Avgrense Avleiing

Sjå dette møtedokumentet (frå 23.4. 2020)

Her held vi fram frå møtet:

Konklusjon frå møtet

  • Vi skal endre +Comp og +Superl til +DerN+Der/Comp+A og +DerN+Der/Superl+A (nummeret på DerN må vi sjå på)
    • dette medfører endringer i filene for (signer når det er gjort)
      • NDS
      • Apertium
      • Gramchecker?
      • cgi paradigmegenerator
      • andre?
  • Vi bør observere og deretter forbetre 12345-grammatikken, og evt andre begrensninger
  • måtar å avgrensa derivasjonane på:
    • Bare for normativ HFST: ved hjelp av Der12345-grammatikken
    • For all analyse/generering: ved hjelp av fortsettingsleksikoner
    • For all analyse/generering: ved hjelp av diakritiske flagg som også fungerer på desc (Px er løst slik)
    • Leksikalisere selve derivasjonen, feks. buoremusvuohta
    • Leksikalisere derivasjoner som er utgangspunkt for nye derivasjoner
  • I smj endrer vi slik at på -dibme og -ahtes ikke får Comp og Superl (ahtes skal få nummer likt eller etter Comp/Superl)

Steg framover

  1. Legge Der/ til Comp/Superl
  2. Deretter dei andre stega ovafor

Derivasjoner som vi bør se på

Caritiv med komparativ, når brukes det?

I korp finnes noen få reelle eksempler (her trenges bedre disambiguering), så vi kunne ihvertfall begrense til bare leksikaliserte -heapme:

  • Korpsøk sme -heapme Comp
  • Korpsøk sme -heapme Superl
  • Eksempler på bruk:
    • Geahnohat bealli dán riiddus lea ge eahpitkeahttá palestiinnálaččat.
    • Sámit leat čuđiid jagiid čađa leamaš čađat geahnohit ja vuoittahalli bealli riidduin guovlluid ja luondduresurssaid alde .
    • ILO-konvenšuvdna lea geahnoheabbo go kommišuvdna meahcceelliid várás
    • Vuosttažettiin adnui sámi kultuvra árvvoheabbon go dáža kultuvra 100 jagi dassá .
    • ... vai eai manaše ruoktot vel ain suruheabbon go ledje dalle_go bohte girkui.
    • Norgga bahkken Davvi-Norgii lea dađistaga duvdán daid kultuvrralaččat fámoheabbo sápmelaččaid eret .
    • gutneheappo mielkkeheabbon návccaheappot
    • kunne man tenke seg arvvoheabbo?
  • Eksempler på skrivefeil som blir skjult i 2018-korp: 27 bálkkáhit, 10 jávohit, 6 deattohit, 3 muosehit, 3 muittohit, 3 gieđahit, 2 vuođuhit, 2 mielahut, 2 lobihit, 2 báguhit, 2 arvvohit, – adv? viegada nu arvvohit ja ilolaččat 1 skihkahit, 1 sahkuhit, 1 rásehit, 1 lihkuhit, Háliidan lihkuhit njenecaid dan jagi davvi álbmogin . 1 leabohit, 1 himuhit, 1 govttohit, 1 dolahit, 1 bealehat, 1 arvvoheabbo, Don leat dál roahkkadeabbo ja arvvoheabbo, ja maiddái duostileabbo cuiggodit vearrivuođa ja duolbmama máid vásihat dán áigodagas. (her brukes ordet feil, men det kunne vært brukt?) 1 arvvohat,

Logg over hva som blir gjort, med dato

  • 2020-05-20 sme: kommenterte ut stier for Der/Car for alleredere deriverte ord
  • 2020-05-20 sme smj sma smn endret tagger fra +Comp/+Superl til +Der/Comp og +Der/Superl,
  • 2020-05-26 smj: endra Der1+Der/Dimin til Der2+Der/Dimin
  • 2021-01-07 sms: sendt epost til jaska og trond om +Comp/+Superl til +Der/Comp og +Der/Superl
  • 2020-06-19 smj removed Der/Comp and Der/Superl path from lexicon DIBME and AHTES
  • 2021-01-13 sme: har sett på -heapme + Der/Comp i korpus og forbedret disambigueringa. -heapme + Der/Comp-formene skjuler mange skrivefeil, så man kan forbedre Divvun-programmet mye ved å fjerne stien fra det generelle forts.leksikonet, og heller lage eget forts.leksikon for de ordene som virkelig brukes
  • 2021-01-19 sme: kommenterte ut flere stier med Der/Car og komparasjon
  • 2021-01-19 smj: moved Der/Dimin form der1 to der2
  • 2021-01-26 sme sma: endra +Comp og +Superl til +Gram/Comp og +Gram/Superl for adverb
  • 2021-01-26 sme: la -heapme adjektiver som kan gi infitivsanalyse til JEAGOHEAPMI_NOCOMP