Avgrense Avleiing

Sjå dette møtedokumentet (frå 23.4. 2020)

Her held vi fram frå møtet:

Konklusjon frå møtet

 • Vi skal endre +Comp og +Superl til +DerN+Der/Comp+A og +DerN+Der/Superl+A (nummeret på DerN må vi sjå på)
  • dette medfører endringer i filene for (signer når det er gjort)
   • NDS
   • Apertium
   • Gramchecker?
   • cgi paradigmegenerator
   • andre?
 • Vi bør observere og deretter forbetre 12345-grammatikken, og evt andre begrensninger
 • måtar å avgrensa derivasjonane på:
  • Bare for normativ HFST: ved hjelp av Der12345-grammatikken
  • For all analyse/generering: ved hjelp av fortsettingsleksikoner
  • For all analyse/generering: ved hjelp av diakritiske flagg som også fungerer på desc (Px er løst slik)
  • Leksikalisere selve derivasjonen, feks. buoremusvuohta
  • Leksikalisere derivasjoner som er utgangspunkt for nye derivasjoner
 • I smj endrer vi slik at på -dibme og -ahtes ikke får Comp og Superl (ahtes skal få nummer likt eller etter Comp/Superl)

Steg framover

 1. Legge Der/ til Comp/Superl
 2. Deretter dei andre stega ovafor

Derivasjoner som vi bør se på

Caritiv med komparativ, når brukes det?

I korp finnes noen få reelle eksempler (her trenges bedre disambiguering), så vi kunne ihvertfall begrense til bare leksikaliserte -heapme:

 • Korpsøk sme -heapme Comp
 • Korpsøk sme -heapme Superl
 • Eksempler på bruk:
  • Geahnohat bealli dán riiddus lea ge eahpitkeahttá palestiinnálaččat.
  • Sámit leat čuđiid jagiid čađa leamaš čađat geahnohit ja vuoittahalli bealli riidduin guovlluid ja luondduresurssaid alde .
  • ILO-konvenšuvdna lea geahnoheabbo go kommišuvdna meahcceelliid várás
  • Vuosttažettiin adnui sámi kultuvra árvvoheabbon go dáža kultuvra 100 jagi dassá .
  • ... vai eai manaše ruoktot vel ain suruheabbon go ledje dalle_go bohte girkui.
  • Norgga bahkken Davvi-Norgii lea dađistaga duvdán daid kultuvrralaččat fámoheabbo sápmelaččaid eret .
  • gutneheappo mielkkeheabbon návccaheappot
  • kunne man tenke seg arvvoheabbo?
 • Eksempler på skrivefeil som blir skjult i 2018-korp: 27 bálkkáhit, 10 jávohit, 6 deattohit, 3 muosehit, 3 muittohit, 3 gieđahit, 2 vuođuhit, 2 mielahut, 2 lobihit, 2 báguhit, 2 arvvohit, – adv? viegada nu arvvohit ja ilolaččat 1 skihkahit, 1 sahkuhit, 1 rásehit, 1 lihkuhit, Háliidan lihkuhit njenecaid dan jagi davvi álbmogin . 1 leabohit, 1 himuhit, 1 govttohit, 1 dolahit, 1 bealehat, 1 arvvoheabbo, Don leat dál roahkkadeabbo ja arvvoheabbo, ja maiddái duostileabbo cuiggodit vearrivuođa ja duolbmama máid vásihat dán áigodagas. (her brukes ordet feil, men det kunne vært brukt?) 1 arvvohat,

Logg over hva som blir gjort, med dato

 • 2020-05-20 sme: kommenterte ut stier for Der/Car for alleredere deriverte ord
 • 2020-05-20 sme smj sma smn endret tagger fra +Comp/+Superl til +Der/Comp og +Der/Superl,
 • 2020-05-26 smj: endra Der1+Der/Dimin til Der2+Der/Dimin
 • 2021-01-07 sms: sendt epost til jaska og trond om +Comp/+Superl til +Der/Comp og +Der/Superl
 • 2020-06-19 smj removed Der/Comp and Der/Superl path from lexicon DIBME and AHTES
 • 2021-01-13 sme: har sett på -heapme + Der/Comp i korpus og forbedret disambigueringa. -heapme + Der/Comp-formene skjuler mange skrivefeil, så man kan forbedre Divvun-programmet mye ved å fjerne stien fra det generelle forts.leksikonet, og heller lage eget forts.leksikon for de ordene som virkelig brukes
 • 2021-01-19 sme: kommenterte ut flere stier med Der/Car og komparasjon
 • 2021-01-19 smj: moved Der/Dimin form der1 to der2
 • 2021-01-26 sme sma: endra +Comp og +Superl til +Gram/Comp og +Gram/Superl for adverb
 • 2021-01-26 sme: la -heapme adjektiver som kan gi infitivsanalyse til JEAGOHEAPMI_NOCOMP