2017-10-13

Grammatikkontrollmøte 13.10.2017

Til stades: Duommá, Kevin, Linda, Sjur

Saker:

  • sidan sist
  • variantar av GC
  • integrering mot klientar / vertsprogram
  • arbeid framover
  • neste møte

Sidan sist

Duommá

  • han samler falske positiver från stort korpus

Det er ein del falske alarmar, vi må vurdera å slå av dei mest problematiske reglane i fyrste versjon, og heller byggja ut grammatikkontrollen over tid.

Kevin

  • cgspell
    • les både arkiv og enkeltfiler (akseptor/analysator+feilmodell)
    • stav berre ukjende som standard, valfritt òg kjende
    • rett output av subreadings
    • testar, travis
    • endring i hfst-ospell-api for korrekt gjenkjenning av tagg vs lemma
  • composed-chars-debugging
  • autooppdatering av webdemo (inn i same system som jorgal: https: //github.com/unhammer/gtweb-apy-conf )
    • svn up skjer OnCalendar=02,08,12,14,16,18: 42

Webtenesta blir starta om att midt på natta og kl 14. Endringar i koden blir ikkje synleg før slike omstartar.

Manuell omstart av tenesta på gtweb med:

sudo systemctl restart apy

Linda

  • fiksa kasusfeilfinning i adposisjonsfraser
    • feilfinningsregler
    • semantiske tagger i disambigueringsregler
    • flere disambigueringsregler for adposisjoner
  • fiksa en del kommaregler
  • litt feedback optimering i errors.xml
  • flere feiltyper på instagram

Instagram: vi bør fylgja fleire, og på den måten kanskje få fleire til å fylgja oss.

Sjur

  • har lagt til støtte for stavekontroll i bygginga
    • manglar zip med stavekontroll
  • har no lagt til rette for grammatikkontroll for alle språk

Variantar av GC

  • ulike land (ulik ortograpfi, jf smj)
  • ulike ortografiar
  • ulike skriftsystem

Lemma og analyse er konstant, overflateform varierer. Dvs at variantane må handterast for:

  • tokeniser
  • forslagsgeneratoren
  • stavekontrollfilene
  • cg-reglar som viser til overflateform: vi viser ikkje til overflateform, berre til lemma + taggar

For geografi og skriftsystem: vi lagar ulike fst-ar og ulike zip-filer, cg-reglane er konstante. Når det gjeld ortografi så må vi venta og sjå kva det reelle behovet er.

Integrering mot klientar / vertsprogram

Vi ventar til vi har full støtte for stavekontroll i alle komponentar.

Framover

Duommá

  • han fortsätter å samle falske positiver från stort korpus

Kevin

  • cgspell
    • støtte i divvun-checker/bibliotek, pipespec.xml og zip-format
    • fiks bug med timeout (men hfst-ospell har same bug?)
  • kommandolinjeval for å skru på preferansar (gøyma reglar) i divvun-checker
  • evalueringssystem mot gullkorpus
  • lag «debug modes» i divvun-gen-sh, så me slepp apertium-gen-modes

Linda

  • testing og evaluering av adposisjonsregler

Sjur

  • søknad til KMD om fast lingviststilling
  • leggja til semantiske (og andre?) taggar i stavekontrollanalysatoren
  • støtte for variantar slik det er diskutert over

Neste møte

Om ca 14 dagar. Sjur kallar inn.