2017-10-13
Grammatikkontrollmøte 13.10.2017
Til stades: Duommá, Kevin, Linda, Sjur
Saker: 
- sidan sist 
- variantar av GC 
- integrering mot klientar / vertsprogram 
- arbeid framover 
- neste møte
Sidan sist
Duommá
- han samler falske positiver från stort korpus
Det er ein del falske alarmar, vi må vurdera å slå av dei mest problematiske reglane i fyrste versjon, og heller byggja ut grammatikkontrollen over tid.
Kevin
- cgspell - les både arkiv og enkeltfiler (akseptor/analysator+feilmodell)
- stav berre ukjende som standard, valfritt òg kjende 
- rett output av subreadings 
- testar, travis 
- endring i hfst-ospell-api for korrekt gjenkjenning av tagg vs lemma 
 
- les både arkiv og enkeltfiler (akseptor/analysator+feilmodell)
- composed-chars-debugging 
- autooppdatering av webdemo (inn i same system som jorgal: https: //github.com/unhammer/gtweb-apy-conf ) - svn up skjer OnCalendar=02,08,12,14,16,18: 42
 
Webtenesta blir starta om att midt på natta og kl 14. Endringar i koden blir ikkje synleg før slike omstartar.
Manuell omstart av tenesta på gtweb med: 
sudo systemctl restart apy
Linda
- fiksa kasusfeilfinning i adposisjonsfraser - feilfinningsregler 
- semantiske tagger i disambigueringsregler 
- flere disambigueringsregler for adposisjoner 
 
- feilfinningsregler 
- fiksa en del kommaregler 
- litt feedback optimering i errors.xml 
- flere feiltyper på instagram
Instagram: vi bør fylgja fleire, og på den måten kanskje få fleire til å fylgja oss.
Sjur
- har lagt til støtte for stavekontroll i bygginga - manglar zip med stavekontroll 
 
- manglar zip med stavekontroll 
- har no lagt til rette for grammatikkontroll for alle språk
Variantar av GC
- ulike land (ulik ortograpfi, jf smj)
- ulike ortografiar 
- ulike skriftsystem
Lemma og analyse er konstant, overflateform varierer. Dvs at variantane må handterast for: 
- tokeniser 
- forslagsgeneratoren 
- stavekontrollfilene 
- cg-reglar som viser til overflateform: vi viser ikkje til overflateform, berre til lemma + taggar
For geografi og skriftsystem: vi lagar ulike fst-ar og ulike zip-filer, cg-reglane er konstante. Når det gjeld ortografi så må vi venta og sjå kva det reelle behovet er.
Integrering mot klientar / vertsprogram
Vi ventar til vi har full støtte for stavekontroll i alle komponentar.
Framover
Duommá
- han fortsätter å samle falske positiver från stort korpus
Kevin
- cgspell - støtte i divvun-checker/bibliotek, pipespec.xml og zip-format 
- fiks bug med timeout (men hfst-ospell har same bug?)
 
- støtte i divvun-checker/bibliotek, pipespec.xml og zip-format 
- kommandolinjeval for å skru på preferansar (gøyma reglar) i divvun-checker
- evalueringssystem mot gullkorpus 
- lag «debug modes» i divvun-gen-sh, så me slepp apertium-gen-modes
Linda
- testing og evaluering av adposisjonsregler
Sjur
- søknad til KMD om fast lingviststilling 
- leggja til semantiske (og andre?) taggar i stavekontrollanalysatoren
- støtte for variantar slik det er diskutert over
Neste møte
Om ca 14 dagar. Sjur kallar inn.

