2014-05-13
Grammatikkontrollmøte 13.5.2014
Til stades: Linda, Sjur
Tidsrom: 13: 20-14: 15
Semantisk annotering
- mer enn halvparten av substantivleksikonet er annotert (Linda)
- revision 94020: 41395/80594 (51.36%)
- det som er mest arbeidskrevende er utviklinga av meningsfulle kategorier
- når taggene er på plass vil det være lettere å annotere leksikonet til
- revision 94020: 41395/80594 (51.36%)
Semantiske tagger i grammatikkontroll
- for å finne sammensatte ord som ikke er skrevet sammen (utelukke visse
- finne objekt til visse verb og på grunnlag av det finne kasusfeil
- finne feil i adposisjonsfraser
- finne realworderrors basert på semantisk kontekst
Guesser
For ukjente navn og andre ukjente ord som stavekontrollen ikkje kan hjelpe med.
- i CG: med regex
- i morfologisk analysator
Falske positiver
- evt når en "feil" form ble skrevet i kursiv og dermed er et sitat (er det mulig å løse dette?)
To do
- legge teknisk til rette slik at Francis kan fortsette med arbeidet (Sjur)
- lage en gullstandard med minst 1000 setninger (Linda, men ikke ennå)
- fortsette med den semantiske tagginga av leksikonet, definere semantiske