Stavekontroll
Contents:
Prosjekt for å lansere ny færøysk stavekontroll til Hammershaimb-jubileet 2019.
Teknisk sett er stavekontrollen ferdig, godt utprøvd og ferdig til
Arbeidsoppgåver
- Testmateriale
- Skaffe så stort tekstkorpus som mogleg
- Skaffe lister over færøyske namn (stadnamn, personnamn, namn på firma, organisasjonar...)
- Skaffe korpus over ordpar autentisk skrivefeil :korrigert form
- Komplettere bøyingsparadigmene i fao/test/src/gt-norm-yamls/
- Skaffe så stort tekstkorpus som mogleg
- Analysatoren:
- Teste analysatoren for leksikalsk dekning mot korpus, og legge til manglande ord.
- Vurdere og gjennomføre ein strategi for danske lånord
- Kontrollere og forbetre samansetjing
- Legge til manglande færøyske namn
- Teste analysatoren for morfologi, morfofonologi og forbetre han.
- Teste analysatoren for leksikalsk dekning mot korpus, og legge til manglande ord.
- Stavekontrollen
- Teste presisjon og recall for tekst merka for korrekturlesing
- Teste framleggsmekanismen (kor stor del av rettingane til autentiske skrivefeil får korrekt rettingsframlegg)
- Teste presisjon og recall for tekst merka for korrekturlesing
Tidsplan
- Folk
- Heðin 4 mnd frå medio mars: Arbeide med analysatoren
- Trond i løpet av året: Oppdatere, kommentere analysator + forslagsmekanisme
- Andre ...
- Heðin 4 mnd frå medio mars: Arbeide med analysatoren
- Milepælar 2018-2019 (tentativt framlegg til 25. mars)
- Medio mars: Ferdig innsamla stort korpus og namnelister
- 1. august: Dekningsgrad for stort korpus over 95%, morfologi stort sett ok
- 1. januar: Dekningsgrad for stort korpus over 97%, morfologi heilt ok,
- 25. mars: Lansering?
- Medio mars: Ferdig innsamla stort korpus og namnelister
Måla som er sett opp her krev meir enn 4 månadsverk.