Meeting_2015-10-06

T&S-møte

 • Korpus
 • stavekontrollstatus
  • hfst
  • sma/sme/smj
 • Bugzilla

Korpus

Trond vil dobla det nordsamiske korpuset.

Innsammlingsarbeidet stoppar opp på ulike stader:

 • Sametinget, og Sjur tek det opp med dei.
 • Den samiske forleggarforeininga
 • Kva er status for materialet der Sametinget har fått forleggarar til å kontraktfeste overlevering til språkteknologi?
 • Forlag
 • Forfattarar

Børre var på runde i mai. Det var positivt, men treng oppfølgjing.

Plan: Kombinere stavekontrollinstalleringsrundreise med møte med forfattarar og forlag.

Andre kjelder: Nasjonalbibliotek, offentleg, andre. Utsett til neste møte.

Kva er status for automatisk korpushausting? Får vi med oss alt?

stavekontrollstatus

hfst

Ei lus knytta til feilmodellhandteringa: klarar ikkje å retta feil der ukjende teikn skal bli ståande: 9-1ágasj -> 9-lagasj funkar ikkje.

sma/sme/smj

Rett forslag i topp-5 for stavekontrolltesting, feilkorpus=typoslista:

 • smj: 73,5 %
 • sme: 81 %
 • sma: 76,6 %

Polderland er betre, (mellom 80% og 90%), men skilnaden blir mindre.

Ting som står att før lansering:

 • retta hfst-feilen (hfst)
 • +CmpN/-implementering på plass (Divvun)
 • Windows- og Mac-pakker på plass, inkl installeringsprogram (Tino+Divvun)
  • Windows går bra !!
  • Mac Word går bra, men det er berre mogleg å bruke ein stavekontroll

Bugzilla

Seinare.