141112
Giellateknomøte 12.11.14
- Nettsider/forrest
- smenob/nobsme-ordbøker
- nyinfraflytting, oppsummering
- Planar framover
- 16.1.-workshop
- Trond/Sjur-møtet
Nettsider/forrest
smenob/nobsme-ordbøker
Cip har rydda.
Samanslåing
No: Bli samd om format for evaluering av formene som skal
Lene har synspunkt på kva lapper vi skal bruke, og skriv
Metainformasjon til brukarar
- Informasjon på Webdict
- Informasjon på NDS: http://sanit.oahpa.no/about/
- Om oss => Om ordboka
nyinfraflytting, oppsummering
Eventuelle problem ser vi når vi skal bygge nye ting.
Planar framover
Trond:
Komponentane i planprosessen.
Lene:
- Kva vi vil tilby brukarar, kor god dei skal vere
- Ariklar: Kva slags, når og kor og kor mykje
Poeng: Prioritere
Viktig: Ting som fungerer, artiklar vi får publisert.
Ciprian:
Ikkje enten/eller men heller selektivt både/og.
Vi held fram planprosessen.
16.1.-workshop
Trond refererte.
Trond/Sjur-møtet
Trond refererte
Genereringsproblem
Problemet er derivasjon.
Cip vil ha grunnform og POS.
Viss vi har POS* har vi derivasjon. Denne POS* peiker til final POS
Problemet er løyst i Laura sitt prosjekt. Overføring av denne løysinga
Med ein mange-til-ein-relasjon mellom base og generert form vil
Ciprian vil ikkje tilby pseudo-lemma, men avleidd lemma med korrekt POS.
Han får lemma som ???. Ein grunn til det er at lemma inneheld #.
Lene: Vi skal tilby berre leksikalisert lemma, ikkje dynamiske samansetjingar
et lite forskingsarbeid -- ganske stort, eigentleg
ikkeordsfeil = feil som resulterer i nonsensord
[hoppe over feiltypar]
her har vi et nordsamisk ord == her har vi en oversikt over
TROND:
Most frequent positions ==> the most frequnt positions where we have errors
i etter vokal er konsonant*
Divvun spellchecker evaluation
sa du kva som var N = (det kan du skrive på 78%-sliden
Phonological rules ==> Phonological rules in the spellchecker
Kanskje du ksal ha feite typar (eller fjerne kursivering) attom ordet til venstre for >
foms > forms
possive > possessive
Disse formene dekker feilskriving i det absolutte paradigmet
Why use FST
Are all our generated forms in use in the language
THE ONELINER, spissformuleringa:
fst-en genererer ikke-eksisterende former, og dekker dermed over skrivefeil.
(Lene: endre rekkjefølgje her)
Possible limitations
Trond: Ver meir eksplisitt:
Limitations
Verbgenitiv
dahko -> dahkko
Looked at a corpus of 19 mill
Prabably misspellings...
Nordsmisk spellchecker I DAG idnetifisererer ...
Fonotaks er viktig