150904
Saksliste:
- DM besøk
- Enaresamiskprosjektet
- oversyn
- ordboksarbeidet
- programmeraren
- oversyn
- TODO-lista (Trond og Ciprian har diskutert)
- Planar for publisering / konferansebidrag
- icall-programmerar
- Korpus
- Eventuelt
DM besøk
- 14.-25. september
- Lene er opptatt 14. september, Trond 15.
- Lene er opptatt 14. september, Trond 15.
- Hotell (Trond)
- Cree Oahpa - evt artikkel sammen med ArtLab
- Workshop?
- Gjesteførelesing på Result? -- open ?
- internt kurs (for hven? om hva?)
Enaresamiskprosjektet
oversyn
- fst: 85,3% for eit kvar dagar siden
- yaml: 577 feil, 540 verbfeil
- 3-4 tilfelle av rotvokalendring
- Gå gjennom verbstammane
- state-of-the-art til fin2smn oppryddingen
- egennavn jobb : -)
- navn som ikke skal oversettes, legges til i bidix x=x
- navn som skal oversettes: kan man få liste fra institusjoner i Finland? (Ilmari?), Taarna Valtonen
- navn som ikke skal oversettes, legges til i bidix x=x
TODO:
- skript for å omforme yamls med ordboksortografi til yamls uten (Ciprian)
- src/scripts/convert-dict-yaml-to-norm-yaml.pl
ordboksarbeidet
- finsmn må bli gjort ferdig på slutt av september
- Deretter smefin, og unifisering
- 32 anneeđ
Tiltak for å forbetre smnfin-NDS-konvertering:
- POS-forbetring: Ta siste POS, ikkje förste
- Lemma-forbetring: CF, ikkje C
- Betre smn.fst (frå smn/src/morphology/incoming/lemmas_from_dict)
programmeraren
TODO-lista (Trond og Ciprian har diskutert)
Skrive advarsel om VD på nettsidene
Planar for publisering / konferansebidrag
-
iwclul
- Tromsøkonferanse -- enaresamisk tema? Deadline 11. nov.
Vi diskuterer tema på neste møte.
icall-programmerar
Trond går vidare med arbeidet med komité.
Korpus
Framlegg frå Jussi: multi-analyser i korpus.
Mogleg problem: Det kan bli komplekst å søke i korpus, og output kan bli komplekst
Glossering på web: Har ikkje fungert i newinfra.
Pipeline for multi-analyse på web får to tillegg:
- Køyre multi gjennom to former:
- lookup2cg
- Felles cg-fil fst_cleanup.cg3 for å fjerne Err/Orth osb. (Lene)
- lookup2cg
Vi diskuterer dette.