150904

Saksliste:

  • DM besøk
  • Enaresamiskprosjektet
    • oversyn
    • ordboksarbeidet
    • programmeraren
  • TODO-lista (Trond og Ciprian har diskutert)
  • Planar for publisering / konferansebidrag
  • icall-programmerar
  • Korpus
  • Eventuelt

DM besøk

  • 14.-25. september
    • Lene er opptatt 14. september, Trond 15.
  • Hotell (Trond)
  • Cree Oahpa - evt artikkel sammen med ArtLab
  • Workshop?
  • Gjesteførelesing på Result? -- open ?
  • internt kurs (for hven? om hva?)

Enaresamiskprosjektet

oversyn

  • fst: 85,3% for eit kvar dagar siden
  • yaml: 577 feil, 540 verbfeil
  • 3-4 tilfelle av rotvokalendring
  • Gå gjennom verbstammane
  • state-of-the-art til fin2smn oppryddingen
  • egennavn jobb : -)
    • navn som ikke skal oversettes, legges til i bidix x=x (f.eks. Lene, Ciprian, Oslo)
    • navn som skal oversettes: kan man få liste fra institusjoner i Finland? (Ilmari?), Taarna Valtonen

TODO:

  • skript for å omforme yamls med ordboksortografi til yamls uten (Ciprian)
    • src/scripts/convert-dict-yaml-to-norm-yaml.pl

ordboksarbeidet

  • finsmn må bli gjort ferdig på slutt av september
  • Deretter smefin, og unifisering
  • 32 anneeđ /Users/lan022/main/words/dicts/smnfin/inc/2015/Saami-suoma_16062015.xlsx

Tiltak for å forbetre smnfin-NDS-konvertering:

  • POS-forbetring: Ta siste POS, ikkje förste
  • Lemma-forbetring: CF, ikkje C
  • Betre smn.fst (frå smn/src/morphology/incoming/lemmas_from_dict)

programmeraren

TODO-lista (Trond og Ciprian har diskutert)

Skrive advarsel om VD på nettsidene

Planar for publisering / konferansebidrag

  • iwclul
  • Tromsøkonferanse -- enaresamisk tema? Deadline 11. nov.

Vi diskuterer tema på neste møte.

icall-programmerar

Trond går vidare med arbeidet med komité.

Korpus

Framlegg frå Jussi: multi-analyser i korpus.

Mogleg problem: Det kan bli komplekst å søke i korpus, og output kan bli komplekst

Glossering på web: Har ikkje fungert i newinfra.

Pipeline for multi-analyse på web får to tillegg:

  1. Køyre multi gjennom to former:
    1. lookup2cg
    2. Felles cg-fil fst_cleanup.cg3 for å fjerne Err/Orth osb. (Lene)

Vi diskuterer dette.

Eventuelt

Sørsamisk ordbok

Det er ord som ikkje lar seg generere

Delar av taggelista er ikkje skrive ut: Kasusnamn felles med sme fungerer, men sma-namn fungerer ikkje