Meeting2020-04-21

Divvun-møte 21.4.2020

Til stades: Børre, Duommá, Inga, Linda, Ritva, Sjur

Saker:

  • sidan sist
  • sommarferie
  • framover
  • ymse
  • neste møte

Sidan sist

Børre

  • Sammallahtis ordbok: tror jeg har dekket hovedtrekkene i konverteringen
  • TermWiki(sh):
    • Missinglister er revsorted, henter ord fra både termwiki og dicts
    • Få orden på generering av expressionsider
  • Overgang fra () til {} for å merke opp errormarkup
    • Korpus er konvertert, ligger på harddisken min (i git)
    • Går løs på CorpusTools i dag

Eige møte for ordbokskonverteringa: Børre, Duommá, Trond, Sjur.

Duommá

  • generelle real word error work:
    • lingvistisk grunnlag før reglerna, dvs. finne morfo—fonnetisk system for å generalisere utifrån centrumskonsonanter
    • samla testkorpus
    • testa

Inga

  • Klar med missinglister, 1500
    • støy: norske og svenske ord, litt nord- og sør-samisk, mange ordfragment
  • Sett litt på gåvvit og mánná
    • bør ha eige lingvistmøte der vi ser på avgrensingar av derivasjonane

Døme på støy:

   7 guovddáš
válgabiire
  33 ánna
   6 ána
   5 ádna
   7 nna
  18 oa
   5 åh-pa
   9 ra
  13 Stora 
   4 pastora
   6 rra
   4 tåvra
   5 högmässa
  50 ávsa
   4 theta
  10 lehta
  11 vuohta
   4 nuhta
   5 áhtta
   6 pevta
   5 Pava
  16 lva
  10 avva
   9 ávva
   8 éa
2453 b
  17 ab

Sein kompilering. Raskaste hfst-oppsettet er:

./configure --without-xfst --with-hfst --enable-reversed-intersect --with-backend-format=foma --enable-alignment
time make -j
make check

Inga og Sjur ser på yaml-testane i lag. Sjur sjekkar at Inga får fail-mail.

Linda

  • skrive regler for generelle realword errors
  • jobba med oppdateringa av GramDivvun
  • gikk gjennom bugzilla og kommenterte/fiksa (ikkje ferdig ennå)
  • fiksa en regel som fjerna stavekontrollforslag
  • fiksa noen regler som valgte sammensettinglesinger istedenfor særskriving
  • testa Duommá sine eksempler

Ritva

  • les sme-setningar, og rettar dei, frå Duommá og Linda

Sara

Ikkje til stades pga nettverksproblem.

Siri

Ikkje til stades pga undervising

Sjur

  • testa ny versjon av kbdgen
    • prøvde å konvertera frå gamal til ny struktur
  • testa dadmin-verktyet
  • informerte alle brukarane om GitHub-flyttinga
  • har slått i hop src/phonology/ med src/morphology/

Sommarferie

Beathe har sendt oss e-post, frist er 1. mai.

  • Duommá: i Juli när det inte regnar, jag har vel bara 12 dar så jag småjobbar nog hela tiden, kanskje i schweden om jag kan smyga øver gränsen før å undvika karantän
  • Linda: har tatt 1,5 uker i februar allerede, tenkte å ta 2 uker i juni eller juli og resten i september
  • Sjur: truleg 6 veker med ferie, heile juli + litt august
  • Inga: usikkert da Gunnar har fått beskjed om at han kanskje ikke får ferie på sommeren.
  • Børre: ingen ferdige planar, men gjerne seint på sommaren, evt 2 veker tidleg + 2 veker seint

Framover

Møte:

  • Sammallahti-ordbokskonverteringa: Børre, Duommá, Trond, Sjur
  • lingvistmøte: avgrensingar i derivasjonane i smj, sme: Inga, Duommá, Lene, Trond, Sjur
  • smj-yaml-testing: Inga og Sjur

Duommá

  • generelle real word error work:
    • lingvistisk grunnlag før reglerna, dvs. finne morfo—fonnetisk system for å generalisere utifrån centrumskonsonanter
    • samla testkorpus
    • testa

Linda

  • fortsette med å teste de 11 generelle real word error regler som vi har correct filer for

Børre

  • Sammallahti: konvertering og slikt
  • CorpusTools: ny errormarkup

Inga

  • Yaml
  • Gullkorpuset
  • gåvvit og mánná

Ymse

Linda vil gjerne introdusera nye taggar.

Neste møte

Tysdag 28.4. kl 09.30 norsk/svensk tid.