Meeting2021-03-30

Divvun-møte 30.3.2021

Til stades: Duommá, Børre, Linda, Tommi, Inga, Katri, Sara, Siri, Sjur

Saker:

  • Sidan sist
  • Årsrapport
  • Arbeid framover
  • Ymse

Sidan sist

Duommá

  • ej mottagit text til tále frå Acapela
  • ej gjort annet enn gram-chk yaml
  • og gram-chk testing o forbedring - word additions, disambiguahtor, bugzilla, errorth forms

Børre

  • Artikkel / grammatikktestverktøy
    • filnavn i grammatikktestresultat
    • forbedre håndteringen av mellomromsfeil
  • sátni.org
    • møte med folket bak julev.no
    • dokumentere api
    • jobbet med lemmatiser/generator etter modell fra NDS
  • Fikse sertifikat- og apache-oppsett gtsvn.uit.no/pahkat.uit.no

Nettsideproblem:

  • divvun.no med andre lokale enn dei som allereie finst (berre for Safari på Mac, ok for alle andre) - ikkje ok enno
  • SEE-server - ikkje på nett enno?

Linda

  • yaml-tester i lag med Duommá (kongruens)
  • artikkel om regresjonstester ilag med Børre og Tommi
  • fiksing av feiloppmerking i goldstandard etc.
  • fiksing av regressjonstestartikkelen
  • yaml make fila
  • CG-workshop med Inga

Vi treng ein modul for å indentifisera språk, både i grammatikkontrollen og for taleprosesseringa.

Tommi

  • divvun-normaliser
  • naacl-artikkel oppdatering for en ny workshop
  • en statuscake for pahkat.uit.no og
  • jobba litt med smj lånordgenerator medn guesser: echo xyzurista |hfst-lookup guesser-gt-desc.anl.hfstol
  • fikk svar fra sigma2.no

Inga

  • Samlet og rettet på tekster fra vårt freekorpus for bruk i TTS
  • TTS-møte
  • Cg-workshop med Linda
  • Rettet på MT-oversettelser
  • Ordboksmøte med Ntec
  • Smårettinger og lagt til enkeltord

Katri

  • tts-møte
  • Abstrakt till fonologikonferensen nästan färdig: min presentation ska diskutera quantity för samiska språken och hur kan de beaktas vid byggandet av en TTS
  • espeak-tts: jobbat med G3 ord som är ortografisk homonymer i nom&gen: espeak har inte en syntaktisk disambiguator; i estnisk samma problem, ortografiskt homonym G3 och G2 uttalas inte annorlunda -> output har "finsk accent"
  • Installerat, lärt mig att använda och eksperimenterat med Merlin-tts (DNN parametric synthesis): training användar GPU nu och jag får Merlin att fungera med Engelsk data -> börjar med Lule Saami data
  • Lite mera python skripter för att processera data vidare om behövs/göra systematisk ändringar etc

Sigma2 kan snart nyttast til meir krevande trening.

Sara Marja

  • missing
  • term wiki
  • har sett på feil i stavekontrollen, paradigmegenereringa

Siri

  • Missinglista
  • Termwiki
  • rettet i ordböker
  • Jobbet litt med Lenes liste, treng litt hjelp - Sjur ser på det, og Sara er med : )

Sjur

  • Møte med ny instituttleder, informert om oss.
  • tts-møte
  • Fiksa byggefeil i crk (sammen med Tino)
  • Møte med Linda og Inga om å få yaml-testinga til å fungere
  • Trond har laget skript for å lage cg-lister ut fra lexc-koden, diskusjon om det
  • har jobba med tekstnormalisering (abbr og tal til full tekst) i sme og smj
  • forenkla stavekontrollbygging
  • testa ny versjon av libdivvun
  • budsjett og rekneskap for Divvun
  • Kintel-ordboksmøte

Göteborg

  • På Windows så synkroniseres språkinnstillinger på nettet med ein av dei siste oppdateringane. På grunn av det forsvinner språk, har jobbet med å løse det.
  • meir arbeid med one-click-installer
  • skal gjera LO-integreringa

Edmonton/Alberta/Canada

  • har laga ferdig Python-bindinga mot Divvunspell

Årsrapport

Kommentarar til utkastet:

  • satni.org: tidlegare 300 treff pr dag i 2019, har stige til 3300/dag no
  • låneordsgeneratoren bør inn i 2.2(?), framhev at det forenklar kvardagen, da språkbrukere får ut tilpassede ord til (lule)samisk. Dette vil også kunne effiktivisere arbeidet i GG.
  • Anders Kintel si ordbok i 1.3: bør nemnast at det er lulesamisk-norsk og norsk-lulesamisk
  • omsetjingsverkty: jobba for å forbetra maskinomsetjinga og integrera den i omsetjingsverktyet, den mest aktive brukaren er veldig nøgd
  • 1.3 - leksikografi/terminologi: sørsamisk er ikkje nemnt - vi får lister frå GG som vi legg inn.
  • flytting til GitHub: websider skal også flyttast. Står lite om artiklar og akademisk publisering, skriv litt meir?

Arbeid framover

  • gjera ferdig årsrapport

Ymse

  • neste møte tysdag 6.4.2021