Meeting2021-03-09

Divvun-møte 9.3.2021

Til stades: Duommá, Børre, Linda, Tommi, Katri, Ritva, Sara, Siri, Sjur

Saker:

  • Sidan sist
  • Arbeid framover
  • Ymse

Sidan sist

Duommá

  • gram-chk yaml
  • gram-chk testing o forbedring - word additions, disambiguahtor, bugzilla, errorth forms
  • GramDivvun-møte

Børre

  • divvun-sdk-nodejs
  • korpus
    • normalisere til NFC (det er hva fst-ene venter)
    • flytte docx til odt (docx-konverteringen produserer innviklet html, odt-konvertering gir en mye enklere versjon)

Kommentarar:

  • pandoc kan vera eit alternativ for å konvertera docx-filer (ikkje doc-filer).
  • divvun-sdk-nodejs - diskuter med Brendan

Nettsideproblem:

  • static-files - ok no, bortsett frå LO-5-pluggen (må byggjast på nytt?)
  • Bugzilla - ikkje på plass enno
  • divvun.no med andre lokale enn dei som allereie finst (berre for Safari på Mac, ok for alle andre) - ikkje ok enno
  • nettstavekontrollen - byta til api-giellalt.uit.no som server (REST-api)
  • see-servar - framleis borte

Linda

  • yaml-testar med Duommá (sammensettinger)
  • GramDivvun med Ritva og Duommá
  • diskuterer nye feiltyper med Ritva + yaml fil for å samle dem
  • neurale nettverk med Tommi, Chiara og Mika
  • evalueringskorpus med Børre
  • fulgte med på disputas om flerspråklighet

Tommi

  • jobb med gold korpus for evaluering i nevral artikkel
  • fiksede bugger i divvun-normaliser
  • --enable-tts er i alle språk nå
  • mindre fikser til autogen.sh og configure også
  • hadde medarbeidersamtale

--enable-tts bør automatisk slå på --enable-phonetic og --enable-tokenisers.

Inga

  • TTS-møte & andre møte
  • rettet på tekster som skal brukes i TTS

Jobba halv tid førre veka.

Katri

  • tts-møte
  • omorganiserad speech-smj-privat-mappen
    • nya mapp (tts-texts) för smj-teksterna som blir spelas in
  • ideen till workshop (Phonological diversity; 16.-19.9. Poznan: http: //wa.amu.edu.pl/plm/2020/Home)
  • utvecklat och testat espeak tts vidare
    • två+ siffriga grundtal fungerer nu, men ordningstal har några problemer
  • prosessera speech-smj-minicorpus för att trena en enkel neural vocoder som fungerar med 1 timmes taldata (Inga): behöver .txt + .wav par per setning
    • har skrivit och testat Praat skripter för att konvertera och dela upp långa ljudfiler till kortare delar
    • python skript för att dela upp tekstfiler också
  • added documentations!

Ritva

  • Flammie hjalp til med svn-problemer
  • GramDivvun filer
  • 2x GramDivvun Workshop (Linda & Duommá)

GramDivvun: kan vera vanskeleg å sjå kor ein er i teksten, etter at ein har klikka seg vidare. Innimellom viser til feil setning, både i MS Word og GoogleDocs.

Sara Marja

  • admin saker

Stor bokstav etter hermeteikn på mobiltastatur (iOS i alle fall) - skal ikkje vera slik.

Sjur

  • Medarbeidersamtaler
  • Møte med ASTIN (observatørstatus for samisk og grønlandsk)
  • Sametingets workshop (Joint Sámi flagship project (IDIL 2022-2032)=
  • Forelesning, Helsinki uni
  • tekstnormalisering (TTS) - første del er på plass
  • møte med Antti Arppe
  • tekstrydding i nordsamiske tts-ressursar

Göteborg

  • Studenten som jobber med talesyntese viste fram en demo med bra lyd
  • Divvun oneclick-installer. Enklere å installere: velg språk, installer verktøy og oppdateringshåndterer. Windowsversjonen slippes ganske snart.

Når kjem det oppdateringar av mobiltastaturet? Dvs ordfullføring og ordprediksjon. — Ingen klare planar enno.

Arbeid framover

  • Medarbeidersamtaler

Ymse

  • Møtefrie dagar?
  • neste møte tysdag 16.3.2021