Meeting_2011-03-21

Meeting setup

  • Date: 21.03.2011
  • Time: 09.30 Norw. time
  • Place: Internet
  • Tools: SubEthaEdit, iChat

Agenda

Opening, agenda review, participants

  • Opened at
  • Present: Biret-Anne, Børre, Ciprian, Lene, Maja, Sjur, Thomas, Tomi, Trond
  • Absent: Berit

Projects & topics

  • Admin routines (Sjur)
  • Speller (Sjur)
  • Barents (Trond)
  • Sørsamisk (Trond, Maja)
  • Infra (Sjur (& Ciprian?))
  • spring planning - year of cleanup? (Sjur (& Ciprian?))
  • Ordbøker (Lene, Ciprian)
  • Korpus (Børre)
  • Depworkshop (Trond)

Admin routines (Sjur)

Dersom folk er borte frå måndagsmøtet, så må ein sjølv passa på å lesa det så fort ein får høve til det. Sjekk inn referat -- og les dei, ev $GTHOME/techdoc/admin/weekly/2011/xxx

Speller (Sjur)

2.1. vart lagt ut på fredag, men pressemeldinga har ikkje gått ut.

Vi oppdaterte berre sma, ikkje sme, smj. Hunspell for smj, sma er no brukbar: Både copula og nektingsverb er inne.

TODO

  • Runde på teksten, for dei som omsette pressemeldinga sist veke

Barents (Trond)

Komi

Arbeidet går vidare, Marina har arbeidd med budsjettet. NFR er utilgjengeleg.

Kildin

Det skjer ingen ting enno, Trond og Sjur må fylgja opp.

Sørsamisk (Trond, Maja)

I eit møte for 14 dagar sidan bestemde vi å gå frå +Pred til +Sg+Nom. No er det gjort, litt forseinka pga ordboks- og stavekontrollslepp.

Maja vil gjerne gå gjennom alle adjektiva, ikkje berre dict og Oahpa-adj. Svært nyttig med tabellane med alle viktige former. Vil gjerne prioritera arbeidet.

TODO

  • Adjektiv: (Sjå ordbokspunktet)
  • Dekning: Arbeide med missing lister (i dag 9,5% uanalysert) (Maja)

Ordbøker (Lene, Ciprian)

sme-dict er ikkje revidert

sma-dict: Stor del av de 113 lemmaene som ikke ble generert, er nå fiksa - noen stedsnavn fremdeles hos Thomas. Vi ventar på adjektiva. Trond har rydda i te og re-elementa. Anna kodeopprydding. Det burde no vera svært få ord som ikkje blir generert neste gong.

Vi treng fleire som testar ordbøkene, også av dei som ikkje kan språka - dei har andre augo enn dei språkkyndige.

No genererast: Attr - Sg Nom - Comp Sg Nom - Superl Sg Nom. Vi legg til: Ill Sg

Føreløypig lanseringsfrist: 28. mars 2011

TODO

Korpus (Børre)

Har retta opp resten av feila i bound (mange feil i xsl-metadata og feilkoding av title og person feltene i Word document). Før han starta var det meir enn 1800 feil, no er vi nede i 107 feil.

Retta ein feil i ccat, kompilert og installert på Victorio, snart på XServe.

Trond: /home/apache_corpus/ 19,2 mill ord. /home/trond 5,8 mill ord.

TODO

  • Børre og Trond pratar i lag for å sjå på diffen mellom Trond og apache_corpus.

Depworkshop (Trond)

GT har invitert P Sammallahti til Tromsø for å diskutera dependensanalyse av samisk, 14-15.4. CG som tema er aktuelt for fleire av oss.

Praktisk om innkalling osb.: Lene, Trond.

Infra (Sjur (& Ciprian?))

Sjur: Prosjektstopp.

  • Nei til nye ting:
    • Grammatikkontroll
  • Gjennomføre det vil har inne
  • Ikkje søkje om nytt

Uklåre:

  • TTS: Skal fullførast.
  • Mo i Rana Linuxboks:
    • Seie ja takk til boksen men varsle at vi arbeider sakte.
  • Forvaltningsordbok II (sma, smj)
  • MT: Vent.
  • NU - smeOahpa: DeepDict, Teksta (pedagogisk tekstanalyse)
    • NU er i gang, og vi held fram med det.
  • smadis.rle + felles smisyn.rle
    • Til Riga, og vi held fram med det.
  • Autshumato og TM
  • Brukergrensesnitt til tospråklige korpora
    • Trond: Eg har liten lyst til å leggje dette på is
  • nobsme og nobsma ordbøker
    • Sjå på dette.
  • smjnob fra Kintel-liste
    • Vente, syns eg (tt, snm)

Ny infra før Barents. Momentliste:

  • gå over til autotools (seinare kanskje CMake for betre Windows-støtte)
  • større modularitet i kjeldekoden -> Omorfi
  • flytta ut script/ frå gt/
  • ... og flytta alle språk til gt/
  • "JavaDoc" - dokumentasjonen i koden
  • Unit Testing - meir bevisstheit omkring testingh -> børre og korpuskonverteringa
  • code review
  • full støtte for hfst
  • taggsamkøyring
  • lexc-kodeopprydding

spring planning - year of cleanup? (Sjur (& Ciprian?))

TODO:

  1. autotools-oppsett/-infra (Børre, Ciprian, Sjur)
  2. "JavaDoc"-infrastruktur (Børre)
  3. Unit-test-rammeverk (Børre?)
  4. LexC-opprydding (Maja, Thomas, Trond)