Meeting_2011-03-07
Contents:
- Meeting setup
- Agenda
- Opening, agenda review, participants
- Project review
- Divvun 2.1:
- TTS
- Divvun-omorganisering (Sjur)
- Testbenkprosjektet (Sjur)
- smekorpus (Børre)
- smakorpus (Børre)
- smenob (Berit Merete)
- VD-ÅD-lansering Mac/Win/iPxd (Ciprian)
- Forvaltningsordbok (Ciprian)
- Kunnskapsforlaget -- sme-ordbok (Trond)
- MT-170 (Trond)
- sma-oahpa (Lene)
- nu-oahpa (Biret Ánne)
- Barentsprosjektet (Trond)
- dis-abstract til Riga (Lene)
- Eventuelt
- Neste veke:
Meeting setup
- Date: 07.03.2011
- Time: 09.30 Norw. time
- Place: Internet
- Tools: SubEthaEdit, iChat
Agenda
Opening, agenda review, participants
- Opened at 09: 45
- Present: Berit Merete, Biret-Anne, Børre, Ciprian, Lene, Maja, Sjur, Thomas, Tomi, Trond
Project review
-
kort oppsummering frå kvart prosjekt, der ein legg fram:
- status (kva er ferdig, kva ligg etter skjema, kva kjem no)
- særlege punkt som treng meir merksemd -> separat møte (men punkta bør nemnast for alle, slik at vi kan sjå avhengigheiter som elles blir oversedde)
- status (kva er ferdig, kva ligg etter skjema, kva kjem no)
Det blir altså ein litt annan struktur enn tidlegare - meir prosjektorientert. Vi prøver det ut, og ser korleis det funkar.
Prosjekta er (rapportør i parentes):
- Divvun 2.1:
- installerarane (Børre)
- buggar (Tomi)
- installerarane (Børre)
- TTS (Biret Ánne)
- Divvun-omorganisering (Sjur)
- Testbenkprosjektet (Sjur)
- smekorpus (Børre)
- smakorpus (Børre)
- smenob (Berit Merete)
- VD-ÅD-lansering Mac/Win/iPxd (Ciprian)
- Forvaltningsordbok (Ciprian)
- Kunnskapsforlaget -- sme-ordbok (Trond)
- MT-170 (Trond)
- sma-oahpa (Lene)
- nu-oahpa (Biret Ánne)
- Barentsprosjektet (Trond)
- dis-abstract til Riga (Lene)
Andre, kvilande prosjekt (inga rapportering - lista er ikkje komplett)
- smefin (Gt+Kotus)
- smanob
- korpusgrensesnitt
Divvun 2.1:
installerarane
Børre:
Vi har ferske sme-, sma- og smj
Problem: Sørsamisk på nye Windowsmaskiner.
Ta kontakt med folk som skal teste:
- sma: Trond (gjort)
- smj: Børre
buggar
Tomi:
- hard-hyphen bug seems to be fixed
- sme should not have hard-coded clitics
- missing words are fixed (?? "isit" still out)
Divvun 2.1 meeting Friday 10 AM: Børre, Sjur, Thomas, Tomi
- Wednesday at 16: 00: deadline for lexical changes before compilation
TTS
Biret Ánne:
- Klare til å gjere opptak med mannleg røyst, når han har tid.
- Beraren av den kvinnelege røysta er sjukemeldt, det tar vi etterpå.
- opptaksrom på konservatoriet - betre akkustikk / mindre støy der
Divvun-omorganisering (Sjur)
Ingenting har skjedd. Sametinget og Universtietet ventar på departementet.
Testbenkprosjektet (Sjur)
Ingenting har skjedd pga. sjukemelding, men prosjektet må bli ferdig.
smekorpus (Børre)
Ciprian har parallellisert det. Francis har sendt ein del attendemeldingar
Det er framleis ting som skjer i konverteringa ("." = ok, "|" = feil):
convert2xml.pl --shallow orig Processing files |||||||||||||||||||||..||||.||||..|.|||||make: *** [all] Error 1
smakorpus (Børre)
Det ligg tekstar der, men vi har ikkje oversikt over kva som er parallelt og
Parallellisering av sma:
- Tekstar må identifiserast som parallelle - det er gjort
- Deretter må anchor.txt vere ferdig (status quo: ca 300/1100 open)
- Så kan vi setningsparallellisere
TODO:
- Samle inn tekstar (Børre) - gjort
- Leggja inn metadata om parallelle tekstar (Børre) - gjort
- Dokumenter parallelliseringsskript (Ciprian)
- Legg inn buggmeldingar om problem med å køyra Ciprian-skripta (Børre)
- Gjer ferdig anchor.txt (Maja)
- Parallelliser (Ciprian, evt. Børre) (modulo java)
smenob (Berit Merete)
- har lært å bruka programma
- identifisert problem kring re- og te-elementa
VD-ÅD-lansering Mac/Win/iPxd (Ciprian)
- now, both VD and ÅD are updated
- VD-pipeline now updated along the ÅD, i.e., more general wrt. features
- slightly improved layout for entries both for mac and for stardict
- planned: some version for mobile OS non-iPx
- http://www.androidzoom.com/android_applications/stardict
TODO:
- Samle e-postliste for agitprop (Sjur; Maja, Børre)
- Sende info om nye ordbøker + ny Divvun-versjon samtidig neste veke (XXX)
- SGM om stedsnavn i sma
Forvaltningsordbok (Ciprian)
- ad, on the GT&DIVVUN side the pipeline works
- actually, we can try to prove to make the word alignment too
- problems:
- input form tca02-sentence aligner: it does not accept anything that it is "detected" as sentence from our preprocessing step (at the moment, manual correction)
- Francis detected some coding errors which we should check, especially, Børre,
- input form tca02-sentence aligner: it does not accept anything that it is "detected" as sentence from our preprocessing step (at the moment, manual correction)
- Berit Merete har starta
TODO
- Finne terskelnivå på kandidatar (0.1, 0.x, …)
- Nytt møte og evaluere, sjå korleis det går
- Møte omtrent 14.3. (BM, Cip, Francis, Lene, Trond)
Kunnskapsforlaget -- sme-ordbok (Trond)
MT-170 (Trond)
sma-oahpa (Lene)
Neste lingvistiske utfordring er adjektiv, for å få dei på plass i Morfa-S.
nu-oahpa (Biret Ánne)
Barentsprosjektet (Trond)
dis-abstract til Riga (Lene)
- To lange tekstar.
- tekstene og missinglistene og tilhørende typos-lister er her:
- private/gt/sma/testcorp/
- bruk typoslista i denne mappa
- private/gt/sma/testcorp/
To ting er aktuelt:
- Vi har ei lang missing-liste (både subformer og manglande leksem)
- Sublemma med standardlemma som oppslagsform, slik:
- standardlemma:sublemma contlex ;
TODO
- Lingvistisk møte for å samkøyre sme, sma
- Saker:
- ordavleiing
- taggar
- ordavleiing
- Tidspunkt: tysdag kl. 0900
- Kven: Biret Merete, Lene, Maja, Thomas, Trond
- Saker:
Eventuelt
Ingenting.
Neste veke:
- Møte til vanleg tid.
- Divvun 2.1. + VD/ÅD-lansering