Meeting_2014-10-14
Sjur og Trond, 134.10.14
Saksliste
- sme-flytting
- møterommet
- Sør-Afrika
- TTS
- Direkte nedlasting av fst-ar
- Teksting-korpus
- mobiltastatur
- ENG
- neste CLARINO-møte
sme-flytting
Yaml-testing
Ciprian har gamle paradigme frå VD, dei kan vi bruke som (utgangspunkt for)
Vi vil ha testar etter:
- fortsetjingsleksikon (dette kan skriptast)
- sluttvokal
- rotvokal
- stammekonsonant
- rotkonsonant xx: x, x: y, xy: xxy (fyll ut for x og y) kontekst* trigger
Dokumentasjon for yaml-testane finst på:
TILTAK: Ciprian tar eit utval frå VD-paradigmet og sett inn i
Korpustesting
Analyser eit rimeleg stort korpus med analysatorane frå både ny og gamal infra,
- Lene analyserer korpus med fst frå ny og gamal infra
- diffen og output skal liggja i $GTHOME/langs/sme/test/data/move/
Oahpa-testing
Heli har genrerert og laga diffar, Lene har kommentert, vi fann ei lus i ny
TILTAK:
- Heli må laga ein ny diff => Trond sender e-post
- diffen skal liggja i $GTHOME/langs/sme/test/data/move/
Møterommet
Vi har fått e-post frå Kyrre Soleng. Møte om ca 2 veker (i november).
Sør-Afrika
Trond har skrive e-post, vi ventar på svar.
TTS
Vi har ein betaversjon! Våre testarar bør få litt meir eksplisitt
Fleire betatestarar:
- Audun
- Per Edvard
- Nils Øyvind Helander + resten av språkavdelinga på SD
Børre lagar nettskjema med lydfilene, og deretter ber vi folk på FB om å testa.
Direkte nedlasting av fst-ar
Folk vil analysera sjølve, men vil ikkje ha heile pakka, og vil ikkje byggja frå
Språk? I prinsippet alle, men sme.
Kompiler på xserve, legg ut på static_files
Vi kan ha eit shellscript
Dei treng tre typar filer:
- Eksterne program:
- (hfst-)lookup
- vislcg3
- perl ~ hfst-tokenisering
- (hfst-)lookup
- binære analysefiler
- analyser-gt-desc.hfst
- disambiguate.bin
- analyser-gt-desc.hfst
- giella-skript:
- preprocess
- lookup2cg
- preprocess
Mål: vi lagar ei pakke som kan distribuerast og som inneheld alt bortsett frå
Timeplan? Vi må koma attende til saka.
Teksting-korpus
Vi får tilgang til eit korpus av samisk teksta TV-sendingar, frå univ i Joensuu.
Lukka ok, vi har ein lisens for det. Men vi kjem til å nytta deriverte data til
TILTAK: Trond følgjer opp.
Mobiltastatur
For seg sjølv eller i langs? Trond: for seg sjølv.
ENG
Møte: kl 8. torsdag
Neste CLARINO-møte
Når? 1-2.12.2014 (UB er arrangør). Skal vi prata om Akan? Utveksla data?
Tiltak: skriva svar - men vi ventar, vi må prata meir.