course December2015
Kurs i Apertium-MT
Tidspunkt:7-10. desember
Sted:Tromsø
Innhald:
- Kva er MT, om prosjektet
- Teknisk: Maskiner skal fungere
- Metodisk: Arbeidsrutiner
- Lingvistisk:
- Arbeide med bidix
- Arbeide med generering
- Arbeide med MT-transfer (syntaks)
- Arbeide med bidix
Forarbeid
- Installere Apertium
- Setje opp pending tests - på Apertium-wiki
- Sikre oss at vi har eit fungerande system
- Legge til tilgjengelig materiale i bidix-filene
- Finne parallelltekstar for arbeid på kurset
- Lage system og placeholdere for kursmateriale
Kurs i Apertium-MT
Tidspunkt:7-10. desember
Sted:Tromsø
Innhald:
- Teknisk: Maskiner skal fungere
- Metodisk: Arbeidsrutiner
- Lingvistisk:
- Arbeide med bidix
- Arbeide med generering
- Arbeide med MT-transfer (syntaks)
- Arbeide med bidix
Forarbeid
- Installere Apertium
- Setje opp pending tests - på Apertium-wiki
- Sikre oss at vi har eit fungerande system
- Legge til tilgjengelig materiale i bidix-filene
- Finne parallelltekstar for arbeid på kurset
- Lage system og placeholdere for kursmateriale
Notater:
Kursplan:
Dag 1
- Kva er MT, om prosjektet ((web+wp) Trond)
-
presentation
- Wiki ContentTranslation
- apertium.org
-
presentation
- Legge inn aliaser - Lene
- Apertium i vårt system - Fran (gt+gt=ap)
- Apertiums moduler - Fran
- Apertiums tagger vs giellatekno/divvuns tagger, analyse - Lene
- Apertiums kommandoer
- apertium -d . sme-sma
- apertium -d . sme-sma-TILLEGG (morph, biltrans, postchunk)
- analyse, generering av morfologi hfst-proc sma-sme.automorf.hfst
- apertium -d . sme-sma
- Prøve å oversette tekst
- Evaluering (Fran)
- definere problemer (i hvilken modul) - Lene
- Begynne å redigere bidix - Trond
-
presentation
- Legge til ord, rette ord, fjerne linjer
- Validere: make
-
presentation
Dag 2
- Bidix: Arbeid i praksis (Trond)
- Arbeid med grunnlag i tekst som ikke har parallell
- Arbeid med grunnlag i parallelle tekster
- Arbeid med grunnlag i tekst som ikke har parallell
- Lexical selection - Trond/Fran (*eks)
- Dynamisk sammensetning - Lene
- Missinglist - Lene
Dag 3
- Generering, hvordan tilpasse FSTer (Trond)
- Lukka ordklasser
- Ikke-samsvar i taggene i sme, smn, sma, smj
- Lukka ordklasser
- Derivasjoner (Lene)
- Syntaks: kvasikode for transferregler (Lene)
- Posisjon
- Om hver posisjon: tag, lemma/sett av lemma (positiv/negativ)
- Referanse til SL eller TL
- Posisjon
Dag 4
- Er problemet sme-disambiguering?
- Pending tests og regresjonstester - wiki
- Mer praktisk arbeid
- Ny evaluering
- Planlegge arbeidet videre, arbeidsdeling
- bidix -
- revisjon (smj?)
- bidix - frekvenssortering
- bidix - legge til ord fre frekvsortert missinglist
- revisjon (smj?)
- leksikalsk seleksjon
- transfer
Etter kurset
- temaundervisning med jevne mellomrom
- kursuke nr. 2 (når?)
- Mål
- Akademisk: Publikasjoner (NFR, oss) (PhD)
- Fungerende system (språksamfunnet, oss)
- Milepæler for forskjellige bruksområder
- Støttetekst
- Redigerbar tekst
- hva er viktigst
- Støttetekst
- kontrastiv grammatikk
- For artikkel: t.d. hjelpeverb
- For artikkel: t.d. hjelpeverb
- Akademisk: Publikasjoner (NFR, oss) (PhD)
- Arbeidsmetode
- Konkret mål for sme2smX Spesifikt korpus
- Konkret mål for sme2smX Spesifikt korpus