160104
Čoahkkin 04.01.2016
Erika (mielde MT-oasis), Lene, Marja-Liisa, Trond
Áššelistu
- Válljet teavstta evalueremii.
- Min bargu ovddos guvlui, ovdal evaluerema.
- MT
- Neeta ja Miina bargu
- FST
- yaml-teasttat
- derivašuvnnat
- yaml-teasttat
- MT
- Konferánsaposter
Válljet teavstta evalueremii
- Domeana jagi 2016 perspektiivvas: servodatoahppogirjjit?
- Evalueremii:
- su. davvisámegiel 300 sáni
- vejolaččat 2 teavstta, Suoma ja Norgga bealde čállon
- sámi politihkka, vuoigatvuođat...
- 3 jorgaleaddji livčče buorre
- IM, SM, T, MM, ML
- IM, SM, T, MM, ML
- su. davvisámegiel 300 sáni
- Váruhusreive jorgaleddjiide. Lene čállá odne.
Reive mii sáddejuvvui lullisámeprošeavtta oktavuođas:
Vedlagt er to tekster, hver på 300 ord, som skal oversettes til sørsamisk. Til den ene teksten får du en "sørsamisk" kladd som er lagd ved hjelp av et oversettingsprogram. Programmet er en mulig begynnelse på noe, men det er veldig uferdig. Uansett hvor mye vi ville kunne arbeide med et slikt program, vil det likevel aldri kunne bli noe mer enn en hjelp for oversettere, men forhåpentligvis vil det kunne bli bedre enn det er nå.
Hensikten med dette er å finne ut hvor nyttig et oversettingsprogram vil være for sørsamiske oversettere. Vi lurer f.eks. på om det går raskere å rette en slik kladd, enn å oversette fra blanke ark. Og om en maskinoversatt tekst ellers kan nyttig for oversetteren.
Vi ber deg ta tiden du bruker på oversettingene. Det er interessant for oss å sammenlikne tiden den samme oversetteren bruker på de to tekstene, ikke å sammenlikne oversettere (dette sendt til 4-5 oversettere). Vi ber deg også å svare på noen spørsmål etter at du har gjort oversettingene.
Vi vil i foredrag og artikler refere til hva oversettere synes, men vi vil ikke i noen sammenheng refere til hvem oversetterne er. De sørsamiske tekstene som dere oversetter, vil vi bruke til arbeid med å forbedre programmet, hvis vi bestemmer oss for å arbeide videre med dette. Det er avhengig av finansiering og prioriteringer.
Takk for hjelpa! Gæjhtoe viehkien åvteste!
Hilsen Lene Antonsen og Trond Trosterud
Spørsmål:
- Sammenlikne tiden du brukte på oversettingene:
- _ Jeg brukte lenger tid på tekst A enn på tekst B:
- _ Jeg brukte omtrent like lang tid på tekst A og tekst B:
- _ Jeg brukte lenger tid på tekst B enn på tekst A:
- _ Jeg brukte lenger tid på tekst A enn på tekst B:
- Hvordan vurderer du den maskinoversatte teksten?
- - den var veldig nyttig
- - den var litt nyttig
- - den var ikke nyttig
- - den var veldig nyttig
- Hvordan brukte du den maskinoversatte teksten?
- _ Jeg tok utgangspunkt i den maskinoversatte teksten og rettet den
- _ Jeg skrev den sørsamiske oversettelsen fra bunnen av, men brukte den maskinoversatte teksten som støtte / for å finne termer
- _ Den sørsamiske teksten var så dårlig / misvisende at jeg fant det bedre å se helt bort fra den
- _ Jeg tok utgangspunkt i den maskinoversatte teksten og rettet den
- Hvordan vurderer du den maskinoversatte teksten når det gjelder terminologi:
- - den inneholdt mer nyttige termer, enn dårlige termer
- - den inneholdt omtrent like mange nyttige termer, som dårlige termer
- - den inneholdt flere dårlige termer enn nyttige termer
- - den inneholdt mer nyttige termer, enn dårlige termer
- Gi eksempler på nyttige termer i den maskinoversatte teksten:
- Gi eksempler på dårlig termer i den maskinoversatte teksten:
- Grammatikken - kom gjerne med kommentarer:
- Vil et slikt oversettingsprogram være nyttig for oversettere?
- – ja, til og med et så pass dårlig program kan være nyttig
- – ja, men bare hvis det er en god del bedre enn dette programmet
- – ja, men bare hvis det gir nesten perfekt oversettelse
- – nei, dette tror jeg ikke vil være nyttig. Hvorfor?
- – ja, til og med et så pass dårlig program kan være nyttig
Min bargu ovddos guvlui, ovdal evaluerema:
MT
Bargat missinglisttuin stuorit materiálas (ML)
- jorgalit davvisámegiel sáni anársámegillii
- lasihit ođđa pára bidixii
Paralleallateavsttaiguin bargat (Erika)
- leat boahtán ođđa teavsttat, vuoruhit
- PresidentNiinisto_Newyearspeech_sme.txt
- Giellagas_homepages.txt (sme)
- PresidentNiinisto_Newyearspeech_sme.txt
Lonuhit dokumeantta nama:
svn mv Giellagas_homepages.txt Giellagas_homepages_sme.txt svn ci -m "dsfdf "
Árvvoštallat pending tests (ML)
http://wiki.apertium.org/wiki/North_Saami_and_Inari_Saami/Pending_tests
./t/pending-tests
Transfer- ja lex-selection njuolggadusat
FST
Bargoprinsihpat:
- Vuorut barggu mii guoská yaml-fiillaide, main lea FAIL (ulbmil: 0 FAIL)
- Ovdalgo šekke sisa barggu mii lea dahkkon FST: s
- yaml-fiila galgá addit PASS (jus it fidne PASS, de sáhtát jearrat veahki, dahje kommenteret eret hámiid mat eai doaimma)
- galggat testet OLLES yaml- ja lemma-check (make check dahje test/yaml-check.sh pluss test/lemma-check.sh), ja boađus ii oaččo hedjonit
- yaml-fiila galgá addit PASS (jus it fidne PASS, de sáhtát jearrat veahki, dahje kommenteret eret hámiid mat eai doaimma)
- Jus yaml-fiila ii atte rivttes gova
- attes eanet hámiid yaml-fiilii, omd.
njälmi+N+Pl+Com: njalmijguin njälmi+N+Pl+Abe: njalmijttáá njälmi+N+Sg+Ill+PxSg3: njálmásis
FST-vuoruheapmi
yaml-teasttat - otná boađus
YAML test 130: generator-gt-norm.xfst + gt-norm-yamls/V-3lex_putestid_gt-norm.gen.yaml - 153/21/174 FAIL YAML test 14: generator-gt-norm.xfst + gt-norm-yamls/A-3lex_vaanis_gt-norm.gen.yaml - 48/2/50 FAIL [27/49][FAIL] #väänis+A+Comp+Pl+Acc => Missing results: vánásuboid vánásuboid [27/49][FAIL] väänis+A+Comp+Pl+Acc => Unexpected results: vánásubboid [28/49][PASS] väänis+A+Comp+Pl+Ill => vánásubboid [29/49][FAIL] #väänis+A+Comp+Pl+Loc => Missing results: vánásuboin [29/49][FAIL] väänis+A+Comp+Pl+Loc => Unexpected results: vánásubboin vánásub attr. NJUORAS - njuorâsuboi, njuorâsuboid, njuorâsubboid Kommando: egrep '(NJUORAS|UAMIS|HAANIS|TIMES|HAAITIS|HEEITUG|VAANIS)' src/morphology/stems/adjectives.lexc|cut -d":" -f1|sed 's/$/+A+Comp+Pl+Acc/g;'|dsmn káálgus+A+Comp+Pl+Acc kálgusubboid miälgus+A+Comp+Pl+Acc miälgusubboid šiälgus+A+Comp+Pl+Acc šiälgusubboid muájus+A+Comp+Pl+Acc muájusubboid ... LEXICON VAANIS !!= __@CODE@__ directing to X_PAAVIR, attr. väni +A+Attr:väni K ; ! +A+Attr:vanâ K ; ! +A:váánnás%^ÁI X_PAAVIR ; +A:váánnás%^ÁI%^CSH%>u COMPo ; <==== +A:váánnás%^ÁI%^CSH%>u MOS ; +A+Cmp/Attr:väni%> R ; YAML test 181: generator-gt-norm.xfst + gt-norm-yamls/V-lex_vuossatDerPass_gt-norm.gen.yaml - 55/1/56 FAIL [49/55][PASS] vuoššâđ+V+Der/Pass+V+PrsPrc => vuáššojijjee vyeššee [49/55][FAIL] vuoššâđ+V+Der/Pass+V+PrsPrc => Unexpected results: vuáššojeijee PrsPrc ii galgga leat mielde Pass-leksikonas -vuššâđ - vuoššuđ YAML test 146: generator-gt-norm.xfst + gt-norm-yamls/V-lex_compl_ud_gt-norm.gen.yaml - 134/21/155 FAIL [1/9][PASS] láámmuđ+V+Inf => láámmuđ mm [2/9][PASS] láámmuđ+V+Ind+Prs+Sg1 => láámum [3/9][FAIL] láámmuđ+V+Ind+Prs+Sg3 => Missing results: láámu m [3/9][FAIL] láámmuđ+V+Ind+Prs+Sg3 => Unexpected results: láámmu [4/9][PASS] láámmuđ+V+Ind+Prs+Du1 => lámmoon [5/9][PASS] láámmuđ+V+Ind+Prs+Pl3 => láámmuh mm - m [6/9][PASS] láámmuđ+V+Ind+Prs+ConNeg => láámu [7/9][PASS] láámmuđ+V+Ind+Prt+Sg1 => laammum [8/9][PASS] láámmuđ+V+Ind+Prt+Sg3 => láámui [9/9][PASS] láámmuđ+V+Ind+Prt+Pl3 => lammuu YAML test 148: generator-gt-norm.xfst + gt-norm-yamls/V-lex_diph_ud_gt-norm.gen.yaml - 1833/14/1847 FAIL liäđđuđ+V+Ind+Prs+Pl3: liäđuh #corpusis more freq: liäđđuh - liäđuh Err/Orth: CSH Parkeret dáid?: YAML test 185: generator-gt-norm.xfst + gt-norm-yamls/V-list_3st_id_gt-norm.gen.yaml - 1462/156/1618 FAIL YAML test 195: generator-gt-norm.xfst + gt-norm-yamls/V-list_ed_gt-norm.gen.yaml - 135/14/149 FAIL YAML test 196: generator-gt-norm.xfst + gt-norm-yamls/V-list_id_gt-norm.gen.yaml - 517/1/518 FAIL YAML test 198: generator-gt-norm.xfst + gt-norm-yamls/V-list_long_id_gt-norm.gen.yaml - 46/2/48 FAIL YAML test 199: generator-gt-norm.xfst + gt-norm-yamls/V-list_od_gt-norm.gen.yaml - 185/9/194 FAIL YAML test 200: generator-gt-norm.xfst + gt-norm-yamls/V-list_ud_gt-norm.gen.yaml - 489/24/513 FAIL SUMMARY for the generating gt-norm fst(s): PASSES: 25943 / FAILS: 265 / TOTAL: 26208
Derivašuvnnat
Miina ja Neeta barggut
- Add words to bidix, also bŧ translation on web
- Check word pairs in bidix
Trond bagada sudno.
-rw-r--r-- 1 root root 398590 jan. 3 04: 13 /usr/share/apertium/apertium-sme-smn/sme-smn.autobil.bin
SUMMARY for the generating gt-norm fst(s): PASSES: 20745 / FAILS: 59 / TOTAL: 20804
Konferánsa-poster
open ~/main/art/2016/iwclul/smnpaper/poster/smnposter.pdf
Posters galgá leat sullii válmmaš 11.1, dalle mii dušše geahččat detáljjaid.
Next meeting
Vuossárgga dii. 10: derivašuvnnat ja posters
Notáhtat
sh devtools/verb_minip.sh PUTESTID kobdediđ+V+Inf kobdediđ kobdediđ+V+Ind+Prs+Sg1 kobdedâm kobdediđ+V+Ind+Prs+Sg3 kobdeed kobdediđ+V+Ind+Prs+Du1 kobdedeen kobdediđ+V+Ind+Prs+Pl3 kobdedeh kobdediđ+V+Ind+Prs+ConNeg kobded kobdediđ+V+Ind+Prt+Sg1 kobdedim kobdediđ+V+Ind+Prt+Sg3 kobdedij kobdediđ+V+Ind+Prt+Pl3 kobdedii [46/57][FAIL] lasettiđ+V+Ind+Prs+ConNeg => Missing results: lasseet [46/57][FAIL] lasettiđ+V+Ind+Prs+ConNeg => Unexpected results: laaseet kobdediđ:kobde%^SVd 3_PUTESTID ; lasettiđ:las%^RCe%^SVtt 3_PUTESTID ; ! !YAML