191120
Giellateknomøte 20.11.19
Til stades:
Saksliste
- Gjennomgang av situasjonen og prioriteringar frå sist møte
- Prioriteringar fram mot jul
- Andre saker
Gjennomgang av situasjonen og prioriteringar frå sist møte
https: //giellalt.uit.no/admin/giellatekno/191024.html
Wordpress
Ingenting har skjedd. Den nye sida fungerer, både ny og gammal
Chiara kan logge seg inn, men Kasia kan ikkje gjere det. Ho
Apertium sme-smn
Vi bør også hugse sme-smn (Lene ser på samansetjingsstiar også for smn).
Annex
Dette er lyd i Korp (jf. epost frå Lene med bilde av poster fra NoDaLiDa).
NDS
Chiara og Trond arbeidde mykje med Biret Merete og logging sist veke.
Vi bør kanskje skrive ein dokumentasjon på access-loggen (Trond diskuterer med BM)
Lene har systematisk sjekket og lagt til type til substantiver. Lene skal skrive Bz for å komme direkte til sme-lemma fra nobsme.
Korp
Den tospråklege nob-sma vart analysert med xfst. Chiara har arbeidd med å flytte til hfst.
Chiara forbetrar dokumentasjonen og sjekkar inn filene til dette..
du -sh for det gamle 2012-korpuset og for heile (gammalt + nytt) gjev:
- 49M freecorpus/stable/tmx/nob2sme/data.nob2sme.20121112.tmx
- 65M big/mt/omegat/nob-sme/tm/nobsme.tmx
Det har med andre ord komme til 16MB nytt innhald etter FAD-prosjektet (2012).
Sametinget har lovd å sende tekster, men det har enda ikke kommet. Møte med dem 12. desember (Trond og Lene).
Det tospråklege korpuset burde komme inn fortest mulig slik av vi rekker både å parallellisere dem og ha dem med i oppdatert korpus i Korp.
Chiara analyserer 2012-filene no, og 16+ -filene (dvs. dei nye etter 2012 + det som kjem til seminaret) siste veka før seminaret.
Vi bør (når vi får litt meir tekst) lage ei betre inndeling for parallell tekst, t.d.
aanaar allaskuvla avi.fi depts ely-keskus evalueringsportalen fefo ffk fi_depts finnmark.no fylkesmannen giellagaldu gonagasviessu.no guovda helsenorge jll.se kainun_institutti kirken.no lansstyrelsen.se metsa.fi nordlandfk nsr ohcejohka oikeusministerio other_files porsanger saamicouncil sd sogsakk uffda uit ulapland
Bibelen
Når det gjeld tekstane vi har fått ventar vi på Børre.
Lene har arbeidd med MT-versjonar av bibeltekstar + sendt to versjoner sme2sma, dvs. ein eigen
Namn i Bibelen er feilanalysert (alle namn som tostava). Problemet er
mhr og mrj
Vi har problem med å gje Chiara tilgang til korpuset på gtsvn-servaren.
Preprosessering
Ikkje gjort:
nasjonalbiblioteket
Prioriteringar fram mot jul
Paris
Lene reiser ikke, sjekker med Børre.
Paris vil, i tillegg til posteren, ha 4 sider(?). Trond høyrer med Sjur. Vi må
CG-MT
Trond snakkar med Sjur om alt-i-eitt-versjonen av pipeline, og om MT-veka, og skriv til E om ting som ikkje fungerer (store bokstavar, halvparten av orda blir ikkje generert).
tmx minne
Trond skriv dokumentasjon for Wordfast.
LIA seminar
Artikkelskriving
Writing retreat på gamle Nordlysobservatoriet siste uka før jul
Andre saker
Chiara reiser til Italia 2.12-9.12