150225
gt-møte 25.2. 2015
Til stades: Ciprian, Lene, Marja-Liisa, Trond
Saksliste
- NRK
- Korpus
- Strukturering av arbeidet
- Ordbøker
NRK
- grammatikkontrollen
- satni.org hører sammen med Divvun-programmet (normering)
- NDS (inneholder mer språkteknologi, både morfologi og lenker til korpus)
- 2000 oppslag pr dag smenob-nobsme, ca 300 finsme-smefin
Korpus
Innsamlingsarbeid
- hvem sitt arbeid å legge inn filer i korpus?
- Oss alle + innleigd hjelp
- Oss alle + innleigd hjelp
- lage inc-mapper i bound og free for nye filer
- iflg kontrakter er det ikke lov til å laste ned bound på egen maskin noe som gjør det vanskelig å arbeide - hva kan gjøres med dette?
- lage liste på internett over hva som finnes i korpus (hvem??)
- rutiner for
- analyse
- hvilke analyserte versjoner som skal tas vare på og hvor lenge
- grep-korpus på Divvun
- legge inn i Korp
- analyse
Enkeltfiler
- Lovfilene er forbetra, manuelt parallellisert (Ciprians sak)
- Samiske tall forteller: manuelt delt opp i enkeltdokumenter (sendes til Trond)
- SDA-2006: ny versjon kommet fra Jussi fordi den opprinnelige versjonen ikke var konverterbar (sendes til Trond)
- Trond forklarer Jaska biggies
Lagring av filer på divvun-serveren
- månedsvise referanseversjonar som grepkorpus i analyzed
- tre dagar
- Sjekkerutine: bit-mengde skal vere omtrent like stor,
- Sjekkerutine: bit-mengde skal vere omtrent like stor,
- Det skal aldri vere slik at repositorium er tomt
Ciprian gjer dette.
Strukturering av arbeidet
Ordbøker
Ciprian snur fila til nobsme. Dette gjelder bare denne fila: smenob/src/N_Propgeo_smenob.xml. Den inneholder bare navn som ikke er med i N_Prop_smenob.xml.