201223
Giellateknomøte 23.12.
Tilstede: Trond, Chiara, Lene
Saker:
- Oppsummering av hausten
- Korpusoppdateringa
- NDS
- Våren
- Servarar
- oahpa.no
- Nasjonale minoritetsspråk
Oppsummering av hausten
Artiklar
- To artiklar i Sámi logut muitalit, publisert (Trond, Lene)
- Artikkel om MT i UiO antologi (Trond, Lene)
- Artikkel om leksikalisering, publisert (Linda, Tommi, Chiara, Trond)
- LIA-artikkel for LIA-antologi (Lene)
- Px i avisspråk, for SDÁ, publiseres 2020 (Lene, Laura)
Registrering i Cristin:
- Trond registrerer /sjekkar Sámi logut muitalit
Andre ting
Stavekontrollanseringar
- fao lansert, fit og cor i betaversjon
Enaresamisk
Mastersudentar
Migrering til python3
- python2 til python3
Korpusoppdateringa
Status:
- u_korp: corpus oppdatert og Korp fra v2 til v6 (Chiara)
- grep_corpus for de samiske + u_korp
- Todo
- Chiara har lasta kode opp til github, https://github.com/giellatekno
Oversikt i korp_corpus.txt under admin i det private korpuset.
- u_korp = mhr 50, myv 9, mdf 9, mrj 5 mill ord.
- f_korp = fiv parallelltekst, fit, fao.
- korp = SIKOR, mykje ny parallelltekst
Vi ser på prioritering av f_korp og korp den 4.1.
Grensesnitt
Grafikk
Sikor mer synlig enn Korp
Markering av aktivt språk
Tospråklege tekstar
NDS
Her har det skjedd lite i det siste.
- Trond har hatt to seminar med leksikografar
- Chiara og Trond har arbeidd med spa-sme.
Automatisk oppdatering av innhald: Dette gjer vi etter migrering til git.
Våren
Planar for artiklar
- MT av Ávvir til smj, Lene følger opp, samarbeid med Inga
MT
Apertium
NMT
Vi vil samarbeide med både Helsingfors og Uleåborg om dette.
CG
Sosiolingvistikk
- Kasia blir phd-student hausten 2021,
- SA har 4 phd-stipendiatar frå 2021
Vi bør samarbeide om phd-kurs
Fellesseminar der studentane blir kjent + der institusjonane presenterer seg sjølv og ressursane sine.
Undervisning
Språkhistorie
Trond Våren 2021.
Elles har vi ikkje undervisning.
Språkteknologi og korpuslingvistikk
Digitalisering og Samisk arkiv
Vi bør invitere Arkivverket til eit møte om dette:
- kva skal tekstar skal/kan digitaliserast, og til kva slags grensesnitt?
- Kva rolle vil språkteknologien spele i dette? Blir tekstene digitalisert slik at de blir brukbare etterpå for analyse, samisk søk osv.
Trond følgjer opp dette.
Servarar
Automatisk status:
gtweb, gtoahpa, gtdict
oahpa.no
Det har ikkje vore oppdatering av oahpa-dokumantasjonssidene sidan juni 2019. No blir det ein del aktivitet framover.
Nasjonale minoritetsspråk
Trond diskutere dette med relavante kanalar.