201223

Giellateknomøte 23.12.

Tilstede: Trond, Chiara, Lene

Saker:

  • Oppsummering av hausten
  • Korpusoppdateringa
  • NDS
  • Våren
  • Servarar
  • oahpa.no
  • Nasjonale minoritetsspråk

Oppsummering av hausten

Artiklar

  • To artiklar i Sámi logut muitalit, publisert (Trond, Lene)
  • Artikkel om MT i UiO antologi (Trond, Lene)
  • Artikkel om leksikalisering, publisert (Linda, Tommi, Chiara, Trond)
  • LIA-artikkel for LIA-antologi (Lene)
  • Px i avisspråk, for SDÁ, publiseres 2020 (Lene, Laura)

Registrering i Cristin:

  • Trond registrerer /sjekkar Sámi logut muitalit

Andre ting

Stavekontrollanseringar

  • fao lansert, fit og cor i betaversjon

Enaresamisk

Mastersudentar

Migrering til python3

  • python2 til python3 Chiara har arbeidd med dette. NDS er i Python 2, Brendan vil hjelpe til

Korpusoppdateringa

Status:

  • u_korp: corpus oppdatert og Korp fra v2 til v6 (Chiara)
  • grep_corpus for de samiske + u_korp
  • Todo u_korp: legge til tidsinterval f_korp: både corpus og Korp oppdatering fra v2 til v6 korp: corpus oppdatering og eventuelt Korp fra v6 til v9 ny grep_corpus for de samiske
  • Chiara har lasta kode opp til github, https://github.com/giellatekno

Oversikt i korp_corpus.txt under admin i det private korpuset.

  1. u_korp = mhr 50, myv 9, mdf 9, mrj 5 mill ord.
  2. f_korp = fiv parallelltekst, fit, fao.
  3. korp = SIKOR, mykje ny parallelltekst

Vi ser på prioritering av f_korp og korp den 4.1.

Grensesnitt

Grafikk

Sikor mer synlig enn Korp

Markering av aktivt språk

Ønskjemål: klårare markering av kva apråk som er aktivt

Tospråklege tekstar

vi må ha ei rullegardin for all fleirspråkleg tekst

NDS

Her har det skjedd lite i det siste.

  • Trond har hatt to seminar med leksikografar
  • Chiara og Trond har arbeidd med spa-sme.

Automatisk oppdatering av innhald: Dette gjer vi etter migrering til git.

Våren

Planar for artiklar

  • MT av Ávvir til smj, Lene følger opp, samarbeid med Inga

MT

Apertium

smj, sma, ...

NMT

Helsingfors har laga oppsett for NMT for samiske språk. Uleåborg vil ha MT-kurs, bruke både Hfors og oss.

Vi vil samarbeide med både Helsingfors og Uleåborg om dette.

CG

Trond diskutere med Eckhard om eitt språkpar og tilpassing til ny struktur i git.

Sosiolingvistikk

  • Kasia blir phd-student hausten 2021,
  • SA har 4 phd-stipendiatar frå 2021

Vi bør samarbeide om phd-kurs

Fellesseminar der studentane blir kjent + der institusjonane presenterer seg sjølv og ressursane sine. Også

Undervisning

Språkhistorie

Trond Våren 2021.

Elles har vi ikkje undervisning.

Språkteknologi og korpuslingvistikk

Våren 2022

Digitalisering og Samisk arkiv

Vi bør invitere Arkivverket til eit møte om dette:

  • kva skal tekstar skal/kan digitaliserast, og til kva slags grensesnitt?
  • Kva rolle vil språkteknologien spele i dette? Blir tekstene digitalisert slik at de blir brukbare etterpå for analyse, samisk søk osv.

Trond følgjer opp dette.

Servarar

Automatisk status: https: //github.com/divvun/registry

gtweb, gtoahpa, gtdict

oahpa.no

Det har ikkje vore oppdatering av oahpa-dokumantasjonssidene sidan juni 2019. No blir det ein del aktivitet framover.

Nasjonale minoritetsspråk

Trond diskutere dette med relavante kanalar.