210126

Giellateknomøte 26.01.2021

Tilstede: Trond, Lene, Chiara

Saker:

  • oppfølgjing frå sist
  • Korp
  • MT
  • Sosling-gruppa
  • Digitaliseringstiltak på UiT
  • Neste møte

Oppfølgjing frå sist

  • Giellalt bµgger (Børre har sett på det), også for dei språkspesifikke sidene, t.d. https://giellalt.uit.no/lang/fkv/KvenDocumentation.html
  • Migrering av python2 til python3, Dette er framleis på oppdateringslista.
  • Digitalisering og Samisk arkiv. Trond har gjort framlegg om OCR-lesing av gamle tekstar. Det er mogleg vi får som svar at det berre gjeld fotografering av Riksarkivet og Samisk Arkiv. Vi får høyre.
  • Nasjonale minoritetsspråk. Trond har skrive brev til KD.
  • ssh og nøklar. Vi bør bestemme kva vi vil gjere, Chiara må svare. Hvis alle bruker ssh-nøkkel, kan man stenge for passordinnlogging. Trond og Lene følger opp i dag.
  • sms og +Comp til +Der/Comp. Trond har skrive til Jack, skal følgje opp.
  • UArctic Digitalisering og sirkumpolare språk. Trond har kontakt med Svein på SA om dette
  • ICALL-prosjekt for nasjonale minoritetspråk i Sverige -- dette blir det ikkje noko av i denne omgang.
  • HIF-10zz i regulære uttrykk og bruk av språkteknologi. Trond held eit samlingsbasert kurs til hausten.
  • SAM.30zz Språkteknologi og korpuslingvistikk. Haust eller vår? Lene og Trond ser på dette.

Korp

Buggane i u_korp

Her har Chiara fiksa fleire: Omsetjingar av attributt og pop-up for taggar. På lista: Årstalsboksen. Deretter https://github.com/giellatekno/korp-frontend/issues/5

Ting å gjere med SIKOR

Comp i sms

Vi vl ha Der/Comp i den nye versjonen.

Evt. arbeid med smn

Sjå på missing list

Grepkorpus

Lene har gode rutiner:

  • Strengar med feil taggar (dobbel POS, ...)
  • Missing list (sjekk at det ikkje er nye ord på toppen)

Bibelen

Få med bibelen parallellisert, også nob

Framdrift

  1. Tekniske ting og Bibel og lingvistisk arbeid
  2. f_korp
  3. SIKOR

MT

NMT-møte

Vi bør ha et oppsett på Giellatekno, vi ser på git-sidene med relevante pipelines, når vi får tid til det.

fin-sme

Trond og Lene har sett på dette, framleis litt att. Deretter er det snakk om betre dis-fil og tilpassing av syntaktiske taggar til vårt system. Det å få med funksjonstaggar krev val av fil (gjort) og tilpassing av syntaggar (må bli gjort).

sme-smn

Trond har ikkje sett på dette. Lene ser på taggar i sme-smn, ser på regresjonstesting etter taggmøtet vi hadde.

MT for smj

Vi treng ikkje få godkjenning for innsamling av materiale hos NSDs fordi vi ikkje lagrar persondata.

Sosling

Møte neste veke. Lene kallar inn.

Digitaliseringstiltak på UiT

https://uit.no/tavla/artikkel/715700/midler_til_digitalisering?p_document_id=715700

Søknadsfrist er 19/2 2021.

Digitaliseringsrådet forvalter et budsjett på 5 MNOK. Disse skal fordeles på digitaliseringstiltak som bidrar til at UiT når sine strategiske mål knyttet til utdanning, forskning og formidling.

  1. Eksperimentell utprøving av løsninger for bedre undervisning eller forskning i små pilotprosjekt. Disse prosjektene vil ha som formål å finne ut om et verktøy eller en arbeidsmåte bidrar til mer læring eller bedre forskning.
  2. Oppskalering av løsninger som har vært prøvd ut én eller flere steder i organisasjonen og som har gitt gode resultater.
  3. Tilrettelegging for digital forskning og utdanning generelt, rettet mot vitenskapelig ansatte. Dette kan være samarbeidsarenaer, kurs, webinarer, organisering av informasjon eller tilrettelegging for deling av digitale læringsobjekter.

Moglege ting å søke på

  • Utvide programmeringsressursar
  • Samle inn korpus
  • Handsame data frå Samisk arkiv
  • Jf. også jusprosjektet, evt. sykepleieterminologi
  • Argumentere for programmerar med ekstern ad hoc-finansiering for instituttet

Oppsummering

  • Småting i boks
  • Prioritering av og plan for Korp-arbeid
  • Strategisk satsing for å styrke programmering og teksthandsaming (Lene, Trond)

Neste møte

Vi tar møte etter at vi har fått ein korpusversjon til på plass. Chiara gir beskjed.