191213

Giellateknomøte 13.12. 2019

Til stades: Chiara, Lene, Trond, Risten

Saksliste:

  • Parallelltekster relevante for sametingene i Norge og Finland
  • Oppdatering av Korp
  • Saker fra forrige møte

Parallelltekster relevante for sametingene i Norge og Finland

Trond og Lene underviste i bruk av tospråklig Korp og OmegaT, til oversettere fra norsk Sameting

Arbeid i etterkant:

  • Lene rydder i Sametinget interne ordliste slik at den kan brukes i OmegaT, og sender den til Sametinget
  • OmegaT
    • Mange ting å gjøre for å forbedre OmegaT, avhengig av tilbakemeldinger fra Sametinget.
    • Trond daterer tmx-filene på internett (f.eks. sist oppdatert XX, størrelse XX)
  • Korp: vi så en del ting som bør forbedres, vi skriver liste til Chiara
  • nobsmj: Lene lager en oversikt over hva som er parallellisert og hva som kan parallelliseres. Sende epost til Sametinget og be dem sende flere dokumenter, evt med link til freecorpus på internett slik at de ser hva vi har.
  • Lene lager en liste til Risten over hvilke filer som finnes i SD katalogen som ikke er parallellisert, både smj-nob, sme-nob
  • Lene legger til de mest frekvente abbr til smj
  • Risten prioriterer nob-smj, spesielt sametingstekster

Trond reiser til Inari i januar for å holde tilsvarende kurs for oversettere ved finsk sameting

<tu> i biggis/mt/omegat i dag, her må man sjekke realitetene (dvs dubletter, god parallellisering).

  • Lene sjekker nob-smj,
  • Trond sjekker fin-smX.
  • nob-sme og nob-sma: disse er ok

Filene:

  • nob-sme 216456
  • nob-sma 13292
  • fin-smn 34351
  • fin-sms 6481
  • nob-smj 1643

Vi planlegger å legge nob-smj i Korp i januar, avhengig av tilbakemelding fra Sametinget.

Oppdatering av Korp

Marisk:mhr (771 MB, 65 mill ord), mrj (70M

IWCLUL er 10.-11. januar 2020. mhr bør være i Korp til da, evt. mrj hvis det er tid til det. Arbeidet kan startes nå.

Saker fra forrige møte

Access fra finsk Korp (Trond ser på det, se forrige referat).