150114

Giellatekno-møte 14.1.

Saksliste

  • Workshop
  • Denne veka
  • Giellatekno
  • Korpus
  • Kursplan for SAM-3000
  • Kamera
  • Neste møte

Workshop

Programmet og hjemmesida må redigeres (Trond gjør dette)

  • Romnr inn på selve programmet
  • Info om parallel session
  • Link til programmet helt øverst
  • Heile sida opp-ned

Sende epost til alle IS ansatte om dette idag

(Lene gjør dette)

Denne veka

Kimmo på torsdag? TWOL som morfologisk teori

Giellatekno

Orienteringar.

Korpus

Tospråklige tekster:

Samiske tall foreller, 1-7. Lene sender epost til Ciprian med info om sekretariatet for evt å få wordfiler derfra.

Hente terminologi frå vitskaplege tekstar

Tagge termer når man legger dem inn i lexc? Eller legge til kommmentar? !TERM

  • Ny lingvistisk term frå lingvistisk oppgåve = +Term/Ling
  • Men kva med lingvistiske termar som er i lexc i dag?
    • Legge til
  • Kva med tvetydige termar?
    • Dobbeltoppföring?
    • Dobbeltagg +Term/Geo_Ling
  • Kven vil ha dette?
    • satni.org + Autshomato verda rundt

Vi merkar terminformasjon som kommentar i lexc.

Kursplan for SAM-3000

Forslag til kursplan for samisk språkteknologi på 3000-nivå (masternivå):

SAM-30.. 10 stp:Samisk språkteknologi

(Innføring i språkteknologien som Giellatekno- og Divvun-gruppene arbeider med)

Kunnskaper og forståelse:

Studentene skal:

  • kjenne til tekstkorpus som finnes for samiske språk
  • kjenne til forskjellen mellom statistiske metoder og regelbasert/dyp lingvistisk modellering av språk
  • kjenne til hvordan man modellerer morfologi ved hjelp Final State Transducers
  • kjenne til hvordan man disambiguerer ambiguitet og legger til syntaktisk analyse ved hjelp av Constraint Grammar
  • kjenne til hvordan morfologisk analyse/generering og syntaktisk analyse kan brukes i sluttbrukerprogrammer
  • kunne plassere Tromsø-modellen i en større sammenheng

Ferdigheter:

Studentene skal kunne:

  • lage morfologiske modeller som kan implementeres som automater
  • på grunnlag av et tekstkorpus kunne utlede syntaktiske regler som kan implementeres som constraint grammar
  • kunne bruke grammatiske analysatorer
  • kunne gjøre avanserte korpussøk (grunnleggende regulære uttrykk) i brukergrensesnittet Korp
  • vurdere feil i analysen

Arbeidskrav:

I løpet av kurset skal studentene levere inn 2 obligatoriske skriftlige øvinger. Øvingene må leveres inn til fastsatte tider, og må være godkjent senest to uker før eksamen.

Vurderingsform:

Eksamensform er en 6-timers skoleeksamen på samisk. Emnet evalueres med bokstavkarakterer (A-F).

SAM-3090 10 stp:Spesialemne i samisk språkvitenskap

(generelt emne som finnes allerede) - her kan studenten velge å fordype seg i noe, f.eks. FST, CG, korpuslingvistikk

HIF-3012 Språkteknologi (FST kurs)

(finnes allerede)

Kamera m. mikrofon

Trond tar opp saka på nytt.

Neste møte

Torsdag 22.1. kl. 8.30 (evt. anna tidspunkt).