130917
Contents:
FAD-möte 17.9.
Til stades: BM, Cip, Trond
Saker
- Evaluering
- Foredrag
Evaluering
BM-Trond
Vi har eit resultat for fordelinga av o, med grense linje 1700 i
Neste steg: Repeter for merged-gt-fad og gt-only.
TILTAK
- Trond genererer 50-filer
- Trond og BM går gjennom og fordeler t, d, o
- Oppsummering etterpå
Ciprian - Bergensevaluering
sjekke overlapp av våre nob med nob i NHH-KBN-NOT-termsamlinga.
Foredrag
Formalia
- Ytre ramme: 15 min + 15 min
- Talarar: Cip, BM
- Språk: eng, sme
- Slides: mest bilder/illustrasjon, max 15 stk
Why - motivasjon - FAD - 1 slide
How - Hvordan med tall: Korpus - xml - parallellfiler - sentence alignment - filtrere støy - analysere m/ Oslo-Bergen og GT - word alignment - automatisk (terskel) & manuell - antall entry (ny data A, V, N) - sammenliknet med GT-data
Overgang til what: En side med GT-data og nye fad-data (Ciprian har illustrajonen)
What - Evaluering: Hvor mye data har vi fått fra fad, evaluering, sammenlikning. Konklusjon : sammenfatning, peke på arbeid videre
Ciprian: Evaluering mot database -
Ciprians del: 7 slide
Berits del: 8 slide - 5 slides med problematikk, 2 slides for brukbarhet, 1 slide konklusjon
Berit: Frekvenser - hvordan er de laget: sme: FAD/GT, nob: FAD/Nowac
Problematisk å vurdere data. Vi har gjort vår del, men vi er ikke normative
Hva er vitsen : vi lager ordlister og økt antall lemma i ordboka, parallellkorpus, glossary, støtte for oversettere.
Konklusjon: 1 slide
Hente tall fra rapporten, tidligere presentasjon
TILTAK
Cip lagar ei ramme, eit .tex-dokument