130625
Contents:
FAD-møte 25.6.
Til stades: BM, Cip, Trond
Saksliste:
- Status quo
- Unifisering
- Enare
Status quo
Cip har prøvekøyrt unifisering, og delt kjeldene i tre (separat gt,
BM har sett på filene.
Unifisering
src-attributter:
- nj= Nils Jernsletten
- fad= fad-prosjektet
- gt= giellatekno
3 kataloger:
dette er data som kun finnes i fad, og skal unifiseres separat:
-
main/words/dicts/nobsme/terms/admin/src_fad-only
- disse to inneholder felles lemma og skal slås sammen og unifiseres, først automatisk og siden manuelt:
- disse to inneholder felles lemma og skal slås sammen og unifiseres, først automatisk og siden manuelt:
-
main/words/dicts/nobsme/terms/admin/src_fad-gt_commons
- --> denne er ikke unifisert separat
- --> denne er ikke unifisert separat
-
main/words/dicts/nobsme/src_gt-fad_commons
- --> denne er unifisert separat
gt ∩ fad = dei som har same nob.
- freq_a = frekvens i hele korpuset (nob=nowac, sme=hele gt-korpuset)
- freq_f = frekvens i fad-korpuset, både sme og nob
Ordboksartikkelen skal sorteres etter freq_a, dette gjelder både nobsme og smenob
Stor sannsynlighet for term : høy freq_f, src=fad og kanskje bare kun src=fad?
Enare
Vi må før sommarferien formulere hypoteser til Enare
Neste møte
Vi tar ei oppsummering før ferien.