130625

FAD-møte 25.6.

Til stades: BM, Cip, Trond

Saksliste:

  • Status quo
  • Unifisering
  • Enare

Status quo

Cip har prøvekøyrt unifisering, og delt kjeldene i tre (separat gt, separat fad, felles), men ikkje unifisert fellesdelen, den er framleis i to ulike filer).

BM har sett på filene.

Unifisering

src-attributter:

  • nj= Nils Jernsletten
  • fad= fad-prosjektet
  • gt= giellatekno

3 kataloger:

dette er data som kun finnes i fad, og skal unifiseres separat:

  • main/words/dicts/nobsme/terms/admin/src_fad-only
    • disse to inneholder felles lemma og skal slås sammen og unifiseres, først automatisk og siden manuelt:
  • main/words/dicts/nobsme/terms/admin/src_fad-gt_commons
    • --> denne er ikke unifisert separat
  • main/words/dicts/nobsme/src_gt-fad_commons
    • --> denne er unifisert separat

gt ∩ fad = dei som har same nob.

  • freq_a = frekvens i hele korpuset (nob=nowac, sme=hele gt-korpuset)
  • freq_f = frekvens i fad-korpuset, både sme og nob

Ordboksartikkelen skal sorteres etter freq_a, dette gjelder både nobsme og smenob

Stor sannsynlighet for term : høy freq_f, src=fad og kanskje bare kun src=fad?

Enare

Vi må før sommarferien formulere hypoteser til Enare

Neste møte

Vi tar ei oppsummering før ferien.