130521

FAD-møte 21.5.13

Til stades: BM, Cip, Trond.

Saksliste

  • Status quo og framover
  • Neste møte

Status quo og framover

terms/admin

  • sme-lemmasjekk og -lekskalisering ok. 7524 sme-lemma er overført til noun-sme-lex.txt
  • nob: 34 framleis ikkje gjort.

nobsme/src

  • unifisering ok
  • lemma-sjekk gjenstår
    • 116 sme-lemma får ingen analyse
    • 719 sme-lemma er ikke leksikalisert
Tests before the unification step in the fad-data:

src>grep -h '<l pos' *.xml | sort | uniq -c | sort -nr | wc -l 
   15371
src>grep -h '<l pos' *.xml | sort | uniq -c | sort -nr | grep "^ *1 " | wc -l 
   11099
src>grep -h '<l pos' *.xml | sort | uniq -c | sort -nr | grep -v "^ *1 " | wc -l 
    4272

  15          <l pos="V">svekke</l>
  13          <l pos="V">redusere</l>
  12          <l pos="N">endring</l>
  11          <l pos="V">snakke</l>
  11          <l pos="V">registrere</l>
  11          <l pos="N">mangfold</l>
  10          <l pos="N">utgangspunkt</l>
  10          <l pos="N">utdanning</l>
  10          <l pos="N">part</l>
  10          <l pos="N">oversikt</l>
  10          <l pos="N">kulturuttrykk</l>
  10          <l pos="N">forvaltningsoppgave</l>
  10          <l pos="N">eiendomsrett</l>

<l>
@pos
@alternative_string
@type
@exp_type
@right_side
</l>

<t>
@pos
@alternative_string
@type
@vmax
@nr
@case
@exp_type
@right_side
</t>

Sjekke om alle disse attributtene er nødvendige (Berit)

TODO

  • BM, Trond: sme, nob.
  • Ciprian: unification
  • nobsme/src och samma igen

Deadlines

  • sme, nob i løpet av veka
  • Cips unifisering til neste veke
  • BM, Marja, Trond neste steg: nobsme/src: lemmasjekk

Neste møte

Onsdag 29. mai kl. 14.15.