120816

Møte, FAD-ordbok, Torsdag 16.8.2012 kl. 14

Til stades: Berit Merete, Ciprian, Marja, Trond.

Saksliste

  • Orientering
  • Arbeid i august

Orientering

FAD-ordbok Administrasjonsordbok

Moment

420 0 -3.592 0.0 0.3529412 redusere<vblex> unnidit<v><tv><der3><der_passl><v><prfprc>

Viktig: passiv er bøying i norsk, og avleiing i samisk. Dermed har vi ein asymmetri i lista.

Eksempel

Second run

17 0 -6.799 0.0 1.0 ansvarsforhold<n><nt> ovddasvástádus+dilli<n>
3 0 -8.533 0.0 1.0 sikkerhet+ansvar<n><nt> dorvu+ovddasvástádus<n>
2 0 -8.939 0.0 1.0 budsjett+ansvar<n><nt> bušeahtta+ovddasvástádus<n>
1 0 -9.632 0.0 1.0 kontroll+ansvar<n><nt> dárkkistit+ovddasvástádus<n>

First run:

1 0 -10.05 0.0 1.0 ansvar+bestemmelse<n><m> ovddasvástádus+mearrádus<n>
1 0 -10.05 0.0 1.0 ansvar+linje<n><f> ovddasvástádus+linjá<n>
143 63 -5.095 -6.911 1.0 ansvar+område<n><nt> snøhvit+buvttadeapmi<n>
143 63 -5.095 -6.911 1.0 ansvar+område<n><nt> ovddasvástádus+duovdda<n>
5 0 -8.448 0.0 1.0 ansvar+oppgave<n><m> ovddasvástádus+dahkamuš<n>
5 0 -8.448 0.0 1.0 ansvar+plassering<n><m> ovddasvástádus+vuogádat<n>
2160 960 -2.38 -4.188 1.0 ansvar<n><nt> stuoris+gávpot+ovddidit<v><tv><der2><der_eapmi><n>
2160 960 -2.38 -4.188 1.0 ansvar<n><nt> ovddasvástádus+sámegiella<n>
2160 960 -2.38 -4.188 1.0 ansvar<n><nt> markeret+jahki<n>
2160 960 -2.38 -4.188 1.0 ansvar<n><nt> kulturdulka<n>
2160 960 -2.38 -4.188 1.0 ansvar<n><nt> koordineret+ovttadat<n>
2160 960 -2.38 -4.188 1.0 ansvar<n><nt> kapitála+gievra<n>
2160 960 -2.38 -4.188 1.0 ansvar<n><nt> juhkan+čáhci+direktiiva<n>
(...)

Eksempel second run:kommune med grep 1.0

cat second_run/fad_nobsme_candidates.20120721 |grep ' 1\.0 '|grep kommune |see

1194 0 -2.547 0.0 1.0 fylkeskommune<n><m> Grønnvoll<N><Prop><Sur>
9 0 -7.435 0.0 1.0 vertskommune<n><m> verdde+gielda<n>
7 0 -7.686 0.0 1.0 kyst+kommune<n><m> mearra+gáddi+suohkan<n>
7 0 -7.686 0.0 1.0 kommune+planlegging<n><m> gielda+plánet<v><tv><der4><der_n><n><sg><loc>
7 0 -7.686 0.0 1.0 kommune+planlegging<n><m> gielda+plánet<v><tv><der4><der_n><n><sg><gen>
3 0 -8.533 0.0 1.0 fjord+kommune<n><m> vuotna+gielda<n>
2 0 -8.939 0.0 1.0 vinter+kommune<n><m> dálvi+gielda<n>
2 0 -8.939 0.0 1.0 reindrift+kommune<n><m> boazu+doalut+suohkan<n>
2 0 -8.939 0.0 1.0 reindrift+kommune<n><m> boazodoallu+suohkan<n>
2 0 -8.939 0.0 1.0 kommune+valg+periode<n><m> gielda+válga+áigodat<n>
2 0 -8.939 0.0 1.0 kommune+senter<n><m> suohkan+guovda<n><der1><der_dimin><n>
1 0 -9.632 0.0 1.0 register+kommune<n><m> registtar+suohkan<n>
1 0 -9.632 0.0 1.0 prosjekt+kommune<n><m> prošeakta+gielda<n>
1 0 -9.632 0.0 1.0 kommunehus<n><nt> gielda+viessu<n>
0 0 0.0 0.0 1.0 kommune+forlag<n><nt> Kommuneforlaget<N><Prop><Org>

Eksempel second run:kommune utan grep

cat second_run/fad_nobsme_candidates.20120721 |grep kommune |see

3362 0 -1.512 0.0 0.8223012 kommune<n><m> gielda<n>
3362 0 -1.512 0.0 0.6942039 kommune<n><m> suohkan<n>

3362 0 -1.512 0.0 0.5483871 kommune<n><m> gieldda<n>
3362 0 -1.512 0.0 0.5 kommune<n><m> virggálaš<a><der3><der_vuohta><n>
3362 0 -1.512 0.0 0.5 kommune<n><m> govda+báddi+teknologiija<n>
3362 0 -1.512 0.0 0.5 kommune<n><m> Po<N><Prop><Mal>
3362 0 -1.512 0.0 0.4347826 kommune<n><m> gielda<n><sg><gen><rcmpnd>
3362 0 -1.512 0.0 0.4 kommune<n><m> fárret<v><iv><der4><der_n><n><sg><ill>
3362 0 -1.512 0.0 0.3333333 kommune<n><m> duottar+sápmi<n>
3362 0 -1.512 0.0 0.25 kommune<n><m> suohkanstivra<n><sg><nom><rcmpnd>
(...)
3362 0 -1.512 0.0 0.000951 kommune<n><m> stáhta<n>
3362 0 -1.512 0.0 0.0009346 kommune<n><m> universitehta<n>
3362 0 -1.512 0.0 0.0007902 kommune<n><m> vuoigatvuohta<n>
3362 0 -1.512 0.0 0.0002193 kommune<n><m> ášši<n>

1194 0 -2.547 0.0 6.23e-05 fylkeskommune<n><m> Sámediggi<N><Prop><Org>
1194 0 -2.547 0.0 1.0 fylkeskommune<n><m> Grønnvoll<N><Prop><Sur>
1194 0 -2.547 0.0 0.8464567 fylkeskommune<n><m> fylkkagielda<n>
(...)
0 0 0.0 0.0 0.0013324 trom+kommune<n><m> suohkan<n>
0 0 0.0 0.0 0.0008282 trom+kommune<n><m> Romsa<N><Prop><Plc>

Status quo

Som oppsummert.

Arbeid i august

  • Marja og BM arbeider med ordbok, Ciprian kompilerer.
    • Mål: Ny ordbok
  • Arbeide med parallellkorpus (Ciprian og Børre)
    • nob abbr.txt må bli kompatibel med seg sjølv tidlegare (Trond, Ciprian)