120816
Møte, FAD-ordbok, Torsdag 16.8.2012 kl. 14
Til stades: Berit Merete, Ciprian, Marja, Trond.
Saksliste
- Orientering
- Arbeid i august
Orientering
FAD-ordbok
Moment
420 0 -3.592 0.0 0.3529412 redusere<vblex> unnidit<v><tv><der3><der_passl><v><prfprc>
Viktig: passiv er bøying i norsk, og avleiing i samisk. Dermed har vi ein
Eksempel
Second run
17 0 -6.799 0.0 1.0 ansvarsforhold<n><nt> ovddasvástádus+dilli<n> 3 0 -8.533 0.0 1.0 sikkerhet+ansvar<n><nt> dorvu+ovddasvástádus<n> 2 0 -8.939 0.0 1.0 budsjett+ansvar<n><nt> bušeahtta+ovddasvástádus<n> 1 0 -9.632 0.0 1.0 kontroll+ansvar<n><nt> dárkkistit+ovddasvástádus<n>
First run:
1 0 -10.05 0.0 1.0 ansvar+bestemmelse<n><m> ovddasvástádus+mearrádus<n> 1 0 -10.05 0.0 1.0 ansvar+linje<n><f> ovddasvástádus+linjá<n> 143 63 -5.095 -6.911 1.0 ansvar+område<n><nt> snøhvit+buvttadeapmi<n> 143 63 -5.095 -6.911 1.0 ansvar+område<n><nt> ovddasvástádus+duovdda<n> 5 0 -8.448 0.0 1.0 ansvar+oppgave<n><m> ovddasvástádus+dahkamuš<n> 5 0 -8.448 0.0 1.0 ansvar+plassering<n><m> ovddasvástádus+vuogádat<n> 2160 960 -2.38 -4.188 1.0 ansvar<n><nt> stuoris+gávpot+ovddidit<v><tv><der2><der_eapmi><n> 2160 960 -2.38 -4.188 1.0 ansvar<n><nt> ovddasvástádus+sámegiella<n> 2160 960 -2.38 -4.188 1.0 ansvar<n><nt> markeret+jahki<n> 2160 960 -2.38 -4.188 1.0 ansvar<n><nt> kulturdulka<n> 2160 960 -2.38 -4.188 1.0 ansvar<n><nt> koordineret+ovttadat<n> 2160 960 -2.38 -4.188 1.0 ansvar<n><nt> kapitála+gievra<n> 2160 960 -2.38 -4.188 1.0 ansvar<n><nt> juhkan+čáhci+direktiiva<n> (...)
Eksempel second run:kommune med grep 1.0
cat second_run/fad_nobsme_candidates.20120721 |grep ' 1\.0 '|grep kommune |see
1194 0 -2.547 0.0 1.0 fylkeskommune<n><m> Grønnvoll<N><Prop><Sur> 9 0 -7.435 0.0 1.0 vertskommune<n><m> verdde+gielda<n> 7 0 -7.686 0.0 1.0 kyst+kommune<n><m> mearra+gáddi+suohkan<n> 7 0 -7.686 0.0 1.0 kommune+planlegging<n><m> gielda+plánet<v><tv><der4><der_n><n><sg><loc> 7 0 -7.686 0.0 1.0 kommune+planlegging<n><m> gielda+plánet<v><tv><der4><der_n><n><sg><gen> 3 0 -8.533 0.0 1.0 fjord+kommune<n><m> vuotna+gielda<n> 2 0 -8.939 0.0 1.0 vinter+kommune<n><m> dálvi+gielda<n> 2 0 -8.939 0.0 1.0 reindrift+kommune<n><m> boazu+doalut+suohkan<n> 2 0 -8.939 0.0 1.0 reindrift+kommune<n><m> boazodoallu+suohkan<n> 2 0 -8.939 0.0 1.0 kommune+valg+periode<n><m> gielda+válga+áigodat<n> 2 0 -8.939 0.0 1.0 kommune+senter<n><m> suohkan+guovda<n><der1><der_dimin><n> 1 0 -9.632 0.0 1.0 register+kommune<n><m> registtar+suohkan<n> 1 0 -9.632 0.0 1.0 prosjekt+kommune<n><m> prošeakta+gielda<n> 1 0 -9.632 0.0 1.0 kommunehus<n><nt> gielda+viessu<n> 0 0 0.0 0.0 1.0 kommune+forlag<n><nt> Kommuneforlaget<N><Prop><Org>
Eksempel second run:kommune utan grep
cat second_run/fad_nobsme_candidates.20120721 |grep kommune |see
3362 0 -1.512 0.0 0.8223012 kommune<n><m> gielda<n> 3362 0 -1.512 0.0 0.6942039 kommune<n><m> suohkan<n> 3362 0 -1.512 0.0 0.5483871 kommune<n><m> gieldda<n> 3362 0 -1.512 0.0 0.5 kommune<n><m> virggálaš<a><der3><der_vuohta><n> 3362 0 -1.512 0.0 0.5 kommune<n><m> govda+báddi+teknologiija<n> 3362 0 -1.512 0.0 0.5 kommune<n><m> Po<N><Prop><Mal> 3362 0 -1.512 0.0 0.4347826 kommune<n><m> gielda<n><sg><gen><rcmpnd> 3362 0 -1.512 0.0 0.4 kommune<n><m> fárret<v><iv><der4><der_n><n><sg><ill> 3362 0 -1.512 0.0 0.3333333 kommune<n><m> duottar+sápmi<n> 3362 0 -1.512 0.0 0.25 kommune<n><m> suohkanstivra<n><sg><nom><rcmpnd> (...) 3362 0 -1.512 0.0 0.000951 kommune<n><m> stáhta<n> 3362 0 -1.512 0.0 0.0009346 kommune<n><m> universitehta<n> 3362 0 -1.512 0.0 0.0007902 kommune<n><m> vuoigatvuohta<n> 3362 0 -1.512 0.0 0.0002193 kommune<n><m> ášši<n> 1194 0 -2.547 0.0 6.23e-05 fylkeskommune<n><m> Sámediggi<N><Prop><Org> 1194 0 -2.547 0.0 1.0 fylkeskommune<n><m> Grønnvoll<N><Prop><Sur> 1194 0 -2.547 0.0 0.8464567 fylkeskommune<n><m> fylkkagielda<n> (...) 0 0 0.0 0.0 0.0013324 trom+kommune<n><m> suohkan<n> 0 0 0.0 0.0 0.0008282 trom+kommune<n><m> Romsa<N><Prop><Plc>
Status quo
Som oppsummert.
Arbeid i august
- Marja og BM arbeider med ordbok, Ciprian kompilerer.
- Mål: Ny ordbok
- Mål: Ny ordbok
- Arbeide med parallellkorpus (Ciprian og Børre)
- nob abbr.txt må bli kompatibel med seg sjølv tidlegare (Trond, Ciprian)