Meeting_2011-08-23
Contents:
- Møte om sme-dict 23.8.2011
- Saker
- Bakgrunn
- Hvordan gjør vi det med hermetegnord?
- Grammatisk informasjon om rørsleadverbial
- Hvordan legge til ord som bare er ord nr 2 i faste uttrykk (f.eks. binná banná) - lage et felt for link til ord nr 1?
- jfr-felt, med link for synonymer?
- te vs. re
- inc-listtut
- kompileren (smenob)
- Neahtta vs VD
- nob-x
- Hva er målet med ordboksarbeidet?
- Enkeltord
Møte om sme-dict 23.8.2011
Til stades: Ciprian, Berit, Biret, Lene, Trond.
Saker
- Hvordan gjøre vi det med hermetegnord?
- Hvordan legge til ord som bare er ord nr 2 i faste uttrykk (f.eks. binná banná) - lage et felt for link til ord nr 1?
- "jfr"-felt, med link for synonymer? moteksempler osv.
- <te> vs. <re>
- ny kompileren - når?
- neahtta vs VD -
- inc-listtut
- enkeltord
Bakgrunn
Alle ord frå visse bøker inn i ordbøkene.
Hvordan gjør vi det med hermetegnord?
Sára beaivvegirji = For å la språket vise til 11 år gamal jente bruker forfattaren ordet "ambulansemann".
- Skal dei med?
- Viss ja, korleis?
<re>om kvinner</re> <style>litterær</style>
Kjeldetilvisng som attributt for x og xt:
<x src="S.B. Johansen 2010: Sárá beaivegirji s. 21">... dakkár ilgadis olmmošlágan filbmasivdnádus, mii lea eambbo robohtalágan go olbmolágan.</x>
Dette må inn i DTD-en!
Grammatisk informasjon om rørsleadverbial
bajimussii
<tg> <re>bevegelse til</re> <t pos="adv">øverst</t>
+ <t pos="adv">til øverst</t> <==== ny <xg> <x>Dál leige mu vuorru fas goargŋut bajimussii.</x> <xt>Nå var det igjen min tur å klatre helt øverst.</xt> <e src="nj" usage="vd"> <lg> <l attr="no" context="none" pos="a">skoavddas</l> <lc>skoavdasat</lc> </lg> <mg> <tg> <re>om masse</re> <===== lagt til <t pos="a">hul</t> <te>f.eks. snø eller is</te> <===== fjerna <xg> <x>skoavdeláibi</x> <xt>hult brød</xt> </xg> <xg> <x>Jiekŋa lea skoavddas.</x> <xt>Isen har hulrom.</xt> </xg> </tg> </mg> </e>
Hvordan legge til ord som bare er ord nr 2 i faste uttrykk (f.eks. binná banná) - lage et felt for link til ord nr 1?
háluid - link til hiluid med eksempel med hiluid háluid -
mwe_smenob.xml: <e usage="vd"> <lg> <l attr="no" context="none" pos="adv">hiluid háluid</l> </lg>
jfr-felt, med link for synonymer?
Initialt i <mg>: <syn lemmaID="buohccebiila" /> → vise til eit synonym <ant lemmaID=""> ↛ vise til eit antonym <hyponym> ↓ vise til eit meir spesifikt ord <hypernym> ↑ vise til eit meir overordna ord <obs> vær obs på dette (bajimussii -> bajimusas) !
<e usage="vd"> <lg> <l pos="n">balloŋŋa</l> <lsub extrapage="yes" pos="n">balluvdna</lsub> <!-- extrapage="yes" er default --> </lg> <mg> <tg> <t pos="n">ballong</t> </tg> </mg> </e> <lg> <l pos="n">kantuvra</l> <lsub extrapage="no" pos="n">kántuvra</lsub> </lg>
te vs. re
ieža = sjøl (om flere)
inc-listtut
Til saman 604 nye ord.
inc-today.csv: njenecagiella ___ n ___ nenetsisk språk ___ a2 itáliagiella ___ n ___ italiensk språk ___ a2 news.1056.missing_nouns.csv: áviisa ___ n ___ avis bálkkašupmi ___ n ___ pris| belønning| premie ___ Munnje lea stuora gudni oažžut dán bálkkašumi. ___ For meg er det en stor ære å få denne prisen. ávvudeapmi ___ n ___ feiring| fest ___ Saami álbmotbeaivvi almmolaš ávvudeapmi lea kulturviesus. ___ Den offisielle markeringen av samefolkets dag er på kulturhuset. proseassa ___ n ___ prosess indiána ___ n ___ indianer
Format som i xxx_smafin.txt
amma ___ pcle ___ toki $ pas | päs
TODO:
- Trond rydder listene og evt. sletter det som ikke er oversatt.
- Ciprian lager om til xml-format i en egen fil.
- BM redigerer i xmlMind.
- Deretter legger Ciprian dem inn i de eksisterende filene.
kompileren (smenob)
Etter at man har lagt til/sjekka ca 604 oversatte ord fra inc-lister pluss incliste fra "Čábbámus iđitguovssu"
Når? 15. september skal det være klart for kompilering:
- inc er inne
- ingen dubletter
- Lene: rydde opp i prop-listene
- at alle lemmaene er i (i)sme-norm.fst
- bruke (i)sme.fst for sub-lemmaer
- at Actor er i actor-fila, G3 er i g3-fila osv.
Neahtta vs VD
Cip oppdaterer nettordboka annakvar veke.
nob-x
- sjekke mot nob-frekvensordliste eller ordbok
- se kritisk på artiklene
- bli enige om et link-system - f.eks. få "áhkku" og "áddjá" inn under "besteforelder" uten å skrive nye artikler (?)
Mål for snuing: 1. oktober.
Hva er målet med ordboksarbeidet?
- ordbøkene er nyttige for folk flest
- vise kombinasjonen leksikografi/morfologi
- vi kan samarbeide med de leksikografiske miljøene
- vi trenger transferleksikon for MT
Enkeltord