Meeting_2011-08-23

Møte om sme-dict 23.8.2011

Til stades: Ciprian, Berit, Biret, Lene, Trond.

Saker

  • Hvordan gjøre vi det med hermetegnord?
  • Hvordan legge til ord som bare er ord nr 2 i faste uttrykk (f.eks. binná banná) - lage et felt for link til ord nr 1?
  • "jfr"-felt, med link for synonymer? moteksempler osv.
  • <te> vs. <re>
  • ny kompileren - når?
  • neahtta vs VD -
  • inc-listtut
  • enkeltord

Bakgrunn

Alle ord frå visse bøker inn i ordbøkene.

Hvordan gjør vi det med hermetegnord?

Sára beaivvegirji = For å la språket vise til 11 år gamal jente bruker forfattaren ordet "ambulansemann".

  1. Skal dei med?
  2. Viss ja, korleis?
<re>om kvinner</re>
<style>litterær</style>

Kjeldetilvisng som attributt for x og xt:

<x src="S.B. Johansen 2010: Sárá beaivegirji s. 21">... dakkár ilgadis olmmošlágan filbmasivdnádus, mii lea eambbo robohtalágan go olbmolágan.</x>

Dette må inn i DTD-en!

Grammatisk informasjon om rørsleadverbial

bajimussii

         <tg>
			<re>bevegelse til</re>
            <t pos="adv">øverst</t> 
+            <t pos="adv">til øverst</t>   <==== ny
            <xg>
               <x>Dál leige mu vuorru fas goargŋut bajimussii.</x>
               <xt>Nå var det igjen min tur å klatre helt øverst.</xt>


  <e src="nj" usage="vd">
      <lg>
         <l attr="no" context="none" pos="a">skoavddas</l>
         <lc>skoavdasat</lc>
      </lg>
      <mg>
         <tg>
            <re>om masse</re>   <===== lagt til
            <t pos="a">hul</t>
            <te>f.eks. snø eller is</te>   <===== fjerna
            <xg>
               <x>skoavdeláibi</x>
               <xt>hult brød</xt>
            </xg>
            <xg>
               <x>Jiekŋa lea skoavddas.</x>
               <xt>Isen har hulrom.</xt>
            </xg>
         </tg>
      </mg>
   </e>

Hvordan legge til ord som bare er ord nr 2 i faste uttrykk (f.eks. binná banná) - lage et felt for link til ord nr 1?

háluid - link til hiluid med eksempel med hiluid háluid - binná bánná

mwe_smenob.xml:

  <e usage="vd">
      <lg>
         <l attr="no" context="none" pos="adv">hiluid háluid</l>
      </lg>

jfr-felt, med link for synonymer?

Initialt i <mg>:
<syn lemmaID="buohccebiila" /> → vise til eit synonym
<ant lemmaID=""> ↛ vise til eit antonym
<hyponym> ↓ vise til eit meir spesifikt ord
<hypernym> ↑ vise til eit meir overordna ord
<obs> vær obs på dette (bajimussii -> bajimusas) !
   <e usage="vd">
      <lg>
         <l pos="n">balloŋŋa</l>
         <lsub extrapage="yes" pos="n">balluvdna</lsub> 
         <!-- extrapage="yes" er default -->
      </lg>
      <mg>
         <tg>
            <t pos="n">ballong</t>
         </tg>
      </mg>
   </e>

      <lg>
         <l pos="n">kantuvra</l>
         <lsub extrapage="no" pos="n">kántuvra</lsub>
      </lg>

te vs. re

ieža = sjøl (om flere)

inc-listtut

Til saman 604 nye ord.

inc-today.csv:

njenecagiella ___ n ___ nenetsisk språk ___ a2
itáliagiella ___ n ___ italiensk språk ___ a2

news.1056.missing_nouns.csv:

áviisa ___ n ___ avis
bálkkašupmi ___ n ___ pris| belønning| premie ___ Munnje lea stuora gudni oažžut dán bálkkašumi. ___ For meg er det en stor ære å få denne prisen.
ávvudeapmi ___ n ___ feiring| fest ___ Saami álbmotbeaivvi almmolaš ávvudeapmi lea kulturviesus. ___ Den offisielle markeringen av samefolkets dag er på kulturhuset.
proseassa ___ n ___ prosess
indiána ___ n ___ indianer

Format som i xxx_smafin.txt

amma ___ pcle ___ toki $ pas | päs

TODO:

  1. Trond rydder listene og evt. sletter det som ikke er oversatt.
  2. Ciprian lager om til xml-format i en egen fil.
  3. BM redigerer i xmlMind.
  4. Deretter legger Ciprian dem inn i de eksisterende filene.

kompileren (smenob)

Etter at man har lagt til/sjekka ca 604 oversatte ord fra inc-lister pluss incliste fra "Čábbámus iđitguovssu"

Når? 15. september skal det være klart for kompilering:

  • inc er inne
  • ingen dubletter
  • Lene: rydde opp i prop-listene
  • at alle lemmaene er i (i)sme-norm.fst
  • bruke (i)sme.fst for sub-lemmaer
  • at Actor er i actor-fila, G3 er i g3-fila osv.

Neahtta vs VD

Cip oppdaterer nettordboka annakvar veke.

nob-x

  • sjekke mot nob-frekvensordliste eller ordbok
  • se kritisk på artiklene
  • bli enige om et link-system - f.eks. få "áhkku" og "áddjá" inn under "besteforelder" uten å skrive nye artikler (?)

Mål for snuing: 1. oktober.

Hva er målet med ordboksarbeidet?

  • ordbøkene er nyttige for folk flest
  • vise kombinasjonen leksikografi/morfologi
  • vi kan samarbeide med de leksikografiske miljøene
  • vi trenger transferleksikon for MT

Enkeltord

Vi gikk gjennom lista fra Sárá beaivegirji, se words/dicts/smenob/inc/inc_sara_beaivegirji_sorted.txt