151110

Võru Oahpa koosolek 10. nov. 2015

Osalejad: Heli, Jack, Sulev

Võru-eesti masintõlge ja sammud selle suunas

Jacki poole pöördus üliõpilane Mari-Ann Loosaar, kes tahab teha uurimistööd võru keele keeletehnoloogiast, näiteks masintõlkest. Meie arvame, et esimene samm võiks olla morfoloogiline ühestamine. Parim juhendaja oleks Tiina Puolakainen.

Võro FST

Sulev märgib tabelites http: //www.ling.helsinki.fi/~rueter/AKU/vro/word_form_nouns_generator-gt-norm_table_2015-09-15.html ja http: //www.ling.helsinki.fi/~rueter/AKU/vro/word_form_verbs_generator-gt-norm_table_2015-09-15.html valed vormid $-ga ja õiged €-ga.

N_10ESÄK/N_10HÕRAK => N_10AABITS, N_10HEERITS, N_10HERESKʼ
?? sinepʼ -bi -pit, petsätʼ -di -tit, minekʼ -gi -kit, ajakʼ -gi -kit, hahkatsʼ -dsi -tsit, horlʼopʼ -bi -pit, roguskʼ -i -it, aadrõs' aadrõs(s)i aadrõssit

Vaja teha: Nimisõnade ja omadussõnade üksteisest lahutamine (Tromsös alustatud). (Sulev)

Võro Oahpa

Kasutajaliides

Lokaliseerimine ok, välja arvatud soome keel. Heli vaatab, miks kasutajaliides on ainult osaliselt soomekeelne.

Heli paneb kasutajaliidese keele vahetamise menüü ka mängude (Leksa, Morfa-S jt.) sisse.

Numra

Kell veel päriselt ei tööta.

Jack tegeleb kella-automaadiga. Väike näpuviga sees: peab olema kolmas (a-ga!), aga on kolmõs (õ-ga) Küll aga on kolmõskümnes, kolmõssaas jne - see ongi õige, õ-ga

Mitte-täistunnid töötavad:

05:45
05:45    viietõistkümne minodi peräst kuuś
05:45    kolmveeränd kuuś
05:45    nelikümmend viiś minotit viiś läbi

Täistunnid:
03:00
03:00    
03:00    kolm 

12:00
12:00    katśtõist 
12:00    

09:00
09:00    
09:00    ütesä 

13:00
13:00    ütś 
13:00    

Numra - ordinals - vahemikud 1 - n, mitte 0 - n (n = 10, 100, 1000) cardinals - arv null' ka sees.

Heli parandab selle ära.

Leksa

Üldiselt töötab hästi, on üksikuid vigu.

Sünonüüme lisada mõnes kohas (Sulev saadab Helile, kui leiab midagi). Helifailid (põhimõtteliselt olemas, aga vaja nimetada lemmade järgi. Saab tegelema hakata, kui eesti-võru sõnaraamatule saavad ära lisatud, tõenäoliselt jaan-veebr).

Morfa-S

  • Uus valik menüüsse: Adjectives. Alustame Cmp+Sg+Nom ja Sup+Sg+Nom-ga. (lühikest ülivõrret pole võru keeles olemas)
    • Heli paneb need omadussõnad Morfa-S-i, mis on oahpa_lexicon.xml-is olemas.
  • Võrdlusastmed
    • Sulev saadab Jackile näiteid võrdlusastmete käänamise kohta.
        nuur : noorõmb : kõgõ noorõmb
        vana : vanõmb : kõgõ vanõmb
        väiku : väikumb : kõgõ väikumb
        (võrokõnõ : võrokõsõmb - naljaga pooleks, nii saab olla iga sõna, ka kass' : kassimb jne)
        verrev : verevämb : kõgõ verevämb
        punanõ : punatsõmb : kõgõ punatsõmb
        suur : suurõmb : kõgõ suurõmb
        (suur : suurõp : kõgõ suurõp)
        ((suurõp : suurõba : ... ))
        

+A+Comp+Sg+Nom =>> yaml-faili panna kõigile adjektiivitestidele üks rida juurde! (Sulev) A-alomanw19_gt-norm.yaml jne.

Morfa-C

Nouns

Vaja teha:

  • Sulev täiendab semantiliste klasside FOOD ja DRINK loendeid uute söödavate ja joodavate asjadega.
  • Heli laiendab ostetavate asjade hulka uute semantiliste kategooriatega, nt kirjatarbed. --- tehtud
  • Heli lisab juurde sõnu semantilisse klassi PLACE_LOCAL või asendab selle küsimus-vastus mallis teise sem. kategooriaga. --- asendatud teistega (BUILDING, ROOM), illatiivi ja inessiivi harjutuses.
  • Sulev liigitab kohana kasutatavaid nimisõnu - PLACE_ON ja PLACE_IN (Oahpa leksikonist vaadata! Ja juurde lisada igapäevaseid, nt kino, teater, kool, koosolek, konverents, kontsert, näitus, eksam, ekskursioon, tapalava, elektritool, Võrolõ, Obinitsa, Oravalõ, Tartohe, Talliina v Tal'nahe, Misso, Mikidämäele jne

Edaspidi realiseerime ka Leksa-place (kohanimede menüü Leksas). Siis võiks Oahpa sõnastikus olla tähtsamad kohanimed - väike valik Võru- ja Setomaa ja Eesti suuremaid kohanimesid, mõned ka lähi- jm välismaalt. Või siis puhastada, ümber töödelda ee-võro kohanimede fail (u 2000 kohanime).

Verbs

Vaja teha:

  • Sulev valib ACTION_V verbide loendist välja Morfa-C harjutusse sobivad ja lisab ka uusi.
  • Heli lisab programmidesse Morfa-S ja Morfa-C kontrolli, mis keelab ära korduvad harjutused sama hulga sees. ---- tehtud

Järgmine koosolek

T, 24. novembril kell 10.