190502
Kokkous 2.5.2019 klo 9.00
Läsnäolevat: Mervi, Trond, Thomas ja Aili
Asialista
- Online-speller
- Sanakirja
- Norjan tavallisimmat sanat
- Facebook-sanat
- Norjan tavallisimmat sanat
- Analysaattori
- Korpus
- Aloitus
- Aloitus
- Projektin- ja työtehtävien hallinta
- Trello: https://trello.com/b/dEsXsuNk/kieliteknologia-2019
- Työtehtävien pilkkominen pienempiin osiin
- Trello: https://trello.com/b/dEsXsuNk/kieliteknologia-2019
- Seuraava kokkous
Grammatiikkikysymykset:
- Oonko Pl+Gen -haamut ko "neljein" ja "miljoonain" olemassa? Eira oon vastanu ette net oon teorettisesti olemassa, mutta ette ei tiä.
- Jos net oon teoreettisesti olemassa, oon net hyvä olla kans analysaattorissa... Joskus se saattaa tulla semmoinen tilane ette tarvittee pittäät net muođot vaikka net tavalisessa puhheessa olis harvinaiset
- Jos net oon teoreettisesti olemassa, oon net hyvä olla kans analysaattorissa... Joskus se saattaa tulla semmoinen tilane ette tarvittee pittäät net muođot vaikka net tavalisessa puhheessa olis harvinaiset
- Käytämäkö konsonanttirankkaa, esim. "kuutten", "viitten", "ensimäisten" jne. Grammatiikissa mainithaan ette -nen loppuiset nominit saavat ylheensä konsonanttirangan. Eira sanoi ette net oon vähän harvemin ko esim. -VVn ja -iitten.
- Kuusi-viisi ja ensimäinen kuuluthaan kahteen eri nomenityypphiin. Mie hääyn freistaat löyttäät meän käänösmateriaalista kunka olema pitänheet nämät sanat (freistaan löyttäät esimerkit Terjen ja Pirjon käänöksistä).
- Kuusi-viisi ja ensimäinen kuuluthaan kahteen eri nomenityypphiin. Mie hääyn freistaat löyttäät meän käänösmateriaalista kunka olema pitänheet nämät sanat (freistaan löyttäät esimerkit Terjen ja Pirjon käänöksistä).
- Taphaus "ensimäinen" oon joukon selvä ko se sanaryhmä oon mainittu grammatiikissa. Muissa ryhmissä se ei ole niin selvä. Grammatiikissa sanothaan ette nomini ei aina piä konsonanttirankkaa (vaikka sillä oon konsonanttirankka olemassa). Se oon sivula 181 norjankielisessä grammatiikissa:
- "Det finnes mange tostamma nomen som aldri danner flertall genitiv ved hjelp av konsonantstammen, for eksempel (sg. nom. : sg. gen. : sg. part. : pl. gen.) vuosi > vuossiin-vuositten ...
- Missä määrin sallima puhekieliset haamut ko "yks" ja "kaks"? "Kaks" oon jo sielä; poistamako sen?
- Sallima
- Sallima
- "Puolikymmentä" ei ole sanakirjassa, mutta oli numerals-tiedostossa. Käytetäkö kvääniksi?
- Mie olen kuulu numeraali-ilmauksen puolenkymmentä... tsekkaan vielä.
- Oonko "miljoona" tahi "miljuuna"? "Miljardi" tahi "miljartti"?
- Miljoona ja miljuuna variasjuuni oon hyvä olla olemassa. Kans molemat sanat miljardi ja miljartti oon teksteissä...
Muut kysymykset
- Miksi on olemassa yksi jono, missä *tämä* saa *+Pers*-tagin? Outoa on, että persoona-pronominit ei toimi jos se poistetaan tahi kommentoidhaan pois.
tämä+Pron+Dem:tä tama_pron ; tämä+Pron+Pers+Sg1:tä 12pronsg ; mie+Pron+Pers+Sg1:m 12pronsg ; !!= * @CODE@ tämä oon (Dem) ja mie oon (Pers) täie täie tämä+Pron+Pers+Sg1+Nom tämä+Pron+Pers+Sg1:tä 12pronsg ; (mie lakka toimimasta jos kommentoima tämän rivin pois) YAML test 73: analyser-gt-norm-dial_Por.hfstol + gt-norm-yamls/P-12pronsg_mie_gt-norm-dial_Por.yaml - 212/0/212 PASS YAML test 73: analyser-gt-norm-dial_Por.xfst + gt-norm-yamls/P-12pronsg_mie_gt-norm-dial_Por.yaml - 212/0/212 PASS YAML test 74: analyser-gt-norm-dial LEXICON 12pronsg !!= @CODE@ on 1., 2. p. yksikkö +Nom:ie K ; +Gen:inun K ;
- Vastaus: annama.
Online-speller
Miten toimii?
Fkv Online speller: http://divvun.org/proofing/online-speller.html
Versio on valitettavasti edelleen fkv version 0.1, 05.12.2017, rev160819 .
Trond hoitaa sen.
Sanakirja
Norjan tavallisimmat sanat
{ cd main/words/dicts make -f make-bildict SLANG=nob TLANG=fkv TNUM=all alias nobfkv alias nobfkv='$LOOKUP $GTHOME/words/dicts/nobfkv/bin/nobfkv-all.fst' cat ../lists/nob/nowac-1.1.lemmas.freq|cut -f1|cut -d" " -f2|tr '[A-ZÆØÅ]' '[a-zæøå]'|nobfkv|grep "?"|cut -f1|grep '[a-z]'|head -200|tr '\n' ','|see
cat ../lists/nob/nowac-1.1.lemmas.freq
less |
main/words/lists/
seg, sin, denne, din., burde, både, of, innlegg, les, kommentar, én, a, in, mens, s, gjelde, the, hans, innlegg, skrevet, nær, gange, frem, jobb, deres, selskap, informasjon, dermed, prosjekt, sv, krav, offentlig, imidlertid, kr, uansett, as, forum, d, bidra, samfunn, internasjonal, re, vond, poeng, re, vurdere, oppleve, postet, hennes, it, denne, a, flott, send, d, handle, benytte, forelder, tilfelle, jan, foto, nr., anbefale, bruker, gjennomføre, stadig, osv., debatt, hilsen, hete, amerikansk, ansatt, generell, privat, publisere, aktivitet, total, blogg, eventuell, video, helst, x, eu, an, medium, er, per, bedrift, utvikling, produkt, eg, behandling, personlig, ene, europa, that, følgende, dessuten, upassende, skjønne, vg, tittel, sammenheng, start, basere, bestå, får, kraftig, pm, m., praksis, fokus, unna, registrert, aksje, fantastisk, effekt, enten, p., sjanse, frp.,
sin (pron.) (pron. refleksiv) iežas Lasse leker med vennen sin.Lásse stoahká iežas ustibiin.
- Kuka lissää nämä norjankieliset sanat sanakirjhaan nyt ko Mari oon saanu työn muvalta? Mervi, Aili?
Facebook-sanat (Kveenin sanat-ryhmästä)
Uusi työtapa: Pitää lista kysytyistä sanoista, esim.
main/words/dicts/nobfkv/inc/facebook.txt (tai macin Muistiinpanot)
Pittääkö kielitinka kans kattoot niitä?
Nobfkv - Tarvittavat sanat
Instituutin käännösten sanat eivät ole lisätty sanakirjaan eivätkä analysaattoriin.
Ratkaisu:
- Ottaa esille kaikki käännösten alkuperäiset norjankieliset dokumentit, ja ajaa ne sanakirjan läpi. Lisätä sanakirjaan.
- Ottaa esille kaikki käännökset, ajaa analysaattorin läpi, lisätä.
antiword *.doc | cat mandat | preprocess| unob|cut -f2|cut -d"+" -f1|uniq|sort|uniq -c|sort -nr|cut -c6-|nobfkv|grep "?" cat ~/Downloads/mandat.txt| preprocess| unob| cut -f2| cut -d"+" -f1| uniq| sort| uniq -c| sort -nr| cut -c6-| nobfkv| grep "?"| cut -f1| grep '[a-z]'| tr '\n' ','| sed 's/,/, /g;'| see
kommisjon, sin, fornorskingspolitikk, fornorsking, én, ene, konsekvens, myndig, majoritetsbefolkning, virkning, gruppere, frem, denne, vurdere, utføre, samfunn, formål, etablere, enkeltperson, både, videre, sameting, offentlig, nasjonal, kartlegge, innad, hoved, granskning, forsone, formidle, ettervirkninger, deres, Sametinget, virkemiddel, utsette, utsatt, utgang, tradisjonell, tilsvarende, tilsvare, tilsvar, tillegge, tilgang, skriftlig, sammenheng, samfunnsliv, samarbeidspartner, samarbeide, s, rettslig, ratifisere, perspektiv, personlig, overlevere, nordisk, miljøer, midlere, middel, mandat, lignende, ligne, la, inkludere, informere, informant, ideologisk, hovedmålsetting, hovedmål, hensyn, hensiktsmessig, hele, granske, får, enkeltindivider, eksisterende, egnet, dokumentere, diskriminering, diskriminere, bøte, burde,
Analysaattori
Verbit
frahtata+V+Inf frahđata liuota+V+Inf liuvota livota+V+Inf lijota noveta+V+Inf nojeta puhjeta+V+Inf puhjeta+V+Inf +? silmästä+V+Inf silmäistä vaitela+V+Inf vaiđela
- Onko lemma todellakin oikein?
- Onko olemassa muita ht: hđ tapauksia?
Korpus
- Mervi saa jonkun etsimään tiedostoja KI: ssa
- Trond päivittää ohjeet Trellossa
- Kaikki ennen 2014 on korpuksessa (?), sen jälkeen tehdyt tekstit eivät ole
Testaa:convert2xml --version
Aloitus
Projektin- ja työtehtävien hallinta
Trello:[https://trello.com/b/dEsXsuNk/kieliteknologia-2019]
Työtehtävien pilkkominen pienempiin osiin
Seuraava kokkous
16.5. klo 9