Analysaattorin Tehtavalista
Contents:
Tässä on lista analysaattorin työtehtävistä ja niiden sisäisistä
Testaustiedostot
-
Tarkistaa substantiivien yaml-tiedostot
- Kirjoitta yaml-tiedostoja verbeihin
Lemmat
Korjata substantiivien lemmalistat
Nyt suurin osaa yamltiedostoista menee läpi. Se tarkoittaa,
- tee make check
- ota leksikko, joka toimii, esim. EEMEED
- ota kaikki EEMEED-tapaukset stems-tiedostosta
-
grep EEMEED src/fst/stems/nouns.lexc|see
-
grep EEMEED src/fst/stems/nouns.lexc|see
- tarkista, että niiden vartalo on samanlainen kuin esimerkkisanojen vartalot
- jos ei, katso toimiiko
- katso stems/nouns.lexc
- jokainen yamlissa toimiva sana voi toimia mallina muille
nounstems-sanojen klassifiointi
Tänään on 1983 nounstems. Jokaiselle pitää antaa oikea contlex.
Muotojen tarkistaminen
Seuraavat kaksi esimerkkikomento antaa kaikki lokatiivit, jotka eivät toimi,
cat src/fst/stems/nouns.lexc | grep ";"| cut -d ';' -f1 | grep -v PUUVSAH|cut -d":" -f1|sed 's/$/+N+Sg+Loc/'|dsmnDict|grep '?' cat src/fst/stems/nouns.lexc | grep ";"| cut -d ';' -f1 | grep "POTTAAK"|cut -d":" -f1|sed 's/$/+N+Pl+Abe/'|dsmnDict
Korjata puuttuvat nominatiivit
Komento make check antaa listan substantiiveista, joille emme
Suljetut luokat, joilla morfologia
- Lisätä puuttuvat pronominit + sijapäätteet
Suljetut luokat, joilla ei ole morfologiaa
- Lisätä puuttuvat sanat sanakirjasta analysaattoriin.
- adverbit, subjunktiot, postpositiot, jne.
Lyhyet sanat missing-listasta
Tiedostosta smn/misc/missing_shortwords.freq
Taivutusmorfologia
Omistusliitteet
Nämä voidaan nyt lisätä. Ks.
Verbit
Parittomat ensin, sitten parilliset.
Adjektiivit
Odottavat substantiiveja.
Johdosmorfologian tekeminen
- Ymmärtää
- Laatia