Gammel Kompilere Nettordbok
Obsolete (old infra)
Ordbok-fst-er
Til dict-sma/sme.fst brukes sma.fst og sme.fst med noen modifiseringer av tagger. dict-sma/sme.fst er ikke definerte i Makefile og derfor kompilerer man en sma.fst/sme.fst som man skifter navn på når man kopierer over i /opt/
Spesielt for sma
isma-dict.fst er kompilert med følgende prosedyre:
i gt/sma
svn up -r 59359
deretter i denne fila:
common/src/tag-not-save-but-oahpa.regex
kommenter ut noen tagger slik at det blir slik:
%0 (<-) %+Hom1,
Felles for sme og sma
Til isma-dict.fst og dict-isme-norm.fst brukes isma-norm.fst og isme-norm.fst med noen modifiseringer av tagger. dict-isme-norm.fst er definert i Makefile, men man må sikre taggene manuelt. For sørsamisk kompilerer man isma-norm.fst med endring av tagger og endrer så navnet til isma-dict.fst når man kopierer til /opt/
Både dict-sma/sme.fst og dict-isma/isma.fst skal bli kompilert med tagger som identifiserer homonymer og varianter.
Her er en liste over taggene det gjelder, og filene de er i (utropstegnet viser hvilke tagger du skal kommentere ut):
tag-not-save.regex - !0 (<-) %+Use%/NVD, remove-variant-homonym-tags.regex !0 <- %+Hom1, !0 <- %+Hom2, !0 <- %+v1, !0 <- %+v2, !0 <- %+v3, !0 <- %+v4, !0 <- %+v5, 0 <- %+Use%/NVD, 0 <- %+Allegro; make-variant-homonym-tags-optional.regex 0 (<-) %+v5; # <== NB Flytt semikolon hit! !0 (<-) %+Use%/NVD, !0 (<-) %+Allegro ; tag-not-save-but-oahpa.regex !0 (<-) %+Hom1, !0 (<-) %+Hom2, !+N (<-) %+N %+NomAg, 0 (<-) %+South , !0 (<-) %+G3 , 0 (<-) %+G7 ;
Taggene nedenfor skal være med i output fra dict-sma/sme.fst for å få riktig bøyningsparadigme til homonyme lemmaer. De to øverste gjelder sma, de nederste sme:
+Hom1 +Hom2 +G3 +NomAg +v1 +v2 +v3 +v4 +v5
Disse to taggene skal være med i dict-isme-norm.fst fordi vi ikke ønsker dem i miniparadigmet:
+Allegro +Use/NVD
Alle de nevnte taggene skal være utkommentert i
gt/common/src/tag-not-save.regex
Deretter kompileres i gt:
make GTLANG=sma make GTLANG=sme
i bin endres navnet på isma-norm.fst til isma-dict.fst slik at man også har en
some-ordbok (for sosiale media)
I tillegg, og med samme taggoppsett, kompileres en egen some-sme.fst for #SoMe-ordboka.
Samme taggoppsett som ovafor, men i tillegg kommenteres de første 20 linjene i
Resultatet blir et sett med fst-er som tolererer assi for ášši. Døp om sme.fst til some-sme.fst
Oppsummering, kommandoer for å kopiere på plass
Når alt er sjekka kopierer vi over til opt:
sma:
sudo cp sma/bin/sma.fst /opt/smi/sma/bin/dict-sma.fst sudo cp sma/bin/isma-norm.fst /opt/smi/sma/bin/isma-dict.fst
sme, vanlig ordbok (kompilert med vanlig spellrelax):
sudo cp sme/bin/sme.fst /opt/smi/sme/bin/dict-sme.fst sudo cp sme/bin/dict-isme-norm.fst /opt/smi/sme/bin/dict-isme-norm.fst
sme, some-ordbok (kompilert med some-spellrelax):
sudo cp sme/bin/sme.fst /opt/smi/sme/bin/some-sme.fst