V Dcheck
SJEKKLISTE for VD-ordboka (gammel infra):
Spesielt for VD
- sjekk at alle lemmaer (adjektiver, verb, substantiver, numeraler, pronIndef og propernouns) som genererer med enn en grunnform, merkes med v1 osv i fst og vmax i dict-filene. Eksempel på kommando for å sjekke dette. Pass på at isme-norm.fst er kompilert med at v1-taggene går til 0 i tag-not-save.regex før kommandoene:
grep '<l ' adjective_smenob.xml | grep -v vmax | tr "<" ">" | cut -d ">" -f3 | sed 's/$/+A+Sg+Nom/' | dsmeNorm | grep -v "?" | sed 's/^$/€/' | tr "\n" " " | tr "€" "\n" | grep 'A+.*A+' | l
- sjekk at substantiver er i riktig fil (G3, Actor osv.)
- sjekk gt/common/src/tag-not-save (oppdater til nyinfra)
- genere lemmaer fra hver ordklasse med codes.txt-filene for å teste kodene
- evt. legge til illpl="no" og pg="no" i leksikonfilene
- evt. legge til l_ref
SJEKKLISTE for den nykompilerte VD-ordboka (gammel infra):
Minst 2-3 ord fra hver ordklassefil - og sjekk
- hvordan ordklasse er presentert
- entalls- og flertallsstedsnavn
- flertallslemmaer
- hvordan <mg> og <tg> er presentert
- hvordan <re> og <te> er presentert
- analysetaggene
- nøkkelformer
- at de er med for substantiv, stedsnavn, verb, adjektiv, numeraler og pron.indef
- taggene
- presentasjonstekst
- sortering av variasjon (flere ordfomer med samme analyse)
- lemmaer med flere skrivemåter, bør ha grunnformen med i nøkkelformer. F.eks. hvis man med tunealla-lemmaet genererer både tunealla og tunnealla. Alternativt kan man ha presentere hver grunnform med eget oppslag i ordboka. Sjekk da at det er riktige nøkkelformer til hver grunnform.
- sjekke spesielle verb: hjelpeverb, værverb etc.
- at de er med for substantiv, stedsnavn, verb, adjektiv, numeraler og pron.indef
- at eksempler er med, og hvordan de er presentert
- at l_ref-linking fungerer
- at illpl="no" fungerer
- at homonymer får rett bøyningsparadigme, feks beassi = never og beassi = reir
- at ønskede ordformer er med i ordboka
- at sublemmaer er med
- at evt. spellrelax fungerer
Minst ett ord fra hver statisk fil
- hvordan ordklasse er presentert
- analysetaggene
- at linking fungerer
- at eksempler er med, og hvordan de er presentert
- at det er en ryddig presentasjon av homonymer
- vi ønsker ikke presentere homonymer hver for seg, med link til samme grunnord. De vil vi heller presentere med alternative analyse-stringer.
- vi ønsker ikke presentere homonymer hver for seg, med link til samme grunnord. De vil vi heller presentere med alternative analyse-stringer.
- nøkkelformer (dvs fullt paradigme)