PlanCG
Dette dokumentet skisserer eit oppsett for CG-basert MT for sme-nob.
Skjematisk oversyn
- Analyse:
- sme hfst-basert gt-pipeline til og med dependens
- sme hfst-basert gt-pipeline til og med dependens
- Transfer:
- leksikalsk ... (kjem)
- grammatisk ... (kjem)
- leksikalsk ... (kjem)
- Generering: (kjem)
Dokumentasjon
Filstruktur
Analyse:sme
Transfer
Lage ny mappe:
sme/tools/mt/cgbased (evt. eit anna namn).
Filene som skal inn her gjev vi namn frå Eckhard sitt oppsett.
Generering
Her har vi eit par alternativ:
- Hente inn nob direkte frå Apertium til tools/mt/cgmt
- Hente nob frå apertium til external-langs, på linje med spa og nno.
- Hente fst frå Ordbanken (jf. nno, og jf. mappa obt i langs/nob)
- bruke langs/nob
Det beste er sannsynlegvis (2), men vi kan evt. eksperimentere med nokre av dei andre alternativa også.
Taggar
Det enklaste vil vere å bruke giella-taggar og ikkje Apertium-taggar. Viss vi så skal ha nob frå apertium vil vi reversere mekanismene i mt/tags.