Meeting_2011-11-07
Møte 7.10 2011.
Sjur, Trond
Korpus
På plass:
- orig-til-xml for .html og .doc
- teiknsettkonvertering
- ccat (for parallellføring, m.m.)
Krev testing:
- språkattkjenning
Ope:
- orig-til-xml for .pdf
- automatisk test for parallellføringa
Deadline:
- Vi må ha eit korpus klart til parallellisering i løpet av oktober.
- Det skal vere så stort som mogleg -- dvs. omfatte alle paralleliserbare tekstane vi har.