120919

FAD-Møte 19.9.2012

Til stades: Børre, Ciprian, Marja, Sjur, Trond, Berit Merete

Saker:

  • Status quo
  • Bugzilla
  • Arbeid framover
  • Neste møte

Status quo

For #1391 står det ei fil att, deretter er metadata i orden. abbr-bugen er i land.

Manglande meta og xsl er no i orden.

Den andre delen som er kommentert i 1391: Der eit dokument manglar etter konvertering tio xml. Når det er ferdig konvertert har dei samiske dokumenta ikkje vore konvertert. Det kan vere for mykje uanalysert tekst, ein for høg prosent er ikkje merka for samisk.

Dette gjeld for 21 dokument.

Det som no ligg i prestable er ca. 1400 ekte par:

  • peikarane er i orden.
  • det er ikkje ocr-filer der

I Cip sin siste runde ligg det 2400 par, av dei har 21 problem.

TODO

  • Konklusjon: convert2xml.pl skal seie frå om manglande parallell ( Børre)
  • Deretter ordparallellisering (Cip)

Arbeid framover til måndag

  1. BM og Marja arbeider med dei 21 konverteringsfeilmeldingane
  2. 1400 -> 2400: Dei 1000 er sannsynlegvis fjerna på korrekt grunnlag.
    1. Sjå på store filer rett under grenseverdien
    2. Laws, t.d.
  3. Heilt nye filer:
    1. Sjå på Sametingets plenumsreferat frå dei siste 3 åra. ( Børre, BM, Marja tar møte torsdag 0915)
  4. Ordparallellisering: Cip køyrer dei 1400

Neste møte

Måndag 24.9. 13.00.