Meeting2013-08-14

Nordplus-møte 14.8. 2013

Saker:

  • status+spørsmål for kvart språk
  • avsluttinga av prosjektet

Status+spørsmål for kvart språk

sme

Ferdig neste vek om eg ikkje blir enno meir førstyrret.

sma

Ferdig neste veke om eg kan arbeida uforstyrra.

smj

1506 $-feil + mange andre feil. Folk bruker Divvun-stavekontrollen, så det er få feil i nye tekstar.

Interjeksjonar

Kva gjer vi med interjeksjonar? Særleg slike som er klart muntlege i stil og ortografi. Døme, med noverande oppmerking:

  • hehe∞(nor)
  • Usj∞(nor)
  • haaaahaaaa!
  • Wups!
  • Hååååhååååj$ Håhåj

Døme frå islandsk (vi merkar opp slik dersom vi ikkje vil ha med orda i testmaterialet):

  • óóóóógeðslegt
  • hahahaha∞(sla)

der ‘sla’ = slang.

Andre problemfeil

Desse vart diskuterte, og løysingar antyda som vist nedanfor:

  • (vuodoskåvlås ålgus vádtsám)¥(sub,nob-smj|vuodoskåvlåjn gærggam) ienep suohtas€(phr| * … (vuosedit ja informerit)€(infl,inf-sup|vuosedittjat ja informeritjit))¥(missing
mijá kultuvra birra.
  • (Saemiedigkie goh¥0 reereme)€(w|Saemiediegkie reerenasse)£(case,nom-ess|Saemiedigkie reerenassine)
  • (suv mañen$(ascii|maŋen) gievkanij viegaj)¥(redun;x|suv gievkanij viegadij)

kal

Elin har fått ny datamaskin igjen, og har måtta bruka tid på å få ting til å fungera igjen.

Kommando for å finna alle $-feil:

$ find . -name '*correct.txt' | xargs cat | tr ' ' '\n' | fgrep '$' | sort | less / see / wc -l

der:

  • less viser lista med $-feil i terminalen
  • see opnar lista med $-feil i SubEthaEdit
  • wc -l tel og skriv ut kor mange $-feil det finst

Har framleis kring 500 feil, men reknar med å få meir tid til å arbeida framover.

isl

Islandsk har no minst 1000 $-feil men det kan vera feil i oppmerkinga.

Spørsmål

Kva gjer ein med manglande mellomrom?

  • Setning hér.Og setning hér. - (hér.Og)¢ - nei, bør vera (hér.Og)$(...

Vil ikkje forkortingar og internettadresser som:

  • p.g.a.
  • www.eretre.eretta.com

bli kunna blanda saman med feil av typen manglande mellomrom? Nei, berre unnataksvis. Stavekontrollane bør klara å oppdaga manglande mellomrom, og dei skal difor merkast som vanlege skrivefeil.

Mange slike feil:

  • lítin$(con,suff,nn-n|lítinn)

Islandsk stavekontroll

Har fått svar frå Púki, berre for Office/Win. Men Hulda har tidlegare fått e-post om at det finst eit kommondolinjeverkty. Ho skriv tilbake og ber om å få bruka det, med kopi til Sjur og Fridrik.

Avsluttinga av prosjektet

Elin klarar ikkje å bruka alle timane sine før prosjektet sluttar, så Hulda kan bruka noko av dette for å merka opp fleire feil.

Teknisk arbeid:

  • avslutt og korriger oppmerkinga - alle lingvistane
  • oppdater testbenken - Sjur
    • støtte for Word-/PLX-stavekontrollen - ferdig
    • oppdaterte grafar + html-tabellar
  • test stavekontrollane - Sjur

Skrivearbeid:

  • dokumentasjon for kvart språk
  • rapport for kvart språk - innsamling og oppmerking
    • Hvilke tekster
    • Antall $-feil, + talet på andre feil som er merka opp
    • Tidsbruk
    • antall ord for heile korpuset
    • klassifiseringa av feil som er brukt i oppmerkinga
  • rekneskap + samla tidsbruk - Inga
  • samla rapport med:
    • evaluering av stavekontrollane, kvar for seg og samla
    • evaluering av prosjektet

Datoar:

26. august - neste møte, kl 12 norsk tid 30. august - siste arbeidsdag for Inga 15. oktober - ferdig med all oppmerking og skriving (både doku og rapport) 15. november - prosjektet blir avslutta