Meeting2013-08-14
Nordplus-møte 14.8. 2013
Saker:
- status+spørsmål for kvart språk
- avsluttinga av prosjektet
Status+spørsmål for kvart språk
sme
Ferdig neste vek om eg ikkje blir enno meir førstyrret.
sma
Ferdig neste veke om eg kan arbeida uforstyrra.
smj
1506 $-feil + mange andre feil. Folk bruker Divvun-stavekontrollen, så det er få feil i nye tekstar.
Interjeksjonar
- hehe∞(nor)
- Usj∞(nor)
- haaaahaaaa!
- Wups!
- Hååååhååååj$ Håhåj
Døme frå islandsk (vi merkar opp slik dersom vi ikkje vil ha med orda i testmaterialet):
- óóóóógeðslegt
- hahahaha∞(sla)
der ‘sla’ = slang.
Andre problemfeil
Desse vart diskuterte, og løysingar antyda som vist nedanfor:
- (vuodoskåvlås ålgus vádtsám)¥(sub,nob-smj|vuodoskåvlåjn gærggam)
mijá kultuvra birra. |
- (Saemiedigkie goh¥0 reereme)€(w|Saemiediegkie reerenasse)£(case,nom-ess|Saemiedigkie reerenassine)
- (suv mañen$(ascii|maŋen) gievkanij viegaj)¥(redun;x|suv gievkanij viegadij)
kal
Elin har fått ny datamaskin igjen, og har måtta bruka tid på å få ting til å fungera igjen.
Kommando for å finna alle $-feil:
$ find . -name '*correct.txt' | xargs cat | tr ' ' '\n' | fgrep '$' | sort | less / see / wc -l
der:
-
less viser lista med $-feil i terminalen
-
see opnar lista med $-feil i SubEthaEdit
- wc -l tel og skriv ut kor mange $-feil det finst
Har framleis kring 500 feil, men reknar med å få meir tid til å arbeida framover.
isl
Islandsk har no minst 1000 $-feil men det kan vera feil i oppmerkinga.
Spørsmål
Kva gjer ein med manglande mellomrom?
- Setning hér.Og setning hér. - (hér.Og)¢ - nei, bør vera (hér.Og)$(...
Vil ikkje forkortingar og internettadresser som:
- p.g.a.
- www.eretre.eretta.com
bli kunna blanda saman med feil av typen manglande mellomrom? Nei, berre unnataksvis. Stavekontrollane bør klara å oppdaga manglande mellomrom, og dei skal difor merkast som vanlege skrivefeil.
Mange slike feil:
- lítin$(con,suff,nn-n|lítinn)
Islandsk stavekontroll
Avsluttinga av prosjektet
Elin klarar ikkje å bruka alle timane sine før prosjektet sluttar, så Hulda kan bruka noko av dette for å merka opp fleire feil.
Teknisk arbeid:
- avslutt og korriger oppmerkinga - alle lingvistane
- oppdater testbenken - Sjur
- støtte for Word-/PLX-stavekontrollen - ferdig
- oppdaterte grafar + html-tabellar
- støtte for Word-/PLX-stavekontrollen - ferdig
- test stavekontrollane - Sjur
Skrivearbeid:
- dokumentasjon for kvart språk
- rapport for kvart språk - innsamling og oppmerking
- Hvilke tekster
- Antall $-feil, + talet på andre feil som er merka opp
- Tidsbruk
- antall ord for heile korpuset
- klassifiseringa av feil som er brukt i oppmerkinga
- Hvilke tekster
- rekneskap + samla tidsbruk - Inga
- samla rapport med:
- evaluering av stavekontrollane, kvar for seg og samla
- evaluering av prosjektet
- evaluering av stavekontrollane, kvar for seg og samla
Datoar:
26. august - neste møte, kl 12 norsk tid