Meeting2020-10-28-spellertesting
20202.10.27 Stavekontrolltesting
Til stades: Børre, Sjur, Tommi
Saker:
- stavekontrolltesting og GitHub-integrering
Ta utgangspunkt i https: //github.com/divvun/divvunspell/ og accuracy-tester
accuracy-tester genererer json-data. Må konverterast til noko som kan visast direkte i GitHub - kan vera MD eller noko som MD kan lenka til.
Testdata finst for alle språk i test/data/typos.txt (TSV-fil).
Kva vi vil ha:
- ein modernisert replika av det vi har hatt
- grunnleggjande mål i ein historisk graf - TSV-fil med ei linje pr testa versjon
TSV-fil og historisk graf
Data som må vera med:
- commithash
- tidsstempel
- forslagskvalitet i prosent (top1, top5, lenger ned, ingen forslag, berre feil)
TSV-format:
hash dato Release/description top1 top5 lower5 nosugg wrongsugg
Detaljert rapport
- json-fil frå accuracy-tester
- konvertering til tabell eller liknande (no: NodeJS-app skriven av Brendan)
- helst direkte integrerbar med MD-dokument slik at ein får automatisk vising i GH
Manglar i Brendan-versjonen:
- redigeringsavstand
- statistikk basert på redigeringsavstand
- true/false negative/positive
Gamalt format, kolonner:
- input
- true/false negative/positive
- expected output
- redigeringsavstand
- plass for rett forslag
- tidsbruk
- faktiske forslag (rett framheva)
- merknader, bugzilla-lenker
Brendan-format, kolonner:
- input + expected output, plass for rett forslag, tidsbruk
- faktiske forslag (rett framheva)
Redigeringsavstand bør koma frå accuracy-tester, dvs Rust, og skrivast ut i json-rapporten som ein del av testresultata. Noko i stil med:
{ "input": "mnngan", "expected": "mænngan", "edit_dist": 1, # <== nytt felt "suggestions": [ { "value": "mænngan", "weight": 21.669922 }, ... ], "position": 0, "time": { "secs": 0, "subsec_nanos": 5624911 } },
Tommi prøver å leggja inn dette, spør Brendan om hjelp om det trengst. Forslag til Rust-crate:
Arbeid framover
Status 20202.11.4:
- integrera detaljrapporten i MD-dokument for kvart språk
- grafikk som viser fordeling mellom dei ulike typane (svg - offline eller på direkten?)
- tabell med alle detaljar - er MD rette formatet?
- grafikk som viser fordeling mellom dei ulike typane (svg - offline eller på direkten?)
- integrera historisk rapport i MD-dokument - Tommi
- grafikk som viser historisk utvikling (svg - offline eller på direkten?)
- grafikk som viser historisk utvikling (svg - offline eller på direkten?)
- integrera i make
Ferdig
- leggja inn redigeringsavstand i json-rapporten (Tommi) - FERDIG
- har lagt til funksjon for å leggja til samandrag til ei fil som viser utviklinga over tid
- har lagt til funksjon for å leggja til samandrag til ei fil som viser utviklinga over tid
- data lagrast (inntil vidare) i tools/spellcheckers/test/ (Sjur) - FERDIG
- legg inn javascript og CSS i gtsvn igjen (frå giella-core), slik at gamle testresultat fungerer igjen (Sjur) - FERDIG for lang-XXX-repoa.