Meeting_2019-01-1418
Contents:
Stavekontrollar for mobiltelefonar, møte 14., 15. og 18.1.2019
Saker:
- erfaringar
- korleis kan vi gjera forslaga betre
Maja
- la ut lenke på sma-FB
- mange syntest det var bra
- kjempebra med stavekontroll!!!
- mange syntest det var bra
- må prøva ut meir
- forslagsmekanismen: same problem som i Word/LO
- veldig positivt å få stavekontrollen rett i fjeset - ser problema tydelegare
- nokre har problem med å få stavekontrollen til å fungera / få oppdateringa på plass
- manglar info om telefon(modell), OS-versjon, m.m.
Duommá
- den er bra men ubegripeleg (forslagsmekanismen)
- han er ikkje konsekvent (sjå Zulip) - kva er det som står i hermeteikn?
Elena
- får mange heilt ville forslag
- treng ikkje vera samiske ord
- skriv: 'Viellka' (ønsker Viellja) - Miella Giella Niellja
- stor fyrstebokstav triggar forslag som er namn -> straff namn høgare
Børre
- problemet er at han gjer rettingar for tidleg - treng (statistisk basert) ordfullføring
- forslaga når ein kjem halvvegs i ordet er berre tull
Sjur
- Siden lansering: over 2000 personer har oppdatert tastaturet i iOS
- Kræsjlogg indikerer at det blir brukt mye
Feilmodell
Er dokumentert her.
Filene som bestemmer vekta til forslaga
Analysatorvektene blir spesifiserte i denne katalogen
- spellercorpus.raw.txt
- tags.reweight
Og vektene i feilmodellen ligg her:
- editdist.default.txt
- final_strings.default.txt
- initial_letters.default.txt
- strings.default.txt
- words.default.txt
Endeleg vekt på forslag = analysatorvekt + vekt frå feilmodell
Byt ut desktop med mobile for vektinga for mobilkstavekontrollen!
Resultat etter fleire rettingar
smj
$ echo Viellka | divvunspell -S -z smj-mobile.zhfst | head -n 15 Reading from stdin... Input: Viellka [INCORRECT] Viellja 11.609375 Giella 18.619987 Giellda 20.51159 Vielja 21.89746 Viellde 23.090923 Viellida 23.590923 Viellit 23.590923 Vielljaj 23.590923 Vielljan 23.590923 Vierkka 23.590923 Viehka 27.546875 Miella 29.163086 Vieleda 31.302734 Jiella 32.590923
sma
vïelle - vielle - $ echo Vïellke | divvunspell -s -z tools/spellcheckers/fstbased/mobile/hfst/sma-mobile.zhfst | head Reading from stdin... Input: Vïellke [INCORRECT] Vïelle 21.18164 Vïelline 21.371094 Vaellie 23.181967 Vellie 23.181967 Vïelje 23.181967 Vïelli 23.181967 Vïellide 23.181967 Vïellige 23.181967 Vïelleme 26.300001 $ echo Vielle | divvunspell -s -z tools/spellcheckers/fstbased/mobile/hfst/sma-mobile.zhfst | head Reading from stdin... Input: Vielle [INCORRECT] Vielie 8.183745 Bielie 10.1075735 Vïelle 12.181641 Vuelie 12.585113 Voelpe 13.037261 Gielie 14.714215 Velle 15.181967 Vellie 15.181967 Vislie 16.010395
sme
$ time echo dáhtttu | divvunspell -s -z tools/spellcheckers/fstbased/mobile/hfst/se-mobile.zhfst | head Reading from stdin... Input: dáhtttu [INCORRECT] dáhtto 0.5107422 dáhttu 5.6054688 sáhttu 12.048828 fáhttu 14.301799 máhttu 15.249023 gáhttu 15.301799 dáhttut 16.82129 dáhtu 17.313477 dáhttui 18.386719 $ time echo muhtin | divvunspell -S -z tools/spellcheckers/fstbased/mobile/hfst/se-mobile.zhfst | head Reading from stdin... Input: muhtin [CORRECT] johtin 5.9035645 mohtin 6.301799 muhtin 8.017578 mohton 8.301799 mohtun 8.301799 lohtin 8.419841 muhtun 9.350586 muhtton 14.301799 murdin 14.537883 $ time echo muhtun | divvunspell -S -z tools/spellcheckers/fstbased/mobile/hfst/se-mobile.zhfst | head Reading from stdin... Input: muhtun [CORRECT] mohton -2.6982012 muhtton 3.3017988 mohttun 5.3018 mohtun 6.301799 muhtun 7.350586 muhto 7.4472656 mihton 8.301799 mohtin 8.301799 lohtun 8.419841 muhtin muhtin muhtin+Pron+Indef+Attr 0,000000 muhtin muhtin+Pron+Indef+Sg+Nom 0,000000 muhtun muhtun muhtun+Pron+Indef+Attr 0,000000 muhtun muhtun+Pron+Indef+Sg+Nom 0,000000
jag skriver "muhtin" venstre: "muhtin" mitten: "johtin" høgre: "mohtin"
jag skriver "muhtun" venstre: "mohttun" mitten: "mohton" høgre: muhtton
aha: jag skriver "dáhtttu" venstre: "sáhttu" mitten: "dáhtto" høgre: "dáhttu"
jag skriver "positiiválaččat" venstre: ""positiiválaččat"" (inom citationstecken) mitten: "positiivvalaččat"
echo positiiválaččat | divvunspell -S -z tools/spellcheckers/fstbased/mobile/hfst/se-mobile.zhfst | head Reading from stdin... Input: positiiválaččat [INCORRECT] positiivvalaččat 4.286133
Det betyr: det til venstre (i hermeteikn) er det du skriv, og det i midten er det som stavekontrollen føreslår, dvs berre eitt forslag.
For å arbeida med forslaga:
- justér vekt (feilmodell, tagger)
- kompiler
- test:
- manuelt
- automatisk: devtools/test_ospell-office_suggestions.sh
- manuelt