2017-12-06

Gramatikkontrollmøte 6.12.2017

Til stades: Duommá, Kevin, Linda, Sjur

Saker:

  • sidan sist
  • arbeid framover
  • samarbeid med Hanna O?

Sidan sist

Duommá

  • disambiguerer post- og preposisjoner

Problem:

sme $ echo “vuostái barge..“ | hfst-tokenise -g 'tools/grammarcheckers/tokeniser-gramcheck-gt-desc.pmhfst'  | vislcg3 --trace -g 'tools/grammarcheckers/../../src/syntax/valency.cg3' | vislcg3 --trace -g 'tools/grammarcheckers/../tokenisers/mwe-dis.cg3'  | cg-mwesplit |  divvun-blanktag 'tools/grammarcheckers/blanktagger.hfst'  | vislcg3 --trace -g 'tools/grammarcheckers/disambiguator.cg3' | vislcg3 --trace -g 'tools/grammarcheckers/grammarchecker.cg3' 
"<“>"
"“" PUNCT LEFT <W:0.0000000000> &punct-aistton ADD:12802:punct-aistton ADD:12809:punct-aistton
"”" PUNCT <W:0.0000000000> RIGHT &SUGGEST ADD:12802:punct-aistton COPY:12804:punct-aistton
"<vuostái>"
"vuosti" N Sem/Wthr Sg Ill <W:0.0000000000> @ADVL> MAP:16947
"vuostá" N Sem/Food Sg Ill <W:0.0000000000> @ADVL> MAP:16947
"vuostái" Adv <W:0.0000000000> @ADVL> MAP:16947
;"vuostái" Pr <W:0.0000000000> REMOVE:6141:r1123
;"vuostái" Po <W:0.0000000000> REMOVE:6230:r1144
: 
"<barge>"

Kevin

  • cg-spell fungerer i checker-cli/checker-lib, pipespec, zip-format, apy, webdemo
  • webdemo deler no opp lange tekster på passande punkt og sender ut litt og litt
  • debugging av korfor -n gav feil topptreff i hfst-ospell ( hfst-push-weights)
  • litt rydding i templates/grammarchecker.cg3
  • (endeleg) implementert støtte for alternative rettingar på same lesing i divvun-suggest, som diskutert for lenge sidan; pluss sletting av ord
  • støtte for å gøyma feiltaggar i checker-cli
  • divvun-gen-sh bør no vera ei fullgod erstatning for apertium-gen-modes (treng ikkje lenger apertium for modes); det går òg an å kompilera gen-sh med  --disable-checker no
  • ny modul divvun-blanktag til tagging av mellomrom-feil, avsnittsskifte; brukbar frå checker/lib/pipelines; lagt til i smegram og webdemo
  • curl|bash-skript for å enkelt installera/oppdatera på mac
  • la til val av «modes» (språk, pipevariant) i webdemo
  • ymse rettingar og koderydding i webdemo og divvun-gramcheck
  • begynte å undersøka LibreOffice-plugin

Problem:

  • Linda: ikonet for å starta grammatikkontrollen har grøn strek, medan strekane i teksten er blåe. Bør vera same farge.

LibreOffice-plugg - ulike måtar å integrera på:

  • LanguageTools: bruker Java
  • C++ - lett å lenka til, men få som nyttar det
  • LightProof bruker Python
  • Voikko? Har gram.kontroll for finsk

Linda

  • hjalp Duommá med disambigueringsregler
  • fiksa kommaregler ved hjelp av Kevins nye tagger etter linjeskift
  • snakka med Bigga om webdemotesting

Sjur

  • blankteiknanalyse ut til alle språk
  • undersøkte problem med "vuostái barge" - fungerer no for meg, ikkje for Duommá, jf lenger opp

Fleire forslag på same ord, overlapp, sletting

implementert i divvun-suggest; webdemoen må sannsynlegvis(?) oppdaterast til å handtera slikt òg. For å bruka det, må forslags-readingen (&SUGGEST) ha den relevante feiltaggen på seg.

$ cat test/suggest/input.delete-and-suggest.cg 
"<dego>"
        "dego" CS <W:0> @CNP ID:11
: 
"<lávvomuorran>"
        "lávvomuorra" N Sem/Dummytag Ess <W:0> @COMP-CS< &syn-not-dego R:DELETE1:11
        "lávvomuorra" N Sem/Dummytag Sg Nom <W:0> @COMP-CS< &syn-dego-nom &SUGGEST
$ cat test/suggest/expected.delete-and-suggest.json |jq .
{
  "errs": [
    [
      "dego lávvomuorran",
      0,
      17,
      "syn-not-dego",
      "not dego (dette er ei leseleg forklaring)",
      [
        "lávvomuorran"
      ]
    ],
    [
      "dego lávvomuorran",
      0,
      17,
      "syn-dego-nom",
      "dego nom (dette er ei leseleg forklaring)",
      [
        "dego lávvomuorra"
      ]
    ]
  ],
  "text": "dego lávvomuorran"
}

Veldig bra! Akkurat det vi vil ha!

Samarbeid med Hanna O?

Utsett til etter Linda sin disputas.

Arbeid framover

Duommá

  • held fram med å disambiguera pre- og postposisjonar

Kevin

  • Alternative forslag inn i webdemo
  • LibreOffice
  • macOS
  • Evalueringsprogram (men kva er spesifikasjonane?) - vent med det

Linda

  • jobbar med avhandlinga
  • hjelper Duommá

Sjur

  • laga spesifikasjon for evalueringsprogram / testbenk