Meeting_2017-03-07
T&S 7.3.2017
Saker til tysdagsmøtet
- Orienteringssaker
- Testbenken
- Vekting
- Korpus
- Mobiltelefontastatur
- gt-maskina
- finugrevita
- OmegaT & tokenisering / hfst, lucene, osb
- personar i bugzilla, jf lusmelding 2018
- kortkurs i grønlandsk
- ConNeg i mordvinske språk
Orienteringssaker
mt og skriftkultur - Trond orienterte om ei sak T og L har diskutert.
Testbenken
Er det mogleg å ha typos med
rett rett
eller må det berre vere
feil rett
Det skal vere slik:
rett feil<tab>rett
Vekting
...
c-conv -W | ... |
<W: 4>
hfst:
ordform<tab>lemma+tag+tag<tab>4.00000
"<ordform>"
Kommando som gjev dette formatet:
ccat -a -l sme $GTFREE/converted/sme \ | hfst-tokenise --giella-cg tools/preprocess/tokeniser-disamb-gt-desc.pmhfst
Vi ber Kevin setje opp pmatch-oppsettet i courses/lexctwolc/weights
Det fungerer i langs/ men ikkje i courses.
Vi må sjå til at russisk cg fungerer i langs/.
Korpus
Reetta - ny korpusarbeidar for Trond, treng opplæring av Børre.
mhr: Framgang med svn-tilgang, neste steg er å evaluere status.
Mobiltelefontastatur og app-bygging
App-systemet er komplekst. Sjur vil på råd frå Brendan
Det vil ta tid å få det til, lenger tid enn 14 dagar, men når
- automatisering av signeringsrutinene for appar og opplasting av skjermbilete
- lettare portabilitet: våre appar med anna innpakking enn vår
gt-maskina
Trond og Børre ser på dette.
OmegaT & tokenisering / hfst, lucene, osb
Plan for integrering av fst. Vi held eit møte i morgon tidleg for å sjå nærmare
personar i bugzilla, jf lusmelding 2018
Sjur har nye metodar, vi ser på det.
Kortkurs i grønlandsk
Trond: ja.
ConNeg i mordvinske språk
Trond og Sjur ser på dette.