180911
Giellatekno-møte 11.09.2018
Tilstede: Ciprian, Trond, Chiara, Lene
Saker
- Oppfølgjing frå førre møte 
 - Korp  
 - NDS 
 - SSHRC 
 - LIA 
 - Loggar   
 - Haustplan
 
Oppfølgjing frå førre møte
Trond følgjer opp preprocess-saka + tale.
Korp (Stockholm)
- Ciprian lagar presentasjon frå oss 
- Multilingual presentasjon av taggane 
 
 - Multilingual presentasjon av taggane 
 - Versjonar av Korp (github) 5.0.10 og (som test) 6.0.1 vs. Göteborg: 7.0.0
 
Korp (Uleåborg)
Nytt innhald + debugging 
"<doaimma>"
        "doaibma" N Sem/Act Sg Gen @>N #2->3
"<skuvlladoaimma>"
        "doaibma" N Sem/Act Sg Gen @>N #2->3
                "skuvla" N Sem/Edu_Org Cmp/SgGen Cmp #2->3
"<jekkiidsuodjalanguovlu>"
        "guovlu" N Sem/Plc Sg Nom @HNOUN #4->2
                "suodjaleapmi" N Sem/Act Cmp/SgNom Cmp #4->2
                        "jeaggi" N Sem/Plc Cmp/PlGen Cmp #4->2
        "guovlu" N Sem/Plc Sg Nom @HNOUN #4->2
                "suodjaleapmi" N Sem/Act Cmp/SgNom Cmp #4->2
                        "jeaggi" N Sem/Plc Err/Orth Cmp/PlGen Cmp #4->2
                        
$HLOOKUP $GTHOME/langs/sme/src/generator-gt-norm.hfstol
jeaggi+N+Cmp/PlGen+Cmp#suodjaleapmi+N+Cmp/SgNom+Cmp#guovlu+N+Sg+Nom        jekkiidsuodjalanguovlu
jeaggi+N+Sem/Plc+Cmp/PlGen+Cmp#suodjaleapmi+N+Sem/Act+Cmp/SgNom+Cmp#guovlu+N+Sem/Plc+Sg+Nom        jekkiidsuodjalanguovlu
(fungerer både med og uten semtagger)
Konklusjon:
- Vi held fram med to preprosesseringsmetodar for Korp (xfst, hfst), og evaluerer skilnaden dei i mellom
 - Prioritet: Presentere ny versjon av korpusinnholdet i Uleåborg 
 - Evalueringa av xfst/hfst vil vise kva versjon vi skal implementere det nye innhaldet med.
 
https://spraakbanken.gu.se/eng/research/infrastructure/korp/distribution/backend
NDS
Posisjonsproblemet med søkeordet er fiksa. Viss søkeordet får to treff prioriterer vi det som har same streng. 
SSHRC
Frist i slutten av september, Lene, Trond, Sjur ser på dette.
LIA
Analyse:
Det er saker opne med annotering, dette bør vi diskutere i Kautokeino.  
Cip og Joel var einig om at Joel skulle arbeide på den siste versjonen,  
Debugging
- Feil søkeresultat (t.d. pronomen for substantiv)
 - Feil pop-up-analyse (substantiv, men presentert med feil lemma eller feil analyse)
 - Dobbel pop-up-analyse (!)
 - Tekniske symbol i analysen (_DCC_)
 - Lingvistiske feil i analyse  
 - Fjerne # frå MT_output, kanskje også *
 
Programmet for LIA-workshop
Loggar
Trond har lagt inn oversyn over loggprosessar i priv/.  Alle ser om det manglar noko, deretter 
Haustplan
Alle oppdaterer planen sin, vi ser på prioriteringar neste gong.

