Meeting_2013-09-02
Sjur og Trond 2.9. 2013
Saker
- filter
- victorio
- Island
- Kintel
- TTS
- Termseminar
- Orddeling
filter
Korleis fungerer gtshared
Diskusjon om dette.
Prinsipp: gtshared berre dei som er delt.
Ergo språk-spesifikke ting bort derfrå.
Sletting av sem-taggar overalt
Sjur vil diskutere dette meir, vi tar det opp seinare.
victorio
Trond orienterte om status quo. Børre må sjå på dette.
Island
Sjur orienterte kort, meir seinare.
Ein del av resultatet med å vise fram
fao
Zakaris skal sjå på lisensspørsmålet.
isl
Fullformliste med restriksjonar i lisensen, som vi evt kan leve med.
S&T ser på om vi kan få til noko til NoDaLiDa på Island med dette.
fst
Sjur har sjekka inn ei fullformsliste x 3
- opne
- lukka med bøying
- lukka utan bøying
og gjort det om til ein fst.
Stunt:
Ta isl-taggane, konverter til våre taggar, opne for samansetjing
dan
Berre ein katalog, men vil bli tilgjengeleg som liste av
Det er også eit lisensspørsmål.
swe
Her er det opne ressursar.
Kintel
Ny medarbeidar, Sandra, i halv stilling, skal arbeide med Kintel.
TTS
Tre veker til å få orden på det såkalla fonetiske leksikonet, dvs.
Møte med Berit-Anne og Thomas.
Prosjektet byrjar 1.10., då skal BÁ til Stockholm i ei veke.
Ei veke før det skal acapella ha ei liste over minst 400 000
Det er ein del feil.
Vi har ingen mekanismar for å handsame lånord.
Ein del
Unntak
lemma+Ort/ort: ortstamme CONTLEX;
Akronym:
-
store bokst ja/nei
- nei: business as usual
- ja: acro
- nei: business as usual
- acro:
- er det på lista av akro-ord? j/n
- ja: NATO / n a: t u /
- nei: FBI / e f: b e: i: /
- ja: NATO / n a: t u /
-
bindestrek ja/nei
- nei: business as usual
- ja: konsonantord
- nei: business as usual
-
konsonantord ja/nei
- ord til venstre utan vokal: acro: cd-spelar / s e: d e: s p ... /
- ord til venstre med vokal: business as usual
- ord til venstre utan vokal: acro: cd-spelar / s e: d e: s p ... /
Termseminar
Om to veker
Orddeling
perlscriptet fungerer ikkje
spell-out av variabel
$utilitydir/lookup $fstflags $hyph_fst | $commondir/hyph-filter.pl"; |
Problemet er:
Docu in the perlscript:
# hyph-filter.pl # Perls script for cleaning the hyphenator output. # - reads one cohort at the time # - compares the hyphenated word to the orignal, disregarding ^ and #: # -- deletes forms that do not correspond to the input string # - uniques the final set # - removes all but the readings with the least word boundaries # and prints what is left (it should normally be only one form) # # $Id: hyph-filter.pl 25426 2009-04-21 09:48:21Z boerre $
~$ll /opt/smi/common/bin/hyph-filter.pl
------------------------------------------------------------------------ r8377 | saara | 2006-10-02 14:26:57 +0300 (Mon, 02 Oct 2006) | 3 lines Improved the script to read one cohort at the time, remove irrelevant word boundary marks, rate the compounds and unique the result. ------------------------------------------------------------------------ r8264 | sjur | 2006-09-26 12:34:16 +0300 (Tue, 26 Sep 2006) | 2 lines Added checking of split results. ------------------------------------------------------------------------ r8259 | sjur | 2006-09-26 09:37:45 +0300 (Tue, 26 Sep 2006) | 2 lines
Added hyphenation filter script.
For Børre
- termseminaret - neste fredag
- termkonvertering - neste fredag
- hyph - fredag - børre ser på det i 2 timar, rapporterer
- vic til gtweb - tja
- forrest