meeting-2013-09-11
TTS-møte
Saker:
- Frå førre møte
- Trykkplassering
- andre problemsekvensar
- andre saker
- Neste møte
Frå førre møte
- (over)lange vokalar (og konsonantar) - fiksa
- bindestrek i utdata - fiksa
Låneord og namn (spørsmål til Acapela)
Bøying
Låneord blir delt inn i tre:
- vokalfinale - inga ending i acc/gen, -a- før konsonantinitiale kasus
-
Nystø, Nystø-as
-
Nystø, Nystø-as
- konsonantfinal, trykktung sistestaving: -a- i acc/gen, -a- før kons.init.
-
Iphone-a Iphone-as
-
Iphone-a Iphone-as
- konsonantfinal, trykklett sistestaving: -a- i acc/gen, -i- før kons.init.
- Sommer-a Sommer-is Sommer-at
Er det nok med å generera nom, acc/gen, og bøyingsstamme for resten? Eller heile paradigmet?
kor går skiljet mellom samisk og ikkje-samisk?
Sihkkel (sykkel) - går rett inn i samisk fonotaks og oppfører seg heilt som
Det største problemet er ord som har samiske teikn med ikkje-samisk uttale: pizza, cup, osb. Desse må vi handtera med IPA-stammar i lexc-leksikonet.
Vi får tre grupper:
- samisk fonotaks
- ikkje-samisk fonotaks med ikkje-samiske teikn (sykkel)
- kan identifiserast automatisk? Sjå etter ikkje-samiske teikn
-
Sommer - oppfører seg heilt samisk, går i den fyrste gruppa
-
Vietnam - -tn- skal ikkje uttalast samisk - må ha IPA-stamme => siste gr
-
Sommer - oppfører seg heilt samisk, går i den fyrste gruppa
- kan identifiserast automatisk? Sjå etter ikkje-samiske teikn
- ikkje-samisk fonotaks med samiske teikn (pizza, cup)
- IPA-stamme i lexc
- alle / dei fleste engelske ord og namn - har Acapela ei liste over slike
ord? Kan vi bruka dei? Dersom dei har trykkplassering, kan vi laga rett bøyingsstamme. - tilsvarande for norske, svenske og finske ord og namn
- alle / dei fleste engelske ord og namn - har Acapela ei liste over slike
- IPA-stamme i lexc
Spørsmål til Acapela:
- kan vi bruka dei listene dei alt har over norske, svenske, finske og engelske
ord og namn? Ev ta snittet av våre lister og deira lister? Men helst alle, slik at TTS-listene blir mest mogleg dekkjande.
Vi har ca 30 500 namn i smi-leksikonet, der ein stor del må få lagt til IPA-stamme (i alle fall dersom vi ikkje får noko frå Acapela).
Spørsmål til Acapela:
- må desse listene leverast 1. oktober eller kan unnataka leverast seinare?
Final t og d
define FinalLightT1 t -> h || _ .#. ; define FinalLightT2 t -> h || _ [ %# | %- ] ; define FinalLightT3 t -> h || _ [ %» | %- ] ; define FinalLightD1 d -> h || Vow j _ .#. ; define FinalLightD2 d -> h || Vow j _ [ %# | %- ] ;
Kan skrivast om til:
define FinalLightT t -> h || _ [ .#. | %# | %- | %» ] ; define FinalLightD d -> h || Vow j _ [ .#. | %# | %- ] ;
Trykkplassering
Testdata no:
neu^ro#fy^sio^lo^ga^lač^ča> psy^ko#so^si^á^la^laž^ža>n gra^nih^ta»la^mos>iid gu^la^hal^la^ma giel^la#gu^la^hal^la^ma rái^da^ra^sa^žiid^dis^guin giel^la#gu^la^hal^la^mea^set giel^la#rái^da^ra^sa^žiid^dis^guin
neu^ro#fy^sio^lo^ga^lač^ča> neu^ro#fy^sio^lo^ga^lač^ča>+? inf psy^ko#so^si^á^la^laž^ža>n psy^ko#so^si^á^la^laž^ža>n+? inf gra^nih^ta»la^mos>iid grˈɑ.nih.tɑ»lˌɑ.mosijh 0,000000 gu^la^hal^lan kˈu.lɑː.hˌɑl.lɑn 0,000000 rái^da^ra^sa rˈɑːjː.tɑ.rɑ.sɑ 0,000000 gu^la^hal^la^ma kˈu.lɑː.hˌɑl.lɑ.mɑ 0,000000 gu^la^hal^la^mea^set kˈu.lɑː.hˌɑl.lɑ.mĕæ.seh 0,000000 rái^da^ra^sa»žiid^dis^guin rˈɑːjː.tɑ.rɑ.sɑ»dʃˌijtː.tis.gujn 0,000000 giel^la#gu^la^hal^la^ma kˈiel.lɑ#kˌu.lɑ.hˌɑl.lɑ.mɑ 0,000000 giel^la#gu^la^hal^la^mea^set kˈiel.lɑ#kˌu.lɑ.hˌɑl.lɑ.mĕæ.seh 0,000000 giel^la#rái^da^ra^sa»žiid^dis^guin kˈiel.lɑ#rˌɑːjː.tɑ.rɑ.sɑ»dʃˌijtː.tis.gujn 0,000000
Fasit for dei to fyrste:
neu^ro#fy^sio^lo^ga^lač^ča> nˈeu.ro#fˌy.si.o.lˌo.gɑ.lˌɑt.tʃɑ 0,000000 psy^ko#so^si^á^la^laž^ža>n psˈy.ko#sˌo.si.ˌɑː.lɑ.lˌɑdː.tʃɑn 0,000000
Forkortingar
utsett
Andre problemsekvensar
utsett
andre saker
utsett
Neste møte
Torsdag kl. 9.30

