170214
MT smenob-møte 14.2.2017
Kevin, Trond, Lene
Saksliste
- @<ADVL til "for/til å"
- Merke overskrifter
- Behandlinga av eksistensialsetninger
- Bisetninger med om
- Kondisjonalis-regler
@<ADVL til "for/til å"
- legge inn egen tagg for actio i t1x for å kunne skille mellom infinitiv og actio (vi ønsker bare "for å" for infinitiv)
- sikre at @<ADVL fungerer slik det skal i functions
- ha altenativene "for å" og "til å" i tx4 - dette er lemmabasert
__Lene__arbeider videre med dette:GJORT, klart for testing med korpus
Merke overskrifter
__Kevin__arbeider videre med dette
Behandlinga av eksistensialsetninger
__Trond__:gå gjennom translation test og leite etter "det" som ikkje fungerer
- "det" som ikkje skal vere
- manglande "det" som skal vere
- innsetting av pro (for mykje for lite)
- det-setningar med feil ordstilling
__Trond og Kevin__arbeider videre sammen med regler
Dokumentasjon:
esubj og @<SUBJext
@<SUBJext blir nå lagt til i t1x til subjekter med <ext>
Dat čuohcá mánáid ja nuoraid árgabeaivái, earret eará sidjiide geain eai leat sámegiel oahpaheaddjit
Det rammer barn og ungdommenes hverdag, blant annet dem som de har ikke samiske lærere. =>
- subjektet skal ikke flyttes (ok pga av ext)
- pro skal ikke settes inn (viss setninga er ei relativsetning skal vi aldri setje inn pro)
- ordrekkefølge: har ikke => ikke har
Dat čuohcá mánáid ja nuoraid árgabeaivái, earret eará sidjiide geat lávlot / leat ruovttus
Det rammer barn og ungdommenes hverdag, blant annet dem som er hjemme.
Doppe eai leat sámegiel oahpaheaddjit.
Mus eai leat oahpaheaddjit.
Doppe mus eai leat sámegiel oahpaheaddjit.
Doppe mus eai leat sámegiel oahpaheaddjit.
"<Doppe>" "doppe" Adv Sem/Plc @ADVL> "<eai>" "ii" V IV Neg Ind Pl3 @+FAUXV "<leat>" "leat" V IV Ind Prs ConNeg @-FMAINV "<sámegiel>" "sámegiel" A Sem/Dummytag Attr @>N "<oahpaheaddjit>" "oahpaheaddji" N NomAg Sem/Hum Pl Nom <ext> @<SUBJext "<.>" "." CLB "<Mus>" "mun" Pron Pers Sg1 Loc <hab> @ADVL> "<lea>" "leat" V IV Ind Prs Sg3 @+FMAINV "<oahpaheaddji>" "oahpaheaddji" N NomAg Sem/Hum Sg Nom <ext> @<SUBJext IKKE @<SUBJext "<.>" "." CLB Jeg har en lærer @<SUBJext Der er det en lærer @<SUBJext apertium-interchunk1 Prn<SN><^Prn<SN><←hab→><p1><mf><sg><nom>{^jeg<prn><pers><p1><mf><sg><nom>$}$ ^adv<SV><@+FAUXV><neg><indic><p3><sg><NC>{^ikke<adv>$}$ ^verb<SV><@-FMAINV><indic><pres><impers><NC><esubj>{^ha<vblex><pres>$}$ ^nom<SN><@←SUBJext><ind><m><sg><nom><pers>{^lærer<n><m><sg><3>$}$ ^sent<SENT>{^..<sent><clb>$}$ SUBJext <choose> <when> <test><equal><var n="c_syn"/><lit v=""/></equal></test> <let><var n="c_syn"/><lit-tag v="@X"/></let> </when> <when> <test> <not><equal><clip pos="1" side="sl" part="ext"/><lit v=""/></equal></not> </test> <let><var n="c_syn"/><lit-tag v="@←SUBJext"/></let> </when> </choose> esubj <choose> <when> <test><in><clip pos="1" side="sl" part="lemh"/><list n="esubj-verbs"/></in></test> <let><var n="esubj"/><lit-tag v="esubj"/></let> </when> <otherwise> <let><var n="esubj"/><lit v=""/></let> </otherwise> </choose> * Der det er lærer er ^prn<@SUBJ><p3><nt><sg><nom>{^prpers<prn><pers><p3><nt><sg><nom>$}$ chunker: ^vcop<SV><@+FMAINV><qst><indic><pres><p3><sg><impers><NC><esubj>{^være<vblex><pres>$}$ Jagis 2001 sárdnidii Norgga prinseassa Märtha Louise sámegillii, vaikko sus ii leat ii veaháge sámegielduogáš. I 2001 prekte Norges prinsesse på Märtha Louises samisk, selv om hun ikke har det ikke #noe<adv> samiskbakgrunnen. e Jagis 2001 sárdnidii Norgga prinseassa Märtha Louise sámegillii, vaikko doppe ii leat sámegielduogáš. I 2001 prekte Norges prinsesse Märtha Louise på samisk, selv om hun ikke har en samiskbakgrunn. tf-hsl-m0016:apertium-sme-nob ttr000$ e Jagis 2001 sárdnidii Norgga prinseassa Märtha Louise sámegillii, vaikko doppe ii leat sámegielduogáš. I 2001 prekte Norges prinsesse Märtha Louise på samisk, selv om der borte ikke hun er en samiskbakgrunn. => ikks sett inn pro hvis ext ... selv om det der borte ikke er en mikrofon. = anna setn ... som der borte er en mikrofon = rel setn echo Doppe ii leat oahpaheaddji. | apertium -d. sme-nob Der borte ikke det er en lærer. => Der borte er det ikke en lærer vcop<SV><@-FMAINV><indic><pres><impers><NC><esubj>{^være<vblex><pres>$}$ !tx3: <def-cat n="lSUBJ"> <cat-item tags="SN.@←SUBJ.*"/> <cat-item tags="SN.@←SUBJext.*"/> </def-cat> med i følgende 3 regler: PR ILL FV-esubj lSUBJ sentenceborder FV lSUBJ PR ILL FV-esubj lSUBJ <def-cat n="maybe-lSUBJ"> med i 12 regler <cat-item lemma="unknown" tags="unknown"/> <cat-item tags="SN.←hab→.*"/> <!-- HAB or not here? --> <cat-item tags="SV.@←SUBJ.*"/> <cat-item tags="SN.@←SUBJ.*"/> <cat-item tags="SA.@←SUBJ.*"/> <!-- also @SUBJ→, for avoiding pro-insertion with @+FAUXV @SUBJ→ @-FMAINV --> <cat-item tags="SV.@SUBJ→.*"/> <cat-item tags="SN.@SUBJ→.*"/> <cat-item tags="SA.@SUBJ→.*"/> <cat-item tags="SN.@X.*"/> </def-cat> med i følgende regler. FV lemq maybe-lSUBJ V2-trigger FV maybe-lSUBJ PR V2-trigger FV maybe-lSUBJ FV IV maybe-lSUBJ V2-trigger FV IV maybe-lSUBJ PR V2-trigger FV IV maybe-lSUBJ PR.ADVLr SN.@P← FV IV maybe-←SUBJ CS adv-FV.neg maybe-lSUBJ IV CS adv-FV.neg maybe-lSUBJ ADVL IV PR ILL FV-esubj adv-lADVL lSUBJ <def-cat n="maybe-lSUBJ"> med i 12 regler <cat-item lemma="unknown" tags="unknown"/> <cat-item tags="SN.←hab→.*"/> <!-- HAB or not here? --> <cat-item tags="SV.@←SUBJ.*"/> <cat-item tags="SN.@←SUBJ.*"/> <cat-item tags="SA.@←SUBJ.*"/> <!-- also @SUBJ→, for avoiding pro-insertion with @+FAUXV @SUBJ→ @-FMAINV --> <cat-item tags="SV.@SUBJ→.*"/> <cat-item tags="SN.@SUBJ→.*"/> <cat-item tags="SA.@SUBJ→.*"/> <cat-item tags="SN.@X.*"/> </def-cat>
Alternative løsninger:
1 a. sette inn @<SUBJext både for hab og ikkje-hab b. sette inn "det" ved @<SUBJext, når hab-variabelen er null 1b a. sette inn @<SUBJext både for hab og ikkje-hab, <esubj> for leat/mannat/saddat b. sette inn "det" ved @<SUBJext, når hab-variabelen er null OG verbet er tagga <esubj> 2 a. ikkje inn @<SUBJext for hab, berre for ikkje-hab b. sette inn "det" ved @<SUBJext (alltid) 3 Ikkje introdusere @<SUBJext i det heile tatt men <ext> 4 noko slags tagging av verbet, basert både på høgrekontekst og venstre
Bisetninger med "om"
__Lene__arbeider videre med dette
- "mun dieđán, ahte son hupmá dávja journalisttaide."
- jeg vet, at h_n snakker ofte til journalistene. ==> ofte snakker
- Jeg spør om h_n snakker ofte til journalistene. ==> ofte snakker
- jeg vet, at h_n snakker ofte til journalistene. ==> ofte snakker
Fund n v mun jearan boahtágo son dávjá jeg spør om han ofte kommer VP V-go subj ... VP om subj V ... mun in dieđe: boahtágo mun in dieđe, boahtágo Harald Jeg vet ikke, kommer Harald legg til "om" i t4 Mii áigguimet iskat vuosttažettiin leago dán sáddaga obage vejolaš čađahit. Vi skulle undersøke først OM er det denne sendinga ganske mulig gjennomføre. Vi skulle undersøke først OM det er mulig å gjennomføre denne sendinga. Mii áigguimet iskat vuosttažettiin leago vejolaš oađđit. Vi skulle undersøke først er det mulig å sove. => Vi skulle undersøke først OM det er mulig å sove. 1. dette er ei leddsetning 2. om e Mii áigguimet iskat vuosttažettiin leago dávjá vejolaš oađđit. Vi skulle undersøke først er det ofte mulig å sove. Vi skulle undersøke først OM det ofte ER mulig å sove.
kondisjonalis-regler
Se på denne, her skulle vi ikke få to "kunne" i
Sáhtášii go son dat, jos livčče sámi mánáidgárdefálaldat buohkaide lasihit sámi giellageavaheddjiid?
- Prpers kunne Kunne montro det, hvis det kunne være et samisk barnehagetilbud for alle øke samiske språkbrukere?
<def-list n="cond-NIL-verbs"> <list-item v="berret"/> <list-item v="galgat"/> <list-item v="soaitit"/> <list-item v="veadjit"/> <list-item v="dáidit"/> <list-item v="máhttit"/> <list-item v="áigut"/> <list-item v="sáhttit"/> </def-list>