Meeting_2013-11-11

Gøteborg-oppsummering

fyrste føredrag

  • bra
  • kvifor gjekk det bra?
  • kommunestyre-dømet fungerte bra
  • fst-gjennomgangen fungerte
  • diskuterte cg-analysen av "vi ville kaste stein" (ville som pret)
  • grammatikkontroll, svensk frå Lingsoft, sme frå oss (Francis)
  • begeistring etterpå

andre føredrag

  • ok

Lars Borin:

  • kan ikkje koma ei heil veke i desember
  • kan koma ei heil veke i februar
  • estarane ei heil veke i jan/feb - overlapp? ikkje heilt men delvis?
  • kan ein av programmerarane koma? manglande framgang med deepdict
  • ciprian om deepdict: han har laga demo, har stoppa ved lemmatiseringa
    • kva slags lemma ved dynamisk samansetjing?
    • kva slags lemma ved avleiing? v -> n, v som lemma istf n
hus+N+Neu+Sg+Cmp#bygge+V+Der/ing+N+Fem+Sg

kva slags lemma ved dynamisk samansetjing?

Sletta alle taggar før +Cmp og # (inkl. +Cmp)

=> hus#bygge+V+Der/ing+N+Fem+Sg

kva slags lemma ved avleiing? v -> n, v som lemma istf n

transformera v+lemma + derivasjon til n-lemma:

  1. . trekkja ut alle der-strengar:
  2. . generera grunnform (derivert lemma)
  3. . snu
  4. . komponer
hus#bygge+V+Der/ing+N+Fem+Sg
bygge+V+Der/ing+N+Fem+Sg -> bygging+N+Fem+Sg

=> hus#bygging+N+Fem+Sg
1. $[ +Der/ing +N ? +Sg ] ; -> ny fst med berre Der/ing
2. projiser +N ... +Sg på nedsida

bygge+V+Der/ing+N:bygging

bygge+V+Der/ing+N...+Sg:bygging+N...+Sg
ny regel projisering

3. snu derfst

4. derfst .o. nob.fst

bygging+N...+Sg:bygge+V+Der/ing+N .o. bygge+V+Der/ing+N...:bygging

=>

bygging+N...+Sg:bygging

Stor eng - glyf basert på n eller N?

  • no er det éin eng (eitt kodepunkt) som blir brukt for to ulike typografiske engar, ein N-lik og ein n-lik.
  • fontar varierer etter kva form dei bruker
  • ingen av formene er akseptable for alle, for kvart språk er det anten eller
  • ei kløyving i ulike kodar for ulike versjonar av 'eng' er den einaste fungerande løysinga - spørsmålet er berre kven som skal endra seg
  • kløyvinga vil føra til store kostnader for dei som må endra seg
  • eit mogleg prinsipp: den eldste forma står, den andre får ein ny kode
  • uansett problematisk, fordi kostnader og storleikstilhøve lett gjer at konflikten kan tolkast inn i ulike ramer basert på gamle historiske tilhøve
  • difor best å senda heile historia opp til politikarane, og be dei avgjera

Michael: "I agree that the N-form, not the n-form capital eng should be the default. It is historically the older form."

Språk n/N Talarar Land
Afrikanske språk: n - -
Bari n 750 000 Sør-Sudan, Uganda, Den Demokratiske Republikken Kongo
Bemba n 3 600 000 Zambia
Dinka n 1 400 000 Sør-Sudan
Ewe n 3 600 000 Ghana, Togo
Fula n 25 000 000 Benin, Burkina Faso, Chad, Gambia, Guinea, Kamerun, Mali, Mauretania, Niger, Nigeria, Senegal, den Sentral-Afrikanske Republikken, Sierra Leone, Sudan, Togo
Ganda n 1 400 000 Uganda
Mandingespråk: n - -
kassonke n 1 600 000 Mali, Senegal
mandinka n 1 300 000 Gambia, Senegal
kita maninka n 450 000 Mali
jahanka n 30 000 Guinea
marka n 230 000 Burkina Faso
bambara–dyula n 4 000 000 Burkina Faso, Elfenbeinskysten, Mali
aust-maninka n 3 300 000 Guinea, Mali, Liberia, Senegal, Sierra Leone, Elfenbeinskysten
bolon n 23 000 Burkina Faso
sinikere n 6 000 Burkina Faso
Songhayspråk: n - -
zarma n 2 500 000 Niger
koyraboro senni n 400 000 Mali
koyra chiini n 200 000 Mali
nordleg songhay n ? Niger
Tonga n 1 100 000 Zambia, Zimbabwe, Mozambique
Wolof n 4 200 000 Senegal, Gambia, Mauretania
Amerikanske språk: ? - -
O'odham ? 9 750 USA, Mexico
Australske språk: ? - -
Bandjalang ? 100 Australia
Yolngu ? ? Australia
Samiske språk: N - -
enaresamisk N 300 Finland
lulesamisk N 1 000 Noreg, Sverige
nordsamisk N 21 000 Finland, Noreg
skoltesamisk N 400 Finland

Kjelde: engelsk wikipedia

Neste steg:

  • skriva ein rapport til UD/FAD/Sametinget, og be dei avklara på politisk og multilateralt nivå kven som skal endra seg.

Spørsmål:

  • skal vi ha med estimat over eksisterande korpusstorleik? Programvare som må endrast?