110827
Реферат разговора
Агенда
- Проект словаря
- xml-репрезентация словаря
- автомат -- корректировка
- компютерная интеграция в программу как StarDict и.д.
- Следующая встреча
проект словаря:
- xml-репрезентатция словаря
- автомат -- корректировка!
- компьютерная интеграция в программу как StarDict и.д.
xml-репрезентация словаря
Надо быть раппорт дйя каждого члена реча (файла)
новый формат:контлекс + русский словарь и словарь Джека (!)
<eg> <lg> <l contlex="Verb3" pos="v">авзыны</l> </lg> <stem>авз</stem> <e> <mg MNo="1"> <m> <head val="1" /> <t lang="ru" pos="">орать, вопить, выть</t> </m> </mg> <mg MNo="2"> <m> <head val="1" /> <t lang="ru" pos="">реветь, рычать, рыкать, рявкать</t> </m> ; <x der="ігтыр"> <kv>авзігтыр <CmPos>(деепр.)</CmPos> уськӧдчыны </kv> <t lang="ru" pos="">броситься рыча</t> </x> </mg> <mg MNo="3"> <m> <head val="1" /> <t lang="ru" pos="">выть, завывать</t> </m> ; <x> <kv>тӧв авзіс</kv> <t lang="ru" pos="">ветер завывал</t> </x> </mg> <mg MNo="4"> <m> <head val="1" /> <t lang="ru" pos="">гавкать, тявкать</t> </m> ; <x der="ігтырйи"> <kv>пон авзігтырйи <CmPos>(деепр.)</CmPos> уськӧдчис вӧрӧ</kv> <stRef cx="nom" lang="kv" pos="n">понй</stRef> <stRef der="ігтырйи" lang="kv" pos="v">авзыны</stRef> <stRef lang="kv" pos="v" predpx="3sg" tx="pretI">уськӧдчыны</stRef> <stRef cx="ill" lang="kv" pos="n">вӧр</stRef> <t lang="ru" pos="">собака, гавкая, бросилась в лес</t> </x> </mg> </e> </eg>
лексикон:информация о языке (коми)
Lexc-lexicon file
<entry id="авзыны_V"> <lemma>авзыны</lemma> <=== <stem>авз</stem> <=== <contlex>Verb3</contlex> <=== <pos>V</pos> </entry>
unified dictionary file (старый формат:квру + Джек)
<e id="авзыны_V"> <mg lang="rus" MNo="2"> <m> <head field="" iter="" range="" register="" sns="" val="1"> <range>диал.</range> </head> <t lang="ru" pos="v">разглагольствовать,</t> <t lang="ru" pos="phrase-v">говорить много;</t> </m> <assoc MNo="1" type="also">лавгыны</assoc> </mg> <mg lang="eng"> <choice> <variant>yelp</variant> <variant>bellow</variant> <variant>howl</variant> </choice> </eng> <mg lang="fin"> <choice> <variant>parkua</variant> <variant>karjua</variant> <variant>ulvoa</variant> </choice> </mg> </e>
автомат -- корректировка!
Рессурсы в Сыктывкаре? -- в Хельсинки и Тромсӧ, ...
сейчас только 30% словаря в анализаторе!
Тест для каждого слова!
Ситуация по глаголам. Хорошо (?)
РАБОТА:
- Марина работает над глаголами и раппортует
- потом, Джек и Трун корректируют автомат
Автомат
Новая структура генератора:
N+Number+Case N+Number+Possessive+Case N+Number+Case+Possessive N+Number+Possessive?+Apr+Case+Possessive?
л =
авзыны V+Inf авзыны авзыны V+Ind+Prs+Sg1 авза авзыны V+Ind+Prs+Sg2 авзан авзыны V+Ind+Prs+Sg3 авзӧ авзыны V+Ind+Prs+Pl1 авзам авзамӧ авзамӧй авзыны V+Ind+Prs+Pl2 авзад авзанныд авзыны V+Ind+Prs+Pl3 авзӧны авзыны V+Ind+Prt1+Sg1 авзі авзыны V+Ind+Prt1+Sg2 авзін авзыны V+Ind+Prt1+Sg3 авзі авзіс авзыны V+Ind+Prt1+Pl1 авзім авзімӧ авзімӧй авзыны V+Ind+Prt1+Pl2 авзід авзінныд авзыны V+Ind+Prt1+Pl3 авзіны авзісны авзыны V+Ind+Prt2+Sg1 авзӧма авзыны V+Ind+Prt2+Sg2 авзӧмыд авзыны V+Ind+Prt2+Sg3 авзӧма ==> авзі авзіс авзыны V+Ind+Prt2+Pl1 авзӧмаӧсь авзыны V+Ind+Prt2+Pl2 авзӧмныд авзӧмныдӧсь авзыны V+Ind+Prt2+Pl3 авзӧмаӧсь авзӧмны авзыны V+Ind+Fut+Sg1 авза авзыны V+Ind+Fut+Sg2 авзан авзыны V+Ind+Fut+Sg3 авзас авзыны V+Ind+Fut+Pl1 авзам авзамӧ авзамӧй авзыны V+Ind+Fut+Pl2 авзад авзанныд авзыны V+Ind+Fut+Pl3 авзасны
абажур: абажур+N+Sg+Nom
абажур N+Sg+Nom абажур абажур N+Sg+Gen абажурлӧн абажур N+Sg+Acc абажур абажурӧс абажур N+Sg+Abl абажурлысь абажур N+Sg+Dat абажурлы абажур N+Sg+Cns абажурла абажур N+Sg+Ill абажурӧ абажур N+Sg+Ill+PxSg1 абажурам ...
компютерная интеграция в программу как StarDict и.д.
- Дэадлайн?
- коми-фински: 4000 глаголов
- коми-русски: 11000 глаголов
Следующая встреча
3 Сентября, суббота 11.00 Msk