110827
Реферат разговора
Агенда
- Проект словаря
- xml-репрезентация словаря
- автомат -- корректировка
- компютерная интеграция в программу как StarDict и.д.
- Следующая встреча
проект словаря:
- xml-репрезентатция словаря
- автомат -- корректировка!
- компьютерная интеграция в программу как StarDict и.д.
xml-репрезентация словаря
Надо быть раппорт дйя каждого члена реча (файла)
новый формат:контлекс + русский словарь и словарь Джека (!)
<eg>
<lg> <l contlex="Verb3" pos="v">авзыны</l> </lg>
<stem>авз</stem>
<e>
<mg MNo="1"> <m> <head val="1" />
<t lang="ru" pos="">орать, вопить, выть</t> </m> </mg>
<mg MNo="2">
<m> <head val="1" />
<t lang="ru" pos="">реветь, рычать, рыкать, рявкать</t> </m>
; <x der="ігтыр">
<kv>авзігтыр
<CmPos>(деепр.)</CmPos> уськӧдчыны
</kv>
<t lang="ru" pos="">броситься рыча</t> </x> </mg>
<mg MNo="3">
<m> <head val="1" /> <t lang="ru" pos="">выть, завывать</t> </m>
;
<x> <kv>тӧв авзіс</kv> <t lang="ru" pos="">ветер завывал</t> </x>
</mg>
<mg MNo="4">
<m> <head val="1" />
<t lang="ru" pos="">гавкать, тявкать</t>
</m>
;
<x der="ігтырйи">
<kv>пон авзігтырйи <CmPos>(деепр.)</CmPos> уськӧдчис вӧрӧ</kv>
<stRef cx="nom" lang="kv" pos="n">понй</stRef>
<stRef der="ігтырйи" lang="kv" pos="v">авзыны</stRef>
<stRef lang="kv" pos="v" predpx="3sg" tx="pretI">уськӧдчыны</stRef>
<stRef cx="ill" lang="kv" pos="n">вӧр</stRef>
<t lang="ru" pos="">собака, гавкая, бросилась в лес</t>
</x>
</mg>
</e>
</eg>
лексикон:информация о языке (коми)
Lexc-lexicon file
<entry id="авзыны_V">
<lemma>авзыны</lemma> <===
<stem>авз</stem> <===
<contlex>Verb3</contlex> <===
<pos>V</pos>
</entry>
unified dictionary file (старый формат:квру + Джек)
<e id="авзыны_V">
<mg lang="rus" MNo="2">
<m>
<head field="" iter="" range="" register="" sns="" val="1">
<range>диал.</range>
</head>
<t lang="ru" pos="v">разглагольствовать,</t>
<t lang="ru" pos="phrase-v">говорить много;</t>
</m>
<assoc MNo="1" type="also">лавгыны</assoc>
</mg>
<mg lang="eng">
<choice>
<variant>yelp</variant>
<variant>bellow</variant>
<variant>howl</variant>
</choice>
</eng>
<mg lang="fin">
<choice>
<variant>parkua</variant>
<variant>karjua</variant>
<variant>ulvoa</variant>
</choice>
</mg>
</e>
автомат -- корректировка!
Рессурсы в Сыктывкаре? -- в Хельсинки и Тромсӧ, ...
сейчас только 30% словаря в анализаторе!
Тест для каждого слова!
Ситуация по глаголам. Хорошо (?)
РАБОТА:
- Марина работает над глаголами и раппортует
- потом, Джек и Трун корректируют автомат
Автомат
Новая структура генератора:
N+Number+Case N+Number+Possessive+Case N+Number+Case+Possessive N+Number+Possessive?+Apr+Case+Possessive?
л =
авзыны V+Inf авзыны авзыны V+Ind+Prs+Sg1 авза авзыны V+Ind+Prs+Sg2 авзан авзыны V+Ind+Prs+Sg3 авзӧ авзыны V+Ind+Prs+Pl1 авзам авзамӧ авзамӧй авзыны V+Ind+Prs+Pl2 авзад авзанныд авзыны V+Ind+Prs+Pl3 авзӧны авзыны V+Ind+Prt1+Sg1 авзі авзыны V+Ind+Prt1+Sg2 авзін авзыны V+Ind+Prt1+Sg3 авзі авзіс авзыны V+Ind+Prt1+Pl1 авзім авзімӧ авзімӧй авзыны V+Ind+Prt1+Pl2 авзід авзінныд авзыны V+Ind+Prt1+Pl3 авзіны авзісны авзыны V+Ind+Prt2+Sg1 авзӧма авзыны V+Ind+Prt2+Sg2 авзӧмыд авзыны V+Ind+Prt2+Sg3 авзӧма ==> авзі авзіс авзыны V+Ind+Prt2+Pl1 авзӧмаӧсь авзыны V+Ind+Prt2+Pl2 авзӧмныд авзӧмныдӧсь авзыны V+Ind+Prt2+Pl3 авзӧмаӧсь авзӧмны авзыны V+Ind+Fut+Sg1 авза авзыны V+Ind+Fut+Sg2 авзан авзыны V+Ind+Fut+Sg3 авзас авзыны V+Ind+Fut+Pl1 авзам авзамӧ авзамӧй авзыны V+Ind+Fut+Pl2 авзад авзанныд авзыны V+Ind+Fut+Pl3 авзасны
абажур: абажур+N+Sg+Nom
абажур N+Sg+Nom абажур абажур N+Sg+Gen абажурлӧн абажур N+Sg+Acc абажур абажурӧс абажур N+Sg+Abl абажурлысь абажур N+Sg+Dat абажурлы абажур N+Sg+Cns абажурла абажур N+Sg+Ill абажурӧ абажур N+Sg+Ill+PxSg1 абажурам ...
компютерная интеграция в программу как StarDict и.д.
- Дэадлайн?
Сентябр Декабр
- коми-фински: 4000 глаголов
- коми-русски: 11000 глаголов
Следующая встреча
3 Сентября, суббота 11.00 Msk

