140822
Meeting, AKU Oahpa, 22.8.2014
Present: Heli, Jaska, Trond
Agenda
- Status
- Participants
- Aika
Status
Venäjän sanat
- Most common 1500 N + 500 V + 500 A in Russian (Trond)
Dokumentaatio
- Correct http://oahpa.no/addlang/index.rus.html - not done
- Burjaatin oahpa tehty (testing.oahpa.no/bxr_oahpa) -- Burjaatin sivu TODO: ( Trond)
Osallistujat
- Kutsut lähetetty
- Käyttäjänimet saatu, Trond tekee tilit
- Monille: Windows + EditPadLite + TortoiseSVN
- Kaikki: Katso näitä.
- Trond: Tsekkaa dokumentaatio
- Kaikki: Katso näitä.
Kurssin nettisivu
- Mihin, ja kuka tekee? ... Silloin kun
- Aikamäärä: Keskiviikko 27.8.
- Nettipaikka: Sekä gt että AKU
Topics
- Methodologies for distributed cooperation on language technology
- What is Oahpa - the pedagogical philosophy
- What lingustic content to include - and how to add it
- Practical work
- Project planning
- ?How to join Oahpa development with language research
Course planning day by day
Preparing before the course
- Setting up user accounts, basic SVN.
Day 0:
- Preliminary course in Unix, svn, etc, for people not having done this before.
- All participants shall have checked out (at least) the ped catalogue and
- basic SVN course. What is it, how to update, check in, etc.
Monday:
Introduction
- Giellatekno overview (infrastructure, projects, tools, Oahpa) (Heli, Trond)
- Presentations by the participants about their languages and existing resources
- Methodologies for distributed cooperation on language technology
- If needed: Practical instruction divided into groups
- Group 1: For the local guru (Heli)
- Group 2: For the computer illiterate (Jack)
- Installing, general help (Trond)
- Group 1: For the local guru (Heli)
- If needed: Practical instruction divided into groups
Eventually
Tuesday:
Leksa
- The key role of Leksa in Oahpa (these are the words we use for different purposes)
- How to choose the vocabulary for Leksa. Textbook word lists, frequency dictionaries.
- How to choose the vocabulary for Leksa. Textbook word lists, frequency dictionaries.
- Creating word lists in csv format.
- Checking in new files and updating the existing ones.
- svn ci -> Heli updates the db -> online check.
Morfa-S
- Drafting the case/number and person/number/tense forms to be included (Individuals should have this all thought out before hand ... )
- Evaluating the fsts
- Setting up the infrastructure for the respective exercises
-
Homework by Thursday:
- think about the productive Morfa-C frames in your language - which cases, which verbs?
Wednesday:
Numra
- Evaluating existing Numras
- How to improve them:
- Learning how to correct automata
- Learning how to extend Numra to ordinal, date, clock.
- Learning how to correct automata
Leksa, Morfa-S
- Continuing work
Thursday:
- Setting up Morfa-S. Case list, possible additional menus.
- Writing Morfa-C frames.
- Extending Leksa: Place names. The names that are different in the indigenous language
Friday:
- General discussion
- New ideas, thoughts that have come up while implementing Oahpa for your language.
- Discussing how to integrate Oahpa in language courses. Presenting kursa
- New ideas, thoughts that have come up while implementing Oahpa for your language.
- Workshop: We write grant applications
- Background: Different groups plan to get funding
- We either do brainstorming or (if possible) work in groups on concrete proposals
- Background: Different groups plan to get funding
- Summing up and future work
- How to proceed with the development of your Oahpa.
Понедельник: Введение Обзор Giellatekno (инфраструктура, проекты, программные средства, Oahpa) (Хели, Трунд) Доклады участников курса об их языков и имеющихся ресурсов (учебники и другие учебные материалы, корпусы, языковые инструменты) Методологии распределенного сотрудничества в области технологии обработки естественных языков При необходимости: Практическая инструкция в группах Группа 1: Для "местного гуру" (Хели) Группа 2: Для неопытных пользователей компьютера (Джэк) Установка программ, общая помощь (Трунд) Если успеем до начнем практическую работу над программе Leksa. Вторник: Leksa Ключевая роль Leksa в Oahpa (это слова, которые мы используем для различных целей) Как выбрать словарь для Leksa. Списки слов в Учебниках, частотные словари. Создание списков слов в формате CSV. Создание списка семантических множеств по примеру. Создание лексикона имен существительных. Создание лексикона глаголов. Добавление новых файлов к SVN-дереву и обновление существующих файлов. Обычный поток работ: SVN commit -> Хели обновляет базу данных -> тестирование программы Leksa онлайн. Morfa-S Составление грамматической информации форм (падеж, число, лицо, время, вид и.т.д.) которые будут включены (Участники должны продумать эти до курса ...) Определение качества морфологического преобразователя. Настройка инфраструктуры для упражнений Morfa-S. Домашнее задание по четверг: Думать о производительных рамок для упражнений Morfa-C на Вашем языке - какие падежи, какие глаголы? Среда: практическая работа Numra Определение качества существующих модулей Numra Как улучшить их: Обучение, как исправить автоматы Обучение, как расширять Numra: порядковые числа, даты, время. Leksa, Morfa-S - продолжение работы Четверг: практическая работа Настройка Morfa-S. Список Case (падеж), возможные дополнительные меню. Создание рамок для Morfa-C. Расширение Leksa: Названия мест. Названия мест, которые отличаются в коренном языке. Пятница: Общая дискуссия Новые идеи, мысли, которые возникли в ходе реализации Oahpa для вашего языка. Обсуждение, как интегрировать Oahpa в языковых курсах. Представление сайта Kursa. Семинар: Мы пишем заявки на получение грантов Справочная информация: Различные группы планируют получить финансирование Мозговой штурм или (если это возможно) работать в группах над конкретными предложениями. Подведение итогов и будущая работа Как развивать и расширять вашего Oahpa.
Programmet
- Kommentarar frå Lene
- Korrekturlese russisk (Heli, Jaska)
- Sette opp program på gt (Trond) og Aku (Jaska)
Neste møte
29.8.2014 9: 30 Finsk tid