140822

Meeting, AKU Oahpa, 22.8.2014

Present: Heli, Jaska, Trond

Agenda

  • Status
  • Participants
  • Aika

Status

Venäjän sanat

  • Most common 1500 N + 500 V + 500 A in Russian (Trond)

Dokumentaatio

Osallistujat

  • Kutsut lähetetty
  • Käyttäjänimet saatu, Trond tekee tilit
  • Monille: Windows + EditPadLite + TortoiseSVN

Kurssin nettisivu

  • Mihin, ja kuka tekee? ... Silloin kun
  • Aikamäärä: Keskiviikko 27.8.
  • Nettipaikka: Sekä gt että AKU

Topics

  1. Methodologies for distributed cooperation on language technology
  2. What is Oahpa - the pedagogical philosophy
  3. What lingustic content to include - and how to add it
  4. Practical work
  5. Project planning
  1. ?How to join Oahpa development with language research

Course planning day by day

Preparing before the course

  • Setting up user accounts, basic SVN.

Day 0:

  • Preliminary course in Unix, svn, etc, for people not having done this before.
  • All participants shall have checked out (at least) the ped catalogue and a working version of their own fst on their own machine (cf. the getting started page.)
  • basic SVN course. What is it, how to update, check in, etc.

Monday:

Introduction

  • Giellatekno overview (infrastructure, projects, tools, Oahpa) (Heli, Trond)
  • Presentations by the participants about their languages and existing resources (textbooks a.o. teaching materials, corpora, language technology tools)
  • Methodologies for distributed cooperation on language technology
    • If needed: Practical instruction divided into groups
      • Group 1: For the local guru (Heli)
      • Group 2: For the computer illiterate (Jack)
      • Installing, general help (Trond)

Eventually

Start with Leksa

Tuesday:

Leksa

  • The key role of Leksa in Oahpa (these are the words we use for different purposes)
    • How to choose the vocabulary for Leksa. Textbook word lists, frequency dictionaries.
  • Creating word lists in csv format.
  • Checking in new files and updating the existing ones.
  • svn ci -> Heli updates the db -> online check.

Morfa-S

  • Drafting the case/number and person/number/tense forms to be included (Individuals should have this all thought out before hand ... )
  • Evaluating the fsts
  • Setting up the infrastructure for the respective exercises
  • Homework by Thursday:
    • think about the productive Morfa-C frames in your language - which cases, which verbs?

Wednesday:

hands-on

Numra

  • Evaluating existing Numras
  • How to improve them:
    • Learning how to correct automata
    • Learning how to extend Numra to ordinal, date, clock.

Leksa, Morfa-S

  • Continuing work

Thursday:

hands-on

  • Setting up Morfa-S. Case list, possible additional menus.
  • Writing Morfa-C frames.
  • Extending Leksa: Place names. The names that are different in the indigenous language

Friday:

  • General discussion
    • New ideas, thoughts that have come up while implementing Oahpa for your language.
    • Discussing how to integrate Oahpa in language courses. Presenting kursa
  • Workshop: We write grant applications
    • Background: Different groups plan to get funding
    • We either do brainstorming or (if possible) work in groups on concrete proposals
  • Summing up and future work
    • How to proceed with the development of your Oahpa.

Понедельник: 
Введение 

Обзор Giellatekno (инфраструктура, проекты, программные средства, Oahpa) (Хели, Трунд) 
Доклады участников курса об их языков и имеющихся ресурсов (учебники и другие учебные материалы, корпусы, языковые инструменты) 
Методологии распределенного сотрудничества в области технологии обработки естественных языков 
При необходимости: Практическая инструкция в группах 
Группа 1: Для "местного гуру" (Хели) 
Группа 2: Для неопытных пользователей компьютера (Джэк) 
Установка программ, общая помощь (Трунд) 
Если успеем до начнем практическую работу над программе Leksa. 

Вторник: 
Leksa 

Ключевая роль Leksa в Oahpa (это слова, которые мы используем для различных целей) 
Как выбрать словарь для Leksa. Списки слов в Учебниках, частотные словари. 
Создание списков слов в формате CSV. 
Создание списка семантических множеств по примеру.
Создание лексикона имен существительных. 
Создание лексикона глаголов. 
Добавление новых файлов к SVN-дереву и обновление существующих файлов. 
Обычный поток работ: SVN commit -> Хели обновляет базу данных -> тестирование программы Leksa онлайн. 

Morfa-S 

Составление грамматической информации форм (падеж, число, лицо, время, вид и.т.д.) которые будут включены (Участники должны продумать эти до курса ...) 
Определение качества морфологического преобразователя. 
Настройка инфраструктуры для упражнений Morfa-S.
Домашнее задание по четверг: 
Думать о производительных рамок для упражнений Morfa-C на Вашем языке - какие падежи, какие глаголы? 

Среда: 
практическая работа 

Numra 

Определение качества существующих модулей Numra 
Как улучшить их: 
Обучение, как исправить автоматы 
Обучение, как расширять Numra: порядковые числа, даты, время. 

Leksa, Morfa-S - продолжение работы 

Четверг: 
практическая работа 

Настройка Morfa-S. Список Case (падеж), возможные дополнительные меню. 
Создание рамок для Morfa-C. 
Расширение Leksa: Названия мест. Названия мест, которые отличаются в коренном языке. 

Пятница: 

Общая дискуссия 
Новые идеи, мысли, которые возникли в ходе реализации Oahpa для вашего языка. 
Обсуждение, как интегрировать Oahpa в языковых курсах. Представление сайта Kursa. 
Семинар: Мы пишем заявки на получение грантов 
Справочная информация: Различные группы планируют получить финансирование 
Мозговой штурм или (если это возможно) работать в группах над конкретными предложениями. 
Подведение итогов и будущая работа 
Как развивать и расширять вашего Oahpa.

Programmet

  • Kommentarar frå Lene
  • Korrekturlese russisk (Heli, Jaska)
  • Sette opp program på gt (Trond) og Aku (Jaska)

Neste møte

29.8.2014 9: 30 Finsk tid