Конечные автоматы в морфологическом анализе 2024/2025

Авторы

Т. Б. Казакова

Г. А. Мороз

Введение

Данные материалы являются конспектом курса Т. Б. Казаковой и Г. А. Мороза ‘Конечные автоматы в морфологическом анализе’ 2024–2025. Данный курс предоставляет углубленное изучение применения конечных автоматов в морфологическом анализе. Конечные автоматы используются для моделирования морфологии языков, особенно малоресурсных. Курс охватывает основные этапы создания морфологического анализатора в системе lexd и twol, проверку его на корпусах, взвешивание трансдьюсера для дизамбигуации. В качестве иллюстративного материала будут использоваться лингвистические задачи и реальные примеры из практики преподавателей. В нашем курсе мы стараемся предложить стратегии компьютерного правилого моделирвания морфологических и морфонологически проблем, стараясь охватить явления интересные с точки зрения теоретической лингвистики.

В курсе будет 6 домашних заданий и экзамен. Все домашние задания имеют одинаковый вес. Экзамен весит 0.4. За курс предусмотрен автомат, если студента устраивает накопленная оценка.

Список использованных программ

```{shell}
lexd -V
```
lexd 1.3.5
```{shell}
hfst-twolc -V
```

hfst-twolc 0 (hfst 3.16.2)
Copyright (C) 2010 University of Helsinki,
License GPLv3: GNU GPL version 3 
<http://gnu.org/licenses/gpl.html>
This is free software: you are free to change and 
redistribute it.
There is NO WARRANTY, to the extent permitted by law.
```{shell}
cg3 -V
```
VISL CG-3 Disambiguator version 1.5.4.13898
Copyright (C) 2007-2025 GrammarSoft ApS. Licensed under GPLv3+
```{shell}
git -v
```
git version 2.43.0

Домашние задания

  • Ссылка на первое домашнее задание. Дедлайн: 27 февраля 23:59.
  • Ссылка на второе домашнее задание. Дедлайн: 2 апреля 23:59.
  • Ссылка на третье домашнее задание. Дедлайн: 29 мая 23:59.
  • Ссылка на четвертое домашнее задание. Дедлайн: 19 июня 23:59.