Разработка свободной/открытой системы машинного перевода с казахского языка на английский и русский языки (и обратно) на базе платформы Apertium
Руководитель проекта: Кыдырбекулы А.Б.
Исполнители проекта: Тукеев У.А., Рахимова Д.Р., Жуманов Ж.М. и др.
Организация: Научно-исследовательский институт математики и механики при КазНУ
Инвентарный номер: 0217РК01208
Регистрационный номер: 0115РК00778
Ключевые слова: Автоматический перевод
Созданы лингвистические словари и правила для машинного перевода англо-казахской и казахско-русской пар языков. Разработана модифицированная версия программного обеспечения для поиска и формирования параллельных корпусов англо-казахской и казахско-русской пар языков, отличающаяся учетом особенностей грамматики казахского и русского языков. Предложена автоматизированная технология сборки параллельных корпусов, интегрирующая открытые инструментарии системы Апертиум. Представлены новые паттерны (шаблоны) распознавания для различных классов имен собственных на основе аппарата регулярных выражений. Выполнена адаптация модели максимальной энтропии для определения имен собственных, непокрываемых паттернами, для англо-казахской и казахско-русской пар языков с использованием корпусной технологии.