Нейросетевой метод семантического разбора текста в глобальной информационной сети (на примере казахского языка)
Full Name of the work head: Калимолдаев М.Н.
Исполнители проекта: Утепбергенов И.Т.*
: Институт проблем информатики и управления
Inventory number: 0213РК00676
Registration number: 0112РК02224
Keywords: Нейронные сети*Автоматическая структуризация текста*Казахский язык*Семантический разбор текста*
Разработан комплекс программ автоматического, полуавтоматического разбора текстов на казахском языке. Рассмотрен альтернативный подход автоматической структуризации текста. Исследован алгоритм самореферентной, реккурентной нейронной сети, предназначенной для "глубокого обучения" иерархическим паттернам казахского языка (сочетаниям букв, слов, фраз) путем попеременного сжатия и растяжения персептивного поля. Объем казахскоязычных ресурсов растет, сообщения, оставленные пользователями сети, содержат грамматические ошибки, иносказания, языковые анахронизмы. Возможности применения рекуррентных моделей ограничены вычислительными мощностями. Изучен один из алгоритмов применительно к структуризации больших потоков символьной информации. *