Нейросетевой метод семантического разбора текста в глобальной информационной сети (на примере казахского языка)
Full Name of the work head: Калимолдаев М.Н.
Исполнители проекта: Утепбергенов И.Т.*
: Институт информационных и вычислительных технологий
Inventory number: 0214РК01098
Registration number: 0112РК02224
Keywords: казахский язык*семантический разбор текста*нейросетевой метод*семантическая карта слов*
Разработаны методы статистического анализа корпуса казахских текстов. Сформирована семантическая карта слов казахского языка. Построены вероятностно-статистические модели, отражающие семантическую структуру казахского языка на уровне лексических парадигм, и синтаксическая языковая модель казахского языка в рамках грамматики связей. Представлены методы предобработки текстовой информации на казахском языке и статистической обработки текстов на казахском языке, а также метод тематической категоризации текста на основе объединения семантических карт и иерархической агломеративной кластеризации и метод улучшения качества поисковой выдачи. *