Руководитель проекта: Мусабаев Рустам Рафикович
Исполнители проекта:
Организация: РГП на ПХВ "Институт информационных и вычислительных технологий" МОН РК
Инвентарный номер: 0322РК00614
Регистрационный номер: 0121РК00396
Ключевые слова: Big Data,высокопроизводительные вычисления,дистрибутивная семантика,кластерный анализ,компьютерная лингвистика,обучение без учителя
Разработан эффективный алгоритм кластеризации смыслов слов и документов с использованием контекстуализированных представлений. Получены результаты автоматического комбинаторного анализа сочетаемости различных смысловых категорий в рамках документов анализируемого текстового корпуса в режиме самообучения. Разработаны методы анализа динамических характеристик смысловых категорий в рамках анализируемого большого текстового корпуса.