Разработка информационно-поискового тезауруса (с учетом морфологии казахского языка) в полнотекстовых базах данных по ИТ-технологиям
Full Name of the work head: Сыдыков Е.Б.
Исполнители проекта: Тусупов Д.А., Сагнаева С.К., Федотов А.М., Мурзин Ф.А., Батура Т.В., Самбетбаева М.А., Еримбетова А.С., Ахметова А.Ж., Бапанов А.А., Бакиева А.М.
: Евразийский национальный университет им. Л.Н.Гумилева
Inventory number: 0217РК01565
Registration number: 0115РК01422
Keywords: тезаурус
Разработан трехъязычный тезаурус предметной области \"Информационные технологии\", содержащий термины на русском, английском и казахском языках. Предложены алгоритм координатного индексирования текстов, который может быть применен для решения задач кластеризации и тематической классификации документов, алгоритм тематической классификации документов, методы определения степени близости предложений на естественном языке. Исследованы модели определения тем текстов на естественном языке. Реализован программный инструментарий для анализа текстов на естественном языке, включающий различные алгоритмы: определения степени близости предложений, построения графов по предложениям, вычисления весов слов, центральностей и других характеристик.