Разработка информационно-поискового тезауруса (с учетом морфологии казахского языка) в полнотекстовых базах данных по ИТ-технологиям
Жетекшінің аты-жөні, тегі: Сыдыков Е.Б.
Work head: Тусупов Д.А., Сагнаева С.К., Федотов А.М., Мурзин Ф.А., Батура Т.В., Самбетбаева М.А., Еримбетова А.С., Ахметова А.Ж., Бапанов А.А., Бакиева А.М.
: Евразийский национальный университет им. Л.Н.Гумилева
Инвентарлық номер: 0217РК01565
Тіркелген номер: 0115РК01422
негізгі сөздер: тезаурус
Разработан трехъязычный тезаурус предметной области \"Информационные технологии\", содержащий термины на русском, английском и казахском языках. Предложены алгоритм координатного индексирования текстов, который может быть применен для решения задач кластеризации и тематической классификации документов, алгоритм тематической классификации документов, методы определения степени близости предложений на естественном языке. Исследованы модели определения тем текстов на естественном языке. Реализован программный инструментарий для анализа текстов на естественном языке, включающий различные алгоритмы: определения степени близости предложений, построения графов по предложениям, вычисления весов слов, центральностей и других характеристик.