Проектирование комплекса сбора и обработки Интернет-данных (поисковая система)
Full Name of the work head: Махамбетов О.Е.
Исполнители проекта: Есенбаев Ж.Датбаев Ж.
: Nazarbayev University Research and Innovation System
Inventory number: 0212РК02268
Registration number: 0111РК00361
Keywords: Казнет, Интернет, Рекомендательные системы, Факторизация неотрицательной матрицы,
Проведен сбор данных из различных источников: ак Amazon, eBay, news.google.com, Twitter, Tencent Weibo. В частности, из социальных сетей были извлечены общедоступные данные из профайлов пользователей. Для сравнительного анализа выбраны и реализованы базовые алгоритмы. Предложено 2 новых алгоритма для рекомендации информации: алгоритм факторизации взвешенных разреженных неотрицательных матриц, алгоритм глубокого распространения. Проведены эксперименты и сравнительные анализы над базовыми и предложенными алгоритмами, по результатам которых предложенные алгоритмы оказались лучше. Собраны акустические данные, содержащие слова, фразы, предложения и короткие рассказы. Все собранные данные были структурированы в отдельную базу данных - Kazspeech.