Разработка систем сбора, обработки и анализа больших данных (Big Data) с использованием облачных технологий для повышения эффективности труда и принятия решений
Жетекшінің аты-жөні, тегі: Бекетаев К. Б.
Work head: К. Б. Бекетаев, Ж. А. Есенбаев, О. Е. Махамбетов, А. О. Макажанов, К. А. Айтпаев, И. М. Сабыргалиев и др.
: National Laboratory Astana
Инвентарлық номер: 0217РК01674
Тіркелген номер: 0115РК02473
негізгі сөздер: машинный перевод*облачные технологии
Разработаны методы и алгоритмы анализа тональности текстов для казахско-русскоязычной среды с точностью 89,6 % для казахского языка и 88,4 % для русского языка; извлечения информации из аудиоданных на казахском и русском языках; гибридного машинного перевода. Качество перевода составляет 21,77 по метрике BLEU, что выше показателей аналогичных систем перевода. Облачная инфраструктура для сбора, обработки и анализа больших данных дополнена распределенной системой хранения, обеспечивающей файловый и блочный интерфейсы доступа к данным. Созданы прототип системы поиска, позволяющей осуществлять поиск по ключевым словам на казахском и русском языках в аудио и видеопотоке, прототип казахско-русского и русско-казахского переводчика с возможностью автоматического определения языка исходного текста, прототип системы анализа тональности текстов по 3-балльной шкале для казахско-русскоязычной среды.