Разработка систем сбора, обработки и анализа больших данных (Big Data) с использованием облачных технологий для повышения эффективности труда и принятия решений
Full Name of the work head: Жумадилов Ж.Ш.
Исполнители проекта: Бекетаев К.Б., Есенбаев Ж.А., Махамбетов О.Е.
: National Laboratory Astana
Inventory number: 0216РК01068
Registration number: 0115РК02473
Keywords: Распознавание жестового языка*Корпус*Полуавтоматический аннотационный инструмент*Поиск аудиоданных
Усовершенствован интерфейс корпуса казахского жестового языка: добавлены страница для поиска выражений и дактиля по словам, раздел с исходными кодами для обработки видеоданных. Разработан специализированный полуавтоматический аннотационный инструмент с расширенным функционалом, позволяющий автоматически аннотировать мануальные признаки жестового языка путем нахождения и классификации кистей рук. В рамках решения задачи автоматического анализа тональности текстов сравнены и оценены алгоритмы машинного обучения и способы векторного представления текстовых данных. Разработана система поиска аудиоданных по ключевым словам, способная осуществлять поиск по фонемам и созвучным словам, если искомые термины отсутствуют в словаре системы. Проведены эксперименты по морфологической предобработке данных на языке источника.