Разработка систем сбора, обработки и анализа больших данных (Big Data) с использованием облачных технологий для повышения эффективности труда и принятия решений
Руководитель проекта: Жумадилов Ж.Ш.
Исполнители проекта: Бекетаев К.Б., Есенбаев Ж.А., Махамбетов О.Е.
Организация: National Laboratory Astana
Инвентарный номер: 0216РК01068
Регистрационный номер: 0115РК02473
Ключевые слова: Распознавание жестового языка*Корпус*Полуавтоматический аннотационный инструмент*Поиск аудиоданных
Усовершенствован интерфейс корпуса казахского жестового языка: добавлены страница для поиска выражений и дактиля по словам, раздел с исходными кодами для обработки видеоданных. Разработан специализированный полуавтоматический аннотационный инструмент с расширенным функционалом, позволяющий автоматически аннотировать мануальные признаки жестового языка путем нахождения и классификации кистей рук. В рамках решения задачи автоматического анализа тональности текстов сравнены и оценены алгоритмы машинного обучения и способы векторного представления текстовых данных. Разработана система поиска аудиоданных по ключевым словам, способная осуществлять поиск по фонемам и созвучным словам, если искомые термины отсутствуют в словаре системы. Проведены эксперименты по морфологической предобработке данных на языке источника.