Разработка интерактивного портала по оптическому распознаванию текста на государственном языке с использованием высокопроизводительных вычислений
Full Name of the work head: Адилов Ж.М.
Исполнители проекта: Турсунов И.Э.*
: Казахский национальный технический университет им. К.И.Сатпаева
Inventory number: 0213РК02644
Registration number: 0112РК02007
Keywords: распознавание текстов*оптическое распознавание символов*распознавание казахского текста*морфосемантический анализатор*электронные словари*
Разработан онлайн-сервис и создана информационная система оптического распознавания текста на государственном языке в виде портала с построением и использованием математических моделей, методов и программных комплексов и проведения синтаксического и смыслового анализа для повышения качества распознавания текста. Реализована параллельная обработка запросов web-сервиса на суперкомпьютере с помощью инструментов Microsoft HPC Pack SDK. В ходе тестирования и отладки финальной бета-версии веб-сервиса исправлены ошибки. Получена альфа-версия веб-сервиса по оптическому распознаванию символов и морфосемантическому анализу. Созданы электронные словари на основе книг "Казахско-русский словарь" К. Бектаева. Сформирована и отредактирована объединенная версия электронного словаря, содержащая в себе 44000 казахских слов. Проведены модернизация, тестирование и отладка модуля оптического распознавания текста на казахском языке с добавлением текстов плохого и нечеткого качества. Усовершенствован и дополнен морфо (семантический) анализатор. Спроектирован портал по распознаванию текста на государственном языке с помощью средств унифицированного языка моделирования UML.*