Новости науки

Разработана новая технология высокоточного чтения по губам говорящего человека

04.04.2016

5109

Группа исследователей из Школы информатики (School of Computing Sciences) университета Восточной Англии (University of East Anglia), возглавляемая профессором Ричардом Харви (Richard Harvey), закончила разработку новой системы распознавания речи по движению губ и мимике говорящего человека. Эта система, построенная на принципах самообучающегося искусственного интеллекта, отличается высокой точностью распознавания и она может оказать неоценимую помощь правоохранительным органам при расследовании преступлений, предоставить коммуникационные возможности людям с нарушениями слуха и речевого аппарата.

"Наша система может применяться везде, где невозможно получить аудиозаписи с качеством, достаточным для определения того, что говорят люди" - рассказывает Хелен Л. Бир (Helen L. Bear), доктор философии из университета Восточной Англии, - "Возможности распознавания речи по губам будут полезны не только при расследовании преступлений, они могут стать частью систем управления в местах, где присутствует высокий уровень шума, к примеру, в автомобилях и в кабинах самолетов".

Следует отметить, что данная система распознавания речи по движениям губ уже далеко не первая, которая была создана людьми. Но все разработчики подобных систем сталкиваются с проблемами, что некоторые звуки, к примеру '/p/', '/b/' и '/m/' во время произношения выглядят почти одинаково. Однако, новая система, прошедшая через процедуру обучения, может дифференцировать подобные с визуальной точки зрения звуки, что существенно повышает качество процесса "чтения по губам".

"Сейчас мы продолжаем изучать науку о визуальной составляющей речи человека. И все, что нам удается узнать нового, тут же воплощается в виде математических моделей, на которых основана работа нашей системы. А процедуры обучения и самообучения, в результате которых создаются специализированные классификаторы, позволяют увеличить точность работы системы во много раз по сравнению с точностью работы других подобных систем" - рассказывает профессор Харви, - "Чтение по губам - это достаточно сложная задача даже для систем с искусственным интеллектом, она осложняется тем, что все люди имеют разную форму губ".

Данная разработка является результатом трехлетних усилий исследователей, которые работали по заказу Engineering and Physical Sciences Research Council (EPSRC). А более подробная информация о новой системе станет доступна после ее презентации, которая будет проведена в рамках международной конференции International Conference on Acoustics, Speech and Signal Processing (ICASSP), которая пройдет в Шанхае в скором времени.

Источник: dailytechinfo.org

«« | »»
Последние новости