Сөйлеуді автоматты тану (ASR) дегеніміз, компьютерлер және интеллектуалды технологиялар мен робототехника сияқты компьютерлендірілген құрылғылардың көмегімен ауызша сөйлеуді тану және мәтінге аудару үшін әдістемелер мен технологияларды әзірлеуге арналған лингвистика, информатика және электротехникадан алынған білім мен зерттеулерді біріктіретін есептеуіш лингвистиканың пәнаралық саласы.
Ондаған жылдар бойы қолдан жинақталған домендік білім заманауи ASR конвейерлерінде пайдаланылды. Мамандар оған қарапайым әрі мықты балама ретінде компоненттердің көпшілігін бір үлгімен ауыстыру үшін терең оқытуды пайдалана отырып, ASR үлгілерін интегралды түрде оқытуды алға тартады. Бұл адамдар өңдейтін сөйлеуді тану контексттерінің толық ауқымын қарастыратын ASR біртұтас жүйесіне бағытталған маңызды қадам болып табылады.
Ақпараттық және есептеу технологиялары институты ғалымдары сөйлеу сигналдарын танудың әдістері мен модельдерін және классификациясын, жасанды интеллект, сөйлеу технологиялары және компьютерлік лингвистиканы, ақпараттық-іздеу жүйелерін зерттеуде. Олардың қолға алған ғылыми жобасының басты мақсаты агглютинативті (түркі) тілдер үшін сөйлеуді автоматты түрде танудың интеграцияланған жүйесінің әдістері, модельдері мен бағдарламалық жасақтамасын әзірлеу болып отыр.
Қазіргі таңда қазақ және әзірбайжан тілдерінің мысалында агглютинативті тілдерге арналған акустикалық корпус, қазақ тіліндегі қолданыстағы сөйлеу корпусын кеңейту, агглютинативті тілдерге арналған сөйлеу және мәтіндік ақпараттарды жинау, корпусты бірнеше мың сағатқа дейін өзгерту, СТС және кодер-декодер механизмдері негізінде әдістер мен модельдерді әзірлеу сияқты жетістіктерге қол жеткізген.
Негізгі көрсеткіштері ретінде сөйлеуді тануға арналған жаңа технологияны, сөйлеу сигналдарын тануға, оны синтездеуге, автоматты талдауға арналған әдістерді, сондай-ақ алгоритмдер мен математикалық модельдерді жасағанын айтуға болады.
Ашқан жаңалығы қандай десеңіз, интегралдық архитектура негізінде қолданыстағы сөйлеуді тану жүйелерін талдау, сөйлеуді автоматты түрде танудың интегралды жүйесін құру үшін қойылған мәселені шешудің математикалық модельдері мен алгоритмдерін құру.
Ғалымдар бұл жаңалықтары корпус сөйлеушілерді сәйкестендіру, тілді сәйкестендіру және сөйлеуді танудың көптеген тапсырмаларын шешу үшін, сондай-ақ жасанды интеллект дамуында қолдануға болады деп сендіреді.