Ғылыми жаңалықтар

ҚазҰТУ мамандары сканерден өткен қазақша мәтінді Word-қа айналдыратын бағдарлама ойлап тапты

16.06.2014

6199

Бүгінде қағаз жұмыстың бәрі компьютермен атқарылады. Алайда, қазақ тіліндегі сканерленген құжаттағы қателерді жөндеуді әбігері көп. Бәрін қайтадан көшіру керек. Ал, ғаламтордағы арнайы қосымшаларды пайдалансаңыз, қазақтың 9 әрпін тани алмайды. Енді бұл қиындықтан да оңай шығатын жол бар. Қазақ Ұлттық техникалық университеті ғылыми зертханасының мамандары қазақ тіліндегі мәтінді оптикалық тану кешенін ойлап тапты, деп хабарлайды «Қазақстан» ұлттық арнасы.
ҚазҰТУ ғылыми зертхана маманы Қайрат Бостанбеков: «Жоба мақсаты- кез келген кітапта не құжатта болсын, қазақ тіліндегі мәтінді сканерден өткізіп, сол алған суретімізді Word сияқты бағдарламадағы құжатқа айналдыру. Сурет болып «қақиып» тұрған сөздерді енді қалағаныңызша өзгерте аласыз. Қазір бұл кешен құжатта кеткен қателерді 98 пайызға дейін түзете алады».

ҚазҰТУ ғылыми зертхана жетекшісінің орынбасары Руслан Бармашов: «Пайдаланушы сканерден өткен қағаздарын біздің порталға енгізеді де «распознать» деген батырманы басады. Өңдеу суперкомпьютерде 3 кезеңнен өтеді. Бірінші - оптикалық тану. Ол кезде мәтіндегі әр әріпті таниды. Екінші кезеңде, морфологиялық талдау жасайды. Яғни, бірінші кезеңде табылған қате сөздерді түзейді. Үшінші - морфология-семантикалық сараптама. Қазақ тілінің синтаксисіне байланысты кеткен қателерді жөндейді. Осының бәрі 3-4 секундта жүзеге асырылады».

Порталдың тиімді тұстары көп. Біріншіден, тегін, әрі уақыт үнемдейсіз. Тіпті, ұялы телефонмен де керек құжатты суретке түсіріп, ғаламтор арқылы өзгертіп, қатесін түзеп пайдалана аласыз.

Айтпақшы, бұл кешен бір ғана бет емес, көпбеттік құжатты да әп-сәтте реттейді.

Дереккөзі: inform.kz

«« | »»
Соңғы жаңалықтар