Основные принципы формализации содержания казахского текста
Full Name of the work head: А.К.Жубанов
Исполнители проекта: А.К.Жубанов
: Ин-т языкознан. им. А. Байтурсынова
Inventory number: 0203РК00581
Registration number: 0100РК00278
Keywords: Формализованные языки, Казахский язык, Автоматический словарь,
Объект исследования: художественные, публицистические, научно-популярные тексты казахского языка. Цель: разработка принципов формализации содержания казахского текста как общепринятой единицы общения людей, семантически значимых единиц казахского текста и правил, понятных компьютеру и объединяющих эти единицы в связный текст. Установлен лексический минимум усвоения казахского языка. Исследованы элементарные составляющие текста, логико-семантические компоненты, главные и второстепенные опорные слова казахского текста. Изучена структура автоматического словаря казахского языка. Разработан алгоритм синтеза словоформ от реестровых основ слов существительных и глагола. Осуществлена семантическая классификация знаменательных классов слов казахского языка и принцип их системного кодирования. В результате исследования статического и динамического содержания казахских текстов найдена эмпирическая формула, выделяющая с помощью потенциального частотного словаря главные и второстепенные опорные слова из текста, в которых сконцентрировано содержание рассматриваемого минитекста. Создана таблица основного статического содержания казахского минитекста.