Основные принципы формализации содержания казахского текста
Руководитель проекта: А.К.Жубанов
Исполнители проекта: А.К.Жубанов
Организация: Ин-т языкознан. им. А. Байтурсынова
Инвентарный номер: 0203РК00581
Регистрационный номер: 0100РК00278
Ключевые слова: Формализованные языки, Казахский язык, Автоматический словарь,
Объект исследования: художественные, публицистические, научно-популярные тексты казахского языка. Цель: разработка принципов формализации содержания казахского текста как общепринятой единицы общения людей, семантически значимых единиц казахского текста и правил, понятных компьютеру и объединяющих эти единицы в связный текст. Установлен лексический минимум усвоения казахского языка. Исследованы элементарные составляющие текста, логико-семантические компоненты, главные и второстепенные опорные слова казахского текста. Изучена структура автоматического словаря казахского языка. Разработан алгоритм синтеза словоформ от реестровых основ слов существительных и глагола. Осуществлена семантическая классификация знаменательных классов слов казахского языка и принцип их системного кодирования. В результате исследования статического и динамического содержания казахских текстов найдена эмпирическая формула, выделяющая с помощью потенциального частотного словаря главные и второстепенные опорные слова из текста, в которых сконцентрировано содержание рассматриваемого минитекста. Создана таблица основного статического содержания казахского минитекста.