Принципы и разработка метатекстовых разметок в национальном корпусе казахского языка
Руководитель проекта: Малбаков М.
Исполнители проекта: Жубанов А.К., Жанабекова А., Карбозова Б. и др.
Организация: Институт языкознания им. А.Байтурсынова
Инвентарный номер: 0215РК02541
Регистрационный номер: 0115РК01922
Ключевые слова: корпусная лингвистика*национальный корпус*метаразметка
Осуществлен выбор казахских текстов по различным жанрам и стилям: художественная проза, поэзия, научно-гуманитарный стиль, научно-технический стиль, публицистика (газетные и журнальные тексты), драматургия и другие. Выявлены теоретические принципы разработки метаразметок в мировом языкознании. Изучены практические методы внедрения метаразметок в мировом языкознании и рассмотрены эффективные методы внедрения метаразметок в национальный корпус казахского языка. Исследованы компьютерные технологии внедрения в корпус текстов различных метаразметок и созданы эффективные компьютерные программы системы поиска по метаразметкам. Создана автоматизированная компьютерная программа внедрения морфологических разметок к выборочным текстам.