Принципы и разработка метатекстовых разметок в национальном корпусе казахского языка
Руководитель проекта: Кажыбек Е.
Исполнители проекта: Жубанов А.К., Жанабекова А., Карбозова Б. и др.
Организация: Институт языкознания им. А.Байтурсынова
Инвентарный номер: 0217РК02236
Регистрационный номер: 0115РК01922
Ключевые слова: корпусная лингвистика*национальный корпус*метаразметки
Осуществлен выбор казахских текстов по различным жанрам и стилям. Изучены принципы проведения выбора метаданных. Выявлены принципы разработки метаразметок в мировом языкознании. Рассмотрены практические методы внедрения метаразметок в мировом языкознании и в национальном корпусе казахского языка. Исследованы компьютерные технологии внедрения в корпус текстов различных меторазметок и созданы эффективные компьютерные программы системы поиска по метаразметкам. Выбраны и обработаны тексты, состоящие из 6 миллионов словоупотреблений по публицистике и внедрены метаданные по всем стилям казахского языка.