Принципы и разработка метатекстовых разметок в национальном корпусе казахского языка
Full Name of the work head: Кажыбек Е.
Исполнители проекта: Жубанов А.К., Жанабекова А., Карбозова Б. и др.
: Институт языкознания им. А.Байтурсынова
Inventory number: 0217РК02236
Registration number: 0115РК01922
Keywords: корпусная лингвистика*национальный корпус*метаразметки
Осуществлен выбор казахских текстов по различным жанрам и стилям. Изучены принципы проведения выбора метаданных. Выявлены принципы разработки метаразметок в мировом языкознании. Рассмотрены практические методы внедрения метаразметок в мировом языкознании и в национальном корпусе казахского языка. Исследованы компьютерные технологии внедрения в корпус текстов различных меторазметок и созданы эффективные компьютерные программы системы поиска по метаразметкам. Выбраны и обработаны тексты, состоящие из 6 миллионов словоупотреблений по публицистике и внедрены метаданные по всем стилям казахского языка.