Национальный компьютерный фонд "Тил - казына" корпуса текстов как культурных ценностей и словарей казахского языка
Full Name of the work head: С.К. Кулманов
Исполнители проекта: Кулманов С.К.
: Институт языкознания им. А.Байтурсынова
Inventory number: 0211РК01290
Registration number: 0109РК01365
Keywords: Компьютерный фонд, Тил-казына, Корпус текстов, Словари, Казахский язык,
Исследованы теоретические и практические стороны создания компьютерной базы корпуса текстов казахского языка. Проведено ознакомление со структурой и методами создания Браунского корпуса, осуществленного в 1960 году в США. Исследованы структуры и методы создания частного словаря Л.Н. Засориной, составленного на основе корпуса текстов в 1970 году и состоящего из 1 млн. словоупотреблений, алгоритмическая структура и пути создания Британского Банка и национального Британского корпуса, осуществленных в 1980 году в Великобритании, структуры и методы создания "Национального корпуса русского языка", состоящего из 140 млн. словоупотреблений, созданного в России. Осуществлено ознакомление с проектом "Машинного фонда русского языка", предложенного А.П. Ершовым. Приведены в электронный вид и подготовлены к вводу в базу "Тил - казына" тексты карточек-цитат картотечного фонда на буквы "С" и далее, а также проведена выборка текстов из романа М. Ауезова "Абай жолы", из произведений А. Кекилбаева согласно требованиям "корпусной лингвистики".