Разработка моделей, алгоритмов семантического анализа веб-контента для определения экстремистской направленности и создание инструментария кибер-криминалистики
Full Name of the work head: Мусиралиева Шынар Женисбековна
Исполнители проекта:
: Некоммерческое акционерное общество "Казахский национальный университет имени аль-Фараби"
Inventory number: 0222РК00194
Registration number: 0120РК00165
Keywords: идентификация пользователей,интернет-экстремизм,кибер-криминалистика,криптовалюта,Семантический анализ
впервые создан корпус экстремистских текстов на казахском языке для обучения и тестирования методов машинного обучения для выявления экстремистских текстов на казахском языке; впервые с учетом особенностей казахского языка построена модель семантического анализа, отличающаяся применением метода TF-IDF к биграммам, предварительно примененным алгоритмом стемминга в слой внедрения слов сети LSTM и повышающая точность определения экстремистских текстов, программный модуль сбора и анализа веб контента для определения ЭН (экстремистской направленности). Метод может быть использован в качестве одного из элементов для системы мониторинга и сбора данных из социальных сетей. Были построены графы пользователей на основе метаданных. Была разработана модель анализа биткоин транзакций для выявления подозрительных транзакций. Разработано программное приложение.