![]() |
ИСТИНА |
Войти в систему Регистрация |
ИСТИНА ФИЦ ПХФ и МХ РАН |
||
В связи с активностью террористической пропаганды в Интернет и социальных сетях, а также учитывая высокую динамичность появления новых сайтов, аккаунтов экстремистской направленности, в профилактике экстремистской и террористической деятельности важно быстро обнаруживать Интернет-сайты, форумы, блоги и пользователей, которые демонстрируют склонность к экстремизму. В данном проекте предполагается с данной точки зрения исследовать возможности автоматического распознавания трех видов интернет-страниц, интернет-блогов, сообщений в Твиттере: 1) поскольку в настоящее время преобладает исламский терроризм, то предполагается автоматически извлекать сайты и пользователей, которые обсуждают ислам, включая пользователей Твиттера 2) нужно обращать внимание на страницы и сообщения, которые высказывают позитивные эмоции (злорадство, торжество) по поводу негативных явлений в России, террористических актов в России и мире, катастроф 3) кроме того, важно обращать внимание, на сайты, форумы, пользователей, где обнаруживается яркая негативная реакция, призывы к насилию по поводу каких-либо стран, национальностей, групп населения (hate-сообщества).
Для обнаружения-анализа таких страниц предполагается: - создать тезаурус для автоматической обработки текстов в области террористической и экстремистской деятельности, в который перенести релевантные описания из существующего Общественно-политического подтезауруса тезауруса русского языка РуТез, а также пополнить религиозной (прежде всего исламской) терминологией, понятиями религиозной жизни и обычаев, терминологией и лексикой, выражающей конфликты и проблемы государств и народов, географическими наименованиями мест с преобладающим исламским населением, названия конкретных имен и организаций, связанных с основными религиями - использовать созданный тезаурус для автоматической классификации-фильтрации сайтов, новостных сообщений и сообщений в социальных сетях по тематике обсуждения религий, групп населения, проблем и кризисных явлений в современной общественно-политической жизни, - улучшить качество извлечения именованных сущностей (имена людей, организаций, географических наименований) в двух направлениях: имена, связанные с арабским и другими восточными языками, упоминания именованных сущностей в Твиттере. - поскольку важно отслеживать реакцию людей на различные происходящие события-явления, то предполагается классифицировать новостной поток специально созданным классификатором, описывающим угрозы государства, террористическую и экстремистскую деятельность, а также автоматически устанавливать связи между такого рода событиями и их обсуждениями в социальных сетях с целью распознавания эмоций, которые высказываются в связи с этими событиями - поскольку способы выражения оценок, эмоций в значимой степени зависят от нескольких факторов, включая предметную область, стиль речи (разговорный, публицистический) и др., то предполагается нарастить специализированные словари оценочной лексики на основе ранее развитых подходов: - автоматическое извлечение специализированной оценочной лексики за счет сопоставления нескольких текстовых коллекций, и имеющегося общезначимого словаря оценочной лексики, - автоматическое выделение типовых конструкций, которые часто являются оценочными, хотя могут и не включать явных оценочных слов, включая конструкции с частицей «не» (не работать), квантификаторами (много, мало), глаголами роста, уменьшения, уничтожения, градуальными прилагательными (узкий, широкий,длинный), с последующим автоматическим статистическим анализом на основе текстовых коллекций, позволят дополнить словарь специализированной оценочной лексики словосочетаниями. - предполагается выявлять типовые высказывания (стереотипы), с помощью которых ведется пропаганда (например, несправедливость к мусульманам и т.п.)
грант РФФИ |
# | Сроки | Название |
1 | 30 июня 2016 г.-31 декабря 2016 г. | Автоматические методы выявления среды распространения терроризма и экстремизма в социальных сетях |
Результаты этапа: | ||
2 | 20 сентября 2017 г.-24 сентября 2018 г. | Автоматические методы выявления среды распространения терроризма и экстремизма в социальных сетях. Этап 2 |
Результаты этапа: | ||
4 | 1 января 2019 г.-31 декабря 2019 г. | Автоматические методы выявления среды распространения терроризма и экстремизма в социальных сетях |
Результаты этапа: |
Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".