Приоритизация работ по созданию и консолидации такого контента невозможна без качественного и количественного анализа больших объемов текстовых данных СМК. В рамках предлагаемого проекта планируется создать на основе современных математических и компьютерных технологий прототип информационно-поисковой аналитической системы для выявления и систематизации поляризованных мнений по вопросам глобального изменения климата в русскоязычных СМК. Проект носит междисциплинарный характер на стыке технологий информационного поиска и искусственного интеллекта, автоматической обработки текстов, медиалингвистики, психолингвистики, социологии, климатологии и смежных с ней наук о Земле.
В рамках проекта планируется создать модели, методы и алгоритмы для решения следующих задач:
1) автоматизированное выявление релевантных тем в потоке текстовых данных СМК (релевантными мы называем семантически однородные темы, связанные с публикациями и обсуждениями различных вопросов глобального изменения климата); сложность задачи в том, что список релевантных тем является открытым и может со временем пополняться, а их верификация требует профессиональной климатологической и лингвистической экспертизы;
2) автоматизированное выявление поляризации внутри релевантных тем; решение данной задачи потребует создания размеченной выборки поляризованных тем с явным выделением мнений для последующей верификации моделей кластеризации мнений; будет проверена гипотеза о целесообразности обогащения разметки лингвистическими маркерами; будут разработаны алгоритмы количественного оценивания объемов текста и объемов аудитории по темам и мнениям, а также количественные индикаторы для оценивания манипулятивности и тревожности для каждого полюса мнений;
3) автоматизированное выявление недостоверной информации (фактоидов, фейков, домыслов) внутри каждой релевантной темы; решение данной задачи потребует создания прототипа платформы для проверки фактов с участием экспертов предметной области и регулярного пополнения размеченной выборки проверенных фактов;
4) автоматизированная привязка поляризованных мнений для каждой релевантной темы к англоязычным научным публикациям; решение данной задачи потребует построения сети цитирования по открытым данным электронных библиотек.
В рамках исследования решены задачи:
- разработки методологии исследования поляризации мнений о проблеме изменения климата в российских средствах массовой коммуникации на материале больших данных;
- создание карты структуры общественного мнения (в масштабе современного российского цифрового общества) по вопросам изменения климата;
- экспертная оценка полученных результатов - состояния общественного мнения в России о проблеме изменения климата, обусловленности / необусловленности основных поводов социальных опасений и причин социальной тревожности в связи с заявленной тематикой, особенностей субъективного восприятия глобальной проблемы в российском цифровом обществе.