В качестве исходных данных выступили дата-сеты сообщений и комментариев из социальных сетей общим количеством около 2 млн. постов и комментариев, взятые из 2 168 сообществ 548 высших учебных заведений РФ и их филиалов. Основой данных явились посты в сообществах и комментарии к ним за период сентябрь 2020 г. - июль 2021 г. Тематики:
- Особенности взаимодействия преподавателей и студентов
- Учебная вовлеченность студентов и аспирантов в университете и НИР
- Финансовое положение студентов
- Социально-бытовые условия / проблемы
- Стресс и психологическое состояние студентов
1. Отбор релевантных сообщений по теме, исключение «мусорных» сообщений.
2. Выявление категорий и тематических направлений, отражающих системные проблемы, на основе группировки смыслового содержания контента сообщений и возможности выделения системных проблем и наиболее часто обсуждаемых вопросов.
3. Определение тональности сообщений, позволяющей оценить полярность, степень эмоциональности и отношения автора сообщения (поста/комментария) к сложившейся проблеме, ситуации, факту по исследуемой теме.
1) реестр официальных и неофициальных университетских сообществ в социальной сети «ВКонтакте» с указанием их метаданных и цифровых следов пользователей (2 168 сообществ);
2) размеченные дата-сеты за 2019 сент.-декабрь, 2020 январь-июль, сентябрь-декабрь, 2021 январь-июль;
3) полная база постов и комментариев из сообществ («неочищенная») (2 млн. сообщений);
СМИ о проекте
https://www.vyatsu.ru/internet-gazeta/obrazovanie-v-usloviyah-koronavirusa-problemyi-i-p.html