Комментарии к «Кто же все-таки был на Болотной и на Сахарова? Анализ профилей 20 000 участников митинга»

По мотивам этого

Простите, не смог пройти мимо. Сам по себе сбор массива - уже здорово. Но вот анализ и интерпретация... Прежде всего - что именно за группы рассматривались?

Остальное разберем по пунктам:

1. Выборка

«Результаты соцопросов от Левада-Центра скучные», «20 000 человек. вроде достаточная выборка, не? к слову у левада-центра 791 человек».

Ну нельзя же так. Абсолютный размер выборки не говорит ну вообще ни о чем. Какая такая "достаточность"?

У «Левады» 791 человек? Думаю, эти люди отбирались с опорой на некую псевдослучайную процедуру. Если на пр-те Сахарова было около 80 тыс. человек, то ошибка случайной выборке на доверительном интервале в 95% не должна превышать 3,5%. Эта характеристика существенна. А как были отобраны те 20000? Сплошняком из двух основных групп записавшихся? А как члены этих групп соотносятся с теми, кто действительно выходил на митинг? Возможно, значительная часть, действительно, была на митинге. Но, думаю, что была и та часть, которая записывалась и не приходила в силу разных обстоятельств (не смогли, живут в другом городе и т.п.). Т.о. эта «выборочная совокупность» вообще не является подмножеством генеральной, о которой делаются выводы (все митинговавшие). P.S.: Даже если бы 20000 выборки были набраны по всем правилам – ошибка случайной выборки на 95% доверительном интервале составила бы 0,6%. Стоит ли ради уменьшения ошибки на 2,9% более чем в 20 раз увеличивать выборку? – Это вопрос экономической целесообразности. Теория для любознательных

2. Соцдем митинговавших (точнее – условных митинговавших)

«66% протестовавших «против Путина» родились после начала перестройки».

«В профилях есть возможность указать родной город, и многие митинговавшие ей воспользовались».

«Большинство «протестантов» имеют высшее образование».

Большинство… даже если не митингующих, а просто отметившихся в группе. Все равно что-то не так. Информация собиралась по открытым данным. Возьмем, к примеру, достаточно полный, на мой взгляд, из доступных и более-менее непредвзятых источников статистики ВК – июльский хабра-пост – «Статистика по профилям пользователей ВКонтакте». Тут тоже сбор шел по открытым данным. И оказалось, что город указан у 30,55% пользователей, возраст – у 17,47%, ВУЗ – у 17,22%. Так о каком большинстве или 66% говорится в тексте? Почему бы не привести цифры, от которых взяты проценты по соцдем распределениям?

3. Так «школота» или нет?

«На удивление оказалось гораздо меньше людей школьного возраста, чем традиционно ожидается. Школота не пройдет! Подавляющая часть митинговавших попадает в границы от 18 до 28, пик приходится на 23-24 года»

«ваши данные показывают, что из того же вконтакта пришла наиболее образованная и думающая часть. остальные - это школота, птушники - которых по вашим же данным не было)»

Не совсем понятна природа мифа о засилье т.н. «школоты» в ВК. Из гистограммы распределения по годам рождения той же ВК-статистики с «Хабра» следует, что пик приходится на 87-89 годы. Т.е., те же самые 22-24 года. Никаких явных отличий «условных митингующих» от средней аудитории соцсети не наблюдается.

4. Вкусовые предпочтения митингующих

«Список любимых фильмов говорит о человеке достаточно».

«Телевизор ребята практически не смотрят, о чем часто упоминают в своих профилях».

«Еще они любят фильмы "Назад в будущее", "День сурка" и "Страх и ненависть в Лас-Вегасе". Вобщем-то неплохие фильмы, если честно».

Стругацкие, Булгаков, Достоевский, Ремарк, Чехов… И опять – немного осторожности в выводах относительно предпочтений не помешало бы. У «британских ученых» (TM) есть интересный материал по сравнению вкусов пользователей Facebook с приватными и публичными профилями. Если коротко, то для публичных профилей характерны The Beatles и Harper Lee, а для приватных – Dan Brown и Bridget Jones. Авторы предлагают вывод, что вкусы, обозначаемые в публичных профилях, часто являются скорее социальными маркерами, чем действительно предпочтениями пользователей. Т.о., при анализе «условных митингующих» речь надо вести скорее не о вкусах, а о своеобразном маркерном наборе. Такой набор интересно сравнить со «среднестатистическим» по сети. Различия позволили бы строить какие-то предположения.

comments powered by Disqus