Sign in or Join FriendFeed
FriendFeed is the easiest way to share online. Learn more »
selfish hard-on
А еще фальсификация бывает вот такая: http://echo.msk.ru/blog... В моей юности один из фейсбукофрендов ссаными тряпками выгонял с кафедры любого идиота, который пробовал впрямую сравнить сплошной уличный опрос на 2500 человек и квотную выборку на 1600. И коньяку потом не давал.
«Статистическая оценка возможной погрешности не проводилась», блин. Конечно, не проводилась, потому что сплошной уличный опрос 2500 человек на генеральной совокупности в 100 миллионов — это шум, там нечего оценивать. - selfish hard-on
Ну ОК, а как оценивать степень искренности отвечающих по телефону, что они действительно проголосуют за ВВиУ? - Тимур
При чем тут степень искренности вообще? - selfish hard-on
Это систематическая ошибка, которая в случае уличного опроса меньше, в случае телефонного - заметно больше (т.к. ниже анонимность). Нас ведь интересует релевантность результатов опроса и тайного голосования, или нет? - Тимур
Я не хочу сейчас обсуждать верность посылки «выше анонимность — выше достоверность», котороая мне тоже кажется довольно умозрительной. Вот прямо сейчас речь о социологических методах оценки достоверности опроса. Крайне грубо можно говорить о трех существующих методах — уличном опросе, случайной выборке и квотной выборке. Для достижения одинаковой достоверности необходимое количество опрошенных различается на несколько порядков для каждого метода, и уличный опрос — самый худший. - selfish hard-on
Не противоречит, достоверность - это ширина полосы, куда с 95% вероятностью попадет опрос, выполненный данным методом. Наверняка для уличного опроса эта полоса заметно шире. Но чем ниже анонимность, тем дальше смещается в сторону "лояльности" середина полосы (конечно, гипотеза). - Тимур
а откуда мнение, что при квотной выборке анонимность меньше, чем при сплошном уличном опросе? - Анё
искренность этих 2500 не имеет никакого значения, потому что должна быть умножена на произвольную величину - selfish hard-on from BuddyFeed
опрашивающий на улице не имеет никакой информации о прохожем; опрашивающий по телефону имеет номер телефона, по которому может быть установлен адрес, а зачастую и ФИО ответившего на звонок. - Тимур
у уличного опроса, конечно, есть свои систематические погрешности. - Тимур
опрос 1600 человек по квотной выборке дает результаты, которые находятся с мнением генеральной совокупности в отношениях, описываемых в терминах статистической погрешности, и эта погрешность — величина, однозначным образом исчислимая математическими методами - selfish hard-on from BuddyFeed
сплошной опрос дает знание о том, что существуют 2500 человек, мнение которых таково — и более никакого знания не дает. - selfish hard-on from BuddyFeed
не согласен, что знания не дает. но достоверность сплошного опроса нельзя оценить из общих соображений, когда выборка очень мала по сравнению с генеральной совокупностью. эмпирически можно установить: провести 20 таких опросов и посмотреть, в какой ширины полосу ложатся с 95% вероятностью результаты. - Тимур
я сейчас в вандербула на ровном месте превращусь, извините. - selfish hard-on from BuddyFeed
Не имел намерения вас злить. По-моему ровно по вашим словам: в 20 раз - это более чем на порядок большая выборка(50 тыс.), а дисперсия, надо полагать, будет больше, чем для квотной в 2500. - Тимур
не имели, просто опровергали закон всемирного тяготения с точки зрения здравого смысла. опровергли успешно. - selfish hard-on from BuddyFeed
ничего подобного, просто общестатистический подход. есть воспроизводимость, есть наука; нет - нету. 2500 - дает данные, но не научные, т.к. погрешность определения неизвестна. 50 тыс. как 20х2500 - это научные данные, но а) технически сложно б) погрешность все равно велика. это и сокращается до фразы "всего лишь мнение 2500". но это не аксиома. - Тимур
сейчас до десктопа дойду и отвечу развернуто. пока коротко: уличный опрос 50 тысяч без дополнительных условий тоже может быть шумом - selfish hard-on from BuddyFeed
1) Дисклеймер: в википедию не смотрю, так что могут быть терминологические ошибки, зато не будет ерунды. Не будем рассматривать такие параметры как искренность респондентов и возможность недостоверного исполнения со стороны интервьюеров. Эти проблемы, кстати, тоже более или менее решаются в компаниях, профессионально занимающихся исследованием общественного мнения, но они сейчас малозначимы. - selfish hard-on
2) На чем вообще основана выборочная социология (как и любые виды выборочного контроля, например любой разрушающий контроль качества на предприятиях)? На предположении, что свойства выборки (прямо исследуемой совокупности) с некоторой (вычисляемой) точностью совпадают со свойствами генеральной совокупности. - selfish hard-on
3) Проще всего дела обстоят со случайной выборкой. Из генеральной совокупности при помощи хорошего генератора случайных чисел выбирается исследуемая совокупность. Вероятности совпадения свойств этой выборки со свойствами генеральной совокупности — чистая математика, которую я забыл, но в которой нет эмпирически выведенных коэффициентов, всё строго. В дефектологии выборка делается понятно как, в социологии запускают генератор случайных чисел на данных переписи населения для общих исследований и на списках голосующих для выборных. - selfish hard-on
4) Последовательная выборка (когда мы тыкаем в совокупность в каком-то месте и выбираем оттуда сколько-то подряд) — много хуже. Например, можно выбрать треть совокупности и получить результат, верный только для этой трети. Дело в том, что мы ничего не знаем о структуре нашей генеральной совокупности (и о самом наличии такой структуры, конечно). При случайной выборке структура не оказывает никакого влияния. Скажем, мы можем взять 10 подряд деталей из 100 и ничего не узнать о том, что 20 деталей подряд были испорчены из-за сбоя в подаче газа в печь. Вероятность такого события можно посчитать, она точно больше половины. При случайной выборке 10 деталей из ста вероятность того, что ни одна из 20 бракованных не попадет в выборку, много меньше. Считать, опять же, не буду, потому что за формулами надо лезть в гугель, а единственный способ для меня написать этот текст — не лезть в гугель и написать его с собой на спор. - selfish hard-on
5) Итого, случайная выборка не просто лучше последовательной, а принципиально лучше. Последовательная выборка гарантированно недостоверна при наличии у генеральной совокупности какой-либо структуры. Опрашивая людей на выходе из «Маяка» в 23:00 и у входа в метро «Щелковская» в 7:00 мы получим не просто разные, а по некоторым вопросам диаметрально противоположные результаты. - selfish hard-on
6) К сожалению, у полностью случайной выборки есть недостаток: хорошая достоверность достигается на значениях порядка единиц процентов (или десятых долей процентов? опять не помню без интернетов) от генеральной совокупности. В любом случае, на генсовокупности «население РФ» даже десятые доли процента — чуть более чем дохуя. - selfish hard-on
7) Для обхода этого ужаса придумали квотную выборку — составляется выборка, которая при прочих случайных характеристиках повторяет структуру генеральной совокупности по характеристикам, в отношении которых замечена высокая корреляция с ответами на вопросы. В случае с дефектологией это может быть сохранение в выборке количественных пропорций деталей, выпущенных бригадами А, Б и В во время суток Г, Д и Е. В случае с соцопросами сохранить стремятся соотношение половозрастных характеристик, доходов и характеристик места жительства (город/село, субъект РФ). Заметим, что природа корреляции в обоих случаях не важна для достоверности исследования и может изучаться комиссией по качеству в первом случае и социопсихологами или политологами во втором. - selfish hard-on
8) Квотная выборка — уже не вполне точная наука. Коэффициенты, которые применяются при подсчете достоверности исследования, выполненного методом квотной выборки, выведены эмпирически. История и контрольные исследования методом случайной выборки показывают высокую пригодность этих эмпирически выведенных коэффициентов. При помощи метода квотной выборки удается получать хорошие результаты на сотых долях процента генсовокупности и приемлемые — на тысячных. - selfish hard-on
9) Суммируя: 1600 человек квотной выборки на ста миллионах генсовокупности — это не очень хорошо, но терпимо. Есть предмет для разговора, во всяком случае. 50 тысяч случайной выборки на той же совокупности — это хуже, но в принципе тоже есть о чем говорить. 50 тысяч, опрошенных последовательно на улице без внесения дополнительных жестких требований, — довольно бестолковое занятие. - selfish hard-on
это, я прошу прощения что я вмешиваюсь, но у меня по исходному тексту замечание небольшое. Ты вот пишешь - "А еще фальсификация бывает вот такая", но вообще говоря - там руководящий член организации городских сумасшедших "солидарность" пишет в блогах для городских сумасшедших (то есть на echo.msk.ru) какую-то хуергу. Мне всё-таки кажется что объединять одним термином "фальсификация" безобидные эксперименты какого-то блаженного, который у метро подёргал за пуговицу 10 человек, и чуровские фокусы -- это не совсем верно. - screamager
@screamager я ужасно не люблю, когда люди борются за дело, которое я считаю и своим тоже, совершенно негодными методамии типа «во имя правды будем врать, и врать, и врать». а он сумасшедший? чорт, я не знал. я отнесся как к серьезному высказыванию. если он мелкий псих, это меняет дело, естественно. - selfish hard-on
@adworse, ну это известная проблема; чикатило, я думаю, согласился бы с тем что 2x2=4, но мы же по этому случаю не отказываемся от базовой ариметики. А перец этот из "солидарности", у которой в лидерах илья яшин, большой поклонник 282-й статьи и одновременно правозащитник лев пономарёв, дядя боря немцов и другие, хм, действующие лица :) - screamager
@ adworse отлично написано - Agent of Evil, Джомсом
а вот Тутубалин примерно о том же, только в профиль http://blog.lexa.ru/2012... Он рассматривает не общую картину, а детали. И в деталях там, к сожалению, такая же фигня. - selfish hard-on from BuddyFeed