Sign in or Join FriendFeed
FriendFeed is the easiest way to share online. Learn more »
оператор канцелярита
А еще фальсификация бывает вот такая: http://echo.msk.ru/blog... В моей юности один из фейсбукофрендов ссаными тряпками выгонял с кафедры любого идиота, который пробовал впрямую сравнить сплошной уличный опрос на 2500 человек и квотную выборку на 1600. И коньяку потом не давал.
«Статистическая оценка возможной погрешности не проводилась», блин. Конечно, не проводилась, потому что сплошной уличный опрос 2500 человек на генеральной совокупности в 100 миллионов — это шум, там нечего оценивать. - оператор канцелярита
Ну ОК, а как оценивать степень искренности отвечающих по телефону, что они действительно проголосуют за ВВиУ? - Тимур
При чем тут степень искренности вообще? - оператор канцелярита
Это систематическая ошибка, которая в случае уличного опроса меньше, в случае телефонного - заметно больше (т.к. ниже анонимность). Нас ведь интересует релевантность результатов опроса и тайного голосования, или нет? - Тимур
Я не хочу сейчас обсуждать верность посылки «выше анонимность — выше достоверность», котороая мне тоже кажется довольно умозрительной. Вот прямо сейчас речь о социологических методах оценки достоверности опроса. Крайне грубо можно говорить о трех существующих методах — уличном опросе, случайной выборке и квотной выборке. Для достижения одинаковой достоверности необходимое количество опрошенных различается на несколько порядков для каждого метода, и уличный опрос — самый худший. - оператор канцелярита
Не противоречит, достоверность - это ширина полосы, куда с 95% вероятностью попадет опрос, выполненный данным методом. Наверняка для уличного опроса эта полоса заметно шире. Но чем ниже анонимность, тем дальше смещается в сторону "лояльности" середина полосы (конечно, гипотеза). - Тимур
а откуда мнение, что при квотной выборке анонимность меньше, чем при сплошном уличном опросе? - Анё
искренность этих 2500 не имеет никакого значения, потому что должна быть умножена на произвольную величину - оператор канцелярита from BuddyFeed
опрашивающий на улице не имеет никакой информации о прохожем; опрашивающий по телефону имеет номер телефона, по которому может быть установлен адрес, а зачастую и ФИО ответившего на звонок. - Тимур
у уличного опроса, конечно, есть свои систематические погрешности. - Тимур
опрос 1600 человек по квотной выборке дает результаты, которые находятся с мнением генеральной совокупности в отношениях, описываемых в терминах статистической погрешности, и эта погрешность — величина, однозначным образом исчислимая математическими методами - оператор канцелярита from BuddyFeed
сплошной опрос дает знание о том, что существуют 2500 человек, мнение которых таково — и более никакого знания не дает. - оператор канцелярита from BuddyFeed
не согласен, что знания не дает. но достоверность сплошного опроса нельзя оценить из общих соображений, когда выборка очень мала по сравнению с генеральной совокупностью. эмпирически можно установить: провести 20 таких опросов и посмотреть, в какой ширины полосу ложатся с 95% вероятностью результаты. - Тимур
я сейчас в вандербула на ровном месте превращусь, извините. - оператор канцелярита from BuddyFeed
Не имел намерения вас злить. По-моему ровно по вашим словам: в 20 раз - это более чем на порядок большая выборка(50 тыс.), а дисперсия, надо полагать, будет больше, чем для квотной в 2500. - Тимур
не имели, просто опровергали закон всемирного тяготения с точки зрения здравого смысла. опровергли успешно. - оператор канцелярита from BuddyFeed
ничего подобного, просто общестатистический подход. есть воспроизводимость, есть наука; нет - нету. 2500 - дает данные, но не научные, т.к. погрешность определения неизвестна. 50 тыс. как 20х2500 - это научные данные, но а) технически сложно б) погрешность все равно велика. это и сокращается до фразы "всего лишь мнение 2500". но это не аксиома. - Тимур
сейчас до десктопа дойду и отвечу развернуто. пока коротко: уличный опрос 50 тысяч без дополнительных условий тоже может быть шумом - оператор канцелярита from BuddyFeed
1) Дисклеймер: в википедию не смотрю, так что могут быть терминологические ошибки, зато не будет ерунды. Не будем рассматривать такие параметры как искренность респондентов и возможность недостоверного исполнения со стороны интервьюеров. Эти проблемы, кстати, тоже более или менее решаются в компаниях, профессионально занимающихся исследованием общественного мнения, но они сейчас малозначимы. - оператор канцелярита
2) На чем вообще основана выборочная социология (как и любые виды выборочного контроля, например любой разрушающий контроль качества на предприятиях)? На предположении, что свойства выборки (прямо исследуемой совокупности) с некоторой (вычисляемой) точностью совпадают со свойствами генеральной совокупности. - оператор канцелярита
3) Проще всего дела обстоят со случайной выборкой. Из генеральной совокупности при помощи хорошего генератора случайных чисел выбирается исследуемая совокупность. Вероятности совпадения свойств этой выборки со свойствами генеральной совокупности — чистая математика, которую я забыл, но в которой нет эмпирически выведенных коэффициентов, всё строго. В дефектологии выборка делается понятно как, в социологии запускают генератор случайных чисел на данных переписи населения для общих исследований и на списках голосующих для выборных. - оператор канцелярита
4) Последовательная выборка (когда мы тыкаем в совокупность в каком-то месте и выбираем оттуда сколько-то подряд) — много хуже. Например, можно выбрать треть совокупности и получить результат, верный только для этой трети. Дело в том, что мы ничего не знаем о структуре нашей генеральной совокупности (и о самом наличии такой структуры, конечно). При случайной выборке структура не оказывает никакого влияния. Скажем, мы можем взять 10 подряд деталей из 100 и ничего не узнать о том, что 20 деталей подряд были испорчены из-за сбоя в подаче газа в печь. Вероятность такого события можно посчитать, она точно больше половины. При случайной выборке 10 деталей из ста вероятность того, что ни одна из 20 бракованных не попадет в выборку, много меньше. Считать, опять же, не буду, потому что за формулами надо лезть в гугель, а единственный способ для меня написать этот текст — не лезть в гугель и написать его с собой на спор. - оператор канцелярита
5) Итого, случайная выборка не просто лучше последовательной, а принципиально лучше. Последовательная выборка гарантированно недостоверна при наличии у генеральной совокупности какой-либо структуры. Опрашивая людей на выходе из «Маяка» в 23:00 и у входа в метро «Щелковская» в 7:00 мы получим не просто разные, а по некоторым вопросам диаметрально противоположные результаты. - оператор канцелярита
6) К сожалению, у полностью случайной выборки есть недостаток: хорошая достоверность достигается на значениях порядка единиц процентов (или десятых долей процентов? опять не помню без интернетов) от генеральной совокупности. В любом случае, на генсовокупности «население РФ» даже десятые доли процента — чуть более чем дохуя. - оператор канцелярита
7) Для обхода этого ужаса придумали квотную выборку — составляется выборка, которая при прочих случайных характеристиках повторяет структуру генеральной совокупности по характеристикам, в отношении которых замечена высокая корреляция с ответами на вопросы. В случае с дефектологией это может быть сохранение в выборке количественных пропорций деталей, выпущенных бригадами А, Б и В во время суток Г, Д и Е. В случае с соцопросами сохранить стремятся соотношение половозрастных характеристик, доходов и характеристик места жительства (город/село, субъект РФ). Заметим, что природа корреляции в обоих случаях не важна для достоверности исследования и может изучаться комиссией по качеству в первом случае и социопсихологами или политологами во втором. - оператор канцелярита
8) Квотная выборка — уже не вполне точная наука. Коэффициенты, которые применяются при подсчете достоверности исследования, выполненного методом квотной выборки, выведены эмпирически. История и контрольные исследования методом случайной выборки показывают высокую пригодность этих эмпирически выведенных коэффициентов. При помощи метода квотной выборки удается получать хорошие результаты на сотых долях процента генсовокупности и приемлемые — на тысячных. - оператор канцелярита
9) Суммируя: 1600 человек квотной выборки на ста миллионах генсовокупности — это не очень хорошо, но терпимо. Есть предмет для разговора, во всяком случае. 50 тысяч случайной выборки на той же совокупности — это хуже, но в принципе тоже есть о чем говорить. 50 тысяч, опрошенных последовательно на улице без внесения дополнительных жестких требований, — довольно бестолковое занятие. - оператор канцелярита
это, я прошу прощения что я вмешиваюсь, но у меня по исходному тексту замечание небольшое. Ты вот пишешь - "А еще фальсификация бывает вот такая", но вообще говоря - там руководящий член организации городских сумасшедших "солидарность" пишет в блогах для городских сумасшедших (то есть на echo.msk.ru) какую-то хуергу. Мне всё-таки кажется что объединять одним термином "фальсификация" безобидные эксперименты какого-то блаженного, который у метро подёргал за пуговицу 10 человек, и чуровские фокусы -- это не совсем верно. - screamager
@screamager я ужасно не люблю, когда люди борются за дело, которое я считаю и своим тоже, совершенно негодными методамии типа «во имя правды будем врать, и врать, и врать». а он сумасшедший? чорт, я не знал. я отнесся как к серьезному высказыванию. если он мелкий псих, это меняет дело, естественно. - оператор канцелярита
@adworse, ну это известная проблема; чикатило, я думаю, согласился бы с тем что 2x2=4, но мы же по этому случаю не отказываемся от базовой ариметики. А перец этот из "солидарности", у которой в лидерах илья яшин, большой поклонник 282-й статьи и одновременно правозащитник лев пономарёв, дядя боря немцов и другие, хм, действующие лица :) - screamager
@ adworse отлично написано - Agent of Evil, Джомсом
а вот Тутубалин примерно о том же, только в профиль http://blog.lexa.ru/2012... Он рассматривает не общую картину, а детали. И в деталях там, к сожалению, такая же фигня. - оператор канцелярита from BuddyFeed