Ложь, большая ложь и статистика

(Спасибо Марку Твену)

Пытаемся апеллировать к цифрам. Иногда даже - без сознательной передержки. Как нашей, так и третьих лиц. И все равно фигня получается.

Существует ли "репрезентативная выборка" (как непротиворечивое и содержательное понятие)?

Многие научные построения основаны на такой логике: по массиву различных явлений определяем усредненное и далее полагаем, что действие этого усредненного явления тождественно действию тех, до усреднения. В молек.физике - так наз. эргодическая гипотеза. Она работает. Чтобы рассчитать давление пара на поршень, не обязательно просчитывать путь каждой молекулы.

Применительно к людям это называется "средняя температура по больнице". Или, чуть грубее, "У среднего человека одна женская грудь и одно яйцо".

Кому, блин, живется весело, Вольготно на Руси?

(Ранис: это тоже из литературы 19-го века, только без блина)
0
От пользователя Акинфо-Потапий
В молек.физике - так наз. эргодическая гипотеза

Эргодическая гипотеза: Среднее по времени равно среднему по ансамблю:-) О действии там вообще речи не идет:-) Если взять много-много одинаковых систем (ансамбль) и усреднить их текущие состояния, то то это сренее будет равняться среднему по состояниям одной-единственной системы, измеряемым в течение долгого-долгого времени:-)
0
Дон.
Не-е, АП, это очень упрощённое распределение сисек и яиц - там всякие дроби получаются.
0
Ну, господа, а я о чем говорю?
Берем ансамбль из М и Ж. Большой такой ансамбль, больше симф.оркестра. Усредняем по сисям и яйцам. (Ну извините, кого коробит...)
Потом применяем усредненные данные к одному солисту. У него, с усреднением по времени, должно все сойтись. Или метод неверен. (Не всегда верен.)
0
О.
От пользователя Акинфо-Потапий
Кому, блин, живется весело, Вольготно на Руси?


А не на Руси?
0
Дон.
АП, а в масштабе всей земли было бы по 0.52 сиськи на каждого индивидуума и по 0.48 яйца. Очень тягостное зрелище получается: усечённое яйцо и сиська с довеском.
0
Не на Руси - это, скажем, Вам виднее будет.
Мне-то кажется, что хорошо жить можно почти везде. И для себя я это с уровнем благ не связываю. Почти.

Но мы тут все же спорим о чем-то. Так что давайте статистику обревизуем как инструмент. А то кждый свое приводит :-) (Да так и будет, конечно)
0
От пользователя Акинфо-Потапий
Применительно к людям это называется "средняя температура по больнице". Или, чуть грубее, "У среднего человека одна женская грудь и одно яйцо".

Естественно это никак не отностится к эргодической гипотезе:-) ДА и та, хотя и экспериментально не опровергнута.. как была так и остается гипотезой... Вообще же статистика, конечно - продажная дефка капитализма (и социализма и вообще всех, кто ей платит). Усредянем то, что нам выгодно не заботясь о доказательстве правомерности усреднения. Раньше для доказательства невозможности использования индуктивного опыта для постороения теории использовался парадокс Рассела:
Мужик целый день садится в разные такси, каждый раз записывает номер и время, когда сел. Вечером приходит домой и строит теорию: Откладывает на графике зависимость номера такси от времени когда в него сел. Потом инерполирует это дело (любые N точек можно соединить многочленом N-1 степени)... Вот и готовая теория зависимости номера от времени. Естественно, следущее же такси в которое он сядет скорее всего не в пишется в такую теорию....
Но тут на "помощь" приходит статистика... Одно такси вносит, говорит статистика, вносит лишь неболушю статистическую шибку теорию, а так- теория верна, и в целом постороенная теория имеет право на существование. "Вы не поверите Патрик" ((с) Тикки Шильен), но подобные "теории" выдвигаются не только откровено продажными статистиками, работающими на политику, но и частенько и учеными экспериментаторами. Сам читал подобные статейки в относительно солидных реферируемых журналах.... :-)
0
Да, Дон. Грустноватое зрелище. Но ничем помочь не могу.
0
От пользователя Акинфо-Потапий
Берем ансамбль из М и Ж

Ансамбль может состоятьтолько из систем, эквивалентных солисту:-) Если солист М, то должны рассматриваться только М, причем с тем же количеством яиц, такого же роста, возраста и т.д. :-)
0
>Ансамбль может состоятьтолько из систем, эквивалентных солисту Если солист М, то должны рассматриваться только М, причем с тем же количеством яиц, такого же роста, возраста и т.д.

Гыы. Подгонка под ответ. В чистом виде.
Если мы все нужное уже знаем об изучаемом объекте, то красивую теорию создать можно.
0
От пользователя Акинфо-Потапий
Гыы. Подгонка под ответ. В чистом виде.

НЕт, такова эргодическая гипотеза:-) Иначе фиг бы вы когда смогли вычислить давеление на прошень зная объем, температуру и количество молекул газа:-)
0
Суть в том, что если надо подсчитать, сколько надо лифчиков для 100 случайных человек - э.г. работает.
У человека 1 сися, у лифчика 2 чашечки - значит, на 100 человек надо 50 лифчиков. Все верно. (Да?)
0
От пользователя Акинфо-Потапий
Суть в том, что если надо подсчитать, сколько надо лифчиков для 100 случайных человек - э.г. работает.

ОНа тут вроде даже рядом не стоит. Что усредняется по времни? Какие выбираются ансамбли?
0
АлисаСелезнёва
статистика про людей это в подавляющем большинстве случаев туфта.
0
Дело не в статистике ...
в методе подсчета и ее трактовании ...

особенно, меня умиляют студенты-социологи, которые не зная мат. статистики в принципе, умудряются трактовать различные аспекты и факторы по цифрам, выданным им программами статистики ...

хотя к среднему арифметическому у меня претензий нет ... это можно посчитать с большой долей достоверности ...
0
>хотя к среднему арифметическому у меня претензий нет ... это можно посчитать с большой долей достоверности ...

Среднее (по доступной выборке!) посчитать можно. А вот всегда ли оно имеет тот смысл, который в него пусть даже и искренне вкладывает автор исследования...
0
Дон.
Не-е, среднее арифметическое - это туфта. Значительно более информативное значение имеет величина... которая я не знаю, как правильно называется, но по-английски звучит median.

[Сообщение изменено пользователем 23.03.2005 11:46]
0
От пользователя Дон.
которая я не знаю, как правильно называется, но по-английски звучит median

Агласите всю аглицкую фразу пжалста... Или дайте определние, а то чето не припоминается чего они (англичане) имеют ввиду....
0
Дон.
Типа, если расставить все сравниваемые величины в один ряд - от самой малой, до самой большой - то медиана будет как раз посередине: половина слева от неё, половина справа.
0
Дон.
По-моему, так и называлось - медиана.

Вообще-то, я в точных науках как был полным профаном, так и сейчас к ним интереса не испытываю.
0
Гм. Расчет по двум крайним точкам, как бы ни легло основное множество?
0
От пользователя Акинфо-Потапий
А вот всегда ли оно имеет тот смысл, который в него пусть даже и искренне вкладывает автор исследования...

НЕ всегда естессьно. Нада доказывать правомерность усреднения. Недаром эг требует эвивалентности систем.
От пользователя The Student
это можно посчитать с большой долей достоверности ...

Степень достоверности - это либо стандартное отклонение SD (Standard deviation) либо стандартная ошибка среднего SEM (Standard Error of the Mean) (ОНа в корень из N раз меньше SD)... Есть ишшо доверительные интервалы... Но все это зависит от конкретных полученных случайных распределений. Далеко не всегда "степень достоверности" бывает удовлетворительной. А если распределение не случайное, то вообще-то усреднение вовсе неправомерно... Хоша... есть челы покруче меня в этом деле - пусть они выскажуться... а то мож где соврал чуток. Кто там с мехмата то был? Кайлер? Иде он?
0
Раз Student есть, пусть он про коэффициенты Стьюдента и пишет.
Но тема не совсем об этом. Ну навесим мы математики - а дальше?
0
От пользователя Boojum
Типа, если расставить все сравниваемые величины в один ряд - от самой малой, до самой большой - то медиана будет как раз посередине: половина слева от неё, половина справа.

Гм.. не понятно что есть "величина" и по какому принципу строится "ряд". От чего берется середина тоже непонятно.

Распределение - это эависимость некоей величины (характеристики) например, скорости частицы, от количества событий с данным значением величины. Всем известное распределение Гаусса (колоколообразная кривая) является симметричным. Значение харатеристики соттветствующее вершине колокола (то бишь то, что посерединке) является средним значением характеристики. Ширина на половине высоты - стандартным отклонением. Чем шире колокол - тем "хуже" усреднение:-) Распределение Гаусса в ноль нигде не обращается, хотя и тремится к нему при стремлении к плюс-минус бесконечностям. Так что определить "самый малый" и "самый большой" сложновато. Есть несимметричнные распределения там с определением среднего не все так красиво и наглядно:-)
0
Авторизуйтесь, чтобы принять участие в дискуссии.