Интересные книги о статистике

comment 1
Книги / наука

Когда пресытился художественной литературой, бизнес-чтивом и книгами по психологии, в голову лезет всякое. Например, почитать про математику или физику.

Вообще тяга к постоянному развитию и расширению кругозора, а также наличие детей способствуют особенному интересу к книгам и авторам, которые умеют в интересной и увлекательной форме рассказать о какой-то области науки или учебном предмете.

Сегодня черёд области, которая со времён учёбы запомнилась как особенно скучная — статистика. Оказывается и про неё можно писать интересно

Чарльз Уилан — «Голая статистика»


Итак, чем же закончился этот трюк для Joseph Schlitz Brewing Company? В перерыве матча за Суперкубок NFL 1981 года в ходе слепой сравнительной дегустации ровно 50% любителей пива Michelob отдали предпочтение Schlitz.

Из этого примера следуют два важных урока: во-первых, вероятность — чрезвычайно мощный инструмент, и во-вторых, многие ведущие сорта пива в 1980-е годы были практически неотличимы друг от друга. Но в этой главе мы сосредоточимся именно на первом уроке.

Повествование организовано в чёткую структуру, хотя в общем суть преследуется цель скорее увлечь предметом и рассказать про основные термины и определения, чем научить пользоваться. То есть это научно-популярное повествовательное чтиво, а не учебник.

Но зато получить представление о том, какие виды среднего бывают, что есть корреляция и регрессионный анализ, а также про Центральную Предельную Теорему, можно в очень наглядной форме с разных сторон.

Помимо структуры и определения терминов книга напичкана юмором и интересными фактами, что и делает её столь увлекательной. Можно узнать, в частности, про парадокс Монти-Холла, о том, как Netflix догадывается о ваших предпочтениях, стоит ли покупать расширенную гарантию (спойлер — нет) и много другого.


Если, например, вы — женщина и находитесь на четвертом–шестом месяце беременности, то в вашем почтовом ящике могут появиться купоны на детскую кроватку и бумажные полотенца — вместе с предложением скидки на газонокосилку и купоном на бесплатные носки для боулинга (при условии покупки любой пары обуви для боулинга). Появление в вашем почтовом ящике купонов для беременных в сочетании с рекламой других товаров, не имеющих никакого отношения к беременности, может показаться вам чистой случайностью. В действительности компания знает, что вы не увлекаетесь боулингом и не стрижете лужайку перед домом. Просто она пытается «замести следы», делая вид, что знает о вас гораздо меньше, чем ей известно на самом деле.

Владимир Савельев — «Статистика и котики»

Очень неплохо идёт в продолжение предыдущей книги и/или если вы вдруг заинтересовались предметной областью, но не знаете с чего начать.

Тут можно открыть для себя такие жутко звучащие темы как меры различий для несвязанных выборок, p-уровень значимости (спойлер — это вероятность того, что нулевая гипотеза верна), к регрессионному анализу добавляется дисперсионный и кластерный, а регрессия рассматривается не только линейная, но и логистическая.

Всё перечисленное и немного другого рассматривается на котиках (что можно предположить из названия), а также пёсиках и слониках (чтобы показать сравнение несвязанных выборок). Ровно на таком уровне, чтобы можно было понять суть терминов и подходов. Без разъяснения деталей. Для тех, кому захочется именно деталей, есть немного их в небольшом приложении и много в другой более специализированной литературе.

Дарелл Хафф — «Как лгать при помощи статистики»

Трудно представить, что кто-то ещё не слышал про эту книгу. В своё время (лет 5-7 назад) она вспоминалась на каждой конференции, где приводились какие-то статистические данные.

Если вы всё-таки пропустили этот момент, скажу, что тут детально раскрывается суть высказывания, приписываемого Дизраэли: «Существует три вида лжи: ложь, наглая ложь и статистика».

Рассматриваются конкретные приёмы введения в заблуждения без необходимости лгать и намеренно искажать информацию — информация искажается на этапе восприятия, а не передачи (только факты, это же статистика, а статистика — область математики. Что может быть точнее?)

Примеры:

  • выбор подходящего среднего (среднее арифметическое, медиана);
  • малые выборки(из 10 раз подброшенная монета может выпасть 8 раз «орлом», на базе этого можно выпускатьть пресс-релиз о том, что независимое исследование демонстрирует более высокую вероятность «орла»);
  • манипуляции с графиками (изменение масштаба одной из шкал, сокрытие части шкал);
  • подмена корреляции причинно-следственной связью.

Несмотря на свой небольшой объём, могу сказать, что «Как лгать при помощи статистики» успешно дополняет список книг, формирующих критическое мышление и иммунитет к подверженности манипуляциям — «Взлом маркетинга«, «Манипуляция сознанием«

1 комментарий

  1. Pingback: Цели на 2019 — Self Engineering

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход /  Изменить )

Google photo

Для комментария используется ваша учётная запись Google. Выход /  Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход /  Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход /  Изменить )

Connecting to %s