Десять уравнений, которые правят миром. И как их можете использовать вы бесплатное чтение

Дэвид Самптер
Десять уравнений, которые правят миром. И как их можете использовать вы

Все права защищены.

Никакая часть данной книги не может быть воспроизведена в какой бы то ни было форме без письменного разрешения владельцев авторских прав.


This edition is published by arrangement with Aitken Alexander Associates Ltd. and The Van Lear Agency LLC


© David Sumpter, 2020

© Издание на русском языке, перевод, оформление. ООО «Манн, Иванов и Фербер», 2022

* * *

Список иллюстраций

Рис. 1. Иллюстрация, как логистическая регрессия дает оценки α = 1,16 и β = 1,25

Рис. 2. Иллюстрация теоремы Байеса

Рис. 3. Нормальное распределение

Рис. 4. Как предположение о марковости может оценивать передачи в футболе

Рис. 5. Парадокс дружбы для четырех участников

Рис. 6. Как меняется со временем отношение к трем товарам

Рис. 7. Иллюстрация к вычислению корреляции между Кайли и косметикой

Рис. 8. Как отслеживающая переменная отслеживает вознаграждение

Рис. 9. Как обучается нейронная сеть

Рис. 10. Иллюстрация сортировки слиянием и алгоритма Дейкстры

Введение: «Десятка»

Существует ли секретная формула обретения богатства? Или счастья? Или популярности? Или уверенности в себе и здравомыслия?

Если вы просматриваете книги в местном магазине и выбрали эту или только что щелкнули по кнопке «Заглянуть» в онлайн-магазине, то знайте: есть множество заголовков, которые предлагают вам какую-нибудь формулу для успеха в жизни.

Мари Кондо советует убраться. Шерил Сэндберг – не бояться действовать. Джордан Питерсон призывает выпрямиться. Брене Браун – быть уязвимыми[1]. Вам говорят, что вам надо, пес раздери, успокоиться; прекратить делать вон ту фигню, забить на всё, не быть лохом и извлекать пользу из каждого чертова момента в жизни. Нужно рано вставать, заправлять постель, расчищать путь, меньше делать, больше запоминать, избавляться от хлама в голове, добиваться целей, взращивать силу воли, писать формулы счастья[2], «поступать как женщина, думать как мужчина»[3]. Есть формулы любви, богатства, план успеха и пять (или восемь, или двенадцать) правил уверенности в себе. Есть даже, видимо, чудо-уравнение, которое обещает сделать невозможные цели неизбежными[4].

Эти советы парадоксальны. Если бы все было так просто, если бы существовали несложные формулы для получения всего, чего мы хотим от жизни, то откуда же все эти книги и журналы, заполненные нравоучениями (зачастую противоречивыми)? Почему так много воодушевляющих телешоу и выступлений на конференциях TED с мотивационными монологами? Можно же просто сформулировать уравнения, дать несколько примеров, как они работают, и закрыть всю индустрию самосовершенствования и правильного мышления. Если здесь все так «математично», аксиоматично, почему не дать ответ прямо сейчас?

Количество предлагаемых решений жизненных проблем растет, и все труднее поверить, что есть одна формула для успеха (или даже несколько). Может, на самом деле нет простого лекарства от всех проблем, что ставит перед нами жизнь?

Я хочу, чтобы вы подумали о другой возможности – той, о которой повествует книга. Я расскажу историю о замечательном обществе людей, взломавших этот код. Они обнаружили несколько уравнений (десять), которые могут принести успех, популярность, богатство, уверенность в себе и здравомыслие. Они хранят секрет, пока остальные ищут ответы.

Это тайное общество было с нами столетиями. Его члены передавали свои знания из поколения в поколение. Они занимали высокие посты на государственной службе, в финансовой сфере, в академических кругах, а с недавнего времени – в технологических компаниях. Они живут среди нас, незримо, но активно консультируя нас, а иногда и контролируя. Они богаты, счастливы и уверены в себе. Они открыли секреты, которых так жаждут остальные.

В книге Дэна Брауна «Код да Винчи» криптограф Софи Невё при расследовании убийства своего деда обнаруживает какой-то математический код. Она знакомится с профессором Робертом Лэнгдоном, который открывает ей, что ее дед был главой тайного общества Приорат Сиона, где мир понимается через единственное число – золотое сечение (φ ≈ 1,618).

«Код да Винчи» – выдумка, но тайное общество, которое я изучал в рамках этой книги, имеет много общего с описанным Брауном. Его тайны зашифрованы в коде, который мало кто понимает до конца, а его члены общаются с помощью загадочных документов. Общество уходит корнями в христианство, его раздирают внутренние моральные сражения и конфликты. Но, как мы вскоре узнаем, оно во многом отличается от Приората Сиона. В частности, в нем нет ритуалов. Именно поэтому его гораздо труднее обнаружить, но его деятельность повсеместна. И оно невидимо для тех, кто снаружи.

Но откуда о нем знаю я? Ответ очень прост. Я в нем состою. Двадцать лет я участвовал в его работе, все более тяготея к его внутреннему кругу. Изучал работы этого общества и применял его уравнения на практике. На своем опыте ощутил успех, который может дать доступ к его коду. Работал в ведущих университетах мира и получил должность профессора прикладной математики за день до своего тридцать третьего дня рождения. Решал научные задачи в самых разных областях – от экологии и биологии до политологии и социологии. Консультировал людей из правительства, из области спорта, азартных игр, финансистов и специалистов по искусственному интеллекту. И я счастлив – отчасти благодаря своему успеху, но в основном, полагаю, из-за того, что секреты, которые узнал, сформировали мое мышление. Эти уравнения сделали меня лучше: сбалансировали мое мировоззрение и помогли понимать действия других.

Членство в клубе дало мне много знакомств с единомышленниками. С такими людьми, как Мариус и Ян – молодые профессиональные игроки, получающие выгоду на азиатских рынках ставок; Марк, микросекундные расчеты которого дают прибыль от небольших неэффективностей в ценах акций. Я работал с аналитиками футбольного клуба «Барселона», изучавшими, как Лионель Месси и компания контролируют поле. Я встречался с техническими экспертами, работающими в Google, Facebook, Snapchat и Cambridge Analytica, которые управляют нашими соцсетями и создают будущий искусственный интеллект. Я лично наблюдал, как исследователи Моа Бёрселл, Николь Нисбетт и Виктория Спейсер используют уравнения, чтобы обнаружить дискриминацию, понять наши политические дискуссии и сделать мир лучше. Я учился у старшего поколения – например, у 94-летнего профессора Оксфорда сэра Дэвида Кокса, открывшего код, на котором построено это тайное общество.

Теперь я готов рассекретить это общество. Я буду называть его «Десятка» – по числу уравнений, которые должен знать каждый компетентный участник. Я готов открыть эти секретные уравнения.

Проблемы, которые решает «Десятка», включают повседневные вопросы. Нужно ли вам бросать работу (или разрывать отношения) и пробовать что-то другое? Почему вы ощущаете, что менее популярны, чем окружающие? Сколько усилий надо приложить, чтобы стать популярнее? Как лучше справляться с огромным потоком информации из соцсетей? Должны ли вы позволять своим детям пялиться в телефон по шесть часов в день? Сколько эпизодов какого-нибудь сериала Netflix вам нужно посмотреть, прежде чем пробовать что-то другое?

Возможно, это не те проблемы, которые, на ваш взгляд, должно решать тайное общество. Но дело вот в чем. Один и тот же небольшой набор формул может дать ответы на тривиальные и глубокие вопросы, рассказать о вас как о личности, а также об обществе в целом. Уравнение уверенности, введенное в главе 3, которое помогает решить, стоит ли вам бросать работу, также позволяет профессиональным игрокам узнать, когда у них есть преимущество на рынке ставок, и выявляет малозаметные расовые и гендерные предубеждения на работе. Уравнение вознаграждения, описанное в главе 8, показывает, как соцсети довели общество до критической точки и почему это не обязательно плохо. Если мы поймем, как интернет-гиганты используют данное и другие уравнения, чтобы вознаграждать нас, влиять на нас и классифицировать нас, мы сможем лучше сбалансировать свое пользование соцсетями, играми и рекламой, а также погруженность в них наших детей.

Мы знаем, что эти уравнения важны, поскольку принесли успех людям, которые их уже применяют. В главе 9 излагается история трех инженеров из Калифорнии, которые использовали уравнение обучения, чтобы увеличить на 2000 % время, затрачиваемое людьми на просмотр YouTube. Уравнение ставок, уравнение влияния, уравнение рынка и уравнение рекламы изменили, соответственно, ставки, технологии, финансы и рекламу, принеся миллиарды долларов небольшому числу членов «Десятки».

По мере того как вы будете изучать уравнения в этой книге, начнут обретать смысл всё новые аспекты мира. Когда вы смотрите глазами участника «Десятки», крупные проблемы становятся мелкими, а мелкие – тривиальными.

Если вы просто ищете быстрые решения, то, конечно, есть одна загвоздка. Чтобы попасть в «Десятку», нужно овладеть новым способом мышления. Она просит разделить мир на три категории: данные, модель и бессмыслица.

Одна из причин, почему «Десятка» сегодня так сильна, в том, что данных сейчас больше, чем когда-либо: движения на фондовой бирже и рынках ставок, личная информация о том, что мы любим, покупаем и делаем, которую собирают Facebook и Instagram. Государственные организации владеют данными о том, где мы живем, как работаем, в какую школу ходят наши дети, сколько мы зарабатываем. В опросах общественного мнения собираются и обобщаются наши политические взгляды и позиции. В соцсетях, блогах и на новостных сайтах копятся новости и мнения. Регистрируется и сохраняется каждое движение звезд спорта на игровых полях.

Взрывной рост данных очевиден всем, но участники «Десятки» осознали важность математических моделей для их объяснения. Как и они, вы можете научиться строить модели, использовать уравнения для управления данными и их использования, чтобы получить выгоду – небольшое преимущество над другими.

Последняя категория, бессмыслица, – то, что нужно научиться распознавать. Вы поймете, что, как бы ни приятно было говорить чушь и как бы много времени мы этому ни посвящали, вам придется отказаться от этого, когда вы начнете мыслить как участник «Десятки». Вам нужно назвать бессмыслицу бессмыслицей, когда вы с ней встретитесь, – и неважно, кто ее говорит. Я покажу вам, как игнорировать бессмыслицу и сосредоточиться на данных и моделях.

Это не просто очередная книга по самосовершенствованию. Это не Десять заповедей. Это не список того, что разрешено, а что запрещено. Здесь есть уравнения, но нет рецептов. Вы не можете просто заглянуть на страницу 181 и узнать точное количество эпизодов сериала Netflix, которые вам нужно посмотреть.

Правила и рецепты эксплуатируют наши страхи. Но эта книга не использует страхи, а объясняет, как эволюционировал код «Десятки» и как он определял последние 250 лет человеческой истории. Мы будем учиться у математиков, которые разработали этот код, и поймем философию, лежащую в основе их мышления. Обучение у «Десятки» подвергает сомнению многие наши повседневные принципы. Вас ждет переосмысление терминов (например, политкорректность), переоценка суждений о других людях и пересмотр стереотипов.

Это также рассказ о морали, поскольку с моей стороны было бы неправильно раскрыть так много секретов, не исследовав, как общество «Десятки» повлияло на мир. Если какая-то малая группа людей может управлять остальными, нам нужно знать, что определяет их выбор. Эта история заставила меня заново оценить себя и мои действия, задаться вопросом, можно ли считать «Десятку» добром или злом, и задуматься о моральных правилах, которые нам нужно установить для себя в будущем.

Передавая силу новому поколению, дядя Человека-паука говорит ему: «С большой силой приходит большая ответственность». Когда на карту поставлено так много, скрытые возможности «Десятки» требуют еще большей ответственности, чем костюм Человека-паука. Вы узнаете секреты, которые могут изменить вашу жизнь. И вам придется также задуматься о том, какое влияние они оказали на мир, в котором мы живем. Слишком долго этот код был доступен только немногим избранным.

Сейчас мы поговорим об этом – открыто и вместе.

Глава 1. Уравнение ставок


Первое, что меня поразило в Яне и Мариусе, когда мы пожимали друг другу руки в холле гостиницы, – они были ненамного старше студентов, которым я преподавал в университете. И я надеялся узнать от них о мире азартных игр столько же, сколько они, по-видимому, рассчитывали узнать от меня о математике.

Мы поддерживали отношения в Сети, но увиделись впервые. Они прилетели пообщаться в рамках своего рода европейского турне, где встречались по очереди с прогнозистами и специалистами по ставкам на футбол – чтобы разработать собственную стратегию на следующий год. Мой родной город Уппсала в Швеции был последней их остановкой.

– Мы захватим ноутбуки в паб? – спросил меня Мариус, когда мы собирались уйти из гостиницы.

– Конечно, – ответил я.

Хотя это была просто встреча, «чтобы лучше узнать друг друга», а настоящая работа предполагалась на следующий день, все мы понимали, что даже для самых неформальных обсуждений нужно обрабатывать большие массивы данных. Ноутбуки всегда должны быть наготове.

Возможно, вы думаете, что для успешных футбольных ставок надо много знать, глубоко понимать эту игру, в том числе и форму всех спортсменов, иметь представление о травмах и, вероятно, получить какую-то инсайдерскую информацию. Может быть, десять лет назад дела обстояли именно так. В те времена внимательное наблюдение за матчами, за языком тела футболистов и отслеживание того, как они действуют в ситуациях один на один, могло дать вам преимущество перед игроками, которые примитивно ставили на команду, игравшую на своем поле. Но теперь все не так.

Ян проявлял к футболу лишь поверхностный интерес и не планировал смотреть большую часть матчей, на которые мы собирались делать ставки на предстоящем чемпионате мира 2018 года. «Буду смотреть матчи сборной Германии», – сказал он с улыбкой.

Был вечер церемонии открытия, весь мир следил за событиями. Однако если не считать интереса Яна к своей сборной, ему было все равно, о чем речь – о Бундеслиге, высшей лиге чемпионата Норвегии или чемпионате мира; о теннисе или конном спорте. Любой турнир и любой вид спорта были для него и Мариуса очередной возможностью заработать деньги. Именно поиск таких возможностей и привел их ко мне.

Несколькими месяцами ранее я опубликовал статью о моей собственной модели ставок[5]. Это была необычная математическая модель. Перед началом сезона Премьер-лиги сезона 2015/16 я написал единственное уравнение и предположил, что оно может улучшить коэффициенты букмекеров для исходов матчей Премьер-лиги. Так и оказалось.

К маю 2018 года прибыль составила 1900 %. Если бы вы в августе 2015 года вложили 100 фунтов в мою модель, то меньше чем за три года у вас было бы 2000 фунтов. Вам требовалось лишь бездумно делать те ставки, что предлагала моя модель.

Мое уравнение не имело ничего общего с тем, что происходило на поле. Оно никак не было связано с просмотром матчей, и ему однозначно было все равно, кто стал чемпионом мира. Эта математическая функция брала коэффициенты букмекеров, слегка подправляла их в соответствии с влиянием информации о прошлых матчах и предлагала выигрышные ставки.

Свое уравнение я совершенно не скрывал, и оно привлекло довольно большое внимание. Я опубликовал подробности в журнале «1843», принадлежащем The Economist Group, и рассказывал о нем в интервью BBC, CNBC, в газетах и социальных сетях. И именно об этой модели меня спрашивали сейчас Ян и Мариус.

– Как вы считаете, почему у вас по-прежнему преимущество? – спросил Мариус.

Валюта азартных игр – информация. Если вы знаете то, чего не знают другие, и эта информация приносит деньги, вам не придет в голову делиться ею. Чтобы защитить преимущество, нужно соблюдать тайну. Если схему будут использовать и другие игроки, букмекеры скорректируют свои коэффициенты. Преимущество исчезнет. По крайней мере в теории. Но я поступил наоборот: рассказал всем о своем уравнении. Мариусу было интересно, почему, несмотря на огласку, моя модель по-прежнему работает.

Значительную часть ответа на вопрос Мариуса можно найти в ежедневно получаемых мной электронных письмах и личных сообщениях в твиттере, где меня спрашивают: «Как думаете, кто выиграет завтрашний матч? Много читал о вас и начал в вас верить»; «Намереваюсь накопить средства, чтобы начать бизнес. Ваши советы о футболе однозначно ведут меня в нужном направлении»; «Кто выиграет – Дания или Хорватия? Чувствую, что Дании удастся победить, но не совсем уверен»; «Как вы думаете, каков будет результат ближайшего матча сборной Англии? Ничья?». Такие просьбы не прекращаются.

Мне не особенно приятно об этом говорить, но причина отправки подобных сообщений и есть ответ на вопрос Мариуса. Как бы я ни демонстрировал ограничения своего подхода и как бы ни подчеркивал долговременность стратегии, основанной на статистике, публика в основном задавала вопросы: «Выиграет ли “Арсенал” на выходных?» или «Выйдет ли Египет из группы, если Салах не будет играть?»

И это еще цветочки. Люди, которые мне пишут, хотя бы ищут в интернете советы по математике и азартным играм. Гораздо больше тех, кто забавляется безо всяких исследований. Они играют на внутреннем чутье, ради развлечения, по пьяному делу, потому что не могут остановиться. И в целом их намного больше, чем тех, кто использует мой метод или нечто подобное.

– Моя модель продолжает выигрывать, потому что она предполагает ставки, которые многие не желают делать, – объяснил я Мариусу. – Ставить на ничью в матче «Ливерпуль» – «Челси» или на то, что «Манчестер Сити» обыграет «Хаддерсфилд», где коэффициент очень мал, скучно и невесело. Чтобы получить какую-то прибыль, нужно время и терпение.

Первое электронное письмо Мариуса попало в один процент сообщений, отличившихся от общей массы. Он рассказал мне об автоматизированной системе, которую они с Яном разработали, чтобы получать выгоду на рынках ставок. Их идея заключалась в использовании того, что большинство букмекеров – «мягкие»: они предлагают коэффициенты, не всегда отражающие реальную вероятность победы той или иной команды.

Подавляющее большинство игроков (вероятно, все те, кто спрашивал у меня совета) используют мягких букмекеров. Ведущие конторы – Paddy Power, Ladbrokes и William Hill – мягкие, как и менее крупные организации вроде RedBet и 888sport. Они отдают предпочтение специальным предложениям, побуждающим людей играть, но уделяют меньше внимания определению тех коэффициентов, которые отражают вероятные исходы спортивных событий. А вот «резкие» букмекеры, например Pinnacle или Matchbook, определяют коэффициенты для предсказания результатов более точно; этими конторами, как правило, пользуются лишь 1 % игроков[6].

Идея Мариуса и Яна состояла в использовании резких букмекеров, чтобы забирать деньги у мягких. Их система отслеживала ставки у всех букмекеров и выискивала расхождения. Если один из мягких букмекеров давал более выгодные коэффициенты, чем резкие, их система предлагала сделать ставку у него. Такая стратегия не гарантировала победу, однако давала Яну и Мариусу важнейшее преимущество, потому что резкие букмекеры были точнее. В долгосрочной перспективе после сотен ставок они выиграли бы деньги у мягких.

Однако у системы было одно ограничение: мягкие букмекеры блокируют победителей. Именно эти конторы решают, хотят ли они иметь с вами дело; и как только видят, что на счетах, скажем, Яна и Мариуса скапливается прибыль, отстраняют их от игры, отправляя сообщение: «Теперь ваша максимальная ставка – 2,5 фунта стерлингов».

Парни нашли способ обойти эту проблему. Они создали службу подписки. За ежемесячную плату подписчикам отправлялись прямые ссылки на выгодные коэффициенты у мягких букмекеров. Это означало, что Ян с Мариусом получали прибыль, даже если их самих заблокировали. Беспроигрышный вариант для всех, кроме букмекеров. Игроки могли получать советы, которые давали выигрыш в долгосрочной перспективе, а Ян с Мариусом брали свою долю.

Вот почему я сидел в пабе с этой парочкой. Они овладели искусством сбора данных и автоматического размещения ставок. Я написал уравнение, которое могло дополнительно увеличить их преимущество: моя модель Премьер-лиги способна была выигрывать не только у мягких букмекеров, но и у резких.

В тот момент я полагал, что обладаю преимуществом для предстоящего чемпионата мира. Однако для проверки моей гипотезы мне требовалось больше данных. Прежде чем я закончил рассказывать о своей идее, Ян открыл ноутбук и попытался поймать Wi-Fi.

– Уверен, что смогу найти коэффициенты для отборочного турнира и для восьми последних крупных международных соревнований, – сказал он. – У меня есть программа для веб-скрейпинга [автоматического просмотра сайтов и загрузки данных с них].

К концу ужина у нас был план, и мы определили данные, которые необходимы для его осуществления. Ян отправился обратно в гостиницу и поставил компьютер заниматься всю ночь веб-скрейпингом коэффициентов для прошлых турниров.

* * *

И Ян, и Мариус принадлежат к новому поколению профессиональных игроков. Они умеют программировать, знают, как добывать данные, и понимают математику. Игроки такого типа зачастую меньше интересуются конкретным видом спорта и больше – числами, чем игроки старой школы. Но они точно так же заинтересованы в зарабатывании денег, и это у них получается гораздо лучше.

Обнаруженное мною преимущество при ставках привлекло ко мне внимание этой пары, и я оказался на периферии их игровой сети. Однако когда я задавал им вопросы о других проектах, по осторожным ответам было понятно, что о полноправном членстве в их клубе речи не было. Во всяком случае пока. Я был любителем – и они просто смеялись надо мной, когда я сказал, что планирую поставить 50 фунтов в разрабатываемой нами системе, – и информацию о других проектах выдавали только по мере необходимости.

Но один знакомый был более откровенен. Недавно он ушел из этой индустрии и был рад поделиться своим опытом, хотя и не пожелал, чтобы я раскрыл его место работы и личность; так что назовем его Джеймсом.

Джеймс сказал мне:

– Если у вас есть реальное преимущество, то скорость вашего обогащения ограничена только скоростью, с которой вы способны делать ставки.

Чтобы понять смысл высказывания Джеймса, сначала представим традиционные инвестиции с доходностью 3 %. Если вы вкладываете 1000 фунтов, то через год у вас будет 1030 – вы получите прибыль 30 фунтов.

Теперь представим игру на сумму 1000 фунтов с преимуществом в 3 % перед букмекерами. Наверняка вы не захотите рисковать сразу всем капиталом при единственной ставке. Так что начнем со ставки в 10 фунтов – относительно умеренный риск. Вы не будете выигрывать каждый раз, но преимущество в 3 % означает, что в среднем на одну ставку в 10 фунтов вы станете получать прибыль 30 пенсов, поэтому уровень доходности для капитала в 1000 фунтов составляет 0,03 % при каждой ставке.

Чтобы получить прибыль 30 фунтов, вам придется сделать 100 ставок по 10 фунтов. Сто ставок в год, примерно две в неделю, – это больше, чем делает большинство из нас. И нас, любителей, отрезвляет мысль, что, даже если у вас есть какое-то преимущество, вы как случайный игрок-любитель не можете ожидать слишком многого от капиталовложения в 1000 фунтов.

Однако парни, с которыми работал Джеймс, не были случайными игроками. По всему миру нетрудно найти 100 матчей за один день. Ян недавно загрузил данные по 1085 различным лигам. Добавьте теннис, регби, скачки и все прочие виды спорта, и вы обнаружите массу возможностей для ставок.

А теперь представим, что Джеймс и его коллеги имеют какое-то преимущество и целый год ставят каждый день на сотню матчей. Примем также, что по мере роста своих доходов они увеличивают ставки пропорционально имеющемуся капиталу; то есть когда у них появилось 10 000 фунтов, они ставят по 100 фунтов, при капитале 100 000 фунтов – по 1000 фунтов и т. д. Сколько получат игроки к концу года, имея преимущество всего лишь в 3 %? 1300, 3000, 13 000 или 310 000 фунтов? На самом деле к концу года у них будет 56 860 593,8 фунта. Почти 57 миллионов! Да, каждая ставка умножает их капитал всего на 1,0003, однако после 36 500 ставок вступает в игру мощь показательного распределения, и их прибыли резко взлетают[7].

Но на практике такой рост недостижим. Хотя резкие букмекерские конторы, которыми пользовались Джеймс с коллегами, разрешают ставить больше, чем мягкие, ограничения всё равно существуют. Джеймс сказал мне:

– Букмекерские компании в Лондоне выросли так быстро и стали такими масштабными, что они вынуждены теперь делать ставки через брокеров. Иначе, если станет широко известно, что они делают определенную ставку на конкретный матч, на этот рынок хлынут все остальные и их преимущество исчезнет.

Несмотря на такие ограничения, деньги по-прежнему текут в букмекерские компании, которыми управляют уравнения. Достаточно посмотреть на стильные интерьеры их офисов в Лондоне, чтобы убедиться в этом. Сотрудники одного из лидеров отрасли, Football Radar, начинают день с бесплатного завтрака, имеют доступ в роскошный спортзал, могут сделать перерыв и поиграть в теннис или PlayStation и располагают всем необходимым компьютерным оборудованием. Специалистам по обработке данных и создателям программного обеспечения предлагают работать в свободное время, а компания утверждает, что гарантирует такую творческую среду, которая обычно ассоциируется с Google или Facebook.

В Лондоне базируются и два основных конкурента Football Radar – Smartodds и Starlizard. Они принадлежат соответственно Мэттью Бенхэму и Тони Блуму, карьера которых началась благодаря умению обращаться с числами. Бенхэм учился в Оксфорде, где начал работать в сфере азартных игр, основываясь на статистике, а Блум обладает опытом профессионального игрока в покер. В 2009 году оба они приобрели футбольные клубы из родных городов: Блум купил «Брайтон энд Хоув Альбион», а Бенхэм – «Брентфорд». Кроме того, второй решил добавить к своим активам и резкую букмекерскую контору Matchbook.

И Бенхэм, и Блум сумели использовать незначительное преимущество и с помощью больших данных получили колоссальные прибыли.

* * *

Преимущество, которое я предложил Яну и Мариусу для вероятности победы их фаворита в каком-нибудь матче чемпионата мира, основано на следующем уравнении:



где x – коэффициент букмекера на победу фаворита. Коэффициент здесь понимается в британском формате: если он составляет 3 к 2 или x = 3/2, это означает, что на каждые поставленные 2 фунта в случае победы чистый выигрыш составляет 3 фунта.

Разберемся, о чем на самом деле говорит уравнение 1. Начнем с левой стороны, где я написал: «P{фаворит выигрывает}». Ни одна математическая модель не предсказывает победу или поражение с абсолютной точностью. Они говорят о вероятности того, что выиграет фаворит, и эта вероятность – число от 0 до 100 %. Оно определяет уровень уверенности, который я приписываю результату.

Эта вероятность зависит от того, что написано в правой части уравнения, куда входят три буквы: латинская x и греческие α и β. Одна студентка сказала мне, что математика казалась ей понятной, пока речь шла о латинских иксах и игреках, но стала трудной, когда начались греческие альфы и беты. Для математиков это звучит смешно, потому что x, α и β – только символы, они не делают науку проще или сложнее, так что я думаю, что студентка всего лишь шутила. Но она попала в точку: когда в уравнениях встречаются α и β, математика обычно сложнее.

Так что давайте начнем без них. Уравнение



понять гораздо проще. Если, скажем, коэффициент был 3/2 (2,5 в европейской системе или +150 в американской)[8], вероятность того, что фаворит выиграет, равна



По сути, это уравнение без α и β дает нам оценку букмекера для победы фаворита. Он считает, что шансы фаворита на победу в матче составляют 2/5, или 40 %. В остальных 60 % случаев будет ничья или победит аутсайдер.

Без α и β (точнее, при α = 1 и β = 1) мое уравнение ставок относительно несложно понять. Однако без α и β оно не принесет денег. Почему? Поставим 1 фунт на фаворита. Если коэффициент букмекера верен, два раза из пяти вы выиграете 1,5 фунта, а три из пяти проиграете по 1 фунту. Поэтому в среднем вы выиграете



Иными словами: после нескольких ставок вы почти ничего не выиграете. Нуль. Пшик. На деле всё еще хуже. Для начала я предположил, что коэффициенты букмекеров справедливы[9]. На самом деле нет. Букмекеры всегда подправляют их, чтобы ситуация складывалась в их пользу. И вместо того, чтобы предложить 3/2, заявят, скажем, 7/5. И если вы не знаете, что делаете, букмекеры всегда выиграют, а вы проиграете. При коэффициенте 7/5 вы будете в среднем проигрывать 4 пенса на ставку в 1 фунт[10].

Единственный способ обыграть букмекеров – рассмотреть эти числа, и именно такие данные компьютер Яна собирал после того, как мы посидели в пабе. Он скачал коэффициенты и результаты для всех матчей чемпионатов мира и Европы, включая отборочные игры, начиная с чемпионата мира в Германии в 2006 году. Утром, усевшись в моем офисе в университете, мы начали искать преимущество.

Сначала мы загрузили данные и посмотрели на них в таблице, подобной нижеприведенной.



Из таких прошлых результатов мы можем получить представление о том, насколько точны коэффициенты: для этого надо сравнить два последних столбца вышеприведенной таблицы. Например, в матче между Испанией и Австралией на чемпионате мира 2014 года коэффициенты дают вероятность 73 %, что Испания выиграет, и она действительно победила. Это можно считать «хорошим» прогнозом. А вот Коста-Рика обыграла Италию, хотя коэффициенты давали 63 % на победу итальянцев, – «плохой» прогноз.

Я пишу слова «хороший» и «плохой» в кавычках, поскольку нельзя сказать, хорош или плох прогноз, если нет альтернативы, с которой его можно сравнить. Вот здесь и появляются α и β. Их называют параметрами уравнения 1. Это величины, которые мы можем менять для тонкой настройки нашего уравнения, чтобы сделать его точнее. Мы не можем изменить итоговые коэффициенты для матча Испания – Австралия и определенно неспособны повлиять на результат этого матча сборных; но можем выбрать α и β так, чтобы получить более точный прогноз, чем у букмекеров.

Метод поиска наилучших параметров – логистическая регрессия. Чтобы описать, как она работает, сначала посмотрим, как можно улучшить наш прогноз на матч Испания – Австралия с помощью корректировки числа β. Если я приму β = 1,2 и оставлю α = 1, получу



Поскольку результатом матча была победа Испании, прогноз на победу в 77 % лучше, чем прогноз букмекеров, который давал 73 %.

Но здесь есть проблема. Если я увеличу β, то повышу и прогнозируемую вероятность победы Англии над Уругваем – с 51 до 52 %. Но Англия в том матче 2014 года уругвайцам проиграла. Чтобы справиться с этой проблемой, я могу увеличить другой параметр, назначив α = 1,1 и оставив при этом β = 1,2. Теперь уравнение предсказывает, что Испания обыграет Австралию с вероятностью 75 %, а Англия обыграет Уругвай с вероятностью 49 %. Изменив исходные значения α = 1 и β = 1, мы улучшили прогноз на оба матча.

Я рассмотрел по одному изменению каждого из параметров α и β и сравнил результаты всего по двум матчам. Данные Яна включали 284 матча на всех чемпионатах мира и Европы с 2006 года. Потребовалось бы очень много времени, чтобы вручную менять значения параметров, подставлять их в уравнение и смотреть, улучшают они прогноз или нет. Однако мы можем использовать для вычислений компьютерный алгоритм; именно это и делает логистическая регрессия (см. рис. 1). Она меняет значения α и β так, чтобы дать прогнозы, которые максимально близки к реальным результатам матчей.


Рис. 1. Иллюстрация того, как логистическая регрессия дает оценки α = 1,16 и β = 1,25


Я написал программу на языке Python, которая выполняет все эти вычисления. Запустил ее и смотрел, как она справляется со всеми этими расчетами. Через несколько секунд у меня был результат: наилучшие прогнозы получались при α = 1,16 и β = 1,25.

Эти числа сразу привлекли мое внимание. Сам факт, что оба параметра α = 1,16 и β = 1,25 превосходят 1, показывал сложную связь между коэффициентами и исходами матчей. Проще всего понять эту связь путем добавления к нашей таблице еще одной колонки и сравнения нашей модели логистической регрессии с прогнозами букмекеров.



Здесь мы видим проявление известного опытным игрокам феномена с недооценкой записных фаворитов вроде Испании. Коэффициенты, которые букмекеры устанавливают для таких команд, как правило, занижены, поэтому на них стоит ставить. А более слабые фавориты, вроде Англии в 2014 году, бывают переоценены: их шансы на победу не так высоки, как предполагают коэффициенты. Хотя такие различия между прогнозами и моделью малы, мы с Яном и Мариусом знали, что их достаточно, чтобы получить прибыль.

Мы нашли небольшое преимущество для чемпионата мира. Еще не зная, будет ли это преимущество, замеченное на предыдущих чемпионатах, работать на новом турнире, мы были готовы рискнуть незначительной суммой. Чтобы реализовать систему ставок на основании моего уравнения, хватило времени до обеда. Мы нажали «Запуск» и привели систему в действие. В течение всего чемпионата мира наши ставки размещались автоматически.

После обеда вернулись ко мне домой. Мы с Мариусом уселись смотреть игру Уругвая с Египтом. Ян достал ноутбук и начал скачивать коэффициенты для тенниса.

* * *

Уравнение ставок – это не только один чемпионат мира и даже не только зарабатывание денег на букмекерах. Его настоящая сила в том, что оно заставляет нас смотреть в будущее с точки зрения вероятностей и исходов. Использование уравнения ставок означает следующее: надо отказаться от догадок и навсегда забыть идею, что результат футбольного матча, скачек, финансовой инвестиции, собеседования при приеме на работу или даже романтического свидания можно предсказать со стопроцентной уверенностью. Вы не можете знать наверняка, что произойдет.

Большинство из нас смутно осознают, что события в будущем во многом определяются случайностью. Когда прогноз погоды говорит, что завтрашний день будет солнечным с вероятностью 75 %, не следует слишком сильно удивляться, если по дороге на работу вы попадете под ливень. Однако нахождение небольших преимуществ, скрытых в вероятностях, требует более глубокого понимания.

Если для вас важен конкретный результат, то подумайте, с какой вероятностью он реализуется, а с какой нет. Недавно я разговаривал с CEO одного очень успешного стартапа, который вырос за счет четырех этапов многомиллионных долларовых инвестиций и в котором работает сотня сотрудников, и он радостно признавал, что шансы на долговременную прибыль для него самого и его инвесторов по-прежнему всего лишь 1 из 10. Он самоотверженно и долго работал, но сознавал, что все может внезапно развалиться.

При поиске работы мечты или любви всей жизни шансы на успех при каком-нибудь конкретном заявлении на работу или свидании могут быть весьма малы. Меня часто удивляет, что люди, не прошедшие собеседования, ругают себя за то, что поступили неверно, а не учитывают, что, возможно, в этот день кто-то из других четырех кандидатов сделал все верно. Помните, что до появления на собеседовании ваши шансы составляли 20 %. Пока вы не провалите примерно пять собеседований, нет особых причин беспокоиться о каком-то конкретном результате[11].

Вводить числа в романтику труднее, но здесь применимы те же вероятностные принципы. Не ждите, что на вашем первом свидании в Tinder появится принц или принцесса, но если вы сидите в одиночестве после неудачного свидания номер 34, то полезно поразмыслить над своим подходом.

Определив соответствующие вероятности, подумайте, как они соотносятся с размером ваших инвестиций и потенциальных прибылей. Мой совет мыслить вероятностно не попытка призвать к кармическому спокойствию или внимательности. CEO с шансами на успех один из десяти располагал бизнес-идеей, которая потенциально могла дать результат, подобный Uber или Airbnb: создать компанию стоимостью 10 миллиардов долларов. Даже десятая часть от этой суммы – миллиард, и это огромная ожидаемая прибыль.

Вероятностное мышление поможет вам быть реалистом перед лицом шансов, которые часто обращаются против вас. В скачках и футболе наивные игроки нередко переоценивают маловероятные события, но в реальной жизни мы склонны их недооценивать. Мы по природе осторожны и избегаем рисков. Помните, что награда после того, как вы получите действительно желательную работу или любимого человека, будет колоссальной. Это означает, что нужно быть готовым пойти на большой риск ради достижения цели.

* * *

Математика требует работы и упорства. Пять минут назад я закончил читать одну из самых примечательных работ в истории прикладной математики – статью, которая буквально стоит миллиард долларов. Я знал, что математика здесь важна, но, добравшись до уравнений, решил, что читать стало гораздо труднее. В первый раз я пропустил их, сказав себе, что вернусь к деталям позже, и перешел к интересным фрагментам.

Речь о статье Уильяма Бентера «Компьютерные системы прогнозирования и размещения ставок на скачках: отчет»[12]. Это своеобразный манифест, декларация о намерениях. И это работа человека, одержимого строгостью и верой в то, что он делает, который документировал свой план, прежде чем взялся его реализовывать, – чтобы показать всему миру, что он побеждает благодаря не удаче, а математической уверенности.

В конце 1980-х Уильям Бентер решил обыграть тотализатор скачек в Гонконге. До того как он начал свой проект, азартная игра с высокими ставками была уделом темных личностей, которые шлялись по ипподромам «Хэппи-Вэлли» и «Сатхинь» и по Гонконгскому жокей-клубу, пытаясь собрать инсайдерскую информацию у владельцев, персонала конюшен и тренеров. Они выясняли, завтракала лошадь или нет и была ли у нее дополнительная тайная тренировка. Они сходились с жокеями и расспрашивали их о стратегии в будущих скачках.

Будучи американцем, Бентер был в этом мире посторонним, однако он нашел другой способ получить инсайдерскую информацию – тот, который жучки упустили, хотя он прятался прямо здесь, в помещениях жокей-клуба. Бентер собрал копии справочников-ежегодников с результатами забегов и нанял двух женщин, чтобы вводить эти данные в компьютер. Затем было то, что журнал Bloomberg Businessweek назвал прорывом. Он взял коэффициенты ставок, также имевшиеся в жокей-клубе, и их оцифровал. Именно они позволили Бентеру применить метод, аналогичный тому, что я показывал Яну и Мариусу: использовать уравнение ставок. Это был ключ к нахождению неточностей в предсказаниях игроков и прогнозистов[13].

Бентер на этом не остановился. В основном уравнении, представленном выше, я ограничился выявлением ошибок в букмекерских коэффициентах для футбола. Теперь, при втором или третьем чтении его статьи, я начал понимать, как Бентер оказывался с прибылью за такой долгий промежуток времени. В своей модели я не рассматривал никаких дополнительных факторов, которые помогали бы мне прогнозировать результат матча. Но Бентер делал все возможное и невозможное. Его быстро разраставшиеся данные включали прошлые выступления, возраст лошади, вклад жокея, стартовый номер, местную погоду и множество других факторов. Каждый из них постепенно вносил свой вклад в уравнение ставок. По мере того как он включал все больше подробностей, точность его логистической регрессии и, соответственно, прогнозов увеличивалась. После пяти человеко-лет ввода данных модель была готова, и Бентер начал играть на скачках на ипподроме «Хэппи-Вэлли» с капиталом, заработанным в казино[14].

За первые два месяца игры Бентер получил 50 % прибыли от инвестиций, но еще через два месяца она исчезла. В течение двух следующих лет прибыли Бентера прыгали вверх и вниз – то взлетая до 100 %, то падая почти до нуля. Примерно через два с половиной года модель действительно начала окупаться[15]. Прибыли поднялись до 200, 300, 400 % и далее росли экспоненциально. Бентер сообщил Bloomberg Businessweek, что в сезоне 1990/91 выиграл 3 миллиона долларов[16]. То же издание оценивало, что за следующие два десятилетия Бентер и его немногочисленные конкуренты, использовавшие те же методы[17], заработали на ипподромах Гонконга свыше миллиарда долларов[18].

Самым примечательным в научной статье Бентера было не содержание, а то, что ее мало кто прочитал. За 25 лет после публикации в других научных журналах на нее сослались всего 92 раза. Для сравнения: когда я 15 лет назад написал статью, как муравьи рода Temnothorax выбирают новое жилье, на нее сослались 351 раз.

Игнорируется не только статья Бентера. Он ссылается на публикацию Рут Болтон и Рэндалла Чепмена 1986 года, называя ее «обязательным чтением» для его собственной работы[19]. Однако прошло почти 35 лет, а эта вдохновенная статья, показывающая, как можно получать деньги на американских ипподромах с помощью уравнения ставок, также цитировалась менее 100 раз.

У Бентера не имелось образования в области высшей математики[20], но он был готов делать то, что требовалось. Его описывали как гения, но я так не считаю. Я знаком со многими нематематиками и негениями, которые настойчиво изучали те же статистические методы, что использовал Бентер. Обычно это не игроки. Это биологи, экономисты и социологи, которые используют статистику для проверки гипотез. Но они нашли время, чтобы понять математику.

Я никогда не улавливаю математические рассуждения при первом чтении. И я видел очень мало профессиональных математиков, которые могли бы прочитать и усвоить уравнения, не возвращаясь потом к ним детально. А именно в деталях и кроются секреты.

* * *

Самая большая угроза для любого тайного общества – раскрытие. Современная версия заговора иллюминатов, которая рисует технически подкованных правителей мира, требует, чтобы абсолютно все участники общества молчали о его целях и методах. Если хотя бы один поделится кодом или разгласит планы общества, вся система окажется под угрозой.

Эта опасность раскрытия – главная причина, почему большинство ученых не верят в существование организаций, подобных иллюминатам. Контроль за всей человеческой деятельностью потребует большого общества и масштабной секретности. Риск того, что кто-нибудь расколется и все расскажет, крайне велик.

Однако когда мы погружаемся в уравнение ставок, то видим, что секрет «Десятки» скрыт у всех на виду. Только когда члены общества упорно учатся, он медленно открывается тем, кто его ищет. Этому коду учат во всех школах, а затем в университетах, но мы не понимаем, что мы изучаем. Члены общества лишь смутно осознают, что они участники этого обширного заговора. Они чувствуют, что им нечего раскрывать, нечего признавать и нечего прятать.

Когда молодой перспективный участник «Десятки» читает научную статью Бентера второй и третий раз, он заставляет себя понять ее правильно. Он начинает ощущать связь, простирающуюся на десятилетия и столетия. Бентер, несомненно, чувствовал ее, когда читал работу Рут Болтон и Рэндалла Чепмена. А те до него испытывали то же чувство, когда изучали статью Дэвида Кокса, который предложил в 1958 году логистическую регрессию, ставшую основой их работы. Связь, выкованная математикой, тянется в историческое прошлое, через Мориса Кендалла и Роналда Фишера, работавших между мировыми войнами, и до первых идей о вероятности, высказанных Абрахамом де Муавром и Томасом Байесом в Лондоне XVIII века.

По мере углубления в детали наш юный последователь видит, как перед ним шаг за шагом раскрываются все секреты. Бентер записал истоки своего успеха в коде уравнений. И теперь, спустя 25 лет, можно постепенно разобрать этот успех – один алгебраический символ за другим.

Именно математика, общий интерес к этому уравнению, объединяет нас в пропасти времени и пространства. Как и Бентер до него, наш юный ученый начинает исследовать красоту размещения ставки не с помощью ощущений, а на основании статистической взаимосвязи данных.

* * *

Можно объяснить идею, которая стоит за разработанной нами с Яном и Мариусом стратегией ставок, даже без уравнений, одной фразой: мы обнаружили, что коэффициенты открытия для чемпионата мира (те, которые букмекеры предлагают задолго до начала матча) можно использовать для более точного прогнозирования результатов, чем коэффициенты закрытия (те, которые букмекеры предлагают прямо перед матчем).

Это наблюдение противоречит интуиции. Когда букмекеры устанавливают свои коэффициенты, до начала игры может произойти много неопределенных событий. Травма ведущего игрока (это случилось с Мохаммедом Салахом из сборной Египта), плохая форма целой команды (за несколько недель до чемпионата мира Франция сыграла вничью с командой США), смена тренера в последний момент (как произошло со сборной Испании). Теоретически для отражения всех таких событий коэффициенты должны меняться: если Испания внезапно уволит своего тренера, ее шансы на победу над Португалией упадут.

Коэффициенты действительно меняются, но при этом они скорее не отражают новую реальность, а завышаются. По мере приближения матча на рынке появляются игроки-любители, которые пытаются спрогнозировать результаты матчей, и коэффициенты букмекерских компаний меняются, чтобы отразить их ставки. Например, коэффициенты на победу Франции над Перу увеличились с 2/5 до 1/2 до их матча на групповой стадии турнира. Возможно, некоторые игроки полагали, что если Франция не смогла обыграть США в товарищеском матче, то Перу заработает одно очко, а то и три. Другие любители, несомненно, читали в газетах критику в адрес звездного полузащитника Поля Погба и начали сомневаться в его способностях привести сборную своей страны к успеху. Какими бы ни оказались причины, это был именно тот сценарий, который – как установила наша модель – давал удачные ставки на предыдущих чемпионатах мира. Когда коэффициенты на записных фаворитов повышаются, выгодно их поддержать. Наша автоматизированная система обнаружила такое их изменение, активировала функцию ставки и поставила 50 фунтов на Францию. После матча мы получили 75 фунтов. Просто и эффективно.

Важный навык для специалистов по прикладной математике – объяснить логику в основе используемых моделей. Когда мы с Мариусом после запуска модели смотрели футбол, то обсуждали, почему по мере приближения к чемпионату мира коэффициенты становятся менее точными.

– Большинство наших стратегий основано на идее, что к матчу коэффициенты становятся гораздо точнее, – сказал он. – С чемпионатом мира должно быть что-то особенное.

– Большой объем ставок, – предположил я. – По телевизору сплошной футбол, интересно попробовать. Одни ставят деньги на свою страну из национальной гордости, другие – против какой-то страны.

Мариус согласился. Чемпионат мира дал футболу новую аудиторию, она не может устоять перед искушением поставить деньги на своих любимцев. По нашим прикидкам, верные английские фанаты считают, что было бы здорово заработать немного за счет французов. Мы подумали, как аргентинцы и немцы ставили на Швейцарию, игравшую свой первый матч с Бразилией. Когда на аутсайдеров хлынули деньги, букмекеры увеличили коэффициенты для фаворитов, и наша модель, пойдя против толпы, оказалась выгодной. Не каждый матч давал нам выигрыш (бразильцы неожиданно сыграли со швейцарцами вничью), но история показала, что ставка на серьезных фаворитов прямо перед началом игры, вероятнее всего, приносит прибыль.

Пристрастие любителей ставить на маловероятные события было только частью нашей модели. Уравнение давало более тонкие прогнозы: значения α = 1,16 и β = 1,25 говорили, что в случае не совсем явного фаворита нам нужно, наоборот, поддержать аутсайдера – как в 2014 году, когда Англия проиграла Уругваю. Хорошим примером такого прогноза был матч между Колумбией и Японией. За дни перед ним коэффициенты на победу Колумбии выросли с 7/10 до 8/9. Подставив эти числа в наше уравнение, можно прийти к выводу, что стоит поставить на Японию. Не потому, что у нее было больше шансов на победу в матче (фаворитом по-прежнему оставалась Колумбия), просто уравнение говорило, что теперь на Японию, коэффициенты для которой стали 26/5, ставить выгоднее. И мы оказались правы: Колумбия проиграла, а мы заработали 260 фунтов, поставив 50.

* * *

Сэру Дэвиду Коксу сейчас 95 лет, и он никогда не прекращал трудиться. За свою 80-летнюю карьеру Кокс написал 317 научных работ, и очень вероятно, что напишет еще. В своем офисе в Наффилд-колледже в Оксфорде он продолжает писать комментарии и обзоры современной статистики, а также вносить новый вклад в эту область.

Я спросил его, каждый ли день он появляется в офисе.

– Не каждый, – ответил Дэвид. – В субботу и воскресенье не появляюсь.

Затем сделал паузу и поправился:

– Точнее, вероятность того, что я приду на работу в субботу или в воскресенье, отлична от нуля. Такое может произойти.

Сэр Дэвид Кокс любит точность. Его ответы на мои вопросы были осторожными и обдуманными; математик всегда оговаривал уровень уверенности в своей способности дать ответ.

Именно Кокс открыл уравнение ставок. Сам он, правда, никогда бы так не выразился, и это в любом случае не совсем верно. Точнее было бы сказать, что он разработал теорию логистической регрессии, которую я использовал для нахождения α и β, а Бентер – для определения факторов, влияющих на исход скачек[21]. Дэвид Кокс разработал статистический метод, благодаря которому уравнение ставок дает точные прогнозы.

Логистическая регрессия была продуктом послевоенной Британии. К финалу Второй мировой войны Дэвид закончил изучать математику в Кембридже, и его направили на работу в королевские ВВС. Затем он перешел в текстильную промышленность, поскольку в Великобритании начался процесс восстановления[22]. Кокс рассказал мне, что изначально его интересовала чистая математика, которую он изучал, но такая работа привлекла его внимание к новым задачам. «Текстильная промышленность была полна увлекательных математических проблем», – сказал он.

Сэр Дэвид признавал, что смутно помнит детали, но лучился энтузиазмом, говоря о тех временах. Он рассказал, как можно использовать тесты для различных характеристик материалов, чтобы определить вероятность их разрушения, и о проблемах, связанных с созданием более прочного и более однородного конечного продукта из грубо пряденой шерсти. Кроме того, в ВВС он столкнулся с задачами, касавшимися частоты аварий и аэродинамики крыла. Это также дало ему много пищи для размышлений.

Именно из таких практических соображений у Дэвида Кокса зародился более общий, математический вопрос: каким образом лучше всего прогнозировать, как разные факторы (скорость ветра или напряжения в материале и другие) могут повлиять на что-то – например, на авиационную катастрофу или на то, порвется ли одеяло. Это вопрос того же типа, который Бентер задавал о лошадях: как зависит вероятность победы четвероногого от истории его прошлых выступлений и от погоды.

– Когда я создавал эту теорию [в середине 1950-х], самые серьезные разногласия в университетах касались анализа медицинских и психологических данных, предсказания того, как разные факторы связаны с медицинским результатом, – рассказывал Кокс. – Логистическая регрессия возникла в результате синтеза моего практического опыта и математического образования. Все известные мне проблемы медицины, психологии и промышленности можно было решить с помощью одного семейства математических функций.

Это семейство оказалось гораздо полезнее, чем предполагал даже сам ученый. Начиная с промышленности 1950-х, когда логистическая регрессия играла важную роль в интерпретации результатов медицинских исследований, она успешно применяется к бесчисленным математическим задачам. Именно этот подход использует Facebook, чтобы определить, какую рекламу нам показать, а Spotify – чтобы рекомендовать нам музыку. Он же стал частью системы идентификации пешеходов в автомобилях без водителей. И конечно, он используется в азартных играх…

Я спросил у сэра Дэвида, знает ли он об успехах Бентера в применении логистической регрессии к скачкам. Он не слышал. Тогда я поведал ему, как логистическая регрессия принесла миллиард долларов, а также об оксфордском студенте Мэттью Бенхэме и его успехе в предсказании результатов футбольных матчей.

– Предпочту сказать, что вам не следует играть в азартные игры, – сказал он мне, а затем надолго задумался.

Потом Кокс начал вспоминать об одном из своих коллег в 1950-х. Он взял с меня обещание никогда не повторять эту историю, и я сдержу слово.

* * *

Ставки – это не прогнозирование будущего с определенностью. Это определение мелких различий между тем, как смотрите на мир вы и как смотрят на него другие. Если ваш взгляд чуть острее, а ваши параметры лучше объясняют данные, у вас есть преимущество. Не ждите, что оно появится сразу. Его нужно наращивать постепенно, методом проб и ошибок, улучшая оценки своих параметров. И не думайте, что будете постоянно побеждать. При регулярной игре у вас получится выигрывать лишь чуть чаще, чем проигрывать.

Иногда мы склонны сосредоточиваться на одной «грандиозной идее». Однако уравнение ставок говорит нам, что ключ к успеху – создать различные вариации нашей идеи. Представьте, что вы начинаете собственные уроки йоги или танцев. Пробуйте различные плей-листы с разными группами и отмечайте, какие композиции получают наилучший отклик. Проверяя множество мелких идей, мы сравниваем их между собой, как лошадей на ипподроме «Хэппи-Вэлли». В конце каждой гонки можем заново оценить победителей и неудачников и посмотреть на те свойства, которые привели к успеху или к неудаче.

Если вы начинаете проверять новую идею, вам нужно выполнять то, что именуется A/B-тестированием. Когда Netflix обновляет дизайн своего сайта, компания создает две или несколько версий (A, B, C и т. д.) и показывает их разным пользователям. Затем создатели смотрят, какой вариант наиболее привлекателен для людей. Это самое прямое применение уравнения ставок к «успеху» и «неудаче» параметров дизайна. Когда Netflix получает так много информации, она может быстро представить четкую картину, что работает, а что нет.

Вам не нужна логистическая регрессия, чтобы начать пользоваться уравнением ставок. Но как только вы поняли принцип настройки параметров для улучшения соответствия данным, рукой подать до изучения самого метода. Сэр Дэвид Кокс сказал мне, что, по его мнению, большинство людей могут и должны научиться использовать разработанный им метод. Он утверждал, будто для понимания того, что раскрывает логистическая регрессия в собранных вами данных, незачем вдаваться во все математические подробности ее работы.

* * *

Во время чемпионата мира я смотрел много матчей, но понятия не имел, принесет ли мне деньги тот или иной исход, потому что не следил за коэффициентами. Я просто наслаждался играми. Раз за разом Ян присылал мне автоматически создаваемые таблицы со списками сделанных ставок и заработанных или проигранных денег. Во время первого круга групповой стадии мы проиграли, но затем начали выигрывать; и по ходу турнира наши прибыли стали превышать потери. К концу чемпионата мира я заработал примерно 200 фунтов при общем объеме ставок в 1400 фунтов, уровень доходности составил 14 %.

После изучения очередной обновленной таблицы с нашими результатами я снова видел письма в своем почтовом ящике, которые по ходу чемпионата становились всё более отчаянными: «Пожалуйста, я знаю, что вы разбираетесь в футболе и правильном счете, не могли бы вы помочь мне, пожалуйста?»; «Я хотел бы следовать всем вашим прогнозам для правильных ставок, потому что я много проиграл у букмекеров»; «Сегодня в стране разыгрывается футбольный джекпот с кучей денег. Помогая мне выиграть, вы поможете еще сотне людей за мной». Такие сообщения шли почти ежечасно.

Я не мог отделаться от мысли, что наша маленькая прибыль поступала из их маленьких карманов. Конечно, самая большая доля шла букмекерам, но те деньги, что заработали мы с Яном и Мариусом, когда-то принадлежали другим людям – возможно, тем, у кого их изначально было немного.

Тогда в моей голове зародилась идея: неравенство между теми, кто знает уравнения, и теми, кто их не знает, не ограничивается азартными играми. Статистические модели сэра Дэвида Кокса работают во многих сферах современного общества. Математические методы привели к прогрессу и легли в основу технологий в самых разных областях – от шерстяной промышленности и проектирования летательных аппаратов до современной науки о данных и искусственного интеллекта. Этот прогресс контролируется очень небольшой группой – теми, кто знает уравнения. И часто именно люди, обладающие этими секретами, извлекали социальную и финансовую пользу из математики.

Дэвид Кокс – член «Десятки». Он не знает об этом, но он изобрел одно из уравнений и полностью понимает остальные девять. Его позиция в истории «Десятки» незыблема. Он заслуженный участник самого высокого уровня.

Бентер, Бенхэм и Блум тоже часть «Десятки». Может, они не знают уравнений на том формальном математическом уровне, на котором их понимает Кокс, но они разбираются в принципах и понимают, как применить их на практике. Ян и Мариус на пути вступления туда.

А я? Я знаю эти десять уравнений в чистом незамутненном виде – как их понимают ученые. Я также знаю их в практическом смысле, в котором их использовал Бентер. И хотя я этого не осознавал ранее, я понял, что «Десятка» определяет меня не только как работника, но и как личность.

Глава 2. Уравнение суждений


Мой друг Марк руководит командой финансовых трейдеров, и все они владеют математическими методами. Марк заметил, что у лучших из них есть общая черта – способность реагировать на новую информацию и обрабатывать ее. Когда происходят какие-то события, они быстро подстраиваются к новой реальности.

Эти люди рассуждают не в абсолютных характеристиках – «та компания получит прибыль в следующем квартале» или «тот стартап провалится», – а в терминах вероятностей: «компания получит прибыль с вероятностью 34 %» или «для этого стартапа риск неудачи составляет 90 %». Когда поступает новая информация – например, CEO вынужден уйти в отставку или бета-версия, выпущенная стартапом, пользуется успехом, – они корректируют эти вероятности: 34 % превращаются в 21 %, а 90 % – в 80 %.

Аналогичные истории я слышал и от Джеймса, знакомого из индустрии азартных игр. Там в ходу варианты уравнения ставок, но при таком количестве денег на кону приходится принимать быстрые решения о том, годится ли их модель для предстоящих футбольных матчей. Что делать, если за час до игры стартовый состав команды меняется и предположения, лежащие в основе модели, становятся недействительными?

– Именно в такие моменты вы узнаете, кто действительно хороший специалист, – говорил Джеймс. – Он не реагирует резко. При одном изменении в стартовом составе ставка не меняется; при двух – четырех специалист оценивает разные возможности; при пяти или больше все ставки снимаются.

Чтобы научиться думать как эти аналитики, вам нужно ставить себя в эмоционально напряженную ситуацию. К примеру, на земле большинство из нас понимают, что полеты не опасны: вероятность попасть в авиакатастрофу со смертельным исходом не превосходит 1 на 10 миллионов. Но в воздухе все ощущается иначе.

Представьте, что вы опытный путешественник, уже летавший сотню раз. Однако этот рейс иной. При снижении самолет начинает грохотать и трястись – такой болтанки вы еще не ощущали. Женщина рядом хватает воздух ртом; мужчина, сидящий через проход, стискивает колени. Все вокруг явно напуганы. Что это? Может ли разворачиваться наихудший сценарий?

В подобных ситуациях математик глубоко вдохнет и соберет всю доступную информацию. Назовем катастрофой худший сценарий – крушение со смертельным (для вас) исходом. Обозначим его вероятность как P{катастрофа}. По статистике, P{катастрофа} = 1/10 000 000, или 1 на 10 миллионов[23].

Чтобы понять, как события зависят друг от друга, обозначим P{тряска|катастрофа} – вероятность, что самолет трясется, при условии, что произойдет катастрофа: «тряска» означает «самолет трясется», а вертикальная линия – «при условии». Сделаем разумное предположение, что P{тряска|катастрофа} = 1, то есть перед любой катастрофой самолет трясет.

Нам также необходимо знать P{тряска|не катастрофа} – вероятность болтанки при безопасном приземлении. Здесь вам придется опираться на свои ощущения. Раз это самый страшный рейс из сотни ваших полетов, то лучшей оценкой будет P{тряска|не катастрофа} = 1/100.

Эти вероятности полезны, но вы желаете знать не их. Вам нужна величина P{катастрофа|тряска}, или вероятность того, что произойдет крушение, при условии, что самолет так трясется. Эту величину можно найти с помощью теоремы Байеса.



Символ ∙ означает умножение. Вскоре я объясню, откуда появляется это уравнение, а пока просто примем его. Оно было рассмотрено преподобным Томасом Байесом в середине XVIII века и с тех пор используется математиками[24]. Подставив все нужные числа в наше уравнение, мы получаем:



Даже если это самая сильная болтанка, которую вы когда-либо испытывали, шансы погибнуть составляют 0,00001. Вы благополучно приземлитесь с вероятностью 99,99999 %.

То же рассуждение применимо к целому ряду различных, казалось бы, опасных ситуаций. Даже если во время купания на австралийском побережье вам кажется, что вы видите в воде нечто пугающее, вероятность того, что это акула, крохотная. Вы можете волноваться, когда ваши близкие возвращаются поздно домой, а вам не удается с ними связаться, но вероятнее всего, что они просто забыли зарядить телефон. Многое из того, что мы считаем новой информацией – тряска самолета, неясные фигуры в воде или отсутствие звонков, – не так уж страшно, если подходить к проблеме правильно.

Теорема Байеса позволяет вам верно оценивать важность информации и сохранять спокойствие, когда все вокруг паникуют.

* * *

Я смотрю на мир способом, который именую кинематографическим: часто (и один, и даже в компании) прокручиваю в голове фильмы о своем будущем. Это не один фильм или одно будущее; это много фильмов с разными поворотами сюжета и концовками. Объясню на примере самолета.

Когда я взлетаю и приземляюсь на самолете, то вижу катастрофу, которую описал выше. Если лечу с семьей, то представляю, как держу руки детей, говорю, что люблю их, чтобы они не беспокоились. Я воображаю, как мы держимся вместе, когда падаем навстречу смерти. Когда я лечу один, а вокруг только незнакомцы, то смотрю другой фильм: наблюдаю целые годы, которые моя семья проведет без меня. Похороны проходят быстро, и я вижу, как моя жена в одиночку справляется с детьми и рассказывает им истории о нашей совместной жизни. Этот фильм неописуемо печален.

Подобные картины крутятся непрерывно и параллельно в какой-то области мозга выше левого глаза. По крайней мере, я так ощущаю. Большинство фильмов не настолько драматичны. У меня встреча с редактором книги, и в голове проигрывается дискуссия: я обдумываю, что ей скажу. Провожу какой-нибудь семинар и вижу, как излагаю материал, представляя сложные вопросы. Многие такие фильмы абстрактны: я прохожусь по научной статье, которую пишу; смотрю на структуру диссертации одного из моих аспирантов; работаю над какой-то математической задачей. Кинокартины такого рода не будут смотреться на большом экране. Они набиты цифрами, техническими терминами и научными ссылками. Мне они нравятся, но я очень специфическая аудитория.

Хочу убедиться, что у вас не сложилось впечатления, будто я воображаю себя всевидящим оракулом. Вовсе нет. Фильмы, которые я создаю, фрагментированы. Нет деталей, нет наполненности реальностью. И, что крайне важно, почти все они не соответствуют действительности. Редактор книги ведет дискуссию в другом направлении, и я забываю все свои вопросы. В цепочке рассуждений в научной статье возникает дыра, и я не могу ее исправить. В первой строке моих математических выкладок обнаруживается ошибка в вычислениях, и результаты оказываются неверными.

Психологи изучали методы, с помощью которых люди смотрят на мир и конструируют повествования о будущем, однако научное описание процесса здесь не главное. Важно ваше представление о том, как вы видите будущее. В форме текстов, фильмов или компьютерных игр? Фотографий, звуков или запахов? Это абстрактное ощущение или вы визуализируете реальные события? Постарайтесь определить метод своих размышлений о вещах. Ваш взгляд на мир должен оставаться вашим личным – я не хочу его менять. Я бы не вынес, если бы кто-нибудь предложил мне отключить мои фильмы. Мой «кинематограф» – часть меня.

Математика участвует в моем мышлении, помогая мне организовать мою коллекцию фильмов. Авиакатастрофа – хороший пример. Когда прокручиваю фильм с катастрофой, я также оцениваю вероятность того, что такое событие произойдет, и считаю ее обнадеживающе низкой. Это не останавливает прокрутку фильма. Я по-прежнему боюсь летать или плавать в океане, но это помогает мне сосредоточиться. Вместо того чтобы бояться, думаю о том, как много значит для меня семья и почему мне нужно меньше путешествовать, а больше плавать в океане.

Научный термин для фильмов, которые я проигрываю в голове, – «модель». Крушение самолета – модель, нападение акулы – модель и план исследовательской работы – тоже. Модели могут быть чем угодно – от смутных мыслей до более формально определенных уравнений, подобных тому, что я создал для ставок на чемпионате мира. Первый шаг к математическому подходу к миру – понять, как мы используем модели.

* * *

У Эми начался новый курс в колледже, и она задается вопросом, с кем стоит дружить, а от кого держаться подальше. Она доверчивый человек, и ее «фильм» в голове – о людях, которые рады ей и ведут себя мило. Но Эми не совсем наивна. Она уже знает, что не все люди приятны, и «стервозный» фильм в ее голове тоже есть. Не судите Эми за термины – в конце концов, она держит мысли при себе. Именно поэтому, когда Эми знакомится с Рэйчел – девушкой, сидящей рядом, – она полагает, будто шансы на то, что Рэйчел окажется стервой, довольно малы: скажем, примерно 1 из 20.

Я не думаю, что Эми при встрече с другими определяет вероятность «стервозности». Я определяю это число, чтобы вы лучше понимали ситуацию. Можете на секунду задуматься и решить, какая доля окружающих стервозна. Надеюсь, она меньше 1/20, но вы можете выбрать свои числа.

В первое утро Рэйчел и Эми вместе разбирают лекцию. Эми плохо разбирается в деталях, потому что в ее школе не давали знаний, необходимых для понимания концепций, о которых говорит преподаватель. Рэйчел выглядит терпеливой, но Эми осознаёт, что та несколько раздосадована. Почему Эми не может учиться быстрее? Затем, после обеда, происходит ужасное. Эми сидит в одной из кабинок в туалете, рыщет по интернету с помощью смартфона и думает о своих делах. Она слышит, как входят Рэйчел и еще одна девушка.

– Эта новая девица тупа, – говорит Рэйчел. – Я пыталась ей объяснить «культурную апроприацию», а она ничего об этом не знала. Она думала, что это когда белые люди учатся играть на бонго![25]

Эми сидит неподвижно, не издает ни звука и ждет, пока девушки уйдут. Что она должна думать?

Большинство из нас на месте Эми огорчились бы, разозлились, а может, и то и другое. Но стоит ли? Да, Рэйчел явно поступила неправильно. У Эми первый день учебы, и лить грязь на человека нехорошо. Но вопрос в другом: должна ли Эми, несмотря на этот проступок Рэйчел, простить ее и дать ей еще один шанс?

Да. Да. Да. Должна! Обязана! Мы должны прощать такое. И не раз, а много. Нужно прощать людей за глупые комментарии, за то, что они обзываются за нашей спиной и не замечают нашего присутствия.

Но почему? Потому что мы хорошие? Потому что всегда позволяем наступать на себя? Потому что слабы и не можем за себя постоять?

Нет. Нет. Нет. Вовсе не поэтому. Нам нужно прощать их, потому что мы рациональны и верим в логику и разум. Мы хотим быть справедливыми. Мы знаем теорему преподобного Байеса. А второе уравнение говорит нам, что это – единственно верное действие.

И вот почему. Теорема Байеса – связь, которую нам нужно установить между моделью и данными. Она позволяет нам проверить, насколько хорошо наши картинки соотносятся с реальностью. В примере, который мы разбирали в начале главы, мы рассматривали вероятность P{катастрофа|тряска} того, что самолет разобьется, при условии, что он попал в болтанку. Эми желает знать P{стерва|грубость}, и логика здесь та же.

Катастрофа и стерва – модели в наших головах. Это наши представления о мире, которые принимают форму мыслей или (в моем случае) фильмов. Тряска и грубость – данные, которые есть в нашем распоряжении. Это нечто осязаемое, то, что происходит, что мы можем ощущать. Значительная часть прикладной математики включает сопоставление моделей с данными, столкновение наших мечтаний с суровой реальностью.

Будем использовать букву M для модели и Д для данных. Мы хотим знать сейчас вероятность того, что модель верна (Рэйчел – стерва), при условии истинности данных (грубый комментарий в туалете). Имеем:



Чтобы понять уравнение (формулу Байеса), лучше всего рассмотреть по отдельности компоненты правой части.

Числитель (часть над дробной чертой) – произведение двух вероятностей, P{М} и P{Д|М}. Множитель P{М} – вероятность того, что модель истинна, до того, как произошло некое событие (статистическая вероятность крушения самолета или оценка Эми, что встреченный ею человек стервозен; в последнем случае – 1/20). Эту величину Эми знала прежде, чем отправилась в туалет. Второй множитель, P{Д|М}, касается того, что произошло в санузле. Это вероятность, что Рэйчел оскорбит Эми, если она в самом деле стерва, или – в общем случае – того, что мы наблюдаем некоторые конкретные данные, если наша модель верна. Трудно оценить это число количественно, поэтому будем считать его эквивалентом броска монетки: P{Д|М} = 0,5. Рэйчел не каждый раз при посещении туалета злословит о сокурсницах. Минимум 50 % времени стервы тратят на разговоры о чем-то еще.

Мы перемножаем вероятности, чтобы найти вероятность того, что произошли одновременно оба события. Например, если я бросаю две игральные кости и хочу найти вероятность выпадения двух шестерок, то я определяю вероятность 1/6 для выпадения шестерки на первой кости, вероятность 1/6 для шестерки на второй, а затем перемножаю их и получаю вероятность выпадения шестерок на обеих костях: 1/6 ∙ 1/6 = 1/36. Тот же принцип применяется и здесь: числитель – вероятность того, что Рэйчел стерва и она отпустила стервозный комментарий при посещении туалета.

Итак, числитель описывает Рэйчел как стерву, но мы должны также рассмотреть альтернативную модель, в которой она хороший человек. Это делается в знаменателе дроби справа. Рэйчел может быть стервой, сделавшей стервозный комментарий (M), или хорошим человеком, допустившим ошибку (M–). Черта над буквой означает противоположность или дополнение. В нашем случае дополнение к «быть стервой» – «быть не стервой», «быть хорошим человеком». Обратите внимание, что первое слагаемое в знаменателе совпадает с числителем, P{Д|М} ∙ P{M}. Второе, P{Д|M–} ∙ P{M–}, – вероятность того, что Рэйчел сделала свое грязное замечание при условии, что она не стерва, умноженная на вероятность того, что она хороший человек. Мы охватили все возможные объяснения тех данных, что получила Эми, сидя в кабинке туалета. Теперь можно найти P{M|Д} – вероятность модели при условии этих данных.

Если Рэйчел не стерва, то она хороший человек, поэтому P{M–}=1–P{M}=0,95. Теперь нужно определить вероятность, что хороший человек совершает ошибку и говорит гадость. Возможно, у милой Рэйчел был неудачный день – у всех такое случается. Предположим, что один раз из десяти у хороших людей бывает плохой день и они говорят то, о чем потом жалеют. Иными словами, пусть P{Д|M–}=0,1 (см. рис. 2).


Рис. 2. Иллюстрация теоремы Байеса


Осталось только произвести подсчет – точно так же, как с крушением самолета, но с другими числами:



Вероятность того, что Рэйчел – стерва, примерно 1/5. Именно поэтому Эми стоит простить ее. С вероятностью 4/5 она хороший человек. Было бы нечестно судить девушку только по одному действию. Эми не следует упоминать, что она слышала Рэйчел, или допустить, чтобы эти слова влияли на их общение. Лучше ждать и смотреть, что произойдет завтра. С вероятностью 80 % к концу года они будут вместе смеяться над этим случаем в туалете.

И еще один совет Эми, съежившейся за дверью туалета. Возможно, в то утро она не работала с максимальной отдачей. Может, в следующий раз ей нужно лучше стараться и уж точно не стоит сидеть в уборной и развлекаться с телефоном. Но помните, что Байес прощает прегрешения. Эми должна применять ту же формулу и к себе. Теорема Байеса предлагает ей медленно корректировать свое мнение о себе и не особо огорчаться из-за конкретных событий.

Вы продукт всех своих действий, а не результат одной или нескольких ошибок. Применяйте к себе то же рациональное прощение, которое Байес просит вас применять к другим.

* * *

Первый урок, который нужно извлечь из формулы Байеса (уравнения суждений), – не надо торопиться с выводами. Числа, которые я использовал в примере, влияют на результат, но не на саму логику. Вы можете спросить себя: какая доля людей, по-вашему, в целом хорошие? Как часто хорошие люди совершают ошибки? И как часто стервы поступают по-свински? Подставьте свои цифры в уравнение, и вы придете к тому же заключению: нужно больше, чем один грязный комментарий, чтобы поставить на человеке клеймо «стерва» или «сволочь».

Иногда мой руководитель ведет себя как козел. Иногда моим студентам как будто не хватает сосредоточенности. Порой кто-то из коллег хочет приписать себе мою идею, заявляя, что придумал это первым. Иногда председатель комиссии, где я состою, кажется мне неорганизованным: он тратит мое время на бесполезный неэффективный обмен электронными письмами. В таких ситуациях я использую уравнение суждений. Но я не вычисляю вероятность того, что каждый из моих коллег – скотина, рассеянный или некомпетентный. И не позволяю разовым событиям определять свои ощущения. Если я вижу, что некто, с кем я работаю, совершил ошибку, я жду развития ситуации. Вполне может оказаться, что неправ был я.

* * *

Мы не можем понять «Десятку» без раскрытия ее истории и философии. История «Десятки» – рассказ о небольшой группе людей, которые передавали секреты рационального мышления из поколения в поколение. Они ставили масштабные вопросы. Они хотели знать, как мыслить яснее и точнее, уметь оценивать истинность того, что говорят люди. Они даже задавались вопросом, что значит быть истинным или ложным. Это история о действительно важных вопросах: природе реальности и месте этих людей в ней.

Это также рассказ о религии, о том, что такое хорошо и что такое плохо, об этике, о добре и зле.

Наша первая остановка – 1761 год. Валлийский философ Ричард Прайс обнаружил в бумагах недавно умершего друга (того самого Томаса Байеса) эссе, полное математических символов и философских размышлений, и один вопрос звучал так: как на основе данных о предыдущих событиях оценить вероятность того, что подобное произойдет снова? Прайс опубликовал его со своим приложением, где просил читателя представить «человека, только что появившегося в этом мире, который заключает из своих наблюдений за порядком и ходом событий, какие силы и причины в нем действуют». Спрашивается, как такой человек должен рассуждать, увидев восход в первый раз, во второй и в третий. Что он должен сказать о вероятности того, что солнце встает каждый день?

Вывод примечателен. Ежедневный восход солнца не должен привести нашего «только появившегося» человека к выводу, будто солнце будет вставать всегда. Наоборот, его умоляют быть очень осторожным с этим событием – даже после сотни восходов и целой жизни восходов. Ничто не должно быть само собой разумеющимся.

«Только появившемуся» человеку предлагалось дать оценку вероятности ежедневного наступления восхода с помощью некоторого параметра θ. Перед первым восходом человек не имеет никаких априорных представлений о солнце и должен считать все значения параметра θ равновозможными. В этот момент одинаково вероятно, что солнце поднимается каждый день (θ = 1), встает в половине дней (θ = 0,5) или только один раз из ста (θ = 0,01). Величина θ может принимать бесконечное число значений из интервала от 0 до 1 (все вероятности находятся в этом промежутке). Например, она может оказаться 0,8567, 0,1234792, 0,99999 и т. д. При этом число десятичных знаков любое, точность произвольна.

Далее человеку предлагается определить, какое значение тот сочтет минимальной правдоподобной вероятностью того, что солнце восходит ежедневно. Если человек думает, что шансы на восход превышают 50 %, то θ > 0,5. Если он считает, что они превысят 90 %, то θ > 0,9.

Теперь представим, что человек увидел 100 восходов подряд и пытается сделать из этого вывод о вероятности восхода в один день: он заявляет, что солнце поднимается чаще 99 раз из 100. Иными словами, он дает оценку θ > 0,99. Выражение P{θ > 0,99|100 восходов} определяет вероятность того, что он прав в своей оценке. Байес показал с помощью определенной разновидности уравнения 2, что P{θ > 0,99|100 восходов} = 1–0,99100+1 ≈ 63,8 %. Соответственно, с вероятностью 36,2 % наш человек ошибается и солнце встает реже, чем он полагает[26].

Если человек прожил 60 лет и видел восход солнца каждый день, он мог бы определенно быть уверен, что вероятность восхода солнца каждый день превышает 99 %. Но если он желает быть уверенным, что вероятность восхода солнца превосходит 99,99 %, мы бы посоветовали проявлять осторожность: 1–0,9999365×60+1 ≈ 88,8 %. Так что остается еще 11,2 %, что он ошибается. Мы заставляем новоприбывшего обитателя мира определить свою модель, высказать минимальное возможное значение θ, а затем сообщаем ему вероятность, с которой он прав в своем предположении.

Ричард Прайс осознал, что формула Байеса связана со спорами о чудесах, которые происходили в XVIII веке. Как и Байес, Прайс был священником и интересовался, как новые научные открытия того времени могут сочетаться с чудесами, в которые он верил после чтения Библии.

Десятилетием ранее философ Дэвид Юм утверждал, что «никакое свидетельство недостаточно для установления чуда, кроме такого, ложность которого была бы большим чудом, нежели тот факт, который оно стремится установить»[27]. Эти слова можно рассматривать как обращение к уравнению суждений. Он просит нас сравнивать модель M, что чудеса происходят, с альтернативной моделью M–, что они не происходят. Юм говорит, что, поскольку мы никогда раньше не были свидетелями чуда, P{M–}близка к 1, а P{M} очень мала, поэтому, чтобы убедить нас в обратном, понадобится очень серьезное чудо, у которого будет очень большая P{Д|M} и маленькая P{Д|M–}. Аргументация Юма очень близка к моим рассуждениям о болтанке в начале этой главы: нужны очень веские доказательства, чтобы убедить нас, что в целом надежный самолет разобьется. Нам необходимы очень веские доказательства, чтобы убедить нас, что Иисус Христос воскрес.

Прайс счел, что рассуждения Юма «противоречат разуму»[28], что Юм неправильно понял Байеса. Он объяснял, что Юму следовало быть более точным, когда он говорит о θ – вероятности чуда. Даже те, кто верит в чудеса, не считают, что они происходят каждый день. Конкретизируем: представьте, что Прайс предложил Юму дать какую-то оценку частоте чудес, а тот говорит, что они случаются реже одного раза в 10 миллионов дней (27 400 лет), что дает θ > 99,99999 %. Предположим, Прайс верит, что 99,99999 % > θ > 99,999 %, то есть в то, что чудеса происходят реже, чем раз в 274 года, но чаще, чем раз в 27 400 лет. Теперь представьте, что 2000 лет подряд не происходило ни одного чуда. Вероятность того, что при таком условии прав Юм, составляет 7,04 %[29]. Вероятность, что прав Прайс, – 92,89 %[30]. Даже если за несколько тысячелетий не произошло ни одного чуда, это недостаточно надежно подтверждает, что чудес не существует. Просто за время жизни одного человека не набирается достаточного объема данных, чтобы подтвердить заявление Юма, будто чудес не существует.

Ричард Прайс направил «Десятку» на путь христианской морали. Он верил в воскресение Христа и использовал рациональные аргументы, чтобы поставить под сомнение само сомнение. Прайс полагал, что логическое мышление поможет обнаружить истины о мире, скрытые от нашего повседневного опыта. Бог был одной из этих истин.

Двумя тысячелетиями ранее в своей аллегории греческий философ Платон описал находящихся в пещере людей в оковах, которые смотрят на тени и способны видеть только смутные проекции истинного, более логичного мира снаружи. Аллегорию Платона часто используют для объяснения силы математики, и Прайс воспринимал ее очень серьезно. Он считал, что мы открываем новые истины, когда признаём, что тени на стене пещеры не реальны. Наш повседневный опыт – путаное представление о какой-то большей истине. Размышляя четче об истинной форме мира – посредством моделей, не зависящих от данных, – мы можем яснее рассуждать о путаных ситуациях, о тенях нашей повседневной жизни.

«Десятка», которую предвидел Прайс, формировалась из его религиозных убеждений и метафизики Платона[31]. Он считал, что в математике есть мораль, что существует рациональный, правильный подход к жизни. Философ не только проповедовал такое представление, но и претворял его в жизнь. Он составил таблицы ожидаемой продолжительности жизни, которые почти целое столетие использовались для страховых выплат[32]. Он считал свою работу способом защиты бедных людей от неопределенности: в ней показывалось, что почти все страховые компании того времени не способны выполнить свои будущие обязательства и должны совершенствовать свою политику[33]. Прайс был ярым сторонником американской революции и близким другом Бенджамина Франклина; он полагал, что в Америке есть возможность создать систему, основанную на принципах свободы, где землей владели бы на равных, а политическая власть справедливо распределялась среди всех людей[34]. Согласно видению Ричарда Прайса, США должны были стать страной, где религиозная рациональная «Десятка» могла бы в итоге процветать.

Современные практики «Десятки» редко говорят о морали, меньшинство из них верят в христианского Бога, однако многие унаследовали ценности Прайса: статистик, тщательно вычисляющий взносы автострахования для вашего тестя или свекра; государственный чиновник, планирующий наши пенсии или устанавливающий процентные ставки; научный сотрудник аппарата ООН, описывающий цели развития; климатолог, измеряющий вероятность различных повышений температуры на следующие двадцать лет; врач, балансирующий между рисками и стоимостью лечения. Все они используют байесовские рассуждения, чтобы создать более цивилизованное, справедливое и лучше организованное общество. Они помогают нам делиться рисками и неопределенностями с другими – и в результате, когда с одним из нас происходит ужасное, но редкое событие, расходы покрывают другие люди.

Уравнение суждений помогает участникам общества действовать на благо всех. Правильные суждения, если смотреть глазами Прайса, требуют, чтобы все мы прощали других и были к ним внимательны. Оно говорит нам, что не стоит отказываться от чудес. Он предполагает, что как минимум одно из десяти уравнений ставит нас на путь праведности.

* * *

Аудитория затихла, ожидая начала мероприятия. Бьорн нервничает. Последние пять лет жизни он посвятил благородному делу открытия новых истин – научным исследованиям. Я был руководителем, направлявшим его к цели. Сейчас он стоит перед коллегами, комиссией, своей семьей и друзьями и собирается защищать свою диссертацию. Бьорна нервирует сочетание этой разнородной аудитории и сложной темы его работы. Одна из глав диссертации называется «Прошлая ночь в Швеции» и представляет собой исследование связей между насильственными преступлениями и иммиграцией у него на родине. В другой главе он рассматривает, как «Шведские демократы» (популистская антииммиграционная партия) приобрели за последние десять лет известность в стране, знаменитой своей либеральной и социалистической политикой.

Для математиков из комиссии, сидящих в зале, это диссертация о статистических методах. Для второго научного руководителя, Ранжулы Бали Свайн, профессора экономики, которая работает в разных областях – от устойчивого развития до исследования того, как микрофинансирование помогает женщинам выбраться из бедности, – диссертация Бьорна нацелена на объяснение того, что происходит из-за смешения культур во всем мире. Семья Бьорна, Бломквисты, и его друзья хотят знать, что он выяснил об изменениях в Швеции. Их страна из однородной земли викингов превращается в мультикультурный плавильный котел из афганцев, эритрейцев, сирийцев, югославов и приехавшего британца.

Бьорн боится упасть с каната, на котором должен балансировать, чтобы осчастливить всех. Защита диссертации в Швеции начинается с выступления оппонента – человека, который должен прочитать работу, обсудить ее с кандидатом и представить исторический контекст в исследуемой области. Оппонент Бьорна – Иэн Вернон из Даремского университета.

Иэн рассказывает нам о принципах байесовского мышления. Мои примеры в этой главе относились к одной модели или использовали один параметр, но обычно ученые имеют дело с несколькими конкурирующими гипотезами. Задача Иэна – рассмотреть все эти альтернативные модели и присвоить им какие-то вероятности. Ни одна гипотеза не верна на 100 %, но по мере накопления свидетельств одни становятся правдоподобнее других. Он демонстрирует разные примеры, начиная с поиска нефтяных месторождений. Нефтедобывающие компании используют алгоритм, запатентованный Иэном и его коллегами, для поиска месторождений, которые дают наилучшие долговременные перспективы. Затем он переходит к здравоохранению. Когда исследователи планируют действия против малярии или ВИЧ, они сначала проводят математическое моделирование для прогнозирования результатов своих действий. Фонд Билла и Мелинды Гейтс использует методы Иэна для планирования своих программ по искоренению заболеваний.

Наконец Иэн переходит к одному из самых масштабных вопросов. Что происходило на первых стадиях существования Вселенной? Как впервые после Большого взрыва образовались галактики и какие модели объясняют размер и форму тех из них, что мы наблюдаем сегодня? Иэн смог уменьшить количество возможных моделей ранней Вселенной, найдя вероятные значения для семнадцати различных параметров, определяющих, как галактики расширяются в космическом пространстве[35]. Презентация Иэна идеально ложится на аудиторию, демонстрируя мощь математических методов и широчайший спектр приложений. Семья и друзья Бьорна ахают, когда видят моделирование вращения и столкновения галактик, возможную модель начального этапа эволюции нашей Вселенной, параметры для которой были восстановлены с помощью формулы преподобного Байеса.

Приходит очередь Бьорна представить свою работу. Введение в масштабах Вселенной могло легко ошеломить и без того нервничающего аспиранта. Возможно, Бьорн обеспокоен сравнением его исследования всего одной страны в Скандинавии с огромным масштабом работ Иэна. Однако когда я смотрю на своего ученика, то вижу, что он спокоен и готов. А когда оглядываюсь на аудиторию, вижу гордость на их лицах. Бломквисты думают: вот что можно сделать с помощью математики, которую изучал Бьорн. Вот чем овладел их Бьорн: математикой Вселенной.

Социальные изменения так же сложны, как происхождение Вселенной, хотя и совершенно иначе. Бьорн показывает, как рост «Шведских демократов» можно объяснить преимущественно географическим положением. Эту партию поддерживают определенные регионы страны, особенно в самой южной области Сконе; однако поддержка есть и в центральной Даларне. Как ни странно, это не районы с самым высоким процентом иммигрантов. Возмущение появляется не потому, что в какую-то область приезжают иммигранты. Скорее, растет поддержка антииммиграционной политики в сельских областях – особенно там, где у людей низкий уровень образования.

После окончания презентации Иэн и комиссия задают Бьорну вопросы. Иэн и другие математики желают знать технические детали того, как Бьорн сравнивал модели и данные. Экономистка Линь Лерпольд, коллега Ранжулы и член комиссии, указывает на некоторые важные ограничения этого исследования. Бьорн не до конца разобрался в причинах антииммиграционных настроений. Он изучил закономерности изменений в местных сообществах, но не понял мышление их представителей. Чтобы ответить на вопросы Линь, нужны подробные беседы и анкеты.

Расспросы комиссии были дотошными, но справедливыми, а решение единогласным. Бьорн защитил диссертацию. Он присоединился к спецназу байесовских ученых.

* * *

Байесовское мышление изменило принципы науки в последние десятилетия. Оно идеально соответствует научному взгляду на мир. Экспериментаторы собирают данные (Д), а теоретики разрабатывают гипотезы или модели (М). Формула Байеса объединяет оба эти компонента.

Рассмотрим следующую научную гипотезу: использование мобильного телефона плохо влияет на психическое здоровье подростков. В моей семье этот вопрос горячо обсуждается – два подростка (и, если честно, два взрослых) целый день приклеены к экранам. В годы моей юности родители беспокоились, где я и чем занимаюсь. У нас с женой другие проблемы: дети слишком много времени проводят дома, уставившись в телефоны. Чего бы мы только не отдали за старые добрые разборки «Почему не пришел домой вовремя», «С кем встречалась?»…

Доктор Кристина Картер, социолог и автор нескольких книг о воспитании детей и производительности, категорически против чрезмерного использования мобильных телефонов, говоря, что «время за экраном – вероятная причина волны депрессии, тревог и суицида среди подростков». Ее статья в журнале Greater Good Magazine, выпускающемся в Калифорнийском университете в Беркли, излагает аргументы в два этапа[36]. Во-первых, Картер ссылается на опрос родителей, почти половина которых считают, что их дети-тинейджеры зависимы от своих мобильных устройств, и 50 % озабочены, что это негативно скажется на их психическом здоровье. Во-вторых, она ссылается на данные, полученные при исследовании 120 115 подростков в Великобритании, которые отвечали на 14 вопросов о том, как они чувствуют себя с точки зрения счастья и удовлетворенности жизнью, и об их социальной жизни. Это исследование показало, что при превышении порога в один час в день дети отличались пониженным психическим благополучием, что измерялось с помощью опросника. Иными словами, чем больше дети используют свои телефоны, тем они несчастнее.

Звучит весомо, не так ли? Должен признаться, когда я прочитал эту статью в первый раз, она меня убедила. Написана специалистом со степенью, опубликована в рецензируемом журнале, который связан с университетом с мировым именем, в статье есть данные качественно проведенного опроса, поддерживающие точку зрения автора. Но есть одна проблема, и серьезная.

Кристина Картер заполнила только верхнюю часть уравнения суждений. Ее первый шаг – описание родительских страхов – аналогичен вероятности модели P{M}: это вероятность того, что родители верят, будто время у экрана влияет на психическое состояние детей. Ее второй шаг – демонстрация, что имеющиеся данные согласуются с гипотезой встревоженных родителей, то есть рассматривается величина P{Д|M}, и она действительно оказывается большой. Но Картер не учла того, что другие модели тоже могли бы объяснить проблемы подростков. Она определила числитель дроби в уравнении 2, но пренебрегла знаменателем. Доктор не сообщает нам P{Д|M–} для альтернативных гипотез, и мы не знаем P{M|Д} – вероятность того, что мобильный телефон объясняет подростковую депрессию, то есть именно то, что мы хотим знать.

Кэндис Оджерс, профессор психологии из Калифорнийского университета в Ирвайне, заполнила пробелы, оставленные Картер. В комментарии, опубликованном в журнале Nature, она пришла к совершенно другому заключению[37]. Она начинает свою статью с признания проблемы. В США доля девочек в возрасте от 12 до 17, сообщавших о случаях депрессии, за период с 2005 по 2014 год выросла с 13,3 до 17,3 %; у мальчиков того же возраста тоже наблюдался рост, хотя несколько меньший. Нет сомнений, что использование мобильных телефонов за этот период увеличилось, здесь нам не нужны статистические данные. Оджерс также не оспаривает данные по британским подросткам, на которые ссылается Кристина Картер и которые указывают на рост случаев депрессии у тех, кто активно пользуется телефоном.

Однако Оджерс указывает, что депрессию у тинейджеров можно объяснить и другими причинами. Например, и отсутствие регулярного завтрака, и сон в разное время оказались втрое более важными факторами для прогнозирования психического состояния подростков, чем пользование телефонами[38]. На языке теоремы Байеса завтрак и сон – альтернативные гипотезы, которые могут объяснить депрессию, и для них вероятность P{Д|M–} велика. Если их учесть в знаменателе формулы Байеса, это перевесит числитель, и искомая вероятность P{M|Д} того, что пользование мобильными телефонами связано с депрессией, становится меньше – не пренебрежимо малой, но достаточно маленькой, чтобы не считать ее важным фактором при объяснении психического здоровья подростков.

Более того, есть документально подтвержденная польза телефонов для тинейджеров. Во многих работах показано, что дети используют гаджеты, чтобы поддерживать друг друга и создавать долговременные социальные структуры. У большинства ребят среднего класса – группы, на которую ориентируются советчики по поводу экранного времени, – мобильные телефоны улучшают способность заводить настоящие, прочные дружеские отношения; и не только в интернете, но и в реальной жизни. Как говорит Кэндис Оджерс в своей статье, с проблемами сталкиваются дети из неблагополучных семей. Менее благополучные подростки скорее начнут драться из-за того, что происходило в соцсетях. Те, кого травили в жизни, позже с большей вероятностью станут жертвами и в интернете.

Мои дети общаются с детьми по всему миру и часто узнают в Сети что-то новое. Я слышал, как на прошлой неделе Элиза и Генри обсуждали барабаны бонго и культурную апроприацию.

Элиза сказала:

– Это базовое уважение: если кто-то говорит, что его оскорбляет исполнение вами музыки его культуры, то лучше остановиться.

– Тогда Эминем – это культурная апроприация? – возразил Генри.

Я точно не мог вести такие разговоры с сестрой, когда нам было тринадцать и пятнадцать. Я не уверен даже, что мы могли бы вести их сейчас. Дети, рожденные в 2000-х, имеют доступ к важным идеям и информации, которые находились вне рамок восприятия тех, кто рос в 1970-е, 1980-е и даже 1990-е.

* * *

Вернемся к Эми и Рэйчел, поскольку я пропустил кое-что важное.

Числа, которые я использовал в том примере (один человек из 20 стервозный; эти люди тратят на гадости половину времени; даже хорошие люди ведут себя так один день из десяти), не просто произвольны, но и субъективны – свои для каждого человека. В зависимости от вашего жизненного опыта вы будете доверять людям больше или меньше, чем Эми. Это как с авиакатастрофами: ужасная и объективная реальность. Выбор Эми, как смотреть на новых соучеников, или мой способ классифицировать коллег, полностью основан на нашем субъективном опыте общения с людьми, которых мы встречали ранее. Нет никаких объективных способов измерить «стервозность», «сучность» или «козлиность».

Да, числа в истории Эми субъективны. Однако дело вот в чем. Формула Байеса работает не только с объективными вероятностями, но и с субъективными. Она дает нам возможность рассуждать о числах, даже если они не абсолютно точные. Мы можем поменять их и получить другие результаты, но нельзя изменить логику, которую нам рекомендует байесовский подход.

Сделанные предположения называются априорными. В уравнении 2 P{M} – априорная вероятность того, что наша модель верна. Часто такие вероятности можно получить из субъективного опыта. Но не может быть субъективной P{M|Д}, вероятность истинности нашей модели после того, как мы увидели какие-то данные. Пересчет вероятностей должен производиться с помощью формулы Байеса.

Многие полагают, что математика обязательно имеет дело с объективными вещами. Это не так. Это способ представления мира и рассуждений о нем; и иногда то, о чем мы спорим, известно только нам. В конце концов, никто другой, возможно, никогда не узнает, считает Эми Рэйчел стервой или нет. Этот процесс может быть навсегда сокрыт в ее мозге.

Вспомните о моем кинематографическом представлении мира – фильмах, которые я проигрываю себе день за днем, порой очень личных. Это могут быть опасения по поводу того, что чувствует моя жена; мысли о будущем дочери; фантазии о том, как я веду мини-футбольную команду сына к победе в турнире; мечта о том, как в один прекрасный день я стану автором бестселлера. Мне не надо рассказывать вам о них, поскольку они принадлежат исключительно мне. Уравнение суждений не говорит нам, какие фильмы нужно иметь в коллекции или о чем мечтать. Оно просто говорит, как нужно рассуждать об этих мечтах, поскольку каждый из таких «фильмов» – модель мира. Уравнение суждений позволяет нам обновлять вероятности, которые мы связываем с каждой мечтой, но не говорит, какие мечты нужно иметь.

После защиты Бьорна Иэн Вернон за бокалом шампанского сказал мне: «Многие, даже математики и другие ученые, не осознают, что настоящая сила байесовского подхода в том, как он заставляет вас определить, что вы думали до эксперимента и после него. Байесовский анализ требует, чтобы вы разбили свои рассуждения на модели и по очереди искали свидетельства для них. Вы можете считать, что данные подтверждают ваше предположение, но нужно быть честным в отношении того, насколько сильно вы поддерживали свою гипотезу до этого эксперимента».

Я согласился. Иэн говорил в целом, думая при этом о защите Бьорна и использовании байесовской теории для объяснения подъема крайне правых сил в шведской политике. В этом проекте я проработал с Бьорном все детали, изучив факторы, которые заставляют людей голосовать за националистические партии. Теперь пытался применить тот же подход к вопросу из собственной семейной жизни. Я не специалист по психическому здоровью или мобильным телефонам, но уравнение суждений дает мне способ интерпретировать результаты, полученные другими, – способ оценить относительную ценность аргументов, выдвинутых учеными. Я использовал теорему Байеса, чтобы проверить, соблюдали ли они критерии для правильного суждения. Посмотрели ли они на собственную и альтернативную модель мира? Кэндис Оджерс представила в своих рассуждениях все стороны; Кристина Картер – только одну.

Иногда я крайне разочарован, когда вижу, как некритично воспринимают люди советы так называемых экспертов по воспитанию, образу жизни или здоровью. Как неопытные игроки, которые просят у меня совета только о предстоящем серьезном матче, так и потребители таких советов смотрят не дальше последнего исследования. Они не понимают, что обеспечение здорового и сбалансированного образа жизни требует долгосрочной позиции, как успешная азартная игра – долгосрочной стратегии.

Но не только Кристина Картер ответственна за представление всех аспектов рассматриваемого вопроса. Вам может показаться странной такая моя позиция, поскольку я счел ее работу вводящей в заблуждение; но я также понимаю, что она отражает беспокойство многих родителей, включая меня. Данные, описанные ею, реальны, и она считает, что они подтверждают ее модель. Описывать поддержку альтернативных моделей не совсем ее дело.

Проверять достоверность ее модели – большей частью наше дело. Когда я читаю авторские колонки, то стараюсь убедиться, что их создатели – независимо от квалификации – разобрались во всех частях нашего уравнения. Мне как родителю оказалось нетрудно получить более полное представление о роли экранов в нашей жизни. Все статьи, что я использовал, есть в свободном доступе в интернете; и мне понадобилось несколько вечеров собственного времени у экрана, чтобы скачать и прочитать их. Как только разобрался в вопросе, обсудил результаты с детьми. Я сказал им, что и хороший сон, и правильный завтрак втрое важнее для их психического состояния, чем время в телефонах. Я рассказал, что телефоны отчасти полезны, подчеркнув: это вовсе не подразумевает, что они должны проводить все вечера на диване за просмотром YouTube. Физические нагрузки и социальное общение необходимы, и уж точно не стоит брать телефоны в спальню. Мне кажется, Элиза и Генри всё поняли.

Можно услышать, как те же люди, которые некритично потребляют информацию о воспитании детей, выражают скептицизм, когда слышат более сбалансированную точку зрения от ученых, подобных Кэндису Оджерсу. Когда ученые излагают все стороны проблемы, такие люди считают, что это говорит о неуверенности специалистов. В научном сообществе активно обсуждаются такие темы, как изменение климата, достоинства разных диет или причины преступности. Но обсуждения и сравнение всех возможных гипотез вовсе не признак слабости или нерешительности участников дискуссии. Скорее, это признак силы и основательности. Это знак преимущества, того, что вы рассмотрели все возможности.

* * *

В мире полно людей, дающих советы. Как быть организованными на работе и дома. Как оставаться спокойными и сосредоточенными. Как стать лучше. Выберите идеальную работу. Идеального партнера. Идеальную жизнь. Десять главных вещей, которые нужно сразу сделать на новой работе. Десять вещей, которых нужно избегать. Десять главных уравнений.

Спокойствие, как у йогов. Самоосознание. Глубокое мышление и медленное дыхание. Тигры. Кошки и собаки. Популярная психология и эволюционное поведение. Будьте пещерным человеком, охотником-собирателем или греческим философом. Отключитесь. Подсоединитесь. Расслабьтесь. Зарядитесь. Выпрямитесь и никогда не лгите. Плюйте на всё, и вы всегда будете счастливы. Не откладывайте, делайте сейчас, и быстрее.

Всем таким советам не хватает структуризации. Важная информация перемешана с мнениями и ерундой. Уравнение суждений позволяет организовывать и оценивать. Оно превращает любой совет, желательный или нежелательный, в модель, которую можно проверить, используя данные. Внимательно прислушивайтесь к мнению других, записывайте альтернативы, собирайте данные и выносите суждение. Корректируйте свое мнение по мере медленного накопления свидетельств за и против той или иной идеи. С помощью того же процесса судите о действиях других. Всегда давайте им второй и даже третий шанс – гарантируя, что ваши решения определяются фактами, а не эмоциями. Используя формулу Байеса, вы не только будете делать оптимальный выбор, но и обнаружите, что завоюете доверие других. Вы прославитесь своими здравыми суждениями.

Глава 3. Уравнение уверенности


Не вся «Десятка» родилась из христианской морали. Если бы нас попросили отправиться в ту точку пространства и времени, где ей было положено начало, то это оказалось бы не смертное ложе Томаса Байеса. Мы очутились бы в Лондоне, но почти на тридцать лет раньше – на собрании друзей 12 ноября 1733 года, где слушали бы, как Абрахам де Муавр раскрывает секреты азартных игр.

Де Муавр был «нестандартным» математиком. Его изгнали из Франции как протестанта, а в Лондоне к нему относились с подозрением из-за его национальности. Его современники – Исаак Ньютон и Даниил Бернулли – стали профессорами в своих областях, а де Муавру приходилось зарабатывать другими способами. Он давал частные уроки для детей среднего класса в Лондоне (предполагается, хотя это и не доказано, что одним из его учеников был юный Томас Байес), занимался «консультациями». Его можно было найти в кофейне Old Slaughter’s на Сент-Мартинс-Лейн, где он давал советы всем – от игроков и финансистов до самого сэра Исаака Ньютона.

Работа де Муавра, появившаяся в 1733 году, была более изощренной по сравнению с его ранними трудами. Он показал, как новая математика – анализ, недавно разработанный Исааком Ньютоном, – помогает определить уровень уверенности в долгосрочной прибыльности в играх, опирающихся на случай. В итоге представленное им уравнение станет основой того, как специалисты в естественных и социальных науках определяют уровень доверия к их исследовательским результатам. Но чтобы понять, откуда взялось уравнение уверенности, нужно начать оттуда же, что и де Муавр. Нужно войти в сомнительный мир азартных игр.

* * *

Сегодня требуется всего несколько минут, чтобы открыть счет для ставок в онлайн-казино. Имя, адрес и (главное) данные карточки – и готово. Игры разные. Есть онлайн-покер, где вы играете против других, а казино получает свою долю. Есть игровые автоматы, похожие на те, что когда-то ставили в пабах; у них свои имена – например, Cleopatra’s Tomb, Fruit vs Candy и Age of the Gods, а также торговые марки вроде Batman v Superman и Top Trumps Football Stars. Вы нажимаете на кнопку, вращаете колесо и, если боги выстраиваются в ряд или в ряду достаточно Бэтменов, выигрываете. Наконец, есть традиционные для казино игры – например, блек-джек и рулетка, – которые транслируются в прямом эфире: элегантно одетые юноши раздают карты, а женщины в вечерних платьях с низким вырезом крутят колесо рулетки.

Я открыл счет на одном популярном сайте онлайн-игр. Положил 10 фунтов стерлингов и получил бонус в 10 фунтов за новый счет, что дало мне стартовый капитал в 20 фунтов. Я решил начать с «Века богов» – только по той причине, что там разрешались самые маленькие ставки. Соответственно, при цене 10 пенсов за вращение у меня было больше попыток.

Через двенадцать попыток у меня оказалось на 70 пенсов меньше и не было ощущения, что что-то происходит. Боги мне наскучили, и я отправился на Top Trumps крутить Криштиану Роналду, Месси и Неймара. Это было дороже, по 20 пенсов за вращение, но через шесть попыток я выиграл (1,5 фунта!) и почти вернулся к своему начальному капиталу. Я попробовал «Бэтмен против Супермена» и несколько других игр. Затем нашел кнопку автоматического запуска и теперь мог крутить постоянно без необходимости нажимать на кнопку. Впрочем, это была плохая идея. Спустя двести попыток у меня осталось 13 фунтов.

Мне показалось, что игровые автоматы не оптимальны по соотношению цены и качества, и я решил попробовать живое казино. За столом распоряжалась Керри, женщина двадцати с небольшим в черном платье. Она приветствовала меня и заговорила с другим клиентом. Это был странный опыт. Я мог набирать сообщения, а она отвечала.

– Как погода у вас? – спросил я.

– Хорошая, – ответила она, посмотрев прямо на меня. – Кажется, весна на подходе. Сейчас последние ставки. Удачи!

Она жила в Латвии и уже четыре раза бывала в Швеции. Немного поболтав, я спросил ее, были ли сегодня крупные выигрыши.

– Мы не видим, сколько вы ставите, – сообщила она.

Я чувствовал себя несколько глупо; старался ставить 1 фунт при каждом вращении колеса, так что она не думала, будто я дешевка.

Керри мне нравилась, но я ощущал, что мне нужно лучше осмотреться. Не знаю, как это выразить, но была какая-то причина, по которой она и большинство ее коллег-мужчин работали в зале с низкими ставками. Керри было слегка неловко и некомфортно в обтягивающем платье, и она не казалась сексуальной.

Залы с более высокими ставками выглядели иначе. Вырез на платьях был глубже, а улыбки завлекательнее. Перед каждым вращением Люси, работавшая в помещении, где я находился, осознанно смотрела в камеру, словно говоря, что мой выбор верный. Мне пришлось заставить себя вспомнить, что она смотрела не только на меня, но и на 163 других игроков со всего мира.

Люси отвечала на вопросы клиентов.

– Да, у меня есть партнер. Но все сложно, – говорила она одному.

– О, я люблю путешествовать, – сообщала другому. – Я бы с радостью поехала в Париж, Мадрид, Лондон…

Камера переключилась на вид сверху, давая возможность увидеть ее ноги перед тем, как колесо пришло во вращение.

Мне стало очень некомфортно. Приходилось напоминать себе, зачем я здесь в первую очередь. Вернулся в помещение с более низкими ставками – там работал Макс, вежливый молодой человек, который давал статистические советы по выигрышным цветам и номерам. Похоже, на его рулетке хорошо шли большие числа.

Посмотрел на свой баланс. Я наугад ставил на красное и черное, особо не раздумывая, и с удивлением увидел, что после нескольких часов в казино у меня имелось 28 фунтов. Прибыль 8 фунтов за вечер. Дела шли хорошо.

* * *

Как узнать, почему мы выигрываем: потому что умело играем или потому что нам повезло? Я знал, что в онлайн-казино шансы против меня, пусть даже я после двух-трех часов и пополнил немного свой счет.

В других играх я не знаю, есть у меня преимущество или нет. Если я играю в покер с друзьями, то вижу, как моя стопка фишек растет и уменьшается. Но сколько времени пройдет, прежде чем я смогу сказать: я – лучший игрок? Если я установил стратегию спортивных ставок, как для чемпионата мира, – когда я узнаю, что она окупается?

Такие вопросы не ограничиваются азартными играми и спортом; они могут быть и политическими. Сколько избирателей нужно опросить, чтобы надежно оценить, кто выиграет президентские выборы в США? Они могут быть связаны с обществом: как узнать, проявляет ли компания расовую дискриминацию при найме людей? И даже личными: сколько времени вы должны отдать работе или отношениям с другим человеком, прежде чем решиться что-то поменять?

Удивительно, но существует формула, которая отвечает на все эти вопросы: назовем ее уравнением уверенности[39]. Вот оно:



Понятие степени уверенности отражается центральным символом ± (плюс-минус). Представьте, что вы спрашиваете меня, сколько чашек кофе в день я выпиваю. Я не знаю наверняка, поэтому могу сказать что-то вроде «четыре плюс-минус парочка», или 4 ± 2. Это – доверительный интервал, удобное обозначение и среднего значения, и отклонения от него. Это не значит, что я никогда не могу выпить 7 чашек (или только одну), но я вполне уверен, что в большинстве случаев выпиваю от 2 до 6 чашек.

Уравнение 3 позволяет нам делать более точные утверждения о нашей уверенности в каком-либо событии. Представьте, что я прошу всех читателей этой книги запустить 400 раз колесо рулетки, ставя по 1 фунту на красное или черное. На рулетке 37 номеров: от 1 до 36, раскрашенные поочередно в красный и черный цвета, и особый зеленый 0 (зеро). Он обеспечивает преимущество казино. Например, если какой-то игрок ставит на красное, то вероятность попадания шарика на красный номер составляет 18/37, и в случае этого события игрок возвращает свою ставку и получает еще такую же сумму. Вероятность потери денег (непопадания шарика на красный цвет) составляет 1 – 18/37 = 19/37. Ожидаемый (средний) выигрыш игрока при ставке в 1 фунт составляет 1 ∙ 18/37 – 1 ∙ 19/37 = –1/37; поэтому при каждом повороте колеса игрок в среднем проигрывает 2,7 пенса. В уравнении 3 средний проигрыш обозначен буквой h, и в нашем случае h = –0,027 (фунтов). За 400 попыток каждый из читателей проиграет в среднем h ∙ n = 0,027 ∙ 400 = 10,8 фунта.

Следующий шаг – определить степень отклонения от среднего. Не каждый читатель проиграет (или выиграет) одну и ту же сумму. Даже без арифметических подсчетов понятно, что при одном обороте рулетки можно наблюдать большую разницу в результатах: если я ставлю 1 фунт, то либо удвою свои деньги, либо потеряю их. Отклонение имеет такую же величину, как инвестируемая сумма, и гораздо больше, чем средняя потеря в 2,7 пенса.

Определим отклонение количественно. Для этого найдем средний квадрат разности между результатом одного вращения и средним значением. Среднее значение равно –0,027 фунта, и если мы выиграли фунт, то квадрат разности равен (1 – (–0,027))2 = 1,0547, а если проиграли 1 фунт, то (–1 – (–0,027))2 = 0,9467. Всего есть 18 удачных исходов и 19 неудачных, поэтому средний квадрат разности, который обозначают σ2, равен:



Такой средний квадрат разности σ2 называют дисперсией. У рулетки она очень близка к единице, но не равна ей. Если бы на рулетке было только 36 номеров, половина красных и половина черных, дисперсия была бы в точности единица.

Дисперсия увеличивается пропорционально количеству вращений колеса. Если я запускаю колесо рулетки дважды, она удваивается; если три раза – утраивается и т. д. Дисперсия при n попытках равна n ∙ σ2.

Обратите внимание, что при вычислении дисперсии мы возводим разность в квадрат, поэтому ее размерность – фунты в квадрате, а не фунты. Чтобы получить снова фунты, можно извлечь из дисперсии квадратный корень и получить так называемое среднеквадратичное (стандартное) отклонение σ; в нашем случае σ = 0,9996. Соответственно, за 400 оборотов мы получим среднеквадратичное отклонение



Теперь у нас есть большая часть компонентов для уравнения уверенности. Единственный элемент, который мы еще не объяснили, – число 1,96. Оно появляется из математической формулы, которая описывает кривую нормального (гауссовского) распределения; эта колоколообразная кривая используется для представления роста людей или их IQ. Вы можете вообразить нормальное распределение в виде колокола с точкой максимума в среднем значении (например, при запуске рулетки 400 раз средний выигрыш будет 10,8 фунта; если мы станем измерять рост мужчин в Великобритании, то среднее значение будет 175 сантиметров)[40]. На рисунке 3 показана кривая нормального распределения для 400 запусков рулетки и ставок по 1 фунту.

Теперь представьте, что мы хотим найти интервал, который содержит 95 % площади этой колоколообразной фигуры.


Рис. 3. Нормальное распределение


Для 400 запусков рулетки это интервал, куда попадут 95 % прибылей или убытков читателей. Величина 1,96 берется именно отсюда. Чтобы интервал содержал 95 % наблюдений, его граничные значения должны в 1,96 раза превосходить среднеквадратичное отклонение. Иными словами, в нашем случае 95 %-й доверительный интервал для нашей прибыли после 400 запусков рулетки определяется уравнением 3:



После 400 запусков рулетки читатель в среднем потеряет 10,8 фунта. Печально. С другой стороны, ±39,2 определяет довольно широкий доверительный интервал, поэтому некоторые читатели преуспеют. Получившие прибыль игроки будут в явном меньшинстве – их всего 31,2 % от общего количества тех, кто крутил рулетку 400 раз. Я обращал на это внимание, когда ходил в казино или на скачки с небольшой группой людей. Обычно находится один человек, который выигрывает и остается в плюсе. Это ощущается как общая победа, особенно когда он покупает всем выпивку.

Итак, вот первый урок из уравнения уверенности. Победитель может считать, что у него была умная стратегия, а в реальности почти треть людей покидают казино победителями. Но случайность не должна их одурачивать. Они счастливчики, а не умельцы.

* * *

Я упустил важную деталь: сказал вам, что распределение результатов игры соответствует нормальному закону, но не объяснил почему. Объяснение восходит к работе Абрахама де Муавра 1733 года.

В своей первой книге «Доктрина шансов», посвященной азартным играм и опубликованной в 1718 году[41], де Муавр определял вероятность получения конкретных рук в карточных играх и выигрышных исходов при бросании костей – например, прихода двух тузов в пятикарточной руке или выпадения двух шестерок при бросании двух костей[42]. Он вел читателя через вычисления, предлагая упражнения для улучшения понимания. Советы именно такого рода просили у него игроки, искавшие его в кофейне Old Slaughter’s.

В работе 1733 года де Муавр спрашивал своих читателей, как вычислить результат подбрасывания симметричной монеты 3600 раз. Для двух бросков монеты вероятность получить подряд два орла нетрудно найти прямым умножением: Вероятность получить три орла при пяти бросках можно найти, если выписать все возможные варианты, когда выпадает три орла (и, соответственно, две решки):

ГГГРР, ГГРГР, ГГРРГ, ГРГРГ, ГРГГР, ГРРГГ, РГРГГ, РГГРГ, РГГГР, РРГГГ,

что дает нам 10 различных вариантов. Еще в 1653 году Блез Паскаль показал, что число способов взять k предметов из n (которое обозначается Cnk) определяется формулой:



Выражение k! которое называют факториалом, определяется так: k! = k ∙ (k – 1) ∙ (k – 2) ∙ … ∙ 2 ∙ 1. В нашем примере n = 5 (пять бросков монеты и их результатов), а k = 3 (три орла, которые должны оказаться среди этих результатов). Следовательно,



Получился тот же результат, что и при прямом переборе всех возможных вариантов. Поскольку вероятность выпадения орла на симметричной монете равна 1/2, то вероятность получить k орлов при n бросаниях монеты равна



Для n = 5 и k = 3 получаем



Следовательно, шансы на выпадение трех орлов при пяти бросках монеты равны 31,25 %.

Де Муавр знал о таком распределении вероятностей (сейчас оно называется биномиальным распределением), но он также понимал, насколько непрактично применять этот способ, когда n – большое число. Чтобы решить аналогичную задачу для n = 3600 подбрасываний монеты, понадобится возвести двойку в степень 3600 и вычислить 3600 ∙ 3599 ∙ … ∙ 2 ∙ 1. Попробуйте это посчитать. Такое невозможно осуществить вручную и трудно даже на компьютере.

Трюк, который проделал де Муавр, – отказ от непосредственного умножения и изучение математической формы биномиального распределения. Он вывел формулу для приближения факториалов больших чисел, а его друг, шотландский математик Джеймс Стирлинг, нашел точное значение константы в ней[43], и де Муавр доказал, что при достаточно больших n вышеприведенное выражение для вероятности получить k орлов при n бросках монеты приблизительно равно



На первый взгляд кажется, что это выражение сложнее, чем исходная формула вероятности для биномиального распределения, поскольку тут есть квадратные корни, константа π = 3,14… и экспонента. Но здесь нет многочисленных умножений, необходимых для вычисления факториалов, и это главное в результате де Муавра. Можно вычислять значения для 3600 или даже миллиона бросаний, просто подставляя нужные значения k и n. Теперь де Муавр мог для вычисления использовать таблицы логарифмов или логарифмическую линейку. Технологии XVIII века способны были вести расчеты для миллиона бросаний.

Де Муавр построил первый доверительный интервал для такого события. Он показал, что шансы получить при 3600 бросаниях меньше 1740 или больше 1860 орлов составляют примерно 21 к 1, то есть вероятность получить от 1740 до 1860 орлов примерно равна 95,4 %[44].

В общем случае функция



с параметрами μ и σ2 называется плотностью нормального (гауссовского) распределения, и это одна из самых важных функций в математике. Де Муавр, видимо, не осознавал всей важности своей формулы, и только в 1810-х Пьер-Симон, маркиз де Лаплас, понял весь ее потенциал. Лаплас изучал так называемую производящую функцию моментов, которая позволяет однозначно определить распределение через его моменты[45]. Производящие функции моментов позволили Лапласу исследовать, как меняется форма распределения при сложении множества случайных результатов (например, выпадения чисел на колесе рулетки или бросания костей). Лаплас продемонстрировал замечательную вещь: независимо от того, что суммировать, по мере увеличения числа слагаемых моменты суммы всегда становятся всё ближе к моментам нормального распределения.

Потребовалось несколько лет, чтобы справиться с некоторыми хитрыми исключениями в результате Лапласа (к некоторым из них мы вернемся в главе 6). Над теми же вопросами работали в XX веке русский математик Александр Ляпунов и финский математик Ярл Вальдемар Линдеберг. Результат, доказанный Линдебергом в 1920 году, известен сегодня под названием «центральная предельная теорема»[46]. Она говорит, что если мы складываем много независимых случайных величин (например, измерений) со средним значением h и среднеквадратичным отклонением σ, то распределение суммы этих величин будет близко к нормальному со средним значением h ∙ n и среднеквадратичным отклонением σ√n.

Чтобы оценить масштабность этого результата, рассмотрим несколько примеров. Суммируя результаты бросания игральной кости, мы получим нормальное распределение. Суммируя результаты последовательных результатов в карточных играх, рулетке или онлайн-казино, – получим также нормальное распределение. И общее количество очков в играх сезона Национальной баскетбольной ассоциации имеет нормальное распределение (см. нижнюю диаграмму на рис. 3)[47]. И урожайность имеет нормальное распределение[48]. Скорость движения по автостраде тоже. Как и рост людей, их IQ и результаты личностных тестов[49].

Везде, где результат обусловлен различными случайными факторами, можно найти нормальное распределение, поэтому уравнение 3 используют для построения доверительного интервала в любой области, где раз за разом происходит повторение одного типа действий или наблюдений.

* * *

В главе 1 я показал, как игрок с преимуществом в 3 % может всего за один год превратить стартовый капитал в 1000 фунтов в сумму 57 миллионов. Если делать ставки и использовать выигрыши в дальнейшей игре, то капитал растет экспоненциально. И здесь я подошел к неизбежной ловушке для моего гипотетического игрока. Я назову этого человека Лизой. Как Лиза узнает, что ее преимущество составляет 3 %?

Нейт Сильвер, создатель и редактор сайта спортивных и политических прогнозов FiveThirtyEight, для объяснения таких ситуаций использует термины «сигнал» и «шум»[50]. В спортивных ставках значение средней прибыли (или потери) при одной ставке (величина h в уравнении 3) – это сигнал. Если у Лизы есть преимущество в 3 %, то в среднем на каждую ставку в 1 фунт она выиграет 3 пенса. Шум при ставке измеряется величиной среднеквадратичного (стандартного) отклонения σ. Как и в случае рулетки, шум в спортивных ставках гораздо больше, чем сигнал. Например, если Лиза ставит 1 фунт на какую-то команду с шансами 1/2, то она либо проиграет 1 фунт, либо выиграет 50 пенсов. С помощью формулы выше можно показать, что стандартное отклонение в этом случае равно 0,71[51]. Таким образом, шум, измеряемый стандартным отклонением (σ = 0,71), при одной ставке гораздо больше, чем сигнал (h = 0,03). Мы скажем, что отношение сигнала к шуму в нашем случае h/σ = 0,03/0,71 ≈ 1/24.

Казино знает, что у него есть преимущество, поскольку поставило рулетки, его обеспечивающие, и отношение сигнала к шуму равно 1/37. Лиза вынуждена при определении того, есть ли у нее преимущество, опираться на свой прошлый опыт. Именно здесь уравнение уверенности важнее всего для профессионального игрока. Если Лиза получила прибыль в h фунтов на ставку, а стандартное отклонение для ставки равно σ, то доверительный интервал для оценки преимущества h можно найти, поделив части уравнения 3 на n:



Например, если Лиза сделала 100 ставок и получила в среднем 3 пенса на каждую, этот доверительный интервал выглядит так:



Ее преимущество может составлять 17 пенсов (0,03 + 0,14 = 0,17), но оно иногда оборачивается потерей 11 пенсов в среднем. Все возможные величины для преимущества между –0,11 и +0,17 лежат в этом 95 %-м интервале[52]. Сделанные ею 100 ставок говорят слишком мало о том, работает ее стратегия или нет.

Поскольку доверительный интервал содержит 0, Лиза не может быть вполне уверена, что ее сигнал h положителен и ее игровая стратегия работает. Есть простое эмпирическое правило, которое она может использовать, чтобы узнать, сколько наблюдений нужно, чтобы надежно определить сигнал. Прежде всего округлим 1,96 до 2: для эмпирического правила разница между этими числами мала. Перепишем уравнение уверенности, чтобы определить условие, при котором доверительный интервал не включает ноль[53]:



Таким образом, если мы возьмем n наблюдений, то сможем обнаружить отношение сигнала к шуму, превосходящее 2/√n.

Ниже дана таблица некоторых значений, чтобы вы представляли, как работает это правило.



Преимущество на ставках или в финансовой сфере, как правило, имеет отношение сигнала к шуму примерно 1/20 или даже 1/50; поэтому, чтобы его обнаружить, нужны тысячи и даже десятки тысяч наблюдений. Для отношения сигнала к шуму h/σ = 1/24, как на спортивных ставках у Лизы, потребуется n > 2304 наблюдений. Больше двух тысяч наблюдений – это очень много футбольных матчей. Если Лиза считает, что ее преимущество на рынке английской Премьер-лиги составляет 3 %, то ей придется для уверенности прождать шесть сезонов.

За эти шесть лет другие игроки могут наткнуться на такое преимущество и нивелировать его. Обширные операции Мэттью Бенхэма и Тони Блума постоянно направлены на поиск возможностей. Как только два этих больших Б оказываются в игре, букмекеры корректируют свои коэффициенты и преимущество исчезает. Лиза рискует, поскольку не осознает, что ее преимущество исчезло. Чтобы убедиться, что преимущество существует, требуется больше 1000 матчей. Чтобы понять, что оно исчезло, может потребоваться столько же больших убытков. Прибыль, которая экспоненциально росла, превратилась в такой же экспоненциальный ущерб.

Большинство инвесторов-любителей представляют, что им нужно отделить сигнал от шума, но мало кто понимает важность извлечения квадратного корня в полученном нами правиле. Например, для обнаружения сигнала вдвое меньшей мощности требуется вчетверо больше наблюдений, и, наоборот, увеличив число наблюдений с 400 до 1600, вы сможете заметить всего вдвое большее преимущество. Очень легко недооценить объем данных, необходимых для обнаружения крошечных преимуществ на рынках.

* * *

Я позвонил Яну в Берлин, чтобы спросить, как дела у него с Мариусом. Все шло хорошо – Мариус даже предупреждал Яна, что мне следует говорить. Однако Ян, как обычно, хотел беседовать о цифрах.

– Что я не могу тебе сказать, пока ты не поговоришь снова с Мариусом и не проверишь, что все в порядке? То, что наш оборот составляет 70 миллионов фунтов. За последний месяц мы сделали 50 000 ставок со средним преимуществом 1,5–2 %.

По сравнению с этим те 50 фунтов, которые мы ставили на чемпионате мира, были мелочью. Когда я сказал Яну, что сейчас пишу про доверительные интервалы, он вспомнил ту игровую модель, что мы построили вместе.

– Да, мы на этом заработали, – сказал он. – Однако, если честно, это не то, что мы станем использовать в будущем.

Он оказался прав: наша модель для чемпионата мира была построена на 283 наблюдениях от предыдущих турниров. Теперь же Ян создал базу данных по 15 миллиардам позиций для ставок, охватывавших многие виды спорта за последние девять лет.

– Мы сосредоточиваемся на стратегиях, где у нас есть больше 10 тысяч подтверждающих наблюдений, – сказал он.

Это давало им уверенность, что их стратегия действительно обладает долгосрочным преимуществом.

Главное преимущество Яна и Мариуса основывалось на национальных различиях. Бразильцы ожидают больше голов в своих матчах, чем забивают на самом деле. Немцы – пессимисты и предпочитают ставить на скучные 0:0.

– Норвежцы отличаются точностью, – смеется Ян. – Идеально рациональные скандинавы.

Я вспомнил свой разговор с Мариусом – как раз рациональным норвежцем – во время чемпионата мира, когда мы обсуждали, как забраться в голову игрока. Он всегда считал, что важно иметь базовое объяснение для любой стратегии ставок. Теперь у него есть одно такое объяснение: применение национальных стереотипов.

* * *

Вы ищете гостиницу на сайте TripAdvisor. Вы желаете остановиться в месте, которое получило оценки в 4 звезды или больше, и скептически относитесь ко всему, что оценено в 3,5 звезды и ниже. Сигнал, который вы здесь ищете, – разница в ползвезды. Принципы присвоения звезд на сайте TripAdvisor различны: одни с энтузиазмом раздают пятерки, а несколько недовольных вечно ставят единицы. Однако в целом шум при оценке составляет около одной звезды: большинство людей ставят 3, 4 или 5 звездочек при среднем значении, слегка превышающем 4[54].

Мы можем ответить на вопрос, сколько обзоров нам нужно прочитать, чтобы надежно выявить отношение сигнала к шуму, равное 1/2: либо используя табличку выше, либо решив уравнение где 1/2 – отношение сигнала к шуму. Это дает нам √n = 4, что эквивалентно n = 16 оценкам на сайте. Вместо того чтобы искать среднее значение по всем сотням оценок для данной гостиницы, возьмите последние 16 и посчитайте среднее. Это даст вам одновременно и свежую, и надежную информацию.

Звездами можно оценивать не только гостиницы. Джесс не уверена в том, что правильно выбрала работу для карьеры. Она трудится в организации, занимающейся защитой прав человека. Это однозначно хорошее дело, однако руководительница просто несносна. Она целый день названивает Джесс и предъявляет непомерные требования. Ее знакомый Стив шесть месяцев встречается с Анной. Их отношения непостоянны: сейчас горячие, а в следующую минуту уже холодные. Они ужасно ссорятся, но когда разборок нет, то все замечательно.

Уравнение уверенности дает определенные указания и для Джесс – сколько ей оставаться на работе, и для Стива – сколько ему продолжать отношения с Анной, прежде чем расстаться. Сначала им нужно установить подходящие интервалы времени. Стив и Джесс решают оценивать каждый день по шкале от 0 до 5 звезд. Затем они планируют регулярно встречаться и оценивать складывающиеся ситуации.

Вечером в пятницу первой недели у Стива происходит страшная ссора с Анной, потому что она отказывается пойти с ним в компанию друзей. Стив звонит Джесс и жалуется: в результате три дня в его неделе получают по 1 звезде. Джесс напоминает ему, что не надо делать выводы слишком быстро. В конце концов, n = 7, и сигнала в шуме пока не найти. У Джесс на работе все хорошо – в основном потому, что ее проблемная начальница была в командировке, так что все дни получили по 3 и 4 звезды.

Через месяц (n = 30) они встречаются за обедом и начинают лучше понимать, как идут дела. Стив провел с Анной несколько хороших недель. В прошлый уик-энд они ездили в Брайтон, плюс к этому было несколько приятных обедов, где они отлично провели время. У Стива были целые полосы 5-звездочных дней. У Джесс все наоборот: когда ее начальница вернулась, то постоянно сердилась, кричала и теряла терпение по малейшему поводу. Дни у Джесс – это 1–2 звезды и даже найдется несколько 0-звездочных.

Прошло немногим более двух месяцев: n = 64, а 2/√n = 1/4. Теперь степень уверенности втрое выше, чем после первой недели. У Стива хорошие дни перевешивают плохие, но всё равно идут постоянные ссоры: оценки – по 3 и 4 звезды. Босс Джесс – реальная проблема, зато она работает над ценным проектом, на котором всегда хотела сосредоточиться. В лучшем случае она ставит 3 и 4 звезды, но в основном оценки – 1 и 2.

Хотя каждая неделя дает новые наблюдения, правило извлечения квадратного корня означает, что скорость получения Стивом и Джесс новой информации не пропорциональна времени, а ниже. Польза от новых наблюдений уменьшается, поэтому они решают ограничить свои обсуждения и установить срок в 100 дней (три месяца с небольшим), после чего с достаточной уверенностью окончательно решить вопрос о своем будущем.

Итак, этот день настал: n = 100, а 2/√n = 1/5. Они оглядываются не только на последние несколько недель, но и на всё, что происходило за это время. У Стива с Анной ссоры происходят реже. Они вместе стали ходить на уроки кулинарии, по вечерам с радостью готовят и приглашают к себе друзей. Жизнь хороша. Стив определяет доверительный интервал. У него получается средняя оценка h = 4,3 звезды, а стандартное отклонение σ = 1,0. Доверительный интервал для его отношений с Анной: 4,3 ± 0,2. Солидное среднее, уверенно выше четырех звезд. Стив решает прекратить жаловаться на Анну; он убежден, что нашел партнера на всю жизнь.

У Джесс ситуация не так благоприятна. Ее среднее h = 2,1 звезды. По-настоящему хороших дней было очень мало, поэтому стандартное отклонение меньше, чем у Стива: σ = 0,5. Ее доверительный интервал: 2,1 ± 0,1. По сути, у Джесс работа на две звезды. Она уже начала искать новую должность и в понедельник собирается подать заявление об уходе.

* * *

В 1964 году Малькольм Икс сказал: «Неважно, насколько сильно белые уважают и признают меня; пока такое же уважение и признание не проявляется ко всему нашему народу, его для меня не существует».

Идея, выраженная в этих словах, рождается из математики. Опыт одного человека – будь то Малькольм Икс или кто-то еще – дает нам очень мало информации. Это все равно что один раз дернуть ручку игрового автомата. Тот факт, что у Джесс был один хороший день на работе, ничего не говорит о ее карьере за долгий промежуток времени. Когда люди стали прислушиваться к Малькольму Иксу, это не значило ничего, пока они не прислушались к афроамериканцам в целом. Борьба цветных в США против дискриминации во всех формах, рассказанная через истории Малькольма Икса, Мартина Лютера Кинга и других, была и остается борьбой десятков миллионов людей.

Джоанна слышит о вакансии на своей работе. Вечером она встречает на вечеринке Джеймса и рассказывает ему об этом. Тот воодушевляется, говорит, что мечтал о такой работе, и в понедельник подает заявление о приеме. Через несколько дней Джеймс уже приступил к новой работе, а Джоанна вдруг у магазинчика с выпечкой сталкивается с Джамалом. Он спрашивает, как у нее дела, и Джоанна рассказывает, что у них только что начал работать Джеймс. Джамал воодушевляется, говорит, что мечтал о такой работе, и спрашивает Джоанну, нет ли других вакансий…

Джоанна белая. Джеймс тоже. Джамал – нет. Джоанна расистка? Нет. Она действовала бы точно так же, если бы первым встретила Джамала. Просто так случилось, что с Джеймсом она столкнулась раньше.

Однако можно еще поразмышлять о том, почему так вышло. Поскольку Джоанна и Джеймс принадлежат к одной социальной группе, они чаще встречаются и делятся информацией о возможностях. Их взаимная помощь может косвенно дискриминировать Джамала. Он не имеет доступа к тем же социальным возможностям, что Джеймс и Джоанна.

Здесь нужно быть осторожными. Мы не можем делать какие-либо выводы из истории Джоанны. У нас всего одно наблюдение, один случай ее взаимодействия с Джеймсом и Джамалом. По одному событию доверительный интервал не построить. Именно поэтому порой трудно обнаружить расовую дискриминацию. Каждый отдельный случай – всего одно наблюдение, из которого мы узнаем очень мало. Единственный способ понять роль расы в обществе – изучить множество наблюдений и построить доверительный интервал.

* * *

Моа Бёрселл, исследователь и преподаватель кафедры социологии в Стокгольмском университете, два года писала резюме и отправляла заявки на работу в Швеции. Всего она подала заявления больше чем на две тысячи разных должностей в сферах информатики, бухгалтерии, преподавания, в качестве водителя и медсестры. Однако Моа вовсе не искала работу. Она проверяла предвзятость работодателей, которым писала.

Для каждого заявления Моа создавала два отдельных резюме и сопроводительных письма, в которых описывала близкую квалификацию и опыт работы. Затем случайным образом придумывала имена для каждой пары. Одно имя звучало по-шведски, например Йонас Сёдерстрём или Сара Андерссон; второе было не шведским – скажем, Камаль Ахмади или Фатима Ахмед, указывавшие на арабское мусульманское происхождение, или Мтупу Хандуле либо Уасила Балагве, говорившие об африканском не мусульманском происхождении. Схема эксперимента Моа была эквивалентна подбрасыванию монеты. Если работодатели будут беспристрастными, они с равной вероятностью позвонят человеку со шведским и иностранным именем.

Однако этого не происходило. Например, в одном исследовании с n = 187 заявками от шведских и арабских мужчин мужчинам с арабскими именами позвонили вдвое реже, чем шведам[55]. Такие результаты нельзя объяснить случайностью. Мы можем увидеть это, построив доверительный интервал. Арабским мужчинам позвонили 43 раза, вероятность такого звонка (сигнал) h = 43/187 = 23 %. Чтобы оценить дисперсию, будем использовать 1 для человека, которому позвонили, и 0 для того, кому не звонили. Теперь, как и в случае рулетки, вычисляем среднеквадратичное расстояние между этими величинами и h и получаем стандартное отклонение σ = 0,649. Если мы подставим эти величины в уравнение 3, то получим доверительный интервал для звонков претендентам с арабскими именами 43 ± 17,3, который содержит значительно меньшие числа, чем 79 звонков, полученных шведами.

Более того, Моа улучшила резюме арабских мужчин, добавив им от одного до трех лет опыта по сравнению со шведскими конкурентами. Это не помогало им найти работу. Более опытному арабу звонили только в 26 случаях – по сравнению с 69 звонками менее квалифицированным шведам; и это значение снова не попадает в доверительный интервал 26 ± 15,9.

«В моих результатах важнее всего то, – сказала она мне, – что их очень просто понять. С цифрами не поспоришь»[56].

Когда Моа читает лекции по этой теме в Стокгольмском университете, она может увидеть реакцию студентов по их лицам. «Когда я смотрю на голубоглазых блондинов, они внимательно слушают. Они не думают, что это честно, но это их не трогает. Зато у людей с карими глазами, темными волосами и темной кожей я вижу другую реакцию, – продолжает она. – Это про них, их друзей, братьев и сестер. Для некоторых это означает окончательное признание. И это может быть облегчением. Они видят, что они не сумасшедшие. Их восприятие реальности подтверждается».

Эти учащиеся часто рассказывают ей о своем опыте, но другие по-прежнему молчат. «Знание о моем расследовании может травмировать, – сказала она мне. – Я вижу, что они расстроены. У них ощущение, словно им сказали: от вас мало толку, вам тут не место».

Моа аккуратно указывает, что из ее работы не следует, будто найти работу невозможно. Смысл исследования – выявить масштабы несправедливости; это не означает, что все в Швеции расисты. Оно показывает, что Камаль Ахмади и Йонас Сёдерстрём должны потратить разное количество времени, если хотят выиграть в этой лотерее вакансий.

Когда реальный Камаль Ахмади подает заявление о работе в Швеции, он не знает наверняка, с каким игровым автоматом имеет дело. Если он подал заявление, а его не вызвали на собеседование, то он не может утверждать, что его дискриминируют. Точно так же реальный Йонас Сёдерстрём не может увидеть преимущество, которое отдает ему этот игровой автомат. Он имеет квалификацию для работы; он подал заявление; ему позвонили и пригласили на собеседование. С его точки зрения, ничего неправильного не произошло.

Я изложил Моа это соображение о Камале и Йонасе, и она сказала: «Это верно, но некоторые люди иногда сами ставят эксперименты. Приехавшие из-за границы рассказывали мне, как искали работу в местном супермаркете и им сообщали, что вакансия уже закрыта. Но когда они потом просили шведского приятеля позвонить по телефону в магазин и узнать, открыта ли еще вакансия, тому сообщали, что можно прийти на собеседование».

Моа и ее коллеги разослали уже свыше 10 000 резюме, чтобы проверить различные гипотезы о шведском рынке труда. Некоторые результаты удручают: дискриминация мужчин арабского происхождения сильнее всего проявляется в ситуациях с низкоквалифицированной работой. Другие результаты вдохновляют больше: дискриминация арабских женщин выражена слабее и исчезает, если у этих женщин больше опыта работы.

Подобные исследования повторялись по всему миру со схожими результатами[57]. Работа Моа показывает пример структурного расизма, дискриминации, которую часто трудно увидеть на индивидуальном уровне, но легко обнаружить с помощью уравнения уверенности. Недавно ведущий медицинский журнал The Lancet опубликовал доверительные интервалы для измерения социального неравенства в США – от бедности, безработицы и лишения свободы до заболеваемости диабетом и сердечными недугами[58]. Чернокожие американцы статистически отличались от белых по всем параметрам. Свалки токсичных отходов строятся близко к районам, выделенным по расовому признаку; правительство не может предотвратить попадание свинца в питьевую воду; мелкие оскорбления на расовой почве; пониженная зарплата за одинаковую работу; целевой маркетинг сигарет и содержащих сахар продуктов; принудительная реконструкция и снос жилья; ограничения для избирателей; здравоохранение по сниженным стандартам вследствие явных или неявных предубеждений; исключение из социальных связей, которые могли бы помочь при поиске работы, – список можно продолжать. Психологическое и физическое здоровье отдельных афроамериканцев и коренных американцев ежедневно подвергается мелкой дискриминации, при этом никакого открытого расизма может и не быть.

Вернемся к Джоанне. Сталкивается ли она чаще с Джеймсами, чем с Джамалами? Чтобы это выяснить, она решает прибегнуть к уравнению уверенности. Она вспоминает всех, кому было бы интересно работать в издательстве, где она трудится: талантливых людей, затем собственных друзей, с которыми постоянно общается[59]. Из 100 друзей Джоанны 93 белые; однако доля белых в населении США 72 %: 93–72 = 21. Ее дружеские отношения имеют перекос в расовом плане. Джоанна проверила свою привилегированность. Она пробудилась и осознала, что люди, с которыми она знакома, не отражают населения в целом и принадлежат к привилегированной группе, которая делится информацией о наличии работы в своей среде. Что Джоанне делать с этим – трудный вопрос.

Вот что я думаю. Не математический ответ на вопрос, а просто мои размышления. Джоанне не надо менять друзей. Она должна дружить с тем, с кем хочет. Но ей нужно подумать, что она может сделать в такой ситуации. Это просто. Она может написать Джамалу и другим семи приятелям из меньшинства, когда слышит о вакансии на работе, или просто поговорить с ними. У Джамала группа общения еще более перекошена: 85 из 100 черные – по сравнению с долей 12,6 % в общем населении США и 25 % в Нью-Йорке, где он живет. Одним быстрым сообщением Джоанна полностью меняет демографию людей, которые знают о вакансии.

Мои взгляды часто именуют политкорректностью. Я предпочитаю называть это статистической корректностью. Речь о статистическом осознании следующего факта: то, что мы ощущаем индивидуально, часто не отражает мир в целом. Каждый из нас как личность должен сам решить, насколько статистически правильны наши жизни и что нам с этим делать.

* * *

Уравнение уверенности, возможно, и было создано для азартных игр, но изменили его именно естественные и в итоге социальные науки. Первым участником «Десятки», осознавшим научную мощь нормальной кривой, был Карл Фридрих Гаусс, который использовал ее свойства в 1809 году, чтобы оценить ошибки в определении местоположения астероида Церера. Сегодня нормальное распределение ча

Скачать книгу

Список иллюстраций

Рис. 1. Иллюстрация, как логистическая регрессия дает оценки α = 1,16 и β = 1,25

Рис. 2. Иллюстрация теоремы Байеса

Рис. 3. Нормальное распределение

Рис. 4. Как предположение о марковости может оценивать передачи в футболе

Рис. 5. Парадокс дружбы для четырех участников

Рис. 6. Как меняется со временем отношение к трем товарам

Рис. 7. Иллюстрация к вычислению корреляции между Кайли и косметикой

Рис. 8. Как отслеживающая переменная отслеживает вознаграждение

Рис. 9. Как обучается нейронная сеть

Рис. 10. Иллюстрация сортировки слиянием и алгоритма Дейкстры

Введение: «Десятка»

Существует ли секретная формула обретения богатства? Или счастья? Или популярности? Или уверенности в себе и здравомыслия?

Если вы просматриваете книги в местном магазине и выбрали эту или только что щелкнули по кнопке «Заглянуть» в онлайн-магазине, то знайте: есть множество заголовков, которые предлагают вам какую-нибудь формулу для успеха в жизни.

Мари Кондо советует убраться. Шерил Сэндберг – не бояться действовать. Джордан Питерсон призывает выпрямиться. Брене Браун – быть уязвимыми[1]. Вам говорят, что вам надо, пес раздери, успокоиться; прекратить делать вон ту фигню, забить на всё, не быть лохом и извлекать пользу из каждого чертова момента в жизни. Нужно рано вставать, заправлять постель, расчищать путь, меньше делать, больше запоминать, избавляться от хлама в голове, добиваться целей, взращивать силу воли, писать формулы счастья[2], «поступать как женщина, думать как мужчина»[3]. Есть формулы любви, богатства, план успеха и пять (или восемь, или двенадцать) правил уверенности в себе. Есть даже, видимо, чудо-уравнение, которое обещает сделать невозможные цели неизбежными[4].

Эти советы парадоксальны. Если бы все было так просто, если бы существовали несложные формулы для получения всего, чего мы хотим от жизни, то откуда же все эти книги и журналы, заполненные нравоучениями (зачастую противоречивыми)? Почему так много воодушевляющих телешоу и выступлений на конференциях TED с мотивационными монологами? Можно же просто сформулировать уравнения, дать несколько примеров, как они работают, и закрыть всю индустрию самосовершенствования и правильного мышления. Если здесь все так «математично», аксиоматично, почему не дать ответ прямо сейчас?

Количество предлагаемых решений жизненных проблем растет, и все труднее поверить, что есть одна формула для успеха (или даже несколько). Может, на самом деле нет простого лекарства от всех проблем, что ставит перед нами жизнь?

Я хочу, чтобы вы подумали о другой возможности – той, о которой повествует книга. Я расскажу историю о замечательном обществе людей, взломавших этот код. Они обнаружили несколько уравнений (десять), которые могут принести успех, популярность, богатство, уверенность в себе и здравомыслие. Они хранят секрет, пока остальные ищут ответы.

Это тайное общество было с нами столетиями. Его члены передавали свои знания из поколения в поколение. Они занимали высокие посты на государственной службе, в финансовой сфере, в академических кругах, а с недавнего времени – в технологических компаниях. Они живут среди нас, незримо, но активно консультируя нас, а иногда и контролируя. Они богаты, счастливы и уверены в себе. Они открыли секреты, которых так жаждут остальные.

В книге Дэна Брауна «Код да Винчи» криптограф Софи Невё при расследовании убийства своего деда обнаруживает какой-то математический код. Она знакомится с профессором Робертом Лэнгдоном, который открывает ей, что ее дед был главой тайного общества Приорат Сиона, где мир понимается через единственное число – золотое сечение (φ ≈ 1,618).

«Код да Винчи» – выдумка, но тайное общество, которое я изучал в рамках этой книги, имеет много общего с описанным Брауном. Его тайны зашифрованы в коде, который мало кто понимает до конца, а его члены общаются с помощью загадочных документов. Общество уходит корнями в христианство, его раздирают внутренние моральные сражения и конфликты. Но, как мы вскоре узнаем, оно во многом отличается от Приората Сиона. В частности, в нем нет ритуалов. Именно поэтому его гораздо труднее обнаружить, но его деятельность повсеместна. И оно невидимо для тех, кто снаружи.

Но откуда о нем знаю я? Ответ очень прост. Я в нем состою. Двадцать лет я участвовал в его работе, все более тяготея к его внутреннему кругу. Изучал работы этого общества и применял его уравнения на практике. На своем опыте ощутил успех, который может дать доступ к его коду. Работал в ведущих университетах мира и получил должность профессора прикладной математики за день до своего тридцать третьего дня рождения. Решал научные задачи в самых разных областях – от экологии и биологии до политологии и социологии. Консультировал людей из правительства, из области спорта, азартных игр, финансистов и специалистов по искусственному интеллекту. И я счастлив – отчасти благодаря своему успеху, но в основном, полагаю, из-за того, что секреты, которые узнал, сформировали мое мышление. Эти уравнения сделали меня лучше: сбалансировали мое мировоззрение и помогли понимать действия других.

Членство в клубе дало мне много знакомств с единомышленниками. С такими людьми, как Мариус и Ян – молодые профессиональные игроки, получающие выгоду на азиатских рынках ставок; Марк, микросекундные расчеты которого дают прибыль от небольших неэффективностей в ценах акций. Я работал с аналитиками футбольного клуба «Барселона», изучавшими, как Лионель Месси и компания контролируют поле. Я встречался с техническими экспертами, работающими в Google, Facebook, Snapchat и Cambridge Analytica, которые управляют нашими соцсетями и создают будущий искусственный интеллект. Я лично наблюдал, как исследователи Моа Бёрселл, Николь Нисбетт и Виктория Спейсер используют уравнения, чтобы обнаружить дискриминацию, понять наши политические дискуссии и сделать мир лучше. Я учился у старшего поколения – например, у 94-летнего профессора Оксфорда сэра Дэвида Кокса, открывшего код, на котором построено это тайное общество.

Теперь я готов рассекретить это общество. Я буду называть его «Десятка» – по числу уравнений, которые должен знать каждый компетентный участник. Я готов открыть эти секретные уравнения.

Проблемы, которые решает «Десятка», включают повседневные вопросы. Нужно ли вам бросать работу (или разрывать отношения) и пробовать что-то другое? Почему вы ощущаете, что менее популярны, чем окружающие? Сколько усилий надо приложить, чтобы стать популярнее? Как лучше справляться с огромным потоком информации из соцсетей? Должны ли вы позволять своим детям пялиться в телефон по шесть часов в день? Сколько эпизодов какого-нибудь сериала Netflix вам нужно посмотреть, прежде чем пробовать что-то другое?

Возможно, это не те проблемы, которые, на ваш взгляд, должно решать тайное общество. Но дело вот в чем. Один и тот же небольшой набор формул может дать ответы на тривиальные и глубокие вопросы, рассказать о вас как о личности, а также об обществе в целом. Уравнение уверенности, введенное в главе 3, которое помогает решить, стоит ли вам бросать работу, также позволяет профессиональным игрокам узнать, когда у них есть преимущество на рынке ставок, и выявляет малозаметные расовые и гендерные предубеждения на работе. Уравнение вознаграждения, описанное в главе 8, показывает, как соцсети довели общество до критической точки и почему это не обязательно плохо. Если мы поймем, как интернет-гиганты используют данное и другие уравнения, чтобы вознаграждать нас, влиять на нас и классифицировать нас, мы сможем лучше сбалансировать свое пользование соцсетями, играми и рекламой, а также погруженность в них наших детей.

Мы знаем, что эти уравнения важны, поскольку принесли успех людям, которые их уже применяют. В главе 9 излагается история трех инженеров из Калифорнии, которые использовали уравнение обучения, чтобы увеличить на 2000 % время, затрачиваемое людьми на просмотр YouTube. Уравнение ставок, уравнение влияния, уравнение рынка и уравнение рекламы изменили, соответственно, ставки, технологии, финансы и рекламу, принеся миллиарды долларов небольшому числу членов «Десятки».

По мере того как вы будете изучать уравнения в этой книге, начнут обретать смысл всё новые аспекты мира. Когда вы смотрите глазами участника «Десятки», крупные проблемы становятся мелкими, а мелкие – тривиальными.

Если вы просто ищете быстрые решения, то, конечно, есть одна загвоздка. Чтобы попасть в «Десятку», нужно овладеть новым способом мышления. Она просит разделить мир на три категории: данные, модель и бессмыслица.

Одна из причин, почему «Десятка» сегодня так сильна, в том, что данных сейчас больше, чем когда-либо: движения на фондовой бирже и рынках ставок, личная информация о том, что мы любим, покупаем и делаем, которую собирают Facebook и Instagram. Государственные организации владеют данными о том, где мы живем, как работаем, в какую школу ходят наши дети, сколько мы зарабатываем. В опросах общественного мнения собираются и обобщаются наши политические взгляды и позиции. В соцсетях, блогах и на новостных сайтах копятся новости и мнения. Регистрируется и сохраняется каждое движение звезд спорта на игровых полях.

Взрывной рост данных очевиден всем, но участники «Десятки» осознали важность математических моделей для их объяснения. Как и они, вы можете научиться строить модели, использовать уравнения для управления данными и их использования, чтобы получить выгоду – небольшое преимущество над другими.

Последняя категория, бессмыслица, – то, что нужно научиться распознавать. Вы поймете, что, как бы ни приятно было говорить чушь и как бы много времени мы этому ни посвящали, вам придется отказаться от этого, когда вы начнете мыслить как участник «Десятки». Вам нужно назвать бессмыслицу бессмыслицей, когда вы с ней встретитесь, – и неважно, кто ее говорит. Я покажу вам, как игнорировать бессмыслицу и сосредоточиться на данных и моделях.

Это не просто очередная книга по самосовершенствованию. Это не Десять заповедей. Это не список того, что разрешено, а что запрещено. Здесь есть уравнения, но нет рецептов. Вы не можете просто заглянуть на страницу 181 и узнать точное количество эпизодов сериала Netflix, которые вам нужно посмотреть.

Правила и рецепты эксплуатируют наши страхи. Но эта книга не использует страхи, а объясняет, как эволюционировал код «Десятки» и как он определял последние 250 лет человеческой истории. Мы будем учиться у математиков, которые разработали этот код, и поймем философию, лежащую в основе их мышления. Обучение у «Десятки» подвергает сомнению многие наши повседневные принципы. Вас ждет переосмысление терминов (например, политкорректность), переоценка суждений о других людях и пересмотр стереотипов.

Это также рассказ о морали, поскольку с моей стороны было бы неправильно раскрыть так много секретов, не исследовав, как общество «Десятки» повлияло на мир. Если какая-то малая группа людей может управлять остальными, нам нужно знать, что определяет их выбор. Эта история заставила меня заново оценить себя и мои действия, задаться вопросом, можно ли считать «Десятку» добром или злом, и задуматься о моральных правилах, которые нам нужно установить для себя в будущем.

Передавая силу новому поколению, дядя Человека-паука говорит ему: «С большой силой приходит большая ответственность». Когда на карту поставлено так много, скрытые возможности «Десятки» требуют еще большей ответственности, чем костюм Человека-паука. Вы узнаете секреты, которые могут изменить вашу жизнь. И вам придется также задуматься о том, какое влияние они оказали на мир, в котором мы живем. Слишком долго этот код был доступен только немногим избранным.

Сейчас мы поговорим об этом – открыто и вместе.

Глава 1. Уравнение ставок

Первое, что меня поразило в Яне и Мариусе, когда мы пожимали друг другу руки в холле гостиницы, – они были ненамного старше студентов, которым я преподавал в университете. И я надеялся узнать от них о мире азартных игр столько же, сколько они, по-видимому, рассчитывали узнать от меня о математике.

Мы поддерживали отношения в Сети, но увиделись впервые. Они прилетели пообщаться в рамках своего рода европейского турне, где встречались по очереди с прогнозистами и специалистами по ставкам на футбол – чтобы разработать собственную стратегию на следующий год. Мой родной город Уппсала в Швеции был последней их остановкой.

– Мы захватим ноутбуки в паб? – спросил меня Мариус, когда мы собирались уйти из гостиницы.

– Конечно, – ответил я.

Хотя это была просто встреча, «чтобы лучше узнать друг друга», а настоящая работа предполагалась на следующий день, все мы понимали, что даже для самых неформальных обсуждений нужно обрабатывать большие массивы данных. Ноутбуки всегда должны быть наготове.

Возможно, вы думаете, что для успешных футбольных ставок надо много знать, глубоко понимать эту игру, в том числе и форму всех спортсменов, иметь представление о травмах и, вероятно, получить какую-то инсайдерскую информацию. Может быть, десять лет назад дела обстояли именно так. В те времена внимательное наблюдение за матчами, за языком тела футболистов и отслеживание того, как они действуют в ситуациях один на один, могло дать вам преимущество перед игроками, которые примитивно ставили на команду, игравшую на своем поле. Но теперь все не так.

Ян проявлял к футболу лишь поверхностный интерес и не планировал смотреть большую часть матчей, на которые мы собирались делать ставки на предстоящем чемпионате мира 2018 года. «Буду смотреть матчи сборной Германии», – сказал он с улыбкой.

Был вечер церемонии открытия, весь мир следил за событиями. Однако если не считать интереса Яна к своей сборной, ему было все равно, о чем речь – о Бундеслиге, высшей лиге чемпионата Норвегии или чемпионате мира; о теннисе или конном спорте. Любой турнир и любой вид спорта были для него и Мариуса очередной возможностью заработать деньги. Именно поиск таких возможностей и привел их ко мне.

Несколькими месяцами ранее я опубликовал статью о моей собственной модели ставок[5]. Это была необычная математическая модель. Перед началом сезона Премьер-лиги сезона 2015/16 я написал единственное уравнение и предположил, что оно может улучшить коэффициенты букмекеров для исходов матчей Премьер-лиги. Так и оказалось.

К маю 2018 года прибыль составила 1900 %. Если бы вы в августе 2015 года вложили 100 фунтов в мою модель, то меньше чем за три года у вас было бы 2000 фунтов. Вам требовалось лишь бездумно делать те ставки, что предлагала моя модель.

Мое уравнение не имело ничего общего с тем, что происходило на поле. Оно никак не было связано с просмотром матчей, и ему однозначно было все равно, кто стал чемпионом мира. Эта математическая функция брала коэффициенты букмекеров, слегка подправляла их в соответствии с влиянием информации о прошлых матчах и предлагала выигрышные ставки.

Свое уравнение я совершенно не скрывал, и оно привлекло довольно большое внимание. Я опубликовал подробности в журнале «1843», принадлежащем The Economist Group, и рассказывал о нем в интервью BBC, CNBC, в газетах и социальных сетях. И именно об этой модели меня спрашивали сейчас Ян и Мариус.

– Как вы считаете, почему у вас по-прежнему преимущество? – спросил Мариус.

Валюта азартных игр – информация. Если вы знаете то, чего не знают другие, и эта информация приносит деньги, вам не придет в голову делиться ею. Чтобы защитить преимущество, нужно соблюдать тайну. Если схему будут использовать и другие игроки, букмекеры скорректируют свои коэффициенты. Преимущество исчезнет. По крайней мере в теории. Но я поступил наоборот: рассказал всем о своем уравнении. Мариусу было интересно, почему, несмотря на огласку, моя модель по-прежнему работает.

Значительную часть ответа на вопрос Мариуса можно найти в ежедневно получаемых мной электронных письмах и личных сообщениях в твиттере, где меня спрашивают: «Как думаете, кто выиграет завтрашний матч? Много читал о вас и начал в вас верить»; «Намереваюсь накопить средства, чтобы начать бизнес. Ваши советы о футболе однозначно ведут меня в нужном направлении»; «Кто выиграет – Дания или Хорватия? Чувствую, что Дании удастся победить, но не совсем уверен»; «Как вы думаете, каков будет результат ближайшего матча сборной Англии? Ничья?». Такие просьбы не прекращаются.

Мне не особенно приятно об этом говорить, но причина отправки подобных сообщений и есть ответ на вопрос Мариуса. Как бы я ни демонстрировал ограничения своего подхода и как бы ни подчеркивал долговременность стратегии, основанной на статистике, публика в основном задавала вопросы: «Выиграет ли “Арсенал” на выходных?» или «Выйдет ли Египет из группы, если Салах не будет играть?»

И это еще цветочки. Люди, которые мне пишут, хотя бы ищут в интернете советы по математике и азартным играм. Гораздо больше тех, кто забавляется безо всяких исследований. Они играют на внутреннем чутье, ради развлечения, по пьяному делу, потому что не могут остановиться. И в целом их намного больше, чем тех, кто использует мой метод или нечто подобное.

– Моя модель продолжает выигрывать, потому что она предполагает ставки, которые многие не желают делать, – объяснил я Мариусу. – Ставить на ничью в матче «Ливерпуль» – «Челси» или на то, что «Манчестер Сити» обыграет «Хаддерсфилд», где коэффициент очень мал, скучно и невесело. Чтобы получить какую-то прибыль, нужно время и терпение.

Первое электронное письмо Мариуса попало в один процент сообщений, отличившихся от общей массы. Он рассказал мне об автоматизированной системе, которую они с Яном разработали, чтобы получать выгоду на рынках ставок. Их идея заключалась в использовании того, что большинство букмекеров – «мягкие»: они предлагают коэффициенты, не всегда отражающие реальную вероятность победы той или иной команды.

Подавляющее большинство игроков (вероятно, все те, кто спрашивал у меня совета) используют мягких букмекеров. Ведущие конторы – Paddy Power, Ladbrokes и William Hill – мягкие, как и менее крупные организации вроде RedBet и 888sport. Они отдают предпочтение специальным предложениям, побуждающим людей играть, но уделяют меньше внимания определению тех коэффициентов, которые отражают вероятные исходы спортивных событий. А вот «резкие» букмекеры, например Pinnacle или Matchbook, определяют коэффициенты для предсказания результатов более точно; этими конторами, как правило, пользуются лишь 1 % игроков[6].

Идея Мариуса и Яна состояла в использовании резких букмекеров, чтобы забирать деньги у мягких. Их система отслеживала ставки у всех букмекеров и выискивала расхождения. Если один из мягких букмекеров давал более выгодные коэффициенты, чем резкие, их система предлагала сделать ставку у него. Такая стратегия не гарантировала победу, однако давала Яну и Мариусу важнейшее преимущество, потому что резкие букмекеры были точнее. В долгосрочной перспективе после сотен ставок они выиграли бы деньги у мягких.

Однако у системы было одно ограничение: мягкие букмекеры блокируют победителей. Именно эти конторы решают, хотят ли они иметь с вами дело; и как только видят, что на счетах, скажем, Яна и Мариуса скапливается прибыль, отстраняют их от игры, отправляя сообщение: «Теперь ваша максимальная ставка – 2,5 фунта стерлингов».

Парни нашли способ обойти эту проблему. Они создали службу подписки. За ежемесячную плату подписчикам отправлялись прямые ссылки на выгодные коэффициенты у мягких букмекеров. Это означало, что Ян с Мариусом получали прибыль, даже если их самих заблокировали. Беспроигрышный вариант для всех, кроме букмекеров. Игроки могли получать советы, которые давали выигрыш в долгосрочной перспективе, а Ян с Мариусом брали свою долю.

Вот почему я сидел в пабе с этой парочкой. Они овладели искусством сбора данных и автоматического размещения ставок. Я написал уравнение, которое могло дополнительно увеличить их преимущество: моя модель Премьер-лиги способна была выигрывать не только у мягких букмекеров, но и у резких.

В тот момент я полагал, что обладаю преимуществом для предстоящего чемпионата мира. Однако для проверки моей гипотезы мне требовалось больше данных. Прежде чем я закончил рассказывать о своей идее, Ян открыл ноутбук и попытался поймать Wi-Fi.

– Уверен, что смогу найти коэффициенты для отборочного турнира и для восьми последних крупных международных соревнований, – сказал он. – У меня есть программа для веб-скрейпинга [автоматического просмотра сайтов и загрузки данных с них].

К концу ужина у нас был план, и мы определили данные, которые необходимы для его осуществления. Ян отправился обратно в гостиницу и поставил компьютер заниматься всю ночь веб-скрейпингом коэффициентов для прошлых турниров.

* * *

И Ян, и Мариус принадлежат к новому поколению профессиональных игроков. Они умеют программировать, знают, как добывать данные, и понимают математику. Игроки такого типа зачастую меньше интересуются конкретным видом спорта и больше – числами, чем игроки старой школы. Но они точно так же заинтересованы в зарабатывании денег, и это у них получается гораздо лучше.

Обнаруженное мною преимущество при ставках привлекло ко мне внимание этой пары, и я оказался на периферии их игровой сети. Однако когда я задавал им вопросы о других проектах, по осторожным ответам было понятно, что о полноправном членстве в их клубе речи не было. Во всяком случае пока. Я был любителем – и они просто смеялись надо мной, когда я сказал, что планирую поставить 50 фунтов в разрабатываемой нами системе, – и информацию о других проектах выдавали только по мере необходимости.

Но один знакомый был более откровенен. Недавно он ушел из этой индустрии и был рад поделиться своим опытом, хотя и не пожелал, чтобы я раскрыл его место работы и личность; так что назовем его Джеймсом.

Джеймс сказал мне:

– Если у вас есть реальное преимущество, то скорость вашего обогащения ограничена только скоростью, с которой вы способны делать ставки.

Чтобы понять смысл высказывания Джеймса, сначала представим традиционные инвестиции с доходностью 3 %. Если вы вкладываете 1000 фунтов, то через год у вас будет 1030 – вы получите прибыль 30 фунтов.

Теперь представим игру на сумму 1000 фунтов с преимуществом в 3 % перед букмекерами. Наверняка вы не захотите рисковать сразу всем капиталом при единственной ставке. Так что начнем со ставки в 10 фунтов – относительно умеренный риск. Вы не будете выигрывать каждый раз, но преимущество в 3 % означает, что в среднем на одну ставку в 10 фунтов вы станете получать прибыль 30 пенсов, поэтому уровень доходности для капитала в 1000 фунтов составляет 0,03 % при каждой ставке.

Чтобы получить прибыль 30 фунтов, вам придется сделать 100 ставок по 10 фунтов. Сто ставок в год, примерно две в неделю, – это больше, чем делает большинство из нас. И нас, любителей, отрезвляет мысль, что, даже если у вас есть какое-то преимущество, вы как случайный игрок-любитель не можете ожидать слишком многого от капиталовложения в 1000 фунтов.

Однако парни, с которыми работал Джеймс, не были случайными игроками. По всему миру нетрудно найти 100 матчей за один день. Ян недавно загрузил данные по 1085 различным лигам. Добавьте теннис, регби, скачки и все прочие виды спорта, и вы обнаружите массу возможностей для ставок.

А теперь представим, что Джеймс и его коллеги имеют какое-то преимущество и целый год ставят каждый день на сотню матчей. Примем также, что по мере роста своих доходов они увеличивают ставки пропорционально имеющемуся капиталу; то есть когда у них появилось 10 000 фунтов, они ставят по 100 фунтов, при капитале 100 000 фунтов – по 1000 фунтов и т. д. Сколько получат игроки к концу года, имея преимущество всего лишь в 3 %? 1300, 3000, 13 000 или 310 000 фунтов? На самом деле к концу года у них будет 56 860 593,8 фунта. Почти 57 миллионов! Да, каждая ставка умножает их капитал всего на 1,0003, однако после 36 500 ставок вступает в игру мощь показательного распределения, и их прибыли резко взлетают[7].

Но на практике такой рост недостижим. Хотя резкие букмекерские конторы, которыми пользовались Джеймс с коллегами, разрешают ставить больше, чем мягкие, ограничения всё равно существуют. Джеймс сказал мне:

– Букмекерские компании в Лондоне выросли так быстро и стали такими масштабными, что они вынуждены теперь делать ставки через брокеров. Иначе, если станет широко известно, что они делают определенную ставку на конкретный матч, на этот рынок хлынут все остальные и их преимущество исчезнет.

Несмотря на такие ограничения, деньги по-прежнему текут в букмекерские компании, которыми управляют уравнения. Достаточно посмотреть на стильные интерьеры их офисов в Лондоне, чтобы убедиться в этом. Сотрудники одного из лидеров отрасли, Football Radar, начинают день с бесплатного завтрака, имеют доступ в роскошный спортзал, могут сделать перерыв и поиграть в теннис или PlayStation и располагают всем необходимым компьютерным оборудованием. Специалистам по обработке данных и создателям программного обеспечения предлагают работать в свободное время, а компания утверждает, что гарантирует такую творческую среду, которая обычно ассоциируется с Google или Facebook.

В Лондоне базируются и два основных конкурента Football Radar – Smartodds и Starlizard. Они принадлежат соответственно Мэттью Бенхэму и Тони Блуму, карьера которых началась благодаря умению обращаться с числами. Бенхэм учился в Оксфорде, где начал работать в сфере азартных игр, основываясь на статистике, а Блум обладает опытом профессионального игрока в покер. В 2009 году оба они приобрели футбольные клубы из родных городов: Блум купил «Брайтон энд Хоув Альбион», а Бенхэм – «Брентфорд». Кроме того, второй решил добавить к своим активам и резкую букмекерскую контору Matchbook.

И Бенхэм, и Блум сумели использовать незначительное преимущество и с помощью больших данных получили колоссальные прибыли.

* * *

Преимущество, которое я предложил Яну и Мариусу для вероятности победы их фаворита в каком-нибудь матче чемпионата мира, основано на следующем уравнении:

где x – коэффициент букмекера на победу фаворита. Коэффициент здесь понимается в британском формате: если он составляет 3 к 2 или x = 3/2, это означает, что на каждые поставленные 2 фунта в случае победы чистый выигрыш составляет 3 фунта.

Разберемся, о чем на самом деле говорит уравнение 1. Начнем с левой стороны, где я написал: «P{фаворит выигрывает}». Ни одна математическая модель не предсказывает победу или поражение с абсолютной точностью. Они говорят о вероятности того, что выиграет фаворит, и эта вероятность – число от 0 до 100 %. Оно определяет уровень уверенности, который я приписываю результату.

Эта вероятность зависит от того, что написано в правой части уравнения, куда входят три буквы: латинская x и греческие α и β. Одна студентка сказала мне, что математика казалась ей понятной, пока речь шла о латинских иксах и игреках, но стала трудной, когда начались греческие альфы и беты. Для математиков это звучит смешно, потому что x, α и β – только символы, они не делают науку проще или сложнее, так что я думаю, что студентка всего лишь шутила. Но она попала в точку: когда в уравнениях встречаются α и β, математика обычно сложнее.

Так что давайте начнем без них. Уравнение

понять гораздо проще. Если, скажем, коэффициент был 3/2 (2,5 в европейской системе или +150 в американской)[8], вероятность того, что фаворит выиграет, равна

По сути, это уравнение без α и β дает нам оценку букмекера для победы фаворита. Он считает, что шансы фаворита на победу в матче составляют 2/5, или 40 %. В остальных 60 % случаев будет ничья или победит аутсайдер.

Без α и β (точнее, при α = 1 и β = 1) мое уравнение ставок относительно несложно понять. Однако без α и β оно не принесет денег. Почему? Поставим 1 фунт на фаворита. Если коэффициент букмекера верен, два раза из пяти вы выиграете 1,5 фунта, а три из пяти проиграете по 1 фунту. Поэтому в среднем вы выиграете

Иными словами: после нескольких ставок вы почти ничего не выиграете. Нуль. Пшик. На деле всё еще хуже. Для начала я предположил, что коэффициенты букмекеров справедливы[9]. На самом деле нет. Букмекеры всегда подправляют их, чтобы ситуация складывалась в их пользу. И вместо того, чтобы предложить 3/2, заявят, скажем, 7/5. И если вы не знаете, что делаете, букмекеры всегда выиграют, а вы проиграете. При коэффициенте 7/5 вы будете в среднем проигрывать 4 пенса на ставку в 1 фунт[10].

Единственный способ обыграть букмекеров – рассмотреть эти числа, и именно такие данные компьютер Яна собирал после того, как мы посидели в пабе. Он скачал коэффициенты и результаты для всех матчей чемпионатов мира и Европы, включая отборочные игры, начиная с чемпионата мира в Германии в 2006 году. Утром, усевшись в моем офисе в университете, мы начали искать преимущество.

Сначала мы загрузили данные и посмотрели на них в таблице, подобной нижеприведенной.

Из таких прошлых результатов мы можем получить представление о том, насколько точны коэффициенты: для этого надо сравнить два последних столбца вышеприведенной таблицы. Например, в матче между Испанией и Австралией на чемпионате мира 2014 года коэффициенты дают вероятность 73 %, что Испания выиграет, и она действительно победила. Это можно считать «хорошим» прогнозом. А вот Коста-Рика обыграла Италию, хотя коэффициенты давали 63 % на победу итальянцев, – «плохой» прогноз.

Я пишу слова «хороший» и «плохой» в кавычках, поскольку нельзя сказать, хорош или плох прогноз, если нет альтернативы, с которой его можно сравнить. Вот здесь и появляются α и β. Их называют параметрами уравнения 1. Это величины, которые мы можем менять для тонкой настройки нашего уравнения, чтобы сделать его точнее. Мы не можем изменить итоговые коэффициенты для матча Испания – Австралия и определенно неспособны повлиять на результат этого матча сборных; но можем выбрать α и β так, чтобы получить более точный прогноз, чем у букмекеров.

Метод поиска наилучших параметров – логистическая регрессия. Чтобы описать, как она работает, сначала посмотрим, как можно улучшить наш прогноз на матч Испания – Австралия с помощью корректировки числа β. Если я приму β = 1,2 и оставлю α = 1, получу

Поскольку результатом матча была победа Испании, прогноз на победу в 77 % лучше, чем прогноз букмекеров, который давал 73 %.

Но здесь есть проблема. Если я увеличу β, то повышу и прогнозируемую вероятность победы Англии над Уругваем – с 51 до 52 %. Но Англия в том матче 2014 года уругвайцам проиграла. Чтобы справиться с этой проблемой, я могу увеличить другой параметр, назначив α = 1,1 и оставив при этом β = 1,2. Теперь уравнение предсказывает, что Испания обыграет Австралию с вероятностью 75 %, а Англия обыграет Уругвай с вероятностью 49 %. Изменив исходные значения α = 1 и β = 1, мы улучшили прогноз на оба матча.

Я рассмотрел по одному изменению каждого из параметров α и β и сравнил результаты всего по двум матчам. Данные Яна включали 284 матча на всех чемпионатах мира и Европы с 2006 года. Потребовалось бы очень много времени, чтобы вручную менять значения параметров, подставлять их в уравнение и смотреть, улучшают они прогноз или нет. Однако мы можем использовать для вычислений компьютерный алгоритм; именно это и делает логистическая регрессия (см. рис. 1). Она меняет значения α и β так, чтобы дать прогнозы, которые максимально близки к реальным результатам матчей.

Рис. 1. Иллюстрация того, как логистическая регрессия дает оценки α = 1,16 и β = 1,25

Я написал программу на языке Python, которая выполняет все эти вычисления. Запустил ее и смотрел, как она справляется со всеми этими расчетами. Через несколько секунд у меня был результат: наилучшие прогнозы получались при α = 1,16 и β = 1,25.

Эти числа сразу привлекли мое внимание. Сам факт, что оба параметра α = 1,16 и β = 1,25 превосходят 1, показывал сложную связь между коэффициентами и исходами матчей. Проще всего понять эту связь путем добавления к нашей таблице еще одной колонки и сравнения нашей модели логистической регрессии с прогнозами букмекеров.

Здесь мы видим проявление известного опытным игрокам феномена с недооценкой записных фаворитов вроде Испании. Коэффициенты, которые букмекеры устанавливают для таких команд, как правило, занижены, поэтому на них стоит ставить. А более слабые фавориты, вроде Англии в 2014 году, бывают переоценены: их шансы на победу не так высоки, как предполагают коэффициенты. Хотя такие различия между прогнозами и моделью малы, мы с Яном и Мариусом знали, что их достаточно, чтобы получить прибыль.

Мы нашли небольшое преимущество для чемпионата мира. Еще не зная, будет ли это преимущество, замеченное на предыдущих чемпионатах, работать на новом турнире, мы были готовы рискнуть незначительной суммой. Чтобы реализовать систему ставок на основании моего уравнения, хватило времени до обеда. Мы нажали «Запуск» и привели систему в действие. В течение всего чемпионата мира наши ставки размещались автоматически.

После обеда вернулись ко мне домой. Мы с Мариусом уселись смотреть игру Уругвая с Египтом. Ян достал ноутбук и начал скачивать коэффициенты для тенниса.

* * *

Уравнение ставок – это не только один чемпионат мира и даже не только зарабатывание денег на букмекерах. Его настоящая сила в том, что оно заставляет нас смотреть в будущее с точки зрения вероятностей и исходов. Использование уравнения ставок означает следующее: надо отказаться от догадок и навсегда забыть идею, что результат футбольного матча, скачек, финансовой инвестиции, собеседования при приеме на работу или даже романтического свидания можно предсказать со стопроцентной уверенностью. Вы не можете знать наверняка, что произойдет.

Большинство из нас смутно осознают, что события в будущем во многом определяются случайностью. Когда прогноз погоды говорит, что завтрашний день будет солнечным с вероятностью 75 %, не следует слишком сильно удивляться, если по дороге на работу вы попадете под ливень. Однако нахождение небольших преимуществ, скрытых в вероятностях, требует более глубокого понимания.

Если для вас важен конкретный результат, то подумайте, с какой вероятностью он реализуется, а с какой нет. Недавно я разговаривал с CEO одного очень успешного стартапа, который вырос за счет четырех этапов многомиллионных долларовых инвестиций и в котором работает сотня сотрудников, и он радостно признавал, что шансы на долговременную прибыль для него самого и его инвесторов по-прежнему всего лишь 1 из 10. Он самоотверженно и долго работал, но сознавал, что все может внезапно развалиться.

При поиске работы мечты или любви всей жизни шансы на успех при каком-нибудь конкретном заявлении на работу или свидании могут быть весьма малы. Меня часто удивляет, что люди, не прошедшие собеседования, ругают себя за то, что поступили неверно, а не учитывают, что, возможно, в этот день кто-то из других четырех кандидатов сделал все верно. Помните, что до появления на собеседовании ваши шансы составляли 20 %. Пока вы не провалите примерно пять собеседований, нет особых причин беспокоиться о каком-то конкретном результате[11].

Вводить числа в романтику труднее, но здесь применимы те же вероятностные принципы. Не ждите, что на вашем первом свидании в Tinder появится принц или принцесса, но если вы сидите в одиночестве после неудачного свидания номер 34, то полезно поразмыслить над своим подходом.

Определив соответствующие вероятности, подумайте, как они соотносятся с размером ваших инвестиций и потенциальных прибылей. Мой совет мыслить вероятностно не попытка призвать к кармическому спокойствию или внимательности. CEO с шансами на успех один из десяти располагал бизнес-идеей, которая потенциально могла дать результат, подобный Uber или Airbnb: создать компанию стоимостью 10 миллиардов долларов. Даже десятая часть от этой суммы – миллиард, и это огромная ожидаемая прибыль.

Вероятностное мышление поможет вам быть реалистом перед лицом шансов, которые часто обращаются против вас. В скачках и футболе наивные игроки нередко переоценивают маловероятные события, но в реальной жизни мы склонны их недооценивать. Мы по природе осторожны и избегаем рисков. Помните, что награда после того, как вы получите действительно желательную работу или любимого человека, будет колоссальной. Это означает, что нужно быть готовым пойти на большой риск ради достижения цели.

* * *

Математика требует работы и упорства. Пять минут назад я закончил читать одну из самых примечательных работ в истории прикладной математики – статью, которая буквально стоит миллиард долларов. Я знал, что математика здесь важна, но, добравшись до уравнений, решил, что читать стало гораздо труднее. В первый раз я пропустил их, сказав себе, что вернусь к деталям позже, и перешел к интересным фрагментам.

Речь о статье Уильяма Бентера «Компьютерные системы прогнозирования и размещения ставок на скачках: отчет»[12]. Это своеобразный манифест, декларация о намерениях. И это работа человека, одержимого строгостью и верой в то, что он делает, который документировал свой план, прежде чем взялся его реализовывать, – чтобы показать всему миру, что он побеждает благодаря не удаче, а математической уверенности.

В конце 1980-х Уильям Бентер решил обыграть тотализатор скачек в Гонконге. До того как он начал свой проект, азартная игра с высокими ставками была уделом темных личностей, которые шлялись по ипподромам «Хэппи-Вэлли» и «Сатхинь» и по Гонконгскому жокей-клубу, пытаясь собрать инсайдерскую информацию у владельцев, персонала конюшен и тренеров. Они выясняли, завтракала лошадь или нет и была ли у нее дополнительная тайная тренировка. Они сходились с жокеями и расспрашивали их о стратегии в будущих скачках.

Будучи американцем, Бентер был в этом мире посторонним, однако он нашел другой способ получить инсайдерскую информацию – тот, который жучки упустили, хотя он прятался прямо здесь, в помещениях жокей-клуба. Бентер собрал копии справочников-ежегодников с результатами забегов и нанял двух женщин, чтобы вводить эти данные в компьютер. Затем было то, что журнал Bloomberg Businessweek назвал прорывом. Он взял коэффициенты ставок, также имевшиеся в жокей-клубе, и их оцифровал. Именно они позволили Бентеру применить метод, аналогичный тому, что я показывал Яну и Мариусу: использовать уравнение ставок. Это был ключ к нахождению неточностей в предсказаниях игроков и прогнозистов[13].

Бентер на этом не остановился. В основном уравнении, представленном выше, я ограничился выявлением ошибок в букмекерских коэффициентах для футбола. Теперь, при втором или третьем чтении его статьи, я начал понимать, как Бентер оказывался с прибылью за такой долгий промежуток времени. В своей модели я не рассматривал никаких дополнительных факторов, которые помогали бы мне прогнозировать результат матча. Но Бентер делал все возможное и невозможное. Его быстро разраставшиеся данные включали прошлые выступления, возраст лошади, вклад жокея, стартовый номер, местную погоду и множество других факторов. Каждый из них постепенно вносил свой вклад в уравнение ставок. По мере того как он включал все больше подробностей, точность его логистической регрессии и, соответственно, прогнозов увеличивалась. После пяти человеко-лет ввода данных модель была готова, и Бентер начал играть на скачках на ипподроме «Хэппи-Вэлли» с капиталом, заработанным в казино[14].

За первые два месяца игры Бентер получил 50 % прибыли от инвестиций, но еще через два месяца она исчезла. В течение двух следующих лет прибыли Бентера прыгали вверх и вниз – то взлетая до 100 %, то падая почти до нуля. Примерно через два с половиной года модель действительно начала окупаться[15]. Прибыли поднялись до 200, 300, 400 % и далее росли экспоненциально. Бентер сообщил Bloomberg Businessweek, что в сезоне 1990/91 выиграл 3 миллиона долларов[16]. То же издание оценивало, что за следующие два десятилетия Бентер и его немногочисленные конкуренты, использовавшие те же методы[17], заработали на ипподромах Гонконга свыше миллиарда долларов[18].

Самым примечательным в научной статье Бентера было не содержание, а то, что ее мало кто прочитал. За 25 лет после публикации в других научных журналах на нее сослались всего 92 раза. Для сравнения: когда я 15 лет назад написал статью, как муравьи рода Temnothorax выбирают новое жилье, на нее сослались 351 раз.

Игнорируется не только статья Бентера. Он ссылается на публикацию Рут Болтон и Рэндалла Чепмена 1986 года, называя ее «обязательным чтением» для его собственной работы[19]. Однако прошло почти 35 лет, а эта вдохновенная статья, показывающая, как можно получать деньги на американских ипподромах с помощью уравнения ставок, также цитировалась менее 100 раз.

У Бентера не имелось образования в области высшей математики[20], но он был готов делать то, что требовалось. Его описывали как гения, но я так не считаю. Я знаком со многими нематематиками и негениями, которые настойчиво изучали те же статистические методы, что использовал Бентер. Обычно это не игроки. Это биологи, экономисты и социологи, которые используют статистику для проверки гипотез. Но они нашли время, чтобы понять математику.

Я никогда не улавливаю математические рассуждения при первом чтении. И я видел очень мало профессиональных математиков, которые могли бы прочитать и усвоить уравнения, не возвращаясь потом к ним детально. А именно в деталях и кроются секреты.

* * *

Самая большая угроза для любого тайного общества – раскрытие. Современная версия заговора иллюминатов, которая рисует технически подкованных правителей мира, требует, чтобы абсолютно все участники общества молчали о его целях и методах. Если хотя бы один поделится кодом или разгласит планы общества, вся система окажется под угрозой.

Эта опасность раскрытия – главная причина, почему большинство ученых не верят в существование организаций, подобных иллюминатам. Контроль за всей человеческой деятельностью потребует большого общества и масштабной секретности. Риск того, что кто-нибудь расколется и все расскажет, крайне велик.

Однако когда мы погружаемся в уравнение ставок, то видим, что секрет «Десятки» скрыт у всех на виду. Только когда члены общества упорно учатся, он медленно открывается тем, кто его ищет. Этому коду учат во всех школах, а затем в университетах, но мы не понимаем, что мы изучаем. Члены общества лишь смутно осознают, что они участники этого обширного заговора. Они чувствуют, что им нечего раскрывать, нечего признавать и нечего прятать.

Когда молодой перспективный участник «Десятки» читает научную статью Бентера второй и третий раз, он заставляет себя понять ее правильно. Он начинает ощущать связь, простирающуюся на десятилетия и столетия. Бентер, несомненно, чувствовал ее, когда читал работу Рут Болтон и Рэндалла Чепмена. А те до него испытывали то же чувство, когда изучали статью Дэвида Кокса, который предложил в 1958 году логистическую регрессию, ставшую основой их работы. Связь, выкованная математикой, тянется в историческое прошлое, через Мориса Кендалла и Роналда Фишера, работавших между мировыми войнами, и до первых идей о вероятности, высказанных Абрахамом де Муавром и Томасом Байесом в Лондоне XVIII века.

По мере углубления в детали наш юный последователь видит, как перед ним шаг за шагом раскрываются все секреты. Бентер записал истоки своего успеха в коде уравнений. И теперь, спустя 25 лет, можно постепенно разобрать этот успех – один алгебраический символ за другим.

Именно математика, общий интерес к этому уравнению, объединяет нас в пропасти времени и пространства. Как и Бентер до него, наш юный ученый начинает исследовать красоту размещения ставки не с помощью ощущений, а на основании статистической взаимосвязи данных.

* * *

Можно объяснить идею, которая стоит за разработанной нами с Яном и Мариусом стратегией ставок, даже без уравнений, одной фразой: мы обнаружили, что коэффициенты открытия для чемпионата мира (те, которые букмекеры предлагают задолго до начала матча) можно использовать для более точного прогнозирования результатов, чем коэффициенты закрытия (те, которые букмекеры предлагают прямо перед матчем).

Это наблюдение противоречит интуиции. Когда букмекеры устанавливают свои коэффициенты, до начала игры может произойти много неопределенных событий. Травма ведущего игрока (это случилось с Мохаммедом Салахом из сборной Египта), плохая форма целой команды (за несколько недель до чемпионата мира Франция сыграла вничью с командой США), смена тренера в последний момент (как произошло со сборной Испании). Теоретически для отражения всех таких событий коэффициенты должны меняться: если Испания внезапно уволит своего тренера, ее шансы на победу над Португалией упадут.

Коэффициенты действительно меняются, но при этом они скорее не отражают новую реальность, а завышаются. По мере приближения матча на рынке появляются игроки-любители, которые пытаются спрогнозировать результаты матчей, и коэффициенты букмекерских компаний меняются, чтобы отразить их ставки. Например, коэффициенты на победу Франции над Перу увеличились с 2/5 до 1/2 до их матча на групповой стадии турнира. Возможно, некоторые игроки полагали, что если Франция не смогла обыграть США в товарищеском матче, то Перу заработает одно очко, а то и три. Другие любители, несомненно, читали в газетах критику в адрес звездного полузащитника Поля Погба и начали сомневаться в его способностях привести сборную своей страны к успеху. Какими бы ни оказались причины, это был именно тот сценарий, который – как установила наша модель – давал удачные ставки на предыдущих чемпионатах мира. Когда коэффициенты на записных фаворитов повышаются, выгодно их поддержать. Наша автоматизированная система обнаружила такое их изменение, активировала функцию ставки и поставила 50 фунтов на Францию. После матча мы получили 75 фунтов. Просто и эффективно.

Важный навык для специалистов по прикладной математике – объяснить логику в основе используемых моделей. Когда мы с Мариусом после запуска модели смотрели футбол, то обсуждали, почему по мере приближения к чемпионату мира коэффициенты становятся менее точными.

– Большинство наших стратегий основано на идее, что к матчу коэффициенты становятся гораздо точнее, – сказал он. – С чемпионатом мира должно быть что-то особенное.

– Большой объем ставок, – предположил я. – По телевизору сплошной футбол, интересно попробовать. Одни ставят деньги на свою страну из национальной гордости, другие – против какой-то страны.

Мариус согласился. Чемпионат мира дал футболу новую аудиторию, она не может устоять перед искушением поставить деньги на своих любимцев. По нашим прикидкам, верные английские фанаты считают, что было бы здорово заработать немного за счет французов. Мы подумали, как аргентинцы и немцы ставили на Швейцарию, игравшую свой первый матч с Бразилией. Когда на аутсайдеров хлынули деньги, букмекеры увеличили коэффициенты для фаворитов, и наша модель, пойдя против толпы, оказалась выгодной. Не каждый матч давал нам выигрыш (бразильцы неожиданно сыграли со швейцарцами вничью), но история показала, что ставка на серьезных фаворитов прямо перед началом игры, вероятнее всего, приносит прибыль.

Пристрастие любителей ставить на маловероятные события было только частью нашей модели. Уравнение давало более тонкие прогнозы: значения α = 1,16 и β = 1,25 говорили, что в случае не совсем явного фаворита нам нужно, наоборот, поддержать аутсайдера – как в 2014 году, когда Англия проиграла Уругваю. Хорошим примером такого прогноза был матч между Колумбией и Японией. За дни перед ним коэффициенты на победу Колумбии выросли с 7/10 до 8/9. Подставив эти числа в наше уравнение, можно прийти к выводу, что стоит поставить на Японию. Не потому, что у нее было больше шансов на победу в матче (фаворитом по-прежнему оставалась Колумбия), просто уравнение говорило, что теперь на Японию, коэффициенты для которой стали 26/5, ставить выгоднее. И мы оказались правы: Колумбия проиграла, а мы заработали 260 фунтов, поставив 50.

* * *

Сэру Дэвиду Коксу сейчас 95 лет, и он никогда не прекращал трудиться. За свою 80-летнюю карьеру Кокс написал 317 научных работ, и очень вероятно, что напишет еще. В своем офисе в Наффилд-колледже в Оксфорде он продолжает писать комментарии и обзоры современной статистики, а также вносить новый вклад в эту область.

Я спросил его, каждый ли день он появляется в офисе.

– Не каждый, – ответил Дэвид. – В субботу и воскресенье не появляюсь.

Затем сделал паузу и поправился:

– Точнее, вероятность того, что я приду на работу в субботу или в воскресенье, отлична от нуля. Такое может произойти.

Сэр Дэвид Кокс любит точность. Его ответы на мои вопросы были осторожными и обдуманными; математик всегда оговаривал уровень уверенности в своей способности дать ответ.

Именно Кокс открыл уравнение ставок. Сам он, правда, никогда бы так не выразился, и это в любом случае не совсем верно. Точнее было бы сказать, что он разработал теорию логистической регрессии, которую я использовал для нахождения α и β, а Бентер – для определения факторов, влияющих на исход скачек[21]. Дэвид Кокс разработал статистический метод, благодаря которому уравнение ставок дает точные прогнозы.

Логистическая регрессия была продуктом послевоенной Британии. К финалу Второй мировой войны Дэвид закончил изучать математику в Кембридже, и его направили на работу в королевские ВВС. Затем он перешел в текстильную промышленность, поскольку в Великобритании начался процесс восстановления[22]. Кокс рассказал мне, что изначально его интересовала чистая математика, которую он изучал, но такая работа привлекла его внимание к новым задачам. «Текстильная промышленность была полна увлекательных математических проблем», – сказал он.

Сэр Дэвид признавал, что смутно помнит детали, но лучился энтузиазмом, говоря о тех временах. Он рассказал, как можно использовать тесты для различных характеристик материалов, чтобы определить вероятность их разрушения, и о проблемах, связанных с созданием более прочного и более однородного конечного продукта из грубо пряденой шерсти. Кроме того, в ВВС он столкнулся с задачами, касавшимися частоты аварий и аэродинамики крыла. Это также дало ему много пищи для размышлений.

Именно из таких практических соображений у Дэвида Кокса зародился более общий, математический вопрос: каким образом лучше всего прогнозировать, как разные факторы (скорость ветра или напряжения в материале и другие) могут повлиять на что-то – например, на авиационную катастрофу или на то, порвется ли одеяло. Это вопрос того же типа, который Бентер задавал о лошадях: как зависит вероятность победы четвероногого от истории его прошлых выступлений и от погоды.

– Когда я создавал эту теорию [в середине 1950-х], самые серьезные разногласия в университетах касались анализа медицинских и психологических данных, предсказания того, как разные факторы связаны с медицинским результатом, – рассказывал Кокс. – Логистическая регрессия возникла в результате синтеза моего практического опыта и математического образования. Все известные мне проблемы медицины, психологии и промышленности можно было решить с помощью одного семейства математических функций.

Это семейство оказалось гораздо полезнее, чем предполагал даже сам ученый. Начиная с промышленности 1950-х, когда логистическая регрессия играла важную роль в интерпретации результатов медицинских исследований, она успешно применяется к бесчисленным математическим задачам. Именно этот подход использует Facebook, чтобы определить, какую рекламу нам показать, а Spotify – чтобы рекомендовать нам музыку. Он же стал частью системы идентификации пешеходов в автомобилях без водителей. И конечно, он используется в азартных играх…

Я спросил у сэра Дэвида, знает ли он об успехах Бентера в применении логистической регрессии к скачкам. Он не слышал. Тогда я поведал ему, как логистическая регрессия принесла миллиард долларов, а также об оксфордском студенте Мэттью Бенхэме и его успехе в предсказании результатов футбольных матчей.

1 Мари Кондо – японская писательница, автор книги «Магическая уборка. Японское искусство наведения порядка дома и в жизни». Шерил Сэндберг – член совета директоров Facebook, автор книги «Не бойся действовать». Джордан Питерсон – канадский психолог, автор книги «12 правил жизни. Противоядие от хаоса», первое из которых гласит: «Выпрямись и расправь плечи». Брене Браун – американская писательница, автор лекции «Сила уязвимости», с которой она выступала на ежегодной конференции фонда TED (Technology, entertainment, design – технологии, развлечения, дизайн). Здесь и далее прим. пер., если не указано иное.
2 Отсылка к названию книги египетского предпринимателя Мо Гавдата «Формула счастья» (Минск: Попурри, 2018).
3 Отсылка к названию книги американского комика Стива Харви «Поступай как женщина, думай как мужчина» (М.: Одри, 2011).
4 Вероятно, отсылка к названию книги Аарона Росса и Джейсона Лемкина «От невозможного к неизбежному» (From Impossible To Inevitable).
5 Эта статья была опубликована на платформе Medium: medium.com/@Soccermatics/if-you-had-followed-the-betting-advice-in-soccermatics-you-would-now-be-very-rich-1f643a4f5a23. Полное описание модели можно найти в моей книге «Футболоматика. Как благодаря математике “Барселона” выигрывает, Роналду забивает, а букмекеры зарабатывают состояния». Издана на русском языке (М.: Бомбора, 2018).
6 Разница между типами букмекеров не только в точности коэффициентов. Резкие быстрее реагируют на изменения ситуации корректировкой коэффициентов (часто это делается автоматически), ставки у них не ограничены. Мягкие меняют коэффициенты медленнее и вводят ограничения на ставки; они тоже имеют доступ к технологиям, но предпочитают охватить больше людей, которые в долгосрочной перспективе будут терять деньги. В России обычно говорят о рекреационных и профессиональных конторах. Первые (подавляющее большинство) рассчитаны на любителей азартных игр, вторые – на профессионалов, нацеленных на получение прибыли.
7 Каждая ставка умножает ваш капитал на 1,0003 (увеличение в 0,03 % на ставку). Если вы делаете по 100 ставок в день, ваш ожидаемый капитал к концу года составляет 1000 × 1,0003100 × 365 = 56 860 593,80.
8 В разных странах используются различные виды коэффициентов. Британский (или дробный) – отношение потенциальной чистой прибыли к сумме, которую надо поставить, чтобы ее получить. В нашем случае отношение 3/2 означает, что мы ставим 2 фунта, чтобы в случае победы получить чистую прибыль 3 фунта. Европейский (десятичный) коэффициент, который используется и в России, – это число, на которое умножается ставка для определения потенциальной выплаты. В нашем случае коэффициент 2,5 означает, что при ставке в 2 фунта мы получаем 2 × 2,5 = 5 фунтов, чистая прибыль снова составляет 3 фунта. Американский коэффициент – это сумма потенциальной чистой прибыли при ставке в 100 условных единиц (он может быть положительным или отрицательным). В нашем случае +150 означает, что на каждые 100 единиц ставки можно получить 150 единиц чистой прибыли. Для ставки в 2 фунта чистая прибыль равна 3 фунтам. Таким образом, все три числа, указанные автором, действительно определяют одно и то же.
9 Коэффициенты букмекера справедливы, если коэффициент на событие, умноженный на коэффициент против события, даст 1. Например, когда коэффициент на победу равен 3/2, а на ничью или поражение 2/3 – поскольку 3/2 × 2/3 = 1. Однако на практике букмекеры никогда не предложат справедливые коэффициенты. Например, в вышеприведенном примере они скорее дадут 7/5 на победу фаворита и 4/7 против, так что 7/5 × 4/7 < 1. Маржа букмекера в этом случае составит 1/(1 + 7/5) + 1/(1 + 4/7) – 1 ≈ 0,05 или 5 %.
10 Ваша ожидаемая прибыль на одну ставку составляет: то есть 4 пенса потерь на ставку в 1 фунт.
11 Даже после пяти неудачных попыток вам не следует слишком отчаиваться. Если вероятность успеха на одном собеседовании составляет 1/5, вероятность того, что вам придется пройти минимум 5 собеседований, чтобы получить какую-то работу, составляет 1 – (1–1/5)5 = 67 %.
12 Benter W. Computer based horse race handicapping and wagering systems: a report // D. B. Hausch, V. S. Y. Lo, W. T. Ziemba, eds. Efficiency of Racetrack Betting Markets. Revised edn. Singapore: World Scientific Publishing Co. Pte Ltd, 2008. Pp. 183–198.
13 Модель работала и без этих старых коэффициентов (по сути, вычисляла коэффициенты с нуля) и даже давала небольшую прибыль. Однако главную выгоду принесло именно сочетание коэффициентов и корректирующего их алгоритма.
14 Бентер входил в состав команды, игроки которой отслеживали все вышедшие карты и за счет этого контролировали вероятность появления следующей карты. Команда получала крохотное преимущество, которого хватало, чтобы заработать. Однако в итоге Бентер с коллегами попали в черный список, и им было запрещено появляться в казино.
15 Модель стала всерьез окупаться как раз тогда, когда Бентер учел коэффициенты ставок.
16 Chellel K. The gambler who cracked the horse-racing code // Bloomberg Businessweek, 3 May 2018 // bloomberg.com/news/features/2018-05-03/the-gambler-who-cracked-the-horse-racing-code.
17 Крупным игроком на гонконгских ипподромах был бывший партнер Бентера по играм в казино Алан Вудс, с которым тот поссорился в первые годы работы над моделью. В итоге они использовали разные модели и ставили по отдельности (хотя часто привлекали одних и тех же людей в качестве помощников – такие ставки требовали участия множества людей).
18 Сам Бентер соглашается с суммой около миллиарда, но говорит, что существенная часть денег ушла его партнерам в Гонконге и США.
19 Bolton R. N., Chapman R. G. Searching for positive returns at the track: a multinomial logit model for handicapping horse races // Management Science. 1986. August. Vol. 32. No. 8. Pp. 1040–1060.
20 Он покинул колледж ради игры в казино.
21 Cox D. R. The regression analysis of binary sequences // Journal of the Royal Statistical Society: Series B (Methodological). 1958. Vol. 20. No. 2. Pp. 215–232.
22 В обоих случаях – в исследовательские организации.
Скачать книгу