Nate Silver
The Signal and the Noise
Why so many predictions fail – but some don’t
© Nate Silver, 2012
© Миронов П., перевод на русский язык, 2014
© Оформление, издание на русском языке. ООО «Издательская Группа «Азбука-Аттикус», 2015
КоЛибри®
Посвящается маме и папе
Введение
В этой книге рассказывается о работе с информацией, о технологиях и научном прогрессе. О конкуренции, свободных рынках и эволюции идей. О том, что делает нас умнее любого компьютера, и о человеческих ошибках. О том, как мы постепенно, шаг за шагом, учимся воспринимать объективный мир и почему иногда делаем шаги назад.
Эта книга – о предсказаниях и прогнозах, оказывающихся в точке пересечения всех этих идей, и о том, почему одни из них сбываются, а другие – нет. Я надеюсь, что благодаря ей мы сможем немного лучше разобраться в том, как планировать свое будущее, и (возможно) будем реже повторять прежние ошибки.
Чем больше информации, тем больше проблем
По сути, революция в области информационных технологий совершилась благодаря печатному прессу, а вовсе не микрочипу. Изобретение Иоганна Гутенберга, сделанное им в 1440 г., позволило информации стать доступной широким массам людей, а возникший в результате этого взрыв новых идей привел к неожиданным последствиям и непредсказуемым эффектам. В том числе и к начавшейся в 1775 г. промышленной революции{1}, в результате которой цивилизация достаточно быстро перешла от состояния практически полного отсутствия научного или экономического прогресса к привычным для нашего времени и происходящим с огромной скоростью переменам. Изобретение печатного пресса способствовало развитию событий, которые в конечном итоге привели к эпохе Просвещения в Европе и основанию республики в Америке.
Однако появление печатного пресса способствовало еще и развязыванию священных религиозных войн, которые не прекращались на протяжении столетий. Как только человечество поверило в то, что оно способно предсказывать и даже выбирать собственную судьбу, началась самая кровавая эпоха в истории человечества{2}.
Книги существовали и до Гутенберга, однако их мало изготавливали и мало читали. Они выступали, скорее, в роли предмета роскоши для благородных семейств и создавались переписчиками, способными одновременно делать лишь одну копию{3}. Ставка за копирование манускрипта составляла примерно один флорин (золотая монета, стоимость которой на сегодняшний день эквивалентна примерно 200 долл. США) за пять страниц{4}, то есть производство книги, подобной той, что вы читаете сейчас, могло обойтись примерно в 20 тыс. долл. Зачастую в книгах содержалось немало ошибок, поскольку при копировании их число увеличивалось и они видоизменялись с каждой новой версией книги.
Все это невероятно усложняло процесс накопления знаний. Требовались поистине героические усилия, чтобы объем знаний не начал уменьшаться, поскольку книги часто приходили в негодность быстрее, чем их успевали воспроизводить. До нашего времени дошли лишь разные издания Библии, а также небольшое количество канонических текстов Платона и Аристотеля. Однако целые пласты человеческого знания и мудрости утрачены в веках{5}, поскольку не были зафиксированы в письменном виде.
Погоня за знанием казалась почти бесполезной, если не напрасной, с самого начала. Как сказано в прекрасных строках Экклезиаста, нет «ничего нового под солнцем» – не потому, что все уже открыто, но еще и потому, что все, что мы знаем, будет забыто{6}.
Печатный пресс изменил эту ситуацию бесповоротно, раз и навсегда. Почти моментально затраты на создание книги снизились примерно в 300 раз{7}. Книга, стоимость изготовления которой совсем незадолго до этого составляла 20 тыс. долл. (в нынешних ценах), теперь могла стоить всего 70 долл. Печатные прессы из Германии быстро распространились по всей Европе, и к 1470 г. они уже были в Риме, Севилье, Париже и Базеле, а еще через 10 лет – почти во всех остальных крупных европейских городах{8}. Производство книг стало увеличиваться в геометрической прогрессии и выросло в течение первых 100 лет после изобретения печатного пресса почти в 30 раз{9}. Хранилище человеческого знания стало увеличиваться в размерах, и довольно быстро (рис. В. 1).
Однако в тот период, как и в первые годы существования Всемирной паутины, качество информации было довольно неоднозначным. Хотя появление печатного станка сразу же принесло свою пользу, скажем, позволив изготавливать более качественные географические карты{10}, список изданных бестселлеров моментально возглавили еретические религиозные и псевдонаучные тексты{11}. Ошибки воспроизводились в массовых масштабах, например в так называемой «Греховной Библии», содержавшей чуть ли не самую злосчастную ошибку в истории, одна из заповедей звучала как «прелюбодействуй»{12}. Кроме того, доступ к огромному количеству новых идей порождал смятение в умах. Объем информации рос значительно быстрее, чем понимание людьми того, что с ней делать, или их способность отличить верную информацию от неверной{13}. Как ни парадоксально, но результатом увеличения объема общедоступного знания стал рост изоляции между нациями и конфессиями. Обладая слишком большим объемом информации, мы инстинктивно склонны относиться к ней избирательно, отбирать то, что нам нравится, и игнорировать все остальное, превращая в союзников тех, кто разделяет наше мнение, и относясь ко всем остальным как к врагам.
Рис. В. 1. Производство книг в Европе
С наибольшим энтузиазмом восприняли печатный станок те, кто использовал его, чтобы проповедовать свои взгляды. «95 тезисов» (Ninety-five Theses) Мартина Лютера сами по себе были не настолько радикальными, близкие изложенным в книге идеи обсуждались до этого множество раз. По мнению Элизабет Эйзенштейн, на этот раз революционный элемент состоял в том, что «тезисы Лютера не остались приколоченными к церковной двери»{14}. Вместо этого они были размножены как минимум 300 тыс. раз с помощью печатного станка Гутенберга{15} – невероятно большим тиражом даже по современным стандартам.
Раскол, возникший в результате протестантской Реформации Лютера, вскоре вверг Европу в войну. В период с 1524 по 1648 г. произошли Крестьянская война в Германии, Шмалькальденская война, Нидерландская революция, Тридцатилетняя война, религиозные войны во Франции, ирландские конфедеративные войны, гражданские войны в Шотландии и Англии – причем многие из них одновременно. Не стоит забывать и об испанской инквизиции, деятельность которой началась в 1480 г., или о войне Священной Лиги 1508–1516 гг., хотя они были в меньшей степени связаны с распространением протестантизма. В ходе одной лишь Тридцатилетней войны погибло не менее трети населения Германии{16}, и XVII век мог по степени своей кровавости сравниться разве что с началом века XX{17}.
Однако даже в этих условиях печатный станок постепенно способствовал развитию науки и образования. Галилей начал делиться своими (просмотренными цензурой) идеями, а Шекспир – публиковать свои пьесы.
Пьесы Шекспира, как и многих других авторов, часто обращаются к теме судьбы. Особый их трагизм связан с разрывом между тем, чего могли бы достичь персонажи, и тем, что может уготовить им судьба. Во времена Шекспира идея контроля своей судьбы казалась вполне естественной частью человеческого сознания, однако понимания, как это можно сделать, не было. Напротив, тот, кто хотел испытать свою судьбу, обычно находил лишь смерть{18}.
Наиболее ярко эти идеи нашли свое отражение в пьесе «Юлий Цезарь». В первой половине пьесы Цезарь получает всевозможные предупредительные сигналы, которые сам называет «знамениями»{19} («остерегись ид мартовских»), о том, что его коронация превратится в бойню. Разумеется, Цезарь игнорирует эти знаки, гордо настаивая на том, что они указывают на смерть кого-то другого, или же трактует эти знаки в высшей степени избирательно. А затем Цезаря убивают.
«Но ведь по-своему толкуют люди явленья, смысла их не понимая», – предупреждает нас Шекспир устами Цицерона – и это вполне хороший совет любому человеку, стремящемуся разобраться с недавно обретенным обилием информации. Отличить сигнал от шума не всегда просто. Зачастую данные рассказывают нам именно ту историю, которую мы хотим услышать, и обычно мы уверены, что у истории должен быть счастливый конец.
И все же, если трагедия «Юлий Цезарь» и была посвящена древней идее предсказания, связанной с фатализмом, гаданием и суеверием, в ней прозвучала и более современная и значительно более радикальная мысль о том, что мы должны интерпретировать эти знаки так, чтобы получать какие-нибудь преимущества. «Порой своей судьбою люди правят. Не звезды, милый Брут, а сами мы виновны в том, что сделались рабами», – говорит Кассий, надеясь убедить Брута принять участие в заговоре против Цезаря.
Идея человека – хозяина своей судьбы – быстро набрала популярность. Слова предсказание (prediction) и прогноз (forecast) в наши дни используются чуть ли не как синонимы, однако во времена Шекспира они обозначали разные вещи. Предсказаниями занимались прорицатели, а прогноз напоминал идеи Кассия.
Слово прогноз (forecast) в английском языке имеет германские корни{20}, а слово predict (предсказывать) пришло из латыни{21}. Прогнозирование отражало скорее новый мирской протестантский взгляд на мир, приземленность, а не ту отрешенность от мира сего, что была характерна для Священной Римской империи. Создание прогноза обычно предполагало работу в условиях неопределенности. Оно основывалось на благоразумии, мудрости и трудолюбии и больше напоминало процесс, который мы в наши дни часто связываем с понятием предвидения{22}.
Теологические последствия этой идеи достаточно сложны{23}. Однако они не были довольно значимыми для тех, кто надеялся обрести благо в земном мире. Эти качества оставались тесно сплетены с протестантской рабочей этикой, которую Макс Вебер воспринимал как основу зарождения капитализма и промышленной революции{24}. Подобное определение прогнозирования непосредственно связано с понятием прогресса. Вся информация, содержавшаяся в массе книг, должна была помочь так планировать свою жизнь, чтобы получить прибыль.
Протестанты, пережившие столетия священных войн, учились использовать накопленное ими знание с целью изменения общества. Промышленная революция началась в протестантских странах и в странах со свободной прессой, в которых и религиозные, и научные идеи могли распространяться без оглядки на цензуру{25}.
Важность промышленной революции сложно переоценить. На протяжении практически всей человеческой истории экономический рост составлял около 0,1 % в год. Этого было достаточно для обеспечения постепенного прироста населения, но не для роста уровня жизни на душу населения{26}. А затем внезапно, почти на пустом месте возник прогресс (рис. В. 2). Экономический рост начал происходить значительно быстрее, чем темпы роста населения (так продолжается и по сей день, если не обращать внимания на краткосрочный глобальный финансовый кризис){27}.
Как оказалось, взрывообразный рост информации, возникший благодаря появлению печатного станка, принес нам массу хорошего. Однако для того, чтобы все это благо реализовалось, потребовалось 330 лет – и миллионы погибших на полях сражений по всей Европе.
Парадокс продуктивности
Всякий раз, когда информационный рост происходит быстрее, чем развивается наше понимание того, как именно обрабатывать получаемые данные, нас поджидает опасность. Последние 40 лет человеческой истории показывают, что для превращения информации в полезное знание может потребоваться немалое время и что если мы не будем достаточно осторожны, то легко сможем сделать шаг назад.
Понятие «информационная эпоха» вряд ли можно считать таким уж новым. Оно получило определенное распространение уже в конце 1970‑х годов. Другой похожий термин – «компьютерная эра» – использовался даже несколько раньше, примерно с 1970 г.{28}. В то время компьютеры уже начали более широко применяться в лабораториях и других научных учреждениях, хотя еще и не стали привычным предметом бытовой техники. В этот раз нам не понадобились 300 лет для того, чтобы рост в области информационных технологий начал приносить человеческому обществу весомые преимущества. Однако нам все равно потребовалось от 20 до 30 лет.
1970‑е гг. были (выражаясь словами Пола Кругмана[1]) «звездным часом множества теорий, созданных вокруг невероятно небольших объемов данных». Мы начали использовать компьютеры для создания моделей мира, однако нам потребовалось время, чтобы понять, насколько неточными и основанными на предположениях они были. Мы не сразу осознали, что точность, на которую способны компьютеры, не может заменить правильность прогнозов. В эту эпоху мы выдвигали множество смелых предположений в целом ряде областей, начиная от экономики и заканчивая эпидемиологией, и очень часто эти предположения оказывались ошибочными. Например, в 1971 г. было заявлено о том, что в течение следующего десятилетия мы научимся достаточно точно предсказывать землетрясения{29}, однако прошло 40 лет, а мы так и не приблизились к решению этой проблемы.
На самом деле компьютерный бум 1970‑х и 1980‑х гг. привел к временному снижению экономической и научной производительности. Экономисты назвали это «парадоксом продуктивности». «Влияние компьютерной эпохи можно было увидеть во всем, за исключением статистики продуктивности», – писал экономист Роберт Солоу в 1987 г.{30}. В период между 1969 и 1982 гг. Соединенные Штаты столкнулись с четырьмя явными рецессиями{31}. Конец 1980‑х гг. был более сильным периодом в экономическом плане для США, но не для многих других стран мира.
Научный прогресс значительно сложнее поддается оценке, чем экономический{32}. Однако одним из его индикаторов может служить количество выданных патентов, особенно в области инвестиций в исследовательскую деятельность. Если после внедрения нового изобретения происходит снижение цен на тот или иной продукт, то это значит, что мы мудро используем имеющуюся информацию и успешно превращаем ее в знание. Если же цены начинают расти, это дает основания считать, что мы видим сигналы в шуме и напрасно тратим время, двигаясь в неверном направлении.
В 1960‑х гг. в Соединенных Штатах было потрачено около 1,5 млн долл. (с учетом инфляции{33}) на каждую патентную заявку{34}, поданную американским изобретателем. Однако на заре информационной эпохи эта цифра скорее росла, а не снижалась, а пиковое значение, достигнутое в 1986 г., составило примерно 3 млн долл. (рис. В. 3){35}.
Рис. В. 3. Расходы на научно-исследовательскую работу, необходимые для подачи заявки на патент
По мере того как мы начали более реалистично оценивать пользу от применения новых технологий, ситуация стала вновь улучшаться в 1990‑е гг. Мы реже оказывались в тупиковых ситуациях; компьютеры сделали нашу повседневную жизнь лучше и стали помогать нашей экономике. Зачастую то, что выглядело прогрессивным в будущем, в скором времени приводило к регрессу. То, что кажется предсказуемым в долгосрочной перспективе, способно нарушить наши самые продуманные планы в настоящем.
Обещания и подводные камни «Больших данных»
В наши времена модным стал термин «Большие данные»[2]. По расчетам компании IBM, мы ежедневно создаем 2,5 квинтильона байтов данных, а 90 % информации, имеющейся в нашем распоряжении, было получено за последние два года{36}.
Этот экспоненциальный рост информации, как и компьютеры в 1970‑е гг., порой представляется нам лекарством от всех болезней. Крис Андерсон, редактор журнала Wired, писал в 2008 г., что сам по себе огромный объем данных способен заменить собой теорию и даже научный метод{37}.
Книга, которую я написал, стои́т на стороне науки и технологии, и я считаю подобную позицию вполне оптимистичной. Однако следует помнить, что мы склонны допускать массу ошибок. Цифры сами по себе не умеют говорить. Именно мы говорим за них. Мы наполняем их смыслом. Как и Цезарь, мы можем трактовать их в свою пользу, что порой уводит нас слишком далеко от объективной реальности.
Управляемые данными предсказания способны обеспечить нам успех – или привести к неудаче. Шансы на неудачу возрастают, когда мы отрицаем собственную роль в процессе. Перед тем как потребовать большего от данных, мы должны потребовать больше от себя.
Если вы знаете мою предысторию, то такая точка зрения может показаться вам довольно странной. Многие слышали о том, что я умею работать с данными и статистически их обрабатывать. Я использую имеющуюся информацию для создания довольно успешных прогнозов. В 2003 г., когда мне уже порядком надоело консультировать клиентов, я занялся созданием системы, получившей название PECOTA, цель которой состояла в предсказании результатов игроков Главной бейсбольной Лиги. Она имела целый ряд инноваций (например, ее прогнозы носили вероятностный характер, и в них указывался диапазон возможных исходов для каждого игрока). Сравнив наши результаты с соответствующими результатами конкурирующих систем, мы обнаружили, что смогли их переиграть. В 2008 г. я создал веб-сайт FiveThirtyEight, призванный предсказать результаты надвигавшихся выборов. Прогнозы FiveThirtyEight правильно назвали победителя президентского голосования в 49 из 50 штатов, а также победителей голосования в 35 штатах по итогам выборов в Сенат.
После выборов со мной связалось несколько издателей, желавших заработать на издании пользовавшихся успехом книг типа «Moneyball» и «Фрикономика»[3] (в которых были приведены истории «ботаников», завоевавших мир). Они хотели, чтобы и в моей книге рассказывалось бы о чем-то подобном, то есть о предсказаниях, основанных на данных в различных областях, начиная от бейсбола и заканчивая финансами и национальной безопасностью.
Однако, пообщавшись в течение четырех лет более чем с сотней экспертов в десятке областей, прочитав сотни журнальных статей и книг и пропутешествовав в ходе своего расследования от Лас-Вегаса до Копенгагена, я постепенно понял, что предсказания в условиях эры Больших данных оказываются не особенно успешными. Мне же повезло сразу на нескольких уровнях: во-первых, из-за того, что я достиг успеха, несмотря на огромное количество сделанных ошибок (о которых я поговорю позднее), и, во-вторых, из-за того, что я правильно выбирал свои битвы.
Бейсбол, например, – уникальный, исключительный случай. Можно сказать, что это особенно яркое и открывающее нам глаза исключение, и в книге объясняется, почему это так и почему через десяток лет после выхода «Moneyball» фанаты статистики и скауты сотрудничают между собой в условиях, близких к полной гармонии.
В книге приведены и некоторые другие примеры, вселяющие в нас надежду. Один из них – прогнозирование погоды, требующее и человеческих суждений, и компьютерных мощностей. Метеорологи имеют довольно плохую репутацию, однако им удалось достичь заметного прогресса в работе: они способны предсказать место появления центра урагана в три раза точнее, чем четверть века назад. Кроме этого, мне довелось встречаться с игроками в покер и людьми, делавшими ставки на спортивные события и переигрывавшими Лас-Вегас. Встречался я и с программистами, создавшими для компании IBM компьютер Deep Blue, который смог обыграть чемпиона мира по шахматам.
Однако все эти примеры прогресса в области прогнозирования с лихвой уравновешиваются массой примеров неудач.
Если бы мне нужно было назвать единственную определяющую черту американцев – то, что делает нас исключительными, – я бы назвал веру в идею Кассия, в то, что мы сами контролируем собственную судьбу. Наша страна была создана на заре промышленной революции религиозными бунтарями, считавшими, что свободный поток идей помогает распространять не только религиозные, но и научные и коммерческие убеждения. Значительная доля наших сильных и слабых черт – нашей изобретательности и нашего трудолюбия, нашего высокомерия и нашего нетерпения – проистекает из непоколебимой веры в идею о том, что мы сами выбираем собственный путь.
Однако новое тысячелетие началось для американцев отвратительно. Мы не ожидали атак 11 сентября. Основная проблема заключалась в нежелании увидеть информацию. Как и в случае с нападением на Перл-Харбор шестью десятилетиями ранее, у нас имелись все сигналы. Однако мы не сопоставили одни сигналы с другими. При отсутствии достойной теории о поведении террористов мы оказались слепы к данным, а атаки оказались для нас «неизвестным неизвестным».
Немало неудачных предсказаний было связано и с недавним глобальным финансовым кризисом. Наша наивная вера в модели и неспособность понять, насколько сильно они полагаются на довольно хрупкие предположения, уже привела к разрушительным результатам. Кроме этого, я обнаружил, что даже в более рутинных условиях мы неспособны спрогнозировать рецессии более чем за несколько месяцев – и совсем не потому, что не стараемся этого сделать.
Несмотря на значительный прогресс в контроле уровня инфляции, можно сказать, что во всех остальных важных вопросах творцы нашей экономической политики действуют вслепую.
Модели прогнозирования, опубликованные политологами в преддверии президентских выборов 2000 г., предсказали убедительную победу Ала Гора, причем с большим перевесом{38}.
Однако выборы выиграл Джордж У. Буш. Неверные прогнозы такого рода вряд ли можно считать аномальными – они довольно типичны для политических предсказаний. Многолетнее исследование, проведенное Филипом Э. Тэтлоком из Пенсильванского университета, показало, что даже после того, как политологи заявляли о полной невозможности определенного политического события, оно тем не менее происходило примерно в 15 % случаев (при этом результаты политологов зачастую оказываются лучше, чем выводы аналитиков, мелькающих в телевизионных шоу).
В последнее время, как и в 1970‑х гг., предпринимался ряд попыток предсказать землетрясения, в основном с помощью математических методов, предполагающих управление данными.
Однако в результате некоторые предсказанные землетрясения так и не произошли, но были другие, к которым мы не смогли подготовиться. Конструкция ядерного реактора в Фукусиме предусматривала возможность выдерживать землетрясение магнитудой 8,6 балла, отчасти потому, что некоторые сейсмологи посчитали, что более сильные землетрясения просто невозможны. Однако в марте 2011 г. произошло самое ужасное в истории Японии землетрясение магнитудой 9,1 балла.
Существует целый ряд научных дисциплин, в которых предсказания часто оказываются неверными, и порой это обходится обществу очень дорого. Достаточно рассмотреть отрасль биомедицинских исследований. В 2005 г. уроженец Афин, медицинский исследователь по имени Джон П. Иоаннидис опубликовал довольно противоречивую работу под названием «Почему самые широко публикуемые выводы исследований неверны»{39}.
В работе изучались выводы, полученные другими исследователями, точнее, были приведены описания различных медицинских гипотез, выдвинутых в рамках лабораторных экспериментов. По мнению автора, большинство этих выводов показало бы свою несостоятельность в условиях реального мира. Не так давно компания Bayer Laboratories подтвердила гипотезу Иоаннидиса. При проведении собственных экспериментов компании не удалось повторить около двух третей результатов, о которых сообщалось в медицинских журналах{40}.
Большие данные действительно приведут к прогрессу, но лишь со временем. Насколько быстро это произойдет, и возможен ли дальнейший регресс, будет зависеть от нас самих.
Почему нас шокирует будущее
С биологической точки зрения мы не очень сильно отличаемся от своих предков. Однако некоторые из сильных сторон каменного века превратились в условиях информационной эпохи в слабости.
У людей довольно мало естественных защитных механизмов. Мы относительно медлительны и не особенно сильны. У нас нет когтей, клыков или брони. Мы не можем плевать ядом или маскироваться. Мы не умеем летать. Вместо всего этого мы выживаем благодаря своим мозгам. Мы способны быстро мыслить. Мы умеем находить закономерности и легко реагировать на появляющиеся возможности и возникающие угрозы.
«Эта потребность в поиске закономерностей проявляется у людей значительно сильнее, чем у других животных», – рассказал мне Томассо Поджио, специалист по неврологии из Массачусетского технологического института, изучающий, как наш головной мозг обрабатывает информацию. «Узнавание объектов в сложных ситуациях предполагает определенную степень обобщения. Новорожденный ребенок способен узнавать очертания лиц. И это не индивидуальный навык, а способность, приобретенная нами в ходе эволюции».
По словам Поджио, проблема состоит в том, что эти эволюционные инстинкты иногда заставляют нас видеть закономерности там, где их нет. «Люди постоянно находят закономерности в случайном шуме», – считает Поджио.
Человеческий мозг – невероятно интересная вещь; по некоторым данным, он способен хранить до трех терабайтов информации{41}. Однако этот огромный объем представляет собой около одной миллионной от той информации, которая, по данным IBM, производится в мире каждый день. Поэтому мы должны быть в высшей степени избирательны по отношению к информации, которую нам нужно помнить.
Элвин Тоффлер, автор вышедшей в 1970 г. книги «Шок будущего» (Alvin Toffler «Future Shock»)[4], предсказал некоторые последствия того, что он называл «информационной перегрузкой». По его мнению, лучший защитный механизм состоит в том, чтобы упрощать мир в соответствии со своими предубеждениями, хотя сам по себе мир становится все более разнообразным и комплексным{42}.
Наши биологические инстинкты не всегда хорошо адаптируются к современному обществу, переполненному информацией. И пока мы не начнем активно изучать собственные предубеждения, польза от дополнительной информации будет ничтожной или даже превратится во вред.
Информационная перегрузка, возникшая после рождения печатного пресса, привела к росту сектантства. Теперь все различные религиозные идеи можно было тестировать с помощью большего объема информации, с большей убежденностью, с бо́льшим количеством «доказательств» – и со значительно меньшей терпимостью к иным мнениям. То же самое явление разворачивается в наши дни. Разделение по политическим партиям в США начало активно развиваться примерно тогда же, когда Тоффлер написал «Шок будущего», и его темпы ускорились с появлением интернета{43}.
Подобные партийные убеждения могут легко нарушить справедливость утверждения о том, что чем больше информации, тем ближе мы становимся к истине. Недавнее исследование, проведенное журналом Nature, показало, что чем больше информации о глобальном потеплении получали рьяные приверженцы той или иной партии, тем меньше они соглашались со своими оппонентами{44}.
Кроме этого, даже при том, что объем информации ежедневно увеличивается на 2,5 квинтильона байт, с объемом полезной информации ситуация совершенно иная. Основная масса ежедневного прироста представляет собой обычный шум, растущий быстрее сигнала. У нас есть масса гипотез, требующих тестирования, и куча информационных массивов для тестирования – однако объем той информации, которую можно считать объективной истиной, остается практически неизменным.
Печатный пресс изменил наш способ совершать ошибки. Более редкими стали обычные ошибки переписчиков. Однако, если ошибка возникала, она могла воспроизводиться множество раз, как произошло с «Греховной Библией».
Этим свойством отличаются сложные системы типа Всемирной паутины. Возможно, они дают сбой не так часто, как более простые системы, но если этот сбой происходит, он оказывается в высшей степени значительным. Капитализм и интернет – две системы, невероятно эффективные с точки зрения пропаганды, позволяют плохим идеям распространяться точно в такой же степени, что и хорошим. Плохие идеи могут вызвать непропорционально сильный эффект. В преддверии финансового кризиса система была настолько искаженной, что любое недостаточно точное предположение в моделях, созданных кредитными рейтинговыми агентствами, сыграло огромную роль в кризисе всей глобальной финансовой системы.
Один из путей решения этой проблемы состоит в регулировании. Однако я подозреваю, что это – всего лишь попытка отказаться от того, чтобы обратиться за ответами внутрь самих себя. Нам нужно остановиться и признать, что у нас, у людей, есть проблема с предсказаниями. Мы любим заниматься ими, но не очень хорошо умеем это делать.
Что можно сказать о предсказании
Предсказание можно считать одновременно и основной проблемой этой книги, и основным ее решением.
Предсказания – это неотъемлемая часть нашей жизни. Каждый раз, когда мы выбираем маршрут движения на работу, размышляем о том, стоит ли идти на второе свидание или нужно ли отложить некоторую сумму на черный день, мы делаем прогноз о том, как будут развиваться события в нашем будущем и каким образом наши планы повлияют на вероятность позитивного исхода.
Тщательного осмысливания требуют решения далеко не всех этих повседневных вопросов; мы можем выделить на принятие каждого решения лишь ограниченное время. Тем не менее в течение дня каждый из нас делает множество предсказаний, вне зависимости от того, отдает ли он себе в этом отчет.
Именно по этой причине данная книга рассматривает предсказание как некий общечеловеческий опыт, а не функцию, которую реализует избранная группа экспертов или практиков. Конечно, всегда забавно потешаться над экспертами, когда их предсказания не сбываются. Однако нам не стоит слишком уж злорадствовать. Заявлять о том, что наши собственные предсказания ничуть не хуже, чем предсказания экспертов, – значит налагать на себя проклятие неоправданной похвалы.
При этом стоит отметить, что предсказания играют достаточно важную роль в науке.
Кому-то из вас может показаться дискомфортной мысль, на которую я намекал выше и которую теперь хочу высказать максимально прямо: мы никогда не сможем создавать идеально объективные предсказания. Они всегда будут искажены вследствие нашей субъективной точки зрения.
Однако эта книга категорически против нигилистической точки зрения, согласно которой объективной истины не существует. Скорее, она утверждает, что убеждение в наличии объективной истины – и приверженность ее достижению – представляет собой первое необходимое условие для создания качественного предсказания. Следующее, что должен признать любой прогнозист, – это тот факт, что его картина мира неидеальна.
Предсказание важно, поскольку оно позволяет соединить субъективную и объективную реальности. Эту точку зрения разделял философ науки Карл Поппер{45}. Для него гипотеза не считалась научной, когда ее нельзя было сфальсифицировать – иными словами, когда ее можно было протестировать в реальном мире путем прогнозирования.
В то же время мы должны понять, что далеко не все наши идеи могут или даже должны подвергнуться проверке. В экономике гораздо проще протестировать прогноз уровня безработицы, чем делать заявления об эффективности расходов на стимулирование бизнеса. В политических науках мы можем тестировать модели, использующиеся для предсказания исхода выборов, но, допустим, верификация теории о том, как могут повлиять изменения в политических учреждениях на общую политику, может занять десятилетия.
Я не хочу идти так же далеко, как Поппер, и утверждать, что эти теории – ненаучны или что в них отсутствует какая-либо ценность. Однако тот факт, что лишь немногие из теорий, которые мы можем проверить, показывают довольно плохие результаты, должен приводить нас к мысли о том, что многие из идей, которые мы не тестировали, могут также оказаться неверными. Вне всякого сомнения, мы живем с иллюзиями, которых даже не понимаем.
Однако нам есть куда двигаться. Возможное решение покоится не на довольно сырых политических идеях – особенно с учетом того, что я рассматриваю нашу нынешнюю политическую систему как значительную часть проблемы. Скорее, решение требует изменения нашего отношения.
Это новое отношение воплощается в так называемой теореме Байеса, о которой я расскажу в главе 8. Эта теорема, по сути, выглядит как математическая формула, но в реальности она представляет собой нечто гораздо более масштабное. Она предполагает, что мы должны думать о своих идеях (и том, как их проверять) иначе. Мы должны почувствовать себя более комфортно в условиях вероятности и неопределенности. Мы должны тщательнее размышлять о предположениях и убеждениях, с которыми связана проблема.
Данная книга делится примерно на две половины. Первые семь глав посвящены диагностике проблемы предсказания, а последние шесть – изучению и применению теоремы Байеса.
Каждая глава ориентирована на освещение конкретного вопроса и описывает его с определенной степенью глубины. Не буду отрицать, что эта книга достаточно детальна – отчасти потому, что в деталях часто кроется дьявол, а отчасти из-за моей убежденности в том, что достаточная степень погружения в предмет позволит понять его несоизмеримо лучше, чем короткое резюме.
Выбранная мной тематика связана с наличием обширной общедоступной информации. Известны примеры того, как прогнозисты создавали предсказания, основанные на закрытой информации (например, в случаях, когда компании используют данные о своих покупателях для прогнозирования спроса на новый продукт). Я же предпочитаю рассказывать о тех объектах, в отношении которых можно не верить мне на слово, а самостоятельно проверить результаты.
Короткая дорожная карта
В этой книге вы найдете много примеров из различных областей знаний (естественных и общественных наук), а также из спорта и азартных игр. В ней приведены как сравнительно прямолинейные примеры, в которых проще всего провести различие между успешным и неудачным предсказанием, так и другие, требующие чуть больше мастерства.
В главах 1–3 рассмотрены случаи неудачного предсказания в таких вопросах, как недавний финансовый кризис, успехи в бейсболе и в области политики, показано, где одни подходы сработали хорошо, а другие – нет. Их цель состоит в том, чтобы заставить вас задуматься о некоторых самых фундаментальных вопросах, лежащих в основе проблемы предсказания. Каким образом можем мы применить свои суждения в отношении данных, не поддаваясь при этом предубеждениям? В каких условиях рыночная конкуренция позволяет сделать лучшие прогнозы и за счет чего она способна их ухудшить? Каким образом мы можем сочетать необходимость использования знания прошлого как руководства к действию с признанием того, что будущее может быть совершенно иным?
В главах 4–7 основное внимание уделено динамическим системам: поведению земной атмосферы, влияющему на формирование той или иной погоды; движению тектонических плит планеты, способному вызвать землетрясения; комплексным взаимодействиям между людьми, влияющим на поведение американской экономики, а также распространению инфекционных заболеваний. Эти системы изучаются некоторыми из наших лучших ученых. Однако прогнозировать процессы, протекающие в динамических системах, достаточно сложно, и предсказания в этих областях далеко не всегда оказываются верными.
Главы 8–10 обращаются к решениям: сначала мы познакомим вас с человеком, делающим ставки на исходы спортивных мероприятий и применяющим теорему Байеса более умело, чем многие экономисты или ученые, а затем поговорим о двух видах спорта – о шахматах и покере.
Спорт и игры, подчиняющиеся четко определенным правилам, представляют собой отличную лабораторию для тестирования наших прогностических навыков. Они помогают нам лучше понимать смысл случайности и неопределенности, а также учат тому, как превращать информацию в знание.
Однако теорема Байеса может применяться и к значительно более важным проблемам. В главах 11–13 рассмотрены три примера: глобальное потепление, терроризм и пузыри на финансовых рынках. Эти проблемы достаточно важны и сложны для прогнозистов и общества в целом. Однако если мы решим принять брошенный нам вызов, то сможем сделать нашу страну, нашу экономику и нашу планету немного безопаснее.
Мир прошел долгий путь со времени изобретения печатного пресса. Информация перестала быть дефицитным продуктом; теперь ее у нас невероятно много, и мы не всегда знаем, что с ней делать. Однако по-настоящему полезной можно считать сравнительно небольшую ее часть. Мы воспринимаем ее избирательно, субъективно и не придаем значения возникающим в результате искажениям. Мы думаем, что нам нужна информация, хотя на самом деле нам нужно знание.
Сигнал – это правда. А шум – это то, что отвлекает нас от правды. Эта книга расскажет вам и о сигналах, и о шумах.
Глава 1
Катастрофически неудачные прогнозы
Наступило 23 октября 2008 г. Фондовый рынок находился в состоянии свободного падения, обвалившись за предшествующие пять недель почти на 30 %. Некогда уважаемая компания Lehman Brothers оказалась банкротом. Кредитные рынки практически перестали работать. Дома в Лас-Вегасе потеряли 40 % от своей стоимости{46}. Безработица подскочила до невероятно высокого уровня. Сотни миллиардов долларов, находившихся в распоряжении обанкротившихся финансовых фирм, моментально исчезли. Уровень доверия к правительству оказался самым низким за весь период его оценок{47}. А через две недели должны были состояться президентские выборы.
Конгресс, работа которого в обычных условиях затихала перед выборами, развил лихорадочную деятельность. Рассматриваемые в нем законопроекты о помощи финансовым организациям обещали стать непопулярными{48}, и Конгрессу нужно было создать впечатление, что все те, кто вел себя «неправильно», будут наказаны. Комитет США по надзору приказал главам трех основных агентств, занимавшихся составлением кредитных рейтингов, – Standard&Poor’s (S&P), Moody’s и Fitch Ratings – дать показания на парламентских слушаниях. Рейтинговые агентства были обвинены в неверной оценке вероятности того, что триллионы долларов в ценных бумагах, обеспеченных закладными, попадут под дефолт. Мягко говоря, возникло впечатление, что они оказались скомпрометированными.
Худшее из возможных предсказаний
Кризис конца 2000‑х гг. часто воспринимают как провал, поражение наших политических и финансовых учреждений. Очевидно, что это действительно было огромным поражением с экономической точки зрения. Даже в 2011 г., через четыре года после официального начала Великой рецессии, американская экономика работала на уровне в 800 млрд долл. ниже своего производственного потенциала{49}.
Однако я убежден, что правильнее оценивать финансовый кризис как провал в оценке состояния экономики или катастрофическую ошибку предсказания. Проблемы с прогнозами носили широкомасштабный характер, возникали практически на каждом шагу до, во время и после кризиса и вовлекали в себя массу участников – от ипотечных брокеров до Белого дома.
И самое страшное заключается в том, что «провалившиеся» предсказания обычно имеют много общих черт. Мы ориентируемся на сигналы, рассказывающие не о реально существующем мире, а о том, что мы хотим видеть. Мы игнорируем риски, которые сложнее всего измерить, даже когда они представляют собой величайшие угрозы нашему благосостоянию. Мы создаем приблизительное представление о мире, значительно более грубое, чем наше восприятие. Мы ненавидим неопределенность, даже когда она является неотъемлемой частью проблемы, которую мы пытаемся решить. Если мы хотим добраться до истинной причины финансового кризиса, нам следует начать с выявления самого «провального» предсказания, которое и привело ко всем последующим ошибкам.
Рейтинговые агентства давали рейтинг AAA (обычно зарезервированный для горстки наиболее платежеспособных стран и отлично управляемых компаний нашего мира) тысячам ценных бумаг, обеспеченных закладными, – финансовым инструментам, позволявшим инвесторам делать ставку на вероятность того, что кто-то не сможет расплатиться по закладной на свой дом.
Рейтинги, выпускавшиеся этими компаниями, были, по сути дела, предсказаниями, то есть расчетами вероятности того, что часть долга подвергнется дефолту{50}. Например, компания Standard&Poor’s озвучивала инвесторам, что рейтинг AAA у особенно сложного типа ценных бумаг, называемых облигациями, обеспеченных долговыми обязательствами (CDO)[5], означает, что невозможность выплаты по ним в течение следующих пяти лет составляет всего 0,12 %, или 1 шанс из 850{51}. По сути, это делало подобный инструмент столь же безопасным, как и корпоративные облигации[6] с рейтингом AAA{52}, и более безопасным, чем казначейские обязательства США (по мнению S&P){53}. Рейтинговые агентства будто забыли о существовании колоколообразных кривых распределения вероятности.
В реальности, судя по внутренним данным S&P, дефолту подверглось 28 % CDO с рейтингом AAA{54} (по некоторым независимым оценкам, этот показатель был еще выше{55}). Это значит, что реальные показатели дефолта для CDO оказались более чем в 200 раз выше, чем предсказывала S&P (рис. 1.1){56}.
Рис. 1.1. Предсказанные и реальные пятилетние уровни дефолта для траншей CDO c рейтингом AAA
Пожалуй, это пример чуть ли не самого серьезного провала, который только можно сделать в области предсказаний, – триллионы долларов в инвестициях, считавшихся почти полностью безопасными, обернулись чем-то диаметрально противоположным. Представьте себе, что прогноз погоды обещает вам +25 °С и солнце, а на вас внезапно обрушивается метель. Если вы сделаете неудачное предсказание, у вас есть несколько вариантов его последующего объяснения. Первый – обвинить внешние обстоятельства – то, что мы часто называем «невезением». Иногда это разумно и даже правильно. Когда Национальная служба погоды говорит о том, что вероятность безоблачной погоды составляет 90 %, а на улице начинается дождь, испортивший вам проведение турнира по гольфу, ее не стоит в этом винить. Исторические данные за многие десятилетия свидетельствуют, что когда Служба погоды говорит, что вероятность дождя составляет 1 к 10, то в долгосрочной перспективе дождь действительно идет всего в 10 % случаев[7].
Однако подобное объяснение внушает куда меньше доверия, когда у человека, делающего прогноз, за плечами нет истории успешных предсказаний и когда масштаб его ошибки значительно больше. В таких случаях проблема чаще связана с моделью мира, созданной прогнозистом, а не с миром как таковым.
В случае с CDO рейтинговые агентства вообще не имели никакой истории, на которую можно было бы опираться, – это были новые и мало кому знакомые ценные бумаги, а показатели уровня дефолта, заявленные S&P, основывались не на исторических данных, а на предположениях, вытекающих из неправильной статистической модели. При этом масштаб ошибок был огромным: на практике шансы на дефолт у CDO с рейтингом AAA оказались в 200 раз выше, чем в теории.
Правильное решение для рейтинговых агентств заключалось в том, чтобы признать ошибочность используемых моделей. Однако на слушаниях в Конгрессе они попытались снять с себя ответственность и заявили, что им просто не повезло. Они обвинили в случившемся внешние непредвиденные обстоятельства, а именно пузырь на жилищном рынке.
«S&P была не единственной компанией, которая внезапно столкнулась с резким падением на рынках жилья и ипотек», – сообщил Конгрессу в октябре того же года Девен Шарма, глава Standard&Poor’s{57}. «Почти никто – ни домовладельцы, ни финансовые учреждения, ни рейтинговые агентства, ни регуляторы, ни инвесторы – не мог предвидеть, что ждет их впереди».
Никто не мог предвидеть, что ждет их впереди. Если вы не можете заявить о своей невиновности, говорите о невежестве – зачастую это становится самой первой версией защиты в случае неудачного прогноза{58}. Однако заявление Шармы оказалось ложью, вполне типичной для слушаний в Конгрессе. Помните «У меня не было сексуальных отношений с этой женщиной» или «Я никогда не использовал стероиды»?[8]
Что же касается пузыря на жилищном рынке, то следует отметить тот факт, что очень многие замечали его развитие – и говорили об этом задолго до того, как он лопнул. Роберт Шиллер, экономист из Йеля, заметил начало развития пузыря еще в 2000 г., написав об этом в книге «Иррациональное изобилие» (Robert J. Shiller. «Irrational Exuberance»){59}. Дин Бейкер, экономист из Центра по экономическим и политическим исследованиям, писал о пузыре в августе 2002 г.{60}. Корреспондент журнала Economist, известный своей степенной прозой, говорил о «крупнейшем пузыре в истории» уже в июне 2005 г.{61}. Пол Кругман, экономист и лауреат Нобелевской премии, писал о пузыре и его неминуемом крахе в августе 2005 г.{62}. «Происходившее полностью вписывалось в систему, – рассказывал мне впоследствии Кругман. – Крах на рынке жилья не был черным лебедем. Он был настоящим слоном в посудной лавке».
Озабоченность проявляли и обычные американцы. Количество поисков в Google по запросу «housing bubble» («пузырь на жилищном рынке») выросло с января 2004 г. по лето 2005 г. примерно в 10 раз{63}. Наибольший интерес к этому термину проявляли в штатах типа Калифорнии, где наблюдался самый значительный рост цен на жилье{64} и где, по всей видимости, могло произойти самое значительное их падение. В сущности, существование пузыря на удивление широко обсуждалось. И если выражение «пузырь на жилищном рынке» появлялось в 2001 г. всего в восьми новостных сообщениях{65}, то к 2005 г. уже в 3447. Пузырь на жилищном рынке обсуждался в заслуживающих уважения газетах и периодических изданиях примерно десять раз в день{66}.
И тем не менее рейтинговые агентства, работа которых заключается в оценке риска на финансовых рынках, утверждали, что они ничего не заметили. И то обстоятельство, что они считали это своей лучшей линией защиты, многое говорит о том, что проблемы с их предсказаниями значительно глубже, чем мы могли бы предположить.
«Не думаю, что они хотели, чтобы музыка перестала играть»
Ни один из известных мне экономистов и инвесторов, с которыми я беседовал перед написанием этой главы, не высказывал теплых чувств по отношению к рейтинговым агентствам. Однако при объяснении причин неудачи рейтингов – алчность или невежество? – мнения моих собеседников разделились.
Возможно, Джулса Кролла можно считать одним из самых авторитетных специалистов в данном вопросе, поскольку он сам управляет рейтинговым агентством. В 2011 г., когда я встретился с ним в нью-йоркском офисе его компании Kroll Bond Ratings (основанной в 2009 г.), она как раз выпустила в свет свой первый рейтинг, связанный с ипотекой для строителей гигантского торгового центра в Арлингтоне, штат Виргиния.
Кролл видит основную причину ошибок рейтинговых агентств в отсутствии «надзора». Достаточно иронично слышать это слово от Кролла, который, перед тем как заняться рейтингами, управлял умеренно известной (и невероятно прибыльной) компанией Kroll, выступавшей в роли своеобразного детективного агентства, расследовавшего случаи корпоративного мошенничества. Эти люди знали, как найти преступников, например, однажды им удалось выловить похитителей одного миллиардера и владельца хеджевого фонда после того, как те воспользовались его кредитной картой, чтобы купить себе пиццу{67}. На момент нашей встречи Кроллу было 69 лет, однако его инстинкты ищейки остались столь же сильными, что и в прошлом, – и они пробудились, как только он занялся изучением деятельности рейтинговых агентств.
«Надзор – это термин, который можно рассматривать как своего рода искусство в рейтинговой отрасли, – сказал мне Кролл. – Суть его заключается в том, что вы постоянно информируете инвесторов о том, что видите. Каждый месяц вы получаете tape[9] – информацию о событиях типа дефолтов по закладным или досрочном их погашении, – короче, массу данных. По сути, это своеобразная система раннего оповещения: становятся ли дела лучше или хуже? И весь мир ждет, что вы будете держать его в курсе».
Иными словами, рейтинговые агентства должны были одними из первых обнаружить проблемы на жилищном рынке, так как обладали значительно более полной информацией, чем кто-либо еще: они знали, удается ли тысячам заемщиков вовремя делать выплаты по закладным. Однако вплоть до 2007 г., пока проблемы не проявились в полный рост, а уровень неплатежей не вырос почти в два раза, агентства не понижали рейтинг множества ценных бумаг, обеспеченных закладными{68}.
«Они отнюдь не дураки, – сказал мне Кролл. – Они все знали. Я думаю, что они просто не хотели, чтобы эта музыка перестала играть».
Kroll Bond Ratings – одна из десяти зарегистрированных NRSRO[10], то есть признанных в национальном масштабе статистических рейтинговых организаций, получивших от Комиссии по ценным бумагам и биржам право оценивать долговые ценные бумаги. Однако Moody’s, S&P и Fitch – трое из множества игроков – имели почти всю долю рынка; S&P и Moody’s независимо друг от друга оценивали почти 97 % CDO, выпускавшихся до финансового коллапса{69}.
Одна из причин, по которым S&P и Moody’s пользовались подобным доминирующим присутствием на рынке, состоит в том, что они слишком долго были «членами клуба». Иными словами, они представляют собой часть узаконенной олигополии; доступ же в эту отрасль ограничивается правительством.
Кроме этого, получение одобрения со стороны S&P и Moody’s часто требуют внутренние правила крупных пенсионных фондов{70}: примерно в двух третях случаев{71} в правилах прямо указано, что перед тем, как пенсионный фонд купит ту или иную ценную бумагу, она должна пройти оценку S&P, Moody’s или обеих компаний{72}.
S&P и Moody’s воспользовались преимуществом своего избранного статуса, чтобы получить исключительно высокую прибыль, несмотря на то что на них часто работали люди, не нашедшие себе места на Уолл-стрит[11].
Доходы Moody’s{73} от составления так называемых рейтингов структурированного финансирования увеличились за период между 1997 и 2007 гг. более чем на 800 %. В годы роста пузыря именно эти продукты были основными для агентства при работе в индустрии рейтингов{74}. Они обеспечили Moody’s в тот период на жилищном рынке самую высокую маржу прибыли по сравнению с любой компанией из списка S&P 500, причем в течение пяти лет подряд{75}. (В 2010 г., даже после того как пузырь лопнул и проблемы с рейтинговыми агентствами стали очевидными, Moody’s умудрялось зарабатывать прибыль на уровне 25 %{76}.)
Огромная прибыль, возникавшая вследствие появления на рынке все новых CDO, а также отсутствие возможности у инвесторов проверить правильность составляемых рейтингов, пока не станет слишком поздно, не давали агентствам стимулов соревноваться за качество продукта. Генеральный директор Moody’s Рэймонд Макдэниел недвусмысленно дал понять правлению компании, что качество рейтингов – это наименьший по важности фактор, определяющий прибыль компании{77}.
Все было гораздо проще. Рейтинговые агентства получали деньги от компаний, выпускавших CDO, за включение в рейтинг – чем больше CDO, тем больше прибыли.
Появилась возможность создавать практически неограниченное количество CDO путем комбинирования различных типов закладных, а когда это становилось совсем скучным, различные типы CDO комбинировались в ценные бумаги, производные друг от друга. Рейтинговые агентства редко упускали возможность оценить новую издаваемую ценную бумагу. Проведенное позднее правительственное расследование обнаружило переписку между двумя высшими руководителями Moody’s, в которой один из участников заявлял, что ценные бумаги могли бы «выпускать и коровы», но Moody’s все равно произвело бы их оценку{78}. В некоторых случаях рейтинговые агентства шли еще дальше и подстрекали эмитентов долговых бумаг манипулировать рейтингами. Заявив о стремлении к большей прозрачности{79}, S&P снабдило эмитентов копиями своих программ для составления рейтингов. Это позволяло эмитентам с легкостью определять, сколько «плохих» закладных они могли бы включать в состав ценной бумаги, не рискуя при этом снижением рейтинга{80}.
Таким образом, возможность возникновения пузыря на жилищном рынке и его последующего краха представляла явную угрозу для локомотива рейтинговых агентств, несущегося вперед на всех парах. Но люди обладают удивительной способностью игнорировать риски, угрожающие их жизненным интересам, – как будто благодаря этому риски исчезнут. Поэтому нетрудно предположить, что заявление Девена Шармы не так уж и неправдоподобно – не исключено, что рейтинговые агентства действительно не увидели пузыря на жилищном рынке, хотя его увидели все остальные.
Однако на самом деле рейтинговые агентства вполне реально рассматривали возможность возникновения пузыря на жилищном рынке. Но они решили, что он не будет серьезной проблемой. В меморандуме, предоставленном мне представителем S&P Кэтрин Мэтис, в деталях описаны проведенные S&P в 2005 г. расчеты, имитирующие ситуацию, при которой цены на жилье по всей стране снизились бы на 20 % (что не так сильно отличается от сокращения цен на жилье на 30 %, которое наблюдалось в период между 2006 и 2008 гг.). В заключительной части меморандума было отмечено, что используемые в S&P модели вполне адекватно «оценивали риск падения» и что ценные бумаги с высоким рейтингом смогут «пережить падение на жилищном рынке без ущерба для своего кредитного рейтинга»{81}.
В некотором смысле такой подход вызывает еще большее беспокойство, чем ситуация, при которой рейтинговые агентства просто упустили бы из виду пузырь на жилищном рынке. В этой книге мы поговорим об опасности «неизвестного неизвестного» – то есть рисков, о которых мы даже не осведомлены. Возможно, хуже них могут быть только риски, которые мы ошибочно считаем контролируемыми[12]. В этих случаях мы не только обманываем сами себя, но и можем заразить своей фальшивой уверенностью других. Что касается рейтинговых агентств, то этот обман позволил инфицировать всю финансовую систему.
«Основное различие между предметом, который может испортиться, и предметом, который испортиться не может, состоит в том, что предмет, который не может испортиться, невозможно починить, если он все-таки испортился», – писал Дуглас Адамс в одной из книг серии «Автостопом по Галактике»{82}.
Но как же так получилось, что модели, используемые рейтинговыми агентствами, обладавшие всеми атрибутами научной точности, настолько плохо описывали реальность?
В чем ошиблись рейтинговые агентства
Чтобы найти источник проблемы, нам нужно копнуть немного глубже. Для поиска ответа потребуется более подробно разобраться в том, каким образом структурируются финансовые инструменты типа CDO. Кроме того, нам нужно понять, в чем заключается различие между неопределенностью и риском.
CDO представляют собой набор закладных, разделенных по пулам или «траншам», часть из них, как предполагается, довольно рискованные, другие же считаются достаточно безопасными. Мой друг Анил Кашьяп, преподающий курс по вопросам финансовых кризисов студентам Чикагского университета, придумал довольно упрощенный пример CDO. Именно его я и использую для объяснения.
Представьте себе, что у вас имеется набор из пяти закладных, и у каждой из них, по вашему предположению, вероятность дефолта, то есть вероятность невыполнения обязательств, составляет 5 %. Вы можете создать целый ряд ставок, основанных на состоянии каждой из этих закладных, причем каждая из ставок может быть более рискованной, чем предыдущая.
Самая безопасная ставка, которую я назову «Альфа», принесет вам деньги во всех случаях, кроме одного: когда дефолту подвергнутся все пять закладных. Самая рискованная – «Эпсилон» – лишает вас денег, если дефолту подвергается любая из закладных. Все остальные варианты могут считаться промежуточными.
Почему инвестор может предпочесть сделать ставку на Эпсилон, а не Альфу? Ответ прост: потому что Эпсилон, с учетом высокой степени рискованности, будет стоить значительно дешевле. Однако, если вы – инвестор, склонный избегать риска (как, например, пенсионный фонд), и ваши внутренние правила не позволяют вам инвестировать в ценные бумаги с низким рейтингом, вы выберете вариант Альфа – ставку, рейтинг которой, само собой разумеется, будет равен AAA.
Альфа состоит из пяти закладных, каждая из которых имеет вероятность дефолта лишь 5 %. Вы потеряете свою ставку только тогда, когда все пять закладных подвергнутся дефолту. Насколько велик риск этого события?
На самом деле, это довольно непростой вопрос, и именно в нем и кроется главная проблема. Вы получите различные ответы в зависимости от того, какие предположения и допущения будете использовать. Если ваши предположения неверны, то ваша модель может оказаться совершенно неправильной.
Одно из предположений заключается в том, что все закладные не зависят друг от друга. В рамках данного сценария ваши риски хорошо диверсифицированы: если плотник в Кливленде не сможет рассчитаться по своей закладной, то это не окажет никакого влияния на действия стоматолога из Денвера.
При таком сценарии риск потери вашей ставки будет исключительно мал. С математической точки зрения он равен 5 % в пятой степени, то есть 1 шанс из 3,2 млн. Если взять в качестве аналогии игру в кости, то дефолту соответствует самая неудачная комбинация «один-один» для двух кубиков. И именно эта чудесная степень диверсификации и позволяла рейтинговым агентствам утверждать, что в случае объединения в общий пул подобная группа субстандартных ипотечных кредитов (каждый из которых имел в среднем кредитный рейтинг на уровне B+{83}, то есть предполагал{84} более чем 20 %-ную вероятность дефолта{85}) практически не имела шансов на дефолт.
Другая крайность: предполагается, что закладные не являются полностью независимыми друг от друга, а ведут себя совершенно одинаково. Иными словами, дефолту подвергнутся либо все пять закладных, либо ни одна из них. Вместо того чтобы «бросать кубик» пять раз и изучать каждый исход, мы делаем ставку на один исход. У вас имеется вероятность в 5 %, что вам выпадет комбинация «один-один» и все закладные подвергнутся дефолту – иными словами, ваша ставка станет в 160 000 раз более рискованной, чем вы предполагали изначально{86} (табл. 1.1).
Таблица 1.1. Упрощенная структура CDO
Какое из этих предположений окажется наиболее верным, зависит от экономических условий. Если экономика и жилищный рынок находятся в хорошем состоянии, то первый сценарий – пять закладных не имеют между собой ничего общего – может считаться вполне разумным предположением. В реальной жизни вполне допустимо ожидать наступления отдельных дефолтов – заемщик может потерять работу или получить слишком большой счет за хирургическую операцию. Однако риск дефолта одного заемщика практически не связан с рисками других.
Но давайте вместо этого предположим, что на рынке присутствует некий общий фактор, от которого зависит судьба всех домовладельцев. Например, на жилищном рынке возник огромный пузырь, заставляющий цены на дома вырасти на 80 % без какого-либо значительного улучшения фундаментальных экономических показателей. У вас возникает проблема: если один заемщик оказывается в состоянии дефолта, то с подобными проблемами могут столкнуться и все остальные. Риск потери вашей ставки возрастает многократно.
Именно этот последний сценарий и начал разыгрываться в Соединенных Штатах в 2007 г. (чуть позже в этой главе я расскажу о развитии пузыря на жилищном рынке более детально). Однако рейтинговые агентства сделали ставку на свое прежнее предположение об отсутствии корреляции между рисками. Хотя неоднозначность этого предположения описывалась в научной литературе{87} и о ней говорили некоторые бдительные сотрудники рейтинговых агентств{88} задолго до того, как пузырь на жилищном рынке лопнул, рейтинговые агентства практически ничего не сделали для исправления ситуации.
Например, Moody’s в течение некоторого периода времени производило косметические корректировки своей модели{89}, в частности повысило вероятность дефолта ценных бумаг с рейтингом AAA до 50 %. Это могло показаться вполне разумным – неужели буфера в 50 % недостаточно для того, чтобы сгладить все шероховатости в наших предположениях?
Все было бы хорошо, если бы вероятность ошибки в прогнозах изменялась бы линейно и рассчитывалась арифметически. Однако «леверидж», или инвестиции за счет долговых обязательств, значительно увеличивают вероятность неточного прогноза, что приводит к возникновению массы нелинейных ошибок. По сути, 50 %-ная корректировка, сделанная Moody’s, напоминала ситуацию, при которой вы используете солнцезащитный крем и утверждаете, что он способен защитить вас от поражения при ядерном взрыве. Иными словами, решение проблемы такого масштаба оказалось совершенно неадекватным. И дело не в том, что риск дефолта в 50 % был слишком низким, – с таким же успехом они могли недооценить его на 500 или 5000 %. Практика показала, что вероятность дефолта оказалась в 200 раз больше, чем заявляли рейтинговые агентства, – иными словами, их модель ошиблась на 20 000 %.
В более широком смысле проблема рейтинговых агентств состояла в их неспособности или нежелании разобраться в различии между риском и неопределенностью.
Риск, как впервые отметил экономист Фрэнк Х. Найт в 1921 г.{90}, предполагает, что его можно оценить. Предположим, вы планируете выиграть партию в покер при условии, что ваш оппонент не соберет так называемый «дырявый стрит» (то есть в его распоряжении до какого-то момента есть все карты для формирования комбинации «стрит», кроме одной недостающей в центре последовательности[13]). Шансы на то, что на столе окажется нужная карта, составляют точно 1 из 11{91}. Это и есть оценка риска. Конечно, такие ситуации всегда неприятны, однако вы, по крайней мере, знаете вероятность ее возникновения и можете это спланировать заранее. В долгосрочной перспективе вы сможете обыграть своих оппонентов, делающих отчаянные ставки на слишком малую вероятность благоприятного для них события.
Неопределенность же представляет собой риск, который сложно измерить. У вас может иметься некоторое расплывчатое представление о возможных неприятностях. Вы даже способны четко представить, в чем они заключаются. Однако вы не знаете ни сколько их, ни когда они могут проявиться. Ваша предварительная оценка вероятности может отличиться от истинной в 100 или даже 1000 раз; вы просто не можете произвести расчеты более точно. Это и есть неопределенность. Риск выступает смазкой для колес локомотива экономики свободного рынка; неопределенность заставляет их тормозить.
Алхимические действия рейтинговых агентств были направлены на то, чтобы превратить неопределенность в нечто, напоминающее рассчитываемые риски. Они брали никому не известные ценные бумаги с высокой степенью системной неопределенности и заявляли о своей способности дать количественную оценку их рисков. Помимо этого, из всех возможных заключений и выводов они выбирали вывод о том, что такие инвестиции практически безрисковые.
Огромное количество инвесторов ошибочно считало эти заключения правильными, и мало кто из них имел план действий на случай, если что-то пойдет не так.
Тем не менее, хотя рейтинговые агентства и несут значительную ответственность за финансовый кризис, они были не единственными, кто допустил ошибки. История финансового кризиса как результата неудачного предсказания может быть рассказана в трех актах.
Акт I. Пузырь на жилищном рынке
Исторически так сложилось, что жилье в Америке никогда не считалось привлекательной инвестицией. В сущности, если верить индексу, разработанному Робертом Шиллером и его коллегой Карлом Кейсом, рыночная цена американского дома в долгосрочной перспективе практически не росла. После корректировок на уровень инфляции инвестиция в размере 10 тыс. долл., сделанная в жилье в 1896 г., могла стоить в 1996 г. около 10,6 тыс. долл. Возврат на инвестиции составил за столетие меньше, чем обычно приносит фондовый рынок за один год{92}.
Однако если инвестиции в жилье и не были прибыльными, то они, по крайней мере, оставались безопасными. До начала 2000‑х гг. самое значительное изменение в ценах на дома в Америке произошло в годы, последовавшие сразу после Второй мировой войны, когда цены выросли примерно на 60 % от уровня 1942 г. (прежнего исторического максимума).
Отметим, что жилищный бум 1950‑х гг. не имел почти ничего общего с пузырем на жилищном рынке 2000‑х. Понять, почему в 2000‑х гг. возникла столь масштабная проблема, помогает довольно простое сравнение.
Для послевоенных лет было характерно значительное изменение стандартов жизни. Американцы вышли из военных времен, имея свободные средства{93}, и внезапно оказались в эпохе процветания. Возник огромный спрос на большие дома. За период с 1940 по 1960 г. доля домовладельцев подскочила с 44 до 62 %{94}, при этом основной рост происходил в пригородах{95}. Кроме того, жилищный бум сопровождался беби-бумом: население США увеличивалось примерно на 20 % за каждое десятилетие после войны, что почти в два раза больше показателя роста 2000‑х. То есть количество домовладельцев возрастало в каждое десятилетие примерно на 80 % – что даже превышало рост цен на жилье.
Рис. 1.2. Индекс Кейса – Шиллера, цены на жилье в США; 1890–006 гг.
Напротив, в 2000‑х гг. доля домовладений выросла совсем ненамного – пик находился примерно на уровне 69 % в 2005 г., а десятью годами ранее рост составлял 65 %{96}. Те немногие американцы, которые к тому времени не приобрели дома, уже не могли позволить себе это сделать. Процентиля[14] доходов домохозяйств, равного 40, увеличенного на величину 15 % инфляции в период между 2000 и 2006 гг.{97}, оказалось недостаточно для покрытия инфляции, не говоря уже о новых домах.
Вместо этого жилищный бум был раздут искусственным образом как за счет спекулянтов, желавших активизировать рынок, так и за счет все более сомнительных займов, выдававшихся все менее платежеспособным потребителям. Для 2000‑х гг. характерны рекордно низкие уровни темпов роста сбережений; в некоторые годы этот показатель составлял чуть более 1 %. При этом получить ипотеку было проще, чем когда-либо ранее{98}. Цены практически утратили связь с реальными показателями спроса и предложения, а кредиторы, брокеры и рейтинговые агентства – получавшие от продажи каждого дома прибыль в том или ином виде – стремились сохранить сложившийся порядок вещей.
Хотя в Соединенных Штатах никогда ранее не возникали подобные пузыри на жилищном рынке, их наблюдали в других странах. И результаты во всех случаях оказались разрушительными. Шиллер, изучавший данные за несколько столетий по многим странам от Нидерландов до Норвегии, обнаружил, что вслед за ростом цен на недвижимость до недопустимых высот неминуемо следовал крах{99}. Печально известный пузырь на рынке недвижимости Японии в начале 1990‑х гг. особенно похож на недавний пузырь на жилищном рынке США. Цена коммерческой недвижимости в Японии выросла за десятилетний период между 1981 и 1991 гг. примерно на 76 %, а затем снизилась на 31 % в течение следующих пяти лет, что очень напоминает траекторию изменения цен на дома в США во время и после пузыря{100} (рис. 1.3).
Шиллер открыл и еще одну важную особенность, связанную с развитием пузыря: ожидания людей, покупавших дома, касающиеся того, что могут принести им эти инвестиции, были совершенно нереалистичны. Исследование, проведенное Кейсом и Шиллером в 2003 г., показало, что домовладельцы ожидали, что их объекты собственности будут расти в цене примерно на 13 % в год{101}. В реальности за более чем столетний период с 1896 по 1996 г.{102} (о котором я уже упоминал выше) продажная цена домов выросла всего на 6 % после поправки на инфляцию, то есть примерно на 0,06 % в год.
Этих домовладельцев, возможно, стоило бы простить за чрезмерное доверие к жилищному рынку. Идея пузыря на жилищном рынке настолько сильно укоренилась в популярной культуре, что в 2005 г. появились (с интервалом в 10 дней) две независимые телевизионные программы – одна под названием Flip This House, а вторая – Flip That House.
Желание быть не хуже остальных захватило даже тех покупателей домов, которые не рассчитывали на высокий возврат на свои инвестиции. «Я еще помню, как 20 лет назад на дороге в Сакраменто не было пробок, – рассказывал мне Джордж Акерлоф, коллега Шиллера, офис которого в Калифорнийском университете в Беркли находится в эпицентре зоны резкого снижения цен на жилье. – А теперь пробки возникают на доброй половине пути. Логика людей была проста – если я не куплю дом сейчас, то через пять лет заплачу ту же сумму за дом, расположенный на 15 километров дальше».
Рис. 1.3. Пузырь на рынке коммерческой недвижимости в Японии (1981–001 гг.) и на рынке жилья в США (1996–011 гг.)
Какой бы логикой ни руководствовались домовладельцы, условия ухудшались с каждым месяцем. К концу 2007 г. появились явные признаки возникновения проблемы: цены на дома снизились в течение года на семнадцати из двадцати крупнейших рынков{103}. Еще более зловещим признаком было резкое сокращение количества выданных разрешений на строительство жилья (ведущего индикатора спроса на жилье). Их количество упало на 50 % от пикового значения{104}. Тем временем кредиторы, наконец-то заметившие последствия чрезмерно сниженных стандартов на рынке субстандартного кредитования, изъявляли все меньше желания выдавать новые займы. К концу 2007 г. количество случаев потери права выкупа удвоилось{105}.
Первым инстинктивным желанием законодателей было вновь надуть пузырь. Чарли Крист, губернатор штата Флорида (который значительно сильнее многих других пострадал от происходившего), предложил выдавать кредит в 10 тыс. долл. каждому покупателю нового дома{106}. В феврале 2008 г. Конгресс США принял еще более серьезный законопроект, значительно расширивший возможности кредитования компаниям Fannie Mae и Freddie Mac в надежде, что это подстегнет продажи домов{107}. Однако цены на жилье продолжали неумолимо снижаться, упав в течение 2008 г. еще на 20 %.
Акт II. Леверидж, леверидж, леверидж
Немногие экономисты своевременно увидели раздувающийся пузырь на жилищном рынке, и очень мало кто из них смог оценить последствия коллапса цен на жилье для экономики в целом. В декабре 2007 г. экономисты из группы экспертов-прогнозистов, созванной Wall Street Journal, предсказали, что вероятность рецессии в следующем году составляет лишь 38 %.
Это заключение было в высшей степени примечательным, поскольку, как показали более поздние данные, экономика в тот период уже находилась в рецессии. Экономисты из другой группы экспертов (Survey of Professional Forecasters) полагали, что вероятность экономического бедствия (на уровне, соответствовавшем реально произошедшему впоследствии) составляет менее чем 1 из 500{108}.
Экономисты не обратили внимания на два существенных фактора. Первый был связан с эффектом влияния падения цен на жилье на финансы среднего американца. По состоянию на 2007 г. у американцев из среднего класса{109} в дома было вложено свыше 65 % капитала{110}. В ином случае они бы просто становились беднее – а жилье как вид капитала можно было использовать как некое подобие банкомата{111}. Денежные же остатки обычной американской семьи, не относящиеся к потребительскому сектору, – сбережения, акции, пенсионные накопления, наличность и капитал, связанный с небольшим бизнесом – уменьшились в среднем на 14 %{112} между 2001 и 2007 гг.{113}. После того как коллапс пузыря на жилищном рынке лишил американцев из среднего класса почти всего жилищного капитала, они обнаружили, что оказались куда в более худшей ситуации, чем несколькими годами ранее.
Снижение расходов на потребление, возникающее в результате более реалистичного восприятия потребителями своих финансов (экономисты называют это эффектом богатства (wealth effect)), оценивается специалистами на уровне от 1,5{114} до 3,5 % ВВП{115} в год, что потенциально достаточно для перехода среднего роста в рецессию. Однако мелкая рецессия – это одно, а глобальный финансовый кризис – совсем другое. И чтобы объяснить, почему пузырь на жилищном рынке его запустил, одного лишь эффекта богатства явно недостаточно.
В реальности рынок жилья представляет собой довольно незначительную часть финансовой системы. В 2007 г. общий объем продаж домов в Соединенных Штатах составлял около 1,7 трлн долл. – ничего особенного по сравнению с 40 трлн долл. ежегодного оборота на рынке акций. При этом, невзирая на то что происходило вокруг, Уолл-стрит делала ставки на жилье, причем с невиданной агрессивностью. В 2007 г. общий объем торговли ценными бумагами, обеспеченными закладными, составлял примерно 80 трлн долл.{116}. Это значило, что на каждый доллар, который кто-то хотел получить по закладной, Уолл-стрит делала ставки на уровне 50 долл.{117}.
Рис. 1.4. Зависимость продажи жилья от ставок на ценные бумаги, обеспеченные закладными
Теперь мы начинаем понимать, как же возник финансовый кризис: ставки покупателей домов были умножены на 50. Проблему можно выразить одним словом – леверидж.
Если вы берете в долг 20 долл., чтобы сделать ставку на победу Redskins над Cowboys, то это ставка, обеспеченная левериджем[15]. Аналогично, левериджем считается ситуация, при которой вы заимствуете деньги, чтобы рассчитаться по ипотеке, или когда вы занимаете деньги, чтобы сделать ставку на ценные бумаги, обеспеченные закладными.
В 2007 г. компания Lehman Brothers имела долю заемных средств на уровне 33 к 1{118}, иными словами, из каждых 33 долл., которые компания имела в открытых финансовых позициях, ей принадлежал всего 1 долл. Это означало, что при снижении стоимости портфеля всего на 3–4 % Lehman Brothers имела бы отрицательный собственный капитал[16] и в принципе могла бы объявить себя банкротом{119}.
Lehman была не единственной компанией с высоким левериджем – доля заемных средств у других крупных банков США составляла примерно 1 к 30 и стабильно повышалась в годы, предшествовавшие финансовому кризису{120}. Хотя исторические данные о доле заемных средств у американских банков достаточно разрознены, проведенный Банком Англии анализ британских банков позволяет понять, что общая доля левериджа в системе была в 2007 г. близка к историческому максимуму, скорее даже беспрецедентно высокой{121}.
Однако что особенно отличало Lehman Brothers, так это ненасытный аппетит к ценным бумагам, обеспеченным закладными. В 2007 г. она держала 85 млрд долл. в ценных бумагах, обеспеченных закладными. Эта сумма в четыре раза превышает величину капитала самой компании, иными словами, снижения их ценности на 25 % вполне достаточно для того, чтобы компания обанкротилась{122}.
В обычных условиях инвесторы проявили бы крайнюю осторожность при покупке подобных активов – или как минимум внимательно хеджировали бы свои ставки.
«Если вы находитесь на рынке и кто-то пытается продать вам что-то, чего вы не понимаете, – сказал мне Джордж Акерлоф, – то думайте, что вам собираются “продать лимон“[17]».
Акерлоф посвятил этому вопросу знаменитую работу под названием «Рынок лимонов»{123}, принесшую ему Нобелевскую премию. Он показал, что на рынке, пораженном асимметрией информации, качество товаров будет снижаться, доминировать же будут мошенничающие продавцы, пытающиеся облапошить доверчивых или отчаявшихся покупателей.
Представьте себе, что к вам на улице подходит незнакомец и предлагает купить его подержанную машину. Он показывает вам данные оценки стоимости машины, однако не разрешает совершить пробную поездку. Показалось бы вам это подозрительным? Главная проблема в данном случае состоит в том, что незнакомец знает о машине – ее истории ремонтов и реальном пробеге – значительно больше, чем вы сами. Здравомыслящие покупатели будут избегать сделок на подобном рынке любой ценой. Это случай неопределенности, берущей верх над риском. Вы знаете, что вам нужно потребовать от него скидку – однако вам сложно понять, какой конкретно она должна быть. И чем меньшую цену он готов вам предложить, тем больше вы будете убеждаться в том, что это слишком хорошо, чтобы быть правдой. В данном случае просто невозможна такая вещь, как справедливая цена.
Но теперь представьте, что за незнакомца, продающего вам машину, готов поручиться кто-то заслуживающий доверия – ваш близкий друг или бывший партнер по бизнесу. Теперь ситуация начинает выглядеть иначе. Именно эту роль сыграли рейтинговые агентства. Они поручились за ценные бумаги, обеспеченные закладными, наделили их рейтингом AAA и помогли создать для них рынок, который в иных условиях просто не существовал бы. Рынок полагался на них, как Дебби Даунер, однако они вели себя, скорее, как Роберт Дауни-младший[18].
Особенно опасным было поведение Lehman Brothers. На встрече с инвесторами в марте 2007 г. финансовый директор компании Кристофер О’Мейра заявил, что недавняя «икота» на рынках его совершенно не заботит и что Lehman надеется заняться «донным промыслом», покупая ценные бумаги у других игроков, преждевременно закрывавших свои позиции{124}. Он объяснил, что качество кредита на рынке закладных оставалось «очень сильным» – a подобное заключение можно было сделать только в том случае, когда вы смотрите на высокий рейтинг ценных бумаг, а не на низкое качество их обеспечения. Lehman «купила лимон».
Через год, когда пузырь на жилищном рынке начал лопаться, Lehman сделала отчаянную попытку закрыть свои позиции. Однако, учитывая умопомрачительные премии, которые требовали инвесторы за кредитные дефолтные свопы, то есть инвестиции, оплата по которым происходит в случае дефолта, и которые, соответственно, считаются основной страховкой на случай его возникновения, величину падения снизили всего на 20 %{125}. Этого оказалось слишком мало, и это произошло слишком поздно, и Lehman завила о банкротстве 14 сентября 2008 г.
Антракт. Смятение как проявление алчности
О том, в какой последовательности происходили события после объявления о банкротстве Lehman, можно было бы написать целую книгу (и, более того, на эту тему уже существует несколько отличных книг типа «Too Big to Fail»[19]). Пока нам достаточно вспомнить, что даже после смерти финансовая компания может преследовать экономику, угрожая ей своими невыполненными обязательствами. Тот факт, что Lehman Brothers больше не могла расплатиться по своим проигрышным ставкам, означал, что у кого-то еще внезапно возникла огромная дыра в портфеле. Проблемы этих людей, в свою очередь, могли повлиять на другие компании, и этот эффект мог распространиться по нарастающей по всей финансовой системе. Инвесторы и заемщики, обеспокоенные случившимся, но не до конца понимавшие, кто, кому и сколько должен, теряли способность отличать платежеспособные компании от зомби. Они отказывались предоставлять деньги под любые проценты, не позволяя эффективно работать даже здоровым компаниям.
Именно по этой причине правительства – за счет средств налогоплательщиков и утраты своей популярности – иногда помогают финансовым компаниям, оказавшимся в сложной ситуации. Однако Федеральная резервная система, спасшая компании Bear Stearns и AIG, вопреки ожиданиям инвесторов приняла решение не оказывать помощь Lehman Brothers, и поэтому на следующее утро индекс Доу-Джонса упал на 500 пунктов сразу же после открытия биржи.
До сих пор не вполне понятно, почему правительство помогло Bear Stearns и AIG, но решило не спасать Lehman. Одно из объяснений – безответственное поведение Lehman, загнавшее ее в настолько глубокую финансовую яму, что правительство не было уверено в том, чего именно оно сможет добиться в этом случае и какой ценой. И, конечно же, правительство не хотело обменивать свои «хорошие» деньги на чужие «плохие» долги{126}.
Ларри Саммерс, занимавший на момент нашей встречи в Белом доме в декабре 2009 г. пост директора Национального экономического совета{127}, сказал мне, что в случае спасения Lehman Brothers исход для правительства Соединенных Штатов стал бы не намного лучше. А при избыточности левериджа в системе боль была бы неминуемой в любом случае. «Это оказалось своего рода пророчеством, опровергавшим само себя, – говорил мне Саммерс о финансовом кризисе. – Все активно пользовались левериджем, но в этом случае система становится достаточно хрупкой, а для самоуспокоенности нет никаких серьезных оснований».
«Lehman можно было сравнить с горящей сигаретой в сухом лесу, – продолжил он немного позднее. – Если бы не случилось этого, то вполне вероятно, что случилось бы что-то еще».
Саммерс воспринимает американскую экономику как последовательность петель обратной связи. Одним из простых видов обратной связи является тот, что возникает между спросом и предложением. Представьте, у вас есть киоск по продаже газировки{128}. Вы снижаете цены, и у вас начинают расти продажи; стоит вам поднять цену, и продажи упадут. Но если вы зарабатываете много денег благодаря тому, что на улице царит жара, а ваш киоск – единственный во всем квартале, можете не сомневаться: какой-нибудь неравнодушный паренек откроет свой киоск на соседней улице и начнет конкурировать с вами по цене.
Спрос и предложение представляют собой пример отрицательной обратной связи: если цены идут вверх, продажи падают. Несмотря на свое название, отрицательная обратная связь является благом для рыночной экономики. Представьте себе, что справедливым было бы обратное утверждение и с ростом цен продажи бы росли. Вы повышаете цену на газировку с 25 центов до 2,5 долл. – однако вместо снижения продажи удваиваются{129}. Вы повышаете цену с 2,5 до 25 долл., но они вновь удваиваются. Со временем вы начинаете брать за стакан газировки 46 тыс. долл. – то есть среднюю сумму годового личного дохода в США, – и все 300 млн американцев выстраиваются за ним в очередь.
Описанная выше ситуация может считаться примером положительной обратной связи. И хотя поначалу она может вам и приглянуться, вы вскоре обнаружите, что производством и продажей газировки занялись буквально все в стране. Не осталось никого, кто изготавливал бы видеоигры, которые вы хотели бы купить за счет своей прибыли.
Обычно, с точки зрения Саммерса, отрицательная обратная связь доминирует в американской экономике, ведя себя подобно термостату, предотвращая скатывание в рецессию или перегрев. Саммерс считает, что одним из самых важных примеров обратной связи является то состояние, которое возникает при необходимости выбирать между тем, что он называет страхом и алчностью. Одни инвесторы не любят рисковать, а другие обожают это делать, однако их действия, обусловленные соответствующими предпочтениями, уравновешивают друг друга: если цена на акции падает вследствие ухудшения финансового положения компании, то опасающийся инвестор продает акции алчному и стремящемуся заняться данным промыслом.
Однако алчность и страх представляют собой достаточно волатильные качества, и баланс между ними может оказаться нарушенным. Когда в системе становится слишком много алчности, появляется пузырь. Когда же в ней в изобилии присутствует страх, на рынке возникает паника.
В обычных условиях мы извлекаем пользу, прислушиваясь к советам друзей и соседей, которых просим высказать свое мнение перед принятием решения. Однако когда их суждение искажено, то искаженным будет и наше. Так, люди склонны оценивать цены на дома, сравнивая их между собой{130}: если дом с тремя спальнями в новом микрорайоне города продается за 400 тыс. долл., то цена на старый дом на соседней улице на уровне 350 тыс. долл. вдруг начинает казаться невероятно низкой. В такой ситуации повышение цены на один из домов может привести к тому, что другие дома будут казаться более привлекательными.
Или, скажем, вы хотите приобрести другой тип активов – ценные бумаги, обеспеченные закладными. Оценить его еще сложнее. Однако чем больше инвесторов их покупает – и чем выше их оценивают рейтинговые агентства, – тем больше вы верите в них как в безопасные и имеющие смысл инвестиции. Так возникает положительная обратная связь – и потенциал для развития пузыря.
В определенное время на рынке начала править бал отрицательная обратная связь – осталось не так много американцев, которые имели бы возможность приобретать дома по существовавшим на тот момент ценам. Более того, многие американцы, уже купившие дома, фактически не могли себе их позволить и вскоре перестали платить по закладным. Однако это произошло уже после того, как были сделаны ставки на триллионы долларов с высокой степенью левериджа. Иными словами, обратное движение стало уже невозможно без существенного ущерба для экономики. И все это произошло в результате уверенности в том, что все люди, покупающие эти активы, не могут ошибаться.
«У нас было слишком много алчности и слишком мало страха, – сказал мне Саммерс в 2009 г. – А теперь у нас слишком много страха и слишком мало алчности».
Акт III. И вновь все как обычно
Как только пузырь на жилищном рынке лопнул, алчные инвесторы испугались неопределенности, поджидавшей их за каждым углом. Процесс распутывания финансового кризиса, то есть выяснения, кто, сколько и кому должен, может приводить к длительному «похмелью» в экономике. Экономисты Кармен Рейнхарт и Кеннет Рогофф, изучившие огромные пласты финансовой истории при написании книги «На этот раз все будет иначе. Восемь столетий финансового безрассудства» (Carmen Reinhart and Kenneth Rogoff «This Time Is Different: Eight Centuries of Financial Folly»), обнаружили, что финансовые кризисы обычно приводят к росту безработицы, сохраняющемуся в течение четырех-шести лет{131}. Другое исследование, проведенное Рейнхарт и посвященное недавним финансовым кризисам, показало, что 10 из последних 15 стран, переживших кризис, никогда не возвращались к докризисному уровню безработицы{132}. Такое положение дел совсем не похоже на нормальные рецессии, после которых обычно наблюдается рост выше среднего в течение примерно года{133} по мере того, как экономика возвращается к среднему значению и ситуация с рабочими местами нормализуется. Однако, несмотря на всю важность этого вопроса, многие экономические модели не проводят различия между финансовой системой и другими областями экономики.
Белому дому следовало бы прислушаться к уроку истории, преподанному Рейнхарт и Рогоффом. Прошло совсем немного времени, и администрации пришлось держать ответ за свои неверные предсказания.
В январе 2009 г., когда Барак Обама готовился принять присягу, пришедшая в Белый дом команда экономистов, возглавляемая Саммерсом и Кристиной Ромер, председателем Совета экономических консультантов, получила задание подготовить план широкомасштабного пакета стимулирующих мер, позволявших снизить недостаток спроса у частных и корпоративных потребителей. По мнению Ромер, бюджет проекта должен был составить 1,2 трлн долл.{134}. Со временем эта сумма была снижена до 800 млрд долл. после возражений со стороны политической команды Белого дома (полагавшей, что ей будет сложно убедить Конгресс выделить триллион долларов).
Чтобы помочь убедить Конгресс и всю страну в необходимости стимулирующих мер, Ромер совместно с коллегами подготовила меморандум{135}, в котором была показана глубина кризиса и последствия стимулирующих мер, направленных на его преодоление. В меморандуме был представлен график, демонстрирующий, как мог бы развиваться уровень безработицы при наличии стимулирующего пакета и без него. По мнению авторов меморандума, уровень безработицы, составлявший 7,3 % по данным на декабрь 2008 г., мог достичь пика на уровне около 9 % в начале 2010 г. Однако при наличии стимулирующих мер безработица не превысила бы значения 8 % и могла бы начать снижаться не позднее июля 2009 г.
Конгресс одобрил пакет стимулирующих мер в феврале 2009 г. Однако безработица продолжала расти – до 9,5 % в июле, а затем и до пикового значения на уровне 10,1 % в октябре 2009 г. Это было значительно хуже, чем ожидал Белый дом даже в рамках сценария «без стимулирования». Консервативные блогеры насмешливо обновляли график Ромер, добавляя к чересчур оптимистичным прогнозам реальный уровень безработицы (рис. 1.5).
Рис. 1.5. Экономические прогнозы уровня безработицы, представленные Белым домом, январь 2009 г.
Источники: Bureau of Labor Statistics*; Белый дом.
* Bureau of Labor Statistics (Бюро трудовой статистики) – подразделение Министерства труда США, ответственное за обработку и распространение статистических материалов по вопросам труда и занятости.
Рассматривая один и тот же график, люди приходили к совершенно разным выводам. Пол Кругман, с самого начала считавший бюджет стимулирующего пакета слишком маленьким{136}, видит в нем подтверждение того, что Белый дом значительно недооценил падение спроса. «Тот факт, что безработица не особенно снизилась даже в условиях стимулирования, означал, что нам придется пройти через чертовски сильный шок после финансового кризиса», – рассказал он мне. Разумеется, при этом другие экономисты воспринимали график как свидетельство полной неудачи пакета стимулирующих мер{137}.
Белый дом может уподобиться S&P и сказать в свою защиту то, что «все сделали одну и ту же ошибку». Его прогнозы во многом соответствовали тому, что говорили в то время независимые экономисты{138}. При этом экономическая статистика в тот период существенно недооценила масштаб кризиса{139}. Результаты первых расчетов правительства, доступные Ромер и Саммерсу на момент предложения этой идеи Конгрессу, показывали, что ВВП сократился осенью 2008 г. на 3,8 %{140}. На самом деле финансовый кризис отъел у экономики кусок в два раза больше. Реальное значение снижения ВВП приближалось к 9 %{141}, то есть страна была примерно на 200 млрд долл. беднее, чем поначалу считало правительство.
Возможно, еще более непростительная ошибка Белого дома состояла в создании столь детального прогноза и в неспособности подготовить общественность к тому, что он может оказаться неверным. Никакой экономист, как в Белом доме, так и за его пределами, не мог бы с должной точностью предсказать, как будут изменяться основные экономические индикаторы типа уровня безработицы (более детально мы обсудим макроэкономические прогнозы в главе 6). Неопределенность в прогнозах уровня безработицы{142}, создававшихся во время рецессии, исторически составляла плюс-минус 2 %{143}. Поэтому, даже если Белый дом полагал, что наиболее вероятное значение уровня безработицы составит примерно 8 %, в реальности она могла легко подскочить до двузначной цифры (или же, напротив, снизиться до 6 %).
Существует значительная неопределенность и в оценке эффективности стимулирующих расходов такого рода. Расчеты эффекта мультипликатора, то есть того, какой вклад в рост вносит каждый доллар стимулирующего пакета, значительно отличаются от исследования к исследованию{144}. Некоторые ученые заявляют, что 1 долл. стимулирующего пакета приведет к росту ВВП на 4 долл., а другие считают, что возврат составит лишь 60 центов на 1 долл. Когда вы накладываете значительную неопределенность, присущую измерениям эффективности стимулирующих мер, на значительную неопределенность, присущую макроэкономическим прогнозам любого рода, есть все шансы на то, что ваше предсказание не сбудется.
Что общего между всеми неудачными прогнозами
Финансовый кризис сопровождался как минимум четырьмя крупными неудачами прогнозирования.
• Сам факт образования пузыря на жилищном рынке говорит о том, что прогноз был плохим. Домовладельцы и инвесторы полагали, что рост цен означает, что стоимость домов будет продолжать увеличиваться, хотя на самом деле это должно было навести их на мысль о снижении цен в дальнейшем.
• Рейтинговые агентства и банки типа Lehman Brothers не смогли понять, насколько рискованны ценные бумаги, обеспеченные закладными. Вопреки их предположениям, сделанным на слушаниях в Конгрессе, проблема была не в том, что рейтинговые агентства не смогли увидеть пузырь на жилищном рынке. Скорее, в их модели прогнозирования были заложены ошибочные допущения, основанные на ложной уверенности в том, что риск, связанный с коллапсом на жилищном рынке, достаточно мал.
• Практически никто не смог представить себе, что кризис на рынке жилья станет спусковым крючком глобального финансового кризиса. Однако это произошло – в результате высокой доли левериджа на рынке, при которой на каждый доллар, который средний американец хотел вложить в новый дом, приходилось до 50 долл., инвестированных в производные бумаги.
• И, наконец, непосредственно после финансового кризиса никто не был способен предсказать масштаб финансовых проблем, которые он может вызвать. Экономисты и политики не прислушались к выводу Рейнхарт и Рогоффа о том, что финансовые кризисы обычно приводят к очень глубоким и долгосрочным рецессиям.
У всех этих проблем, связанных с прогнозами, имеется общая черта. В каждом случае при оценке данных люди игнорировали важную часть контекста:
• вера домовладельцев в то, что цены на жилье не упадут, проистекала из того факта, что в недавнем прошлом никакого значительного снижения цен на жилье в США не происходило. Однако никогда прежде не было и столь масштабного роста этих цен;
• доверие банков к способности Moody’s и S&P оценивать ценные бумаги, обеспеченные закладными, могло быть основано на том факте, что агентства достаточно профессионально оценивали другие типы финансовых активов. Однако рейтинговые агентства никогда прежде не оценивали столь новые и сложные ценные бумаги, как кредитные дефолтные опционы;
• вера экономистов в способность финансовой системы выдержать кризис на жилищном рынке могла быть связана с тем, что колебания цен на жилье в прошлом не оказывали существенного влияния на финансовую систему. Однако финансовая система никогда прежде не использовала так много заемных средств и уж точно не создавала так много производных инструментов на жилищном рынке;
• вера политиков в способность экономики быстро восстановиться после финансового кризиса могла быть связана с их опытом недавних рецессий, большинство из которых заканчивалось быстрым «V-образным» восстановлением. Однако эти рецессии прежде не были вызваны финансовыми кризисами, а природа этих кризисов достаточно уникальна.
Для описания проблемы подобного типа существует специальный технический термин. В случае значительных ошибок в прогнозировании специалисты обычно говорят о том, что «данные находятся за пределами выборки». И обычно следы именно этой проблемы можно найти на местах подобных «преступлений».
Что означает этот термин? Объяснить его суть нам поможет простой пример.
За пределами выборки – за пределами мышления, или Формула неудачного предсказания
Представьте себе, что вы – очень хороший водитель. Так о себе думают почти все водители{145}, но вы можете это доказать – за 30 лет водительского стажа (то есть совершив 20 тыс. поездок) вы пару раз легко наехали на бордюры.
Помимо этого, вы не злоупотребляете алкоголем и уж точно никогда не садитесь за руль пьяным. Однако как-то раз вы расслабляетесь на рождественской вечеринке в офисе. Не так давно умер ваш хороший друг, и вы находитесь в состоянии стресса. Один коктейль водка-тоник превращается в 12. Вы сильно пьяны. Что лучше сделать – поехать домой, сев за руль, или же вызвать такси?
Ответ кажется очевидным – взять такси. И отменить утреннюю встречу.
Рис. 1.6. Аккуратность и точность
Однако вы начинаете руководствоваться иной логикой. Прежде вы уже совершили 20 тыс. поездок, и лишь в двух из них произошли незначительные инциденты. Иными словами, вы спокойно добрались до места назначения в 19 998 случаях. Кажется, что все свидетельствует о том, что вы способны благополучно доехать до дома. А если у вас есть столь убедительные шансы на успех, зачем напрягать себя вызовом такси?
Разумеется, проблема состоит в том, что ни в одной из этих 20 тыс. поездок вы не находились в состоянии столь сильного опьянения. Размер вашей выборки для оценки успеха при вождении в нетрезвом состоянии равен не 20 тыс., а 0, и вы не сможете использовать свой прежний опыт для предсказания риска аварии в будущем. Это – типичный пример проблемы, связанной с ошибкой выборки.
Хотя может показаться, что избежать подобной ошибки легко, рейтинговые агентства ее допустили. Проделанный Moody’s расчет корреляции между различными ипотечными ценными бумагами на основании данных из прошлого был неверен – особенно принимая во внимание тот факт, что компания учитывала данные о ценах на жилье в США, начиная с 1980‑х гг.{146}. Однако в период с 1980‑х до середины 2000‑х гг. цены были стабильными или росли. В подобных обстоятельствах предположение о том, что закладная одного домовладельца мало связана с закладной другого, было достаточно точным. При этом ничто в данных из прошлого не могло показать, что произойдет, когда начнут снижаться цены на все дома. Коллапс на жилищном рынке оказался событием, находившимся за пределами выборки, поэтому созданная модель не могла применяться для оценки риска в этих условиях.
Ошибки, которые мы совершили, – и чему они учат
Разумеется, сотрудники Moody’s не были такими уж беспомощными. Они могли бы дать куда более правдоподобные оценки, расширив горизонт ви́дения. Соединенные Штаты никогда ранее не испытывали подобного краха на жилищном рынке – однако он происходил в других странах и приводил к плачевным результатам. Возможно, если бы экономисты Moody’s посмотрели, как изменились ставки в Японии после развития пузыря на рынке недвижимости, то смогли бы более реалистично представить себе всю опасность ценных бумаг, обеспеченных закладными, – и не дали бы им рейтинга AAA.
Однако большинство из тех, кто составляет прогнозы, как правило, избегает проблем, находящихся за пределами выборки. Расширяя выборку и включая в нее события, отделенные от нас пространством и временем, мы часто сталкиваемся с примерами того, что изучаемые связи выглядят совсем не так, как мы привыкли видеть. Наша собственная модель начинает казаться куда более слабой и смотрится уже куда менее впечатляюще при ее презентации (в статье в журнале или посте в блоге). Мы вынуждены признать, что знаем о мире значительно меньше, чем нам казалось. И наши личные и профессиональные стимулы почти всегда препятствуют подобному расширению выборки.
Мы забываем – или сознательно игнорируем – тот факт, что наши модели представляют собой упрощение мира. Мы считаем, что любая допускаемая нами ошибка будет находиться в разумных пределах. Однако в комплексных системах ошибки измеряются не в процентах, а в разах. S&P и Moody’s недооценили величину риска, связанного с CDO, в 200 раз. Экономисты считали, вероятность именно такой рецессии, которая произошла в реальности, составляла лишь 1 к 500.
Как я уже писал во введении, один из самых широко распространенных рисков, с которыми мы сталкиваемся в информационную эпоху, состоит в следующем: несмотря на увеличение объема знания в мире, разрыв между тем, что мы знаем, и тем, о чем мы думаем, что знаем, постоянно расширяется. Этот синдром часто связан с тем обстоятельством, что прогнозы, кажущиеся нам невероятно точными, на самом деле не являются таковыми. Moody’s провела расчеты с точностью до второго знака после запятой – однако они были невероятно далеки от реальности. Это все равно, что заявлять, что вы умеете хорошо стрелять, потому что ваши пули всегда оказываются в одних и тех же местах – хотя и невероятно далеко от центра мишени (рис. 1.6).
Финансовые кризисы, как и большинство других неудачных предсказаний, возникают как раз вследствие подобного фальшивого ощущения доверия. Аккуратные прогнозы притворяются точными, заставляя кое-кого из нас попасться на удочку и удвоить свои ставки. И в тот самый момент, когда нам кажется, что мы смогли преодолеть все основные недостатки своих суждений, ступор может наступить даже в такой сильной экономике, как американская.
Глава 2
Кто умнее: вы или «эксперты[20]» из телевизионных передач?
Для многих людей выражение «политический прогноз» практически стало синонимом телевизионной программы McLaughlin Group, политического круглого стола, транслируемого по воскресеньям с 1982 г. (и примерно с того же времени пародируемого в юмористическом шоу Saturday Night Live). Ведет эту программу Джон Маклафлин, сварливый восьмидесятилетний человек, предпринимавший в 1970 г. неудачную попытку стать сенатором США. Он воспринимает политические прогнозы как своего рода спорт. В течение получаса в передаче обсуждаются четыре-пять тем, при этом сам Маклафлин настойчиво требует, чтобы участники программы отвечали на совершенно различные вопросы – от политики Австралии до перспектив поиска внеземного разума.
В конце каждого выпуска McLaughlin Group наступает время рубрики «Прогнозы», в которой каждому участнику дается несколько секунд, чтобы выразить мнение по тому или иному актуальному вопросу. Иногда они имеют возможность выбрать тему самостоятельно и поделиться своим мнением о чем-то, весьма далеком от политики. В других же случаях Маклафлин устраивает им своего рода неожиданный экзамен, на котором участники должны дать так называемые вынужденные прогнозы и ответить на один конкретный вопрос.
На некоторые вопросы Маклафлина – например, назвать следующего претендента на место в Верховном суде из нескольких достойных кандидатов – сложно ответить. На другие намного проще. Например, в выходные перед президентскими выборами 2008 г. Маклафлин спросил у участников, кто одержит верх – Джон Маккейн или Барак Обама?{147}.
Казалось, что ответ на этот вопрос не заслуживает длительного размышления. Барак Обама опережал Джона Маккейна практически в каждом национальном опросе, проводимом после 15 сентября 2008 г., когда банкротство Lehman Brothers привело к одному из самых сильных спадов в экономике со времен Великой депрессии. Также Обама вел по результатам опросов почти в каждом колеблющемся штате: Огайо, Флориде, Пенсильвании и Нью-Гемпшире – и даже в тех нескольких штатах, где демократы обычно не выигрывают, таких как Колорадо и Виргиния. Статистические модели, наподобие той, что я разработал для FiveThirtyEight, показывали, что шансы Обамы на победу в выборах превышают 95 %. Букмекерские конторы были менее конкретны, однако все равно оценивали шансы Обамы как 7 против 1{148}.
Однако первый участник дискуссии, Пэт Бьюкенен, уклонился от ответа. «В этот уик-энд свое слово скажут неопределившиеся», – заметил он, вызвав смех остальных участников круглого стола. Другой гость, Кларенс Пейдж из газеты Chicago Tribune, сказал, что данные кандидатов слишком «близки друг к другу, чтобы делать ставки». Моника Кроули из Fox News была упрямее и заявила, что Маккейн выиграет с перевесом «в пол-очка». И лишь Элеанор Клифт из Newsweek констатировала очевидное мнение и предсказала победу Обамы и Байдена.
В следующий вторник Обама стал избранным президентом. Он получил 365 голосов выборщиков против 173, отданных за Джона Маккейна, – результат, практически совпавший с предсказанным на основании опросов и статистических моделей. Хотя это и не убедительная историческая победа, все равно это был не тот случай, когда трудно предсказать результаты выборов – Обама обогнал Джона Маккейна почти на десять миллионов голосов. И казалось бы, что всем, кто делал противоположные прогнозы, следует объясниться.
Однако через неделю, когда те же участники McLaughlin Group собрались снова{149}, ничего подобного не произошло. Они обсуждали статистические нюансы победы Обамы, его выбор Рама Эмануэля в качестве главы администрации и его отношения с президентом России Дмитрием Медведевым. Никто не упомянул о неудачных прогнозах, сделанных на национальном телевидении, невзирая на массу свидетельств обратного. Скорее, участники передачи попытались сделать вид, что исход был полностью непредсказуемым. Кроули сказала, что это был «необычный год» и что Маккейн провел ужасную предвыборную кампанию, забыв упомянуть, что сама хотела сделать ставку на этого кандидата неделей ранее.
Специалистов по прогнозированию редко стоит судить по одному-единственному прогнозу, но в данном случае можно сделать исключение. За неделю до выборов единственная правдоподобная гипотеза, позволявшая поверить в победу Маккейна на выборах, заключалась в массивном всплеске расовой враждебности по отношению к Обаме, почему-то не замеченной в ходе опросов{150}. Однако подобную гипотезу не высказал ни один из экспертов. Вместо этого они, казалось, существовали в альтернативной вселенной, в которой не проводятся опросы, отсутствует коллапс экономики, а президент Буш все еще более популярен, чем Маккейн, рейтинг которого стремительно падает.
Тем не менее я решил проверить, не был ли данный случай аномальным. Насколько вообще умеют предсказывать участники дискуссии McLaughlin Group – люди, получающие деньги за свои разговоры о политике?
Я оценил достоверность примерно 1000 прогнозов, сделанных в последней рубрике шоу как самим Маклафлином, так и участниками его передачи. Около четверти из них или были слишком расплывчатыми, что не позволяло их анализировать, или касались событий в отдаленном будущем. Все остальные я оценивал по пятибалльной шкале, варьировавшейся в диапазоне от абсолютно ошибочных до полностью точных.
С таким же успехом участники шоу могли бы подбрасывать монетку. 338 их прогнозов были неточными – либо полностью, либо в значительной степени. Точно такое же количество – 338 – оказалось верными полностью или в значительной степени{151} (табл. 2.1).
Таблица 2.1. Анализ прогнозов, высказанных в телевизионной программе McLaughlin Group{152}
Кроме этого, ни одного из участников дискуссии – даже Клифта с его точным прогнозом итогов выборов 2008 г. – нельзя было выделить как лучшего среди остальных. Я рассчитал для каждого участника показатель, отражавший долю их личных верных индивидуальных прогнозов. Наиболее часто принимающие участие в обсуждении – Клифт, Бьюкенен, покойный Тони Блэнкли и сам Маклафлин – получили почти одинаковую оценку от 49 до 52 %, что означало, что они могли с равным успехом дать как верный, так и неверный прогноз{153}. Иными словами, их политическое чутье оказалось на уровне любительского джазового квартета, состоящего из парикмахеров.
Разумеется, программа McLaughlin Group в большей или меньшей степени задумана как своеобразное фарсовое развлечение для политических наркоманов. Это – своего рода пережиток прежней эры, такой же как программа Crossfire на канале CNN, в которой либералы и консерваторы бесконечно ругались друг с другом. Нынешняя, камерная эра не особо отличается от прежней, за исключением лишь того, что либералы и консерваторы вещают на своих кабельных каналах, а в качестве демилитаризованной демаркационной зоны между ними находятся Food Network или Golf Channel[21]. Подобная расстановка сил повышает рейтинги, однако далеко не всегда обеспечивает более надежный анализ.
Но что можно сказать о тех, кому платят за правильность и тщательность исследований, а не просто за количество высказываемых мнений? Можно ли считать, что качество прогнозов политологов или аналитиков из вашингтонских мозговых центров выше?
Действительно ли политологи лучше «экспертов»?
Распад Советского Союза и некоторых других стран Восточного блока происходил невероятно высокими темпами и, учитывая все обстоятельства, довольно упорядоченным образом[22].
12 июня 1987 г. Рональд Рейган, стоявший перед Бранденбургскими воротами, призвал Михаила Горбачева разрушить Берлинскую стену. И тогда его слова казались не менее дерзкими, чем обязательство Джона Ф. Кеннеди отправить человека на Луну. Рейган оказался лучшим пророком: стена рухнула менее чем через два года.
16 ноября 1988 г. парламент республики Эстония, государства размером со штат Мэн, заявил о суверенитете Эстонии, то есть о ее независимости от всемогущего СССР. Менее чем через три года Горбачеву удалось отразить попытку переворота со стороны сторонников жесткой линии в Москве, а затем советский флаг был в последний раз спущен перед Кремлем; Эстония и другие советские республики вскоре стали независимыми государствами.
Если постфактум падение советской империи и кажется вполне предсказуемым, то предвидеть его не мог практически ни один ведущий политолог. Те немногие, кто говорил о возможности распада этого государства, подвергались насмешкам{154}. Но если политологи не могли предсказать падение Советского Союза – возможно, самого важного события в истории конца XX в., – то какой вообще от них прок?
Филип Тэтлок, преподаватель психологии и политологии, работавший в то время в Калифорнийском университете в Беркли{155}, задавал себе именно такие вопросы. В период распада СССР он организовал амбициозный и беспрецедентный проект. Начиная с 1987 г. Тэтлок принялся собирать прогнозы, сделанные обширной группой экспертов из научных кругов и правительства по широкому кругу вопросов внутренней политики, экономики и международных отношений{156}.
Тэтлок обнаружил, что политическим экспертам было довольно сложно предвидеть развал СССР, поскольку для понимания происходившего в стране нужно было связать воедино различные наборы аргументов. Сами эти идеи и аргументы не содержали ничего особенно противоречивого, однако они исходили от представителей разных политических направлений{157}, и ученые, бывшие сторонниками одного идеологического лагеря, вряд ли могли так легко пользоваться аргументацией оппонентов.
С одной стороны, непосредственно от Горбачева зависело довольно много, и его желание реформ было искренним. Если бы вместо того, чтобы заняться политикой, он предпочел стать бухгалтером или поэтом, то Советский Союз мог бы просуществовать еще несколько лет. Либералы симпатизировали Горбачеву. Консерваторы же мало верили ему, а некоторые из них считали его разговоры о гласности простым позерством.
С другой стороны, критика коммунизма консерваторами была скорее инстинктивной. Они раньше остальных поняли, что экономика СССР разваливается, а жизнь среднего гражданина становится все более сложной. Уже в 1990 г. ЦРУ рассчитало – причем неверно{158}, – что ВВП Советского Союза примерно в два раза меньше, чем в США{159} (в расчете на душу населения, что сопоставимо с уровнем демократических в настоящее время государств типа Южной Кореи и Португалии). Однако недавно проведенные исследования показали, что советская экономика, ослабленная длительной войной в Афганистане и невниманием центрального правительства к целому ряду социальных проблем, была примерно на 1 трлн долл. беднее, чем думало ЦРУ, и сворачивалась почти на 5 % в год с инфляцией, темпы которой описывались двузначными цифрами.
Если связать эти два фактора воедино, то коллапс Советского Союза было бы легко предвидеть. Обеспечив гласность прессы, открыв рынки и дав гражданам больше демократических прав, Горбачев, по сути, наделил их механизмом, катализирующим смену режима. А благодаря обветшавшему состоянию экономики страны люди с радостью воспользовались представленной возможностью. Центр оказался слишком слаб, чтобы удержать контроль, и дело было не в том, что эстонцы к тому времени устали от русских. Русские и сами устали от эстонцев, поскольку республики-сателлиты вносили в развитие советской экономики значительно меньше, чем получали из Москвы в виде субсидий{160}.
Как только к концу 1989 г. в Восточной Европе начали сыпаться костяшки домино – Чехословакия, Польша, Румыния, Болгария, Венгрия и Восточная Германия, – Горбачев, да и кто-либо еще вряд ли смогли бы что-то сделать, чтобы предотвратить этот процесс. Многие советские ученые осознавали отдельные части проблемы, однако мало кто из экспертов мог собрать все кусочки головоломки воедино, и практически никто не был способен предсказать внезапный коллапс СССР.
Тэтлок, вдохновленный примером с Советским Союзом, начал проводить опросы экспертов и в других областях. Например, он просил их поделиться мнением и дать прогнозы, касающиеся Войны в Заливе, пузыря на рынке недвижимости в Японии, потенциального отделения Квебека от Канады и практически каждого из других важных событий 1980‑х и 1990‑х гг.
Была ли неспособность предсказать коллапс Советского Союза исключением, и заслуживает ли своих лавров «экспертный» политический анализ? Исследования Филипа Тэтлока, проводившиеся свыше 15 лет, были опубликованы в 2005 г. в книге «Знания экспертов: Насколько мы можем им верить?» (Philip E. Tetlock «Expert Political Judgement: How good is it?»).
Выводы Тэтлока оказались убийственными. Эксперты в рамках его опросов – вне зависимости от их рода занятий, опыта или отрасли знаний – демонстрировали ничуть не лучшие результаты, чем можно получить при обычном гадании. Более того, они предсказывали будущие политические события хуже, чем даже рудиментарные статистические методы. Они были слишком самоуверенны, оценивая их вероятность: около 15 % событий, которые, по их мнению, не имели ни малейшего шанса на возникновение, все же реализовывались, а еще 25 % событий, в возникновении которых эксперты были полностью уверены, так и не произошли{161}. И не имело значения, какие это были события: касались ли они экономики, внутренней политики или международных дел, суждения экспертов оказались одинаково ошибочными по всем вопросам.
Чтобы делать более верные прогнозы, нужно стать лисой
Хотя в среднем результаты экспертов оказались довольно плохими, Тэтлок обнаружил, что некоторым из них эта работа удавалась лучше, чем остальным. Среди проигравших оказались те эксперты, чьи предсказания чаще всего цитировались в СМИ. Тэтлок установил, что чем больше интервью прессе давал эксперт, тем хуже были его предсказания.
Другая же подгруппа экспертов показывала сравнительно более хорошие результаты. Тэтлок, получивший образование психолога, очень интересовался когнитивным стилем экспертов – тем, как они размышляют о мире. Поэтому он видоизменил несколько вопросов в личностных тестах и задал их всем экспертам.
Основываясь на полученных ответах, Тэтлок смог классифицировать всех экспертов в соответствии с определенной шкалой, распределив их между так называемыми ежами и лисами. Разделение на эти две группы напрямую связано с названием эссе Исайи Берлина о русском писателе Льве Толстом. Берлин, в свою очередь, позаимствовал его из строки, приписываемой греческому поэту Архилоху: «Лис знает много секретов, а еж – один, но самый главный».
Если вы не фанат Толстого или цветистой прозы, то вам совершенно не обязательно читать эссе Берлина. Однако основная его идея заключается в том, что писателей и мыслителей можно разделить на две большие категории.
• «Ежи» – это те люди, которые верят в Большие Идеи или управляющие миром принципы. «Ежи» приравнивают их к законам физики, универсальным для каждого вида взаимоотношений в обществе. Можно вспомнить Карла Маркса и идею классовой борьбы или Зигмунда Фрейда и идею бессознательного. Или же Малкольма Гладуэлла и теорию «переломного момента».
• «Лисы» же, напротив, верят во множество мелких идей и предлагают разнообразные подходы к решению проблем. Они более терпимы к нюансам, неопределенности, сложности и противоречивым мнениям. Если «ежи» – это охотники, всегда ищущие большую добычу, то «лисы» – это собиратели.
«Лисы», как обнаружил Тэтлок, умеют предсказывать значительно лучше, чем «ежи». Например, они гораздо лучше оценили перспективы Советского Союза. Вместо того чтобы воспринимать СССР исключительно в идеологических понятиях, как «империю зла» или как сравнительно успешный (и, возможно, даже выступающий образцом для подражания) пример марксистской экономической системы, они видели то, что было на самом деле, – все более дисфункционализирующую страну, стоявшую на грани распада. Если прогнозы «ежей» были немногим лучше, чем вероятностный шанс, то прогнозы «лис» показывали, что у них есть определенные способности к предсказаниям (табл. 2.2).
Таблица 2.2. Различия между «лисами» и «ежами»
Почему из «ежей» получаются хорошие гости телешоу
Я встретился с Тэтлоком за обедом в гостинице «Дюран», приятном и освещенном зимним солнцем заведении, расположенном рядом с общежитием Беркли. Вполне естественно, Тэтлок напоминал типичную «лису»: он говорил мягким голосом и часто замолкал на 20 или 30 секунд перед тем, как дать на мои вопросы максимально выверенный ответ.
«Что стимулирует людей, демонстрирующих свой интеллект на публике? – спросил меня Тэтлок. – Есть целый ряд ученых, предпочитающих сохранять анонимность. Но есть и другие, желающие выступать на публике, высказывать смелые теории и оценивать значительные события в понятиях вероятности. Разумеется, такой подход естественным образом привлекает к ним внимание».
Иными словами, смелые предсказания в стиле «ежа» с большей вероятностью приведут вас на телевидение. Возьмем пример Дика Морриса, бывшего советника Билла Клинтона, работающего в настоящее время комментатором на канале Fox News. Моррис – это классический «еж», и, по всей видимости, его стратегия состоит в том, чтобы при любом удобном случае выступать с шумным предсказанием. В 2005 г. Моррис заявил, что действия Джорджа У. Буша по преодолению последствий урагана «Катрина» помогут ему обрести прежние позиции во взаимоотношениях с общественностью{162}. Накануне выборов 2008 г. он предсказал, что Барак Обама выиграет в Теннесси и Арканзасе{163}. В 2010 г. Моррис предсказал, что республиканцы легко получат сотню мест в Палате представителей США{164}. В 2011 г. он заявил, что Дональду Трампу стоит выдвинуть свою кандидатуру на президентских выборах от республиканской партии и что у него «чертовски высокие» шансы на выигрыш{165}.
Все эти предсказания оказались абсолютно неверными. «Катрина» стала началом конца Буша, а не его возрождения. Обама проиграл в Теннесси и Арканзасе с разгромным счетом – фактически это были единственные штаты, в которых его результаты были хуже, чем у Джона Керри четырьмя годами ранее. Республиканцам повезло в ноябре 2010 г., однако они получили 69 мест, а не 100. Трамп официально отказался от президентских амбиций всего через две недели после настойчивых призывов Морриса.
Однако Моррис умеет быстро вставать на ноги и снова продолжает заниматься маркетингом самого себя – он, как и прежде, регулярно появляется в программах Fox News и даже смог продать свою книгу сотням тысяч людей.
«Лисам» же порой бывает непросто вписаться в отдельные типы культур, таких как телевидение, бизнес и политика. Их убеждение в том, что многие проблемы сложно предсказать и что мы должны принимать во внимание большую степень неопределенности в жизни, может ошибочно приниматься за отсутствие у них уверенности в себе. Их плюралистический подход может быть столь же ошибочно принят за отсутствие убежденности. Широко известна фраза Гарри Трумэна, потребовавшего представить ему «сделанного одной рукой экономиста»[23], после того как «лисы» в его администрации никак не могли дать ему однозначный ответ на вопрос.
При этом оказывается, что «лисы» могут делать более качественные предсказания. Они быстрее других понимают, насколько данные могут быть искажены шумом, и они в меньшей степени склонны гоняться за фальшивыми сигналами. Они больше знают о том, что они не знают.
Если вам нужен врач, способный оценить ваше физическое состояние, или инвестиционный консультант, помогающий максимизировать величину пенсионных накоплений, то вам стоит довериться «лисе». Возможно, он даст менее радужные прогнозы относительно своих способностей, но уж точно будет лучше понимать, что происходит на самом деле.
Почему политические предсказания обычно оказываются неудачными
«Лисье» восприятие происходящего может оказаться особенно важным, когда речь заходит о предсказаниях в области политики. Существует целый ряд ловушек, в которые чаще всего попадают «ежи», а «лисы» с присущей им осторожностью – нет.
Одна из них – партийная идеология. Моррис, несмотря на то что ранее был советником Билла Клинтона, позиционирует себя как республиканец и занимается сбором средств для кандидатов от этой партии. И его консервативные взгляды вполне соответствуют взглядам его работодателя, Fox News. Однако и у либералов нет иммунитета против того, чтобы стать «ежами». Изучая правильность прогнозов, сделанных участниками McLaughlin Group, я обнаружил, что Элеанор Клифт, обычно выступающая как самый либеральный участник этого шоу, почти никогда не выдвигала предположений о более предпочтительном для республиканцев варианте. Возможно, это и помогло ей в предсказании результата выборов 2008 г., но в долгосрочной перспективе она не была более точной, чем ее консервативные оппоненты.
Научные эксперты, деятельность которых изучал Тэтлок, могут страдать от той же проблемы. В сущности, неполные знания могут стать опасной вещью в руках «ежа» с докторской степенью. Один из самых примечательных выводов Тэтлока звучал так: если с приобретением нового опыта у «лис» улучшаются способности к предсказанию, то для «ежей» справедливо обратное – по мере приобретения дополнительных знаний результативность их прогнозов, скорее, ухудшается. Тэтлок верит, что чем больше фактов узнают «ежи», тем больше у них появляется возможностей манипулировать с этими фактами с целью подтверждения их предубеждений. Это чем-то напоминает ситуацию, когда вы помещаете ипохондрика в темную комнату с доступом в интернет. Чем больше времени вы ему дадите, тем больше информации будет у него в распоряжении и тем более страшный диагноз он себе поставит (в подобных ситуациях ему будет легко принять обычную простуду за бубонную чуму).
Но, хотя Тэтлок и обнаружил, что самые плохие предсказания исходили от «ежей» с правого и левого флангов, он также заметил, что «лисы» из разных политических групп были менее подвержены подобным проявлениям{166}. «Лисы» могут иметь свои идеальные представления о том, каким должен быть мир. Однако они в большей степени способны при анализе отделить свои представления о том, как мир может выглядеть в ближайшем будущем, от того, как выглядит мир в реальности.
Напротив, «ежам» сложнее отстраниться от своих глубинных интересов при проведении анализа. По словам Тэтлока, вместо этого они создают «расплывчатую смесь из сваленных в одну кучу фактов и значений параметров». Они с большим предубеждением относятся к свидетельствам, обращая внимание лишь на то, что хотят увидеть, а не то, что есть в реальности.
Вы можете использовать тест Тэтлока для диагностики того, относитесь ли вы к «ежам». Иными словами, улучшаются ли ваши прогнозы, если у вас появляется доступ к большей информации? Теоретически дополнительная информация должна служить попутным ветром, когда вы делаете предсказания, – вы можете всегда игнорировать информацию, если она кажется вам не особенно полезной. Однако «ежи» часто загоняют себя в угол собственными действиями.
Рассмотрим, что показали результаты опроса группы политических инсайдеров, проведенного журналом National Journal, в котором выяснялось мнение примерно 180 политиков, политических консультантов, социологов и других ученых. Опрос проводился отдельно для представителей демократической и республиканской партий, однако обеим группам задавались одни и те же вопросы. Можно сказать, что участники этой группы, вне зависимости от политических пристрастий, – подлинные «ежи». Политические деятели гордятся своими боевыми шрамами и видят себя участниками вечной битвы с оппонентами на коктейльной вечеринке.
За несколько дней до промежуточных выборов 2010 г. National Journal спросил участников группы о том, удастся ли демократам сохранить контроль и над Конгрессом, и над Сенатом{167}. По обоим вопросам имелось почти стопроцентное согласие – демократы могли сохранить Сенат, однако республиканцам было вполне по силам взять контроль над Конгрессом (участники опроса оказались правы в обоих предположениях). Как демократические, так и республиканские инсайдеры пришли к почти полному согласию в вопросе о том, сколько дополнительных мест получат республиканцы в Конгрессе; эксперты демократов говорили о 47, а республиканцы предсказывали 53. Разницу можно считать относительно незначительной с учетом того, что в Конгрессе 435 мест.
Однако кроме этого National Journal попросил участников опроса предсказать исход одиннадцати отдельных событий: выборов в Сенат, Конгресс и на пост губернатора. И здесь выявились куда более значительные различия. Мнения разделились по вопросам результатов выборов в Сенат в Неваде, Иллинойсе и Пенсильвании, выборов губернатора во Флориде и крайне важных выборов в Конгресс в Айове. В целом участники опроса – республиканцы – ожидали, что демократы выиграют в 1 из 11 гонок, а демократы – что выиграют в 6 из 11 (реальный исход достаточно предсказуемым образом оказался посередине – демократы выиграли 3 из 11 кампаний, о которых спрашивал National Journal){168}.
Очевидно, что свою роль здесь сыграла партийная принадлежность: демократы и республиканцы поддерживали своих. Однако только этого недостаточно, чтобы объяснить необычные расхождения в том, как участники опроса отвечали на различные типы вопросов. Когда их, к примеру, спрашивали о шансах республиканцев в общем, то между полученными ответами почти не было различий. Однако они проявлялись, когда задавались вопросы о конкретных выборах – и такие вопросы заставляли партийные различия выплыть на поверхность{169}.
Чрезмерный объем информации в руках «ежа» может оказаться для него злом. Вопрос о том, как много мест могли бы отобрать республиканцы у демократов, выглядит общим (пока вы не принимаетесь изучать детали всех 435 выборных кампаний). Напротив, когда участников опроса спрашивали о конкретной кампании, например о выборах в Сенат в Неваде, то оказывалось, что они располагают разной информацией о ней (и результаты опросов, и новости о ходе кампании, и слухи, и собственные мысли о кандидатах). Иногда они даже знали лично или самих кандидатов, или людей, работавших на них.
«Ежи», имеющие в своем распоряжении много информации, начинают выстраивать сюжеты более приглаженные и идеальные, чем реальный мир. В придуманных ими историях имеются союзники и враги, победители и проигравшие, победы и поражения в жестоких битвах – и обычно хеппи-энд для команды, к которой принадлежит «еж». Черт побери, наш кандидат, отстающий от своего соперника на 10 %, все равно выиграет, поскольку я знаю и его, и избирателей в его штате. А еще я слышал, как пресс-секретарь кандидата говорил о том, что разрыв сокращается, и видел его новый прекрасный рекламный ролик…
Создавая такие сюжеты, мы можем утратить способность к критическому осмыслению имеющихся фактов. Обычно выборы представляют собой конкуренцию различных повествований. Что бы вы ни думали в 2008 г. о Бараке Обаме, Саре Пейлин, Джоне Маккейне или Хиллари Клинтон, у каждого из них имелась убедительная история жизни – повествования о ходе кампании (типа «Game Change») читаются как отлично написанные бестселлеры. Кандидаты кампании 2012 г. были менее привлекательными, однако все равно смогли представить аудитории обычный ансамбль драматических клише от трагедии (Герман Кейн?) до фарса (Рик Перри).
Порой в таких повествованиях можно запутаться. Политика может быть особенно уязвимой к плохим предсказаниям из-за присущих ей человеческих элементов: наличие качественного выбора заставляет нас включать сильные чувства. Это не значит, что хорошее предсказание политического события требует от вас полной бесстрастности. Но это не значит и то, что отстраненный подход «лис» всегда будет приносить свои дивиденды.
«Лисий» подход к прогнозированию
Идея FiveThirtyEight[24] возникла у меня в зале ожидания международного аэропорта имени Луи Армстронга в Новом Орлеане в феврале 2008 г., где я ждал объявления на посадку на задержанный рейс. По какой-то причине, возможно, свою роль в этом сыграла порция мартини, мне вдруг показалось очевидным, что кто-то должен создать сайт, на котором оценивались бы шансы Хиллари Клинтон и Барака Обамы (жестко конкурировавших на тот момент в борьбе за пост кандидата от демократической партии) против Джона Маккейна.
При этом мой интерес к электоральной политике возник несколько раньше – и был скорее результатом разочарования, а не привязанности к политическому процессу. В 2006 г. я тщательно наблюдал за попыткой Конгресса запретить интернет-покер (бывший на тот момент одним из основных источников моего дохода). Я нашел анализ политических событий даже более интересным, чем анализ спорта (качество которого значительно улучшилось благодаря так называемой «Революции Moneyball»).
Во время подготовки к предварительным выборам я обнаружил, что все чаще и чаще смотрю политические телевизионные программы, в основном на каналах MSNBC, CNN и Fox News. Как правило, освещение событий было довольно скучным и бессодержательным. Несмотря на то что выборы должны были состояться через несколько месяцев, многие комментаторы говорили о неизбежности победы Клинтон и игнорировали неопределенность, присущую подобным ранним этапам выборной кампании. Слишком много внимания уделялось полу Клинтон и расе Обамы{170}. Некоторые комментаторы пытались навязчиво определить, удалось ли тому или иному кандидату «выиграть день», произнеся успешную фразу на пресс-конференции или переманив на свою сторону одного из не особо известных сенаторов (притом что это не волновало 99 % избирателей).
Политические новости, и особенно важные и действительно влияющие на кампанию, появляются нерегулярно. Однако новости создаются каждый день. Зачастую это всего лишь «наполнитель», упакованный в форме историй, призванных скрыть незначительность информации[25]. Часто это приводит не только к утрате сигнала, но и к усилению шума. Если в каком-то штате проводится некое количество опросов, показывающих верховенство республиканцев, то нет ничего интересного в том, что вы скажете то же самое, что говорят все остальные. Если же результаты вашего опроса покажут, что верх начинают брать демократы, вам обеспечено место в заголовках новостей – несмотря на то что ваш опрос представляет собой всего лишь информационный выброс и не может предсказать исход с должной степенью точности.
Иными словами, планка, установленная в конкурентной борьбе, казалась достаточно низкой. Любой человек мог произвести впечатление гения, занявшись самыми простыми базовыми исследованиями того, что действительно обладает предсказуемостной способностью в политической кампании. Поэтому я начал вести блог на сайте Daily Kos, рассказывая о детальном и управляемом данными анализе таких вопросов, как опросы или данные по сбору средств кандидатами. Я выяснил, какие опросы показывали в прошлом самые точные результаты и насколько победа в одном штате – к примеру, Айове – могла привести к изменению расстановки сил в другом. Мои статьи быстро стали популярными, хотя чаще всего комментарии читателей сайтов, подобных Daily Kos, носят качественный (и довольно предвзятый) характер. В марте 2008 г. я начал выставлять аналитические данные на собственном сайте (FiveThirtyEight), где размещались прогнозы, касающиеся различных выборных кампаний.
Поначалу модель прогнозирования FiveThirtyEight была довольно простой – по сути, она брала среднее значение из результатов всех опросов и рассчитывала вес каждого опроса в зависимости от его соответствия последующим событиям. Затем она стала более изощренной, однако при этом всегда соблюдались три довольно широких принципа (которые можно назвать «лисьими»).
Принцип 1. Учитывайте вероятностность события
Почти все публикуемые мной прогнозы, как в политике, так и в других областях, являются вероятностными.
Вместо того чтобы «выплеснуть» одну цифру и утверждать, что я точно знаю, что произойдет далее, я показываю диапазон возможных результатов. Например, 2 ноября 2010 г. мой прогноз о возможном количестве мест республиканцев в Конгрессе США выглядел так, как показано на рис. 2.1.
Предполагалось, что наиболее вероятное количество мест, которое наберут республиканцы, находилось в диапазоне, перекрывающем почти половину всех возможных вариантов, – от 45 до 65 (в реальности они получили 63 места). Однако также имелась возможность выигрыша республиканцами 70 или 80 мест – но уж точно не предсказанной Диком Моррисом сотни. И существовала вероятность того, что демократы удержат достаточно мест для сохранения контроля над Конгрессом.
Рис. 2.1. Прогноз количества мест республиканцев в Конгрессе США на 2 ноября 2010 г. от FiveThirtyEight
Широкий разброс исходов выборов отражал неопределенность, присущую реальному миру. Прогноз был создан на основе индивидуальных прогнозов для каждого из 435 мест в Конгрессе – и в большинстве кампаний разрыв межу конкурировавшими кандидатами был минимальным. В результате судьба 77 мест в Конгрессе определялась разрывом голосов менее чем в 10 %{171}. Если бы демократы обогнали собственные прогнозы в самых конкурентных регионах всего на пару процентов, то смогли бы легко удержать за собой Конгресс. Если бы то же самое смогли сделать республиканцы, то превратили бы свою победу в невероятный триумф. Небольшие колебания политических течений могли бы привести к существенно иному результату; поэтому было бы глупо сводить описание происходящего к точной цифре.
Этот вероятностный принцип также сохраняется в случаях, когда я прогнозирую, чем завершатся отдельные кампании. Например, насколько велика вероятность выигрыша кандидата, если он, по итогам опросов, опережает конкурента на пять пунктов? Именно такие вопросы и призваны решать модели типа FiveThirtyEight.
Ответ на подобный вопрос в значительной степени зависит от типа гонки, в которую вовлечен кандидат. Чем ниже уровень выборов, тем более волатильными становятся результаты: данные опросов на предвыборной гонке в Конгресс менее точны, чем данные опросов при выборах в Сенат, а те, в свою очередь, менее точны, чем опросы перед выборами президента. Также считается, что, в целом опросы в ходе предварительных партийных выборов (праймериз) значительно менее точны, чем опросы в ходе общих выборов. Во время праймериз Демократической партии в 2008 г. средняя величина ошибки в данных опроса составляла около восьми пунктов – значительно больше, чем подразумевается при оценке ее погрешности. Проблема опросов в ходе республиканских праймериз 2012 г. была еще масштабнее{172}. Фактически во многих важных штатах – включая Айову, Южную Каролину, Флориду, Мичиган, Вашингтон, Колорадо, Огайо, Алабаму и Миссисипи – кандидат, лидировавший в ходе опросов за неделю до выборов, проигрывал гонку.
Однако опросы становятся более точными по мере приближения дня выборов. В табл. 2.3 представлены некоторые результаты, полученные с использованием упрощенной версии модели прогнозирования FiveThirtyEight для выборов в Сенат, использовавшей данные за период с 1998 по 2008 г. В модели рассчитывалась вероятность выигрыша кандидата на основе значения средней величины его опережения в ходе опросов. Допустим, кандидат в Сенат, имевший пятипроцентное опережение, выигрывал гонку в 95 % случаев – это было почти гарантировано, хотя пресса часто называла предвыборную гонку «непредсказуемой». Напротив, в случае преимущества в пять пунктов за год до выборов, шансы на победу составляют лишь 59 % – чуть лучше, чем при гадании с помощью подбрасывания монетки.
В подобных условиях ценность моделей типа FiveThirtyEight становится очевидной. Нет никаких проблем с тем, чтобы посмотреть на цифры, увидеть, что некий кандидат ведет по данным некоторых или всех опросов, и понять, что он является фаворитом (за некоторыми исключениями это предположение будет правильным). Гораздо сложнее понять, в какой мере он выступает фаворитом. Наши мозги, приученные находить закономерности, всегда пытаются найти в данных сигнал, хотя, на самом деле, вместо этого нам следует оценивать степень шума.
Таблица 2.3. Вероятность победы кандидата на выборах в Сенат, основанная на среднем показателе опережения в ходе опросов
Я привык именно к такому стилю мышления, а предпосылкой для него является опыт, приобретенный, когда я имел дело с двумя дисциплинами – спортом и покером, в которых вы, так или иначе, сталкиваетесь со всеми вариантами развития событий. Сыграв достаточное количество партий в покер, вы получаете некоторое количество комбинаций ройял-флэш. Стоит вам сыграть еще, и вы окажетесь в ситуации, когда у вас на руках будет фулл-хаус, а ройял-флэш придет вашему сопернику. В спорте, особенно бейсболе, также возникают события с низкой вероятностью. Так, команда Boston Red Sox не смогла выйти в плей-офф в 2011 г., несмотря на то что в какой-то момент ее шансы на это составляли 99,7 %{173}, – хотя лично я не стал бы спорить с человеком, считающим, что в случае Red Sox или Chicago Cubs обычные законы вероятности просто не работают.
Такое отсутствие определенности часто расстраивает политиков и политических обозревателей. В 2010 г. один конгрессмен-демократ позвонил мне за несколько недель до выборов. Он представлял довольно благополучный для демократической партии район на западном побережье.
Тем не менее, принимая во внимание, насколько хорошо шли в том году дела у республиканцев, он беспокоился, что может потерять свое место. Он хотел знать, насколько велика доля неопределенности в нашем прогнозе. При округлении наши цифры говорили ему о том, что вероятность его победы составляет 100 %… Однако что значили эти 100 % на самом деле – 99 % или 99,99 %, или же 99,9999 %? В первом случае, когда шансы проигрыша оценивались как 1 к 100 000, он был готов пожертвовать собранными на его кампанию средствами и передать их другим кандидатам, баллотировавшимся в более уязвимых районах. Однако он не был готов так поступить, если шансы на его проигрыш составляли 1 к 100.
Представители политических партий могут неправильно интерпретировать роль неопределенности в прогнозе; они относятся к ней как к своего рода страховке или возможному оправданию в случае, если предсказание оказывается неверным. Но дело заключается совсем в другом. Если вы прогнозируете, что некий конгрессмен будет выигрывать в 90 % случаев, то это также означает, что ему будет суждено проиграть в 10 % случаев{174}. Отличительный признак хорошего прогноза заключается в том, что каждая из этих вероятностей может реализоваться в долгосрочной перспективе.
«Ежи» Тэтлока очень плохо понимают суть этих вероятностей. Когда вы говорите, что вероятность того, что какое-то событие произойдет, составляет 90 %, то за этими словами имеется вполне конкретный и объективный смысл. Однако наши мозги превращают его в нечто более субъективное. Выводы психологов Даниэла Канемана и Амоса Тверски показывают, что такие субъективные оценки не всегда соответствуют реальности. У людей могут возникнуть проблемы при оценке различия между вероятностью благополучного приземления самолета, составляющей 90 %, и вероятностью в 99 % или даже в 99,9999 %. Хотя совершенно очевидно, что от этого напрямую зависит, стоит ли нам бронировать билет на самолет.
При наличии должной практики наша оценка может стать лучше. «Ежей» Тэтлока отличала высокая степень упрямства и неготовность учиться на своих ошибках. Признание присущей реальному миру неопределенности в прогнозах вынудило бы их признать неправильность своих теорий, касающихся должного поведения мира, а это – последнее, чего хотелось бы приверженцу той или иной идеологии.
Принцип 2. Сегодняшний ваш прогноз – это первый прогноз из тех, что еще будут в вашей жизни
Еще одно заблуждение состоит в том, что хороший прогноз не следует изменять. Разумеется, если ваш прогноз резко изменяется день ото дня, это не говорит ни о чем хорошем. Либо у вас плохая модель, либо вы пытаетесь предсказать непредсказуемые события. В 2012 г., когда я опубликовал прогнозы республиканских праймериз в каждом из штатов на основании одних лишь данных опросов, вероятности победы различных кандидатов существенно менялись каждый раз после появления результатов очередного опроса.
Когда исход более предсказуем – как, например, в случае общих выборов на последних этапах гонки, – прогнозы обычно выглядят более стабильными. После выборов 2008 г. я часто слышал, что многие люди, вовлеченные в этот процесс, обращались к сайту FiveThirtyEight, чтобы просто успокоиться[26]. К окончанию президентской гонки каждый день из различных штатов поступают данные 30–40 опросов, и результаты некоторых из них неминуемо выпадут за пределы обычной ошибки. Кандидаты, стратеги и телевизионные комментаторы, заинтересованные в том, чтобы сделать гонку более интригующей, чем она есть, будут обращать внимание на подобные необычные цифры, однако расчеты с использованием модели FiveThirtyEight показали, что они редко на чем-либо сказываются.
Самое правильное из того, что вы можете сделать, это создать лучший из возможных на сегодняшний день прогнозов – вне зависимости от того, что вы говорили на прошлой неделе, в прошлом месяце или прошлом году. Появление новых прогнозов не означает, что старый прогноз просто исчезает (в идеале, вы должны сохранить его и позволить другим людям оценить, насколько хорошо вы проделали свою работу в течение всего периода предсказания события). Но если у вас есть основания считать, что вчерашний прогноз был неверным, то держаться за него нет никакого смысла. «Когда меняются факты, меняется и мое мнение, – говорил знаменитый экономист Джон Мейнард Кейнс. – А у вас разве не так, сэр?»
Некоторым людям не нравится подобный тип корректирования курса, и они ошибочно принимают его за признак слабости. Им кажется, что в таких действиях присутствует некий элемент мошенничества, как будто вы вместо научного анализа пытаетесь определить направление ветра с помощью поднятого вверх пальца{175}.
Критики обычно полагают, явно или косвенно, что политика в чем-то сходна с физикой или биологией, в которых соблюдаются фундаментальные законы, познаваемые по своей природе. (Кстати, один из наиболее часто критикующих меня людей – профессор нейробиологии из Принстона{176}.) Если же придерживаться подобных взглядов, то новая информация не имеет особенного значения; выборы должны двигаться по предсказуемой орбите, как комета, направляющаяся в сторону Земли.
Однако, в отличие от физики или биологии, прогнозирование на выборах напоминает, скорее, покер: мы можем наблюдать за поведением оппонента и улавливать те или иные подсказки, но мы не видим его карт. Пытаясь выкачать как можно больше из имеющейся ограниченной информации, мы должны быть готовы изменить свой прогноз по мере получения более новых и более качественных сведений. Неспособность изменить свой прогноз вследствие излишнего стыда говорит лишь об отсутствии у нас должной смелости.
Принцип 3. Ищите консенсус
Каждый «еж» представляет себе, как он создает смелый, дерзкий и нестандартный прогноз, радикально отличающийся от точки зрения, основанной на консенсусе.
Коллеги над ним смеются, и даже их золотые ретриверы начинают смотреть на него недоуменно. Однако затем предсказание вдруг оказывается глубоким, точным и несомненно правильным. Через два дня рассказ о нем появляется на первой полосе Wall Street Journal, а он сам – смелый и решительный первопроходец – сидит в гостевом кресле на шоу Джея Лино.
Время от времени делать такие прогнозы вполне нормально и правильно. Консенсус между экспертами может быть ошибкой – человек, который осмеливался бы предсказать коллапс Советского Союза, заслуживал бы огромной благодарности. Однако выступить с таким фантастическим сценарием довольно сложно. Хотя «лисы», и в том числе я сам, считают себя нонконформистами, мы все равно начинаем нервничать всякий раз, когда наши прогнозы радикально отличаются от творений конкурентов.
Существует довольно много свидетельств тому, что совокупные, или групповые, прогнозы являются более точными, чем индивидуальные (для разных дисциплин значения показателя могут находиться между 15 и 20 %). И это не всегда означает, что групповые прогнозы хороши (чуть позже в книге мы детально рассмотрим этот вопрос). Но это значит, что вы можете извлечь определенную пользу от изучения проблемы с разных точек зрения.
«“Лисы” часто прокручивают в голове то, на что способна лишь группа “ежей”», – рассказал мне Тэтлок. Он имеет в виду, что «лисы» выработали у себя способность имитировать процесс консенсуса. Вместо того чтобы задавать вопросы целой группе экспертов, они постоянно задают вопросы сами себе. Зачастую это означает, что они объединяют различные виды информации – так обычно делает группа людей с различными идеями об окружающем мире, – а не относятся к каждому факту как Святому Граалю (например, в прогнозах FiveThirtyEight часто совмещаются данные опросов с информацией о состоянии экономики, демографических сведений о штате и т. д.). Составители прогнозов, которым не удается следовать рекомендациям Тэтлока, часто вынуждены платить за это высокую цену.
Остерегайтесь чудодейственных прогнозов
В преддверии выборов 2000 г. экономист Дуглас Хиббс опубликовал модель прогнозирования и заявил, что при ее использовании можно невероятно точно предсказывать итоги президентских выборов, учитывая всего лишь две переменных. Одна из них была связана с экономическим ростом, а вторая – с военными потерями{177}. Хиббс сделал ряд смелых заявлений в стиле «ежа». Он сказал, что рейтинг одобрения деятельности президента (исторически считавшийся надежным индикатором возможности переизбрания) никак не улучшал его прогнозы. Не имели значения ни уровень инфляции, ни уровень безработицы. Не важны были и личности кандидатов – партия могла выдвинуть как идеолога типа Джорджа Макговерна, так и центриста и героя войны наподобие Дуайта Д. Эйхенхауэра. Хиббс утверждал, что вместо всех этих показателей главным критерием выступает довольно туманная экономическая переменная, названная им «реальным располагаемым доходом на душу населения».
Какие результаты показала эта модель? Она предсказала убедительную победу Ала Гора с перевесом в девять пунктов. Однако выборы после пересчета голосов во Флориде выиграл Джордж У. Буш. Гор доказал свою популярность, однако из модели следовало, что результат будет совершенно иным. Согласно ей, вероятность тех событий, которые произошли на самом деле, составляла лишь 1 к 80{178}.
Аналогичный подход был использован и в некоторых других моделях. Их создатели утверждали, что смогли свести столь сложный вопрос как президентские выборы, к формуле с двумя переменными (как ни странно, никто из авторов не использовал одни и те же две переменные). Некоторые из них показали еще более неточные результаты, чем метод Хиббса. В 2000 г. одна из этих моделей предсказала победу для Гора с перевесом в 19 пунктов, а шансы на реальный исход составили, согласно ей, всего один к миллиарду{179}.
Такие модели стали популярными после выборов 1988 г., когда казалось, что фундаментальные показатели на стороне Джорджа Х. У. Буша – экономика пребывала в хорошем состоянии, а уровень популярности республиканского предшественника Буша, Рональда Рейгана, был достаточно высоким, – однако результаты опросов говорили о предпочтении Майкла Дукакиса до последних дней гонки{180}. В конечном счете, Буш одержал легкую победу.
Поскольку эти модели были доступны широкой публике для изучения, их последующие результаты оказались не менее плачевными. В среднем в ходе пяти президентских выборов после 1992 г. типичная модель, основанная на «фундаментальных факторах», – то есть модель, игнорирующая результаты опросов и заявляющая, что способна определить поведение избирателей без их учета, – ошибалась в величине разрыва между основными кандидатами почти на семь пунктов{181}. Модели, основанные на «лисьем» подходе, то есть совмещавшие экономические данные с данными опросов и других источников информации, показали более надежные результаты.
Взвешивайте качественную информацию
Все эти чудодейственные модели прогнозирования провалились, даже несмотря на то что они были количественными и основывались на опубликованной экономической статистике. К количественным относятся и некоторые из самых неудачных прогнозов, описанных мной в этой книге. Например, модели рейтинговых агентств, которые должны быть точными и использовать управляемые данные[27], оценивали вероятность дефолта, учитывая невыполненные обязательства. Эти модели были неверными и опасными, поскольку основывались на довольно своекорыстном допущении, заключавшемся в том, что риск дефолта для различных закладных не зависит друг от друга, но это предположение не имело никакого смысла при образовании пузырей на рынках жилья и кредитов. Сразу скажу, что я предпочитаю при создании своих прогнозов именно количественный подход. При этом «ежи» берут любую информацию и используют ее для подкрепления своих предубеждений, а «лисы», умеющие взвешивать различные типы информации, могут извлечь немалую пользу из сочетания качественных и количественных факторов.
Очень мало найдется политических аналитиков, имеющих такое большое количество свидетельств успеха, как дружная команда, управляющая Cook Political Report. Эта группа, созданная в 1984 г. гениальным Чарли Куком, круглолицым уроженцем Луизианы, почти неизвестна за пределами вашингтонских политических кругов. Однако истинные любители политики годами полагаются на прогнозы Кука, и у них редко возникают основания испытать разочарование.
Кук и его команда работают над реализацией одной конкретной миссии – предсказать исход выборов в США, в частности в Конгресс. Это значит, что они выдают прогнозы для всех 435 избирательных кампаний в Конгресс США, а также примерно для 35 кампаний по выборам в Сенат США, проходящих раз в два года.
Предсказание исхода выборов в Сенат или губернаторских выборов – процесс сравнительно простой. Обычно кандидаты достаточно хорошо известны избирателям, а самые важные кампании привлекают широкое внимание и оцениваются многими уважаемыми аналитиками. В этих обстоятельствах представляется довольно сложным предложить более хороший метод объединения результатов опросов, наподобие предложенного мной в модели FiveThirtyEight.
Однако выборы в Конгресс – это совсем иное дело. Кандидаты часто появляются практически из ниоткуда – то могут быть члены городских собраний или владельцы небольших бизнесов, решившие попробовать себя в национальной политике. В некоторых случаях они почти неизвестны избирателям еще за несколько дней перед выборами. При этом избирательные участки размещаются буквально в каждом уголке страны, что сопровождается проявлением огромного количества демографических особенностей. Зачастую опросы на избирательных участках в Конгресс не происходят, а даже если это и бывает, то крайне несистемно и запутанно{182}.
Но это не значит, что у аналитиков типа Кука нет вообще никакой информации. На самом деле ее можно найти в изобилии: помимо результатов опросов имеются и демографические сводки по району, и информация о том, как его избиратели голосовали на прошедших выборах. Существуют данные и об общих тенденциях и склонностях к предпочтению той или иной партии по всей стране (в том числе рейтинги одобрения тех или иных кандидатов в президенты). Есть информация и о том, сколько собрано средств, так как об этом партии должны подавать детальную отчетность в Федеральную избирательную комиссию.
Другие типы информации носят более качественный характер, но тем не менее могут быть потенциально полезными. Может ли кандидат считаться хорошим оратором? Насколько пересекается его платформа с особенностями избирательного района? Какой тип рекламных роликов он использует? Политическая кампания представляет собой, по сути, небольшой бизнес, и важный вопрос состоит в том, насколько хорошо кандидат управляет людьми.
Разумеется, если бы вы были «ежом», не умеющим тщательно взвешивать информацию, она бы вся показалась вам лишь источником дополнительных проблем. Однако компания Cook Political имеет немалый опыт в создании прогнозов, а ее прогнозы довольно часто оказываются правильными.
Cook Political оценивает предвыборные кампании по семибалльной шкале, начиная от «Солидного преимущества республиканцев» (это означает, что данную кампанию почти гарантированно выиграет республиканский кандидат) до «Солидного преимущества демократов» (с обратным исходом). За период между 1998 и 2010 гг. кампании, отнесенные Cook к группе «Солидное преимущество республиканцев», действительно были выиграны республиканскими кандидатами 1205 раз из 1207 – то есть более чем в 99 % случаев. Аналогично, кампании, которые они отнесли к группе «Солидное преимущество демократов», были выиграны демократами в 1226 из 1229 случаев.
Большинство кампаний, которые Cook относит к группам «Солидного преимущества», происходят в районах, где одна и та же партия каждый год выигрывает со значительным перевесом, – их исход несложно предсказать. Однако Cook Political удается добиваться отличных результатов даже тогда, когда в ходе кампаний прогнозирование результатов требует значительно более серьезных навыков. Например, кампании, которые можно было назвать «склоняющимися» в сторону республиканских кандидатов, были выиграны республиканцами примерно в 95 % случаев. Аналогичным образом, «склоняющаяся» в сторону демократов кампания приводила к выигрышу демократов в 92 % случаев{183}. Более того, Cook удается спрогнозировать правильный результат даже тогда, когда он расходится с такими количественными индикаторами, как опросы{184}.
Я посетил офис Cook Political в Вашингтоне в сентябре 2010 г., примерно за пять недель до ноябрьских выборов, и провел несколько часов в обществе Дэвида Вассермана, кудрявого мужчины в возрасте за 30, отвечающего в компании за прогнозы, касающиеся выборов в Конгресс.
Самое уникальное свойство принятого у Cook процесса связано с интервью кандидатов. Во время предвыборных кампаний дверь на пятый этаж комплекса «Уотергейт», где располагаются офисы Cook, буквально не закрывается. Кандидаты приезжают туда на часовые беседы в промежутках между мероприятиями по сбору денег и стратегическими совещаниями. В день моего визита у Вассермана было назначено три таких интервью. Он предложил мне принять участие в одном из них – с республиканским кандидатом по имени Дэн Капанке.
Капанке надеялся обойти своего основного конкурента – демократа Рона Кайнда – в третьем избирательном районе штата Висконсин, представляя несколько небольших поселений в юго-западной части штата. Cook Political оценивал состояние в этом районе как «Возможную победу демократов». Это означало, что они дают Капанке лишь небольшие шансы на победу и размышляют о переводе района в более сильную категорию – «Предпочтение демократам». Капанке, сенатор штата, управлял небольшой компанией, производившей вспомогательное оборудование для сельского хозяйства. По виду и манерам он напоминал школьного учителя физкультуры. У него был сильный местный акцент: когда он произносил название местной бейсбольной команды La Crosse Loggers, я никак не мог разобрать, говорит ли он о «logger» (дровосеках) или «lager» (пиве). Стоит отметить, что для бейсбольного клуба из Висконсина в принципе подходили оба названия. В то же самое время прямота помогала ему компенсировать недостаток очарования – и он раз за разом получал свое место в сенате штата в районе, который обычно голосовал за демократов{185}.
Вассерман использует в интервью подход профессионального игрока в покер. Он держит каменное лицо и ведет себя безупречно с профессиональной точки зрения, однако подспудно пытается вызывать у кандидата напряжение, позволяющее больше о нем узнать.
«Моя базовая техника, – говорил он, – состоит в том, чтобы сформировать комфортные и дружеские отношения с кандидатом в самом начале интервью, в основном заставляя их рассказывать о том, откуда они родом. Затем я пытаюсь задать более нацеленный вопрос. Назовите тот вопрос, по которому вы не согласны с лидерами своей партии. Цель состоит не в том, чтобы дать им раскрыться, а в том, чтобы лучше почувствовать их стиль и подход».
Интервью с Капанке следовало тому же шаблону. Тот факт, что Вассерман знает кучу нюансов и деталей политической географии, заставляет его казаться местным уроженцем, и Капанке был счастлив поговорить об особенностях своего района – о том, как много голосов избирателей ему нужно выиграть в Ла-Кросс, чтобы компенсировать потерю в О-Клер. Однако он начал запинаться после серии вопросов, связанных с обвинением в том, что он использовал переданные ему лоббистами средства на покупку нового освещения для стадиона «Loggers»{186}.
Это была мелочь; Капанке не обвиняли ни в измене жене, ни в махинациях с налогами. Однако этого было достаточно для того, чтобы убедить Вассермана изменить рейтинг{187}. Капанке действительно проиграл выборы в ноябре того года, отстав от лидера примерно на 9500 голосов, хотя республиканцы в целом выиграли выборы в большинстве подобных районов на Среднем Западе.
Это происходит не так уже часто; Вассерман обычно сохраняет тот же рейтинг после интервью. Несмотря на то что он пытается получить как можно больше новой информации из кандидатов, часто та оказывается не настолько важной, чтобы заставить его изменить мнение.
Подход Вассермана работает, поскольку он способен оценить полученные сведения, не поддаваясь очарованию сидящего перед ним кандидата. Многие менее способные аналитики могли бы чрезмерно открыться перед людьми, пытающимися их очаровать или обмануть, или какими-то еще путями потерялись бы в рассказах о кампании. Или же они могли влюбиться в собственное представление о том, как будет вести себя кандидат в ходе интервью, и полностью игнорировать всю другую информацию, связанную с кампанией.
Вместо этого Вассерман рассматривает все в более широком политическом контексте. Отличный кандидат от демократической партии, умело отвечающий на вопросы в ходе интервью, может не иметь никаких шансов в районе, где республиканец обычно побеждает с опережением на 20 пунктов.
Так для чего вообще тратить время на интервью с кандидатами? Чаще всего Вассерман ищет так называемые красные флаги. Например, конгрессмен-демократ Эрик Масса (который позднее был вынужден с позором уйти из Конгресса после обвинений в сексуальных домогательствах к сотруднику-мужчине) постоянно пытал Вассермана о том, сколько тому лет. Психолог Пол Меель называет такие случаи «примером сломанной ноги» – то есть ситуациями, в которых нечто становится настолько заметным, что будет глупо не принимать это во внимание{188}.
Способность улавливать подобные сигналы несколько раз в год помогает Вассерману улучшить прогнозы по тем или иным кампаниям. Он способен взвешивать информацию, получаемую в ходе интервью, без чрезмерного внимания к ней (что могло бы привести к ухудшению прогнозов). Не так важно, какая количественная или качественная информация к вам поступает, – гораздо важнее, каким образом вы ее используете.
Быть объективным непросто
В этой книге я очень тщательно подхожу к использованию понятий объективное и субъективное. Порой слово объективное ассоциируется с количественным, но это не всегда так. Напротив, оно означает способность не ограничиваться нашими личными предубеждениями и изучать истинное положение дел с той или иной проблемой{189}.
Абсолютная объективность всегда желательна, но недостижима в этом мире. Создавая прогноз, мы можем выбирать любой из множества различных методов. Некоторые из них, например опросы, основываются исключительно на количественных переменных, а другие подходы (например, подход Вассермана) могут принимать во внимание и качественные факторы. Однако все они приводят к принятию решений и выдвижению предположений специалистом по прогнозированию.
Везде, где имеется человеческое суждение, возможно и появление предубеждений. Чтобы стать более объективным, нам стоит признавать влияние, которое имеют наши предположения на прогнозы, и критически к ним относиться. И это может оказаться особенно сложным (особенно если учитывать наши собственные идеологические убеждения и сложности процесса создания связного повествования из данных) в областях с высоким уровнем шумов.
Поэтому вам придется принять на вооружение привычки некоторых ученых, которых можно увидеть в телевизионных передачах. Вам нужно научиться выражать – и оценивать количественным образом – неопределенность своих предсказаний. Вам понадобится корректировать свой прогноз по мере изменения фактов и обстоятельств. От вас потребуется признать необходимость видеть мир с разных точек зрения. Чем больше вы захотите это делать, тем легче вам будет оценивать огромные массивы информации без искажений и злоупотреблений.
Короче говоря, вам нужно научиться думать как «лиса». Прогнозист-«лиса» признает ограниченность человеческого суждения в попытках предсказания развития мира. И знание об этой ограниченности помогает ему создавать больше правильных предсказаний.
Глава 3
Все, что меня интересует, – это победы и поражения
Настроение игроков бейсбольной команды Red Sox было отвратительным. Они только что вернулись из Нью-Йорка, где проиграли все три игры серии ненавистным соперникам – команде Yankees, что лишило их всех шансов на выигрыш титула чемпионов Восточного отделения Американской лиги[28] в 2009 г.
Если учитывать, что в рамках официальных соревнований оставалось всего лишь семь игр, команда Red Sox была практически уверена, что сможет выйти в плей-офф, получив доступ в него от руководства Американской лиги[29]. Однако ни команда, ни ее руководители не хотели завершать сезон подобным образом. Хотя статистические исследования и показывают, что успешное или неуспешное завершение официального периода соревнований никак не сказывается на результатах команд в плей-офф{190}, игроки Red Sox почувствовали, что это не их год.
Я направлялся в Фенвей-парк[30], чтобы поговорить со звездой Red Sox – игроком второй базы[31] Дастином Педройя. Он был одним из моих самых любимых бейсболистов еще с 2006 г., когда PECOTA (система прогнозирования, разработанная мной для организации Baseball Prospectus) предсказала, что он станет одним из лучших игроков в бейсбол. Предсказание PECOTA противоречило мнению многих скаутов, считавших Педройю «недостаточно развитым физически»{191}, критиковавших его за неправильную осанку и слишком широкий замах битой и приходивших к выводу, что он будет довольно посредственным игроком. Если PECOTA оценивала в 2006 г. Педройю как четвертого в списке потенциальных звезд бейсбола{192}, то издание Baseball America, традиционно уделяющее большое внимание точке зрения скаутов, поместило его на 77‑е место. И подобное отношение к этому игроку было распространено достаточно широко{193}. Взять хотя бы отчет Кита Лоу из ESPN[32]{194}, составленный в самом начале карьеры Педройи:
Дастин Педройя не обладает ни силой, ни той скоростью удара, которые позволили бы ему оказаться в основной лиге, и ему недостает мощности. Если его показатель результативности (хит[33]) будет на уровне 0,260, то он сможет оказаться полезным, и, возможно, у него появится какое-то будущее в роли запасного игрока на внутреннем поле – если только он перестанет постоянно перебегать на третью базу и ловить там мячи.
Лоу опубликовал этот комментарий 12 мая 2007 г. На тот момент показатель результативности Педройи составлял 0,247, и на его счету был лишь один хоумран[34]{195}. По правде говоря, я тоже начал утрачивать веру; внимательно понаблюдав за тем, как Педройя «выходит к бите», я начал думать, что он слишком переоценен[35].
Однако, будто пытаясь доказать неправоту тех, кто в нем сомневался, Педройя начал творить чудеса. В течение следующих 15 игр он достиг невероятного показателя – 0,472, в результате его среднее значение, снизившееся до 0,158 в апреле, поднялось до 0,336.
В июле, через два месяца после отчета Лоу, Педройя вошел в состав «Звездной команды» Американской лиги. В октябре он помог Red Sox стать победителями ежегодного чемпионата – World Series[36] – во второй раз с 1918 г. В ноябре того же года он был назван «Новичком года». А в следующем сезоне 24-летний Педройя получил награду «Самый ценный игрок» как лучший в Американской лиге. Теперь он уже был не запасным игроком, а суперзвездой. Скауты серьезно его недооценили.
Я отправился в Фенвей, поскольку хотел понять, что же заставило Педройю так измениться. Я подготовил целый список вопросов, а Red Sox выдала мне пресс-карту и обеспечила доступ на поле. Я знал, что это будет непросто. Игровое поле основной лиги – это настоящее святилище для игроков и уж точно не лучшее место для проведения интервью. Игроки Red Sox после неудачных игр были напряженными и раздраженными.
Я стал наблюдать за тренировавшимся на поле Педройей. Он ловил мячи Кевина Юкилиса, неповоротливого игрока третьей базы, и перебрасывал их новому подающему – игроку первой базы Кейси Кочману. Мне стало ясно, что в нем что-то изменилось. Движения Педройи были точными, в отличие от Юкилиса и Кочмана, внимание которых казалось рассеянным. Но главное отличие проявлялось в его отношении к происходившему – Педройя раздраженно бросал мяч по всему внутреннему полю и выглядел недовольным отсутствием сосредоточенности на игре у своих товарищей по команде.
Прошло примерно 15 минут, тренировка закончилась, и Red Sox уступила внутреннее поле своим соперникам – команде Toronto Blue Jays. Я стоял около первой базы, в паре метров от дагаут[37] Red Sox, и Педройя прошел прямо мимо меня. Скауты были правы, когда говорили о его осанке. Официальный рост Педройи – около 178 сантиметров (примерно, как и мой), однако он казался на несколько сантиметров ниже. Скауты были правы, и когда отмечали его совершенно не атлетическое сложение. В свои 25 лет Педройя уже начал заметно лысеть, и на его груди было практически столько же волос, что и на голове, а из-под майки выступало заметное брюшко. Встретив его на улице, вы могли бы принять его за сотрудника видеопроката.
Педройя прошел в дагаут и сел там на скамейку в одиночестве. Это показалось мне идеальным моментом, чтобы начать разговор, поэтому я собрался с силами и подошел:
«Привет, Дастин, у вас найдется минутка?»
Педройя подозрительно смотрел на меня в течение пары секунд, а затем заявил – максимально снисходительно и выделяя каждое слово: «Нет. Не найдется. Я готовлюсь к серьезной игре».
Я несколько минут побродил по полю, пытаясь утешить оскорбленное самолюбие, а затем направился в ложу для прессы, чтобы понаблюдать за игрой.
На следующий день, после того как действие моих «верительных грамот» истекло, я вернулся в Нью-Йорк и отправил своего друга Дэвида Лаурилу, моего бывшего коллегу по Baseball Prospectus и опытного интервьюера, с разведывательной миссией. Я хотел понять, сможем ли мы вытащить из Педройи что-нибудь полезное. Педройя был не особенно разговорчив, однако подарил Лаурилу отличную фразу для цитирования. «Знаете что? Меня нисколько не беспокоят цифры и статистика, – заметил он в беседе с Лаурилой. – Все, что меня интересует, – это победы и поражения. Все остальное не важно».
Педройя научился использовать в разговоре подобные клише после того, как когда-то решил отойти от политики, чем и вызвал немалые проблемы на свою голову. Это произошло, когда он назвал свой родной город Вудленд, штат Калифорния, «свалкой»{196}. «Можете так и написать, – сказал Педройя репортеру журнала Boston. – Мне это по фигу».
Ему было по фигу. Я понял, что если бы Педройя относился к жизни как-то иначе, то стал бы думать о том, что напишут о нем скауты в своих отчетах, и никогда не смог бы пробиться в основную лигу.
Создание системы прогнозирования для бейсбола
Сколько я себя помню, я всегда был фанатом бейсбола и бейсбольной статистики. Когда мне было шесть лет, команда из моего города – Detroit Tigers – выиграла World Series в 1984 г. Будучи маленьким математическим вундеркиндом, я очень интересовался цифрами, связанными с игрой. В семилетнем возрасте я купил свою первую бейсбольную карточку, в 10 – прочитал первый выпуск Elias Baseball Analyst, а в 12 лет начал создавать свои собственные статистические таблицы (довольно странные – по моим данным выходило, что не полностью проявивший себя игрок Red Sox Тим Найринг был чуть ли не лучшим по итогам нескольких игр).
Мой интерес достиг своего пика в 2002 г. В это время Майкл Льюис напряженно работал над книгой «Moneyball», которой было суждено вскоре стать национальным бестселлером. В этой книге приводилась хроника жизни команды Oakland Athletics и рассказывалось о ее умеющим использовать статистические данные менеджере Билли Бине.
Примерно в то же время на должность консультанта Red Sox был приглашен Билл Джеймс, который 25 годами ранее открыл эру «Sabermetric»[38], начав публиковать альманах под названием «Bill James Baseball Abstract». Нездоровая одержимость бейсбольной статистикой внезапно оказалась чем-то бо́льшим, чем простое хобби, – и как только я это понял, то сразу же принялся искать новую работу.
В течение двух лет после окончания колледжа я жил в Чикаго и работал консультантом по трансфертному ценообразованию в бухгалтерской компании KPMG. Работа довольно неплохая. Мои начальники и коллеги оказались дружелюбными и профессиональными, зарплата вполне достойной, и я чувствовал себя в безопасности.
Однако мое личное представление о по-настоящему вдохновляющей работе заключалось отнюдь не в том, чтобы рассказывать клиентам, как устанавливать цены на фабрике по производству телефонов в Малайзии, чтобы снизить размер налогов, или отправляться в шесть часов утра на самолет в Сен-Луи, чтобы оценить качество контрактов, использовавшихся в работе горнодобывающей компанией.
В этой работе было слишком мало риска, она оказалась чересчур разумной и рутинной для неугомонного 24-летнего человека, и мне стало скучно как никогда. Однако одно из ее преимуществ состояло в том, что у меня оставалась куча свободного времени. Поэтому в свое свободное время я начал создавать разноцветную таблицу, заполняя ее бейсбольной статистикой. Впоследствии именно она легла в основу PECOTA.
Во время учебы в колледже я также начал читать ежегодник «Baseball Prospectus», основанный в 1996 г. Гэри Хакебеем. Этот рыжий человек с неимоверными запасами энергии и сарказма пригласил на работу команду авторов новостной группы newsgroup rec.sport.baseball (бывшей в первые годы интернета авангардом статистического анализа спорта). Хакебей почуял возможность, которую предоставлял в то время рынок: Билл Джеймс перестал публиковать свои Abstracts в 1988 г., а большинство продуктов, призванных его заменить, либо были недостаточно хороши, либо прекратили свое существование во время длительных забастовок бейсболистов в 1994–1995 гг. Первый выпуск «Baseball Prospectus», опубликованный в 1996 г., распечатывался на лазерном принтере, из него по ошибке исчезла вся информация о клубе St. Louis Cardinals, и продано было всего 75 экземпляров. Однако у «Baseball Prospectus» быстро появились свои поклонники, а продажи начали расти в геометрической прогрессии практически каждый год.
«Baseball Prospectus» был настоящей сладостной мечтой любого фаната статистики. В нем собиралось неимоверное количество цифр, не только по игрокам основной лиги, но и по потенциальным игрокам, игравшим во второстепенных командах.
Тексты в бюллетене порой носили эзотерический характер, там часто упоминались герои мультсериала «Симпсоны», допускались шутки о полузабытых порнофильмах 1980‑х гг. и даже саркастические оценки нелюбимых издателем менеджеров различных команд.
Однако самыми важными публикациями этого издания были предсказания о том, как будет играть каждый игрок в следующем сезоне. Для этого Хакебей использовал созданную им самим систему под названием Vladimir. Казалось, что она будет следующим шагом в начатой Джеймсом революции.
Хорошая система бейсбольных прогнозов должна выполнять три основные задачи.
1. Принимать во внимание текущий статус статистики игрока.
2. Разделять навыки и удачу.
3. Понимать, каким образом изменяется результативность игрока по мере его взросления – эта закономерность известна под названием кривой старения.
Первая задача сравнительно проста. Бейсбольные соревнования, наиболее уникальные из основных американских видов спорта, всегда проводились на полях с нестандартными размерами. Среднему игроку значительно проще показывать хорошие результаты в уютном квадратном Фенвей-парке (контуры которого заданы компактными улицами Новой Англии), чем на напоминающем пещеру стадионе «Доджер», окруженном огромными парковками. Наблюдая за тем, как ведут себя игроки при игре дома и в гостях, мы можем рассчитать так называемый фактор парка, позволяющий учитывать степень сложности, с которой сталкивается игрок. Например, Фред Линн, основной игрок Red Sox в 1970‑е гг., добивался результата 0,347 во время игр в Фенвей-парке, но его результат на любом другом стадионе был равен лишь 0,264. Аналогичным образом, наблюдая за результатами игроков после перехода из Национальной лиги в Американскую лигу, мы можем довольно четко сказать, какая лига лучше, и оценить силу конкурентной позиции игрока.
Самый масштабный набор данных в мире
Решить вторую задачу – то есть разделить навыки и удачу – намного сложнее. Бейсбол выстроен таким образом, что в краткосрочной перспективе удача играет большую роль – даже лучшие команды проигрывают до трети матчей, и даже лучшие подающие не могут добраться до базы каждые три раза из пяти. Иногда удача не позволяет распознать подлинный уровень навыков игрока даже за целый год. Во время любого сезона бьющий, объективный результат которого 0,275, с вероятностью 10 % может добиться результата 0,300 и, соответственно, с той же вероятностью иметь результат 0,250. И это зависит только от одной лишь удачи{197}.
Хорошо продуманная система прогнозирования может оценить, какие статистические показатели сильнее зависят от удачи. Например, среднее количество попаданий битой по мячу более подвержено влиянию ошибок, чем количество хоумранов. Это особенно важно для питчеров[39], статистика которых невероятно непоследовательна. Если вы хотите предсказать, насколько успешной будет игра питчера, то вам стоит смотреть на количество страйкаутов[40] и уолков[41], а не на данные о его выигрышах и проигрышах в предыдущем сезоне, поскольку первый набор статистических данных выглядит более последовательным от года к году.
Как и при разработке любого прогноза, цель в данном случае состоит в выявлении основополагающей причины – выбивание в аут не позволяет отбивающим игрокам команды соперника добраться до базы, что, в свою очередь, не дает им получить дополнительные очки, а значит – и выиграть матч. Однако чем глубже вы копаете, тем больше шума окажется в системе: результаты питчера определяются не только качеством его ударов, но и факторами, которые он не в состоянии контролировать. Так, отличный питчер команды Seattle Mariners Феликс Эрнандес имел по итогам 2009 г. показатель выигрышей и поражений на уровне 19:5, а в 2010 г. этот показатель был 13:12 – и не потому, что Эрнандес плохо делал свою работу, а потому, что у Mariners’ в 2010 г. был на редкость неудачный состав подающих.
Подобные случаи происходят довольно часто, и если вы уделите изучению данных достаточно времени, то сможете найти их и сами. Пожалуй, именно бейсбол предлагает самый объемный массив данных в мире – практически все, происходившее на игровых полях основной лиги в течение последних 140 лет, скрупулезно и точно записывалось, а в крупных лигах играют сотни спортсменов. При этом, хотя бейсбол и считается командной игрой, матч строится в соответствии с четкой процедурой: питчеры по очереди сменяют друг друга, подающие «выходят к бите» один за другим. Поэтому игроки в значительной степени сами несут ответственность за свою личную статистику[42]. В игре возникает сравнительно немного проблем, связанных с чем-то комплексным и нелинейным. В ней просто выявить причинно-следственные связи.
Это значительно упрощает жизнь человеку, занимающемуся прогнозами в мире бейсбола. Гипотезы обычно можно проверить эмпирическим путем, что позволяет подтвердить или опровергнуть их с высокой степенью статистической достоверности. Что же касается прогнозирования в таких областях, как экономика или политика, где данные появляются значительно реже, – президентские выборы происходят один раз в четыре года, и нет возможности получать сотни новых данных ежегодно – вы не можете похвастаться столь же высокой степенью точности, и ваши прогнозы могут оказаться неверными значительно чаще.
Берегитесь – кривая старения!
Однако все, о чем шла речь выше, основывалось на предположении, что способности игрока не меняются год от года – и если бы мы только могли отделить сигнал от шума, то узнали бы все, что нам нужно. Но в реальной жизни навыки бейсболиста постоянно изменяются, и в этом кроется немалая проблема.
Изучив статистику по нескольким тысячам игроков, Джеймс обнаружил, что игра типичного из них{198} год от года совершенствуется до тех пор, пока его возраст не приблизится к отметке примерно в 30 лет, а начиная примерно с этого возраста навыки обычно начинают атрофироваться, что особенно заметно проявляется примерно к 35 годам{199}. И этот факт позволил Джеймсу сделать одно из самых значительных своих открытий – выявить кривую старения.
Гимнастки-олимпийки достигают пика своей карьеры в подростковом возрасте, поэты – после 30 лет; шахматисты – после 30{200}; экономисты – после 40{201}, а средний возраст CEO компаний из списка Fortune 500 равен 55 годам{202}. Игрок в бейсбол, как обнаружил Джеймс, достигает своего спортивного пика в возрасте 27 лет. У 60 % игроков из списка, включающего 50 самых известных бейсболистов, отмеченных наградами в период между 1985 и 2009 гг., возраст колебался в интервале между 25 и 29 годами, а возраст 20 % из них составлял ровно 27 лет. Именно в этом возрасте, судя по всему, возникает идеальное соотношение между физической и умственной формой, необходимой для игры (рис. 3.1).
Рис. 3.1. Кривая старения для подающего
Осознание этого факта – существование кривой старения – могло бы стать невероятно ценным для любой команды, ознакомившейся с работой Джеймса. В соответствии с принятыми правилами бейсболист не может стать профессиональным игроком, не связанным контрактом, до достаточно поздних этапов своей карьеры. Он получает право на этот статус, отыграв не менее шести полных сезонов в основной лиге (до этого момента он находится под полным контролем своего первого клуба и не может требовать у него полной оплаты по рыночным ставкам).
Поскольку типичный новичок оказывается в крупных лигах в возрасте 23 или 24 лет, он не может стать свободным игроком до 30-летнего возраста – то есть до того периода, когда пик его результативности уже минует. Команды платили многим профессиональным игрокам большие суммы в расчете на то, что они смогут оставаться столь же производительными, что и в возрасте до 30 лет; в реальности же их результаты обычно ухудшались, а поскольку контракты в главной бейсбольной лиге имеют определенные гарантии, у команды были связаны руки.
Однако кривая старения Джеймса рисовала слишком гладкую картину. Разумеется, средний игрок достигает пика в возрасте 27 лет. Но, как скажет вам любой человек, внимательно изучавший в детстве обратные стороны бейсбольных карточек, игроки стареют с разной скоростью. Боб Хорнер, третий бейсмен команды Atlanta Braves в 1980‑е гг., получил награду «Новичок года» в возрасте 20 лет и вошел в команду «Всех звезд», когда ему было 24 года; в то время многие считали, что он точно попадет в Зал бейсбольной славы. Однако к 30 годам, вследствие череды травм и неудачного перехода в команду Yakult Swallows японской лиги, он полностью покинул мир профессионального бейсбола. С другой стороны, великий Эдгар Мартинез из Seattle Mariners не имел постоянного контракта в крупных лигах до 27 лет. Однако ему все равно удалось пережить период расцвета своей спортивной карьеры, хотя и достаточно поздно – после 30 лет: и даже в 40 лет он возглавлял список лиги по количеству RBI[43].
Хотя случаи с Хорнером и Мартинезом и могут считаться исключением из правила, крайне редко уровень игры других бейсболистов изменяется в точном соответствии с гладкой траекторией кривой старения; скорее, нормой для них оказывается периодически нарушаемое равновесие взлетов и падений.
Реальные кривые старения наполнены шумом – причем значительным (рис. 3.2). В среднем они могут выглядеть довольно гладкими. Однако среднее подобно семье, имеющей 1,7 ребенка, – это всего лишь статистическая абстракция. Возможно, полагал Гэри Хакебей, в шуме есть сигнал, который не учитывала кривая Джеймса. Возможно, у игроков на сложных с точки зрения физических сил позициях навыки пропадают быстрее, чем у других. А возможно, карьера игроков, обладающих более атлетическим сложением, продолжительнее, чем у игроков, имеющих лишь один-два сильно развитых навыка.
Рис. 3.2. Вид кривых старения, на которых отражаются шумы, для различных подающих
На основе системы Хакебея была выдвинута гипотеза, согласно которой имеется 26 различных видов кривых старения, причем каждый из них применим к разным типам игроков{203}. Если Хакебей был прав, то появлялась возможность оценить, какая кривая в большей степени подходит для каждого игрока, и тем самым предсказать, как будет развиваться его карьера. Если кривая старения игрока была похожа на соответствующую кривую Боба Хорнера, то можно было бы ожидать, что пик его карьеры придется на более ранний возраст, а затем наступит раннее угасание. Если же его кривая больше напоминала кривую Мартинеза, то лучшие сезоны этого бейсболиста наступят в более зрелом возрасте.
Хотя системе Vladimir Хакебея и удалось сделать ряд правильных прогнозов, в целом она все же была ненамного более точной, чем медленные и устойчивые прогнозы Джеймса{204}, согласно которым одна и та же кривая старения применялась к каждому игроку. Отчасти проблема заключалась в том, что число 26 для количества категорий Хакебея было выбрано случайным образом, а для того, чтобы определить, к какой группе относится игрок, требовалось скорее искусство, а не наука.
Но, чтобы войти в число элитных игроков в бейсбол, человек должен обладать широким диапазоном физических и ментальных навыков: мышечной памятью, физической силой, координацией между глазами и руками, скоростью удара битой, распознаванием направления полета мяча и силой воли, позволяющей сохранять концентрацию даже в сложные для команды периоды. Понятие о существовании различных видов кривых старения, вытекающее из созданных системой Vladimir, казалось, более точно отражало всю сложность, присущую человеческой природе.
При разработке PECOTA я попытался заимствовать некоторые элементы у Хакебея, а некоторые – у Билла Джеймса. В выпуске Baseball Abstract за 1986 г. Джеймс представил так называемые оценки подобия, которые (как и предполагает их название) были призваны выявить статистическое подобие между статистикой карьеры любых двух игроков основной лиги. Концепция была сравнительно простой. Для начала каждому из двух игроков присваивалось по 1000 баллов, а затем при наличии между игроками различий по тому или иному параметру соответствующие баллы вычитались{205}. У игроков с высокой степенью подобия итоговый балл мог составлять 950 или даже 975, однако в других случаях расхождения накапливались достаточно быстро.
Оценки подобия могут оказаться невероятно полезными любому человеку с хорошим знанием истории бейсбола. Вместо того чтобы изучать статистику игрока в вакууме, специалисты могут оценить исторический контекст происходящего. Например, статистические результаты Педройи до достижения им возраста 25 лет были идентичны результатам Рода Кэрью, великого игрока из Панамы, возглавлявшего Minnesota Twins в 1970‑х, или результатам Чарли Герингера, звезде команды Tigers времен Великой депрессии. Оценки подобия Джеймса позволяют проводить ретроспективный анализ, предоставляя возможность оценивать прошлые события. Например, с его помощью можно проанализировать, насколько игрок заслуживает, чтобы его приняли в Зал славы.
Если вы считали, что ваш любимый игрок действительно заслуживает это, и могли увидеть, что это удалось 9 из 10 игрокам с идентичной статистикой, то у вас были все шансы верить в успех.
Но можно ли использовать оценки подобия и для предсказания? Например, если мы могли выявить сотню игроков, наиболее сопоставимых с Педройей по возрастным критериям, то в какой степени результаты этих игроков за всю карьеру могли подсказать нам, как будет развиваться карьера Педройи?
Меня заинтересовала эта идея, и так, понемногу, PECOTA начала свое существование в те долгие дни, которые я проводил в KPMG в 2002 г. Она приобрела форму гигантской и разноцветной электронной таблицы Excel. Этот выбор был довольно случайным, поскольку именно Excel был одним из моих основных рабочих инструментов в KPMG (каждый раз, когда мимо моего стола проходил кто-то из начальников, он предполагал, что я усердно тружусь над какой-то особенно сложной моделью для одного из наших клиентов{206}).
Постепенно, отнимая пару часов от работы и по нескольку часов от сна, я смог разработать базу данных, включавшую более чем 10 000 позиций «игрок – сезон» (я учел каждый сезон основной лиги, начиная со времен Второй мировой войны{207}). Кроме этого, я разработал алгоритм, позволяющий сравнивать любого игрока с другим. Алгоритм был чуть более сложным, чем алгоритм Джеймса, и предполагалось, что он сможет в полной мере воспользоваться изобилием данных, присущих бейсболу. В нем был заложен иной метод сравнения набора игроков, метод, называемый на техническом языке метод ближайшего соседа[44]. Также он учитывал более широкий набор факторов, включая рост и вес игрока, которые обычно принимаются во внимание лишь скаутами.
Как и система Хакебея, PECOTA предполагала, что различные типы игроков могут стареть по-разному. Однако я не стремился сопоставить игру каждого бейсболиста с одной из 26 кривых развития; более того, сопоставление происходило естественным образом с помощью поиска похожих игроков где-то далеко в статистической галактике бейсбола.
Если, допустим, обнаруживалось, что очень многие игроки, статистические параметры игры которых сопоставимы с данными Дастина Педройи, становились сильными игроками основной лиги, то это давало основания надеяться на успех и самого Педройи.
Однако чаще всего мне не удавалось найти однозначно сопоставимые результаты; пути игроков, имевших одинаковую статистику в определенные периоды их карьеры, могли значительно расходиться после этого. Я уже упоминал, что по оценкам подобия, созданным Джеймсом, Педройя был идентичен Чарли Гейгеру и Роду Кэрью, двум игрокам, имевшим долгую и яркую карьеру и попавшим в конце концов в Зал славы. Однако статистика Педройи за этот период была также идентична статистическим данным Хосе Видро, ничем не примечательного игрока второй базы команды Montreal Expos.
Еще сильнее различия могут проявляться у игроков низших лиг[45]. В 2009 г. среди игроков, которые выявила PECOTA для сопоставления с Джейсоном Хейвардом, 19-летним кандидатом на позицию в команде Atlanta Braves, можно было найти и участника Зала славы, и жертву убийства. Чиппер Джонс, один из близких по показателям к Хейварду игроков, был примером первого варианта. Это один из величайших игроков Atlanta Braves за все времена, он отыграл с клубом 17 сезонов, и его показатель результативности за всю карьеру в среднем составил 0,304. Он принес команде более 450 хоумранов. С другой стороны, система выдала мне имя Дернелла Стенсона, многообещающего молодого человека, чьи показатели были также идентичны цифрам Хейварда. В 2003 г. после одной из тренировочных игр в Аризоне неизвестные связали его, а потом застрелили, угнав при этом его внедорожник. Судя по всему, произошел случайный акт насилия.
Все сопоставимые с Хейвардом игроки были крупными, сильными спортсменами; они обладали множеством талантов, имели отличные задатки и демонстрировали развитие навыков при играх в небольших лигах. Однако судьба их сложилась совершенно по-разному. Инновационный характер PECOTA был призван признать этот факт: система выдавала диапазон возможных исходов для каждого игрока, основанный на прецедентах с сопоставимыми игроками. По сути, это были наилучший, наихудший и наиболее вероятный сценарий. Но нужно помнить, что каждый раз при попытках предсказать развитие человека нам придется сталкиваться с бесконечным диапазоном возможных исходов.
Пока что для Хейварда все складывалось ни шатко ни валко. После удачного для него 2009 г., когда он был назван «Игроком года в низшей лиге», Хейвард дебютировал в команде Braves в 2010 г. и обеспечил своей команде восемь хоумранов в первых 30 играх в основной лиге. После этого он вошел в состав «Звездной команды», превзойдя все ожидания. Однако сезон 2011 г. оказался для него более сложным, и его результат не превысил 0,227. Хорошая система статистического прогнозирования позволяет сохранять оптимизм даже после выступления Хейварда в сезоне 2011 г. – все его показатели были, по сути, теми же, если не считать результативности ударов по мячу, а этот показатель зависит от удачи значительно больше, чем другие.
Но может ли статистика сказать вам все, что вы хотите узнать об игроке? Десять лет назад эта тема была одной из самых обсуждаемых в мире бейсбола.
Можем ли мы все ужиться?
Довольно поверхностное, но распространенное мнение о книге «Moneyball» состоит в том, что это рассказ о конфликте между двумя конкурирующими группами – «статистиками» и «скаутами». Каждая из них полагалась при оценке результативности игроков на свою собственную парадигму (разумеется, статистики полагались на статистические методы, скауты – на «инструменты»).
В 2003 г., когда книга «Moneyball» была впервые опубликована, читатели Майкла Льюиса вполне могли оценить, насколько враждебными были отношения между двумя группами (нужно сказать, что и сама книга подливала масла в огонь). Когда я в том же году посетил ежегодное «Зимнее собрание» специалистов по бейсболу в гостинице Marriott в Новом Орлеане, мне показалось, что я вновь вернулся в школу. В одном углу можно было увидеть скаутов, которые, подобно буйволам в оазисе, цедили виски и обменивались историями о холодной войне, сгрудившись у стойки бара в гостинице. Часто они уходили в гостиничные номера и принимались за переговоры. Эти люди навсегда связали себя с миром бейсбола. Им было уже за 40, а то и за 50, многие из них были в прошлом спортсменами, которые внесли свой вклад в игру и теперь постепенно продвигались вверх в организационной иерархии.
В другом углу располагались «ботаники» – ребята в возрасте 20–30 лет, вооруженные ноутбуками и цветными распечатками. Они ходили кругами по холлу и пытались уговорить кого-нибудь из профессионалов старой школы взять их на работу. Между двумя лагерями практически не происходило никакого общения, и каждая сторона считала другую слишком высокомерной и косной.
Возможно, подлинный источник конфликта состоял в том, что представители старой школы воспринимали молодежь как угрозу своей работе, способную лишить скаутов значительной доли заработка. «Сейчас существует невероятно сильная конкуренция, – рассказывал Эдди Бейн, директор по скаутингу команды Anaheim Angels на круглом столе в рамках одной конференции, посвященной “Moneyball”{208}. – Некоторые из наших старых коллег теряют работу, которую, по нашему мнению, они должны были сохранить. Возможно, что сокращение штатов вызвано денежными проблемами. Однако мы связываем происходящее с влиянием разных компьютерных штук, и это нас возмущает».
До конца неизвестно, как много команд в реальности урезало бюджеты на скаутинг. Одной из них была Toronto Blue Jays, и она заплатила за это высокую цену, перенеся череду неудач в 2002–2005 гг. Однако уреза́ние бюджета было вынужденной мерой, вызванной спецификой работы корпоративного спонсора команды, компании Rogers Communications. Та пыталась противостоять ослаблению канадского доллара, поэтому случившееся отнюдь не было прихотью генерального менеджера компании, ученика Бина по имени Дж. П. Риккарди.
После публикации «Moneyball» прошло десять лет, и пламя прежней борьбы давно потухло. Успех Red Sox, выигравшей в 2004 г. титул чемпиона ежегодного чемпионата США по бейсболу впервые за 68 лет, был основан на подходе, уделявшем внимание как статистике, так и скаутингу. Команды, которые в 2003 г. можно было назвать исключительно «скаутинговыми» (например, команда St. Louis Cardinals), приняли на вооружение более аналитический подход и являются сейчас одними из лидеров в области спортивных инноваций. Команды со «статистическим» уклоном, такие как Oakland A’s, значительно увеличили свои скаутинговые бюджеты{209}.
Экономическая рецессия, продолжавшаяся с 2007 по 2009 г., способствовала дальнейшему развитию аналитических методов. Хотя бейсбол довольно хорошо перенес рецессию, внезапно буквально все прониклись идеями «Moneyball» и начали пытаться оптимизировать свои возможности в условиях ограниченных бюджетов{210}. На рынке не было дефицита в дешевой рабочей силе среди статистиков. Выпускники Гарварда и Йеля, специализировавшиеся на экономике и вычислительной технике, которые незадолго до этого времени планировали работать в инвестиционном банке и получать по 400 тыс. долл. в год, теперь с радостью отправлялись в Тампу или Кливленд и круглосуточно работали за десятую часть от этой суммы. Зарплата «компьютерного ботаника» в 40 тыс. долл. казалась куда лучшей инвестицией, чем 40 млн долл., выплачиваемых свободному агенту[46], прежние выдающиеся результаты которого постепенно снижались до средних.
Однако случившееся не было свидетельством безоговорочной победы статистиков. Если им и удалось доказать свою ценность, то это же удалось и скаутам.
PECOTA против скаутов – победа остается за скаутами
Изначально название PECOTA представляло собой аббревиатуру, расшифровывавшуюся как Эмпирическое сравнение питчеров и тестовый алгоритм оптимизации (Pitcher Empirical Comparison and Optimization Test Algorithm). Кроме того, эта аббревиатура повторяла имя Билла Пекоты, довольно среднего игрока внутреннего поля[47] команды Kansas City Royals, игравшего в 1980‑х гг. и доставившего немало неприятностей моей любимой команде Detroit Tigers[48].
Поначалу программа должна была оценивать результативность питчеров, а не подающих. Предсказать этот параметр невероятно сложно, поэтому после пары лет экспериментов с системой под названием WFG Baseball Prospectus оставил попытки и начал публиковать пустые поля для своих прогнозов по этой группе игроков. Я почуял возможность и показал PECOTA Хакебею. К моему удивлению, система понравилась и ему, и сотрудникам Baseball Prospectus; они предложили мне выкупить PECOTA в обмен на долю в Baseball Prospectus и при условии, что я создам аналогичную систему для бьющих (хитеров){211}. Я это сделал, и зимой 2003 г. в Baseball Prospectus был опубликован первый ряд прогнозов PECOTA.
По окончании сезона 2003 г. мы обнаружили, что PECOTA сработала немного лучше, чем другие коммерческие системы прогнозирования{212}. Фактически ежегодно с 2003 по 2008 г. наша система была не хуже конкурентов. Это демонстрировалось по итогам тестов – как наших, так и сторонних{213}. При этом нам удавалось показывать более четкие результаты, чем те, что использовались букмекерами в Вегасе{214}. Несколько успешных прогнозов помогли существенно укрепить репутацию системы. Например, в 2007 г. PECOTA предсказала, что Chicago White Sox – всего за два года до выигрыша титула в чемпионате – обеспечит себе по итогам сезона лишь 72 победы. Этот прогноз чикагских СМИ и руководство White Sox пытались опротестовать{215}. Однако он оказался правдивым – сезон для White Sox завершился именно так: 72 победы против 90 поражений.
Но уже к 2009 г. другие системы начали догонять, а то и опережать прогнозы PECOTA. Подобно тому как я заимствовал некоторые элементы системы у Джеймса и Хакебея, другие исследователи заимствовали ряд инноваций у PECOTA и добавляли к ним какие-то свои идеи. Некоторые из этих систем оказались очень хорошими. Если вы попытаетесь проранжировать лучшие прогнозы года по тому, насколько хорошо они предсказывали результаты игроков основной лиги, то разница между результатами лучших систем не будет превышать долей процента{216}.
Меня давно интересовала и еще одна цель, с которой можно использовать PECOTA, – прогнозирование результатов игроков низшей лиги, таких как Педройя. Это значительно сложнее. А поскольку в то время очень мало систем разрабатывалось с подобной целью, единственным реальным конкурентом были скауты.
В 2006 г. я впервые опубликовал список 100 лучших потенциальных игроков, по версии PECOTA, а также сравнил его со списком, созданным на основе работы скаутов и опубликованным в это же время в Baseball America. Игроки в списке PECOTA были проранжированы по величине возможного вклада в результат в течение следующих шести сезонов после вхождения в состав команд высшей лиги{217}.
Сезон 2011 г. стал шестым годом после публикации прогнозов, поэтому я мог провести корректное сравнение прогнозов и реальности. Хотя игроки в этом списке были сравнительно молодыми, данные давали довольно четкое представление о том, удалось ли им стать звездами, либо же они просидели основную часть сезонов на скамейке запасных или вообще покинули мир большого спорта.
По данным моего списка, Педройя оказался на четвертом месте в списке потенциальных звезд. Это был не единственный успешный прогноз PECOTA. Система дала высокую оценку Иену Кинслеру, который вообще отсутствовал в списке Baseball America; в реальности он вошел в состав двух команд «Всех звезд» и стал одним из ведущих нападавших команды Texas Rangers. PECOTA высоко оценила и Мэтта Кемпа, суперзвезду команды Dodgers, который в 2011 г. получил редкую награду – бейсбольную Тройную корону[49] (оценка, данная ему Baseball America, была значительно ниже моей).
Но доводилось ли вам слышать о Жоэле Гузмане? Дональде Мерфи? Йосемиро Пети? Возможно, нет, если только вы не подлинный фанатик бейсбола. PECOTA же посчитала этих игроков достаточно перспективными.
Свои упущения были и у Baseball America – скауты проявляли чрезмерный оптимизм в отношении Брэндона Вуда, Ластингса Милледжа и Марка Роджерса. Однако были и успешные прогнозы. Так, Baseball America отметила питчера Red Sox Йона Лестера, шорт-стопа[50] Rockies Троя Туловицки и аутфилдера[51] Baltimore Orioles Ника Маркакиса, все они имели довольно скромные статистические результаты в низшей лиге и вообще не были включены в список PECOTA.
Для статистического сравнения систем имеется достаточно большой объем данных. В частности, мы можем посмотреть на количество побед игроков в составе команд в каждом списке – например, на показательWARP[52]{218}. Этот показатель призван оценить, какой вклад вносит игрок любыми действиями: хитингом, питчингом и ловлей.
В течение 2011 г. игроки из списка PECOTA обеспечили 546 побед своим командам высшей лиги (рис. 3.3). Однако игроки из списка Baseball America показали еще более высокие результаты, обеспечив 630 побед. Хотя суждение скаутов иногда бывает искаженным, в данном случае оно оказалось полезным – их прогнозы оказались на 15 % лучше тех, что были сделаны на основе одной лишь статистики. Хотя такое различие может показаться не очень значительным, однако это не так. Бейсбольные команды готовы платить по 4 млн долл. за каждую удачную находку на рынке спортсменов-профессионалов, не связанных контрактом{219}. Таким образом, скауты обошли нас за этот период примерно на 336 млн долл.[53].
Рис. 3.3. Достижения кандидатов из списков 100 лучших потенциальных игроков, составленных в 2006 г. системой PECOTA и Baseball America, к 2011 г.
Предубеждения скаутов и статистиков
Конечно, было бы здорово, если бы список PECOTA оказался более точным, чем тот, что был составлен на основе мнений скаутов, но я не ожидал, что так может произойти. Через некоторое время после их публикации я написал{220}:
«Несмотря на то что мне было бы интересно взглянуть на противостояние скаутов и статистиков под новым углом, я не жду, что ранжирование, выполненное системой PECOTA, будет столь же точным, как рейтинги… создаваемые Baseball America».
Исходным «сырьем» для любой системы ранжирования служит информация – а если у вас была возможность изучить и скаутинговую, и статистическую информацию, значит, вы получили больше такого «сырья». Единственная возможность для чисто статистического подхода переиграть смешанный заключается в том, что вызываемые смешанным подходом предубеждения порой оказываются настолько сильными, что перевешивают преимущества.
Иными словами, скауты используют смешанный подход. Они имеют доступ к широкой информации, не ограничивающейся статистикой. И скауты, и PECOTA могут без проблем изучать личные достижения, или ERA[54] игрока; не имеющая предубеждений система типа PECOTA может немного лучше отсеивать какую-то часть шумов из этих данных и выдавать их в более правильном контексте. Однако скауты имеют доступ к огромным массивам информации, о которой PECOTA не имеет ни малейшего представления. Допустим, вместо того чтобы гадать о том, насколько велика сила броска питчера, они могут просто достать лазерный радар и замерить скорость мяча или же использовать секундомер, чтобы оценить, насколько быстро он перебегает с базы на базу.
Этот тип информации позволяет нам сделать еще один шаг в сторону глубинных причин того, что мы пытаемся предсказать. В низших лигах питчеры даже со слабой силой броска могут нащупать успешную зону; большинство противостоящих ему подающих довольно неумелы, поэтому он вполне может их переиграть. В высших лигах, где отбивающие способны парировать мяч, летящий со скоростью до 120 км/ч, шансы таких питчеров невелики. PECOTA может быть дезинформирована подобными данными, но это никогда не произойдет с умелым скаутом. И наоборот, скаут может выявлять игроков, обладающих талантом на уровне высшей лиги, для развития которых может потребоваться время.
Нужно, впрочем, отметить, что каждый раз, когда в процесс вовлекается человеческое суждение, возникает и потенциал для предубеждения. Как мы видели в главе 2, увеличение объема информации способно лишь ухудшить ситуацию для тех, кто неправильно относится к прогнозам и пытается навязать свою точку зрения на то, как устроен мир, вместо того чтобы попытаться познать истину.
Возможно, в эре, предшествовавшей «Moneyball», эти предубеждения играли на руку скаутам. Они могли уделять больше внимания эстетике игры, чем таланту игрока. Если свежие списки Baseball America можно считать очень хорошими, то списки начала 1990-х{221} были переполнены огромным количеством несбывшихся прогнозов – достаточно вспомнить таких превозносившихся игроков, как Тодд Ван Поппел, Рубен Ривера и Браен Тейлор, которым так и не удалось добиться серьезных результатов.
Однако свои предубеждения могут иметься и у статистиков. Одним из самых пагубных может считаться предположение о том, что все, что не поддается количественной оценке, не имеет большого значения. Например, в бейсболе измерять результативность защиты всегда было намного сложнее, чем эффективность броска или отбития мяча. В середине 1990‑х команда Oakland A’s не обращала особого внимания на защиту, и ее деятельность во внешнем поле направлялась довольно медлительными и неуклюжими игроками типа Матта Стрейерса, который, однако, мог считаться прирожденным подающим. По мере улучшения анализа действий защиты стало очевидным, что плохая защита команды стоила ей от восьми до десяти побед за сезон{222}. Это не позволяло им занимать достойные позиции в чемпионате вне зависимости от статистики удачных ударов по мячу. Бин уловил суть проблемы, и его новые и успешные команды имеют сравнительно хорошую защиту.
Подобные слепые места могут привести к еще бо́льшим проблемам, когда речь заходит о прогнозировании результатов игроков низшей лиги. Когда мы говорим об игроке высшей лиги, главный вопрос состоит в том, сможет ли он показывать такие же хорошие результаты, как в прошлом. Самые толковые системы статистического прогнозирования могут выявить восходящий или нисходящий тренд величиной всего в несколько процентных пунктов{223}. Однако если вы просто предположите, что игрок покажет примерно те же результаты, что и в два предшествовавших сезона, то несильно ошибетесь.
Однако бейсбол уникальным образом отличается от других основных профессиональных видов спорта – у него невероятно разветвленная система команд низшей лиги. Если у Национальной футбольной лиги официально вообще нет низшей лиги, а в состав низшей лиги NBA[55] входят всего несколько команд, то в бейсболе их 240 – по восемь для каждой родительской команды из высшей лиги. Кроме этого, если баскетболисты или футболисты могут стать видными профессионалами сразу же после колледжа или даже старших классов школы, то в бейсболе подобный мгновенный рост проявляется крайне редко. Даже самые талантливые игроки чаще всего играют в течение какого-то времени в Billings, Bakersfield или Binghamton перед тем, как перейти в команды основных лиг.
Довольно сложно предсказывать результаты этих игроков, поскольку мы надеемся, что они со временем смогут сделать что-то, на что пока не способны, – показывать хорошие результаты, играя в высших лигах. Можно легко представить себе, что уникальный по своему потенциалу игрок типа Брюса Харпера, лучшего подающего в стране, играющего в школьной лиге, попросту не выжил бы в противостоянии с питчером высшей лиги. Для игры на новом уровне ему нужно подрасти, стать сильнее, умнее и дисциплинированнее – а все это требует определенной комбинации упорного труда и удачи. Представьте себе, что вы заходите в обычный школьный класс, несколько дней наблюдаете за учащимися, а потом вас просят предсказать, кто из них станет успешным врачом, юристом и предпринимателем, а кто будет вынужден всю жизнь сводить концы с концами. Думаю, что вы изучили бы их оценки и посмотрели на то, у кого из них больше друзей, но в целом любые ваши выводы будут высосаны из пальца.
Тем не менее от многих скаутов-любителей (и любой статистической системы, имитирующей их действия) ожидается именно это. Хотя некоторые бейсболисты приходят в команды после колледжей, кое-кто попадает в них и во время учебы в школе, а процесс скаутинга начинается, когда те еще находятся в подростковом возрасте. Как и в любой другой группе молодых людей, в них будут играть гормоны и юношеский задор. Тела их продолжают расти и развиваться, а сами они постоянно подвергаются искушениям, связанным с выпивкой и влечением к противоположному полу. Только представьте себе, что вам нужно доверить весь свой бизнес кучке 19-летних парней.
Не только «Пять инструментов»[56]
Как писал Льюис в книге «Moneyball», Билли Бин был одним из тех игроков, кто имел потрясающий талант, но не смог этого понять; впервые попав в серьезную команду в 1980 г., он сыграл в высшей лиге всего 148 игр, а его средний результат за карьеру составил 0,219. Тем не менее Бин все равно попал в Зал славы, в отличие от других потенциальных кандидатов – типа Джона Сандерса, работающего в настоящее время скаутом для Los Angeles Dodgers.
Сандерсу удалось сыграть в серьезном матче, но лишь однажды, как это произошло и с Мунлайтом Грэмом, героем фильма «Поле его мечты» («Field of Dreams»). 13 апреля 1965 г., когда Сандерсу было 19 лет, команда Kansas City Athletics использовала его в качестве пинчраннера[57] в седьмом иннинге[58] игры против Detroit Tigers. Сандерсу не удалось сделать ничего особенного – последние два подающих внезапно покинули поле, и его заменили перед началом следующего иннинга{224}. Больше ему так и не довелось сыграть в высшей лиге.
Сандерс был достаточно талантлив. В годы учебы в школе в Небраске он входил в состав «звездной» команды по американскому футболу (1963), команды штата по баскетболу (1964), а также стал золотым призером в соревнованиях штата по метанию диска{225}. Возможно, что бейсбол даже не был его любимым видом спорта. Однако ему удавалось играть достаточно хорошо, и после выпуска из школы летом 1964 г. он получил, кроме диплома, и профессиональный контракт с командой A’s.
Однако дальнейшему развитию Сандерса помешало правило «Bonus Baby». До появления в 1965 г. новых правил формирования команд высшей лиги все игроки-любители были свободными спортсменами, и команды могли платить им любую сумму, которую бы только захотели.
Чтобы не позволить самым богатым командам перехватывать всех перспективных игроков, правило налагало серьезное ограничение – игроки, получившие значительную сумму при подписании контракта, должны были провести первые два профессиональных сезона в составе команды высшей лиги, даже если не были готовы при этом играть на соответствующем уровне{226}.
Это правило стало настоящим наказанием для блестящих новичков типа Сандерса. Большинство игроков, попавших под действие правила, были вынуждены почти все время сидеть на скамейке запасных и крайне редко выходили на поле в матчах высшей лиги.
Им не позволялось играть и приобретать опыт в то самое время, когда это было им более всего необходимо. Кроме того, им редко удавалось найти сочувствие у болельщиков и других членов команды, не понимавших, почему 19-летнему парню, сидящему на скамейке запасных, платят такие большие деньги. Хотя некоторым игрокам из команды Bonus Babies, например Сэнди Коуфаксу и Хармону Килбрю, удалось, завершив карьеру, попасть в Зал славы, многие другие талантливые игроки той эры так и не смогли сыграть в полную силу.
История Сандерса, возможно, лучшего спортсмена-любителя в штате Небраска, заслужившего упоминания в Baseball Encyclopedia, обеспечивает ему уникальное по своей глубине понимание души молодых игроков. Мне удалось поговорить с ним по телефону в момент, когда он направлялся из Северной Каролины в Джорджию, чтобы посмотреть матч одной из дочерних команд клуба Braves.
Если бы я встретил Сандерса на «Зимней встрече» 2003 г., проходившей в Новом Орлеане, то отнес бы его к группе «спортсменов». После завершения своей (недолгой) игровой карьеры он посвятил жизнь спорту. Однако сам Сандерс никогда не воспринимал игру как противостояние спортсменов и статистиков.
«Я люблю считать, – рассказал он мне. – Я всегда наслаждался статистическими выкладками еще в те дни, когда мы использовали калькуляторы или даже счеты».
Сандерс рассказал мне историю, которая произошла с ним: «Один из скаутов как-то сказал мне: “Давайте признаемся сами себе. Что мы делаем сразу после приезда на стадион? Мы идем в пресс-центр и получаем там статистику. Что в этом плохого? Именно так нам и надо работать”».
В реальности статистика была частью бейсбола с самого начала. Первые результаты матчей в газете с пятью категориями статистических данных для каждого игрока – количеством переходов, ударов, создания положений «вне игры», удачных передач и ошибок – были опубликованы Генри Чедвиком в 1859 г.{227}, за 12 лет до создания первой профессиональной лиги (1871). Многие споры в эпоху «Moneyball» были связаны не с тем, нужно ли использовать статистику, а с тем, какие именно данные следует принимать в расчет.
Например, такой показатель, как коэффициент попаданий на базу (OBP), которым на протяжении многих лет оперировали аналитики типа Джеймса, больше коррелирует с количеством пробежек, приносящих компании очки (а следовательно, и с выигрышами игр), чем среднее количество попаданий битой по мячу. Однако этот вывод очень долго не признавался представителями традиционных взглядов в этой сфере{228}.
Подобные споры обычно разворачивались на территории статистиков. Тот факт, что OBP содержит более полезную информацию, чем среднее количество попаданий по мячу, или что ERA питчера представляет собой более справедливый индикатор его успеха, чем соотношение побед и поражений, – это такие же научные факты, как тот, что Земля вращается вокруг Солнца. Разумеется, статистики были однозначно правы в своем отношении к этому показателю. Однако наличие сильного выигрышного аргумента заставило статистиков почивать на лаврах и слишком пренебрежительно относиться к другим, не столь очевидным разногласиям.
Чем дальше вы отходите от основных показателей – то есть чем больше вы пытаетесь предсказать, а не измерить результаты игрока, – тем менее полезной может оказаться статистика. Статистическая обработка показателей игроков более продвинутых уровней низшей лиги (таких как Double-A и Triple-A) позволяла делать прогнозы с почти той же степенью точности, что и для спортсменов высшей лиги.
Однако статистическая обработка данных участников, играющих на более низких уровнях низшей лиги, становится менее надежной, а цифры, полученные для игроков, учащихся в колледжах или школах, практически не имеют ценности с точки зрения предсказаний.
Традиционная альтернатива статистике, которой пользуются скауты, называется «Пять инструментов»: способность нанести особенно сильный удар, средняя результативность попаданий, скорость, сила рук и диапазон защиты. Этот список вызывал и вызывает изрядную критику. Так, в нем совершенно не учитывается так называемая Plate discipline, которая включает в себя уолки и страйкауты. Применение «Пяти инструментов» иногда приводит к тому, что создается обманчивое впечатление их одинаковой важности. В то же время в реальности возможность сделать по-настоящему сильный удар значительно важнее силы рук для игроков всех игровых позиций, кроме шорт-стопа и кэтчера[59].
Есть также основания считать, что «Пять инструментов» сами по себе не способны сказать нам слишком много. По мере того как игрок продвигается вверх по лестнице низшей лиги, эти инструменты должны все чаще отражаться в его статистике – либо ему не будет суждено двинуться еще выше. На самом деле некоторые из категорий как раз и являются статистикой – так, «средняя доля удачных ударов» представляет собой результат арифметического расчета; «способность нанести мощный удар» определяется количеством хоумранов и ударов, после которых бэттер успешно достигает второй базы. Если скаут говорит вам, что определенный игрок оценивается в 70 баллов по 80-балльной скаутинговой шкале с точки зрения потенциальной мощности удара, однако ему не удается сделать десять хоумранов в год для команды Altoona Curve, то сильно ли вы будете верить словам этого скаута?
Сандерс, подлинный ветеран спортивной индустрии, достаточно скептично относится к тому вниманию, которое уделяется «Пяти инструментам». «Влияние этого набора инструментов очевидно для всех. Они показывают, что некий игрок быстро бегает, хорошо бросает и все такое. Скауты могут прийти на стадион и увидеть все своими глазами, – рассказывал он мне. – Я думаю, что вопрос состоит в следующем – используются ли навыки достаточно эффективным образом для того, чтобы игроки выиграли матч? Превращаются ли результаты применения инструментов в полезные навыки? Разумеется, мы можем быстро понять, насколько велика скорость владения битой. Но если человек с высокой скоростью работы с битой не верит в себя, то от этого навыка нет никакой пользы».
Сандерс фокусируется скорее не на физических инструментах, а на более полезных для игры навыках. Та мера, в которой эти навыки могут быть переданы другим игрокам, зависит от того, что он называет ментальной панелью инструментов игрока. Ментальные инструменты часто развиваются медленнее, чем физические. Жена Сандерса, занимающаяся обучением детей с особыми потребностями, рассказала ему об исследовании, согласно которому большинство людей остается в ментальном подростковом возрасте примерно до 24 лет{229}. До наступления этого возраста Сандерс готов давать игроку определенное послабление, если замечает сигналы, свидетельствующие о развитии их ментальных инструментов. Но после достижения этого возраста ему нужны результаты. Интересно отметить, что 24 года – это примерно тот возраст, когда игрок оказывается в команде группы Double-A и его результаты становятся более предсказуемыми с точки зрения статистики.
У Сандерса нет никакого формального определения того, что именно должна включать ментальная панель инструментов игрока, однако в ходе нашего с ним разговора мне удалось выявить пять различных интеллектуальных и психологических способностей, которые, по мнению Сандерса, помогают предсказать успех на уровне высшей лиги.
• Готовность и преданность своему делу. Бейсбол не похож ни на какие другие профессиональные виды спорта, игры в которые происходят шесть или семь раз в неделю. Бейсболист не может «настроиться» на игровой день, как это делает футболист или баскетболист; он должен быть готов к работе на профессиональном уровне каждый день. Иными словами, ему необходим определенный уровень дисциплины. Сандерс любит приходить на стадион до начала матча, поскольку считает, что может лучше понять игрока во время предыгровых ритуалов, чем во время самой игры. Например, совершенно очевидно, что в тот сентябрьский вечер в Фенвей-парке Педройя был более сконцентрированным на игре, чем его коллеги. У него был свой метод подготовки, и он предпочитал не отвлекаться ни на что постороннее, в том числе и на какого-то неизвестного ему репортера, желавшего взять интервью.
• Концентрация и сосредоточенность. Хотя эти категории и связаны с готовностью, они имеет отношение к манере, в которой игрок ведет себя во время игры. Бейсбол представляет собой спорт, основанный на рефлексах. У подающего имеется примерно три десятых секунды, чтобы решить, в какую сторону закрутить мяч{230}; а игрок на внутреннем поле должен быстро реагировать на движение мяча сразу же после касания биты. «Если игрок не наполнен энергией, то я даже не знаю, что из него может получиться, – говорит Сандерс. – Я хочу, чтобы шорт-стоп, средний игрок на внутреннем поле, умел концентрировался при каждом ударе, а это умение не отражается в статистике».
• Конкурентоспособность и уверенность в себе. Хотя тот факт, что любой профессиональный спортсмен будет естественным конкурентом для других, и кажется само собой разумеющимся, бейсболисты должны преодолеть сомнения в себе и другие психологические препятствия на ранних этапах своей карьеры. Сегодня они – короли школы, а завтра уже колесят в автобусах между Каннаполисом и Гринсборо, читая в интернете статьи о своих неудачах сразу же после окончания игр. Видя, как талантливый игрок не выкладывается на полную, Сандерс постоянно задается вопросом: «Не пропадает ли желание игрока добиться успеха под действием неудач? Готов ли он потерпеть поражение? Имеется ли у него достаточно желания преуспеть для того, чтобы преодолеть страх неудачи?»
• Управление стрессом и принятие ситуации. В мире бейсбола даже лучшие подающие время от времени допускают ошибки, и каждый игрок так или иначе «спотыкается и падает» в течение сезона. Способность справиться с этой неудачей требует умения забывать и некоторой доли чувства юмора. Одна из излюбленных техник скаутинга Сандерса состоит в наблюдении за реакцией игрока после сложной или неудачной игры. «Я люблю наблюдать за подающим, когда он промахивается при броске. Для зрителей это кажется ужасным, но я радуюсь, видя улыбку на его лице. Потому что в следующий раз – бам! – он отправит мяч на расстояние в четыреста футов!» Эти навыки обретают особую важность, как только игрок попадает в высшую лигу, а значит, становится объектом пристального внимания со стороны болельщиков и СМИ.
• Адаптивность и обучаемость. Насколько эффективно может игрок обработать новую информацию во время игры? Слушает ли он советы тренеров? Как он адаптируется к изменениям жизненной ситуации? Что происходит, когда он переходит в другую команду или когда его просят поиграть на незнакомой позиции? Путь между любительскими и главными лигами редко бывает прямым, даже для самых потенциально талантливых игроков, поэтому ментальный подход великого игрока не может быть слишком жестким. «Игроки, добившиеся успеха в этой игре, – это люди, которые, поворачивая за угол здания, не просто срезают угол, а совершают еще и разворот на месте, – замечает Сандерс. – Это своего рода контролируемая интенсивность».
Разумеется, подобные навыки необходимы и представителям многих других профессий, о которых мечтают люди. Некоторые из них даже могут быть особенно важными для прогнозистов – особенно тот, который Сандерс называет адаптивностью. Как вы реагируете на новую информацию, когда она к вам поступает? Если вы слишком нервничаете и чрезмерно активно реагируете на изменение обстоятельств или, напротив, не желаете отказаться от своих привычных представлений, когда этого требуют объективные свидетельства, то дело неминуемо закончится плохими прогнозами.
При этом мало найдется таких профессий, в которых столь высок уровень конкуренции, как в бейсболе. Из многих тысяч профессиональных бейсболистов и сотен тысяч любителей лишь 750 человек могут играть в командах главных лиг в любой момент времени, а из них лишь несколько десятков войдет в «Звездную команду». Работа Сандерса состоит в поиске тех исключительных людей, которые не подчиняются законам вероятности. Его работа ненамного проще работы самих игроков, и он почти каждый день своей жизни проводит в пути (несмотря на то что ему уже почти 70).
Однако именно Сандерс обеспечивает команду Dodgers самой ценной информацией – информацией, которой нет у других.
«Информация» как новое название игры
Билли Бин, главный герой «Moneyball», считает неустанный сбор информации главным секретом хорошего скаутинга. «Кого мы называем хорошим скаутом? Того, кто способен раздобыть информацию, которую не могут найти остальные, – рассказывал он мне. – Познакомиться с парнем. Познакомиться с его семьей. Это лишь два из множества остальных действий, которые вы должны предпринять, чтобы больше узнать об этом человеке».
Бин знает, о чем говорит. Во многом успех его команды стал результатом хорошей статистической оценки игроков команды. Однако не менее важным для успеха был и скаутинг игроков-любителей. Мигель Техада, Джейсон Джамби, Барри Зито, Тим Ху, Эрик Чавес – иными словами, большинство звезд команды в начале 2000‑х годов (периода, описанного в «Moneyball») – были найдены клубом и получили в нем должное развитие.
Бин рассказал мне, что бюджет команды на скаутинг в наши дни выше, чем когда-либо прежде. Более того, по его словам, руководство команды увеличило его именно благодаря увлечению статистическим анализом. Как мы уже говорили выше, бейсболисты не могут приобрести статус свободного агента – профессионала, не связанного контрактом, – до конца полного шестого сезона, то есть до тех пор, пока им не исполняется по меньшей мере 30 лет.
Как показал проведенный Биллом Джеймсом анализ кривых старения, зачастую клубы тратят на свободных агентов слишком много денег – причем тогда, когда их лучшие годы уже оказываются позади.
Однако у этой медали есть и другая сторона – игрок может быть чрезвычайно полезным для клуба и до того, как ему исполнится 30 лет. Более того, экономика бейсбола структурирована таким образом, что более молодые игроки с хорошим потенциалом могут быть куплены за довольно небольшие деньги{231}.
Если рассматривать бейсбольную команду как любой другой бизнес, то есть с точки зрения прибыли и убытков, то почти вся ценность в нем создается в процессах скаутинга и дальнейшего развития. Если система прогнозирования в команде исключительно хороша, то команда может себе позволить платить по 10 млн долл. в год игроку, истинная ценность которого составляет 12 млн долл. Однако если скаутинг выстроен в команде по-настоящему хорошо, то появляется возможность найти хорошего игрока, которому можно платить всего 400 тыс. долл. И именно таким образом и строится конкуренция на небольшом рынке типа Окленда.
Поэтому не приходится говорить, что команде A’s недостает уважения к роли, которую в ней играют скауты. Более того, Бин четко дает понять, что, принимая решение о приглашении игрока в команду, менеджеры не стесняются изучать его психический склад.
Организация до сих пор в значительной степени верит в тщательный анализ. Однако тщательность и дисциплина проявляются в том, как организация обрабатывает ту информацию, что у нее имеется, а не в том, чтобы объявлять те или иные типы информации ненужными или неприменимыми.
«Пропорция объективного и субъективного анализа определяется в различных организациях по-разному, – пояснил мне Бин. – С нашей точки зрения, мы вынуждены принимать объективные решения, а не полагаться на свои чувства. Если мы, живущие в Окленде, примем правильное решение, основываясь на эмоциях, то лично я буду считать это случайностью. И мы просто не можем позволить себе принимать случайные решения и надеяться, что нам повезет. Если бы мы играли в блек-джек, у нас было бы шесть очков, а у дилера четыре, то мы точно знали бы, что для выигрыша нам понадобятся дополнительные карты».
Как мы заметили в главе 2, чтобы составить хороший прогноз, нам не стоит ограничиваться одной лишь количественной информацией. Скорее, мы должны уметь хорошо и правильно взвешивать информацию. В этом и состоит суть философии Бина – собрать максимально возможный объем информации, а затем очень тщательно и дисциплинированно проанализировать ее.
Лакмусовой бумажкой, позволяющей понять, насколько вы компетентны как прогнозист, является изменение качества ваших прогнозов: становятся ли ваши предсказания лучше при увеличении объема информации? Если же они становятся хуже, то можно сказать, что у вас имеются некоторые плохие привычки (как у политологов, прогнозы которых изучал Фил Тэтлок). Если Кандидат А имеет результат 0,300 с 20 хоумранами и раздает в свободные дни еду бездомным, а Кандидат B имеет результат 0,300 с 20 хоумранами, но при этом тусуется в свободное время в ночных клубах и употребляет кокаин, вы не сможете дать количественную оценку различиям между ними. Однако можете не сомневаться, что хороший прогнозист обязательно примет эту информацию к сведению.
Как показывает практика, преобразовать качественную информацию в количественную вполне реально[60]. Фактически скауты оценивают игроков по четкой цифровой шкале, варьирующейся от 20 до 80 в каждой категории. Нет никаких препятствий к тому, чтобы включить ее в статистическую модель вместе со средним количеством удачных попаданий битой по мячу{232} и посмотреть, повышает ли это качество прогноза. Некоторые команды, например Cardinals, уже это делают.
На самом деле грань между статистикой и скаутингом, а также качественной и количественной информацией в бейсболе стала довольно расплывчатой. Взять, например, внедрение Pitch f/x – системы трехмерных камер, которые сейчас уже установлены на каждом стадионе высшей лиги. Эти камеры способны измерять не только скорость полета мяча (это можно было сделать и раньше при помощью лазерных устройств), но и степень его колебаний в горизонтальной и вертикальной плоскостях, когда он подлетает к конечной цели. Например, мы можем, воспользовавшись статистикой, сказать, что Зак Грейнке, питчер из Milwaukee Brewers, ставший в 2009 г. лучшим молодым питчером в своей лиге, имеет лучшую скользящую подачу (слайдер) в бейсболе{233} или что Мариано Ривера действительно отбивает самые закрученные и быстро летящие мячи так хорошо, как говорят легенды{234}. Традиционно все эти вопросы считались вотчиной скаутинга; теперь же они представляют собой еще одну переменную, которую можно добавить в систему прогнозирования.
Мы совсем недалеки от того времени, когда в нашем распоряжении будет иметься трехмерная запись всего, что происходит на бейсбольном поле. Вскоре мы сможем в точности измерить, насколько высоко готов подпрыгнуть Джейкоби Эллсбери, чтобы поймать летящий над его головой мяч. Мы будем знать, насколько быстро Ичиро Сузуки бежит от одной базы к другой, или с какой скоростью Ядир Модина успевает перебросить мяч на вторую базу.
Эта новая технология неспособна будет убить скаутинг, как это не удалось и «Moneyball». Скорее, мы станем уделять больше внимания вещам, которым еще сложнее дать количественную оценку и в которых такая информация, как, допустим, ментальные способности игрока, оказывается еще более эксклюзивной. Но толковые скауты, к числу которых относится и Сандерс, уже находятся впереди.
Почему предрекали, что Педройю постигнет неудача…
Но почему же скауты так сильно ошибались, когда высказывали предположения о том, как будет развиваться спортивная карьера Дастина Педройи?
Мнения скаутов, основанные на базовой информации о нем, совпадали. Все знали, что Педройя был в среднем неплохим подающим, что он довольно толково ведет себя на поле и что его ментальные способности довольно «нестандартны». Все знали, что он обладает длинным свингом; что его защита стабильна, но в ней нет ничего выдающегося; что бегает он со скоростью не выше средней; что он – коротышка, обладающий не самым лучшим телосложением.
Однако это был довольно специфический набор качеств для молодого игрока, и многие скауты не знали, что с ним можно сделать. «При оценке игрока скауты примерно представляют, что хотят увидеть, – рассказал мне Сандерс. – Прототипы и стандарты. А Дастин во многом им противоречил, начиная с роста и фигуры».
Когда мы не можем вставить квадратный колышек в круглое отверстие, то часто виним колышек, хотя порой неспособность решить задачу связана с чрезмерной негибкостью нашего мышления. Прежде всего, мы инстинктивно пытаемся отнести информацию к той или иной категории. И обычно у нас имеется сравнительно небольшое количество категорий, поскольку тогда их проще отслеживать (достаточно вспомнить о том, как бюро переписи США делит людей из сотен этнических групп на шесть расовых категорий или о том, как критики относят тысячи музыкантов к представителям нескольких музыкальных жанров).
Чаще всего это может сработать. Однако когда у нас возникает проблема с категоризацией какого-то объекта, то мы часто не обращаем на него внимания или неправильно его оцениваем. Именно по этой причине Бин предпочитает избегать решений, основанных на том, что он «чувствует нутром». Слишком сильно полагаясь на первые впечатления, он рискует упустить из виду потенциально ценных молодых игроков – а с учетом бюджета команды он просто не может себе этого позволить.
Система, подобная PECOTA, позволяющая осуществлять поиск среди тысяч игроков и находить среди них людей с одинаковыми профилями, имеет более строгий способ категоризации игроков. Этот способ позволяет оценивать навыки людей, подобных Педройе, в более правильном контексте.
Поиск с помощью PECOTA позволил найти несколько интересных прецедентов. Оказалось, к примеру, что приземистость Педройи может быть предпочтительной характеристикой, с учетом других его навыков.
В бейсболе принято считать зоной страйка расстояние от плеч игрока до его коленей. Чем ниже спортсмен, тем меньше размер цели у питчера. Игрок типа Педройи, умеющий хорошо работать битой, может извлечь из подобной ситуации немало пользы.
Кроме этого, невысокий рост и близость к полю могут стать отличной характеристикой для защиты игрока второй зоны. Эта позиция на поле требует особой ловкости и кошачьих рефлексов, помогающих поймать мячи, только что изо всех сил отправленные в полет ударом биты. Из истории бейсбола мы знаем, что многие лучшие игроки второй зоны были невысокими. Из 17 участников Зала славы лишь двое – Нэп Ладжойе и Ранн Сандберг – имели рост выше 180 см{235}. Рост Джо Моргана (возможно, величайшего игрока второй базы всех времен) составлял чуть больше 170 см.
Скауты отлично делают свою работу, однако в этом случае они слишком быстро и со слишком высокой степенью предубеждения отнесли игрока к определенной категории. Маленький рост Педройи был в каком-то смысле его сильной чертой.
Тем не менее никто не может ничего гарантировать. Из прогноза PECOTA не следовало, что успех Педройи – очевидный факт, речь шла о том, что у него есть определенные шансы. Скауты считали, что шансов, скорее, у него недостаточно. Отличие, однако, состояло в том, что команда Red Sox верила в Дастина Педройю. И, к счастью для команды, в себя верил и сам Педройя.
…и как он выиграл вопреки всем прогнозам
Я познакомился с Биллом Джеймсом на встрече консультантов на фестивале, организованном журналом New Yorker, в октябре 2009 г. После официальной части началась угарная вечеринка, и этот человек сильно выделялся из толпы модников. Он был облачен в невероятно яркий свитер и сабо, которые казались на пару размеров больше, чем нужно. Пока все остальные участники вечеринки пытались добиться внимания Сьюзен Сарандон, мы устроились в баре и некоторое время поболтали{236}.
В Red Sox обязанности Джеймса достаточно разнообразны – и довольно конфиденциальны (в рамках официальной беседы он всячески воздерживался от деталей). После того как он в течение четверти века изучал бейсбол со стороны, можно было сказать, что в зрелом возрасте он несколько смягчился. Теперь спорт казался ему чем-то иным, чем в годы, когда он был внутри процесса; по словам Джеймса, он быстрее других распознает ментальные аспекты игры.
«В 80‑е годы я писал много чего, что потом оказалось неверным, – рассказывал он мне. – Одно из первых изменений было связано с тем, что у меня появились дети. Я знаю, что это клише, однако, когда у вас появляется свой ребенок, вы начинаете понимать, что и каждый человек вокруг вас – это тоже чей-то ребенок. И это – совершенно иной взгляд на людей. Пока вы растете, то воспринимаете всех этих людей как персонажей телешоу или видеоигр или героев на бейсбольных карточках – вы даже не задумываетесь, что все они – люди, которые делают лучшее из того, на что способны».
Я был поряжен, насколько были похожи комментарии Джеймса на те, что я слышал от Бина и Сандерса, хотя все эти люди смотрели на спорт под совершенно разными углами. Так, если бы вы положили рядом записи моих разговоров с Джеймсом, Бином и Сандерсом, то вряд ли могли бы понять, какая из них относится к конкретному собеседнику (если не принимать во внимание то, что разговоры с Джеймсом были на порядок забавнее). Джеймс признаёт, что скауты Red Sox имеют определенную ценность для клуба, и проводит параллель между своей и их миссией. В бейсболе успех измеряется довольно определенным образом – соотношением показателей W и L (выигрышей и проигрышей), – поэтому найти общую точку для соприкосновения достаточно несложно. Если повышение объема информации делает ваши предсказания хуже, то вам следует заняться чем-то другим, и уж точно вы не будете пожизненно заняты в McLaughlin Group.
«На определенном уровне и я, и скауты воспринимаем бейсбол одинаково, – рассказывал мне Джеймс. – Возможно, это можно сравнить с ситуацией, когда люди с крайне правыми и крайне левыми взглядами начинают говорить, по сути, об одном и том же. Скауты хотят увидеть то же, что пытаюсь увидеть я».
В 2004 г. Джеймс помогал Red Sox отбирать новых игроков. Он написал довольно положительный отчет о Педройе, однако порекомендовал команде взять кого-то другого. Тем не менее ему было приятно и то, что Педройя все же попал в команду, и то, что его результаты заставляли прежних критиков выглядеть идиотами.
Однако в самом начале карьеры Педройи было несколько моментов, когда даже самые большие его фанаты начали в нем сомневаться. Педройю пригласили для участия в играх высшей лиги в августе 2006 г. Он сыграл в 31 матче, однако его показатель попадания по мячу составил всего 0,198, и он всего шесть раз смог выбить мяч за пределы базы. Это никого не обеспокоило; Red Sox, в несколько непривычной для себя манере уже выбыла из соревнований в рамках плей-офф в последние недели сезона, и внимание всей Новой Англии переключалось на Celtics и Patriots. Однако в следующем году, когда Педройе уже была доверена вторая база, он начал сезон столь же медленно – после первого месяца игр его результат составил 0,172.
В этот момент Педройю уже могли бы выгнать из такой команды, как Cubs, до недавних времен славившейся своим довольно бессистемным процессом принятия решений. Во многих клубах каждое действие вызывает мощную и порой чрезмерную прямо противоположную реакцию. Однако Red Sox следует более дисциплинированному и систематическому подходу. И когда менеджеры Red Sox внимательно посмотрели на происходившее с Педройей в тот момент сезона, то, по словам Джеймса, они увидели кое-что, что им понравилось. Педройя не просто промахивался по мячу – он активно взаимодействовал с ним. И активность этого взаимодействия должна была рано или поздно привести к появлению какой-то новой тенденции.
«У каждого из нас возникает момент, когда мы теряем доверие к данным, – сказал мне Джеймс. – Возможно, вы это знаете и сами, но если вы посмотрите на данные предыдущего года, когда результат Дастина составил где-то около 0,180, то соотношение ударов и промахов у него находилось на уровне примерно 8–9 %. Это происходило именно в те весенние месяцы, когда ему было сложнее всего. Такой результат вполне закономерен – если вы замахиваетесь так же сильно, как он, то вы никогда в жизни не сможете обеспечить хороший контакт и показать результат выше 0,180».
Руководители команды Red Sox принимали решение о том, чтобы Педройя оставался в команде, не без сомнений. Они продолжали наблюдать за ним, чтобы понять, удается ли ему делать то, что приносило ему успех на любительском уровне. Если бы они решили оставить Педройю на скамейке запасных, то принятие его потребовало бы ничуть не меньших раздумий, чем решение о том, чтобы выпустить его на поле. Они не позволяли данным диктовать решения без рассмотрения более широкого контекста происходящего.
По словам Джеймса, единственное, что их беспокоило, было связано с тем, не начнет ли сам Педройя сомневаться в себе. И такой поворот событий был вполне вероятен для любого другого игрока, но только не Педройи, не переживающего ни из-за дураков, ни из-за критиков.
«К счастью, Дастин по-настоящему упрямый человек. Если бы он слушал всех этих людей, то почувствовал бы себя униженным, и это бы его просто уничтожило. Он же никого не слушал. Он копал свою яму, он отрабатывал замахи, и, в конечном итоге, все повернулось так, как он хотел».
Педройя обладает тем, что Джон Сандерс называет «памятью главной лиги», то есть быстро забывает то, что становится прошлым. Его не беспокоят отдельные неудачи, потому что он совершенно уверен в том, что играет правильно, а в долгосрочной перспективе значение имеет лишь это.
И он крайне нетерпим ко всему, что отвлекает его от работы. И становится не самым приятным в общении человеком, но именно это и дает ему возможность играть на второй базе за бостонскую команду Red Sox, а это – единственное, о чем заботится Педройя.
«Наши сильные и слабые стороны всегда взаимосвязаны, порой не самым явным образом, – сказал мне Джеймс. – Педройя смог превратить в силу то, что у других игроков является слабостью».
Реальные уроки «Moneyball»
«Как сказал Майкл Льюис, споры окончены», – заявил Билли Бин, когда мы с ним обсуждали «Moneyball». В течение какого-то времени «Moneyball» представлял немалую угрозу для людей, имеющих отношение к игре. Казалось, что на кон поставлена их работа и уровень жизни. Однако новая жизнь так и не наступила – компьютеры не стали полноценной заменой скаутам. В действительности спрос на знание о том, какое будущее ждет различные категории бейсболистов (знание, получаемое либо из отчетов скаутов, либо из статистических систем типа PECOTA), все же значительно превышает предложение. Каждый раз, когда команда размышляет над тем, кого брать в состав, кого обменять на другого игрока или сколько заплатить за свободных игроков, на кону стоят миллионы долларов – и исход будущего чемпионата. И чтобы принять правильные решения, команды все активнее используют все имеющиеся в их распоряжении инструменты.
Информационная революция внесла существенный вклад в мир бейсбола, при том что во многих других областях ее результаты оказались значительно более скромными. И причина тому – присущая бейсболу уникальная комбинация быстро развивающихся техник, хорошо сбалансированной системы стимулов, жесткой конкуренции и наличия огромных массивов данных.
Но это не делает жизнь Бина легче. В разговоре со мной он выразил изрядную озабоченность тем обстоятельством, что другие команды смогли скопировать лучшие трюки A’s. Например, немногие команды в наши дни не понимают всей важности OBP[61] или пренебрегают ролью защиты – но при этом у большинства из них, как и прежде, гораздо больше денег, чем у A’s.
В таких высококонкурентных областях, как спорт, лучшие прогнозисты должны постоянно использовать новые методы. Нет ничего сложного в том, чтобы поставить себе цель «пользоваться неэффективностью рынка».
Вот почему эта книга обходит стороной быстрые и легкие решения, но и не приводит план поиска примеров такой неэффективности. Они не позволят вам понять, действительно ли вам удалось нащупать что-то свежее и интересное, или же вы забрели в тупик. Маловероятно, что вы натолкнетесь на идею, которую никто другой не обдумывал. А еще сложнее – на хорошую идею, – и даже когда вы на нее натолкнетесь, пройдет совсем немного времени, и ее кто-нибудь скопирует.
Вот почему эта книга не рассказывает о быстрых решениях, в основе которых лежат лишь небольшие корректировки, дающие возможность предсказывать будущее лучше конкурентов. Хорошие специалисты в области инноваций обычно обдумывают ситуацию и масштабно, и в деталях. Порой новые идеи можно найти именно в деталях и тонкостях проблемы, на которые не обращают внимания другие. А порой их можно найти, когда вы начинаете совершенно абстрактно и философски размышлять о том, почему мир устроен определенным образом и возможна ли альтернатива для доминирующей парадигмы. Но подобное мышление сложно обрести в тех условиях, в которых живут 99 % из нас. Привычные для нашей обычной жизни способы мыслить категориями и делать приблизительные выкладки порой приводят к тому, что мы упускаем из виду информацию, способную обеспечить нам конкурентное преимущество.
Главное, что здесь можно сделать, – это развивать инструменты и привычки, помогающие вам чаще находить идеи и информацию в нужном месте, и оттачивать навыки, необходимые как при поражениях, так и в победах.
Это сложная задача. Однако бейсбол остается необычайно плодородной почвой для множества новаторов. С момента дебюта PECOTA прошло десять лет, но после нее никакая другая столь же новаторская система так и не была создана. Однако наверняка появится кто-то, способный по-умному распорядиться данными Pitch f/x или же понять, каким образом совмещать количественные и качественные оценки результативности игрока. Все это обязательно произойдет, и произойдет быстрее, чем мы думаем, – возможно, уже тогда, когда будет печататься тираж этой книги.
«Сейчас в игру вступают люди с невероятно высокими интеллектуальными и творческими способностями, – рассказывал мне Бин. – Если бы я хотел получить свою работу десятью годами позже, то не дошел бы даже до стадии собеседования».
Moneyball умер; да здравствует Moneyball.
Глава 4
Вы столько лет говорили нам, что дождь – зеленый
Во вторник 23 августа 2005 г. самолет-разведчик ВВС США уловил признаки атмосферных возмущений над Багамами{237}. Члены экипажа наблюдали «несколько небольших воздушных вихрей», вращавшихся против часовой стрелки и перемещающихся с востока на запад – от просторов Атлантического океана в сторону США. Подобное изменение в движении ветра было сложно выявить на основании данных спутников или наземного наблюдения, однако постепенно все больше экипажей грузовых лайнеров стали докладывать о нем. Национальный Центр слежения за ураганами (NHC) посчитал, что собрал достаточно свидетельств, чтобы охарактеризовать это явление как тропический циклон, получивший название «Тропическая депрессия 12»[62]. Это был «коварный» шторм, способный как развиться в нечто более серьезное, так и просто исчезнуть без следа. Примерно половина всех тропических депрессий в Атлантическом бассейне со временем перерастает в ураганы{238}.
Однако эта депрессия быстро набирала силу, и уже днем в среду на основе компьютерных расчетов в соответствии с одной из моделей Центр слежения за ураганами прогнозировал двойной удар по побережью Соединенных Штатов: один ударит по побережью южной Флориды, а второй может принять форму «циклона, движущегося в направлении к Новому Орлеану»{239}. Но шторм набрал достаточно силы, чтобы стать ураганом, и ему было присвоено имя «Катрина»{240}.
«Катрина» сначала пронеслась над территорией к северу от Майами, а через несколько часов обрушилась на национальный парк Эверглейдс во Флориде в виде урагана категории 1. Но этот ураган продолжался не так долго, чтобы угрожать множеству жизней, но не был и настолько длительным, чтобы растерять свою энергию. Напротив, «Катрина» набирала силу в теплых водах Мексиканского залива. Уже через несколько часов утром в субботу прогноз стал менее благоприятным: «Катрина» превратилась в ураган категории 3 и имела немалые шансы стать ураганом категории 5. Ее прогнозируемая траектория постепенно смещалась в западном направлении, в сторону от Пэнхэндла[63] во Флориде к Миссисипи и Луизиане. Теперь все компьютерные модели предрекали одно и то же: шторм начал угрожать Новому Орлеану{241}.
«Насколько я помню, после удара “Катрины” я участвовал в пяти слушаниях в Конгрессе», – рассказывал Макс Мэйфилд, бывший директором Центра в тот период, когда этот ураган достиг побережья. Во время нашей беседы я попросил его вспомнить, когда он впервые осознал весь масштаб угрозы. «Один из конгрессменов спросил меня, когда я впервые начал беспокоиться о Новом Орлеане, а я ответил ему “Шестьдесят лет назад”».
Сильный ураган, обрушивающийся на Новый Орлеан, – самый страшный кошмарный сон любого синоптика. В городе имелись идеальные условия, позволяющие привести к разрушениям и массовой гибели людей. С одной стороны, географическое положение – Новый Орлеан скорее не граничит с Мексиканским заливом, а утопает в нем. Основная масса горожан проживала в помещениях, расположенных ниже уровня моря, и полагалась на устаревшую систему дамб и природных барьеров, которые постепенно смывались морем{242}. С другой стороны, существует проблема, связанная с определенным типом культуры жителей Нового Орлеана. Они многое делают хорошо, но есть две вещи, которые они с гордостью отказываются делать: они никогда не двигаются быстро и не особо доверяют властям. В противном случае это просто был бы не Новый Орлеан. И, конечно, если бы не эти обстоятельства, город куда лучше подготовился бы к встрече с «Катриной», поскольку именно на эти обстоятельства стоит обратить внимание, когда возникает угроза урагана.
Национальный Центр слежения за ураганами уточнил свой прогноз, касающийся «Катрины»; ему удалось рассчитать возможность удара по городу почти за пять дней до разрушения дамб. Центр посчитал, что развитие ситуации по достаточно кошмарному сценарию вполне вероятно, причем уже через 48 часов. 20 или 30 лет назад столь заблаговременное предупреждение вряд ли было возможным, и в итоге удалось бы эвакуировать значительно меньше людей. Прогноз Центра и постоянные улучшения качества прогнозирования погоды за последние десятилетия, вне всякого сомнения, помогли спасти множество жизней.
Однако к прогнозам центра прислушались далеко не все. Примерно 80 тысяч жителей Нового Орлеана{243} – почти пятая часть населения города в то время – не смогли эвакуироваться, и 1600 из них погибли. Опросы выживших показали, что около двух третей из них не думали, что шторм будет настолько сильным{244}. Другие были в замешательстве от того, как осуществлялась эвакуация. Мэр города Рэй Нейгин ждал почти 24 часа, прежде чем объявил об обязательной эвакуации, несмотря на обращения Мэйфилда и других официальных лиц. Тем не менее некоторые жители – бедные, пожилые или не имевшие доступа к новостям – не могли покинуть город, даже если бы и захотели.
Прогнозирование погоды – одна из историй успеха, о которых рассказывает книга. Именно в этой области человек и машина способны объединить усилия, чтобы понять всю сложность окружающей природы, а то и предвидеть ее поведение. Однако тот факт, что мы можем порой предсказать поведение природы, совсем не означает, что мы можем его изменить. Кроме того, прогноз не имеет никакого смысла, если его никто не хочет слушать. История «Катрины» – это история человеческой изобретательности и человеческих ошибок.
Прогноз погоды от суперкомпьютера
Суперкомпьютеры лаборатории Национального центра атмосферных исследований (NCAR), расположенного в Булдере, штат Колорадо, создают, по сути, свою собственную погоду. Они сильно нагреваются и излучают тепловую энергию – 77 трлн вычислений, которые ежесекундно делает суперкомпьютер IBM Bluefire, вызывают значительное потепление. Они создают ветер – поскольку у страны должна всегда оставаться способность прогнозировать погоду, компьютеры нужно охлаждать, и поэтому вокруг компьютеров установлено несколько мощных вентиляторов высокого давления, постоянно обдувающих их потоком кислорода. Они настолько шумные, что в комплект спецодежды сотрудников ввели стандартные средства защиты слуха.
Bluefire разделен на 11 секций высотой примерно по 2,5 м и шириной около 50 см, по бокам каждой из которых тянется ярко-зеленый шлейф. Сзади эти шкафы напоминают типичный суперкомпьютер, каким мы его себе представляем – масса переплетенных кабелей и синих огоньков, мерцающих в «мозге» машины. Спереди же по форме и размерам они напоминают портативные туалеты, а сходство лишь усиливается благодаря двери с серебряной ручкой.
Я говорю об этом доктору Ричарду Лофту, директору NCAR по технологическому развитию, контролирующему работу суперкомпьютерной лаборатории. Метеорологи привыкли к подобному юмору. Ларри Дэвид в своем шоу Curb Your Enthusiasm («Умерь свой энтузиазм») уверяет, что метеорологи иногда предсказывают дождь, когда его не ожидается, просто для того, чтобы занять лучшие места на поле для гольфа{245}. Политические рекламные ролики часто используют погодные метафоры для атаки на своих оппонентов{246}, заявляя, к примеру, что оппоненты переменчивы, как мнение метеорологических центров. Большинство людей полагает, что специалисты по прогнозированию погоды плохо делают свою работу.
Крайне забавно разглядывать ряды жужжащих компьютеров и думать: неужели все это бесполезно? Неужели все эти сложные устройства придуманы, чтобы предсказывать? И неужели, несмотря на всю свою сложность, они так и не могут сказать нам, будет ли завтра дождь?
Лофт не удивлялся моим вопросам. Увеличение мощности компьютеров никоим образом не улучшило качество прогнозирования землетрясений или процессов в экономике. Однако в метеорологии наметился значительный и даже примечательный прогресс. И во многом он был вызван именно ростом мощности суперкомпьютеров Лофта.
Очень короткая история прогнозирования погоды
«Позвольте мне отклониться от обычного повествования, – сказал мне Лофт, сидя в своем офисе. Оказалось, что он обладает чувством юмора – необычным и неординарным, чем-то напоминавшим героя сериала “Офис” Двайта Шрута[64]. По его словам, с самых древних времен человек пытался предсказать поведение окружавшей его среды. – Вы едете в каньон Чако или Стоунхендж и понимаете, что люди каким-то образом поняли, что могут предвидеть наступление и самого короткого, и самого длинного дня в году. Движение Луны по небу предсказуемо. Однако есть вещи, предсказать которые древним людям было не под силу: внезапное нападение хищного зверя, наводнение или гроза».
В наши дни мы принимаем как данность то, что можем прогнозировать местность, на которую через несколько дней обрушится ураган, однако метеорология довольно поздно развилась в успешную науку. На протяжении столетий в этой области почти не было никакого прогресса. Вавилоняне, знаменитые астрономы, создавали прообразы прогнозов и фиксировали их на каменных табличках уже более 6000 лет назад{247}. Однако в конечном итоге они сдавались на волю бога дождей Нингирса. Аристотель написал трактат о метеорологии{248} и даже выдвинул несколько интересных догадок, однако в целом эта часть его деятельности была довольно слабой. Лишь в последние 50 лет, когда существенно выросла мощность вычислительных машин, появилась возможность для реального прогресса.
О метеорологической сводке не стоит думать как о метафизическом упражнении, однако сама идея предсказания погоды заставляет нас задуматься о старых спорах на тему предначертания и свободной воли. «Написано ли все до нас или мы сами пишем свою историю? – спросил Лофт. – Это была основная проблема для человеческих существ. И в реальности существовало две школы мыслителей. Одна из них была связана со св. Августином и кальвинизмом», – продолжил он, имея в виду людей, веривших в предначертание. Согласно этой философии, люди способны предсказывать предстоящие события, однако они не могут ничего сделать для того, чтобы их изменить. Все происходит в соответствии с божьим планом. «Это направление противоречит идеям иезуитов и Фомы Аквинского о том, что у нас имеется свобода воли. И вопрос состоит, в конечном итоге, в том, считаем ли мы мир предсказуемым или непредсказуемым».
Дискуссии о предсказуемости в том или ином виде обрели новую жизнь во времена Возрождения и промышленной революции. Из механики Исаака Ньютона, казалось бы, следовало, что во Вселенной, упорядоченной и предсказуемой, все подчиняется сравнительно простым физическим законам. Идеи научного, технического и экономического прогресса, которые в предыдущие столетия никто не мог принять как данность, обрели жизнь. Многие стали верить, что человечество способно научиться управлять собственной судьбой. Предначертание сменилось новой идеей – идеей научного детерминизма.
Эта идея приобретала множество форм, но мало кто способствовал ее развитию так же сильно, как французский астроном и математик Пьер-Симон Лаплас. В 1814 г. Лаплас выдвинул постулат, впоследствии ставший известным под названием «Демон Лапласа»:
Мы можем рассматривать настоящее состояние Вселенной как следствие его прошлого и причину его будущего. Интеллект, который был бы способен в каждый определенный момент времени познать все силы, приводящие природу в движение, и положение всех элементов, из которых она состоит, и если бы этот интеллект был бы достаточно сильным, чтобы проанализировать все эти данные, он смог бы объять единым законом и движения величайших тел во Вселенной, и движения крошечных атомов; для этого интеллекта ничто больше не казалось бы неопределенным, а будущее, как и прошлое, оказывалось бы прямо перед его глазами, подобно настоящему{249}.
Учитывая, что в настоящее время мы прекрасно информированы обо всех условиях («положение всех элементов, из которых состоит природа») и хорошо знаем законы, управляющие Вселенной («все силы, приводящие природу в движение»), у нас появляется возможность делать идеальные предсказания («будущее, как и прошлое, оказывается прямо перед нашими глазами, подобно настоящему»). Движение каждой частицы во Вселенной может казаться нам столь же предсказуемым, как движение шаров на бильярдном столе. Возможно, полагал Лаплас, подобная задача окажется людям не под силу. Однако если бы мы были достаточно умны (и если бы имели необходимое количество мощных компьютеров), то мы могли бы предсказывать погоду и многие другие события – и обнаружить в конце концов, что природа совершенна.
Идея Демона Лапласа казалась противоречивой на протяжении всего своего двухсотлетнего существования.
Против точки зрения детерминистов выступали сторонники вероятностного подхода, верившие, что условия Вселенной познаваемы лишь с некоей долей неопределенности[65]. Подобный пробабилизм представлял собой поначалу исключительно эпистемологическую парадигму – согласно ей существуют ограничения на взаимодействия человека и природы. Совсем недавно, благодаря открытиям в области квантовой механики, ученые и философы задались вопросом, а не ведет ли себя сама Вселенная вероятностным образом.
При ближайшем рассмотрении частицы, которые стремился выявить Лаплас, начинают вести себя подобно волнам: возникает впечатление, что они не занимают никакого постоянного положения. Как можно предсказать, в каком направлении будет двигаться объект, если вы даже не знаете, где именно он находится? Разумеется, это невозможно. И именно эта мысль и заложена в основу знаменитого принципа неопределенности, разработанного физиком-теоретиком Вернером Гейзенбергом{250}. Физики трактуют принцип неопределенности по-разному, однако он, по сути, утверждает, что постулат Лапласа не может быть верен в буквальном смысле. Идеальные предсказания невозможны, если природа сама по себе развивается случайным образом.
К счастью, для изучения погоды нам не нужна квантовая механика. Погодные изменения происходят на молекулярном (а не атомном) уровне, и сами молекулы слишком велики для того, чтобы на них оказывала какое-то значимое влияние квантовая физика. Более того, мы уже довольно давно поняли, что изменения погоды вполне подчиняются законам химии и ньютоновской физики.
А что касается обновленной версии Демона Лапласа, то можно сказать следующее. Если мы знаем положение каждой молекулы в земной атмосфере (такое утверждение куда более скромное, чем стремление к знанию местоположения каждого атома во Вселенной), то можем ли мы создавать идеальные прогнозы погоды? Или же в погоде тоже изначально заложен некий элемент случайности?
Матрица
Мы уже давно умеем делать прогнозы погоды на основе чисто статистических наблюдений. Насколько велика вероятность того, что завтра пойдет дождь, с учетом того, что он шел сегодня? Метеоролог мог бы изучить все такие случаи, связанные с дождями, собранные в его базе данных, и дать ответ на этот вопрос. Или же он мог бы изучить долгосрочные средние значения и сказать нам о том, что в марте в Лондоне дождь идет примерно 35 % времени{251}.
Проблема состоит в том, что предсказания такого рода не особенно полезны – они недостаточно точны для того, чтобы порекомендовать вам взять с собой с утра зонтик, не говоря уже о прогнозировании движения урагана. Поэтому метеорологи пошли по иному пути. Вместо статистической модели они хотели создать живую и дышащую модель, имитирующую физические процессы, которые управляют погодой.
Однако наша способность делать прогнозы погоды на основе расчетов куда слабее, чем наше теоретическое понимание. Мы знаем, какие уравнения надо решить, и примерно представляем себе верные ответы, однако нам недостаточно быстродействия для того, чтобы произвести расчеты для каждой молекулы в земной атмосфере. Вместо этого нам приходится заниматься аппроксимацией.
Самый интуитивно понятный метод для этого случая – упрощение проблемы за счет разбиения атмосферы на конечное количество наборов пикселей – метеорологи часто называют такую систему матрицей, решеткой или сеткой. По данным Лофта, первые заслуживающие внимания попытки работы в этом направлении были сделаны в 1916 г. Льюисом Фраем Ричардсоном, знаменитым британским физиком. Ричардсон хотел определить погоду над Северной Германией в определенное время – в 13 ч 20 мая 1910 г. Строго говоря, это нельзя назвать предсказанием, поскольку этот день уже прошел. Однако в распоряжении Ричардсона имелось много данных – о температуре, атмосферном давлении и скорости ветра, – собранных германским правительством. И у него было достаточно времени, поскольку он служил медиком-добровольцем и оставался без дел в перерывах между артиллерийскими канонадами. Поэтому Ричардсон разбил территорию Германии на ряд двумерных секторов размерами по три градуса широты (около 340 км) на три градуса долготы (рис. 4.1). Затем он приступил к работе, пытаясь решить химические уравнения, определявшие погоду в каждом секторе, и то, каким образом они влияют на погоду в соседних.
К сожалению, эксперимент Ричардсона бесславное провалился{252} – он «предсказал» серьезный рост атмосферного давления, в реальности же в тот день это не наблюдалось. Однако Ричардсон тем не менее опубликовал свои результаты. Этот метод определенно казался правильным методом предсказания погоды – Ричардсон считал, что следует не полагаться на грубые статистические приближения, а выявить некие основные принципы и воспользоваться глубоким теоретическим пониманием поведения системы.
Рис. 4.1. Матрица Ричардсона – прообраз современной системы прогнозирования погоды
Проблема состояла в том, что метод Ричардсона требовал выполнения огромного объема работы. Для решения поставленных им задач были нужны компьютеры. Как вы увидите в главе 9, компьютеры не каждую из поставленных им задач могут выполнить и далеко не всегда служат панацеей в процессе предсказания. Однако компьютеры идеальны с точки зрения вычислений – то есть быстрого и точного многократного повторения одних и тех же арифметических задач. Они отлично подходят для решения шахматных задач, подчиняющихся довольно простым правилам, но сложных с точки зрения вычислений. Сходные задачи имеются и в области метеорологии.
Первый компьютерный прогноз погоды создал в 1950 г. математик Джон фон Нейман, который использовал для этого машину, способную осуществлять порядка 5000 вычислений в секунду{253}. Расчет происходил намного быстрее, чем мог сделать Ричардсон с карандашом и листом бумаги на французском деревенском поле. Тем не менее прогноз оказался неудачным, и его результаты оказались не намного точнее обычной случайной догадки.
Со временем, к середине 1960‑х гг., компьютеры начали демонстрировать определенные навыки в прогнозировании погоды. Так, Bluefire, выдающий результаты примерно в 15 миллиардов раз быстрее, чем первый компьютерный прогноз (и, возможно, в квадрильон раз быстрее, чем Ричардсон), дает нам куда более осмысленные результаты благодаря скорости вычислений.
Прогнозы погоды в наши дни значительно чаще бывают верными, чем 15 или 20 лет назад. Однако, если скорость вычислений в последние десятилетия увеличивалась по экспоненте, прогресс в точности прогнозов погоды был хотя и стабильным, но медленным.
Можно назвать две основные причины сложившейся ситуации. Первая связана с тем, что мир имеет не одно и не два измерения. Самый надежный способ повысить правильность прогноза погоды – то есть на один шаг приблизиться к пониманию поведения каждой молекулы – состоит в уменьшении размера сетки, используемой для отображения атмосферы. Сектора Ричардсона имели размер 340 на 340 км, обеспечивая в лучшем случае слишком масштабный взгляд на планету (в квадрат 340 на 340 км² можно почти полностью вместить Нью-Йорк и Бостон – города, в которых может быть совершенно разная погода). Предположим, вы хотите в два раза уменьшить площадь секторов, до 170 на 170 км. Благодаря этому ваш прогноз станет более точным, но при этом увеличится количество уравнений, которые вам надо решить. В реальности количество уравнений вырастет не в два, а в четыре раза, поскольку вы уменьшаете масштаб и по длине, и по ширине. Иными словами, для того чтобы решить такую задачу, вам нужно примерно в 4 раза увеличить вычислительную мощность.
Однако вам нужно учитывать не только эти два измерения. В верхних слоях атмосферы могут проявляться одни закономерности, а в нижних слоях, над океанами и у поверхности Земли – совершенно иные. В трехмерной вселенной двукратное увеличение разрешения нашей сетки потребует восьмикратного повышения вычислительной мощности. Кроме этого, имеется и четвертое измерение – время. Если метеорологическая модель статична, в ней нет никакого толка – самое главное для нас состоит в том, чтобы знать, как меняется погода в каждый момент времени. Шторм движется со скоростью примерно 40 миль в час – если размеры вашей сетки составляют 40×40×40, то вы можете отслеживать его движение, собирая наблюдения каждый час. Однако если вы уменьшите размер сетки до 20×20×20, то шторм будет перемещаться из ячейки в ячейку каждые полчаса. Это значит, что вам нужно уменьшить в два раза и временной интервал, то есть вам потребуется в 16 раз больше вычислительных мощностей, чем изначально.
Но если бы эта проблема оказалась единственной, то ее вполне можно было бы решить. Хотя вам нужно, грубо говоря, в 16 раз увеличить вычислительную мощность, чтобы удвоить разрешение прогноза погоды, сама вычислительная мощность растет по экспоненте, удваиваясь примерно каждые два года{254}. Это значит, что вам нужно подождать всего восемь лет, и тогда ваш прогноз станет в два раза точнее; интересно, что NCAR обновляет свои суперкомпьютеры примерно с такой же частотой.
Предположим, что вам удалось разобраться с законами динамики движения жидкостей, которым подчиняются погодные системы. Они в целом следуют ньютоновским законам. Вам не будет особенно мешать и принцип неопределенности, интересный для физиков. Вы получили доступ к компьютерному шедевру типа Bluefire. Вы наняли Ричарда Лофта для проектирования и тестирования компьютерных программ. Что же еще может пойти не так в этом случае?
Почему теория хаоса так напоминает безумие
Итак, с чем может быть связана очередная ваша проблема? С теорией хаоса. Возможно, вам доводилось слышать выражение «взмах крыльев бабочки в Бразилии может привести к торнадо в Техасе». Изначально это было частью заглавия научной работы{255}, представленной в 1972 г. преподавателем Массачусетского технологического института Эдвардом Лоренцем, который начинал свою карьеру как метеоролог. Теория хаоса применима в отношении систем, для которых справедливы два утверждения:
1) системы динамичны, что означает, что поведение системы в один момент времени влияет на ее поведение в будущем;
2) системы нелинейны, иными словами, в них поддерживаются скорее экспоненциальные, а не аддитивные связи.
Динамические системы доставляют специалистам по прогнозированию немало проблем. Примером может служить описанный в главе 6 факт, свидетельствующий о том, что американская экономика постоянно вызывает цепную реакцию событий, что и является одной из причин, по которым ее развитие так сложно предсказать. Развитие при этом остается нелинейным: ценные бумаги, обеспеченные закладными, стимулировавшие начало финансового кризиса, были разработаны таким образом, что небольшие изменения в макроэкономических условиях значительно повышали риск дефолта по ним.
Совмещая все эти параметры, вы получаете на выходе настоящую неразбериху. Сам Лоренц не понимал, насколько масштабны эти проблемы, до тех пор пока (следуя той же традиции, что и Александр Флеминг и пенициллин{256} или команда «Нью-Йорк Никс» и баскетболист Джереми Лин) он не сделал свое открытие, причем совершенно случайно.
Лоренц и его команда разрабатывали программу прогнозирования погоды на одном из первых компьютеров, известном как Royal McBee LGP-30{257}. Исследователи полагали, что все идет как надо, но лишь до тех пор, пока компьютеры не начали выдавать совершенно бессмысленные результаты.
Они начали еще раз анализировать, почему так получается, что, вводя в точности те же самые, как они считали, данные, после запуска программы на выходе в качестве результата они получают в одном случае – чистое небо над Канзасом, а в другом – сведения о надвигавшемся шторме.
После нескольких недель, проведенных за проверкой оборудования и программ, Лоренц и его команда поняли, что исходные данные не были в точности одинаковыми: один из техников не вводил в систему цифры после третьего знака после запятой. Например, вместо того чтобы вводить в одно из полей сетки значение атмосферного давления, равное 29,5168, в расчетах использовалось число 29,517. Неужели вся разница возникла именно из-за этого?
Лоренц понял, что это действительно так. Один из основных постулатов теории хаоса гласит, что небольшое изменение в начальных условиях – бабочка машет крыльями в Бразилии – может привести к масштабному и неожиданному развитию последующих событий – торнадо в Техасе.
Это не значит, что поведение системы случайно, как можно было бы считать, увидев слово «хаос». Более того, теория хаоса отнюдь не является проявлением одного из следствий знаменитого Закона Мерфи («если что-то может пойти не так, оно обязательно пойдет не так»). Это всего лишь значит, что поведение систем определенного типа достаточно сложно предсказать.
Проблема возникает тогда, когда наши данные не совсем точны (или неточны наши предположения, как в случае ценных бумаг, обеспеченных закладными). Представьте себе, что мы должны были сложить вместе 5 и 5, однако неправильно взяли второе число. Вместо того чтобы сложить 5 и 5, мы сложили 5 и 6. Это получим 11, хотя правильный ответ равен 10. Мы ошибемся, но ненамного: сложение, как линейное действие, умеет прощать. Куда хуже будут обстоять дела в том случае, когда мы возводим число в степень. Если вместо того, чтобы рассчитать значение 55, равное 3215, мы рассчитаем 56, то получим в результате 15 625. И это уже серьезная ошибка – мы промахнулись на 500 %.
Значимость подобных неточностей существенно возрастает, когда речь идет о динамическом процессе, при котором результат вычислений одного этапа становится входящими данными следующего. Например, предположим, что нам нужно рассчитать, чему будет равно пять в шестой степени, а затем возвести полученное значение в пятую степень. Если мы допустим ту же ошибку, что и выше, и заменим вторую цифру 5 на 6, то ошибка в окончательном результате увеличится примерно в 3000 раз{258}. Влияние небольшой и, на первый взгляд, тривиальной ошибки становится все больше и больше.
Изменения погоды представляют собой проявление динамической системы, а уравнения, описывающие движение атмосферных газов и жидкостей, нелинейны (чаще всего это дифференциальные уравнения){259}. Таким образом, теория хаоса явным образом применима к прогнозированию погоды, а следовательно, наши прогнозы оказываются в высшей степени уязвимы к неточностям в исходных данных.
Иногда эти неточности возникают в результате человеческой ошибки. Еще бо́льшая фундаментальная проблема состоит в том, что мы можем наблюдать за окружающим нас миром лишь с определенной степенью точности. Ни один термометр не идеален, и ошибка в его показаниях в третьем или даже четвертом знаке после запятой может оказать огромное влияние на прогноз.
На рис. 4.2 показаны результаты, полученные после 50 запусков программ, моделирующих прогноз погоды для Франции и Германии на сочельник 1999 г. Все модели используют одни и те же программы и основаны на одних и тех же предположениях о поведении погоды. Фактически эти модели являются детерминистическими: в них заложено допущение, что если мы в полной мере знаем все изначальные параметры, то можем создать идеальный прогноз. Однако небольшие различия во входных параметрах способны привести к огромным отличиям в результатах, полученных на выходе. В Европейском центре метеорологических прогнозов пытались принять во внимание эти ошибки. В одном из процессов имитационного моделирования закладывалось условие, что атмосферное давление в Ганновере подвергалось лишь незначительным колебаниям. В другом менялись характеристики ветра в Штутгарте, причем на долю процента. Однако даже таких небольших изменений может быть достаточно для того, чтобы в одних прогнозах говорилось об урагане в Париже, а в других – о тихом зимнем вечере.
Рис. 4.2. Результаты расчетов прогноза погоды с немного различающимися начальными условиями
Именно такие модели и используют для создания современных прогнозов погоды. Небольшие изменения, сознательно добавляемые в модель для имитации неопределенности в качестве данных, превращают детерминистический прогноз в вероятностный. Допустим, если ваш местный метеоролог говорит о том, что вероятность дождя на следующий день составляет 40 %, это можно понимать и так, что результаты расчетов используемых им моделей в 40 % случаев говорят о том, что ожидается предштормовое состояние, а в 60 % случаев – при использовании лишь незначительно измененных начальных параметров – результат противоположный.
Но на практике все не так просто. Программы, которые метеорологи используют для прогнозирования погоды, довольно хороши, но не идеальны. Прогнозы, которые вы слышите постоянно, представляют собой комбинацию компьютерных расчетов и человеческого суждения. Порой люди способны улучшить компьютерные прогнозы, а порой – ухудшить их.
Важность ви́дения
Здание World Weather Building – довольно уродливое сооружение в стиле 1970‑х гг., выкрашенное в цвет ириски и расположенное в Кэмп-Спрингз, штат Мэриленд, примерно в 20 минутах езды от Вашингтона.
Здесь находится штаб-квартира NOAA (National Oceanic and Atmospheric Administration – Национального управления по исследованию океанов и атмосферы) – материнской организации Национальной службы погоды (National Weather Service, NWS), входящей в состав правительственных служб{260}. В отличие от зданий NCAR в Булдере, расположенных в живописном уголке Скалистых гор, это здание заставляет думать исключительно о бюрократии.
Изначально Служба погоды была организована в 1879 г. в структуре военного ведомства Соединенных Штатов президентом Улиссом С. Грантом. Отчасти это было связано с убежденностью президента Гранта в том, что только культура, основанная на военной дисциплине, обеспечит должный уровень точности прогнозирования{261}, а отчасти с тем, что это предприятие выглядело настолько безнадежным, что заниматься им имело смысл лишь во время военных действий, когда вы пробуете все, что угодно, для достижения военного перевеса.
Широкая публика заинтересовалась вопросами прогнозирования погоды после знаменитой «Школьной метели» (Schoolhouse Blizzard). В сравнительно теплый день 12 января 1888 г. на Великих Равнинах температура воздуха упала за несколько часов почти на 30 °, и вдруг началась ослепляющая метель{262}. Сотни детей, вышедших из школы, попали в эту снежную бурю по дороге домой и умерли от переохлаждения. Несмотря на неточность ранних прогнозов погоды, все надеялись, что эта служба поможет хоть как-то предупредить о столь значительных колебаниях температуры. Соответственно, Национальная служба погоды была переведена в структуру департамента сельского хозяйства и начала заниматься более мирными делами[66].
История происхождения Службы погоды до сих пор проявляется в культуре организации. Специалисты по прогнозированию погоды работают в ней круглыми сутками за довольно скромную оплату{263} и воспринимают себя важными государственными служащими. Метеорологи, с которыми я встретился в Кэмп-Спрингз, были настоящими патриотами, редко упускавшими возможность напомнить мне о важности прогнозов погоды для работы сельскохозяйственных ферм, небольших бизнесов, авиакомпаний, энергетического сектора, воинских подразделений, сектора общественных услуг, площадок для гольфа, организации пикников и экскурсий для школьников – прогнозов, которые можно было бы получить за копейки. (NWS удается работать с бюджетом, составляющим всего 900 млн долл. в год{264}, то есть примерно 3 долл. на каждого гражданина США. И это несмотря на то что погода напрямую влияет примерно на 20 % экономики страны{265}.)
Одним из тех метеорологов, с которыми мне удалось встретиться, был Джим Хоук – директор центра гидрометеорологического прогнозирования NWS. Хоук проработал в этой области около 35 лет, занимаясь и вычислительной стороной процесса (он помогал выстраивать компьютерные модели, которые используют его прогнозисты), и операционной (создавая эти прогнозы и сообщая их широкой публике). И, благодаря этому, он достаточно хорошо представляет себе, как взаимодействуют люди и машины в мире метеорологии.
Так что же конкретно люди могут делать лучше, чем компьютеры, способные обрабатывать данные со скоростью 77 терафлоп[67]? Они обладают ви́дением. Хоук отвел меня на этаж прогнозирования, заставленный рабочими станциями, около каждой из которых видела табличка с пояснением типа «военно-морской центр прогнозов» или «центр прогнозов на национальном уровне». Каждая станция управлялась одним-двумя метеорологами, а рядом с каждым из них имелась целая армада жидкокристаллических мониторов с полноцветными картами всевозможных типов погодных данных для каждого уголка страны.
Прогнозисты работали тихо и быстро, с точностью, о которой, наверное, и мечтал Грант{266}.
Некоторые из прогнозистов рисовали на этих картах световыми указками, тщательно корректируя контуры температурных градиентов, созданных компьютерными моделями, – 25 миль к западу в сторону дельты Миссисипи, 50 миль к северу в направлении озера Эри. Постепенно, шаг за шагом они приводили карты к желанному платоническому идеалу.
Прогнозисты отлично представляют себе недостатки компьютерных моделей. Это возникает неминуемо, поскольку, как следует из теории хаоса, даже самая тривиальная ошибка в модели может привести к значительным последствиям. Возможно, компьютер оказывается слишком консервативным при прогнозировании ночных дождей в Сиэтле, когда над заливом Пьюджет-Саунд образуется зона низкого давления. Возможно, он не знает, что при одном направлении ветра туман в национальном парке Акадия в Мэйне рассеивается к восходу солнца, при другом – может остаться до середины дня.
Подобные вещи прогнозисты понимают со временем, учась обходить недостатки модели, наподобие того как опытный игрок в пул привыкает обходить слепые зоны бильярдного стола в местном баре.
Уникальным ресурсом этих прогнозистов было и остается их умение видеть. Этот инструмент важен в любой дисциплине – визуальное изучение графика, показывающего взаимодействие между двумя переменными, часто оказывается более быстрым и более надежным способом выявить странные искажения данных, чем статистический тест. Это также одна из тех областей, в которых компьютеры сильно отстают от человеческого мозга. Стоит немного изменить последовательность букв – как в случае технологии CAPTCHA[68], часто использующейся для противостояния спаму в качестве средства защиты паролей (рис. 4.3), – и даже самые «толковые» компьютеры начинают смущаться. Они воспринимают информацию слишком буквально. Они неспособны распознать закономерность, подвергшуюся даже небольшой манипуляции. Люди же, в силу эволюционной необходимости, обладают мощными визуальными способностями. Они быстро отсеивают любые искажения закономерностей и могут распознать такие абстрактные вещи, как закономерности и организация, то есть то, что оказывается особенно важным в различных типах погодных систем.
Рис. 4.3. Пример теста CAPTCHA
На самом деле, в старые времена, когда метеорологические компьютеры были еще не особенно полезными, прогнозирование погоды представляло собой почти полностью визуальный процесс. Вместо дисплеев в офисах стояли столы с подсветкой, на которых лежали карты. Метеорологи корректировали рисунки на картах с помощью мелков или цветных карандашей. Хотя последняя доска с подсветкой была отправлена в отставку уже много лет назад, дух этого метода живет и в наши дни.
По словам Хоука, самые квалифицированные синоптики-прогнозисты должны обладать способностью думать визуально и абстрактно, но в то же самое время им необходимо разбираться с огромными массивами информации, которой снабжает их компьютер. Более того, они должны понимать динамическую и нелинейную природу изучаемой ими системы. Это непростая задача, требующая тщательного использования и правого, и левого полушарий. Многие из прогнозистов могли бы стать хорошими инженерами или программистами с куда большей зарплатой, однако они сознательно решают стать метеорологами.
NWS постоянно отслеживает два типа данных: первый показывает, насколько хорошо компьютеры справляются в одиночку, а второй оценивает долю человеческого вклада. Судя по статистическим данным, люди способны улучшить правильность компьютерных прогнозов выпадения осадков примерно на 25 %{267}, а прогнозов погоды – примерно на 10 %{268}.
Более того, согласно Хоуку, эти сравнительные данные практически не менялись со временем: какой бы прогресс ни происходил в компьютерных технологиях, люди-прогнозисты могут еще лучше повысить их ценность. Ви́дение стоит дорогого.
Вероятность погибнуть от удара молнии становится все меньше
Когда Хоук только начинал начал свою карьеру в середине 1970‑х, анекдоты о синоптиках были недалеки от истины. Например, в прогнозах погоды NWS, сделанных за три дня, максимальное отклонение от прогнозируемой температуры достигало примерно 6 ° F (рис. 4.4). Это ненамного лучше, чем в случае составления прогноза на основе обычного изучения таблицы долгосрочных средних значений. Однако партнерство между человеком и машиной способно принести немалые дивиденды. В наши дни средняя величина ошибки составляет примерно 3,5 ° F – иными словами, она стала примерно наполовину меньше. Также синоптикам удается значительно лучше предсказывать аномальные погодные явления.
Рис. 4.4. Ошибка в определении среднемесячной максимальной температуры в прогнозах NWS
Какова вероятность получить смертельный удар молнии? На самом деле, значение этого показателя не постоянная величина, которая зависит, например, от вероятности того, будете ли вы на улице в момент возникновения молнии. В 1940 г. вероятность смерти жителя Америки от удара молнии в определенный год составляла примерно 1 из 400 000{269}. В наши дни вероятность этого события равна всего 1 из 11 000 000 (то есть ее величина снизилась почти в 30 раз). Отчасти это связано с изменением образа жизни (всё больше работы в наши дни производится в домах) и улучшением коммуникации в области технологий и здравоохранения, но также это связано и с тем, что прогнозы погоды становятся более точными.
Возможно, самые впечатляющие успехи были достигнуты в предсказании ураганов. Всего 25 лет назад, когда Национальный центр по ураганам попытался дать предварительный прогноз местонахождения территории, по которой в ближайшие три дня ударит ураган, диапазон ошибки составлял в среднем 560 км{270}. Это слишком много. Нарисуйте, допустим, окружность с радиусом 560 км вокруг Нового Орлеана, и она покроет все точки от Хьюстона, штат Техас, до Таллахасси, штат Флорида (рис. 4.5). Эвакуировать людей с такой большой территории просто невозможно.
Рис. 4.5. Улучшение качества прогнозирования поведения ураганов
В наши дни величина погрешности равна примерно сотне миль, то есть наша окружность охватит лишь юго-восток Луизианы и южную границу Миссисипи. Время от времени ураганы будут выбиваться за пределы этой зоны, но теперь в большинстве случаев нам имеет смысл обращать внимание на заметно меньшую по площади зону, эвакуировать жителей из которой можно за 72 часа. Для сравнения, в 1985 г. такую же степень точности обеспечивали лишь прогнозы, созданные менее чем за 24 часа до события. Это значит, что теперь у нас есть еще дополнительно двое суток до удара урагана – а как мы увидим позже, при эвакуации города типа Нового Орлеана критически важным оказывается каждый час[69].
Службе погоды еще не удалось избавиться от Демона Лапласа, однако вполне можно полагать, что она заслуживает большего признания, чем принято считать. Наука прогнозирования погоды довольно успешно развивается, несмотря на все проблемы, связанные с особенностями метеорологических условий. В этой книге вы неоднократно увидите, что при составлении прогнозов это является скорее исключением, чем правилом (так что приберегите свои шутки для экономистов).
Усилия Национальной службы погоды часто недооценивают. Она сталкивается с жесткой конкуренцией со стороны частных компаний{271}, работающих в совершенно иных условиях. В отличие от всех других игроков, Служба погоды должна предоставлять свои данные моделирования бесплатно всем желающим (большинство других стран с хорошими погодными бюро продают лицензии или взимают плату за использование своих данных). Частные компании типа AccuWeather и Weather Channel могут затем использовать их как основу для развития собственных продуктов и их коммерческого распространения. Подавляющее большинство потребителей получают прогнозы от одного из частных поставщиков; трафик сайта телеканала Weather Channel (Weather.com) примерно в десять раз превышает трафик Weather.gov{272}.
В целом я большой сторонник конкуренции на свободном рынке или конкуренции между государственными и частными компаниями. Во многом именно благодаря конкуренции бейсбол активно развивался и смог лучше совмещать знания скаутов и статистиков при прогнозировании развития игроков.
Как видите, в бейсболе идея конкуренции более ясна – сколько мячей ты выиграл (или же соотношение выигранных и проигранных мячей). В прогнозировании погоды ситуация несколько более сложная, а перед частными и государственными прогнозистами стояли разные задачи.
Что делает прогноз хорошим?
«Разумеется, ученого-исследователя не казнят на месте за просмотр Weather Channel, однако многие из них делают это за закрытыми дверями», – рассказал мне доктор Брюс Роуз, приветливый научный руководитель и вице-президент Weather Channel (TWC).
По словам Роуза, у него не было намерения утверждать, что прогнозы TWC лучше правительственных, они просто были другими – в большей степени ориентированными на нужды типичного потребителя.
«Модели обычно не оцениваются по тому, насколько хорошо они предсказывают те или иные практически важные параметры погоды, – продолжает он. – Для жителей Нью-Йорка на самом деле важно, что ожидает их на улице – залитые водой мостовые после ливня или снеговой покров толщиной 10 см{273}. С точки зрения потребителя, различие огромно, а вот для ученых это не всегда интересно».
На самом деле, значительная доля времени доктора Роуза уделяется прагматичным и даже отчасти банальным проблемам, связанным с тем, как потребители интерпретируют его прогнозы. Например, он задается вопросом, как разработать алгоритмы, позволяющие исходные данные о погоде выразить понятно. Что может означать выражение очень холодно? А вероятность порывистого ветра? Где проходит различие между переменной облачностью и преимущественно пасмурной погодой? Weather Channel должна в этом хорошо разбираться, а Роузу приходится создавать формальные правила, поскольку компания выпускает настолько много прогнозов, что способ их подачи необходимо разрабатывать чуть ли не для каждого случая.
Иногда необходимость адаптировать прогноз к потребностям клиента может принимать комические формы. На протяжении многих лет Weather Channel показывал дождь на своих радарных картах зеленым цветом (иногда сопровождаемым желтыми и красными участками, обозначавшими особенно сильные штормы). В какой-то момент в 2001 г. кому-то из отдела маркетинга пришла в голову гениальная идея выкрасить дождь в синий цвет – что показалось тогда разумным и напоминало естественный цвет воды. Довольно быстро на Weather Channel обрушился вал телефонных звонков разгневанных, а порой и напуганных потребителей: некоторые из них ошибочно приняли синие облака за прежде неизвестный вид осадков (плазменные облака? радиоактивные выбросы?). «Кто-то даже посчитал это последствием ядерного взрыва, – рассказал мне доктор Роуз. – Люди писали нам: “Вы многие годы говорили нам о том, что дождь имеет зеленый цвет, а теперь он оказался синим? Это что еще за выкрутасы?”»
Но, несмотря на все эти анекдотические истории, Weather Channel относится к метеорологии очень серьезно. По крайней мере, в теории, и есть основания думать, что эта компания способна сделать более качественный прогноз, чем правительство. В конце концов, Weather Channel, использует все исходные данные, полученные из правительственных источников, в качестве отправной точки, а затем учитывает и всю ту ценную информацию, которую они в состоянии получить своими силами.
Вопрос заключается в следующем: какой прогноз считать «лучшим»? Я бы сказал просто – лучшим является самый точный прогноз. Однако я знаю о нескольких конкурирующих между собой идеях в области прогнозирования погоды.
В известном эссе 1993 г.{274}, написанном Алланом Мерфи (работавшим в то время метеорологом в Университете штата Орегон), утверждалось, что в сообществе прогнозистов погоды имеются целых три определения качества прогноза. Мерфи не утверждал, что то или иное определение лучше остальных; скорее, он пытался начать более открытое и честное их обсуждение. Версии этих определений могут применяться почти в любой области, где нужны прогнозы или предсказания.
Первый (и, возможно, самый очевидный) способ оценки прогноза, писал Мерфи, связан с тем, что он сам называл «качеством», но, пожалуй, его лучше определить как правильность. Иными словами, оценивается ответ на вопрос, соответствовала ли реальная погода прогнозу?
Второй способ обозначен словом «последовательность», но я считаю, что в данном случае чаще подходит слово честность. Даже если прогноз оказался достаточно точным, был ли это лучший прогноз, на который способен прогнозист в то время? Отражал ли он самые наилучшие из имевшихся суждений и модифицировали ли его каким-либо образом перед тем, как представить публике?
И, наконец, Мерфи говорил об экономической ценности прогноза. Способствовал ли он принятию общественностью и политиками более правильных решений?
Проведенное Мерфи различие между правильностью и честностью не сразу очевидно, однако крайне важно. Когда созданный мной прогноз оказывается неверным, я часто спрашиваю себя, был ли это лучший вариант прогноза, который я мог бы дать с учетом имевшихся у меня на тот момент данных. Иногда я считаю, что этак: мой мыслительный процесс оказался верным, я провел все необходимые исследования, выстроил хорошую модель и точно указал, какая доля неопределенности присутствует в прогнозе. В других же случаях я обнаруживал, что мне не нравится моя собственная работа. Иногда я слишком быстро отказывался от ключевых элементов исследования. Иногда я переоценивал степень предсказуемости проблемы. Иногда у меня возникали какие-то другие предубеждения или неверные стимулы.
Я не хочу сказать, что вы должны ругать себя всякий раз, когда ваш прогноз оказывается неверным. Напротив, признаком того, что вы делаете хороший прогноз, является то, что вы полностью принимаете то, как развиваются события, понимая, что не все из них вы можете непосредственно контролировать. Однако у вас всегда есть возможность спросить себя о том, какие цели вы имели, принимая свое решение.
В долгосрочной перспективе заявленные Мерфи цели правильности и честности должны сходиться друг с другом, когда у нас имеются правильные стимулы. Однако так бывает не всегда. Например, не исключено, что политических комментаторов из McLaughlin Group больше волновало желание казаться толковыми на экране телевизора, чем создание правильных предсказаний. Возможно, что они вели себя вполне рационально. Однако если они сознательно делали плохие прогнозы, поскольку хотели произвести приятное впечатление на представителей той или иной партии, или же хотели вновь оказаться на шоу, то можно считать, что они провалили тест Мерфи на честность.
Третий критерий Мерфи – экономическая ценность прогноза – способен запутать нас еще сильнее. Разумеется, мы вполне можем согласиться с доктором Роузом в том, что прогнозы для городов могут заслуживать большего внимания – допустим, если температура воздуха находится около точки замерзания и осадки могут принять форму дождя, льда или снега, каждый из которых может по-разному влиять на безопасность и транспортировку жителей.
Однако это, скорее, связано с тем, на чем Weather Channel концентрирует свои ресурсы и чему уделяет основное внимание. Это не значит, что иногда под сомнение ставится правильность или честность прогноза. Многие газеты стремятся к тому, чтобы каждая опубликованная в них статья была точной и честной, однако им все равно необходимо принимать решение о том, какие материалы поместить на первую полосу. Weather Channel должен принимать аналогичные решения, и экономическое влияние прогноза – это вполне разумная основа для них.
Впрочем, бывают времена, когда цели начинают конфликтовать между собой и коммерческий успех оказывается важнее правильности.
Когда конкуренция приводит к тому, что прогнозы становятся хуже
Существуют два основных теста, которые должен пройти любой прогноз погоды, чтобы доказать свою состоятельность.
1. Он должен оказаться лучше, чем тот, что следует из так называемого метеорологами постоянства: то есть из предположения о том, что завтра (и в последующие дни) погода будет такой же, как и сегодня.
2. Он должен оказаться лучше, чем тот, что следует из климатологии, то есть лучше прогноза, сделанного на основе анализа долгосрочных исторических средних климатических условий на конкретную дату в конкретном месте.
Эти методы были доступны нашим предкам задолго до того, как на сцене появились Ричардсон, Лоренц и суперкомпьютер Bluefire; если мы не можем улучшить их результаты, то все дорогостоящие вычислительные мощности просто не выполняют свою работу.
У нас есть масса данных о том, какой была погода в прошлом, начиная еще со времен Второй мировой войны. Например, я могу зайти на сайт Wunderground.com и узнать, что в 13 января 1978 г. в 7 часов утра в Лэнсинге, штат Мичиган, – в день и час моего рождения – температура была равна –8 °С, шел небольшой снег и дул северо-восточный ветер{275}. Однако сравнительно немного людей занималось сбором данных о прогнозах погоды из прошлого. Ожидался ли в то утро в Лэнсинге снег? Это был один из тех немногих элементов информации, который можно было бы рассчитывать найти в интернете, но его там нет.
В 2002 г. предприниматель по имени Эрик Флер, выпускник факультета вычислительной техники Университета штата Огайо, работавший на MCI, перевернул все с ног на голову. Он попросту стал собирать данные о прогнозах, выпущенных NWS, Weather Channel и AccuWeather, чтобы понять, какая модель прогноза более точна – правительственная или частная. Сначала он занялся этим исключительно для самообразования – он проводил своего рода широкомасштабный научный проект, – однако это увлечение довольно быстро превратилось в прибыльный бизнес с названием ForecastWatch.com, в рамках которого данные переупаковываются в модернизированные по заказам пользователей отчеты для клиентов, начиная от трейдеров на энергетическом рынке (для которых изменение температуры на долю градуса приравнивается к десяткам тысяч долларов) и заканчивая учеными.
Флер обнаружил, что явного победителя выявить не удается. Его данные показывали, что AccuWeather чуть лучше других удаются прогнозы по осадкам, Weather Channel – прогнозы по температуре, а прогнозы правительства достаточно точны во всем остальном. То есть в целом все прогнозы были достаточно хороши.
Но чем больше оказывался период прогнозирования, тем менее точными становились прогнозы (рис. 4.6). Допустим, прогнозы, создаваемые за восемь дней, достаточно хороши с точки зрения постоянства, однако не намного лучше климатологических.
А если интервал прогнозирования составляет девять и более дней, все профессиональные прогнозы оказывались стабильно хуже климатологических данных.
Лофт рассказывал мне, что в тех случаях, когда период прогнозирования даже немного превышает неделю, теория хаоса начинает брать верх над всем остальным, и динамическая память атмосферы полностью стирается. Хотя приведенная ниже аналогия вряд ли может считаться совершенно точной, она помогает нам подумать об атмосфере как о трассе для гонок NASCAR, в которой различные погодные системы представлены отдельными автомобилями. После первой пары десятков кругов по трассе и при условии знания стартового порядка машин мы можем сделать довольно неплохое предсказание порядка, в котором они будут проезжать мимо нас. Наши предсказания не будут идеальными: на них повлияют и неожиданные поломки, и пит-стопы, и заглохшие моторы, – но наш прогноз будет значительно лучше случайно выбранной последовательности.
Рис. 4.6. Сравнение прогнозов максимальной температуры{276}
Вскоре, однако, более быстрые автомобили начнут опережать более медленные, и через какое-то время ситуация станет непредсказуемой. Может получиться и так, что машина, занимающая второе место, будет ехать рядом с машиной, которая занимает 16‑е место (обгоняя ее почти на круг), и с машиной, находящейся на 28‑м месте (которую она один раз уже обогнала и которую собирается обогнать еще раз). Все то, что мы знали о начальных условиях гонки, теперь не имеет для нас никакой ценности. Аналогично, если в атмосфере достаточно долго циркулировали воздушные потоки, погодные параметры настолько слабо будут напоминать о своих начальных значениях, что исходные модели теряют любой смысл.
Тем не менее открытие Флера поднимает пару тревожных вопросов. Одно дело, если в долгосрочных прогнозах (после семи или восьми дней) компьютерные модели демонстрируют, в сущности, нулевые результаты. На самом же деле они показывают негативный результат. Он оказывается хуже, чем мы с вами могли бы получить, сидя дома и изучая таблицы долгосрочных погодных явлений. Как такое может быть? Возможно, это связано с тем, что в компьютерные программы заложена слишком высокая чувствительность к естественно возникающей обратной связи в погодной системе. Они начинают сами создавать обратную связь. И теперь дело не ограничивается тем, что сигнал подавляется шумом, дело в том, что сам шум начинает многократно усиливаться.
Стоит задаться еще более масштабным вопросом: почему, если эти долгосрочные прогнозы так плохи, их продолжают публиковать Weather Channel (10-дневные прогнозы) и AccuWeather (сайт, поднимающий планку до 15-дневного прогноза)?
Доктор Роуз считает, что серьезного вреда в этом нет; даже прогноз, основанный исключительно на климатологии, может тем не менее представлять некий интерес для потребителей.
Когда дело заходит о коммерческом прогнозировании погоды, статистическая реальность правильности перестает быть самым главным условием. Скорее, ценность в глазах потребителей возникает благодаря ощущению правильности.
Например, коммерческие синоптики редко предсказывают, что вероятность дождя составляет именно 50 %. С точки зрения потребителей, это может свидетельствовать об определенной нерешительности и желании избежать конкретики{277}. Вместо этого они бросают монетку и округляют цифру до 60 или 40 %, хотя это делает прогнозы менее точными и менее честными{278}.
Флер также обнаружил еще один вопиющий пример фальсификации цифр, описывающий, пожалуй, один из самых главных секретов в прогнозной отрасли. Большинство коммерческих прогнозов погоды искажено, и, возможно, сознательно. В частности, прогнозы чаще говорят об осадках, чем они выпадают на самом деле{279}. Метеорологи называют это «сдвигом в сторону осадков»». Чем дальше вы отклоняетесь от исходных данных, предоставленных правительством, и чем больше потребителей изучают ваши прогнозы, тем сильнее становятся искажения. Прогнозы «добавляют ценность», уменьшая при этом правильность.
Как понять, что ваш прогноз неверен
Один из самых важных тестов любого прогноза – и я бы даже сказал, что самый важный{280}, – носит название калибровки. Насколько часто сбывались ваши прогнозы о том, что вероятность выпадения осадков составляет 40 %? Если в долгосрочной перспективе дождь действительно шел примерно в 40 % случаев, это значит, что ваши прогнозы хорошо откалиброваны. Если на самом деле дождь шел в 20 или 60 % случаев, о хорошей калибровке говорить не приходится.
Во многих областях добиться хорошей калибровки непросто. Для ее применения требуется, чтобы вы думали в понятиях вероятности, а это не очень хорошо получается у большинства из нас (включая и большинство «экспертов»-прогнозистов). По сути, такой подход предполагает борьбу с чрезмерной уверенностью в себе, которая в немалых дозах присутствует у большинства прогнозистов. Помимо этого, оценка предполагает изучение большого объема данных, то есть сотен созданных прогнозов[70].
Метеорологи вполне соответствуют этому стандарту. Они ежедневно прогнозируют температуру и вероятность дождя и других осадков в сотнях городов. В течение любого года они создают десятки тысяч прогнозов.
Подобная высокая частота прогнозов невероятно полезна не только в тех случаях, когда мы хотим оценить прогноз, но также и для самих прогнозистов – они будут получать заметную обратную связь, если делают что-то не так, а следовательно, и изменить свой курс. Например, некоторым компьютерным моделям свойственно проявлять небольшое искажение{281} – они прогнозируют дождь чаще, чем тот идет на самом деле. Однако как только вам становится известно об этом искажении, вы можете его скорректировать. Аналогичным образом вы можете довольно быстро понять, что ваши прогнозы чересчур оптимистичны.
Оказалось, что прогнозы Национальной службы погоды на удивление хорошо откалиброваны{282} (рис. 4.7). Когда в ее прогнозе говорится, что вероятность дождя составляет 20 %, он действительно идет в 20 % случаев. Эта служба хорошо воспользовалась обратной связью, и ее прогнозы достаточно точны и честны.
Рис. 4.7. Оценка калибровки прогнозов Национальной службы погоды – расхождение между прогнозируемым и реальным выпадением осадков
Метеорологи Weather Channel немного лукавят, но при определенных условиях. Например, исторически сложилось так, что, когда они говорят о том, что вероятность дождя – 20 %, в реальности в эти дни дождь идет лишь в 5 % случаев{283}. Это делается сознательно, и Weather Channel даже согласен это признать. Все дело в экономических стимулах.
Люди замечают один тип ошибки – неспособность предсказать дождь – значительно чаще, чем другой – ложную тревогу. Если дождь начинается, когда не должен, они проклинают синоптиков за то, что им приходится отменять пикник, а неожиданный солнечный день воспринимается ими как приятный сюрприз. С научной точки зрения это не очень хорошо, однако как призналась мне доктор Роуз из Weather Channel: «Если бы прогноз был объективным и обладал нулевым искажением с точки зрения частоты и осадков, у нас возникли бы немалые проблемы».
При этом Weather Channel – достаточно консервативная организация (многие зрители даже ошибочно принимают ее за правительственную), и чаще всего она умело соответствует этой роли. Прогнозируемый ею «сдвиг в сторону осадков» ограничен небольшим преувеличением вероятности дождя даже в случае, когда его возникновение почти нереально – например, они говорят о 20 %-ной вероятности, когда ее реальное значение составляет 5 или 10 %. Таким образом она пытается обезопасить себя на всякий неблагоприятный случай. Во всех остальных случаях ее прогнозы хорошо откалиброваны (рис. 4.8). Когда ее сотрудники говорят, например, о 70 %-ной вероятности дождя, этим данным можно верить.
Рис. 4.8. Оценка калибровки прогнозов Weather Channel – расхождение между прогнозируемым и реальным выпадением осадков
Но когда речь заходит о прогнозах погоды на местных телевизионных каналах, можно и голову потерять. Здесь искажение начинает проявляться в полную силу, и правильность и честность страдают сильнее всего.
Канзас-Сити можно считать отличным рынком для прогнозов погоды – тут бывает и палящее жаркое лето, и холодные зимы, торнадо и засухи, а кроме этого, он достаточно велик, и в нем ведется трансляция всех основных кабельных каналов. Житель города по имени Дж. Д. Эгглстон начал отслеживать содержание прогнозов погоды на местных каналах, желая помочь своей дочери-пятикласснице с выполнением домашнего задания. Он посчитал этот анализ крайне интересным делом и занимался им в течение семи месяцев, публикуя результаты своего исследования в блоге Freakonomics{284}.
Телевизионные синоптики обычно не уделяют особого внимания правильности. Напротив, их прогнозы были значительно хуже, чем прогнозы Национальной службы погоды, которые они могли бы бесплатно брать с сайта и транслировать в своих программах. Помимо всего прочего, они были ужасно откалиброваны. Согласно исследованию Эгглстона, в тех случаях, когда метеоролог из Канзас-Сити говорил о том, вероятность дождя составляет 100 %, обещанный дождь так и не начинался в трети случаев (рис. 4.9).
Рис. 4.9. Оценка калибровки прогнозов, передаваемых на местном ТВ-канале, – расхождение между прогнозируемым и реальным выпадением осадков
Синоптики даже не считали нужным за это извиняться. «Точность не входит в число критериев при найме метеорологов на работу. Главное – это не правильность прогноза, а то, как она презентуется», – сказал один из них Эгглстону. «Правильность не особенно важна для зрителей», – говорил другой. Судя по всему, они относятся к своей работе как к милому развлечению: кого волнует небольшое изменение прогноза – «сдвиг в сторону осадков», – если оно идет на пользу телекомпании? А поскольку публика в любом случае не думает, что наши прогнозы достаточно хороши, к чему нам беспокоиться из-за точности?
Эта логика начинает напоминать замкнутый круг. Синоптики на телевидении говорят, что им нет нужды делать точные прогнозы, поскольку, по их мнению, зрители все равно им не поверят. Однако у публики нет оснований им верить, поскольку их прогнозы неточны.
Проблема становится куда более масштабной, когда возникает некое не терпящее отлагательств событие – например, ураган «Катрина». Очень многие американцы получают информацию о погоде из местных источников{285}, а не напрямую от Центра прогнозирования ураганов, поэтому они все равно будут надеяться, что люди с телевизионных каналов станут снабжать их точной информацией. При условии взаимного недоверия между синоптиками и общественностью последняя никогда не будет слушать, даже когда это оказывается самым важным.
Конус хаоса
Макс Мэйфилд сообщил Конгрессу, что он готовился к тому, что ураган, подобный «Катрине», может обрушиться на Новый Орлеан, почти всю свою 60-летнюю жизнь{286}. Мэйфилд вырос в жестких погодных условиях – в Оклахоме, сердце «Аллеи Торнадо» – и начал свою карьеру в области прогнозирования в Военно-воздушных силах, где люди серьезно относятся к риску и создают настоящие боевые планы для противостояния неблагоприятным погодным условиям. Ему потребовалось немало времени, чтобы понять, насколько сложно для Национального центра слежения за ураганами доносить свои прогнозы до широкой публики.
«После урагана “Хьюго” в 1989 г., – вспоминал Мэйфилд, растягивая слова, как истинный уроженец Оклахомы, – я беседовал с ученым из Университета штата Флорида, изучающим проблемы поведения людей. По его словам, люди не реагируют на предупреждения об ураганах. Я почувствовал себя оскорбленным этим замечанием – разумеется, они это делают. Однако впоследствии я понял, что он абсолютно прав. Люди не реагируют на одну лишь фразу “предупреждение об урагане”. Они внимательно относятся к тому, что слышат от местных властей. Вам наверняка бы не понравилось, если бы синоптик или телевизионный диктор принимал решения о том, когда открывать убежища или менять схему дорожного движения».
Под руководством Мэйфилда Национальный центр по слежению за ураганами начал обращать значительно больше внимания на то, как он представлял свои прогнозы. В отличие от сайтов большинства правительственных учреждений, которые выглядят так, будто не обновлялись с первых дней существования интернета, центр уделяет огромное внимание дизайну своих продуктов и создает множество ярких и привлекательных графиков, позволяющих точно и интуитивно уловить информацию по разнообразным параметрам, начиная от скорости ветра и заканчивая силой возможного шторма.
Также Центр слежения за ураганами немало заботится о том, как представлять неопределенность в своих прогнозах. «Неопределенность – это фундаментальный компонент предсказания погоды, – сказал Мэйфилд. – Никакой прогноз не будет полным без описания этой неопределенности в той или иной форме». Вместо того чтобы показывать линию для предсказанной траектории урагана, их графики изображают конус неопределенности. «Некоторые люди называют его конусом хаоса», – рассказывает Мэйфилд. Конус показывает диапазон территории, где, вероятнее всего, приземлится глаз урагана{287}. Но Мэйфилда волнует то обстоятельство, что даже этого недостаточно. Такие важные проблемы, как внезапное наводнение (которое порой бывает чуть ли не опаснее самого урагана), может произойти далеко от центра шторма и значительно позже снижения пиковой скорости ветра. Ни один человек в Нью-Йорке не умер от последствий урагана «Ирен» в 2011 г., несмотря на массовый ажиотаж на тему урагана в СМИ, однако три человека погибли в результате наводнения в имеющем выход к морю Вермонте{288} после того, как телевизионщики выключили свои камеры.
Обычно Центр слежения за ураганами не издает руководств и указаний для местных официальных лиц, например, о способах проведения эвакуации жителей города. Вместо этого данная функция передается 122 местным офисам Национальной службы погоды, которые общаются с губернаторами и мэрами, шерифами и полицейским начальством. Официальная версия – местные власти смогут лучше понимать культуру и людей, с которыми им приходится сотрудничать. После разговора с Мэйфилдом я понял, что неофициальная причина состоит в том, что Центр хочет сохранить свою миссию максимально ясной. Он, и только он, издает прогнозы об ураганах, и ему важно, чтобы эти прогнозы были максимально точными и честными и исключали возможность появления любых потенциальных отвлечений от основной темы.
Однако такой подход – оставаться в стороне – не мог сработать в условиях Нового Орлеана. Мэйфилду было нужно поднять телефонную трубку.
Решения об эвакуации непросты отчасти и потому, что сама по себе эвакуация может оказаться смертельно опасной. Так, автобус с пациентами, эвакуированными из одной из больниц во время другого шторма 2005 г. (урагана «Рита»), попал в аварию и сгорел при выезде из Хьюстона, и в результате погибло 23 пожилых пассажира{289}. «Иметь дело с этими местными начальниками непросто, – говорит Мэйфилд. – Они смотрят на вероятностную информацию и превращают ее в решение. Идти или не идти. Да или нет. Они должны взять вероятностное решение и превратить его в нечто более конкретное».
В данном случае необходимость эвакуации была очевидной, однако сообщение никак не могло достигнуть адресата.
«У нас работал молодой человек по имени Мэттью Грин. Исключительный молодой человек с научной степенью в области метеорологии. Он координировал предупреждения местным властям. Его мать жила в Новом Орлеане. По какой-то причине она решила не покидать город. И вот представьте себе парня, который знает все об ураганах и управлении в кризисных ситуациях и даже не может эвакуировать собственную мать».
Поэтому Центр принялся обзванивать местных официальных лиц по всему побережью. В субботу 27 августа – после того, как прогноз ухудшился, но за два дня до того, как «Катрина» нанесла удар, – Мэйфилд разговаривал с губернатором штата Миссисипи Хейли Барбур, которая тут же распорядилась об обязательной эвакуации из самых уязвимых районов штата{290}, и губернатором штата Луизиана Кэтлин Бланко, объявившей чрезвычайное положение. Бланко сообщила Мэйфилду, что ему стоит позвонить Рэю Нэйджину, мэру Нового Орлеана, который реагировал на происходившее значительно медленнее.
Нэйджин пропустил звонок от Мэйфилда, однако перезвонил ему сам. «Не помню в точности, что я говорил, – рассказывал мне Мэйфилд. – За эти два-три дня мы общались с кучей людей. Однако я абсолютно уверен, что сказал ему о том, что ему нужно принять жесткое решение, потому что на кону стоят жизни многих людей». Мэйфилд посоветовал Нэйджину издать приказ об обязательной эвакуации, и сделать это максимально быстро.
Вместо этого Нэйджин издал документ о добровольной эвакуации. В его администрации царило настроение в духе «все в порядке», но лишь приказ об обязательной эвакуации мог помочь людям почувствовать всю силу угрозы{291}. Без проведения обязательной эвакуации большинство жителей Нового Орлеана просто не могло бы выжить, когда на город в 1965 г. обрушился ураган «Бетси». Те, кто пережил это бедствие, сформировали определенный иммунитет. «Если мне удалось выжить после “Бетси”, я смогу выжить и в следующий раз. Мы умеем справляться с ураганами», – рассказывал позднее официальным лицам пожилой житель города, решивший остаться{292}. Реакция такого рода была вполне типичной. Исследования последствий «Катрины» и других ураганов показали, что человек, переживший один ураган, с меньшей охотой будет эвакуироваться при угрозе нового урагана{293}.
Причины, по которым Нэйджин запоздал с изданием приказа об эвакуации, остаются предметом споров – по одной из версий, он беспокоился из-за того, что владельцы гостиниц могут подать иск против властей, обвинив их в нарушении нормального хода работы{294}. Как бы то ни было, он не объявлял об обязательной эвакуации до 11 часов утра воскресенья{295}. К этому моменту жители, не получившие четких указаний, уже находились в изрядном смятении. Одно из исследований показало, что примерно треть жителей, отказавшихся от эвакуации, не услышали приказа от властей. Еще одна треть услышала его, но посчитала, что в нем нет ясных инструкций{296}. Опросы людей, переживших стихийные бедствия, не всегда надежны – людям сложно выразить, почему они вели себя определенным образом в условиях серьезного эмоционального стресса{297}, и лишь некоторая доля населения всегда скажет о том, что не слышала приказа об эвакуации, даже если он выпущен достаточно рано и повторен несколько раз. Однако в данном случае Нэйджин нес прямую ответственность за значительную часть возникшего смятения.
Разумеется, всегда найдется, кого винить в проблемах, вызванных приходом «Катрины», – в дополнение к Нэйджину можно упомянуть и о роли FEMA[71]. Можно говорить о разной степени доверия к различным источникам – большинство людей эвакуировалось отчасти вследствие точного прогноза, сделанного Центром по слежению за ураганами. Если бы в результате урагана «Бетси» в 1965 г. до того, как появились более надежные прогнозы ураганов, были затоплены дамбы, то количество смертей в итоге могло бы оказаться значительно выше, чем после «Катрины».
Однако урок, который вытекает из опыта с «Катриной», состоит в том, что правильность – это лучшая политика для прогнозиста. С точки зрения прогнозов желание поставить политические соображения, личную славу или экономическое благосостояние выше истины прогноза можно считать настоящим смертным грехом. Иногда это делается с добрыми намерениями, однако всегда приводит к ухудшению прогноза. Центр по слежению за ураганами прикладывает огромные усилия, чтобы не позволять подобным обстоятельствам ставить под сомнение его прогнозы. И, возможно, не случайным является и тот факт, что в противовес всем примерам неудачных прогнозов, приведенных в этой книге, их собственные прогнозы улучшились на 350 % только за последние 25 лет.
«Роль прогнозиста состоит в создании наилучшего из возможных прогнозов», – говорит Мэйфилд. Все очень просто – однако прогнозисты во множестве областей раз за разом делают все не так.
Глава 5
В отчаянных поисках сигнала
Прохладным апрельским воскресным вечером 2009 г. жители итальянского города Л’Акуила, уже собиравшиеся отправиться ко сну, вдруг почувствовали пару толчков, каждый из которых ощущался немного сильнее, чем те, что вызывает проходящий где-то вдалеке грузовой поезд. Первый из них, который зарегистрировали около 11 часов вечера по местному времени, имел силу 3,9 балла по шкале магнитуд[72] – этого было достаточно, чтобы пощекотать жителям нервы и сдвинуть с места кое-какую мебель, но не более. Второй оказался еще более слабым, магнитудой 3,5 балла, а его силы не хватило бы даже для того, чтобы разбудить крепко спящего человека.
Однако жители Л’Акуилы, расположенной у подножия Апеннинских гор и известной своими лыжными курортами и средневековыми стенами, находились в нервном напряжении: в тот период они ощущали подобные землетрясения чуть ли не постоянно. Воскресные толчки были седьмым и восьмым из них с магнитудой не менее 3 баллов за последнюю неделю. Небольшие землетрясения вполне естественны для этой местности, однако обычно они наблюдаются намного реже – примерно одно в два-три месяца. В этот раз землетрясения происходили чуть ли не в 100 раз чаще.
Жители города Сульмоны, расположенного у подножия одной из соседних гор, совсем незадолго до этого пережили аналогичные страхи, связанные с землетрясениями. Инженер по имени Джанпаоло Джулиани, работавший в итальянском национальном Институте ядерной физики, заявил о том, что ему удалось выявить необычно высокую концентрацию радона в этом регионе. Он предположил, что подобный факт может являться предвестником землетрясения, поэтому Джулиани не поленился сообщить мэру Сульмоны о том, что землетрясение затронет их город в полдень 29 марта. Мэр, впечатленный этим предсказанием, приказал направить в город грузовики с громкоговорителями, чтобы предупредить жителей о надвигающейся угрозе{298}.
Однако в назначенный день землетрясения в Сульмоне так и не было. И так как предсказание не сбылось, местные власти обвинили Джулиани в procurato allarme (паникерстве), по сути, напоминавшем крики о пожаре в переполненном театре. Он был вынужден убрать свои предсказания из интернета, чтобы не раздувать панику в будущем.
Власти Л’Акуилы сообщили жителям, что им не стоит беспокоиться из-за «роя мелких землетрясений»[73]. По словам заместителя руководителя Департамента гражданской обороны Италии Бернардо де Бернардиниса{299}, «рой землетрясений» позволил «сбросить энергию» и уменьшил шансы на крупное землетрясение. Он согласился с репортером, бравшим у него интервью, в том, что им стоит расслабиться и насладиться бокалом вина{300}; де Бернардинис порекомендовал отличный сорт местного вина монтепульчиано.
Однако сильное землетрясение магнитудой 6,3 балла в Л’Акуилe все же произошло. Оно началось в 3:32 утра по местному времени в понедельник. Дома сотрясались до основания, крыши сносило, мебель разбивалась в щепки. Во время землетрясения погибло более 300 жителей, без крыши над головой осталось 65 тыс. человек, а общая величина связанных с ним убытков составила свыше 16 млрд долл.{301}.
Что мы делаем, если наши устои пошатнулись
Л’Акуиле следовало бы лучше подготовиться к землетрясению. Этот город находится неподалеку от особенно опасного типа разлома земной коры, известного как зона субдукции[74], где Африканская плита, одна из восьми основных тектонических плит, покрывающих поверхность Земли, немного проскальзывает вниз, медленно и неминуемо оказываясь под Евразийской. Первое значительное землетрясение в этом районе было зафиксировано в 1315 г., а затем землетрясения вновь происходили в 1349, 1452, 1461, 1501, 1646, 1703 и 1706 гг.{302}; во время самого серьезного из них, в 1786 г., погибло свыше 5000 человек. Каждый раз город восстанавливался и вновь заселялся (часто по прямому указанию папы){303}.
С тех пор Л’Акуила испытывала судьбу на протяжении более чем двух столетий. Землетрясение 1958 г. было довольно слабым, магнитудой 5 баллов{304}, и о нем вспоминали лишь самые старые жители города. Землетрясение 2009 г. оказалось значительно более мощным. Магнитуда оценивается по логарифмической шкале; ее возрастание по шкале на 1 балл соответствует увеличению выброса энергии в 32 раза. Таким образом, землетрясение 2009 г. магнитудой 6,3 балла было в 75 раз более мощным, чем землетрясение 1958 г. И оно было примерно в 3000 раз сильнее колебаний-предвестников, которые Л’Акуила испытала чуть раньше тем же вечером.
При этом, хотя землетрясение 2009 г. и было серьезным, по итальянским стандартам, его вряд ли можно было считать чем-то значительным в глобальном масштабе. Землетрясение, разрушившее Японию в 2011 г., имело магнитуду 9,0 или 9,1 балла, то есть почти в 11 тыс. раз более мощным. А крупнейшее землетрясение, зафиксированное со времен начала надежных расчетов и обрушившееся на Чили в 1960 г., имело магнитуду 9,5 балла, то есть было почти в 60 тыс. раз сильнее, чем землетрясение в Л’Акуиле.
Почему же тогда Л’Акуила – довольно зажиточный город в богатой, промышленно развитой стране – подверглась столь значительным разрушениям? Одна из причин – геологическое строение местности: Л’Акуила располагается на древнем озерном пласте, усиливающем любые колебания Земли. На таком же пласте построен Мехико-Сити{305}, и во время землетрясения 1985 г., эпицентр которого находился на удалении 200 миль, в городе погибло 10 тыс. жителей.
Однако основная причина проста и заключается в том, что жители города были благодушны и слишком спокойно относились к сейсмической угрозе, находившейся всего в 15 км ниже уровня земли. В городе не было ничего, что хоть как-то демонстрировало бы надлежащий уровень готовности к землетрясениям{306}: ни норм на строительство, ни запасов предметов первой необходимости, ни тренировок населения. В результате землетрясения разрушились не только столетние здания, но и множество новых, в том числе крыло госпиталя, выстроенного не далее как в 2000 г. Даже небольшое заблаговременное предостережение могло бы спасти огромное количество жизней.
Но можно ли считать предостережением заявление Джанпаоло Джулиани? В итальянских таблоидах его изображали как настоящего подвижника и мученика. Этот человек с мягким голосом и растрепанными волосами, часто одевавшийся в форму местной футбольной команды, играл роль скромного государственного служащего или рассеянного профессора, открытия которого были проигнорированы научным истеблишментом. Он заявил, что предупредил о землетрясении в Л’Акуиле всех своих друзей и членов семьи и что полиция не дозволила ему рассказать об этом остальным. Также он потребовал, чтобы власти принесли извинения – не ему лично, а жителям Л’Акуилы.
Стоит помнить, что на самом деле Джулиани не предсказывал землетрясения. Его прогноз был вполне конкретным – риску подвергалась Сульмона, а не Л’Акуила, а само землетрясение должно было произойти в марте, а не в апреле. По сути, он даже сообщил местной газете о том, что опасность миновала. «Если говорить просто, – заявил он, прежде чем пуститься в бессвязные рассуждения о лунных циклах, – система Земля – Луна оказалась на уровне перигелия… минимального расстояния от Земли и на одной линии с планетой Венера… думаю, что могу успокоить моих соотечественников, поскольку «рой землетрясений» будет уменьшаться с конца марта»{307}.
Перигелий с планетой Венера? Газ радон? Что общего у всего этого с землетрясением? А что можно сказать о неудачном предсказании Джулиани относительно Сульмоны? Казалось, что все это не имеет никакого значения. Когда случается катастрофа, мы принимаемся искать сигнал в шуме – мы ищем хоть какое-то объяснение окружающего нас хаоса и пытаемся вновь навести порядок в мире. И лучшим, что было в нашем распоряжении в тот момент, оказались путаные объяснения Джулиани.
Никакой другой тип катастрофы не разрушает наше ощущение порядка так, как землетрясения. Они буквально потрясают нас до самого основания. Если ураганы спускаются на нас с небес и иногда даже ассоциируются с Божьей волей[75], то землетрясения возникают глубоко под землей и порой воспринимаются как знаки гнева Бога{308}, его безразличия{309} или даже отсутствия (Лиссабонское землетрясение 1755 г. стало одной из искр, из которых разгорелось пламя светской философии{310}). И если ураганы – равно как и наводнения, торнадо и извержения вулканов – часто можно предсказывать заранее, усилия множества ученых на протяжении столетий так и не дали нам надежного инструмента для предсказания землетрясений.
Волшебные жабы и поиск Святого Грааля
Город Пасадена, штат Калифорния, уже давно считается мировым эпицентром исследований в области землетрясений. Именно там находится Калифорнийский технологический институт, в котором Чарльз Рихтер разработал в 1935 г. свою знаменитую логарифмическую шкалу. Также там располагается один из офисов Службы геологии, геодезии и картографии США (USGS), в котором работает большое количество специалистов по исследованию землетрясений. Я поехал туда в сентябре 2009 г., чтобы встретиться с доктором Сьюзен Хоф, одной из ведущих сейсмологов USGS и автором ряда книг по вопросу предсказания землетрясений. Она с немалым подозрением изучила телевизионные интервью Джулиани, а затем написала яркую редакторскую статью в газете New York Times{311}, где раскритиковала как самого Джулиани, так и внимание, которое ему уделялось.
По мнению, высказанному Хоф, успех Джулиани был результатом совпадения. «Все услышали о предсказаниях Джулиани только потому, что оно смогло выплыть на поверхность, – писала она. – Но я знаю массу других [неверных] предсказаний, о которых широкая публика никогда не слышала». Если в мире есть сотни людей, пытающихся обратить внимание на свои прогнозы, и при этом ежегодно происходят сотни землетрясений, то кому-то неминуемо удастся попасть со своим прогнозом в цель.
Теории Джулиани о радоне и лунных циклах неоднократно изучались{312}, однако, по мнению признанных сейсмологов, данные теории не могут использоваться для достоверного предсказывания землетрясений. Джулиани просто повезло, как везет обезьянке, которой удается напечатать на машинке текст пьесы Шекспира, или осьминогу, успешно предсказавшему результаты Кубка мира по футболу.
Офис Хоф в USGS располагается в тихом уголке университетского кампуса, где количество эвкалиптовых деревьев намного превышает количество находящихся в этом районе студентов. Во время нашей встречи Хоф выглядела немного уставшей от странствий – она только что вернулась из Турции, где изучала систему разломов коры при землетрясениях. Эта женщина с мягкими манерами, темными глазами и вьющимися волосами общается в устало-скептическом тоне. «А какова ваша основная работа?» – озадачила она меня вопросом уже через несколько минут после знакомства.
В какой-то момент во время разговора она взяла со стола небольшой глобус, наподобие тех, что продаются в сувенирных лавках аэропортов, и провела указательным пальцем линию в направлении востока и юго-востока, начав с Японского моря.
«Самые разрушительные землетрясения концентрируются в этом поясе – от южного Китая до Греции, – объяснила Хоф. – Это довольно сложная зона – в ней располагается множество зданий с довольно уязвимой конструкцией. Крупное землетрясение где-нибудь под Тегераном может убить миллион человек».
Фактически почти все самые ужасные землетрясения в современной истории (рис. 5.1) произошли на отмеченном Хоф пути, проходящем через колыбель цивилизации на Ближнем Востоке и некоторые самые густонаселенные регионы на планете, включая Китай и Индию. Эти регионы, часто бедные и перенаселенные, порой просто не имеют возможности подготовиться даже к одной катастрофе в 300 лет. Однако, если землетрясения в них все же происходят, последствия бывают катастрофическими, а количество жертв измеряется сотнями тысяч[76].
Рис. 5.1. Расположение мест, где произошли землетрясения с наибольшим количеством жертв, начиная с 1900 г. Размер кругов соответствует количеству жертв. Источник: USGS
Во время землетрясений погибает больше людей, чем при ураганах{313}, несмотря на то что происходят они значительно реже{314}. Возможно, это связано с тем, что обычно не удается сделать достаточно точные предсказания их времени и места. Если в наши дни точность предсказания места зарождения урагана в три и более раз выше, чем 25 лет назад, то наука прогнозирования землетрясений почти не развилась с IX в. н. э., когда японцы впервые заявили о возможности предсказывать землетрясения, основываясь на изучении поведения сомов{315} (в различные периоды времени сообщалось также о необычном поведении коров, свиней, угрей, крыс, попугаев, чаек, черепах, золотых рыбок и змей в преддверии землетрясений).
Чудаков типа Джулиани до сих пор принимают всерьез, причем не только в итальянских таблоидах{316}. Калифорнийский Центр по предсказаниям землетрясений ежегодно получает сотни неожиданных прогнозов землетрясений, большинство из которых, по словам представителя агентства, «описывает странное поведение домашних питомцев, интуицию, ноющие кости тети Агаты или другие таинственные знаки и предзнаменования, которые ученые просто не понимают»{317}. При этом некоторые публикации в научной прессе сложно отличить от средневекового японского фольклора. В одной из работ 2010 г.{318}, опубликованной в сравнительно престижном журнале Journal of Zoology, сообщалось о том, что жабы в пруду, расположенном в 80 км от Л’Акуилы, перестали квакать за пять дней до крупного землетрясения{319}. Примечательно, что, по мнению авторов, это было достаточным свидетельством того, что жабы способны предсказывать землетрясения.
Именно такие исследования больше всего и огорчают Хоф. «Если оглянуться назад, скажем, в 1970‑е, то можно увидеть, как у людей появлялась какая-то идея, которая вселяла в них оптимизм, но потом, когда проходило лет десять, и этот метод отвергался, – рассказывала она мне. – Через десять лет у вас появлялся очередной новый метод, а еще через десять лет отказывались и от него. Большинство ведущих ученых занимаются поисками Святого Грааля, который, возможно, вообще не существует».
Опровергнуть версии Джулиани, связанные с влиянием Венеры или со способностями жаб, очень легко, но есть ли у нас хоть какой-то другой способ предсказать землетрясение? Что можно сказать о «рое мелких землетрясений» в окрестностях Л’Акуилы перед Большим Ударом? Было ли это простым совпадением? Сейсмологическое сообщество известно своим консерватизмом. Например, оно довольно медленно принимало теорию тектоники плит{320} – широко распространенного в настоящее время мнения о том, что основной причиной землетрясений служит смещение континентальных плит Земли. Идея была предложена еще в 1912 г., однако ученые согласились с ней лишь в 1960‑е. Может быть, скепсис Хоф уже превратился в цинизм?
Официальная позиция USGS еще более эмпатична – согласно ей, землетрясения невозможно предсказать. «Ни USGS, ни представителям Калифорнийского института, а также никаким другим ученым никогда не удавалось предсказать значительное землетрясение, – утверждается на сайте организации{321}. – Неизвестно, как это делать, и мы не ожидаем, что будем знать, как это делать, в обозримом будущем».
Действительно ли предсказывать землетрясения невозможно? Эта книга рассказывает о предсказаниях, а не занимается предсказаниями, однако сейчас я хочу выступить с заявлением – я прогнозирую, что в следующем году в Японии будет больше землетрясений, чем в Нью-Джерси. Я также предсказываю, что в какой-то момент в течение следующей сотни лет серьезное землетрясение произойдет где-то в Калифорнии{322}.
Мы вместе с USGS играем в семантические игры. Понятия «предсказание» и «прогноз» по-разному используются в различных областях человеческой деятельности; в некоторых случаях они могут считаться синонимами, а в других между ними проводится четкое различие. Вряд ли найдется отрасль науки, более чувствительная к этому различию, чем сейсмология.
1. Предсказание – это конкретное и детальное заявление о том, когда и где ударит землетрясение: 28 июня в Киото, Япония, произойдет сильное землетрясение.
2. Прогноз же представляет собой вероятностное заявление, обычно рассматривающие возможность события в течение более длительного периода: вероятность землетрясения в Южной Калифорнии в ближайшие 30 лет составляет 60 %.
Официальная позиция USGS состоит в том, что землетрясения невозможно предсказать. Однако их можно спрогнозировать.
Что мы знаем о том, как часто и какими бывают землетрясения
При внимательном изучении сайта USGS вы найдете там множество инструментов, помогающих прогнозировать землетрясения. Один из них позволяет вам ввести широту и долготу для любой точки на территории США, после чего он выдаст вам долгосрочную вероятность землетрясения в ней{323}.
Из данных, приведенных в табл. 5.1, можно увидеть, какова вероятность землетрясений в нескольких крупных городах США, по данным USGS. Мы знаем, что Калифорния сейсмически активна; по расчетам USGS, землетрясение с магнитудой 6,8 балла или выше будет происходить в районе Сан-Франциско примерно каждые 35 лет. Многие также знают, что множество землетрясений происходило и на Аляске – в 1964 г. в районе Анкориджа произошло второе по величине из известных нам землетрясений с магнитудой 9,4 балла.
Таблица 5.1. Частота сильных (магнитуда ≥ 6,75 балла) землетрясений в пределах 80-километрового радиуса от некоторых городов США
Но доводилось ли вам слышать о Чарльстоне, штат Южная Каролина? Это тоже сейсмически активная зона; в 1886 г. там произошло землетрясение магнитудой 7,3 балла. USGS считает, что в этом районе крупное землетрясение будет происходить примерно 1 раз в 600 лет. Если же вы живете в Сиэтле, то вам стоит подготовить план действий на случай землетрясения; по мнению USGS, опасность землетрясения в нем выше, чем во многих частях Калифорнии. Возможно, такой план не потребуется жителям Денвера, находящегося на безопасном расстоянии от границ континентов.
На сайте USGS можно найти довольно много конкретной и удобной для анализа информации. Это может показаться странным для организации, утверждающей невозможность предсказания землетрясений. Однако прогнозы USGS основаны на широко используемом сейсмологическом инструменте, именуемом законом Гутенберга – Рихтера. Теория, созданная Чарльзом Рихтером и его коллегой из Калифорнийского технологического института Бено Гутенбергом в 1944 г., основана на эмпирической статистике землетрясений. Согласно ей, существует сравнительно простая связь между магнитудой землетрясения и частотой его возникновения.
Сравнив частоту землетрясений с их магнитудами, можно обнаружить, что количество землетрясений снижается по мере роста магнитуды. Если катастрофических землетрясений довольно мало, то незначительных землетрясений – буквально миллионы: ежегодно в мире происходит примерно 1,3 млн землетрясений с магнитудой от 2,0 до 2,9 балла{324}. Большинство из них остается незамеченными, как людьми, так и сейсмометрами{325}. Однако в наши дни приборы улавливают почти все землетрясения с магнитудой 4,5 балла и выше (хотя не всегда точно оценивают их местоположение). На рис. 5.2а показана экспоненциальная зависимость частоты землетрясений от их магнитуды, основанная на фактической статистике землетрясений с января 1964 г.{326} по март 2012 г.{327}.
Рис. 5.2а. Зависимость частоты землетрясений в год от их магнитуды по всему миру, январь 1964 г. – март 2012 г.
Однако если немного изменить этот график, то можно выявить потрясающую закономерность. На графике, приведенном на рис. 5.2б, по вертикальной оси показана частота землетрясений с различными магнитудами в логарифмическом масштабе[77]. Теперь линия на графике становится почти ровной. Подобный вид графика характерен для так называемого степенного распределения, и именно эту связь удалось установить Рихтеру и Гутенбергу.
Рис. 5.2б. Зависимость частоты землетрясений в год от их магнитуды по всему миру, январь 1964 г. – март 2012 г.; логарифмическая шкала
Данные, соответствующие этому распределению, обладают очень полезным свойством – вы можете спрогнозировать некоторое количество масштабных явлений на основе менее значительных, и наоборот. Что касается землетрясений, то оказалось, что при каждом повышении магнитуды на один пункт частота землетрясений снижается примерно в 10 раз. Например, землетрясения с магнитудой 6 баллов возникают в десять раз чаще, чем с магнитудой 7 баллов, и в 100 раз чаще, чем с магнитудой 8 баллов.
Более того, соответствие закону Гутенберга – Рихтера наблюдается как в отдельных регионах, так и по всей планете. Предположим, к примеру, что мы хотим составить прогноз землетрясений для иранской столицы Тегерана. К счастью, с момента начала сейсмологических замеров в этом регионе не было никаких катастрофических землетрясений. Однако за период между 1960 и 2009 гг. в окрестности города произошло около 15 землетрясений с магнитудой от 5,0 до 5,9 балла{328}. Иными словами, в среднем одно подобное землетрясение происходит раз в три года. Согласно выводам Гутенберга и Рихтера, это значит, что в Тегеране примерно раз в 30 лет может произойти землетрясение с магнитудой, величина которой находится между значениями 6,0 и 6,9 балла.
Также из этого следует, что раз в 300 лет в районе Тегерана может произойти землетрясение с магнитудой от 7 баллов. Именно такого землетрясения боится Сьюзен Хоф. Землетрясение магнитудой 7 баллов на Гаити, случившееся в 2010 г. и погубившее 316 тыс. человек{329}, продемонстрировало апокалиптические последствия подобных событий для развивающегося мира. Многие из проблем Ирана аналогичны проблемам Гаити – бедность, низкий контроль над соблюдением строительных норм, политическая коррупция{330}, – однако плотность населения в Иране значительно выше. По расчетам USGS, с учетом показателей общей смертности в стране, в случае катастрофического подземного толчка может погибнуть от 15 до 30 % населения Тегерана{331}. Поскольку в ареале Тегерана живет около 13 млн человек, количество жертв может составить от 2 до 3 млн.
Из того факта, что частота землетрясений и их магнитуда подчиняются закону Гутенберга – Рихтера, вовсе не следует, что мы можем узнать, когда именно произойдет землетрясение (также не следует, что в Тегеране «неминуемо» случится землетрясение, если только другое землетрясение не произошло там совсем недавно). У таких стран, как Иран и Гаити, нет возможности реализовывать планы действий в отношении события, происходящего раз в 300 лет. Прогнозы землетрясений, созданные на основе закона Гутенберга – Рихтера, дают лишь общее руководство по оценке степени угрозы в том или ином регионе. Прогнозы погоды, основанные лишь на исторической статистике (в марте в Лондоне дождь идет 35 % времени), не всегда превращаются в применимые на практике знания (брать ли мне с собой зонт или нет?). В геологии временны́е срезы охватывают века или даже тысячелетия; а срок человеческой жизни измеряется не секундами, а годами.
Искушение сейсмологов
На самом деле сейсмологи заинтересованы иметь то, что Сьюзен Хоф называет «Святым Граалем» сейсмологии, – прогнозы, связанные со временем, согласно которым вероятность землетрясения не считается равномерно распределенной во времени. Даже те из них, кто скептично относится к возможности делать подобные прогнозы, признают, что в распределении землетрясений по времени присутствуют определенные закономерности. А самая очевидная из них – наличие повторных сейсмических ударов (также называемых афтершоками).
После крупных землетрясений почти всегда возникают десятки или даже тысячи афтершоков (после землетрясения 2011 г. в Японии ученые насчитали не менее 1200). Эти афтершоки следуют довольно предсказуемой тенденции{332}. Они возникают значительно чаще сразу же после землетрясения, чем через несколько дней после него, и значительно чаще, чем через несколько недель.
Однако знание этого обстоятельства не особенно помогает нам, когда речь заходит о спасении человеческих жизней. Прежде всего потому, что афтершоки, по определению, всегда слабее изначального землетрясения. Обычно, если какой-то разлом земной коры вызывает достаточно мощное землетрясение, количество афтершоков будет небольшим, и на какой-то момент в регионе воцарится спокойствие. Однако так происходит не всегда. Например, невероятно сильное землетрясение, произошедшее в районе Нью-Мадридского геологического разлома на границе штатов Миссури и Теннесси 16 декабря 1811 г. и оцененное сейсмологами в 8,2 балла, произошло всего через шесть часов после другого удара примерно той же силы. Но на этом дело не закончилось – после землетрясений 16 декабря произошло еще одно землетрясение силой 8,1 балла (23 января), а затем еще одно, даже более мощное – силой 8,3 балла (7 февраля). Какие из них можно было бы считать предвестниками, а какие – афтершоком? Любая версия будет в данном случае бессмысленной.
Разумеется, главный вопрос состоит в том, способны ли мы предсказать землетрясения заранее и можем ли мы отличить предвестника от афтершока? И когда мы смотрим на данные по распределению землетрясений во времени и пространстве, у нас появляется искушение предположить, что в шуме может иметься какой-то сигнал.
Например, на рис. 5.3a показано распределение землетрясений, произошедших вблизи Л’Акуилы{333} за период с 2006 г. до момента возникновения землетрясения 2009 г. магнитудой 6,3 балла{334}. На графике кружками, за исключением большого черного круга (относящегося к основному землетрясению), отмечены время и магнитуда других землетрясений, произошедших ранее. В случае Л’Акуилы ситуация представляется довольно ясной. Непосредственно перед ударом 2009 г. в регионе произошел целый ряд землетрясений силой до 4 баллов – что было значительно выше прежнего уровня сейсмической активности.
Рис. 5.3а. Соотношение между землетрясениями, произошедшими вблизи Л’Акуилы (Италия) за период с 1 января 2006 г. по 6 апреля 2009 г., и их магнитудами
Менее очевидной представляется ситуация с землетрясением 2011 г., произошедшим в Японии. На графике, сделанном для региона Тохоку (рис. 5.3б), мы прежде всего видим, что эта местность сейсмически более активна, чем окрестности Л’Акуилы в Италии. Однако можно ли выявить на нем какие-то закономерности в распределении землетрясений по времени? Судя по всему, да; например, выделяется группа землетрясений силой от 5,5 до 7 баллов, произошедших в середине 2008 г. Однако они не сопровождались более масштабным землетрясением. При этом заметен особенно крупный предварительный толчок силой 7,5 балла (9 марта 2011 г.), случившийся примерно за 50 часов до землетрясения магнитудой 9,1 балла в Тохоку{335}.
Рис. 5.3б. Соотношение между землетрясениями, произошедшими вблизи Тохоку (Япония) за период с 1 января 2006 г. по 11 марта 2011 г., и их магнитудами
Однако заметные предвестники возникают лишь у половины значительных землетрясений{336}. На Гаити их не было (рис. 5.3в). К сожалению, в большинстве карибских регионов имеется недостаточно инструментов для проведения замеров, поэтому у нас нет данных о землетрясениях магнитудой 2 и 3 балла, однако сейсмометры в США и других регионах способны уловить колебания на уровне 4 баллов и больше. Последний раз землетрясение магнитудой 4 балла в этом регионе зарегистрировано в 2005 г., то есть за пять лет до 7-балльного землетрясения 2010 г. Иными словами, не было никаких предупреждающих сигналов.
Еще сильнее ситуацию усложняют ложные сигналы – периоды повышенной сейсмической активности, не завершающиеся значительными толчками. Сейсмологи отлично помнят целый ряд небольших землетрясений, произошедших около города Рино, штат Невада, в начале 2008 г.
Рис. 5.3 в. Соотношение между землетрясениями, произошедшими вблизи Леогана (Гаити) за период с 1 января 2000 г. по 12 января 2010 г., и их магнитудами
«Рой землетрясений» в Рино напоминает тот, что наблюдался в Л’Акуиле в 2009 г. Однако он так и не привел ни к чему значительному; самое значительное землетрясение в серии имело магнитуду 5,0 (рис. 5.3 г).
Рис. 5.3 г. Соотношение между землетрясениями, произошедшими вблизи Рино, штат Невада, за период с 1 января 2006 г. по 31 декабря 2011 г., и их магнитудами
И это всего лишь часть того невообразимого массива данных, с которым работают сейсмологи. Он ввергает их в мучительное состояние: с одной стороны, этот массив не случаен, а с другой – недостаточно предсказуем. Возможно, мы могли бы хоть как-то продвинуться вперед в области прогнозирования землетрясений, даже если и не получится делать точные предсказания. Однако все прежние попытки предсказать землетрясения почти всегда завершались полной неудачей.
Парад неудачных прогнозов
Изданная в 2009 г. книга Сьюзен Хоф «Предсказывая непредсказуемое: волнующая всех наука о предсказаниях землетрясений» (Hough S. «Predicting Unpredictable: Tumultuous Science of Earthquake Prediction») представляет собой своеобразную историю попыток предсказать землетрясения, и, судя по всему, они оказались ненамного успешнее, чем прогнозы политических экспертов, о которых писал Фил Тетлок в своем исследовании.
В общем, в этой области в целом особый прогресс не наблюдается, однако можно увидеть много ложных сигналов.
Лима, Перу
Один из самых печально известных случаев неудачных прогнозов связан с Брайаном Брэди, получившим докторскую степень в МТИ и работавшим в Колорадском горном училище. По его расчетам, в 1981 г. в районе столицы Перу Лимы должно было произойти землетрясение магнитудой 9,2 балла – одно из крупнейших за всю историю наблюдений{337}. Поначалу его предсказание получило определенную поддержку в сейсмологическом сообществе – ее ранняя версия была создана в сотрудничестве с ученым из USGS. Однако затем Брэди начал включать в нее множество новых элементов – от анализа горных пород, которые он исследовал в годы занятий горным делом, до теории относительности Эйнштейна. По мере того как теория становилась все более сложной, коллеги начали все чаще говорить ему о том, что перестают понимать ее суть{338}: то есть, мягко говоря, что он сошел с ума. В какой-то момент Брэди предсказал, что землетрясение магнитудой 9,2 балла будет лишь первым в ряду землетрясений в Перу, а кульминацией станет рекордное землетрясение в августе 1981 г. магнитудой 9,9 балла{339}.
Предсказание просочилось в перуанские СМИ и изрядно напугало население; казавшийся серьезным американский ученый был убежден, что столица страны скоро окажется в руинах. Их тревога лишь усилилась после новостей о том, что перуанский Красный Крест в рамках подготовки к возможному бедствию затребовал 100 тыс. мешков для захоронения трупов. Снизился наплыв туристов, и упали цены на недвижимость{340}. Со временем правительство США отправило в Перу группу ученых и дипломатов с целью успокоить нервы жителей. Новость о том, что в 1981 г. Большое Перуанское землетрясение так и не произошло (равно как и небольшое), попала на первые страницы многих газет.
Паркфилд, штат Калифорния
Несмотря на то что история в Лиме наглядно показала, что ложные тревоги оказывают значительное психологическое и экономическое влияние на население, сейсмологи продолжили поиски святого Грааля. Если Брэди можно было назвать одиноким волком, то известны и другие случаи, когда предсказание землетрясения получало более явную поддержку со стороны USGS и широкого сейсмологического сообщества. Однако и среди них трудно найти примеры удачных предсказаний.
Одной из самых активно изучаемых сейсмических зон в мире является Паркфилд, штат Калифорния, располагающийся вдоль разлома Сан-Андреас (в районе, ограниченном Фресно и Бейкерсфилдом). В течение довольно длительного времени с интервалами примерно в 22 года, то есть в 1857, 1881, 1901, 1922, 1934 и 1966 гг., в Паркфилде возникали землетрясения. В одном из научных исследований, профинансированном USGS{341}, был описан тренд и дан прогноз, что с вероятностью в 95 % в период между 1983 и 1993 гг. (а скорее всего, в 1988 г.) в этом районе произойдет очередное землетрясение. Однако в реальности более-менее заметное землетрясение произошло в Паркфилде лишь в 2004 г., что явно не соответствовало предсказанию.
Помимо того что предсказание землетрясений в Паркфилде было ошибочным, оно усилило популярное заблуждение о том, что эти события происходят через равные промежутки времени и что региону «суждено» пережить землетрясение, если оно не наблюдалось там в течение какого-то времени в прошлом. Землетрясения возникают в результате роста напряжения вдоль линий разлома. Напряжение нарастает, пока не происходит выброс наподобие того, как из гейзера выбивается струя горячей воды. Затем напряжение спадает, и процесс начинается с самого начала.
Однако система разломов довольно сложна – регионы, подобные Калифорнии, имеют множество разломов, и каждый из них обладает собственными особенностями и спецификой. В результате землетрясения может произойти частичное снижение напряжения на одном участке разлома, но оно может передаться соседним или даже отдаленным уголкам того же разлома{342}. Более того, напряжение на разломе сложно зафиксировать напрямую до тех пор, пока не произойдет землетрясение.
То есть если в Сан-Франциско в соответствии с прогнозом значительное землетрясение происходит каждые 35 лет, из этого вовсе не следует, что такие события распределяются равномерно (например, в 1900, 1935, 1970 гг.). Правильнее предположить, что вероятность ежегодных землетрясений составляет 1 из 35, и что это соотношение не будет особенно сильно меняться со временем вне зависимости от того, сколько времени прошло с предыдущего.
Пустыня Мохаве, штат Калифорния
Казалось, что после фиаско Брэди и Паркфилда интерес к попыткам предсказывать землетрясения утихнет. Однако он вернулся в 2000‑х гг. с удвоенной силой, и произошло это благодаря появлению методов прогнозирования, основанных на статистике.
Один из таких методов активно выдвигался Владимиром Кейлисом-Бороком, родившимся в России, математиком и геофизиком, который, несмотря на то, что ему уже далеко за 80, до сих пор преподает в Калифорнийском университете. Кейлис-Борок многое сделал для развития теории формирования землетрясений. Впервые его взгляды стали известны широкой публике после того, как в 1986 г., во время встречи на высшем уровне в Рейкьявике с Михаилом Горбачевым, президенту Рейгану передали лист бумаги с предсказанием сильного землетрясения, которое должно будет произойти в течение ближайших пяти лет в Соединенных Штатах. Позднее многие согласились с тем, что речь шла о землетрясении в Лома-Приета, обрушившемся на Сан-Франциско в 1989 г.{343}.
В 2004 г. Кейлис-Борок со своей командой заявил о том, что им удалось достичь «значительного прогресса» в предсказании землетрясений{344}. Выявляя закономерности при изучении слабых землетрясений в заданном регионе, исследователи могли, по их собственным словам, предсказывать более значительные. Для этого Кейлис-Борок использовал достаточно сложные и туманные методы{345}. Каждое из землетрясений, имевших место в прошлом, описывалось серией из восьми уравнений, применявшихся для различных комбинаций времени и пространства. Однако, по словам команды, этот метод позволил достаточно точно предсказать землетрясения 2003 г. в Сан-Симеоне, штат Калифорния, и на острове Хоккайдо в Японии.
Остается не до конца понятным, действительно ли исследователи выступили с публичными и заблаговременными заявлениями о землетрясениях в Сан-Симеоне и на Хоккайдо{346}; поиск по текстам газетных статей за 2003 г. через систему Lexis-Nexis не привел к каким-либо результатам{347}. При оценке успеха того или иного метода прогнозирования крайне важно разделять сами предсказания и последующие рассказы о них; предсказание прошлого представляет собой явный оксюморон, и очевидно, что его не стоит относить к примерам успеха{348}.
Однако к январю 2004 г. Кейлис-Борок довольно громко заявил о другом своем предсказании: в течение следующих девяти месяцев землетрясение магнитудой не менее 6,4 балла должно было произойти в пустыне Мохаве в Южной Калифорнии{349}. Это заявление привлекло всеобщее внимание: Кейлису-Бороку были посвящены статьи в журнале Discover, газете Los Angeles Times и примерно в десятке других значимых изданий. Ему позвонили из офиса губернатора Шварценеггера; власти собрали чрезвычайное заседание. Даже знаменитые своим скепсисом сотрудники USGS были готовы уделить этой информации внимание; на сайте института было написано, что «работа команды Кейлиса-Борока основывается на вполне разумном подходе к исследованиям в области предсказания землетрясений»{350}.
Однако крупного землетрясения в пустыне Мохаве не произошло ни в тот год, ни в последующее десятилетие. Команда Кейлиса-Борока продолжала выступать со своими предсказаниями землетрясений в Калифорнии, Италии и Японии, но без особого успеха: проведенный в 2010 г. анализ показал, что прогнозы оказались точными лишь в трех случаях, а в 23 были ошибочными{351}.
Суматра, Индонезия
Но в предсказаниях землетрясений встречаются ошибки и иного рода: прогнозируется, что в каком-то регионе землетрясение заданной магнитуды маловероятно или невозможно, – а затем оно вдруг происходит. Дэвид Боумэн, бывший ученик Кейлиса-Борока, возглавляющий в настоящее время департамент геологических наук в Университете штата Калифорния в Фуллертоне, удвоил свои усилия по предсказанию землетрясений после землетрясения 2004 г. на Суматре – ужасающего бедствия с магнитудой 9,2 балла, приведшего к возникновению цунами и гибели 230 тыс. человек.
Методика Боумэна (как и Кейлиса-Борока) базировалась на серьезном математическом аппарате и использовала землетрясения средней силы для предсказаний более значительных{352}. Однако это был более элегантный и амбициозный подход. Боумэн предложил теорию, в рамках которой попытался дать количественную оценку величине напряжения в различных точках в системе разломов. В отличие от подхода Кейлиса-Борока, метод Боумэна позволял предсказывать вероятность землетрясения в любой части разлома. Таким образом, он мог предсказать не только где может произойти землетрясение, но и те участки земной поверхности, где его возникновение было бы маловероятным.
Поначалу Боумэн и его команда достигли определенного успеха; его метод позволил выявить зону риска на Суматре, в эпицентре которой в марте 2005 г. произошел серьезный афтершок с измеренной магнитудой 8,6 балла. Однако в научной работе, которую он опубликовал в 2006 г., было высказано предположение, что риск землетрясений в другой части разлома, в Индийском океане недалеко от индонезийской провинции Бенкулу особенно мал{353}. Но уже через год, в сентябре 2007 г., целый ряд землетрясений произошел именно в этой области, причем магнитуда самого сильного из них достигала 8,5 балла. К счастью, землетрясения произошли достаточно далеко от берега и привели к незначительным жертвам. Однако они оказались разрушительными для теории Боумэна.
Между молотом и наковальней
После того как его модель потерпела фиаско, в 2007 г. Боумэн поступил так, как редко делают прогнозисты. Вместо того чтобы возложить всю вину на неудачу (его модель допускала некоторую возможность землетрясения около Бенкулу, однако незначительную), он еще раз изучил ее и решил, что его подход к предсказанию землетрясений был фундаментально ошибочным, – после чего сдался.
«Я – несостоявшийся прогнозист, – рассказывал мне Боумэн в 2010 г. – Я совершил смелый и глупый поступок – выступил с предсказанием, которое можно проверить. Именно это, в принципе, мы и должны делать, но, когда предсказания оказываются ошибочными, это приносит боль».
Идея Боумэна заключалась в том, чтобы выделить основополагающие причины землетрясений – и на их основе формулировать прогнозы. В сущности, он хотел понять, каким образом изменяется и распространяется напряжение во всей системе. В основе его подхода лежала теория хаоса.
Сама по себе теория хаоса – это демон, которого можно приручить. И это удалось, хотя бы частично, сделать синоптикам. Они гораздо лучше понимают, что происходит в атмосфере, чем сейсмологи – в земной коре. В большей или меньшей степени они представляют себе, как работает погода на молекулярном уровне.
У сейсмологов нет такого преимущества. «Анализировать климатические системы просто, – размышлял Боумэн. – Если они хотят увидеть, что происходит в атмосфере, им нужно просто посмотреть наверх. Мы же смотрим на лежащий под ногами камень. Большинство событий происходит на глубине 15 м под землей. Если отвлечься от того, что показывают в фантастических фильмах, у нас нет никакой надежды туда попасть. Это – фундаментальная проблема. Нет такого способа, используя который можно было бы напрямую измерить напряжение».
Не обладая теоретическим пониманием, подобным тому, что есть у синоптиков, сейсмологи вынуждены полагаться исключительно на статистические методы предсказания землетрясения. Вы можете ввести статистическую переменную под названием «напряжение» в свою модель, как попытался сделать Боумэн. Однако, поскольку величину этой переменной невозможно измерить напрямую, она может быть выражена исключительно в виде математической функции от параметров прошлых землетрясений. Боумэн полагает, что исключительно статистические подходы подобного рода, с большой долей вероятности, не сработают. «Набор данных содержит огромную долю шума, – полагает он. – При тестировании гипотез мы просто не можем получить статистически значимые результаты».
Процесс, происходящий в системах, основанных на данных с большой долей шума и на не до конца разработанной теории (а таковыми являются предсказания землетрясений или отдельные области экономики и политики), состоит из двух этапов. Сначала люди начинают ошибочно принимать шум за сигнал. После этого возникший шум заполняет журналы, блоги и новости ложными сигналами, подрывающими научное развитие и мешающими нам понимать, как на самом деле работает система.
Оверфиттинг: самая важная научная проблема, о которой вы никогда не слышали
Когда статистики ошибаются и принимают шумы за сигнал, они называют это оверфиттингом[78]. Представьте себе, что вы – мелкий уголовник, а я – ваш босс. Я поручаю вам найти хороший метод подбора цифровых комбинаций для цифровых замков, аналогичных тем, что можно найти в школьных шкафчиках (возможно, мы хотим стащить у школьников деньги, припасенные на обед). Я хочу, чтобы вы нашли способ, позволяющий с высокой вероятностью подобрать нужную комбинацию замков в любое время и в любом месте. Для практики я даю вам три замка – красный, черный и синий.
Поэкспериментировав с замками в течение нескольких дней, вы возвращаетесь ко мне и рассказываете, что смогли найти ошибкоустойчивое решение. По вашим словам, если замок красный, то правильная комбинация – 27–12–31. Если он черный, то нужно использовать цифры 44–14–19, а если синий – 10–3–32.
На все это я могу сказать только то, что вы не справились с заданием. Очевидно, что вы вычислили, как открыть эти три конкретных замка. Однако вы ничего не сделали для создания теории, позволяющей открывать замки, когда комбинация неизвестна нам заранее. Допустим, я бы хотел узнать, можно ли открывать эти замки с помощью скрепки из хорошей стали или же следует воспользоваться каким-то присущим им механическим дефектом. Даже если бы это вам не удалось, вы могли бы найти какой-то обходной маневр – например, какие-то цифры, которые появляются в комбинациях чаще других. Вы же дали мне слишком конкретное решение для общей проблемы. Это и есть оверфиттинг, и он способен привести к ухудшению любых прогнозов.
Название оверфиттинг (оverfitting) связано с тем, что статистические модели «подстраиваются, подгоняются» (fit) под прошлые наблюдения. Степень подгонки может быть слишком общей. И такое явление называется «андерфиттингом» (underfitting). При андерфиттинге вы захватываете меньшую часть сигнала по сравнению с максимально возможной. Либо же модель может обладать свойством оверфиттинга, иными словами, ваши данные содержат слишком много шума, что не позволяет четко выявить структуру, лежащую в их основе. На практике второй тип ошибки встречается намного чаще.
Чтобы понять, как это работает, давайте использовать допущение, которого в реальной жизни не бывает почти никогда. Мы будем точно знать, как должны выглядеть реальные данные. На графике на рис. 5.4 изображена гладкая параболическая кривая с максимумом посередине. Такой кривой можно описывать любые интересные для нас данные из реального мира. Например, как мы уже видели в главе 3, именно такая кривая довольно четко описывает изменение результативности бейсболистов с увеличением возраста, поскольку они значительно более результативны в середине своей карьеры, чем в конце или начале.
Рис. 5.4. Истинное распределение данных
Однако мы не можем наблюдать эту зависимость напрямую. Вместо этого мы имеем набор отдельных точек, характеризующих данные, на базе которых мы должны найти закономерность. Кроме этого, на эти точки данных влияет масса своеобразных обстоятельств – иными словами, у нас имеются и сигнал, и некоторый шум.
На график я нанес 100 точек данных, представленных в виде кругов и треугольников. Этого должно быть достаточно для выявления сигнала даже с учетом шума. Хотя в данных и присутствует некая доля случайности, вполне понятно, что они в целом следуют нашей кривой.
Но что произойдет, если объем данных, имеющийся в нашем распоряжении, окажется более ограниченным (как обычно и происходит в реальной жизни)? Очевидно, что это приведет к увеличению ошибки. На графике, приведенном на рис. 5.5a, показаны примерно 25 точек из сотни. Каким образом вы могли бы теперь соединить эти точки?
Рис. 5.5а. Ограниченная выборка данных
Рис. 5.5б. Хорошо подобранная модель
Разумеется, зная, как должна выглядеть подлинная тенденция, вы будете склонны соединять точки в виде некоторой кривой. На практике моделирование таких данных с помощью простого математического инструмента, известного как квадратное уравнение, действительно помогает выявить связь, очень похожую на истинную (рис. 5.5б).
В ситуациях, когда мы не знаем, какими должны быть наши данные, но хотим, чтобы они соответствовали «платоническому идеалу», мы часто склонны проявлять жадность. На рис. 5.5в отражен результат такого поведения – модель с оверфиттингом. При создании этого графика была разработана комплексная функция{354}, которая отыскивает каждую из отдаленных точек данных. При попытке «увязать» их между собой значение функции колеблется (довольно невероятным образом) вверх и вниз. И в результате мы еще больше удаляемся от понимания истинной связи, и прогнозы, которые мы делаем, становятся еще менее качественными.
Казалось бы, что избежать подобной ошибки легко, но только в том случае, если бы мы были всемогущи и всегда представляли себе структуру данных. Однако почти всегда в реальных условиях нам приходится действовать по индукции[79], находя структуру на основе имеющихся данных. Скорее всего, в вашей модели будет проявляться оверфиттинг, когда объем данных ограничен, сами данные засорены шумом, а ваше понимание фундаментальных связей достаточно слабо. И эти обстоятельства принимаются во внимание при прогнозировании землетрясений.
Когда мы не знаем об истинной связи или не хотим об этом знать, у нас появляется множество причин, по которым мы будем склоняться к оверфиттингу. Одна из них состоит в том, что модель с оверфиттингом будет лучше соответствовать результатам большинства статистических тестов, используемых прогнозистами. Например, довольно часто встречается тест, который оценивает разброс данных в модели. Судя по его результатам, модель с оверфиттингом (см. рис. 5.5в) позволяет объяснить 85 % дисперсии. И благодаря этому она выглядит «лучше», чем модель с хорошей степенью подгонки (см. рис. 5.5б), объясняющая лишь 56 %. Однако, по сути, модель с оверфиттингом обеспечивает такие высокие результаты за счет своеобразного обмана – она скорее принимает во внимание шум, а не сигнал. То есть на самом деле она обладает меньшей степенью достоверности при объяснении событий в реальном мире{355}.
Рис. 5.5 в. Модель с оверфиттингом
Несмотря на всю очевидность приведенного выше объяснения, многие прогнозисты полностью игнорируют эту проблему. Значительное количество статистических методов, имеющихся в распоряжении исследователей, позволяет им вести себя подобно ребенку, пытающемуся увидеть в формах облаков изображения зверей (это занятие, безусловно, очень интересное, но совершенно ненаучное)[80]. Математик Джон фон Нейман говорил об этой проблеме так: «Кривую с четырьмя параметрами я могу подогнать под слона, а с пятью – я заставлю слона махать хоботом»{356}.
Оверфиттинг представляет собой двойную проблему: он помогает нашей модели лучше выглядеть на бумаге, однако в действительности показывать худшие результаты. И из-за второй проблемы модель с оверфиттингом, применяемая для создания реальных прогнозов, в какой-то момент сильно нас подведет. А первая проблема будет создавать для нашей модели слишком впечатляющий образ (опять же до поры). Она будет считаться очень точной и заслуживающей доверия, подлинным шагом вперед по сравнению с прежними техниками. Это даст возможность опубликовать ее в научных изданиях, вытеснив с рынка другие модели, показывающие более честную картину. Но если модель включает в себя шум, у нее есть немалый потенциал для того, чтобы повредить научным результатам.
Как вы, возможно, уже догадались, модель прогнозирования землетрясений Кейлиса-Борока обладала огромным оверфиттингом. В ней использовался невероятно сложный набор уравнений, примененных к данным с большой долей шумов. За это пришлось заплатить свою цену – из 23 прогнозов, сделанных на ее основе, лишь три оказались верными. Дэвид Боумэн признал, что в созданной им модели имелись аналогичные проблемы, и вовремя перестал над ней работать.
Должен сразу сказать, что эти ошибки, как правило, представляют собой вполне искренние заблуждения. Если воспользоваться названием другой книги, то они отражают нашу склонность быть одураченными случайностью[81]. Особенности нашей модели могут казаться нам вполне объяснимыми и допустимыми. Мы даже можем, в полной мере этого не осознавая, работать в обратном направлении и создавать убедительно звучащие теории, позволяющие рационализировать нашу точку зрения и тем самым дурачить и самих себя, и своих друзей с коллегами. Майкл Бабяк, много писавший об этой проблеме{357}, характеризует дилемму следующим образом: «В научной работе мы стараемся выстроить баланс между любопытством и скепсисом».
И любопытство часто берет над нами верх.
Применялась ли в Японии модель с оверфиттингом?
Наша склонность ошибочно принимать шум за сигнал способна время от времени приводить к вполне печальным последствиям в реальной жизни. Япония, несмотря на высокую степень сейсмической активности в регионе, оказалась практически неготовой к разрушительному землетрясению 2011 г. Ядерный реактор в Фукусиме был способен выдержать землетрясения магнитудой до 8,6 балла{358}, но никак не 9,1 балла. Археологические находки позволяют предположить, что в прежние времена высота цунами могла достигать 40 м{359} (что и произошло после землетрясения 2011 г.), однако эти случаи были, по всей видимости, забыты или проигнорированы.
Землетрясения магнитудой 9,1 балла происходят в мире в высшей степени редко – никто не может предсказать такое сильное землетрясение с точностью до десятилетия, не говоря уже о конкретной дате. Однако если говорить о Японии, то некоторые ученые и специалисты по широкомасштабному планированию предпочли полностью проигнорировать такую возможность, что может свидетельствовать о присутствии оверфиттинга.
На рис. 5.6a представлено соотношение частоты повторения исторически достоверных землетрясений и их магнитуд с эпицентром в Японии{360}. При построении графика учитывались все данные, за исключением землетрясения магнитудой 9,1 балла, произошедшего 11 марта. Как видно из рисунка, они образуют практически линейную группу; именно такое соотношение и следует из расчетов по методу Гутенберга и Рихтера. Однако при значении магнитуды около 7,5 балла на графике возникает перегиб. С 1964 г. в регионе не было землетрясений магнитудой более 8 баллов, и поэтому изменение наклона кривой кажется вполне оправданным.
Рис. 5.6а. Соотношение между средней годовой частотой землетрясений и их магнитудами; Япония (регион Тохоку), период с 1 января 1964 г. по 10 марта 2011 г.
Каким же образом соединять точки? Если вы решите следовать методу Гутенберга – Рихтера, игнорируя перегиб на графике, то у вас получится прямая линия, как приведено на рис. 5.6б. Но можно использовать и метод, который сейсмологи называют характеристическим соответствием (characteristic fit) (рис. 5.6в). Этот метод предполагает, что исторически достоверные данные о частоте повторения землетрясений в этой области могут в полной мере использоваться для создания объективной картины. В конкретном случае это может означать, что вы посчитали перегиб в имеющихся исторических данных реальным. Иными словами, предположили наличие какой-то веской причины, по которой землетрясения магнитудой выше 7,6 балла в этом регионе маловероятны.
Рис. 5.6б. Соотношение между средней годовой частотой землетрясений и их магнитудами; метод Гутенберга – Рихтера; Япония (регион Тохоку), период с 1 января 1964 г. по 10 марта 2011 г.
Рис. 5.6 в. Соотношение между средней годовой частотой землетрясений и их магнитудами; метод характеристического соответствия; Япония (регион Тохоку), период с 1 января 1964 г. по 10 марта 2011 г.
И это еще один пример того случая, когда кажущийся безобидным выбор допущения приводит к радикально разным выводам – в данной ситуации о вероятности землетрясения магнитудой 9 баллов в этой части Японии. Если оценивать имеющиеся данные, основываясь на методе характеристического соответствия, то можно сделать вывод, что землетрясения такой силы там практически невозможны: согласно этому методу подобные события могли возникать лишь каждые 13 тыс. лет. Однако оценка по методу Гутенберга – Рихтера показывает, что такие землетрясения могли происходить каждые 300 лет. Иными словами, подобные события возникают редко, но вряд ли их можно считать невозможными. Связанный с ними риск довольно значителен, и такой богатой стране, как Япония, вполне по силам к нему подготовиться{361}.
Характеристическое соответствие достаточно хорошо описывало те землетрясения, что происходили в районе Тохоку за наблюдаемый период. Однако, как мы уже успели видеть, подобный тип сопоставления не всегда хорош. Иногда он сопровождается возникновением модели с оверфиттингом и в этом случае лишь усложняет работу по выявлению истины. В данном случае модель с оверфиттингом привела к значительной недооценке вероятности катастрофического землетрясения в данном районе страны.
Проблема метода характеристического соответствия состоит в том, что он полагается на невероятно слабый сигнал. Как я уже упоминал, до землетрясения в Тохоку в этом регионе за последние 45 лет не происходило ни одного землетрясения магнитудой 8 баллов и выше. Однако заметим для начала, такие события вообще происходят редко. Согласно закону закон Гутенберга – Рихтера землетрясения такого масштаба в этой области могли возникать лишь примерно один раз в 30 лет{362}. Так что нет ничего особенного в том, что событие, которое происходит примерно раз в 30 лет, может не произойти в течение какого-либо 45-летнего периода{363}. Такое просто случается, так же как и у отличного бейсболиста с рекордными показателями может быть плохой день. Кроме того, в этой области Японии было довольно немного землетрясений с магнитудами величиной порядка 7 баллов. В случаях когда подобные землетрясения происходили в других частях мира, они почти всегда были предвестниками более масштабных событий. Почему же ученые считали, что случай Тохоку можно считать особенным?
На самом деле, сейсмологи как в Японии, так и за ее пределами нашли для этой ситуации логическое обоснование. Они предположили, что особенности состава морского дна в этом регионе (плотность и низкая температура воды) могут препятствовать возникновению масштабных землетрясений{364}. Некоторые сейсмологи обратили внимание на тот факт, что до 2004 г. ни в одном регионе с подобным типом морского дна не происходило землетрясения магнитудой 9 баллов.
Однако такой вывод аналогичен утверждению, что ни один из жителей Пенсильвании не сможет выиграть джекпот в лотерею только потому, что этого не происходило за последние три недели. Землетрясения магнитудой 9 баллов, как и выигрыш в лотерею, происходят достаточно редко. Фактически до 2004 г. в мире было зафиксировано всего три таких землетрясения. Очевидно, что этих данных недостаточно для каких-то конкретных выводов о тех обстоятельствах, при которых подобные события могут или не могут произойти. Японский пример неудачного предсказания был не первым. Сходные заявления делались относительно Суматры{365}, в то время как там происходило множество землетрясений магнитудой в 7 баллов{366}, но не более. Но затем в декабре 2004 г. на Суматре произошло гигантское землетрясение магнитудой 9,2 балла{367}.
Закон Гутенберга – Рихтера не позволял точно предсказать дату землетрясения на Суматре или в Японии, однако допускал возможность их возникновения{368}. И до сих пор его положения работают, в то время как огромное количество других тщательных попыток предсказания землетрясений потерпели неудачу.
Что ограничивает наши знания о землетрясениях
Серьезные землетрясения последних лет заставляют сейсмологов переосмысливать вопрос о возможном верхнем значении их магнитуды. Если посмотреть на рис. 5.2б, где отражены все землетрясения с 1964 г. (включая землетрясения на Суматре и Тохоку), то мы видим почти прямую линию, проходящую через все точки данных. Если бы мы такой график построили 10 лет назад, на нем можно было бы найти больше перегибов – подобных тому, что мы наблюдаем на рис. 5.6a. Из этого следует, что реально происходило чуть меньше мегаземлетрясений, чем предсказывал закон Гутенберга – Рихтера, однако в последние годы мы наверстываем упущенное.
Поскольку землетрясения магнитудой 9 баллов происходят крайне редко, нам потребуются столетия, чтобы узнать реальное значение их частоты. Еще больше времени ноебходимо для того, чтобы понять, может ли произойти землетрясение магнитудой выше 9,5 балла. В разговоре со мной Хоф заявила о том, что география системы разломов может накладывать некоторые фундаментальные ограничения на масштаб землетрясений. По ее словам, в случае соединения самой крупной непрерывной последовательности разломов в мире – начиная от Терра Дель Фуэго на южной оконечности Южной Америки и заканчивая разломами на Алеутских островах, возможным стало бы и землетрясение с магнитудой 10 баллов. Однако наверняка это узнать практически невозможно.
Но даже если бы у нас имелись надежные сейсмологические записи за тысячу лет, не факт, что это бы сильно нам помогло. Не исключено, что у предсказуемости землетрясений есть свои естественные границы.
Землетрясение представляет собой комплексный по своей природе процесс. Теория сложности, разработанная покойным физиком Пером Баком и другими учеными, отличается от теории хаоса, хотя их часто объединяют. Согласно этой теории, даже самые простые вещи могут вести себя странным и таинственным образом при взаимодействии друг с другом.
Бак любил приводить пример с горкой песка на пляже. Если бросить на нее еще одну песчинку (а что может быть проще, чем песчинка?), то это может привести к одному из трех последствий. В зависимости от формы и размеров горка песка может остаться почти неизменной. Либо же с нее, после того как на нее упадет песчинка, каскадом сползут другие песчинки, скатившись до самой земли. Либо же может произойти нечто совершенно иное – если горка песка слишком неустойчива, то дополнительная песчинка способна дестабилизировать всю систему и привести к возникновению своеобразной песчаной лавины. Сходным свойством обладают и комплексные системы. Значительные периоды кажущегося застоя сменяется внезапными и катастрофическими динамичными процессами. Эти процессы в буквальном смысле не будут случайными, но они настолько сложны, что вы можете предсказать их возникновение только до определенного уровня понимания.
Красота шума
Тем не менее если вы будете рассматривать комплексный процесс с достаточно большого расстояния, то увидите в нем порядок и красоту. В этой книге я порой вольно обхожусь с понятиями «сигнал» и «шум», однако изначально эти термины появились в электротехнике. Инженеры выделяют несколько разных типов шума. Все они достаточно случайны, но при этом следуют определенным типам вероятностного распределения. Если вы послушаете настоящий «белый шум», создаваемый случайными всплесками звука над обычным распределением частот, то он покажется вам свистящим и довольно грубым. Другой тип шума, связанный с комплексными системами и называемый броуновским шумом, кажется более успокаивающим и чем-то напоминает звук падающей воды{369}.
Те же тектонические силы, которые создали линии разлома под поверхностью земли, позволили возникнуть потрясающим по своей красоте горам, плодородным долинам и живописным берегам рек и морей. Это значит, что люди, скорее всего, так и не перестанут жить в этих районах, несмотря на сейсмическую угрозу.
Суд над наукой
История с землетрясением в Л’Акуиле имела ироничный финал: в 2011 г. группа из семи ученых и правительственных чиновников предстала перед судом по обвинению в непредумышленном убийстве{370}. Прокуроры из Л’Акуилы утверждали, что подсудимые не обеспечили адекватного уведомления жителей об опасности значительного бедствия после целого «роя мелких землетрясений».
Очевидно, что этот суд был достаточно смехотворным. Но можно ли считать, что ученые могли лучше сделать свою работу? Вероятно. Существуют достаточно четкие доказательства того, что риск значительного землетрясения существенно (порой в 100–500 раз{371}) повышается после роя мелких. Тем не менее риск все же был крайне мал. Большинство «роев землетрясений» не приводит к возникновению серьезных последствий. Но было бы не совсем правильно предположить, что проблем нет и не может возникнуть и что жители могут расслабиться и выпить бокал вина.
В основе этой книги лежит убеждение в том, что первый долг любого прогнозиста состоит в сохранении верности истине. Политика в широком смысле этого слова порой может встать у него на пути.
Сейсмологическое сообщество до сих пор остается напуганным неудачными предсказаниями в Лиме и Паркфилде и тем, что ему приходится противостоять сильным противникам типа Джулиани. Это лишает ученых стимулов к работе и отвлекает от главной миссии. Плохие и безответственные прогнозы могут заменить собой хорошие.
Возможно, что Хоф права, утверждая, что мы никогда не сможем обрести святой Грааль в предсказании землетрясений. Даже если отдельные сейсмологи и ведут себя достаточно ответственно, мы тем не менее вынуждены оценивать коллективный исход этой научной дисциплины, а следовательно, все тысячи гипотез предсказуемости землетрясений. Имеющиеся на настоящий момент данные показывают, что большинство этих гипотез оказались неудачными и что какие-либо универсальные подходы к предсказанию землетрясений, по всей видимости, не работают.
Пока что можно вполне смело сказать, что если мы раз за разом используем один и тот же метод с небольшими корректировками, то это приводит к тем же самым результатам. Но история науки имеет массу примечательных страниц. Наука часто сталкивается с «непредсказуемыми» прорывами. Одна из областей, в которых сейсмологи смогли добиться определенного прогресса, связана с краткосрочными прогнозами землетрясений, что вполне могло бы помочь жителям Л’Акуилы.
Помимо закона Гутенберга – Рихтера, знание о том, что значительные землетрясения почти всегда приводят к появлению афтершоков, получило широкое признание в этой дисциплине. Некоторые сейсмологи, с которыми я общался, например Джон Рандл из Калифорнийского университета в Дэвисе и Том Йордан из Университета Южной Калифорнии, концентрируются на изучении этих краткосрочных прогнозов и убеждают других, что информация о содержимом таких прогнозов должна доноситься до публики ясно и в полном объеме.
Например, исследования Йордана показывают, что иногда афтершоки движутся в предсказуемом географическом направлении вдоль линии разлома. При движении в направлении населенных пунктов они могут представлять потенциальную угрозу для жизни и имущества даже при снижении магнитуды. Например, землетрясение магнитудой 5,8 балла в Крастчерче, Новая Зеландия, в 2011 г., когда погибло 185 человек, было афтершоком землетрясения в 7 баллов, возникшего в сентябре 2010 г. в отдаленном районе страны{372}. Когда речь заходит об афтершоках, у нас появляется значительно больше сигналов, поэтому концентрироваться на их изучении вполне естественно.
Кроме того, не стоит на месте и технология. Довольно многообещающими представляются недавние попытки NASA и Рандла измерить напряжение разлома с помощью систем дистанционного зондирования GPS-спутников{373}. Хотя в результате этих усилий пока что получены довольно грубые данные, в будущем они смогут обеспечить сейсмологов бо́льшим объемом данных и приблизить их к пониманию первопричин землетрясений.
Со временем эти методы приведут к определенной степени прогресса. Если на протяжении тысячелетий мы не могли говорить о сколь-нибудь значимом успехе в деле предсказания землетрясений, то стоит вспомнить, что то же самое мы говорили и о прогнозах погоды всего 40 лет назад. Возможно, что благодаря лучшему пониманию теории сложности – достаточно новой научной области – мы сможем прийти к заключению о том, что землетрясения не так уж и непредсказуемы.
Как бы то ни было, нам еще предстоит столкнуться с большим количеством неудачных предсказаний. Но, когда память о них ослабнет, мы вновь увидим, что на горизонте брезжит сигнал. И мы в своем стремлении к прогнозированию вновь направимся в его сторону, даже если это – всего лишь мираж.
Глава 6
Как утонуть на метровой глубине
Политические опросы общественного мнения всегда содержат в себе элемент допуска на ошибку, и мы всегда ожидаем, что в них присутствует некая неопределенность. Однако экономические прогнозы чаще всего ограничиваются одной-единственной цифрой. В следующем месяце будет создано 150 тыс. рабочих мест. ВВП вырастет в следующем году на 3 %. Цена нефти достигнет 120 долл. за баррель.
Подобные высказывания создают впечатление, что прогнозы невероятно точны.
Заголовки в экономической прессе, выражающие удивление любым незначительным отклонением от прогноза, часто выглядят следующим образом:
Неожиданный скачок уровня безработицы до 9,2 % наносит удар рынкам – Denver Post, 9 июля 2011 г.{374}.
Но если вы прочитаете сам текст этой статьи, то увидите, что неожиданным оказался рост до уровня 9,2 %, а не 9,1 %, как предсказывали экономисты{375}. Если одной десятой процента достаточно для того, чтобы об этом писали в заголовках, может показаться, что в обычных условиях эти прогнозы крайне надежны.
На самом же деле экономические прогнозы представляют собой в лучшем случае инструменты, редко способные предсказать переломные события в экономике более чем за несколько месяцев. Стоит отметить, что некоторые из этих прогнозов не смогли «предсказать» рецессию даже после ее начала: большинство экономистов не считало, что экономика находится в условиях рецессии, ни в 1990, ни в 2001, ни в 2007 гг. и признало это лишь постфактум{376}.
Предсказание поведения американской экономики, такой большой и сложной по своей сути, – непростая задача. Разрыв между тем, что показывают прогнозы, и тем, как они воспринимаются, довольно значителен.
Некоторые специалисты по экономическому прогнозированию не хотели бы, чтобы вы об этом знали. Как и специалисты по прогнозированию в других дисциплинах, они воспринимают неопределенность как врага, угрожающего их репутации. Они не оценивают ее с должной степенью четкости и не выдвигают предположений, которые способны, с одной стороны, снизить долю неопределенности в их моделях, а с другой – каким-либо способом улучшить их предсказания в реальном мире. И это приводит к тому, что мы остаемся не готовыми к реальным бедствиям.
Почему важно сообщать о неопределенности
В апреле 1997 г. река Ред-Ривер затопила город Гранд Форкс, штат Северная Дакота, вода перелилась через дамбы и проникла в город примерно на 3 км[82]{377}.
Хотя до человеческих жертв не дошло, почти все население города – около 50 тыс. человек – было эвакуировано, затраты на расчистку последствий наводнения составили миллиарды долларов{378}, а 75 % домов в городе оказались разрушенными или требовали серьезного ремонта{379}.
В отличие от ураганов и землетрясений, наводнения в Гранд Форкс могло не быть. Конструкции, предназначенные для защиты от наводнения, можно было укрепить с помощью мешков с песком{380}. И также существовала возможность направить поток воды в ненаселенные области – на фермерские поля, а не на школы, церкви и жилые дома.
Жители Гранд Форкс были осведомлены об угрозе наводнения за несколько месяцев. Той зимой на Великих Равнинах выпало невероятно много снега. Национальная служба погоды, предвидя возможные последствия его таяния, выпустила прогноз, согласно которому высота воды в Ред-Ривер могла подняться до 15 м – значения, близкого к рекордному.
Существовала одна небольшая проблема. Дамбы в Гранд Форкс были построены таким образом, что могли выдержать поток воды высотой до 15,5 м, поэтому даже небольшая ошибка в прогнозе могла оказаться роковой (рис. 6.1).
Однако реально уровень воды поднялся до 16,5 м. Конечно, прогноз Службы погоды в любом случае не мог быть идеальным, и ошибка в 1,5 м в прогнозе, сделанном за два месяца до прихода большой воды, кажется вполне разумной – по крайней мере, с точки зрения исторических данных. Величина предельной погрешности, рассчитанная статистически, в прошлом составляла ±2,7 м. Это означало, что вероятность того, что вода перельется через дамбу, составляла примерно 35 %{381}.
Рис. 6.1. Предсказанное значение уровня воды с учетом предельной погрешности{382}
Главная проблема состояла в том, что Служба погоды не сообщила широкой общественности о том, что в прогнозе присутствует неопределенность. В нем подчеркивалось лишь, что вода поднимется на 15 м. Позднее прогнозисты сообщили, что боялись ситуации, при которых общественность утратила бы доверие к прогнозам, если бы в них была подчеркнута хоть какая-то неопределенность.
В результате, вместо того чтобы лучше подготовиться к этому событию, а то и полностью избежать наводнения, укрепив и увеличив высоту дамбы и перенаправив водный поток, предоставленные сами себе жители поверили в то, что им не о чем беспокоиться (мало кто из них даже купил страховку на случай наводнения{383}). Предсказание о том, что уровень воды поднимется на 15 м, высказанное без каких-либо оговорок, давало основание считать, что высота потока будет именно такой и что высоты дамбы в 15,5 м будет вполне достаточно, чтобы обеспечить безопасность. Некоторые студенты даже восприняли цифру в 15 м как максимум возможного подъема уровня воды{384}.
Известна старая шутка – «статистик утонул, переходя через реку, средняя глубина которой составляла лишь один метр». В рамках прогнозной модели Службы погоды уровень воды поднимался в среднем на 15 м, однако даже небольшое его превышение могло привести к затоплению.
Как мы видели в главе 4, Национальная служба погоды со временем признала важность информирования о неопределенности в своих прогнозах, что делает их гораздо более точными и честными. Однако подобное отношение редко встречается у других прогнозистов – особенно тех, кто рассказывает о возможном движении экономики в том или ином направлении.
Рациональны ли экономисты?
Теперь давайте посмотрим, что произошло в ноябре 2007 г. До официального начала Великой рецессии оставался всего месяц. Уже были видны явные признаки проблемы на жилищном рынке – количество вынужденных выкупов недвижимости удвоилось{385}, а компания Countrywide, крупный кредитор на ипотечном рынке, оказалась на грани банкротства{386}. Не менее тревожные знаки были заметны и на кредитных рынках{387}.
Тем не менее экономисты в рамках ежеквартального опроса профессиональных прогнозистов Survey of Professional Forecasters (SPF), проводимого Федеральным резервным банком Филадельфии, считали будущую рецессию относительно маловероятной. Более того, они ожидали, что в 2008 г. экономика будет расти на уровне чуть меньше среднего уровня в 2,4 %, и, конечно, не предполагали возможности рецессии, столь сильной, как случилось в реальности.
Опрос SPF уникален в том смысле, что в ходе него экономистов просят максимально широко описать возможный диапазон направлений, по которым будет двигаться экономика. Как я уже неоднократно подчеркивал в этой книге, вероятностное изучение последствий представляет собой важнейшую часть научного прогноза. Если бы я попросил вас предсказать результат выбрасывания пары кубиков, то ваш точный ответ представлял бы собой не единственное число, а перечисление возможных вариантов и их сравнительную вероятность, как это проиллюстрировано на рис. 6.2. Хотя у вас будет выпадать число 7 гораздо чаще, чем любое другое, с точки зрения прогноза оно не имеет никаких преимуществ перед цифрой 2 или 12, при условии, что каждое число выпадает с вероятностью, которую вы присваиваете ему в долгосрочной перспективе.
Рис. 6.2. Прогнозируемое распределение вероятностей: сумма чисел на двух кубиках
Рис. 6.3. Прогнозируемое распределение вероятности роста реального ВВП США в 2008 г. Источник: SPF, ноябрь 2007 г.
Нечто подобное просят сделать и экономистов в рамках опроса SPF, когда они прогнозируют величину ВВП и других переменных. Например, их просят оценить вероятность того, что значение ВВП окажется между 2 и 3 % или же между 3 и 4 %. Вот как выглядели, по результатам их опроса, значения ВВП в ноябре 2007 г. (рис. 6.3).
Как упоминалось выше, экономисты в рамках этого опроса думали, что прирост ВВП по итогам 2008 г. составит примерно 2,4 %, то есть окажется чуть ниже уровня долгосрочного тренда. Этот прогноз оказался невероятно плохим. На самом деле, после того как ударил финансовый кризис, ВВП снизился на 3,3 %. Но что еще хуже: экономисты очень доверяли своим плохим прогнозам. По их мнению, вероятность снижения величины ВВП в 2008 г. составляла лишь 3 %{388}. А вероятность спада в экономике на уровне 2 % или более (что и произошло чуть позже) составляла, по их мнению, лишь 1 из 500{389}.
На самом деле экономисты уже давно демонстрируют слишком высокую степень доверия к своим способностям предсказывать направление развития экономики. На рис. 6.4 приведены данные о прогнозах роста ВВП, взятые из результатов опроса SPF за 18-летний период между 1993 и 2010 гг.{390}. Горизонтальными линиями на рисунке отмечены интервалы прогнозирования в 90 %, указанные экономистами.
Рис. 6.4. Прогнозы ВВП: 90 %-ные интервалы прогнозирования и реальные показатели
Интервал прогнозирования представляет собой диапазон наиболее вероятных вариантов значений роста ВВП в рамках прогноза и чем-то напоминает величину ошибки при политических опросах. Допустим, предполагается, что интервал прогнозирования, равный 90 %, должен покрывать 90 % всех возможных реальных вариантов. Вне этого интервала остаются лишь 10 % нестандартных случаев в хвостовых концах распределения. Если бы прогнозы экономистов были настолько точными, как заявляли они сами, то можно было бы ожидать, что реальная величина ВВП будет находиться в рамках указанных ими интервалов прогнозирования в 9 или в 10 случаях, или во всех случаях, за исключением двух, за 18 лет.
Реальная величина ВВП выпадала за пределы прогнозов экономистов шесть раз за 18 лет, или примерно в одной трети случаев. Авторы еще одного исследования, анализировавшие цифры, полученные начиная с самых первых опросов SPF в 1968 г., продемонстрировали, что ситуация с прогнозами экономистов еще хуже: реальный показатель ВВП не попадает в интервал прогнозирования почти в половине случаев{391}. Не стоит считать, что экономистам просто не повезло{392} – на самом деле они фундаментально переоценили степень надежности своих прогнозов.
На самом деле, когда группа экономистов дает вам свой прогноз по ВВП, истинный интервал прогнозирования в 90 %, основанный на соответствии этих прогнозов реальности{393}, а не на заявляемой самими экономистами степени точности, захватывает примерно 6,4 пункта ВВП (что эквивалентно ошибке в ±3,2 %)[83].
Иными словами, когда вы слышите в новостях, что ВВП вырастет в следующем году на 2,5 %, это может с тем же успехом означать и невероятный рост на 5,7 %, и падение на 0,7 %, то есть достаточно серьезную рецессию. До сих пор экономисты не смогли придумать ничего лучше, и нет особенных свидетельств тому, что качество их прогнозов улучшается. Старая шутка об экономистах, выявивших девять из последних шести рецессий, имеет под собой вполне реальную основу. В течение 1990‑х годов экономисты смогли заранее предсказать лишь две из 60 рецессий{394}.
В этом смысле экономисты не уникальны. Результат такого рода можно считать либо следствием того, что эксперты не умеют давать честное описание неопределенности в своих прогнозах, либо следствием того, что они не очень заинтересованы это делать. Такая же чрезмерная уверенность в достоверности прогнозов наблюдается и во множестве других областей, в том числе в медицинских исследованиях, политических науках, финансах и психологии. Судя по всему, она применяется и тогда, когда мы, создавая прогноз, основываемся на своих суждениях (а именно так делали политологи – гости Фила Тэтлока) или когда мы используем для этого статистическую модель (как в случае неудачных прогнозов землетрясений, описанных в главе 5).
Однако, в отличие от представителей других профессий, подобные ошибки экономистов могут считаться непростительными. В первую очередь их прогнозы не просто слишком самоуверенны, но и плохо применимы в условиях реального мира. Ошибка в прогнозах реального значения ВВП может приводить к существенным экономическим последствиям. Кроме того, организованные усилия по предсказанию значения таких переменных, как ВВП, проводятся уже много лет, начиная с опроса, проведенного Ливингстоном в 1946 г. Эти результаты хорошо задокументированы и имеются в бесплатном доступе. Получение обратной связи от того, как проявили себя наши прогнозы в реальности, – это единственный и, возможно, самый важный способ их улучшить.
Предсказатели в мире экономики получают больше обратной связи, чем представители большинства других профессий. Однако они предпочитают вести себя крайне самоуверенно и не желают исправлять собственные искажения.
Но разве экономика – это не дисциплина, изучающая рациональность поведения? Разумеется, вы можете ожидать, что представитель какой-то другой профессии, например антрополог, может допустить искажения при создании прогнозов, но не экономист. Возможно, именно с этим отчасти и связана проблема экономических прогнозов. Экономисты хорошо разбираются в вопросах рациональности. Это означает, что они хорошо понимают, как работает система стимулов. И если они делают искаженные прогнозы, то, возможно, это является признаком того, что у них недостаточно стимулов для создания хороших.
«Никто даже не представляет себе…»
Принимая во внимание такие результаты работы экономистов в области создания прогнозов, мне очень захотелось найти кого-нибудь из них, кто мог бы признать, насколько сложна его работа и насколько легко любой прогноз может оказаться неверным. И мне удалось найти такого человека – Яна Хациуса, главного экономиста компании Goldman Sachs.
Хациус может, по крайней мере, смело утверждать, что его прогнозы в последние годы были более надежными, чем у его конкурентов. В ноябре 2007 г., пока большинство экономистов все еще думало, что рецессия любого рода маловероятна, Хациус опубликовал провокационное письмо под названием «Долги с рычагом, или Почему дефолт на ипотечном рынке так важен». В письме предупреждалось о возможном развитии такого сценария, при котором миллионы домовладельцев могли оказаться неплатежеспособными. Это могло, в свою очередь, вызвать эффект домино на кредитных и финансовых рынках, привести к триллионным убыткам и очень жесткой рецессии. Примерно такой сценарий и был реализован. Хациус и его команда отозвались критически и о возможности чудесного послекризисного восстановления. В феврале 2009 г., через месяц после принятия закона о пакете стимулирующих финансовых мер и заявлении Белого дома о возможности снизить безработицу до уровня в 7,8 % к концу 2009 г., Хациус спрогнозировал рост безработицы до 9,5 %{395} (что оказалось довольно близко к реальному значению – 9,9 %).
Хациус, мягкий почти до меланхолии немец, занимающий должность главного экономиста Goldman Sachs с 2005 г.{396}, через восемь лет после начала работы в компании вызывает уважение даже у тех, кто скептически относится к большим банкам.
«[Ян] очень хорош, – рассказывал мне Пол Кругман. – Я надеюсь, что присущее Ллойду Бланкфейну злорадство не отразится на Яне и его людях». Кроме того, Хациус на удивление спокойно относится к своей способности предсказывать направление развития экономики США.
«Никто даже не представляет себе, – рассказывал он мне на встрече в офисе Goldman со стеклянными стенами, расположенном на Уэст-стрит в Нью-Йорке, – насколько сложно прогнозировать цикл бизнеса. Понимание сути такого комплексного процесса, как экономика, – это невероятно сложный процесс».
С точки зрения Хациуса, у людей, занимающихся экономическими прогнозами, имеются три фундаментальные проблемы. Во-первых, очень сложно выявить причинно-следственные связи на основании анализа одной лишь экономической статистики. Во-вторых, экономика постоянно меняется, поэтому объяснения экономического поведения, подходящие для одного цикла бизнеса, могут быть неприменимы для другого. И, в-третьих, плохи не только сами прогнозы экономистов, но и данные, с которыми им приходится работать.
Корреляция без причинно-следственной зависимости
Ежегодно правительство рассчитывает около 45 тыс. экономических показателей{397}, а в частных источниках отслеживается не менее 4 млн данных{398}. Многие экономисты поддаются искушению закинуть все эти данные в блендер и заявить о том, что возникающая в результате каша представляет собой образец высокой кухни. С момента окончания Второй мировой войны в стране было всего 11 рецессий{399}. Если у вас есть статистическая модель, которая призвана объяснить 11 реальных событий, но должна выбирать для этого исходные данные из 4 млн входных параметров, многие из выявленных вами связей будут ложными (это еще один классический пример оверфиттинга – ошибочного принятия шума за сигнал – проблема в предсказании землетрясений, описанная в главе 5).
Только представьте себе, насколько креативным нужно быть, когда набор экономических переменных, имеющихся в вашем распоряжении, представляет собой перечень толщиной с телефонный справочник. Например, когда-то основным показателем экономического развития считался победитель Суперкубка по американскому футболу. Начиная с Суперкубка I, состоявшегося в 1967 г. и заканчивая Суперкубком XXXI в 1997 г., рост фондового рынка до конца года{400} составлял в среднем 14 %, если кубок выигрывала команда из Национальной футбольной лиги (NFL){401}. Если же выигрывала команда из Американской футбольной лиги (AFL), то рынок падал почти на 10 %.
До 1997 г. этот индикатор достаточно точно «предсказывал» направление развития фондового рынка в 28 из 31 случаев. Однако стандартный тест статистической значимости показывает{402}, что вероятность того, что экономический рост является следствием спортивного результата, составляет лишь 1 к 4 700 000.
Разумеется, это было всего лишь совпадением, и со временем индикатор начал давать сбои. В 1998 г. Суперкубок выиграла команда Denver Broncos из Американской футбольной лиги. Очевидно, что это можно было считать плохим знамением. Однако вместо того, чтобы упасть, фондовый рынок вырос на 28 % на фоне бума доткомов. В 2008 г. команда New York Giants из NFL обыграла в финале благодаря потрясающему маневру Дэвида Туре команду New England Patriots из AFL. Но даже Туре не смог предотвратить коллапса пузыря на жилищном рынке, заставившего рынок рухнуть на 35 %. Фактически с 1998 г. фондовый рынок вел себя на 10 % лучше, когда Суперкубок выигрывала команда из AFL, то есть показывал результат, строго противоположный тому, что прогнозировал индикатор.
Каким же образом этот индикатор, невзирая на всю свою статистическую невероятность, мог, как казалось, предсказывать будущее? Это происходило по той же самой причине, по которой, несмотря на крайне небольшие шансы выигрыша в лотерею Powerball (1 шанс из 195 000 000{403}), кто-то выигрывает джекпот каждые несколько недель. Шансы любого участника лотереи минимальны, но, поскольку ежемесячно продаются миллионы билетов, кому-то обязательно везет.
Точно так же, учитывая, что в мире оцениваются миллионы статистических показателей, может случиться, что некоторые из них очень хорошо коррелируют с ценами на акции, показателем ВВП или уровнем безработицы. Если не победитель Суперкубка, то, допустим, им может стать показатель поголовья кур в Уганде. Однако эта связь будет не более чем результатом совпадения.
Хотя экономисты не принимают индикатор Суперкубок всерьез, они вполне способны убедить самих себя в том, что другие типы переменных, имеющих хотя бы какой-то экономический смысл, могут считаться «опережающими индикаторами», предсказывающими рецессию или рост экономики за несколько месяцев. Одна фирма, занимающаяся прогнозами, с гордостью заявляла, что использует в своей работе 400 переменных{404}, то есть гораздо больше, чем те два или три десятка, в которых, по словам Хациуса, содержится основной экономический смысл[84].
Другие авторы прогнозов полагают, что предсказательной силой обладают такие довольно туманные показатели, как отношение количества заказов к объему выставленных счетов у компаний – производителей полупроводниковых материалов и изделий{405}. С учетом огромного количества экономических переменных, из которых можно выбирать, при желании всегда найдется нечто, достаточно четко описывающее шум из прошлого.
Значительно сложнее найти что-то, что позволяет выявить сигнал. Переменные, которые служат «опережающими индикаторами» в одном экономическом цикле, часто превращаются в «запаздывающие» в другом. Из семи так называемых опережающих индикаторов, описанных в 2003 г. в статье в журнале Inc.{406} и четко предсказавших рецессии 1990 и 2001 гг., лишь два – цены на жилье и количество нанятых временных сотрудников – позволили с должной степенью точности предсказать рецессию 2007 г. Другие же, такие как объемы коммерческого кредитования, начали снижаться лишь в течение года после начала рецессии.
Свои проблемы есть и у вполне уважаемого показателя – индекса ведущих экономических показателей, представляющего собой совокупность 10 экономических индикаторов, публикуемых организацией Conference Board. Обычно его значение начинало снижаться за пару месяцев до наступления рецессий. Однако столь же часто индикатор подает ложные сигналы. Самый печальный случай произошел в 2004 г., когда значение индикатора резко снижалось в течение трех месяцев подряд{407}, сигнализируя о рецессии, но экономика продолжала расти на уровне 6 %. Некоторые исследователи даже пришли к выводу, что индекс опережающих индикаторов не имеет предсказательной силы при использовании в режиме реального времени{408}.
«На самом деле, мало что обладает настоящей предсказательной силой, – рассказывал мне Хациус, – а объяснить, что является результатом корреляции, а что – результатом причинно-следственной связи, невероятно сложно».
Многие из вас слышали выражение «совпадение еще не означает наличие причинно-следственной зависимости». Сам факт, что переменные имеют между собой некую статистическую корреляцию, еще не означает, что одна из них влияет на другую. Цифры продаж мороженого и показатели по количеству лесных пожаров коррелируют между собой, потому что они обычно описывают происходящее в жаркие летние месяцы. Однако причинно-следственной зависимости здесь нет. Нельзя сказать, что, покупая мороженое, вы провоцируете начало лесного пожара где-нибудь в Монтане.
Но, хотя эту концепцию легко выразить словами, ее сложно применять на практике, особенно когда речь заходит о понимании причинно-следственных связей в экономике. Допустим, заметил Хациус, что уровень безработицы обычно воспринимается как запаздывающий индикатор, что иногда справедливо. После наступления рецессии компании отказываются принимать на работу новых сотрудников до тех пор, пока будущее не покажется более стабильным и радужным. Для того чтобы все уволенные вернулись на работу, также потребуется немалое время. Однако уровень безработицы может одновременно выступать и в качестве опережающего индикатора для потребительского спроса, поскольку у безработных снижается способность покупать товары и услуги во время рецессии. Экономика может оказаться внутри порочного цикла – компании не нанимают людей, пока не видят роста потребительского спроса, однако сам потребительский спрос достаточно низок, поскольку компании не занимаются наймом, и потребители не могут позволить себе купить их продукцию.
Столь же непростой переменной выступает уровень доверия со стороны потребителей. Иногда потребители оказываются первыми, кто улавливает предупреждающие сигналы в экономике. Они же могут оказаться среди последних, кто замечает признаки выздоровления. Люди часто считают, что экономика находится в рецессии, даже через многие месяцы после того, как технически она считается завершенной.
Поэтому экономисты много спорят о том, может ли уровень доверия со стороны потребителей считаться опережающим или запаздывающим индикатором{409}, и ответ на этот вопрос может зависеть от этапа, на котором находится экономика. Более того, поскольку степень доверия со стороны потребителей влияет на их поведение, отношения между ожиданиями от экономики и реальность могут оказывать друг на друга постоянное корректирующее воздействие.
Принцип экономической неопределенности
Возможно, что самый проблематичный пример подобных петель обратной связи возникает между экономическими прогнозами и экономической политикой. Если, например, прогнозируется, что экономика скоро окажется в состоянии рецессии, правительство и Федеральная резервная система предпримут шаги по снижению риска или, по крайней мере, по смягчению ситуации. Таким образом, часть проблемы состоит в том, что прогнозистам такого типа, как Хациус, приходится предсказывать не только экономические, но и политические решения. А это может стать настоящей проблемой в стране, где уровень одобрения деятельности Конгресса составляет около 10 %.
Проблема может оказаться еще более глубокой. Как указал в 1976 г. экономист и лауреат Нобелевской премии Роберт Лукас{410}, данные из прошлого, на которых основана экономическая модель, отчасти влияют на политические решения в настоящем. Таким образом, порой недостаточно знать, что делают нынешние политики. Иногда нам приходится выяснять, как выглядела финансовая и налоговая политика во времена администрации Никсона. Сходная доктрина, известная как закон Гудхарда (названная так в честь предложившего ее преподавателя Лондонской школы экономики{411}), гласит, что, когда люди, отвечающие за политику, начинают активно использовать какую-то переменную, она способна потерять свою значимость в качестве экономического индикатора. Допустим, если правительство предпринимает шаги по искусственной накачке цен на жилье, цены могут вырасти, но уже не будут считаться хорошим показателем оценки общего экономического здоровья.
С точки зрения логики мы можем дойти до крайности и предположить, что такая ситуация чем-то напоминает действие эффекта наблюдателя (часто ошибочно принимаемого за сходную концепцию принципа неопределенности Гейзенберга). Как только мы начинаем что-то измерять, поведение измеряемого объекта меняется вследствие наших действий. Большинство статистических моделей построено на утверждении о том, что независимые и зависимые переменные, а также входные и выходные значения могут быть отделены друг от друга{412}. Но когда речь заходит об экономике, все они перемешиваются в одном котле и представляют собой единое кипящее варево.
Постоянно меняющаяся экономика
Даже если экономисты могли бы решить все эти проблемы, им все равно пришлось бы противостоять движущейся мишени. И американская, и мировая экономики находятся в состоянии постоянного развития, и связи между различными экономическими переменными способны со временем измениться.
Например, история показывает наличие достаточно сильной корреляции между ростом ВВП и числом рабочих мест. Экономисты называют эту связь законом Оукена[85]. Во время периода Длинного бума с 1947 по 1999 г. значение показателя роста занятости{413} составляло обычно примерно половину от величины роста ВВП. Если ВВП в течение года вырастал на 4 %, количество рабочих мест увеличивалось примерно на 2 %.
Эта связь существует до сих пор – чем выше экономический рост, тем лучше для людей, ищущих работу. Однако, судя по всему, изменилась ее динамика. После каждой из последней пары рецессий создавалось значительно меньше новых рабочих мест, чем могло бы быть в годы Длинного бума. Например, в течение года после одобрения стимулирующего пакета ВВП рос достаточно быстро, что должно было позволить создать, как это следует из закона Оукена, около 2 млн рабочих мест{414}. На практике количество рабочих мест снизилось на 3,5 млн.
Экономисты часто спорят о том, что значит это изменение. Самая пессимистическая интерпретация, которую поддерживают такие экономисты, как Джеффри Сакс из Колумбийского университета, состоит в том, что эта закономерность отражает серьезные культурные проблемы в американской экономике. К их числу относят рост конкуренции со стороны других стран, дисбаланс между производственным и сервисным секторами экономики, стареющее население, сокращающийся средний класс и рост национального долга. В соответствии с этой теорией США вошли в новую и нездоровую реальность, и проблемы могут стать еще глубже, если не произойдут фундаментальные изменения. «Мы недооцениваем влияние глобальных изменений на события в США, – рассказывал мне Сакс. – Уступка большого количества рабочих мест Китаю и другим растущим рынкам нанесла огромный удар по экономике страны». И еще один важный вопрос: можно ли считать, что высокая волатильность 2000‑х более точно описывает условия экономики в долгосрочной перспективе? Возможно, что годы Длинного бума были всего лишь исключением. В те времена экономика находилась в рецессии лишь 15 % времени, однако этот показатель вырос более чем в два раза – до 36 % – с 1900 по 1945 г.{415}.
Хотя большинство экономистов верит в то, что в результате стабилизации цикла деловой активности[86] был достигнут определенный прогресс, можно считать, что нам просто повезло и мы смогли избежать более серьезных проблем.
Это мнение особенно справедливо для периода между 1983 и 2006 гг. – частью Длинного бума, которую иногда называют эпохой Великого успокоения (Great Moderation), когда экономика находилась в рецессии лишь 3 % времени. Однако значительная часть роста обеспечивалась за счет масштабного увеличения государственного и потребительского долга, а также за счет пузырей с различными видами активов. Ни у какой развитой экономики просто нет объективной возможности расти такими темпами, как во времена Великого успокоения. Если в 1980‑е гг. прирост экономики Японии ежегодно составлял 5 %, то сейчас она растет в лучшем случае на 1 % в год{416}.
Возможно, это и стало одной из причин, из-за которых прогнозисты и политики оказались застигнутыми врасплох столь глубокой рецессией 2007 г. Они не только не могли предсказать события масштабов Великой депрессии[87], но иногда и калибровали свои прогнозы по параметрам эпохи Великого успокоения, которая с исторической точки зрения была лишь исключением.
Не отбрасывайте имеющиеся данные
Федеральный комитет по операциям на открытом рынке[88], отвечающий за определение процентной ставки в стране, должен по закону предоставлять макроэкономические прогнозы Конгрессу не менее двух раз в год. К концу 2007 г. этот комитет в каком-то смысле опережал события. Его прогноз роста ВВП был чуть более «медвежьим»[89], чем прогнозы, создававшиеся в частном секторе, что заставило организацию четыре раза понижать процентную ставку до конца года.
Тем не менее в протоколе комитета, выпущенном в конце октября 2007 г., термин «рецессия» вообще не использовался для описания экономической ситуации{417}. Федеральный комитет очень внимательно следит за своим языком и возможностью рецессии, поэтому были использованы фразы типа «риски, связанные со снижением оборотов». Однако он не делал ставку на рецессию, и его прогноз все еще предполагал экономический рост. Мало было факторов, которые указывали бы на то, что комитет в принципе рассматривал возможность рецессии (особенно в тех масштабах, в которых рецессия произошла в реальности).
Отчасти причина этого может быть связана с тем, что комитет, оценивая правильность своих прогнозов, полагался на данные, полученные со времен Великого успокоения. В частности, он уделял серьезное внимание научной работе, в которой изучалась эффективность экономических прогнозов за период с 1986 по 2006 г.{418}. Однако проблема этих лет состояла в том, что экономическая нестабильность в тот период была крайне мала: в 1990–1991 гг. и в 2001 г. произошли лишь две слабые рецессии. «Связывая текущую неопределенность с данными, полученными начиная с середины 1980‑х гг., – предупреждали авторы работы, – мы предполагаем, что спокойные условия Великого успокоения будут существовать и далее». Это было невероятно смелое предположение. Отчасти Федеральный комитет пришел к выводу о невозможности серьезной рецессии в 2007 г. из-за того, что предпочел игнорировать годы, в которые бушевала жестокая рецессии.
Прогнозист не должен игнорировать любые данные, особенно когда изучает редкие события, такие как рецессии или президентские выборы. В подобных случаях, в принципе, исходных данных немного. Игнорирование каких-либо из них часто свидетельствует либо о том, что прогнозист слишком уверен в себе, либо о том, что его модель обладает значительным оверфиттингом. Иными словами, он делает акцент на самопрезентацию, а не на точность прогноза.
В этом конкретном случае было не так очевидно, что экономистам удалось улучшить свои прогнозы дальнейшего развития цикла деловой активности. На рис. 6.5а представлены данные прогнозируемого уровня роста ВВП, взятые из опросов SPF, и его реальные значения за период с 1968 по 1985 г., которые Федеральный комитет мог принять во внимание, но предпочел отбросить. Как видно из рисунка, для этого периода характерна значительная экономическая нестабильность, как, например, происходило и во времена направляемой инфляцией рецессии середины 1970‑х и начала 1980‑х. Тем не менее эти результаты нельзя считать обескураживающими для прогнозистов, поскольку предсказанные и реальные параметры обладают достаточно сильной корреляцией.
Рис. 6.5а. Соотношение между прогнозируемыми и фактическими значениями ВВП, США, 1968–985 гг.
Однако если посмотреть на аналогичные данные за период с 1986 по 2006 г. (рис. 6.5б), то мы увидим совсем другую картину. Большинство точек попало в узкий диапазон от 2 до 5 %, и расположены они достаточно близко друг от друга. Так как в этот период значения ВВП изменялись не намного, средняя ошибка прогнозирования была меньше, чем в предыдущем периоде[90]. Тем не менее прогнозы не смогли уловить признаки умеренной рецессии ни в 1990 и 1991 гг., ни в 2001 г. В сущности, корреляция между прогнозируемыми и фактическими значениями практически отсутствовала. Это позволяет нам сделать вывод, что экономисты так и не научились предсказывать поведение экономики. Скорее, на какое-то время, когда экономика развивалась довольно слабо, их работа стала временно легче (как легче работа синоптика в предсказуемом Гонолулу по сравнению с работой в довольно непредсказуемом Буффало).
Рис. 6.5б. Соотношение между прогнозируемыми и фактическими значениями ВВП, США, 1986–006 гг.
Исследователи отбрасывают некоторые данные еще и потому, что, по их мнению, в экономике происходят те или иные фундаментальные изменения. В какой-то степени эта точка зрения оправдана. Американская экономика постоянно развивается, и периодически в ней действительно происходят структурные изменения (не так давно, например, произошел переход от экономики, определяемой промышленным производством, к экономике, определяемой сервисным сектором). Это не бейсбол, где правила игры никогда не меняются.
Проблема такого подхода в том, что вы никогда не знаете, когда возникает следующее изменение парадигмы, приведет ли оно к повышению или ослаблению волатильности, к усилению или ослаблению экономики. Нет никакого смысла использовать экономическую модель, предполагающую отсутствие значительных изменений, однако предсказание важных поворотных точек – довольно непростая работа.
Экономические данные переполнены шумом
Третья значительная проблема экономических прогнозов связана с тем, что исходные данные довольно плохи. Выше я уже упоминал, что в экономических прогнозах приводятся выводы, но редко упоминается о границах сделанных допущений. Возможно, экономистам кажется, что это способно пошатнуть их позиции как профессионалов. «Почему они не делятся информацией о допустимых интервалах? Возможно, им просто стыдно и неудобно», – говорил мне Хациус.
Однако неопределенность связана не только с экономическими прогнозами, но и с экономическими переменными. Большинство наборов экономических данных обычно пересматривается, и этот процесс может происходить через месяцы или даже годы после их первой публикации. Корректировки могут быть огромными{419}. Печальную известность приобрели сделанные правительством расчеты роста ВВП в последнем квартале 2008 г. Если поначалу говорилось о «незначительном» его снижении на уровне 3,8 %, то теперь принято считать, что экономика упала почти на 9 %. Если бы экономисты из Белого дома знали о реальных размерах экономической дыры, то, возможно, потребовали бы более серьезных стимулирующих мер в январе 2009 г. или же поняли, насколько глубокими оказались проблемы, и попытались бы создать более долгосрочное решение, а не предложили набор быстрых «заплаток».
Серьезные ошибки такого рода встречаются достаточно часто. За период 1965–2009 гг. изначальные расчеты квартального ВВП, сделанные правительством, были со временем пересмотрены в среднем на 1,7 пункта{420}. И это – среднее значение. Диапазон возможных изменений в каждом значении ежеквартального ВВП может оказаться еще выше, а величина ошибки в изначальных расчетах ежеквартального изменения ВВП равна ±4,3 %{421}. Это значит, что экономика может подняться после рецессии, даже если правительство изначально не заявляло о росте выше среднего, или наоборот. Например, поначалу правительство могло заявить, что экономика выросла на 4,2 % в четвертом квартале 1977 г., а затем изменить это значение на –0,1 %{422}.
Так что можно лишь посочувствовать тем, кто делает экономические прогнозы{423}. Довольно сложно понять, в каком направлении реально движется экономика. Однако задача усложняется еще сильнее, если вы для начала не знаете, где находитесь именно сейчас.
Бабочка машет крыльями в Бразилии, и кто-то в Техасе теряет работу
Сложная задача, которая стоит перед экономистами, вполне сравнима с той, с которой сталкиваются синоптики. По сути, им приходится решать две аналогичные фундаментальные проблемы.
Прежде всего, экономика, как и атмосфера, – это динамическая система. Каждый ее элемент влияет на все остальные, и система находится в бесконечном движении. В метеорологии это движение проявляется буквально, поскольку изменение погоды описывается в рамках теории хаоса – можно предположить, что взмах крыльев бабочки в Бразилии каким-то образом способен привести к торнадо в Техасе. Но, с определенной степенью допущения, можно сказать, что цунами в Японии или забастовка грузчиков в Лонг-Бич могут повлиять на то, найдет ли работу какой-нибудь житель Техаса.
Во-вторых, в прогнозах погоды начальные условия исходно точно не определены. Вероятностное выражение прогноза погоды («вероятность дождя – 75 %») возникает не вследствие случайности, присущей погоде. Скорее, это вызвано предположением метеорологов о том, что они используют неточные инструменты для оценки начальных условий и что поведение погоды (как следует из теории хаоса) в высшей степени чувствительно к изменениям начальных условий. Сходным образом, в экономическом прогнозировании качество исходных первичных данных также часто бывает достаточно плохим.
Однако в этой книге мы много говорим об успехах метеорологов. Очень многие прогнозы, начиная от траекторий ураганов и заканчивая изменением температуры в течение дня, стали значительно лучше, чем те, что были 10 или 20 лет назад. Это произошло благодаря повышению вычислительных мощностей, улучшению качественных методов сбора данных и старомодному упорному труду.
Но этого нельзя сказать об экономическом анализе. Любая иллюзия о том, что экономические прогнозы стали лучше, разбивается вдребезги о те ужасные ошибки, которые допустили экономисты перед последним финансовым кризисом{424}.
Хотя некоторые проблемы в работе метеорологов и напоминают проблемы экономистов – особенно когда мы говорим о динамической системе с неопределенными начальными условиями, – на стороне метеорологов выступает наука. Физика и химия явлений, подобных торнадо, довольно просты. Это не значит, что торнадо легко предсказывать. Однако у метеорологов имеется глубокое фундаментальное понимание и причин возникновения торнадо, и того, что заставляет их исчезать.
Экономика более пластична. Хотя экономисты и обладают достаточно четким пониманием основных систем, управляющих экономикой, причины и следствия часто пересекаются друг с другом, особенно во время раздувания пузырей или паники, когда система подвержена воздействию петель обратной связи, непосредственно влияющих на поведение человека.
Тем не менее, даже если разделить причины и следствия сложно, предпринимать такие попытки лучше, чем сдаваться. Давайте еще раз взглянем на то, что написал Хациус 15 ноября 2007 г.:
«Возможные убытки на рынке закладных представляют значительно бо́льшую угрозу для макроэкономики, чем принято считать… макроэкономические последствия могут быть значительными. Если инвесторы, использовавшие леверидж, столкнутся с совокупными убытками в 200 [млрд долл.], им придется компенсировать их объемом заимствований на сумму 2 трлн долл… Это будет серьезный шок… И легко представить, как он может привести к значительной рецессии или длительному периоду слабого роста».
По словам Хациуса, потребители пользовались слишком большим кредитом, чтобы заплатить за дома, стоимость которых из-за пузыря на жилищном рынке стала для большинства из них недоступной. Многие перестали платить по ипотеке, а это могло привести к еще более значительным потерям. Степень левериджа в системе могла бы лишь усилить эту проблему, парализуя кредитный рынок, да и всю систему финансовых услуг в целом. Шок может быть достаточно серьезным и подтолкнуть к возникновению сильной рецессии.
Именно это и произошло, когда разразился финансовый кризис. Прогноз Хациуса оказался не просто верным: в нем были правильно указаны причины кризиса и дано объяснение как причин, так и возможных последствий происходившего. Сам Хациус называет эту цепочку причинно-следственных событий «историей». И хотя эта история об экономике и управляется данными, ее корни лежат во вполне реальном мире.
Напротив, если вы будете рассматривать экономику как набор переменных и уравнений, не принимая во внимание ее фундаментальную структуру, то почти гарантированно ошибетесь и примете шум за сигнал, ошибочно заставив себя (и доверчивых инвесторов) думать, что вы создаете хороший прогноз, хотя на самом деле это не так. Давайте посмотрим, что произошло с одним из конкурентов Хациуса – компанией ECRI.
В сентябре 2011 г. ECRI говорила о почти гарантированной глубокой рецессии.
«Политики ничего не могут сделать для исправления ситуации, – утверждалось в заявлении компании{425}. – Если вы думаете, что происходящее сейчас – это плохое состояние экономики, то считайте, что вы еще ничего не видели». В интервью управляющий директор компании Лакшман Ахутхан предположил, что рецессия может начаться прямо сейчас, если уже не началась{426}. Компания обосновала свое заключение следующим образом:
«Наше мнение об угрозе рецессии основано не на одном или двух опережающих индексах, а на десятке специализированных показателей, в том числе долговременных основных показателях США… за которыми следует снижение еженедельных основных показателей и других, более коротких опережающих индексов. По сути, большинство надежных прогнозных индикаторов ведет себя так, как если бы мы находились на пороге полноценной рецессии»{427}.
Это заключение написано на профессиональном языке, однако ему недостает реальной экономической сути. Это – повествование о данных, как будто данные сами по себе способны вызвать рецессию, а не об экономике. Но компания ECRI гордится таким подходом. В 2004 г. в документе, адресованном клиентам, ее руководители писали: «Так же, как вам, чтобы ездить на автомобиле не нужно точно знать, как работает его двигатель, вам не нужно понимать все тонкости экономики для того, чтобы пользоваться сделанными нами выводами»{428}.
Подобные заявления становятся все более распространенными в эпоху Больших данных{429}. Кому нужна теория, когда у вас так много информации? Однако подобная точка зрения категорически неверна в области прогнозов, особенно экономических, где данные наполнены шумом. Статистические выкладки кажутся куда более убедительными, если они подкреплены теорией или хотя бы сопровождаются глубоким размышлением об их фундаментальной основе. Разумеется, в сентябре 2011 г. имелись причины для экономического пессимизма{430} – например, долговой кризис, разворачивавшийся в Европе, – однако ECRI даже не смотрела в сторону этих событий. Вместо этого она варила суп из случайных переменных, принимая совпадение за причинно-следственную зависимость{431}.
Следует отметить, что после прогноза ECRI в экономике действительно возникла поворотная точка – однако она была позитивной. Показатель S&P 500 набрал 21 % за пять месяцев после того, как после ECRI заявила о возможной рецессии{432}, а рост ВВП составил в последнем квартале 2011 г. неплохие 3 % вместо того, чтобы упасть в результате рецессии. ECRI пустилась в объяснения о том, что воздействие позитивных факторов усилилось в 2012 г., что невозможно было предсказать изначально{433}.
Когда предвзятые прогнозы оказываются рациональными
Если вам действительно нужен экономический прогноз, то лучше всего обращаться к средним или обобщенным прогнозам, чем к прогнозам отдельных экономистов. Мое исследование обзоров профессиональных прогнозистов в сфере экономики SPF показало, что обобщенные прогнозы примерно на 20 % точнее, чем индивидуальные, предсказывают величину ВВП, на 10 % – уровень безработицы и на 30 % – уровень инфляции{434}. Эта особенность – групповые прогнозы переигрывают индивидуальные – проявлялась почти в любой области, где проводились подобные исследования.
И хотя идея о том, что обобщенные прогнозы оказываются лучше индивидуальных, может считаться важной с эмпирической точки зрения, порой она используется как отговорка, препятствующая улучшению прогнозов. Обобщенный прогноз создается из отдельных; и если они улучшаются, то улучшается и групповой результат. Более того, даже обобщенные экономические прогнозы оказываются достаточно плохими с точки зрения работы в реальном времени, так что в этом вопросе есть над чем работать.
Большинство экономистов высказывает свои суждения при создании прогноза с определенными условиями, а не делятся результатами статистической модели как таковой. С учетом того, насколько сильно данные забиты шумом, это имеет смысл. Исследование Стивена К. Макнесса, бывшего вице-президента Федерального резервного банка Бостона, показало, что корректировки методов статистических прогнозов, связанные с теми или иными суждениями, позволяют повысить точность прогнозов примерно на 15 %{435}. Идея о том, что статистическая модель будет способна «решить» проблему экономического прогнозирования, была довольно расплывчатой в 1970‑е и 1980‑е гг., когда компьютеры только начинали получать широкое распространение. Однако, как и в других областях (например, при предсказании землетрясений), улучшение технологий не компенсировало недостатка теоретического понимания экономики. По сути, компьютеры дали экономистам лишь более быстрые и продвинутые способы ошибочно принимать шум за сигнал. Модели, прежде казавшиеся многообещающими, в тот или иной момент терпели поражение и отправлялись в мусорное ведро{436}.
Свою роль в развитии искажений играют и человеческие суждения. Вы можете создать прогноз, который волшебным образом станет соответствовать вашим экономическим стимулам или политическим убеждениям. Вы можете возгордиться и не захотите изменить его, даже когда этого потребуют факты и обстоятельства. «Я думаю, что у людей есть одна тенденция, которой стоит активно противостоять, – сказал мне Хациус, – она заключается в том, что человек воспринимает информационный поток таким, каким он хочет его видеть». Но есть ли экономисты, которым удается лучше других управлять этим компромиссом? Можно ли считать, что экономист, правильно предсказавший рецессию в прошлом, сможет предсказать и будущую? На этот вопрос есть интересный ответ.
Когда мы, чтобы оценить умение прогнозировать, применили статистические методы анализа к данным SPF, результат оказался в целом негативным{437}.
Иными словами, при изучении результатов мы не можем сделать вывод о том, что некоторые экономисты обычно создают более хорошие прогнозы, чем остальные. Однако изучение прогнозов другой группы экспертов – от компаний «голубых фишек» (Blue Chip Economic Survey) – позволило получить более позитивные результаты{438}. Разумеется, в экономическом прогнозировании велика доля удачи: экономисты, которые последовательно защищают «медвежью» или «бычью» точку зрения, время от времени гарантированно будут правы. Однако исследования мнения экспертов «голубых фишек» показали, что некоторым из них действительно удается создавать лучшие прогнозы на долгосрочную перспективу.
В чем состоит разница между двумя опросами? Опрос SPF проводится анонимно: каждый экономист получает случайный номер, не меняющийся от опроса к опросу, однако у читателей нет никакой возможности понять, кто скрывается за тем или иным номером. В рамках опроса «голубых фишек» прогноз каждого участника подкрепляется его именем и репутацией.
Если рядом с прогнозом стоит ваше имя, это может привести к изменению структуры ваших стимулов. Допустим, вы работаете на малоизвестную компанию. В этом случае для вас может иметь смысл создавать достаточно дикие прогнозы – пусть они и не будут сбываться достаточно часто, но в случае успеха вам гарантировано должное внимание. С другой стороны, сотрудники компаний типа Goldman Sachs должны вести себя более консервативно, для того чтобы оставаться в рамках консенсуса.
Именно это и было выявлено в результате исследования прогнозов Blue Chip{439} – довольно заметное явление под названием «искажения из соображений рациональности»{440}. Чем менее известно ваше имя, тем меньше вы можете потерять, принимая на себя риски, связанные с прогнозами. Даже если вы знаете, что вы немного лукавите в своем прогнозе, для вас может иметь смысл попытаться сделать большую ставку. С другой стороны, если у вас уже имеется серьезная репутация, вы, возможно, не захотите слишком отклоняться от общей точки зрения, даже в том случае, когда, по вашему мнению, это следует из имеющихся данных.
Каждое из этих опасений, связанных с вашей репутацией, способно отвлечь вас от основной цели – создания наиболее честных и точных прогнозов. Несмотря на довольно незначительные различия, исторические данные по анонимным участникам SPF показывают, что им удавалось немного лучше предсказывать показатели ВВП и безработицы, чем участникам экспертов из «голубых фишек», заботящихся о своей репутации{441}.
Преодоление искажений
Если оказалось, что создавать плохие прогнозы рационально, то можно предположить, что у таких прогнозов есть свой рынок и есть потребители, способствующие их развитию. Подобно тому как в политике существует целая группа экспертов, делающих карьеру на том, что они предлагают довольно дикие идеи аудиториям, состоящим из представителей той или иной партии, в экономике также имеются свои «медведи», «быки» и прочие участники, которые всегда захотят прислушаться к вашим выводам. Иногда экономические прогнозы напрямую связаны с политическими целями (расчеты показывают, что экономические прогнозы, созданные Белым домом, исторически были одними из самых неточных{442}, вне зависимости от того, кто занимал пост президента – демократ или республиканец).
Однако, когда речь заходит об экономическом прогнозировании, ставки значительно повышаются. Как отметил Роберт Лукас, линия между экономическим прогнозированием и экономической политикой достаточно размыта. Плохой прогноз способен ухудшить ситуацию в реальной экономике.
Впрочем, можно надеяться, что процесс экономического прогнозирования значительно улучшится в дальнейшем за счет использования новых технологических усовершенствований. Например, поисковый трафик Google может уже сейчас служить опережающим индикатором для ряда экономических показателей, таких как уровень безработицы.
«Давайте рассуждать: показатель запросов, связанных со страховками на случай потери работы, может служить хорошим индикатором, предсказывающим уровень безработицы, а тот, в свою очередь, хорошим индикатором, предсказывающим уровень экономической активности», – рассказывал мне главный экономист Google Хэл Вариан во время моего визита в головной офис Google в Маунтин-Вью, штат Калифорния.
«Мы можем предсказать рост количества таких страховок заранее. Если вы работаете в компании, в которой начинают ходить слухи о сокращении штатов в ближайшем будущем, сотрудники начинают создавать поисковые запросы типа “Где находится ближайший офис бюро занятости”, “как подавать заявление на бирже труда” и т. д. Так что это вполне может рассматриваться как некий опережающий индикатор». Тем не менее история прогнозирования в экономике и других областях показывает, что технологические усовершенствования не приносят особой пользы, если они компенсируются человеческими предубеждениями. У нас нет серьезных оснований считать, что экономическое прогнозирование не подвержено влиянию таких предубеждений. Например, прогнозисты, по всей видимости, ничему не научились на опыте с Великой рецессией. Если посмотреть на прогнозы роста ВВП, сделанные участниками SPF в ноябре 2011 г. (рис. 6.6), то мы увидим, как проявляется та же самоуверенность, что и в 2007 г. Экономические сценарии, как позитивные, так и негативные, создаются с невероятной лихостью, никак не учитывающей степень исторической правильности прежних прогнозов{443}.
Рис. 6.6. Прогнозируемое распределение вероятностей: реальный рост ВВП США (2012 г.) и исторические ошибки прогнозирования (по данным SPF, ноябрь 2011 г.)
Если мы захотим снизить влияние таких искажений – а мы никогда не сможем избавиться от них полностью, – то у нас имеются два фундаментальных альтернативных способа. Первый связан с предложением точных экономических прогнозов, а второй – со снижением спроса на неточные или слишком самоуверенные прогнозы. Робин Хэнсон, экономист Университета Джорджа Мэйсона, относится к серьезным защитникам первого подхода. Мы встретились с ним за обедом в одном из его любимых марокканских ресторанов в Северной Виргинии. Робину уже за 50, но выглядит он значительно моложе (несмотря на довольно большую лысину). Он склонен к эксцентричным поступкам. Так, он планирует, что после смерти его голова будет заморожена в криогенной камере{444}. Кроме этого, он поддерживает идею системы, которую сам называет «футархией» (futarchy), при которой решения политических вопросов принимаются не политиками, а по итогам работы рынков предсказаний{445}. Совершенно очевидно: этот человек не боится бросить вызов общепринятым точкам зрения.
«Я думаю, что самый интересный вопрос состоит в том, как мало усилий мы в реальности прикладываем к прогнозированию даже тех вещей, которые, по нашим словам, для нас крайне важны, – сказал мне Хэнсон, как только нам принесли обед. – В школах MBA часто рисуется образ менеджера как автора великих решений – человека, принимающего решения “по науке”. У него есть электронные таблицы, статистика, и он умеет взвешивать различные варианты. Однако на практике менеджмент значительно сильнее связан с управлением коалициями, поддерживающими тот или иной проект. В случае если вы создали коалицию, а затем в самый последний момент прогнозы начинают меняться, вы же не отбрасываете проект в сторону?»
«Судя по всему, в сборе данных о качестве исторических прогнозов не заинтересованы даже академические ученые, – добавил он позже. – Возможно, они не видят в этом смысла? Куда более фундаментальная проблема состоит в том, что в нашем обществе есть спрос на экспертов, но нет спроса на точные прогнозы». В качестве решения этой проблемы Хэнсон пропагандируют идею создания рынков предсказания – систем, в которых вы можете делать ставки на определенный экономический или политический исход, например, вступит ли Израиль в войну с Ираном или насколько вырастет глобальная температура вследствие климатических изменений. Его точка зрения в данном вопросе достаточно проста: возникающие при этом методе финансовые риски заставляют нас быть более точными и не пытаться хорошо выглядеть в глазах других.
Мы еще вернемся к идее рынков предсказаний в главе 11. Разумеется, она не является панацеей, особенно если мы допустим ошибку и предположим, что эта система никогда не может ошибаться сама по себе. Однако, по словам Хэнсона, она способна улучшить, хотя бы отчасти, систему стимулирования экспертов.
Эта система может применяться, например, для оценки макроэкономических переменных типа величины ВВП или уровня безработицы. Уже сейчас имеется довольно много прямых и косвенных способов делать ставки на величину показателей инфляции, процентных ставок и цены на товары, но пока что не создано сколь-нибудь важного рынка для оценок ВВП.
У таких рынков может найтись своя аудитория. Не так давно четко проявлялась корреляция между ценами на акции и макроэкономическими рисками{446}, поэтому в данном случае они могут выступать в качестве своеобразного инструмента хеджирования. Эти рынки смогут также предоставлять информацию в режиме реального времени политикам, выступая, по сути, инструментом постоянного обновления прогнозов по ВВП. Если добавить в систему несколько вариантов ответа – скажем, ставки на то, что ВВП вырастет на 5 % и снизится на 2 %, – это позволит наказать слишком самоуверенных прогнозистов и обеспечит более надежные расчеты неопределенностей, присущих прогнозированию экономики.
На осуществление другого решения, связанного со спросом, потребуется значительно больше времени. В сущности, оно предполагает, что мы должны стать лучше в качестве потребителей прогнозов. В контексте экономического прогнозирования это может означать, что нам следует отвернуться от шарлатанов с их «черными ящиками», набитыми случайными комбинациями опережающих индикаторов, и обратиться в сторону людей типа Яна Хациуса, рассказывающих о сути экономических явлений. Также из этого может следовать вывод о том, что необходимо уделять больше внимания уровню шума в экономических показателях и прогнозах. Возможно, нам надо потребовать, чтобы в расчетах ВВП указывались пределы их точности, так же как это происходит в опросах на политические темы.
В более общем смысле это означает, что мы должны признать следующее. Объем доверия, который мы выражаем к тому или иному прогнозу, еще не говорит о его правильности. Напротив, между этими качествами может иметься обратная зависимость. Самая главная опасность – как в экономике, так и в других областях – возникает, когда мы препятствуем прогнозистам, желающим максимально полно и детально описать риски, присущие окружающему нас миру.
Глава 7
Ролевые модели
Грипп обрушивался на Форт-Дикс[91] каждый год, как по часам. Он стал своеобразным обрядом посвящения. Большинство солдат разъезжалось на Рождество по домам, расположенным по всей территории Соединенных Штатов. Возвращались же они на базу сытыми, хорошо отдохнувшими, но при этом «прихватывали» и переносили любые вирусы, которые только могли найтись в их родных городах. Если где-то в стране царил грипп, то обычно он «прибывал» вместе с ними. В казарме трудно уединиться. Если даже один солдат заболевал гриппом, обстановка казармы становилась чуть ли не идеальным условием для переноса болезни.
Такое положение дел обычно не вызывало особого беспокойства – десятки миллионов американцев ежегодно заболевают гриппом в январе-феврале. И очень малое количество заболевших умирает от этой болезни. Исключением не были и молодые мужчины, такие как Дэвид Льюис, 19-летний рядовой из Уэст-Эшли, штат Массачусетс, который вернулся в Форт-Дикс после отпуска. Поэтому Льюис, хотя и чувствовал себя хуже других новобранцев и мог остаться в казарме, решил не отставать от товарищей и отправился в 80-километровый переход через покрытые снегом равнины центральной части штата Нью-Джерси. Он совсем не хотел, чтобы небольшая лихорадка ему помешала. На дворе стоял 1976 г. – год 200-летия основания страны, которая так нуждалась в порядке и дисциплине после Уотергейта и Вьетнама{447}.
Но Льюис так и не вернулся в казарму. Пройдя 20 км после начала марш-броска, он потерял сознание, а затем был объявлен умершим. Вскрытие показало, что легкие Льюиса наполнены кровью. Он умер от воспаления легких – типичного осложнения, вызванного гриппом, которое, однако, редко приводит к смерти здоровых и молодых людей.
Медики Форт-Дикс к тому времени уже были обеспокоены ситуацией на базе. Несмотря на то что у нескольких сотен солдат, заболевших гриппом той зимой, был выявлен штамм A/Victoria (распространенный и сравнительно безопасный вирус, путешествовавший в том году по всему миру{448}), им пришлось столкнуться и с более тяжелыми случаями заболеваний, такими как у Льюиса, пострадавшего от другой, малоизвестной и, по всей видимости, гораздо более опасной разновидности гриппа. Образцы крови Льюиса были отправлены Центр по контролю за заболеваниями (Center for Disease Control – CDC), который находится в Атланте, для дальнейшего исследования.
Через две недели CDC удалось распознать этот таинственный вирус. Это была не новая разновидность, а скорее, пугающий призрак прошлых эпидемий – вирус инфлюэнцы типа H1N1, более часто известный под названием «свиной грипп». Именно он вызывал самую страшную пандемию в современной истории – «испанку» 1918–1920 гг., во время которой заболело 30 % населения планеты и умерло 50 млн человек, в том числе 675 тыс. в Соединенных Штатах{449}. Это открытие взволновало все эпидемиологическое сообщество страны, причем не только с научной точки зрения, не последнюю роль сыграло и суеверие. Эпидемия 1918 г. также началась на военной базе Форт-Райли в Канзасе, где солдаты готовились к вступлению в Первую мировую войну{450}. Более того, в то время существовало убеждение – основанное на довольно хлипких научных свидетельствах, – что серьезная эпидемия гриппа проявляется примерно каждые 10 лет{451}. Всплески гриппа наблюдались в 1938, 1947, 1957 и 1968 гг.{452}; поэтому в 1976 г. мир готовился к новой пандемии.
Вскоре появились и пугающие предсказания. Проблема была связана не с текущей вспышкой, к тому времени как CDC удалось выявить штамм N1H1, сезон гриппа уже почти исчерпал себя. Однако ученые опасались, что следующей зимой может произойти нечто куда более страшное. Как писал в газете New York Times один видный врач{453}, на практике никогда не было случая, чтобы новый штамм гриппа не смог бы вытеснить своих конкурентов и не стать глобальным гегемоном. Иными словами, достаточно слабый штамм A/Victoria не имел никаких шансов выстоять в борьбе против своего опасного и изобретательного соперника. Если бы в мире начала развиваться эпидемия, хотя бы отдаленно похожая на события 1918 г., то можно было бы ожидать самых страшных последствий. По оценкам Ф. Дэвида Мэтьюса, советника по вопросам здравоохранения президента Джеральда Форда, в результате могло бы умереть до 1 млн американцев, значительно больше, чем в 1918 г.{454}.
Президент Форд оказался в затруднительном положении. Перед тем как начать изготавливать вакцины в промышленных масштабах, как это происходит и в индустрии моды, требуется по крайней мере шесть месяцев для того, чтобы понять, какая вакцина будет самой популярной в следующем сезоне. Формула немного меняется каждый год. Если создавать вакцину против H1N1 необходимо – особенно в количествах, достаточных для спасения всей страны, – работу нужно было начинать немедленно. Между тем Форд старался изменить общественное мнение, считавшее его медленно соображающим и неуверенным в себе. Это впечатление усиливалось с каждым уик-эндом благодаря талантливым пародиям актера Чеви Чейза, выходившим на канале NBC в новом популярном шоу под названием «Saturday Night Live». Поэтому Форд решил сделать решительный шаг и попросил Конгресс заказать около 200 млн доз вакцины и запустить программу массовой вакцинации. Программ такого масштаба у страны не было со времен, когда Йонас Солк разработал вакцину от полиомиелита в 1950‑е гг.
Пресса очень скептически отнеслась к новой программе массовой вакцинации, назвав происходившее азартной игрой{455}. Однако Форд понимал, что это игра между деньгами и жизнями и что он сам находится на правильной стороне. Подавляющее большинство обеих палат Конгресса одобрило его планы, на реализацию которых требовалось 180 млн долл.{456}.
Тем не менее к лету начали появляться серьезные сомнения, касающиеся планов правительства. Хотя лето обычно не сезон для гриппа в США{457}, в Южном полушарии была зима, время, когда грипп обычно достигает пика. И нигде, от Окленда до Аргентины, не было следов H1N1; напротив, вновь стал доминировать умеренный и привычный штамм A/Victoria. По сути, две сотни заболевших в Форт-Дикс стали единственными подтвержденными случаями возникновения H1N1 в мире, а рядовой Льюис – единственной жертвой. На программу обрушился нескончаемый поток критики – буквально со всех сторон. Ее критиковали и помощник директора CDC{458}, и Всемирная Организация Здравоохранения{459}, и престижный британский медицинский журнал Lancet{460}, и редакторы New York Times, охарактеризовавшие угрозу H1N1 как «ложную тревогу»{461}. Ни одна другая западная страна не призвала принять столь же решительные меры, как это сделали США.
Вместо того чтобы признаться в том, что угроза оказалась переоцененной, администрация Форда решила нанести ответный удар. Она подготовила серию довольно пугающих объявлений и запустила их в регулярную ротацию на национальных телевизионных каналах{462}. В одном ролике высмеивалась наивность людей, отказывавшихся от прививки. Сначала герой, изображавший довольно типичного американца, говорил: «Я самый здоровый 55-летний человек, которого вам только доводилось видеть, – я играю в гольф каждые выходные!» – а в следующем кадре он уже лежал на смертном одре. В другом хриплый женский голос повествовал о том, как вирус передавался от одного человека другому, причем так, что у зрителей возникали ассоциации с заболеванием, передававшимся половым путем: «Мать Бетти передала его водителю такси… и одной из тех очаровательных стюардесс… а та передала его своей подруге Дотти, у который случился сердечный приступ, и она умерла».
Эти довольно манерные ролики были призваны донести до зрителей очень серьезное сообщение – американцам нужно было бояться, и бояться очень сильно. Страна заглотнула наживку. Однако страх проявился скорее по отношению к вакцине, чем к самой болезни. На протяжении всей американской истории сама мысль о том, что правительство тыкает иголки в руки жителям, всегда вызывала серьезное беспокойство. Однако на этот раз причины для общественного беспокойства были куда более серьезными. В августе того же года под давлением компаний – изготовителей лекарств Конгресс и Белый дом согласились освободить их от юридической ответственности в случае производственных дефектов. Общественность восприняла это как вотум недоверия. Казалось, что правительство торопится выпустить в свет вакцину, которая не была протестирована в течение времени, необходимого для полного исследования. Проведенные тем летом опросы показали, что лишь около 50 % американцев планировали сделать прививку, и это значение оказалось очень далеким от той цели – вакцинации 80 % населения, поставленной правительством{463}.
Волнение достигло апогея только в октябре, когда началась программа вакцинации. 11 октября появился отчет из Питтсбурга о том, что три пенсионера умерли вскоре после прививки. То же самое произошло с двумя стариками в Оклахома-Сити, а потом еще с одним в Форт-Лодердейле{464}. На самом деле ничто не свидетельствовало о том, что эти смерти были связаны с вакцинацией – в конце концов, пожилые люди умирают каждый день{465}. Однако в тех условиях, когда люди проявляли беспокойство по поводу правительственной программы вакцинации и при этом плохо разбирались в тех статистических данных, что узнавали из СМИ{466}, каждая смерть человека, сделавшего прививку, становилась поводом для тревоги. Даже журналист Уолтер Кронкайт, человек, которому верило большинство американцев, отказался от своей привычной сдержанности и призвал СМИ успокоиться, однако безрезультатно. Клиники в Питтсбурге и многих других городах были закрыты{467}.
К концу осени возникла еще одна проблема, куда более серьезная. Около 500 пациентов, получивших прививку, начали испытывать симптомы редкого неврологического расстройства, известного как синдром Гийена – Барре (аутоиммунного расстройства, способного вызвать паралич). На этот раз статистические данные выглядели гораздо более убедительными – обычная заболеваемость синдромом Гийена – Барре в популяции – примерно один случай на 1 млн человек{468}. Показатель для населения, получившего прививку, был в 10 раз выше – 500 случаев на 50 млн человек. Хотя ученые и не были до конца уверены в причинах, вызывавших синдром, но наиболее правдоподобным виновником были названы производственные дефекты, связанные с лихорадочным графиком работ{469}. Медицинское сообщество пришло к единому мнению{470}: эта программа вакцинации должна быть закрыта навсегда, и правительство наконец сделало это 16 декабря.
В конце концов всплеск H1N1 в Форт-Дикс оказался полностью изолирован; в стране больше не выявили ни одного подтвержденного случая заболевания{471}. При этом смертность от обычного штамма A/Victoria зимой 1976/77 г. оказалась чуть ниже среднего значения{472}. По сути, ситуацию можно было описать выражением «много шума из ничего».
Эта история, вскоре получившая название «фиаско свиного гриппа», оказалась катастрофической для президента Форда. В ноябре того же года он проиграл очередные выборы демократу Джимми Картеру{473}. Производители лекарств были освобождены от какой-либо юридической ответственности, в связи с чем граждане обратились в суд против правительства Соединенных Штатов, выдвинув иски на общую сумму 2,6 млрд долл.{474}. Казалось, что каждая местная газета опубликовала статью о бедной официантке или школьном учителе, который исполнил свой долг и сделал прививку, после чего пострадал от синдрома Гийена – Барре. Количество американцев, готовых получить прививку от гриппа, снизилось примерно до 1 млн человек{475}, что могло привести к смертельной угрозе для страны, если бы на нее в 1978 или 1979 гг. обрушился более серьезный штамм гриппа{476}.
Действия президента Форда в этой ситуации были безответственными сразу на нескольких уровнях. Для начала он выстроил прямые параллели с событиями 1918 г., тем самым выступив против мнения медицинских экспертов (считавших, что вероятность столь неблагоприятного исхода составляет всего от 2 до 35 %){477}.
Тем не менее до сих пор осталось неясным, что способствовало исчезновению H1N1 – столь же внезапному, как и его появление. Прогнозы, сделанные в отношении этого штамма, имели значительно больше шансов сбыться, когда он вернулся примерно 33 года спустя. Поначалу, после первых признаков возвращения H1N1 в 2009 г., ученые не обратили на него внимания, а затем, как только он проявил себя достаточно серьезно, они значительно переоценили угрозу.
Фиаско свиного гриппа, часть вторая?
Важную роль в распространении вируса играют птицы, особенно дикие морские птицы типа альбатросов, чаек, уток, лебедей и гусей, которые переносят его гены с одного континента на другой, но редко сами заболевают. Они передают его другим биологическим видам – особенно свиньям и одомашненным птицам, таким как куры{478}, которые живут в большей близости к человеку. Куры могут заболеть гриппом, но обычно достаточно хорошо с ним справляются, выживают и передают своим хозяевам. Свиньям это удается еще лучше, поскольку они восприимчивы и к человеческим, и к птичьим заболеваниям (не говоря уже о своих собственных). По сути, они могут представлять собой своеобразный «сосуд», в котором различные штаммы вируса могут смешиваться и мутировать вместе{479}.
Таким образом, идеальным инкубатором для свиного гриппа будет регион, в котором соблюдаются три условия.
1. Люди и свиньи живут в тесной близости друг к другу, то есть свинина в этом регионе является одним из основных продуктов питания.
2. Местность должна находиться вблизи от океана, что создает условия для осуществления контакта между свиньями и мореплавающими птицами.
3. Большая вероятность, что это регион одной из развивающихся стран, где из-за бедности более низкий уровень гигиены и санитарии, что позволяет вирусам животных легче передаваться людям.
Эти три условия почти идеально описывают такие страны Юго-Восточной Азии, как Китай, Индонезия, Таиланд и Вьетнам (в одном только Китае живет почти половина всего мирового поголовья свиней{480}). Данные страны часто становятся местом зарождения различных штаммов гриппа, вызывающих заболевания животных и потенциально способных привести к глобальной пандемии[92]. Поэтому они уже давно стали объектом пристального внимания медицинского сообщества, особенно в последние годы, когда усилился страх появления очередного штамма вируса. В течение ряда лет в Восточной Азии вызревал штамм H5N1, известный как «птичий грипп», различные мутации которого могут привести к невероятно опасным последствиям.
Однако опасный регион не ограничивается Азией. Например, в мексиканском штате Веракрус условия для распространения гриппа столь же благоприятны. Веракрус располагается на берегу Мексиканского залива, а сама Мексика – развивающаяся страна, в кулинарных традициях которой делается большой акцент на свинине{481}. Именно в штате Веракрус, в регионе, на которой обращало внимание крайне мало ученых{482}, и начался всплеск H1N1 2009 г.{483}.
К концу апреля 2009 г. ученые начали получить огромное количество данных о заболеваниях свиным гриппом в штате Веракрус и других частях Мексики. В некоторых отчетах приводилась цифра о 1900 случаях заболевания H1N1 в Мексике и порядка 150 смертельных исходов. Соотношение этих двух цифр, известное как «смертность», казалось очень высоким: от этого гриппа умерло около 8 % заразившихся людей, что превышало показатели для эпидемии «испанки»{484}.
Более того, многие из умерших были сравнительно молодыми и здоровыми взрослыми людьми (что часто считается еще одной характеристикой серьезной проблемы). Вирусу удавалось успешно репродуцироваться. Случаи заболевания были выявлены в Канаде, Испании, Великобритании, Израиле, Новой Зеландии, Германии, Нидерландах, Швейцарии и Ирландии (помимо Мексики и Соединенных Штатов){485}.
Внезапно показалось, что именно H1N1– а не H5N1– и есть тот враг, появления которого ученые боялись все эти годы. Мехико оказался фактически закрыт на карантин; европейские страны порекомендовали своим гражданам не ездить в Мексику или США. Фондовые рынки в Гонконге и Сингапуре (странах, особенно обеспокоенных пандемией гриппа) испытали резкое падение{486}.
Однако вскоре опасения поутихли. Хотя свиной грипп и распространялся в США невероятно быстро – начиная с 20 подтвержденных случаев 26 апреля до 2618 уже 15 днями позже{487}, в большинстве случаев заболевание протекало достаточно умеренно. В США было подтверждено всего три смертельных исхода, то есть показатель смертности был вполне сопоставим с таковым при заболевании обычным гриппом. Уже через неделю после того, как всем казалось, что свиной грипп обладает безграничным разрушительным потенциалом, CDC порекомендовала вновь открыть закрытые школы.
Однако болезнь продолжала распространяться по всему миру, и к июню 2009 г. ВОЗ присвоила ей шестой уровень, то есть самый высокий уровень угрозы. Ученые боялись, что болезнь будет распространяться в тех же масштабах, что и эпидемия «испанки» 1918 г., которая поначалу была достаточно умеренной, однако ее вторая и третья волны оказались смертельно опасными (рис. 7.1). К августу настроение жителей США вновь сменилось на пессимистичное. Власти страны начали описывать «вполне правдоподобный сценарий», при котором до половины населения страны могло быть инфицировано свиным гриппом, а около 90 тыс. американцев могло умереть{488}.
Рис. 7.1. Смертность в результате вспышек заболеваний вирусом H1N1 в 1918–919 гг.
Однако эти прогнозы оказались необоснованными. В конце концов правительство США сообщило о том, что в 2009 г. штаммом H1N1 оказалось инфицировано около 50 млн американцев, то есть не половина, а примерно одна шестая часть населения страны, и что от болезни умерло 11 тыс. человек{489}. Штамм H1N1 оказался на удивление умеренным, и смертность составила всего 0,02 %. Фактически от гриппа в 2009–2010 гг. умерло чуть меньше людей, чем в любой другой год{490}. Конечно, эта ошибка в данных была не столь эпической, как в 1976 г., однако прогнозы оказались неудачными от начала и до конца.
Нет никаких гарантий, что прогнозы распространения гриппа будут лучше в следующий раз. Грипп и другие инфекционные заболевания обладают рядом свойств, вследствие которых их распространение очень сложно предсказать.
Опасность экстраполяции
Экстраполяция является одним из основных методов прогнозирования, порой слишком простым. В сущности, это предположение о том, что текущая тенденция будет развиваться и в будущем, причем до бесконечности. Некоторые самые известные неудачные предсказания были сделаны именно вследствие слишком вольного обращения с подобным предположением.
Например, на рубеже XX в. многие градостроители были обеспокоены увеличением использования конных экипажей, следствием использования которых было загрязнение улиц конским навозом. Один из авторов газеты Times of London предсказывал, что если в 1894 г. улицы Лондона, фигурально выражаясь, погрязли по колено в навозе, то к 1940‑м гг. они окажутся погребенными под трехметровой толщей этой субстанции{491}. К счастью, примерно через 10 лет после публикации этой статьи Генри Форд начал производить первые прототипы автомобиля «Модели Т», и подобного кризиса удалось избежать.
Экстраполяция также стала виновником и некоторых других неудачных предсказаний, связанных с ростом населения. Возможно, самые первые серьезные усилия по предсказанию роста населения в мире были предприняты английским экономистом сэром Уильямом Петти в 1682 г.{492}. В то время статистика населения была не особенно доступна, и Петти выполнил большую инновационную работу, чтобы рассчитать (достаточно точно), что темп роста населения в XVII в. был довольно медленным. Однако затем он совершенно неверно предположил, что события в будущем станут развиваться точно такими же темпами, и, согласно его прогнозам, глобальное население планеты в 2012 г. должно было составить всего чуть более 700 млн человек{493}.
Через сто лет началась промышленная революция, и население начало расти значительно быстрее. В реальности количество жителей планеты, перевалившее за 7 млрд в конце 2011 г.{494}, примерно в 10 раз больше, чем следовало из прогнозов Петти.
В 1968 г. была издана достаточно противоречивая книга «Демографическая бомба» (Paul Ehrlich «Population Bomb»), написанная биологом из Стэнфорда Полом Р. Эрлихом и его женой, Анной Эрлих. В ней была допущена противоположная ошибка. Авторы этой книги совершенно ошибочно предположили, что от голода в 1970‑е гг. умрут сотни миллионов людей{495}. Неудача этого предсказания была вызвана огромным количеством причин, в том числе и склонностью Эрлихов концентрироваться на самых страшных сценариях, чтобы привлечь внимание к своей точке зрения. Однако одна значительная проблема состояла в том, что они предполагали сохранение высокого уровня рождаемости, присущего эре свободной любви 1960‑х гг., и в будущем. С их точки зрения, это означало появление все большего и большего количества голодных ртов[93].
«В процессе написания “Демографической бомбы” я предполагал, что интерес людей к сексу и детям настолько силен, что изменить размер семьи будет сложно, – рассказывал мне Пол Эрлих в коротком интервью, – но затем мы поняли, что, если относиться к женщинам достойно и предоставить им достаточно возможностей для работы, показатель рождаемости начинает снижаться». Другие ученые, не склонные к подобным упрощениям, поняли это уже тогда. Прогнозы роста населения, изданные ООН в 1960‑е и 1970‑е гг., в целом достаточно точно показали, чему будет равна численность населения планеты через 30 или 40 лет{496}.
Экстраполяция приводит к одной из самых значительных проблем при исследовании как роста населения, так и распространения болезней, когда изучаемый показатель увеличивается по экспоненте. В начале 1980‑х гг. совокупное количество случаев заболевания СПИДом, диагностированных в США, росло в геометрической прогрессии{497}: в 1980 г. было 99 случаев, в 1981 г. – 434, а к 1984 г. оно достигло 11 148. Эти цифры можно нанести на график, как сделали некоторые ученые в то время{498}, и попытаться его экстраполировать, чтобы выявить закономерность. В этом случае можно было бы сделать прогноз о том, что количество случаев СПИДа, диагностированных в США, могло бы вырасти к 1995 г. до 270 тыс. Довольно неутешительный прогноз, однако на самом деле все стало гораздо хуже: к 1985 г. СПИДом заболело около 560 тыс. человек, то есть примерно в два раза больше (рис. 7.2).
Рис. 7.2. Общее количество случаев заболевания СПИДом, диагностированных в США: реальное до 1984 г. и экстраполированное до 1995 г.
Возможно, однако, что с точки зрения статистики точные прогнозы, основанные на экстраполяции по экспоненциальной шкале, вообще нельзя делать. Даже корректная версия этого метода{499}, учитывающая предел погрешности, показывает, что количество случаев заболевания СПИДом в 1995 г. могло колебаться в пределах от 35 тыс. до 1,8 млн. Этот диапазон слишком широк, чтобы дать какую-то разумную основу для прогноза.
Почему оказались неудачными предсказания, касающиеся эпидемии гриппа в 2009 г.
Хотя статистические методы, используемые эпидемиологами при анализе вспышек гриппа, не так просты, как в описанных выше примерах, при их использовании все равно приходится сталкиваться с проблемой экстраполяции. Это связано с тем, что обычно имеется только небольшое количество потенциально сомнительных базовых точек данных.
Одной из самых полезных переменных при прогнозировании распространения болезни является так называемое репродуктивное число, обычно обозначаемое R0. Значение R0 показывает, какое количество неинфицированных людей потенциально могут заразиться от единственного инфицированного человека. Например, значение R0, равное 4, означает, что – при отсутствии вакцин или других средств защиты – заболевший человек передаст болезнь еще четырем людям до того момента, как выздоровеет (или умрет).
Теоретически любая болезнь с R0 > 1 распространится со временем (при отсутствии вакцин и карантинов) на все население. Однако порой значение R0 бывало обманчивым: оно приближалось к 3 для «испанки», к 6 для оспы и к 15 для кори. В случае малярии, одной из самых смертельно опасных болезней в истории цивилизации, до сих пор отвечающей примерно за 10 % смертей в некоторых уголках мира, значение этого показателя может достигать сотен{500} (табл. 7.1).
Таблица 7.1. Медианные значения[94] R0 для различных заболеваний{501}
Проблема состоит в невозможности сформулировать надежные расчеты R0 до тех пор, пока болезнь не распространится по всему сообществу и пока у вас не появится достаточно времени для тщательного изучения статистики. Поэтому эпидемиологи вынуждены делать экстраполяции, основываясь на ранних и немногих данных. Измерить на ранних этапах другой ключевой статистический показатель заболеваемости, смертность, может быть столь же сложно. Мы сталкиваемся с ситуацией «Уловки-22»; болезнь невозможно точно предсказать без этой информации, однако надежные количественные расчеты чаще всего оказываются невозможными, пока болезнь не наберет обороты.
Данные о первых вспышках инфекционных заболеваний часто бывают искаженными. Например, приведенные выше цифры о первых поставленных диагнозах СПИДа в США стали доступными лишь через несколько лет после заражений. Но даже скорректированные статистические данные не позволили улучшить качество прогнозов. Однако если бы мы были вынуждены положиться на данные, реально доступные ученым в то время{502}, то результаты могли оказаться еще хуже. Это связано с тем, что в первые годы своего развития СПИД плохо воспринимался и вызывал чувство стыда как у пациентов, так и у врачей{503}. Множество странных синдромов с симптомами, напоминавшими СПИД, оставались без диагноза или диагностировались неправильно – иногда причиной смерти считались другие инфекции, вызываемые СПИДом. Лишь многие годы спустя, когда врачи начали заново открывать старые истории болезней, им удалось лучше оценить развитие СПИДа в первые годы.
Неточные данные также послужили причиной плохих прогнозов распространения свиного гриппа в 2009 г. Смертность, связанная с H1N1, была, по всей видимости, достаточно высокой в Мексике, однако оказалась невероятно низкой в США. Хотя отчасти это было связано с различиями в эффективности здравоохранения в каждой стране, значительная часть различий представляла собой на самом деле статистическую иллюзию.
Само понятие смертности представляет собой простое отношение количества смертельных случаев, вызванных болезнью, к количеству случаев заболеваний. Однако оба элемента этого соотношения вызывают целый ряд вопросов. С одной стороны, в Мексике имелась тенденция относить к жертвам H1N1 людей, умерших от других форм гриппа или вообще других болезней. Лабораторные тесты показали, что не менее четверти смертей, ранее связывавшихся с действием вируса H1N1, в реальности не имели никаких черт, присущих гриппу. С другой стороны, в ряде случаев данные о заболеваниях, вызванных вирусом H1N1, передавались не в полном объеме. В таких развивающихся странах, как Мексика, не развиты ни такая сложная система отчетов, как в Соединенных Штатах, ни культура посещения врача при первых признаках заболевания{504}. Факт быстрого распространения заболевания после того, как оно оказалось на территории США, заставляет предположить, что в Мексике имелись десятки, а то и десятки тысяч заболевших, о которых не было известно властям.
Фактически вирус H1N1 мог циркулировать по южной и центральной Мексике на протяжении ряда месяцев, пока на него не обратила внимание медицинская общественность (занятая в то время поисками следов птичьего гриппа в Азии). Отчеты о вспышке респираторного заболевания появились сначала в небольшом городке Ла Глория, штат Веракрус, в начале марта 2009 г., после того как гриппом заболело большинство жителей, однако поначалу мексиканские власти полагали, что это вызвано более привычным штаммом вируса под названием H3N2{505}.
Напротив, свиной грипп был навязчивым объектом множества публикаций в СМИ с момента его появления на территории США. Только несколько случаев могло бы остаться без внимания. Так как в США используются более высокие стандарты отчетности, показатель смертности там был более надежным и позволял исключить некоторые плохие сценарии из дальнейшего рассмотрения – но лишь до тех пор, пока не оказалось слишком поздно отказываться от некоторых пугающих прогнозов, ставших доступными широкой публике.
Самореализующиеся и самоотменяющиеся предсказания
Во многих случаях, связанных с предсказаниями деятельности человека, сам факт создания предсказания может повлиять на поведение людей. Иногда, как и в экономике, эти изменения в поведении могут повлиять и на результат прогноза, либо аннулировав его, либо, напротив, повысив его точность. Прогнозы, касающиеся гриппа и других инфекционных заболеваний, затрагивают обе стороны этой проблемы. Случай, при котором предсказание приводит к событиям, его подтверждающим, называется самореализующимся предсказанием или самоисполняющимся пророчеством. Примером его может служить выпуск результатов политического опроса в гонке с множеством кандидатов, например, первичные выборы на президентский пост.
В таких случаях избиратели могут из тактических соображений поддержать кандидата, потенциально способного выиграть (а не растратить зря свой голос), и раскрученные результаты опроса часто лучше всего показывают, какому кандидату это по силам. Например, на последних этапах политической гонки республиканцев в Айове в 2012 г. канал CNN выпустил результаты опроса, показывавшие, что Рик Санторум может рассчитывать на 16 % голосов, а не на 10 %, как это было раньше{506}. Этот опрос выбивался из общего ряда – другие исследования общественного мнения не показывали, что Санторум набирает обороты, даже после выпуска опроса CNN{507}. Тем не менее благодаря опросу Санторум получил значительную и позитивную поддержку СМИ, и некоторые избиратели, ранее поддерживавшие кандидатуры других, близких по идеологическим взглядам кандидатов типа Мишель Бахманн и Рика Перри, перешли на его сторону. Через некоторое время опрос сделал свое дело, Санторум выиграл в Айове, а Бахманн и Перри остались далеко позади.
Более тонкие примеры этого подхода можно найти в таких областях, как дизайн и развлечения, где компании, в сущности, соревнуются друг с другом в том, что смогут предугадать вкусы потребителей. Но они также способны влиять на потребителей определенным образом через толковые маркетинговые планы. Что касается моды, то специалисты в этой области пытаются угадать, какие цвета будут популярными в следующем сезоне{508} – это нужно делать заранее, примерно за год, поскольку именно такой срок требуется для переналадки производственных линий.
Допустим, группа влиятельных модельеров решит, что в следующем году популярным будет коричневый цвет, и начнет выпускать большое количество одежды коричневого цвета. Если модели и знаменитости начнут носить коричневое, а в каталогах и витринах магазинов будет преобладать одежда коричневых тонов, то велики шансы на то, что публика последует за этой тенденцией. Однако в данном случае она просто реагирует на маркетинг коричневого цвета, а не выражает какое-либо глубинное предпочтение к нему. Дизайнер может показаться настоящим провидцем, угадавшим цвет, хотя, если бы он выбрал белый, черный или лавандовый, произошло бы примерно то же самое{509}.
Заболевания и другие медицинские обстоятельства также могут обладать свойствами самореализации. Когда те или иные медицинские аспекты широко обсуждаются в СМИ, люди чаще начинают находить у себя соответствующие симптомы, а врачи чаще диагностируют ту или иную болезнь. Наиболее известный пример такого случая, наблюдаемый в последние годы, связан с аутизмом.
Если вы сравните количество детей, которым поставлен диагноз «аутизм»{510}, с частотой использования термина аутизм в американских газетах{511}, то обнаружите почти идеальное соответствие по модели «один-к-одному» (рис. 7.3), причем оба значения в недавние годы выросли. И хотя аутизм не всегда воспринимается как заболевание, можно провести определенные параллели с гриппом. «Мы наблюдаем поразительное явление. Для заболеваний, не имеющих четкого механизма возникновения, новости сами по себе начинают способствовать появлению все новых случаев постановки такого диагноза», – рассказал мне доктор Алекс Озонофф из гарвардской Школы здравоохранения. Озонофф серьезно изучал математику и довольно свободно разбирается в вопросе управляемых данных, однако сейчас он в основном концентрируется на использовании тщательного статистического анализа при исследовании гриппа и других инфекционных заболеваний. «Мы раз за разом обнаруживаем, что чем чаще люди думают и обсуждают конкретный диагноз или болезнь, тем чаще его начинают ставить, и корреляция доходит почти до 100 %».
Рис. 7.3. Аутизм: освещение в СМИ и количество поставленных диагнозов, 1992–008 гг.
Озонофф полагает, что именно это явление может отвечать за ту скорость, с которой свиной грипп распространился по США в 2009 г. Хотя болезнь и распространялась достаточно быстро, резкий статистический прирост мог быть отчасти связан с тем, что люди сообщали врачам о симптомах, которые прежде игнорировали.
Если бы доктора решили производить расчеты темпа распространения болезни среди населения, то количество официально объявленных случаев привело бы к искаженной статистике. Чем-то это напоминает ситуацию со статистикой преступности. Предположим, что полиция сообщает об увеличении количества ограблений в каком-то районе. Связано ли это с тем, что полицейские усилили бдительность и стали раскрывать больше преступлений, чем раньше, или же им стало проще сообщать об этом?[95] А может быть, этот район действительно стал более опасным? Подобные проблемы очень сложны для любого, кто хочет делать прогнозы заболеваемости гриппом на ранних стадиях.
Самоотменяющиеся предсказания
Самоотменяющееся предсказание относится к противоположным случаям, при которых факт появления предсказания приводит к прекращению развития ситуации. Интересным примером здесь могут служить системы GPS-навигации, обретающие все бо́льшую популярность. Через Манхэттен проходят две основные трассы в направлении с юга на север – Вест-Сайдское шоссе, идущее вдоль реки Гудзон, и скоростная магистраль ФДР-Драйв на восточной стороне острова. В зависимости от конечной точки водитель не всегда может отдать предпочтение определенной трассе. Однако его GPS-система сама укажет, по какой дороге ехать, учитывая степень их загруженности: система, по сути, предсказывает, какой путь выбрать, чтобы быстрее добраться до точки назначения. Проблема возникает, когда много водителей пользуется одной и той же системой: совершенно внезапно дорога становится перегруженной машинами, и прежде «более быстрая» трасса превращается в более медленную. Уже есть ряд теоретических{512} и эмпирических{513} свидетельств того, что это стало проблемой на некоторых часто используемых трассах в Нью-Йорке, Бостоне и Лондоне и что такие системы иногда могут оказаться контрпродуктивными.
Это качество предсказаний порой может представлять проблему и с точки зрения правильности предсказаний, касающихся гриппа, поскольку их цель, хотя бы отчасти, состоит в повышении общей осведомленности о болезни и, таким образом, изменения поведения в обществе. Самым эффективным прогнозом в отношении гриппа может считаться тот, которому не удается сбыться, поскольку он мотивирует людей на более здоровый выбор.
Простота без изощренности
Финский ученый Ханна Кокко предпочитает использовать статистическую или прогнозную модель рисования карт{514}. Модель должна содержать достаточно деталей, чтобы быть полезной и честно отображать фундаментальную картину: наверняка вы не захотите упустить из внимания крупные города, рельефные реки, высокие горные массивы и главные дороги.
Однако чрезмерное количество деталей иногда может запутать путешественника, а порой и сбить его с пути. Как было отмечено в главе 5, эти проблемы носят не только эстетический характер.
Без необходимости усложненные модели способны оставить в системе больше шумов, чем сигналов, и в результате плохо воспроизводят лежащую в основе структуру, тем самым ухудшая качество прогнозов.
Но какой объем деталей считать недостаточным или, напротив, чрезмерным? Чтобы изучить картографию и научиться сочетать элементы искусства и науки, присущие ей, может уйти целая жизнь. Возможно, говорить о выстраивании модели как о форме искусства – это уже чересчур, но что-то правильное в идее есть.
Однако в идеале на вопросы, подобные тому, что задала Кокко, можно дать эмпирический ответ. Работает ли модель? Если нет, то, возможно, нам стоит изучить ее с другой степенью детализации. В эпидемиологии традиционные модели, используемые докторами, довольно просты – и не работают так, как хотелось бы.
Самое базовое математическое описание инфекционного заболевания называется SIR-моделью (рис. 7.4). В этой модели, сформулированной в 1927 г.{515}, принято следующее допущение: существуют три «состояния», в одном из которых любой человек может находиться в каждый момент времени. S (susceptible) означает восприимчивые к болезни, I (infectiousill) – заразившиеся, a R (recovery) – выздоровевшие после болезни. В рамках этой модели переход от одного состояния к другому происходит всегда в одном направлении – от S к I и затем к R. Вакцинация выступает своего рода «короткой дорожкой»[96], позволяющей человеку перейти от S к R без перенесения заболевания. Математика этой модели сравнительно проста и сводится к ряду дифференциальных уравнений, которые можно решить на ноутбуке за несколько секунд.
Рис. 7.4. Схематическое изображение SIR-модели
Проблема состоит в том, что для нормальной работы модели требуется сделать множество предположений, и некоторые из них на практике выглядят не вполне реалистично. В частности, в модели заложено предположение, что все участники той или иной популяции ведут себя одинаковым образом: то есть они в равной степени подвержены болезням, имеют одинаковый доступ к вакцинации и пересекаются друг с другом случайным образом. Нет никаких различий с точки зрения расы, пола, возраста, религии или сексуальной ориентации, и все ведут себя более-менее одинаково.
Парадокс ВИЧ в Сан-Франциско
Увидеть недостатки этих допущений проще всего при изучении болезней, передающихся половым путем. В конце 1990‑х и начале 2000‑х гг. был заметен сильный рост незащищенного секса в гомосексуальном сообществе Сан-Франциско{516}, опустошенном пандемией ВИЧ/СПИД двумя десятилетиями ранее. Некоторые исследователи видели причину этого в увеличении темпов потребления наркотиков, особенно кристального метамфетамина, который наиболее часто вызывает более рискованное сексуальное поведение. Другие обращали внимание на повышение эффективности антиретровирусной терапии – коктейлей из различных лекарственных средств, способных продлить жизнь ВИЧ-инфицированных пациентов на многие годы или десятилетия. В результате геи перестали воспринимать диагноз ВИЧ как смертельный приговор. Другие теории концентрировались на поколенческих закономерностях – молодое поколение геев начало воспринимать Сан-Франциско 1980‑х гг. с его эпидемией СПИДа как древнюю историю{517}.
Единственное заключение, с которым соглашались эксперты, состояло в том, что при увеличении случаев незащищенного секса должно было увеличиться и количество случаев заражения ВИЧ{518}. Однако этого не случилось, хотя наблюдался рост других заболеваний, передающихся половым путем. В частности, наблюдался всплеск (с девяти случаев в 1998 г. до 502 в 2004 г.{519}) количества вновь поставленных диагнозов «сифилис» среди мужчин, занимавшихся сексом с другими мужчинами (MSM){520}, притом что в 90‑е гг. эти болезни почти исчезли в Сан-Франциско. Выросло и количество заболеваний гонореей. Однако, как ни парадоксально, количество новых случаев ВИЧ не увеличилось. В 2004 г., когда заболеваемость сифилисом достигла самого высокого уровня за многие годы наблюдений, количество диагнозов ВИЧ упало до минимального значения с начала эпидемии СПИДа (рис. 7.5). С точки зрения исследователей, это казалось очень странным: сифилис и ВИЧ в обычных условиях обладают достаточно высокой статистической корреляцией. Кроме этого, между ними имеется причинно-следственная связь, поскольку наличие одной болезни может сделать вас более уязвимым к приобретению второй{521}.
Рис. 7.5. Изменение количества вновь поставленных диагнозов ВИЧ и сифилиса, геи, Сан-Франциско, 1998–004 гг.
Как оказалось, решение парадокса заключалось в том, что геи начали активнее использовать так называемый серосортинг, иными словами, они выбирали половых партнеров с тем же статусом ВИЧ, что и у них. Не до конца понятно, как им удавалось это организовать, однако этот факт был задокументирован детальными поведенческими исследованиями, проведенными в Сан-Франциско{522}, Сиднее{523}, Лондоне и других городах с большими популяциями геев. Возможно, что положительную роль сыграли и кампании в области здравоохранения – часть из них переключилась с идеи борьбы с «усталостью от презервативов» на «обсуждаемую безопасность». Также не исключено и влияние интернета, заменившего бары в качестве лучшего места для поиска половых партнеров. В интернете существуют другие нормы по разглашению информации: многие мужчины указывают в профилях на специализированных сайтах свой статус ВИЧ, а кроме того, в интернете проще задавать интимные вопросы (и получать честные ответы), чем на танцполе{524}.
В чем бы ни состояла причина, было ясно, что это специфическое и локализованное поведение не вполне соответствует простым моделям заболевания – к счастью, в данном случае это означало, что прогнозы исследователей в отношении ВИЧ оказались слишком пугающими. Модели, основанные на различных состояниях, предполагают, что у каждого человека имеется свой уровень восприимчивости к болезни. Это допущение не работает столь же точно в случае болезней, требующих более близкого контакта, или в случаях, когда уровень риска является асимметричным для различных групп населения. Иными словами, вы не можете зайти в продуктовый магазин и выйти из него зараженным ВИЧ.
Почему не сработали модели в Форт-Дикс
Однако даже в случае более простых заболеваний компартментальные модели[97] могут оказаться неприменимыми из-за слишком общих и нестрогих допущений, заложенных в них. Рассмотрим, например, корь.
Корь – это первая болезнь, которую (вследствие ее простоты) начинают изучать будущие эпидемиологи в рамках программы PhD[98]. «Корь представляет собой удобную модель для изучения системы инфекционного заболевания, – утверждает Марк Липсиц, коллега Озоноффа по Гарварду. – Она одномерна. Ее можно выявить с помощью анализа крови, у нее имеется лишь один штамм, и у всех заболевших проявляются одни и те же симптомы. Переболев ею, вы не заразитесь второй раз». Если бы нужно было назвать единственную болезнь, идеально описываемую SIR-моделью, то специалисты выбрали бы корь.
Однако в 1980‑х и начале 1990‑х гг. в Чикаго был зафиксирован ряд необычно тяжелых всплесков кори, которые эпидемиологи не могли предсказать. В соответствии с традиционной моделью, прививки имелись у такого количества жителей города, которого должно было быть достаточного для формирования так называемого коллективного иммунитета – своего рода биологического эквивалента брандмауэра, благодаря которому болезнь не имеет возможности развиваться и затухает сама собой. Однако в отдельные годы на протяжении 1980‑х корью заболевало не менее 1000 жителей города – в основном маленькие дети. Проблема показалась настолько тревожной, что власти приказали медсестрам ходить от двери к двери и делать жителям прививки{525}.
Доктор Роберт Даум, педиатр и специалист по инфекционным заболеваниям, работавший в нескольких больницах Чикагского университета, серьезно изучил эти всплески кори. Даум – настоящий идеал врача. У него глубокий голос, огромная борода и потрясающее чувство юмора. Незадолго до встречи со мной в Чикаго Даум вернулся с Гаити, где вместе с коллегами помогал преодолевать последствия землетрясения 2010 г.
Чикаго, в котором я прожил 13 лет, – это город пригородов. Зачастую пригороды бывают достаточно сегрегированы либо по расовому составу, либо по социально-экономическим признакам. Даум обнаружил, что население пригородов также различалось по отношению к прививкам. Небогатые афроамериканцы, жившие в районах типа Саус-Сайд, неохотно разрешали прививать своих детей вакциной MMR (против кори, свинки и краснухи). Непривитые дети вместе ходили в школу, вместе играли, кашляя и чихая друг на друга. Их поведение отвергало одно из предположений модели SAR о так называемом случайном смешивании, согласно которому любые два человека имеют одинаковый шанс вступить в контакт друг с другом. И понятно было, что эти дети как раз и явились распространителями кори.
Именно это явление неслучайного перемешивания и стало причиной «фиаско свиного гриппа» в 1976 г., когда ученые посчитали H1N1 угрозой национального масштаба на основании нескольких случаев заболевания в Форт-Дикс. Штамм свиного гриппа – известный в наши дни под названием A/New Jersey/76 – казался столь угрожающим отчасти потому, что быстро распространился по военной базе: в течение от двух до трех недель было диагностировано 230 подтвержденных случаев{526}. Это дало ученым основание предположить, что у болезни имеется крайне высокое репродуктивное число R0, близкое к 3, что было сопоставимо со значением R0 для пандемии «испанки» 1918 г.
Однако воинское подразделение можно считать средой, предрасположенной к заболеваниям. Солдаты находятся в нетипично тесном контакте друг с другом, в условиях, где им приходится делиться едой и постельными принадлежностями и сложно уединиться. Более того, они часто выполняют тяжелые физические упражнения, которые временно истощают иммунную систему, а социальные нормы в армии предполагают, что вы должны заниматься делом, даже если больны. Таким образом, для передачи инфекционного заболевания появляется множество возможностей, и оно начинает распространяться значительно быстрее.
Последующее изучение{527} событий в Форт-Дикс показало, что бурное распространение заболевания было вызвано этими особыми факторами, а не его вирулентностью. Форт-Дикс нельзя было считать аналогом какого-нибудь американского пригорода. Сам по себе штамм A/New Jersey/76 не был таким уж опасным. Значение R0 для него составляло всего 1,2, то есть было примерно таким же, как у обычного сезонного гриппа. Если бы дело происходило не на военной базе (или в другом месте с похожими условиями, типа тюрьмы или университетского общежития), то болезнь не распространилась бы так широко. В сущности, грипп в Форт-Дикс исчез сам по себе, после того как на базе не осталось инфицированных людей.
Фиаско, связанное с A/New Jersey/76, – как и парадокс в отношении ВИЧ/сифилиса в Сан-Франциско или всплески кори в Чикаго в 1980‑е гг. – способно многое сказать об ограничениях моделей, основанных на слишком упрощенных допущениях. Конечно же, я не хочу сказать, что вам всегда стоит предпочитать сложные модели простым; как мы уже видели в других главах этой книги, сложные модели так же успешно могут завести людей в тупик. А поскольку сложные модели часто дают нам более точные (хотя и не обязательно правильные) ответы, они способны слишком повысить самоуверенность исследователя и заставить его ошибочно считать себя отличным прогнозистом.
Тем не менее, хотя и можно считать плюсом модели ее простоту, она должна быть хотя бы изощренно простой{528}. Модели типа SIR, хотя и полезны для понимания болезни, слишком туповаты для того, чтобы помочь нам предсказать ее дальнейшее развитие.
Система имитационного моделирования Sim[99] в действии
Прогнозы погоды представляют собой один из немногих примеров сравнительно сложных моделей, в рамках которых качество предсказаний смогло значительно улучшиться. Для этого потребовались десятилетия работы, однако после создания системы, способной физически имитировать атмосферу, метеорологи получили возможность делать нечто большее, чем использовать исключительно статистические подходы к предсказаниям погоды.
Все больше и больше профессионалов пытается применять аналогичный подход к предсказанию развития болезней на основе агентного моделирования[100]. Я побывал в Питтсбургском университете и встретился с исследователями, находящимися на передовом крае разработки этой методики. Для названия своей модели команда использует аббревиатуру FRED, которая расшифровывается как «основа реконструкции динамики эпидемий» (framework for reconstruction of epidemic dynamics). Одновременно это имя является своеобразной данью уважения уроженцу Питтсбурга Фреду Роджерсу, бывшему ведущему детского телевизионного шоу «Mister Rogers’ Neighborhood».
Питтсбург, как и Чикаго, – это город, состоящий из пригородов. Размышляя о болезни, исследователи постоянно апеллируют к ним, и поэтому FRED представляет собой своеобразный аналог Питтсбурга – СимПиттсбург (SimPittsburgh) – невероятно детальную имитационную модель, в которой каждый человек представлен «агентом», имеющим семью, сеть социальных контактов, место жительства и набор убеждений и манер поведения, соответствующих его социально-экономическому статусу.
Доктор Джон Грефенстетте, один из ученых питтсбургской команды, прожил в этом городе значительную часть своей жизни, однако до сих пор говорит с заметным иностранным акцентом. Он рассказал мне, как организована работа FRED: «Школы, офисы и больницы размещены в этой модели так же, как в реальном городе. У жителей нашей системы имеются вполне реальные проблемы при записи детей в школы; они не всегда ходят в самую ближнюю – а кроме того, некоторые школы слишком малы, в то время как другие огромны. Это чем-то напоминает игру SimCity». Доктор Грефенстетте и его любезный коллега доктор Шон Браун показали мне некоторые результаты имитационного моделирования, полученные с использованием FRED, на которых волны болезней, раскрашенные разным цветом, распространялись по районам СимПиттсбурга, СимВашингтона или СимФиладельфии. Однако при этом FRED – это серьезный бизнес. Модели такого рода не ищут легких путей, в них должны быть представлены практически все жители города, графства или штата.
Некоторые модели, основанные на агентах, пытаются даже имитировать всю страну или весь мир. Как и погодные модели, они требуют проведения огромного количества расчетов, а следовательно, использования суперкомпьютеров. Естественно, что при проведении расчетов такого рода необходимо правильно учесть демографические данные (это вполне можно сделать, используя результаты переписи населения). Однако модели также должны принимать во внимание куда менее предсказуемое человеческое поведение. Например, насколько велика вероятность того, что 26-летняя мать-одиночка-латиноамериканка пойдет делать прививку? Вы можете провести опрос и спросить ее – основанные на агентах модели довольно сильно полагаются на данные опросов. Однако люди на удивление часто лгут (или забывают), когда речь идет об их действиях, связанных с охраной здоровья: так, они заявляют, что моют руки{529} или используют презервативы{530} гораздо чаще, чем это происходит в реальности.
По словам доктора Грефенстетте, одно довольно устоявшееся правило заключается в следующем: люди готовы принимать участие в неудобных, но ведущих к оздоровлению действиях, таких как вакцинации, если они связаны с достаточно высоким, по их мнению, риском заболеть. Жительница СимПиттсбурга получит прививку от гриппа, если будет считать риск свиного гриппа серьезным. Однако как изменится ее представление о происходящем, если заболеет ее сосед или даже ребенок? Что, если в местных новостях постоянно рассказывают случаи, связанные с гриппом? Самореализующиеся и самоотменяющиеся свойства предсказания заболеваний играют огромную роль в этих моделях с использованием агентов. Поскольку они динамичны и позволяют поведению агента меняться со временем, то в какой-то момент дают возможность получить ответы и на заданные мной чуть выше вопросы.
Можно посмотреть и на работу доктора Даума и его команды из Чикагского университета, которые строят модели, основанные на агентах, для изучения распространения опасного заболевания под названием MRSA[101] -инфекции. Вызывающие ее стафилококки устойчивы к антибиотикам, и в результате обычные ссадины, порезы и синяки могут стать опасными для жизни, а порой привести к неизлечимому заболеванию. MRSA-инфекция – это сложное заболевание с множеством путей распространения: через объятия, открытые раны или через пот или кровь. Порой они могут задерживаться на различных поверхностях, таких как столешницы или полотенца. Часто следы MRSA можно найти в раздевалках, в которых спортсмены обмениваются снаряжением; всплески MRSA время от времени фиксируются у членов футбольных команд разного уровня – от школьных до профессиональных. Задача усложняется еще и потому, что многие люди являются носителями бактерии MRSA, но не заболевают и не страдают от присущих болезни симптомов.
Предпринимая попытку смоделировать действие MRSA, Даум и его коллеги задают себе примерно такие вопросы: люди какого типа используют пластыри, если они получили ссадину или порез? Насколько распространены объятия среди представителей разных культур? Какая доля жителей пригорода сидела в тюрьмах (где стафилококковые инфекции встречаются чаще обычного)?
Используя традиционные модели, даже нельзя рассчитывать на то, чтобы учитывать ответы на подобные вопросы, но модели, основанные на агентах, могут, по крайней мере, предложить нам шанс получить точные прогнозы. Однако командам из Питтсбурга и Чикаго приходится принимать во внимание множество довольно разнообразных переменных. И это необходимо делать всякий раз, когда вы пытаетесь оценивать поведение каждого жителя большой популяции. Работа часто заставляет их изучать вопросы когнитивной психологии, поведенческой экономики, этнографии и даже антропологии: модели, основанные на агентах, используются для изучения ВИЧ-инфекции в различных сообществах – от жителей джунглей Папуа – Новой Гвинеи{531} до завсегдатаев гей-баров Амстердама{532}. И в этом случае нужны довольно глубокие знания местных обычаев и привычек.
Учитывая вышесказанное, стоит заметить: агентное моделирование – исключительно смелое занятие, и в группах, работающих в этой области, часто собраны звезды из лучших и ярчайших представителей различных дисциплин. Однако даже при наличии всей этой интеллектуальной элиты их усилия часто подрываются нехваткой данных. «Даже в случае H1N1 довольно сложно получить детальные географические данные о том, кто, когда и где заболел, – жалуется Грефенстетте. – И вы не поверите, насколько сложно получать данные о всплесках болезни, имевших место в прошлом».
Во время разговора с участниками команд в Чикаго и Питтсбурге я иногда вспоминаю о красивых новых торговых центрах в Китае. Центрах, в которых есть невероятные интерьеры – римские колонны, американские горки и венецианские каналы, – но нет посетителей или магазинов-арендаторов. Исследователи из обеих команд уже пришли к некоторым невероятно полезным и действенным заключениям. Например, доктор Грефенстетте вычислил, что закрытие школ может приводить к неблагоприятным последствиям, если происходит слишком быстро или слишком ненадолго, а команда из Чикагского университета пришла к выводу, что необычно большое количество случаев заболеваний MRSA-инфекцией в центральной части Чикаго было вызвано перемещением людей в окружную тюрьму Кук и из нее. Однако по большей части модели заточены под создание прогнозов на будущее и готовы использовать данные, которых еще нет.
Модели, основанные на методах агентного моделирования, в отличие от методов, используемых при создании прогноза погоды, которые могут уточняться ежедневно, сложно протестировать. Вспышки серьезных заболеваний возникают не так уж часто. И даже хорошие модели могут пасть жертвой собственного успеха из-за присущего им свойства самоотмены. В данном случае правильное предсказание будущего способно изменить ход событий: будущее станет значительно более благоприятным. Представьте себе, что модель говорит о том, что некое действие – например, закрытие школ в одном графстве – может оказаться очень эффективным. И это действие срабатывает! Распространение болезни в условиях реального мира замедляется. Но это же заставляет модель выглядеть в ретроспективе слишком пессимистичной.
Именно поэтому команды из Питтсбурга и Чикаго не решаются использовать свои модели для создания конкретных предсказаний. Другие ученые были менее осторожны в преддверии всплеска свиного гриппа 2009 г., и кое-кто выдал достаточно плохие предсказания{533}, иногда значительно недооценивая масштабы распространения гриппа.
В настоящее время работа команд ограничена в основном тем, что коллега доктора Даума Чип Масал называет «моделирование для глубокого понимания». Иными словами, агентное моделирование может помочь нам проводить эксперименты, позволяющие больше узнать об инфекционном заболевании, но пока что маловероятно, что они помогут предсказать их всплеск.
Что делать, когда прогнозы неутешительны
Итак, оказалось, что две последние и значительные волны страхов, вызванных гриппом в Соединенных Штатах, оказались достаточно беспочвенными. В 1976 г. не наблюдался всплеск заболеваний, вызванных вирусом N1H1, за исключением случаев в Форт-Дикс, а программа массовой вакцинации президента Форда начала казаться чрезмерной. В обоих случаях прогнозы правительства относительно масштабов вспышки заболевания были достаточно неточными.
Но при этом нет никакой гарантии, что ошибка не повторится в следующий раз, когда придет грипп. Адаптировавшийся к человеческому организму штамм птичьего гриппа H5N1 мог убить сотни миллионов людей. Он распространялся так же легко, как и H1N1 версии 2009 г., однако его расчетная смертность была вполне сопоставима с версией 1918 г., и могло бы погибнуть 1,4 млн американцев. Имеются также потенциальные угрозы со стороны других вирусов, например вируса атипичной пневмонии SARS и даже оспы, уничтоженной в мире к 1977 г., но которая теоретически может вновь оказаться среди нас (например, в виде биологического оружия, примененного террористами) и способна убить миллионы. По определению, самые серьезные эпидемии могут прогрессировать крайне быстро. В 2009 г. штамму H1N1 потребовалось около недели, чтобы из болезни, не замечаемой медицинским сообществом, превратиться в болезнь, потенциально способную убить миллионы людей.
Эпидемиологи, с которыми я общался перед написанием этой главы, – в отличие от своих коллег в других областях – отлично представляют себе ограничения, присущие их моделям. «Было бы глупо заниматься предсказаниями, основываясь на трех точках данных, – сказал мне Марк Липсиц, имея в виду пандемии гриппа в 1918, 1957 и 1968 гг. – Все, что вы можете сделать, – это распланировать различные сценарии». Если вы не можете создать хороший прогноз, то будет крайне неправильным притворяться, что это вам под силу. Я подозреваю, что эпидемиологи и другие представители медицинского сообщества понимают это благодаря своей приверженности клятве Гиппократа. Primum non nocere – Прежде всего не навреди.
Представители медицинской профессии выполнили большое количество работ, касающихся правильного и неправильного использования статистических моделей и надлежащей роли прогнозов{534}. Я не хочу сказать, что прогнозы экономистов (в отличие от прогнозов эпидемиологов) не основаны ни на чем. Однако вследствие довольно тесной связи медицины с вопросами жизни и смерти врачи склонны к осторожности. В области их деятельности глупые модели способны привести к смерти людей. И знание этого факта обладает отличным отрезвляющим эффектом.
Кое-что стоит сказать и об идее «моделирования для глубокого понимания» Чипа Масала. Философия этой книги состоит в том, что предсказание – это средство, а не цель. К примеру, оно играет крайне важную роль при тестировании гипотез, а значит, и в развитии науки в целом{535}.
Когда-то статистик Джордж Э. П. Бокс написал: «Все модели неправильны, но некоторые модели полезны»{536}. Он имел в виду, что все модели представляют собой упрощение Вселенной, как и должно быть. Еще один ученый, математик, сказал: «Лучшая модель кошки – это кошка»{537}. Все остальное предполагает, что мы исключаем какие-то детали. Степень уместности каждой детали будет зависеть от проблемы, которую мы пытаемся решить, и от того, насколько точный ответ нам требуется.
Статистические модели – не единственные инструменты, которые мы используем для созданий аппроксимаций, позволяющих получить какое-либо представление о Вселенной. Например, язык представляет собой тип модели или аппроксимацию, которую мы используем для общения друг с другом. В каждом языке есть слова, не имеющие прямых аналогов в других, хотя все они пытаются объяснить одну и ту же Вселенную. Свой специализированный язык есть и в технических областях деятельности. Для вас и для меня цвет обложки этой книги – желтый, а графический дизайнер будет использовать более специфический термин, например Pantone 107.
Но, как писал Бокс, модели могут быть полезны. Мне представляется, что работа, которую проделывают команды из Чикаго или Питтсбурга со своими имитационными моделями, в высшей степени полезна. Понимание того, что думают о вакцинации различные этнические группы, как передается болезнь в разных районах города или как реагируют люди на сообщения о гриппе, важно само по себе.
Хорошая модель может оказаться полезной даже в случае неудачи. «Нужно принимать за данность, что каждый создаваемый нами прогноз неверен, – рассказал мне Озонофф. – Так что дело состоит в том, насколько именно он неверен, что делать, когда он неверен, и как минимизировать связанные с ним убытки».
Самое главное – это помнить, что модель представляет собой инструмент, помогающий нам понимать всю сложность окружающего мира, а не заменяет собой этот мир. И это важно не только когда мы создаем предсказания. Некоторые нейробиологи, такие как Томассо Поджио из МТИ, считают, что создание серии аппроксимаций – это основной способ, который используют наши мозги для обработки информации.
Вот почему, если мы хотим улучшить свои прогнозы, нам так важно научиться понимать себя и то, как мы искажаем и интерпретируем получаемые сигналы. Первая половина этой книги была во многом связана с описанием тех случаев, где аппроксимации служат нам хорошую службу, а где подводят нас. Оставшаяся часть книги посвящена тому, как понемногу делать их лучше.
Глава 8
Все меньше, и меньше, и меньше неточностей[102]
Харалабос «Боб» Вулгарис, человек, для которого держать пари на результат спортивных состязаний стало профессией, живет в районе Голливудских холмов в Лос-Анджелесе в блестящем модернистском доме из металла и стекла и с бассейном на заднем дворе, доме, чем-то напоминающем картины Дэвида Хокни. Каждый вечер с ноября по июнь он проводит, наблюдая одновременно за пятью матчами Национальной баскетбольной ассоциации (НБА). Для этого он приобрел пять плоских телеэкранов Samsung (пожалуй, таких нет и у ребят из телекомпании DirecTV). Когда ему нужно немного отдохнуть, он едет в свой кондоминиум в Палмс-плейс в Лас-Вегасе, а когда ему нужно отдохнуть как следует – на сафари в Африку. В неудачный для него год Боб зарабатывает миллионы долларов, а в хороший – в три или четыре раза больше.
Боб искренне наслаждается некоторыми атрибутами роскошной жизни. Однако он совсем не похож на стереотипного азартного игрока в выходном костюме, нервно жующего сигару. Он не зависит ни от подсказок инсайдеров, ни от подкупленных судей, ни от других хитростей, позволяющих сделать удачную ставку. Нет у него и никакой «системы». Хотя он и использует компьютерное моделирование, но никогда не полагается только на него.
Успешным его делает тот метод, при помощи которого он анализирует информацию. Боб не просто выискивает некие шаблоны. Напротив, он совмещает свое знание статистики с пониманием особенностей баскетбола, выявляя осмысленные связи в имеющихся данных.
Для этого требуется много и упорно трудиться, а иногда – и проявить немалое мужество. Чтобы достигнуть того положения, что у него есть, Бобу потребовалось играть по-крупному и с хорошим расчетом.
Вулгарис вырос в Виннипеге, штат Манитоба, городе, расположенном в 145 км к северу от границы Миннесоты, в котором живут трудолюбивые, но холодные люди. Его отец когда-то был достаточно богат – его капитал на пике карьеры составлял примерно 3 млн долл., – однако он растратил их на азартные игры. Когда Бобу исполнилось 12 лет, его отец полностью обанкротился. А к 16 годам Боб понял, что, если он хочет выбраться из Виннипега, ему нужно получить хорошее образование, за которое платить придется ему самому. Поэтому в годы учебы в университете штата Манитоба он пытался заработать денег везде, где только мог.
Летом он отправлялся далеко на север в Британскую Колумбию и собирал там орехи, залезая на деревья. В те времена за каждое дерево платили по 7 центов. А когда он учился в школе, ему приходилось работать грузчиком в порту, перетаскивая сумки жителей Виннипега, направлявшихся в Торонто, Миннеаполис или еще дальше.
Со временем Вулгарис скопил достаточно средств и выкупил долю в компании, занимавшейся перевозкой грузов в аэропорту, а вскоре стал ее единственным владельцем. К 1999 г., когда он учился в старших классах колледжа, его капитал составлял уже около 80 тыс. долл.
Однако эта сумма, по мнению Вулгариса, была не такой уж и большой – ему доводилось видеть, как его отец выигрывал и проигрывал куда бо́льшие деньги. А перспективы работы для специалиста по философии из Университета штата Манитоба были не особенно многообещающими. Он пытался найти способ изменить свою жизнь, когда ему попалось на глаза объявление, мимо которого просто невозможно было пройти.
В тот год команда Los Angeles Lakers наняла на работу тренером дерзкого и критически настроенного Фила Джексона, который перед этим выиграл с командой Chicago Bulls шесть чемпионатов. В Lakers играло немало своих талантливых спортсменов: центральный нападающий, рослый Шакил О’Нил был на пике своих способностей, а 20-летний защитник Коби Брайант, закончивший школу лишь четырьмя годами ранее, активно обретал свою уникальную форму. Связка О’Нила и Брайанта считалась классической формулой успеха в НБА, особенно под руководством такого сильного тренера, как Джексон, который мог справляться с их невероятно раздутым эго.
При этом общественное мнение было не на стороне Lakers. Команда так и не смогла войти в ритм в предыдущем году. Сезон 1998/99 г. оказался для нее крайне неудачным. Она сменила трех тренеров подряд, итоговый счет поражений и побед составил 31:19, а после второго раунда плей-офф команда выбыла из дальнейшего соревнования, четыре раза подряд проиграв команде San Antonio Spurs. О’Нил и Брайант постоянно враждовали. Так, О’Нил крайне ревниво относился к тому, что Брайант, находившийся еще в том возрасте, когда официально нельзя пить спиртное, был готов занять его место в рейтинге популярности, а майки с его номером продавались в спортивных магазинах Лос-Анджелеса куда активнее, чем майки с номером самого О’Нила{538}. В те времена Западная Конференция[103] обладала немалой силой. В ее состав входили такие сплоченные и опытные команды, как San Antonio и Portland, и пошли слухи, что Lakers еще «недостаточно созрела», чтобы справиться с ними.
Когда Lakers проиграли команде Portland в третьей игре регулярного сезона (во время игры O’Нил даже утратил свое обычное хладнокровие и был удален с поля), казалось, что все самые пессимистичные прогнозы экспертов и комментаторов начинают сбываться. Даже газета Los Angeles Times из родного для Lakers города поставила ее всего лишь на седьмое место в списке команд НБА{539} и изрядно отчитала букмекеров из Вегаса за слишком оптимистичный прогноз шансов команды на выигрыш титула НБА (1 к 4).
Уже через пару недель после начала регулярного сезона 1999/2000 г. букмекеры Лас-Вегаса начали поддаваться скепсису. Они понизили ставки на победу Lakers до 6½ к 1. В результате любой человек, который был готов поспорить с мнением большинства, мог заработать неплохие деньги. Вулгарис никогда особенно не верил в общепринятое мнение – во многом тот стиль жизни, что он имеет сейчас, стал возможен именно благодаря недостаткам коллективного мышления, – и происходившее казалось ему настоящим безумием. Авторы колонок в газетах и букмекеры делали слишком высокую ставку на небольшую выборку данных, игнорируя более полную картину и окружавший ее контекст.
По мнению Вулгариса, Lakers играли не так уж плохо. Команда уже одержала победу в пяти из первых семи матчей, несмотря на жесткое расписание, притирку к новому тренеру и проблему с травмой Брайанта, повредившего запястье перед началом сезона и еще не выходившего на поле после этого. СМИ сфокусировались на довольно неудачном сезоне 1998/99 г., прерывавшемся то забастовкой, то сменой тренера, игнорируя при этом рекордный результат 61:21, достигнутый при нормальных обстоятельствах в сезоне 1997/98 г. Вулгарис смотрел многие игры Lakers – ему нравилось то, что Джексон делал с клубом. Поэтому он поставил 80 тыс. долл. – все свои накопления за вычетом небольшой суммы, оставленной на питание и обучение, – на то, что Lakers выиграют чемпионат НБА. Выигрыш этой ставки принес бы ему полмиллиона долларов. А потеря заставила бы вернуться к работе в аэропорту по две смены в день.
Поначалу казалось, что природное чутье не обмануло Вулгариса. Начиная с этого момента в сезоне, Lakers выиграли 52 из остававшейся им 71 игры, в том числе 19, 16 и 11 игр подряд. Итоговый результат побед и поражений, составивший 67:15, оказался одним из лучших рекордов регулярного сезона в истории НБА. Однако в плей-офф ситуация изменилась: команды Западной Конференции сражались как звери, и даже высокая доля игр на домашнем поле – награда за выдающийся сезон – не особо способствовала тому, чтобы Lakers выиграли четыре серии игр кряду.
Игроки из Лос-Анджелеса пережили настоящий испуг, сражаясь против команды Sacramento Kings в первом круге плей-офф, а затем легко одержали победу над командой из Финикса[104] в полуфинале матчей Западной Конференции. Однако в следующем круге им противостояла Portland Trail Blazers – зрелая команда, во главе которой стоял бывший коллега Майкла Джордана – и бывший ученик Джексона – Скотти Пиппен. Выиграть у Portland было бы непросто – хотя команде и недоставало таланта Lakers, ее упрямство и физический стиль игры зачастую выбивали соперников из привычного ритма{540}.
Lakers довольно легко выиграли первую игру в серии «best-of-seven»[105], однако затем начались настоящие американские горки. Команда провалила вторую игру в Лос-Анджелесе, уступив в третьем тайме команде Portland 20 очков{541} и проиграв со счетом 106:177 (это было самое позорное поражение за весь сезон){542}.
Следующая игра происходила на стадионе Роуз-Гарден в Портленде. К третьему тайму Lakers смогли собраться после того, как проигрывали по итогам первого 13 очков. Брайант совершил в последние секунды тайма великолепный бросок, закрепивший победу с перевесом в 2 очка{543}. В следующей игре команда вновь смогла нарушить законы гравитации, преодолев отставание на 11 очков после того, как О’Нил, обычно плохо исполнявший штрафные броски, смог забить 9 мячей во всех представившихся ему попытках{544}. Проиграв по итогам серии со счетом 1:3, команда Trail Blazers, по хвастливому замечанию Джексона, «начала стучаться в двери ада»{545}.
Однако в пятой игре, происходившей в «Стейплз-Сентер» в Лос-Анджелесе, игроки Lakers опять не смогли взять игру в свои руки. Из 79 бросков удачными оказались лишь 30, и команда проиграла со счетом 88:96. В шестой игре, снова происходившей в Портленде, она потеряла темп и так и не смогла настроиться на нужный лад, и Blazers успешно победили со счетом 103:93. Решающим должен была стать седьмой матч в Лос-Анджелесе.
Для тех, кто делал ставки, самым разумным в такой ситуации было бы подстраховаться. Например, Вулгарис мог поставить 200 тыс. долл. на то, что команда Portland (ставки на которую принимались с коэффициентом 3 к 2) выиграет седьмой матч. Это гарантировало бы ему прибыль. В случае выигрыша Blazers он заработал бы значительно больше, чем потерял на начальной ставке в 80 тыс. долл., и остался бы с весомой суммой в 220 тыс. долл.{546}. Если бы выиграли Lakers, его первоначальная ставка все равно бы сыграла. Да, он потерял бы вторую поставленную сумму, однако чистый итог от двух ставок составил бы 320 тыс. долл.[106].
Конечно, это значительно меньше, чем полмиллиона, но все равно неплохо.
Но возникла одна небольшая проблема: у Вулгариса не было 200 тыс. долл. Более того, он не знал ни одного человека, который мог бы одолжить ему такую сумму (по крайней мере, среди тех, кому можно было бы доверять). Он был всего-навсего 23-летним грузчиком в аэропорту, проживавшим в Виннипеге в подвале дома своего брата. Так что на карту он поставил практически все.
В самом начале игры его шансы были не особенно хорошими. Игроки Blazers преследовали O’Нила при каждой возможности. Они поняли, что могут либо вынудить его бросать с линии штрафного броска с совершенно не гарантированным результатом, либо провоцировать его нарушать правила. К середине второго тайма эта стратегия сработала – O’Нил получил три фола и не смог совершить ни одного удачного броска с поля.
Затем игроки Portland пошли в атаку, которая завершилась 3-очковым броском Пиппена. Он не только принес команде перевес в 16 очков, но и заставил загудеть весь зал «Стейплз-Сентра»{547}. К этому моменту шансы Вулгариса упали до нуля. Случаи, чтобы команда в том положении, в котором тогда оказалась Lakers{548}, – c отставанием в 16 очков за две минуты до конца третьего тайма – смогла бы выиграть, были крайне редки; шансы на выигрыш составляли примерно 1 из 15{549}, и казалось, что ставка Вулгариса – и мечта выбраться из Виннипега – обречена на провал{550}. Однако в четвертом тайме внезапно проявилась слабая сторона жесткого стиля игры Portland. Игроки команды устали, и им уже не хватало сил и адреналина. Lakers играли перед своей публикой, а как считают физиологи, это часто способствует выбросу тестостерона в самые нужные для игроков моменты{551}. Кроме этого, Lakers была более молодой командой, способной быстрее восстанавливать запасы энергии.
Внезапно игроки Portland перестали попадать в корзину. В четвертом тайме они не смогли увеличить счет в течение целых шести минут, а Lakers начали набирать темп. Сначала разрыв сократился до 6 очков, потом до 5, потом до 4, и, наконец, Брайан Шоу сравнял счет с помощью 3-очкового броска за четыре минуты до конца тайма. После этого Брайант вколотил еще два 3-очковых мяча, обеспечив своей команде перевес. Хотя в последние несколько минут игроки Portland вновь стали чаще бросать мяч в кольцо, было уже слишком поздно. Lakers показали свое преимущество, продемонстрировав целый ряд комбинаций, идеально разыгранных тандемом своих суперзвезд – Брайантом и O’Нилом.
Еще через две недели Lakers эффектно расправились с командой Indiana Pacers и выиграли свой первый титул чемпиона НБА со времен эры Мэджика Джонсона. Грузчик Боб оказался на полпути к тому, чтобы стать миллионером.
Насколько хорошо думают азартные игроки
Откуда Вулгарис мог узнать, что его ставка на Lakers выиграет? Конечно же, это было ему неизвестно.
Успешные игроки – а также успешные прогнозисты любого рода – не рассчитывают на то, что в дальнейшем их ожидают беспроигрышные ставки, а сами они будут иметь дело только с безукоризненными теориями или пользоваться результатами невероятно точных измерений. Все это – иллюзии простака, которого искушает собственная чрезмерная уверенность в себе. Напротив, успешные игроки рассматривают будущее как крупицы вероятностей, растущих и снижающихся, подобно тикеру на фондовом рынке, в ответ на каждый новый элемент информации. Когда проведенные ими расчеты показывают, что вероятность выиграть значительно превышает вероятность проиграть, они могут сделать ставку.
Например, когда Вулгарис сделал ставку, предполагалось, что вероятность выиграть титул НБА командой Lakers составляет 13 %. Вулгарис не считал, что вероятность победы – 100 % или даже 50 %, он просто был уверен, что в реальности она выше 13 %. Возможно, он допускал, что ее значение даже превышает 25 %. И если расчет Вулгариса был верным, ставка теоретически могла принести ему прибыль на уровне 70 тыс. долл. (табл. 8.1).
Таблица 8.1. Оценка Вулгарисом возможных последствий ставки на LAKERS
Если будущее для прогнозиста имеет разные оттенки серого, то настоящее рассматривается только в черно-белых красках (рис. 8.1). Теоретическая прибыль Боба (70 тыс. долл.) оценивалась с учетом 25 %-ной вероятности выиграть 520 тыс. долл. и 75 %-ной вероятности проиграть 80 тыс. долл. В долгосрочной перспективе победы и поражения взаимно сведутся на нет. Для хорошего прогнозиста будущее и прошлое больше похожи друг на друга, чем каждое из них похоже на настоящее – поскольку все будущие события могут быть выражены через значения их долгосрочных вероятностей. Однако в данном случае речь шла об одной ставке. Вулгарису необходимо было получить достаточно большой перевес (и у него имелось немало причин считать, что букмекеры недооценивали Lakers). Ему потребовался и недюжинный ум, чтобы понять это.
Рис. 8.1. Мир глазами успешного азартного игрока
Теперь, когда Вулгарис заработал достаточно денег, он может позволить себе работать с меньшим напряжением. В настоящее время он делает по три-четыре ставки на регулярные матчи в рамках чемпионата НБА. Хотя эти ставки невероятно велики по любым нормальным стандартам, они малы по сравнению с его капиталом – настолько малы, что он может вести себя по отношению к их исходу довольно индифферентно. Вечером, когда я пришел к нему в гости, он, не моргнув глазом, воспринял новость о том, что команда Utah Jazz выпустила на поле высокого и агрессивного украинского игрока Кирилла Фесенко – а это значило, что команда, скорее всего, выиграет матч, а Вулгарис потеряет свою ставку в 30 тыс. долл.
Самый большой секрет Вулгариса состоит в том, что у него нет большого секрета. Вместо этого у него имеется тысяча небольших секретов, квантов информации, которые он рассматривает в конкретный момент времени. Например, у него есть программа, позволяющая рассчитать исход каждой игры. Однако он полагается на ее выводы либо в тех случаях, когда считает, что у него есть серьезный перевес, либо когда ее выводы подкрепляются другой информацией. Он смотрит почти каждую игру НБА – иногда вживую, иногда в записи – и формирует собственное мнение о том, какие команды играют в полную силу, а какие нет. Он даже создал некое подобие аналитической службы, наняв ассистентов для создания графиков перемещений каждого игрока в каждой игре. Результаты этой работы обеспечивают ему преимущество, которого нет у многих команд НБА.
Он следит за тем, что пишут в Twitter десятки игроков НБА, и анализирует каждое 140-символьное сообщение. Игрок, пишущий о том, что он собирается зайти в ночной клуб, может хуже проявить себя в игре в следующий день. Вулгарис обращает много внимания на то, что говорят тренеры на пресс-конференции, и на слова, которые они используют: например, если тренер говорит, что ждет от команды «умелой защиты» или хочет, чтобы она играла «в хороший классический баскетбол», это может означать, что тренер хочет замедлить темп игры.
Все, за чем наблюдает Вулгарис, может показаться тривиальным большинству людей. В каком-то смысле так оно и есть – большие и очевидные перевесы будут замечены другими азартными игроками, а следовательно, это отразится на ставках. Поэтому ему нужно копнуть немножко глубже.
Например, в конце сезона 2002 г. Вулгарис заметил, что счет, с которым оканчивались игры с участием команды Cleveland Cavaliers, постоянно не соответствовал прогнозам. Стоит сказать, что в баскетболе принимают два вида ставок: на разницу в очках и на общий счет, то есть на количество очков, заработанных обеими командами. Внимательно проследив за ходом пары игр, он быстро выявил причину: Рики Дэвис, довольно эгоистичный разыгрывающий защитник команды, должен был стать в конце года профессионалом, не связанным контрактом, и поэтому он делал все, что только мог, чтобы улучшить свою статистику и повысить свою цену на рынке. Он отчаянно помогал нападавшим Cavaliers создать как можно больше возможностей зарабатывать очки и результативные подачи. Было совсем не важно, хороший это баскетбол или нет, – Cavaliers практически не имели шансов выйти в плей-офф{552}. Часто или нет, но соперники Cavaliers, которые находились в столь же плачевном положении и хотели взять реванш, заключали с ними негласное соглашение. Обе команды переставали обращать внимание на защиту и принимались обмениваться результативными бросками в корзину, пытаясь улучшить статистику друг друга{553}. В последние три недели сезона в играх с участием Cavaliers средний результат внезапно вырос с 192 очков за игру до 207{554}. Конечно, никто не мог гарантировать, что ставка на то, что счет окажется выше среднего, была беспроигрышной – гарантировать вообще нельзя ничего, – однако подобная ставка могла оказаться достаточно прибыльной.
Закономерности такого рода иногда кажутся очевидными в ретроспективе. Разумеется, итог игр Cavaliers должен был быть выше, поскольку им не оставалось ничего другого, кроме как улучшать статистику нападений. Однако и этот факт часто ускользает от внимания азартных игроков, которые слишком ограниченно понимают статистику и не учитывают контекст. Даже если команда заработала больше очков, чем ожидалось, в течение одной-двух или трех-четырех игр, то это обычно ничего не значит. Сезон игр НБА очень продолжительный: каждая из 30 команд играет по 82 игры, и поэтому подобные случаи наблюдаются почти постоянно{555}. Но не стоит слишком сильно на это рассчитывать. Причина возникновения таких результатов не имеет ничего общего с вероятностью. Букмекеры тоже замечают возникновение таких закономерностей, и это отражается на размере ставок, которые они предлагают рынку. И порой эти ставки выглядят так, что игроку стоит сделать ставку на противоположный исход.
Поэтому Вулгарис не просто выявляет закономерности – сделать это в любой среде с большими массивами данных несложно; именно так и поступают посредственные азартные игроки. Самое главное – это понять, что представляет собой данная закономерность – шум или сигнал.
Но, хотя я и не могу поделиться с вами каким-либо основным и единственным доводом, на основании которого Вулгарис делает или не делает ставку, его решения направляются определенным типом мыслительного процесса, называемого рассуждениями Байеса.
Невероятное наследие Томаса Байеса
Томас Байес был английским священником, родившимся то ли в 1701, то ли в 1702 г. О жизни его известно довольно мало, хотя он подарил свое имя целому направлению в статистике и, возможно, самой знаменитой ее теореме. Неясно даже, как выглядел Байес на самом деле, его портрет, который часто приводят в энциклопедиях, может принадлежать другому лицу{556}.
Нам известно, что Байес, скорее всего, родился в зажиточной семье, проживавшей в юго-восточном английском графстве Хартфордшир. Он был вынужден отправиться в далекое путешествие и поступил в Эдинбургский университет, поскольку принадлежал к церкви нонконформистов, а не англиканской и ему был закрыт доступ в учебные заведения типа Оксфорда и Кембриджа{557}.
Тем не менее Байес был все равно избран членом Королевского научного общества, несмотря на незначительное количество публикаций. Там он обычно выполнял роль своего рода внутреннего критика или был посредником в ходе интеллектуальных дебатов. Одной из работ, которые ученые приписывают Байесу (несмотря на ее публикацию под псевдонимом Джон Нун{558}), является трактат под названием «Божественная доброта»{559}. В этом трактате Байес рассматривал извечный теологический вопрос о том, как могут существовать в мире страдания и зло, несмотря на безграничную доброту Господа. В сущности, ответ Байеса на этот вопрос состоит в том, что мы ошибочно принимаем наше собственное несовершенство за несовершенство Бога, чей замысел в отношении нашей Вселенной мы не можем понять в полной мере. В письме другому теологу Байес писал «довольно странно… для человека, видящего лишь нижнюю часть шкалы, говорить о всеобъемлющем поражении счастья в мире»{560}.
Более знаменитая работа Байеса «Очерки к решению проблемы доктрины шансов»{561} была опубликована только после его смерти и после того, как была представлена вниманию Королевского общества в 1763 г. другом Байеса по имени Ричард Прайс. В работе рассматривался вопрос о том, как мы формулируем вероятностные представления о мире, сталкиваясь с новыми данными.
В описании эссе Байеса Прайс приводит пример человека, попадающего в наш мир (например, Адама или человека из платоновской пещеры) и впервые наблюдающего восход солнца. Поначалу он не знает, обычное ли это событие или из ряда вон выходящее. Однако он видит восход солнца каждый последующий день и начинает все сильнее верить, что это – постоянное свойство природы. Постепенно, основываясь лишь на этой, в чистом виде статистической форме взаимодействия с природой, он присваивает своему прогнозу о том, что солнце вновь встанет на следующий день, вероятность, максимально близкую (хотя и никогда не достигающую) к 100 %.
Суть идеи Байеса и Прайса состоит не в том, что мир всегда оценивается в вероятностях или степенях неопределенности. Байес верил в небесное совершенство; он также выступал сторонником взглядов Исаака Ньютона, согласно которым природа следует регулярным и предсказуемым законам. Скорее, Байес говорил – с математической и философской точек зрения – о том, как нам следует изучать Вселенную. Мы учимся новым представлениям о ней с помощью аппроксимаций, оказываясь ближе и ближе к истине по мере того, как мы собираем все больше свидетельств.
Это заключение прямо противоположно более скептичной точке зрения шотландского философа Дэвида Юма{562}, который считал, что, поскольку мы не можем быть уверены в том, что солнце взойдет, наш прогноз относительно этого события не может считаться более рациональным, чем обратное заключение{563}. Напротив, байесовская точка зрения рассматривает рациональность как вероятностное событие. По сути, Байес и Прайс говорят Юму: не обвиняйте природу, поскольку вы слишком глупы, чтобы ее понять, и если вы вылезете из своей скептической раковины и сделаете прогнозы ее поведения, то, возможно, сможете приблизиться к истине.
Вероятность и прогресс
Стоит отметить, насколько это утверждение напоминает слова Байеса, приведенные в трактате «Божественная доброта» («Divine Benevolence»), где утверждалось, что нам не стоит относить собственное несовершенство на ошибки Бога. Однако в философии Байеса, по сути, нет ничего религиозного{564}.
Нужно отметить, что самое точное математическое выражение того, что в наши дни считается теоремой Байеса, было разработано человеком, который с высокой долей вероятности был атеистом{565}, – французским математиком и астрономом Пьером-Симоном Лапласом.
Лаплас, как вы, возможно, помните из главы 4, был ярким представителем человека, стоящего на позициях научного детерминизма. Он считал, что мы могли бы идеально спрогнозировать нашу Вселенную, если бы знали положение каждой частицы в ней и могли бы достаточно быстро рассчитать ее движение. Так почему же Лаплас так увлекся теорией, основанной на вероятности?
Причина заключается в разрыве между совершенством природы и нашим человеческим несовершенством в измерении и понимании ее. Лапласа изрядно расстраивали астрономические наблюдения, свидетельствовавшие об аномалиях в орбитах Юпитера и Сатурн – по их предсказаниям, Юпитер должен был врезаться в Солнце, а Сатурн – вылететь за края Солнечной системы{566}.
Разумеется, эти предсказания были в корне неверными, Лаплас посвятил значительную часть своей жизни тому, чтобы более точно определить орбиты этих планет{567}. Уточнения, которые внес Лаплас, были основаны на вероятностных заключениях{568}, а не на результатах более точных измерений, поскольку инструменты того времени (например, телескопы) были достаточно грубыми. Лаплас начал рассматривать вероятность как срединную точку между невежеством и знанием. Ему казалось очевидным, что для достижения научного прогресса важно уделять вопросам вероятности значительно больше внимания{569}.
Таким образом, Байес и Лаплас уже в XVIII в. отлично понимали, что существует некая тонкая связь между вероятностью, предсказанием и научным прогрессом. И это было еще в тот период, когда человечество только начало сталкиваться с взрывообразным ростом объемов информации, ставшим возможным благодаря изобретению печатного пресса несколькими столетиями ранее и способствовавшим развитию устойчивого научного, технического и экономического прогресса. Эта связь крайне важна – как для предсказания орбит планет, так и для угадывания победителя в матче с участием Lakers. Как мы увидим ниже, наука зашла в тупик позже, когда в XX в. начала доминировать иная статистическая парадигма, лишившая предсказание былой значимости и пытавшаяся рассматривать неопределенность как результат несовершенства наших измерений, а не как ошибку наших суждений.
Простая математика теоремы Байеса
Если философская подоплека теоремы Байеса удивительно глубока, то ее математика потрясающе проста. В своей базовой форме это всего лишь алгебраическое выражение с тремя известными переменными и одной неизвестной. Однако эта простая формула способна привести к инсайтам в предсказаниях.
Теорема Байеса прямо связана с условной вероятностью. Иными словами, она позволяет рассчитать вероятность какой-либо теории или гипотезы, если произойдет какое-либо событие. Представьте себе, что вы живете с партнером и, вернувшись домой из командировки, обнаруживаете незнакомую пару нижнего белья в своем гардеробе. Возможно, вы зададитесь вопросом: какова вероятность того, что ваш партнер вас обманывает? Условие состоит в том, вы найдете белье; гипотеза состоит в том, что вы заинтересованы оценить вероятность того, что вас обманывают. Хотите – верьте, хотите – нет, но теорема Байеса способна дать вам ответ на вопрос такого рода – при условии того, что вы знаете (или хотите оценить) три качества.
• Прежде всего вы должны оценить вероятность появления белья как условие правильности гипотезы – то есть при условии того, что вам изменяют.
Для решения этой проблемы давайте предположим, что вы женщина, а ваш партнер – мужчина, а предметом спора выступает пара трусиков. Если он вам изменяет, то несложно представить себе, как в ваш гардероб могли попасть чужие трусики. Но, даже если (или даже особенно в том случае если) он вам изменяет, вы можете ожидать, что он ведет себя достаточно осторожно. Давайте скажем, что вероятность появления трусиков при условии того, что он вас обманывает, составляет 50 %.
• Во-вторых, вы должны оценить вероятность появления белья при условии того, что гипотеза неверна.
Если муж вам не изменяет, должны быть другие, более невинные объяснения появления трусиков в вашем гардеробе. Некоторые из них могут оказаться довольно неприятными (например, это могли бы быть его собственные трусики). Возможно, что его багаж был по ошибке перепутан с чужим. Возможно, что в его доме по каким-то причинам вполне невинно заночевала какая-то ваша подруга, которой вы доверяете. Трусики могли бы быть подарком вам, который он забыл упаковать. Ни одна из этих теорий не лишена изъянов, хотя порой объяснения в стиле «мое домашнее задание съела собака» действительно оказываются правдой. Вы оцениваете их совокупную вероятность в 5 %.
• Третье и самое важное, что вам нужно, – это то, что байесовцы называют априорной вероятностью (или просто априори). Как вы оценивали вероятность его измены до того, как нашли белье? Разумеется, вам сложно сохранять объективность оценки сейчас, после того как эти трусики появились в поле вашего зрения (в идеале вы оцениваете эту вероятность до того, как начинаете изучать свидетельства). Но иногда оценивать вероятность подобных событий можно эмпирически. Например, в ряде исследований было показано, что в течение любого случайным образом взятого года своим супругам изменяет около 4 % женатых партнеров{570}, так что мы возьмем эту цифру за априорную вероятность.
Если вы произвели оценку всех этих значений, то можете применить теорему Байеса для оценки апостериорной вероятности[107]. Именно в этой цифре мы и заинтересованы больше всего – насколько велика вероятность того, что нам изменяют, при условии что мы нашли чужое белье?
Расчет и простая алгебраическая формула, позволяющая его сделать, приведены в табл. 8.2.
Таблица 8.2. Пример расчета вероятности измены по теореме Байеса
Оказывается, что вероятность измены все равно достаточно мала – 29 %. Это может показаться нелогичным: разве трусики не являются достаточно весомой уликой? Возможно, такой результат связан с тем, что вы использовали слишком низкое априорное значение вероятности его измены.
Хотя у невиновного человека может быть значительно меньше вариантов разумных объяснений появления трусиков, чем у виновного, вы изначально посчитали его невиновным, и это оказало большое влияние на результат расчета по уравнению.
Когда мы априорно в чем-то уверены, мы можем проявить удивительную гибкость даже при появлении новых свидетельств. Одним из классических примеров таких ситуаций является выявление рака груди у женщин в возрасте старше 40 лет. К счастью, вероятность, что у женщины в возрасте после 40 лет разовьется рак груди, довольно невелика и составляет примерно 1,4 %{571}. Однако чему равна вероятность положительного результата на ее маммограмме?
Исследования показывают, что даже если у женщины нет рака, то маммограмма ошибочно покажет его наличие в 10 % случаев{572}. С другой стороны, если у нее есть рак, маммограмма выявит его примерно в 75 % случаев{573}. Увидев эту статистику, вы можете решить, что положительный результат маммограммы означает, что все очень плохо. Однако расчет по теореме Байеса с использованием этих цифр позволяет сделать иное заключение: вероятность наличия рака груди у женщины в возрасте за 40 при условии, что у нее положительная маммограмма, все еще составляет примерно 10 %. В данном случае такой результат расчета по уравнению обусловлен тем, что довольно немного молодых женщин имеют рак груди. Именно поэтому многие врачи рекомендуют женщинам не начинать регулярно делать маммограммы до 50-летнего возраста, после достижения которого априорная вероятность рака груди значительно увеличивается{574}.
Проблемы такого рода, вне всякого сомнения, сложны. Во время недавно проводимого исследования статистической грамотности американцев им приводили этот пример с раком груди. И оказалось, что всего 3 % из них смогли правильно рассчитать значения вероятности{575}. Иногда, немного замедлившись и попробовав визуализировать эту проблему (как показано на рис. 8.2), мы можем легко проверить реальностью свои неточные аппроксимации. Визуализация помогает нам легче увидеть общую картину – поскольку рак груди встречается у молодых женщин крайне редко, сам факт положительного результата маммограммы еще ни о чем не говорит.
Рис. 8.2. Графическое изображение исходных данных для теоремы Байеса на примере с маммограммой
Однако мы обычно склонны ориентироваться на самую новую или самую доступную информацию, и общая картина начинает теряться. Умные игроки вроде Боба Вулгариса научились умело пользоваться подобными недостатками нашего мышления. Вулгарис сделал выгодную ставку на Lakers отчасти потому, что букмекеры уделили слишком много внимания нескольким первым играм Lakers и изменили ставки на выигрыш командой титула с 4 к 1 до 65 к 1. Однако на самом деле команда играла ничуть не хуже, чем могла играть хорошая команда в случае травмы одного из ее звездных игроков. Теорема Байеса требует от нас более внимательно продумывать проблемы такого рода. Она может оказаться крайне полезной для выявления случаев, когда наши аппроксимации, основанные на чутье, оказываются слишком грубыми.
Но я не хочу сказать, что наши априорные ожидания всегда доминируют над новыми свидетельствами или что теорема Байеса всегда приводит к нелогичным, на первый взгляд, результатам. Иногда новые свидетельства оказываются настолько значимыми для нас, что перевешивают все остальное, и мы можем практически моментально изменить свое мнение и стать полностью уверенными в событии, вероятность которого считали почти нулевой.
Давайте рассмотрим более мрачный пример – атаки 11 сентября. Большинство из нас, проснувшись в тот день утром, присваивало практически нулевое значение вероятности того, что террористы примутся разбивать самолеты о небоскребы на Манхэттене. Однако мы признали очевидную возможность террористической атаки после того, как первый самолет врезался во Всемирный торговый центр. И у нас исчезли любые сомнения в том, что на нас было произведено нападение, после того как самолет врезался во вторую башню. Теорема Байеса способна отобразить этот результат.
Допустим, до столкновения первого самолета с башней наши расчеты вероятности террористической атаки на высотные здания Манхэттена составляли лишь 1 шанс из 20 тыс., или 0,005 %. Однако мы также должны были считать достаточно низкой вероятность ситуации, при которой самолет столкнулся бы с башней Всемирного торгового центра по ошибке. Эта цифра может быть рассчитана эмпирически. За период длительностью 25 тыс. дней до событий 11 сентября, в течение которых осуществлялись полеты над Манхэттеном, произошло всего два подобных случая{576}: столкновение с Эмпайр-стейт-билдинг в 1945 г. и с башней на Уолл-стрит, 40, в 1946 г. Следовательно, возможность подобного инцидента составляла примерно 1 шанс из 12 500 в любой случайный день. Если по этим цифрам сделать расчеты с использованием теоремы Байеса (табл. 8.3a), то вероятность террористической атаки повышалась с 0,005 до 38 % в момент столкновения первого самолета со зданием.
Таблица 8.3а. Пример расчета вероятности террористической атаки по теореме Байеса
Однако идея, заложенная в теорему Байеса, заключается в том, что мы не корректируем свои расчеты вероятности только один раз. Мы делаем это постоянно по мере появления новых свидетельств. Таким образом, наша апостериорная вероятность террористической атаки после столкновения первого самолета, равная 38 %, становится нашей априорной возможностью столкновения со вторым.
И если вы еще раз проведете расчеты после столкновения второго самолета с башней Всемирного торгового центра, то увидите, что вероятность террористической атаки 99,99 % сменяется почти полной уверенностью в этом событии. Один несчастный случай в яркий солнечный день в Нью-Йорке был крайне маловероятен, но второй практически не мог не произойти (табл. 8.3б), как мы внезапно и с огромным ужасом поняли.
Таблица 8.3б. Пример расчета вероятности террористической атаки по теореме Байеса
Я сознательно выбрал в качестве примеров довольно сложные случаи – террористические атаки, рак, супружеская измена, – поскольку хочу продемонстрировать масштаб проблем, к решению которых может быть применено байесовское мышление. Теорема Байеса – это не волшебная формула. В ее самой простой формуле, которую мы приводим в этой книге, используются простые арифметические действия по сложению, вычитанию, делению и умножению. Но для того, чтобы она дала нам полезный результат, мы должны снабдить ее информацией, в частности нашими расчетами априорных вероятностей.
Однако теорема Байеса заставляет нас думать о вероятности событий, происходящих в мире, даже когда речь заходит о вопросах, которые мы не хотели бы считать проявлением случайности. Она не требует, чтобы мы воспринимали мир как внутренне, метафизически неопределенный: Лаплас считал, что все, начиная от орбит планет и заканчивая движением мельчайших молекул, управляется упорядоченными ньютоновскими правилами. И тем не менее он сыграл важную роль в развитии теоремы Байеса. Скорее можно сказать, что эта теорема связана с эпистемологической неопределенностью – границами наших знаний.
Проблема ложноположительного срабатывания[108]
Когда мы не можем думать подобно истинным байесовцам, ложноположительное срабатывание начинает представлять собой проблему не только для маммографии, но и для всей науки. В введении я упомянул работу врача-исследователя Джона П. А. Иоаннидиса. В 2005 г. Иоаннидис опубликовал влиятельный труд под названием «Почему самые широко публикуемые выводы исследований неверны»{577}, в котором процитировал множество статистических и теоретических аргументов, подтверждавших, что (как и следует из названия) большинство гипотез, признанных истинными в медицине и большинстве других научных профессий, являются, по сути, ложными.
Гипотеза Иоаннидиса, как мы уже сказали, кажется одной из немногих истинных. Так, сотрудники компании Bayer Laboratories обнаружили, что не могут повторить в ходе собственных экспериментов до двух третей положительных заключений, опубликованных в медицинских журналах{578}. Еще один способ проверить правдивость выводов исследования состоит в том, чтобы понять, насколько точными являются результаты предсказаний в реальном мире, И, как мы видим на множестве примеров, приведенных в этой книге, часто выводы не выдерживают испытание реальностью. Судя по всему, частота появления неудачных предсказаний во множестве областей, от сейсмологии до политических наук, оказывается невероятно высокой.
«За последние 20 лет благодаря геометрическому росту доступной информации, развитию геномики и других технологий мы получили возможность измерять миллионы и миллионы потенциально интересных переменных, – рассказал мне Иоаннидис. – Можно ожидать, что мы сможем использовать эту информацию для того, чтобы заставить предсказания работать на нас. Я не говорю, что мы не достигли никакого прогресса. Принимая во внимание наличие миллионов научных работ, признать это было бы крайне стыдно. Однако совершенно очевидно, что мы не сделали миллионов открытий. Большинство работ не вносят реального вклада в развитие знания».
Вот почему наши предсказания могут оказаться более подверженными неудаче в эру Больших данных. С экспоненциальным ростом объема доступной информации по той же экспоненте растет и количество гипотез, требующих изучения. Например, правительство США в настоящее время публикует сведения о 45 тыс. экономических статистических показателей. Если вы захотите протестировать связи между всеми комбинациями из пар этих показателей – есть ли, допустим, причинно-следственная связь между ставкой банковского кредитования и уровнем безработицы в Алабаме? – то вам потребуется протестировать не меньше миллиарда гипотез[109]. Однако количество осмысленных связей в данных, говорящих о наличии причинно-следственной связи, а не о корреляции, и позволяющих протестировать то, каким образом мир работает по-настоящему, на много порядков ниже. Истина не растет теми же темпами, что и информация; по сути, в мире сейчас не больше истины, чем было до появления интернета или печатного пресса. Основная часть данных – всего лишь шум, так же как основная часть Вселенной заполнена вакуумом.
Тем не менее, как мы знаем из теоремы Байеса, в случаях, когда реальная вероятность возникновения какой-либо болезни в популяции низка (рак груди у молодых женщин; истина в море данных), ложноположительное срабатывание может доминировать в результатах, если только мы не будем достаточно внимательны и осторожны. На рис. 8.3 представлено графическое отображение этой картины. Так, 80 % истинных научных гипотез вполне справедливо признаются истинными, а около 90 % неверных гипотез совершенно справедливо отвергаются. Тем не менее, поскольку истинные открытия возникают крайне редко, оказывается, что около двух третей выводов, которые мы считаем правильными, на самом деле оказываются ложными!
Рис. 8.3. Графическое отображение ложноположительного срабатывания
К сожалению, как выяснил Иоаннидис, состояние опубликованных исследований в большинстве областей, по которым проводилось статистическое тестирование, напоминает ту картину, что можно увидеть на рис. 8.3[110].
Почему же доля ошибок так велика? До определенной степени вся данная книга представляет собой ответ на этот вопрос. Причин можно назвать много: отчасти они связаны с нашими психологическими предубеждениями, отчасти – с распространенными методологическими ошибками, а отчасти – с неправильно выстроенными стимулами.
Однако основная проблема лежит в том, что тип статистического мышления, который используют различные исследователи, является ошибочным по своей сути.
Когда статистика отклонилась от принципов Байеса
Английский статистик и биолог по имени Рональд Эймлер (Р. A.) Фишер был, возможно, основным интеллектуальным соперником Томаса Байеса, несмотря на то что он родился в 1890 г., почти через 120 лет после его смерти. Он проявил себя еще более яркой личностью, чем Байес, и таким же олицетворением английской интеллектуальной традиции своего времени, каким в наши дни стал Кристофер Хитченс. Он был миловидным, но неопрятно одетым человеком{579}, постоянно курил трубку или сигареты и вел непрекращающийся бой с реальными и вымышленными соперниками.
Посредственный лектор, но в то же время проницательный писатель, обладавший чутьем к драматическим сюжетам, он оставался отличным и востребованным собеседником за обедом. Интересы Фишера были невероятно широкими. Один из лучших биологов и генетиков своего времени, но при этом беззастенчивый сторонник элитизма, он искренне оплакивал тот факт, что у представителей бедных классов имелось значительно больше потомства, чем у интеллектуалов{580} (сам Фишер, следуя собственным убеждениям, с осознанием собственного долга дал жизнь восьмерым отпрыскам).
Возможно, Фишер в большей степени, чем кто-либо еще, отвечает за то, какими статистическими методами мы широко пользуемся в настоящее время. Он разработал терминологию проверки статистической значимости и значительную часть соответствующей методологии. Он не относился к числу больших поклонников Байеса и Лапласа, но именно он впервые использовал термин «байесовский» (Bayesian) в опубликованной статье, причем довольно уничижительным образом{581}, а в другой статье утверждал, что теория Байеса «должна быть полностью отвергнута»{582}.
Фишер и его современники не видели проблемы в формуле, называемой теоремой Байеса, как таковой, поскольку это обычное математическое выражение. Скорее, они беспокоились о том, как следует ее применять. В частности, у них вызывало вопросы понятие байесовского априорного значения{583}. Оно казалось им слишком субъективным: мы должны заранее предусмотреть, насколько вероятным мы считаем какое-то событие, прежде чем пуститься в эксперименты? Не противоречит ли это понятиям объективной науки?
Поэтому Фишер и его современники решили разработать набор статистических методов, которые, как они надеялись, освободят нас от любого возможного негативного влияния предубеждений и искажений. Это направление статистики обычно называется «фреквентизм» (frequentism), хотя также его называют «фишеровской статистикой» (в противовес байесовской){584}.
Идея фреквентизма состоит в том, что неопределенность в статистической проблеме возникает исключительно из-за того, что сбор данных производится на выборке, а не на всей популяции. Это имеет вполне разумные основания, когда мы изучаем, допустим, результаты политических опросов. Например, при проведении опросов в Калифорнии выборка составляет всего 800 человек, а не 8 млн, которые придут голосовать на очередных выборах, в результате возникает так называемая ошибка выборки. Величина ошибки, которую вы видите в описании политических опросов, измеряет именно это – насколько велика вероятность ошибки из-за того, что вы опрашиваете 800 представителей популяции из 8 млн? Методы фреквентистов как раз и призваны дать этому параметру количественную оценку.
Однако даже в контексте политических выборов ошибки выборки не всегда позволяют рассказать всю историю. В течение короткого интервала между конференцией демократической партии в Айове и первичными выборами демократической партии в Нью-Гемпшире в 2008 г. в последнем штате было опрошено около 15 тыс. человек{585} – невероятно много для столь небольшого штата, притом что предел погрешности теоретически составлял ±0,8 %. Однако реальная ошибка оказалась в 10 раз выше: Хиллари Клинтон выиграла выборы в штате с перевесом в 3 %, хотя, по данным опросов, уступала Бараку Обаме 8 %. Ошибка выборки – единственный тип ошибки, которому фреквентисты дают право на существование, – была, пожалуй, меньшей из проблем, возникшей при проведении опросов в Нью-Гемпшире.
Кроме того, некоторые организации, занимающиеся опросами, стабильно демонстрируют искажение в сторону той или иной партии{586}. С тем же успехом они могли бы опросить все 200 млн взрослых американцев и все равно получить неверные результаты. Байес разобрался с этими проблемами уже 250 лет назад. Если вы используете искаженный инструмент, то не важно, как много измерений вы произведете, вы неправильно сформулировали цель.
По сути, фреквентистский подход к статистике пытается изо всех сил утвердиться в мысли о том, что частая причина неверных предсказаний – это человеческая ошибка. Этот подход рассматривает неопределенность как нечто, присущее эксперименту, а не нашей способности понимать реальный мир. Фреквентистский метод также предполагает, что чем больше данных мы собираем, тем меньше становится ошибка. Со временем она приблизится к нулю. Таким образом, наличие данных считается необходимым и достаточным для решения любой проблемы. Многие из куда более проблемных вопросов предсказания, описанных в этой книге, связаны с областями, в которых полезные данные встречаются крайне редко, и порой их сбор действительно является важным и ценным делом. Однако неправильное использование этого метода вряд ли поставит вас на верный путь к статистическому совершенству. Как заметил Иоаннидис, эра Больших данных лишь ухудшает проблемы ложных позитивных выводов в исследовательской литературе.
Фреквентистский метод нельзя считать особенно объективным ни в теории, ни на практике. Напротив, он полагается на целый ряд предположений. Например, обычно предполагается, что неопределенность в измерении следует колоколообразной кривой или нормальному распределению. Часто это предположение достаточно хорошо описывает ситуацию, но не в случае таких вещей, как колебания на фондовом рынке. Фреквентистский подход требует определения выборки, которая будет выглядеть достаточно прямолинейно, когда дело касается политического опроса, но довольно неоднородно во многих других областях практического применения.
Какую «выборку из популяции» можно было бы выбрать в случае атаки 11 сентября?
Однако еще бо́льшая проблема состоит в том, что фреквентистские методы – в своем стремлении создать безупречные статистические процедуры, которые не могут быть испорчены предубеждениями самого исследователя, – вынуждают его герметично закрываться от реального мира. Эти методы не позволяют такому исследователю изучить глубокий контекст или ущербные черты своей гипотезы, то есть то, чего требует байесовский метод в форме априорной вероятности. В результате можно увидеть, на первый взгляд, серьезные научные работы о том, как жабы могут предсказывать землетрясения{587}, или о том, как оптовые магазины типа Target стимулируют создание нетерпимости в обществе{588}. В подобных исследованиях фреквентистские тесты применяются для создания «статистически значимых» (однако, по сути, бессмысленных и даже возмутительных) выводов.
Данные без контекста бесполезны
Ближе к концу своей карьеры Фишер смягчился и даже время от времени хвалил Байеса{589}. Некоторые из методов, разработанных им за долгие годы (хотя и не самые популярные в наши дни), представляли собой, по сути, компромиссы между байесовским и фреквентистским подходами. Однако в последние годы своей жизни Фишер допустил крайне серьезный просчет, который продемонстрировал ограничения этого подхода.
Вопрос касался курения сигарет и рака легких. В 1950‑е гг. в значительном количестве исследований (в некоторых из них использовались стандартные статистические методы, а в других – байесовские){590} утверждалось, что между ними существует связь, что в наши дни никого уже не удивляет.
Фишер провел последние годы своей жизни, выступая против этих выводов. Он публиковал письма в престижных изданиях типа British Medical Journal и Nature{591}, не отрицая, впрочем, что в результатах этих исследований прослеживается довольно сильная статистическая зависимость между курением и раком легких. Однако он утверждал, что в данном случае произошла путаница между корреляцией и причинно-следственными связями, сравнивая эту ситуацию с исторической корреляцией между объемами импорта яблок и количеством браков в Англии{592}. В какой-то момент он даже утверждал, что рак легких приводит к курению, а не наоборот{593}, – по всей видимости, предполагая, что люди курят, чтобы облегчить боль в легких.
Многие научные выводы, которые в наши дни ни у кого не вызывают сомнения, когда-то могли восприниматься с большим недоверием. Иногда это было вызвано существовавшими культурными табу (как в случае заявления Галилея о том, что Земля вращается вокруг Солнца), а довольно часто тем, что просто отсутствовали данные, требующиеся для анализа проблемы. Мы, может быть, и позволили бы Фишеру сорваться с крючка, если бы к 1950 г. уже не было достаточного количества убедительных свидетельств существования связи между курением сигаретам и раком легких. Ученые, изучившие данные и свидетельства из прошлого, пришли к выводу, что на тот момент уже было множество статистических и клинических тестов, проводившихся большим количеством исследователей в разных контекстах, которые наглядно показывали причинно-следственную связь{594}. Идея быстро стала научным консенсусом.
Так почему же Фишер отвергал эту теорию? Одна из причин могла быть связана с тем, что он консультировал производителей сигарет за деньги{595}. Другая – с тем, что он сам курил всю жизнь. Фишеру нравилось казаться противоречивым и демонстрировать, что он не любит все, имеющее привкус пуританства. Короче говоря, он сам был подвержен огромному количеству «искажений».
Возможно, однако, что более значимая проблема заключается в том, как статистическая философия Фишера воспринимает мир. Она уделяет особое внимание объективной чистоте эксперимента: каждая гипотеза может быть доведена до идеального заключения, если только был собран достаточный объем данных. Однако в процессе достижения такого уровня чистоты эта теория отвергает необходимость байесовских априорных значений или любого другого вида беспорядка в контексте реального мира. Этот метод не требует и не побуждает нас задуматься о некорректности нашей гипотезы – идея о том, что сигареты вызывают рак легких, ничем не отличается от предположения о том, что жабы способны предсказывать землетрясения. Но мне кажется, что стоит сказать Фишеру спасибо за то, что он признал тот факт, что корреляция не всегда предполагает наличие причинно-следственной связи.
Однако фишеровские статистические методы никоим образом не помогают нам понять, какая корреляция предполагает наличие причинно-следственных связей, а какая нет. Так что не приходится удивляться тому, что после того, как Фишер всю жизнь думал определенным образом, он утратил способность рассказать о различии между ними.
Боб – байесовец
В байесовской картине мира предсказание представляет собой критерий, с помощью которого мы оцениваем степень прогресса. Возможно, мы никогда и не будем уверены, что знаем истину на все 100 %, однако создание корректных прогнозов представляет собой отличный способ понять, приближаемся ли мы к ней.
Сторонники взглядов Байеса особенно ценят тех, кто играет в азартные игры{596}. Байес и Лаплас, да и другие теоретики, разрабатывавшие теорию вероятности на ее раннем этапе, очень любили приводить примеры из азартных игр, чтобы пояснить свои идеи. (Хотя Байес, по всей видимости, сам не увлекался этим занятием{597}, он вращался в кругах, где часто играли на деньги в карты и бильярд.) Игрок делает предсказания (хорошо), и он делает предсказания, предполагающие расчет вероятностей (отлично), а когда он готов поставить деньги на свои предсказания (еще лучше), он делится своими убеждениями о мире с остальными. Наиболее практичное определение байесовского априори может представлять собой вероятность события, на которые вы хотите сделать свою ставку[111].
Боб Вулгарис представляет собой особенно ярко выраженный байесовский тип азартного игрока. Ему нравятся ставки на баскетбол как раз потому, что они дают ему возможность протестировать самого себя и правильность своих теорий. «Представьте себе, что вы управляете спортивной командой и набираете себе игроков, – сказал он мне ближе к концу интервью. – Вы не всегда понимаете, было ли ваше решение правильным или нет. В моем же случае я знаю – в конце дня или в конце сезона, – оказался ли я прав или нет, поскольку я либо теряю деньги, либо их выигрываю. Это довольно хорошее подтверждение теории». Вулгарис впитывает так много информации о баскетболе, как только может, поскольку практически любой факт способен изменить его расчеты вероятности. Профессиональный игрок на спортивных событиях такого типа, как Вулгарис, будет размещать ставки только в том случае, если считает, что вероятность выигрыша не меньше 54 %. Этого вполне достаточно для покрытия комиссионных, которые букмекеры взимают с выигрышных ставок, и риска, связанного с этим действием. При всех своих навыках и упорном труде – Вулгарис считается одним из лучших азартных игроков в мире в наши дни – он угадывает результаты правильно лишь примерно в 57 % случаев. Добиться более высокого результата исключительно сложно.
Таким образом, вся разница связана с незначительным объемом информации, позволяющим Вулгарису увеличить вероятность с 53 до 56 %. Именно на эту небольшую прибыль и живут игроки, проводящие время как за покерным столом, так и на фондовом рынке. Предложенное Фишером понятие статистической значимости, слишком вольно отсекающее те или иные факты вне зависимости от контекста[112] для определения уровня «значительности»{598}, несколько грубовато для людей, делающих ставки на спорт.
Это не значит, что Вулгарис избегает создавать гипотезы на основе данных, которые показывает ему статистика (проблема подхода Фишера к тестированию гипотез состоит не в их существовании, а в том, как Фишер рекомендует их тестировать){599}. В сущности, это критически важно для того, что делает Вулгарис. Статистические закономерности видны во всем, и рано или поздно они отражаются на ставках. Вопрос состоит в том, представляют ли они собой сигнал или шум. Гипотезы Вулгариса сформированы с учетом его знаний о баскетболе, поэтому он может увидеть разницу быстрее и точнее.
Подход Вулгариса к ставкам на баскетбол представляет собой один из чистейших примеров научного метода, который только можно найти (табл. 8.4). Он изучает мир и задает вопросы: почему команда Cleveland Cavaliers так часто получает больше очков, чем предполагалось? Затем он собирает информацию о проблеме и формулирует гипотезу: команда делает это потому, что у Рики Дэвиса заканчивается контракт и он хочет играть в быстром темпе, чтобы его личная статистика стала выглядеть лучше. Четкая граница между тем, что делает Вулгарис, и тем, что делают физики или биологи, состоит в том, что он делает ставки на результат собственных предсказаний, а ученые надеются на подтверждение своих предсказаний путем экспериментов.
Если Вулгарису удается создать достаточно сильную гипотезу о том, что он видит в данных, он делает более агрессивные ставки. Предположим, например, что Вулгарис обращает внимание на ремарку тренера команды Denver Nuggets о том, что он хочет «устроить хорошее шоу» для фанатов. Возможно, это досужая болтовня, но не исключено, что команда будет играть в более быстром темпе, чтобы повысить зрелищность и заставить аудиторию покупать больше билетов на матчи. Если эта гипотеза верна, то Вулгарис может ожидать, что Nuggets будет выигрывать 70 % времени, в отличие от статистических 50 %. Как следует из теоремы Байеса, чем выше убежденность Вулгариса в правильности его гипотезы, тем быстрее он может начинать делать прибыльные ставки на игры Nuggets. Он может начать это делать, изучив, как проходили пары игр с участием команды, и поняв, выдерживает ли его теория испытание практикой. Причем он начнет делать это раньше, чем на данную закономерность обратят внимание букмекеры в Лас-Вегасе и изменят ставки. И, напротив, он позволяет себе не отвлекаться на статистические закономерности, такие как медленный старт Lakers в 1999 г., в котором нет никакого глубокого смысла, но который другие игроки могут ошибочно принять за сигнал.
Таблица 8.4. Научный метод, используемый Вулгарисом{600}
Байесовский путь к снижению неправоты
Но какими можно считать расчеты вероятностей, которые делает Боб, – субъективными или объективными? Это довольно хитрый вопрос.
С эмпирической точки зрения, мы все имеем убеждения и предубеждения, основанные на комбинации нашего опыта, ценностей, знаний и, возможно, политических или профессиональных взглядов. Одна из полезных характеристик байесовской точки зрения состоит в том, что если мы явным образом признаем, что у нас имеются априорные убеждения (влияющие на то, как мы интерпретируем новые свидетельства), то сможем достаточно хорошо описать нашу реакцию на изменения в своем мире. Например, если, согласно априорному убеждению Фишера, вероятность, что курильщики заболеют раком легких, составляют всего 0,00001 %, это объясняет, почему его не могли убедить никакие свидетельства обратного. В сущности, согласно теореме Байеса, ничто не мешает вам оставаться убежденным в чем-то, что вы считаете совершенно правильным. Если, по вашему мнению, вероятность существования Бога – 100 % (или же, напротив, 0 %), то, согласно теореме Байеса, никакое количество доказательств не убедит вас в обратном.
Я не собираюсь ничего говорить о том, существует или нет что-то, во что вы можете верить с абсолютной и беспрекословной уверенностью[113]. Однако возможно, что нам нужно честно говорить об этом. Спор человека, считающего, что вероятность какого-то события составляет 0 %, с человеком, уверенным на 100 % в том, что оно произойдет, – дело бесполезное. Возможно, что именно из-за таких споров и возникало множество конфликтов, таких как религиозные войны в Европе в первые годы после появления печатного пресса.
Но у нас нет оснований предполагать, что все априорные убеждения в равной степени правильны. Однако я склонен считать, что наши убеждения никогда не будут идеально объективны, рациональны или истинны. Вместо этого мы стараемся быть менее субъективными, менее иррациональными и менее неправыми. Создание предсказаний, основанных на наших убеждениях, представляет собой лучший (а возможно, и единственный) способ протестировать самих себя. Если объективность предполагает выявление истины, вне зависимости от наших личных обстоятельств, а предсказание представляет собой лучший способ изучения того, насколько тесно связано наше личное восприятие с великой истиной, то самыми объективными из нас будут считаться те, кто выступает с самыми точными предсказаниями. Статистический метод Фишера, согласно которому объективность была возможна лишь в замкнутых рамках лабораторного эксперимента, пригоден для решения таких задач куда меньше, чем байесовский.
Фактически одно из свойств теоремы Байеса состоит в том, что наши убеждения должны сближаться друг с другом – и приближаться к истине – по мере того, как нам со временем предоставляется все больше свидетельств. На рис. 8.4 я показал в качестве примера, как три инвестора пытаются определить, находятся ли они на «бычьем» или «медвежьем» рынке.
Рис. 8.4. Сближение по методу Байеса
Сначала инвесторы имеют совершенно различные наборы убеждений. Один из них оптимистично настроен и верит, что вероятность того, что рынок «бычий», составляет 90 %. Другой склонен к «медвежьим» настроениям и считает, что шансы «бычьего» рынка равны лишь 10 %. Каждый раз, когда рынок движется вверх, настроение инвесторов становится чуть более «бычьим» по сравнению с априорным, а при каждом движении вниз происходит обратная ситуация. Однако я имитировал такую ситуацию, что, хотя ежедневные колебания и носят случайный характер, в долгосрочной перспективе рынок растет в течение 60 % времени. Несмотря на то что на этой дороге есть свои ухабы, со временем все инвесторы точным образом определяют, что находятся на «бычьем» рынке, с уверенностью почти 100 % (но не с абсолютной).
В теории наука должна работать именно таким образом. Понятие научного консенсуса довольно сложно, однако основная его идея состоит в том, что мнение научного сообщества идет по пути постепенного сближения, двигаясь в сторону истины в процессе обсуждения идей и появления новых свидетельств. Как и на фондовом рынке, эти шаги не всегда направлены вперед или их легко делать. Научное сообщество часто выступает слишком консервативно по вопросу адаптации существующих парадигм к новым свидетельствам{601}, хотя иногда наука и принимает новые данные с поразительной быстротой, напоминая человека, успевающего запрыгнуть в вагон уходящего поезда. Но если предположить, что мы все находимся в одном байесовском поезде[114], то даже неверные убеждения и ошибочные априорные предположения пересматриваются, и мы постепенно движемся в сторону истины.
Например, на наших глазах происходит изменение парадигмы в статистических методах, используемых учеными. Моя критика ошибок статистического подхода Фишера не является чем-то новым или радикальным – аналогичные аргументы уже много лет приводят знаменитые ученые из различных областей знаний, начиная от клинической психологии{602} и заканчивая политологией{603} и экологией{604}. Однако пока что фундаментальных изменений почти не видно.
Тем не менее недавно целый ряд уважаемых статистиков начал утверждать, что фреквентистскую статистику не нужно преподавать студентам младших курсов университетов{605}. В некоторых профессиональных изданиях было официально объявлено об отказе в публикации результатов исследований, основанных на гипотезе Фишера{606}. Фактически, если прочитать все написанное за последние 10 лет, то сложно найти материалы, не защищающие байесовский подход.
Боб также ставит свои деньги на Байеса. Дело не в том, что он буквальным образом применяет теорему Байеса в каждом случае. Однако его практика тестирования статистических данных в контексте гипотез и убеждений, основанная на его знаниях о баскетболе, является в чистом виде байесовской, равно как и его готовность признавать вероятностные ответы на его вопросы.
Для изменения наших учебников и традиций потребуется некоторое время. Однако теорема Байеса утверждает, что мы будет постепенно приближаться к лучшему из возможных исходов. Теорема Байеса предсказывает, что байесовцы одержат победу.
Глава 9
Восстание против машин
Как и многие другие, 27-летний Эдгар Аллан По, был очарован «Механическим турком» (рис. 9.1) – хитроумным изобретением, которому удалось обыграть в шахматы Наполеона Бонапарта и Бенджамина Франклина. Машина, сконструированная в Венгрии в 1770 г., то есть еще до рождения По или Соединенных Штатов Америки, была доставлена в Балтимор и Ричмонд в 1830‑е гг. после того, как в течение десятилетий собирала огромные аудитории по всей Европе. По предположил, что это – довольно сложный розыгрыш. Он считал, что за винтиками и шестеренками машины скрывался высококлассный шахматист. И именно он управлял рычагами, обеспечивая перемещение фигур по доске и кивок головой куклы в тюрбане каждый раз после того, как она делала шах оппоненту.
Рис. 9.1. Механический турок
По считают создателем детективного жанра{607}, и действительно, в некоторых своих произведениях он очень хорошо вскрывал мистификации. Тот факт, что некий человек (впоследствии оказавшийся немецким гроссмейстером Вильгельмом Шламбергером) всегда находился рядом с машиной при ее распаковке и упаковке, но всегда отсутствовал во время игры, вполне оправданно показался ему подозрительным. («Ага! – подумал По. – Он и сидит в ящике».)
Однако самые интересные и пророческие мысли, изложенные По в эссе о Механическом турке, связаны с его представлением о том, что мы теперь называем «искусственным интеллектом» (сам термин появился только через 120 лет). В эссе выражалась очень глубокая и довольно привычная для наших дней обеспокоенность тем, что «компьютеры» смогут имитировать высшие функции человека или даже превзойти их.
По признавал, насколько впечатляющим был сам факт, что машины вообще могут играть в шахматы. Едва ли кто задумывался о первом механическом компьютере, который Чарльз Бэббидж называл «вычислительной машиной», в то время, когда По делился своими мыслями. Предложенный Бэббиджем компьютер, так и не достроенный при его жизни, мог в лучшем случае рассчитывать значения некоторых элементарных функций типа логарифмических в дополнение к операциям сложения, вычитания, умножения и деления. О работе Бэббиджа По отзывался как о достаточно впечатляющей. Однако в машину вводили предсказуемые значения на входе, затем в ней крутились несколько шестеренок, и машина выдавала предсказуемые значения на выходе. Эта машина не обладала никаким интеллектом – работа, выполняемая ею, была в чистом виде механистической. С другой стороны, компьютер, который мог играть в шахматы, казался почти чудом, поскольку для хорошей игры ему нужно было делать собственные суждения. По заявлял, что если бы машины, играющие в шахматы, действительно существовали, то они должны были бы, по определению, играть безупречно – машины не допускают ошибок при вычислении. Он подчеркивал тот факт, что «Турок» не играл в шахматы идеально – машина выигрывала большинство игр, но иногда проигрывала, – как еще одно доказательство того, что это была не машина, а аппарат, находившийся под контролем человека и обладавший человеческим несовершенством.
Хотя логика По не вполне корректна, подобное почитание машин осталось с нами до сих пор. Мы воспринимаем компьютеры как удивительные изобретения, одно из самых ярких выражений человеческого гения. Согласно опросам, Билла Гейтса считают одним из наиболее уважаемых людей в Америке{608}, а Apple и Google – одними из самых значимых компаний{609}. Мы ожидаем, что компьютер будет вести себя безупречно и изыщет возможность преодолеть человеческие недостатки своих создателей.
Более того, мы считаем расчеты компьютерных программ безукоризненно точными и, возможно, даже пророческими. В 2012 г. двум британским подросткам было предъявлено обвинение в обмане инвесторов на сумму более миллиона долларов – они предлагали легковерным вкладчикам «робота» под названием MARL{610}, занимавшегося подбором акций для инвестирования. По словам подростков, робот мог производить «1 986 832 математических операций в секунду» и при этом не быть подверженным человеческим эмоциям, что якобы позволяло инвесторам удваивать вложенные ими денежные средства каждые несколько часов, следуя рекомендациям MARL, касающимся дешевых акций{611}.
Но даже когда предсказания, выданные компьютерами, не внушают нам доверия, они способны развить в нас страхи. Например, компьютеры, рассчитывающие шансы на выживание пациентов больниц, о которых иногда пишут в новостях{612}, начинают считать собратьями HAL 9000, компьютера из фильма «Космическая одиссея 2001», решившего, что он больше не нуждается в астронавтах, и пытавшегося их удушить, лишив подачи кислорода.
Поскольку мы входим в эру Больших данных, а объемы информации и вычислительной мощности растут в геометрической прогрессии, пришло время выработать более здоровое отношение к компьютерам и к тому, что они могут для нас сделать. Технология имеет свои плюсы, поскольку позволяет нам повысить эффективность работы, но не следует ждать, что машины будут думать за нас.
Рождение шахматного компьютера
Испанский инженер Леонардо Торрес де Киведо в 1912 г. изготовил версию Механического турка, которую назвал El Ajedrecista (шахматист). Хотя El Ajedrecista иногда и называют первым компьютерным игровым компьютером{613}, функциональность этого устройства была очень ограничена, в частности, он мог разыгрывать лишь позиции в эндшпиле, когда на доске оставалось всего три фигуры. (Кроме этого, у El Ajedrecista не было примечательной особенности «Турка» – кукольной головы в тюрбане.)
Отцом современного шахматного компьютера был Клод Шэннон из МТИ, математик, считающийся основоположником теории информации. В 1950 г. Шэннон опубликовал работу под названием «Программирование компьютера для игры в шахматы», где были представлены некоторые алгоритмы и техники, которые легли в основу сегодняшних шахматных программ{614}. Он также признал, что именно шахматы представляют собой столь интересную задачу, решение которой позволит тестировать мощности машин, обрабатывающих информацию.
Шэннон понимал, что игра в шахматы имеет исключительно ясную и понятную цель – мат сопернику. Более того, она следует сравнительно простому набору правил, и в шахматах отсутствует элемент удачи или случайности. И тем не менее, как знают все, кто когда-либо играл в шахматы (лично я не такой уж хороший игрок), даже простые правила по достижению простой цели еще не означают, что эта задача окажется легкой. Шахматы требуют глубокой концентрации, позволяющей выжить после пары десятков ходов, не говоря уже о том, чтобы выиграть. Шэннон воспринимал шахматы как своего рода лакмусовый тест мощности компьютеров и способностей, которые они могли бы обрести в какой-то момент.
Однако Шэннон, в отличие от своих последователей, не был склонен романтизировать идею о том, что компьютеры могут играть в шахматы так же, как люди. И он не считал неминуемой их победу над людьми на шахматном поле боя.
При этом он отмечал четыре потенциальных преимущества компьютеров, которые:
1) способны очень быстро производить расчеты;
2) не допускают ошибок, если только эти ошибки не зашиты в самой программе;
3) не ленятся и не отказываются от полного анализа происходящего или всех возможных шагов;
4) не будут играть эмоционально и слишком сильно верить в очевидно выигрышное положение, которое может быть упущено, или слишком расстраиваться в сложной ситуации, когда ее еще можно спасти.
По мнению Шэннона, компьютерам противостоят четыре явно выраженных преимущества, которыми обладают только люди, а именно:
1) гибкость и способность переключаться, решая проблему, а не следовать закодированному набору последовательностей;
2) способность к воображению;
3) способность к разумному размышлению;
4) способность обучаться.
Шэннон считал такое противостояние вполне честным. Однако оно обрело более-менее реальную форму лишь в середине 1990‑х гг., когда российский гроссмейстер Гарри Каспаров – лучший шахматист всех времен – решил выступить против одного из самых передовых компьютеров из когда-либо созданных – компьютера Deep Blue производства IBM.
До начала этого матча люди постоянно выигрывали борьбу, и казалось, что компьютерам их не догнать. Однако постепенно компьютеры взяли верх, и теперь это будет так продолжаться, пока мы живы.
Шахматы, предсказания и эвристика
В соответствии с теоремой Байеса предсказание представляет собой, по сути, тип деятельности по обработке информации: использование новых данных для тестирования гипотез об объективном мире с целью создать более истинные и более точные концепции о нем.
Шахматы можно считать неким аналогом предсказания. Игроки должны обрабатывать информацию о положении 32 фигур на доске и их возможные действия. Они используют эту информацию для разработки стратегий, позволяющих поставить своему оппоненту мат. Эти стратегии, в сущности, представляют собой различные гипотезы о том, как выиграть игру. Можно сказать, что любой человек, выигравший игру, имел лучшую гипотезу.
Шахматы обладают свойством детерминизма – в них отсутствует реальный элемент удачи. Однако теоретически это справедливо и в отношении погоды, как мы видели в главе 4. Наше знание обеих систем несовершенно. Что касается погоды, то в метеорологии значительная часть проблемы связана с тем, что у нас нет полных данных изначальных условий. Даже если мы очень хорошо представляем, по каким правилам работает погодная система, у нас нет полной информации о положении всех молекул, образующих облака, штормы и ураганы. Поэтому лучшее, что мы можем сделать, – это дать вероятностные прогнозы.
В шахматах известны все правила и имеется идеальный набор информации – количество шахматных фигур конечно, и они располагаются на доске в ясной последовательности. Однако игра все равно невероятно сложна для нас. Шахматы способны многое сказать о нашей способности обрабатывать информацию – и продемонстрировать нам некоторые лучшие стратегии принятия решений. Необходимость предсказания появляется не только потому, что мир сам по себе наполнен неопределенностью, но и потому, что его понимание находится за пределами наших способностей{615}.
Поэтому и компьютерные программы, и шахматисты допускают ряд упрощений, чтобы спрогнозировать исход игры. Мы можем называть эти упрощения «моделями», однако при изучении компьютерного программирования и процессов принятия решений чаще используется термин эвристика. Это слово происходит от того же греческого слова, что и слово «эврика»{616}. Эвристический подход к решению проблемы состоит в использовании эмпирических правил в ситуациях, когда детерминистическое решение проблемы находится вне наших практических способностей.
Эвристика – очень полезная вещь, однако она всегда приводит к возникновению искажений и слепых пятен{617}. Например, правило эвристики «Когда вы сталкиваетесь с опасным животным, то убегайте!» часто действительно представляет собой полезное руководство, но не в случаях, когда вы встречаетесь с медведем-гризли; своим движением вы можете привлечь его внимание, а затем он запросто может вас догнать (напротив, служба национальных парков рекомендует вам в случае встречи с медведем-гризли вести себя максимально тихо и спокойно и даже притворяться мертвым, если это необходимо{618}). Люди и компьютеры используют в процессе игры в шахматы разную эвристику. Игра друг против друга в таких случаях обычно сводится к тому, чтобы найти слепые пятна оппонента быстрее, чем он найдет ваши.
Неудачное предсказание Каспарова
В январе 1988 г. Гарри Каспаров, один из самых лучших шахматистов мира с 1986 г. до своего ухода на пенсию в 2005 г.{619}, предсказал, что никакая компьютерная программа не может обыграть человека на уровне гроссмейстера по шахматам по крайней мере до 2000 г.{620}. «Если какому-то гроссмейстеру сложно играть против компьютеров, – заявил он на пресс-конференции в Париже, – я буду счастлив поделиться своим советом»{621}. Но чуть позже в том же году датский гроссмейстер Бент Ларсен потерпел поражение от программы Deep Thought, созданной несколькими выпускниками Университета Карнеги – Меллон в качестве дипломной работы.
Однако Бент Ларсен – далеко не Каспаров, а когда Deep Thought попытался выступить против Каспарова в 1989 г., то потерпел решительное поражение.
Каспаров всегда уважал роль компьютерных технологий в шахматах и уже давно использовал компьютеры для улучшения своей игры. Однако он довольно скромно отозвался о способностях Deep Though и публично высказал надежду, что в один прекрасный день может появиться компьютер, который потребует от него «использовать для победы все 100 % своих способностей»{622}.
Команду программистов во главе с Фэн Сюн Сю и Мюрреем Кэмпбеллом, стоявшую за разработкой Deep Thought, со временем наняла компания IBM, и их система постепенно была преобразована в Deep Blue. Новый Deep Blue победил Каспарова в первой игре матча в Филадельфии в 1996 г., однако Каспаров восстановился и довольно легко выиграл все остальные игры матча. В следующем году, в матче-реванше, проходившем в Нью-Йорке, случилось невероятное: Гарри Каспаров, лучший шахматист в истории, которого боялись все остальные, сам испугался компьютера.
В начале было…
Игра в шахматы, как и все остальное, состоит из трех этапов: начала, середины и конца. Небольшая особенность шахмат заключается в том, что на каждом из этих этапов требуются различные интеллектуальные и эмоциональные навыки, что превращает игру в некий умственный триатлон скорости, силы и выносливости.
В начале шахматной партии центр доски пуст, а пешки, ладьи и слоны аккуратно выстроены в первых двух рядах в ожидании инструкций от своих хозяев. Возможности почти безграничны. Белые могут начать игру 20 различными способами, а черные могут ответить 20 собственными ходами, создавая 4000 возможных вариантов действий уже после первого хода.
После второго хода каждой стороны количество возможных вариантов вырастает до 71 852; после третьего – до 9 132 484. Количество вариантов действий во всей шахматной партии, сыгранной до конца, настолько велико, что даже рассчитать его – немалая проблема, однако некоторые математики оценивают его в 10 10^50 степени. Это – астрономически огромные числа: как писал Диего Расскин-Гутман, «количество возможных вариантов шахматной партии превышает количество атомов во Вселенной»{623}.
Может показаться, что в начале игры, когда все фигуры еще стоят на доске, а количество возможностей безгранично, компьютеры находятся на пике своих величайших возможностей. На сайте IBM перед матчем с Каспаровым было размещено хвастливое утверждение о том, что Depp Blue способен рассчитать 200 млн позиций в секунду.
«А Гарри Каспаров, к сожалению, может рассчитать всего около трех положений в секунду», – ехидно писалось в статье{624}. Были ли у Каспарова хоть какие-то шансы?
Однако шахматным компьютерам многие годы не удавались удачные дебюты. Хотя количество возможностей и максимально, в этот момент цели выглядят наименее ясными. При наличии 10 в 10 10^50 ветвей на дереве игры[115] расчет 3 или 200 млн операций в секунду будет одинаково бесплодным, если только вы не направляете свою силу в одном, четко определенном направлении.
И компьютеры, и люди должны разбить шахматную партию на три промежуточные цели: допустим, захват пешки оппонента или шах королю. В середине игры, когда фигуры начинают прямое противостояние и угрожают друг другу, возникает огромное количество подобных стратегических целей. Достижение их требует разработки определенной тактики, и правильное прогнозирование может оказать самое сильное влияние на оставшуюся часть игры. Цели первых шагов сравнительно абстрактны. Компьютерам приходится сражаться с абстрактными и открытыми проблемами, а люди формулируют эвристические правила, такие как «контроль центра доски» и «сохранение нужной организации пешек», и формулируют неограниченное количество творческих способов по их исполнению.
Более того, поскольку первые ходы более привычны для игроков, чем позиции, с которыми они могут столкнуться позже, люди могут полагаться на многолетний опыт, позволяющий выбрать лучшие ходы. Хотя теоретически белые могут выбрать для начала игры 20 ходов, более чем 98 % серьезных шахматных партий начинаются с одного из четырех лучших{625}.
Проблема людей в том, что компьютерные программы могут систематизировать это знание путем изучения статистики. Шахматные базы данных содержат результаты сотен тысяч партий, и с помощью этих данных вполне можно сделать целый ряд глубоких выводов и прогнозов. Программисты IBM изучали, насколько часто разыгрывалась каждая последовательность первых ходов и насколько сильными были игроки, их разыгрывавшие. Они считали, насколько часто каждая серия шагов приводит к победам, поражениям и ничьим для сторон{626}. Эвристика компьютера, необходимая для анализа этой статистики, позволяла, в принципе, достаточно эффективно противостоять человеческой интуиции и опыту, а то и переигрывать их. «Каспаров играет не против компьютера, а против духов гроссмейстеров прошлого», – говорилось на сайте IBM при описании баз данных Deep Blue{627}.
Таким образом, цель Каспарова в первой из шести игр матча против Deep Blue в 1997 г. состояла в том, чтобы извлечь программу из «страны баз данных» и заставить ее работать в условиях нулевой видимости». Он начал партию с довольно распространенного первого хода, переместив коня на клетку доски, известную игрокам под названием f3. Deep Blue ответил продвижением вперед слона, поставившего коня Каспарова под угрозу, – вне всякого сомнения, потому что его базы данных показали, что этот ход исторически снижал возможность выигрыша белых с 56 до 51 %[116].
Однако эти базы данных строились вокруг предположения о том, что Каспаров должен был ответить на это тем же, что делают почти все другие игроки в такой ситуации{628}, то есть отодвинуть коня назад. Вместо этого он проигнорировал угрозу, посчитал, что Deep Blue блефует{629}, и предпочел двинуть вперед одну из своих пешек, чтобы позволить своему слону контролировать центр доски.
Ход Каспарова, хотя и осмысленный со стратегической точки зрения, позволил добиться и еще одной цели. Он сделал всего три хода, а Deep Blue – всего два, однако позиция, к которой они пришли (рис. 9.2), ранее возникала в профессиональных соревнованиях всего один раз{630} из сотен тысяч игр, имеющихся в базе данных Deep Blue.
Рис. 9.2. Расположение фигур после третьего хода Каспарова в первой партии
Даже когда разыгрываются популярные шахматные ходы, количество возможных ответвлений на дереве настолько велико, что базы данных становятся бесполезными примерно после 10–15 ходов. В любой достаточно длинной шахматной партии со временем вполне может возникнуть ситуации, с которой никогда не сталкивался никто из шахматистов в истории человечества. Однако Каспаров смог «отключить» базу данных после всего лишь трех ходов. Как мы постоянно видим в этой книге, исключительно статистические подходы к прогнозированию оказываются в лучшем случае неэффективными при отсутствии достаточной выборки данных для работы. Deep Blue пришлось «думать» за себя.
Дилемма шахматиста: ширина против глубины
Середина шахматной партии (обычно называемая миттельшпиль) потенциально позволяет использовать сильные стороны компьютера. Когда у фигур есть возможность сдвинуться в центр доски, то в среднем существует около 40 возможных ходов вместо 20{631}. Это может показаться не особенно большой разницей, однако из-за того, что древо возможностей разрастается в геометрической прогрессии, количество возможных вариантов ходов быстро увеличивается. Предположим, например, что вы хотите рассчитать всего три следующих хода (точнее, по три хода ваших и вашего противника, то есть всего шесть ходов). В начале партии значение этой функции рассчитывается примерно как 20 в шестой степени – то есть существует 64 млн позиций, и это уже гигантское число. Однако в середине игры вам уже нужно рассчитать 40 в 50‑й степени комбинаций, или 4,1 млрд возможностей. Deep Blue мог бы рассчитать все эти положения всего за 20 секунд. А Каспарову для этого потребовалось бы буквально 43 года, даже без перерывов на еду, сон или туалет.
Великие игроки типа Каспарова не обманывают себя и не верят в то, что им под силу рассчитать все эти варианты. Именно это и отличает лучших игроков от любителей. В своем знаменитом исследовании шахматистов голландский психолог Адриаан де Гроот обнаружил, что любители при столкновении с шахматной проблемой часто начинают напряженно искать идеальный ход и в итоге не могут сделать ни одного{632}.
Мастера игры в шахматы, напротив, ищут хороший ход – и, по возможности, лучший ход в любой позиции, – однако они скорее прогнозируют, как этот ход изменит их положение, а не пытаются оценить любую возможность. Было бы «чистой фантазией», писал американский гроссмейстер Рейбен Файн{633}, предполагать, что люди-шахматисты заранее рассчитывают каждую позицию перед тем, как сделать 20 или 30 шагов.
Но сказать, что «идеальное – враг хорошего», просто. Если вы хотите серьезно освоить такой вид искусства как шахматы, то порой вам нужно шагнуть за пределы простой эвристики. Тем не менее мы все равно неспособны создавать идеальные решения, когда нам поступает больше информации, чем мы можем обработать в ограниченный промежуток времени. Признавая свое несовершенство, мы обретаем свободу, что позволяет нам находить лучшие решения и в шахматах, и в других областях, вовлекающих прогнозирование.
Я не хочу сказать, что таким гроссмейстерам, как Каспаров, не нужно ничего рассчитывать. Как минимум Каспаров должен разработать тактику, точную последовательность трех-пяти ходов для захвата фигуры соперника или достижения другой краткосрочной цели. Для каждого из этих ходов он должен продумать возможную реакцию оппонента – все возможные вариации – и оценить, способен ли какой-нибудь из ходов оппонента свести его тактику на нет. Также ему нужно удостовериться в том, что соперник не устроил ему никаких ловушек; если король игрока не защищен, то самая сильная позиция может привести к мату буквально за несколько ходов.
Для того чтобы научиться, на чем именно стоит сосредоточиться во время игры, необходимы и память, и опыт. Иногда для этого требуется пройти по многим ветвям дерева, но лишь на пару ходов вглубь; в других случаях шахматисты концентрируются лишь на одной ветке, но производят более глубокие расчеты. Такой тип компромисса между шириной и глубиной возникает каждый раз, когда мы сталкиваемся со сложной проблемой. Например, Министерство обороны США и ЦРУ должны решить, отслеживать ли им широкий спектр сигналов для предсказания и предотвращения возможных террористических атак или сконцентрироваться на том, что они считают наиболее вероятной угрозой. Лучшим мировым шахматистам отлично удается метапознание – осознание того, как они мыслят, – и способность откорректировать этот процесс, когда им кажется, что в их мышлении нарушен баланс.
Стратегия против тактики
До некоторой степени шахматные компьютеры развиваются в двух направлениях. Они используют эвристику для того, чтобы «обрезать» свои деревья поиска, направляя свою вычислительную мощность на самые многообещающие ветви, а не просчитывая каждую с одинаковой степенью глубины. Однако поскольку скорость обработки информации у них высока, им не нужно идти на серьезные компромиссы – они могут понемногу оценивать каждую возможность и изучать в деталях те из них, которые кажутся самыми важными.
Однако компьютерные шахматные программы не всегда могут увидеть общую картину и думать стратегически. Они хороши для расчета тактики достижения какой-то ближайшей цели, однако значительно менее успешны в определении самой значимой из них в более масштабной схеме игры.
Каспаров попытался воспользоваться слепыми пятнами в эвристике Deep Blue, вынуждая его бездумно следовать планам, которые не улучшают стратегическую позицию.
Компьютерные шахматные программы часто предпочитают краткосрочные цели, которые могут быть разделены и квантованы и для достижения которых не требуется анализировать шахматную доску как целостный организм. Классический пример искажения в работе компьютера – это его готовность принять жертвы; компьютер часто соглашается, когда хороший игрок предлагает обменять более сильную фигуру на более слабую.
Эвристическое правило «Принимать обмен, когда противник отказывается от более сильной фигуры» обычно оказывается правильным – но не всегда в случаях, когда вам противостоит игрок вроде Каспарова, готовый сознательно ослабить свою позицию. Он знает, что тактическая потеря перевешивается стратегическим преимуществом. В ходе первой игры Каспаров предложил Deep Blue на 30‑м ходу обменять ладью на слона, и, к его радости, Blue согласился[117]. Возникла позиция (рис. 9.3а), которая помогает проиллюстрировать идею слепых пятен, появляющихся вследствие отсутствия у компьютера стратегического мышления.
Рис. 9.3а. Расположение фигур после 32-го хода Каспарова в первой партии
У Каспарова и Deep Blue были свои способы упростить позицию, показанную на рис. 9.3a. Компьютер разбивал сложную проблему на отдельные элементы. Например, для Deep Blue позиция могла напоминать ситуацию, представленную на рис. 9.3б, при которой каждой фигуре присваивалось определенное значение в баллах. Если вы сложите баллы, то увидите, что Deep Blue имел преимущество над Каспаровым, эквивалентное одной пешке, что в большинстве случаев приводит к победе или ничьей{634}.
Рис. 9.3б. Поэлементная оценка позиции
Рис. 9.3 в. Целостная оценка позиции
Люди же способны в большей степени концентрироваться на самых важных элементах и видеть стратегическое целое, которое иногда представляет собой нечто большее, чем сумма частей. Для Каспарова позиция ассоциировалась с ситуацией, которая показана на рис. 9.3в, и казалась ему достаточно хорошей. Каспаров видит, что три его пешки продвигаются в направлении к недостаточно защищенному королю Deep Blue.
Королю придется уйти со своего места – и в этом случае Каспаров сможет продвинуть свои пешки до последнего ряда обороны Deep Blue и превратить их в ферзей[118] – или оказаться под угрозой мата. Кроме этого, ферзь и слон Каспарова, хотя и находятся в левом нижнем углу доски, способны практически беспрепятственно перемещаться по диагонали; тем самым они могут усилить натиск своих пешек на уязвимого короля. Каспаров пока что еще не знает, как именно будет поставлен мат королю Deep Blue, однако понимает, что при таком давлении шансы оказываются на его стороне. Сила позиции Каспарова скоро стала понятна и Deep Blue, который через 13 ходов признал свое поражение.
«В этом и заключается типичная слабость компьютера, – позднее сказал Каспаров. – Я уверен, что ему очень нравилась позиция, однако последствия были слишком глубоки для того, чтобы он мог правильно все оценить»{635}.
«Человек переиграл компьютер», – гласил заголовок статьи в New York Times{636}. На следующий день после игры газета опубликовала целых четыре статьи, посвященных ей. Однако в конце игры произошел определенный поворот, который остался без внимания комментаторов, но впоследствии изменил всю историю шахмат.
Начало конца
В финале шахматной партии, эндшпиле, количество фигур на доске значительно меньше, чем в начале, и удачные комбинации рассчитываются без особых усилий. Тем не менее на этой фазе партии необходима особая точность, поскольку реализация выигрышного положения часто требует безошибочного проведения десятков ходов. Например, в позиции, которую вы видите на рис. 9.4, белые выиграют вне зависимости от действий черных, однако для этого белые должны безукоризненно сделать 262 последовательных хода[119].
Человек почти гарантированно не сможет найти выход в ситуации, показанной на рис. 9.4. Однако у людей имеется немалая практика в управлении эндшпилями, когда для завершения партии требуется 10, 15, 20 или 25 ходов.
Рис. 9.4. Победа белых… после 262 ходов
Эндшпиль может считаться одновременно и благом, и проклятием для компьютеров. На этой стадии игры у них остается немного промежуточных тактических целей, однако компьютер может иногда не «увидеть леса за деревьями». С другой стороны, у шахматных компьютеров есть базы данных не только для дебюта партии, но и для эндшпиля. Решения имеются практически для всех позиций, в которых на доске остается шесть или меньше фигур. Почти завершена работа с позициями из семи фигур – причем некоторые решения достаточно сложны и требуют не меньше 517 ходов – однако компьютеры уже сейчас хорошо помнят, какие шаги можно считать выигрышными, проигрышными или ведущими к ничьей.
Соответственно, на этой стадии игры возникает нечто, напоминающее черную дыру – точку, преодоление которой неотвратимо перевешивает дерево игры. Тогда компьютер осмысливает все позиции, что могут быть осмыслены, и выигрывает те из них, которые должен выиграть. Абстрактные цели этой завершающей фазы шахматной партии заменяются набором конкретных: королевская пешка должна оказаться здесь, и тогда вы точно выиграете; убедите черных переместить свою ладью вот сюда, и вы добьетесь ничьей.
Поэтому у Deep Blue имелись определенные стимулы продолжать борьбу с Каспаровым в первой игре. Хотя программа и говорила ему, что эта позиция проигрышная, но даже великие игроки типа Каспарова совершают серьезные промахи примерно один раз за 75 ходов{637}. Одного неверного шага Каспарова было бы достаточно, чтобы активировать сенсоры Deep Blue и обеспечить ничейную позицию. Ситуация для компьютера была отчаянной, но не полностью безнадежной.
Однако вместо этого Deep Blue сделал кое-что странное, по крайней мере с точки зрения Каспарова. На своем 44‑м ходу Deep Blue переместил одну из своих ладей в первый ряд белых вместо более удобного хода, при котором королю Каспарова был бы поставлен шах. Ход, сделанный компьютером, казался совершенно бессмысленным. В момент, когда ему со всех сторон угрожали, компьютер, по сути, пропустил ход, что позволило Каспарову продвинуть вперед одну из своих пешек во второй ряд черных, где у нее значительно выросли шансы превратиться в ферзя. Еще более странным было то, что Deep Blue сдался уже на следующем ходу (рис. 9.5).
Рис. 9.5. Странный ход Deep Blue
«О чем думает компьютер?» – удивился Каспаров. Он привык, что Deep Blue допускает стратегические ошибки – например, он может принять обмен слон – ладья – в сложных позициях, где он просто не может думать достаточно глубоко, чтобы оценить все последствия. Однако это было нечто иное, чем тактическая ошибка в сравнительно простой позиции, то есть именно та ошибка, которую компьютеры не делают.
«Неужели компьютер может покончить с собой таким образом?» – спросил Каспаров Фредерика Фриделя, немецкого шахматного журналиста, а также своего друга и специалиста по вычислительной технике, когда они в гостинице «Плаза» анализировали, как проходила партия, после ее окончания{638}. Никакие объяснения произошедшего особенно не порадовали Каспарова.
Возможно, Deep Blue действительно «покончил с собой», поняв, что проиграет в любом случае, и не пожелал показать Каспарову, как он мог бы играть дальше? А возможно, это стало частью более замысловатой игры? Возможно, был запрограммирован отвлекающий маневр, нацеленный на то, чтобы Каспаров слишком переоценил свои эвристические способности после победы в первой партии?
Каспаров сделал то, что было для него наиболее естественно: погрузился в данные. С помощью Фриделя и компьютерной программы Fritz он выяснил, что стандартный розыгрыш позиции – перемещение черными ладьи и шах королю белых – был совершенно невыгоден для Deep Blue: он приводил к неминуемому мату, хотя для этого Каспарову пришлось бы сделать более 20 ходов.
Однако это и пугало больше всего. Каспаров предположил, что единственный способ противостоять его натиску состоял для компьютера в том, чтобы заставить его сделать мат не в 20 ходов, а за значительно большее их количество. И было похоже, что он нашел решение. Как вспоминал Фридель, Deep Blue смог рассчитать позицию до конца и просто предпочел более простой вариант завершения партии. «Возможно, он увидел мат через 20 и более ходов», – добавил Гарри, искренне довольный тем, что в результате своих расчетов пришел к правильному выводу{639}.
Однако до этого считалось, что просчитать 20 ходов вперед в такой сложной игре, как шахматы, невозможно как для людей, так и для компьютеров. По словам самого Каспарова, он искренне гордился тем, как во время одного матча в Нидерландах в 1999 г. он смог представить себе выигрышную позицию за 15 ходов{640}.
Считалось, что Deep Blue в большинстве случаев ограничивается расчетом шесть-восемь будущих ходов. Каспаров и Фридель не были полностью уверены в том, что именно происходит, однако то, что казалось сторонним наблюдателям случайной и необъяснимой ошибкой, содержало в себе, судя по всему, огромную мудрость. И после этого Каспарову уже не удалось ни разу обыграть Deep Blue.
Эдгар Аллан Каспаров
Во второй партии компьютер играл более агрессивно, не позволяя Каспарову занять выгодную позицию. Самый главный момент наступил где-то после 35-го хода. Силы сторон были примерно равны: у каждого игрока оставались ферзь, по одному слону, по две ладьи и по семь пешек. Однако Deep Blue, игравший белыми, обладал преимуществом следующего хода, а у его ферзя было много места для маневра. Положение (рис. 9.6) было не особенно угрожающим для Каспарова, однако существовала угроза угрозы – уже через несколько ходов могло проясниться, есть ли у Deep Blue шанс выиграть или же игра неминуемо движется к ничьей.
Рис. 9.6. Варианты действий Deep Blue на 36‑м ходу второй партии
Deep Blue нужно было поразмышлять над парой ходов. Он мог переместить ферзя на более угрожающую позицию; и это было бы хорошо с точки зрения тактики. Он мог обменяться пешками с белыми, открывая левый угол доски, что привело бы к созданию более открытой, элегантной и стратегически интересной позиции.
Гроссмейстеры, комментировавшие матч, ожидали, что Deep Blue воспользуется первым вариантом и продвинет вперед ферзя{641}. Этот ход казался довольно очевидным и более соответствовавшим характеру игры Deep Blue – компьютеры предпочитают сложные и требующие множества расчетов позиции. Однако после необычайно долгого «размышления» Deep Blue предпочел обмен пешками{642}.
Каспаров тут же расслабился, поскольку размен пешек делал его позицию менее напряженной. Однако чем больше он оценивал происходившее, тем меньше оно ему нравилось. Он кусал кулаки и отчаянно хватался за голову; одному из зрителей даже показалось, что в какой-то момент Каспаров заплакал{643}. Почему же Deep Blue решил не двигать своего ферзя вперед? Этот ход вряд ли можно ли считать слабым: на самом деле, его вполне мог бы совершить кто-то из соперников Каспарова из плоти и крови, таких как Анатолий Карпов.
Однако подобный ход компьютера должен был быть обусловлен тактическими «соображениями». Каспаров никак не мог понять, в чем они состояли, – если только его подозрения не оказались верными и Deep Blue не был способен предсказать 20 и более следующих ходов.
Каспаров и Deep Blue сделали еще восемь ходов. Для репортеров и экспертов, наблюдавших за игрой, стало очевидно, что у Каспарова, игравшего в обороне с самого начала, нет никаких шансов на выигрыш. Однако он все же мог бы свести игру к ничьей. Тем не менее, к немалому удивлению публики, Каспаров сдался после 45-го хода. Он решил, что компьютер не может допустить ошибку в расчетах, если он способен просчитать ситуацию на 20 ходов вперед. Он знал, что Deep Blue выиграет, – так зачем тратить энергию, когда впереди оставалось еще четыре партии?
Публика в аудитории разразилась аплодисментами{644}. Эта игра была хорошо сыграна, гораздо лучше первой. И даже если собравшимся мат, который поставил Deep Blue, казался не столь очевидным, как Каспарову, они не могли просчитать ситуацию так же глубоко, как он. Однако основные симпатии в этот раз были на стороне Deep Blue – компьютер играл как человек.
«Отличный стиль! – воскликнула чемпионка мира среди женщин Сьюзен Полгар в беседе с журналистом New York Times{645}. – Компьютер играл в стиле чемпиона типа Карпова». С ней согласился Джоэль Бенджамин, гроссмейстер, помогавший команде Deep Blue: «Это была не игра в компьютерном стиле, а настоящие шахматы!»
Каспаров быстро покинул зал, не вступая в беседу с журналистами, однако принял комментарии своих коллег-гроссмейстеров близко к сердцу.
Возможно, Deep Blue был человеком в буквальном, а не в экзистенциальном смысле. Не исключено, что, как и в случае с «Механическим турком» двумя столетиями ранее, какой-то гроссмейстер, находившийся «за сценой», тайно контролировал происходившее. Возможно, Бенджамин, сильный игрок, когда-то сыгравший вничью с Каспаровым, не просто регулировал работу Deep Blue, но и фактически вмешивался от имени компьютера в ход игры.
Столь мощные умы, какими обладают шахматные чемпионы, заточены на выявление закономерностей, и их иногда считают немного параноидальными. В ходе пресс-конференции на следующий день Каспаров обвинил IBM в обмане. Об игре компьютера он выразился словами «Марадона называл это рукой Господа»{646}, намекая на гол, который забил великий аргентинский футболист Диего Марадона в печально известном матче на Кубок мира 1986 г. с командой Англии. Запись показала, что он направил мяч в сетку ворот не головой, а левой рукой.
Марадона заявил, что он забил гол «un poco con la cabeza de Maradona y otro poco con la mano de Dios» – то есть немного воспользовался своей головой и немного – рукой Бога. Каспаров же считал, что параноидальность в поведение Deep Blue была внесена чужим интеллектом.
Две теории Каспарова относительно поведения Deep Blue были, конечно же, внутренне �