Искусственный интеллект на службе бизнеса. Как машинное прогнозирование помогает принимать решения бесплатное чтение

Аджей Агравал, Джошуа Ганс, Ави Голдфарб
Искусственный интеллект на службе бизнеса
Как машинное прогнозирование помогает принимать решения

Издано с разрешения Ajay Agrawal, Joshua Gans and Avi Goldfarb c/o Levine Greenberg Rostan Literary Agency


Все права защищены.

Никакая часть данной книги не может быть воспроизведена в какой бы то ни было форме без письменного разрешения владельцев авторских прав.


© Ajay Agrawal, Joshua Gans and Avi Goldfarb, 2018. This edition published by arrangement with Levine Greenberg Rostan Literary Agency and Synopsis Literary Agency.

© Перевод на русский язык, издание на русском языке, оформление. ООО «Манн, Иванов и Фербер», 2019

* * *

Нашим семьям, коллегам, студентам и стартапам, вдохновившим нас всесторонне и глубоко задуматься над искусственным интеллектом


Предисловие партнера

Мое первое знакомство с решениями в области искусственного интеллекта (ИИ) состоялось в далеком 1993 году. На выставке CEBIT в Ганновере исследовательская команда Инновационного центра при Академии наук, который я возглавлял, впервые продемонстрировала работающий алгоритм распознавания рукописных текстов. Несмотря на то что наша экспериментальная установка представляла собой штатив с примотанной к нему изолентой бытовой камерой, наш стенд вызывал неподдельный интерес посетителей. Алгоритм на базе нейронной сети успешно распознавал рукописные цифры независимо от их размера, наклона, толщины линий и графического стиля, приводя в восторг любознательную публику. Тогда все только начиналось, и мы не представляли себе возможностей коммерческого использования этих решений. Только в конце 90-х на основе этого опыта появились первые индустриальные решения для фотовидеофиксации, которые нашли широкое применение в системах безопасности по всему миру.

По оценкам аналитиков, мировой рынок искусственного интеллекта и нейротехнологий к 2025 году превысит 500 млрд долларов США, а размер российского рынка составит около 20 млрд долларов. Многие лидеры стран определили технологии ИИ как важнейший фактор конкурентоспособности. Только за последние три года более чем в двадцати ведущих странах были разработаны национальные стратегии развития ИИ. Россия имеет хорошие шансы занять достойное место среди глобальных лидеров в области ИИ.

Спектр используемых технологий, связанных с ИИ, очень широк. Это и компьютерное зрение, распознавание и синтез речи, системы принятия решений, предиктивная аналитика, машинное обучение и т. п. Уже сегодня сложно представить себе жизнь без систем навигации и голосовых помощников. В ближайшее время не останется банков, которые проводят оценку надежности заемщика вручную, а в недалеком будущем мы будем повсеместно пользоваться услугами автономного транспорта. Технологии ИИ активно вторгаются в наш быт и играют огромную роль в процессе цифровой трансформации бизнеса.

Если ранее стратегический выбор был в первую очередь следствием меняющихся потребительских предпочтений, то сегодня к ключевым драйверам изменений добавились технологии.

Развитие технологий приводит к трансформации бизнес-моделей, а также того, как мы находим своих клиентов, понимаем их потребности и создаем для них ценность: таргетированная реклама, динамические модели ценообразования и системы лояльности, цифровые продукты, переход на сервисные модели и управление жизненным циклом, оптимальный клиентский опыт.

Меняется логика производственных процессов и принятия управленческих решений: роботизированная логистика и производственные системы, оптимальные технологические процессы, сокращение простоев оборудования посредством предиктивной аналитики, минимум потерь вследствие рационального управления ресурсами, а также системы управления рисками и принятия инвестиционных решений, системы мотивации и вознаграждения сотрудников. Все это сегодня уже невозможно без применения решений в области ИИ.

Русский перевод книги «Искусственный интеллект на службе бизнеса» появился очень своевременно. Авторы превзошли себя, описав простым и доступным языком очень сложные понятия, определения и возможные последствия распространения ИИ. Книга включает четыре основных раздела: прогностика, решения, инструменты и стратегия. Очень хорошо структурированное и последовательное описание, изобилующее многочисленными примерами, можно смело назвать библией ИИ. Книга не только описывает, как ИИ повлияет на бизнес, но и позволяет лучше понять, какими будут социальные последствия, как будет меняться роль человека в альянсе с машинами.

Данная книга безусловно полезна для предпринимателей и менеджеров – тех, кто ищет новые возможности для долгосрочной конкурентоспособности бизнеса. Также книга будет полезна для чиновников, отвечающих за формирование стратегической повестки страны или региона. Несмотря на некоторую сложность книги, я бы все-таки рекомендовал ее в качестве учебного пособия для студентов вузов и бизнес-школ.

Александр Идрисов, президент Strategy Partners

Предисловие. Машинный интеллект

Если следующая ситуация вам пока в новинку, скоро вы к ней привыкнете. Ребенок в соседней комнате делает уроки, вы слышите, как он говорит: «Назови столицу Делавэра». Вы погружаетесь в размышления: «Балтимор?.. Нет, это первое, что пришло в голову… Уилмингтон?.. Нет, не столица». Не успели вы продолжить, как «Алекса» дает правильный ответ: «Столица Делавэра – Довер». «Алекса» – искусственный интеллект[1] компании Amazon.сom, она обрабатывает вербальный запрос и молниеносно выдает результат. В глазах ребенка «Алекса» как источник информации заменила всезнающих родителей.

ИИ – повсюду. В наших телефонах, автомобилях, больницах, банках, без него не обходятся покупки, знакомства и электронные СМИ. Понятно, что руководители и вице-президенты компаний, менеджеры, начальники отделов, предприниматели, инвесторы, коучи и политики стремятся узнать о нем как можно больше: они понимают, что скоро ИИ коренным образом изменит всю их деятельность.

Мы наблюдали за преимуществами ИИ втроем: мы – экономисты, добившиеся профессиональных успехов на ниве последнего технологического достижения современности – интернета. Много лет занимаясь исследованиями и научившись отделять зерна от плевел, выявляя истинное значение технологий для руководителей, мы организовали «Лабораторию созидательного разрушения» (ЛСР) – программу для ранних этапов развития бизнеса, повышающую вероятность успеха наукоемких стартапов. Изначально ЛСР предназначалась для любых стартапов, но к 2015 году большинство самых интересных начинаний основывались на ИИ. В сентябре 2017-го ЛСР третий год подряд подтвердила высокую эффективность ИИ-стартапов по сравнению с остальными разработками.

В результате немало стартап-лидеров регулярно приезжали в Торонто для участия в ЛСР. Например, один из основных разработчиков ИИ, лежащего в основе «Алексы», Уильям Танстолл-Пидоу, каждые восемь недель прилетал из Кембриджа в Англию для участия в программе. Как и Барни Пелл из Сан-Франциско, ранее возглавлявший в НАСА команду из 85 человек, которая запустила в космос первый ИИ.

Такого успеха в своей сфере ЛСР добилась отчасти благодаря расположению в Торонто, где зарождалось и развивалось большинство ключевых разработок в области так называемого машинного обучения, способствовавших недавнему всплеску интереса к ИИ. Специалисты, ранее занятые на кафедре IT-наук Университета Торонто, ныне возглавляют команды ведущих мировых компаний ИИ, в том числе в Facebook, Apple и проекте Илона Маска Open AI.

Близость к практическому применению ИИ заставила нас сосредоточиться на том, как данные технологии влияют на стратегии бизнеса. Как вы скоро узнаете, ИИ – это прогностическая технология, а поскольку решения принимаются на основе прогнозов, экономика предоставляет идеальную схему для понимания вариантов выбора, лежащих в основе принятия любого решения. Итак, благодаря везению и некоторым усилиям мы оказались в нужном месте в нужное время, чтобы наладить связь между техническими специалистами и представителями сферы бизнеса. Результатом стала эта книга.

Первоначально ее основная идея заключалась в том, что новая волна ИИ принесла нам не в полной мере разум, а лишь его критическую составляющую – прогнозирование. Когда ребенок произнес запрос, «Алекса» преобразовала звуки в слова и спрогнозировала, какая информация им соответствует. «Алекса» «не знает» столицу Делавэра, но способна спрогнозировать, что в ответ на такой запрос люди получат конкретный ответ: «Довер».

Каждый стартап в нашей лаборатории базируется на преимуществах улучшенного прогнозирования. Компания Deep Genomics сделала шаг вперед в медицине, предполагая, какие процессы начнутся в клетке после изменений в последовательности ДНК. Компания Chisel усовершенствовала правовую практику прогнозом, какая именно часть документа подлежит редактированию. Компания Validere повысила эффективность нефтедобычи, рассчитав процент содержания влаги в поступающем на переработку и хранение сырье. Все это – лишь малый перечень всех возможностей применения, которые появятся в бизнесе в ближайшем будущем.

Если вы плохо представляете, что значит ИИ для вас, мы поможем вам понять все его возможности и сориентироваться в преимуществах технологии, даже если вы ни разу не программировали свёрточную нейронную сеть и не изучали байесовскую статистику[2].

Руководителям бизнеса мы объясним влияние ИИ на управление и принятие решений. Студентам и недавним выпускникам дадим пищу для размышлений о перспективах развития трудовой деятельности и карьеры. Финансовым аналитикам и венчурным инвесторам предложим схему, на основании которой они разработают инвестиционные декларации. Политикам предоставим примерный план изменений общества с помощью ИИ, обсудим, какие меры можно предпринять, с тем чтобы перемены оказались к лучшему.

Экономика представляет собой надежную основу для понимания неопределенности и ее роли в принятии решений. Поскольку качественное прогнозирование снижает неопределенность, мы объясним в терминах экономики значение ИИ для принятия решений по развитию бизнеса, что, в свою очередь, даст представление о том, какие инструменты с наибольшей вероятностью помогут максимизировать прибыль от рабочих бизнес-процессов. Это приведет нас к схеме разработки новых стратегий – например, изменения масштаба и диапазона бизнеса для применения новых экономических реалий, проистекающих из удешевления прогнозов. И, наконец, мы изложим основные плюсы и минусы влияния ИИ на трудовую деятельность, концентрацию корпоративной власти, конфиденциальность и геополитику.

Какие прогнозы важны для вашего бизнеса? Как дальнейшее развитие ИИ повлияет на предположения, из которых вы исходите? Как изменятся рабочие места в вашей сфере деятельности с развитием прогностических технологий, что уже происходило с появлением ПК и интернета? ИИ – это новая и еще не до конца понятая технология, но существуют надежные инструменты экономики по оценке возможных последствий удешевления прогностики, хотя приводимые нами примеры, без сомнения, когда-нибудь устареют, в отличие от предложенной схемы. Идеи сохранят свою эффективность и с развитием технологий, и с повышением точности и сложности прогнозов.

Наша книга не предлагает рецептов успеха в экономике ИИ – напротив, мы подчеркиваем его преимущества и недостатки. Чем больше данных, тем меньше конфиденциальность; чем выше скорость, тем ниже точность; чем больше независимости – тем слабее контроль. Мы не предлагаем рекомендаций для выработки оптимальной бизнес-стратегии: это ваша забота. Лучшая стратегия для компании, карьеры или страны зависит от вашей оценки соотношения плюсов и минусов. Мы разработали схему определения ключевых преимуществ и недостатков, а также способы оценки всех «за» и «против» для оптимального решения какой-либо задачи. Разумеется, даже располагая нашей схемой, вы заметите, что все меняется очень быстро и вам придется действовать, не обладая исчерпывающей информацией, но, как правило, это все же лучше пассивности.

Выводы

• Новая волна ИИ принесла нам не в полной мере разум, а лишь его критическую составляющую – прогнозирование.

• Любое решение по большей части зависит от прогнозов. В экономике наработаны схемы принятия решений. Новые и не совсем понятные последствия развития прогностических технологий можно объединить с проверенной логикой экономической теории принятия решений и вывести ряд идей, помогающих сориентироваться в том, как применить ИИ в вашей организации.

• Единственного верного ответа на вопрос о том, какая стратегия или инструменты ИИ оптимальны, не существует, потому что неизбежно придется искать компромисс: больше скорость – ниже точность, больше независимости – слабее контроль, больше данных – меньше конфиденциальности. Мы предлагаем метод определения благоприятных и неблагоприятных последствий принятия связанных с ИИ решений, чтобы вы оценили потенциальную выгоду и потери в свете миссии и целей организации, а затем нашли оптимальный для вашего бизнеса вариант.

Дешевизна меняет все

Каждый человек уже соприкасался с ИИ либо очень скоро откроет его для себя. Мы привыкли к регулярным сообщениям в СМИ о новых технологиях, изменяющих нашу жизнь. Технофилы предвкушают возможности будущего, технофобы горюют о старых добрых временах. Впрочем, все уже привыкли к бомбардировке технологическими новостями и, не задумываясь, повторяют: «Единственное, что остается неподвластным переменам, – это сами перемены». Пока не сталкиваются с ИИ. И тогда понимают, как эта технология отличается от остальных.

Некоторые IT-специалисты впервые оценили потенциал ИИ в 2012 году, когда команда студентов Университета Торонто одержала триумфальную победу на ежегодных соревнованиях по распознаванию визуальных образов ImageNet (Large Scale Visual Recognition Challenge). В последующие годы все финалисты ImageNet использовали новаторский для того времени подход «глубокого обучения»: распознавание объектов – не просто игра, оно наделяет машину «зрением».

Ряд руководителей технологических компаний увидели новые возможности ИИ, узнав о том, что в 2014 году Google приобрела британскую компанию DeepMind за более чем $600 млн, несмотря на ничтожный по сравнению с этой суммой доход. Крупнейшая сделка состоялась только потому, что DeepMind продемонстрировала свой ИИ, который научился – самостоятельно, без всякого программирования – играть в некоторые видеоигры Atari со сверхчеловеческой эффективностью.

Всемирно известной новостью ИИ стал в том же 2014 году благодаря решительному заявлению знаменитого физика Стивена Хокинга: «Все в нашей цивилизации является продуктом человеческого интеллекта… и создание искусственного интеллекта стало бы крупнейшим событием в истории человечества»[3].

Кто-то другой осознал грандиозность ИИ, впервые отпустив руль едущей «Теслы», управляемой автопилотом.

В Китае откровением стал момент, когда AlphaGo – ИИ DeepMind – выиграл у Ли Седоля, корейского профессионального игрока в го, а позднее в том же году победил лучшего китайского игрока Кэ Цзе. «Нью-Йорк Таймс» назвала эту игру «моментом Спутника»[4] для Китая[5]. Как после запуска спутника в СССР в Америке вложили огромные средства в науку, так и Китай отреагировал национальной стратегией повсеместного распространения ИИ к 2030 году и внушительным финансированием осуществления этого плана.

В своей компании мы осознали значимость ИИ в 2012 году, когда в ЛСР сначала обратились несколько стартапов, применяющих ультрасовременные методики машинного обучения, а затем они хлынули потоком. Обращения следовали почти из всех сфер: исследовательской фармакологии, клиентского обслуживания, производства, контроля качества, розничных продаж, медицинской техники. Технологии были мощными, широко применимыми, обещали заметное повышение эффективности. Понимая их экономическую ценность, мы углубились в работу. Мы знали, что ИИ будет развиваться в той же экономике, что и остальные технологии.

Говоря проще, технология сама по себе потрясающая. Как метко сказал знаменитый венчурный инвестор Стив Джурвертсон: «Почти каждый продукт, который в ближайшие пять лет покажется волшебством, наверняка будет построен на этих же алгоритмах»[6]. Джурвертсон назвал ИИ «волшебством», что перекликается с распространенным сюжетом таких фильмов, как «2001 год: Космическая одиссея», «Звездные войны», «Бегущий по лезвию», и недавних «Она», «Превосходство» и «Из машины».

Мы согласны с Джурвертсоном: это действительно волшебство. И наша задача как экономистов состоит в том, чтобы воплотить волшебство ИИ в простой, понятной и практичной форме.

Отделить зерна от плевел

Экономисты смотрят на мир иначе, чем большинство людей. Мы воспринимаем все относительно схемы, управляемой такими силами, как спрос и предложение, производство и потребление, цена и издержки. Иногда экономисты расходятся во мнениях, но всегда действуют в рамках общей схемы. Мы оспариваем допущения и интерпретации, не сомневаясь в фундаментальных понятиях вроде роли дефицита и конкуренции в регулировании цен. Такой подход дает нам уникальную позицию наблюдателей, что можно отнести к плюсам нашей профессии. Минус же состоит в том, что наша точка зрения суха и бесстрастна, поэтому нас не очень жалуют на званых вечеринках. Тем не менее она добавляет ясности в принятии деловых решений.

Начнем с азов – цен. Когда снижается цена на какой-либо предмет, товар или услугу, спрос немедленно повышается. Более дешевые вещи покупают чаще. Так действует простейшая экономика, именно это сейчас и происходит с ИИ. Он повсюду: встроен в приложения для телефона, оптимизирует сети электроснабжения и заменил управляющего вашим портфелем акций. Скоро он будет возить вас по городу и прилетать к двери вашего дома с посылками.

Экономисты лучше всех умеют отделять зерна от плевел. Где другие замечают трансформационные инновации, мы видим всего лишь снижение цен. Но не все так просто. Чтобы понять влияние ИИ на вашу организацию, следует точно знать, как изменилась цена и как это отразится на экономической ситуации в целом. Только после этого можно приступать к разработке плана действий. История экономики учит, что последствия крупных инноваций часто проявляются в самых неожиданных местах.

Вспомним пример 1995 года из коммерческого интернета. Тогда очень многие смотрели сериал Seinfeld, а Microsoft выпустила Windows 95 – первую многозадачную операционную систему. В том же году правительство США отменило все ограничения на коммерческий трафик в интернете, и Netscape – изобретатель интернет-браузера – отпраздновала первое публичное размещение (IPO) в данном сегменте.

Так и произошел перелом в сфере IT, когда интернет из технологической диковины превратился в коммерческую приливную волну, омывающую экономику.

Первое публичное размещение Netscape оценивалось более чем в $3 млрд, хотя не принесло существенной прибыли. Венчурные инвесторы оценивали стартапы в миллионах, даже если они были (используем возникший тогда термин) «преддоходными». Новоиспеченные выпускники МБА отказывались от прибыльных традиционных профессий ради заработка в интернете. Когда влияние интернета начало распространяться на все сферы вверх и вниз по цепи издержек, проповедники технологий стали называть его «новой экономикой» вместо «новой технологии». Термин прижился. Интернет вышел за технологические границы и проник в человеческую деятельность на фундаментальном уровне. Политики, руководители, инвесторы, предприниматели и крупные СМИ ввели термин в широкое употребление. Все кому не лень называли интернет новой экономикой, за исключением экономистов.

Мы не видели ни новой экономики, ни новых экономистов. Для нас это была все та же старая экономика. Хотя следует признать, что ряд важных изменений все же произошел. Появилась возможность распространять через интернет товары и услуги. Коммуникации упростились. Информацию теперь получали, просто нажав на кнопку «поиск». Но все это было доступно и раньше – разница лишь в том, что снизилась цена. Расцвет интернета ознаменовал падение цен на распределение, коммуникацию и поиск. Чтобы понять последствия для бизнеса, необходимо оценить результаты технологического развития, заключающиеся в переходе от дорогостоящего к дешевому или от дефицита к изобилию. К примеру, вспомните, когда вы впервые использовали Google, – новоприобретенная способность мгновенно, словно по волшебству, получать нужную информацию завораживала. С экономической же точки зрения Google удешевила поиск. И в результате компании, зарабатывавшие на продаже информации другими средствами (справочники, турагентства, рекламные издания), потеряли конкурентное преимущество. В то же время компании, которым требовалось, чтобы их нашли, – самодеятельные авторы, продавцы коллекционных товаров и доморощенные режиссеры – процветали.

Изменение относительных издержек определенной деятельности радикально повлияло на ряд бизнес-моделей и даже преобразовало некоторые сферы. Однако законы экономики остались прежними: мы еще могли рассматривать все что угодно с точки зрения спроса и предложения, разрабатывать стратегии, устанавливать политику и предвидеть будущее с помощью стандартных законов экономики.

«Дешево» значит «повсеместно»

Когда цена на что-то внезапно и существенно падает, может измениться целый мир. Возьмем, к примеру, свет. Не исключено, что вы читаете эту книгу при искусственном освещении. И более того, включая свет, вы, скорее всего, никогда не подсчитывали, во сколько вам обойдется чтение. Электричество настолько дешево, что им пользуются, не задумываясь. Однако, согласно подробному исследованию экономиста Уильяма Нордхауса, в начале XIX века освещение стоило в сотню раз дороже[7]. Всего два века назад вы сто раз подумали бы, прежде чем читать при свете. Падение цен на электричество осветило мир. Ночь легко превращалась в день, стало возможным жить и работать в больших зданиях, куда не проникал естественный свет. Практически ничего из того, что мы имеем сейчас, не существовало бы без мизерной платы за электричество.

С технологическими новшествами удешевляется все. С изменением цены за бытовое электричество изменилось и наше поведение – от раздумий, стоит ли включать свет, к бездумному щелчку выключателем. Существенное падение цен дает шанс делать то, что мы не делали раньше; невозможное становится возможным. И неудивительно, что экономисты озабочены последствиями грандиозного падения цен на такие фундаментальные результаты прогресса, как свет.

Одни последствия дешевизны света были более предсказуемы, другие – менее. Не всегда полностью очевидно, на что именно повлияет падение цены вследствие появления новых технологий, будь то искусственное освещение, паровые машины, автомобили или вычисления.

Тим Бреснахан, экономист из Стэнфорда и один из наших наставников, подчеркивал, что компьютеры выполняют расчеты, и ничего более. Распространение и коммерциализация компьютеров понизили стоимость вычислений[8]. Теперь мы не только чаще используем их для обычных расчетов, но и применяем новую, дешевую арифметику в сферах, традиционно не связываемых с ней, например в музыке.

Ада Лавлейс, которая считается первым программистом, раньше всех разглядела эти возможности. Работая при дорогостоящем освещении в начале XIX века, она написала первую программу расчета последовательности чисел (называемых «числами Бернулли») для компьютера, разработанного Чарльзом Бэббиджем тогда еще в теории. Бэббидж тоже был экономистом, и, как вы узнаете из нашей книги, это не единственный случай пересечения экономики и IT-дисциплин. Лавлейс понимала, что арифметика может, выражаясь современным жаргоном стартапов, «масштабироваться» и содержит огромный потенциал. Ада догадывалась, что возможности компьютеров не сводятся к арифметическим операциям: «Если предположить, например, что фундаментальные соотношения тонов звукоряда в гармонии и музыкальной композиции можно выразить и адаптировать в таком виде, то машина могла бы сочинять затейливые и искусные музыкальные произведения любой степени сложности»[9]. Никаких компьютеров тогда и в помине не было, но Лавлейс предполагала, что вычислительные машины могут хранить и воспроизводить музыку – форму искусства, повлиявшую на все его остальные жанры и человечество в целом.

Так и произошло. Когда полтора века спустя цена на расчеты опустилась достаточно низко, арифметике нашлось столько применений, сколько никому и не снилось. Она внесла такой важный вклад во множество сфер деловой и обычной жизни, что с ее удешевлением мир, как это уже бывало, преобразился. Если свести что-либо к чистым издержкам, легко отделить зерна от плевел, хотя это и не самый увлекательный способ поведать о новейших передовых технологиях. Стив Джобс никогда не анонсировал выпуск «счетной машины», хотя только ими всю жизнь и занимался. Новые счетные машины Джобса имели успех, потому что снижали цену на что-то значимое.

Это возвращает нас к ИИ. Для экономики он имеет огромное значение именно потому, что удешевит что-то важное. Сейчас вы, вероятно, думаете об интеллекте, логических рассуждениях и мышлении вообще. А может, представляете себя среди роботов или бестелесных существ, таких как дружелюбные компьютеры из фильма «Звездный путь», которые избавят вас от необходимости думать. У Лавлейс было похожее предположение, но она быстро от него отказалась. Во всяком случае в отношении компьютеров она писала, что «у них нет никаких притязаний к созиданию. Они могут только то, что умеем мы. Они способны следовать порядку расчетов, но не обладают возможностью предвосхищать аналитические соотношения или истины»[10].

Несмотря на ажиотаж вокруг ИИ, «возражения леди Лавлейс», как позднее назвал их Алан Тьюринг[11], все еще актуальны. Компьютеры пока не умеют думать, так что мысли подешевеют нескоро. Однако цена снизится на нечто настолько привычное и повсеместно используемое (как и арифметика), что никто, скорее всего, еще не догадывается, насколько удешевление повлияет на нашу жизнь и экономику.

Что же подешевеет благодаря ИИ? Ответим: прогнозы. Следовательно, согласно законам экономики, мы не только станем чаще пользоваться ими, но и начнем применять в самых неожиданных областях нашей жизни.

Дешевизна создает преимущества

Прогнозирование (или прогностика) – это процесс заполнения информационных пробелов. Берется имеющаяся информация, называемая данными, и из нее выводится отсутствующая информация. В многочисленных обсуждениях ИИ акцентируется разнообразие прогностических методов с непонятными названиями: классификация, кластеризация, регрессия, дерево решений, байесовское оценивание, нейронные сети, топологический анализ данных, глубокое обучение, стимулированное обучение, глубокое стимулированное обучение, капсульные сети и т. д. Специалисты используют для внедрения ИИ соответствующие конкретной прогностической задаче способы.

В книге мы избавим вас от математики, лежащей в основе этих методов. Хотим лишний раз подчеркнуть, что все они касаются прогностики: использования имеющейся информации для генерации отсутствующей. Мы поможем вам определить, в каких ситуациях необходимо иметь прогноз и как получить от него максимальную выгоду.

Удешевление прогностики ведет к ее распространению. Снова элементарная экономика в действии: мы покупаем больше товаров или услуг, если цены на них падают. Например, когда в 1960-е годы зарождалась компьютерная индустрия, цена на арифметику начала быстро снижаться, и там, где она была уже востребована, к ней обращались чаще – например, в Бюро переписи населения США, Министерстве обороны США, НАСА (что отображено в фильме 2016 года «Скрытые фигуры»). Позднее новая, дешевая арифметика нашла применение в сферах, к которым прежде не имела отношения, – таких как фотография. Когда-то фотоновинки разрабатывались благодаря химии, но с удешевлением арифметики появилось и соответствующее решение – цифровые камеры. Цифровой снимок представляет собой всего лишь последовательность нулей и единиц, посредством арифметики преобразуемую в визуальное изображение.

То же касается и прогнозов. Они используются в привычных задачах: управлении ресурсами и прогнозировании спроса, – но благодаря удешевлению все чаще применяются в сферах, не относящихся к прогностике. Кэтрин Хауи из Integrate.ai призывает переформулировать любую проблему в контексте прогностики, и современные инженеры всего мира все чаще так и поступают. Беспилотный транспорт существует в управляемой среде уже больше двадцати лет, однако функционировал он при наличии подробных планов этажей на заводах и складах. С поэтажным планом разработчики программировали своих роботов двигаться согласно логической схеме «если, то»: если перед роботом находится человек, то следует команда «стоп». Если полка пуста, то нужно двигаться к следующей. Обычные улицы оставались для роботов недоступными – в городском пространстве может случиться все что угодно – слишком много возникает условий «если, то», всего не предусмотреть.

Беспилотный транспорт не будет работать вне полностью предсказуемой и контролируемой среды до тех пор, пока инженеры не переформулируют проблему навигации в прогностическую. Они уже поняли, что вместо того, чтобы просчитывать для машины действия во всех возможных обстоятельствах, необходимо поставить одну прогностическую задачу: что сделал бы человек? И сейчас компании вкладывают миллиарды долларов в обучение машин беспилотному передвижению в неконтролируемой среде, в том числе на городских улицах и шоссе.

Представьте ИИ сидящим в автомобиле рядом с водителем. Человек проезжает миллионы километров, получает зрительную и звуковую информацию из окружающей среды, обрабатывает ее мозгом и реагирует соответственно: едет прямо или сворачивает, тормозит или разгоняется. Инженеры оснастили ИИ собственными глазами и ушами – датчиками (камерами, радарами, лазерами). Таким образом ИИ собирает поступающие к нему со всех сторон данные, пока человек управляет автомобилем, и одновременно регистрирует реакцию водителя. При совокупности конкретных данных человек поворачивает направо, тормозит или нажимает на газ. Чем дольше ИИ наблюдает за водителем, тем лучше предсказывает его действия, исходя из поступающих данных. ИИ учится водить машину, прогнозируя, как поступил бы человек в соответствующих обстоятельствах.

И вот что самое главное: когда такая важная вводная, как прогноз, дешевеет, возрастает ценность других вещей. Экономисты называют их «дополняющими факторами». Как падение цены на кофе повысило ценность сахара и сливок, так для беспилотных автомобилей падение цены прогноза повышает ценность датчиков сбора данных окружающей среды. Например, в 2015 году Intel заплатила больше $15 млрд за израильский стартап Mobileye, в первую очередь за технологию сбора данных, позволяющую транспортному средству эффективно распознавать объекты (дорожные знаки, людей и т. д.) и разметку (на улицах и дорогах).

Дешевея, прогностика станет использоваться чаще, возрастет количество дополняющих ее факторов: данные базовые экономические силы приводят в действие новые возможности, создаваемые прогностическими машинами. На элементарном уровне они снимут с человека задачи прогнозирования и таким образом снизят издержки. По мере распространения машин прогностика изменит и улучшит качество принятия решений. Но в какой-то момент прогностические машины, вероятно, станут столь точными и надежными, что изменят и деятельность организаций. Некоторые ИИ настолько заметно повлияют на деловую экономику, что перестанут использоваться только для повышения продуктивности в соответствии со стратегией; они изменят саму стратегию.

От дешевизны к стратегии

Руководители постоянно спрашивают нас: «Как ИИ повлияет на нашу стратегию бизнеса?» Проведем для ответа мысленный эксперимент. Большинство людей делали покупки на Amazon. Как и в остальных онлайн-магазинах, вы открываете сайт, находите нужные вещи, кладете их в корзину, оплачиваете и затем получаете по почте. Сейчас модель Amazon такова: «покупка – затем доставка».

Когда вы заходите на сайт, ИИ Amazon прогнозирует, что вы хотели бы купить, и предлагает соответствующие товары. Это целесообразный труд, однако его результаты далеки от идеала. В нашем случае точность прогнозов не превышает 5 %. И мы заказываем одну из множества рекомендуемых вещей. С учетом миллионного ассортимента это совсем не плохо!

Представьте, что ИИ Amazon собрал больше информации о нас и использует ее для улучшения качества прогнозов, – это усовершенствование сравнимо с поворотом регулятора громкости на колонках, только вместо звука регулируется точность прогнозов.

В определенный момент поворота ручки точность прогнозов ИИ достигает порогового значения и меняет бизнес-модель Amazon. Прогнозы становятся настолько точными, что компании выгоднее присылать вам товары, которые вы предположительно захотите купить, чем ждать, пока вы закажете их на сайте.

В таком случае другие магазины вам уже не нужны, а каждая покупка будет стимулировать следующую. Amazon получит основную долю содержимого вашего кошелька. Очевидно, что это выгодно Amazon, но также удобно и вам. Магазин доставляет покупки до того, как вы их совершили, и таким образом избавляет вас от траты времени на шопинг. С поворотом регулятора точности на максимум бизнес-модель Amazon меняется с «покупка – затем доставка» на «доставка – затем покупка».

Разумеется, покупатели не захотят возиться с возвратом нежелательных товаров. Поэтому Amazon вложится в отладку этого процесса – скажем, раз в неделю служба доставки будет собирать невостребованные посылки[12].

Но если такая бизнес-модель лучше, почему Amazon до сих пор ее не внедрил? Дело в том, что сегодня издержки сбора и обработки возвратов перевешивают рост дохода от основной доли кошелька. Например, сейчас мы вернули бы 95 % доставленных товаров. Это трудоемко для нас и затратно для Amazon. Для освоения новой бизнес-модели прогнозы пока еще недостаточно точны.

Возможен иной вариант: Amazon обращается к новой стратегии до того, как точность прогнозов достигнет качественного уровня, исходя из предположения, что однажды это принесет выгоду. Благодаря раннему запуску ИИ соберет больше данных за короткий срок и усовершенствуется. В Amazon понимают, что чем раньше они стартуют, тем сложнее будет конкурентам их нагнать. Качественный прогноз привлечет больше покупателей, что увеличит объем данных для обучения ИИ и, в свою очередь, приведет к повышению качества прогнозов, а далее этот цикл неоднократно повторится. Раннее внедрение обойдется дорого, но опоздание может стать роковым[13].

Мы не утверждаем, что Amazon будет или должен внедрять такую практику, хотя для скептиков у нас есть неожиданная новость: в 2013 году Amazon получил патент США на «опережающую доставку»[14]. Несомненно, вращение регулятора точности прогнозов коренным образом повлияет на стратегию. В данном примере оно меняет бизнес-модель Amazon с «покупка – затем доставка» на «доставка – затем покупка», создает стимул для вертикальной интеграции посредством организации услуги по возврату товаров (в том числе грузового автопарка) и ускоряет процесс инвестирования. И все это вследствие поворота регулятора точности прогностической машины.

Что это означает для стратегии? Во-первых, необходимо инвестировать в сбор информации относительно того, как быстро и насколько высоко вырастет точность прогнозов в вашем и в смежных секторах. Во-вторых, разработка тезиса о стратегических возможностях, образовавшихся в результате вращения регулятора точности, потребует финансовых вложений.

Чтобы начать «научное фантазирование», закройте глаза, мысленно возьмитесь за регулятор прогностической машины и, следуя бессмертным словам члена группы Spinal Tap[15], поверните его на 11 часов.

План книги

Прежде всего необходимо построить фундамент для стратегического внедрения прогностических машин в своей организации. Именно так мы структурировали книгу – возводили пирамиду от основания.

В части I мы заложим фундамент и объясним, как машинное обучение повышает качество прогнозов. Затем разберемся, чем новые преимущества отличаются от статистики, которой вас учили или которой уже занимаются ваши аналитики. Далее мы затронем ключевые дополняющие факторы прогнозов – данные, особенно те, что необходимы для качественной прогностики, – и расскажем, как убедиться, что они у вас есть. И в завершение рассмотрим, когда прогностические машины работают эффективнее человека и в каких случаях людям и машинам целесообразно объединить усилия для получения максимально точных прогнозов.

В части II мы опишем роль прогнозов в качестве вводных для принятия решений и объясним значение еще одной составляющей, пока недооцененной в сфере ИИ, – суждений. Прогнозы помогают принимать решения, снижая неопределенность, а суждения определяют ценность. В экономической терминологии суждением называется определение окупаемости, целесообразности, дохода и прибыли. Самое значительное свойство прогностических машин состоит в том, что они повышают ценность суждения.

В части III перейдем к практике. Прогностические машины оснащены инструментами ИИ в соответствии с конкретными задачами. Мы опишем шаги, помогающие определить, когда создание (или покупка) инструментов ИИ максимально повысит доход. Иногда такие инструменты идеально укладываются в рабочий процесс, но бывает, что побуждают изменить его. Также мы познакомим вас с важным подспорьем для уточнения ключевых требований к инструментам – «шаблоном ИИ».

В части IV вернемся к стратегии. Как в описанном нами эксперименте с Amazon, иногда ИИ настолько масштабно влияет на экономику задачи, что преобразует компанию или промышленность. Тогда он становится краеугольным камнем стратегии организации. В результате воздействия на стратегию ИИ переключает на себя внимание высшего руководства помимо менеджеров продукта и инженеров.

Как правило, заранее предусмотреть степень влияния ИИ на стратегию нельзя. Например, немногие, опробовав инструменты поиска Google, предсказывали, что они преобразуют медиаиндустрию и лягут в основу самых успешных компаний планеты.

Помимо возможностей получения прибыли ИИ несет системные риски, способные повлиять на бизнес. Все сосредоточены на рисках ИИ для человечества, но мало кто обращает внимание на опасность ИИ для организаций. К примеру, некоторые прогностические машины, обучаемые на полученных от человека данных, заодно усваивают ненужные отклонения и стереотипы.

Книгу завершает часть V, в которой мы отвечаем на вопросы о широком влиянии ИИ на общество и касаемся пяти основных спорных тем.


1. Сохранятся ли рабочие места? Ответим: да.

2. Усугубится ли проблема неравенства? Вероятно.

3. Будут ли несколько крупнейших компаний контролировать весь мир? Зависит от обстоятельств.

4. Страны погрузятся в политику «гонки уступок», лишат нас приватности и безопасности ради конкурентного преимущества отечественных компаний? Некоторые – да.

5. Наступит ли конец света? До него достаточно времени, чтобы успеть с пользой применить полученную информацию.

Выводы

• Экономика предлагает четкое представление о влиянии удешевления прогнозов на бизнес. Прогностические машины будут использоваться как для традиционных (управление ресурсами и прогнозирование спроса), так и для новых задач. Падение цен на прогнозы повлияет на ценность других понятий и предметов, повысит ценность дополняющих факторов (данных, суждения и действий) и снизит ценность эквивалентов (человеческого прогноза).

• Организации могут использовать прогностические машины, внедряя инструменты ИИ с целью выполнения текущей стратегии. Когда инструменты станут мощнее, они изменят саму стратегию. Например, если Amazon сможет прогнозировать желания покупателей, то перейдет с модели «покупка – затем доставка» на модель «доставка – затем покупка» – будет доставлять товары до размещения заказов. Такой переход преобразит организацию.

• В результате новых стратегий, разработанных с учетом преимуществ ИИ, мы встанем перед фактом его влияния на общество. Наш выбор будет зависеть от потребностей и предпочтений и наверняка в разных странах и культурах окажется разным. Мы разделили книгу на пять частей в соответствии с уровнями влияния ИИ и от основы пирамиды – прогнозов – начнем подниматься выше: прогностика, принятие решений, инструменты, стратегия и общество.

Часть I. Прогностика

Глава 1. Волшебство прогностических машин

Что общего у Гарри Поттера, Белоснежки и Макбета? Их действиями движет пророчество, то есть прогноз. Даже сюжет «Матрицы», вроде бы описывающий прогностические машины, построен на вере персонажей в предсказание. Везде, от религии до сказок, знание будущего имеет решающее значение. Предсказания влияют на наше поведение и принятие решений.

Древние греки чтили своих многочисленных оракулов за пророческие способности, но их предсказания иногда бывали такими туманными, что сбивали с толку вопрошающих. Например, однажды царь Лидии Крез задумал рискованный штурм Персидской империи. И поскольку не доверял полностью ни одному оракулу, решил проверить каждого, прежде чем просить совета о нападении на Персию. Ко всем оракулам он разослал гонцов. На сотый день они должны были спросить, что Крез делает прямо сейчас. Ближе всех к истине оказался оракул из Дельф, поэтому царь обратился за пророчеством к нему[16].

Как и в примере с Крезом, прогноз может касаться и настоящего. Мы предполагаем, правомерная или мошенническая операция проводится по кредитной карте, злокачественная опухоль на снимке или доброкачественная, в камеру телефона смотрит владелец iPhone или посторонний человек.

Слово «прогноз» происходит от греческого слова πρόγνωσις, буквально означающего «предузнавание» (то есть знание того, что произойдет), но в современном понимании это скорее способность видеть скрытую информацию как в будущем, так и в прошлом и настоящем. Наверное, самый известный символ магического предсказания – хрустальный шар. И хотя в нашем представлении он связан с гадалками, обещающими финансовое процветание или успех в любви, в книге Фрэнка Баума «Волшебник страны Оз» Дороти с его помощью видит, что делает ее тетя Эм в настоящем. Все это приводит нас к определению прогностики.

Волшебство прогностики

Несколько лет назад Ави Голдфарб обнаружил, что в казино Лас-Вегаса с его кредитной карты снята крупная сумма. Но он в это время был совершенно в другом месте. А в Лас-Вегас ездил лишь однажды и очень давно – азартные игры не вписываются в его экономическое мировоззрение. После продолжительных переговоров банк отменил транзакцию и выдал новую карту.

Недавно неприятность повторилась. Кто-то снова сделал покупку по кредитной карте Ави. Но на этот раз он даже не успел увидеть транзакцию, так что ему не пришлось сто раз описывать ситуацию вежливому, но строгому сотруднику службы поддержки. Ави сообщили по телефону о подозрительной операции по карте и что уже выслали новую по почте.

Банк совершенно правильно заключил, исходя из потребительских привычек Ави и тонны другой информации, что транзакция мошенническая. И был настолько уверен в этом, что даже не стал блокировать карту до выяснения обстоятельств.

Вместо этого у Ави, как по волшебству, появилась другая карта, для чего он и пальцем не шевельнул. Конечно, хрустального шара у банка нет, но есть данные и надежная предсказательная модель: прогностическая машина. Повышение качества прогнозов позволило снизить риск мошенничества и одновременно, как выразился президент MasterСard по вопросам безопасности Аджай Бхалла, «избавить клиентов от ошибочного отклонения транзакций»[17].

В сфере бизнеса применение прогностики полностью соответствует ее определению как процесса заполнения информационных пробелов. Эмитентам необходимо знать, не была ли недавняя транзакция мошеннической. Для прогноза по конкретной операции используются данные о совершенных мошеннических (и правомерных) переводах денежных средств. В случае подтверждения неправомерности эмитент может заблокировать карту, а если прогноз сделан достаточно быстро, то успеет отменить и текущую транзакцию.

Данный принцип – когда из имеющейся информации выводится отсутствующая – положен в основу главных современных достижений ИИ в области перевода. Об этой цели говорилось еще в предании тысячелетней давности о Вавилонской башне; цивилизация шла к ней на протяжении всей своей истории. Раньше для разработки автоматических переводчиков нанимали лингвиста (владеющего каким-либо конкретным языком), чтобы он изложил грамматические правила в приемлемой для программирования форме[18]. Таким образом, например, если требовалось перевести фразу с испанского языка, слова не просто последовательно переводились, но существительные и прилагательные менялись местами, чтобы в итоге получилось грамотно составленное и понятное предложение.

Недавний рывок в развитии ИИ позволил поместить переводы в сферу прогностических задач. После этого качество онлайн-переводчика Google прямо-таки чудесным образом изменилось. Рассказ Эрнеста Хемингуэя «Снега Килиманджаро» начинается такими словами: «Килиманджаро – покрытый вечными снегами горный массив высотой в 19 710 футов, как говорят, высшая точка Африки».

В ноябре 2016 года профессор Юн Рекимото, ученый, IT-специалист из Токийского университета, переводил рассказ в Google-переводчике с японского языка на английский и получил такой результат: «Килиманджаро высота 19 710 футов гора снежный покров, и сказал самая высокая в Африке». На следующий день перевод выглядел уже по-другому: «Килиманджаро гора высотой 19 710 футов покрыта снегом и считается самой высокой в Африке».

Разница невероятная! Прошла всего одна ночь, а вместо корявого автоматического перевода получилось складное предложение, словно вместо недоучки работу делал человек, одинаково хорошо владеющий обоими языками.

Конечно, следует признать, что автору перевода до Хемингуэя далеко, но налицо явный прогресс. Вавилон возродился. И это не случайная перемена и не сбой: Google перекроила машинный переводчик с учетом недавних достижений в области ИИ, о которых мы рассказываем. Если быть точнее, современная программа Google-переводчик базируется на глубоком обучении повышению точности прогнозов.

Перевод заключается в определении японских эквивалентов английских слов и выражений. Прогнозируемые отсутствующие данные – это японские слова и их грамматический порядок. Если на основании данных иностранного языка составлять алгоритм слов и их правильный порядок на известном языке, то перевод получается читабельным. А если сделать все точно, то не всегда можно догадаться, что это перевод.

Компании, не теряя времени, начали коммерческое применение этой волшебной технологии. Например, более 500 миллионов граждан Китая уже пользуются сервисом на основе глубокого обучения, разработанным iFlytek, для перевода, транскрибирования и переписки на родном языке. С его помощью домовладельцы договариваются с иностранными арендаторами, пациенты больниц получают справочную информацию, врачи дают рекомендации, а водители общаются со своими автомобилями[19].

Чем чаще используется ИИ, тем больше он собирает данных и учится и тем лучше становится. А с таким количеством пользователей он совершенствуется очень быстро.

Насколько сейчас прогнозы лучше, чем раньше?

Изменения в программе Google-переводчик иллюстрируют, как машинное обучение (один из его подразделов – глубокое обучение) снижает цену на качественные прогнозы. За ту же цену в единицах вычислительной мощности Google предоставляет перевод более высокого качества. Цена прогнозов аналогичного качества значительно снизилась.

Инновации в прогностических технологиях влияют на традиционно связанные с прогнозом сферы, такие как обнаружение финансового мошенничества. Здесь наблюдается такой прогресс, что эмитенты кредитных карт выявляют и пресекают случаи мошенничества раньше, чем пользователи успевают их заметить. И все же улучшение происходит постепенно. В конце 1990-х с помощью передовых тогда методов удавалось предотвратить около 80 % мошеннических транзакций[20]. К 2000 году эти показатели поднялись до 90–95 %, а сегодня достигают 98–99,9 %[21]. Последний рывок стал результатом машинного обучения: разница между 98 и 99,9 % огромна.

Кажется, что от 98 % совсем недалеко до 99,9 %, но, если ошибки обходятся дорого, важно действовать постепенно. Улучшение с 85 до 90 % означает, что количество ошибок уменьшилось на треть. А с улучшением с 98 до 99,9 % ошибок стало в 20 раз меньше. Про такой показатель уже не скажешь «постепенно».

Падение цены на прогноз меняет и человеческую деятельность. Как первоначально компьютеры использовались для арифметических вычислений, таких как учет численности и разнообразные таблицы, так и первые прогнозы, полученные в результате машинного обучения, применялись для решения обычных прогностических задач. Помимо обнаружения мошенничества в них входили кредитоспособность, медицинская страховка и управление ресурсами.

Кредитоспособность – это прогноз вероятности погашения кредита заемщиком. Для медицинской страховки рассчитывали сумму, которую страхователь потратит на лечение. В управлении ресурсами важен прогноз загрузки склада в определенный день.

Не так давно возникли совершенно новые категории прогностических задач. Многие из них считались невыполнимыми до недавнего прогресса в технологии машинного интеллекта, в том числе распознавание объектов, языковой перевод и разработка лекарственных средств. Возьмем, к примеру, широко известный ежегодный конкурс ImageNet Challenge. Распознавание объектов – не всегда легкая задача и для человека. В данных ImageNet содержится множество категорий объектов, в том числе породы собак и другие схожие изображения. Не всегда можно уловить разницу между тибетским мастифом и бернским зенненхундом или между сейфовым и кодовым замком. Люди ошибаются примерно в 5 % случаев[22].

Если сравнивать первый (2010) и последний (2017) конкурсы, то прогнозы заметно улучшились. На рис. 1 приводится график точности победителей по годам. На вертикальной оси отмечена частота ошибок (поэтому чем ниже, тем лучше). В 2010 году лучшие прогностические машины неверно распознавали 28 % изображений. В 2012 году конкурсанты впервые использовали глубокое обучение, и частота ошибок снизилась до 16 %. Как отмечает профессор Принстона, IT-специалист Ольга Русаковская, «2012-й действительно стал годом огромного прорыва в точности, и это доказывает эффективность модели глубокого обучения, существующей уже несколько десятков лет»[23].


Рис. 1. Временной график ошибок в распознавании объектов


Алгоритмы улучшались быстро, впервые человеческий эталон был превзойден в 2015-м. К 2017 году у большинства участников было уже в два раза меньше ошибок. Машины стали распознавать объекты лучше человека[24].

Последствия удешевления прогнозов

Нынешнее поколение ИИ пока отстает от разумных машин из научной фантастики. У нас нет ЭАЛа из «2001: Космическая одиссея», «Скайнет» из «Терминатора», Си-Три-Пи-О из «Звездных войн». Если современный ИИ способен только на прогностику, почему вокруг него такой ажиотаж? Да потому, что прогноз действительно важен. Не все это понимают, но прогноз имеет значение во всех сферах человеческой деятельности, в том числе в деловой и частной жизни. Решения принимаются на основе прогнозов; чем они качественнее, тем полнее информация и, следовательно, тем лучше результаты.

Прогноз можно назвать «добычей полезной информации», что слегка отдает шпионажем[25]. Машинный же прогноз – это искусственная выработка полезной информации, а она всегда во главе угла. Качество прогноза влияет на итоги чего бы то ни было, как мы объяснили в примере с выявлением мошенничества. Благодаря снижению цены на прогноз мы делаем его полезным для многих других сфер, открывая его безграничные возможности, – например, машинный языковой перевод, который раньше нельзя было даже вообразить.

Выводы

• Прогресс роста точности прогнозов обманчив. Например, улучшение с 85 до 90 % кажется больше, чем с 98 до 99,9 % (в первом случае на 5 %, а во втором – на 2 %). Однако улучшение с 85 до 90 % означает, что количество ошибок уменьшилось на 30 %. А с улучшением с 98 до 99,9 % ошибок стало в 20 раз меньше. В некоторых условиях это меняет все.

• За волшебством прогностических машин стоит самое что ни на есть заурядное заполнение информационных пробелов. Машины умеют видеть (распознавание объектов), ориентироваться (беспилотные автомобили) и переводить.

Глава 2. Почему это называется «интеллект»

В 1956 году группа учеников Дартмутского колледжа в Нью-Гемпшире планировала исследование с целью создания ИИ. Их интересовало, можно ли запрограммировать компьютер на познавательный процесс, чтобы он учился, скажем, играть, доказывать математические теоремы и прочее. Также они предусмотрели язык и соответствующие данные, с тем чтобы компьютер мог описывать вещи. Они хотели, чтобы компьютер выбирал лучший из предложенных вариантов. Исследователи видели возможности ИИ в самом радужном свете. В обращении за финансированием к Фонду Рокфеллера они написали:

«Мы намерены выяснить, как научить компьютер использовать язык, оперировать абстрактными понятиями, решать разные типы задач, которые сейчас решают люди, и самосовершенствоваться. Полагаем, что за лето при условии сплоченной работы коллектива ученых мы заметно продвинемся в направлении одной из этих целей»[26].

Но эти планы по большей части остались в мечтах. Помимо прочего, в 1950-х компьютеры были недостаточно мощными и быстродействующими для воплощения в жизнь всех замыслов студентов.

После этого заявления ИИ показал некоторый прогресс в языковых переводах, но незначительный. Разработки ИИ для узкоспециализированной среды (например, создания программы-психотерапевта) были неприменимы в других случаях. В начале 1980-х появилась надежда на создание экспертных систем для замены квалифицированных специалистов, в том числе для постановки медицинских диагнозов, но проекты оказались дорогостоящими, громоздкими и не могли учитывать миллиарды исключений и вариантов, что привело к периоду, называемому «зимой ИИ».

Но, похоже, зима закончилась. Сейчас данных больше, модели лучше, компьютеры мощнее, поэтому недавние разработки в сфере машинного обучения привели к повышению качества прогнозов. Усовершенствования в сборе и хранении большого объема данных обеспечили основу для новых алгоритмов машинного обучения. По сравнению со своими предшественниками современные компьютеры оборудованы более мощными процессорами, а новые модели машинного обучения гибче и выдают более точные прогнозы – настолько, что эту отрасль IT снова стали называть «искусственным интеллектом».

Прогнозирование оттока клиентов

В основе развития прогностики лежат улучшенные данные, модели и компьютеры. Для понимания их ценности давайте рассмотрим давнюю проблему прогнозирования «оттока клиентов», как выражаются маркетологи. Большинству компаний привлечение клиентов обходится дорого, и, следовательно, их отток приносит убытки. С набранной клиентской базой компания экономит на этих расходах, снижая отток. Сложнее всего его контролировать в сферах профессиональных услуг: страховании, финансовых операциях и телекоммуникации. Первый шаг к снижению оттока – выявление ненадежных клиентов, для чего компании могут использовать прогностические технологии.

Раньше отток клиентов прогнозировали статистическим методом, называемым «регрессия». Научные исследования позволили усовершенствовать его.

Ученые предложили и протестировали сотни различных методов регрессии в теории и на практике.

Регрессия делает прогноз на основе средних показателей прошлого. Например, если вам необходимо определить, пойдет ли завтра дождь, и у вас есть только данные за предыдущие семь дней, то оптимально использовать средний показатель. Если дождь лил два дня из семи, то вероятность завтрашних атмосферных осадков составит примерно два из семи, то есть 29 %. Но благодаря всему, что нам теперь известно о прогностике, мы можем сконструировать модели, способные извлекать из контекста больше данных и точнее рассчитывать средний показатель.

Мы делали это с помощью так называемого условного среднего значения. Например, если вы живете на севере Калифорнии, то из опыта знаете, что вероятность осадков зависит от времени года – она ниже летом и выше зимой. Таким образом, если зимой вероятность дождя достигает 25 %, а летом – 5 %, вы не считаете, что завтра она составит 15 %. Почему? Потому что вам известно, зима сейчас или лето, и прогнозируете вы с учетом этих данных.

Поправка на сезон – только одно из условий среднего значения (хотя и распространенное в розничной торговле). Учитываются также время суток, уровень загрязнения, облачность, температура океана и вообще любая доступная информация.

Поправки можно делать на несколько факторов одновременно: пойдет ли завтра дождь, если сегодня пасмурно, сейчас зима, дождь идет в 320 км к западу, в 160 км к югу солнечно, земля влажная, температура Северного Ледовитого океана низкая и дует юго-западный ветер со скоростью 24 км/ч? Однако все это обрастает громоздкими вычислениями. Только расчет среднего для семи категорий данных дает 128 комбинаций, а с дополнительными данными – в разы больше.

До машинного обучения множественная регрессия была эффективна для учета нескольких условий без необходимости рассчитывать десятки, сотни и тысячи условных средних значений.

Регрессия собирает данные и пытается извлечь результат с минимумом прогностических ошибок и с максимальной «точностью приближения», как ее называют.

К счастью, математическое значение термина точнее, чем это может показаться, исходя из формулировки. Регрессия минимизирует прогностические ошибки среднего значения и за крупные ошибки карает строже, чем за мелкие. Это достаточно надежный метод, особенно для работы с относительно небольшим объемом данных и при условии понимания, что в прогнозе самое главное. Например, если оценивать отток аудитории кабельного телевидения, то важны привычки людей; те, кто включает телевизор редко, с большей вероятностью откажутся от подписки на канал.

Кроме того, регрессионные модели способствуют генерации объективных результатов, поэтому при достаточном количестве прогнозов в среднем они будут точными. Хотя мы предпочитаем объективные прогнозы субъективным (в которых систематически переоценивается или недооценивается какой-либо показатель, например ценность), первые все еще не идеальны. Это утверждение можно проиллюстрировать старой статистической шуткой.

Физик, инженер и статистик отправились на охоту. В лесу они увидели оленя.

Физик прикинул расстояние до цели, скорость и понижение траектории пули, сделал нужные поправки, выстрелил – и промахнулся на полтора метра влево.

Расстроенный инженер упрекнул его: «Ты забыл сделать поправку на ветер. Дай сюда ружье!» Он лизнул палец, поднял руку вверх, определил направление и скорость ветра, выстрелил – и промахнулся на полтора метра вправо.

И тут статистик закричал: «Ура! Попали!» Заметим, что он даже не расчехлил ружье.

Идеальная точность в среднем иногда говорит о том, что каждый отдельный результат ошибочен. Регрессия может постоянно промахиваться на полтора метра влево и вправо. Даже если средний показатель оказывается верным, не исключено, что регрессия ни разу не попала в цель.

В отличие от регрессии, прогноз методом машинного обучения может быть ошибочным в среднем, но если промахивается, то ненамного. Статистики называют это допущением незначительных отклонений ради снижения расхождений.

Важное отличие машинного обучения от регрессионного анализа заключается в способе разработки новых методов. В процессе создания нового метода машинного обучения необходимо доказать повышенную эффективность на практике, для разработки же новых методов регрессии достаточно их работоспособности в теории. Сосредоточившись на практике, разработчики машинного обучения получают свободу для экспериментов, даже если их методы дают неверные оценки или отклонения в среднем. Именно свобода экспериментировать способствовала стремительным улучшениям, благодаря которым стало возможным воспользоваться преимуществами большого объема данных и быстродействующих компьютеров, появившихся в последние годы.

В конце 1990-х и начале 2000-х успех экспериментов с машинным обучением для прогнозирования оттока клиентов был скромным. Методы машинного обучения совершенствовались, но регрессия все еще давала в целом лучшие результаты. Данных хватало, а компьютеры не были настолько мощными, чтобы реализовать все преимущества машинного обучения.

Например, центр Teradata в Университете Дьюка в 2004 году провел турнир по анализу данных для прогнозирования оттока клиентов. Тогда подобные события были редкостью; любой мог подать заявку, а выигрыш выплачивался наличными. В призовых заявках использовались регрессионные модели. Некоторые методы машинного обучения продемонстрировали неплохие результаты, но методы нейронной сети, впоследствии совершившие революцию в ИИ, никуда не годились. В 2016 году все выглядело уже наоборот: в лучших моделях прогнозирования оттока клиентов использовалось машинное обучение, а модели с глубоким обучением (нейронными сетями) обошли все остальные.

Что же изменилось? Во-первых, объем данных и мощность компьютеров стали достаточными для повсеместного использования машинного обучения. В 1990-е было трудно собрать действительно большой объем данных. Например, в классическом исследовании прогнозирования оттока использовалось 650 клиентов и менее 30 переменных.

К 2004 году компьютерная обработка и хранение данные усовершенствовались. В турнире Дьюка обучающий набор данных содержал информацию о сотнях переменных для десятков тысяч клиентов. При таких условиях методы машинного обучения улучшились до уровня регрессии, если не превзошли его.

Современные исследователи прогнозируют отток на основе тысяч переменных и миллионов клиентов. Возросшая мощность компьютеров дала возможность анализировать огромный объем данных, включая, помимо чисел, тексты и изображения.

Например, в модели прогнозирования оттока клиентов мобильной связи исследователи использовали данные почасовой истории звонков помимо стандартных переменных, таких как сумма счета и пунктуальность оплаты.

Методы машинного обучения улучшились также за счет эффективного использования доступных данных. В конкурсе Дьюка ключевой составляющей успеха был выбор, какие данные использовать из сотен имеющихся и какую применять статистическую модель. В лучших методах того времени, будь то машинное обучение или классическая регрессия, переменные и модель выбирали с помощью комбинации статистических критериев и интуиции. Современные методы машинного (и особенно глубокого) обучения позволяют гибкость, то есть переменные сочетаются самым неожиданным образом. Скажем, клиенты со счетами на большие суммы, расходующие минуты в начале расчетного периода, уйдут с меньшей вероятностью, чем клиенты со счетами на более крупные суммы, но расходующие минуты в конце расчетного периода. Или клиенты с внушительным счетом за роуминг в выходные, которые к тому же задерживают оплату и часто обмениваются текстовыми сообщениями, уйдут с повышенной вероятностью. Такие комбинации могут сыграть в прогнозах решающую роль, но их трудно предусмотреть. И поэтому их не включают в стандартные регрессионные модели. Машинное обучение предоставляет компьютеру выбор комбинаций и взаимодействий, имеющий значение для него, а не для программиста.

Прогресс методов машинного обучения в целом и глубокого обучения в частности свидетельствует о возможности эффективного применения доступных данных для точного прогнозирования оттока клиентов. И сейчас очевидно их превосходство над регрессией и многими другими методами.

Прогнозирование в других сферах

Помимо оттока клиентов машинное обучение улучшило прогнозирование во многих других сферах, от рынка до погоды.

Финансовый кризис 2008 года ознаменовал крах основанных на регрессии прогностических методов. Отчасти в кризисе виновны прогнозы вероятности дефолта по обеспеченным долговым обязательствам. В 2007 году агентства уровня Standard & Poor прогнозировали, что в ближайшие пять лет вероятность не получить доход по обязательствам с рейтингом ААА[27] составит 1 из 800. Пятью годами спустя больше одного из четырех обеспеченных долговых обязательств не принесли дохода. Изначальный прогноз оказался провальным, несмотря на обширные данные по предыдущим дефолтам.

Проблема заключалась не в недостатке данных, а в том, как аналитики использовали их для прогнозирования. Рейтинговые агентства исходили из моделей множественной регрессии, в которых цены на недвижимость на разных рынках друг с другом не сопоставлялись. В этом и состояла ошибка, и не только в 2007 году, но и раньше. Прибавьте сюда одновременное потрясение нескольких рынков недвижимости, и вероятность потерь на обеспеченных долговых обязательствах резко возрастает, даже если они распределены по многим городам США.

Аналитики создают регрессионные модели на основе гипотез о том, что именно (и с какими характеристиками) имеет значение, – для машинного обучения все это не нужно. Модели машинного обучения особенно хороши для вычленения полезных переменных из множества и определения, что не имеет значения, а что, как ни удивительно, наоборот. К сегодняшнему дню интуиция и гипотезы аналитиков утратили свою значимость. Таким образом, машинное обучение позволяет делать прогнозы на основе непредусмотренных сопоставлений, как, например, то, что цены на недвижимость в Лас-Вегасе, Фениксе и Майами изменятся одновременно.

Если это всего лишь прогноз, за что его называют интеллектом?

Недавний прогресс в машинном обучении преобразовал применение статистики для прогнозирования. Последний рывок в развитии ИИ наводит на мысль, что машинное обучение – это всего-навсего «навороченная традиционная статистика». В каком-то смысле так и есть, поскольку цель та же – заполнение информационных пробелов. К тому же в процесс машинного обучения входит поиск решения с минимизацией ошибок.

Итак, за что же машинное обучение считается революционной вычислительной технологией и заслужило название «искусственный интеллект»? В некоторых случаях прогнозы настолько хороши, что их можно использовать вместо основанной на правилах логики.

Эффективная прогностика меняет компьютерное программирование. Ни традиционные статистические методы, ни алгоритмы «если, то» не работают в сложной среде настолько успешно. Хотите найти кошку на одном изображении из нескольких представленных? Уточните, что кошки бывают разного окраса и с шерстью длинной, короткой, курчавой и т. д. Они могут стоять, сидеть, лежать, прыгать, хмуриться, как Грампи-кэт, и находиться где угодно. Все сразу усложняется: даже для более или менее сносных результатов следует предусмотреть очень многое. И это только в отношении кошек. А если необходимо описать все объекты на изображении? Для каждого придется составлять отдельные спецификации.

Ключевая технология глубокого обучения основана на так называемом обратном распространении. С ним машина учится примерно так же, как наш мозг – на примерах (насколько искусственные нейроны похожи на настоящие – еще один интересный вопрос помимо достоинств технологии). Когда ребенка учат слову «кошка», то повторяют его каждый раз при появлении животного; в машинном обучении действует тот же самый принцип. Снабдите компьютер фотографиями кошек с названием «кошка» и фотографиями без кошек и, соответственно, без этого названия. Машина научится распознавать паттерны пикселей, связанные с названием «кошка».

При наличии фотографий с кошками и собаками связь между кошкой и четырехногим объектом укрепится, как и связь между ним же и собакой. Без дальнейших уточнений можно загрузить несколько миллионов разных изображений (в том числе без собак) с названиями, тогда у машины появится больше ассоциаций, и она научится отличать кошек от собак.

Большинство проблем перешли из алгоритмической категории («Каковы признаки кота?») в прогностическую («Есть ли на этом изображении без названия что-нибудь похожее на кошек, которых я уже видел?»). Для решения задач машинное обучение использует вероятностные модели.

Почему же технические специалисты называют машинное обучение интеллектом искусственным? Потому что его результат – прогноз – представляет собой ключевую составляющую интеллекта, точность прогнозов возрастает в процессе обучения, а высокая степень точности позволяет машинам выполнять задачи, которые до недавнего времени считались прерогативой человеческого интеллекта, – такие как распознавание объектов.

В книге «Об интеллекте»[28] Джефф Хокинс одним из первых заявил, что прогноз являет собой основу человеческого интеллекта. Суть теории Хокинса такова: интеллект человека, лежащий в основе творческого начала и продуктивной деятельности, обусловлен тем, как мозг использует память для прогнозирования: «Мы осуществляем непрерывное прогнозирование на низком уровне всеми органами чувств одновременно. И это еще не все. У меня есть более серьезное предположение. Прогностика – не просто одна из функций мозга, это первичная функция неокортекса и базис интеллекта. Кора головного мозга является прогностическим органом»[29].

Хокинс считает, что наш мозг постоянно делает прогнозы относительно всего, что мы испытаем в ближайшие мгновения: что увидим, почувствуем или услышим. С развитием и взрослением прогнозы становятся все точнее и чаще всего сбываются. Если же нет, мы замечаем несоответствие между предполагаемым и произошедшим, информация поступает в мозг, который обновляет свои алгоритмы и таким образом учится и совершенствуется.

Теорию Хокинса воспринимают неоднозначно. Его идеи обсуждаются в психологической литературе, а многие IT-специалисты категорически отрицают утверждение о коре головного мозга как модели для прогностических машин. Предположение, что ИИ может пройти тест Тьюринга (на способность обмануть человека, убедив его, что тоже является человеком), пока еще далеко от реальности. Современные алгоритмы не умеют убеждать, к тому же с ними сложно вести переговоры для выяснения основания их прогнозов.

Независимо от того, насколько уместна аналогия Хокинса, его утверждение о прогностике как базисе интеллекта удобно для понимания значения недавнего развития ИИ. Мы хотим подчеркнуть огромные последствия усовершенствования прогностических технологий. Теперь до вдохновенных идей Дартмутского семинара 1956 года рукой подать. Прогностические машины различными способами могут «использовать язык, оперировать абстрактными понятиями, решать разные типы задач, которыми сейчас [в 1955 году. Прим. авт.] занимаются люди, и самосовершенствоваться»[30].

Мы не строим домыслов о том, возвещает ли этот прогресс появление общего ИИ – приход технологической сингулярности, подобной «Скайнет». Однако, как вы убедитесь, если пристально посмотрите на прогностику, грандиозные перемены в ближайшие несколько лет вполне реальны.

Так же как дешевая арифметика с распространением компьютеров ознаменовала волну перемен в деловой и частной жизни, аналогичные преобразования не заставят себя долго ждать с удешевлением прогнозов.

Интеллект это или нет, но в целом переход от детерминированного программирования к вероятностному произошел скачком, хотя и параллельно с прогрессом в общественных и естественных науках. Канадский философ Ян Макдугалл Хакинг в книге «Укрощение случайности» сказал, что до начала XIX века вероятность была прерогативой азартных игроков[31]. С наступлением XIX века и ростом государственной статистики зарождающаяся вероятностная математика стала применимой к общественным наукам. В ХХ веке произошло фундаментальное изменение нашего понимания физики, и мы перешли от детерминистских ньютоновских взглядов к неопределенности квантовой механики. Важнейший прорыв XXI века в IT сравним с предыдущими достижениями в социальных и естественных науках: осознание того, что алгоритмы лучше работают с вероятностной структурой данных.

Выводы

• Цели машинного обучения отличаются от статистических. Статистика стремится к точности среднего показателя, в машинном обучении этого не требуется. Его цель – практическая эффективность. Смещение прогнозов допускалось при условии, что они были точнее (что стало возможным из-за увеличения мощности компьютеров). Это дало ученым простор для экспериментов и быстро принесло улучшения, благодаря которым стало возможным воспользоваться преимуществами большого объема данных и быстродействующих компьютеров, появившихся в последние годы.

• В традиционных статистических методах для спецификаций модели необходимы сформулированные гипотезы или, по крайней мере, человеческая интуиция. Машинное обучение не требует предварительной спецификации и вмещает в себя эквиваленты гораздо более сложных моделей с большим количеством взаимодействий между переменными.

• Прогресс машинного обучения называют достижением ИИ, поскольку:

• основанные на данном методе системы учатся и постепенно совершенствуются;

• системы выдают значительно более точные прогнозы, чем другие при аналогичных условиях, а некоторые специалисты считают прогностику базисом интеллекта;

• повышенная точность прогнозов таких систем позволяет им выполнять задачи, такие как языковой перевод и навигация, ранее считавшиеся прерогативой исключительно человеческого интеллекта.

• По поводу связи между прогнозом и интеллектом мы придерживаемся агностической точки зрения. Ни одно из наших заключений не основано на позиции, утверждающей, что достижения прогностики представляют собой интеллектуальные достижения. Мы рассматриваем последствия удешевления прогнозов, а не интеллекта.

Глава 3. Данные – это новая нефть

Хэл Вариан, ведущий экономист Google, в обращении к Роберту Гойцуэте из Coca-Cola сказал в 2013 году: «Миллиард лет назад появился современный “человек разумный”. Миллиард минут назад зародилось христианство. Миллиард секунд назад выпустили IBM PC. А миллиард поисковых запросов назад… наступило сегодняшнее утро»[32]. И Google – не единственная компания с неохватным объемом данных. Для всех, от гигантов вроде Facebook и Microsoft до местных государственных органов и стартапов, сбор данных стал проще и дешевле, чем когда-либо. Эти данные обладают ценностью. Миллиарды поисковых запросов – это миллиарды строк данных, с которыми Google совершенствует свои службы. Данные даже называют «новой нефтью».

Прогностические машины полагаются на данные. Чем их больше и чем они лучше, тем качественнее прогнозы. Выражаясь языком экономистов, данные остаются ключевым компонентом прогнозирования, их ценность растет с удешевлением прогнозов.

В ИИ данные представлены в трех ипостасях. Первая – входные данные, которые загружаются в алгоритмы и используются для прогнозирования. Вторая – обучающие данные, необходимые для создания самих алгоритмов; с их помощью ИИ учится прогнозировать в реальной среде. И наконец, существуют также данные обратной связи, призванные постепенно улучшить эффективность алгоритмов. В некоторых случаях виды данных пересекаются, например одна и та же информация выполняет все три роли.

Но сбор данных может стоить дорого, следовательно, объем капиталовложений рассчитывается исходя из компромисса между выгодой от получения дополнительных данных и затратами на них. Чтобы принять оптимальное решение по инвестированию средств в данные, необходимо понимать, как машины их используют.

Для прогностики необходимы данные

До недавнего ажиотажа вокруг ИИ возникало много шумихи по поводу большого объема данных. Их разнообразие, количество и качество заметно выросли за последние 20 лет. Изображения и тексты переводят в цифровую форму, чтобы машины могли их анализировать. Все оснащено датчиками. Такой активный интерес основан на возможности этих данных помочь людям снизить неопределенность и оставаться в курсе происходящего.

Рассмотрим улучшенные датчики сердечного ритма. Многочисленные компании и некоммерческие организации с медицинскими названиями, такие как AliveCor и Cardiio, разрабатывают продукты, использующие данные о сердечном ритме. Например, стартап Cardiogram сделал приложение для iPhone, которое получает показатели сердечного ритма от Apple Watch и выдает огромный объем информации: посекундные замеры частоты сердцебиения. Пользователи могут отслеживать, не подскакивает ли она в течение дня и повысилась или уменьшилась за год или даже за десять лет.

Изобилие данных и возможности прогностических машин открывают подобным разработкам широкие перспективы. Научные и производственные исследователи продемонстрировали, как смартфоны прогнозируют нарушения сердечного ритма («мерцательную аритмию», как говорят медики)[33]. Продукты, разрабатываемые Cardiogram, AliveCor и Cardiio с помощью прогностических машин, используют данные о сердечном ритме, необходимые для диагностики кардиологических заболеваний. Общий подход компаний заключается в том, чтобы на основе выявленных данных прогнозировать информацию о наличии у пользователя отклонений в работе сердца.

Без входных данных прогностические машины не смогут работать, поэтому их называют просто «данными», в отличие от обучающих и данных обратной связи.

Неподготовленные пользователи не улавливают в необработанных данных связи между информацией о частоте сердечных сокращений (ЧСС) и нарушением сердечного ритма. А приложение Cardiogram выявляет его с 97 %-ной точностью благодаря работе глубокой нейронной сети[34]. Отклонения в работе сердца становятся предвестниками 25 % всех инфарктов, а усовершенствования анамнеза позволят врачам вовремя назначить лечение. Для профилактики инфаркта существуют лекарства.

Но для этого потребители должны предоставить сведения о своем сердечном ритме. Машина не сможет прогнозировать риски для конкретного человека, не имея о нем необходимой информации. При наличии у прогностической машины индивидуальных данных человека она выдаст прогноз вероятности нарушений сердечного ритма.

Как машины учатся с помощью данных

Нынешнее поколение технологий ИИ не без причины называется «машинным обучением». Оно учится на данных. В только что описанном примере машина для составления прогноза нарушений сердечного ритма (и вероятности развития инфаркта) устанавливает связь между ЧСС и случаями диагностированной мерцательной аритмии. Для этого она сопоставляет входные данные Apple Watch – их статистики называют «независимыми переменными» – с информацией о нарушениях сердечного ритма («зависимой переменной»).

Чтобы обучить машину, информация о нарушениях сердечного ритма должна исходить от тех же людей, что входные данные Apple Watch. Другими словами, прогностической машине необходимы данные о большой выборке людей с нарушениями сердечного ритма наряду с полученными от них данными. Кроме того (и это важно), необходимы также аналогичные показатели большой выборки людей, не страдающих кардиологическими заболеваниями. Прогностическая машина сравнивает данные обеих групп, на основании чего выдает прогноз. И если паттерн сердечного ритма нового пациента ближе к данным «обучающей» выборки людей с нарушениями, то машина прогнозирует у него нарушение сердечного ритма.

Как и большинство медицинских приложений, Cardiogram собирает данные научных исследований с участием шести тысяч пользователей. Из них примерно у двухсот человек уже диагностировано нарушение сердечного ритма, Cardiogram остается только получить с помощью Apple Watch данные и сравнить их с предыдущими показателями.

Такие продукты продолжают совершенствовать точность прогнозов даже после выпуска. Прогностическим машинам необходимы данные обратной связи о корректности прогнозов: в данном случае это частота нарушений сердечного ритма среди пользователей продукта. Машина объединяет эти данные со входными данными кардиомониторинга и на основе полученной информации непрерывно повышает качество прогнозов.

Однако добыть обучающие данные не всегда легко. Для прогноза одной группы (в нашем случае это пациенты с риском сердечных заболеваний) необходима информация как о потенциальном риске (нарушении сердечного ритма), так и о том, что необходимо для уточнения прогноза данного прецедента в новом контексте (кардиомониторинг).

Еще сложнее, когда прогноз касается будущих событий. Вы можете предоставить прогностической машине подтвержденную информацию только на настоящий момент. Скажем, вы надумали купить билет на игры любимой команды на следующий сезон. В Торонто большинство болеет за местную хоккейную команду Maple Leafs. Вы хотите ходить только на матчи, в которых любимая команда победит, и не желаете платить за проигрышные. Вы решили, что стоит купить билет только в случае, если команда в следующем году выиграет минимум половину матчей. Но для этого вам необходимо спрогнозировать количество побед.

В хоккее выигрывает команда, загнавшая больше шайб в ворота противника. Поэтому вы предполагаете, что команда, забивающая больше голов, побеждает чаще. Вы загружаете в прогностическую машину данные за прошлые сезоны: сколько каждой команде засчитали голов, сколько она пропустила, каково количество побед каждой команды. Вам кажется, что это великолепный способ прогнозировать вероятность победы. Теперь вы собираетесь таким же образом прогнозировать количество выигрышей на следующий год.

Но ничего не выйдет, поскольку это невозможно. У вас нет информации о том, как сыграет команда в предстоящем сезоне, следовательно, вы не узнаете ничего о предстоящих спортивных победах или поражениях. У вас есть данные за прошлый сезон, но они не пригодятся, потому что вы научили машину прогнозировать по данным за текущий год.

Для вашего прогноза необходимы данные, доступные на момент прогнозирования. Возможно переучить прогностическую машину использовать забитые в прошедшем году шайбы для прогнозирования предстоящих побед. Можно добавить другую информацию, например о выигранных ранее матчах или возрасте игроков команды и качестве их игры.

Так работают многие коммерческие приложения ИИ: для создания прогностической машины берут входные данные вместе с критериями исходов, а затем используют входные данные новой ситуации для прогнозирования ее исхода. Если вы располагаете данными по исходам, то ваша прогностическая машина может непрерывно обучаться на данных обратной связи.

Решения по данным

Сбор информации нередко стоит дорого, но прогностические машины иначе работать не могут. Исходные данные необходимы для их создания, функционирования и совершенствования.

Следовательно, нужно найти решение относительно масштаба и диапазона приобретаемых данных. Сколько разных типов данных вам понадобится? Сколько различных объектов требуется для обучения? Как часто вам необходимо собирать данные? Большее число типов, объектов и частый сбор означают, что цена будет выше, но и выгода тоже увеличится. Взвешивая решение, следует тщательно продумать, что именно вы собираетесь прогнозировать. Конкретные предсказательные задачи подскажут ответ.

Программа Cardiogram разработана для прогнозирования риска развития и возникновения инфарктов. Нарушения сердечного ритма в ней использовались в качестве индикатора (подтвержденного медициной)[35]. В качестве цели установили выявление нарушений, после чего оставалось только получить данные о ЧСС пользователей. Могли также использоваться данные о сне, физической активности, родственниках, истории болезни и возрасте. После получения данной информации приложению требовался всего один прибор, точно измеряющий единственный параметр – ЧСС.

Данные были необходимы Cardiogram и для обучения – в базе состояло шесть тысяч человек, и некоторые из них страдали нарушениями сердечного ритма.

Несмотря на обилие датчиков и разнообразие потенциально доступных данных о пользователях, по большинству людей Cardiogram собирала немного информации. И доступ требовался только к данным об отклонениях сердечного ритма у людей из обучающей ИИ выборки. Таким образом, количество переменных оказалось относительно малым.

Для качественного прогноза в распоряжение машины должны быть предоставлены обучающие данные по достаточному количеству людей (или единиц анализа). Количество зависит от двух факторов: первый – стабильность «сигнала» по отношению к «шуму», второй – насколько точным должен быть прогноз, чтобы он имел смысл. Иными словами, требуемое количество людей зависит от того, считаем мы ЧСС сильным или слабым прогностическим критерием нарушений сердечного ритма, и того, насколько дорого обойдется ошибка. Если ЧСС считается сильным прогностическим критерием, а ошибки не принесут проблем, то достаточно нескольких человек. Если же это слабый критерий или любая ошибка может стоить жизни, то необходимы тысячи людей, а лучше миллионы. В предварительном исследовании Cardiogram, как мы уже говорили, использовалась выборка из шести тысяч человек, в том числе двухсот с нарушениями сердечного ритма. Впоследствии сбор дополнительной информации осуществлялся посредством обратной связи о том, диагностировано ли у пользователей нарушение сердечного ритма.

Почему именно шесть тысяч? Специалисты по обработке и анализу данных пользуются отличным инструментарием для получения необходимого объема информации с учетом желаемой надежности и степени точности прогноза. Эти инструменты называют «расчетом мощности» – они сообщают, сколько единиц требуется для проведения анализа, с тем чтобы прогноз имел смысл[36]. Очевидно, придется искать компромисс: для более точного прогноза необходимо больше анализируемых показателей, а они могут дорого стоить.

Cardiogram требует постоянного сбора данных – посекундного, – и для этого используется Apple Watch: ритм сердечных сокращений варьируется в течение дня, а для точности измерений необходим многократный анализ того, насколько измеренный показатель типичен для конкретного человека. Алгоритмы Cardiogram используют устойчивый поток данных от устройства, которое человек постоянно носит на теле, в противовес результатам отдельных измерений при посещении врача.

Сбор данных потребовал существенных вложений. Пациенты постоянно носили устройства, что не всегда удобно в повседневных действиях (особенно тем, у кого нет Apple Watch). Поскольку речь шла о здоровье, было необходимо соблюдать конфиденциальность, и Cardiogram разрабатывалась с ее учетом, что повысило расходы и снизило способности машины совершенствоваться при помощи обратной связи. Она собирала данные для прогнозов посредством приложения, а все данные хранились на устройстве.

Далее мы обсудим разницу между статистическим и экономическим подходами к количеству требуемой информации. (Вопросы конфиденциальности мы рассмотрим вместе со стратегиями в части IV.)

Экономия на масштабе

Чем больше данных, тем лучше прогноз. Но сколько их нужно? Преимущества дополнительной информации (единиц анализа, типов переменных и частоты) могут увеличиваться или уменьшаться вместе с имеющимся объемом данных. Выражаясь экономическим языком, отдача от масштаба может быть возрастающей или убывающей. С чисто статистической точки зрения у данных убывающая отдача от масштаба. Мы получаем больше ценной информации из третьего наблюдения, чем из сотого, и больше из сотого, чем из миллионного. По мере добавления наблюдений к обучающей информации они все меньше и способствуют улучшению прогноза.

Каждое наблюдение приносит дополнительные данные для обоснования прогноза. Cardiogram учитывает промежутки между ударами сердца. Говоря «у данных убывающая отдача», мы подразумеваем, что первых ста ударов достаточно для того, чтобы убедиться, есть у человека нарушения сердечного ритма или нет. Каждый последующий удар менее важен для уточнения прогноза, чем предыдущие.

Для примера рассмотрим расчет времени выхода из дома, чтобы вовремя приехать в аэропорт. Если вы там ни разу не были, первая поездка даст много полезной информации. После второй и третьей вы определите среднее время в пути. В сотый же раз вы вряд ли узнаете что-то новое. Вот что означает убывающая отдача от масштаба данных: по мере поступления дополнительных показателей данных каждый следующий раз дает меньше информации (и отдачи), чем предыдущий.

С экономической точки зрения это неверно, однако не в плане улучшения прогноза с помощью дополнительных данных. Смысл в том, что данные повышают ценность, которую вы извлекаете из прогноза. Если прогноз и исход совпадают, то убывающая отдача от наблюдений статистически подразумевает убывающую отдачу в отношении интересующих вас итогов. Но иногда прогноз и исход различаются.

К примеру, у пользователей есть выбор: брать продукт вашего или какого-то другого производства. И ваш они выберут только в том случае, если он так же хорош или лучше, чем у конкурента. При условии постоянной доступности данных все продукты будут одинаково хороши. Например, большинство поисковых машин на одинаковые запросы выдает похожие результаты. И в Google, и в Bing на запрос «Джастин Бибер» вы получите одно и то же.

Ценность поисковой машины зависит от ее способности выдать лучший результат на необычные запросы. Попробуйте набрать в строке поиска Google или Bing слово «подрыв» (disruption). На момент, когда мы пишем эти строки, Google показал словарное определение и ссылки на упоминания подрывных инноваций профессора Гарвардской школы бизнеса Клея Кристенсена. В первых девяти результатах Bing содержались словарные определения. Результаты Google были лучше, потому что для предположения о том, что именно ищет пользователь с необычным запросом, требуются данные о таких пользователях. Большинство людей пользуется Google и для обычных, и для непростых запросов. Даже небольшие преимущества поисковой машины могут увеличить долю рынка и доход.

Итак, с технической позиции у данных убывающая отдача от масштаба – миллиардный поиск менее полезен для улучшения поисковой машины, чем первый, – но с точки зрения бизнеса данные обладают огромной ценностью, если у вас их больше и они лучше, чем у конкурента. Некоторые утверждают, что данные об уникальных факторах приносят несоразмерно большие преимущества на рынке[37]. И увеличение объема данных приводит к такому же результату. Следовательно, с экономической точки зрения в обоих случаях для данных характерна прибывающая отдача от масштаба.

Выводы

• Прогностические машины используют три типа данных:

• обучающие данные для ИИ;

• входные данные для прогнозирования;

• данные обратной связи для повышения точности прогноза.

• Сбор данных требует затрат – вложения. Его размер зависит от того, сколько данных вам необходимо и чем осложнен процесс сбора. Крайне важно уравновесить издержки на приобретение данных с выгодой от повышенной точности прогноза. Для определения оптимального подхода требуется оценить окупаемость затрат для каждого типа данных: сколько нужно вложить для сбора и насколько ценным окажется повышение точности соответствующих прогнозов?

• Увеличение ценности с поступлением дополнительных данных зависит от статистических и экономических причин. С точки зрения статистики у данных – убывающая отдача. Каждая следующая порция данных улучшает прогноз меньше, чем предыдущая; десятое наблюдение более существенно для прогноза, чем тысячное. С точки зрения экономики все не так однозначно. Добавление данных к существующему большому объему может быть эффективнее, чем к маленькому, – например, если дополнительные данные делают прогностическую машину пригодной к использованию, повышают ее продуктивность или позволяют обойти конкурента. Таким образом, организация должна понимать взаимосвязь между добавлением данных, повышением точности прогнозов и увеличением ценности.

Глава 4. Новое разделение труда

Каждое изменение в электронном документе можно зафиксировать. Для большинства людей это просто более удобный способ отслеживать правки, но Рон Глозман увидел в нем возможность применять ИИ к данным для прогнозирования редактирования. В 2015 году Глозман запустил стартап Chisel, и его первый продукт прогнозировал конфиденциальную информацию в юридических документах. Продукт представляет ценность для юридических компаний, потому что при разглашении документов они обязаны скрывать информацию такого рода. Раньше редактировали вручную, люди вычитывали и исправляли тексты документов. Предложение Глозмана позволяло сэкономить время и силы.

Машинное редактирование работало, но не идеально. Бывало, что машина по ошибке скрывала информацию, подлежащую разглашению, или пропускала конфиденциальную. Для соответствия юридическим стандартам требовалась проверка исправленного текста человеком. На тестовом этапе Chisel предлагала фрагменты для редактирования, и человек подтверждал или опровергал предложение. На практике такая совместная работа экономила много времени, а ошибок оказывалось меньше, чем если бы редактирование осуществлялось только человеком.

Разделение труда между человеком и компьютером оказалось эффективным, потому что устранило недостатки работы читающего – низкую скорость и недостаточную внимательность – и ошибки машинной интерпретации текста.

Ошибаются и люди, и машины. Не зная типичных неточностей, мы не понимаем, как объединить их для прогнозирования. Зачем? Согласно идее разделения труда, существующей еще с XVIII века, со времен экономики Адама Смита[38], – роли распределяются в соответствии со способностями. В нашем случае с целью прогнозирования разделение труда должно произойти между человеком и машиной. Для этого необходимо разобраться, какие обязанности лучше выполняют люди, а какие – компьютеры. Таким образом мы определим отдельные роли.

Слабые стороны человека в прогнозировании

В известном психологическом эксперименте испытуемому показывали случайную последовательность Х и О и просили ее продолжить. Например, такую:

OXXOXOXOXOXXOOXXOXOXXXOXX

Почти все сразу замечают, что Х здесь больше, чем О, – если подсчитать, получится 60 % Х и 40 % О. Поэтому чаще выбирают Х и иногда разбавляют О. Однако для повышения шансов на точный прогноз нужно всегда выбирать Х. Тогда ответ окажется верным в 60 % случаев. Если рандомизировать 60/40 (как это делают большинство испытуемых), прогноз окажется верным только в 52 % случаев. И это немногим лучше, чем выбирать, вообще не задумываясь о соотношении Х и О, а просто угадывать (с вероятностью 50/50)[39].

Из подобных экспериментов напрашивается вывод, что из людей получаются плохие статистики даже в ситуации, когда они способны оценить вероятности. Такую ошибку не сделала бы ни одна прогностическая машина. Но люди, вероятно, не относятся к подобным задачам ответственно, для них это просто игра. Допускали бы они такие ошибки, если последствия были бы серьезнее, чем в игре?

Ответ на этот вопрос подтвержден психологами Дэниелом Канеманом и Амосом Тверски в многочисленных экспериментах: несомненно «да»[40]. Они предлагали людям решить задачу про две больницы: если в одной рождается 45 младенцев в день, а в другой 15, то в какой из них будет больше дней, когда 60 % новорожденных или более окажутся мальчиками? Верный ответ давали очень немногие – в маленькой. Он правильный, потому что чем больше количество событий (в данном случае рождений), тем выше вероятность, что итог каждого дня будет ближе к среднему (в данном случае к 50 %). Попробуем понять почему: представьте, что вы подбрасываете монетку. Вероятность выпадения нескольких орлов подряд выше, если подбросить монетку пять, а не пятьдесят раз. Таким образом, в маленькой больнице – потому что там рождается меньше младенцев – вероятность отклонений от среднего значения выше.

О подобных эвристических опытах и отклонениях написано немало книг[41]. Большинство людей не умеют составлять прогноз на основе статистических правил, поэтому нанимают специалистов. Но и те, к сожалению, не всегда могут избежать таких же отклонений и сложностей со статистикой во время принятия решений. Отклонениями заражены разнообразные сферы, такие как медицина, право, спорт и бизнес. Тверски вместе с исследователями Гарвардской школы медицины описывал медикам два вида лечения рака легких: лучевую терапию и операцию. На основании показателей выживаемости за пять лет он рекомендовал операцию. Для двух групп участников информацию о краткосрочной выживаемости после операции – более рискованного варианта, чем лучевая терапия, – сформулировали по-разному. Исходя из формулировки «в течение месяца выжили 90 % пациентов», операцию предпочли 84 % врачей, а когда данные перефразировали: «в первый месяц смертность составляет 10 %» – уже всего 50 %. Суть обоих вариантов одна и та же, а на решение влияла исключительно формулировка. Машина не учитывала бы ее.

Дэниел Канеман обнаружил множество ситуаций, когда специалисты не способны дать качественный прогноз на основе сложной информации. Опытные рентгенологи в оценке снимков в одном случае из пяти противоречили сами себе. Аудиторы, врачи клинической лабораторной диагностики, психологи и менеджеры демонстрировали такую же непоследовательность.

Канеман пришел к выводу: если для прогноза вместо человека возможно использовать формулу, так и следует поступать.

Низкое качество экспертных прогнозов стало темой книги Майкла Льюиса Moneyball[42]. Бейсбольная команда Oakland Athletics оказалась в затруднении после ухода трех лучших игроков, поскольку не располагала средствами приобрести новых. Ее менеджер Билли Бин (в фильме «Человек, который изменил всё» роль Бина исполнил Брэд Питт) для прогноза эффективности игроков использует статистическую систему Билла Джеймса. Билли и его аналитики махнули рукой на рекомендации скаутов и собрали собственную команду с помощью саберметрики[43]. Несмотря на скромный бюджет, команда обошла соперников и дошла до игр Мировой серии 2002 года. Суть новой системы заключалась в смене приоритетных критериев – вместо таких показателей, как кражи базы, средний уровень, баттинг[44], учитывались другие, в том числе эффективность на базе и процент сильных ударов. Заодно удалось исключить иногда совершенно непостижимую логику скаутов. Один из них в фильме обронил: «Его подружка – уродина. Значит, у него низкая самооценка». В свете подобных алгоритмов принятия решений неудивительно, что основанные на данных прогнозы в бейсболе взяли верх над человеческими.

Новые показатели учитывали вклад игрока в эффективность команды в целом. Прогностическая машина позволила подобрать в Oakland Athletics игроков с более низкими показателями по традиционной шкале оценки и, следовательно, более высокой ценностью из расчета отношения стоимости к повышению продуктивности команды. Без прогностики на их качества никто не обратил бы внимания. Oakland Athletics сыграли на отклонениях в свою пользу[45].

Явственное представление о проблемах с прогнозами, которые делают люди, даже если это опытные и маститые специалисты, дает исследование решений о выдаче под залог в судах США[46]. Ежегодно там принимается 10 млн таких решений – с последствиями для семьи, работы и других сфер жизни, не говоря уже о государственных расходах на тюремное содержание. Судья в своем решении должен исходить из того, не сбежит ли обвиняемый и не совершит ли другие преступления, будучи отпущенным под залог, а не из вероятности признания его виновным. Критерии ясные и четко описаны.

В исследовании использовали машинное обучение для разработки алгоритмов, прогнозирующих вероятность того, что данный обвиняемый совершит побег или снова нарушит закон, если его выпустить под залог. Обучающих данных было предостаточно: 750 тыс. человек, отпущенных под залог в Нью-Йорке с 2008 по 2013 год. В алгоритмы также включили список предыдущих правонарушений, предъявленные обвинения и демографические сведения.

Машинный прогноз оказался точнее человеческого. Например, согласно прогнозу, из 1 % обвиняемых, причисленных машиной к самым опасным, 62 % совершат преступление, будучи отпущенными под залог. Судьи же (у которых не было доступа к прогнозам машины) выпустили почти половину из них. Прогноз оказался почти идеальным – 63 % обвиняемых действительно совершили повторные преступления, а половина из них не явилась на следующее заседание суда. Из них 5 % совершили изнасилования и убийства.

Если бы судьи последовали рекомендациям машины, то могли бы отпустить то же количество обвиняемых и снизить показатель преступности среди выпущенных под залог на 75 %. Или сохранить показатели преступности и посадить за решетку вдвое меньше обвиняемых[47].

В чем же дело? Почему прогноз судей так заметно расходится с машинным? Одна из причин, возможно, в том, что судьи пользуются недоступной алгоритмам информацией, скажем, внешностью и поведением обвиняемых в суде. Она бывает полезной, но может и вводить в заблуждение. С учетом высоких показателей совершения преступлений выпущенными под залог разумно заключить, что последнее более вероятно; прогнозы судей никуда не годятся. В исследовании достаточно и других подтверждений данного неутешительного вывода.

Прогностика в такой ситуации представляет сложность для человека из-за неоднозначных факторов, влияющих на показатели преступности. Прогностические машины гораздо лучше людей определяют факторы сложных взаимодействий отдельных показателей.

Получается, когда вы уверены, что прошлые преступления обвиняемого повышают риск побега, машина подсчитывает, что это произойдет только в случае, скажем, если он не сможет найти работу в течение определенного периода. Иными словами, эффект взаимодействия может быть важнее, а поскольку многоплановость таких взаимодействий возрастает, способность человека к составлению точных прогнозов снижается.

Отклонения не просто проявляются время от времени в медицине, бейсболе и суде, это неотъемлемая часть любой профессиональной деятельности. Специалисты обнаружили, что и менеджеры, и рабочие прогнозируют часто – причем с полной уверенностью, – не догадываясь, что их предположения несостоятельны. Занимаясь исследованием 15 агентств по найму неквалифицированных рабочих, экономисты Митчелл Хоффман, Лиза Кан и Даниэль Ли обнаружили: когда решения по найму принимались на основании объективного проверяемого теста и обычного собеседования, стаж работы на следующем месте был выше на 15 %, чем в результате одного только собеседования[48]. А перед менеджерами при этом стояла задача по увеличению стажа.

Достаточно объемный тест включал вопросы на проверку когнитивных способностей и соответствие обязанностям. А после того как свободу действий менеджеров ограничили – запретили аннулировать баллы при неудовлетворительных результатах теста, – стаж дополнительно вырос и доля увольнений по собственному желанию снизилась. Итак, даже с учетом поставленной задачи по увеличению продолжительности стажа и при наличии весьма точных машинных прогнозов менеджеры все же умудрялись делать неверные предположения.

Слабые стороны машин в прогнозировании

Бывший министр обороны Дональд Рамсфелд однажды сказал:

«Есть известные известные – вещи, в знании которых мы уверены. Еще есть известные неизвестные – когда мы знаем, что есть кое-что, чего мы не знаем. Но есть еще и неизвестные неизвестные – мы их не знаем и не подозреваем об их существовании. Если посмотреть на историю нашей страны и других свободных государств, самой сложной является последняя категория»[49].

Это обеспечивает удобную структуру понимания условий, на которых «спотыкаются» прогностические машины. Первое: «известные известные» – это наличие большого объема данных, когда есть уверенность в правильности прогноза. Второе: «известные неизвестные» – когда данных мало и очевидно, что сделать прогноз будет сложно. Третье: «неизвестные неизвестные» – события, не знакомые по опыту или не имеющиеся в данных и тем не менее вероятные, поэтому прогнозировать их трудно, хотя мы можем об этом не подозревать. И наконец, не упомянутая Рамсфелдом категория – «неизвестные известные»: когда подтвержденный в прошлом опыт представляет собой результат неизвестного или ненаблюдаемого фактора, изменяющегося со временем, из-за чего прогноз становится ненадежным. Прогностические машины ошибаются именно в тех случаях, когда не могут исходить из хорошо известных рамок статистики.

Известные известные

С достаточным объемом данных машинный прогноз чаще всего верен. Машине известна ситуация, она выдает качественный прогноз, и мы убеждаемся в этом. Вот что составляет зону комфорта нынешнего поколения машинного интеллекта: выявление мошенничества, медицинская диагностика, бейсбол и решения по выпуску осужденных под залог – все попадает в эту категорию.

Известные неизвестные

Даже лучшие на сегодня (и ближайшее будущее) прогностические модели требуют огромного количества данных. Следовательно, в случаях, когда их не хватает, точность прогноза соответственно понизится. Мы знаем, чего мы не знаем: известные неизвестные.

Недостаток данных обычно сопутствует достаточно редко происходящим событиям, поэтому их прогнозировать сложно. Президентские выборы в США проводятся только раз в четыре года, а кандидаты и политическая обстановка всегда разные. Предугадать итоги президентских выборов на несколько лет вперед практически невозможно. Как показали выборы 2016 года, трудно предположить итоги даже недели или хотя бы одного дня. Крупные землетрясения тоже достаточно редки (к счастью), и прогнозировать, когда они произойдут, где и с какой интенсивностью, пока нереально (но сейсмологи работают над этим)[50].

В отличие от машин, людям иногда отлично удаются прогнозы на основе ограниченного объема данных. Мы опознаём лица, даже если видели их лишь пару раз и в другом ракурсе. Сорок лет спустя мы узнаём одноклассника, с которым учились в четвертом классе, как бы он ни изменился внешне. С ранних лет мы угадываем траекторию полета мяча (даже если у нас еще недостаточно развита координация, чтобы его поймать). Мы легко проводим аналогии, усмотрев схожие с прошлым опытом обстоятельства в новой ситуации. Например, ученые в течение нескольких десятилетий представляли атом как миниатюрную солнечную систему, и во многих школах его до сих пор так и описывают[51].

IT-специалисты стараются снизить потребность машин в данных и разрабатывают такие методы, как «обучение на одном примере», в которых машины учатся прогнозировать объекты, увидев их единожды, но полный успех пока не достигнут[52]. Поскольку люди пока лучше умеют прогнозировать на основе известных неизвестных, можно запрограммировать машины так, чтобы в подобных ситуациях они призывали человека на помощь.

Неизвестные неизвестные

Чтобы машина выдала прогноз, ей необходимо указать, что именно следует прогнозировать. Если какое-то событие не происходило никогда, машина не сможет с ним работать (во всяком случае, без предоставления человеком сформулированного суждения с адекватной аналогией, позволяющей сделать прогноз с использованием информации о других событиях).

В книге «Черный лебедь»[53] Нассим Николас Талеб подчеркивает значение неизвестных неизвестных[54]. Он утверждает, что мы не можем на основе прошлого опыта прогнозировать то, чего в нем не было. Название книги навеяно открытием в Австралии нового вида лебедей, совершенным европейцами. В XVIII веке в Европе считалось, что лебеди бывают только белыми. Прибыв в Австралию, европейцы увидели нечто совершенно новое и неожиданное: черных лебедей. Никто их раньше не видел и поэтому не имел оснований предполагать, что они существуют[55].

Талеб считает, что появление неизвестных неизвестных приводит к серьезным последствиям – в отличие от черных лебедей, которые не повлияли на общество Европы и Австралии.

Возьмем, к примеру, расцвет музыкальной индустрии в 1990-х[56]. Продажи компакт-дисков увеличивались, доход стабильно рос. Будущее выглядело оптимистично. Но в 1999 году восемнадцатилетний Шон Фэннинг придумал Napster – программу, позволяющую людям бесплатно обмениваться музыкальными файлами в интернете. Вскоре были загружены миллионы таких файлов, и доходы от продажи дисков начали снижаться. Индустрия до сих пор не оправилась от этого краха.

Фэннинг стал неизвестной неизвестной, машины не смогли бы прогнозировать его появление. Стоит согласиться с мнением Талеба и многих других – людям тоже плохо дается прогноз неизвестных неизвестных. Перед ними пасуют и люди, и машины.

Неизвестные известные

Возможно, самый большой недостаток прогностических машин заключается в неверных прогнозах, причем обоснованных. Как мы уже обсудили, в случае известных неизвестных люди предполагают неточности в прогнозе: он выдается с доверительным интервалом, из чего следует вероятность погрешностей. О неизвестных неизвестных люди ничего не знают. При наличии же неизвестных известных прогностическая машина выдает точный прогноз, но он может быть очень далек от истины.

Почему так получается? Дело в следующем: хотя решения и выносят исходя из данных, но и данные иногда получают посредством решений. Если машина не понимает процесса принятия решений для получения данных, то ее прогноз неточен. К примеру, вы хотите прогнозировать, будете ли использовать прогностическую машину в своей организации. Считайте, что она у вас уже есть. Если вы читаете эту книгу, то почти наверняка обзаведетесь прогностической машиной.

Вы так поступите по меньшей мере по трем причинам. Первая и самая непосредственная – изложенные в книге идеи покажутся многообещающими: читая, вы больше узнаете о прогностических машинах и, следовательно, захотите повысить с их помощью эффективность своего бизнеса.

Вторая причина называется «обратной причинностью». Вы читаете эту книгу потому, что у вас уже есть прогностическая машина или вы собираетесь в скором времени приобрести ее. Не книга привела к применению технологий, а применение технологий (в настоящее время), наоборот, привело к чтению книги.

Третья причина называется «пропущенной переменной». Вы интересуетесь техническими новинками и занимаете руководящую позицию, поэтому решили прочитать книгу. В работе вы применяете новые технологии, в том числе прогностические машины. В этом случае ваша склонность к технологиям и управлению становится причиной и чтения книги, и использования прогностических машин.

Причина не всегда существенна. Если нужно знать, воспользуется ли читатель прогностическими машинами, то неважно, что будет причиной, а что – следствием. Если вы видите человека, читающего эту книгу, можете обоснованно прогнозировать, что он внедрит прогностические машины в свой рабочий процесс.

Но иногда причина все же имеет значение. Вы порекомендуете эту книгу друзьям в случае, если благодаря ей повысите свое мастерство в качестве менеджера в сфере прогностических машин. Что вы хотели бы узнать? Сначала вы прочитаете книгу. Затем попробуете заглянуть в будущее и посмотреть, насколько хорошо пойдет работа с ИИ. Предположим, вы увидели радужные перспективы и замечательно преуспели на поприще прогностических машин: они играют главную роль в вашей организации, и вы добились больших успехов, чем в самых смелых мечтах. Можно ли сказать, что книга привела вас к этому?

Нет.

Если вы хотите убедиться в том, что такое влияние оказала именно книга, необходимо знать, что случилось бы, если бы вы ее не читали. Но таких данных у вас нет. Следует рассмотреть «отсутствие вмешательства», как говорят экономисты и статистики: что произошло бы, если бы вы предприняли иные действия. Для утверждения, что действие служит причиной результата, требуется два прогноза: первый – что будет, если предпринять это действие, и второй – что будет, если предпринять другое действие. Но это невозможно. У вас никогда не появится данных о последствиях того, чего вы не делали[57].

Это хроническая проблема прогностических машин. В книге Deep Thinking Гарри Каспаров обсуждает похожие проблемы первых алгоритмов машинного обучения в шахматах: «В начале 1980-х Мичи с коллегами написали экспериментальную шахматную программу машинного обучения, основанную на данных. Результат оказался очень забавным. Они загрузили в машину сотни тысяч позиций гроссмейстерских игр в надежде, что она разберется, какие ходы удачные и какие нет. Сначала вроде бы все получалось. Анализ позиций был точнее, чем у других программ. Проблемы начались, когда машина начала сама играть в шахматы. Она сделала несколько ходов, пошла в атаку и сразу же пожертвовала ферзем! Через пару ходов она проиграла, отдав ферзя без всякой причины. Почему? Когда гроссмейстер жертвует ферзем, обычно это ловкое и продуманное решение. Обучаясь на одних только гроссмейстерских играх, машина сделала вывод, что выигрывает тот, кто остается без ферзя!»[58]

Машина неверно истолковала причинно-следственную связь. Не понимая, что гроссмейстер жертвует ферзем только в случае, если это прямой и верный путь к победе, она сделала вывод, что игрок побеждает вскоре после того, как отдаст ферзя, то есть ошибочно связала потерю шахматной фигуры и победу. Данную проблему прогностические машины решили, но обратная причинность остается слабым местом этих технологий.

В бизнесе такие задачи тоже встречаются. В большинстве сфер низким ценам сопутствует падение продаж. Например, в гостиничном бизнесе в несезонное время цены снижаются, но вырастают, когда спрос большой и отели переполнены. На основании таких данных машина может наивно предположить, что если поднять цены, то повысится спрос. Человек – хотя бы с минимальными познаниями в экономике – понимает, что рост цен служит следствием повышения спроса, а не наоборот. То есть, если поднять цены, продажи не вырастут.

Человек может предоставить машине верные данные (например, предложения индивидуального комфорта гостиничного номера исходя из цены) и соответствующие модели (с учетом сезонного спроса, а также других требований и предложений), чтобы лучше прогнозировать продажи по различным ценам. Для машины это неизвестные известные, но человек, разбирающийся в ценообразовании, воспринимает их как известные неизвестные или даже известные известные, если способен принимать решения по ценам самостоятельно.

Проблема с неизвестными известными и причинно-следственная зависимость становятся еще важнее в присутствии стратегического поведения других людей. Поиск Google работает по секретным алгоритмам. Они создаются с помощью прогностических машин, прогнозирующих, на какую ссылку пользователь нажмет с наибольшей вероятностью. Для администратора веб-сайта высокое ранжирование означает больше посетителей и продаж. Большинство администраторов знают об этом и делают оптимизацию в поисковых системах: стараются повысить рейтинг сайта в результатах поиска Google. Оптимизация, как правило, заключается в построении обходных путей существующих алгоритмов, в результате чего со временем поисковая машина замусоривается спамом и неинтересными пользователю ссылками.

Прогностические машины великолепно выполняют краткосрочные задачи – прогнозируют, на какую ссылку нажмут пользователи. Но через недели и месяцы обмануть систему ухитряется так много администраторов, что Google приходится постоянно обновлять прогностическую модель. Такое «перетягивание каната» между поисковой машиной и спамерами обусловлено возможностью обмануть прогностическую машину. Google пыталась разработать систему, в которой это было бы невыгодно, и попутно обнаружила, что полностью полагаться на прогностические машины неразумно. По этой причине Google начала использовать человеческие суждения для реоптимизации от подобного спама[59]. Instagram тоже постоянно борется со спамерами и возмутительной информацией обновлением алгоритмов для их отсева[60]. Вообще, как только эту проблему осознали, она перестала быть неизвестной известной: люди находят решение для улучшения прогноза, чтобы проблема стала известной известной, иногда требующей совместной работы человека и машины, либо не могут найти решения, и тогда проблема переходит в разряд известной неизвестной.

Возможности прогностических машин огромны, но не беспредельны. Они не очень хорошо работают с ограниченным объемом данных.

Квалифицированные специалисты способны разглядеть причину затруднений машины, будь то недостаток событий или причинно-следственные проблемы, и улучшить прогнозы. Но для этого нужно разбираться в IT очень хорошо.

Улучшенный прогноз совместными усилиями

Иногда в результате сотрудничества людей и машин, компенсирующего слабые стороны друг друга, получаются более точные прогнозы. В 2016 году команда исследователей ИИ из Гарварда и Массачусетского технологического института получила главный приз в конкурсе Camelyon Grand Challenge за компьютерную диагностику метастатического рака молочной железы по слайдам биопсии. Алгоритм глубокого обучения выдавал верный прогноз в 92,5 % случаев, а врач клинической лабораторной диагностики – в 96,6 %. Казалось бы, человек победил, но исследователи пошли дальше и объединили прогнозы алгоритма и врача. В результате точность повысилась до 99,5 %[61]. Процент ошибок человека таким образом упал с 3,4 до 0,5 %, то есть на 85 %.

Это классическое разделение труда, но не физического, описанного Адамом Смитом, а когнитивного, о котором экономист и первооткрыватель компьютеров Чарльз Бэббидж писал в XIX веке: «Разделение труда, как механического, так и мыслительного, позволяет осваивать и применять точно такой объем знаний и навыков, который для него требуется»[62].

Людям и машинам лучше всего удаются разные аспекты прогнозов. Врач редко ошибается, диагностируя рак. С другой стороны, ИИ точнее определяет отсутствие онкологического заболевания, то есть человек и машина совершают разные типы ошибок. Различие в способностях учли при их объединении с прогностической целью, человек и машина компенсировали недостатки друг друга, и в результате процент ошибок существенно снизился.

Как такое сотрудничество применимо в сфере бизнеса? Машинный прогноз может повысить прогностическую эффективность человека двумя способами. Первый – машинный прогноз проверяет человек и сравнивает со своей оценкой. Второй способ предполагает проверку человеческого прогноза машинным, для контроля над решениями людей. Таким образом, начальник будет уверен, что сотрудник старается составить качественный прогноз. Если же его не контролировать, он не всегда будет прилагать максимальные усилия. Теоретически человек, который должен обосновать, почему его предположения отличаются от прогноза беспристрастных алгоритмов, возьмет над машиной верх только в случае, если приложит достаточно усилий, чтобы быть уверенным в своем прогнозе.

Отличная сфера для проверки совместной работы – прогноз платежеспособности заемщиков. Ученые-экономисты профессор Дэниел Паравизини и Антуанетта Шоар после введений новой системы рейтинга кредитоспособности проверяли оценку центрального банка Колумбии в отношении подавших заявку на кредит на организацию малого бизнеса[63]. В компьютерную систему ввели разнообразную информацию о заявителях, и она выдала оценку предполагаемого риска. Затем сотрудники кредитного комитета банка сопоставляли эти результаты с собственными предположениями и одобряли, отказывали или передавали заявку региональному руководству.

Порядок рассмотрения машинного прогноза до или после вынесения решения определялся не распоряжением менеджеров, а рандомизированным контролируемым испытанием. Таким образом можно было научно обосновать влияние рейтинга на принятие решения. Одной группе сотрудников его сообщили непосредственно перед их встречей для вынесения решения (аналогично первому способу сотрудничества людей и машин, в котором люди выносят решения на основании машинного прогноза). Другой группе о рейтинге не говорили, пока они не закончили работу над собственным анализом (пример второго способа, в котором прогноз помогает следить за качеством решений, принятых людьми; разница между способами состоит в том, как люди принимают собственное решение – на основании прогноза или без него).

Рейтинг принес пользу в обоих случаях, но все же она оказалась гораздо большей, когда информацию предоставляли заранее. Комитет выносил оптимальные решения и обращался за помощью к руководству реже, благодаря прогнозу сотрудники располагали достаточно полным объемом информации.

У второй группы, участникам которой рейтинг сообщали после того, как они дадут свою оценку, тоже улучшилось качество принятых решений, потому что прогнозы помогли руководству контролировать их работу. У сотрудников появился стимул стремиться к высокому качеству решений.

В прогностической паре «человек – машина» для улучшения прогнозов требуется понимание пределов возможностей обоих. В примере с заявками на кредит люди склонны к смещенным прогнозам или прилагают недостаточные усилия. Машинам же может не хватать информации. В коллективах часто делается упор на командную работу и сплоченность, но работа машины и человека бок о бок пока непривычна. Чтобы людям удалось улучшить качество прогнозов машин и наоборот, важно знать слабые стороны тех и других и строить их совместную работу таким образом, чтобы они компенсировали недостатки друг друга.

Прогноз исключений

Одно из основных преимуществ прогностических машин заключается в возможности экономии на масштабе. Минус же их – в том, что они не умеют прогнозировать необычные ситуации с недостаточным количеством прецедентов. Если сложить то и другое, получается, что сотрудничество людей и машин оптимально для «прогноза исключений».

Как мы уже говорили, прогностические машины учатся на больших объемах данных, накопленных для привычных, часто встречающихся ситуаций, и в таких случаях они не требуют участия человека. Но как только появляются исключения – нестандартные ситуации, – подключаются люди и вносят свой вклад в качество и точность прогноза. Пример с кредитным комитетом центрального банка Колумбии как раз и есть такой «прогноз исключений».

Это название происходит от метода «управление исключениями». В прогностике человек во многих смыслах становится руководителем машины. У него много сложных задач; для экономии времени нужно наладить работу машины так, чтобы она требовала внимания только в случае необходимости. Если непосредственно контактировать с машиной можно нечасто, значит, один человек без затруднений использует ее преимущества для рутинных прогнозов.

На прогнозе исключений основан первый продукт Chisel (его мы упоминали в начале главы): он использовался для распознавания конфиденциальной информации, подлежащей редактированию в документах. Необходимость в трудоемкой процедуре возникает во многих юридических ситуациях, когда документ оглашается третьим сторонам или публично при условии частичного сокрытия информации.

Для первичной обработки текста в редакторе Chisel применялся прогноз исключений, когда пользователь может выбирать усиленный или легкий режим[64]. В усиленном режиме порог предполагаемой для скрытия информации выше, чем в легком. Например, если вы беспокоитесь, что редактор пропустит конфиденциальную информацию, то выбираете усиленный режим, а если нужно раскрыть максимум информации – настраиваете слабый. У Chisel удобный для просмотра и подтверждения результатов интерфейс. Иными словами, машинная редакция выдавала скорее рекомендательный, чем окончательный вариант. Последнее слово оставалось за человеком.

В продукте Chisel предпринята попытка преодолеть недостатки человека и машины с помощью их сотрудничества. Машина работает быстрее и обеспечивает логичный подход, а человек вмешивается, если у нее недостаточно данных для составления точного прогноза.

Выводы

• Люди, в том числе профессионалы в какой-либо области, в определенных условиях неспособны давать точный прогноз. Они часто переоценивают очевидное и не учитывают статистические свойства. Эти несовершенства подтверждены многочисленными научными исследованиями; на них построен сюжет художественного фильма «Человек, который изменил все».

• В прогностике машины и человека есть свои сильные и слабые стороны. Машины постоянно совершенствуются, что требует изменений в сфере разделения труда. Прогностические машины лучше людей анализируют сложные взаимодействия между разными признаками, особенно при наличии большого объема данных. Поскольку многоплановость таких взаимодействий возрастает, способность человека к составлению точных прогнозов снижается по сравнению с машинами. Однако человек превосходит их в случаях, когда понимание происхождения данных дает прогностическое преимущество, особенно при скудном объеме данных. Мы классифицировали условия прогноза (известные известные, известные неизвестные, неизвестные известные и неизвестные неизвестные) для удобства выбора подходящей схемы разделения труда.

• Прогностические машины позволяют экономить на масштабе. Цена за единицу прогноза падает с повышением частоты прогнозов. С человеческими прогнозами все по-другому. Однако люди придерживаются когнитивной модели всего происходящего в мире и поэтому могут делать прогнозы исходя из ограниченного объема данных. Это предвещает распространение «человеческого прогноза исключений», поскольку прогнозы машин по большей части основаны на рутинных данных о регулярно повторяющихся событиях, а в нетипичных ситуациях машина не способна на точный прогноз – и тогда ей требуется помощь человека. Человек обеспечивает прогноз исключений.

Часть II. Принятие решений

Глава 5. Анализ решений

Под принятием решений обычно подразумевают нечто важное: покупать ли дом, куда пойти учиться, вступать ли в брак. Несомненно, что такие шаги играют в жизни важную роль, но раздумывать над ними приходится нечасто.

Мы постоянно совершаем менее значимый выбор: остаться ли сидеть в кресле, продолжать ли идти вперед по улице, оплачивать ли ежемесячный счет. Как утверждала популярная канадская группа Rush в гимне свободе воли, «если отказываешься принимать решения, это тоже решение». Большинство мелких решений принимаются автоматически, как правило, по умолчанию, чтобы сохранить ресурсы для важного выбора. При этом решить ничего не решать – тоже решение.

Принятие решений лежит в основе любой деятельности. Школьные учителя решают, как учить детей, каждый из которых обладает собственной индивидуальностью. Менеджеры решают, кого нанимать в команду и кого повышать. Работники жилищно-эксплуатационных контор решают, как поступать в случае протечки канализации или угрозы безопасности жильцов дома. Водители грузовиков решают, что делать, если перекрыта трасса или произошло ДТП. Полицейские выбирают, как действовать по отношению к подозрительным личностям или при поступлении сигнала об опасности. Врачи решают, какое лекарство прописать, когда и как его назначать, какие необходимы медицинские обследования. Родители решают, сколько часов в день дети могут проводить за компьютером.

Такие решения, как правило, приходится принимать в условиях неопределенности. Учитель не знает наверняка, станет конкретный ребенок учиться лучше по одной или другой методике. Менеджер не уверен, насколько хорошо будет работать нанятый им сотрудник. Доктор неточно знает, необходимо ли дорогостоящее обследование. Все люди вынуждены прогнозировать.

Но прогноз – не решение. Чтобы принять решение, следует вынести суждение о прогнозе последующих действий. До недавнего прогресса машинного интеллекта данное разделение этапов интересовало только ученых, потому что люди всегда прогнозировали и судили одновременно, но сегодня развитие машинного прогнозирования привело нас к необходимости выяснить анатомию решений.

Анатомия решений

Влияние прогностических машин ощутимее всего на уровне решений. Но у них еще шесть ключевых составляющих (рис. 5.1). Когда кто-то (или что-то) принимает решение, то использует входные данные из окружающей обстановки, позволяющие сделать прогноз. Этот прогноз стал возможным вследствие обучения, из которого известно об отношениях между разными типами данных и о том, какой из них ближе всего к рассматриваемой ситуации. Объединив суждение о ней с прогнозом, принимающий решение выбирает действие. Оно ведет к результату (положительному или отрицательному). Результат есть следствие решения, он необходим для завершения картины. Также результат дает обратную связь, полезную для улучшения последующих решений.


Рис. 5.1. Анатомия решений


Представьте, что у вас заболела нога и вы пошли к врачу. Он осмотрел вас, сделал рентген, взял анализ крови, задал несколько вопросов – собрал входные данные. С их учетом, а также опираясь на полученные во время обучения знания и опыт лечения пациентов с похожими симптомами (обучающие данные и данные обратной связи), врач делает прогноз: «Скорее всего, у вас мышечные судороги, хотя есть и небольшая вероятность тромба».

Суждение осуществляется одновременно с анализом. Врач принимает во внимание и другие данные (в том числе интуицию и опыт). Если предположить мышечные судороги, то для выздоровления вам нужен покой. Если же симптомы указывают на тромбоз, необходимо другое лекарство без долговременных побочных эффектов, но у большинства пациентов его прием сопровождается незначительным недомоганием. Если врач ошибется и предложит лечить мышечные судороги лекарством от тромбоза, то вы зря пострадаете от несущественных побочных эффектов. Если же у вас тромб, а доктор пропишет вам отдых, вас могут ждать более серьезные последствия вплоть до фатальных. В суждении сопоставляются положительные и отрицательные стороны всех возможных результатов, являющихся следствием как верных, так и ошибочных решений (в данном случае это исцеление, побочные эффекты и серьезные осложнения). Определение положительных и отрицательных сторон всех возможных результатов необходимо, чтобы выбрать между медикаментозным лечением (которое принесет временный дискомфорт, зато снизит риск серьезных осложнений) и покоем.

Применив суждение к прогнозу, врач решает, вероятно с учетом вашего возраста и исходя из возможных рисков, назначить вам покой для лечения мышечной судороги, несмотря на минимальную вероятность тромбоза.

Далее следует действие – назначение лекарства и отслеживание результата: ушла ли боль в ноге, и не появились ли другие симптомы. Свои наблюдения врач сможет использовать для последующих прогнозов.

Разбивая решение на составляющие, мы получаем четкое представление о том, ценность какой деятельности человека снизится, а какой – повысится в результате внедрения машинных прогнозов. Что касается собственно прогнозов, то очевидно, что машины в целом справляются с ними лучше человека. И поскольку машины все чаще делают прогноз вместо людей, ценность человеческих прогнозов снижается. Но главный вывод в том, что прогноз представляет собой ключевой, но не единственный компонент любого решения, в остальных (суждение, данные и действие) уверенное преимущество остается за человеком. Составляющие решения дополняют прогноз, то есть их ценность повышается с его удешевлением. Например, мы готовы приложить усилия к вынесению суждения в случаях, когда раньше предпочитали не решать что-либо (то есть принимали все по умолчанию), потому что прогностические машины делают прогноз лучше, быстрее и дешевле. Вот почему спрос на суждения человека растет и продолжит расти.

Утрата знаний

Чтобы стать водителем знаменитых лондонских черных такси (Black Cab), претенденты проходят тест. Проверяется их знание тысяч мест и улиц города и – самое сложное – умение прогнозировать кратчайший или быстрейший путь между любыми двумя точками в любое время суток. Трудно представить себе объем такой информации даже для маленького города, а Лондон огромен. Он состоит из множества районов, которые раньше были отдельными городами и деревнями, но за последние две тысячи лет срослись в гигантский мегаполис. Чтобы пройти тест, будущий водитель должен правильно ответить на все вопросы. Неудивительно, что в среднем для этого требуется три года, и все это время необходимо не только изучать карты, но еще и кататься по городу и все запоминать. Пройдя тест и получив зеленый значок, таксист становится кладезем знаний[65].

Уже понятно, к чему мы клоним. Десять лет назад знания лондонских таксистов были их конкурентным преимуществом, никто не мог сравниться с ними по качеству услуг. Даже если можно было дойти пешком, люди садились в такси, потому что водители знали дорогу лучше. Но пять лет назад простейшие мобильные GPS-устройства (или спутниковые навигационные системы) дали всем водителям доступ к данным и прогнозам, которыми раньше владели только таксисты. Сейчас любой получает эти преимущества бесплатно в мобильном телефоне. Заблудиться просто невозможно, каждый знает кратчайший путь. А телефоны обошли преимущества такси, потому что в реальном времени обновляют информацию о загруженности дорог.

Таксисты три года корпели над сдачей теста, не подозревая, что им придется состязаться с прогностическими машинами. Они «загрузили» карты в собственную память и протестировали маршруты, а если чего-то не знали, такие проблемы компенсировались смекалкой. Сейчас у навигаторов есть доступ к тем же картам, а алгоритмы и прогностическое обучение позволяют им в любой момент выбрать оптимальный маршрут с учетом прежде недоступных таксистам данных по обстановке на дорогах.

Судьба лондонских таксистов зависит не только от способности навигаторов прогнозировать, но и от других элементов, необходимых для выбора оптимального пути из пункта А в пункт Б. Во-первых, таксист полностью контролирует автомобиль. Во-вторых, у него есть свои «датчики» – глаза и уши, – через которые в мозг поступают контекстные данные, благодаря чему он правильно применяет свои знания. Но все это есть и у других людей. Ни один таксист не стал хуже водить из-за навигаторов – наоборот, непрофессиональные водители стали ездить лучше. Знания таксистов перестали принадлежать только им, и у них появились конкуренты на таких платформах, как Uber.

Обычные водители обрели знания с помощью мобильных телефонов, а с прогнозом кратчайших путей смогли предоставлять услуги аналогичного уровня. Качественный машинный прогноз недорог, а человеческий упал в цене, поэтому таксисты пострадали. Количество поездок на лондонских такси снизилось из-за наплыва конкурентов. Они тоже обладали навыками вождения и человеческими «датчиками» – дополнительные ресурсы, поднявшиеся в цене с удешевлением прогнозов.

Разумеется, вероятно, что в конце концов на смену всем придут беспилотные автомобили, но к этому мы еще вернемся. Суть в том, что для понимания последствий распространения машинного прогноза требуется знать различные аспекты принятия решений, описанные в их анатомии.

Брать ли зонтик?

До этого момента мы не совсем точно определяли суждение. Попробуем объяснить его с помощью инструмента для принятия решений – дерева решений[66]. Оно особенно пригодится для условий неопределенности, когда вы не уверены в последствиях своего выбора.

Для примера рассмотрим привычную ситуацию. Взять ли зонтик, отправляясь на прогулку? Все знают, что такое зонтик – штука, которую держат над головой, чтобы не промокнуть, но в данном случае это еще и своего рода страховка от дождя. Итак, для всех касающихся страховки решений для снижения риска применяется следующая схема.


Рис. 5.2. Брать ли зонтик?


Конечно, если вы уверены, что дождь не пойдет, то оставите зонтик дома. Если же точно знаете, что пойдет, то возьмете с собой. На рис. 5.2 этот процесс представлен в древовидной диаграмме. У основания дерево расходится на ветви: «взять зонтик» и «оставить зонтик». От них отходят еще две ветви, описывающие то, в чем вы не уверены: «дождь» и «ясно». Без прогноза погоды вы об этом не узнаете, но, возможно, заметили, что в это время года вероятность ясной погоды в три раза выше дождя. Мы готовы приложить усилия к вынесению суждения в случаях, когда раньше предпочитали не решать (то есть принимали все по умолчанию).

В трех случаях из четырех будет ясно, а в одном – дождь. Это ваш прогноз. И, наконец, последствия представлены на кончиках ветвей. Если не взять зонт и пойдет дождь, вы промокнете и т. д.

Какое решение принять? Здесь поможет суждение, то есть процесс определения вознаграждения за конкретное действие в конкретных обстоятельствах. Нужно выяснить, какую цель вы преследуете. Для вынесения суждения следует задать так называемую функцию вознаграждения, сопоставить положительные и отрицательные результаты конкретных действий, приводящих к конкретным исходам. Промокнуть или нет? Обременять себя тяжелым зонтом или нет?

Предположим, вы хотите не промокнуть и не брать зонт (присваиваете этому варианту рейтинг 10 из 10), а не просто не промокнуть, но лучше возьмете зонт (8 из 10), чем промокнете (однозначно 0; рис. 5.3). Этих данных достаточно для выбора действия.


Рис. 5.3. Брать или не брать зонтик: средняя отдача


С вероятностью дождя 1:4 и суждением о том, чтобы промокнуть или нести зонтик, вы можете просчитать усредненную отдачу от двух вариантов – брать или не брать зонтик. Исходя из этого получается, что лучше его взять (средняя отдача 8), чем оставить (средняя отдача 7,5)[67].

Если таскать с собой зонт совсем неохота (6 из 10), все равно можно вынести суждение о предпочтениях. В случае если вы не захватите с собой зонт, средняя отдача останется прежней (7,5), но, если возьмете, она составит уже 6. Ненавистники зонтиков оставят их дома.

Пример, конечно, пустяковый: понятно, что люди, предпочитающие промокнуть, лишь бы не тащить с собой зонт, оставят его дома. Но такое дерево решений пригодится и для расчета средней отдачи для нетривиальных решений, поскольку суждение в них особенно важно. Здесь действие – взять зонтик, прогноз – дождь или ясно, исход – промокнуть или нет, а суждение – насколько вы будете довольны («отдача») промокнуть или не промокнуть, с зонтиком или без него.

Прогнозы становятся лучше, быстрее и дешевле, мы чаще будем пользоваться ими для принятия решений, поэтому нам понадобится больше человеческих суждений, и, следовательно, их ценность возрастет.

Выводы

• Прогностические машины представляют собой ценность:

• потому что почти всегда дают более точный, быстрый и дешевый прогноз, чем люди;

• прогноз есть ключевая составляющая принятия решений в неопределенности;

• решения принимаются повсеместно в экономической и частной жизни.

• Однако сам по себе прогноз – не решение, а только одна из его составляющих; остальные – суждение, действие, исход и три типа данных (входные, обучающие и обратной связи).

• Разбив решение на составляющие, мы можем проследить влияние прогностических машин на ценность человека и других ресурсов. Ценность аналогов прогностических машин, а именно человеческих прогнозов, будет снижаться. При этом ценность других составляющих, таких как навыки человека в сборе данных, вынесении суждения и совершении действий, будет расти. Лондонские таксисты вложили три года в получение знаний – необходимых для прогноза кратчайшего пути из одной точки в другую в конкретное время суток, – и их профессионализм с появлением прогностических машин никуда не делся. Но и другие водители теперь могут выбирать оптимальный маршрут с помощью прогностических машин. Прогностические навыки таксистов больше не являются дефицитным ресурсом. А навыки вождения и человеческие «датчики» (глаза и уши) были и у других водителей, а сейчас стали эффективнее благодаря прогностическим машинам, что привело к росту конкуренции.

• Суждение заключается в определении относительной отдачи для всех возможных исходов решений, как «верных», так и ошибочных. Суждение представляет собой необходимый этап принятия решений и требует уточнения преследуемой цели. Поскольку прогностические машины выдают все более точные, быстрые и дешевые прогнозы, ценность человеческих суждений будет расти вследствие повышения спроса.

Глава 6. Ценность суждения

С повышением точности прогнозов ценность суждений растет. Ведь информация о вероятности дождя не поможет ничем, если вы точно не знаете, что вам важнее – не промокнуть или не обременять себя зонтиком.

Прогностические машины, в отличие от людей, не способны к суждениям, потому что только человек может сформулировать относительную отдачу от разных действий. Прогноз полностью возлагается на ИИ, поэтому людям для принятия решений реже придется раздумывать одновременно над прогнозом и суждением, и они сосредоточатся только на последнем. Это создаст диалоговый интерфейс между машинным прогнозом и человеческим суждением – аналогично запуску альтернативного запроса в динамической таблице или базе данных.

С повышением точности прогнозов появилось больше возможностей рассмотрения отдачи от действий – иными словами, больше возможностей для суждений. А это значит, что с точными, быстрыми и дешевыми прогнозами нам придется принимать решения чаще.

Суждение о мошенничестве

Сети кредитных карт, такие как MasterСard, Visa и American Express, постоянно прогнозируют и оценивают. Им необходимо прогнозировать, отвечают ли просители кредитных карт их стандартам кредитоспособности. Если нет, то в выдаче кредитной карты будет отказано. Можно подумать, что роль играет только прогноз, но суждение тоже имеет большое значение. Кредитоспособность – понятие растяжимое, и компании приходится взвешивать, какой риск она готова на себя взять с учетом разных процентных ставок и долей невозврата. Такие решения приводят к разработке заметно различающихся бизнес-моделей – от люксовой платиновой карты American Express до базового уровня, ориентированного на студентов.

Компании также необходимо прогнозировать правомерность каждой транзакции. Как и в примере с зонтиком, компания взвешивает четыре отдельных исхода (рис. 6.1).


Рис. 6.1. Четыре исхода для кредитных компаний


Компания прогнозирует, является снятие денег мошенническим или правомерным, далее решает, авторизовать или отклонить транзакцию, а затем оценивает каждый исход (отклонить мошенническую транзакцию – хорошо, разозлить клиента отклонением правомерной транзакции – плохо). Если бы эмитенты кредитных карт идеально прогнозировали мошенничество, все было бы отлично. Но они этого не могут.

Например, у Джошуа Ганса регулярно отклоняют транзакцию при покупке беговых кроссовок – он приобретает их примерно раз в год, обычно в стоковых магазинах и находясь в отпуске. Уже много лет ему приходится звонить в банк для одобрения транзакции.

Кредитные карты чаще всего крадут в торговых центрах, и, как правило, мошенники сразу приобретают одежду и обувь (вещи легко перевести в наличные после возврата в любом магазине сети). И поскольку Джошуа редко покупает одежду и обувь и нечасто посещает торговые центры, банк прогнозирует высокую вероятность кражи кредитки. Это вполне логичное предположение.

Факторы, влияющие на прогноз о том, украдена ли карта, разделяются на общие (вид транзакции, например покупка беговых кроссовок) и частные (в данном случае это возраст и частота покупок). При сочетании факторов алгоритмы, отслеживающие транзакции, усложняются.

ИИ обещает сделать прогнозы гораздо более точными, особенно при наличии одновременно общей и индивидуальной информации. Например, с учетом данных транзакций Джошуа за многие годы прогностическая машина могла бы обнаружить в них закономерности, в том числе ежегодную покупку кроссовок примерно в одно и то же время. И считать эту покупку обычной для конкретного человека, а не классифицировать как подозрительную. Прогностической машине стоило бы учитывать и другие вещи, например, сколько времени потребуется на выбор вещей и покупку, если произошли две транзакции подряд в разных магазинах. Когда прогноз мошеннических транзакций станет точнее, банки смогут с большей уверенностью отклонять их, в некоторых случаях даже не связываясь с клиентом. И это время не за горами. Последняя покупка беговых кроссовок в стоковом магазине прошла у Джошуа без осложнений.

Пока прогностические машины еще совершенствуются в прогнозировании мошенничества, банкам приходится вычислять цену ошибки, что требует суждения. Предположим, что прогноз не идеален и вероятность ошибки равна 10 %. Тогда если компания отклонит транзакцию, то будет права в 90 % случаев и сэкономит издержки по возмещению неавторизованной транзакции. Но существует 10 % вероятности отклонения правомерной транзакции, и в таком случае компания получает недовольного клиента. Для выбора правильных действий необходимо сопоставить издержки по выявлению мошенничества с издержками, связанными с разочарованием клиента. У банков готового ответа на этот вопрос нет. Им следует все взвешивать: это и есть суждение.

Все точно так же, как и в примере с зонтиком, но вместо нести / не нести и промокнуть / не промокнуть на чаше весов мошенничество и удовлетворение клиента. В данном случае, поскольку вероятность мошенничества в девять раз выше, чем правомерной транзакции, компания не отклонит операцию только при условии, что удовлетворение клиента в девять раз важнее возможных издержек.

Что касается мошенничества с кредитными картами, о вариантах отдачи судить достаточно легко. Очень вероятно, что издержки на компенсацию обладают особой денежной ценностью, которую сеть может определить. Предположим, компенсация за транзакцию в $100 составляет $20. Ес

Скачать книгу

Нашим семьям, коллегам, студентам и стартапам, вдохновившим нас всесторонне и глубоко задуматься над искусственным интеллектом

Предисловие партнера

Мое первое знакомство с решениями в области искусственного интеллекта (ИИ) состоялось в далеком 1993 году. На выставке CEBIT в Ганновере исследовательская команда Инновационного центра при Академии наук, который я возглавлял, впервые продемонстрировала работающий алгоритм распознавания рукописных текстов. Несмотря на то что наша экспериментальная установка представляла собой штатив с примотанной к нему изолентой бытовой камерой, наш стенд вызывал неподдельный интерес посетителей. Алгоритм на базе нейронной сети успешно распознавал рукописные цифры независимо от их размера, наклона, толщины линий и графического стиля, приводя в восторг любознательную публику. Тогда все только начиналось, и мы не представляли себе возможностей коммерческого использования этих решений. Только в конце 90-х на основе этого опыта появились первые индустриальные решения для фотовидеофиксации, которые нашли широкое применение в системах безопасности по всему миру.

По оценкам аналитиков, мировой рынок искусственного интеллекта и нейротехнологий к 2025 году превысит 500 млрд долларов США, а размер российского рынка составит около 20 млрд долларов. Многие лидеры стран определили технологии ИИ как важнейший фактор конкурентоспособности. Только за последние три года более чем в двадцати ведущих странах были разработаны национальные стратегии развития ИИ. Россия имеет хорошие шансы занять достойное место среди глобальных лидеров в области ИИ.

Спектр используемых технологий, связанных с ИИ, очень широк. Это и компьютерное зрение, распознавание и синтез речи, системы принятия решений, предиктивная аналитика, машинное обучение и т. п. Уже сегодня сложно представить себе жизнь без систем навигации и голосовых помощников. В ближайшее время не останется банков, которые проводят оценку надежности заемщика вручную, а в недалеком будущем мы будем повсеместно пользоваться услугами автономного транспорта. Технологии ИИ активно вторгаются в наш быт и играют огромную роль в процессе цифровой трансформации бизнеса.

Если ранее стратегический выбор был в первую очередь следствием меняющихся потребительских предпочтений, то сегодня к ключевым драйверам изменений добавились технологии.

Развитие технологий приводит к трансформации бизнес-моделей, а также того, как мы находим своих клиентов, понимаем их потребности и создаем для них ценность: таргетированная реклама, динамические модели ценообразования и системы лояльности, цифровые продукты, переход на сервисные модели и управление жизненным циклом, оптимальный клиентский опыт.

Меняется логика производственных процессов и принятия управленческих решений: роботизированная логистика и производственные системы, оптимальные технологические процессы, сокращение простоев оборудования посредством предиктивной аналитики, минимум потерь вследствие рационального управления ресурсами, а также системы управления рисками и принятия инвестиционных решений, системы мотивации и вознаграждения сотрудников. Все это сегодня уже невозможно без применения решений в области ИИ.

Русский перевод книги «Искусственный интеллект на службе бизнеса» появился очень своевременно. Авторы превзошли себя, описав простым и доступным языком очень сложные понятия, определения и возможные последствия распространения ИИ. Книга включает четыре основных раздела: прогностика, решения, инструменты и стратегия. Очень хорошо структурированное и последовательное описание, изобилующее многочисленными примерами, можно смело назвать библией ИИ. Книга не только описывает, как ИИ повлияет на бизнес, но и позволяет лучше понять, какими будут социальные последствия, как будет меняться роль человека в альянсе с машинами.

Данная книга безусловно полезна для предпринимателей и менеджеров – тех, кто ищет новые возможности для долгосрочной конкурентоспособности бизнеса. Также книга будет полезна для чиновников, отвечающих за формирование стратегической повестки страны или региона. Несмотря на некоторую сложность книги, я бы все-таки рекомендовал ее в качестве учебного пособия для студентов вузов и бизнес-школ.

Александр Идрисов, президент Strategy Partners

Предисловие. Машинный интеллект

Если следующая ситуация вам пока в новинку, скоро вы к ней привыкнете. Ребенок в соседней комнате делает уроки, вы слышите, как он говорит: «Назови столицу Делавэра». Вы погружаетесь в размышления: «Балтимор?.. Нет, это первое, что пришло в голову… Уилмингтон?.. Нет, не столица». Не успели вы продолжить, как «Алекса» дает правильный ответ: «Столица Делавэра – Довер». «Алекса» – искусственный интеллект[1] компании Amazon.сom, она обрабатывает вербальный запрос и молниеносно выдает результат. В глазах ребенка «Алекса» как источник информации заменила всезнающих родителей.

ИИ – повсюду. В наших телефонах, автомобилях, больницах, банках, без него не обходятся покупки, знакомства и электронные СМИ. Понятно, что руководители и вице-президенты компаний, менеджеры, начальники отделов, предприниматели, инвесторы, коучи и политики стремятся узнать о нем как можно больше: они понимают, что скоро ИИ коренным образом изменит всю их деятельность.

Мы наблюдали за преимуществами ИИ втроем: мы – экономисты, добившиеся профессиональных успехов на ниве последнего технологического достижения современности – интернета. Много лет занимаясь исследованиями и научившись отделять зерна от плевел, выявляя истинное значение технологий для руководителей, мы организовали «Лабораторию созидательного разрушения» (ЛСР) – программу для ранних этапов развития бизнеса, повышающую вероятность успеха наукоемких стартапов. Изначально ЛСР предназначалась для любых стартапов, но к 2015 году большинство самых интересных начинаний основывались на ИИ. В сентябре 2017-го ЛСР третий год подряд подтвердила высокую эффективность ИИ-стартапов по сравнению с остальными разработками.

В результате немало стартап-лидеров регулярно приезжали в Торонто для участия в ЛСР. Например, один из основных разработчиков ИИ, лежащего в основе «Алексы», Уильям Танстолл-Пидоу, каждые восемь недель прилетал из Кембриджа в Англию для участия в программе. Как и Барни Пелл из Сан-Франциско, ранее возглавлявший в НАСА команду из 85 человек, которая запустила в космос первый ИИ.

Такого успеха в своей сфере ЛСР добилась отчасти благодаря расположению в Торонто, где зарождалось и развивалось большинство ключевых разработок в области так называемого машинного обучения, способствовавших недавнему всплеску интереса к ИИ. Специалисты, ранее занятые на кафедре IT-наук Университета Торонто, ныне возглавляют команды ведущих мировых компаний ИИ, в том числе в Facebook, Apple и проекте Илона Маска Open AI.

Близость к практическому применению ИИ заставила нас сосредоточиться на том, как данные технологии влияют на стратегии бизнеса. Как вы скоро узнаете, ИИ – это прогностическая технология, а поскольку решения принимаются на основе прогнозов, экономика предоставляет идеальную схему для понимания вариантов выбора, лежащих в основе принятия любого решения. Итак, благодаря везению и некоторым усилиям мы оказались в нужном месте в нужное время, чтобы наладить связь между техническими специалистами и представителями сферы бизнеса. Результатом стала эта книга.

Первоначально ее основная идея заключалась в том, что новая волна ИИ принесла нам не в полной мере разум, а лишь его критическую составляющую – прогнозирование. Когда ребенок произнес запрос, «Алекса» преобразовала звуки в слова и спрогнозировала, какая информация им соответствует. «Алекса» «не знает» столицу Делавэра, но способна спрогнозировать, что в ответ на такой запрос люди получат конкретный ответ: «Довер».

Каждый стартап в нашей лаборатории базируется на преимуществах улучшенного прогнозирования. Компания Deep Genomics сделала шаг вперед в медицине, предполагая, какие процессы начнутся в клетке после изменений в последовательности ДНК. Компания Chisel усовершенствовала правовую практику прогнозом, какая именно часть документа подлежит редактированию. Компания Validere повысила эффективность нефтедобычи, рассчитав процент содержания влаги в поступающем на переработку и хранение сырье. Все это – лишь малый перечень всех возможностей применения, которые появятся в бизнесе в ближайшем будущем.

Если вы плохо представляете, что значит ИИ для вас, мы поможем вам понять все его возможности и сориентироваться в преимуществах технологии, даже если вы ни разу не программировали свёрточную нейронную сеть и не изучали байесовскую статистику[2].

Руководителям бизнеса мы объясним влияние ИИ на управление и принятие решений. Студентам и недавним выпускникам дадим пищу для размышлений о перспективах развития трудовой деятельности и карьеры. Финансовым аналитикам и венчурным инвесторам предложим схему, на основании которой они разработают инвестиционные декларации. Политикам предоставим примерный план изменений общества с помощью ИИ, обсудим, какие меры можно предпринять, с тем чтобы перемены оказались к лучшему.

Экономика представляет собой надежную основу для понимания неопределенности и ее роли в принятии решений. Поскольку качественное прогнозирование снижает неопределенность, мы объясним в терминах экономики значение ИИ для принятия решений по развитию бизнеса, что, в свою очередь, даст представление о том, какие инструменты с наибольшей вероятностью помогут максимизировать прибыль от рабочих бизнес-процессов. Это приведет нас к схеме разработки новых стратегий – например, изменения масштаба и диапазона бизнеса для применения новых экономических реалий, проистекающих из удешевления прогнозов. И, наконец, мы изложим основные плюсы и минусы влияния ИИ на трудовую деятельность, концентрацию корпоративной власти, конфиденциальность и геополитику.

Какие прогнозы важны для вашего бизнеса? Как дальнейшее развитие ИИ повлияет на предположения, из которых вы исходите? Как изменятся рабочие места в вашей сфере деятельности с развитием прогностических технологий, что уже происходило с появлением ПК и интернета? ИИ – это новая и еще не до конца понятая технология, но существуют надежные инструменты экономики по оценке возможных последствий удешевления прогностики, хотя приводимые нами примеры, без сомнения, когда-нибудь устареют, в отличие от предложенной схемы. Идеи сохранят свою эффективность и с развитием технологий, и с повышением точности и сложности прогнозов.

Наша книга не предлагает рецептов успеха в экономике ИИ – напротив, мы подчеркиваем его преимущества и недостатки. Чем больше данных, тем меньше конфиденциальность; чем выше скорость, тем ниже точность; чем больше независимости – тем слабее контроль. Мы не предлагаем рекомендаций для выработки оптимальной бизнес-стратегии: это ваша забота. Лучшая стратегия для компании, карьеры или страны зависит от вашей оценки соотношения плюсов и минусов. Мы разработали схему определения ключевых преимуществ и недостатков, а также способы оценки всех «за» и «против» для оптимального решения какой-либо задачи. Разумеется, даже располагая нашей схемой, вы заметите, что все меняется очень быстро и вам придется действовать, не обладая исчерпывающей информацией, но, как правило, это все же лучше пассивности.

Выводы

• Новая волна ИИ принесла нам не в полной мере разум, а лишь его критическую составляющую – прогнозирование.

• Любое решение по большей части зависит от прогнозов. В экономике наработаны схемы принятия решений. Новые и не совсем понятные последствия развития прогностических технологий можно объединить с проверенной логикой экономической теории принятия решений и вывести ряд идей, помогающих сориентироваться в том, как применить ИИ в вашей организации.

• Единственного верного ответа на вопрос о том, какая стратегия или инструменты ИИ оптимальны, не существует, потому что неизбежно придется искать компромисс: больше скорость – ниже точность, больше независимости – слабее контроль, больше данных – меньше конфиденциальности. Мы предлагаем метод определения благоприятных и неблагоприятных последствий принятия связанных с ИИ решений, чтобы вы оценили потенциальную выгоду и потери в свете миссии и целей организации, а затем нашли оптимальный для вашего бизнеса вариант.

Дешевизна меняет все

Каждый человек уже соприкасался с ИИ либо очень скоро откроет его для себя. Мы привыкли к регулярным сообщениям в СМИ о новых технологиях, изменяющих нашу жизнь. Технофилы предвкушают возможности будущего, технофобы горюют о старых добрых временах. Впрочем, все уже привыкли к бомбардировке технологическими новостями и, не задумываясь, повторяют: «Единственное, что остается неподвластным переменам, – это сами перемены». Пока не сталкиваются с ИИ. И тогда понимают, как эта технология отличается от остальных.

Некоторые IT-специалисты впервые оценили потенциал ИИ в 2012 году, когда команда студентов Университета Торонто одержала триумфальную победу на ежегодных соревнованиях по распознаванию визуальных образов ImageNet (Large Scale Visual Recognition Challenge). В последующие годы все финалисты ImageNet использовали новаторский для того времени подход «глубокого обучения»: распознавание объектов – не просто игра, оно наделяет машину «зрением».

Ряд руководителей технологических компаний увидели новые возможности ИИ, узнав о том, что в 2014 году Google приобрела британскую компанию DeepMind за более чем $600 млн, несмотря на ничтожный по сравнению с этой суммой доход. Крупнейшая сделка состоялась только потому, что DeepMind продемонстрировала свой ИИ, который научился – самостоятельно, без всякого программирования – играть в некоторые видеоигры Atari со сверхчеловеческой эффективностью.

Всемирно известной новостью ИИ стал в том же 2014 году благодаря решительному заявлению знаменитого физика Стивена Хокинга: «Все в нашей цивилизации является продуктом человеческого интеллекта… и создание искусственного интеллекта стало бы крупнейшим событием в истории человечества»[3].

Кто-то другой осознал грандиозность ИИ, впервые отпустив руль едущей «Теслы», управляемой автопилотом.

В Китае откровением стал момент, когда AlphaGo – ИИ DeepMind – выиграл у Ли Седоля, корейского профессионального игрока в го, а позднее в том же году победил лучшего китайского игрока Кэ Цзе. «Нью-Йорк Таймс» назвала эту игру «моментом Спутника»[4] для Китая[5]. Как после запуска спутника в СССР в Америке вложили огромные средства в науку, так и Китай отреагировал национальной стратегией повсеместного распространения ИИ к 2030 году и внушительным финансированием осуществления этого плана.

В своей компании мы осознали значимость ИИ в 2012 году, когда в ЛСР сначала обратились несколько стартапов, применяющих ультрасовременные методики машинного обучения, а затем они хлынули потоком. Обращения следовали почти из всех сфер: исследовательской фармакологии, клиентского обслуживания, производства, контроля качества, розничных продаж, медицинской техники. Технологии были мощными, широко применимыми, обещали заметное повышение эффективности. Понимая их экономическую ценность, мы углубились в работу. Мы знали, что ИИ будет развиваться в той же экономике, что и остальные технологии.

Говоря проще, технология сама по себе потрясающая. Как метко сказал знаменитый венчурный инвестор Стив Джурвертсон: «Почти каждый продукт, который в ближайшие пять лет покажется волшебством, наверняка будет построен на этих же алгоритмах»[6]. Джурвертсон назвал ИИ «волшебством», что перекликается с распространенным сюжетом таких фильмов, как «2001 год: Космическая одиссея», «Звездные войны», «Бегущий по лезвию», и недавних «Она», «Превосходство» и «Из машины».

Мы согласны с Джурвертсоном: это действительно волшебство. И наша задача как экономистов состоит в том, чтобы воплотить волшебство ИИ в простой, понятной и практичной форме.

Отделить зерна от плевел

Экономисты смотрят на мир иначе, чем большинство людей. Мы воспринимаем все относительно схемы, управляемой такими силами, как спрос и предложение, производство и потребление, цена и издержки. Иногда экономисты расходятся во мнениях, но всегда действуют в рамках общей схемы. Мы оспариваем допущения и интерпретации, не сомневаясь в фундаментальных понятиях вроде роли дефицита и конкуренции в регулировании цен. Такой подход дает нам уникальную позицию наблюдателей, что можно отнести к плюсам нашей профессии. Минус же состоит в том, что наша точка зрения суха и бесстрастна, поэтому нас не очень жалуют на званых вечеринках. Тем не менее она добавляет ясности в принятии деловых решений.

Начнем с азов – цен. Когда снижается цена на какой-либо предмет, товар или услугу, спрос немедленно повышается. Более дешевые вещи покупают чаще. Так действует простейшая экономика, именно это сейчас и происходит с ИИ. Он повсюду: встроен в приложения для телефона, оптимизирует сети электроснабжения и заменил управляющего вашим портфелем акций. Скоро он будет возить вас по городу и прилетать к двери вашего дома с посылками.

Экономисты лучше всех умеют отделять зерна от плевел. Где другие замечают трансформационные инновации, мы видим всего лишь снижение цен. Но не все так просто. Чтобы понять влияние ИИ на вашу организацию, следует точно знать, как изменилась цена и как это отразится на экономической ситуации в целом. Только после этого можно приступать к разработке плана действий. История экономики учит, что последствия крупных инноваций часто проявляются в самых неожиданных местах.

Вспомним пример 1995 года из коммерческого интернета. Тогда очень многие смотрели сериал Seinfeld, а Microsoft выпустила Windows 95 – первую многозадачную операционную систему. В том же году правительство США отменило все ограничения на коммерческий трафик в интернете, и Netscape – изобретатель интернет-браузера – отпраздновала первое публичное размещение (IPO) в данном сегменте.

Так и произошел перелом в сфере IT, когда интернет из технологической диковины превратился в коммерческую приливную волну, омывающую экономику.

Первое публичное размещение Netscape оценивалось более чем в $3 млрд, хотя не принесло существенной прибыли. Венчурные инвесторы оценивали стартапы в миллионах, даже если они были (используем возникший тогда термин) «преддоходными». Новоиспеченные выпускники МБА отказывались от прибыльных традиционных профессий ради заработка в интернете. Когда влияние интернета начало распространяться на все сферы вверх и вниз по цепи издержек, проповедники технологий стали называть его «новой экономикой» вместо «новой технологии». Термин прижился. Интернет вышел за технологические границы и проник в человеческую деятельность на фундаментальном уровне. Политики, руководители, инвесторы, предприниматели и крупные СМИ ввели термин в широкое употребление. Все кому не лень называли интернет новой экономикой, за исключением экономистов.

Мы не видели ни новой экономики, ни новых экономистов. Для нас это была все та же старая экономика. Хотя следует признать, что ряд важных изменений все же произошел. Появилась возможность распространять через интернет товары и услуги. Коммуникации упростились. Информацию теперь получали, просто нажав на кнопку «поиск». Но все это было доступно и раньше – разница лишь в том, что снизилась цена. Расцвет интернета ознаменовал падение цен на распределение, коммуникацию и поиск. Чтобы понять последствия для бизнеса, необходимо оценить результаты технологического развития, заключающиеся в переходе от дорогостоящего к дешевому или от дефицита к изобилию. К примеру, вспомните, когда вы впервые использовали Google, – новоприобретенная способность мгновенно, словно по волшебству, получать нужную информацию завораживала. С экономической же точки зрения Google удешевила поиск. И в результате компании, зарабатывавшие на продаже информации другими средствами (справочники, турагентства, рекламные издания), потеряли конкурентное преимущество. В то же время компании, которым требовалось, чтобы их нашли, – самодеятельные авторы, продавцы коллекционных товаров и доморощенные режиссеры – процветали.

Изменение относительных издержек определенной деятельности радикально повлияло на ряд бизнес-моделей и даже преобразовало некоторые сферы. Однако законы экономики остались прежними: мы еще могли рассматривать все что угодно с точки зрения спроса и предложения, разрабатывать стратегии, устанавливать политику и предвидеть будущее с помощью стандартных законов экономики.

«Дешево» значит «повсеместно»

Когда цена на что-то внезапно и существенно падает, может измениться целый мир. Возьмем, к примеру, свет. Не исключено, что вы читаете эту книгу при искусственном освещении. И более того, включая свет, вы, скорее всего, никогда не подсчитывали, во сколько вам обойдется чтение. Электричество настолько дешево, что им пользуются, не задумываясь. Однако, согласно подробному исследованию экономиста Уильяма Нордхауса, в начале XIX века освещение стоило в сотню раз дороже[7]. Всего два века назад вы сто раз подумали бы, прежде чем читать при свете. Падение цен на электричество осветило мир. Ночь легко превращалась в день, стало возможным жить и работать в больших зданиях, куда не проникал естественный свет. Практически ничего из того, что мы имеем сейчас, не существовало бы без мизерной платы за электричество.

С технологическими новшествами удешевляется все. С изменением цены за бытовое электричество изменилось и наше поведение – от раздумий, стоит ли включать свет, к бездумному щелчку выключателем. Существенное падение цен дает шанс делать то, что мы не делали раньше; невозможное становится возможным. И неудивительно, что экономисты озабочены последствиями грандиозного падения цен на такие фундаментальные результаты прогресса, как свет.

Одни последствия дешевизны света были более предсказуемы, другие – менее. Не всегда полностью очевидно, на что именно повлияет падение цены вследствие появления новых технологий, будь то искусственное освещение, паровые машины, автомобили или вычисления.

Тим Бреснахан, экономист из Стэнфорда и один из наших наставников, подчеркивал, что компьютеры выполняют расчеты, и ничего более. Распространение и коммерциализация компьютеров понизили стоимость вычислений[8]. Теперь мы не только чаще используем их для обычных расчетов, но и применяем новую, дешевую арифметику в сферах, традиционно не связываемых с ней, например в музыке.

Ада Лавлейс, которая считается первым программистом, раньше всех разглядела эти возможности. Работая при дорогостоящем освещении в начале XIX века, она написала первую программу расчета последовательности чисел (называемых «числами Бернулли») для компьютера, разработанного Чарльзом Бэббиджем тогда еще в теории. Бэббидж тоже был экономистом, и, как вы узнаете из нашей книги, это не единственный случай пересечения экономики и IT-дисциплин. Лавлейс понимала, что арифметика может, выражаясь современным жаргоном стартапов, «масштабироваться» и содержит огромный потенциал. Ада догадывалась, что возможности компьютеров не сводятся к арифметическим операциям: «Если предположить, например, что фундаментальные соотношения тонов звукоряда в гармонии и музыкальной композиции можно выразить и адаптировать в таком виде, то машина могла бы сочинять затейливые и искусные музыкальные произведения любой степени сложности»[9]. Никаких компьютеров тогда и в помине не было, но Лавлейс предполагала, что вычислительные машины могут хранить и воспроизводить музыку – форму искусства, повлиявшую на все его остальные жанры и человечество в целом.

Так и произошло. Когда полтора века спустя цена на расчеты опустилась достаточно низко, арифметике нашлось столько применений, сколько никому и не снилось. Она внесла такой важный вклад во множество сфер деловой и обычной жизни, что с ее удешевлением мир, как это уже бывало, преобразился. Если свести что-либо к чистым издержкам, легко отделить зерна от плевел, хотя это и не самый увлекательный способ поведать о новейших передовых технологиях. Стив Джобс никогда не анонсировал выпуск «счетной машины», хотя только ими всю жизнь и занимался. Новые счетные машины Джобса имели успех, потому что снижали цену на что-то значимое.

Это возвращает нас к ИИ. Для экономики он имеет огромное значение именно потому, что удешевит что-то важное. Сейчас вы, вероятно, думаете об интеллекте, логических рассуждениях и мышлении вообще. А может, представляете себя среди роботов или бестелесных существ, таких как дружелюбные компьютеры из фильма «Звездный путь», которые избавят вас от необходимости думать. У Лавлейс было похожее предположение, но она быстро от него отказалась. Во всяком случае в отношении компьютеров она писала, что «у них нет никаких притязаний к созиданию. Они могут только то, что умеем мы. Они способны следовать порядку расчетов, но не обладают возможностью предвосхищать аналитические соотношения или истины»[10].

Несмотря на ажиотаж вокруг ИИ, «возражения леди Лавлейс», как позднее назвал их Алан Тьюринг[11], все еще актуальны. Компьютеры пока не умеют думать, так что мысли подешевеют нескоро. Однако цена снизится на нечто настолько привычное и повсеместно используемое (как и арифметика), что никто, скорее всего, еще не догадывается, насколько удешевление повлияет на нашу жизнь и экономику.

Что же подешевеет благодаря ИИ? Ответим: прогнозы. Следовательно, согласно законам экономики, мы не только станем чаще пользоваться ими, но и начнем применять в самых неожиданных областях нашей жизни.

Дешевизна создает преимущества

Прогнозирование (или прогностика) – это процесс заполнения информационных пробелов. Берется имеющаяся информация, называемая данными, и из нее выводится отсутствующая информация. В многочисленных обсуждениях ИИ акцентируется разнообразие прогностических методов с непонятными названиями: классификация, кластеризация, регрессия, дерево решений, байесовское оценивание, нейронные сети, топологический анализ данных, глубокое обучение, стимулированное обучение, глубокое стимулированное обучение, капсульные сети и т. д. Специалисты используют для внедрения ИИ соответствующие конкретной прогностической задаче способы.

В книге мы избавим вас от математики, лежащей в основе этих методов. Хотим лишний раз подчеркнуть, что все они касаются прогностики: использования имеющейся информации для генерации отсутствующей. Мы поможем вам определить, в каких ситуациях необходимо иметь прогноз и как получить от него максимальную выгоду.

Удешевление прогностики ведет к ее распространению. Снова элементарная экономика в действии: мы покупаем больше товаров или услуг, если цены на них падают. Например, когда в 1960-е годы зарождалась компьютерная индустрия, цена на арифметику начала быстро снижаться, и там, где она была уже востребована, к ней обращались чаще – например, в Бюро переписи населения США, Министерстве обороны США, НАСА (что отображено в фильме 2016 года «Скрытые фигуры»). Позднее новая, дешевая арифметика нашла применение в сферах, к которым прежде не имела отношения, – таких как фотография. Когда-то фотоновинки разрабатывались благодаря химии, но с удешевлением арифметики появилось и соответствующее решение – цифровые камеры. Цифровой снимок представляет собой всего лишь последовательность нулей и единиц, посредством арифметики преобразуемую в визуальное изображение.

То же касается и прогнозов. Они используются в привычных задачах: управлении ресурсами и прогнозировании спроса, – но благодаря удешевлению все чаще применяются в сферах, не относящихся к прогностике. Кэтрин Хауи из Integrate.ai призывает переформулировать любую проблему в контексте прогностики, и современные инженеры всего мира все чаще так и поступают. Беспилотный транспорт существует в управляемой среде уже больше двадцати лет, однако функционировал он при наличии подробных планов этажей на заводах и складах. С поэтажным планом разработчики программировали своих роботов двигаться согласно логической схеме «если, то»: если перед роботом находится человек, то следует команда «стоп». Если полка пуста, то нужно двигаться к следующей. Обычные улицы оставались для роботов недоступными – в городском пространстве может случиться все что угодно – слишком много возникает условий «если, то», всего не предусмотреть.

Беспилотный транспорт не будет работать вне полностью предсказуемой и контролируемой среды до тех пор, пока инженеры не переформулируют проблему навигации в прогностическую. Они уже поняли, что вместо того, чтобы просчитывать для машины действия во всех возможных обстоятельствах, необходимо поставить одну прогностическую задачу: что сделал бы человек? И сейчас компании вкладывают миллиарды долларов в обучение машин беспилотному передвижению в неконтролируемой среде, в том числе на городских улицах и шоссе.

Представьте ИИ сидящим в автомобиле рядом с водителем. Человек проезжает миллионы километров, получает зрительную и звуковую информацию из окружающей среды, обрабатывает ее мозгом и реагирует соответственно: едет прямо или сворачивает, тормозит или разгоняется. Инженеры оснастили ИИ собственными глазами и ушами – датчиками (камерами, радарами, лазерами). Таким образом ИИ собирает поступающие к нему со всех сторон данные, пока человек управляет автомобилем, и одновременно регистрирует реакцию водителя. При совокупности конкретных данных человек поворачивает направо, тормозит или нажимает на газ. Чем дольше ИИ наблюдает за водителем, тем лучше предсказывает его действия, исходя из поступающих данных. ИИ учится водить машину, прогнозируя, как поступил бы человек в соответствующих обстоятельствах.

И вот что самое главное: когда такая важная вводная, как прогноз, дешевеет, возрастает ценность других вещей. Экономисты называют их «дополняющими факторами». Как падение цены на кофе повысило ценность сахара и сливок, так для беспилотных автомобилей падение цены прогноза повышает ценность датчиков сбора данных окружающей среды. Например, в 2015 году Intel заплатила больше $15 млрд за израильский стартап Mobileye, в первую очередь за технологию сбора данных, позволяющую транспортному средству эффективно распознавать объекты (дорожные знаки, людей и т. д.) и разметку (на улицах и дорогах).

Дешевея, прогностика станет использоваться чаще, возрастет количество дополняющих ее факторов: данные базовые экономические силы приводят в действие новые возможности, создаваемые прогностическими машинами. На элементарном уровне они снимут с человека задачи прогнозирования и таким образом снизят издержки. По мере распространения машин прогностика изменит и улучшит качество принятия решений. Но в какой-то момент прогностические машины, вероятно, станут столь точными и надежными, что изменят и деятельность организаций. Некоторые ИИ настолько заметно повлияют на деловую экономику, что перестанут использоваться только для повышения продуктивности в соответствии со стратегией; они изменят саму стратегию.

От дешевизны к стратегии

Руководители постоянно спрашивают нас: «Как ИИ повлияет на нашу стратегию бизнеса?» Проведем для ответа мысленный эксперимент. Большинство людей делали покупки на Amazon. Как и в остальных онлайн-магазинах, вы открываете сайт, находите нужные вещи, кладете их в корзину, оплачиваете и затем получаете по почте. Сейчас модель Amazon такова: «покупка – затем доставка».

Когда вы заходите на сайт, ИИ Amazon прогнозирует, что вы хотели бы купить, и предлагает соответствующие товары. Это целесообразный труд, однако его результаты далеки от идеала. В нашем случае точность прогнозов не превышает 5 %. И мы заказываем одну из множества рекомендуемых вещей. С учетом миллионного ассортимента это совсем не плохо!

Представьте, что ИИ Amazon собрал больше информации о нас и использует ее для улучшения качества прогнозов, – это усовершенствование сравнимо с поворотом регулятора громкости на колонках, только вместо звука регулируется точность прогнозов.

В определенный момент поворота ручки точность прогнозов ИИ достигает порогового значения и меняет бизнес-модель Amazon. Прогнозы становятся настолько точными, что компании выгоднее присылать вам товары, которые вы предположительно захотите купить, чем ждать, пока вы закажете их на сайте.

В таком случае другие магазины вам уже не нужны, а каждая покупка будет стимулировать следующую. Amazon получит основную долю содержимого вашего кошелька. Очевидно, что это выгодно Amazon, но также удобно и вам. Магазин доставляет покупки до того, как вы их совершили, и таким образом избавляет вас от траты времени на шопинг. С поворотом регулятора точности на максимум бизнес-модель Amazon меняется с «покупка – затем доставка» на «доставка – затем покупка».

Разумеется, покупатели не захотят возиться с возвратом нежелательных товаров. Поэтому Amazon вложится в отладку этого процесса – скажем, раз в неделю служба доставки будет собирать невостребованные посылки[12].

Но если такая бизнес-модель лучше, почему Amazon до сих пор ее не внедрил? Дело в том, что сегодня издержки сбора и обработки возвратов перевешивают рост дохода от основной доли кошелька. Например, сейчас мы вернули бы 95 % доставленных товаров. Это трудоемко для нас и затратно для Amazon. Для освоения новой бизнес-модели прогнозы пока еще недостаточно точны.

Возможен иной вариант: Amazon обращается к новой стратегии до того, как точность прогнозов достигнет качественного уровня, исходя из предположения, что однажды это принесет выгоду. Благодаря раннему запуску ИИ соберет больше данных за короткий срок и усовершенствуется. В Amazon понимают, что чем раньше они стартуют, тем сложнее будет конкурентам их нагнать. Качественный прогноз привлечет больше покупателей, что увеличит объем данных для обучения ИИ и, в свою очередь, приведет к повышению качества прогнозов, а далее этот цикл неоднократно повторится. Раннее внедрение обойдется дорого, но опоздание может стать роковым[13].

Мы не утверждаем, что Amazon будет или должен внедрять такую практику, хотя для скептиков у нас есть неожиданная новость: в 2013 году Amazon получил патент США на «опережающую доставку»[14]. Несомненно, вращение регулятора точности прогнозов коренным образом повлияет на стратегию. В данном примере оно меняет бизнес-модель Amazon с «покупка – затем доставка» на «доставка – затем покупка», создает стимул для вертикальной интеграции посредством организации услуги по возврату товаров (в том числе грузового автопарка) и ускоряет процесс инвестирования. И все это вследствие поворота регулятора точности прогностической машины.

Что это означает для стратегии? Во-первых, необходимо инвестировать в сбор информации относительно того, как быстро и насколько высоко вырастет точность прогнозов в вашем и в смежных секторах. Во-вторых, разработка тезиса о стратегических возможностях, образовавшихся в результате вращения регулятора точности, потребует финансовых вложений.

Чтобы начать «научное фантазирование», закройте глаза, мысленно возьмитесь за регулятор прогностической машины и, следуя бессмертным словам члена группы Spinal Tap[15], поверните его на 11 часов.

План книги

Прежде всего необходимо построить фундамент для стратегического внедрения прогностических машин в своей организации. Именно так мы структурировали книгу – возводили пирамиду от основания.

В части I мы заложим фундамент и объясним, как машинное обучение повышает качество прогнозов. Затем разберемся, чем новые преимущества отличаются от статистики, которой вас учили или которой уже занимаются ваши аналитики. Далее мы затронем ключевые дополняющие факторы прогнозов – данные, особенно те, что необходимы для качественной прогностики, – и расскажем, как убедиться, что они у вас есть. И в завершение рассмотрим, когда прогностические машины работают эффективнее человека и в каких случаях людям и машинам целесообразно объединить усилия для получения максимально точных прогнозов.

В части II мы опишем роль прогнозов в качестве вводных для принятия решений и объясним значение еще одной составляющей, пока недооцененной в сфере ИИ, – суждений. Прогнозы помогают принимать решения, снижая неопределенность, а суждения определяют ценность. В экономической терминологии суждением называется определение окупаемости, целесообразности, дохода и прибыли. Самое значительное свойство прогностических машин состоит в том, что они повышают ценность суждения.

В части III перейдем к практике. Прогностические машины оснащены инструментами ИИ в соответствии с конкретными задачами. Мы опишем шаги, помогающие определить, когда создание (или покупка) инструментов ИИ максимально повысит доход. Иногда такие инструменты идеально укладываются в рабочий процесс, но бывает, что побуждают изменить его. Также мы познакомим вас с важным подспорьем для уточнения ключевых требований к инструментам – «шаблоном ИИ».

В части IV вернемся к стратегии. Как в описанном нами эксперименте с Amazon, иногда ИИ настолько масштабно влияет на экономику задачи, что преобразует компанию или промышленность. Тогда он становится краеугольным камнем стратегии организации. В результате воздействия на стратегию ИИ переключает на себя внимание высшего руководства помимо менеджеров продукта и инженеров.

Как правило, заранее предусмотреть степень влияния ИИ на стратегию нельзя. Например, немногие, опробовав инструменты поиска Google, предсказывали, что они преобразуют медиаиндустрию и лягут в основу самых успешных компаний планеты.

Помимо возможностей получения прибыли ИИ несет системные риски, способные повлиять на бизнес. Все сосредоточены на рисках ИИ для человечества, но мало кто обращает внимание на опасность ИИ для организаций. К примеру, некоторые прогностические машины, обучаемые на полученных от человека данных, заодно усваивают ненужные отклонения и стереотипы.

Книгу завершает часть V, в которой мы отвечаем на вопросы о широком влиянии ИИ на общество и касаемся пяти основных спорных тем.

1. Сохранятся ли рабочие места? Ответим: да.

2. Усугубится ли проблема неравенства? Вероятно.

3. Будут ли несколько крупнейших компаний контролировать весь мир? Зависит от обстоятельств.

4. Страны погрузятся в политику «гонки уступок», лишат нас приватности и безопасности ради конкурентного преимущества отечественных компаний? Некоторые – да.

5. Наступит ли конец света? До него достаточно времени, чтобы успеть с пользой применить полученную информацию.

Выводы

• Экономика предлагает четкое представление о влиянии удешевления прогнозов на бизнес. Прогностические машины будут использоваться как для традиционных (управление ресурсами и прогнозирование спроса), так и для новых задач. Падение цен на прогнозы повлияет на ценность других понятий и предметов, повысит ценность дополняющих факторов (данных, суждения и действий) и снизит ценность эквивалентов (человеческого прогноза).

• Организации могут использовать прогностические машины, внедряя инструменты ИИ с целью выполнения текущей стратегии. Когда инструменты станут мощнее, они изменят саму стратегию. Например, если Amazon сможет прогнозировать желания покупателей, то перейдет с модели «покупка – затем доставка» на модель «доставка – затем покупка» – будет доставлять товары до размещения заказов. Такой переход преобразит организацию.

• В результате новых стратегий, разработанных с учетом преимуществ ИИ, мы встанем перед фактом его влияния на общество. Наш выбор будет зависеть от потребностей и предпочтений и наверняка в разных странах и культурах окажется разным. Мы разделили книгу на пять частей в соответствии с уровнями влияния ИИ и от основы пирамиды – прогнозов – начнем подниматься выше: прогностика, принятие решений, инструменты, стратегия и общество.

Часть I. Прогностика

Глава 1. Волшебство прогностических машин

Что общего у Гарри Поттера, Белоснежки и Макбета? Их действиями движет пророчество, то есть прогноз. Даже сюжет «Матрицы», вроде бы описывающий прогностические машины, построен на вере персонажей в предсказание. Везде, от религии до сказок, знание будущего имеет решающее значение. Предсказания влияют на наше поведение и принятие решений.

Древние греки чтили своих многочисленных оракулов за пророческие способности, но их предсказания иногда бывали такими туманными, что сбивали с толку вопрошающих. Например, однажды царь Лидии Крез задумал рискованный штурм Персидской империи. И поскольку не доверял полностью ни одному оракулу, решил проверить каждого, прежде чем просить совета о нападении на Персию. Ко всем оракулам он разослал гонцов. На сотый день они должны были спросить, что Крез делает прямо сейчас. Ближе всех к истине оказался оракул из Дельф, поэтому царь обратился за пророчеством к нему[16].

Как и в примере с Крезом, прогноз может касаться и настоящего. Мы предполагаем, правомерная или мошенническая операция проводится по кредитной карте, злокачественная опухоль на снимке или доброкачественная, в камеру телефона смотрит владелец iPhone или посторонний человек.

Слово «прогноз» происходит от греческого слова πρόγνωσις, буквально означающего «предузнавание» (то есть знание того, что произойдет), но в современном понимании это скорее способность видеть скрытую информацию как в будущем, так и в прошлом и настоящем. Наверное, самый известный символ магического предсказания – хрустальный шар. И хотя в нашем представлении он связан с гадалками, обещающими финансовое процветание или успех в любви, в книге Фрэнка Баума «Волшебник страны Оз» Дороти с его помощью видит, что делает ее тетя Эм в настоящем. Все это приводит нас к определению прогностики.

Волшебство прогностики

Несколько лет назад Ави Голдфарб обнаружил, что в казино Лас-Вегаса с его кредитной карты снята крупная сумма. Но он в это время был совершенно в другом месте. А в Лас-Вегас ездил лишь однажды и очень давно – азартные игры не вписываются в его экономическое мировоззрение. После продолжительных переговоров банк отменил транзакцию и выдал новую карту.

Недавно неприятность повторилась. Кто-то снова сделал покупку по кредитной карте Ави. Но на этот раз он даже не успел увидеть транзакцию, так что ему не пришлось сто раз описывать ситуацию вежливому, но строгому сотруднику службы поддержки. Ави сообщили по телефону о подозрительной операции по карте и что уже выслали новую по почте.

Банк совершенно правильно заключил, исходя из потребительских привычек Ави и тонны другой информации, что транзакция мошенническая. И был настолько уверен в этом, что даже не стал блокировать карту до выяснения обстоятельств.

Вместо этого у Ави, как по волшебству, появилась другая карта, для чего он и пальцем не шевельнул. Конечно, хрустального шара у банка нет, но есть данные и надежная предсказательная модель: прогностическая машина. Повышение качества прогнозов позволило снизить риск мошенничества и одновременно, как выразился президент MasterСard по вопросам безопасности Аджай Бхалла, «избавить клиентов от ошибочного отклонения транзакций»[17].

В сфере бизнеса применение прогностики полностью соответствует ее определению как процесса заполнения информационных пробелов. Эмитентам необходимо знать, не была ли недавняя транзакция мошеннической. Для прогноза по конкретной операции используются данные о совершенных мошеннических (и правомерных) переводах денежных средств. В случае подтверждения неправомерности эмитент может заблокировать карту, а если прогноз сделан достаточно быстро, то успеет отменить и текущую транзакцию.

Данный принцип – когда из имеющейся информации выводится отсутствующая – положен в основу главных современных достижений ИИ в области перевода. Об этой цели говорилось еще в предании тысячелетней давности о Вавилонской башне; цивилизация шла к ней на протяжении всей своей истории. Раньше для разработки автоматических переводчиков нанимали лингвиста (владеющего каким-либо конкретным языком), чтобы он изложил грамматические правила в приемлемой для программирования форме[18]

1 Искусственный интеллект здесь и далее по тексту сокращенно обозначается ИИ (англ. – AI). Прим. ред.
2 Статистика Байеса – статистическая модель, предполагающая обновление сложившихся представлений в свете полученного опыта. Прим. ред.
3 Hawking, St., Russell, St., Tegmark, M., Wilczek, F. Stephen Hawking: «Transcendence Looks at the Implications of Artificial Intelligence – But Are We Taking AI Seriously Enough?» // The Independent. 2014. May 1 // http://www.independent.co.uk/news/science/stephen-hawkingtranscendence-looks-at-the-implications-of-artificial-intelligence-but-are-wetaking-9313474.html.
4 Момент Спутника – момент осознания обществом, насколько оно отстает от другой страны в технических и научных достижениях. Назван по прецеденту 1957 года, то есть реакции США на запуск СССР в космос первого искусственного спутника Земли. Прим. перев.
5 Mozur, P. Beijing Wants A. I. to Be Made in China by 2030 // The New York Times. 2017. July 20 // https://www.nytimes.com/2017/07/20/business/chinaartificial-intelligence.html?mcubz=0&_r=0/.
6 Jurvetson, St. Intelligence Inside // Medium. 2016. August 9 / https://medium.com/@DFJvc/intelligence-inside-54dcad8c4a3e/.
7 Nordhaus, W. D. Do Real-Output and Real-Wage Measures Capture Reality? The History of Lighting Suggests Not. – Yale University: Cowles Foundation for Research in Economics, 1998 // https://lucept.files.wordpress.com/2014/11/william-nordhaus-the-cost-of-light.pdf.
8 Часть долговременной тенденции по снижению стоимости вычислений; см. Nordhaus, W. D. Two Centuries of Productivity Growth in Computing // Journal of Economic History. 2007. Vol. 67/1. P. 28–159.
9 Lovelace, cit. in Isaacson, W. The Innovators: How a Group of Hackers, Geniuses, and Geeks Created the Digital Revolution. NY: Simon & Schuster, 2014. P. 27.
10 Lovelace, cit. in Isaacson, W. The Innovators: How a Group of Hackers, Geniuses, and Geeks Created the Digital Revolution. NY: Simon & Schuster, 2014. P. 27.
11 Тьюринг Алан (Alan Mathison Turing; 1912–1954) – английский математик, логик, криптограф, оказавший существенное влияние на развитие информатики. Предложил эмпирический тест Тьюринга для оценки ИИ компьютера. В честь ученого названа премия Тьюринга – самая престижная в мире награда в области информатики. Прим. ред.
12 Amazon уже работает над потенциальными проблемами безопасности по этому плану. В 2017 году она запустила Amazon Key – систему, позволяющую доставщикам открыть входную дверь клиента и оставить посылку внутри помещения. Происходящее записывается на видеокамеру для контроля.
13 Любопытно отметить, что некоторые стартапы уже мыслят в этом направлении. Stitch Fix использует машинное обучение для прогнозирования, какая одежда понравится пользователям, и отправляет им посылку. Затем нежелательные вещи возвращают. В 2017 году Stitch Fix успешно провел первичное публичное размещение акций по этой модели – вероятно, первым из всех «ориентированных на ИИ» стартапов.
14 См. US Patent Number 8,615,473 B2; Kopalle, P. Why Amazon’s Anticipatory Shipping is Pure Genius // Forbes. 2014. January 29 // https://www.forbes.com/sites/onmarketing/2014/01/28/why-amazons-anticipatoryshipping-is-pure-genius/#2a3284174605.
15 Spinal Tap – вымышленная британская рок-группа из одноименного псевдодокументального фильма 1984 года. Прим. перев.
16 В качестве напоминания о том, как важно правильно интерпретировать прогноз: дельфийский оракул предсказал, что великая империя будет уничтожена, если царь атакует. Воодушевленный Крез напал на Персию, но, к его удивлению, Лидийская империя рухнула. Прогноз в принципе оказался верным, просто неправильно понятым.
17 MastercardRolls Out Artificial Intelligence across Its Global Network // Mastercard press release. 2016. November 30 // https://newsroom.mastercard.com/press-releases/mastercard-rolls-out-artificial-intelligence-across-its-globalnetwork/.
18 Geitgey, A. Machine Learning Is Fun, Part 5: Language Translation with Deep Learning and the Magic of Sequences // Medium. 2016. August 21 // https://medium.com/@ageitgey/machine-learning-is-fun-part-5-language-translationwith-deep-learning-and-the-magic-of-sequences-2ace0acca0aa/.
Скачать книгу