Карл Маркс и большие данные — страница 6 из 46

Многие данные, пока еще не нашедшие своего применения, сегодня сохраняются и будут использоваться в дальнейшем, рано или поздно создавая информацию в соединении с новыми данными. Здесь можно заметить еще одно фундаментальное и по-своему уникальное свойство данных и информации. При сложении собранных данных объем информации, который можно из них извлечь, больше, чем можно извлечь из каждой базы данных по отдельности. Пауло Коэльо говорил, что радость идет против основ математики: она умножается, когда мы ею делимся. Так вот данные, оказывается, обладают примерно таким же свойством. Подробнее об этом мы поговорим во второй главе. А сейчас пришло время рассмотреть несколько серьезных примеров применения больших данных и оценить влияние, которое они уже оказывают на экономику и нашу жизнь.


Как большие данные меняют мир


Итак, автоматизированная обработка огромных массивов данных, даже в отдельно взятых отраслях, уже сегодня дает невообразимые в недавнем прошлом результаты. Это направление активно развивают многие передовые корпорации, государства и научные сообщества, выделяя большие данные в качестве одного из ключевых векторов своего развития. Нахождение значимых корреляций и построение на основе алгоритмов причинно-следственных связей позволяет решать самые разные задачи, оптимизировать многие процессы.

Так, использование технологии больших данных в здравоохранении16 массово реализуется в развитых странах. К примеру, в США более 94% больниц уже применяют электронные карты17, ведется массовая оцифровка старых рукописных больничных карт и совмещение полученной информации в системе больших данных. Датификация электронных карт пациента позволяет по неявным корреляциям вычислять заболевания на ранних стадиях: так, система обработки больших данных, разработанная в 2013 году членами консорциума Kaiser Permanente, позволяет производить профилактику возможного развития слабоумия у некоторых пациентов с сахарным диабетом18. Получение и обработка данных с носимых устройств пациентов (пульсометры, специальные часы и т.д.) в сочетании с электронными медицинскими карточками дает возможность заранее предсказывать различные заболевания до проявления симптомов. Запись показателей человеческого организма в цифровом виде и анализ собранных больших данных является одним из наиболее перспективных направлений развития системы здравоохранения, способных защитить человечество от многих болезней, спасти миллионы жизней. Скажем, исследования одних лишь поисковых запросов позволили аналитикам компании Microsoft в 15% случаев выявлять рак поджелудочной железы на ранних стадиях19. По словам консалтинговой компании McKinsey, если американское здравоохранение по-настоящему эффективно научится использовать данные, то сможет сэкономить около $300 млрд в год, а колоссальные расходы страны в этой области снизятся на 8%20. Качественный сбор данных позволит отслеживать состояние и обслуживание пациентов, выявлять и пресекать врачебные ошибки, сократит число эпидемий и их опасность, поможет создавать новые лекарства. Оптимизация существующей системы при помощи анализа больших данных снизит затраты на работу больниц, устранит множество злоупотреблений и лишних расходов в государственных системах здравоохранения.

Разумеется, большие данные используются и в отраслях, напрямую связанных с производством.

Так, в российском сельском хозяйстве21, по прогнозам Фонда развития интернет-инициатив и ряда государственных структур, уже к 2020 году более трети аграрных предприятий будут использовать в своей работе большие данные, что позволит им сократить издержки производства до 40%. При принятии решений относительно организации производства предприниматель, работающий в области сельского хозяйства, должен руководствоваться огромным количеством факторов, таких как погода, состояние посевов и почвы, история болезней, эксплуатационные особенности техники и многое другое. Большую часть из этих данных нужно собирать и хранить годами, с объемом накопленных данных будет увеличиваться и эффективность информации, полученной в результате их обработки. Датчики современной сельскохозяйственной техники, анализирующие физические факторы, и компьютеры, совмещающие их с показателями снимков со спутников, прогнозом погоды и рядом других релевантных данных, сегодня не модная причуда, а порой единственная возможность конкурировать в сфере сельского хозяйства. Подобно тому, как индустриальный трактор, заменив собой лошадь, в свое время облегчил жизнь крестьян, многократно увеличив производительность труда, новый «информационный трактор», опирающийся на анализ больших данных (а значит, знающий, что, где и сколько сеять, поливать и собирать), выводит аграрное производство на новый уровень и делает простые индустриальные тракторы неконкурентоспособными перед их усовершенствованными при помощи больших данных аналогами. Так же, как пахотная скотина не смогла когда-то конкурировать с трактором во времена индустриальной революции.

Большие данные используются или активно внедряются практически на любом передовом промышленном предприятии. Анализ собираемых десятилетиями показателей выявляет слабые стороны товаров, предотвращает поломку продукции и средств производства. Например, в автомобильной промышленности большие данные как основу используют навигаторы и системы автопилота, за внедрение которых идет конкурентная

борьба ведущих корпораций. Компании, не использующие технологию больших данных, а главное, не собирающие и не хранящие данные со своих автомобилей, рискуют навсегда потерять конкурентоспособность и производство.

Прогноз продаж автономных автомобилем в мире, млн ед. в год.

Источник: J'son & Partners Consulting, 2017


Программа Министерства промышленности и информатизации Китая, одного из ведущих государств по применению технологий больших данных, указывает на необходимость скорейшего их внедрения в промышленное производство: «Планируется, что к 2020 году продукты и услуги, связанные с большими данными, принесут стране 1 трлн юаней, при этом совокупный прирост дохода будет в среднем увеличиваться на 30% в год... Между тем в Министерстве отмечают, что технологии больших данных еще недостаточно распространены на производстве. По словам аналитиков, большие данные могут оптимизировать работу производственного конвейера и предупредить неисправности, помочь менеджерам принимать мотивированные управленческие решения и интеллектуализировать хозяйственную деятельность»22. А по оценке General Electric, оптимизация работы оборудования за

счет анализа данных на базе Big Data в перспективе 20 лет обеспечит экономию для населения до 30%23.

В гуманитарных областях науки так же, как и в технических, передовые исследования все реже обходятся без больших данных. В науках, связанных с изучением людей и общества, традиционные опросы нескольких тысяч респондентов или узкие фокус-группы не дают и десятой доли той информации, которой располагают, к примеру, владельцы больших данных о миллионах пользователей Интернета, на чем полностью строится современная таргетинговая интернет-реклама. Во многом это обусловлено характером мировой экономики (о чем мы поговорим в следующей главе), а также тем, что Интернет является полностью датифицированной сферой, где каждое действие пользователя оставляет свой след, записывается и бережно хранится. Система интернет-рекламы, реализуемая в первую очередь информационными корпорациями Google и Facebook, и анализ больших данных тысяч характеристик пользователей позволяет рекламодателям предложить свою рекламу наиболее релевантной аудитории. В июне 2018 года конгресс США опубликовал письмо от корпорации Facebook, содержащее ответы на вопросы, которые ее глава Марк Цукерберг не смог или не успел дать во время пристрастных слушаний в Капитолии Вашингтона, вызванных скандалом с использованием этой социальной сети как инструмента для манипуляций мнением избирателей во время президентских выборов. В письме перечисляются типы данных, собираемых социальной сетью со своих пользователей. К ним относятся время, частота и длительность действий в окне с вкладкой соцсети (в том числе открыто ли оно или находится в фоновом режиме); покупки на сторонних сайтах; установленные в браузере пользователя плагины; движения мыши на устройстве пользователя; использование камеры, встроенной в приложение Facebook; метаданные фотографий (в том числе время и место съемки); установленные на устройстве пользователя приложения; имена и типы файлов на устройстве пользователя; идентификаторы из игр, приложений и других учетных записей; доступное место на диске устройства пользователя; контакты из адресной книги пользователя; в случае с Android-устройствами — журнал звонков и история SMS; ближайшие к пользователю точки доступа Wi-Fi и сотовой связи; информация мобильных и стационарных провайдеров через компьютеры, телефоны, сопряженные телевизоры и другие устройства в сети; информация об уровне заряда устройства пользователя, настройках и разрешениях; информация и фотографии других пользователей, а также частота взаимодействия и общения с ними24. И это не считая данных партнеров и другой информации, которую Facebook покупает в офлайне. Как видим, социальная сеть обладает серьезными массивами данных о каждом своем пользователе и благодаря этому имеет возможность продавать качественную нацеленную рекламу наравне с Google.

Революционное свойство больших данных состоит в том, что даже абсолютное знание о предмете не дает таких возможностей, как знание о предмете в системе больших данных.

Американский социолог Сет Стивенс-Давидович, длительное время проработавший в компании Google на должности аналитика больших данных и выпустивший известную, насыщенную яркими примерами книгу

«Все Лгут. Поисковики, Big Data и Интернет знают о вас всё», посвященную возможностям больших данных в изучении общества и его отдельных индивидов, выделяет 4 могущественных особенности больших данных: