В то же время задача получения самых точных эмпирических показателей вместе с проявлением большими объемами собранных данных новых качеств становится все сложнее, в связи с чем наиболее прорывные открытия все чаще совершаются именно в области применения больших данных. Поэтому информационный капитал, ввиду своей деятельности обладающий собственными огромными закрытыми массивами информации и эксклюзивными источниками больших данных, получает фундаментальное преимущество.
Постепенная фокусировка информационного капитала на практически всех областях научной деятельности наблюдается уже сегодня. И если, например, в сфере теоретической физики традиционные государственные или частные научные институты еще могут проводить закрытые контролируемые эксперименты и считаться передовиками научной мысли, то в гуманитарных науках, особенно связанных с изучением поведения людей, они уже фундаментально отстали от представителей информационного капитала. Традиционные массовые опросы, интервью или различные глубинные исследования уже не отвечают вызовам современной науки и не дают и толики той информации, которую дает анализ больших данных. Может ли сегодня Институт социологии РАН или ВЦИОМ знать о российском обществе больше, чем корпорация Mail.Ru Group или Yandex? Как может короткий опрос нескольких тысяч человек сравниться с десятками миллионов страниц в социальных сетях, содержащих подробную информацию об интересах и запросах пользователей, данными об их передвижениях, покупках, мировоззрении, активных контактах и многому другому?
Проще говоря, большие данные являются важнейшим, по-своему революционным эмпирическим материалом для практически любого рода исследований и важнейшим компонентом новейших изобретений, включающих в себя, например, технологию развитого искусственного интеллекта. В тех отраслях, куда пока не добралась тотальная датификация, это ощущается в меньшей степени, но со временем и в них передовые исследования потребуют применения больших данных: «Информации стало настолько много, что на любой вопрос можно получить статистически обоснованный ответ. Удивительно, но это делает научный метод в том виде, в каком мы его привыкли применять, неработоспособным, потому что существенным становится все подряд! Многовековые традиционные исследовательские методологии, построенные на лабораторном анализе, отныне нельзя считать адекватными... Научный метод, что сейчас практикуется в сфере общественных наук, неэффективен и недостаточно силен, чтобы выжить в эпоху больших данных», — пишет Алекс Пентленд61.
Технология применения больших данных не исключает использования результатов исследований прошлых лет. Но происходящие революционные изменения ставят науку в зависимое положение от объема, вариативности и качества имеющихся у исследователя больших данных. Сельское хозяйство в процессе промышленной революции подчинилось индустриальному производству с его тракторами и заводами — вопрос эффективности и конкурентоспособности сельского хозяйства стал во многом определяться качеством и количеством техники. Индустриальное производство, в свою очередь, в процессе научно-технической революции стало определяться уровнем развития науки, а борьба за конкурентоспособность техники благодаря ускоряющемуся технологическому прогрессу переместилась из заводских цехов в научные институты и лаборатории. Главным игроком здесь становятся информационные корпорации.
Нужно сказать, что некоторые из них, понимая потенциал исследования имеющихся у них данных, предоставляют их в обобщенном виде всем желающим посредством, например, api или таких сервисов, как Google Trends. Данные других зачастую могут быть «запарсены» и обработаны специалистами самостоятельно — но и в этих случаях речь идет лишь о крохах общей информации, которую представитель информационного капитала по каким-то причинам решает не оставлять в единоличном пользовании.
Конечно, всегда остаются определенные области науки, не нуждающиеся в эмпирических данных, а у традиционных научных институтов, простых ученых-одиночек или небольших стартапов всегда есть возможность самостоятельно собирать эмпирическую информацию, используя современные технические средства, придумывать свои ноу-хау и совершать научные открытия. Тем не менее информационный капитал по своей сущности, по качеству данных, по их объему и прочим параметрам будет оставаться далеко впереди, тогда как небольшие частные исследовательские проекты лишь в редких случаях будут преуспевать (и, вероятнее всего, выкупаться информационным капиталом), гораздо чаще проваливаясь или маргинализируясь и претендуя максимум на роль поставщика — но в любом случае находясь в зависимости от информационного капитала, владельца больших данных. В последние годы на глобальном рынке появилась целая уже упоминавшаяся нами профессия data miner (копателя данных): специалисты в этой области ищут источники больших объемов данных и сферы применения результатов их обработки для Дальнейшей продажи или использования.
Приведенные тезисы позволяют выделить революцию больших данных как принципиально новую ступень глобальной модели экономического развития, а не части очередного этапа научно-технической революции. Ведь развитие передовых областей науки (в особенности связанных с материальным производством и общественными дисциплинами) становится сильно затруднено (зачастую невозможно) без доступа к большим данным и информации как результату их обработки. Определение направлений научной деятельности оказывается в зависимости от больших данных как ведущего фактора производства. Сам по себе процесс неуклонной миграции передовых центров науки из университетов в крупные корпорации происходит в течение достаточно продолжительного периода. Революция больших данных лишь способствует ускорению монополизации науки в руках корпораций, перехода этого процесса на новый уровень.
Сет Стивенс-Давидовиц в упомянутой выше работе62 приводит пример помешанного на лошадиных скачках ученого, стремящегося посредством больших данных предсказать эффективность того или иного скакуна. В процессе своих многолетних поисков он датифицирует всё новые и новые аспекты лошадиных гонок, пока с помощью самодельного лошадиного УЗИ-аппарата не находит рабочую причинно-следственную связь между размером конкретных внутренних органов лошади и ее успехами в скачках, что в конце концов позволяет ему точно предсказать триумф Американского Фараона, выигравшего тройную корону. Этот пример еще раз демонстрирует, что вариативность данных имеет не меньшую роль, чем их количество. То есть в процессе дальнейших исследований данные информационных корпораций, которые могут на первый взгляд не иметь никакого отношения к исследуемому вопросу, рано или поздно будут находить свое применение и становиться важной частью научного исследования.
В наши дни использование больших данных производителем зачастую ограничивается лишь сугубо релевантными источниками информации, но в ходе революции больших данных требования к передовым конкурентоспособным товарам будут возрастать и скоро поставят его в зависимость от данных, имеющихся у информационных корпораций. Технологическая рента, которая получит определяющее значение, будет постепенно возникать и взиматься не на уровне базовых технологий, а на уровне сбора и обработки больших данных.
До тех пор, пока в мире не все оцифровано, а информация уже может быть дороже любого ресурса и доступна на каждом шагу в изобилии, только руку протяни, идея о грядущей монополии информационного капитала на научные исследования с большими данными, несмотря на все приведенные нами аргументы, все-таки может показаться спорной критически мыслящему читателю. Нужно помнить, что мы пока находимся в самом начале революции, но корпорации уже многократно превосходят остальной мир в объемах собранных данных и темпах датификации. Мы считаем, что данная тенденция будет продолжаться и ускорится, распространяясь на одну за другой все новые и новые области экономики. Научная гонка меняет характер с «соревнования мозгов» на соревнование объемов накопленной информации. При таком развитии событий передовые научные знания и прорывные открытия будут в будущем принадлежать не всему человечеству или государству, а конкретной группе информационной элиты.
Большие данные как ресурс четвертой технологической революции
«Большие данные — топливо для новой цифровой экономики» — такое определение дано в программе Еврокомиссии «Горизонт 2020»63. Описав зависимость научной деятельности от данных, можно обсудить известную аналогию: данные— это ресурсы, «нефть» эпохи четвертой технологической революции.
Ее начало связывают с развитием в первую очередь технологии искусственного интеллекта и роботизацией.
Если индустриальная революция в свое время обогатила нефтедобытчиков, сделав «черное золото» на долгое время, вплоть до наших дней, неотъемлемой частью производственного процесса, то происходящая революция делает уже сами данные неотъемлемой частью практически любой экономической деятельности — вечность уже не пахнет нефтью. Нефть и другие физические материалы являлись топливом индустриальной революции, позволяющей эффективно работать заводам, фабрикам, машинам — в наши дни своеобразным топливом становятся данные. На нем начинают работать исследовательские институты и лаборатории, занятые передовыми научными разработками, искусственный интеллект и цифровое распределенное производство, мир Интернета вещей и, в конечном счете, практически все, что нас окружает.
Описанное не означает, что, скажем, научной деятельностью в том виде, в каком мы привыкли ее видеть, скоро совсем нельзя будет заниматься без больших данных. В конце концов, и машины на дровах еще существуют, да и поле до сих пор можно вспахать при помощи плуга и лошади. Это означает лишь то, что традиционная наука будет сильно зависеть от больших данных, а значит, и информационного капитала.