Идиот или гений? Как работает и на что способен искусственный интеллект — страница 16 из 19

О понимании

“Интересно, сможет ли ИИ преодолеть барьер понимания и когда это произойдет?”[314] Размышляя о будущем ИИ, я снова и снова возвращаюсь к этому вопросу, заданному математиком и философом Джан-Карло Ротой. Выражение “барьер понимания” точно описывает идею, которая легла в основу этой книги: люди обладают глубоким и сущностным пониманием ситуаций, с которыми сталкиваются, но пока ни одна система ИИ не может с ними в этом сравниться. Хотя современные программы ИИ почти сравнялись с людьми (а в некоторых случаях и превзошли их) в выполнении ряда узких задач, у них нет понимания, которое помогает людям воспринимать окружающий мир, пользоваться языком и мыслить логически. Очевидным этот недостаток понимания делают нечеловеческие ошибки, совершаемые системами, затруднения с абстрактным мышлением и переносом обучения, отсутствие основанных на здравом смысле знаний и уязвимость к вредоносным атакам. Барьер понимания между ИИ и интеллектом человеческого уровня не преодолен по сей день.

В настоящей главе я кратко опишу, как ученые – психологи, философы и исследователи ИИ – сегодня представляют себе человеческое понимание. В следующей главе я расскажу о ярких попытках внедрить компоненты человеческого понимания в системы ИИ.

Компоненты понимания

Представьте, что вы ведете машину по многолюдной улице города. На светофоре впереди горит зеленый сигнал, и вы собираетесь повернуть направо. Вы смотрите вперед и видите ситуацию, показанную на рис. 44. Какие когнитивные способности нужны вам, человеку за рулем автомобиля, чтобы понять такую ситуацию?[315]

Начнем с начала. Люди обладают ценным запасом изначальных знаний – примитивным здравым смыслом, который мы получаем при рождении или усваиваем на ранних этапах жизни[316]. Так, даже малышам известно, что мир состоит из объектов, что составные части объектов обычно двигаются вместе и что, если фрагменты объектов скрыты из виду (например, как ноги мужчины, который переходит дорогу позади коляски на рис. 44), они остаются частью этих объектов. Это жизненно необходимые знания! Но нельзя сказать наверняка, что, скажем, сверточная нейронная сеть сможет усвоить эти факты, даже имея в своем распоряжении огромный набор фотографий и видео.


Рис. 44. Ситуация, с которой вы можете столкнуться, когда ведете машину


В раннем детстве мы, люди, многое узнаем о поведении объектов в мире. Во взрослом возрасте мы воспринимаем эти знания как должное и даже не сознаем, что они у нас есть. Если толкнуть объект, он подвинется, если он при этом не слишком тяжел и не заблокирован другим объектом; если уронить объект, он упадет и остановится, отскочит или разобьется при столкновении с землей; если поместить маленький объект позади большого, маленький объект окажется скрыт; если поместить объект на стол и отвернуться, а затем повернуться обратно, объект по-прежнему будет на столе, если только кто-нибудь его не уберет или он не умеет двигаться сам. Этот список можно продолжать бесконечно. Главное, что младенцы постепенно постигают причинно-следственную структуру мира: например, они начинают понимать, что, когда кто-то толкает объект (например, коляску с рис. 44), объект движется не случайно, а потому что его толкнули.

Психологи предложили называть набор изначальных знаний и убеждений об объектах и их поведении интуитивной физикой. В раннем детстве мы также развиваем интуитивную биологию: знания о том, чем одушевленные предметы отличаются от неодушевленных. Так, любому ребенку понятно, что в отличие от коляски собака с рис. 44 может двигаться (или не двигаться) по собственной воле. Мы интуитивно понимаем, что собака может видеть и слышать и наклоняется к земле, чтобы почувствовать запах.

Поскольку люди – существа социальные, с младенчества мы развиваем также интуитивную психологию: способность чувствовать и предсказывать чувства, убеждения и цели других людей. Так, мы понимаем, что на рис. 44 женщина хочет перейти улицу таким образом, чтобы ее ребенок и собака не пострадали, что она не знает мужчину, который идет ей навстречу, что она его не боится, что в настоящий момент она сосредоточена на разговоре по телефону, что машины, по ее мнению, должны ее пропустить, и что она удивится и испугается, если заметит, что машина подъехала к ней слишком близко.

Эти ключевые интуитивные знания формируют фундамент когнитивного развития человека, ложась в основу обучения и мышления, включая нашу способность усваивать новые понятия, имея лишь несколько примеров, обобщать эти понятия, быстро разбираться в ситуациях вроде той, что изображена на рис. 44, и решать, какие действия предпринять в ответ[317].

Прогнозирование возможных вариантов будущего

Неотъемлемая часть понимания любой ситуации – умение прогнозировать, что может случиться дальше. Видя ситуацию на рис. 44, вы ожидаете, что переходящие улицу люди продолжат движение в том же направлении, а женщина будет и дальше удерживать коляску, поводок и телефон. Вы можете предсказать, что женщина потянет за поводок и собака станет упираться, желая продолжить изучение местных ароматов. Женщина потянет за поводок сильнее, собака пойдет за ней и спустится с тротуара на проезжую часть. Вы за рулем – вы должны быть к этому готовы! На более базовом уровне вы ожидаете, что туфли женщины останутся у нее на ногах, а голова – на плечах. Кроме того, вы уверены, что улица не оторвется от земли. Вы ожидаете, что мужчина выйдет из-за коляски и что у него будут ноги, а на ногах – ботинки. Переступая ногами, он поднимется на тротуар. Иными словами, вы оперируете тем, что психологи называют ментальными моделями важных аспектов мира, основанными на ваших знаниях о физических и биологических фактах, причинно-следственных связях и поведении людей. Эти модели – репрезентации того, как работает мир, – позволяют вам строить “симуляции” у себя в голове. Нейробиологи пока плохо понимают, как такие ментальные модели – и ментальные симуляции, “построенные” на них, – рождаются в результате деятельности миллиардов взаимосвязанных нейронов. Тем не менее видные психологи предположили, что понимание концепций и ситуаций формируется именно на основе ментальных симуляций, которые активируют воспоминания о прошлом физическом опыте человека и позволяют ему представить, какие действия можно предпринять[318].

Ваши ментальные модели позволяют вам не только предсказывать, что с большой вероятностью произойдет в конкретной ситуации, но и представлять, что могло бы произойти, если бы случились определенные события. Если бы вы нажали на клаксон или крикнули: “Уйди с дороги!” – высунувшись в окно, женщина, вероятно, вздрогнула бы от неожиданности и переключила внимание на вас. Если бы она споткнулась и потеряла туфлю, она бы нагнулась, чтобы ее поднять. Если бы ребенок в коляске заплакал, она бы посмотрела на него, чтобы понять, что стряслось. Неотъемлемый аспект понимания ситуации – способность применять ментальные модели, чтобы представлять различные возможные варианты будущего[319].

Понимание как симуляция

Психолог Лоуренс Барсалоу – один из самых известных сторонников гипотезы “понимания как симуляции”. По его мнению, наше понимание ситуаций, с которыми мы сталкиваемся, основано на (бессознательном) построении таких ментальных симуляций. Более того, Барсалоу предполагает, что ментальные симуляции также лежат в основе нашего понимания ситуаций, где мы не принимаем непосредственного участия, то есть ситуаций, которые мы наблюдаем, о которых слышим или читаем. “В процессе осмысления текста люди конструируют симуляции для репрезентации его перцептивного, моторного и эмоционального компонента, – пишет он. – Симуляции оказываются ключевым аспектом репрезентации смыслов”[320].

Мне несложно представить, как я читаю статью об аварии с участием женщины, которая переходила улицу, разговаривая по телефону, и понимаю историю с помощью ментальной симуляции ситуации. Я могу поставить себя на место женщины и представить (с помощью симуляции на основе своих ментальных моделей), как говорю по телефону, качу коляску, держу собаку на поводке, перехожу улицу, отвлекаюсь и так далее.

Но как быть с абстрактными понятиями – такими, например, как истина, бытие и бесконечность? Барсалоу с коллегами на протяжении десятилетий утверждают, что мы постигаем даже самые отвлеченные понятия с помощью ментальной симуляции конкретных ситуаций, в которых фигурируют эти понятия. По мнению Барсалоу, “при обработке понятий репрезентация категорий [даже максимально абстрактных] происходит с помощью воссоздания сенсорно-моторных состояний, то есть симуляции”[321]. Как ни удивительно (по крайней мере для меня), самые убедительные аргументы в пользу этой гипотезы дает когнитивное исследование метафор.

Метафоры, с которыми мы живем

Давным-давно на школьном уроке английского я узнала определение метафоры, которое звучало примерно так:

Метафора – это фигура речи, которая описывает предмет или действие не буквально, а таким образом, чтобы можно было получить более полное представление о нем или провести сравнение… Метафоры применяются в поэзии, литературе и в других случаях, когда человек хочет добавить образности своей речи[322].

На уроке учитель привел несколько примеров метафор, включая самые известные строки Шекспира. “Но что за блеск я вижу на балконе? / Там брезжит свет. Джульетта, ты как день!”[323] И еще: “Жизнь – ускользающая тень, фигляр, / Который час кривляется на сцене / И навсегда смолкает”[324]. И так далее. Я поняла, что метафоры в основном используются, чтобы добавить красок в скучный текст.

Много лет спустя я прочитала книгу “Метафоры, с которыми мы живем”[325], написанную лингвистом Джорджем Лакоффом и философом Марком Джонсоном. Мое представление о метафорах перевернулось с ног на голову (уж простите меня за эту метафору). Лакофф и Джонсон утверждают, что наш язык кишит метафорами, которые часто остаются незамеченными, а почти все абстрактные понятия мы понимаем благодаря метафорам, основанным на базовых знаниях физики. Лакофф и Джонсон подкрепляют свой тезис большим набором лингвистических примеров, показывая, как мы формируем представление о таких абстрактных понятиях, как время, любовь, печаль, гнев и бедность, обращаясь при этом к конкретным физическим концепциям.

Так, Лакофф и Джонсон отмечают, что мы говорим об абстрактном понятии времени, используя термины, которые применимы к более конкретному понятию денег. Вы “тратите” и “экономите” время. Часто у вас возникает “нехватка времени”. Иногда потраченное время “того стоит”, а значит вы “потратили время выгодно”. Возможно, у вас есть знакомый, у которого время, как и деньги, “утекает сквозь пальцы”.

Подобным образом мы формируем представление о таких эмоциональных состояниях, как радость и печаль, используя направления движения – вверх и вниз. Настроение может “упасть”. Можно “провалиться в депрессию”. При этом друзья часто “поднимают нам настроение”, после чего оно надолго остается “приподнятым”.

Более того, чтобы сформировать представление о социальных взаимодействиях, мы часто прибегаем к концепции физической температуры. “Меня тепло приняли”. “Она одарила меня ледяным взглядом”. “Он встретил меня холодно”. Наша речь пестрит подобными выражениями, но мы даже не понимаем, что используем метафоры. Утверждение Лакоффа и Джонсона, что эти метафоры обнажают физический фундамент нашего понимания мира, поддерживает теорию Лоуренса Барсалоу о понимании через симуляцию ментальных моделей на основе изначальных знаний.

Психологи проверяли эти идеи во множестве любопытных экспериментов. Одна группа исследователей отметила, что одна и та же область мозга активируется, когда человек думает о физическом тепле и о тепле социальном. Чтобы изучить возможные психологические эффекты этого, исследователи пригласили нескольких добровольцев для проведения эксперимента, в рамках которого сотрудник сопровождал каждого участника при подъеме на лифте в лабораторию психологии. В лифте сотрудник просил испытуемого “пару секунд” подержать стакан с горячим или холодным кофе, пока сам записывал его имя. Испытуемые не знали, что это часть эксперимента. В лаборатории каждый испытуемый читал краткое описание вымышленной личности, после чего оценивал некоторые черты характера этого человека. Тем, кто держал в лифте горячий кофе, человек казался гораздо “теплее”, чем тем, кто держал холодный кофе[326].

Другие исследователи получили подобные результаты. Более того, связь физической и социальной “температуры”, похоже, работает также в обратном направлении: психологи обнаружили, что при “теплых” и “холодных” социальных взаимодействиях испытуемые также ощущают физическое тепло и холод[327].

Хотя эти эксперименты и трактовки вызывают споры в психологическом сообществе, их результаты можно считать подтверждением теорий Барсалоу и Лакоффа и Джонсона: мы формируем представление об абстрактных понятиях на основе базовых физических знаний. Если на ментальном уровне активируется понятие тепла в физическом смысле (например, когда человек держит стакан с горячим кофе), это приводит также к активации понятия тепла в более абстрактном, метафорическом смысле, например при оценке характера человека, и наоборот.

Сложно говорить о понимании, не говоря о сознании. Начиная работу над этой книгой, я планировала вообще не касаться вопроса сознания, поскольку он обладает особенным весом в науке. Но, была не была, – я рискну предложить одну гипотезу. Если мы формируем представление о понятиях и ситуациях, осуществляя симуляции на основе ментальных моделей, возможно, феномен сознания – и вся концепция самости – рождается из способности человека конструировать модели собственных ментальных моделей и проводить симуляции на основе них. Я могу создать не только ментальную симуляцию перехода улицы при разговоре по телефону, но и ментальную симуляцию того, как обдумываю эту мысль. Кроме того, я могу представить, о чем подумаю дальше. Модели моделей, симуляции симуляций – почему бы и нет? Подобно тому как физическое восприятие тепла активирует метафорическое и, наоборот, понятия, связанные с физическими ощущениями, могут активировать абстрактное понятие самости, которое, возвращаясь, снова проходит по нервной системе, в результате чего появляется физическое восприятие самости, или – если хотите – сознание. Такая циклическая причинность сродни тому, что Дуглас Хофштадтер назвал “странной петлей” сознания, “в которой символический и физический уровни питают друг друга и переворачивают причинность вверх тормашками, в результате чего складывается впечатление, что символы обретают свободу воли и парадоксальную способность командовать частицами, а не наоборот”[328].

Абстракции и аналогии

Пока я описала несколько предложенных психологами идей об изначальном “интуитивном” знании, которое люди получают при рождении или приобретают на ранних этапах жизни, и объяснила, как это изначальное знание ложится в основу ментальных моделей, формирующих наши представления о мире. При конструировании и применении этих ментальных моделей люди пользуются двумя фундаментальными способностями – к абстрактному мышлению и к построению аналогий.

Абстрактное мышление – это способность видеть в конкретных понятиях и ситуациях примеры из более общих категорий. Давайте конкретизируем понятие абстрактного мышления (оцените игру слов!). Представьте, что вы родитель и специалист по когнитивной психологии. Пусть вашу дочь зовут S. Наблюдая за развитием S, вы ведете дневник, в котором отмечаете, как растут ее способности к абстрактному мышлению. Далее я приведу несколько выдержек из вашего гипотетического дневника.

Три месяца. S различает радость и печаль на лицах, обобщая свои представления при взаимодействии с разными людьми. Она абстрагировала понятия “радостное лицо” и “печальное лицо”.

Шесть месяцев. Теперь S понимает, когда люди машут ей на прощание рукой, и машет им в ответ. Она абстрагировала понятие “махание рукой” и научилась отвечать “таким же” жестом.

Полтора года. S абстрагировала понятия “кошка” и “собака” (а также усвоила многие другие категории) и научилась узнавать разных кошек и собак на фотографиях, рисунках, в мультфильмах и реальной жизни.

Три года. S узнает отдельные буквы алфавита, написанные разными людьми и напечатанные разными шрифтами. Кроме того, она различает прописные и строчные буквы. Она абстрагировала большое количество понятий, связанных с буквами! Помимо этого, она генерализировала свои знания о морковке, брокколи, шпинате и др. в более абстрактное понятие “овощи”, которое теперь приравнивает к другому абстрактному понятию – “гадость”.

Восемь лет. Я случайно услышала, как J, лучшая подруга S, рассказывает S о том, как мама забыла забрать ее после футбольного матча. “О да, однажды со мной случилось то же самое, – ответила S. – Уверена, ты рассердилась, а твоей маме стало очень стыдно”. Я поняла, что “тем же самым” S назвала совсем другую ситуацию, в которой няня забыла забрать ее из школы и отвезти на урок музыки. По словам “со мной случилось то же самое” можно понять, что S сформировала абстрактное понятие “сопровождающий забыл забрать ребенка до или после некоего занятия”. S также на основе собственного опыта предположила, как отреагировали на ситуацию сама J и ее мама.

Тринадцать лет. S начинает подростковый бунт. Я несколько раз просила ее навести порядок в комнате. Сегодня она крикнула в ответ: “Ты не можешь меня заставить, Авраам Линкольн освободил рабов!” Мне это не понравилось, в основном из-за неудачной аналогии.

Шестнадцать лет. Интерес S к музыке растет. В машине мы часто играем в игру: включаем передающее классическую музыку радио посреди композиции и соревнуемся, кто быстрее угадает композитора или эпоху создания вещи. Пока что я выигрываю чаще, но S все лучше узнает абстрактное понятие “музыкальный стиль”.

Двадцать лет. S прислала мне длинное электронное письмо о жизни в колледже. Она описала свою неделю следующим образом: “Учебафон, потом едафон, потом сонофон”. Она также сказала, что колледж делает из нее “кофеголика”. В том же письме она упомянула о студенческих протестах против предполагаемого сокрытия университетской администрацией подозреваемого сексуального скандала с участием выдающегося профессора и сказала, что студенты называют сложившуюся ситуацию “харассмент-гейтом”. Возможно, S об этом не знает, но в ее письме содержатся прекрасные примеры стандартных языковых абстракций: она формирует новые слова, прибавляя суффиксы, описывающие абстрактные ситуации. Суффикс – фон (из слова “марафон”) означает деятельность, которая занимает много времени или сопряжена с большими количествами чего-либо; суффикс – голик (из слова “алкоголик”) – “пристрастие” к чему-либо; суффикс – гейт (из слова “Уотергейт”) – скандал или попытку его замять[329].

Двадцать шесть лет. S окончила юридический факультет и поступила на работу в престижную фирму. Недавно ее клиентом (подзащитным) стала интернет-компания, владеющая публичной блог-платформой. Мужчина (истец) подал к компании иск о клевете, поскольку один из блогеров с платформы оскорбил его честь и достоинство в своем посте. S объяснила суду, что блог-платформа сродни “стене”, на которую “разные люди наносят граффити”, и компания просто “владеет стеной”, а следовательно, не несет ответственности за случившееся. Суд согласился с ее аргументом и встал на сторону подзащитного. Это стало первой крупной победой S в суде![330]

Я привела эти выдержки из гипотетического родительского дневника, чтобы сделать несколько важных замечаний о построении абстракций и аналогий. В некоторой форме абстракция лежит в основе всех наших понятий, причем с младенческого возраста. Такая простая задача, как узнавание лица матери – при разном освещении, под разными углами, с разными выражениями и прическами, – требует того же абстрактного мышления, которое задействуется при узнавании музыкального стиля или построении убедительной юридической аналогии. Как показывают приведенные выше выдержки из дневника, все, что мы называем восприятием, категоризацией, распознаванием, обобщением и напоминанием (“со мной случилось то же самое”), подразумевает необходимость абстрагирования ситуаций, с которыми мы сталкиваемся.

Абстрагирование тесно связано с построением аналогий. Дуглас Хофштадтер, который несколько десятков лет занимается изучением этих способностей, определяет построение аналогий в общем смысле как “обнаружение сходства между двумя вещами”[331]. Сходством может быть конкретное понятие (например, “радостное лицо”, “махание рукой на прощание”, “кошка”, “музыка”, “стиль барокко”), которое мы называем категорией, или с трудом поддающаяся описанию концепция, формируемая на ходу (например, “сопровождающий забыл забрать ребенка до или после некоего занятия” или “владелец публичного «пространства для письменного выражения мыслей» не несет ответственности за «написанное» в этом пространстве”), и такую концепцию мы называем аналогией. Эти ментальные феномены – стороны одной медали. В некоторых случаях такая мысль, как “стороны одной медали”, рождается при построении аналогии, а затем входит в лексикон в качестве идиомы, и мы начинаем считать ее категорией.

Иными словами, аналогии, которые чаще всего строятся бессознательно, лежат в основе наших способностей к абстрагированию и формированию понятий. Как отметили Хофштадтер и его соавтор, психолог Эммануэль Сандер, “без понятий не может быть мышления, а без аналогий не может быть понятий”[332].

В этой главе я обрисовала некоторые идеи из недавних работ психологов, изучающих ментальные механизмы, с помощью которых люди понимают возникающие ситуации и определяют свое поведение в соответствии с обстоятельствами. Мы обладаем базовыми знаниями – некоторые из них присущи нам от рождения, а остальные мы приобретаем в процессе развития и жизни. Наши понятия хранятся в мозге как ментальные модели, которые мы можем “запускать” (то есть симулировать), чтобы предсказывать, что произойдет в любой ситуации или что может произойти, если ситуация изменится каким-либо мыслимым образом. Наши понятия – от простых слов до сложных концепций – формируются с помощью абстракций и аналогий.

Конечно, я не берусь утверждать, что охватила все аспекты человеческого понимания. Многие отмечают, что термины “понимание” и “смысл” (не говоря уже о “сознании”) не имеют адекватного определения и выполняют функцию условных заменителей, поскольку у нас пока не появилось корректного языка или теории, чтобы говорить о происходящем в мозге. “Хотя такие донаучные зачатки идей, как «полагать», «знать» и «иметь в виду», полезны в повседневной жизни, с технической точки зрения они слишком грубы для применения в авторитетных теориях… – отметил пионер ИИ Марвин Минский. – Какими бы реальными нам ни казались сегодня понятия «самость» и «понимать»… это лишь первые шаги к появлению более удачных понятий”. Далее Минский отметил, что путаница с этими понятиями “возникает из-за обремененности традиционных идей коннотациями, не соответствующими этой невероятно сложной задаче… Наши представления о разуме еще не сформировались окончательно”[333].

До недавних пор вопрос о том, какие ментальные механизмы позволяют людям понимать мир – и могут ли машины обрести такое же понимание, – занимал в основном философов, психологов, нейробиологов и теоретиков ИИ, которые на протяжении десятилетий (а иногда и столетий) вели научные дебаты на этот счет, не уделяя внимания тому, какие последствия все это имеет для реального мира. Однако, как я показала в предыдущих главах, системы ИИ, не имеющие человеческого понимания, сегодня находят широкое применение при выполнении реальных задач, а потому все эти теоретические вопросы перестают быть прерогативой академического сообщества. В какой степени системам ИИ необходимо человеческое понимание мира или некоторое его подобие, чтобы надежно и эффективно выполнять свою задачу? Ответа не знает никто. Но почти все исследователи ИИ уверены, что изначальные знания “на основе здравого смысла” и способность к построению сложных абстракций и аналогий – это звенья, отсутствие которых сдерживает дальнейшее развитие ИИ. В следующей главе я опишу ряд методов, которые используются, чтобы наделить машины этими способностями.

Глава 15