Стивен Пинкер
Как работает мозг

Шагом в правильном направлении будет встроить в систему способность различать концепты (ребенок, слизняк и др.) и роли, которые они выполняют (деятель, объект действия и т. д.). Допустим, мы создадим отдельные фонды узлов – один для роли деятеля, а другой для роли объекта действия. Чтобы представить суждение, каждый фонд узлов дополняется шаблоном для выполняющего роль в данный момент концепта, поступающим из отдельного раздела памяти. Если бы мы соединили каждый узел с соседними узлами, мы бы получили автоассоциатор для суждений, способный немного работать с комбинаторными мыслями. Мы бы могли хранить в готовом виде суждение «ребенок съел слизняка»; в этом случае, получая любые два компонента в форме вопроса (скажем, «ребенок» и «слизняк» в форме вопроса «Каково отношение между ребенком и слизняком?»), система дополняла бы шаблон, включив узлы, соответствующие третьему компоненту (в данном случае «съел»).

Ведь так? Увы, нет. Рассмотрим такие мысли:

Baby same-as baby. (Ребенок то-же-самое-что ребенок.)

Baby different-from slug. (Ребенок отличное-от слизняк.)

Slug different-from baby. (Слизняк отличное-от ребенок.)

Slug same-as slug. (Слизняк то-же-самое-что слизняк.)

Никакое сочетание весов связей, при котором элемент «ребенок» в первой ячейке и элемент «то-же-самое-что» в средней ячейке активизируют элемент «ребенок» в третьей ячейке, а элемент «ребенок» и «отличное-от» активизируют элемент «слизняк», а элемент «слизняк» и элемент «отличное от» включают элемент «ребенок», не позволит элементам «слизняк» и «то-же-самое-что» активизировать элемент «слизняк». Это все та же самая проблема «исключающего ИЛИ», только в другом обличье. Если связи, соединяющие элементы «ребенок» и «ребенок» и элементы «то-же-самое-что» и «ребенок» сильны, они активизируют элемент «ребенок» в ответ на «ребенок то-же-самое-что____» (что хорошо), однако они включат элемент «ребенок» и в ответ на «ребенок отличное-от – ____» (что плохо), и в ответ на «слизняк то-же-самое-что____» (что тоже плохо). Можно как угодно жонглировать весами связей, но вы никогда не найдете такой вариант, который будет работать для всех четырех предложений. Любой человек безошибочно поймет все четыре предложения, следовательно, человеческий мозг представляет суждения в более замысловатой форме, чем совокупность связей концепта с концептом или концепта с ролью. Мозгу нужна репрезентация для самого суждения. В нашем примере модели нужен дополнительный уровень – более конкретно, уровень, на котором суждение было бы представлено полностью, независимо от концептов и их ролей в суждении¹¹³.

Рисунок внизу показывает в упрощенной форме разработанную Джеффри Хинтоном модель, которая позволяет справиться с предложениями.

Узлы в модуле «суждений» активизируются произвольным образом, получается что-то вроде серийных номеров, которыми помечаются полноценные мысли. Этот модуль функционирует как сверхструктура, благодаря которой концепты в каждом суждении остаются каждый в своей ячейке. Обратите внимание, как точно архитектура этой сети воспроизводит стандартный, напоминающий естественный язык, мыслекод! Выдвигались и другие версии композициональных сетей, которые не так очевидно имитируют естественный язык, но все они непременно включали в себя специальные компоненты, которые задуманы для того, чтобы отделять концепты от их ролей, и для того, чтобы правильно увязывать каждый концепт с его ролью. Чтобы сеть могла выполнять функции, свойственные мышлению, нужно вернуть в нее такие компоненты логики, как предикат, аргумент и суждение; одних только ассоциаций явно недостаточно¹¹⁴.

Еще одна замечательная способность мышления, которую вы, возможно, даже никогда не осознавали, называется квантификацией или присваиванием значения переменным. Она представляет собой сочетание первой проблемы – различения индивидных объектов – и второй – композициональности. Ведь предметом наших композициональных мыслей, в конце концов, часто бывают индивидные объекты, и очень важно, каким образом эти индивидные объекты связаны с разными элементами мысли. Мысль о том, что какой-то определенный ребенок съел какого-то определенного слизняка, отличается от мысли о том, что какой-то определенный ребенок ест слизняков в принципе, или о том, что все дети вообще едят слизняков. Существует целая плеяда анекдотов, основанных на том, что слушатель не распознает это различие. «В США каждые сорок пять секунд кто-то получает травму головы» – «О, боже! Не повезло этому кому-то!» Когда мы слышим фразу «Хильдегард хочет выйти замуж за мускулистого мужчину», мы не можем знать наверняка, есть ли у нее уже кто-то подобный на примете или она просто регулярно ходит в спортзал в надежде найти кого-нибудь. Авраам Линкольн сказал: «Можно некоторое время дурачить всех людей; можно даже дурачить некоторых людей все время; но нельзя дурачить все время всех людей». Без способности квантификации мы едва бы поняли, что он сказал.

В этих примерах у нас есть несколько предложений или несколько прочтений двусмысленного предложения, в которых одни и те же концепты играют одни и те же роли, однако в результате получаются очень разные идеи. Привязать концепты к их ролям недостаточно. Специалисты по логике фиксируют эти различия с помощью переменных и кванторов. Переменная – это символ-заполнитель вроде х или у, который обозначает одну и ту же сущность в разных суждениях или в разных частях одного суждения. Квантор – это символ, который может выражать отношения «Существует определенный х, который…» и «Несмотря на х, справедливо утверждение, что…». Мысль может быть выражена суждением, состоящим из символов, которые обозначают концепты, роли, кванторы и переменные, расположенные в строго определенном порядке с использованием скобок. Сравним, к примеру: «Каждые сорок пять секунд {существует X [который получает травму]}» и «Существует X {который каждые сорок пять секунд [получает травму]}». Наш мыслекод должен иметь механизм, который делал бы что-то вроде этого, но пока у нас нет ни малейшего понятия, как это можно осуществить в рамках ассоциативной сети.

Мало того, что суждение может быть об индивидном объекте, оно само должно интерпретироваться как нечто вроде индивидного объекта, а отсюда вытекает еще одна проблема. Сила коннектоплазмы заключается в наложении разных шаблонов в пределах одной и той же совокупности узлов. К сожалению, результатом может стать причудливая химера или вообще сбой в работе сети. Это одно из проявлений вечной проблемы коннектоплазмы, которая известна как интерференция или перекрестные помехи.

Возьмем два примера. Психологи Нил Коэн и Майкл Мак-Клоски научили сеть складывать две цифры. Сначала ее обучили прибавлять единицу к другим числам: получая на входе «1» и «3», сеть научилась выдавать на выходе «4», и т. д. Далее ее научили прибавлять 2 к любому другому числу. Увы, для решения задачи с прибавлением двойки веса связей переросли в значения, оптимальные для прибавления 2, а поскольку у сети не было специально выделенных средств, чтобы закрепить знание о том, как прибавить 1, она попросту забыла, как это делается! Этот эффект известен как «катастрофическое забывание», потому что он отличается от постепенного забывания, с которым мы имеем дело в повседневной жизни. Еще один пример – сеть, разработанная Мак-Клелландом и его коллегой Аланом Кавамото для присваивания значений двусмысленным предложениям. Например, предложение A bat broke the window (предложение может быть переведено с английского как «Бита разбила окно» или «Летучая мышь разбила окно». – Прим. пер.) может означать либо что в окно бросили бейсбольную биту, либо что через него пролетело крылатое млекопитающее. Сеть выдала единственное толкование, к которому не мог прийти человек: крылатое млекопитающее разбило окно с помощью бейсбольной биты¹¹⁵!

Как и в случае с любым другим инструментом, свойства, которые делают коннектоплазму пригодной для одних вещей, делают ее же непригодной для других вещей. Способность сети к обобщению обусловлена плотной взаимосвязанностью ее элементов и наложением входных данных. Но представьте, что вы – один из узлов сети; вам покажется не таким уж приятным то, что вам в ухо постоянно что-то орут тысячи других узлов и вас то и дело захлестывают волны входных данных. Нередко разные куски информации требуется хранить отдельно, чтобы они не смешивались. Один из способов сделать это – предоставить каждому суждению собственную ячейку памяти и адрес (что, опять же, указывает на то, что не все особенности компьютера оказываются всего лишь странностями кремниевого разума). Компьютеры, в конце концов, придумали не для обогрева, а для того, чтобы обрабатывать информацию таким образом, который имел бы значение для пользователей.

Психологи Дэвид Шерри и Дэн Шактер продолжили эту цепь рассуждений. Они отметили, что разные технические требования к системе памяти зачастую противоречат друг другу. Естественный отбор, утверждают они, отреагировал на эту проблему тем, что наделил организмы специализированными системами памяти. Каждая из таких систем имеет вычислительную структуру, оптимизированную для выполнения одной из задач, стоящей перед мышлением животного. Например, у птиц, запасающих зерно впрок на черный день, сформировалась отличная память на тайники (в случае североамериканской ореховки их количество составляет до десяти тысяч). Птицы, самцы которых поют, чтобы впечатлить самок или внушить страх другим самцам, хранят в памяти большое количество песен (двести в случае соловья). Память на тайники и память на песни располагаются в разных структурах мозга и имеют разные схемы нервных соединений. Мы, люди, одновременно предъявляем к своей системе памяти два очень различных требования. Мы должны помнить отдельные эпизоды: кто сделал что, кому, где, когда, почему, – а для этого необходимо каждый эпизод пометить временем, датой и серийным номером. Вместе с тем мы должны извлекать из информации обобщенное знание о том, как устроены люди и мир вокруг них. Шерри и Шактер предполагают, что природа дала нам по одной системе памяти для каждого из этих требований: «эпизодическую», или автобиографическую, память и «семантическую» память, то есть память общего знания (впервые это разграничение было проведено психологом Энделем Тулвингом)¹¹⁶.

Тонкость, благодаря которой количество доступных человеку мыслей увеличивается до поистине астрономического, заключается не в разделении концептов на три или четыре роли, а в своеобразной плодовитости нашего мышления, носящей название «рекурсивность». Фиксированной совокупности узлов для каждой роли недостаточно. Мы, люди, можем взять любое суждение целиком и отвести ему роль в более длинном суждении, а потом взять это длинное суждение и встроить его в еще большее, тем самым создав иерархическую структуру из суждений внутри суждений. Мы можем подумать не только о том, что ребенок съел слизняка, но и о том, что отец видел, как ребенок съел слизняка, и о том, что мне интересно, видел ли отец, что ребенок съел слизняка, и о том, что отец знает, что мне интересно, видел ли он, что ребенок съел слизняка, и о том, что я догадываюсь, что отец знает, что мне интересно, видел ли он, что ребенок съел слизняка, и т. д. Точно также, как способность прибавить единицу к любому числу влечет за собой способность генерировать бесконечное количество чисел, способность встроить суждение в другое суждение влечет за собой способность помыслить бесконечное число мыслей.

Чтобы получить суждения внутри суждений от сети, изображенной на предыдущей схеме, можно добавить еще один уровень связей в верхней части схемы, соединив модуль узлов, соответствующий целому суждению, с ячейкой роли в некотором более крупном суждении; эта роль может быть чем-то вроде «событие – наблюдаемое». Если мы продолжим добавлять всё новые уровни, мы можем получить многоуровневое суждение, запечатлев в кон-нектоплазме целую иерархическую структуру, соответствующую ему. Но это решение слишком громоздко и вызывает подозрения. Для каждого типа рекурсивной структуры придется предусмотреть отдельную сеть: одну сеть для человека, который думает о суждении, вторую – для человека, думающего о суждении о человеке, думающем о суждении, третью – для человека, сообщающего суждение о некоем человеке другому человеку, и т. д.

В вычислительной технике и психолингвистике используется более мощный и гибкий механизм. Каждая простая структура (соответствующая человеку, действию, суждению и т. д.) представляется в долгосрочной памяти один раз, и процессор переключает внимание от одной структуры к другой, сохраняя маршрут своих перемещений в краткосрочной памяти, чтобы связать суждение воедино. Этот динамический процессор, называемый рекурсивной сетью переходов, особенно хорошо воспроизводит понимание предложений, потому что мы слышим и читаем слова по одному, а не впитываем целое предложение целиком. И наши сложные мысли мы, по-видимому, жуем по кусочку, а не заглатываем или отрыгиваем целиком, а это означает, что наш мозг оснащен рекурсивным обрабатывателем суждений для мыслей, а не только для предложений. Психологи Майкл Джордан и Джефф Элман создали сети, в которых исходящие из узлов выхода соединения возвращаются обратно на совокупность узлов краткосрочной памяти, тем самым запуская новый цикл. Такая циклическая структура позволяет представить, как может протекать в нейронных сетях процесс обработки итеративной информации, однако и этого недостаточно, чтобы интерпретировать или строить структурированные суждения. В последнее время были предприняты попытки соединить циклическую сеть с сетью суждений и получить нечто вроде рекурсивной сети переходов, состоящей из кусочков коннектоплазмы. Эти попытки показывают, что нейронным сетям будет не по плечу наше рекурсивное мышление, если они не будут специально организованы в рекурсивный процессор¹¹⁷.

Нужно отдать должное человеческому мышлению: у него есть и еще одна когнитивная способность, которую очень сложно выжать из коннектоплазмы, а следовательно – сложно объяснить с помощью ассоциационизма. Нейронные сети с легкостью реализуют нечеткую логику, в которой все представляет собой что-то вроде чего-то в той или иной степени. Нужно признать, многие понятия из сферы здравого смысла довольно размыты и им сложно дать четкое определение. Философ Людвиг Виттгенштейн предлагал в качестве примера понятие «игра», образцы которого (паззлы, роллер-дерби, керлинг, «Подземелья и драконы», петушиные бои и т. д.) не имеют между собой ничего общего. Ранее я приводил еще два примера – «холостяк» и «овощ». Членам нечетко определяемой категории недостает одной определяющей черты; они во многих отношениях пересекаются – почти как члены одной семьи или как нити веревки, из которых ни одна не проходит по всей длине. В комиксе «Bloom County» пингвин по имени Опус, временно потерявший память, возражает, когда ему говорят, что он – птица. Птицы изящные и обтекаемые, отмечает Опус, а он – нет. Птицы умеют летать, а он – нет. Птицы умеют петь, а от его исполнения песни Yesterday слушатели давятся от хохота. Опус начинает подозревать, что на самом деле он – лось Буллвинкль. Итак, даже такие концепты, как «птица», оказываются построенными не на необходимых и достаточных условиях, а на прототипических представителях категории. Если вы найдете слово «птица» в словаре, то на картинке увидите не пингвина, а какую-нибудь маленькую птичку, например, воробья.

Эксперименты в области когнитивной психологии показали, что люди демонстрируют крайнюю узколобость в определении птиц, других животных, овощей, инструментов. У людей есть общий стереотип, который они распространяют на всех членов категории; этот стереотип они узнают быстрее, чем не соответствующие ему экземпляры, и даже заявляют, что видят стереотип, в тех случаях, когда на самом деле они видели образцы, похожие на него. Подобные ответы можно прогнозировать, подведя итог свойствам, которые у данного члена категории являются общими с другими ее членами: например, чем больше у него свойств, характерных для птицы, тем в большей степени он является птицей. Автоматический ассоциатор, получив образцы данной категории, сделает примерно то же самое, потому что он вычислит корреляции свойств. Это заставляет думать, что некоторые части человеческой памяти устроены наподобие автоассоциатора¹¹⁸.

Но ведь не может же наше мышление ограничиваться этим! Люди не всегда мыслят нечеткими категориями. Мы смеемся над Опусом, потому что часть нашего сознания понимает, что на самом деле он – птица. Может быть, мы сходимся в определении прототипа бабушки – это добрая седоволосая женщина лет семидесяти, которая потчует внуков кексами с черникой или куриным бульоном (зависит от того, чей это стереотип), но в то же самое время без труда понимаем, что и Тина Тернер и Элизабет Тейлор – тоже бабушки (более того, Тейлор – еще и еврейская бабушка). Если говорить о холостяках, многие люди – например, представители иммиграционных властей, мировые судьи, чиновники сферы здравоохранения – печально известны тем, что очень четко определяют эту категорию; мы все знаем, как много может зависеть от клочка бумаги. Примеры четкого мышления мы находим всюду. Судья может освободить явно виновного подозреваемого из-за формальности. Бармен может не налить пива взрослому человеку за день до того, как ему исполнится двадцать один год. Мы шутим, что нельзя быть немножко беременной или слегка женатым, но после того, как исследование канадских ученых показало, что замужние женщины занимаются сексом 1,57 раз в неделю, карикатурист Терри Мошер изобразил женщину, которая сидит в постели рядом с храпящим мужем и говорит: «Что ж, уже 0,57».

На самом деле нечеткие и четкие версии одной и той же категории могут мирно сосуществовать в одной и той же голове. Психологи Шэрон Армстронг, Генри Глейтман и Лайла Глейтман провели коварный эксперимент: они дали студентам университета стандартные тесты для нечетких категорий, но определить предложили очень четко определяемые категории – такие, как «нечетное число» и «лицо женского пола». Испытуемые с готовностью согласились с такими абсурдными утверждениями, как то, что 13 – более удачный пример нечетного числа, чем 23, и что мать – более удачный пример лица женского пола, чем комедийная актриса. Уже через несколько минут испытуемые заявляли, что число может быть либо четным, либо нечетным, а человек либо женского пола, либо мужского, без переходных вариантов.

У людей есть два режима мысли. Они могут формировать размытые стереотипы, автоматически усваивая корреляции свойств и опираясь на утверждение о том, что все явления в мире склонны делиться на группы (тот, кто лает, также должен кусаться и мочиться на пожарный гидрант). В то же время люди могут создавать системы правил – интуитивные теории, которые определяют категории с точки зрения применимых к ним правил и которые оценивают все члены категории одинаково. Во всех культурах есть системы формального родства – такие точные, что по ним можно доказывать теоремы. И в нашей собственной системе родства есть совершенно четкое определение того, что такое «бабушка»: это мать одного из родителей, и наплевать, печет она кексы или нет. Законодательство, арифметика, народные традиции, социальные условности (которые включают в себя и обряды перехода, четко отграничивающие взрослых от детей и холостяков от женатых мужчин) – все это примеры систем правил, в которые включены все люди на планете. Грамматика языка – это тоже одна из таких систем¹¹⁹.

Системы правил позволяют нам подняться над банальным сходством и сделать выводы, основанные на трактовке явлений. Как пишут Хинтон, Румельхарт и Мак-Клелланд, «людям хорошо дается обобщение только что полученных знаний. Если, к примеру, вы узнаете, что шимпанзе любят лук, вы, вероятно повысите свою оценку вероятности того, что гориллы тоже любят лук. В сети, которая использует распределенные репрезентации, такого рода обобщения производятся автоматически»¹²⁰. Это смелое заявление – современный отголосок замечания Юма о том, что от тела, схожего с хлебом по цвету и консистенции, мы ожидаем аналогичной степени питательности. Тем не менее их предположение рушится в любом случае, когда речь идет о реальных знаниях человека. Конечно, любящие лук гориллы были взяты только ради примера, но интересно отметить, что авторы этого простого примера недооценивают наши способности. Даже зная немного о зоологии и совсем немного о гориллах, я уж точно не увеличил бы свою оценку вероятности того, что гориллы любят лук. Животных можно классифицировать по нескольким признакам. Их можно сгруппировать по генеалогии и сходству в одну таксономическую категорию, например, «человекообразные», но их также можно объединить в группы, которые отличаются друг от друга способом добычи пищи: всеядные, травоядные и плотоядные. Исходя из этого принципа, я могу рассуждать следующим образом. Шимпанзе – всеядные, поэтому неудивительно, что они едят лук; в конце концов, мы, будучи всеядными, тоже его едим. А вот гориллы – травоядные; они всю жизнь жуют дикий сельдерей, чертополох и другие растения. Травоядные могут быть очень привередливы в отношении видов, которыми они питаются, потому что их пищеварительный тракт оптимально приспособлен для того, чтобы устранять влияние ядов, содержащихся только в определенных видах растений (наиболее яркий пример – это коалы, которые специализируются на поедании листьев эвкалипта). Поэтому я бы не удивился, если бы гориллы не стали есть едкий лук, что бы там ни ели шимпанзе. В зависимости от того, какую систему классификации я имею в виду, шимпанзе и гориллы будут либо очень похожими соседями по таксономической категории, либо видами столь же разными, как люди и коровы¹²¹.

В рамках ассоциационизма и его реализации в форме коннектоплаз-мы то, как представлен объект (а именно в виде совокупности характеристик), автоматически заставляет систему делать определенные обобщения (если только она не была научена избегать подобного обобщения, намеренно предъявляя примеры обратного). Альтернатива, к которой я пытаюсь подвести, – это то, что человек может мысленно представить в символической форме виды объектов, причем используемые символы могут иметь отношение к целому ряду систем правил, которые мы все время держим в голове. (В теории искусственного интеллекта этот метод называется «обобщение, основанное на объяснении», а коннекционистские модели – это образец метода, называемого «обобщение, основанное на сходстве».) Наши системы правил выражают знание в форме композиционных, выраженных количественно рекурсивных суждений, и совокупности этих суждений смыкаются, образуя модули или интуитивные теории, касающиеся конкретных областей человеческого опыта: таких, как родство, интуитивная наука, интуитивная психология, числа, законы и язык. Некоторые из этих областей более подробно освещаются в главе 5¹²².

Что толку в четких категориях и системах правил? В социальном мире они могут послужить для разрешения спора между враждующими сторонами, каждая из которых ссылается на нечеткую границу категории: одна сторона заявляет, что тот или иной объект входит в категорию, а другая – что не входит. Обряды посвящения, достижение совершеннолетия, выдача дипломов, лицензий и других юридических документов – все эти события проводят четкие линии, благодаря которым каждый член общества может точно знать статус любого другого его члена. Подобным образом правила, не допускающие отступлений, являются хорошей защитой против тактики поэтапных мероприятий, когда кто-то пытается, пользуясь нечеткостью категории, постепенно отвоевать «территорию», выигрывая одно спорное дело за другим.

Правила и абстрактные категории помогают разобраться и в природе вещей. Обходя вопрос сходства, они позволяют нам проникнуть под внешний слой явлений и выяснить скрытые закономерности, в соответствии с которыми функционирует окружающий нас мир. А поскольку эти закономерности в определенном смысле слова цифровые, они придают репрезентациям точность и стабильность. Если сделать копию с аналоговой записи на магнитной пленке, а потом с копии сделать еще одну копию и так далее, качество записи будет ухудшаться с каждым «поколением». Но если сделать такую же цепочку копий в цифровом формате, качество последней будет нисколько не хуже первой. Подобным образом четкие символические репрезентации позволяют составлять логические цепочки, в которых символы дословно копируются в каждую из последующих мыслей, образуя то, что в логике называют термином «сорит»¹²³:

Все во́роны – врановые.
Все врановые – птицы.
Все птицы – животные.
Всем животным нужен кислород.

Сорит позволяет мыслителю уверенно делать выводы, несмотря на ограниченный опыт. Так, мыслитель может сделать вывод, что воронам нужен кислород, даже если никто никогда не пытался лишить ворона кислорода и посмотреть, что произойдет. Мыслитель может прийти к этому выводу, даже если он никогда не наблюдал эксперимента, в котором какое бы то ни было животное было лишено кислорода, а только слышал об этом от заслуживающего доверия специалиста. Однако если каждый логический шаг в этом рассуждении будет нечетким, или вероятностным, или осложненным частными характеристиками представителей категории предыдущего логического шага, коэффициент ухудшения будет постепенно расти. Последнее утверждение будет таким же зашумленным, как энная пиратская копия видеокассеты или последняя произнесенная шепотом фраза в игре «сломанный телефон». Представители всех цивилизаций могут выстраивать длинные цепочки рассуждений из звеньев, истинность которых они не наблюдали непосредственно. Философы неоднократно указывали на то, что именно эта способность сделала возможным существование науки¹²³.

Как и многие другие проблемные вопросы, связанные с мышлением, полемику по поводу коннекционизма нередко сводят к полемике между врожденностью и обучением. И, как всегда в таких случаях, это затрудняет способность четко мыслить. Несомненно, обучение играет огромную роль в моделировании коннекционных сетей. Часто разработчик сетей, вынужденный вернуться к чертежной доске из-за проблем, о которых я говорил выше, решает воспользоваться способностью сети со скрытыми уровнями запоминать совокупности входов и выходов и распространять их на новые подобные им данные. Иногда можно даже заставить типовую сеть со скрытыми уровнями делать то, что вам нужно, предварительно заучив ее «до смерти». Тем не менее обучение в авральном режиме само по себе не может быть спасением для коннектоплазмы. И не потому, что у сетей слишком мало «врожденной» структуры и слишком много информации на входе из окружения, а потому что у грубой коннектоплазмы так мало мощности, что иногда приходится создавать сети, используя самую худшую комбинацию: слишком малое количество врожденной структуры в сочетании со слишком большим количеством информации на входе из окружения.

Так, Хинтон разработал трехуровневую сеть для вычисления родственных отношений. (По его замыслу, она должна была служить примером того, как работают сети, однако другие коннекционисты восприняли ее как реальную психологическую теорию.) Уровень ввода включал в себя узлы, соответствующие имени, и узлы, соответствующие типу родственных отношений, например, «Колин» и «мать». Уровень вывода включал в себя узлы, соответствующие имени человека, который находится в таких отношениях с заданным человеком, например, «Виктория». Поскольку узлы и связи составляют врожденную структуру сети, а усваивать в процессе обучения ей приходится только веса связей, эта сеть, если ее воспринимать буквально, соответствует врожденному модулю мозга, предназначенному для выдачи ответов на вопросы о том, кто состоит с указанным человеком в родственном отношении указанного типа. Эта система не пригодна для анализа родственных отношений в общем, потому что знания в ней как бы размазаны по всем весам связей, соединяющим уровень вопросов с уровнем ответов, а не хранятся в базе данных, к которой могут иметь доступ разнообразные процессы поиска информации. Следовательно, это знание окажется бесполезным, если хотя бы немного изменить вопрос: например, спросить, в каком родственном отношении состоят между собой два человека, или запросить имена членов семьи человека и родственные отношения, в которых он с ними состоит. В этом смысле модель имеет слишком большой процент врожденной структуры; она создана специально для конкретного типа вопросов¹²⁴.

Научив модель воспроизводить отношения в маленькой вымышленной семье, Хинтон обратил внимание на способность системы переносить сделанные выводы на другие пары родственников. Тем не менее при этом очень мало говорилось о том, что для того, чтобы сеть могла распространить выводы на 4 возможные пары из 104, ее нужно было сначала обучить работать с первой сотней. И каждую из ста пар в режиме обучения нужно было подать в сеть 1500 раз (это в общей сложности 150000 уроков!). Здесь явно не было ничего общего с тем, как усваивают систему семейных отношений маленькие дети. Эти цифры типичны для коннекционных сетей, потому что они приходят к решению не через правила; в них просто нужно «вдолбить» большинство примеров, и тогда они смогут просто переносить знания с одного примера на другой. Любой существенно отличающийся от прочих пример обязательно должен входить в набор для обучения, иначе сеть будет делать сомнительные выводы, как в анекдоте про статистиков на утиной охоте: один стреляет на метр выше, чем нужно, второй стреляет на метр ниже, а третий кричит: «Попали!»

Почему я уделяю столь пристальное внимание коннектоплазме? Уж конечно, не потому, что я считаю моделирование нейронных сетей бессмысленным занятием – как раз наоборот! Без него все мое величественное строение рассуждений о том, как работает мозг, осталось бы парить в воздухе. И уж конечно, я не считаю, что моделирование сетей заключается всего лишь в распределении подрядов между строителями-демонами и структурами данных нейронной «аппаратуры». Многие коннекционные модели поражают тем, чего можно добиться с помощью простейших операций ментального вычисления. С другой стороны, я считаю, что достоинства коннекционизма сильно преувеличивают. Благодаря тому, что сети много рекламировали, называя их функционирование мягким, параллельным, аналогичным, биологичным, бесперебойным, они приобрели привлекательные коннотации и обширную армию поклонников. Но ведь нейронные сети не способны творить чудеса, они только выполняют определенные логические и статистические операции. Решения по таким вопросам, как представление вводных данных, количество сетей, выбранная для каждой из них схема соединений, пути данных, управляющие структуры, соединяющие их между собой, – все это может рассказать гораздо больше о том, что делает систему по-настоящему интеллектуальной, чем общие способности составляющей ее коннектоплазмы.

<< предыдущий лист

следующий лист >>

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64