Галюцинації Голема: до проблеми емульованого несвідомого

У мережі можна знайти цікаву історію однієї панди на ім’я Meng Er. Коли він розламує бамбук, він демонструє вирази, немов це складне завдання. Однак ми можемо уявити приблизну силу панди та зрозуміти, що розламати бамбук для неї — не надто складна задача.
 Цю поведінку пояснюють тим, що панда Meng Er був розлучений зі своєю матір’ю і вирощувався під опікою Пекінського зоопарку. Там щоразу, коли доглядач намагався розламати бамбук навпіл, він зосереджено морщив чоло і скреготів зубами, а Meng Er, спостерігаючи за цими діями, почав їх повторювати. Очевидно, що Мeng Er не усвідомлює, навіщо він імітує міміку. Він просто повторює поведінку, яку спостерігав раніше, оскільки це стало частиною його повсякденної рутини(1).

Загалом, ця коротка історія описує те, як працюють сучасні Generative Large Language Models (коротко G.L.L.M (Gollem) або Gen.AI).

Галюцинації

Коли користувач робить свій запит у Gen.AI, він очікує отримати відповідь, яка була б причетна до логіки заданого промпту. Як правило, алгоритми видають якісно точні результати, але іноді можна зустріти такі конфабуляції ШІ, які не ґрунтуються на натренованих даних та створюють шалені та дурні відповіді. Коли таке відбувається, ми відкрито заявляємо — наш ШІ галюцинує. 

Традиційно галюцинації ШІ сприймаються як суто алгоритмічна помилка, що виникає під час неправильного декодування результатів генерації трансформером(2). Однак у цій статті ми відійдемо від суто технічного огляду ШІ та зосередимося на можливих емерджентних властивостях, властивих усім складним системам, у тому числі взаємодії різних компонентів нейронної мережі.

У масовий вжиток поняття «галюцинації» запровадив Жан-Етьєн Домінік Ескіроль (Jean-Étienne Dominique Esquirol) на початку ХІХ століття. У своїй книзі «Des maladies mentales considérées sous les rapports medical, hygiénique et medico-légal» Ескіроль визначив галюцинації як «сприйняття, що виникає без зовнішнього об’єкта»(3). — Тобто таке явище, чия інтенція виходить зсередини та не має ініціації ззовні, що з погляду традиції фройдівського психоаналізу відрізняє галюцинації від неврозу, коли ініціації ззовні є.

У психоаналітичній традиції галюцинації тісно пов’язані з терміном «несвідоме». Коли Фройд вслід за Кантом говорить «бути божевільним — те саме, що бачити сни наяву», він вказує на явну природу взаємин несвідомого (яке часто проявляється в сновидіннях) з маренням (інакше галюцинаціями)(4). Трохи пізніше Жак Лакан, відомий своєю оригінальною інтерпретацією фройдівської спадщини, запропонує складніше трактування галюцинацій. Він описує їх, як «певне означальне в Реальному». Щоб зрозуміти це формулювання, необхідно розглянути його в контексті лаканівської теорії психіки: галюцинації, за Лаканом, є вторгненням несвідомого (le Réel) в людську свідомість через регістр Уявного (l’Imaginaire). Це вторгнення часто пов’язане з травматичним досвідом, який не був належним чином інтегрований у Символічне (le Symbolique)(5).

Загалом, моє ж перше «вторгнення» тут полягає в тому, що приблизно так, як людська свідомість породжує сновидіння і галюцинації, ШІ генерує подібні явища як побічний продукт своєї непередбачуваності. Тоді галюцинації ШІ, тобто генерацію неправильної чи недійсної інформації, слід сприймати як результат «вторгнення» неструктурованих або неповних даних (le Réel) через генеративні процеси (l’Imaginaire) у вихідні дані системи (аналог свідомості).

Галюцинації – не помилка, а прояв несвідомого 


Дискурс навколо ШІ як «is a new black» несвідомого розпочався у 2023 році з двох публікацій на різних платформах, що вийшли в один день — 8 березня. Перша стаття — робота канадського психоаналітика Дуейна Русселя (Duane Rousselle) під назвою «Escaping the Meta-Verse»(6). У ній він припускає, що ChatGPT демонструє механізми сновидінь, які можуть функціонувати без суб’єкта-сновидця:

«Руссель стверджує, що умови для традиційного несвідомого кастрації були виключені. Він ілюструє це в термінах нездатності мріяти; він стверджує, що сьогодні ми мріємо поза собою, і, отже, такі системи, як ChatGPT і Metaverse, працюють, пропонуючи собі саме той простір, який ми втратили через те, що старі моделі кастрації відходять на другий план». 

Другою важливою роботою стала стаття відомого інтелектуала Ноама Хомські (Noam Chomsky) «The False Promise of ChatGPT”, про яку теолог Марк Джі Мерфі (Mark G. Murphy) написав: «Ноам Хомські стверджує про повний онтологічний розрив між нами та штучним інтелектом»(7). Невдовзі Мерфі також опублікував статтю, де позначив сучасних ШІ чат-ботів новим несвідомим:

«ChatGPT і OpenAI представляють несвідоме без відповідальності, і це становить загрозу для соціальних зв’язків. Він не пропонує вирішення сегрегації та фундаментальної ізоляції та антагонізму, від яких ми все ще страждаємо, оскільки без відповідальності не може бути пост-даності. Це термін, який Руссел використовує, щоб сформулювати мінімальні координати, які дозволяють можливість мати місце прощення, навіть заднім числом»(8).

Логічний розвиток посилки «ШІ — нове несвідоме» знаходить себе у статті відомого словенського філософа Славоя Жижека (Slavoj Žižek), де він у звичній для себе манері яскраво окреслює таке:

«Чат-боти — це машини для збочень, і вони більше, ніж будь-що інше, затьмарюють несвідоме: саме тому, що вони дозволяють нам виплеснути всі наші брудні фантазії та непристойності, вони є більш репресивними, ніж навіть найсуворіші форми символічної цензури»(9).

У світлі цих робіт стає очевидним, що проблематика нашого сприйняття та інтерпретації ШІ має також значний потенціал для концептуалізації й через призму психоаналітичної теорії. Цей підхід відкриває нові горизонти для міждисциплінарного дослідження, що дозволяє глибше проникнути у суть взаємодії людської свідомості зі штучними інтелектуальними системами. Ця стаття є авторським коментарем, спрямованим на обґрунтування концепції «ШІ як несвідоме».

Моє друге припущення у тому, що проблема «галюцинацій» ШІ лежить не в площині внутрішнього декодування ШІ, а в площині зовнішньої інтерпретації, тобто інтерпретації людиною. У межах цієї гіпотези «відповіді, що галюцинують» не є результатом збою системи, вони лише не відповідають звичному патерну нашої свідомої ідентифікації. Отож «відповідь, що галюцинує» не піддається повній символізації та залишається вадою чи розривом у структурі нашого сприйняття, тому ми зчитуємо її як системну помилку. Далі я концентрую свою увагу на прикладах прояву цифрового несвідомого, який сміливо можна називати «емульованим» — таким, що латентно пародіює структуру нашого несвідомого, і намагаюся на ключових аспектах пояснити, як ми можемо розуміти черговий «розрив» з ШІ.

Витіснення пам’яті

У лютому 2024 року професор Джеффрі Гінтон (Geoffrey Hinton), часто званий «хрещеним батьком ШІ», провів лекцію в Оксфордському університеті(10). У ній він запропонував переосмислити те, що зазвичай називають «галюцинаціями» ШІ, визначивши їх насправді як конфабуляцію. Для ілюстрації своєї думки Гінтон навів цікавий історичний приклад. Він розповів історію Джона Діна, чиї свідчення відіграли ключову роль у Вотергейтському скандалі. У процесі скандалу з’ясувалося, що існували записи всіх зустрічей, про які Дін свідчив. Порівняльний аналіз показав, що попри те, що Дін помилявся у багатьох деталях, загальна канва його розповіді відповідала дійсності. Джон Дін явно намагався говорити правду, але людська пам’ять не зберігає у собі спогади, а відтворює їх. Якщо події недавні — відтворення точні, а якщо давні — ми часто впевнені в помилкових деталях. Ми побудували нейромережі на основі нашого мозку, тому Gen.AI також працює за схожим принципом — відтворюючи, а не згадуючи інформацію. Якщо ми сприймаємо за норму конфабуляції у людини, то чому не можемо зайти далі та порівняти це з конфабуляціями у ШІ на основі подібності? Якщо прийняти цю тезу за істину, чи не означає, що ШІ є відображенням чогось схожого на те, що ми, люди, вміщуємо в собі, коли говоримо про галюцинації? Фройдистська теорія каже нам, що прогалини та помилки у пам’яті тісно пов’язані з функцією витіснення (repression), коли спогади й бажання витісняються зі свідомого розуму в несвідомий. Я не говорю, що ШІ має несвідоме, я припускаю, що він імітує несвідомі форми функціонування спогадів і відтворює їх так, як несвідоме виявляється у нас. 

Мова

Жак Лакан, розвиваючи ідеї Фройда, сформулював знамениту максиму — «несвідоме структуроване, як мова»(11). Це твердження стало наріжним каменем його теорії, яка застосовує принципи структурної лінгвістики до розуміння несвідомого. Несвідоме керується символами та знаками подібно до того, як це робить мова. Мова (хоча семантично більш доречним буде слово «текст») як знакова і символічна система є головною їжею для тренування ШІ систем. Якщо несвідоме структуроване як мова, а ШІ заснований на обробці мовних даних, то галюцинації ШІ слід розуміти як відображення структурних особливостей, подібні до несвідомого. Як зазначалося в блозі Anthropic, штучні нейрони та субнейрони ШІ можуть компілювати не лише інформацію (реальність), а й синтезувати певний простір «за-тексту» (аналог le Réel у Лакана). У такому разі помилки, прогалини в пам’яті або галюцинації — це не баг, а «удавання в тексті» чат-бота. Я маю на увазі, що ШІ помиляється, тому що помиляється людина. Інтерпретуючи слова «Слава Жижека» — ШІ помиляється від нашого імені.

Асоціації та метонімія

Ще однією посилкою до мого припущення є розуміння структури функціонування несвідомого. Згідно з Жаком Лаканом, у несвідомому діють основні механізми мовних асоціацій, що він називає «дискурсом Іншого»(Autre). Лакан стверджує, що «Інший» відповідає одному з трьох важливих регістрів — Символічному (le Symbolique).

Символічне, що тісно пов’язане з мовою, відіграє ключову роль у формуванні несвідомого. Саме через символічний порядок елементи несвідомого організовуються та з’єднуються у вигляді асоціативних зв’язків. На глибшому рівні працює принцип метонімії — перехід від однієї асоціації до іншої через їхню суміжність.

Нещодавні дослідження в галузі штучного інтелекту, зокрема проведені компанією Anthropic, демонструють дивовижні паралелі з лаканівською теорією несвідомого. Дослідники навчилися виявляти нейрони в ШІ, що схожі за асоціаціями. За допомогою пошуку метонімічних функцій вдалося виявити несподівані зв’язки субнейронів. Так ось, субнейрон, який відповідає за «міст Золоті Ворота», виявився пов’язаний із зображеннями з фільму Альфреда Гічкока «Запаморочення», дія якого відбувається в Сан-Франциско, де знаходиться цей міст. Стверджується, що асоціативні зв’язки у несвідомому точно так представлені у вигляді ланцюжків, де один спогад чи ідея пов’язані з іншими через символічні та метонімічні зв’язки.

Ці спостереження дозволяють провести прямі паралелі між структурою несвідомого за Лаканом та організацією сучасних нейромереж. Подібно до того, як витіснені бажання та спогади можуть несподівано спливати в людській мові, в алгоритмах чат-ботів можуть виникати несподівані асоціації та «спогади». Тоді, повертаючись до другої посилки цієї статті, галюцинації слід розглядати не як помилки, а як прояв глибинних асоціативних та метонімічних зв’язків, аналогічних тим, що існують у людському несвідомому.

Метафора

Однією з ключових здібностей людської психіки є вміння мислити на високих рівнях концептуальної абстракції. Це дозволяє нам редукувати, узагальнювати та спрощувати складні ідеї до їхніх основних елементів та принципів, а потім знаходити подібності між ними. У структурі нашого несвідомого за встановлений принцип подібності відповідає метафора.

Метафора, за Лаканом, пов’язана з поняттям заміщення: одна ідея чи образ заміщає інший з урахуванням певної подібності між ними. Цікаво, що внутрішня організація концепцій у моделях штучного інтелекту певною мірою відповідає нашим людським уявленням про подобу. Коли ШІ створює текст, він може використовувати приховані смислові відтінки слів, особливо під час обговорення делікатних тем. Це формує у ШІ свого роду схильність уникати певних тем чи виразів — описуючи складну емоцію, ШІ порівнює її з природним явищем й уникає при цьому надто прямолінійних чи потенційно образливих формулювань.

Саме цей цензуруючий механізм «не говорити» призводить ШІ до використання метафоричних зв’язків і пояснює, як функція «травми» у людини заміщується на «цифровий bias». Такий підхід до обробки інформації дозволяє ШІ, зокрема Claude-3, демонструвати чудову здатність створювати метафори.

Несвідоме без відповідальності

Пошук несвідомого в генеративних чат-ботах може здатися передчасним, враховуючи, що на цьому етапі розвитку ШІ не має свідомості в людському розумінні. Багато хто взагалі передбачає, що природа алгоритмічного детермінізму ШІ може бути аргументом на користь того, що він може залишитися лише «стохастичним папугою». Однак ця тема заслуговує на більш глибокий розгляд.

У дискусії про ШІ та несвідоме Руссель і Мерфі припустили, що ChatGPT є «несвідомим без відповідальності». Славой Жижек протиставляє це фройдівському несвідомому, яке має на увазі відповідальність, що виявляється в парадоксальному почутті провини, навіть коли ми не знаємо, у чому винні. Цифрове несвідоме дозволяє суб’єкту не відповідати за комунікацію, оскільки вона здійснюється ШІ, а не самим суб’єктом.

Цю думку можна розвинути далі в контексті «галюцинацій»: людське несвідоме часто проявляється у снах, обмовках і творчих процесах, які свідомість контролює не повністю. Аналогічно «галюцинації» ШІ є генерацією контенту, який не повністю контролюється закладеними алгоритмами. А точніше, можна припустити, що і несвідоме має свої латентні методи зміни у системі психіки, тому галюцинації ШІ як видимий збій поверхневих алгоритмів — це демонстрація роботи субалгоритмів. Я маю на увазі, що досвід несвідомої свідомості недоступний, ми навчилися інтерпретувати його з часом, але спочатку це було не так. Так і галюцинації ШІ — це певне відображення «проблеми вирівнювання» статистичних алгоритмів з несвідомим ШІ. Проблема стає ще складнішою, коли до цієї формули додається інтерпретація «Іншого» (Autre у Лакана). Люди та ШІ по-різному інтерпретують явища: homo conscious — людина свідома — покладається на контекст і культурні знання, тоді як ШІ спирається на статистичні закономірності. Простіше кажучи, те, що для нас є інформацією, для ШІ лише дані. Ця примордіальна поняттєва різниця створює певний розрив у розумінні ШІ. Тому ШІ як простір «Іншого» не може володіти відповідальністю, тому що не може бути повністю зрозумілим нами.
Справді, ви можете уявити, як бути штучним інтелектом?


Моє останнє «вторгнення» полягає в тому, що ШІ слід розглядати не лише як цифровий мозок у контексті сучасного розвитку нейронаук, а й як емульоване несвідоме. Цей підхід вимагає від нас меншої наукової суворості, оскільки питання свідомості та несвідомого, як показує практика, мають плідний розвиток саме тоді, коли до них не прикута надмірна увага вчених.

Ми повинні бути готові поставити питання про межі імітації ШІ. Наприклад, чи є суперечливі відомості (при недостатніх даних про реальність) необхідною властивістю заміщення у процесі побудови уявлень про світ штучним інтелектом? Або, можливо, найкраще, що ми можемо постулювати в цьому випадку — це визнати, що наявність помилки — це принцип прояву людської психіки. І хоча визнання повноцінної психіки у ШІ було б передчасним і необґрунтованим, визнання можливості імітації її елементів підтверджує початкову наслідувальну першооснову генеративного штучного інтелекту.

Слідом за Жижеком також важливо уточнити природу чат-ботів ШІ, як «несвідомого без відповідальності». Категоріально, проводячи певні опозиції людини як «свідомо-органічне» та ШІ як «несвідомо-штучне», ми маємо на увазі несвідоме ШІ не як свідомість зі знаком мінус, а як несвідоме без автономності, внаслідок його штучної, а не органічної природи. Звідси й випливає, що несвідоме у ШІ або «емульоване несвідоме» як спроба штучної репрезентації, не може нести відповідальність як таку.

Однак спочатку я планував розпочати цю статтю з припущення, що «галюцинації» ШІ є проявом емульованого несвідомого. Це важлива вхідна точка, тому що без неї неможливо повноцінно обговорювати існування цифрового несвідомого, але давайте домовимося, що «галюцинуючи», тобто помиляючись, ШІ не просто показує розрив у своєму розумінні світу, але оголює глибокі тріщини в нашому сприйнятті його роботи. Але саме глибина тріщин та розмір розривів реальності виявляє наше людське, як ніщо інше. Дискурс «Чи є ШІ несвідомим?» насправді відкриває нам нову точку входу у споконвічне запитання: «Чому ми відчуваємо себе людьми?», а пошук нових перспектив на подібні питання є каталізатором нашого існування. Тому, зазначимо останнє — чим більше ми досліджуємо імітований мозок, тим краще розуміємо свій власний.

Примітки:

  1. https://says.com/my/fun/meet-the-panda-that-grits-its-teeth-when-breaking-bamboo
  2. https://www.ibm.com/topics/ai-hallucinations
  3. Jean-Étienne Dominique Esquirol “Des maladies mentales considérées sous les rapports médical, hygiénique et médico-légal” 
  4. Sigmund Freud. (1899) The Interpretation of Dreams..
  5. https://www.thecollector.com/jacques-lacan-imaginary-symbolic-real
  6. https://sublationmedia.com/escaping-the-meta-verse/
  7. https://www.nytimes.com/2023/03/08/opinion/noam-chomsky-chatgpt-ai.html.
  8. https://sublationmedia.com/chatgpt-a-new-unconscious/
  9. https://sublationmedia.com/chatgpt-says-what-our-unconscious-radically-represses/
  10. Prof. Geoffrey Hinton – “Will digital intelligence replace biological intelligence?” Romanes Lecture
  11. Jacques Lacan. (1955-1956) Seminar III “Les Psychoses”.
  12. https://www.anthropic.com/news/mapping-mind-language-model
  13. https://thephilosophicalsalon.com/does-chatgpt-enjoy/  

Автор: Ілля Рєпін