Может ли искусственный интеллект прочитать наши мысли
Мы склонны думать о своем разуме как о неприступной крепости. Другие люди видят наши внутренние мысли только тогда, когда мы переводим их в язык и посылаем в мир.
Однако ранее в этом месяце исследователи из Университета Остина устранили этот барьер между внутренним и внешним.
Вводя данные визуализации мозга в модель искусственного интеллекта, они уловили суть того, что их испытуемые слышали, видели и думали . По мере повышения точности технологии она может даже позволить общаться с людьми, которые парализованы или потеряли способность говорить по иной причине.
Технология чтения мыслей
В декодировании речи нет ничего нового. Но до сих пор он полагался на мозговые имплантаты, которые обнаруживают попытки человека формировать слова, а затем преобразовывают эти голосовые сигналы в язык.
Этот новый неинвазивный метод работает по-другому: он предсказывает слова на основе паттернов мозговой активности, не связанных напрямую с речью. Декодер не может точно угадать каждое слово, но общее сходство по смыслу все равно ошеломило его создателей.
«На самом деле мы получили очень хорошие пересказы», — говорит ведущий автор Александр Хут, специалист по вычислительной нейробиологии. «Это нас ошеломило».
Исследование, опубликованное в Nature Neuroscience , было сосредоточено на трех субъектах, каждый из которых провел 16 часов, слушая повествовательные подкасты, такие как « Мотылек » и «Современная любовь» , лежа в аппарате функциональной магнитно-резонансной томографии (фМРТ).
Сканер измерял приток крови к различным частям их мозга, показывая, какие части были активны в определенные моменты эпизодов подкаста. Затем большая языковая модель (более старая версия модели ChatGPT от OpenAI) сопоставляла слова, которые слышали испытуемые, с соответствующей активностью их мозга.
Декодер, появившийся в результате этого процесса, не мог подслушать ваш внутренний монолог как таковой, но после всей этой подготовки он стал хорошо знаком с состояниями мозга, вызываемыми определенным языком. В последующих сеансах фМРТ он смог воспроизвести мысль, основываясь исключительно на нейронных сигналах, которые произвела мысль.
Он по-прежнему регулярно ошибается в отдельных словах и фразах и борется с некоторыми аспектами грамматики, такими как местоимения и имена собственные. (Разве не все мы?) Но его способность переупаковывать суть сюжетной линии просто невероятна; он работает лучше, чем можно было бы ожидать по чистой случайности, в 70–80% случаев.
Сканирование мозга и чтение мыслей
Для многих экспертов тот факт, что фМРТ способна на такие подвиги, стал шоком. В конце концов, кровь течет намного медленнее, чем скорость, с которой активируются нейроны, что часто приводит к получению данных с низким разрешением.
Обратите внимание, как быстро слова проносятся в вашей голове — каждое МРТ-сканирование представляет несколько из них, однако предсказательная сила языковых моделей способна собрать мельчайшие детали о мыслях, закодированных в этом грубом процессе.
Тем не менее, у фМРТ есть и другие ограничения. Поскольку для этого требуется массивная машина, его нелегко вплести в повседневную жизнь.
Исследование указывает на возможность того, что другие методы визуализации мозга могут повторить успех фМРТ. Одним из претендентов является функциональная спектроскопия ближнего инфракрасного диапазона (fNIRS), которая измеряет ту же физиологическую реакцию, но достаточно мала, чтобы ее можно было встроить в шляпу.
Его разрешение хуже, чем у фМРТ, но когда исследователи размыли свои результаты до уровня fNIRS, они обнаружили, что декодирование все еще работает, хотя и менее точно. Более того, учитывая недавние темпы разработки больших языковых моделей, вполне возможно, что текущая и будущие версии будут работать намного лучше, даже с изображениями с более низким разрешением.
Модель GPT-1, использованная в этом исследовании, уже трижды заменялась. Возможно, GPT-4, на котором работает ChatGPT Plus, сможет достичь той же точности с fNIRS более низкого качества.
Визуализация мозга и конфиденциальность мыслей
Наиболее актуальное применение расшифровке – общение с людьми, лишившимися привычных средств связи. Но в долгосрочной перспективе некоторые эксперты считают, что эта технология может коренным образом изменить то, как мы все взаимодействуем с нашими устройствами.
Что, если бы у нас был компьютерный интерфейс, который был бы не клавиатурой, не мышью, а просто вашим мышлением? Вы просто представляете, где бы вы хотели поужинать сегодня вечером, и ваш телефон сделает заказ за вас .
Несмотря на потенциал этой технологии во благо, конечно, есть четкая оруэлловская нить в идее будущего, где злоумышленники могут прослушивать ваш мозг. Предвидя эти опасения, исследователи провели эксперименты на своей модели, чтобы проверить, можно ли ею злоупотреблять.
Одна из очевидных опасностей заключается в том, что следователи или авторитарные режимы могут использовать декодеры для получения информации от людей против их воли. Но поскольку эти модели должны тщательно обучаться на каждом отдельном человеке, они не могут извлечь ничего полезного без сотрудничества.
Даже когда декодер настроен на конкретного человека, этот человек может сопротивляться, например, выполняя вычисления в уме или перечисляя животных в уме.
Читайте наши статьи на Дзен