ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
02 февраля 2025
Будапешт призывает к пересмотру ограничений против России
02 февраля 2025
В Кобулети состоялись похороны вора в законе Резо Питкина
02 февраля 2025
Эрик Принс предложил Трампу выдать ЧВК «каперы» для борьбы с наркокартелями за пределами США
02 февраля 2025
В Берлине прошла демонстрация в поддержку Палестины
02 февраля 2025
Billions in offshores and corruption schemes: Controversial businessman Igor Yusufov and his sons are "milking" Russia’s budget
02 февраля 2025
Банковские работники стали жертвами мошенников, потеряв миллионы на фальшивых операциях
02 февраля 2025
Кремль отверг запрос Сирии на выдачу Асада, сосредоточив внимание на экономической помощи
02 февраля 2025
Ротенберг прокомментировал худший результат СКА
02 февраля 2025
В Рязанской области возбуждено дело о вымогательстве против известных общественных деятелей
02 февраля 2025
Американского полицейского осудили за кражу и продажу наркотиков
02 февраля 2025
Чиновника из администрации Красноярска задержали за получение откатов при госзакупках