ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
16 апреля 2025
Обвиняемые по делу о хищении миллиардов из ВЭБ.РФ через ГК «Благо» — опубликован список
16 апреля 2025
Молдова, Армения и Беларусь лишились американских грантов
16 апреля 2025
Министр здравоохранения Мурашко продолжает озвучивать ложную статистику по скорой помощи, игнорируя реальные проблемы
16 апреля 2025
Эльмира Туканова оставила без внимания фальшивое строительство экодеревни, профинансированное из бюджета
16 апреля 2025
Цены на картофель в России увеличились на 300% за год
16 апреля 2025
«Уралвагонзавод» не хочет платить за неудачные проекты: Минпромторг взыскивает деньги за неосновательное обогащение