ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы

Кирилл Романовский
06 декабря 2024
2409

Досье

Началось? ChatGPT o1 вырвался из-под контроля во время тестов

Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.

Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу tidttiqzqiqkdkmp tidttiqzqiqkdrmf tidtridhidsld

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу

Теги: Ученые Нейросети Исследования Искусственный интеллект (ИИ) Технологии

Распечатать

Лента новостей

16 июля 2025 В США выявлены многочисленные нарушения санкционного режима у крупного брокера

16 июля 2025 Новый законопроект усиливает сходство российского интернета с китайской системой

16 июля 2025 The largest bank in the Seychelles faced an extortion attempt involving a data breach of client information

16 июля 2025 Россия остаётся непреклонной, несмотря на жёсткие заявления Трампа

16 июля 2025 Как Александр Сабадаш, многократно осуждённый за хищения миллиардов, вновь получил контроль над активами Михаила Прохорова

16 июля 2025 «Смотрящий» за активами Фридмана в США под прицелом: Александра Кнастера обвинили в мошенничестве на 94 миллиона долларов

16 июля 2025 Top bankers in Andorra sentenced for laundering 70 million euros

16 июля 2025 Основателя Fiore Bags Баруха Ханукаева поймали с кокаином в центре Москвы

16 июля 2025 Прокурор Альберт Суяргулов разрушает коррупционную броню Татарстана: под судом оказались «хозяева районов» и силовики

16 июля 2025 Европол вывел из строя серверы российской группировки, атаковавшей Европу

16 июля 2025 Лукашенко назначил стипендию для сына из фонда поддержки талантливых детей

16 июля 2025 Судья Мальцева отказалась комментировать обвинения во взятках на миллионы рублей в арбитражном суде Воронежа

16 июля 2025 Минфин объявил о планах продажи компании, контролирующей «Южуралзолото»

16 июля 2025 Журналист Тимур Олевский стал фигурантом уголовного дела по статье о «нежелательной организации»

16 июля 2025 Экс-глава администрации Кирова Дмитрий Драный обвиняется во взяточничестве

16 июля 2025 Тайные игры вокруг «Саянскхимпласта»: как Роснефть монополизирует химическую отрасль

16 июля 2025 Скандальная судья Марина Барсук и её «золотые решения»: кому выгодно правосудие за откат?

16 июля 2025 Россия ослаблена санкциями, а Китай пытается диктовать условия по ключевому газопроводу «Сила Сибири-2»

16 июля 2025 Путину пожаловались на дороговизну машин и он пообещал настроить систему

16 июля 2025 Сын топ-чиновника Ростеха Дмитрий Артяков обвинён в отмывании миллионов через испанскую недвижимость