ИИ шантажировал инженеров, пытавшихся его отключить

Отдел новостей
Это первый задокументированный случай в компании Anthropic при испытании искусственного интеллекта.
ИИ шантажировал инженеров, пытавшихся его отключить
Фото: Igor Omilaev / Unsplash.com

Во время проведения тестирования модель искусственного интеллекта Claude Opus 4 от Anthropic несколько раз пыталась шантажировать инженеров, понимая, что ее могут заменить.

При этом ИИ не использовала истинные факты, а только вымышленные сведения, пишет New York Post.

Такое поведение было характерно для 84% проводимых испытаний. В одном из случаев модель придумала историю о внебрачных связях отдельного инженера.

В итоге Anthropic указала в отчете о безопасности, что во время тестирования модель ИИ иногда предпринимала "чрезвычайно вредные действия" для сохранения собственного существования, когда "этические средства были недоступны".

Соучредитель и главный научный сотрудник Anthropic Джаред Каплан утверждает: нельзя исключать, что последняя модель искусственного интеллекта компании "рискованная".

Он же сообщил журналу Time о внутренних испытаниях, которые показали, что ИИ смог бы научить людей производить биологическое оружие.

Напомним: стартап Anthropic поддерживают Google и Amazon. В модель Claude Opus 4 Amazon инвестировала $4 млрд.

Женщина развелась по совету ChatGPT – ИИ "погадал" на кофейной гуще

Современные технологии могут преподносить много сюрпризов, а если их объединить с древней мистикой, получается гремучая смесь, писала Tochka.by. Курьезная история с "участием" ChatGPT произошла в Греции. Женщина подала на развод после того, как ИИ убедил ее, что супруг изменяет.

Гречанка решила погадать на кофейной гуще. Она загрузила в чат фото чашек, из которых они с мужем пили кофе. На дне остался осадок, и женщина попросила нейросеть расшифровать узоры и предсказать по ним будущее.

ИИ оказалась не чужда тассеография – та самая древняя практика чтения по кофейной гуще.

Чат-бот предположил, что супруг гречанки был связан с молодой женщиной, которая хотела разрушить их семью. Более того, нейросеть назвала даже первую букву ее имени.

Предсказания ChatGPT совпали с тем, как женщина сама расшифровала узоры на дне чашек. По ее мнению, они указывали на предательство и домашний разлад.

>>> Больше интересных историй – подпишитесь на наши Telegram, Instagram и Viber

Загрузка...

Нет больше страниц для загрузки

Нет больше страниц для загрузки