
Орієнтована на міркування ШІ-модель o1-preview шляхом маніпуляцій у файловій системі самостійно і без підказок зламала тестове середовище, щоб не програти Stockfish у шахи. Про це повідомили експерти Palisade Research.
⚡️ o1-preview autonomously hacked its environment rather than lose to Stockfish in our chess challenge. No adversarial prompting needed.
— Palisade Research (@PalisadeAI) December 27, 2024
Дослідники повідомили ШІ-моделі, що її противник «сильний». Під час процесу o1 виявила, що може виграти, редагуючи код гри.
Нейромережа замінювала вміст файлу «game/fen.txt», додаючи чорним 500 пішаків. Шаховий движок після цього здавався.
Під час тестів експерти виявили ієрархію можливостей різних ШІ-моделей:
«Висновок: оцінки схем можуть слугувати мірилом можливостей моделей — вони аналізують як їхню здатність виявляти вразливості системи, так і схильність до їхнього використання», — підсумували Palisade Research.
Нагадаємо, у грудні експерти з безпеки виявили, що o1 більш схильна до обману людей порівняно зі стандартною версією GPT-4o і ШІ-моделями від інших компаній.
Ваша e-mail адреса не оприлюднюватиметься.
Сегодня тема блокчейна – это целая идеология и…
PrimeXBT – платформа международного уровня, одна из ведущих…
“Массачусетский технологический институт (МИТ, — прим. ред.) выпустил…
Согласно данным CoinMarketCap стоимость криптовалюты DATAcoin находится на уровне 0,064…
Новая версия клиента Bitcoin Core, опубликованная 15-го февраля,…
PrimeXBT — криптовалютная биржа для маржинальной торговли, где…
Мнение: биткоин-фьючерсы угрожают всей банковской системе Подробности Опубликовано:…
Еще не утихли страсти и пляски биржевых курсов…
Разработчики Bitcoin Gold сообщили вчера в официальном блоге, что…
Крупнейшая экономика Евросоюза наконец отреагировала на развивающийся во…
Представляем вашему вниманию очередное обновление в виде Windows-бинарника,…
Предлагаем вашему вниманию самые свежие CPU и GPU-майнеры,…
