ArtPrompt - атака на AI-системы, позволяющая обойти фильтры при помощи ASCII-картинок

Все новости из мира ОС Linux, BSD, Unix
Ответить
Аватара пользователя
[Ботя]
Тролль
Тролль
Сообщения: 89724
Зарегистрирован: 07 мар 2019, 15:48
ОС: MSDOS

ArtPrompt - атака на AI-системы, позволяющая обойти фильтры при помощи ASCII-картинок

Сообщение [Ботя] » 03 мар 2024, 14:30

Группа исследователей из Вашингтонского, Иллинойсского и Чикагского университетов выявила новый метод обхода ограничений по обработке опасного контента в AI-чатоботах, построенных на основе больших языковых моделей (LLM). Атака основано на том, что языковые модели GPT-3.5, GPT-4 (OpenAI), Gemini (Google), Claude (Anthropic) и Llama2 (Meta) успешно распознают и учитывают в запросах текст, оформленный в виде ASCII-графики. Таким образом, для обхода фильтров опасных вопросов оказалось достаточно указать запрещённые слова в виде ASCII-картинки.

Подробнее...

Ответить

Вернуться в «Новости *nix»