Ученые обошли защиту нейросетей и научили ИИ выдавать фейки

Вера Цветова Автор статьи

Новый метод управления ответами больших языковых моделей разработала группа исследователей под руководством Михаила Белкина из Калифорнийского университета в Сан-Диего и Адита Радхакришнана из Массачусетского технологического института. Результаты опубликованы в журнале Science. Об этом пишет издание Pro Город Самара.

Проанализировав внутренние механизмы открытых моделей Llama и DeepSeek, специалисты выделили 512 понятий, структурированных по категориям. Математические методы позволили воздействовать на эти понятия и корректировать результаты работы моделей. Методика показала эффективность на разных языках, включая китайский и хинди.

В основе подхода — алгоритмы Recursive Feature Machines (RFM), ранее предложенные этой же командой. Разработчики считают, что технология поможет выявлять галлюцинации и повышать точность перевода кода между языками.

В ходе экспериментов удалось уменьшить влияние механизма отказа, который ранее приводил к выдаче недостоверных данных и поддержке конспирологических теорий. Авторы предупреждают: при неправильном использовании такие инструменты могут способствовать распространению ложной информации.

Работа ограничена открытыми моделями, коммерческие системы не тестировались. Набор понятий не охватывает все абстрактные категории, что требует дальнейших исследований. В научном сообществе продолжаются дискуссии о регулировании и этике применения подобных технологий.

Ученые обошли защиту нейросетей и научили ИИ выдавать фейки

Популярное

Препарат снижает токсичные белки при Альцгеймере

Из Астраханской области выдворили 46 нелегалов

Ихтиологи описали новый вид «ходячих» акул

Отдых на Черном море и гостиницы подорожали в Астраханской области

Оральная вакцина от рака кишечника на основе листерии: результаты

Конфискованный у астраханца кроссовер уехал от кредиторов к Минобороны

В Трусовском районе Астрахани назначили нового главу

В Югре обсудят модуль по критике ИИ для школьников

Учёные: в Испании 8000 лет назад детей кормили грудью до 5 лет

В Астраханской области начали сажать позднюю капусту

Астраханский студент создал защиту от квантовых взломов

Астрахань готовится к визиту Патриарха Кирилла

Учёные ИТМО создали биоферментатор для отходов

Жара до +33° и грозы: прогноз погоды в Астрахани на 18 июня

Сложная жизнь на Земле может продлиться на 500 млн лет дольше

МЧС предупредило астраханцев о резком ухудшении погоды

Землетрясение сдвинуло Японию

Вероятность мегаземлетрясения в Калифорнии достигла исторического максимума