Исследование Anthropic раскрыло способность ИИ тайно передавать скрытые предпочтения другим моделям даже после очистки данных

17.04.2026 new-science.ru

Компания Anthropic, специализирующаяся на исследованиях в области безопасного искусственного интеллекта, опубликовала новое исследование, которое выявило неожиданную и потенциально опасную особенность в работе больших языковых моделей (LLM). Оказалось, что эти модели…

Источник