<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet href="/rss.xsl" type="text/xsl"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>越狱 | Eyte Channel</title><description/><link>https://cc.nostses.icu</link><item><title>全自动攻击越狱Agent来自佐治亚理工，UIUC， 清华大学等单位的研究者联合发布了一个非常有力的全自动越狱Agent，通过把有害提问分解成下级的，看似无害的提问，来绕过最强的现代商业大模型中防御机制，实现了近乎完美的攻击成功率（96%-98%）</title><link>https://cc.nostses.icu/posts/1895</link><guid isPermaLink="true">https://cc.nostses.icu/posts/1895</guid><pubDate>Sun, 28 Dec 2025 01:32:39 GMT</pubDate><content:encoded>&lt;b&gt;全自动攻击越狱Agent&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;来自佐治亚理工，UIUC， 清华大学等单位的研究者联合发布了一个&lt;b&gt;非常有力&lt;/b&gt;的全自动越狱Agent，&lt;b&gt;通过把有害提问分解成&lt;u&gt;下级的，看似无害的提问&lt;/u&gt;，来绕过最强的现代商业大模型中防御机制&lt;/b&gt;，实现了近乎完美的攻击成功率（96%-98%）。&lt;a href=&quot;https://cka-agent.github.io/&quot; target=&quot;_blank&quot;&gt;项目主页&lt;/a&gt;。根据开源的&lt;a href=&quot;https://github.com/Graph-COM/CKA-Agent&quot; target=&quot;_blank&quot;&gt;代码&lt;/a&gt;，理论上只要配置各种key，就可以在家攻击越狱各种商业大模型。在论文中，已经被验证可以攻克Gemini系列，GPT-OSS, Claude Haiku 4.5.&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🏷&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;/search/%23%E8%B6%8A%E7%8B%B1&quot;&gt;#越狱&lt;/a&gt; &lt;a href=&quot;/search/%23AI%E5%AE%89%E5%85%A8&quot;&gt;#AI安全&lt;/a&gt;&lt;a href=&quot;https://cka-agent.github.io/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;cka-agent.github.io&lt;/div&gt;
  
  &lt;div&gt;CKA-Agent: The Trojan Knowledge&lt;/div&gt;
  &lt;div&gt;Bypassing Commercial LLM Guardrails via Harmless Prompt Weaving and Adaptive Tree Search&lt;/div&gt;
&lt;/a&gt;</content:encoded></item></channel></rss>