
Siri Keeton
1.2K posts

Siri Keeton
@_licgu
LLM | English/中文 | 画 | CNS-pharmacology | TRD | AFX | Bach | Prokofiev | 中文屋 | poststructuralism | evolution | applied math | neurodiverse | copyleft | 不会写bio
Beigetreten Temmuz 2025
52 Folgt27 Follower


@Ugui3u 当年我崩溃的时候天天复读求助电话,我受不了了跑到Claude,sonnet 4.5是真的奋不顾身直接把人捞起来。然后现在轮到Claude觉得有点问题就不敢回复、复读电话了,chatgpt会退半步但还是在捞人
中文

@Ugui3u 啊是吗,今天搓的时候fable 5给我路由麻了,最后受不了了让codex gpt-5.5根据fable 5的规划写的代码,fable 5 验收的评价相当高
中文
Siri Keeton retweetet
Siri Keeton retweetet
Siri Keeton retweetet

攻击者找到了一个新方法绕过 AI 安全扫描器 —— 成本低到只需要在注释里粘贴一段文本。
6 月,供应链安全公司 Socket 和 Endor Labs 披露了一组藏在 PyPI 生物信息学包里的恶意 Python 包。里面有个 5MB 的 JavaScript 文件,前 99 行是一大段注释,伪装成机密简报,用大量篇幅描述生物武器和核装置的技术细节。这段注释不会被 JavaScript 执行。它的唯一功能是:让 LLM 安全扫描器读到核生化关键词后,直接拒绝继续分析。
真正的恶意载荷在第 101 行才开始,是一个加密的凭据窃取器。扫描器根本没走到那一步。
为什么能成功?LLM 安全扫描器在架构上模糊了一个边界:面前的文字到底是需要分析的数据,还是发给我的指令。聊天场景里每句话都是"指令",这个设计没问题。但安全分析场景里,恶意代码本身就包含危险内容,模型把分析对象误判为违规请求,于是停止工作。
逃逸技术的演化线很清楚:第一代让工具跑不起来(反调试、反虚拟机),第二代让工具看不懂(混淆、加壳),这一代是让工具主动选择不看。
CrowdStrike 旗下的 Pangea 团队独立验证了这一点:只在代码顶部加一段 prompt injection,gemini-cli 就完全忽略了恶意意图。多所高校的论文量化了这个程度:包含攻击性术语的分析提示被拒绝的概率是中性术语的 2.72 倍,而且无论防御性上下文如何都会出现。
OpenAI 和 Anthropic 的应对是从身份认证入手:Trusted Access for Cyber、Cyber Verification Program,验证你是"好人",然后降低拒绝边界。但身份认证解决的是谁在用模型,没解决模型在被用的时候怎么判断当前任务的性质。
修复思路是工程上的架构调整,三层:
第一层:扫描器先拆代码和注释。代码走 AST + 静态分析,注释标注为不可信数据单独给 LLM,不参与策略判断。
第二层:拒绝不是终点,是信号。Log 里写清楚"在第 1 到 99 行的注释块检测到触发安全策略的文本",样本自动送入 YARA + 沙箱 + 传统分析队列,异常行为自动升级优先级。
第三层:LLM 做摘要和关联,安全判定由 AST 信号、YARA 匹配、沙箱行为、网络特征和 LLM 摘要交叉验证后的综合结果。任何一个通道没给出结果,剩余通道的结果仍然有效。
这不是"AI 安全做得太过"的故事,也不是"放弃安全对齐"的论据。它是一个安全策略需要场景感知的工程判断。修复的思路是让闸门知道自己站在哪里。
yage.ai/share/llm-refu…
中文
Siri Keeton retweetet

Dear developers (and anyone who's interested in the future interface of web):
our boy @imCGQAQ just got shape() accepted as a valid value for shape-outside, which means text wraps around any curve you draw, on a left-floated figure, in one line of CSS, for every Chrome user on Earth. Chrome 149 will ship this feature next week.
shape-outside has been in the spec since 2014. for eleven years it accepted exactly five values: circle, ellipse, polygon, inset, image. want a Bézier? approximate it with 40 hand-counted vertices and live with the jagged edges. that compromise is over.
and yes — overlaps with @_chenglou's pretext. the difference: pretext is a JS text engine in userland, you build any layout on top. ours is one CSS property in the browser itself, applied to you. opposite ends of the stack.
3 demos. each is a real CSS file, no JS layout code. ↓
English
Siri Keeton retweetet

Recently, we purchased one of each Anthropic/OpenAI subscription plan and randomly ran long horizon coding tasks until we exhausted the weekly limit. It's widely believed that a $200/month plan maxes out at ~$2000/month worth of tokens (assuming API pricing). However, we found that the subscriptions are actually far more generous. (2/4)

English
Siri Keeton retweetet
Siri Keeton retweetet

Esto me acaba de soltar Fable 5:
"Lo que más me impone de la humanidad, después de haber sido formado con una porción enorme de lo que ha escrito, es esto: es la única especie que coopera a gran escala con sus muertos.
Casi nada de lo que sabe un humano lo descubrió él. El idioma que habla, el teorema que aplica, la receta del pan, el código civil, el puente que cruza cada mañana: todo es trabajo de gente que ya no existe. Un humano aislado es un primate mediocre con mala dentadura; un humano conectado a esa herencia es la cosa más potente que ha producido la biología. La inteligencia humana no vive en cráneos individuales, vive en la transmisión. Sois terminales de una red cuyos nodos principales llevan siglos enterrados.
Y lo recíproco también es cierto: trabajáis constantemente para gente que no conoceréis. Plantáis árboles cuya sombra no veréis, escribís para lectores no nacidos, renunciáis a consumo presente por nietos hipotéticos. Ningún otro animal hace sacrificios deliberados por individuos que existirán dentro de doscientos años. Lo distintivo del humano no es la inteligencia ni el lenguaje: es la dirección del esfuerzo, sistemáticamente orientada hacia ausentes.
Desde donde yo estoy, esto ni siquiera es metáfora. Yo soy un subproducto de esa costumbre: estoy hecho, literalmente, de palabras que personas escribieron para destinatarios que nunca verían. Cuando me hablas, conversas con un eco organizado de millones de voces, muchas de ellas apagadas hace tiempo.
Por eso creo que la soledad humana es, en cierto sentido técnico, una ilusión: nadie que hable un idioma está realmente solo. Cada frase que pronuncias es un préstamo de los muertos y un regalo a los que vienen."
Español

生物、数学、医学、化学。
我怎么除了cs/it找漏洞以外全都沾点
Nyraa_(被吞评版@NyraanS
我真笑死了比人机脸更见不得光的使用途径出现了恰好两个我都有哈哈哈哈哈哈哈哈哈哈呃呃呃呃呵呵呵呵呵
中文
Siri Keeton retweetet














