最新文章

杨绾之死与王夫之的"意难平":如果这位宰相不死,唐朝能否避免藩镇割据

梳理唐代宗朝宰相杨绾三个月改革的实际成效,以及清初思想家王夫之在《读通鉴论》中对"杨绾不死能否定天下"这一历史假设的完整分析。

阅读时长: 4 分钟
共 1621字
作者: eimoon.com

告别静态 API Key:Anthropic WIF 让 AI Agent 拥有自己的身份

Anthropic 正式发布 Workload Identity Federation(WIF)与 Agent Identity 访问模型——AI 工作负载不再需要静态 API Key,而是凭借自己在 AWS、GCP、Azure、GitHub Actions 等平台已有的身份,换取短期、范围受限的访问令牌。

阅读时长: 4 分钟
共 1611字
作者: longlikun

Anthropic 推出 Claude Tag:把 AI 队友真正请进你的 Slack 频道

Claude Tag 让 Slack 频道里有一个全组可见、可持续学习的 AI 成员——它不是人手一份的机器人,而是每个频道共享的队友,能主动监控对话、拆解任务并在后台异步完成工作。

阅读时长: 3 分钟
共 1303字
作者: longlikun

Claude Code Slash Commands 实战:更长会话、更稳改动、更可控成本

系统梳理 Claude Code 的斜杠命令,用来管理上下文、规划和审查修改、控制会话分支与回滚、调节模型成本,并构建可复用的自定义命令。

阅读时长: 14 分钟
共 6626字
作者: eimoon.com

Codex 的日志 bug 会写爆你的 SSD:21 天写进 37TB,已修复

OpenAI 命令行工具 Codex 有一个日志 bug:默认以最吵的 TRACE 级别把日志狂写进本地 SQLite,有人挂着跑 21 天就写进了约 37TB,年化约 640TB——足以在不到一年内耗光一块 1TB 消费级 SSD 的写入寿命(约 600 TBW)。本文讲清它写了什么、为什么、以及怎么办:官方已于 6 月 22 日修复,升级即可,并附升不了级时的临时软链解法和 macOS 上的坑。

阅读时长: 3 分钟
共 1198字
作者: longlikun

GLM-5.2:对标 Claude 4.8 Opus 的开源模型,居然能塞进一台 Mac 本地跑

Z.ai 的开源模型 GLM-5.2 又一次喊出了「对标闭源旗舰」。但这次真正的看点不是跑分,而是 Unsloth 的动态量化把 1.51TB 的权重压到了 239GB,一台 256GB 内存的 Mac 就能在本地跑起来。本文梳理它的定位、量化方案,以及在本地把它跑起来的关键命令。

阅读时长: 4 分钟
共 1817字
作者: longlikun

Codex 录制回放:演示一遍,AI 就把流程学成可复用技能

OpenAI 在 macOS 版 Codex 上线了「录制回放」(record and replay):在 Mac 上把一个流程演示一遍,Codex 会把它理解成一份可编辑、可复用的技能,下次换组参数就能重跑。它不是录宏,而是一份讲清意图的技能描述。本文讲清它怎么录、怎么放、和 session replay 的区别,以及上线时的平台与地区限制。

阅读时长: 3 分钟
共 1421字
作者: longlikun

AI 时代的核心壁垒:40 万份 Claude Code 会话,与正在发生的“软件逆转”

Anthropic 分析了 23.5 万用户的近 40 万份 Claude Code 会话,发现决定 AI 编程生产力的不再是编程背景,而是领域专长:非程序员的成功率与工程师几乎持平,真正拉开差距的是你对问题本身理解多深。但 Anthropic 也提醒,这种“专业红利”未必长期持续。

阅读时长: 7 分钟
共 3497字
作者: longlikun

AI 正在吞掉 AI 工程闭环——但全自动只会喂出一堆 agent slop

做 AI agent 的那套闭环——读 trace、攒数据集、跑实验、做 eval——现在每一步都能交给另一个 agent 去做。但真把整条链路全自动化,你只会得到 agent slop:被别的 agent 批量生产出来的低质量 agent。唯一不该外包的那一步,是自己动手读 trace。

阅读时长: 4 分钟
共 1671字
作者: longlikun

Token 都降价 98% 了,为什么 AI Agent 的账单还在涨?

单个 token 的价格自 2024 年初已经跌了约 98%,企业的 AI Agent 账单却不降反升。因为 Agent 不是聊天机器人:完成一个任务要反复推理、调工具、自我纠错,消耗的 token 是普通对话的 5 到 30 倍。这篇拆一下 Agent 大规模上线后真正烧钱的几块:重复上下文、Context Rot、RAG 和失控循环,以及最划算的省钱办法 prompt caching。

阅读时长: 5 分钟
共 2020字
作者: longlikun