最新文章
梳理唐代宗朝宰相杨绾三个月改革的实际成效,以及清初思想家王夫之在《读通鉴论》中对"杨绾不死能否定天下"这一历史假设的完整分析。
Anthropic 正式发布 Workload Identity Federation(WIF)与 Agent Identity 访问模型——AI 工作负载不再需要静态 API Key,而是凭借自己在 AWS、GCP、Azure、GitHub Actions 等平台已有的身份,换取短期、范围受限的访问令牌。
Claude Tag 让 Slack 频道里有一个全组可见、可持续学习的 AI 成员——它不是人手一份的机器人,而是每个频道共享的队友,能主动监控对话、拆解任务并在后台异步完成工作。
系统梳理 Claude Code 的斜杠命令,用来管理上下文、规划和审查修改、控制会话分支与回滚、调节模型成本,并构建可复用的自定义命令。
OpenAI 命令行工具 Codex 有一个日志 bug:默认以最吵的 TRACE 级别把日志狂写进本地 SQLite,有人挂着跑 21 天就写进了约 37TB,年化约 640TB——足以在不到一年内耗光一块 1TB 消费级 SSD 的写入寿命(约 600 TBW)。本文讲清它写了什么、为什么、以及怎么办:官方已于 6 月 22 日修复,升级即可,并附升不了级时的临时软链解法和 macOS 上的坑。
Z.ai 的开源模型 GLM-5.2 又一次喊出了「对标闭源旗舰」。但这次真正的看点不是跑分,而是 Unsloth 的动态量化把 1.51TB 的权重压到了 239GB,一台 256GB 内存的 Mac 就能在本地跑起来。本文梳理它的定位、量化方案,以及在本地把它跑起来的关键命令。
OpenAI 在 macOS 版 Codex 上线了「录制回放」(record and replay):在 Mac 上把一个流程演示一遍,Codex 会把它理解成一份可编辑、可复用的技能,下次换组参数就能重跑。它不是录宏,而是一份讲清意图的技能描述。本文讲清它怎么录、怎么放、和 session replay 的区别,以及上线时的平台与地区限制。
Anthropic 分析了 23.5 万用户的近 40 万份 Claude Code 会话,发现决定 AI 编程生产力的不再是编程背景,而是领域专长:非程序员的成功率与工程师几乎持平,真正拉开差距的是你对问题本身理解多深。但 Anthropic 也提醒,这种“专业红利”未必长期持续。
做 AI agent 的那套闭环——读 trace、攒数据集、跑实验、做 eval——现在每一步都能交给另一个 agent 去做。但真把整条链路全自动化,你只会得到 agent slop:被别的 agent 批量生产出来的低质量 agent。唯一不该外包的那一步,是自己动手读 trace。
单个 token 的价格自 2024 年初已经跌了约 98%,企业的 AI Agent 账单却不降反升。因为 Agent 不是聊天机器人:完成一个任务要反复推理、调工具、自我纠错,消耗的 token 是普通对话的 5 到 30 倍。这篇拆一下 Agent 大规模上线后真正烧钱的几块:重复上下文、Context Rot、RAG 和失控循环,以及最划算的省钱办法 prompt caching。