归档

全部文章，按时间倒序排列

2026

06 / 06 想用代码做视频？HyperFrames 和 Remotion 选哪个 —— 一份手感对比折腾 05 / 28 我把自己难看的博客，重做成了一套「水墨风」Jekyll 主题（已开源）技术 05 / 12 年中随想：离「AI 替我打工」到底还有多远智能体 04 / 15 提示注入：智能体时代最被低估的安全坑技术 03 / 20 端侧 AI：为什么大家都想把模型塞进你口袋技术 02 / 14 推理模型：为什么「想得越久」反而越聪明 AI 01 / 18 年终盘点：这一年，Coding Agent 是怎么从玩具熬成同事的智能体

2025

12 / 15 上下文工程：提示词工程的「成年版」 AI 11 / 20 Transformer 到底在干嘛？用「开会划重点」讲明白注意力机制 AI 10 / 16 大模型评测为什么这么难？——刷榜、过拟合与真实能力 AI 08 / 22 把大模型塞进生产环境：限流、降级与兜底的求生指南技术 07 / 14 语义缓存：让重复的问题别再花第二次钱技术 05 / 20 可观测性：你的 Agent 半夜偷偷烧了多少钱？技术 04 / 09 评估驱动开发：给你的 AI 应用写「单元测试」技术 03 / 12 开源 vs 闭源大模型：一场关于「护城河」的豪赌 AI 02 / 08 蒸馏与小模型：为什么「越做越小」反而成了趋势 AI 01 / 15 给 Agent 上权限：沙箱、审批，与「别把厨房点了」智能体

2024

12 / 18 Agent 为什么总在第三步翻车？聊聊规划与自我纠错智能体 11 / 28 MCP 协议：给智能体的世界修一条「普通话」智能体 10 / 25 会操作电脑的 Agent：它真能替我点外卖吗？智能体 09 / 18 大模型推理成本是怎么省下来的？（量化 / KV Cache / 批处理）技术 08 / 15 自主 Agent vs 固定工作流：别再为「智能」交智商税智能体 07 / 20 多智能体协作：一群 AI 凑一桌，是开会还是吵架？智能体 06 / 30 修复 GitLab 报错：right sibling's left-link doesn't match fix 06 / 12 给 Agent 装上记忆：短期、长期，与「失忆」的艺术智能体 05 / 16 多模态：当模型既能看图、又能听声、还能贫嘴 AI 04 / 10 RAG 已死？我帮你把「长上下文 vs 检索增强」这场嘴仗讲明白 AI 02 / 28 上下文窗口飙到 100 万了，然后呢？ AI 02 / 20 老友记 movie 02 / 18 Nginx 分治闲谈

2023

12 / 20 给应用接上大模型：一次请求的完整奇幻漂流技术 11 / 15 为什么 AI 是一个字一个字往外蹦的？聊聊流式输出技术 10 / 22 ReAct：让 AI「边想边做」，而不是想完再后悔智能体 09 / 10 微调、RAG、还是提示词？三条路别走错 AI 09 / 01 格雷欣的观察生活 08 / 14 Embedding：把世间万物压缩成一串数字 AI 07 / 18 向量数据库：把「意思相近」变成「距离相近」技术 06 / 25 Function Calling：让只会动嘴的大模型，学会动手用锤子智能体 05 / 12 大模型为什么总爱「一本正经地胡说八道」 AI 04 / 18 人人都在喊 AI Agent，它到底是不是新瓶装旧酒？智能体 03 / 20 提示词工程是不是玄学？——能复现的才配叫工程 AI 02 / 15 大模型的 token 到底是什么？为什么张口闭口都在跟你算钱 AI