雾水
首页
归档
分类
友链
关于
Esc
归档
全部文章,按时间倒序排列
2026
05 / 28
我把自己难看的博客,重做成了一套「水墨风」Jekyll 主题(已开源)
技术
05 / 12
年中随想:离「AI 替我打工」到底还有多远
智能体
04 / 15
提示注入:智能体时代最被低估的安全坑
技术
03 / 20
端侧 AI:为什么大家都想把模型塞进你口袋
技术
02 / 14
推理模型:为什么「想得越久」反而越聪明
AI
01 / 18
年终盘点:这一年,Coding Agent 是怎么从玩具熬成同事的
智能体
2025
12 / 15
上下文工程:提示词工程的「成年版」
AI
11 / 20
Transformer 到底在干嘛?用「开会划重点」讲明白注意力机制
AI
10 / 16
大模型评测为什么这么难?——刷榜、过拟合与真实能力
AI
08 / 22
把大模型塞进生产环境:限流、降级与兜底的求生指南
技术
07 / 14
语义缓存:让重复的问题别再花第二次钱
技术
05 / 20
可观测性:你的 Agent 半夜偷偷烧了多少钱?
技术
04 / 09
评估驱动开发:给你的 AI 应用写「单元测试」
技术
03 / 12
开源 vs 闭源大模型:一场关于「护城河」的豪赌
AI
02 / 08
蒸馏与小模型:为什么「越做越小」反而成了趋势
AI
01 / 15
给 Agent 上权限:沙箱、审批,与「别把厨房点了」
智能体
2024
12 / 18
Agent 为什么总在第三步翻车?聊聊规划与自我纠错
智能体
11 / 28
MCP 协议:给智能体的世界修一条「普通话」
智能体
10 / 25
会操作电脑的 Agent:它真能替我点外卖吗?
智能体
09 / 18
大模型推理成本是怎么省下来的?(量化 / KV Cache / 批处理)
技术
08 / 15
自主 Agent vs 固定工作流:别再为「智能」交智商税
智能体
07 / 20
多智能体协作:一群 AI 凑一桌,是开会还是吵架?
智能体
06 / 30
修复 GitLab 报错:right sibling's left-link doesn't match
fix
06 / 12
给 Agent 装上记忆:短期、长期,与「失忆」的艺术
智能体
05 / 16
多模态:当模型既能看图、又能听声、还能贫嘴
AI
04 / 10
RAG 已死?我帮你把「长上下文 vs 检索增强」这场嘴仗讲明白
AI
02 / 28
上下文窗口飙到 100 万了,然后呢?
AI
02 / 20
老友记
movie
02 / 18
Nginx 分治
闲谈
2023
12 / 20
给应用接上大模型:一次请求的完整奇幻漂流
技术
11 / 15
为什么 AI 是一个字一个字往外蹦的?聊聊流式输出
技术
10 / 22
ReAct:让 AI「边想边做」,而不是想完再后悔
智能体
09 / 10
微调、RAG、还是提示词?三条路别走错
AI
09 / 01
格雷欣的观察
生活
08 / 14
Embedding:把世间万物压缩成一串数字
AI
07 / 18
向量数据库:把「意思相近」变成「距离相近」
技术
06 / 25
Function Calling:让只会动嘴的大模型,学会动手用锤子
智能体
05 / 12
大模型为什么总爱「一本正经地胡说八道」
AI
04 / 18
人人都在喊 AI Agent,它到底是不是新瓶装旧酒?
智能体
03 / 20
提示词工程是不是玄学?——能复现的才配叫工程
AI
02 / 15
大模型的 token 到底是什么?为什么张口闭口都在跟你算钱
AI