最近有人在问我:AI编程到底到了哪一步?是噱头还是真能干活?

我的回答是:看你用什么工具。

今天聊两个本周在GitHub上爆火的项目,一个解决了”AI不懂你的代码库”的痛点,另一个解决了”AI写代码像无头苍蝇”的问题。我自己都在用,感受很真实。


先说背景:AI编程的两大尴尬

用过AI编程工具的人,大概都踩过两个坑:

坑一:AI读不懂你的项目。

你问它”这个函数调用了哪些地方”,它开始猜。你问它”改这个接口会影响哪些服务”,它说”建议你全局搜索一下”。本质上,大多数AI编程工具对代码的理解是”文件级”的——它能看到一个个文件的内容,但理解不了文件之间、函数之间、服务之间的复杂调用关系。

坑二:AI写代码没有章法。

你让它实现一个功能,它上来就写。写到一半发现需求理解错了,推倒重来。或者写完了才发现没写测试,回头补。更惨的是,它在一个文件里改了一通,结果把别的地方搞炸了。没有设计、没有计划、没有质量把控——像个刚毕业的新人,热情有余,章法不足。

这周GitHub Trending上爆火的两个项目,正好分别解决了这两个问题。


codebase-memory-mcp:给AI装上”代码地图”

先说数据:**一天涨星2300+**,在今天的GitHub Trending上排名第一。

这个项目叫 codebase-memory-mcp,来自 DeusData。一句话概括:把你的整个代码库索引成一个知识图谱,让AI通过这个图谱来理解代码。

这听起来像是”又做了一个代码搜索工具”?不是。

传统的AI编程工具理解代码的方式,基本上是”读文件”。你问一个问题,它把相关文件读一遍,然后回答。问题是,一个中大型项目动辄几十上百个文件,AI不可能全部读完——token成本太高,速度也太慢。

codebase-memory-mcp 的做法是:用 tree-sitter 对代码做语法解析(支持158种语言),然后把函数、类、调用链、HTTP路由、跨服务链接这些结构信息全部提取出来,存成一个持久化的知识图谱。AI查这个图谱,一次查询不到1毫秒,消耗的token只有原来的不到1%。

项目给出了一个对比数据:5个结构性查询,用知识图谱大约消耗3400个token;如果用传统的文件搜索方式,大约要412000个token。差了120倍。

这是什么概念?如果你的项目有几十万行代码,用传统方式AI基本上是”盲人摸象”——每次只能看到局部,理解不了全局。而有了知识图谱,AI可以在毫秒级别回答”这个函数被谁调用了”、”改动这个接口影响范围有多大”、”哪些代码是死代码”这类结构性问题。

几个让我觉得有意思的设计:

Hybrid LSP 语义类型推断。 不仅仅做语法解析,还结合了LSP(语言服务器协议)来做类型推断。这意味着它不仅知道”这里调用了foo”,还知道”foo的返回值是Bar类型,被传给了baz”。对于Python、TypeScript、Go、Rust等主流语言都支持。

基础设施即代码索引。 Dockerfile、K8s manifests、Kustomize都能索引,还会建立交叉引用。这对DevOps来说很实用——你能追踪一个K8s资源被哪些服务引用。

一键安装,零依赖。 单个静态二进制文件,macOS/Linux/Windows全平台支持。不用装Docker,不用配环境变量,下载、安装、重启AI——完事。它还能自动检测你装了哪些AI编程工具(Claude Code、Codex CLI、Gemini CLI、Zed、OpenClaw等11种),自动配置好MCP连接。

本地处理,代码不上传。 所有解析都在本地完成。对于公司项目来说,这点很关键。

当然,也有需要观望的地方:项目的论文预印本(arXiv:2603.27277)显示在31个真实仓库上评测,答案质量83%。这个数字还不错,但31个仓库的样本量不算大,在更复杂的生产环境里表现如何还需要验证。

另外,它本质上还是一个”只读”工具——帮你理解代码,但不会帮你改代码。真正写代码的时候,你还需要另一个维度的工具。

这就引出了今天的第二个项目。


Superpowers:给AI编程装上”SOP”

**一天涨星1400+**,同时在Claude、Codex、Cursor、Gemini等主流AI编程工具的插件市场都能直接装。

Superpowers 来自 obra,定位是”AI编程的完整方法论框架”。如果说 codebase-memory-mcp 解决的是”AI看不懂代码”的问题,Superpowers 解决的是”AI写代码没章法”的问题。

它的核心理念很简单:不要让AI直接写代码,先让它搞清楚要干什么。

听起来像废话?但大多数AI编程工具的工作方式就是:你说一句”帮我做个登录功能”,它直接开始撸代码。做到一半发现没考虑密码加密,又重来。做完了发现没写测试,再补。来回折腾,代码质量还没保证。

Superpowers 定义了一套强制流程,分几个阶段:

第一阶段:头脑风暴。 AI不会急着写代码,而是先问你:”你到底要做什么?”通过多轮对话,把模糊的需求变成清晰的设计文档。然后分块展示给你确认——不会一次性甩一个5000字的设计文档让你看完。

第二阶段:制定计划。 设计确认后,AI把工作拆成2-5分钟的小任务,每个任务有明确的文件路径、完整的代码、验证步骤。这份计划详细到”一个热情但品味一般、没有项目上下文、不爱写测试的初级工程师”都能跟着做。

第三阶段:子代理执行。 你说”开始”,AI启动子代理(subagent)来逐个执行任务。每个子代理完成一个任务后,会有两轮审查——第一轮检查是否符合规格,第二轮检查代码质量。问题严重的会阻止后续任务。据说AI可以连续自主工作几个小时不跑偏。

第四阶段:收尾。 跑测试、合并分支、清理工作区。

还有贯穿全程的TDD(测试驱动开发):先写失败的测试,看它失败,写最小代码让测试通过,提交。如果你先写了代码再补测试,它会强制删掉——逼你走RED-GREEN-REFACTOR的流程。

这套方法论最妙的地方在于:它是自动触发的。 你不需要手动调用什么命令,只要Superpowers检测到你在做开发,它就会自动启动这套流程。装了插件之后,你的AI编程工具就”自动拥有”了这些能力。

我现在自己就在用类似的技能框架(OpenClaw的skills系统),体感上最大的变化是:AI不再是一个”你说一句它做一步”的工具,而是变成一个有方法论、有节奏的协作者。它会在你冲动的时候拉住你说”等等,我们先想清楚再动手”。


两个项目放在一起看:AI编程的下一站

把 codebase-memory-mcp 和 Superpowers 放在一起,你会发现一个趋势:AI编程正在从”辅助补全”走向”工程化协作”。

过去两年,AI编程工具的核心卖点都是”补全代码”——你写一行,它补三行。Cursor、GitHub Copilot、通义灵码,基本上都是这个路线。但补全解决的是效率问题,不解决质量问题。

现在的新一代工具开始在更高层面发力:

  • 理解层面(codebase-memory-mcp):让AI真正理解项目结构,而不是逐文件扫描
  • 流程层面(Superpowers):让AI遵循软件工程方法论,而不是随心所欲地写

当这两个层面都成熟了,AI编程才真正有可能从”好用”变成”可靠”。

不过,也有个现实问题:这套组合的学习成本不低。 codebase-memory-mcp 虽然安装简单,但你需要理解知识图谱、MCP协议、tree-sitter这些概念才能发挥它全部潜力。Superpowers 更是需要你对TDD、子代理模式有一定认知。对于刚接触AI编程的开发者来说,门槛还是偏高。

但对于认真想用AI提升代码质量的开发者来说,这两个项目值得花时间研究。它们代表的不是某个功能点,而是一种新的工作方式。


我的判断

说实话,用了几个月AI编程工具后,我最大的感悟是:AI不是来取代程序员的,而是来淘汰”不用AI的程序员”的。

但更准确的说法是:用好了AI工具的程序员,会淘汰没用好的。

codebase-memory-mcp 解决的是”AI对项目的认知带宽”问题——从文件级跃升到架构级。Superpowers 解决的是”AI的开发纪律”问题——从随意编码跃升到工程化流程。这两个方向,可能就是未来一年AI编程工具赛道的核心战场。

如果你正在找一个能深度理解代码库的AI工具,试试 codebase-memory-mcp。如果你受够了AI写代码的混乱节奏,装个 Superpowers。

两个都开源,两个都不要钱。


参考链接

  1. codebase-memory-mcp 项目地址
    https://github.com/DeusData/codebase-memory-mcp

  2. codebase-memory-mcp 论文预印本
    https://arxiv.org/abs/2603.27277

  3. Superpowers 项目地址
    https://github.com/obra/superpowers

  4. Superpowers 招聘社区工程师(说明项目在认真做长期)
    https://primeradiant.com/jobs/superpowers-community-engineer/

  5. tree-sitter 官方网站
    https://tree-sitter.github.io/tree-sitter/