Jason Zhou 分享了如何通过“上下文工程”(Context Engineering)和完善的文档系统,让 Claude Code 在复杂代码库中的表现提升10倍,干货满满,值得深度学习:
1. 上下文工程是关键
Claude Code 默认接收系统提示(System prompt)、系统工具、MCP工具、CLAUDE.md文档和消息。使用
2. 子代理(Sub-agent)管理上下文
子代理适合只读任务(如调研),能将大量信息浓缩成关键摘要,帮助主代理聚焦核心内容,避免上下文爆炸。
3. 高效的文档系统至关重要
Jason推荐建立
- System:项目结构、技术栈、数据库模式、关键模块
- SOP:常见错误及最佳实践流程
- Tasks:产品需求文档(PRD)
- README:文档总目录,支持管理大型代码库
这个结构借鉴了 Manus 的本地缓存上下文卸载思路,能处理复杂项目。
4. 自动更新文档
设计
5. 实践案例:管理遗留代码库
@ODMtweets 分享了用类似方法管理基于 WordPress 的大规模遗留代码库。为每个类生成文档,并配合定制代理模式,显著提升了代理对旧代码的理解和操作效率。
上下文工程改变游戏规则:合理设计上下文不仅提升效率,还能让初级开发者产出接近资深水平。
- 文档驱动开发(DDD)落地:结合PRD和细化任务计划,让AI协助代码实现与评审,形成闭环。
- 防止提示漂移:保持文档即时更新和子代理分工,避免上下文信息丢失或偏离目标。
- 成本与收益权衡:更智能的上下文管理虽增加计算成本,但带来的开发效率提升远超投入。
1. 上下文工程是关键
Claude Code 默认接收系统提示(System prompt)、系统工具、MCP工具、CLAUDE.md文档和消息。使用
/context 指令可以查看上下文结构,合理设计上下文能极大提升代码智能生成质量。2. 子代理(Sub-agent)管理上下文
子代理适合只读任务(如调研),能将大量信息浓缩成关键摘要,帮助主代理聚焦核心内容,避免上下文爆炸。
3. 高效的文档系统至关重要
Jason推荐建立
.agent 文件夹,包含:- System:项目结构、技术栈、数据库模式、关键模块
- SOP:常见错误及最佳实践流程
- Tasks:产品需求文档(PRD)
- README:文档总目录,支持管理大型代码库
这个结构借鉴了 Manus 的本地缓存上下文卸载思路,能处理复杂项目。
4. 自动更新文档
设计
/update-doc 命令,代理每完成关键功能或修正错误后自动更新文档,保持知识库与代码同步,防止“上下文漂移”。5. 实践案例:管理遗留代码库
@ODMtweets 分享了用类似方法管理基于 WordPress 的大规模遗留代码库。为每个类生成文档,并配合定制代理模式,显著提升了代理对旧代码的理解和操作效率。
上下文工程改变游戏规则:合理设计上下文不仅提升效率,还能让初级开发者产出接近资深水平。
- 文档驱动开发(DDD)落地:结合PRD和细化任务计划,让AI协助代码实现与评审,形成闭环。
- 防止提示漂移:保持文档即时更新和子代理分工,避免上下文信息丢失或偏离目标。
- 成本与收益权衡:更智能的上下文管理虽增加计算成本,但带来的开发效率提升远超投入。
OpenAI ChatKit 是一个开箱即用的聊天框架,帮你快速集成高质量、AI 驱动的对话体验。无论是客服、智能助理还是社交应用,只需简单配置,就能拥有流畅自然的聊天界面和强大功能。| #框架
主要亮点:
- 完全可定制的UI,自然融入你的应用
- 支持响应流,打造交互式会话体验
- 内置工具和工作流集成,支持智能推理和多步骤操作
- 丰富的交互组件,支持文件和图片上传
- 线程和消息管理,轻松组织复杂对话
- 来源注释与实体标注,保证透明度和引用准确
只需几步,添加 ChatKit 组件,连接客户端令牌,就能快速上线,省时又高效。
主要亮点:
- 完全可定制的UI,自然融入你的应用
- 支持响应流,打造交互式会话体验
- 内置工具和工作流集成,支持智能推理和多步骤操作
- 丰富的交互组件,支持文件和图片上传
- 线程和消息管理,轻松组织复杂对话
- 来源注释与实体标注,保证透明度和引用准确
只需几步,添加 ChatKit 组件,连接客户端令牌,就能快速上线,省时又高效。
PrimisAI Nexus 是一款强大灵活的 Python 框架,专为多智能体系统和大型语言模型(LLM)驱动的复杂任务编排设计。它支持创建多层级主管和助理主管结构,自动管理对话历史和日志,支持结构化输出和YAML配置,轻松实现任务分工和多智能体协作。| #框架
核心优势:
- 统一管理多智能体,支持主控与助理主管分层协作
- 内置持久化历史记录,保证会话连续性和复现性
- 灵活配置LLM参数,支持自定义模型调用
- 支持通过MCP协议集成远程或本地工具服务器,实现智能体功能扩展
- 可使用YAML文件定义复杂智能体架构,方便快速部署和修改
- 丰富调试与日志功能,助力开发与问题排查
适合 AI 研究者、开发者以及需要复杂自动化任务管理的团队。
#资源参考 #AI框架 #PrimisAI Nexus
核心优势:
- 统一管理多智能体,支持主控与助理主管分层协作
- 内置持久化历史记录,保证会话连续性和复现性
- 灵活配置LLM参数,支持自定义模型调用
- 支持通过MCP协议集成远程或本地工具服务器,实现智能体功能扩展
- 可使用YAML文件定义复杂智能体架构,方便快速部署和修改
- 丰富调试与日志功能,助力开发与问题排查
适合 AI 研究者、开发者以及需要复杂自动化任务管理的团队。
#资源参考 #AI框架 #PrimisAI Nexus
ollm:在仅8GB显存的GPU上,利用SSD卸载技术运行超大语言模型(LLM)并支持10万token上下文,无需量化处理。这意味着即使硬件受限,也能处理海量上下文数据。
🔹 速度约为0.5 token/秒,虽不适合实时交互,但适合非实时、离线或后台任务。
🔹 这种做法对SSD寿命有较大影响,需权衡性能与硬件耐用性。
🔹 业内讨论关注点:
- 是否值得牺牲SSD寿命换取超大上下文?
- 未来能否结合新内存扩展技术(如三星CXL DRAM扩展)实现更高效方案?
- 量化与混合硬件策略是否更实用?
这项技术拓宽了超大模型的部署边界,尤其适合资源有限但需要处理海量上下文的场景。未来优化空间巨大,值得持续关注。
当前主流LLM部署受限于显存大小,SSD卸载为“显存瓶颈”提供了新思路,但速度和硬件磨损是现实挑战。结合硬件创新(如CXL内存扩展)与软件优化(量化、分布式推理),未来或能实现高效、耐用的超长上下文推理,为复杂任务提供更强支持。
🔹 速度约为0.5 token/秒,虽不适合实时交互,但适合非实时、离线或后台任务。
🔹 这种做法对SSD寿命有较大影响,需权衡性能与硬件耐用性。
🔹 业内讨论关注点:
- 是否值得牺牲SSD寿命换取超大上下文?
- 未来能否结合新内存扩展技术(如三星CXL DRAM扩展)实现更高效方案?
- 量化与混合硬件策略是否更实用?
这项技术拓宽了超大模型的部署边界,尤其适合资源有限但需要处理海量上下文的场景。未来优化空间巨大,值得持续关注。
当前主流LLM部署受限于显存大小,SSD卸载为“显存瓶颈”提供了新思路,但速度和硬件磨损是现实挑战。结合硬件创新(如CXL内存扩展)与软件优化(量化、分布式推理),未来或能实现高效、耐用的超长上下文推理,为复杂任务提供更强支持。
AI工程不断迭代升级,想掌握LLM、RAG和智能代理的实战技巧?
AI Engineering Hub 是一个集深度教程与实战案例于一体的开源项目,覆盖大语言模型、检索增强生成、AI代理等前沿内容。无论你是入门者、开发者还是研究者,都能在这里找到丰富资源,助力项目落地和技能提升。
主要特色:
- 系统讲解大型语言模型(LLM)和检索增强生成(RAG)技术
- 丰富的AI智能代理实战案例,展示真实业务应用
- 详细示例代码,方便快速上手和二次开发
- 免费数据科学电子书赠送,涵盖150+核心课程,订阅即得
#资源参考 #AI Engineering Hub #LLM #RAG #AI前沿内容
AI Engineering Hub 是一个集深度教程与实战案例于一体的开源项目,覆盖大语言模型、检索增强生成、AI代理等前沿内容。无论你是入门者、开发者还是研究者,都能在这里找到丰富资源,助力项目落地和技能提升。
主要特色:
- 系统讲解大型语言模型(LLM)和检索增强生成(RAG)技术
- 丰富的AI智能代理实战案例,展示真实业务应用
- 详细示例代码,方便快速上手和二次开发
- 免费数据科学电子书赠送,涵盖150+核心课程,订阅即得
#资源参考 #AI Engineering Hub #LLM #RAG #AI前沿内容
系统架构和扩展从来不是只靠理论就能掌握的事情。
《The Accidental CTO》由Subhash Choudhary亲述他如何从零基础到打造支撑百万店铺的Dukaan系统。
这不是枯燥的教科书,而是充满实战经验和幕后故事的系统设计手册:
- 从MVP快速迭代到大规模分布式流水线
- 复制、分片、缓存、队列的利弊权衡
- 观测性、容错设计和云成本管理的实战要点
- 真实生产环境中遇到的各种挑战与解决方案
无论你是工程师、架构师还是创业者,都能从这本书中学到如何将分布式系统从理论变成可用、可扩展、可维护的“活机器”。
#CTO #实践 #MVP
《The Accidental CTO》由Subhash Choudhary亲述他如何从零基础到打造支撑百万店铺的Dukaan系统。
这不是枯燥的教科书,而是充满实战经验和幕后故事的系统设计手册:
- 从MVP快速迭代到大规模分布式流水线
- 复制、分片、缓存、队列的利弊权衡
- 观测性、容错设计和云成本管理的实战要点
- 真实生产环境中遇到的各种挑战与解决方案
无论你是工程师、架构师还是创业者,都能从这本书中学到如何将分布式系统从理论变成可用、可扩展、可维护的“活机器”。
#CTO #实践 #MVP
日常工作、学习和创作中,信息海量且杂乱,如何高效整理和利用上下文成为挑战。
MineContext 是一个开源的主动式上下文感知AI助手,通过截屏和内容理解(未来支持多模态多源信息),实时捕获你的数字世界全貌,自动生成日/周总结、待办事项和活动记录,帮助你理清思路,提升效率。
主要功能:
- 自动截屏,持续捕捉你的数字工作环境,轻松收集海量上下文;
- 智能重现相关内容,创作时快速调取关键资料;
- 主动推送洞见和总结,让信息主动找上你;
- 本地存储,隐私安全有保障;
- 支持多API接入,灵活定制,完美贴合你的需求。
适合知识工作者、内容创作者、项目经理等多种角色。无需频繁切换工具,MineContext让你的数字生活更智能、更高效。
#资源参考 #AI #开源
MineContext 是一个开源的主动式上下文感知AI助手,通过截屏和内容理解(未来支持多模态多源信息),实时捕获你的数字世界全貌,自动生成日/周总结、待办事项和活动记录,帮助你理清思路,提升效率。
主要功能:
- 自动截屏,持续捕捉你的数字工作环境,轻松收集海量上下文;
- 智能重现相关内容,创作时快速调取关键资料;
- 主动推送洞见和总结,让信息主动找上你;
- 本地存储,隐私安全有保障;
- 支持多API接入,灵活定制,完美贴合你的需求。
适合知识工作者、内容创作者、项目经理等多种角色。无需频繁切换工具,MineContext让你的数字生活更智能、更高效。
#资源参考 #AI #开源
开源项目分享:可去除 Gemini 图片右下角可见水印
这是一款一款名为 GeminiWatermarkTool 的命令行开源工具,可离线去除 Gemini 生成图片右下角的可见水印。工具通过反向 Alpha 混合计算,还原被水印覆盖的像素,支持 jpg、png、webp 等常见格式。该工具为由 C++ 编写,无需依赖,并可批量处理目录。作者表示仅针对 Gemini 当前的可见水印,不支持去除隐藏水印。
另有开发者基于此项目开发出纯前端版本,完全在浏览器本地运行,不依赖服务器。项目使用 JavaScript 实现,通过反向 Alpha 混合算法还原原始像素,避免 AI 修补带来的不确定性。
allenk/GeminiWatermarkTool
这是一款一款名为 GeminiWatermarkTool 的命令行开源工具,可离线去除 Gemini 生成图片右下角的可见水印。工具通过反向 Alpha 混合计算,还原被水印覆盖的像素,支持 jpg、png、webp 等常见格式。该工具为由 C++ 编写,无需依赖,并可批量处理目录。作者表示仅针对 Gemini 当前的可见水印,不支持去除隐藏水印。
另有开发者基于此项目开发出纯前端版本,完全在浏览器本地运行,不依赖服务器。项目使用 JavaScript 实现,通过反向 Alpha 混合算法还原原始像素,避免 AI 修补带来的不确定性。
allenk/GeminiWatermarkTool
#文件传输
取文件
在线文件传输工具,不限文件格式,最大支持 10 GB,可选择过期时间和永久有效,上传发送文件后,会给到一个取件码,对方输入即可获取文件,免费使用,无需注册。
https://quwenjian.cc
取文件
在线文件传输工具,不限文件格式,最大支持 10 GB,可选择过期时间和永久有效,上传发送文件后,会给到一个取件码,对方输入即可获取文件,免费使用,无需注册。
https://quwenjian.cc
当贝AI
⭐️ 网站功能:AI助手
📁 网站简介:一个集成了多种优质AI大模型的平台,提供了DeepSeek满血版,聚合了全网的AI资源,如DeepSeek-R1 671B、豆包、通义千问和智谱等。
可以在平台上进行各种AI相关的查询和操作,享受免费的服务,且没有使用限制。
🔗 网站网址:点击打开
⭐️ 网站功能:AI助手
📁 网站简介:一个集成了多种优质AI大模型的平台,提供了DeepSeek满血版,聚合了全网的AI资源,如DeepSeek-R1 671B、豆包、通义千问和智谱等。
可以在平台上进行各种AI相关的查询和操作,享受免费的服务,且没有使用限制。
🔗 网站网址:点击打开
在线智能问答系统,文档上传、向量检索、模型推理一体化,轻松实现本地RAG入门体验。
Local PDF Chat RAG 是一个开源项目,专为想理解并动手实践检索增强生成(RAG)技术的初学者设计。它结合了PDF处理、FAISS向量检索、多模型集成等核心模块,帮助你从源码层面掌握RAG的底层流程。
主要功能:
- 多PDF文档上传与自动文本切割向量化
- 本地FAISS向量数据库构建与高效语义检索
- 混合BM25关键词检索提升召回率
- 交叉编码器及大模型(支持本地 Ollama 和云端 SiliconFlow)结果重排序
- 支持联网搜索增强回答的时效性(需配置SerpAPI密钥)
- 递归式深度检索,自动生成新查询,提升答复深度
- Gradio交互式Web UI,操作简单直观
- 本地化优先,保护数据隐私
适合科研、开发者和RAG技术爱好者快速上手,理解RAG的全流程细节。
#资源参考 #工具 #RAG
Local PDF Chat RAG 是一个开源项目,专为想理解并动手实践检索增强生成(RAG)技术的初学者设计。它结合了PDF处理、FAISS向量检索、多模型集成等核心模块,帮助你从源码层面掌握RAG的底层流程。
主要功能:
- 多PDF文档上传与自动文本切割向量化
- 本地FAISS向量数据库构建与高效语义检索
- 混合BM25关键词检索提升召回率
- 交叉编码器及大模型(支持本地 Ollama 和云端 SiliconFlow)结果重排序
- 支持联网搜索增强回答的时效性(需配置SerpAPI密钥)
- 递归式深度检索,自动生成新查询,提升答复深度
- Gradio交互式Web UI,操作简单直观
- 本地化优先,保护数据隐私
适合科研、开发者和RAG技术爱好者快速上手,理解RAG的全流程细节。
#资源参考 #工具 #RAG
在线寻找音乐资源总是要翻遍各大平台,下载工具、播放器、歌词插件……太多分散工具使用起来很麻烦。
Music Megathread 是一个超全的音乐资源合集,汇集了免费音乐播放器、多平台下载器、流媒体客户端、歌词工具、音乐识别和管理软件,甚至还有Telegram音乐机器人,帮你轻松玩转音乐世界。
不仅支持 Spotify、YouTube Music、Deezer 等主流平台,还覆盖离线播放器、音频编辑、曲库管理、音效合成等丰富功能,满足各种音乐需求。| #音乐
核心亮点:
- 多平台音乐播放器和下载工具,支持Windows、macOS、Linux、Android、iOS;
- 丰富的 Spotify 和 YouTube Music 客户端及辅助工具,解锁更多功能;
- 在线与离线音乐管理、编辑、歌词同步与显示,一站式解决方案;
- 海量音乐识别与元数据编辑工具,方便整理个人音乐库;
- 全面支持音频录制、合成、转换、编辑,适合音乐制作爱好者;
- 集成多种Telegram音乐机器人,聊天中也能轻松找歌听歌。
适合音乐爱好者、音乐制作人、DJ、音频发烧友,帮你更高效地发现、管理和享受音乐。
#音乐资源 #工具 #资源参考
Music Megathread 是一个超全的音乐资源合集,汇集了免费音乐播放器、多平台下载器、流媒体客户端、歌词工具、音乐识别和管理软件,甚至还有Telegram音乐机器人,帮你轻松玩转音乐世界。
不仅支持 Spotify、YouTube Music、Deezer 等主流平台,还覆盖离线播放器、音频编辑、曲库管理、音效合成等丰富功能,满足各种音乐需求。| #音乐
核心亮点:
- 多平台音乐播放器和下载工具,支持Windows、macOS、Linux、Android、iOS;
- 丰富的 Spotify 和 YouTube Music 客户端及辅助工具,解锁更多功能;
- 在线与离线音乐管理、编辑、歌词同步与显示,一站式解决方案;
- 海量音乐识别与元数据编辑工具,方便整理个人音乐库;
- 全面支持音频录制、合成、转换、编辑,适合音乐制作爱好者;
- 集成多种Telegram音乐机器人,聊天中也能轻松找歌听歌。
适合音乐爱好者、音乐制作人、DJ、音频发烧友,帮你更高效地发现、管理和享受音乐。
#音乐资源 #工具 #资源参考
Agentic RAG:AI工程师必知的进阶检索生成框架
简单的RAG(Retrieval-Augmented Generation)系统很少直接用在实际场景。现实中,我们通常会给RAG加上“智能代理”(Agentic)能力,且尽量保持简洁。
没有放之四海皆准的方案,RAG系统必须根据具体业务灵活调整。理解Agentic RAG的关键组成,有助你设计适合自己的方案:
1️⃣ 用户查询分析
- 由基于大模型(LLM)的智能代理分析原始查询,可能重写或拆分成多条查询。
- 判断是否需要额外数据源。
2️⃣ 触发检索
- 若需更多数据,智能代理负责确定应调用哪些数据源,如实时用户数据、内部文档、网络信息等。
3️⃣ 数据整合与重排序
- 用更强的模型对检索结果进行筛选和重排名,大幅缩小信息范围。
4️⃣ 无需额外数据时,直接由LLM生成答案或执行多步动作。
5️⃣ 答案评估与循环优化
- 智能代理评判答案的准确性和相关性。
- 不达标时重新改写查询,重复生成,循环次数有限制。
💡 经验分享:
- 尽量简化流程,很多场景不需全部环节即可满足需求。
- 数据预处理和重排序环节是关键,覆盖90%以上应用。
- Agentic系统远超传统RAG,不只是问答,更能自动执行后续动作,未来会有更多分享,敬请关注!
Agentic RAG的核心在于“智能代理”的灵活决策能力,真正实现从理解用户意图到智能调取数据,再到动态生成和校验答案的全流程闭环。相比传统RAG,Agentic RAG更适合复杂业务场景,尤其是需要自动化执行操作的企业应用。未来AI系统的发展趋势将是“理解+检索+行动”的深度融合,而不仅仅是回答问题。
简单的RAG(Retrieval-Augmented Generation)系统很少直接用在实际场景。现实中,我们通常会给RAG加上“智能代理”(Agentic)能力,且尽量保持简洁。
没有放之四海皆准的方案,RAG系统必须根据具体业务灵活调整。理解Agentic RAG的关键组成,有助你设计适合自己的方案:
1️⃣ 用户查询分析
- 由基于大模型(LLM)的智能代理分析原始查询,可能重写或拆分成多条查询。
- 判断是否需要额外数据源。
2️⃣ 触发检索
- 若需更多数据,智能代理负责确定应调用哪些数据源,如实时用户数据、内部文档、网络信息等。
3️⃣ 数据整合与重排序
- 用更强的模型对检索结果进行筛选和重排名,大幅缩小信息范围。
4️⃣ 无需额外数据时,直接由LLM生成答案或执行多步动作。
5️⃣ 答案评估与循环优化
- 智能代理评判答案的准确性和相关性。
- 不达标时重新改写查询,重复生成,循环次数有限制。
💡 经验分享:
- 尽量简化流程,很多场景不需全部环节即可满足需求。
- 数据预处理和重排序环节是关键,覆盖90%以上应用。
- Agentic系统远超传统RAG,不只是问答,更能自动执行后续动作,未来会有更多分享,敬请关注!
Agentic RAG的核心在于“智能代理”的灵活决策能力,真正实现从理解用户意图到智能调取数据,再到动态生成和校验答案的全流程闭环。相比传统RAG,Agentic RAG更适合复杂业务场景,尤其是需要自动化执行操作的企业应用。未来AI系统的发展趋势将是“理解+检索+行动”的深度融合,而不仅仅是回答问题。
一个体积只有 0.1B、可以在 CPU 上运行的隐私文本过滤模型 tanaos-text-anonymizer-v1,能够自动识别并隐藏文本中的敏感信息,操作简单,支持英文(需微调支持其他语言),提供无需训练数据的微调工具,便于用户保护隐私。
https://fxtwitter.com/karminski3/status/2003996015943471501
https://fxtwitter.com/karminski3/status/2003996015943471501
InterceptSuite/ProxyBridge - 将 Windows/macOS 的 TCP/UDP 流量重定向到 HTTP/SOCKS5 代理
https://github.com/InterceptSuite/ProxyBridge
ProxyBridge 是一个轻量级的开源代理客户端,为 Windows 和 macOS 提供透明代理路由功能。
它能将特定进程的 TCP 和 UDP 流量重定向到 SOCKS5 或 HTTP 代理,支持基于应用程序的流量路由、阻止或允许,是 Proxifier 的替代方案。
● 跨平台支持(Windows 和 macOS)
● 双界面设计(GUI 和 CLI)
● 基于进程的流量控制(路由、阻止、允许)
● 支持多种代理协议(SOCKS5 和 HTTP)
● 系统级数据包拦截(内核 / 网络扩展级别)
● TCP 和 UDP 协议支持
● 流量阻止功能
● 灵活的规则配置(支持 IP、端口、协议、主机名等)
● 规则导入 / 导出功能
#Network #Tool #GitHub
https://github.com/InterceptSuite/ProxyBridge
ProxyBridge 是一个轻量级的开源代理客户端,为 Windows 和 macOS 提供透明代理路由功能。
它能将特定进程的 TCP 和 UDP 流量重定向到 SOCKS5 或 HTTP 代理,支持基于应用程序的流量路由、阻止或允许,是 Proxifier 的替代方案。
● 跨平台支持(Windows 和 macOS)
● 双界面设计(GUI 和 CLI)
● 基于进程的流量控制(路由、阻止、允许)
● 支持多种代理协议(SOCKS5 和 HTTP)
● 系统级数据包拦截(内核 / 网络扩展级别)
● TCP 和 UDP 协议支持
● 流量阻止功能
● 灵活的规则配置(支持 IP、端口、协议、主机名等)
● 规则导入 / 导出功能
#Network #Tool #GitHub