Ragflow-Plus:基于 Ragflow 的二次开发,专注解决实际应用痛点,提升知识库管理与文档交互效率。
• 全新后台管理系统:支持用户、团队、配置、文件与知识库统一管理,提升运维便捷度
• 权限回收机制:前端权限收缩,简化操作界面,保障安全与易用并重
• 解析能力升级:引入 MinerU 替代 DeepDoc,增强文本与图片解析效果,实现图文结合输出
• 文档撰写模式革新:全新交互体验,优化内容创作流程,适合多场景知识沉淀
• 开箱即用:提供 Docker 快速部署方案,配套视频教程与详细文档支持
• 开源透明:遵循 AGPLv3 许可证,支持商业使用,保障软件自由与合规
• 社群活跃:官方社群讨论技术与使用,支持持续贡献与共建
Ragflow-Plus 深耕知识管理本质,结合技术迭代与用户需求,助力打造高效、灵活的智能文档与问答平台。
#资源参考 #RAG
• 全新后台管理系统:支持用户、团队、配置、文件与知识库统一管理,提升运维便捷度
• 权限回收机制:前端权限收缩,简化操作界面,保障安全与易用并重
• 解析能力升级:引入 MinerU 替代 DeepDoc,增强文本与图片解析效果,实现图文结合输出
• 文档撰写模式革新:全新交互体验,优化内容创作流程,适合多场景知识沉淀
• 开箱即用:提供 Docker 快速部署方案,配套视频教程与详细文档支持
• 开源透明:遵循 AGPLv3 许可证,支持商业使用,保障软件自由与合规
• 社群活跃:官方社群讨论技术与使用,支持持续贡献与共建
Ragflow-Plus 深耕知识管理本质,结合技术迭代与用户需求,助力打造高效、灵活的智能文档与问答平台。
#资源参考 #RAG
Streamlit PDF Viewer:专为Streamlit应用设计的高效PDF可视化和增强组件,助力结构化数据展示与交互体验升级。
• 基于pdf.js,支持PDF文件直观展示,文本层覆盖实现复制粘贴
• 支持页面级渲染与滚动,快速定位指定页码或注释
• 注释高亮显示,支持多种边框样式及颜色,自定义点击回调函数
• 多重缩放控制,灵活调整视图比例,容器内居中/左/右对齐自由配置
• 可选分页分隔线,提升多页文档视觉分辨率
• 兼容Firefox和Chrome,针对复杂PDF支持动态加载及交互
• 开源Apache-2.0许可,持续迭代中,适合科研、文档分析与数据标注场景
通过对PDF的文本与注释分层渲染,实现了交互性与信息可复制性的平衡,促进面向结构化数据的深度挖掘和应用开发。
入门简单,pip install即可集成,适用范围广泛,具备长期工程实践参考价值。
• 基于pdf.js,支持PDF文件直观展示,文本层覆盖实现复制粘贴
• 支持页面级渲染与滚动,快速定位指定页码或注释
• 注释高亮显示,支持多种边框样式及颜色,自定义点击回调函数
• 多重缩放控制,灵活调整视图比例,容器内居中/左/右对齐自由配置
• 可选分页分隔线,提升多页文档视觉分辨率
• 兼容Firefox和Chrome,针对复杂PDF支持动态加载及交互
• 开源Apache-2.0许可,持续迭代中,适合科研、文档分析与数据标注场景
通过对PDF的文本与注释分层渲染,实现了交互性与信息可复制性的平衡,促进面向结构化数据的深度挖掘和应用开发。
入门简单,pip install即可集成,适用范围广泛,具备长期工程实践参考价值。
VSAG:面向大规模向量集的高效相似度搜索索引库,突破内存限制,简化参数调优,助力精确快速检索。
• 支持超大规模向量集合,适配内存外数据,解决传统向量库内存瓶颈。
• 采用领先算法,QPS性能较Glass提升100%,较HNSWLIB提升300%(基于ann-benchmark,GIST数据集,90%召回率)。
• C++核心实现,提供Python封装pyvsag,便于集成与二次开发。
• 自动参数生成机制,无需深入算法原理即可高效部署。
• 多场景验证,OceanBase、TuGraph、GreptimeDB等多个顶级分布式系统采用。
• 持续迭代,2025年路线图包含稀疏向量搜索、ARM与GPU加速、图结构压缩等关键特性。
• 开源社区驱动,欢迎贡献代码与反馈,促进矢量数据库生态发展。
VSAG从算法优化到工程实现均体现出对大规模、高性能相似度搜索的深刻理解,提供了行业领先的解决方案与可持续进化路径,适合长期技术布局与创新探索。
• 支持超大规模向量集合,适配内存外数据,解决传统向量库内存瓶颈。
• 采用领先算法,QPS性能较Glass提升100%,较HNSWLIB提升300%(基于ann-benchmark,GIST数据集,90%召回率)。
• C++核心实现,提供Python封装pyvsag,便于集成与二次开发。
• 自动参数生成机制,无需深入算法原理即可高效部署。
• 多场景验证,OceanBase、TuGraph、GreptimeDB等多个顶级分布式系统采用。
• 持续迭代,2025年路线图包含稀疏向量搜索、ARM与GPU加速、图结构压缩等关键特性。
• 开源社区驱动,欢迎贡献代码与反馈,促进矢量数据库生态发展。
VSAG从算法优化到工程实现均体现出对大规模、高性能相似度搜索的深刻理解,提供了行业领先的解决方案与可持续进化路径,适合长期技术布局与创新探索。
ALLinSSL
⭐️ 项目功能:SSL证书自动化管理
📁 项目简介:一个开源免费的SSL证书自动化管理平台,旨在简化SSL/TLS证书的申请、部署和续期过程。
通过一键式操作实现全生命周期的自动化管理,支持跨云环境和多种证书颁发机构(CA),大幅降低了手动操作的复杂性和出错风险。
🌐 项目地址:点击直达
⭐️ 项目功能:SSL证书自动化管理
📁 项目简介:一个开源免费的SSL证书自动化管理平台,旨在简化SSL/TLS证书的申请、部署和续期过程。
通过一键式操作实现全生命周期的自动化管理,支持跨云环境和多种证书颁发机构(CA),大幅降低了手动操作的复杂性和出错风险。
🌐 项目地址:点击直达
短视频理解进入结构化新时代,ARC-Hunyuan-Video-7B推动多模态深度解析,助力内容精准洞察。
• 专为微信视频号、抖音等用户生成短视频设计,综合视觉、音频、文本信号,实现创作者意图、情感表达与核心信息的深度理解。🎥🎧
• 同步处理视觉与音频,支持复杂问题解答,突破单模态限制,精准识别幽默、细节等多维内容。
• 时间感知精准,具备多粒度时间戳字幕、时间定位与事件总结能力,适配视频检索、精彩片段生成和内容分析。
• 多阶段训练结合强化学习,强化推理能力,支持零样本及少样本微调,广泛覆盖视频标签、推荐、检索等下游应用。
• 建基于Hunyuan-7B视觉语言模型,创新音频编码器与时间戳叠加机制,百万级真实视频自动标注,确保模型高质量主观理解。
• 提供模型权重与vLLM支持的API服务,支持中英文多模态视频理解,V0版本专注中文视频描述与总结。
以结构化视频理解为核心,ARC-Hunyuan-Video-7B不仅解析“发生了什么”,更洞悉“何时何地”及“背后意义”,为视频智能分析树立新标杆。
• 专为微信视频号、抖音等用户生成短视频设计,综合视觉、音频、文本信号,实现创作者意图、情感表达与核心信息的深度理解。🎥🎧
• 同步处理视觉与音频,支持复杂问题解答,突破单模态限制,精准识别幽默、细节等多维内容。
• 时间感知精准,具备多粒度时间戳字幕、时间定位与事件总结能力,适配视频检索、精彩片段生成和内容分析。
• 多阶段训练结合强化学习,强化推理能力,支持零样本及少样本微调,广泛覆盖视频标签、推荐、检索等下游应用。
• 建基于Hunyuan-7B视觉语言模型,创新音频编码器与时间戳叠加机制,百万级真实视频自动标注,确保模型高质量主观理解。
• 提供模型权重与vLLM支持的API服务,支持中英文多模态视频理解,V0版本专注中文视频描述与总结。
以结构化视频理解为核心,ARC-Hunyuan-Video-7B不仅解析“发生了什么”,更洞悉“何时何地”及“背后意义”,为视频智能分析树立新标杆。
Python 代码质量分析新利器,集成多工具输出精准诊断:
• 综合 Pylint、pycodestyle、McCabe 复杂度等多款分析工具,覆盖错误、潜在问题、风格违例及复杂度评估
• 默认配置即开箱即用,自动适配项目依赖库,减少误报,特别优化 Django、Celery 等框架支持
• 灵活配置“profiles”实现定制化规则,支持严格度分级(verylow 到 veryhigh),满足不同团队需求
• JSON 输出方便集成自动化流程,支持 pre-commit 钩子自动运行,保障代码持续健康
• 安装便捷:pip 安装一键完成,支持扩展插件(如 mypy、bandit),满足安全与类型检查
• 开源 GPLv2 许可,活跃社区支持,2k+ Stars,持续进化中
深度洞察:Prospector 通过框架感知和多工具融合,解决单一工具误报多、配置复杂难题,提升团队代码质量管理效率,兼顾准确性与易用性,适合长期维护和复杂项目。
Prospector | #工具
• 综合 Pylint、pycodestyle、McCabe 复杂度等多款分析工具,覆盖错误、潜在问题、风格违例及复杂度评估
• 默认配置即开箱即用,自动适配项目依赖库,减少误报,特别优化 Django、Celery 等框架支持
• 灵活配置“profiles”实现定制化规则,支持严格度分级(verylow 到 veryhigh),满足不同团队需求
• JSON 输出方便集成自动化流程,支持 pre-commit 钩子自动运行,保障代码持续健康
• 安装便捷:pip 安装一键完成,支持扩展插件(如 mypy、bandit),满足安全与类型检查
• 开源 GPLv2 许可,活跃社区支持,2k+ Stars,持续进化中
深度洞察:Prospector 通过框架感知和多工具融合,解决单一工具误报多、配置复杂难题,提升团队代码质量管理效率,兼顾准确性与易用性,适合长期维护和复杂项目。
Prospector | #工具
Docling Parse:专注于从程序化 PDF 中高效提取文本、路径及位图资源的轻量级工具包。
• 支持字符、单词及行级别文本坐标输出,精准定位文本内容,方便深度版面分析与可视化
• 同时提取路径和位图图像,满足复杂文档结构解析需求
• 内置可交互式可视化脚本,便于快速验证与展示解析效果
• 性能显著提升,最新版本解析速度较初版快 5-10 倍,适合大规模文档处理
• Python 包即装即用,支持命令行和编程接口,灵活集成到多种工作流
• 完全开源,MIT 许可,社区活跃,持续更新与优化,便于二次开发和创新
• 适合科研、文档数字化、信息抽取等多场景应用,助力文档数据智能化转型
基于程序化 PDF 结构,精细提取多层级文本单元与图形元素,融合性能优化与可视化,推动 PDF 内容的结构化理解与应用扩展。
#资源参考 #工具 #AI #PDF提取文本图像
• 支持字符、单词及行级别文本坐标输出,精准定位文本内容,方便深度版面分析与可视化
• 同时提取路径和位图图像,满足复杂文档结构解析需求
• 内置可交互式可视化脚本,便于快速验证与展示解析效果
• 性能显著提升,最新版本解析速度较初版快 5-10 倍,适合大规模文档处理
• Python 包即装即用,支持命令行和编程接口,灵活集成到多种工作流
• 完全开源,MIT 许可,社区活跃,持续更新与优化,便于二次开发和创新
• 适合科研、文档数字化、信息抽取等多场景应用,助力文档数据智能化转型
基于程序化 PDF 结构,精细提取多层级文本单元与图形元素,融合性能优化与可视化,推动 PDF 内容的结构化理解与应用扩展。
#资源参考 #工具 #AI #PDF提取文本图像
NVIDIA AI Blueprint:大规模视频搜索与摘要的行业级解决方案
• 支持海量实时及存档视频的智能摄取与结构化分析,助力快速决策与运营优化
• 结合视觉语言模型(Cosmos Nemotron VLM)、大型语言模型(Llama Nemotron LLM)及NVIDIA NIM微服务,实现精准视频摘要和交互式问答
• 采用Context-Aware RAG模块,融合向量库与图数据库,增强多跳推理、时序理解及异常检测能力
• 灵活部署:支持单GPU、局部多GPU及完全远程架构,满足从开发到生产的多种场景需求
• 面向视频分析师与AI开发者,提供一键部署、丰富配置及高度可定制化的流水线和微服务
• 完善文档覆盖API授权、硬件需求、快速上手指南及安全漏洞说明,保障稳定可靠运行
• 典型应用涵盖智能空间监控、仓储自动化及标准作业流程验证,赋能行业数字化转型
视频智能分析已进入多模态融合与上下文增强的新阶段,NVIDIA蓝图提供了系统化路径,降低复杂度,提升效率,释放视频数据的最大价值。
• 支持海量实时及存档视频的智能摄取与结构化分析,助力快速决策与运营优化
• 结合视觉语言模型(Cosmos Nemotron VLM)、大型语言模型(Llama Nemotron LLM)及NVIDIA NIM微服务,实现精准视频摘要和交互式问答
• 采用Context-Aware RAG模块,融合向量库与图数据库,增强多跳推理、时序理解及异常检测能力
• 灵活部署:支持单GPU、局部多GPU及完全远程架构,满足从开发到生产的多种场景需求
• 面向视频分析师与AI开发者,提供一键部署、丰富配置及高度可定制化的流水线和微服务
• 完善文档覆盖API授权、硬件需求、快速上手指南及安全漏洞说明,保障稳定可靠运行
• 典型应用涵盖智能空间监控、仓储自动化及标准作业流程验证,赋能行业数字化转型
视频智能分析已进入多模态融合与上下文增强的新阶段,NVIDIA蓝图提供了系统化路径,降低复杂度,提升效率,释放视频数据的最大价值。
#开源 #抓包 #工具
🔗 ProxyPin - 开源免费抓包工具
您可以使用它来拦截、检查和重写 HTTP(S) 流量,支持手机扫码连接、域名过滤、搜索、请求重写等功能
支持Windows、Mac、Android、IOS、Linux 全平台系统
🔗 ProxyPin - 开源免费抓包工具
您可以使用它来拦截、检查和重写 HTTP(S) 流量,支持手机扫码连接、域名过滤、搜索、请求重写等功能
支持Windows、Mac、Android、IOS、Linux 全平台系统
#prompt #AI
🔗 Prompt Optimizer - 一个开源的提示词优化工具
输入提示词就可以开始优化,支持多个 AI 大模型,可直观查看、对比提示词优化
支持在线使用、Chrome 插件、Vercel部署、Docker部署
📑相关阅读
PromptPilot - 字节跳动推出的 AI 提示词优化工具
🔗 Prompt Optimizer - 一个开源的提示词优化工具
输入提示词就可以开始优化,支持多个 AI 大模型,可直观查看、对比提示词优化
支持在线使用、Chrome 插件、Vercel部署、Docker部署
📑相关阅读
PromptPilot - 字节跳动推出的 AI 提示词优化工具
#自动化 #自媒体 #工具
🔁 自媒体运营助手 - 一个开源的浏览器自动化工具
⬇️ 下载页面
自媒体运营工具支持一键视频搬家、下载,一键发布视频到多平台,一键搬家到快手、YouTube、小红书、美拍、哔哩哔哩等平台
支持 Windows、macOS
🔁 自媒体运营助手 - 一个开源的浏览器自动化工具
⬇️ 下载页面
自媒体运营工具支持一键视频搬家、下载,一键发布视频到多平台,一键搬家到快手、YouTube、小红书、美拍、哔哩哔哩等平台
支持 Windows、macOS
#开源 #下载工具
🎓 knowledge-grab - 国家中小学智慧教育平台资源下载器
⬇️ 下载页面
功能是可以从国家中小学智慧教育平台下载特定教育资源,支持批量下载、分类下载。支持Windows、macOS、Linux
☀️ 适合教育工作者、家里有娃的家长
🎓 knowledge-grab - 国家中小学智慧教育平台资源下载器
⬇️ 下载页面
功能是可以从国家中小学智慧教育平台下载特定教育资源,支持批量下载、分类下载。支持Windows、macOS、Linux
☀️ 适合教育工作者、家里有娃的家长
Telegraphite 是一款功能强大的工具,用于从公开 Telegram 源中提取和保存帖子,具有多种功能。
它支持从多个频道提取帖子、以 JSON 格式保存数据、上传媒体文件和按关键字过滤。
该工具可在计划模式和连续模式下运行,并能删除重复的帖子。
可按关键字或内容类型(纯文本、纯媒体)筛选。
数据存储在结构化目录中,每个 posts.json 文件都包含帖子信息,如 ID、日期和内容。
🧬 https://github.com/hamodywe/telegram-scraper-TeleGraphite
#tools
它支持从多个频道提取帖子、以 JSON 格式保存数据、上传媒体文件和按关键字过滤。
该工具可在计划模式和连续模式下运行,并能删除重复的帖子。
可按关键字或内容类型(纯文本、纯媒体)筛选。
数据存储在结构化目录中,每个 posts.json 文件都包含帖子信息,如 ID、日期和内容。
🧬 https://github.com/hamodywe/telegram-scraper-TeleGraphite
#tools
高效上下文工程实用指南,助力 Gemini 2.5 和 ManusAI 优化性能与成本控制:
• 上下文顺序关键🧩:采用“追加式”上下文,将新信息追加到末尾,提升缓存命中率,降低4倍成本与延迟。
• 工具管理需稳定🔧:避免任务中途变更工具顺序或可用性,防止缓存失效和模型混乱。
• 外部记忆不可少💾:主动写入上下文和目标至外部存储,防止信息丢失。Manus 典型任务需调用约50次工具。
• 定期复述目标🎯:让模型周期性重申任务目标,保持关注重点,防止迷失方向。
• 错误信息要保留⚠️:上下文中保留错误提示,帮助模型从错误中学习,避免重复失误。
方法论核心在于稳定输入结构与闭环反馈,确保模型持续聚焦与高效执行,提升长期任务可靠性与成本效益。
• 上下文顺序关键🧩:采用“追加式”上下文,将新信息追加到末尾,提升缓存命中率,降低4倍成本与延迟。
• 工具管理需稳定🔧:避免任务中途变更工具顺序或可用性,防止缓存失效和模型混乱。
• 外部记忆不可少💾:主动写入上下文和目标至外部存储,防止信息丢失。Manus 典型任务需调用约50次工具。
• 定期复述目标🎯:让模型周期性重申任务目标,保持关注重点,防止迷失方向。
• 错误信息要保留⚠️:上下文中保留错误提示,帮助模型从错误中学习,避免重复失误。
方法论核心在于稳定输入结构与闭环反馈,确保模型持续聚焦与高效执行,提升长期任务可靠性与成本效益。