Cogito v2 发布:四款混合推理大模型(70B、109B MoE、405B、671B MoE)开放授权,代表全球顶尖水平。
• 创新迭代自我提升范式(Iterated Distillation & Amplification,IDA),模型通过内化推理过程,实现智能“直觉”提升,推理链长度比DeepSeek R1缩短60%。
• 最大的671B MoE模型性能媲美甚至超越DeepSeek v3/R1,逼近闭源前沿模型如o3和Claude 4 Opus。
• 训练成本低于350万美元,展示高效可扩展的超级智能构建路径。
• 模型支持直接回答和自我反思推理两种模式,适配多样应用场景。
• 可通过Huggingface下载,或在Together AI、Baseten、RunPod等API平台使用,本地运行支持Unsloth。
• 未来将继续迭代自我提升,发布更强模型,全部开源共享。
Cogito在推理时不再单纯靠“搜索更多”,而是通过迭代策略改进,将推理经验蒸馏回模型参数,增强模型的智能先验,类似AlphaGo的策略迭代思路,开创自然语言处理领域的全新自我优化范例。
详文 | API接入 | 开源地址
• 创新迭代自我提升范式(Iterated Distillation & Amplification,IDA),模型通过内化推理过程,实现智能“直觉”提升,推理链长度比DeepSeek R1缩短60%。
• 最大的671B MoE模型性能媲美甚至超越DeepSeek v3/R1,逼近闭源前沿模型如o3和Claude 4 Opus。
• 训练成本低于350万美元,展示高效可扩展的超级智能构建路径。
• 模型支持直接回答和自我反思推理两种模式,适配多样应用场景。
• 可通过Huggingface下载,或在Together AI、Baseten、RunPod等API平台使用,本地运行支持Unsloth。
• 未来将继续迭代自我提升,发布更强模型,全部开源共享。
Cogito在推理时不再单纯靠“搜索更多”,而是通过迭代策略改进,将推理经验蒸馏回模型参数,增强模型的智能先验,类似AlphaGo的策略迭代思路,开创自然语言处理领域的全新自我优化范例。
详文 | API接入 | 开源地址
MongoDB MCP Server:MongoDB 最新开源 MCP Server 正式发布,开启人人都是数据库工程师的新纪元:
• 支持通过自然语言与 MongoDB 交互,免去手写复杂查询语法
• 兼容 MongoDB Atlas、Community Edition 和 Enterprise Advanced
• 让 AI 工具如 Claude、Cursor、GitHub Copilot 等直接对接数据库,实现智能代理查询
• 典型操作示例:“展示最活跃用户”,“创建只读数据库用户”,“查看订单集合的 schema”
• 提升非技术人员数据探索能力,支持生产级查询生成
• 性能方面,MCP 调用比直连 API 多 2-3 秒延迟,适合探索性分析但非实时场景
• 100% 开源,助力数据库访问民主化
• 安全性需重点关注,合理权限管理是防止数据泄露的关键
• 支持通过自然语言与 MongoDB 交互,免去手写复杂查询语法
• 兼容 MongoDB Atlas、Community Edition 和 Enterprise Advanced
• 让 AI 工具如 Claude、Cursor、GitHub Copilot 等直接对接数据库,实现智能代理查询
• 典型操作示例:“展示最活跃用户”,“创建只读数据库用户”,“查看订单集合的 schema”
• 提升非技术人员数据探索能力,支持生产级查询生成
• 性能方面,MCP 调用比直连 API 多 2-3 秒延迟,适合探索性分析但非实时场景
• 100% 开源,助力数据库访问民主化
• 安全性需重点关注,合理权限管理是防止数据泄露的关键
网页元素转图片新选择:snapDOM,速度快、精度高,实测验证优于 html2canvas。
• 支持完整 DOM 捕获,包括 shadow DOM 和伪元素(::before、::after)
• 保留样式、字体、背景图,支持 Font Awesome、Material Icons 等图标字体内嵌
• 输出多格式:SVG、PNG、JPG、WebP、Canvas,且无需额外依赖,基于标准 Web API
• 体积轻巧,性能优越,实测比 html2canvas 快 2~150 倍,尤其是大尺寸复杂元素截图
• 提供丰富 API 支持缩放、压缩、排除元素、自定义过滤、CORS 图片代理等高级功能
• 支持资源预加载,确保大规模复杂页面截图稳定高效
• 未来将支持插件系统、模块化架构及自动字体预加载,方便扩展与优化
推荐给需要高性能网页截图、生成可缩放矢量图和精美栅格图的前端开发者和设计师。
• 支持完整 DOM 捕获,包括 shadow DOM 和伪元素(::before、::after)
• 保留样式、字体、背景图,支持 Font Awesome、Material Icons 等图标字体内嵌
• 输出多格式:SVG、PNG、JPG、WebP、Canvas,且无需额外依赖,基于标准 Web API
• 体积轻巧,性能优越,实测比 html2canvas 快 2~150 倍,尤其是大尺寸复杂元素截图
• 提供丰富 API 支持缩放、压缩、排除元素、自定义过滤、CORS 图片代理等高级功能
• 支持资源预加载,确保大规模复杂页面截图稳定高效
• 未来将支持插件系统、模块化架构及自动字体预加载,方便扩展与优化
推荐给需要高性能网页截图、生成可缩放矢量图和精美栅格图的前端开发者和设计师。
go2rtc:全平台零依赖摄像头终极流媒体解决方案,集成 RTSP、RTMP、WebRTC、HomeKit、FFmpeg 等多协议,支持多源多协议智能协同,极低延迟,解锁摄像头全新玩法。
• 支持 Windows/macOS/Linux/ARM 系统,无需额外配置,开箱即用。
• 多协议接入:RTSP、RTMP、HTTP-FLV、MJPEG、HLS、MSE、MP4、WebRTC、HomeKit 摄像头等,涵盖主流及专业流媒体格式。
• 灵活多源管理:支持多摄像头、多协议混合接入,自动匹配客户端支持的编码,实现多源两路音视频协商。
• 高度兼容:兼容主流智能家居平台(Home Assistant 等),支持插件形式集成与独立部署。
• 先进转码能力:内置 FFmpeg 支持硬件加速转码,动态处理不兼容编码,保障流畅播放体验。
• 双向音频支持:RTSP/ONVIF、Tapo、Hikvision、Roborock 等品牌摄像头实现浏览器端双向语音交互。
• 安全与访问控制:API 可限制访问,支持本地与远程安全访问(ngrok、TURN、STUN)。
• 创新应用场景:浏览器即IP摄像头、WebTorrent流分享、流媒体发布至YouTube/Telegram等。
• 业界首创:全球首个支持 HomeKit 摄像头流媒体代理与转发,无需苹果设备也能使用。
• 丰富开发接口:HTTP API、模块化设计,方便二次开发与自定义界面。
go2rtc 通过多协议融合与智能协商,解决了不同设备和客户端生态间的壁垒,真正实现“摄像头即服务”的理念。零配置、零依赖的设计极大降低了运维门槛,适合长期稳定运行和复杂多样的智能家居及监控场景。其持续活跃的开源社区也保障了创新与安全的稳步推进。
• 支持 Windows/macOS/Linux/ARM 系统,无需额外配置,开箱即用。
• 多协议接入:RTSP、RTMP、HTTP-FLV、MJPEG、HLS、MSE、MP4、WebRTC、HomeKit 摄像头等,涵盖主流及专业流媒体格式。
• 灵活多源管理:支持多摄像头、多协议混合接入,自动匹配客户端支持的编码,实现多源两路音视频协商。
• 高度兼容:兼容主流智能家居平台(Home Assistant 等),支持插件形式集成与独立部署。
• 先进转码能力:内置 FFmpeg 支持硬件加速转码,动态处理不兼容编码,保障流畅播放体验。
• 双向音频支持:RTSP/ONVIF、Tapo、Hikvision、Roborock 等品牌摄像头实现浏览器端双向语音交互。
• 安全与访问控制:API 可限制访问,支持本地与远程安全访问(ngrok、TURN、STUN)。
• 创新应用场景:浏览器即IP摄像头、WebTorrent流分享、流媒体发布至YouTube/Telegram等。
• 业界首创:全球首个支持 HomeKit 摄像头流媒体代理与转发,无需苹果设备也能使用。
• 丰富开发接口:HTTP API、模块化设计,方便二次开发与自定义界面。
go2rtc 通过多协议融合与智能协商,解决了不同设备和客户端生态间的壁垒,真正实现“摄像头即服务”的理念。零配置、零依赖的设计极大降低了运维门槛,适合长期稳定运行和复杂多样的智能家居及监控场景。其持续活跃的开源社区也保障了创新与安全的稳步推进。
从未想过用 Git 以外的版本控制工具,直到我了解了 jj 的逻辑,只看了一个视频就听懂并接受了。于是我开始思考,如果原本根深蒂固的思想很容易就被一个新的思想覆盖,或许确实说明这个老的思想不够符合大脑的直觉偏好。回想了一下,我当年花了一两年才把 git 的分支和冲突处理用明白,jj 却让我首次意识到,版本管理不该如此复杂繁琐。我感觉长期被 git 压迫的大脑猛然呼吸了一口新鲜空气,也许它真的是下一代更好用的版本控制工具。
https://github.com/jj-vcs/jj
视频(可以直接从 12:39 开始看): https://youtu.be/2otjrTzRfVk?si=q4UaeFVPMw1uqYmv&t=759
https://github.com/jj-vcs/jj
视频(可以直接从 12:39 开始看): https://youtu.be/2otjrTzRfVk?si=q4UaeFVPMw1uqYmv&t=759
👾 Tooooools:极简主义和 Lo-fi 效果图片/视频生成器
🔗:Web
🔥 最近很火的生成器网站 Tooooools 把我们又带回了前几年「点阵」和 Lo-fi 流行的年代,它由俄罗斯设计师 Daniil Sukhovskoy 所开发,目前维护了一年了
💡 只需上传照片或视频,平台就可以将它们转化成不同风格,包含了点阵、渐变、重新着色、拉伸等多种风格。此外,平台也提供了丰富的自定义,你可以设置画布尺寸、预处理参数以及导出格式等
👀 个人认为 Tooooools 比较适合用于 Logo 和极简线条视频的复古化处理,开发者表示 Tooooools 可免费用于个人或商业用途,大家可自由进行创作
📘 关联阅读:
1️⃣ more.graphics:生成不同风格的自定义背景纹理图案
2️⃣ 1001 个小而美 App:Nothing 风格 App 大推荐
频道:@NewlearnerChannel
Claude Code subagents
https://github.com/wshobson/agents
项目包含多个生产级的专业 subagents,覆盖开发架构、语言开发专家、基础设施运维、质量安全、数据与 AI、专项领域以及业务营销等多个领域。
这些子代理可以被 Claude Code 自动基于上下文调用,或用户显式指定调用,支持多种复杂工作流的自动协作。
#AI #DevOps #Tool #GitHub
Subagent 是具有特定专业技能和任务范围的 AI Agent 单元,负责处理明确领域的问题或任务,多个 subagents 之间能够协作,提升了任务执行的专业性和效率,减少了单个 AI Agent 面对多领域任务时的复杂度和响应时间。
https://github.com/wshobson/agents
项目包含多个生产级的专业 subagents,覆盖开发架构、语言开发专家、基础设施运维、质量安全、数据与 AI、专项领域以及业务营销等多个领域。
这些子代理可以被 Claude Code 自动基于上下文调用,或用户显式指定调用,支持多种复杂工作流的自动协作。
#AI #DevOps #Tool #GitHub
Subagent 是具有特定专业技能和任务范围的 AI Agent 单元,负责处理明确领域的问题或任务,多个 subagents 之间能够协作,提升了任务执行的专业性和效率,减少了单个 AI Agent 面对多领域任务时的复杂度和响应时间。
Prompt-Optimizer - 提示词优化器,编写高质量的提示词
https://github.com/linshenkx/prompt-optimizer
Prompt Optimizer 是一个强大的 AI 提示词优化工具,帮助你编写更好的 AI 提示词,提升 AI 输出质量。支持 Web 应用、桌面应用、Chrome 插件和 Docker 部署四种使用方式。
● 智能优化:一键优化提示词,支持多轮迭代改进,提升 AI 回复准确度
● 双模式优化:支持系统提示词优化和用户提示词优化,满足不同使用场景
● 对比测试:支持原始提示词和优化后提示词的实时对比,直观展示优化效果
● 多模型集成:支持 OpenAI、Gemini、DeepSeek、智谱 AI、SiliconFlow 等主流 AI 模型
● 安全架构:纯客户端处理,数据直接与 AI 服务商交互,不经过中间服务器
● 多端支持:同时提供 Web 应用、桌面应用、Chrome 插件和 Docker 部署四种使用方式
● 访问控制:支持密码保护功能,保障部署安全
● MCP 协议支持:支持 Model Context Protocol (MCP) 协议,可与 Claude Desktop 等 MCP 兼容应用集成
#Prompt #AI #Tool #GitHub
https://github.com/linshenkx/prompt-optimizer
Prompt Optimizer 是一个强大的 AI 提示词优化工具,帮助你编写更好的 AI 提示词,提升 AI 输出质量。支持 Web 应用、桌面应用、Chrome 插件和 Docker 部署四种使用方式。
● 智能优化:一键优化提示词,支持多轮迭代改进,提升 AI 回复准确度
● 双模式优化:支持系统提示词优化和用户提示词优化,满足不同使用场景
● 对比测试:支持原始提示词和优化后提示词的实时对比,直观展示优化效果
● 多模型集成:支持 OpenAI、Gemini、DeepSeek、智谱 AI、SiliconFlow 等主流 AI 模型
● 安全架构:纯客户端处理,数据直接与 AI 服务商交互,不经过中间服务器
● 多端支持:同时提供 Web 应用、桌面应用、Chrome 插件和 Docker 部署四种使用方式
● 访问控制:支持密码保护功能,保障部署安全
● MCP 协议支持:支持 Model Context Protocol (MCP) 协议,可与 Claude Desktop 等 MCP 兼容应用集成
#Prompt #AI #Tool #GitHub
CopyParty - 轻量便携文件服务器
https://github.com/9001/copyparty
copyparty 是一个便携式文件服务器,支持使用任意网页浏览器进行可续传文件上传和下载。
● 支持断点续传、多线程上传,上传过程中自动校验数据完整性,支持重传和跳过重复内容,无文件大小限制
● 支持多协议服务:内置 HTTP 文件服务、FTP、TFTP、WebDAV 和 SMB 服务
● 自带 Web 浏览器 UI,支持文件浏览、搜索(包括通过文件大小、日期、路径名、MP3 标签等搜索)、缩略图显示以及媒体播放
● 支持创建账户和权限管理,可以针对不同文件夹设置不同用户权限
● 支持文件夹压缩下载成 ZIP 或 TAR 文件,并支持在线转码音频
#Tool #HomeLab #GitHub
https://github.com/9001/copyparty
copyparty 是一个便携式文件服务器,支持使用任意网页浏览器进行可续传文件上传和下载。
● 支持断点续传、多线程上传,上传过程中自动校验数据完整性,支持重传和跳过重复内容,无文件大小限制
● 支持多协议服务:内置 HTTP 文件服务、FTP、TFTP、WebDAV 和 SMB 服务
● 自带 Web 浏览器 UI,支持文件浏览、搜索(包括通过文件大小、日期、路径名、MP3 标签等搜索)、缩略图显示以及媒体播放
● 支持创建账户和权限管理,可以针对不同文件夹设置不同用户权限
● 支持文件夹压缩下载成 ZIP 或 TAR 文件,并支持在线转码音频
#Tool #HomeLab #GitHub
LunaTranslator
视觉小说(Galgame)翻译工具,支持 HOOK、OCR、剪贴板、语音识别等多种文本提取方式,并提供语音合成、日语分词及假名注音、查词、Anki、加载浏览器插件等功能,支持几乎所有能想得到的翻译引擎,包括在线翻译、离线翻译、预翻译等,免费开源,适用于 Windows 系统。
频道 @WidgetChannel
Audio Switcher
Windows 音频设备快速切换工具,特别适合既有音响也有耳机的情况,主要是操作特别便捷,点击托盘图标即可切换,支持为每个设备单独绑定快捷键,支持收藏常用设备,完全免费。
🌐 主页
频道 @WidgetChannel