#AI #自动化 #开源

Ruto-GLM

Android 自动化与多任务框架,借助 Shizuku 激活的系统级能力,并结合 AI 大模型,可实现真正的后台自动化、多任务并行和智能 UI 操作执行,简单地说,就是可以一边执行任务,一边玩手机,互不耽误,上手应该是有点门槛的,感兴趣的可以试试,免费开源。

🐙 GitHub

频道 @WidgetChannel
#AI #检测

朱雀AI检测助手

腾讯推出的 AI 生成内容检测工具,可快速分析文本和图像文件,并在数秒内输出详细的检测报告,包括
AI 生成概率、具体可疑段落或区域标注及内容特征提示,支持 GPT、Claude、DeepSeek、混元、豆包、千问、即梦、MJ、SD、GAN 等常见模型的识别,免费使用,有次数限制,登录后可享更多次数。

https://matrix.tencent.com/ai-detect/

频道 @WidgetChannel
Claude Opus 4.5 的提示词(Prompting)实战指南 | 帖子 | #指南

为了帮助大家更好地驾驭新模型,我们的研究与应用团队经过大量内部测试和“折腾”,总结了一份针对 Claude Opus 4.5 的提示词(Prompting)实战指南。

以下是我们目前摸索出的“独家秘籍”,教你如何榨干它的潜能,获得最佳效果:

1. 用好 effort 参数,想多聪明你说了算

新的 effort(努力值)参数简直是个神器。它能让你大体控制 Claude 在输出内容时消耗多少算力。这就好比你有了一个调节旋钮:你可以通过它,在“智能程度”与“成本/响应速度”之间做一个权衡 (向左转省钱快出结果,向右转费点时间但智商爆表)。

这个参数对所有类型的 Token (AI 处理文本的最小单位,相当于单词或汉字) 都有效,包括模型的思考过程、正式回复以及工具调用。

2. 别太凶,温柔点:调整工具触发率

你可能会发现工具触发的频率变了。这是因为 Opus 4.5 对系统提示词(System Prompts)的反应更加灵敏。

以前为了防止它“偷懒”不调用工具 (Undertriggering,即触发不足),你的旧提示词可能使用过非常激进或严厉的语言。但在新版本里,这样反而会导致它变得太敏感,动不动就乱用工具 (Overtriggering,即触发过度)。

所以,是时候把语气放缓了。将原来那种 “CRITICAL: You MUST use this tool”(严重警告:你必须使用此工具)的命令,改成平和的 “Use this tool when...”(当出现……情况时,使用此工具)就可以了。

3. 防止“加戏”:避免过度设计

Opus 4.5 有时候会有点“想太多”,导致过度设计 (Overengineer,即把简单问题复杂化),比如凭空增加不必要的文件或者搞一堆复杂的抽象层。

要解决这个问题,你得在提示词里把话说明白,比如加上:“Only make changes that are directly requested. Keep solutions simple and focused.”(只修改我明确要求的部分。保持解决方案简洁、聚焦。)

4. 拒绝“云写代码”:强制它先读后写

在探索代码库时,Opus 4.5 有时会表现得比较保守。

如果你发现它没看代码就直接瞎提修改建议,请直接给它下死命令:“ALWAYS read and understand relevant files before proposing edits. Do not speculate about code you have not inspected.”(在提出修改建议前,必须总是先阅读并理解相关文件。绝对不要对自己没检查过的代码进行猜测。)

5. 眼神更好了:视觉能力大升级

Opus 4.5 的视觉能力有了显著提升,处理图像和提取数据的能力更强了,尤其是在同时处理多张图片的时候。

对于那些信息量巨大、密密麻麻的图片 (Dense Images),教你个绝招:给它配备一个裁剪工具,让它能像用放大镜一样“放大”并聚焦于局部细节。在我们的测试评估中,这一招能稳定提升它的表现。

如果你想快速应用上述所有技巧,将你的应用无缝迁移到 Opus 4.5,可以直接使用我们制作的这个 Claude Code 迁移插件
#资源参考 #AI #Prompt #Prompts #提示词 #ClaudeCode提示词
#AI #换脸 #开源

Deep Live Cam

AI 换脸工具,仅需一张图片即可实现高质量的实时人脸替换,并支持视频深伪、人脸增强与多脸处理等功能,兼容多平台,适用于视频制作与动画创作等场景,完全免费。

主页 项目地址

频道 @Edgebyte
自动生成短视频,从视频文案、素材、字幕到配音和背景音乐,一键搞定,效率翻倍。

MoneyPrinterTurbo 利用强大的 AI 大模型,支持多种视频比例(9:16竖屏、16:9横屏),还能批量生成,适合做抖音、快手、YouTube等平台内容创作。

核心亮点:
- 自动生成视频文案,支持中英双语,灵活定制
- 高清无版权视频素材,支持上传本地素材
- AI智能语音合成,多种声音风格实时试听
- 字幕自动生成,支持字体、颜色、位置多样化调整
- 背景音乐随机或自定义,音量自由调节
- 支持OpenAI、Azure、文心一言等多家大模型接入
- 完整MVC架构,提供Web界面和API接口,方便集成部署

适用场景:内容创作者、短视频运营、小白用户快速上手。
#资源参考 #工具 #AI #短视频生成工具
Vibe Voice - 微软开源 AI 语音框架

https://github.com/microsoft/VibeVoice

VibeVoice 是微软开源的 AI 语音框架,用于从文本生成富有表现力的长篇多说话人对话音频(如播客),通过 LLM 理解文本上下文和对话流,生成高保真音频。

长篇多说话人模型:支持最长 90 分钟音频、最多 4 个不同说话人的对话式语音合成
实时流式 TTS 模型:初始音频延迟约 300 毫秒,支持流式文本输入的实时语音生成
超低帧率语音分词器:以 7.5Hz 帧率的连续语音分词器保持音频保真度同时提升计算效率
多语言支持:支持英文、中文以及实验性支持 9 种语言(德、法、意、日、韩、荷、波、葡、西班牙语)
风格化语音:提供 11 种不同的英文风格语音供用户选择

#TTS #Voice #AI #GitHub GitHub - microsoft/VibeVoice: Open-Source Frontier Voice AI
Huntly - 个人 AI 驱动信息中心

https://github.com/lcomplete/huntly

AI 驱动的个人信息中心,配备强大的浏览器扩展,可使用 AI 捕获、处理和组织网页内容 —— 将您的浏览转化为可操作的知识。

AI 内容处理 利用 AI 进行摘要、翻译和智能内容分析,支持自定义快捷指令
● 智能网页归档 使用 Mozilla Readability 自动保存和归档网页,AI 驱动的内容提取
● RSS 订阅管理 集中管理所有 RSS 订阅,支持智能分类、OPML 导入 / 导出和全文搜索
● 强大的全文搜索 Apache Lucene 搜索引擎,IK 分词器支持中文分词,布尔运算符和模糊搜索
● 社交媒体集成 特殊处理 Twitter/X 内容,自动重建推文线程并保存媒体
● GitHub 集成 同步和组织您的 GitHub stars,提取仓库元数据和 README
● 隐私与自托管 100% 自托管,SQLite 数据库,Docker 部署,完全掌控您的数据
● 多平台支持 Web 应用、Chrome 扩展 (Manifest V3) 和桌面应用 (Tauri)

#Tool #AI #GitHub #Chrome #Extension GitHub - lcomplete/huntly: Your Personal AI-Powered Information Hub
UI UX Pro Max Skill - UI / UX 前端页面设计 AI Agent Skill

https://github.com/nextlevelbuilder/ui-ux-pro-max-skill

设计效果相比其一般 AI 生成的 “Demo” 页面还是好很多的


一个 前端页面设计 AI Agent Skill 项目。

它将 UI 样式、调色板、字体搭配、图表类型、产品推荐、UX 指南以及特定技术栈的最佳实践全部做成一个可以搜索的知识库。

可集成于 Claude Code、Cursor、Windsurf 等多个 AI Coding Agent 中。

#Design #AI #Tool #GitHub
Lumen - AI 增强的 Git 命令行工具

https://github.com/jnsahaj/lumen

Lumen 是一个利用 AI 技术简化 Git 工作流程的命令行工具。

可用于查看代码变更,也可生成规范的 Commit 信息,帮助开发者更高效地使用 Git 版本控制。

美观的终端 Diff 查看器:支持侧边栏导航、文件过滤、监听模式和 PR 预览
智能 Commit 信息生成:基于暂存区变更自动生成规范提交信息,支持上下文增强
Git 命令生成:通过自然语言查询生成相应的 Git 命令
变更解释:分析代码变更内容、原因和潜在影响
交互式模式:使用 fzf 进行模糊搜索查找提交记录
AI 提供商支持:兼容 OpenAI、Claude、Gemini、Groq、Ollama 等

#AI #Shell #Tool #GitHub #DevOps GitHub - jnsahaj/lumen: Beautiful git diff viewer, generate commits with AI, get summary of changes, all from the CLI
YouMedHub - AI 视频分析工具 | 拆解镜头和口播结构

https://github.com/kociii/youmedhub

一个基于 Vue 3 + TypeScript 的智能视频分析应用,使用阿里云通义千问视觉模型自动分析视频内容,生成详细的脚本拆解表格。

视频分析:上传视频或提供视频 URL,AI 自动分析视频内容
脚本拆解:生成包含景别、运镜、画面内容、口播等详细信息的结构化表格
视频片段预览:鼠标悬停即可播放对应时间段的视频片段
安全存储:API Key 本地存储,保护隐私
实时流式输出:Markdown 流式显示,所见即所得
Token 统计:实时显示输入 / 输出 / 总计 Token 使用量

#AI #Tool #Video #GitHub GitHub - kociii/youmedhub: 一个基于 AI的视频分析、剪辑工具
Lumen - AI 增强的 Git 命令行工具

https://github.com/jnsahaj/lumen

Lumen 是一个利用 AI 技术简化 Git 工作流程的命令行工具。

可用于查看代码变更,也可生成规范的 Commit 信息,帮助开发者更高效地使用 Git 版本控制。

美观的终端 Diff 查看器:支持侧边栏导航、文件过滤、监听模式和 PR 预览
智能 Commit 信息生成:基于暂存区变更自动生成规范提交信息,支持上下文增强
Git 命令生成:通过自然语言查询生成相应的 Git 命令
变更解释:分析代码变更内容、原因和潜在影响
交互式模式:使用 fzf 进行模糊搜索查找提交记录
AI 提供商支持:兼容 OpenAI、Claude、Gemini、Groq、Ollama 等

#AI #Shell #Tool #GitHub #DevOps GitHub - jnsahaj/lumen: Beautiful git diff viewer, generate commits with AI, get summary of changes, all from the CLI
Huntly - 个人 AI 驱动信息中心

https://github.com/lcomplete/huntly

AI 驱动的个人信息中心,配备强大的浏览器扩展,可使用 AI 捕获、处理和组织网页内容 —— 将您的浏览转化为可操作的知识。

AI 内容处理 利用 AI 进行摘要、翻译和智能内容分析,支持自定义快捷指令
● 智能网页归档 使用 Mozilla Readability 自动保存和归档网页,AI 驱动的内容提取
● RSS 订阅管理 集中管理所有 RSS 订阅,支持智能分类、OPML 导入 / 导出和全文搜索
● 强大的全文搜索 Apache Lucene 搜索引擎,IK 分词器支持中文分词,布尔运算符和模糊搜索
● 社交媒体集成 特殊处理 Twitter/X 内容,自动重建推文线程并保存媒体
● GitHub 集成 同步和组织您的 GitHub stars,提取仓库元数据和 README
● 隐私与自托管 100% 自托管,SQLite 数据库,Docker 部署,完全掌控您的数据
● 多平台支持 Web 应用、Chrome 扩展 (Manifest V3) 和桌面应用 (Tauri)

#Tool #AI #GitHub #Chrome #Extension GitHub - lcomplete/huntly: Your Personal AI-Powered Information Hub
▎MTranServer
一个超低资源消耗速度超快的离线翻译模型服务器,无需显卡。单个请求平均响应时间 50 毫秒。支持全世界主要语言的翻译。

本地模型,适合私有化部署到自己项目上,可以实现无限免费翻译的模板,和主流大模型相比数据较小,翻译质量会逊于主流模型。主要优点还是无限免费。
#项目 #GitHub #翻译 #ai

地址:GitHub
▎WhisperJAV
一款用于日本成人视频的字幕生成器。采用了针对日语会话语音优化的HuggingFace模型

支持DeepSeek(廉价)、Gemini(免费套餐)、Claude、GPT-4和OpenRouter。

不过操作起来还是挺麻烦得,下载得前置软件有ffmpeg等,可以详细看下说明。
应该项目还是早期,感兴趣的可以尝鲜下,或者等后期完善。无中文界面
#ai #视频 #翻译 #GitHub

地址:GitHub
AI 验证码求解器 - Chrome扩展
一个功能完整的Chrome扩展程序,使用AI大模型自动识别和填充验证码。

支持OpenAI、Claude、Google Gemini等
自动识别img/canvas/svg类型的验证码
识别后自动填充到输入框,模拟真实用户输入
#浏览器 #插件 #ai #GitHub

地址:GitHub
#电子书 #阅读 #开源 #AI

Anx Reader

电子书阅读器,支持 EPUB、MOBI、AZW3、FB2、TXT、PDF 等主流格式,可基于阅读内容生成心智图、提供随需翻译与词典查询、整理章节摘要与视角分析,阅读界面可调节字体、行间距、段落间距、边距、主题风格、对齐方式,还支持字体样式与背景调整,支持标注、笔记、文本转语音、整书中英翻译、简繁转换等特性,另外通过 WebDAV 实现书籍、笔记与阅读进度的同步,免费开源,适用于 Android、iOS、Windows、macOS 甚至 Linux 平台。

❤️主页 🐙GitHub

频道 @WidgetChannel
 
 
Back to Top