#AI #自动化 #开源

Ruto-GLM

Android 自动化与多任务框架,借助 Shizuku 激活的系统级能力,并结合 AI 大模型,可实现真正的后台自动化、多任务并行和智能 UI 操作执行,简单地说,就是可以一边执行任务,一边玩手机,互不耽误,上手应该是有点门槛的,感兴趣的可以试试,免费开源。

🐙 GitHub

频道 @WidgetChannel
Vibe Voice - 微软开源 AI 语音框架

https://github.com/microsoft/VibeVoice

VibeVoice 是微软开源的 AI 语音框架,用于从文本生成富有表现力的长篇多说话人对话音频(如播客),通过 LLM 理解文本上下文和对话流,生成高保真音频。

长篇多说话人模型:支持最长 90 分钟音频、最多 4 个不同说话人的对话式语音合成
实时流式 TTS 模型:初始音频延迟约 300 毫秒,支持流式文本输入的实时语音生成
超低帧率语音分词器:以 7.5Hz 帧率的连续语音分词器保持音频保真度同时提升计算效率
多语言支持:支持英文、中文以及实验性支持 9 种语言(德、法、意、日、韩、荷、波、葡、西班牙语)
风格化语音:提供 11 种不同的英文风格语音供用户选择

#TTS #Voice #AI #GitHub GitHub - microsoft/VibeVoice: Open-Source Frontier Voice AI
PrimisAI Nexus 是一款强大灵活的 Python 框架,专为多智能体系统和大型语言模型(LLM)驱动的复杂任务编排设计。它支持创建多层级主管和助理主管结构,自动管理对话历史和日志,支持结构化输出和YAML配置,轻松实现任务分工和多智能体协作。| #框架

核心优势:

- 统一管理多智能体,支持主控与助理主管分层协作
- 内置持久化历史记录,保证会话连续性和复现性
- 灵活配置LLM参数,支持自定义模型调用
- 支持通过MCP协议集成远程或本地工具服务器,实现智能体功能扩展
- 可使用YAML文件定义复杂智能体架构,方便快速部署和修改
- 丰富调试与日志功能,助力开发与问题排查

适合 AI 研究者、开发者以及需要复杂自动化任务管理的团队。
#资源参考 #AI框架 #PrimisAI Nexus
Visual Story-Writing 是一套创新系统,能够自动将文本故事可视化呈现,展示事件的时间线、角色及其行为。

用户可通过便捷的工具编辑故事。

核心功能包括:通过时间轴交互查看事件、在合并或移动角色时编辑文本,以及重新排列事件顺序。

该系统采用GPT-4o进行信息提取与修改建议。

该程序采用TypeScript开发,结合React和Vite框架,确保与现代浏览器兼容。

🧬 https://github.com/m-damien/VisualStoryWriting

#AI #tools
MineContext:洞察本质,激发创造

一个开源、主动的上下文感知 AI 伙伴,致力于让您的工作、学习与创作更加清晰高效。

https://github.com/volcengine/MineContext

基于屏幕截图 + 内容理解的方式(未来还将支持其他来源的多模态信息,包括文档、图片、视频、代码、外部应用数据),能够看到并看懂用户的数字世界上下文,然后再基于底层的上下文工程框架,主动推送洞察、日 / 周总结 、待办、活动记录等高质量信息,同时支持用户基于 Context 和生成的信息进行再创作。

MineContext 专注于四个核心功能:无负担收集、主动推送、智能浮现和上下文工程架构。

#AI #Tool #GitHub
Awesome AI Apps:一站式 AI 应用开发资源库,涵盖 RAG、agents、工作流等多种前沿实践,助力打造高效智能系统:

• 汇集 Google ADK、OpenAI Agents SDK、LangChain、LlamaIndex、Agno、CrewAI、AWS Strands 等主流 AI Agent 框架
• 多层级示例覆盖:从快速入门 Starter Agents(邮件助手、任务管理、天气机器人)到实用 Simple Agents(财经监控、日程助手、数据库对话)
• MCP(Model Context Protocol)方案示例:文档语义检索、GitHub 代码库分析、知识问答多场景应用
• RAG(检索增强生成)案例丰富,支持多文档对话、简历优化、PDF 分析、OCR 处理等
• 复杂端到端流程示范:多阶段深度研究、社交媒体及招聘分析、AI 趋势挖掘、会议演讲稿自动生成、金融数据预测服务
• 完整开发环境准备与安装说明,项目均含详细文档,适合不同水平开发者快速上手
• 社区开放贡献,持续更新,MIT 开源协议保障自由使用与改造

持续探索 AI Agent 与 LLM 驱动应用的多样可能,打造可复用、可扩展的智能系统架构,推动 AI 实践落地与创新。
#资源参考 #AIAgent #LLM #AI开发资源库 GitHub - Arindam200/awesome-ai-apps: A collection of projects showcasing RAG, agents, workflows, and other AI use cases
Motia:AI Agents的缺失后台,一站式统一后端框架,整合API、后台任务、事件与智能代理,轻松构建复杂工作流。

• 多语言支持:Python、JavaScript、TypeScript无缝协作,灵活选择最佳工具。
• 插件化Step设计:业务逻辑即Step,支持HTTP请求、事件驱动和定时任务触发。
• 内建全链路观测:自动追踪日志与状态变更,零配置实现端到端可视化调试。
• 事件驱动工作流:步骤间通过事件发布与订阅解耦,简单声明式代码构建多阶段流程。
• 统一状态管理:共享键值存储,实时追踪数据生命周期,提升调试与维护效率。
• 一键部署体验:快速启动项目,内置Workbench UI便于实时开发测试。
• 100%开源,社区活跃,持续迭代支持多种语言和云平台。

Motia解决了碎片化后端带来的部署复杂性和运维难题,是构建稳定、可扩展AI Agent系统的理想选择。
#资源参考 #Agent #AI #后端框架 GitHub - iii-hq/iii: iii (pronounced “three eye”) unifies your existing backend stack with a single engine and three primitives:…
#资源参考 #AI #Agent #ai_agents #genai

您可以探索医疗保健、金融、教育、客户服务等众多行业的大量 AI 代理项目和用例。这些 AI 代理可自动执行医疗诊断、股票交易、个性化辅导、客户支持、产品推荐和供应链优化等任务。这些项目包含开源代码和框架,例如 CrewAI、Autogen、Agno 和 Langgraph,它们可帮助您构建、管理和协作 AI 代理,以执行编码、多代理团队合作、数据分析和工作流自动化等任务。利用这些资源可以节省您的时间、提高效率,并激发您创建满足您需求的 AI 解决方案。

https://github.com/ashishpatel26/500-AI-Agents-Projects
 
 
Back to Top