T2I-R1 – 港中文联合上海AI Lab推出文生图模型 T2I-R1是什么 T2I-R1 是香港中文大学和上海AI Lab联合推出的新型文本生成图像模型。基于引入双层推理机制,语义级链式思维(CoT)和 Token 级 CoT,实现高层次图像规划与低层次像... Ai项目 3周前4,8950
TesserAct – AI 4D具身世界模型,能预测3D场景的动态演变 TesserAct是什么 TesserAct 是创新的 4D 具身世界模型,能预测 3D 场景随时间的动态演变,响应具身代理的动作。通过训练 RGB-DN(RGB、深度和法线)视频数据来学习,超越了传... Ai项目 3周前4,8950
Agent-E – 基于AutoGen代理框架构建的AI浏览器自动化系统 Agent-E是什么 Agent-E是基于AutoGen代理框架构建的智能自动化系统,专注于浏览器内的自动化操作。Agent-E基于自然语言交互,能执行填写表单、搜索排序电商产品、定位网页内容、管理网... Ai项目 3周前4,8950
O1-CODER – 北交大推出的O1代码版开源项目,专注于编码任务 O1-CODER是什么 O1-CODER是北京交通大学研究团队推出的开源项目,旨在复制OpenAI的O1模型,专注于编码任务。O1-CODER结合强化学习(RL)和蒙特卡洛树搜索(MCTS)技术,提升... Ai项目 3周前4,8950
UniAct – 清华、商汤、北大、上海AI Lab共同推出的具身基础模型框架 UniAct是什么 UniAct 是新型的具身基础模型框架,解决不同机器人之间行为异构性的问题。通过学习通用行为,捕捉不同机器人共享的原子行为特征,消除因物理形态和控制接口差异导致的行为异构性。Uni... Ai项目 12个月前04,8950
SurfSense – 开源AI研究助手,个人知识库与全球数据源无缝链接 SurfSense是什么 SurfSense 是开源的 AI 研究工具,类似于 NotebookLM 和 Perplexity,具备更强的扩展性。工具能与多种外部数据源(如搜索引擎、Slack、Not... Ai项目 3周前4,8900
EmaFusion – AI初创公司 Ema 推出的多模型融合技术 EmaFusion是什么 EmaFusion 是人工智能初创公司 Ema 推出的多模型融合技术,为企业级 AI 应用提供高效、灵活且低成本的解决方案。通过动态结合 100 多种语言模型,根据任务需求智... Ai项目 3周前4,8900
Co-op Translator – 微软推出面向开发者的开源多语言翻译工具 Co-op Translator是什么 Co-op Translator是微软推出的开源多语言翻译工具,基于Azure AI服务实现项目文档和图像中文本的自动化多语言翻译。仅需一条命令,Co-op T... Ai项目 3周前4,8900
VISION XL – AI视频修复处理工具,修复缺失、支持四倍超分辨率 VISION XL是什么 VISION XL是高效的视频修复和超分辨率工具,基于潜在扩散模型技术,专注于解决高清视频的逆问题。工具能修复视频缺失部分、去除模糊,提升视频清晰度,最高可达四倍超分辨率。V... Ai项目 3周前4,8900
Orpheus TTS – 开源AI语音合成系统,支持多种语音风格 Orpheus TTS是什么 Orpheus TTS 是基于 Llama-3b 架构的开源文本到语音(TTS)系统。Orpheus TTS 支持生成自然、富有情感且接近人类水平的语音,具备零样本语音克... Ai项目 12个月前04,8900