STIV – 苹果公司推出的视频生成大模型 STIV是什么 STIV(Scalable Text and Image Conditioned Video Generation)是苹果公司推出的视频生成大模型。STIV拥有8.7亿参数,能处理文本... Ai项目 3周前5,1550
Mind GPT-3o – 理想汽车推出的多模态端到端大模型 Mind GPT-3o是什么 Mind GPT-3o是理想汽车推出的多模态端到端大模型,融合语音、视觉和语言理解技术,实现高效实时交互。Mind GPT-3o具备记忆、规划、工具使用和表达能力,能提升... Ai项目 3周前5,1550
DeepSeek Engineer – 开源AI编程助手,处理用户对话生成结构化JSON DeepSeek Engineer是什么 DeepSeek Engineer 是集成DeepSeek API 的AI编程助手,基于命令行界面让用户能读取本地文件、创建新文件及实时对现有文件进行差异编辑... Ai项目 3周前5,1550
Miras – 谷歌推出的深度学习架构设计通用框架 Miras是什么 Miras是谷歌推出的用在深度学习架构设计的通用框架,特别是序列建模任务。Miras基于关联记忆和注意力偏差的概念,将Transformer、现代线性RNN等模型重新定义为具有内部优... Ai项目 3周前5,1550
RAG Logger – 专为检索增强生成应用设计的开源日志工具 RAG Logger是什么 RAG Logger是开源的日志记录工具,专为检索增强生成(RAG)应用设计。作为LangSmith的轻量级替代品,专注于满足RAG应用的日志记录需求。RAG Logger... Ai项目 3周前5,1550
3DIS-FLUX – 浙大联合哈佛推出的多实例生成框架 3DIS-FLUX是什么 3DIS-FLUX是基于深度学习的多实例生成框架,通过解耦实例合成实现高质量的图像生成。结合3DIS框架的深度驱动场景构建和FLUX模型的扩散变换器架构,分为两阶段:首先生成... Ai项目 3周前5,1550
Agentic Reasoning – 牛津大学推出增强LLM推理能力的框架 Agentic Reasoning是什么 Agentic Reasoning是牛津大学推出的增强大型语言模型(LLM)推理能力的框架。基于整合外部工具(如网络搜索、代码执行和结构化记忆)解决复杂的多步... Ai项目 12个月前05,1550
OpenScholar – 华盛顿大学联合艾伦研究所开源的学术搜索工具 OpenScholar是什么 OpenScholar是华盛顿大学和艾伦AI研究所共同推出的检索增强型语言模型(LM),能帮助科学家基于检索和综合科学文献中的相关论文回答问题。系统用大规模的科学论文数据... Ai项目 3周前5,1500
WiS – 淘天联合阿里研究团队推出的多智能体博弈游戏平台 WiS是什么 WiS(Who is Spy)是淘天集团和阿里的技术研究团队推出的创新在线AI竞赛平台,专门设计用在测试和分析基于大型语言模型(LLMs)的多智能体系统(MAS)。WiS模拟“谁是卧底... Ai项目 3周前5,1500
TryOffAnyone – 将模特穿着服装的图像还原成平铺商品图的 AI 工具 TryOffAnyone是什么 TryOffAnyone是能将穿着服装的人物照片转换成平铺的服装展示图的AI工具。基于先进的Latent Diffusion Models技术,自动识别并提取照片中的服... Ai项目 3周前5,1500