Cognita – 面向生产环境的开源、模块化 RAG 框架 Cognita是什么 Cognita是开源的模块化RAG(Retrieval Augmented Generation)框架,能帮助开发者构建模块化、易于扩展和部署的生产级应用程序。Cognita用L... Ai项目 3周前5,0350
AlphaEvolve – 谷歌 DeepMind 推出的通用科学AI Agent AlphaEvolve是什么 AlphaEvolve是谷歌DeepMind推出的通用科学Agent,基于结合大型语言模型(LLMs)的创造力和自动评估器来设计和优化高级算法。用Gemini Flash... Ai项目 3周前5,0250
Pangea – 卡内基梅隆大学开源的多语言多模态大语言模型 Pangea是什么 Pangea是卡内基梅隆大学团队推出的多语言多模态大型语言模型(LLM),能提升全球语言和文化多样性的覆盖。模型包含600万条指令的多样化数据集,支持39种语言,包含高质量英文指令... Ai项目 3周前5,0250
WeGen – 中科大联合上海交大等推出的统一多模态生成模型 WeGen是什么 WeGen 是中国科学技术大学联合上海交通大学、微信团队、中国科学院等机构推出的统一多模态生成模型,基于自然对话实现多样化的视觉生成任务。WeGen结合多模态大语言模型(MLLM)和... Ai项目 12个月前05,0250
Flex3D – Meta GenAI和牛津大学共同推出的两阶段3D生成框架 Flex3D是什么 Flex3D是Meta的GenAI团队和牛津大学研究团队推出的创新的两阶段3D生成框架,能基于任意数量的高质量输入视图,解决从文本、单张图片或稀疏视图图像生成高质量3D内容的挑战... Ai项目 3周前5,0200
SmolVLM – Hugging Face推出的轻量级视觉语言模型 SmolVLM是什么 SmolVLM是Hugging Face推出的轻量级视觉语言模型,专为设备端推理设计。以20亿参数量,实现了高效内存占用和快速处理速度。SmolVLM提供了三个版本以满足不同需求... Ai项目 3周前5,0200
Insight-V – 提升长链视觉推理能力的多模态模型 Insight-V是什么 Insight-V是南洋理工大学、腾讯公司和清华大学的研究者们共同推出的多模态模型,能提升多模态大型语言模型在长链视觉推理方面的能力。基于可扩展的数据生成流程生产高质量的推理... Ai项目 3周前5,0200
Ruyi – 图森未来推出的图生视频大模型 Ruyi是什么 Ruyi是图森未来推出的图生视频大模型,专为在消费级显卡上运行设计,支持多分辨率、多时长视频生成,具备首帧、首尾帧控制、运动幅度控制和镜头控制等特性。Ruyi基于DiT架构,由Casu... Ai项目 3周前5,0200
Ola – 清华联合腾讯等推出的全模态语言模型 Ola是什么 Ola是清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言模型。通过渐进式模态对齐策略,逐步扩展语言模型支持的模态,从图像和文本开始,再引入语音和... Ai项目 12个月前05,0200
DeepClaude – 开源AI应用开发平台,深度集成 DeepSeek R1 和 Claude 模型 DeepClaude是什么 DeepClaude 是高性能的开源 AI 工具,基于深度集成 DeepSeek R1 和 Claude 两大模型,结合推理、创造力和代码生成能力。DeepClaude提供... Ai项目 12个月前05,0200