Genesis – CMU 联合 20 多所研究机构开源的生成式物理引擎 Genesis是什么 Genesis是卡内基梅隆大学、马里兰大学、斯坦福大学、麻省理工学院等研究机构联合推出的开源生成式物理引擎,能模拟世界万物。Genesis能用简单的语言描述,快速生成精确的物理模... Ai项目 2个月前1,8650
AniDoc – 2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画 AniDoc是什么 AniDoc是香港科技大学、蚂蚁集团、南京大学、浙江大学和香港大学共同推出的简化2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画,遵循参考角色设计。模型用对应匹配... Ai项目 2个月前1,3400
ElevenLabs Flash – ElevenLabs推出的低延迟语音合成模型 ElevenLabs Flash是什么 ElevenLabs Flash是ElevenLabs推出的低延迟语音合成模型,专为快速对话型AI设计。ElevenLabs Flash有两个版本:Flash ... Ai项目 2个月前1,4900
OpenAI o3 – OpenAI推出的新一代最强推理模型 OpenAI o3是什么 OpenAI o3模型是继o1之后的新一代推理模型,是 OpenAI 首次将图像推理融入思维链的模型,能直接在思维链中思考图像。用户可以上传模糊、颠倒或低质量的图像,模型依然... Ai项目 2个月前1,4600
StyleStudio – 文本驱动的风格迁移模型,能将参考图像的风格与文本提示内容融合 StyleStudio是什么 StyleStudio是西湖大学AI实验室、复旦大学、南洋理工大学和香港科技大学(广州)联合推出的,文本驱动的风格迁移模型,能将参考图像的风格与文本提示的内容融合。Sty... Ai项目 2个月前1,2350
RWKV-7 – RWKV系列的最新大模型架构版本,有强大的上下文学习能力 RWKV-7是什么 RWKV-7是RWKV系列的最新大模型架构版本,超越了传统的attention和linear attention范式,具有更灵活的状态演化能力,能在相同算力消耗下解决attenti... Ai项目 2个月前1,7100
PromptWizard – 微软开源的 AI 提示词自动化优化框架 PromptWizard PromptWizard是微软推出的自动化提示优化框架,改进大型语言模型(LLMs)在特定任务中的表现。基于自我演变和自我适应机制,PromptWizard用反馈驱动的批评和... Ai项目 2个月前1,3400
INFP – 音频驱动的生成逼真面部表情和头部姿态的AI框架 INFP是什么 INFP是音频驱动的头部生成框架,专为双人对话交互设计。能自动在对话音频引导下进行角色的转换,无需手动分配角色和角色切换。INFP包括两个阶段:基于动作头部模仿阶段和音频引导动作生成阶... Ai项目 2个月前1,3600
VisionFM – 通用眼科AI大模型,具备少样本多种疾病诊断能力 VisionFM是什么 VisionFM(伏羲慧眼)是多模态多任务的视觉基础模型,专为通用眼科人工智能而设计。通过预训练3.4百万张来自560,457个个体的眼科图像,覆盖广泛的眼科疾病、成像模态、设... Ai项目 2个月前1,5950
MetaMorph – 统一多模态理解与生成大模型,基于VPiT 预测多模态 token MetaMorph是什么 MetaMorph是多模态大模型(MLLM),通过指令微调(Instruction Tuning)实现视觉理解和生成。它提出了一种名为Visual-Predictive In... Ai项目 2个月前1,6900