OmniCam – 浙大联合上海交大等高校推出的多模态视频生成框架 OmniCam是什么 OmniCam 是先进的多模态视频生成框架,通过摄像机控制实现高质量的视频生成。支持多种输入模态组合,用户可以提供文本描述、视频中的轨迹或图像作为参考,精确控制摄像机的运动轨迹... Ai项目 5个月前02,9400
GPT-4.1 – OpenAI 推出新一代语言模型,支持百万 token 上下文 GPT-4.1是什么 GPT-4.1 是 OpenAI 最新推出的新一代语言模型,包含 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 三个版本。系列模型在编码能力、指令遵循和... Ai项目 5个月前02,9300
ebook2audiobookXTTS – 开源电子书转有声书 AI 工具,支持16种语言 ebook2audiobookXTTS是什么 ebook2audiobookXTTS是开源的AI工具,能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式,如epub、pd... Ai项目 5个月前2,9250
StockMixer – 上海交大推出的股票价格预测架构 StockMixer是什么 StockMixer是上海交通大学推出的用在股票价格预测的多层感知器(MLP)架构,具备简单和强大的预测能力。架构基于指标混合、时间混合和股票混合三个步骤处理和预测股票数据... Ai项目 5个月前2,9200
A2A – 谷歌开源的首个标准智能体交互协议 A2A是什么 A2A(Agent2Agent Protocol)是谷歌开源的首个标准智能体交互协议,让不同框架和供应商构建的AI智能体相互协作。A2A基于标准化的通信方式,打破系统孤岛,让智能体安全地... Ai项目 5个月前02,9200
Baichuan-M1-14B – 百川智能推出的行业首个开源医疗增强大模型 Baichuan-M1-14B是什么 Baichuan-M1-14B是百川智能推出的行业首个开源医疗增强大模型,医疗能力超越了更大参数量的Qwen2.5-72B,与o1-mini相差无几。专为医疗场景... Ai项目 5个月前2,9150
DeepSeek-GRM – DeepSeek 联合清华推出的通用奖励模型 DeepSeek-GRM是什么 DeepSeek-GRM是DeepSeek和清华大学研究者共同提出的通用奖励模型(Generalist Reward Modeling)。通过点式生成式奖励建模(Poi... Ai项目 5个月前02,9100
Step-Video-T2V – 阶跃星辰开源的文本到视频模型 Step-Video-T2V是什么 Step-Video-T2V 是阶跃星辰团队推出的开源文本到视频预训练模型,拥有 300 亿参数,能生成长达 204 帧的高质量视频。模型基于深度压缩的变分自编码器... Ai项目 5个月前02,9050
OpenMath-Nemotron – 英伟达开源的数学推理系列模型 OpenMath-Nemotron是什么 OpenMath-Nemotron是英伟达推出的系列开源数学推理模型,专门用在解决复杂数学问题,包括奥林匹克级别的难题。模型基于大规模数据集OpenMathR... Ai项目 4个月前2,9000
Samsung Gauss2 – 三星推出的第二代多模态生成式AI模型 Samsung Gauss2是什么 Samsung Gauss2是三星公司推出的第二代多模态生成式AI模型,能提升Galaxy AI功能的性能和效率。Samsung Gauss2能同时处理文本、代码和... Ai项目 5个月前2,9000