Profiling Data – DeepSeek开源训练和推理框架的性能分析数据 Profiling Data是什么 Profiling Data是DeepSeek开源的训练和推理框架的性能分析数据,基于PyTorch Profiler捕获的程序运行过程中的详细信息,用在分析和优化... Ai项目 12个月前04,9000
Phi-4-Multimodal – 微软最新推出的多模态语言模型 Phi-4-Multimodal是什么 Phi-4-Multimodal 是微软最新推出的多模态语言模型,拥有 56 亿参数,能将语音、视觉和文本处理集成到一个统一架构中。模型在多个基准测试中表现优异... Ai项目 12个月前04,2450
R1-Onevision – 开源多模态视觉推理模型,基于 Qwen2.5-VL 微调 R1-Onevision是什么 R1-Onevision 是开源的多模态大语言模型,专注于复杂视觉推理任务。基于 Qwen2.5-VL 微调而成,通过整合视觉和文本数据,能精准地进行多模态信息解释。在... Ai项目 12个月前05,8450
Phi-4-Mini – 微软推出专注于文本任务的小型语言模型 Phi-4-Mini是什么 Phi-4-Mini 是微软 Phi-4 系列中最新推出的专注于文本任务的小型语言模型,参数量为 38 亿。基于密集的解码器-only Transformer 架构,结合分... Ai项目 12个月前05,1600
IndexTTS – B 站推出的文本转语音模型,支持拼音纠正汉字发音 IndexTTS是什么 IndexTTS 是 B 站推出的工业级可控文本转语音(TTS)系统。基于 XTTS 和 Tortoise 模型开发,结合了 GPT 风格的生成技术,能将文本高效转化为自然流畅... Ai项目 12个月前04,8850
Scribe – ElevenLabs 推出的高精度语音转文本模型 Scribe是什么 Scribe 是 ElevenLabs 推出的高精度语音转文本模型,专为多语言和复杂音频环境设计。支持99种语言,英语和意大利语的转录准确率分别达到96.7%和98.7%,在小语种... Ai项目 12个月前05,2350
VideoGrain – 悉尼科技大学和浙大推出的视频编辑框架 VideoGrain是什么 VideoGrain 是悉尼科技大学和浙江大学推出的零样本多粒度视频编辑框架,能实现类别级、实例级和部件级的精细视频修改。VideoGrain基于调节时空交叉注意力和自注意... Ai项目 12个月前04,9250
腾讯混元Turbo S – 腾讯推出的新一代快思考模型 腾讯混元Turbo S是什么 腾讯混元Turbo S是腾讯推出的新一代快思考模型。模型采用创新的Hybrid-Mamba-Transformer融合架构,有效降低了传统Transformer的计算复杂... Ai项目 12个月前04,8800
GPT-4.5 – OpenAI 推出的最强聊天模型 GPT-4.5是什么 GPT-4.5 是 OpenAI 推出的最新大型聊天模型,是目前规模最大、性能最强的聊天模型。基于扩展无监督学习,提升模式识别、知识广度和创意生成能力,减少了幻觉现象,让对话更自... Ai项目 12个月前08,3600
3FS – DeepSeek开源的高性能分布式文件系统 3FS是什么 3FS(Fire-Flyer File System)是DeepSeek推出的高性能分布式文件系统,专为AI训练和推理任务设计。3FS用现代SSD和RDMA网络技术,基于分离式架构聚合数... Ai项目 12个月前06,5200