BlockDance – 复旦联合字节推出的扩散模型加速方法 BlockDance是什么 BlockDance 是复旦大学联合字节跳动智能创作团队推出的用在加速扩散模型的新方法。BlockDance 基于识别重用相邻时间步中结构相似的时空特征(STSS),减少冗... Ai项目 1年前04,6700
Reve Image – Reve 推出的全新 AI 图像生成模型 Reve Image是什么 Reve Image 是 Reve 推出的全新 AI 图像生成模型。专注于提升美学表现、精确的提示遵循能力以及出色的排版设计,能生成高质量的视觉作品。模型在生成图像时展现出... Ai项目 1年前05,1650
StarVector – 开源多模态视觉语言模型,支持图像和文本到 SVG 生成 StarVector是什么 StarVector 是开源的多模态视觉语言模型,ServiceNow Research、Mila – Quebec AI Institute 和 ETS Mo... Ai项目 1年前04,0000
LHM – 阿里通义开源的单图生成可动画3D人体模型 LHM是什么 LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通义实验室推出的从单张图像重建可动画化3D人体模型。基于多模态Transform... Ai项目 1年前06,7450
瀚海智语 – 海洋垂直领域大模型,基于360 智脑和 DeepSeek 研发 瀚海智语是什么 瀚海智语(OceanDS)是国家海洋环境预报中心联合海洋出版社和三六零数字安全科技共同推出的国内首个海洋垂直领域大语言模型,模型以360智脑13B和Deepseek-R1-70B大模型... Ai项目 1年前06,2100
Qwen2.5-VL-32B – 阿里开源的最新多模态模型 Qwen2.5-VL-32B是什么 Qwen2.5-VL-32B是阿里巴巴开源的多模态模型,参数规模为32B。模型在Qwen2.5-VL系列的基础上,基于强化学习优化,具备更符合人类偏好的回答风格、显... Ai项目 1年前05,1700
AndroidGen – 智谱推出增强大语言模型 Agent 能力的框架 AndroidGen是什么 AndroidGen 是智谱技术团队推出增强基于大语言模型(LLM)的 Agent 能力的框架,特别是在数据稀缺的情况下。框架通过收集人类任务轨迹基于这些轨迹训练语言模型... Ai项目 1年前04,4250
ReasonGraph – 开源可视化与分析LLMs推理过程的AI工具 ReasonGraph是什么 ReasonGraph 是用在可视化和分析大语言模型(LLMs)推理过程的开源网络平台。ReasonGraph支持超过 50 种主流模型(如 Anthropic、Open... Ai项目 1年前05,5600
Gemini 2.5 Pro – 谷歌推出的最新 AI 思考模型 Gemini 2.5 Pro是什么 Gemini 2.5 Pro 是谷歌推出的最新 AI 模型,是一个“思考模型”,能在回应前进行推理,提升性能和准确性。模型在多个基准测试中表现卓越,在推理和代码生成... Ai项目 1年前08,3550
pdf-craft – 开源 PDF 转 Markdown 工具 pdf-craft是什么 pdf-craft 是用在将 PDF 文件转换为其他格式(如 Markdown、EPUB)的工具,专注于处理扫描书籍的 PDF 文件。pdf-craft 支持提取正文内容,过... Ai项目 1年前05,1550