Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第47页

MarkItDown – 微软开源的多功能、多格式文档转Markdown工具

MarkItDown是什么 MarkItDown是微软开源的多功能文档转换工具，能将PDF、PPT、Word、Excel、图像、音频、HTML等多种格式的文件转换成Markdown格式。支持OCR文字...

Ai项目

2周前

6,1500

EMMA-X – 新加坡科技设计大学推出的具身多模态动作模型

EMMA-X是什么 EMMA-X是新加坡科技设计大学推出的具有70亿参数的具身多模态动作模型，在有根据的链式思维（CoT）推理数据上微调OpenVLA创建。EMMA-X结合层次化的具身数据集，包含3D...

Ai项目

2周前

5,2400

WeaveFox – 蚂蚁推出 AI 前端研发平台，根据设计图直接生成源代码

WeaveFox是什么 WeaveFox是蚂蚁团队推出的AI前端智能研发平台，基于蚂蚁自研的百灵多模态大模型，能直接根据设计图生成前端源代码。工具支持多种应用类型，包括控制台、移动端H5、小程序等，兼...

Ai项目

2周前

4,9700

UniReal – 港大联合 Adobe 推出的通用图像生成和编辑框架

UniReal是什么 UniReal是香港大学和Adobe研究院共同推出的框架，专注于实现多种图像生成和编辑任务。框架基于模拟现实世界动态，能在单一模型中处理包括图像生成、编辑、定制和合成在内的广泛任...

Ai项目

2周前

5,9100

X-AnyLabeling – AI图像标注工具，支持图像和视频多样化标注样式

X-AnyLabeling是什么 X-AnyLabeling是集成多种深度学习算法的图像标注软件，专注于提升标注效率和精度。X-AnyLabeling支持图像和视频的多样化标注样式，适配多种AI训练场...

Ai项目

2周前

6,9000

Explorer – AI 3D世界生成模型，文本图像秒变3D渲染场景

Explorer是什么 Explorer是Odyssey公司推出的生成性世界模型，能将任何图像转化为详细的3D世界。Explorer模型擅长生成真实感世界，支持动态效果的生成。Explorer基于高斯...

Ai项目

2周前

6,1050

Gemini 2.0 Flash Thinking – 谷歌推出的最新推理模型，支持百万上下文展示思考路径

Gemini 2.0 Flash Thinking是什么 Gemini 2.0 Flash Thinking 是谷歌最新发布的推理增强型 AI 模型，专为复杂问题的高效推理和可解释性设计。在 Chat...

Ai项目

2周前

11,1550

Genesis – CMU 联合 20 多所研究机构开源的生成式物理引擎

Genesis是什么 Genesis是卡内基梅隆大学、马里兰大学、斯坦福大学、麻省理工学院等研究机构联合推出的开源生成式物理引擎，能模拟世界万物。Genesis能用简单的语言描述，快速生成精确的物理模...

Ai项目

2周前

6,2350

AniDoc – 2D动画上色AI模型，基于视频扩散模型自动将草图序列转换成彩色动画

AniDoc是什么 AniDoc是香港科技大学、蚂蚁集团、南京大学、浙江大学和香港大学共同推出的简化2D动画上色AI模型，基于视频扩散模型自动将草图序列转换成彩色动画，遵循参考角色设计。模型用对应匹配...

Ai项目

2周前

5,3800

ElevenLabs Flash – ElevenLabs推出的低延迟语音合成模型

ElevenLabs Flash是什么 ElevenLabs Flash是ElevenLabs推出的低延迟语音合成模型，专为快速对话型AI设计。ElevenLabs Flash有两个版本：Flash ...

Ai项目

2周前

4,5400