Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第72页

百聆 – AI语音对话助手，端到端时延低至800ms

百聆是什么百聆(Bailing)是开源的语音对话助手，基于语音识别（ASR）、语音活动检测（VAD）、大语言模型（LLM）和语音合成（TTS）技术实现与用户的自然语音对话，实现类GPT-4o的对话效...

Ai项目

3周前

5,0500

LineArt – 吉林大学等机构推出的设计绘图外观迁移框架

LineArt是什么 LineArt是吉林大学、瑞典皇家理工学院、东京工业大学等机构推出的，无需训练的高质量设计绘图外观迁移框架，能将复杂外观特征转移到详细的设计图纸上，辅助设计和艺术创作。LineA...

Ai项目

3周前

6,5450

SynthLight – 耶鲁大学联合 Adobe 推出的人像重照明技术

SynthLight是什么 SynthLight 是耶鲁大学和 Adobe Research 联合推出的基于扩散模型的人像重照明技术，通过模拟不同光照条件下的合成数据进行训练，能将人像照片重新渲染为具...

Ai项目

3周前

4,8500

X-Dyna – 字节联合斯坦福等高校推出的动画生成框架

X-Dyna是什么 X-Dyna 是基于扩散模型的动画生成框架，基于驱动视频中的面部表情和身体动作，将单张人类图像动画化，生成具有真实感和环境感知能力的动态效果。核心是 Dynamics-Adapte...

Ai项目

3周前

5,4000

DeepSeek-R1 – DeepSeek推出的高性能AI推理模型，性能对标OpenAI o1正式版

DeepSeek-R1是什么 DeepSeek-R1是杭州深度求索公司 DeepSeek 推出的高性能AI推理模型，对标OpenAI的o1正式版。DeepSeek-R1推理模型通过大规模强化学习技术进...

Ai项目

3周前

9,4000

k1.5 – Kimi推出的多模态思考模型

k1.5是什么 k1.5 是月之暗面Kimi推出的最新多模态思考模型，具备强大的推理和多模态处理能力。模型在 short-CoT（短链思维）模式下，数学、代码、视觉多模态和通用能力大幅超越了全球范围内...

Ai项目

3周前

4,6150

OmniThink – 浙大联合阿里通义实验室推出的深度思考机器写作框架

OmniThink是什么 OmniThink是浙江大学和阿里巴巴通义实验室联合开发的创新的机器写作框架，通过模拟人类的迭代扩展和反思过程，突破大型语言模型在机器写作中的知识边界。框架通过信息树和概念池...

Ai项目

3周前

5,7300

H-Optimus-0 – 法国初创公司Bioptimus开源的病理学AI基础模型

H-Optimus-0是什么 H-Optimus-0是法国初创公司Bioptimus发布的世界上最大的开源病理学AI基础模型。模型拥有11亿参数，是在专有数据集上训练的，数据集包含从4000个临床实践...

Ai项目

3周前

5,0100

Roop-Unleashed – AI换脸工具，支持批量换脸、VR换脸、直播换脸

Roop-Unleashed是什么 Roop-Unleashed 是基于 Roop 的开源项目，专注于深度伪造（Deepfake）技术的实现与优化。用户无需进行复杂的训练过程，可快速实现图像和视频中的...

Ai项目

3周前

6,1950

书生·浦像 – 上海AI Lab 联合港中文和浙大推出的超高动态成像算法

书生·浦像是什么书生·浦像是上海人工智能实验室联合香港中文大学、浙江大学等机构研发的超高动态成像算法，核心为浦像HDR（UltraFusion HDR）。算法结合了AIGC技术和HDR技术，通过曝光...

Ai项目

3周前

4,7200