MnnLlmApp – 阿里巴巴开源的离线大模型 Android 手机应用AI助手 MnnLlmApp是什么 MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开源的 Android 手机应用,支持各类大语言模型(LLM)在手机上离线运行。具备多模态功能,能实现文本生成文本、图... Ai项目 12个月前4,8950
Magic 1-For-1 – 北大、英伟达等推出的高效视频生成模型 Magic 1-For-1是什么 Magic 1-For-1是北京大学、Hedra Inc. 和 Nvidia 推出的高效视频生成模型,基于优化内存消耗和推理延迟快速生成高质量视频片段。模型将复杂的文... Ai项目 12个月前04,8950
Maestro – 开源的端到端自动化测试框架 Maestro是什么 Maestro是用在移动和Web应用的端到端自动化测试框架。基于内置的容错能力和延迟容忍机制,解决传统测试中常见的不稳定性和等待问题。Maestro基于声明式语法,支持在yaml... Ai项目 12个月前04,8950
豆包·语音播客模型 – 火山引擎推出的语音播客模型 豆包·语音播客模型是什么 豆包·语音播客模型是字节跳动旗下火山引擎推出的语音播客模型。模型基于流式模型构建,可将文本秒级转化为双人对话式播客,具有低成本、高时效、强互动特点。解决了传统AI播客内容重复... Ai项目 4周前4,8900
GLM-PC – 智谱推出的电脑智能体,基于CogAgent视觉多模态模型构建 GLM-PC是什么 GLM-PC是智谱推出的基于多模态大模型CogAgent的电脑智能体。能像人类一样“观察”和“操作”计算机,协助用户高效完成各类电脑任务,如文档处理、网页搜索、信息整理、社交互动等... Ai项目 4周前4,8900
3DHM – 3D人体动作生成框架,单张图片生成任意视频动作 3DHM是什么 3DHM(3D Human Motions)是先进的3D人体动作生成技术,加州大学伯克利分校的研究人员推出。能从单张人物照片生成具有3D控制的动态人体视频,实现从静态图像到动态视频的转... Ai项目 4周前4,8900
Agent Laboratory – AMD 联合约翰·霍普金斯大学推出的自主科研 Agent Agent Laboratory是什么 Agent Laboratory是AMD和约翰·霍普金斯大学推出,基于大型语言模型(LLM)的自主研究框架,能加速科学发现、降低成本并提高研究质量。Agent ... Ai项目 4周前4,8900
MTVCrafter – 中科院联合中国电信等机构推出的人像动画生成框架 MTVCrafter是什么 MTVCrafter是中国科学院深圳先进技术研究院计算机视觉与模式识别实验室、中国电信人工智能研究所等机构推出的新型人类图像动画框架,基于原始3D运动序列进行高质量动画生成... Ai项目 4周前4,8850
SynCamMaster – 快手联合浙大、清华等机构推出的多视角视频生成模型 SynCamMaster是什么 SynCamMaster是浙江大学、快手科技、清华大学和香港中文大学的研究人员共同合作推出的全球首个多视角视频生成模型,能结合6自由度相机姿势,从任意视点生成开放世界视... Ai项目 4周前4,8850
IndexTTS – B 站推出的文本转语音模型,支持拼音纠正汉字发音 IndexTTS是什么 IndexTTS 是 B 站推出的工业级可控文本转语音(TTS)系统。基于 XTTS 和 Tortoise 模型开发,结合了 GPT 风格的生成技术,能将文本高效转化为自然流畅... Ai项目 12个月前04,8850