VidTok – 微软开源的视频分词器,支持连续和离散分词化 VidTok是什么 VidTok(Video Tokenizer)是微软开源的先进的视频分词器,通过高效的算法将视频内容转换成一系列“视频词”。支持连续和离散分词化,具有灵活的压缩率和多样化的隐空间... Ai项目 2周前4,6700
Diff-Instruct – 从预训练扩散模型中迁移知识的通用框架 Diff-Instruct是什么 Diff-Instruct是先进的知识转移方法,用于从预训练的扩散模型中提取知识,指导其他生成模型的训练。它基于一种新的散度度量——积分Kullback-Leible... Ai项目 2周前4,2600
3DHM – 3D人体动作生成框架,单张图片生成任意视频动作 3DHM是什么 3DHM(3D Human Motions)是先进的3D人体动作生成技术,加州大学伯克利分校的研究人员推出。能从单张人物照片生成具有3D控制的动态人体视频,实现从静态图像到动态视频的转... Ai项目 2周前4,7100
DeepSeek V3 – DeepSeek开源的最新版 AI 模型,编程能力超越Claude DeepSeek V3是什么 DeepSeek V3是知名私募巨头幻方量化旗下人工智能公司深度求索(DeepSeek)开源的最新版AI模型,在多语言编程能力上的进步显著。在aider多语言编程测评中的... Ai项目 2周前10,0300
FinRobot – 开源 AI Agent 平台,解决金融领域应用的综合解决方案 FinRobot是什么 FinRobot是开源的AI代理平台,专注于金融领域的应用。基于大型语言模型(LLMs)来构建能进行复杂分析和决策的金融专业AI代理。平台通过金融思维链(CoT)提示功能,将难... Ai项目 2周前5,0300
FastExcel – 开源的高性能 Excel 处理工具 FastExcel是什么 FastExcel是基于Java的开源库,提供快速、简洁且能解决大文件内存溢出问题的Excel处理工具。FastExcel兼容EasyExcel,提供性能优化、bug修复,新... Ai项目 2周前5,0450
DRT-o1 – 腾讯研究院推出的文学翻译系列AI模型 DRT-o1是什么 DRT-o1是腾讯研究院推出的一系列AI模型,通过长链思考推理(CoT)技术显著提升了文学作品的翻译质量,尤其在处理比喻和隐喻等修辞手法时。模型能更深入地理解文本,保留原文的情感色... Ai项目 2周前4,6950
WiS – 淘天联合阿里研究团队推出的多智能体博弈游戏平台 WiS是什么 WiS(Who is Spy)是淘天集团和阿里的技术研究团队推出的创新在线AI竞赛平台,专门设计用在测试和分析基于大型语言模型(LLMs)的多智能体系统(MAS)。WiS模拟“谁是卧底... Ai项目 2周前5,0700
TRELLIS – 微软联合清华和中科大推出的高质量 3D 生成模型 TRELLIS是什么 TRELLIS是清华大学、中国科学技术大学和微软研究院推出的3D生成模型,基于Structured LATent(SLAT)表示法,从文本或图像提示中生成高质量、多样化的3D资产... Ai项目 2周前5,1300
Browser Use – AI 浏览器助手,自动执行网页中的交互任务 Browser Use是什么 Browser Use是专门为大语言模型服务的智能浏览器工具,创新的Python工具库,让AI代理能像人类一样自然地浏览和操作网页。Browser Use支持多标签页管理... Ai项目 2周前4,6400