OminiControl – AI图像生成框架,实现图像主题控制和空间精确控制 OminiControl是什么 OminiControl是高度通用且参数高效的图像生成框架,为扩散变换器模型如FLUX.1设计,实现对图像生成过程的精细控制。OminiControl支持主题驱动控制和... Ai项目 3周前5,1250
Step R-mini – 阶跃星辰推出的 Step 系列首个推理模型 Step R-mini是什么 Step R-mini(全称Step Reasoner mini)是阶跃星辰推出的推理模型, 是 Step 系列模型家族的首个推理模型,擅长主动规划、尝试和反思,基于慢思... Ai项目 3周前5,1250
Airweave – 将任何应用程序转为 Agent 知识库的开源工具 Airweave是什么 Airweave 是开源工具,能将任何应用程序的数据(包括API、数据库、网站等)同步到图数据库和向量数据库中,让数据能基于智能代理或搜索机制进行检索。Airweave用数据分... Ai项目 12个月前05,1250
pdf-craft – 开源 PDF 转 Markdown 工具 pdf-craft是什么 pdf-craft 是用在将 PDF 文件转换为其他格式(如 Markdown、EPUB)的工具,专注于处理扫描书籍的 PDF 文件。pdf-craft 支持提取正文内容,过... Ai项目 12个月前05,1250
交交 – 上海交大推出的口语对话情感大模型 交交是什么 交交是上海交通大学听觉认知与计算声学实验室推出的全球首个纯学术界自研的口语对话情感大模型。交交具备多人对话、多语言交流、方言理解、角色扮演、情感互动及知识问答等强大功能,支持汉语、英语、日... Ai项目 12个月前05,1250
Perplexica – 开源AI搜索引擎,支持多种搜索模式、实时信息更新 Perplexica是什么 Perplexica是开源的AI驱动搜索引擎,是Perplexity AI的开源替代品。基于机器学习算法和自然语言处理技术理解用户查询,提供精确答案。Perplexica支... Ai项目 3周前5,1200
FinRobot – 开源 AI Agent 平台,解决金融领域应用的综合解决方案 FinRobot是什么 FinRobot是开源的AI代理平台,专注于金融领域的应用。基于大型语言模型(LLMs)来构建能进行复杂分析和决策的金融专业AI代理。平台通过金融思维链(CoT)提示功能,将难... Ai项目 3周前5,1200
联通元景 – 中国联通AI开源的中文原生文生图模型 联通元景是什么 联通元景(UniT2IXL)是中国联通AI推出的中文原生文生图模型,完全在国产昇腾AI基础软硬件平台上实现训练和推理。模型采用复合语言编码模块,优化中文长文本和特色词汇理解,提升图像生... Ai项目 3周前5,1200
VideoPhy – UCLA 联合谷歌推出评估视频生成模型物理常识能力的基准测试 VideoPhy是什么 VideoPhy是UCLA和谷歌研究研究院联合推出的,首个评估视频生成模型物理常识能力的基准测试,能衡量模型生成的视频是否遵循现实世界的物理规则。VideoPhy基准包含688... Ai项目 3周前5,1200
RF-DETR – Roboflow推出的实时目标检测模型 RF-DETR是什么 RF-DETR是Roboflow推出的实时目标检测模型。RF-DETR是首个在COCO数据集上达到60+平均精度均值(mAP)的实时模型,性能优于现有的目标检测模型。RF-DET... Ai项目 12个月前05,1200