DeepFloyd IF:StabilityAI旗下的DeepFloyd团队推出的图片生成模型

DeepFloyd IF:StabilityAI旗下的DeepFloyd团队推出的图片生成模型

DeepFloyd IF是由StabilityAI旗下的DeepFloyd研究团队推出的开源的文本到图像生成模型,IF是一个基于级联方法的模块化神经网络。IF是由多个神经模块(处理特定任务的独立神经网络)构建的,在一个架构内联合起来产生协同效应。IF以级联方式生成高分辨率图像:从产生低分辨率样本的基础模型开始,然后由一系列的升级模型提升,以创造令人惊叹的高分辨率图像。IF的基础和超分辨率模型采用扩散模型,利用马尔可夫链步骤将随机噪声引入数据中,然后再反转过程,从噪声中生成新的数据样本。IF在像素空间内操作,而不是依赖潜伏图像表征的潜伏扩散(如稳定扩散)。
03250
Cohere

Cohere

Cohere是一个提供大语言模型的平台,帮助开发人员和企业构建高性能的AI产品。该平台主要提供AI驱动的搜索文本(多语言嵌入、神经搜索、搜索排名)、分类文本和生成文本等服务,可帮助企业快速部署对话式AI聊天机器人、生成式搜索引擎、文本摘要总结、增强向量检索等。5月3日,Cohere公司获2.5亿美元融资,目前估值约20亿美元,投资者包括Saleforce、Nvidia、Index Ventures等。该公司的联合创始人 Aidan Gomez 是《Attention Is All You Need》论文的作者之一,此论文提出了 GPT 等大语言模型的采用的 Transformer 架构。Cohere提供了一个Playground供用户试玩,如果你感兴趣的话可以访问试试看。另外Cohere还推出了LLM University,一个学习大语言模型的课程,可帮助你了解大型语言模型及其体系结构的基础知识。
01400
MiracleVision 奇想智能

MiracleVision 奇想智能

MiracleVision奇想智能是什么MiracleVision奇想智能是由美图秀秀公司推出的自研AI视觉大模型,不仅具备高度的美学导向和图像处理能力,还能够广泛地应用于多个行业,提高工作流效率。同时,它还提供了简单易用的AI视觉创作工具,使用户能够快速进行图像的创作和编辑。最新的MiracleVision 4.0支持AI图片生成、AI设计排版和AI视频生成等能力。MiracleVision奇想智能的主要能力AI图片生成,支持文生图和图生图,输入文字或上传图像即可创作图片,提供多种风格、参数调整、图片尺寸、精准画面控制等AI智能设计,包括矢量图形、文字特效、智能分层和智能排版,可以满足AI设计的基础需求AI视频生成,提供文生视频、图生视频、视频运镜、视频生视频四大功能,让奇思妙想动起来视觉模型商店,平台提供丰富的视觉模型,从经典复古到现代潮流、从超现实幻想到极简抽象,用户可以任意选择创造惊艳的视觉效果MiracleVision奇想智能的适用行业电商行业:从涂鸦生成线稿、线稿上色、商品图、模特试穿图,再到电商物料输出,全程可通过MiracleVision实现。游戏制作:包揽场景设计、角色设计、道具设计、UI图标、宣发物料等流程,拓宽设计师想象空间的同时助力游戏行业降本。影视行业:充分满足概念场景设计、分镜设计、人物造型、道具设计、宣发物料的效果要求,极大提升影视行业设计环节的效率。广告设计:覆盖创意脑暴、创意深化、平面排版、多尺寸延展、线下投放预览的全工作流,助力客户在广告物料制作环节提效。动漫卡通:打通了概念设计、故事板生成、线稿上色、动漫补帧、视频转动漫等流程,支持创意到物料成品的快速落地。
01750
Gradio

Gradio

Gradio是一个开源的Python库,用于构建演示机器学习或数据科学,以及web应用程序。你可以使用Gradio基于自己的机器学习模型或数据科学工作流快速创建一个漂亮的用户界面,让用户可以尝试拖放他们自己的图像、输入文本、录制他们自己的声音,并通过浏览器与你的演示程序进行交互。Google、HuggingFace、亚马逊、Meta、思科、VMware等公司都在使用。Gradio适用于:向客户/合伙人/用户/学生演示您的机器学习模型。通过自动共享链接快速部署您的模型,并获得模型性能反馈。在开发过程中使用内置的操作和解释工具交互式地调试模型。
0750
魔搭社区:阿里达摩院推出的AI模型社区,超过300+开源AI模型

魔搭社区:阿里达摩院推出的AI模型社区,超过300+开源AI模型

魔搭社区是什么魔搭社区(ModelScope)是阿里巴巴达摩院推出的综合性的人工智能模型共享与服务平台,为构建一个开放、高效、易用的AI模型生态,为开发者、研究人员和企业用户提供一站式的模型获取、部署和应用体验。 ModelScope平台汇集了丰富的预训练模型资源,涵盖自然语言处理、计算机视觉、语音识别等多个领域。用户可以通过简单的搜索和下载操作,快速获取所需的模型,结合平台提供的工具进行微调、优化和部署。魔搭社区支持多种硬件平台,包括昇腾、GPU等,满足不同用户的需求。魔搭社区的主要功能丰富的预训练模型:提供涵盖自然语言处理、计算机视觉、语音识别、多模态等多个领域的预训练模型。模型上下文协议(MCP):推出MCP广场,上架千余款热门MCP服务,包括支付宝、MiniMax等独家首发服务。MCP为大模型对接外部数据源和工具建立了统一标准,简化了开发流程。数据集与指标:提供多种数据集和性能评估指标,方便开发者进行模型训练和优化。模型推理与部署:支持在线推理、本地部署和云端部署。用户可以通过网页界面直接上传数据获取推理结果,也可以通过SDK在本地运行模型。分布式训练与优化:提供分布式训练工具,支持多种框架(如PyTorch、TensorFlow等),提供模型压缩、量化等优化工具。调试与集成:提供简单易用的调试环境和工具,支持第三方平台集成,降低开发者使用门槛。开源与社区共建:作为一个开源平台,鼓励开发者贡献模型和代码,形成开源协作生态。开发者社区:提供交流平台,开发者可以分享经验、讨论技术问题,共同推动AI技术的发展。如何使用魔搭社区访问平台:访问魔搭社区的官方网站,注册或登录。环境准备安装 Python:确保系统中已安装 Python(推荐版本 3.8 及以上)。安装 ModelScope Python 库:通过以下命令安装 ModelScope 的 Python 库。模型下载通过命令行下载:使用 ModelScope 提供的命令行工具下载模型。通过网页界面下载:访问魔搭社区官网,在模型库中搜索并下载所需的模型。模型推理:使用 Python 脚本加载模型并进行推理。模型微调:使用 ms-swift 进行微调ms-swift 是魔搭社区提供的大模型训练和部署框架。模型部署:使用 Vllm 部署模型,Vllm 是一个高效的推理框架,支持多 GPU 分布式推理。探索更多模型和工具:访问魔搭社区官网,浏览丰富的模型库、数据集和工具。参与社区交流:加入魔搭社区的开发者社区,与其他开发者交流经验,共同推动 AI 技术的发展。魔搭社区的应用场景AI研究与教育:研究人员和教育工作者可以用ModelScope上的模型进行AI相关的研究和教学活动,提高研究效率和学习效果。企业应用开发:企业可以用ModelScope上的模型快速开发AI应用,降低研发成本,加快产品上市时间。创业项目:初创企业可以借助ModelScope上的模型资源,开发创新的AI产品和服务,验证商业模式并实现产品的快速迭代。个人项目:个人开发者可以用ModelScope上的模型实现自己的创意,开发个性化的AI应用。多模态应用:ModelScope支持多种多模态模型,例如处理文本、图像和视频的InternVL3系列模型。可以应用于智能助手、内容创作、视频生成等领域。
01950
悟道

悟道

2021年6月,北京智源研究院(BAAI)推出了悟道1.0的后续版本悟道2.0,作为中国第一个超大规模智能模型系统。悟道是一个语言模型,旨在在人类层面的思维上超越 OpenAI 的 GPT-3 和谷歌的 LaMDA。经过4.9TB的图像和文本训练,并在9个基准上超过了最先进(SOTA)水平,悟道比任何同行都更接近于实现通用人工智能(AGI)和人类水平的思维。悟道接受了4.9 TB高质量英文和中文图像和文本的训练:1.2TB中文文本数据2.5TB中文图形数据1.2TB英文文本数据悟道是基于开源的 MoE 系统 FastMoE 进行训练的。MoE是一种机器学习技术,其工作原理如下:将预测建模任务划分为子任务,针对每个子任务训练专家(学习者)模型,开发门控模型,该门控模型基于要预测的输入来学习咨询哪个专家,并组合预测。FastMoE使悟道能够并行咨询不同的专家模型,并切换到预测结果最好的模型。例如,如果输入是英文文本,悟道将使用预测模型,该模型可以在英文文本中生成回应。
01400
Jan(Jan.ai)

Jan(Jan.ai)

Jan(Jan.ai)是一个免费开源的本地运行大模型并进行AI聊天对话的工具,可帮助用户在本地电脑(Windows、Mac、Linux)上安装、部署、运行并使用开源版本的ChatGPT替代大模型,如LLaMa、Mistral、Phi-2等20多个模型,也支持输入自己的OpenAI API Key以运行GPT。相较于AI工具集此前介绍的Ollama,该工具提供了对话UI和API服务器,适合开发者、研究人员或AI爱好者本地体验开源的大模型。Jan的主要功能本地运行开源大模型:支持LlaMa、Mistral、Phi-2、DeepSeek、Yi等20多个模型,可手动导入也可以在模型库下载模型简洁好用的聊天界面:软件界面清爽简洁、直观易用,直接在本地与开源大模型快速进行对话聊天支持多个平台:Jan支持在Windows、Mac(Intel、M1/M2/M3)和Linux等操作系统运行,后续还将推出移动端APP。内置API服务器:与OpenAI API兼容,可通过API获取模型信息、下载、启动、停止模型及聊天等如何使用Jan访问Jan的官网(jan.ai),选择对应的电脑操作系统版本,点击Download进行下载然后安装并打开软件,在软件界面的左下角点击Download your first model进入模型库Hub界面,选择你感兴趣的模型进行下载,下载完成后点击Use使用该模型在对话界面输入你的描述即可与你选择的模型进行对话啦Jan还在持续开发中,后续会支持移动端APP、创建AI助理、推理引擎、插件扩展等功能。
0950
GPT

GPT

GPT-4介绍GPT-4(Generative Pre-trained Transformer)是 OpenAI 开发的自然语言处理模型 GPT 家族中的第四个版本,该模型依靠强大的神经网络来理解和生成类似人类的语言。 如何免费使用GPT-4?不开会员的6种方法 目前官方版的GPT-4仅能通过ChatGPT Plus付费会员才能使用,免费版的ChatGPT无法使用最新的GPT-4,而Plus版本需要每个月花费20美元来订阅,并且国内付款非常困... AI教程 2年前 (2023) GPT-4 通过使用被称为「转换器(Transformer)」的特殊架构来帮助软件理解单词的含义以及它们在句子中的组合方式。通俗来讲,Transformer帮助计算机找出如何将所有的词以正确的顺序放在一起,使之有意义。之所以采用这样的方法,是因为该模型已经在一个巨大的数据集上进行了训练,其中包括来自不同来源的文本,如书籍、文章和网站。这种训练使 GPT-4 模型能够进行类似人类的对话,并产生看似有意义的回应。不过虽然 GPT-4 创造的文本和回应读起来像人,但它远远不是有意识的智能,离通用人工智能还有距离。GPT-4的工作原理GPT-4通过与其前身(GPT-3.5)相同的基本流程工作,但规模更大,以下是其主要的工作原理:Transformer架构: GPT-4是使用一种叫做「Transformer」的设计来构建的,这些转换器就像超级智能机器,能够理解一句话中哪些词是重要的,以及它们之间的关系。大规模的预训练: GPT-4从大量的文本中学习,如书籍、网站和文章,这样一来,它就能更好地理解语言模式、语法和事实。微调(Fine-tuning): 在从大量文本中学习后,GPT-4会在特定的任务中接受训练,如回答问题或理解文本中的情感,这有助于它在处理这些任务时变得更加出色。分词(Tokenization): GPT-4将文本分解成更小的部分,称为「tokens」,这些token可以是单词或单词的一部分,这有助于它处理不同的语言并理解词语的含义。上下文窗口(Context window): GPT-4有一个限制,即它可以一次查看多少个token。这个限制有助于它理解语境和单词之间的关系,但这也意味着它不一定能理解很长的句子或段落。概率分布和抽样: 当GPT-4生成文本时,它根据模型认为每个词的可能性的大小来猜测下一个词。然后,它从这些猜测中挑选出一个词,使其够创造出多样化和有趣的句子。细粒度控制(Fine-grained control): GPT-4可以通过使用特殊提示或调整其设置等技巧,引导它给出特定类型的答案或文本,以帮助从该模型中获得我们想要的结果。ChatGPT和GPT-4的区别ChatGPT 和 GPT-4 并不是同一回事,ChatGPT 是基于 GPT-3.5 和 GPT-4 模型的,专门为对话式人工智能应用而设计的,比如根据用户输入生成类似人类的文本回复。而GPT-4指的是GPT系列大语言模型的当前版本——驱动ChatGPT的引擎。ChatGPT提供的输出读起来更自然,GPT-4更强大,在输入/输出方面可以处理更多文本。GPT-4可以免费访问吗?这个问题的答案:是也不是。用户可以通过ChatGPT、New Bing等软件访问GPT-4,这些平台使用GPT-4来生成内容并与用户互动。然而,GPT-4只有在ChatGPT Plus付费计划下才能使用,或者作为开发者建立应用程序和服务的API。New Bing(新必应)可以每天免费有限次数使用GPT-4驱动的AI聊天,而独立用户在这些人工智能聊天机器人平台之外没有机会使用GPT-4。
02200