《大模型概念、技术与应用实践》由厦门大学大数据教学团队制作,科普大模型技术及其在各领域的应用。强调其在大数据教学领域的影响力。回顾人工智能发展简史,引出大模型的定义、特点和分类,详细阐述了在自然语言处理、计算机视觉、语音识别等领域的广泛应用,以及对工作和生活的深远影响。介绍了AIGC(人工智能生成内容)技术,包括文本、图片、语音、视频生成及辅助编程等应用实践案例,展示了大模型在内容创作、智能办公、AI搜索等方面的强大能力。是一份全面、深入且通俗易懂的大模型科普资料,适合对人工智能和大模型技术感兴趣的读者学习和参考。
厦门大学大数据教学团队介绍
厦门大学大数据教学团队是国内高校大数据教学的重要贡献者,团队以林子雨副教授为核心,成员平均年龄46岁以下,结构合理,涵盖教学型、科研型和实验工程师。团队自2013年起专注于大数据教学,具有前瞻性和强大的执行力,在教材编写、MOOC课程、师资培养等方面取得了显著成就。
林子雨是厦门大学计算机科学与技术系副教授,以第一作者编著出版了15本大数据系列教材,被国内1000余所高校采用。曾获得多项教学成果奖,入选多个国家级教学项目,被授予“教育部国家智慧教育公共服务平台应用典型案例”等荣誉。他的个人主页提供了丰富的教学资源和联系方式。
林子雨编著的《数字素养通识教程——大数据与人工智能时代的计算机通识教育》是面向大一新生的教材,旨在重构大学计算机公共课知识体系,培养学生计算思维、数据思维和AI思维。教材官网提供了讲义PPT、MOOC视频、案例视频、上机实验、教学大纲等丰富资源,供师生使用。
人工智能发展简史
人工智能的发展历程可以追溯到1950年图灵测试的提出。1956年,达特茅斯会议标志着人工智能学科的正式诞生。此后,人工智能经历了萌芽期(1950-2005)、沉淀期(2006-2019)和爆发期(2020-至今)。从早期的CNN到Transformer架构,再到GPT系列和多模态大模型的出现,人工智能技术不断演进,推动了自然语言处理、计算机视觉等领域的快速发展。
人工智能思维
-
了解:掌握AI的基础原理。
-
区分:明确人类能力和机器能力的差异。
-
协作:学会与AI系统协同工作,提升效率。
大模型:人工智能的前沿
-
- 大模型是基于深度学习技术的超大规模人工智能模型,具有海量参数、强大的学习能力和泛化能力。其“大”的特点体现在参数数量庞大、训练数据量大和计算资源需求高。例如,GPT-3参数规模达1750亿,而GPT-4的参数规模超过1.8万亿。
- :大模型的发展经历了三个阶段:
- :以CNN为代表的神经网络模型。
- :以Transformer架构为代表的模型。
- 爆发期(2020-至今):以GPT系列为代表的预训练大模型。
-
- 大模型是人工智能领域的前沿技术,属于预训练模型的一种。它通过大规模数据训练,具备强大的语言生成、逻辑推理和多模态处理能力,是推动AI技术发展的关键力量。
- :国内外主要的大模型产品,包括:
- :如OpenAI的ChatGPT、Gemini,以及Sora等。
- 国内产品:如DeepSeek、通义千问、豆包、文心一言等。
- 这些产品在自然语言处理、多模态理解和生成等领域表现出色,广泛应用于智能客服、内容创作、代码生成等场景。
-
- 大模型基于Transformer架构,通过编码器-解码器结构和自注意力机制,能够处理和生成自然语言文本。其核心能力在于捕捉单词之间的复杂关系,实现高效的文本生成和理解。
- :大模型具有以下特点:
- 巨大规模:参数数量庞大,模型体积大。
- 涌现能力:在大规模数据训练下展现出复杂能力。
- 多任务学习:能够处理多种任务,具备泛化能力。
- 大数据训练:需要海量数据支持。
- :依赖GPU/TPU等硬件加速。
- 迁移学习和预训练:通过预训练和微调适应不同任务。
-
- 大模型按照应用领域可分为L0、L1、L2三个层级,覆盖自然语言处理、计算机视觉、语音识别等多个领域。
- :大模型在多个领域有广泛应用,包括但不限于:
- 自然语言处理:文本生成、翻译、问答系统等。
- :图像分类、目标检测、医学影像分析等。
- 语音识别:语音合成、语音翻译等。
- 推荐系统:个性化推荐、广告投放等。
- 医疗健康:辅助诊断、药物研发等。
- :风险评估、欺诈检测等。
- :大模型对工作和生活产生了深远影响:
- 工作:提高了工作效率,推动了自动化办公和智能客服的发展。
- 生活:改变了内容消费方式,提供了个性化服务。
-
- 介绍了本地部署大模型的优势,包括数据隐私保护、避免使用限制、定制化灵活性、成本优化和离线高效使用。以Ollama和DeepSeek R1为例,展示了本地部署的具体方法。
-
- 基于大模型的智能体能够模拟人类智能行为,具备自主性和交互性。例如,OpenAI的Operator和Deep Research能够完成复杂任务,提供高效、个性化的服务。
AIGC应用与实践
-
- AIGC(人工智能生成内容)是利用AI技术生成文本、图像、音频、视频等内容的新方式。它基于生成对抗网络(GAN)、预训练模型等技术,能够根据用户输入生成高质量内容,广泛应用于创意设计、教育、娱乐等领域。
-
- 介绍了文本生成工具(如DeepSeek、文心一言)的使用方法和技巧。这些工具能够根据用户提示生成文章、诗歌、代码等,并支持多轮对话和文档处理功能。
-
- 图片类AIGC利用深度学习生成图像,应用场景包括图像生成、修复、风格转换等。以百度文心一格为例,展示了如何通过输入提示词生成高质量图片。
-
- 语音类AIGC能够实现语音识别、语音合成和情感分析等功能,广泛应用于智能语音助手和客服领域。以豆包和讯飞智作为例,展示了语音类AIGC的使用方法。
-
- 视频类AIGC能够根据文本或图像生成视频内容,应用场景包括广告制作、影视特效等。以腾讯智影为例,展示了如何生成数字人播报视频。
-
- AIGC能够自动生成代码,提高编程效率。以豆包为例,展示了如何通过AI生成Python代码。
-
- AI搜索利用自然语言处理和机器学习技术,提供更精准的搜索结果。以360的纳米AI搜索为例,展示了其多模态搜索和智能工具集成的特点。
-
- AI智能办公通过文档处理、数据分析和智能助手等功能,提升办公效率。例如,AI能够生成文档初稿、自动排版、总结文档内容和辅助数据分析。