厦门大学《大模型概念、技术与应用实践》（PPT文件） – AI教程资料

《大模型概念、技术与应用实践》由厦门大学大数据教学团队制作，科普大模型技术及其在各领域的应用。强调其在大数据教学领域的影响力。回顾人工智能发展简史，引出大模型的定义、特点和分类，详细阐述了在自然语言处理、计算机视觉、语音识别等领域的广泛应用，以及对工作和生活的深远影响。介绍了AIGC（人工智能生成内容）技术，包括文本、图片、语音、视频生成及辅助编程等应用实践案例，展示了大模型在内容创作、智能办公、AI搜索等方面的强大能力。是一份全面、深入且通俗易懂的大模型科普资料，适合对人工智能和大模型技术感兴趣的读者学习和参考。

厦门大学大数据教学团队介绍

厦门大学大数据教学团队是国内高校大数据教学的重要贡献者，团队以林子雨副教授为核心，成员平均年龄46岁以下，结构合理，涵盖教学型、科研型和实验工程师。团队自2013年起专注于大数据教学，具有前瞻性和强大的执行力，在教材编写、MOOC课程、师资培养等方面取得了显著成就。
林子雨是厦门大学计算机科学与技术系副教授，以第一作者编著出版了15本大数据系列教材，被国内1000余所高校采用。曾获得多项教学成果奖，入选多个国家级教学项目，被授予“教育部国家智慧教育公共服务平台应用典型案例”等荣誉。他的个人主页提供了丰富的教学资源和联系方式。
林子雨编著的《数字素养通识教程——大数据与人工智能时代的计算机通识教育》是面向大一新生的教材，旨在重构大学计算机公共课知识体系，培养学生计算思维、数据思维和AI思维。教材官网提供了讲义PPT、MOOC视频、案例视频、上机实验、教学大纲等丰富资源，供师生使用。

人工智能发展简史

人工智能的发展历程可以追溯到1950年图灵测试的提出。1956年，达特茅斯会议标志着人工智能学科的正式诞生。此后，人工智能经历了萌芽期（1950-2005）、沉淀期（2006-2019）和爆发期（2020-至今）。从早期的CNN到Transformer架构，再到GPT系列和多模态大模型的出现，人工智能技术不断演进，推动了自然语言处理、计算机视觉等领域的快速发展。

人工智能思维

人工智能思维强调对人工智能运行模式的理解，包括：

了解：掌握AI的基础原理。
区分：明确人类能力和机器能力的差异。
协作：学会与AI系统协同工作，提升效率。

这种思维模式有助于人们更好地适应数字化时代的需求。

大模型：人工智能的前沿

- 大模型是基于深度学习技术的超大规模人工智能模型，具有海量参数、强大的学习能力和泛化能力。其“大”的特点体现在参数数量庞大、训练数据量大和计算资源需求高。例如，GPT-3参数规模达1750亿，而GPT-4的参数规模超过1.8万亿。

：大模型的发展经历了三个阶段：
- ：以CNN为代表的神经网络模型。
- ：以Transformer架构为代表的模型。
- 爆发期（2020-至今）：以GPT系列为代表的预训练大模型。
- 大模型是人工智能领域的前沿技术，属于预训练模型的一种。它通过大规模数据训练，具备强大的语言生成、逻辑推理和多模态处理能力，是推动AI技术发展的关键力量。

：国内外主要的大模型产品，包括：
- ：如OpenAI的ChatGPT、Gemini，以及Sora等。
- 国内产品：如DeepSeek、通义千问、豆包、文心一言等。
- 这些产品在自然语言处理、多模态理解和生成等领域表现出色，广泛应用于智能客服、内容创作、代码生成等场景。

- 大模型基于Transformer架构，通过编码器-解码器结构和自注意力机制，能够处理和生成自然语言文本。其核心能力在于捕捉单词之间的复杂关系，实现高效的文本生成和理解。
：大模型具有以下特点：
- 巨大规模：参数数量庞大，模型体积大。
- 涌现能力：在大规模数据训练下展现出复杂能力。
- 多任务学习：能够处理多种任务，具备泛化能力。
- 大数据训练：需要海量数据支持。
- ：依赖GPU/TPU等硬件加速。
- 迁移学习和预训练：通过预训练和微调适应不同任务。
- 大模型按照应用领域可分为L0、L1、L2三个层级，覆盖自然语言处理、计算机视觉、语音识别等多个领域。

：大模型在多个领域有广泛应用，包括但不限于：
- 自然语言处理：文本生成、翻译、问答系统等。
- ：图像分类、目标检测、医学影像分析等。
- 语音识别：语音合成、语音翻译等。
- 推荐系统：个性化推荐、广告投放等。
- 医疗健康：辅助诊断、药物研发等。
- ：风险评估、欺诈检测等。
：大模型对工作和生活产生了深远影响：
- 工作：提高了工作效率，推动了自动化办公和智能客服的发展。
- 生活：改变了内容消费方式，提供了个性化服务。
- 介绍了本地部署大模型的优势，包括数据隐私保护、避免使用限制、定制化灵活性、成本优化和离线高效使用。以Ollama和DeepSeek R1为例，展示了本地部署的具体方法。
- 基于大模型的智能体能够模拟人类智能行为，具备自主性和交互性。例如，OpenAI的Operator和Deep Research能够完成复杂任务，提供高效、个性化的服务。