厦门大学《大模型概念、技术与应用实践》(PPT文件) – AI教程资料

AI教程19小时前更新 Agixxw
90 0 0

大模型概念、技术与应用实践》由厦门大学大数据教学团队制作,科普大模型技术及其在各领域的应用。强调其在大数据教学领域的影响力。回顾人工智能发展简史,引出大模型的定义、特点和分类,详细阐述了在自然语言处理、计算机视觉、语音识别等领域的广泛应用,以及对工作和生活的深远影响。介绍了AIGC(人工智能生成内容)技术,包括文本、图片、语音、视频生成及辅助编程等应用实践案例,展示了大模型在内容创作、智能办公、AI搜索等方面的强大能力。是一份全面、深入且通俗易懂的大模型科普资料,适合对人工智能和大模型技术感兴趣的读者学习和参考。

厦门大学大数据教学团队介绍

厦门大学大数据教学团队是国内高校大数据教学的重要贡献者,团队以林子雨副教授为核心,成员平均年龄46岁以下,结构合理,涵盖教学型、科研型和实验工程师。团队自2013年起专注于大数据教学,具有前瞻性和强大的执行力,在教材编写、MOOC课程、师资培养等方面取得了显著成就。
林子雨是厦门大学计算机科学与技术系副教授,以第一作者编著出版了15本大数据系列教材,被国内1000余所高校采用。曾获得多项教学成果奖,入选多个国家级教学项目,被授予“教育部国家智慧教育公共服务平台应用典型案例”等荣誉。他的个人主页提供了丰富的教学资源和联系方式。
林子雨编著的《数字素养通识教程——大数据与人工智能时代的计算机通识教育》是面向大一新生的教材,旨在重构大学计算机公共课知识体系,培养学生计算思维、数据思维和AI思维。教材官网提供了讲义PPT、MOOC视频、案例视频、上机实验、教学大纲等丰富资源,供师生使用。

人工智能发展简史

人工智能的发展历程可以追溯到1950年图灵测试的提出。1956年,达特茅斯会议标志着人工智能学科的正式诞生。此后,人工智能经历了萌芽期(1950-2005)、沉淀期(2006-2019)和爆发期(2020-至今)。从早期的CNN到Transformer架构,再到GPT系列和多模态大模型的出现,人工智能技术不断演进,推动了自然语言处理、计算机视觉等领域的快速发展。

人工智能思维

人工智能思维强调对人工智能运行模式的理解,包括:
  • 了解:掌握AI的基础原理。
  • 区分:明确人类能力和机器能力的差异。
  • 协作:学会与AI系统协同工作,提升效率。
这种思维模式有助于人们更好地适应数字化时代的需求。

大模型:人工智能的前沿

    • 大模型是基于深度学习技术的超大规模人工智能模型,具有海量参数、强大的学习能力和泛化能力。其“大”的特点体现在参数数量庞大、训练数据量大和计算资源需求高。例如,GPT-3参数规模达1750亿,而GPT-4的参数规模超过1.8万亿。
  • :大模型的发展经历了三个阶段:
    • :以CNN为代表的神经网络模型。
    • :以Transformer架构为代表的模型。
    • 爆发期(2020-至今):以GPT系列为代表的预训练大模型。
    • 大模型是人工智能领域的前沿技术,属于预训练模型的一种。它通过大规模数据训练,具备强大的语言生成、逻辑推理和多模态处理能力,是推动AI技术发展的关键力量。
  • :国内外主要的大模型产品,包括:
    • :如OpenAI的ChatGPT、Gemini,以及Sora等。
    • 国内产品:如DeepSeek、通义千问、豆包、文心一言等。
    • 这些产品在自然语言处理、多模态理解和生成等领域表现出色,广泛应用于智能客服、内容创作、代码生成等场景。
    • 大模型基于Transformer架构,通过编码器-解码器结构和自注意力机制,能够处理和生成自然语言文本。其核心能力在于捕捉单词之间的复杂关系,实现高效的文本生成和理解。
  • :大模型具有以下特点:
    • 巨大规模:参数数量庞大,模型体积大。
    • 涌现能力:在大规模数据训练下展现出复杂能力。
    • 多任务学习:能够处理多种任务,具备泛化能力。
    • 大数据训练:需要海量数据支持。
    • :依赖GPU/TPU等硬件加速。
    • 迁移学习和预训练:通过预训练和微调适应不同任务。
    • 大模型按照应用领域可分为L0、L1、L2三个层级,覆盖自然语言处理、计算机视觉、语音识别等多个领域。
  • :大模型在多个领域有广泛应用,包括但不限于:
    • 自然语言处理:文本生成、翻译、问答系统等。
    • :图像分类、目标检测、医学影像分析等。
    • 语音识别:语音合成、语音翻译等。
    • 推荐系统:个性化推荐、广告投放等。
    • 医疗健康:辅助诊断、药物研发等。
    • :风险评估、欺诈检测等。
  • :大模型对工作和生活产生了深远影响:
    • 工作:提高了工作效率,推动了自动化办公和智能客服的发展。
    • 生活:改变了内容消费方式,提供了个性化服务。
    • 介绍了本地部署大模型的优势,包括数据隐私保护、避免使用限制、定制化灵活性、成本优化和离线高效使用。以Ollama和DeepSeek R1为例,展示了本地部署的具体方法。
    • 基于大模型的智能体能够模拟人类智能行为,具备自主性和交互性。例如,OpenAI的Operator和Deep Research能够完成复杂任务,提供高效、个性化的服务。

AIGC应用与实践

    • AIGC(人工智能生成内容)是利用AI技术生成文本、图像、音频、视频等内容的新方式。它基于生成对抗网络(GAN)、预训练模型等技术,能够根据用户输入生成高质量内容,广泛应用于创意设计、教育、娱乐等领域。
    • 介绍了文本生成工具(如DeepSeek、文心一言)的使用方法和技巧。这些工具能够根据用户提示生成文章、诗歌、代码等,并支持多轮对话和文档处理功能。
    • 图片类AIGC利用深度学习生成图像,应用场景包括图像生成、修复、风格转换等。以百度文心一格为例,展示了如何通过输入提示词生成高质量图片。
    • 语音类AIGC能够实现语音识别、语音合成和情感分析等功能,广泛应用于智能语音助手和客服领域。以豆包和讯飞智作为例,展示了语音类AIGC的使用方法。
    • 视频类AIGC能够根据文本或图像生成视频内容,应用场景包括广告制作、影视特效等。以腾讯智影为例,展示了如何生成数字人播报视频。
    • AIGC能够自动生成代码,提高编程效率。以豆包为例,展示了如何通过AI生成Python代码。
    • AI搜索利用自然语言处理和机器学习技术,提供更精准的搜索结果。以360的纳米AI搜索为例,展示了其多模态搜索和智能工具集成的特点。
    • AI智能办公通过文档处理、数据分析和智能助手等功能,提升办公效率。例如,AI能够生成文档初稿、自动排版、总结文档内容和辅助数据分析。
© 版权声明

相关文章