
会员
从零开始大模型开发与微调:基于PyTorch与ChatGLM
王晓华更新时间:2024-12-31 17:38:36
最新章节:18.5 本章小结开会员,本书免费读 >
大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch2.0深度学习环境搭建、从零开始学习PyTorch2.0、深度学习基础算法详解、基于PyTorch卷积层的MNIST分类实战、PyTorch数据处理与模型展示、ResNet实战、有趣的词嵌入、基于PyTorch循环神经网络的中文情感分类实战、自然语言处理的编码器、预训练模型BERT、自然语言处理的解码器、强化学习实战、只具有解码器的GPT-2模型、实战训练自己的ChatGPT、开源大模型ChatGLM使用详解、ChatGLM高级定制化应用实战、对ChatGLM进行高级微调。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》适合PyTorch深度学习初学者、大模型开发初学者、大模型开发人员学习,也适合高等院校人工智能、智能科学与技术、数据科学与大数据技术、计算机科学与技术等专业的师生作为教学参考书。
品牌:清华大学
上架时间:2023-11-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
从零开始大模型开发与微调:基于PyTorch与ChatGLM最新章节
查看全部- 18.5 本章小结
- 18.4.3 Huggingface专用PEFT的使用
- 18.4.2 PEFT的使用与参数设计
- 18.4.1 PEFT技术详解
- 18.4 高级微调方法3——基于Huggingface的PEFT模型微调
- 18.3.5 基于基本原理的LoRA实现
- 18.3.4 基于自定义LoRA的模型推断
- 18.3.3 基于自定义LoRA的模型训练
- 18.3.2 自定义LoRA的使用方法
- 18.3.1 对ChatGLM进行微调的方法——LoRA
王晓华
主页
最新上架
- 会员
AI原生应用开发:提示工程原理与实战
本书结合AI原生应用落地的大量实践,系统讲解提示工程的核心原理、相关案例分析和实战应用,涵盖提示工程概述、结构化提示设计、NLP任务提示、内容创作提示、生成可控性提示、提示安全设计、形式语言风格提示、推理提示和智能体提示等内容。本书的初衷不是告诉读者如何套用各种预设的提示模板,而是帮助读者深入理解和应用提示设计技巧,以找到决定大语言模型输出的关键因子,进而将提示工程的理论知识应用到产品设计中。本书计算机18.2万字 - 会员
揭秘大模型:从原理到实战
本书从技术角度深度解析大模型的原理,从大模型的基础概念及领域发展现状入手,概述大模型的理论基础,介绍OpenAIGPT、清华大学GLM、MetaLlama等主流大模型的技术原理,并从大模型参数高效微调、大模型指令微调、大模型训练优化和大模型推理优化等多角度解析大模型背后的技术,带领读者全方位掌握大模型的原理和实践方法。本书最后介绍私有大模型的构建,手把手指导读者做技术选型并搭建自己的私有大模型计算机12.2万字 - 会员
贝叶斯算法与机器学习
本书共分为10章,涵盖了贝叶斯概率、概率估计、贝叶斯分类、随机场、参数估计、机器学习、深度学习、贝叶斯网络、动态贝叶斯网络、贝叶斯深度学习等。本书涉及的应用领域包含机器学习、图像处理、语音识别、语义分析等。计算机0字 - 会员
秒懂AI写作:让你轻松成为写作高手
《秒懂AI写作:让你轻松成为写作高手》针对职场、学习、生活、艺术创作领域常见的40余种写作应用场景,遵循“场景+方法+总结”的框架,详细介绍了如何正确利用AI完成多种写作任务,并归纳出使用AI写作的方法和技巧。《秒懂AI写作:让你轻松成为写作高手》分为6章。第1章通过5个步骤、6大场景介绍了如何驾驭AI完成多种类型的写作任务;第2章至第6章分别详细介绍了在职场应用文写作、商业营销文案写作、新媒体写计算机8.1万字 - 会员
AI高手速成:DeepSeek让你工作变轻松
这是一本全面介绍AI应用的实用工具书,旨在为不同行业的专业人士提供实用的AI使用方法和策略。本书用简单易懂的语言解释了AI的基本工作原理,详细介绍了20多个通用AI指令,并通过案例展示如何运用这些指令解决工作问题;提供了AI在文案写作、数据处理、编程、教学和科研等场景中的实战应用案例,同时还提供了商业级解决方案和企业应用案例。本书既有AI应用的通用原则和方法,又有具体的流程步骤和样例演示,还提供了计算机5.5万字 - 会员
人工智能治理研究
本书从技术和规制两个角度入手,以人工智能治理的法律、公共政策以及伦理规范等相关社会行为和社会关系的规则建立和运行为主要思考方向和研究进路,在梳理人工智能发展情况、欧盟及其他国家人工智能立法与政策发布现状的基础上,对人工智能治理的基础、基本路径及我国人工智能产业、政策与规制思路进行了全面和有益的探索。计算机23.9万字 - 会员
大模型工程化:AI驱动下的数据体系
大模型在众多领域得到了广泛应用,促进了AI技术的整合和创新。然而,在实际应用过程中,直接将大模型应用于特定行业常常难以达到预期效果。本书详细阐述如何在游戏经营分析场景中利用大模型实现数据体系的建设。本书分为6个部分,共16章。第1部分主要介绍大模型技术的发展与应用,从大模型的发展现状展开,重点介绍大模型与数据体系的相关知识。第2部分主要介绍大模型下的关键基础设施,涵盖湖仓一体引擎、湖仓的关键技术、计算机15.6万字 - 会员
AIGC革命:Web 3.0时代的新一轮科技浪潮
本书立足于AIGC技术前沿与发展趋势,全面阐述了AIGC的概念内涵、底层技术与应用场景,详细梳理全球科技巨头在AIGC领域的战略布局,并辅之以大量生动有趣的案例,深度剖析AIGC在各行业领域的应用场景,旨在引导读者真切感受AIGC革命浪潮蕴含的商业创造力。全书分为五个部分,共18章。第一部分主要厘清AIGC技术的起源与演变,阐述席卷全球的AIGC背后的技术架构以及AIGC的应用场景;第二部分重点剖计算机11.4万字 - 会员
AIGC+智慧教育:Web 3.0时代的教育变革与转型
随着Web3.0时代的来临,我国教育领域迎来了一场全面而深刻的变革——AIGC、ChatGPT、大数据、云计算、物联网、数字孪生、元宇宙等新兴技术与教育行业的融合程度日益加深,AI驱动的教育新形态、新模式、新产品不断涌现,数字化、网络化、智能化逐渐成为引领我国教育变革与转型的重要方向。本书立足于全球范围内智慧教育领域的实践经验与前沿趋势,全面阐述AIGC、ChatGPT、元宇宙、数字孪生等新兴技计算机13.8万字