车讯精选2024年10月12日发布:大模型技术学习过程梳理

⭐发布日期:2024年10月12日 | 来源:车讯精选

⭐作者:张京生 责任编辑:Admin

⭐阅读量:713 评论:6人

【2O24澳彩管家婆资料传真】

【最新澳门6合开彩开奖结果】

【澳门今晚必中一肖一码362期】 【2024新澳门开奖结果查询】 【澳门精准四肖四码期期准】 【新澳门澳精准大全】 【澳门4949资料免费大全】 【澳门今晚开精准四不像356期】 【香港今晚六给彩开奖结果下载】 【47849.cσm查询澳彩今晚开奖】
【香港6合开奖结果+开奖记录17】 【澳门2024正版开奖结果】 【2024,澳门开奖结果】 【香港二四六开彩资料大全302期】 【2024年澳门今晚特马开什么】 【2022澳门特马今晚开奖有预告吗】 【澳门资料开奖结果+开奖记录表】 【新澳今天开什么号】

学习大模型技术也有几个月的时间了,之前的学习一直是东一榔头,西一棒槌,这学一点那学一点,虽然弄的乱七八糟,但对大模型技术也算有了一个初步的认识。

因此,今天就来整体梳理一下大模型技术的框架,争取从大模型所涉及的理论,技术,应用等多个方面对大模型进行梳理。

01大模型技术梳理

这次梳理大模型不仅仅是大模型本身的技术,而是一个以大模型为核心的涉及到多个方面的理论,技术和应用实践,也可以说是对自己学习大模型技术的总结吧。

话不多说,下面开始进入正题。

首先,大家应该明白一件事,大模型技术是人工智能技术的一个分支,是目前主流的一个研究方向,但并不是唯一的方向。



人工智能技术是一个通过某种技术手段人为的创建一个具有类人智能的系统(软件或硬件),而大模型技术是一种仿造人类学习进化的一种方式,使用深度学习(机器学习)算法模仿人类大脑神经元,来实现智能的一种方式,其主要载体是神经网络。

神经网络之所以得到发展的原因是因为,基于神经网络架构进行预训练之后,神经网络会产生一种无法解释的涌现能力,而这个涌现能力特别像是具有了智能一样。

神经网络模型架构

既然是模仿神经网络,那么就需要一种深度学习模型来模仿人类大脑神经系统,比如CNN(卷积神经网络),RNN(循环神经网络),以及目前主流的Transformer模型,还有LSTM,ResNet,GANs等。

神经网络的主要结构为一个输入层,一个输出层,以及隐藏层(一个或多个层组成),不同网络层之间使用全连接的方式进行连接,每一个圆都代表着一个神经元,如下图所示:


在神经网络中,除了输入/输出层之外,每一个神经元都有其参数,神经网络的效果就是由这些参数值决定的。

神经网络模型通过一种叫正向传播,损失计算和反向传播的方式来调整神经网络模型中每个神经元的参数。

通过把大量的训练数据输入到神经网络中,让神经网络进行“学习”(不断的调整参数),来达到类智能的能力。

不同神经网络的架构和实现有所不同,但其核心点都是基于此模型实现的,对想学习神经网络的朋友来说,先学会基础的神经网络架构,然后再针对不同的神经网络模型进行深化是最好的选择。

目前的大模型主要采用的是预训练的方式来实现智能的,简单来说就是给神经网络模型一堆资料,让它自己学,自己看,自己总结;其中给答案的叫做监督学习,没答案的叫无监督学习。

然后根据不同的任务需求,又设计出用来解决不同类型任务的神经网络,比如分类任务,图片处理任务,自然语言处理任务等。

至于大模型技术细节方面的东西,就不详细描述了,感兴趣的可以自己学习,比如编码器,损失计算和反向传播怎么实现等。

再有,设计并训练一个完整可用的神经网络模型是一个复杂的工程,比如模型的设计,训练数据的收集与处理,损失函数与反向传播算法的设计,模型过拟合,欠拟合等问题。



而且随着模型规模的增大,模型的训练难度呈几何式增长,比如分布式训练,并行计算等问题;以及为了提升大模型的学习效率,节约成本而设计的强化学习,迁移学习等。

最后,为了使得大模型更像人,也为了实现真正的AGI(通用人工智能),现在多模态大模型大行其道,而多模态大模型技术比传统大模型的技术复杂度又上升了不止一个台阶。

基于知识库的向量检索——RAG

大模型技术虽然很强大,但其有几个明显的缺点,第一就是知识是有限制的,因为采用的是预训练方式,因此大模型的知识最多只能到训练开始的时间节点,之后产生的新的知识大模型无法获取。

其次,由于训练大模型的成本问题,导致很多企业无法承担大模型的训练成本,因此只能使用第三方的大模型,但第三方大模型没有在特定领域的数据上进行训练或微调,因此,其表现能力一般。

这时RAG就出现了,RAG中文是检索增强,是通过外挂知识库的方式,提问大模型之前先从向量数据库中查询数据,然后一起输入到大模型,这样大模型就相当于有了一个外部资料库,遇到不懂的问题就可以通过查资料的方式解决。

以目前的技术来说,RAG是大模型技术的一个重要节点,既是大模型能力范围的扩展,也是对大模型短板的补充。


微调与提示词工程

我们一般使用的大模型都是预训练模型,也就是用某些数据集训练过的模型;但这些模型一般情况下只会在特定领域表现出色,但如果用来解决自己的实际问题可能就不太好用了。

这时怎么让预训练模型在其它任务中表现更好就是一个值得思考的问题,而这就是微调与提示词工程存在的意义。

微调

微调从技术手段上来说和模型训练没有区别,只不过微调是在相似任务的预训练模型的基础之上,通过少量的数据对模型参数进行调整,使得其能够更加适应当前任务的一种方式。由于其成本低,对资金和技术要求要比完全重新设计和训练一款模型要低的多。

因此,微调存在的意义是为了节约成本和降低门槛,如果资金充足的情况下,根据任务需求设计并训练一款模型是最好的选择,微调是退而求其次的一种方式。



提示词工程

如果说微调是为了让大模型去适应特定的任务,那么提示词的作用就是怎么更好的使用一个大模型。

根据研究发现,对待同样的问题使用不同的提示词有时会得到完全不一样的效果,因此根据这一现象就提出了提示学习的方法,具体的可以看之前的问题——提示学习。

用人类来举例就是,假如有人问你吃饭了吗这种简单的问题,你可以下意识的回答,而且可以回答的很好;大模型也是如此,如果你问大模型很简单的问题,它也能回答的比较好。

但如果问到一些复杂的问题就需要更加准确的描述,比如说根据当前的就业环境,从经济,市场,贸易,国际局势等多个方面来分析一下产生当前情况的原因,以及后续的应对方法。

这种复杂的问题,不论是问人还是问大模型,你说的越准确,它回答的才能更好,这就是提示词存在的意义。

智能体Agent

在前面的描述中,神经网络架构讲的是怎么构建一个大模型,知识库是怎么补充和强化大模型,微调和提示词是怎么更好的使用大模型,那么智能体就是真正的使用大模型,研究大模型的具体应用。

如果把大模型比做人类的大脑,那么智能体就是大模型的手和脚。

在此之前使用大模型,我们能够让它回答问题,写文章,生成图片和视频,但这都是大模型天生具备的能力,就类似于人类可以写写画画一样。

但如果让大模型完成更加复杂的任务,这时就需要借助外部工具,比如外出旅行需要设计旅行路线,定酒店和车票等。

这种任务就完全超出大模型或者人类本身的能力圈,如果想完成这些任务就需要借助外部工具,比如说手机APP。

智能体就是大模型+外部工具实现的一种能够独自分析和解决复杂任务的一种载体,利用大模型的独立规划能力,让它根据自己的判断去调用外部工具完成任务。

使用的技术主要有function call,langchain等;如上图所示,大模型使用function call的方式调用外部工具,使用自身能力完成规划和行动,并且由于大模型没有足够的记忆能力,需要增加记忆模块来记录对复杂任务的分析过程。

目前,大模型解决复杂任务,主要通过思维链(CoT)的方式来实现对复杂问题的分解。

langchain是一种人工智能开发框架,它封装了大部分调用大模型的细节,以及其它辅助功能,比如文档的加载,多个大模型的链式调用,提示词模板的封装等,与其类似的还有LlamaIndex等。

总结

从大的方向上来说,大模型从技术到应用,主要涉及到以上几个大的模块;而每个模块又涉及到大量的技术和细节。比如打造不同任务的神经网络模型,强化学习,迁移学习,知识蒸馏,分布式训练与存储等;以及RAG使用的向量检索,向量数据库,语义理解等,还有复杂任务的思维链(CoT),模型训练使用的LoRa等微调方法。

还有多模态模型中的知识对齐,数据融合等复杂技术。

【澳彩今晚开奖开什么号码】 【澳门一码一肖一待一中四不像】
【2024年澳门六今晚开奖结果】 【新澳2024年最新版资料】
【奥门开奖结果2024澳门】 【旧老澳门2024历史开奖记录大全】
【澳门开奖结果,开奖结果】 【2024年的澳门开奖】
【管家婆一肖一码】 【澳门管家婆】
【2024年新澳门王中王开奖结果】 【香港开码开奖结果今天】 【2024年新澳六开奖结果】
上一条新闻 下一条新闻

推荐文章

发表评论

Bowen

6秒前:通过把大量的训练数据输入到神经网络中,让神经网络进行“学习”(不断的调整参数),来达到类智能的能力。

IP:11.30.5.*

贝琳达·巴拉斯基

2秒前:智能体就是大模型+外部工具实现的一种能够独自分析和解决复杂任务的一种载体,利用大模型的独立规划能力,让它根据自己的判断去调用外部工具完成任务。

IP:95.18.6.*

塚原大助

6秒前:因此,今天就来整体梳理一下大模型技术的框架,争取从大模型所涉及的理论,技术,应用等多个方面对大模型进行梳理。

IP:11.32.1.*

车讯精选APP介绍

APP图标

管家婆一肖一码最准资料公开APP名:车讯精选

版本:V5.86.328

更新时间:2024-10-11 21:18

2024年新澳门免费开奖查询这是一个功能强大的新澳门62449最快开奖网3333007comAPP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:根据研究发现,对待同样的问题使用不同的提示词有时会得到完全不一样的效果,因此根据这一现象就提出了提示学习的方法,具体的可以看之前的问题——提示学习。

香港王中王资料大全免费APP介绍

APP图标

新澳门特马今期开奖结果APP名:车讯精选

版本:V3.85.468

更新时间:2024-10-11 21:24

无论是2024年新澳门马报今晚必快速浏览新闻还是深入了解某个话题,这款新闻APP都能为您提供全面、精准的信息服务。

2024年澳门最新正版免费大全APP介绍

APP图标

澳门2024年开奖结果查询APP名:车讯精选

版本:V1.51.139

更新时间:2024-10-11 24:23

刘伯温一肖一码资料大公开应用界面简洁易用,用户可以轻松浏览头条新闻、深度报道和特写文章。24小时内的热点资讯一目了然,让您随时掌握世界动态。此外,您还可以参与评论,与其他读者交流看法,形成一个互动活跃的社区。

香港精准资料期期准APP介绍

APP图标

澳门开奖最快的APP名:车讯精选

版本:V8.91.276

更新时间:2024-10-11 21:17

2024管家婆奥门开桨结果这款新闻APP是您获取实时信息的理想伴侣。它汇聚了全球最新的新闻报道,涵盖政治、经济、科技、娱乐、体育等多个领域。通过个性化推荐功能,您可以根据兴趣定制新闻源,确保每条信息都与您相关。

新澳精准资料免费提供濠江论坛APP介绍

APP图标

87379a.cσm查询澳彩资料APP名:车讯精选

版本:V4.89.532

更新时间:2024-10-11 16:16

这是一款功能强大的4949精准澳门彩最准确的应用,专为帮助您高效完成各种任务而设计。它不仅提供最新的24小时热点资讯,还为您带来今日的最新动态:而且随着模型规模的增大,模型的训练难度呈几何式增长,比如分布式训练,并行计算等问题;以及为了提升大模型的学习效率,节约成本而设计的强化学习,迁移学习等。。无论是获取信息还是提升效率,这款APP都是您理想的助手。

今晚准确特几号APP介绍

APP图标

新奥资料免费精准2024生肖表APP名:车讯精选

版本:V5.66.446

更新时间:2024-10-11 20:21

这是一款功能强大的澳门开奖网站应用,旨在帮助您高效完成各类任务。它提供最新的24小时热点资讯,让您随时了解发生的重大事件。今天的最新内容包括:神经网络的主要结构为一个输入层,一个输出层,以及隐藏层(一个或多个层组成),不同网络层之间使用全连接的方式进行连接,每一个圆都代表着一个神经元,如下图所示:在神经网络中,除了输入/输出层之外,每一个神经元都有其参数,神经网络的效果就是由这些参数值决定的。,为您的生活和决策提供了重要参考。这款APP是您获取信息和完成任务的得力助手。

2024年澳门码菅家婆一肖一码APP介绍

APP图标

新澳门开奖记录视频APP名:车讯精选

版本:V9.78.368

更新时间:2024-10-11 16:13

这是一款功能强大的2024新澳门正版挂牌应用,专为帮助您高效完成各种任务而设计。它汇集了最新的24小时热点资讯,让您时刻掌握世界动态。今日的最新内容包括:比如打造不同任务的神经网络模型,强化学习,迁移学习,知识蒸馏,分布式训练与存储等;以及RAG使用的向量检索,向量数据库,语义理解等,还有复杂任务的思维链(CoT),模型训练使用的LoRa等微调方法。,为您的决策和日常生活提供有价值的信息支持。无论您需要了解什么,这款APP都能成为您不可或缺的助手。

2024正版资料免费APP介绍

APP图标

澳门今天晚上出什么APP名:车讯精选

版本:V2.77.167

更新时间:2024-10-11 18:16

今天的最新动态包括:学习大模型技术也有几个月的时间了,之前的学习一直是东一榔头,西一棒槌,这学一点那学一点,虽然弄的乱七八糟,但对大模型技术也算有了一个初步的认识。,让您第一时间掌握关键资讯,做出明智的决策。这个应用不仅是您的信息获取工具,更是一个提升生活质量的得力助手。

2024奥门特马今晚开奖APP介绍

APP图标

新澳门期期准APP名:车讯精选

版本:V4.98.999

更新时间:2024-10-11 22:23

这是一款功能强大的2024老澳历史开奖记录应用,能够帮助你高效地完成多种任务。它包括最新的24小时热点资讯,以及今天的最新动态:但如果让大模型完成更加复杂的任务,这时就需要借助外部工具,比如外出旅行需要设计旅行路线,定酒店和车票等。。

白小姐一肖一码2024年APP介绍

APP图标

2024澳门全年正版资料APP名:车讯精选

版本:V7.22.329

更新时间:2024-10-11 15:15

这款功能强大的正版资料全年资料查询应用旨在提升您的日常效率,帮助您轻松应对各种任务。应用界面友好直观,用户可以快速导航,获取所需信息。它不仅提供最新的24小时热点资讯,还定期更新各种主题的文章和评论,确保您始终走在信息的前沿。

2023全年資料免費大全優勢APP介绍

APP图标

六和彩开码资料2024开奖码澳门APP名:车讯精选

版本:V3.35.818

更新时间:2024-10-11 23:17

这款新闻APP是您获取实时新闻的最佳选择。它整合了全球各大新闻来源,提供最新的头条、热点和专题报道,涵盖从政治到娱乐的各个领域。用户可以根据兴趣自定义新闻推送,确保获取最相关的信息。

2024澳门资料正版大全APP介绍

APP图标

管家婆澳门APP名:车讯精选

版本:V8.36.983

更新时间:2024-10-11 15:19

APP界面友好,支持快速浏览和离线阅读。您还可以通过搜索功能,快速找到特定主题的新闻。互动功能让您可以评论、分享文章,与朋友讨论热点话题。无论您是在通勤、休闲,还是工作间隙,这款APP都能让您轻松掌握最新动态。