一种模型训练的样本增强方法、装置与系统

文档序号:8564 发布日期:2021-09-17 浏览:31次 英文

一种模型训练的样本增强方法、装置与系统

技术领域

本申请涉及数据处理方法,主要涉及在AI模型训练时对所需要的样本数据作协同与增强的处理方法。

背景技术

目前人们普遍认为人工智能(AI-Artificial Intelligence)会是二十一世纪及以后最具影响力的技术之一。而对于AI来说,核心的功能体现为AI模型,模型又是通过使用某种AI算法来训练样本得到的。因此,一个样本数据的质量往往对模型的效用与质量产生重大的影响。

从机器学习演进而来的增强学习,会使用数据增强的方式来提升样本的质量。一种典型的数据增强方式是输入更多的先验知识,另一种典型的数据增强方式是对数据作自循环式的广度组合或深度叠加。两种方式都希望最大可能地挖尽样本数据,提升样本数据的价值。

但对于任何一个特定样本数据来说,其包含的含义与模式也是有限的,因此上述数据增强方式的效果有限。

发明内容

因此,本申请提出解决上述问题、利用辅助数据(集)提升样本质量、并进一步提升训练所得模型质量的方法、系统和装置。这些方法,应用于不特定的工具、设备、系统甚至数据中心或云服务中心,从而构成一个模型训练的样本增强系统。为此,本发明:

一方面,提出模型训练的样本增强方法,包括:

接收第一数据,所述第一数据为使用目标算法作训练时的样本主数据;接收第二数据集,所述第二数据集包含一个或多个第二数据,所述第二数据作为所述第一数据的辅助数据,所述第二数据拟用于对所述第一数据的增强;加工确定第三数据集,所述第三数据集包含一个或多个第三数据,所述第三数据为所述第一数据经所述第一数据的拟增强数据后的回报值;加工确定第四数据,所述第四数据包含所述第一数据与第五数据集,所述第五数据集包含在所述第二数据集中。进一步,所述对所述第四数据的加工确定过程,还包括使用所述第三数据集以及所述第三数据集各元素对应的拟增强数据训练强化学习模型。进一步,所述第二数据对所述第一数据的拟增强,还包括确定所述第二数据对所述第一数据的增强策略,所述增强策略依赖于所述第二数据对所述第一数据的元数据的扩展情况。进一步,所述第二数据对所述第一数据的元数据扩展,还包括通过所述元数据的扩展情况,从而确定在两类拟增强的方式中作选择:对所述第一数据的特征空间作横向扩充;或者,对所述第一数据的值空间作纵向扩充;通过所述元数据的扩展方式,从而确定增强策略。进一步,所述第三数据的加工过程,还包括使用AI算法训练通过拟增强方式得到的所述第一数据的拟增强数据,得到第六数据与所述第三数据集中的一个第三数据,所述第六数据为经所述AI算法训练得到的算法模型。进一步,加工确定第四数据,还包括所述加工确定过程使用第六数据集与所述第三数据集,所述第六数据集包含一个或多个所述第六数据。进一步,还包括使用AI算法训练所述第一数据与所述第五数据集,输出对应的AI模型。

在一个部署有服务器集群或云数据中心网络的环境中,通过AI平台化与引擎化,从而为用户提供来自于数据中心的便捷易用的AI能力,而一个具有增强型样本的AI算法可以为用户提供更有吸引力的、高度可定制化的、高质量的AI模型。该增强型样本的数据处理过程为:接收作为主样本的数据,或者叫做主数据,划分主数据为训练数据与验证数据;接收作为辅助样本的数据集,或者叫做辅助数据集,所述辅助数据集包含多个辅助数据,每个辅助数据通过拆解方式可以对主数据以训练样本为目的作拟增强,这里的拟增强是在训练生成最终算法模型的阶段前的尝试性增强过程;所述的拆解过程包含,解析主数据与所述辅助数据的元数据,以特定的增强策略确定辅助数据对主数据的拟增强方式:或者为特征扩充、或者为值扩充方式;所述辅助数据集,以计算所得的状态空间与动作空间来决定并产出所述的各个辅助数据;以每次得到的辅助数据以及增强策略,从而得到拟增强样本,所有的拟增强样本组成拟增强样本集;针对每次确定出的拟增强样本,使用目标AI算法训练所述拟增强样本,得到对应的拟AI算法模型,使用验证数据来验证所述拟AI算法模型,得到所述拟增强样本对应的回报值;所有这种回报值,组成回报值集;使用强化学习模型加工所述回报值集与拟增强样本集,得到针对主样本数据的最终增强样本数据,再使用所述目标AI算法训练所述最终增强样本,从而得到目标算法对应的增强AI模型。

这样,实施了包含上述部分或全部方法与步骤的产品与服务系统,能够通过增强样本来提供更高质量的AI模型,甚至在强化学习算法的选择下,为同一AI算法提供更灵活的、高度定制化的模型输出结果,从而使得AI具有助推更便捷云应用与大数据应用的能力,加速云应用与大数据应用的推广与普及。

另一方面,提出模型训练的样本增强装置,该装置包含:

主数据:示意了AI算法训练用的样本主数据;

辅助数据集:示意了AI算法训练用的样本辅助数据。所述主数据与该辅助数据集可以保存于数据存储器件、存储模块、或提供外部访问接口的存储系统中;

模型训练单元:该单元用于算法训练,以输出相应的模型。具体地,训练过程包括两阶段:一阶段是对拟增强样本作训练,以回报值的方式作为强化训练的输入;一阶段是对终版样本作训练,最终得到满足质量要求的AI算法模型;

强化训练单元:该单元用于作强化学习算法的训练,以输出强化学习生成的增强样本数据。具体地,强化学习算法输入样本主数据,拟增强的辅助数据集,以及拟增强辅助数据对应的回报值集,通过强化学习算法来确定终版增强辅助数据。所述拟增强的辅助数据与回报值具有对应关系;

数据中台:该中台完成数据的各种转换与加工操作,以配合完成样本数据的协同与增强。具体地,该中台包含相应的数据访问接口、采集单元、拆解单元、融合单元、关联单元,这些单元分别提供对样本增强用的辅助数据收集、拆解、融合、关联等操作过程。

本发明提出的上述接口与模块,同产品实际实施时所需要的其它单元、模块以及相关平台与相关引擎一起,共同实现一个基于限定主数据与非限定辅助数据的增强式模型训练过程,从而实现一个模型增强装置。体现在:模型增强装置接收作为主样本的数据,或者叫做主数据,模型增强装置划分主数据为训练数据与验证数据;模型增强装置接收作为辅助样本的数据集,或者叫做辅助数据集,所述辅助数据集包含多个辅助数据,每个辅助数据通过拆解方式可以对主数据以训练样本为目的作拟增强,这里的拟增强是在训练生成最终算法模型的阶段前的尝试性增强过程;所述的拆解过程包含,模型增强装置解析主数据与所述辅助数据的元数据,以特定的增强策略确定辅助数据对主数据的拟增强方式:或者为特征扩充、或者为值扩充方式;所述辅助数据集,以计算所得的状态空间与动作空间来决定并产出所述的各个辅助数据;模型增强装置以每次得到的辅助数据以及增强策略,从而得到拟增强样本,所有的拟增强样本组成拟增强样本集;针对每次确定出的拟增强样本,模型增强装置使用目标AI算法训练所述拟增强样本,模型增强装置得到对应的拟AI算法模型,模型增强装置使用验证数据来验证所述拟AI算法模型,模型增强装置得到所述拟增强样本对应的回报值;所有这种回报值,组成回报值集;模型增强装置使用强化学习模型加工所述回报值集与拟增强样本集,模型增强装置得到针对主样本数据的最终增强样本数据,模型增强装置再使用所述目标AI算法训练所述最终增强样本,从而模型增强装置得到目标算法对应的增强AI模型。

这样,具有上述功能装置的产品与服务系统,能够提供更高质量的AI模型,甚至在强化学习算法的选择下,为同一AI算法提供高度定制化的、更灵活的模型输出结果,从而使得AI具有助推更便捷云应用与大数据应用的能力,加速云应用与大数据应用的推广与普及。

另一方面,提供了一种计算机可读存储介质,该计算机存储介质存储有程序指令,该程序指令当被处理器运行时,该处理器(分别)具有执行上述关于方法的实施过程。

另一方面,提供了一种管理的装置,包括存储组件,处理组件和通信组件,存储组件,处理组件和通信组件相互连接。其中,存储组件用于存储数据处理代码,通信组件用于与外部设备进行信息交互;处理组件被配置用于调用程序代码,分别行使上述关于装置的功能。

附图说明

为了更清楚地说明本发明实施的技术方案,更清楚地阐述发明目标的达成要素、方式与过程,下面将对本发明实施中所需要使用的附图进行说明:

图1是本发明提出的模型训练的样本增强的系统组成图之一;

图2是本发明提出的模型训练的样本增强的系统组成图之一;

图3是本发明提出的模型训练的样本增强的系统组成图之一;

图4是本发明提出的模型训练的样本增强的数据示意图之一;

图5是本发明提出的模型训练的样本增强的数据示意图之一;

图6是本发明提出的模型训练的样本增强的操作执行流程之一;

图7是本发明提出的模型训练的样本增强的操作执行流程之一;

图8是本发明提出的模型训练的样本增强的操作执行流程之一。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例进行描述。

本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

在本申请书中使用的术语“服务器”、“设备”、“装置”、“单元”、“部件”、“模块”、“系统”等用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。例如,服务器可以是但不限于,处理器,数据处理平台,计算设备,计算机,两个或更多个计算机等;单元可以是但不限于,在处理器上运行的进程、可运行对象、可执行文件、执行线程、或其它任何可执行的计算机程序。一个或多个单元可驻留在进程和/或执行线程中,一个单元也可位于一个计算机上和/或分布在2个或更多个计算机之间。此外,这些单元可从在上面存储有各种数据结构的各种计算机可读介质执行。单元可根据具有一个或多个数据分组(例如来自与本地系统、分布式系统和/或网络间的另一单元交互的二个单元的数据,例如通过信号与其它系统交互的互联网)的信号通过本地和/或远程进程来通信。

首先,对本申请中的部分用语进行解释说明,以便于本领域技术人员理解。所列用语包含如下:

(1)云计算:即Cloud Computing,指那种拥有集成度优势、连接在网络环境中、以服务方式向用户提供计算、存储甚至软件能力的新型计算范式。这种新的计算范式跟旧有的计算范式的差异,体现在可感观与可用性上就是,它对用户而言并不存在可见的固定形态、甚至基本不存在无资源可用的状态,故被叫做云计算;

(2)人工智能:即Artificial Intelligence,简称AI,指那种通过计算系统模拟人类智能的方法、技术、软硬件及系统的泛称;

(3)机器学习:机器学习属于AI领域的一个重要分支性技术。机器学习会从样本数据中提取数据模式,以便对应用数据做出尽可能好的预测。从目前的发展结果来看,机器学习分为监督学习、无监督学习与强化学习;

(4)算法-样本-模型:这是机器学习的三个重要的概念。算法是一个先验性的指导,当然不同的机器学习类型决定了算法所具有的先验知识的多少;先验知识需要一定的数据量来转化及验证所得的预测能力,这些一定量的数据,叫做样本;算法在样本数据所提供的值空间里寻找某种针对未来数据作预测与处理的能力,这种能力的机器表示,就是模型。一般情况下,样本会被分为训练样本与验证样本;

(5)强化学习模型:那些使用时间顺序上的每一步紧密相关的回报值来标记对学习过程的奖励或惩罚、进而在持续的改进过程中获得对未来的预测能力的机器学习算法,均属于强化学习算法。其训练所得的模型,即强化学习模型。

其次,对本发明的目标问题、解决目标问题的技术方法作概览。随着AI应用的深入,人们对AI提出了高质量、易用性与便捷性方面的要求。传统的AI基于特定样本作训练得到AI模型的方法,限制了AI的灵活性。在样本数据必定是有限而AI算法又是稀缺的现实情况下,为解决这个矛盾,本发明提出一种通过更灵活的增强样本方法来提升AI模型的灵活性,从而提升AI应用的易用性与便捷性,便于AI在更大范围内的推广与普及。

再次,结合各附图,对发明内容作进一步的阐述。其中:

如图1为本发明的系统组成图之一。该图示意了一种关于数据协同及样本增强功能实现的组成关系。其中:

101-主数据:示意了作用AI算法训练用的样本主数据;

102-辅助数据集:示意了作用AI算法训练用的样本辅助数据;

103-模型训练单元:该单元用于算法训练,以输出相应的模型;

104-强化训练单元:该单元用于作强化学习算法的训练,以输出强化学习生成的增强样本数据;

105-数据中台:该中台完成数据的各种转换与加工操作,以配合完成样本数据的协同与增强。

如图2为本发明的系统组成图之一。该图示意了一种关于数据协同及样本增强功能实现的组成关系。其中:

201-主数据:示意了作用AI算法训练用的样本主数据;

202-辅助数据集:示意了作用AI算法训练用的样本辅助数据;

203-模型训练单元:该单元用于算法训练,以输出相应的模型;

204-强化训练单元:该单元用于作强化学习算法的训练,以输出强化学习生成的增强样本数据;

205-数据存储接口:该接口用于完成对所需数据的存取操作;

206-数据采集单元:该单元用于数据中台所维护与管理数据的原始采集等操作;

207-数据拆解单元:该单元用于对样本增强所需要的数据拆解操作;

208-数据融合单元:该单元用于对样本增强所需要的数据融合操作;

209-数据关联单元:该单元用于对样本增强所需要的数据关联操作。

如图3为本发明的系统组成图之一。该图示意了前述功能组成的划分关系。其中:

301-数据交互单元:该单元用于提供应用层与中台间的数据交互与数据控制;

302-应用采集单元:该单元用于提供对应用的采集使能、数据采集;

303-增强策略单元:该单元用于提供与管理样本增强所需要的增强策略;

304-模型训练单元:该单元用于执行算法模型的训练过程;

305-数据采集单元:该单元用于对采集数据作管理;

306-数据关联单元:该单元用于对拆解后的数据作关联性分析;

307-强化学习单元:该单元用于对执行训练过程所需要的强化学习过程;

308-模型评估单元:该单元用于对拟增强的样本作评估,评估使用验证样本子集;

309-数据拆解单元:该单元用于对辅助数据作拆解;

310-数据融合单元:该单元用于对拟增强作融合;

311-AI建模引擎:该引擎用于提供算法建模所需要的运算支撑;

312-大数据引擎:该引擎用于提供数据其它处理所需要的能力与服务支撑。

如图4为本发明的数据示意图之一。该图示意了发明申请所使用的主数据与辅助数据在映射关系与拆解转化的表达方式。其中:

401-主数据示意:该示意一个待作算法训练的样本数据;

402-辅助数据集示意:该示意了一个待作样本增强的辅助数据集;

403-主数据元数据项示意:该示意了主数据对应的元数据项;

404-辅助数据元数据项示意:该示意了辅助数据集的元数据项;

405-主数据的元数据示意:该示意了主数据对应的完整元数据;

406-辅助数据对应的元数据集示意:该示意了辅助数据各子集对应的元数据子集,各辅助数据子集的元数据间存在可能相同的元数据项;

407-主数据中的验证数据:该示意了主数据划分出来的验证数据;

408-主数据中的训练数据:该示意了主数据划分出来的训练数据;

409-辅助数据集中的辅助数据子集:该示意了辅助数据集里对应的部分辅助数据子集;

需要说明的是:一方面,401与402所示意的主数据与辅助数据集,应该是一个模糊性的表示,其它部分的元数据层与数据层示意了一种映射关系;另一方面,无论是403~406,还是407~409,都不用于对数据的广度与深度的限定;再一方面,该图的数据关系的简单示意,更非对发明实施的具体限定。

如图5为本发明的数据示意图之一。该图示意(假设存在)了一个实施了发明核心方法的样例产品:通过照片直接判断职业与技能特长。该产品主要使用简历网站的数据作为样本训练得到算法模型、再以该模型来识别目标图片的主人之职业与技能特长;所述对发明核心方法的实施即:将简历网站的数据样本主数据,将其它网站可获得的数据作为辅助数据,通过梳理其它网站的信息得到分门别类的信息,在类型可对应的情况下,将辅助数据与简历网站数据作拟增强融合,再将融合后的数据作为最终样本来作算法训练,从而得到新的“图片->职业”的识别模型。其中:

501-简历网站的主数据,简历数据;

502-用作增强的辅助数据,来自于如新闻/论坛/学术等的加工数据;

503-简历数据的元数据项;

504-其它种类数据的描述项;

505-简历数据的元数据;

506-其它种类的元数据;

507简历数据集中的验证数据;

508-简历数据集;

509-用作对简历数据进行增强的、分类提取的各类辅助数据。

如图6为实现本发明的操作执行流程图之一。该图示意一个单次增强训练过程。其中:

10A-获得元数据项的集合:该操作用于获取主数据与某辅助数据的元数据项的集合;

10B-确定元数据项的对应关系:该操作用于分析与确定元数据项的对应关系;

10C-增强策略与数据集关系分析:该操作用于分析增强策略与数据集关系的分析;

10D-扩充方式确定:该操作用于在特征扩充与字段扩充之间作增强决定;

10E-拟增强数据集的形成:该操作用于根据增强决定,生成拟增强数据;

10F-待评估模型生成:该操作用于使用训练算法训练拟增强数据集,从而得到待评估模型;

10G-验证得到回报值:该操作用于将验证集应用于待评估模型,从而得到对应的回报值。

如图7为实现本发明的操作执行流程图之一。该图示意一个通过辅助数据集对主数据作拟增强的选择过程。其中:

20A-提取主数据的元数据项:该操作用于提取主数据的元数据;

20B-提取辅助数据的元数据项:该操作用于提取辅助数据的元数据项;

20C-拆解元数据到元数据项:该操作用于对前述主数据以及辅助数据的元数据作拆解;

20D-确定对应关系:该操作用于调用策略相关接口来判定主数据与辅助数据在每一元数据项上的对应关系,所调用的策略接口用于分析主数据、辅助数据、以及各元数据项的对应性;

20E-确定增强策略:该操作用于调用策略相关接口来确定辅助数据对主数据的增强策略,所调用的策略确定接口使用前述分析得到的对应关系信息;

20F-迭代进行数据融合与训练:该操作用于通过待评估模型得到对应的回报值,通过该操作的迭代从而得到所有组合的回报值集;

20G-组合选择:该操作用于根据回报值来确定最终的组合方式。

如图8为实现本发明的操作执行流程图之一。该图示意一个使用强化学习算法来确定与选择增强样本的过程。其中:

30A-接收与提取主数据:该操作用于接收与提取训练用的样本主数据;

30B-划分主数据为训练样本与验证样本:该操作用于对主数据作划分,从而得到训练样本与验证样本;

30C-接收与提取辅助数据集:该操作用于接收与提取用作对样本增强的辅助数据集;

30D-划分辅助数据集的子集:该操作用于通过状态空间与动作空间来划分辅助数据的子集;

30E-计算与得到辅助数据集各子集对主数据的拟增强回报值:该操作用于得到拟增强的回报值。根据前述划分辅助数据集得到的子集,在增强策略的支援下,经过AI算法的训练与模型验证,得到各子集对样本数据的拟增强回报值;

30F-构造拟增强样本集与回报值集:该操作用于构造通过划分子集得到的拟增强样本的集合,以及从拟增强样本得到的回报值的集合;

30G-强化训练拟增强样本集与回报值集:该操作使用强化学习算法来训练拟增强样本集和回报值集。所述拟增强样本集,既可以表示为训练样本与各回报值对应的辅助数据融合后的数据形成的集合,也可以表示为各回报值对应的辅助数据形成的集合、附加上训练样本;

30H-得到最终增强样本:该操作用于通过前述强化学习算法的输出,来得到最终的增强辅助数据,或最终包含辅助数据的训练样本;

30K-得到AI算法的最终模型:该操作用于使用前述终版增强辅助数据与样本主数据作AI算法训练,从而得到最终的AI算法模型。

在本申请中,所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于单个网络节点内,或者也可以分布到多个网络节点上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外,根据具体约束与实现所需,在本申请各个实施例中的各功能组件可以集成在一个组件也可以是各个组件单独物理存在,也可以是两个或两个以上组件集成在一个组件中。上述集成的组件既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的组件如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台或一台以上计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个本发明实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着先后执行的严格顺序,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。尽管在此结合各实施例对本申请进行了描述,然而,在实施例所要求保护的本申请过程中,本领域技术人员可理解并实现公开实施例的其他变化。

完整详细技术资料下载
上一篇:石墨接头机器人自动装卡簧、装栓机
下一篇:一种微博舆情动态时空关联下浒苔灾害空间分布推估方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!