目标对象的确定方法、装置和服务器
技术领域
本说明书属于人工智能
技术领域
,尤其涉及目标对象的确定方法、装置和服务器。背景技术
在许多业务产品的推广场景(例如,银行推广理财产品等)中,基于现有方法,负责业务产品推广的工作人员往往无法充分且有效地利用客户的海量信息数据,大多只能使用到某几项的数据,再结合个人经验,来主观地判断客户是否是业务产品的潜在客户(或者称潜力客户)。导致在确定潜在客户时误差较大、准确度较低,进而影响后续业务产品的推广效果。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本说明书提供了一种目标对象的确定方法、装置和服务器,以能够高效、精准地筛选出对目标业务产品的接受概率较高的潜在客户对象。
本说明书实施例提供了一种目标对象的确定方法,包括:
获取多个第一对象的个体数据和关系数据;
根据所述多个第一对象的关系数据,构建相应的关系知识图谱;
根据所述关系知识图谱,从所述多个第一对象中筛选出多个符合预设的第一要求的第二对象;
调用预设的潜在对象预测模型处理所述多个第二对象的个体数据,以得到第二对象的预测结果;
根据所述第二对象的预测结果,从多个第二对象中筛选出符合预设的第二要求的目标对象。
在一些实施例中,所述第一对象包括:自然人对象,和/或,法人对象。
在一些实施例中,所述关系数据包括以下至少之一:自然人关系、股权关系、任职关系、业务往来关系、资金关系。
在一些实施例中,根据所述多个第一对象的关系数据,构建相应的关系知识图谱,包括:
根据第一对象的对象标识,建立节点;
根据第一对象之间的关系数据,利用边连接相应节点;并标注出边的属性值,以得到所述关系知识图谱。
在一些实施例中,根据所述关系知识图谱,从所述多个第一对象中筛选出多个符合预设的第一要求的第二对象,包括:
检索所述关系知识图谱,找到对象标识与客户名单匹配的节点作为起始节点;
从所述起始节点出发,搜索与所述起始节点通过边相连的节点作为候选节点;
获取并根据候选节点与起始节点之间边的属性值,筛选出属性值符合预设的第二要求的候选节点所对应的第一对象作为第二对象。
在一些实施例中,所述个体数据包括以下至少之一:
第一对象的借贷数据、第一对象的收入数据、第一对象的资产数据、第一对象的缴费记录、第一对象的保险数据、第一对象的注册信息。
在一些实施例中,调用预设的潜在对象预测模型处理所述多个第二对象的个体数据,以得到第二对象的预测结果,包括:
对所述第二对象的个体数据进行预处理,以提取得到第二对象的多个维度的个体特征;
调用预设的潜在对象预测模型处理第二对象的多个维度的个体特征,以得到第二对象的预测结果。
在一些实施例中,所述多个维度的个体特征包括:职业特征、收入特征、住房特征、车辆特征、消费特征、自然人关系特征。
在一些实施例中,根据所述第二对象的预测结果,从多个第二对象中筛选出符合预设的第二要求的目标对象之后,所述方法还包括:
获取目标对象的业务标签;
根据所述业务标签,确定针对目标对象的目标推送策略;
根据所述目标推送策略,向所述目标对象推送关于目标业务产品的链接数据。
在一些实施例中,所述方法还包括:
获取多个样本对象的个体特征作为样本数据;
根据样本度对象的业务标签,对所述样本数据进行类别标记,得到标注后的样本数据;
构建初始模型以及预设的损失函数;其中,所述预设的损失函数为FocalLoss损失函数;
利用预设的损失函数、标注后的样本数据对初始模型进行训练学习,以得到预设的潜在对象预测模型。
本说明书实施例还提供了一种目标对象的确定装置,包括:
获取模块,用于获取多个第一对象的个体数据和关系数据;
构建模块,用于根据所述多个第一对象的关系数据,构建相应的关系知识图谱;
第一筛选模块,用于根据所述关系知识图谱,从所述多个第一对象中筛选出多个符合预设的第一要求的第二对象;
调用模块,用于调用预设的潜在对象预测模型处理所述多个第二对象的个体数据,以得到第二对象的预测结果;
第二筛选模块,用于根据所述第二对象的预测结果,从多个第二对象中筛选出符合预设的第二要求的目标对象。
本说明书实施例还提供了一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现以下内容:获取多个第一对象的个体数据和关系数据;根据所述多个第一对象的关系数据,构建相应的关系知识图谱;根据所述关系知识图谱,从所述多个第一对象中筛选出多个符合预设的第一要求的第二对象;调用预设的潜在对象预测模型处理所述多个第二对象的个体数据,以得到第二对象的预测结果;根据所述第二对象的预测结果,从多个第二对象中筛选出符合预设的第二要求的目标对象。
本说明书实施例还提供了一种计算机存储介质,其上存储有计算机指令,所述指令被执行时实现:获取多个第一对象的个体数据和关系数据;根据所述多个第一对象的关系数据,构建相应的关系知识图谱;根据所述关系知识图谱,从所述多个第一对象中筛选出多个符合预设的第一要求的第二对象;调用预设的潜在对象预测模型处理所述多个第二对象的个体数据,以得到第二对象的预测结果;根据所述第二对象的预测结果,从多个第二对象中筛选出符合预设的第二要求的目标对象。
本说明书提供的一种目标对象的确定方法、装置和服务器。基于该方法,当需要搜寻潜在客户对象进行目标业务产品推送时,可以先获取并根据第一对象的关系数据,构建相应的关系知识图谱;再基于该关系知识图谱,对第一对象进行筛选,找出符合预设的第一要求的第二对象;接着,可以调用预设的潜在对象预测模型通过处理上述第二对象的个体数据,以获得第二对象的预测结果;再根据第二对象的预测结果,对第二对象进行筛选,找出符合预设的第二要求的目标对象。从而可以通过综合利用第一对象的关系数据和个体数据,高效、精准地从第一对象中筛选出对目标业务产品的接受概率较高的潜在客户对象,减少了确定目标对象时的确定误差。进而后续可以针对上述目标对象,根据相匹配的策略,进行与目标业务产品相关的信息推送,提高目标业务产品的推广效果。
附图说明
为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是应用本说明书实施例提供的目标对象的确定方法的系统的结构组成的一个实施例的示意图;
图2是本说明书的一个实施例提供的目标对象的确定方法的流程示意图;
图3是本说明书的一个实施例提供的服务器的结构组成示意图;
图4是本说明书的一个实施例提供的目标对象的确定装置的结构组成示意图;
图5是在一个场景示例中,应用本说明书实施例提供的目标对象的确定方法的一种实施例的示意图;
图6是在一个场景示例中,应用本说明书实施例提供的目标对象的确定方法的一种实施例的示意图;
图7是在一个场景示例中,应用本说明书实施例提供的目标对象的确定方法的一种实施例的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
本说明书实施例提供一种目标对象的确定方法,所述目标对象的确定方法具体可以应用于包含有服务器和终端设备的系统中。具体可以参阅图1所示。服务器和终端设备之间可以通过有线或无线的方式相连,以进行具体的数据交互。
在本实施例中,所述服务器具体可以包括一种应用于某银行数据中心网络平台一侧,能够实现数据传输、数据处理等功能的后台服务器。具体的,所述服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,所述服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定所述服务器所包含的服务器数量。所述服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
在本实施例中,所述终端设备具体可以包括一种应用于该银行数据中心网络平台一侧,能够对网络平台所接入的海量业务数据实现数据采集、数据监测、数据传输等功能的前端电子设备。或者,所述终端设备也可以为能够运行于上述电子设备中的软件应用。例如,可以是在服务器上运行的某APP等。
在本实施例中,某银行数据中心网络平台每天都会接入海量的业务数据。例如,用户A在该银行办理的房贷数据、用户B通过该银行的电子银行向用户C发送的转账交易数据、用户D在办理该银行的关联账户时填写的注册信息等。
当前,该银行计划对外推广一种新推出的理财产品(可以记为目标业务产品)。为了提高推广效果,服务器可以应用本说明书实施例所提供的目标对象的确定方法,来有效且充分地利用网络平台所接入的海量业务数据,以从多个待选的客户对象(可以记为第一对象,包括个人对象和法人对象)中筛选出针对该理财产品的接受概率较大、购买意愿较高的客户对象作为潜在客户对象(可以记为目标对象);再对上述目标对象有针对性地进行理财产品的推广。
具体实施时,首先,服务器可以通过终端设备采集获取该银行数据中心网络平台所接入的海量业务数据。
接着,服务器可以通过对上述业务数据进行语义识别和关系推理,以提取得到上述业务数据中所涉及到的第一对象的对象标识、第一对象的个体数据(例如,第一对象的房贷数据、第一对象的车贷数据、第一对象的资金流水记录、第一对象的保险数据等等),以及第一对象之间的关系数据(例如,第一对象之间的自然人关系、股权关系、任职关系、业务往来关系、资金关系等等)。
进一步,服务器可以利用多个第一对象的关系数据,构建相应的关系知识图谱。具体的,服务器可以先确定出关系数据所涉及的第一对象的对象标识(例如,第一对象的姓名、第一对象的注册手机号、第一对象的账户名等)。再根据第一对象的对象标识,使用圆圈建立与该第一对象对应的节点。然后服务器可以根据第一对象之间的关系数据,利用用于表征关系的边来连接同一个关系数据中所涉及到的不同的第一对象所对应的节点。同时还可以根据预设的关系标注规则,基于具体的关系数据,标注出边的属性值(例如,边所表征的关系的关系类型、关系的密切程度、关系的持续时长等参数)。这样服务器可以建立得到符合要求的关系知识图谱。
服务器可以根据该关系知识图谱,利用第一对象之间的关系数据,进行第一次筛选,以基于不同第一对象之间的关系,筛选出相对较有可能会成为潜在客户对象的第一对象作为符合预设的第一要求的第二对象。
具体的,服务器可以先利用已有的记录有潜在客户对象(或者优质客户对象)的客户名单,对该关系知识图片进行对象标识的检索,以找到对象标识与该客户名单相匹配的节点作为起始节点。接着,服务器可以从该起始节点出发,搜索与该节点通过边直接或间接相连的其他节点作为候选节点。然后,服务器可以获取连接候选节点与起始节点之间边属性值。再根据属性值,筛选出与起始节点存在较为紧密的关联关系的候选节点(即符合预设的第一要求的候选节点)所对应的第一对象作为符合预设的第一要求的第二对象。
服务器可以调用预先训练好的预设的潜在对象预测模型,利用第二对象的个体数据,进行第二次筛选,以基于第二对象的个体特征,从多个第一对象中进一步筛选出具有相对较高概率会接受并购买待推广的目标业务产品的第一对象,作为符合预设的第二要求的目标对象(即,潜在客户对象)。
具体的,服务器可以先以对第二对象个体数据进行预处理,以从第二对象的个体数据中提取出针对该第二对象的多个维度的个体特征(例如,第二对象的职业特征、收入特征、住房特征、车辆特征、消费特征、自然人关系特征等)。再将上述第二对象的多个维度的个体特征组合作为模型输入,输入至预先训练好的预设的潜在对象预测模型中;并运行该模型,以输出第二对象的预测结果。服务器可以根据第二对象的预测结果,再从第二对象中筛选出符合预设的第二要求的具有较大概率会接受并购买目标业务产品的目标对象。
最后,服务器可以有针对性地向目标对象进行目标业务产品的推广。
具体的,服务器可以先根据目标对象的对象标识检索客户数据库,以获取该银行针对该目标对象的业务标签(例如,指示该客户投资理财倾向、行为习惯等的标签),以及该目标对象的其他相关的客户数据。进而可以根据该目标对象的业务标签,结合其他相关的客户数据,针对该目标对象生成相匹配的目标推送策略。再根据该目标推送策略,向该目标对象推送关于目标业务产品的链接数据。
例如,服务器可以根据该目标对象的业务标签发现该目标对象平时相对较习惯使用手机,且该目标对象对于投资理财更注重稳健、保值。根据上述信息,服务器可以生成与该目标对象相匹配的目标推送策略。进而,服务器可以根据目标推送策略从预设的宣传文本库中搜索关于该目标业务产品,且重点凸显稳健、保值特点的宣传文本,作为目标推广文本。再将该目标推广文本与该目标业务产品的下载链接数据组合,得到针对该目标对象的关于目标业务产品的目标推广数据。然后以手机短信的方式将该目标推广数据发送至该目标对象的手机。这样目标对象可以通过手机及时地接收到该目标推广数据,并根据目标推广数据中目标推广文本,更容易对该目标业务产品产生兴趣,进而更有可能通过触发目标推广数据中的下载链接数据下载并办理目标业务产品。
通过上述实施例,可以较为高效、精准地从海量第一对象中筛选出对目标业务产品的接受概率较高的潜在客户对象,减少确定目标对象时的误差。进一步,还可以针对上述目标对象,生成并根据匹配的目标推广策略对该目标对象进行与目标业务产品相关的目标推广数据的推送,提高目标业务产品的推广效果。
参阅图2所示,本说明书实施例提供了一种目标对象的确定方法。其中,该方法具体应用于服务器一侧。具体实施时,该方法可以包括以下内容:
S201:获取多个第一对象的个体数据和关系数据;
S202:根据所述多个第一对象的关系数据,构建相应的关系知识图谱;
S203:根据所述关系知识图谱,从所述多个第一对象中筛选出多个符合预设的第一要求的第二对象;
S204:调用预设的潜在对象预测模型处理所述多个第二对象的个体数据,以得到第二对象的预测结果;
S205:根据所述第二对象的预测结果,从多个第二对象中筛选出符合预设的第二要求的目标对象。
通过上述实施例,可以有效且充分地利用第一对象的关系数据和个体数据两种不同类型的数据,高效、精准地从第一对象中筛选出对目标业务产品的接受概率较高的潜在客户对象作为目标对象,减少在确定目标对象过程中的处理误差。
在一些实施例中,上述第一对象具体可以理解为待确定是否为目标业务产品的潜在客户对象的客户对象。其中,上述目标业务产品具体可以是一种实体产品(例如,手机、电脑、书籍等),也可以是一种虚拟服务(例如,理财服务、保险服务、保洁服务等)。
在一些实施例中,针对理财服务推广场景(例如,银行对外推广新推出的理财产品等),所述第一对象具体可以包括:自然人对象,和/或,法人对象等。
当然,上述所列举的第一对象只是一种示意性说明。针对不同的应用场景,上述第一对象还可以包括其他类型的对象。例如,针对手机推广场景,上述第一对象具体可以包括:学生对象、成人对象等。
通过上述实施例,针对理财服务推广场景,可以应用本说明书实施例所提供的目标对象的确定方法,有效地覆盖并该应用场景中的多种第一对象进行具体判断和确定。
在一些实施例中,上述个体数据具体可以包括用于反映第一对象的个体特征的数据。上述关系数据具体可以包括用于反映不同第一对象之间的关联关系的数据。
在一些实施例中,针对理财服务推广场景,所述关系数据具体可以包括以下至少之一:自然人关系、股权关系、任职关系、业务往来关系、资金关系等。
通过上述实施例,可以较为全面地区分并利用多种不同类型的关系数据来较好地覆盖理财服务推广场景中的大部分关联关系,从而能够有效地利用关系数据来确定出潜在客户对象。
在一些实施例中,针对理财服务推广场景,所述个体数据具体可以包括以下至少之一:第一对象的借贷数据、第一对象的收入数据、第一对象的资产数据、第一对象的缴费记录、第一对象的保险数据、第一对象的注册信息等。
通过上述实施例,可以较为全面地获取并利用多种类型的个体数据来较好地覆盖理财服务推广场景中的大部分关个体特征,从而能够有效地利用个体数据来确定出潜在客户对象。
在一些实施例中,上述获取多个第一对象的个体数据和关系数据,具体实施时,可以包括以下内容:
S1:获取与第一对象相关的业务数据;其中,所述业务数据具体可以包括:第一对象的注册信息、第一对象的用户数据、第一对象的产品持有记录、第一对象之间的交易数据、涉及第一对象的资产登记数据等等;
S2:对所述业务数据进行语义识别和关联推理,以抽取第一对象的个体数据,以及第一对象之间的关系数据。
在一些实施例中,上述根据所述多个第一对象的关系数据,构建相应的关系知识图谱,具体实施时,可以包括以下内容:
S1:根据第一对象的对象标识,建立节点;
S2:根据第一对象之间的关系数据,利用边连接相应节点;并标注出边的属性值,以得到所述关系知识图谱。
通过上述实施例,可以较为有效地利用不同第一对象之间的关系数据,构建得到包含有较为全面的关联关系的、准确度较高的关系知识图谱。
在一些实施例中,上述根据所述关系知识图谱,从所述多个第一对象中筛选出多个符合预设的第一要求的第二对象,具体实施时,可以包括以下内容:
S1:检索所述关系知识图谱,找到对象标识与客户名单匹配的节点作为起始节点;
S2:从所述起始节点出发,搜索与所述起始节点通过边相连的节点作为候选节点;
S3:获取并根据候选节点与起始节点之间边的属性值,筛选出属性值符合预设的第二要求的候选节点所对应的第一对象作为第二对象。
通过上述实施例,可以根据关系知识图谱,有效地利用不同第一对象之间的关系数据,完成第一次筛选,以从海量的第一对象中筛选出可能为潜在客户对象的第二对象。
在一些实施例中,上述客户名单具体可以是记录有已经被确定为潜在客户对象或者高潜力客户对象的对象标识的名单数据。
在一些实施例中,针对理财服务推广场景,上述根据所述关系知识图谱,从所述多个第一对象中筛选出多个符合预设的第一要求的第二对象,具体实施时,还可以包括:根据第一对象的个体数据,筛选出个人拥有资产数据大于预设的数据预置的第一对象作为候选对象;检索关系知识图谱,找到与所述候选对象的对象标识相同的节点作为起始节点;进而可以从所述起始节点出发,搜索与所述起始节点通过边相连的节点作为候选节点;再获取并根据候选节点与起始节点之间边的属性值,筛选出属性值符合预设的第二要求的候选节点所对应的第一对象作为第二对象。
在一些实施例中,上述调用预设的潜在对象预测模型处理所述多个第二对象的个体数据,以得到第二对象的预测结果,具体实施时,可以包括以下内容:对所述第二对象的个体数据进行预处理,以提取得到第二对象的多个维度的个体特征;调用预设的潜在对象预测模型处理第二对象的多个维度的个体特征,以得到第二对象的预测结果。
通过上述实施例,可以先对第二对象的个体数据进行预处理,以提取得到相应的个体特征;再调用预先训练好的预设的潜在对象预测模型处理上述个体特征,以精准地确定出用于指示第二对象是否为潜在客户对象的预测结果;进而后续可以根据第二对象的预测结果,充分利用第二对象的个体数据,完成第二次筛选,以从多个第二对象中进一步确定并筛选出潜在客户对象作为最终的目标对象。
在一些实施例中,所述多个维度的个体特征具体可以包括:职业特征、收入特征、住房特征、车辆特征、消费特征、自然人关系特征等。
通过上述实施例,可以较为全面地区分并利用多种不同维度的个体特征来较好地覆盖理财服务推广场景中的大部分个体特征,进而能够基于第二对象的个体特征,有效地利用个体数据来精细地识别并确定出潜在客户对象。
在一些实施例中,上述对第二对象的个体数据进行预处理具体实施时,可以包括:对所述第二对象的个体数据进行语义识别,以提取得到第二对象的多个特征数据;调用预先训练好的特征分类模型,处理所述多个特征数据,以得到第二对象的多个维度的个体特征。
在一些实施例中,上述预设的潜在对象预测模型具体可以是一种XGBoost算法模型。
在一些实施例中,上述XGBoost具体可以理解为一种基于GBDT的算法实现,而GBDT是又一种基于boosting集成思想的算法模型。基于XGBoost算法模型,具体进行模型训练时,可以采用前向分布算法进行贪婪的学习,每次迭代都学习一棵CART数来拟合之前t-1棵树的预测结果与训练样本真实值的残差。上述XGBoost支持并行计算。
在一些实施例中,在具体调用预设的潜在对象预测模型处理第二对象的多个维度的个体特征时,可以先根据与特征维度对应的预设的特征编码规则,将各个维度的个体特征转换为相应的特征编码;再将多个特征编码组合作为模型输入,输入至预设的潜在对象预测模型中进行具体处理。
在一些实施例中,针对理财服务推广场景,上述职业特征能够在一定程度上反映出客户对象的资产获取能力,例如,A职业相对于其他职业普遍具有较高且稳定的资产获取能力。具体实施前,对应职业特征可以设计如下的预设的特征编码规则:1-A职业,2-B职业,3-C职业,4-D职业……。
针对理财服务推广场景,上述收入特征可以较好地辅助推算出客户对象的资产情况,例如,包括:代发工资信息、党费缴纳信息、政务信息(社保、公积金)等。
针对理财服务推广场景,上述住房特征也能够在一定程度反映出客户的阶层与财富,例如,包括:房贷信息、可靠联系地址、装修贷款信息等。
针对理财服务推广场景,上述车辆特征也是客户对象的重要资产和消费能力的体现,例如,包括:etc登记信息、行驶证扫描信息、汽车消费贷款信息等。
针对理财服务推广场景,上述消费特征往往与客户的购买力之间相关,而客户的资产又是购买力的主要支撑,因此,也能够反映出客户对象的资产状况。例如,包括:信用卡月均消费额、信用卡消费情况(奢侈品消费,境外消费)、子女学校缴费(学费情况)、实物贵金属投资情况等。
针对理财服务推广场景,上述自然人关系特征,例如,客户对象与已被确定的同潜在客户对象(或者高潜力客户对象、超高净值客户对象等)之间的自然人关系,也能从侧面反映出该客户对象自身的资产状况。具体实施前,对应自然人关系特征可以设计如下的预设的特征编码规则:11-第1类关系,12-第2类关系,13-第3类关系等。
在一些实施例中,在根据所述第二对象的预测结果,从多个第二对象中筛选出符合预设的第二要求的目标对象之后,所述方法具体实施时,还可以包括以下内容:
S1:获取目标对象的业务标签;
S2:根据所述业务标签,确定针对目标对象的目标推送策略;
S3:根据所述目标推送策略,向所述目标对象推送关于目标业务产品的链接数据。
通过上述实施例,在从海量的第一对象中确定出对目标业务产品的接受概率较高的目标对象之后,还可以确定并根据与目标对象相匹配的目标推送策略,有针对性地向目标对象进行关于目标业务产品的链接数据的推送,从而可以获得较好的推广效果。
在一些实施例中,所述方法具体实施时,还可以包括以下内容:
S1:获取多个样本对象的个体特征作为样本数据;
S2:对所述样本数据进行类别标记,得到标注后的样本数据;
S3:构建初始模型以及预设的损失函数;其中,所述预设的损失函数为FocalLoss损失函数;
S4:利用预设的损失函数、标注后的样本数据对初始模型进行训练学习,以得到预设的潜在对象预测模型。
通过上述实施例,可以利用样本数据,同时结合基于FocalLoss损失函数的预设的损失函数,高效地训练得到准确度较高、效果较好的预设的潜在对象预测模型。
在一些实施例中,上述对所述样本数据进行类别标记,得到标注后的样本数据,具体实施时,可以包括:根据样本数据的类别(例如是高潜力客户对象,还是非高潜力客户对象;或者,是推广成功的客户对象,还是推广失败的客户对象),在样本数据上设置对应的类别标签,进行标记,从而可以得到标注后的样本数据。例如,在高潜力客户对象或推广成功的客户对象的样本数据设置表征正样本的类别标签,在非高潜力客户对象或推广失败的客户对象的样本数据设置表征负样本的类别标签,从而得到标注后的样本数据。
在得到标注后的样本数据之后,还可以根据预设的训练比例(例如9:1)将标注后的样本数据拆分为训练集和测试集,以便后续可以先利用训练集进行模型训练,再利用测试集进行模型测试,得到满足要求的预设的潜在对象预测模型。
在一些实施例中,在具体利用标注后的样本数据进行模型训练之前,可以先对样本对象的个体特征进行数值类型检测,找出属于数值连续型的个体特征(例如,代发工资信息、房贷信息、信用卡月均消费额等);然后可以采用直方图算法将上述数值连续型的个体特征先离散化为k个离散特征,同时构造一个宽度为k的直方图(含有k个bin)用于进行信息统计。这样后续在具体进行模型训练时,可以直接利用上述直方图所统计的信息进行训练,无需再遍历所有的个体特征,只需遍历直方图中k个bin就可以快速地找到最佳分裂点,从而可以极大提升了节点分裂时的计算效率,在一定程度上降低了模型的方差,增强了模型的鲁棒性,也提高的模型训练效率。
在一些实施例中,上述预设的损失函数具体可以为FocalLoss损失函数。基于上述预设的损失函数,可以有效地利用FocalLoss损失函数针对不同类别分别设置不同的权重系数。
在一些实施例中,具体进行预设的潜在对象预测模型的训练时,可以基于XGBoost算法思想,按照以下方式构建模型训练的目标函数(包括预设的损失函数和正则化项两部分):
其中,Obj代表目标函数的函数值,l代表预设的损失函数,Ω代表正则化项,f代表模型函数。是第i个样本对象xi的预测值,yi是第i个样本对象xi的真实值。
其中,上述预设的损失函数具体可以表示为以下形式:
其中,αi代表基于类别设置的权重系数,取值范围为0-1之间。
通过引入并利用上述包含有基于类别的权重系数的预设的损失函数构建目标函数,以进行模型训练,可以对不同类别赋予不同的权重,从而能够较为有效地避免训练过程中出现占比高的样本类别的loss占主导,导致训练得到的模型会特别照顾占比高的样本类别的问题,提高了模型训练的准确度。
进一步,又由于XGBoost是一种加法模型,因此,预测值(或者称预测得分)具体可以是每棵树打分的累加之和。如下所示:
再将全部k棵树的复杂度进行求和,并添加到目标函数中作为正则化项:
其中,J代表叶子节点的数量,w代表第j个叶子节点的最优解。
通过引入并利用正则化项来构建目标函数,以进行模型训练,可以有效地防止过拟合,进一步提高模型的训练效果。
由上可见,基于本说明书实施例提供的目标对象的确定方法,当需要搜寻潜在客户对象进行目标业务产品推送时,可以先获取并根据第一对象的关系数据,构建相应的关系知识图谱;基于该关系知识图谱,对第一对象进行筛选,找出符合预设的第一要求的第二对象;接着,可以调用预设的潜在对象预测模型通过处理上述第二对象的个体数据,以获得第二对象的预测结果;再根据第二对象的预测结果,对第二对象进行筛选,找出符合预设的第二要求的目标对象。从而可以通过综合利用第一对象的关系数据和个体数据,高效、精准地从第一对象中筛选出对目标业务产品的接受概率较高的潜在客户对象。进而可以针对上述目标对象,根据匹配的策略进行与目标业务产品相关的信息推送,以提高目标业务产品的推广效果。
本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:获取多个第一对象的个体数据和关系数据;根据所述多个第一对象的关系数据,构建相应的关系知识图谱;根据所述关系知识图谱,从所述多个第一对象中筛选出多个符合预设的第一要求的第二对象;调用预设的潜在对象预测模型处理所述多个第二对象的个体数据,以得到第二对象的预测结果;根据所述第二对象的预测结果,从多个第二对象中筛选出符合预设的第二要求的目标对象。
为了能够更加准确地完成上述指令,参阅图3所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口301、处理器302以及存储器303,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
其中,所述网络通信端口301,具体可以用于获取多个第一对象的个体数据和关系数据。
所述处理器302,具体可以用于根据所述多个第一对象的关系数据,构建相应的关系知识图谱;根据所述关系知识图谱,从所述多个第一对象中筛选出多个符合预设的第一要求的第二对象;调用预设的潜在对象预测模型处理所述多个第二对象的个体数据,以得到第二对象的预测结果;根据所述第二对象的预测结果,从多个第二对象中筛选出符合预设的第二要求的目标对象。
所述存储器303,具体可以用于存储相应的指令程序。
在本实施例中,所述网络通信端口301可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的端口,也可以是负责进行FTP数据通信的端口,还可以是负责进行邮件数据通信的端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
在本实施例中,所述处理器302可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
在本实施例中,所述存储器303可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
本说明书实施例还提供了一种基于上述目标对象的确定方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:获取多个第一对象的个体数据和关系数据;根据所述多个第一对象的关系数据,构建相应的关系知识图谱;根据所述关系知识图谱,从所述多个第一对象中筛选出多个符合预设的第一要求的第二对象;调用预设的潜在对象预测模型处理所述多个第二对象的个体数据,以得到第二对象的预测结果;根据所述第二对象的预测结果,从多个第二对象中筛选出符合预设的第二要求的目标对象。
在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
参阅图4所示,在软件层面上,本说明书实施例还提供了一种目标对象的确定装置,该装置具体可以包括以下的结构模块:
获取模块401,具体可以用于获取多个第一对象的个体数据和关系数据;
构建模块402,具体可以用于根据所述多个第一对象的关系数据,构建相应的关系知识图谱;
第一筛选模块403,具体可以用于根据所述关系知识图谱,从所述多个第一对象中筛选出多个符合预设的第一要求的第二对象;
调用模块404,具体可以用于调用预设的潜在对象预测模型处理所述多个第二对象的个体数据,以得到第二对象的预测结果;
第二筛选模块405,具体可以用于根据所述第二对象的预测结果,从多个第二对象中筛选出符合预设的第二要求的目标对象。
需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
由上可见,基于本说明书实施例提供的目标对象的确定装置,通过综合利用第一对象的关系数据和个体数据,高效、精准地从第一对象中筛选出对目标业务产品的接受概率较高的潜在客户对象。
在一个具体的场景示例中,可以应用本说明书实施例提供的目标对象的确定方法基于关联关系探查目标客户,并进行相应营销。具体实施过程可以参阅图5所示,包括以下步骤。
步骤S1,获取并根据初始业务数据,确定出多种隐形关系(例如,第一对象关系数据)。并利用自然人关系、股权关系、任职关系、业务往来关系、资金关系等关联关系构建知识图谱(例如,关系知识图谱)。利用该知识图谱可以探查各种隐性关系,并挖掘出暂时表现为低价值低资产的客户(例如,个人资产总额小于20W),但从关联数据中预估实际资产高的客户名单(例如,从海量的第一对象中筛选出符合预设的第一要求的第二对象)。
步骤S2,根据所述低资产潜力客户名单,从和资金最为密切的六个维度(包括:职业、收入、住房、汽车、消费、自然人关系),利用XGBoost算法模型(例如,预设的潜在对象预测模型)根据上述六个维度的特征(例如,个体特征)进行潜在目标客户预测。
步骤S3,根据模型预测结果,同时可以结合传统的客户星级标签,判断客户的综合情况,为客户经理的精准营销提供有力的决策支持(例如,确定出目标对象,并对目标对象进行目标业务产品的推广)。
在本场景示例中,具体实施时,可以利用法人对个人关系和个人对个人关系数据,将客户实体作为“点”,实体与实体之间的“关系”作为“边”,构建知识图谱挖掘低资产潜力客户,譬如通过公司信息(公司结算户、上市公司信息)结合工商注册信息(股权关系、高管关系)或资金流向关联关系,精准识别潜力客户;或私人银行超高净值客户为起点,基于亲属关系、信用卡主副卡关系、企业关联关系等图谱关联关系,挖掘目标客户。其中亲属关系可基于个人登记信息、房贷共同还款人、贷款担保信息、信用卡联系人、相同信用卡地址、相同联系地址、保险受益人、固定转账账户、资金密切往来人、政务信息(婚姻)等其它信息进行判定。
在本场景示例中,可以基于职业、收入、住房、汽车、消费、自然人关系等客户基础信息,利用XGBoost算法模型,对这些目标客群进行潜在目标客户预测。
其中,职业:客户的职业决定了客户的资产获取能力,尤其是企业重要管理者,我们将常见职业进行编码,如:1-A职业,2-B职业,3-C职业,4-D职业.....,将其作为一个特征用于XGBoost模型学习。收入:客户的收入可以直接推算客户的资产情况,包括代发工资信息、党费缴纳信息、政务信息(社保、公积金)。住房:国内客户不同的住房条件反映了客户阶层与财富,包括:房贷信息、可靠联系地址、装修贷款信息。汽车:汽车是客户重要资产和也是消费能力的体现,包括etc登记信息、行驶证扫描信息、汽车消费贷款信息。消费:消费情况反应的是客户的购买力,而客户的财力是购买力的背后支撑,包括信用卡月均消费额、信用卡消费情况(奢侈品消费,境外消费)、子女学校缴费(学费情况)、实物贵金属投资情况。自然人关系:根据步骤S1得到的关联关系,对待预测客户与私人银行超高净值客户的关系进行编码,如11-第1类关系,12-第2类关系,13-第3类关系等等。其他内容:曾经的高资产客户,由于各种情况流失,可以作为跟踪依据。
在本场景示例中,参阅图6所示,可以利用相应系统,进行基于XGBoost算法的潜在目标客户预测模型训练。其中,该系统具体可以包括以下结构:
训练样本单元601和测试样本单元602:在本场景示例中,可以将已知的私人银行客户、高净值客户作为正样本,前期基层客户经理营销失败的客户案例作为负样本,将客户的职业、收入、住房、汽车、消费、自然人关系等基础信息作为样本特征。按照9:1的比例将样本数据分为训练样本和测试样本。
数据预处理单元603:对于连续的特征值(如代发工资信息、房贷信息、信用卡月均消费额等等),我们采用直方图算法将其离散化为k个离散特征,同时构造一个宽度为k的直方图用于统计信息(含有k个bin)。这一预处理方法使模型训练过程中无需遍历数据,只需遍历k个bin即可找到最佳分裂点,极大提升了节点分裂时的计算效率,一定程度上降低了模型的方差,增强了模型的鲁棒性。
模型训练单元604:在本场景示例中,可以采用XGBoost算法进行潜力目标客户预测模型训练,XGBoost是基于GBDT的一种工程实现,而GBDT是一种基于boosting集成思想的算法模型,训练时采用前向分布算法进行贪婪的学习,每次迭代都学习一棵CART数来拟合之前t-1棵树的预测结果与训练样本真实值的残差。XGBoost的基本思想和GBDT,但是做了一些优化,如默认的缺失值处理,加入了二阶导数信息、正则项、列抽样,并且可以并行计算。
其中,XGBoost的目标函数由损失函数和正则化项两部分组成,定义如下:
其中,l代表损失函数。上述基于逻辑回归的损失函数可以表示为:
其中,是第i个样本xi的预测值,因为在准备样本数据集时,将已知的私人银行客户、高净值客户作为正样本,前期基层客户经理营销失败的客户案例作为负样本,存在正负样本的比例差距较大问题,导致在训练过程中占比高样本类别的loss会占主导,训练得到的模型会特别照顾占比高的样本类别,导致模型的精度降低。
因此,在本场景示例中,可以采用FocalLoss作为损失函数,以对每个类别赋予不同的权重:
其中,αi为类别权重,取值范围为0-1之间。
由于XGBoost是一种加法模型,因此,预测得分是每棵树打分的累加之和:
再将全部k棵树的复杂度进行求和,添加到目标函数中作为正则化项,用于防止过拟合:
其中,J是叶子节点的数量,w是第j个叶子节点的最优解。
模型评估单元605:利用测试样本对训练的模型进行评估,待模型迭代输出模型评估结果满足预测需求后,即结束训练。
在本场景示例中,随着业务的使用,可以利用累计的营销结果数据和数据库中原有的信息数据,重新训练潜在目标客户预测模型,使模型准确率提高。
进一步,参阅图7所示,可以构建一套基于关联关系探查目标客户的营销系统。其中,该系统具体可以包括以下结构:
701法人客户清单单元:获取公司结算户、上市公司清单;
702法人关联个人探查单元(可以包括股权关系单元、任职关系单元和资金关系单元等):将公司客户、个人客户等实体对象简单抽象为一个个“点”,将工商注册信息(股权关系、高管关系)或资金流向等实体之间的关系抽象为一条条“边”,生成的一个关系网络,基于“关系”的维度来探查个人潜力客户;
703高价值个人客户清单单元:可以获取私人银行客户、高净值客户清单;
704个人关联个人探查单元(包括自然人关系单元、资金关系单元、投保人关系单元等):将个人客户简单抽象为一个个“点”,将亲属关系(包含个人登记信息、房贷共同还款人、贷款担保信息、信用卡联系人、相同信用卡地址、相同联系地址、保险受益人、固定转账账户、资金密切往来人、政务信息(婚姻))、信用卡主副卡关系、企业关联关系等实体之间的关系抽象为一条条“边”,生成的一个关系网络,基于“关系”的维度来探查个人潜力客户;
705潜力客户清单单元:对法人关联个人探查单元和个人关联个人探查单元得到的个人潜力客户名单进行个人资产查询,如果客户的净资产小于20万元,进行隐性星级评估;
706个人客户基础信息单元:包含有关于个人客户的职业单元、收入单元、住房单元、汽车单元、消费单元、自然人关系单元等;
707目标潜在客户预测模型:用于基于个人客户基础信息特征,利用XGBoost算法模型,对目标客群进行潜在目标客户预测;
708营销个人客户清单单元:根据模型预测结果与传统的客户星级结合判断客户的综合情况,获得待营销客户清单。
通过上述场景示例,可以验证本说明书实施例所提供的目标对象的确定方法可以突破现有关系型数据库的限制,更高效、精准、迅速地从海量的数据中挖掘低资产潜力客户;同时有效地利用自然人关系、股权关系、任职关系、业务往来关系、资金关系等关联关系构建知识图谱探查各种隐性关系,并挖掘出银行暂时表现为低价值低资产的客户,但从关联数据中预测可能是有价值的客户,缩小了待分析的客户范围。进一步,可以再基于6大潜在分析维度:职业、收入、住房、汽车、消费、自然人关系等客户基础信息,利用改进的XGBoost算法构建潜在目标客户预测模型,对这些目标客群进行预测,并将预测结果作为主要营销切入点。基于上述方法和系统,可以改变传统将各种维度的信息堆积进行查看带来的杂乱无章,也强化了对客户背后深层次的情况进行总结归纳。并且,通过客户资产与模型预测结果的结合使用判断客户综合情况,便于客户经理的准确识别和营销服务。
虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。