一种景区游客流量预测方法及装置

文档序号:8789 发布日期:2021-09-17 浏览:23次 英文

一种景区游客流量预测方法及装置

技术领域

本申请属于智能旅游

技术领域

,尤其涉及一种景区游客流量预测方法及装置。

背景技术

随着国内居民生活水平的不断提升,旅游已经成为了众多国人生活中必不可少的娱乐、休闲的重要项目。景区人流量一直是人们和景区管理部门所特别关注的事情,例如,游客如果能够事先预知某个景区的聚集度的可能性,则使得游客可以更好地安排或调整自己的行程。

目前,为了预测景区人流量,一些专家和学者提出了可以使用统计模型或现有的一些人工智能模型来识别人流量,但是,统计模型通常都是线性模型,而预测景区游客流量是非线性相关问题,可能会导致较大的预测误差。另外,一些专家和学者提出,还可以利用人工智能模型来对景区游客流量进行预测,但是目前常用的人工智能模型(例如,SVM)易出现过拟合缺陷,导致陷入局部最优,影响人流量预测结果的精确度。

发明内容

有鉴于此,本申请实施例提供了一种景区游客流量预测方法及装置,以解决现有技术中景区的人流量预测结果的精确度较低的问题。

本申请实施例的第一方面提供了一种景区游客流量预测方法,包括:获取历史游客流量时间序列,所述历史游客流量时间序列包括多个日期和相应的当日游客流量;基于交互信息法计算所述历史游客流量时间序列所对应的时间延迟;基于几何不变量法计算所述历史游客流量时间序列和所述时间延迟所对应的嵌入维度;基于所述时间延迟和所述嵌入维度对所述历史游客流量时间序列进行相空间重构,以得到相应的多个相空间时间序列;将所述多个相空间时间序列输入至游客量预测模型,以由所述游客量预测模型确定对应人流量预测日期的预测景区游客流量。

本申请实施例的第二方面提供一种景区游客流量预测装置,包括:获取单元,被配置为获取历史游客流量时间序列,所述历史游客流量时间序列包括多个日期和相应的当日游客流量;延迟计算单元,被配置为基于交互信息法计算所述历史游客流量时间序列所对应的时间延迟;嵌入维度计算单元,被配置为基于几何不变量法计算所述历史游客流量时间序列和所述时间延迟所对应的嵌入维度;相空间重构单元,被配置为基于所述时间延迟和所述嵌入维度对所述历史游客流量时间序列进行相空间重构,以得到相应的多个相空间时间序列;游客流量预测单元,被配置为将所述多个相空间时间序列输入至游客量预测模型,以由所述游客量预测模型确定对应人流量预测日期的预测景区游客流量。

本申请实施例的第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法的步骤。

本申请实施例的第四方面提供一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。

本申请实施例与现有技术相比存在的有益效果是:

通过统计多个日期和相应的当日游客流量以得到时间序列,对此时间序列进行相空间重构,能够更好地提取非线性的人流量预测问题的访客数据中的时间信息,并将相应的多个相空间时间序列输入至游客量预测模型,可以有效提高所预测的景区游客流量的准确度。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了根据本申请实施例的景区游客流量预测方法的一示例的流程图;

图2示出了根据本申请实施例的对游客量预测模型进行参数设置的一示例的流程图;

图3示出了根据本申请实施例的利用游客量预测模型来确定预测景区游客流量的一示例的流程图;

图4示出了根据本申请实施例的景区游客流量预测装置的一示例的结构框图;

图5是本申请实施例的电子设备的一示例的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

在本发明中,“模块”、“系统”等等指应用于计算机的相关实体,如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说,例如,元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有,运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中,并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间,并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号,例如,来自一个与本地系统、分布式系统中另一元件交互的,和/或在因特网的网络通过信号与其它系统交互的数据的信号通过本地和/或远程过程来进行通信。

最后,还需要说明的是,在本文中,术语“包括”、“包含”,不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

另外,在本申请的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

图1示出了根据本申请实施例的景区游客流量预测方法的一示例的流程图。关于本申请实施例方法的执行主体,其可以是景区服务器或景区旅游平台。通过景区旅游平台不仅可以完成对景区中相关数据和信息的处理,还能够与其他终端设备(例如,平台注册用户的终端)进行通信交互,以实现各种通信功能。

如图1所示,在步骤110中,获取历史游客流量时间序列。这里,历史游客流量时间序列包括多个日期和相应的当日游客流量,例如可以是过往半年中每一天的景区到访游客的数量。

在步骤120中,基于交互信息法计算历史游客流量时间序列所对应的时间延迟。这里,采用交互信息法,能弥补自相关法(或其他延迟确定方式)中前后序列点的关联性太强的缺陷,通过计算联合概率分布和系统概率分布,得到适宜于当前数据场景(即,人流量预测场景)的时间延迟。

在步骤130中,基于几何不变量法计算历史游客流量时间序列和时间延迟所对应的嵌入维度。

应理解的是,一个系统在某一时刻的状态称为相,决定状态的几何空间称为相空间。在相空间重构技术有两个关键的参数:嵌入的维数d和延迟时间τ。在实际应用中,时间序列都是有噪声的有限序列,使得嵌入维数d和时间延迟τ必须要根据实际数据来选取合适的值。

示例性地,可以计算吸引子的某些几何不变量(如关联维数,Lyapunov指数等),并在选择好延迟时间τ之后逐渐增加维数d,直到它们停止变化为止。从Takens嵌入定理分析可知,这些几何不变量具有吸引子的几何性质,当维数d大于最小嵌入维数的时候,几何结构已经被完全打开,此时这些几何不变量与嵌入的维数无关。基于此理论,可以选择吸引子的几何不变量停止变化时的嵌入维数d作为重构的相空间维数。

在步骤140中,基于时间延迟和嵌入维度对历史游客流量时间序列进行相空间重构,以得到相应的多个相空间时间序列。

在步骤150中,将多个相空间时间序列输入至游客量预测模型,以由游客量预测模型确定对应人流量预测日期的预测景区游客流量。

通过本申请实施例,利用PSR技术来对历史游客流量时间序列进行相空间重构,将一维时间序列重构成多个多维的序列,通过上述数据挖掘过程而得到能更好地表现出时间信息的相空间时间序列。继而,将这些相空间时间序列输入至游客预测模型,使得游客预测模型能够较精确地预测到对应日期的景区人流量。

需说明的是,与传统的人工智能模型不同的是,一般的人工智能模型为了处理分类问题,可以基于简单的任务样本训练而实现具有对相应任务的处理能力,例如动物识别模型可以简单地利用一些动物图像样本来进行训练即可。然而,在面对一些实际自然问题时,由于影响因子众多或不确定性较大,直接利用初期准备的训练样本集进行训练,模型无法实现期望效果。结合本申请实施例的业务场景而言,如果直接利用过往不同日期的游客到访流量来作为游客量预测模型的输入样本,则无法充分考虑不同日期之间的其他外在因素对当日游客量的影响,例如温度、空气湿度等等。然而,如果人为地去考虑并设置模型的不同影响维度,则可能会遗漏某个影响维度,而导致降低模型的预测结果的精确度。

通过本申请实施例,采用相空间重构技术对历史游客流量时间序列进行挖掘,提取时间延迟和相应的嵌入维度,使得其在高维空间中的路径变得清晰,进而构建多个相空间时间序列并将其作为模型输入,进而预测景区游客流量。由此,可以有效保障对景区游客流量的预测结果的可靠性。

在本申请实施例的一些示例中,游客量预测模型包括级联的第一网络模块、第二网络模块和第三网络模块。这里,第一网络模块可以表示模型的输入模块层,第二网络模块可以表示模型的连接模块层,以及第三网络模块可以表示模型的输出模块层。具体地,第一网络模块用于接收相空间时间序列所对应的特征数据并通过第一激活函数进行处理,第二网络模块用于对所输入的数据进行矩阵计算处理,以及第三网络模块用于对所输入的数据通过第二激活函数进行处理,以输出预测景区游客流量。

需说明的是,在对游客量预测模型进行设置和优化的过程中,可以采用一般的梯度优化方式来对模型进行参数化设置和优化。然而,一般的梯度优化方式仅在对应分类问题的人工智能模型中适用,而在应对非线性问题时,则容易出现过拟合现象。

图2示出了根据本申请实施例的对游客量预测模型进行参数设置的一示例的流程图。

如图2所示,在步骤210中,获取与第一网络模块、第二网络模块和第三网络模块的网络层参数分别对应的第一参数区间、第二参数区间和第三参数区间。这里,网络层设置包括网络层权值和阈值。应理解的是,神经网络的各个网络层的权值和阈值在训练优化的过程中可以不断地被调整,直到模型收敛。

在步骤220中,根据拉丁超立方抽样规则从第一参数区间、第二参数区间和第三参数区间中进行M次采样,以得到相应的M个采样参数集。这里,M是大于1的自然数。示例性地,可以从第一参数区间、第二参数区间和第三参数区间中分别抽样a1、a2和a3,从而得到相应的采样参数集{a1,a2,a3},进而重复M次上述抽样过程以得到最终的采样结果。这样,通过拉丁超立方抽样规则的分层抽样技术,实现从多元参数分布中近似随机抽样,能够满足对模型中多层结构的不同参数的抽样需求。

在步骤230中,基于各个采样参数集分别定义相应的种群成员,以构建相应的种群。

在步骤240中,基于训练样本集和预设的种群遗传算法,从种群中确定最优种群成员。

应理解的是,遗传算法(Genetic Algorithm,GA)是根据大自然中生物体进化规律而设计提出的,是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。此外,在本申请实施例中所采用的种群遗传算法的类型可以是多样化的,例如可以借鉴目前相关技术中其他领域的种群遗传算法,在此应不加限制。

示例性地,训练样本集中的每个训练样本可以包含相空间时间序列样本和相应的景区游客流量标签。利用种群适应度函数确定种群中的各个种群成员所对应的适应度,其中种群适应度函数可以是由景区游客流量标签来定义的。继而,可以从种群中确定具有最高适应度的最优种群成员。

在步骤250中,利用最优种群成员,设置第一网络模块、第二网络模块和第三网络模块的对应网络层参数。具体地,可以利用最优种群成员所对应的采样参数集中的各个参数分别对第一网络模块、第二网络模块和第三网络模块的网络层参数进行对应设置。

通过本申请实施例,利用符合生物体进化规律的种群遗传算法,对游客量预测模型进行优化,可以有效地帮助模型在训练过程中找到全局最优解,相比于梯度优化算法,能有效避免陷入局部最优和过拟合的问题。

需说明的是,“法定假期”、“学生寒暑假”等特定日期类型是对景区游客流量的最重要影响因素之一,例如国内很多景区的营收主要取决于在法定假期的游客量。

鉴于此,在本申请实施例的一些示例中,存在多个分别具有相应的日期类型的候选游客量预测模型,以便于针对不同的预测日期调用相应的候选模型来进行预测操作。

图3示出了根据本申请实施例的利用游客量预测模型来确定预测景区游客流量的一示例的流程图。

如图3所示,在步骤310中,根据日期类型对历史游客流量时间序列进行划分,以得到相应的节假日类型子序列和工作日类型子序列。

在步骤320中,获取人流量预测日期所对应的目标日期类型。

在步骤330中,从节假日类型子序列和工作日类型子序列中,选择与目标日期类型相应的目标子序列。

在步骤340中,从多个候选游客量预测模型中,确定与目标日期类型相应的游客量预测模型。这里,每一候选游客量预测模型分别具有相应的日期类型。

在步骤350中,将目标子序列输入至所确定的游客量预测模型,以得到对应人流量预测日期的预测景区游客流量。

在本申请实施例中,针对预测日期的不同日期类型,可以采用不同的候选模型,并利用相应日期类型的时间序列进行预测,可以避免将节假日时间序列用于重构或预测工作日的景区人流量,可以保障预测结果具有较高的精确度。

在一些情况下,术语“人流量预测日期”可以表示相对于当前日期的特定日期(例如,今天或明天),也可以是一段时间的连续日期,例如未来三天(即,明天、后天和大后天)的人流量预测。应理解的是,为了保障预测结果的精确度,人流量预测日期不宜与当前日期相差太久。

在本申请实施例的一些示例中,在步骤150之后,该方法还包括:从客户端接收景区游客量查询请求。例如,游客在对景区进行旅游之前,可以事先登录景区平台APP,并通过点击相应控件而生成针对景区旅游平台的游客量查询请求。然后,响应于景区游客量查询请求,景区旅游平台发送预测景区游客流量至客户端。由此,通过客户端与平台之间的数据通信交互操作,游客可以预先知道出行日期(例如,当天或明天)的人流量情况,有利于游客规划安排景区出行计划,也能避免景区中出现游客拥挤情况,保障了景区到访游客的旅游体验。

在一些实施方式中,还可以检测预测景区游客流量是否超过预设游客量阈值,并当超过预设游客量阈值时,根据预约客户端列表中的各个客户端设备信息向相应的客户端推送景区拥挤通知。这里,预约客户端列表记录了各个在人流量预测日期预约进行出游的游客所对应的客户端设备信息。由此,能够向预约了在人流量预测日期出游的游客及时推送拥堵风险通知,使得游客在如约到访时能够对拥堵具有一定的心理基础,在最大程度上降低游客的抱怨。

在一些情况中,模型在实际使用场景下的预测结果可能不如人意,例如实际上景区中的人数很少但却预告景区拥挤,此时,则需要提示平台运营商对游客量预测模型进行优化。

具体地,可以基于景区闸机采集对应人流量预测日期的实测游客流量。这里,景区闸机位于景区入口,且用于对入园人员进行票券验证操作。示例性地,游客可以使用手机或票券上的二维码对准景区闸机上的扫码枪,从而实现票券信息的上传与验证。这样,可以通过统计各个景区闸机处的入园游客量,从而得到相应的实测游客流量。

然后,可以计算实测游客流量与预测景区游客流量之间的游客流量差值。

进而,当游客流量差值超过预设阈值时,生成模型优化警示通知,使得基于模型优化警示通知提醒平台运维人员对游客量预测模型进行优化。例如,可以向各个平台运营人员所对应的终端设备发送模型优化警示通知,以提示运营人员及时对模型进行优化。由此,可以避免因游客量预测模型的性能问题或场所不适配问题而导致的人流量的预测结果偏差,更保障了向用户所呈现或推送的预测景区游客流量的高精确度。

图4示出了根据本申请实施例的景区游客流量预测装置的一示例的结构框图。

如图4所示,景区游客流量预测装置400包括获取单元410、延迟计算单元420、嵌入维度计算单元430、相空间重构单元440和游客流量预测单元450。

获取单元410被配置为获取历史游客流量时间序列,所述历史游客流量时间序列包括多个日期和相应的当日游客流量。

延迟计算单元420被配置为基于交互信息法计算所述历史游客流量时间序列所对应的时间延迟。

嵌入维度计算单元430被配置为基于几何不变量法计算所述历史游客流量时间序列和所述时间延迟所对应的嵌入维度。

相空间重构单元440被配置为基于所述时间延迟和所述嵌入维度对所述历史游客流量时间序列进行相空间重构,以得到相应的多个相空间时间序列。

游客流量预测单元450被配置为将所述多个相空间时间序列输入至游客量预测模型,以由所述游客量预测模型确定对应人流量预测日期的预测景区游客流量。

需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。

图5是本申请实施例的电子设备的一示例的示意图。如图5所示,该实施例的电子设备500包括:处理器510、存储器520以及存储在所述存储器520中并可在所述处理器510上运行的计算机程序530。所述处理器510执行所述计算机程序530时实现上述景区游客流量预测方法实施例中的步骤,例如图1所示的步骤110至150。或者,所述处理器510执行所述计算机程序530时实现上述各装置实施例中各模块/单元的功能,例如图4所示单元410至450的功能。

示例性的,所述计算机程序530可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器520中,并由所述处理器510执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序530在所述电子设备500中的执行过程。

所述电子设备500可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述电子设备可包括,但不仅限于,处理器510、存储器520。本领域技术人员可以理解,图5仅是电子设备500的示例,并不构成对电子设备500的限定,可以包括比图示更多或少的部件,或组合某些部件,或不同的部件,例如所述电子设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器510可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器520可以是所述电子设备500的内部存储单元,例如电子设备500的硬盘或内存。所述存储器520也可以是所述电子设备500的外部存储设备,例如所述电子设备500上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器520还可以既包括所述电子设备500的内部存储单元也包括外部存储设备。所述存储器520用于存储所述计算机程序以及所述电子设备所需的其他程序和数据。所述存储器520还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的装置/电子设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/电子设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述单元既可以采用硬件的形式实现,也可以采用软件的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

完整详细技术资料下载
上一篇:石墨接头机器人自动装卡簧、装栓机
下一篇:微气象监测装置高维构建及补全方法、系统、装置及介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!