数据抽检方法、装置、电子设备和可读存储介质
技术领域
本发明涉及数据处理
技术领域
,特别是涉及数据抽检方法、装置、电子设备和可读存储介质。背景技术
随着数据验收技术的发展,例如在对小语种人工翻译结果进行验收时,第一用户和第二用户双方分别可以对小语种人工翻译结果通过多次的随机抽取,选取对各自最有利的一次抽取结果进行验收,会出现不能准确评价数据的质量的问题。
为了避免在对小语种人工翻译结果进行验收时出现不能准确评价数据质量的问题,现有技术将随机种子输入计算机编程语言中,运行代码得到随机序列,在随机序列中进行抽取得到抽取结果,对抽取结果进行验收。如果不设置随机种子的值,系统根据时间选择随机种子的值,那么每次生成的随机序列因时间差异而不同。
然而,在实际应用过程中,现有技术中的随机种子不固定,运行代码生成的随机序列也不固定,会导致第一用户和第二用户分别在随机序列中抽取到的结果也不一样,会出现交付通过率低的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据抽检方法、装置、电子设备和可读存储介质。
依据本发明的第一方面,提供了一种数据抽检的方法,该方法包括:
获取数据,对所述数据进行处理得到随机种子,其中,所述随机种子由密码散列函数值获得;
将所述随机种子进行处理,生成序列信息;
在所述序列信息中进行抽取,得到数据抽检结果。
可选地,对所述数据进行处理得到随机种子包括:
对所述数据利用密码散列函数进行运算,得到密码散列函数值。
可选地,将所述随机种子进行处理,生成序列信息包括:
将所述随机种子输入到计算机编程语言,运行所述计算机编程语言得到随机序列,所述随机序列由所述序列信息获得。
可选地,所述得到数据抽检结果包括:
第一用户对所述数据抽检结果进行验收,得到验收结果,所述验收结果通过,所述第一用户将所述验收结果反馈给第二用户,第二用户再进行验收,验收可以一次性通过。
可选地,所述得到数据抽检结果还包括:
所述验收结果不通过,所述第一用户将所述验收结果反馈给所述第二用户。
可选地,所述得到数据抽检结果包括:
若所述第一用户和所述第二用户基于可信合作状态下,所述第一用户先对所述数据抽检结果进行验收,得到验收结果,所述第一用户将所述验收结果反馈给所述第二用户。
可选地,所述得到数据抽检结果还包括:
若所述第一用户和所述第二用户没有基于可信合作状态下,所述第一用户和所述第二用户每次交付时,各提供一个额外全新数据,并附在交接单上,其中,所述额外全新数据包括交付人姓名、时间、签字图像但不限于这些;其中,所述交接单是所述第二用户确认收到所述第一用户对所述数据抽检结果进行验收的数据的证明。
依据本发明的第二方面,提供了一种数据抽检的装置,该装置包括:
接收模块,用于获取所述数据,对所述数据进行处理得到随机种子,其中,所述随机种子由密码散列函数值获得;
生成模块,用于将所述随机种子进行处理,生成序列信息;
抽取模块,用于在所述序列信息中进行抽取,得到数据抽检结果。
依据本发明的第三方面,提供了一种数据抽检的电子设备,该电子设备包括:
处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现如第一方面所述的方法的步骤。
依据本发明的第四方面,提供了一种数据抽检的可读存储介质,该可读存储介质包括:
所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法的步骤。
本发明实施例提供的数据抽检的方法、装置、电子设备和可读存储介质,通过在双方进行验收前,所述第一用户和所述第二用户先确认所述待抽验数据,由所述第一用户对数据抽检得到的所述数据抽检结果进行验收,得到验收结果,所述第一用户将所述验收结果反馈给所述第二用户,所述第二用户再进行验收,这样不仅可以减少双方的交互成本,还能提高验收效率。利用所述密码散列函数对所述待抽验数据进行计算密码散列函数值,所述随机种子由所述密码散列函数值获得,将所述随机种子进行处理,生成序列信息,在所述序列信息中进行抽取,得到数据抽检结果;这样固定了所述随机种子,所述随机序列是固定的,所述数据抽检结果也是固定的有利于对数据质量进行准确的评价,提高交付的通过率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的
具体实施方式
。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例提供的一种数据抽检方法的步骤流程图;
图2是本发明实施例提供的一种数据抽检装置的框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的数据抽检方法、装置、电子设备及可读存储介质进行详细的说明。
本发明的第一实施方式涉及一种数据抽检方法,其流程图如图1所示,包括:
步骤101,获取数据,对所述数据进行处理得到随机种子,其中,所述随机种子由密码散列函数值获得;
需要说明的是,在本申请实施例中,乙方向甲方提供数据,甲方要对乙方提供的数据进行抽验,双方在进行抽验之前,需要先确认好要对哪些数据进行抽验,利用密码散列函数对待抽验的数据进行运算得到密码散列函数值,将密码散列函数值作为随机种子,利用计算机编程语言实现生成随机序列。
在本发明实施例中,数据可以是文本数据、音频数据、图像数据,包括但不限于这些。
在本发明实施例中,密码散列函数可以是MD5等具体的密码散列函数,本申请对此不做限定。
其中,密码散列函数的运算模型是:h=H(M)。其中,M是待处理的数据;H是单向散列函数,h是生成的密码散列函数值。其中H具有以下的单项性质:给定H和M,很容易计算h;给定h和H,很难计算M;给定H,要找两个不同的M,使得计算的h相同,在计算上是不可行的。
步骤102,将所述随机种子进行处理,生成序列信息;
需要说明的是,本申请实施例中,将所述随机种子输入到计算机编程语言中,运行所述计算机编程语言,将得到随机序列,这样固定了随机种子,那么生成的随机序列也是固定的。
其中,在实际的使用过程中,实现将随机种子生成随机序列的计算机编程语言有很多都可以支持,上述示例只是举例说明,本申请对此不做限定。
步骤103,在所述序列信息中进行抽取,得到数据抽检结果;
需要说明的是,本申请实施例中,假设要再10000条中抽取10条进行验收,则要生成长度为10000的随机序列,再从中选取前10大的数字,这样,每条数据被抽到的概率才是均等的。在此只是通过某种方式抽选出N个数据,抽选的方式可以是任意方式,上述示例只是举例说明,本申请对此不做限定。
本申请实施例中,某次小语种人工翻译,由于参与翻译人员过多、水平参差不齐,培训管理沟通成本高,在甲方要对乙方小语种的翻译结果进行数据抽验之前,双方需要先确认好要对哪些小语种翻译结果进行验收,之后由乙方进行数据的抽检,对得到的数据抽检结果进行验收,得到验收结果,验收结果是通过的,则甲方验收可以一次性通过。
其中,验收结果是不通过的,乙方将验收结果反馈给甲方。
本申请实施例中,以上操作基于甲乙双方互为可信的合作状态。
其中,甲乙双方没有基于互为可信的合作状态时,例如乙方对数据抽检结果进行验收,得到验收结果是不通过的,乙方对验收未通过的数据进行修改并重新提交,那么乙方再次重复数据抽检的步骤得到的将会是全新的数据抽检结果。
本发明实施例通过在双方进行验收前,所述第一用户和所述第二用户先确认所述待抽验数据,由所述第一用户对数据抽检得到的所述数据抽检结果进行验收,得到验收结果,所述第一用户将所述验收结果反馈给所述第二用户,所述第二用户再进行验收,这样不仅可以减少双方的交互成本,还能提高验收效率。利用所述密码散列函数对所述待抽验数据进行计算密码散列函数值,所述随机种子由所述密码散列函数值获得,将所述随机种子进行处理,生成序列信息,在所述序列信息中进行抽取,得到数据抽检结果;这样固定了所述随机种子,所述随机序列是固定的,所述数据抽检结果也是固定的有利于对数据质量进行准确的评价,提高交付的通过率。
本发明的第二实施方式涉及一种数据抽检装置,其流程图如图2所示,包括:
接收模块201,用于获取数据,对所述数据进行处理得到随机种子,其中,所述随机种子由密码散列函数值获得;
生成模块202,用于将所述随机种子进行处理,生成序列信息;
抽取模块203,用于在所述序列信息中进行抽取,得到数据抽检结果。
本发明实施例通过在双方进行验收前,确认所述待抽验数据,这样不仅可以减少双方的交互成本,还能提高验收效率。利用所述密码散列函数对所述待抽验数据进行计算密码散列函数值,所述随机种子由所述密码散列函数值获得,这样固定了所述随机种子,所述随机序列是固定的,所述数据抽检结果也是固定的有利于对数据质量进行准确的评价,提高交付的通过率。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:一种融合关系分析方法及系统