语义工程平台的构建方法及语义工程平台

文档序号:8296 发布日期:2021-09-17 浏览:33次 英文

语义工程平台的构建方法及语义工程平台

技术领域

本发明涉及计算机自然语言

技术领域

,尤其涉及一种语义工程平台的构建方法及语义工程平台。

背景技术

目前,现有的自然语言初等数学应用题求解技术,都是采用支持向量机等机器学习算法进行语义识别,没有“类人”的中间步骤,直接求解结果,结果也不尽如人意。而对于自然语言数学应用题类人机器求解方式,由于自然语言的表述形式几乎是无限的,因此对于语义处理问题而言,语义特征稀疏问题十分突出。这使得众多以数据为基础的机器学习算法对自然语言模型匹配无从下手。要解决这个问题,一要发展适应语义表示稀疏问题的新算法;二要建设语义工程平台积累语料和语义表示数据。

可见,如何构建语义工程平台以实现积累语料和语义表示数据,对于自然语言数学应用题类人机器求解具有重要意义。

发明内容

基于上述技术问题,本发明提出了一种语义工程平台的构建方法及语义工程平台,能够针对数学应用题类人求解实际问题,实现具体专门的语义、语料积累,构建了面向问题的语义工程平台,为实现真正的类人思维的求解提供数据基础。

本发明提供了一种语义工程平台的构建方法,所述方法包括:

从预设的数据集合中提取类人求解技术环节相关的语义工程问题,所述数据集合为自然语言初等数学应用题集合;

对提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,所述语义表示实例数据包括数据元变量的语料实例、变量之间的数值关系的语义实例、变量的逻辑关系的语义实例;

根据得到的语义表示实例数据构建面向问题的语义工程平台。

进一步地,所述对提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,包括:

识别语义工程问题中的数据元,并采用数据元变量表示识别出的数据元,数据元包含表征数字量的数字串和表征数据提问的汉字串;

提取所述数据元所处的上下文分词和语义预处理后的词汇流,根据得到的上下文分词和词汇流构建对应数据元变量的子句框架库与语义特征库;

识别语义工程问题中的上下文显式数值关系,所述上下文显式数值关系为数据元变量之间的显式数值关系,根据得到的上下文显式数值关系构建对应数据元变量的语义导图库;

识别语义工程问题中的数据元变量的逻辑关系,所述数据元变量的逻辑关系为变量之间的直接运算关系,根据得到的逻辑关系构建对应数据元变量的语义导图库;

所述子句框架库和语义特征库构成数据元变量的语料实例;

所述子句框架库和语义导图库构成变量之间的数值关系的语义实例;

所述子句框架库、语义特征库和语义导图库构成变量的逻辑关系的语义实例。

进一步地,所述识别语义工程问题中的数据元,并采用数据元变量表示识别出的数据元,包括:

对提取的语义工程问题进行分词处理,分词后通过量词识别、概念属性识别、概念关系识别、指代识别、时间分段识别和/或常识关系识别,依次识别出语义工程问题中的数据元;

根据预设的变量标签集合,选择当前场景单元框架涉及变量的核心词集合及其修饰词集合对识别出的数据元进行表示。

进一步地,所述语义导图库由多个封闭的语义圈组成,每个语义圈包含多条语义边,每条语义边对应一个数学公式。

进一步地,所述方法还包括:

按照预设的数据规则对变量标签、变量的上下文分词、语义圈、语义边以及数学公式进行数据文件配置。

进一步地,所述方法还包括:

当检测到重复命名的变量时,则根据相关语义圈相应变量名和语义特征库进行修正,或,增加场景修饰词汇以去除重名。

进一步地,所述方法还包括:

对语义边的数值运算关系进行匹配处理,以及

对同类型变量的数值关系补充和类似模型的类比关系扩展。

进一步地,所述方法还包括:

基于所述语义工程平台对待计算的初等数学应用题进行分析计算和结果输出。

进一步地,所述基于所述语义工程平台对待计算的初等数学应用题进行计算和结果输出,具体包括:

识别所述待计算的初等数学应用题中的数据元变量、上下文显式数值关系和数据元变量的逻辑关系;

根据识别出的数据元变量、上下文显式数值关系和数据元变量的逻辑关系进行语义表示实例数据匹配,生成待计算的初等数学应用题对应的动态语义圈,以描述数据元变量与相应公式变量的一一对应关系;

基于所述动态语义圈进行模拟求解计算。

本发明还提供了一种语义工程平台,所述语义工程平台采用如上所述的方法构建。

本发明提出的语义工程平台的构建方法及语义工程平台,通过对从自然语言初等数学应用题提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,并基于得到的语义表示实例数据构建面向问题的语义工程平台,能够针对数学应用题类人求解实际问题,实现具体专门的语义、语料积累,为实现真正的类人思维的求解提供数据基础。

进一步地,本发明构建的语义工程平台能够用可解释的中间步骤实现类人的求解过程,实现真正的类人思维,对在线教育辅助学生学习领域具有重要的应用价值。

附图说明

图1为本发明的语义工程平台的构建方法的流程图;

图2为本发明的语义工程平台的构建方法中步骤S12的具体实现流程图;

图3为本发明提出的数学应用题语义问题的分析示意图;

图4为本发明一个具体实施例中涉及的语义圈示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

语义表述的维度是十分广泛的,要积累语义表示数据,首先必须明确语义工程问题,并以问题为维度积累语义表示实例数据;然后用研究用自然语言处理的方法自动求解语义工程问题。本发明以自然语言初等数学应用题的类人求解为研究对象,凝练自然语言初等数学应用题的类人求解技术环节面临的语义工程问题,针对问题建设语义工程平台,积累语义表示数据,适时用算法自动处理。

请参照图1所示,其为本发明实施例提供的语义工程平台的构建方法的流程示意图。本发明实施例提供的语义工程平台的构建方法,具体包括以下步骤:

S11、从预设的数据集合中提取类人求解技术环节相关的语义工程问题,所述数据集合为自然语言初等数学应用题集合。

S12、对提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,所述语义表示实例数据包括数据元变量的语料实例、变量之间的数值关系的语义实例、变量的逻辑关系的语义实例。

数学应用题一般包含三种信息:一是数据元变量,就是表征数据的字符串,比如,整数或实数,或者“多少”、“多长”、“几”、“百分之几”等表征数据提问的汉字串,这些字符串可以用其他数据替换,形成解题方法相同,但答案不同的其他题目;二是变量之间的数值关系,比如,倍数关系、多少关系、倍数+多少关系、等值关系等,绝大多数情况用于从已知变量推导未知变量的值,也有用于表示方程未知变量的关系传递;三是变量的逻辑意义,比如,产量、效率、时长、距离和速度等,逻辑意义的背后蕴含着变量的计算公式或方法。

本发明实施例,通过从具体应用问题的解决技术环节进行语料和语义分析得到上述三种信息,以实现对语义、语料积累。

S13、根据得到的语义表示实例数据构建面向问题的语义工程平台。

本发明提出的语义工程平台的构建方法及语义工程平台,通过对从自然语言初等数学应用题提取的语义工程问题,从具体应用问题的解决技术环节进行语料和语义分析,得到语义表示实例数据,并基于得到的语义表示实例数据构建面向问题的语义工程平台,从底层根基建设展开语义工程应用的开发,能够针对数学应用题类人求解实际问题,实现具体专门的语义、语料积累,为实现真正的类人思维的求解提供数据基础。

如图2所示,在本发明实施例中,步骤S12中的对提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,具体包括以下步骤:

S121、识别语义工程问题中的数据元,并采用数据元变量表示识别出的数据元,数据元包含表征数字量的数字串和表征数据提问的汉字串。

本实施例中,所述识别语义工程问题中的数据元,并采用数据元变量表示识别出的数据元,具体包括:对提取的语义工程问题进行分词处理,分词后通过量词识别、概念属性识别、概念关系识别、指代识别、时间分段识别和/或常识关系识别,依次识别出语义工程问题中的数据元;根据预设的变量标签集合,选择当前场景单元框架涉及变量的核心词集合及其修饰词集合对识别出的数据元进行表示。

本发明使用了场景单元词汇序列文法描述输入词汇的场景单元框架,并实现了场景单元框架的匹配识别算法。场景单元框架对应语言表示背后蕴含的常识知识和语言表述的显式知识、信息和数据,对场景单元框架的识别意味者对应语言表述语义的识别。

S122、提取所述数据元所处的上下文分词和语义预处理后的词汇流,根据得到的上下文分词和词汇流构建对应数据元变量的子句框架库与语义特征库。

具体的,语义工程问题中的数据元,它包含所有表征数字量的数字串,和如“多少”、“多长”、“几”、“百分之几”、“几分之几”等表征数据提问的汉字串,这些数据元是可以用其他数值替换的,其求解方法不变。用数据元变量表示这些可变化的数据元,变量初始赋值为数据元的值。数据元处在上下文语义之中,本发明将数据元所处的上下文分词和语义预处理后的词汇流保存为数据元变量的子句框架库与语义特征库,用于固定数据元变量的语义。

S123、识别语义工程问题中的上下文显式数值关系,所述上下文显式数值关系为数据元变量之间的显式数值关系,根据得到的上下文显式数值关系构建对应数据元变量的语义导图库。

S124、识别语义工程问题中的数据元变量的逻辑关系,所述数据元变量的逻辑关系为变量之间的直接运算关系,根据得到的逻辑关系构建对应数据元变量的语义导图库。具体的,语义导图库由多个封闭的语义圈组成,每个语义圈包含多条语义边,每条语义边对应一个数学公式。

其中,子句框架库和语义特征库构成数据元变量的语料实例;子句框架库和语义导图库构成变量之间的数值关系的语义实例;子句框架库、语义特征库和语义导图库构成变量的逻辑关系的语义实例。

具体的,如图3所示,初等数学应用题的构成包括:数据元变量、变量之间的数值关系和变量的逻辑关系,语义问题涉及数据元识别、上下文显式数值关系的识别、数据元变量的逻辑意义识别。其中,上下文显式数值关系的识别,指由上下文明确指出的数据元变量之间的数值关系,由子句框架库和语义导图库综合描述。数据元变量的逻辑意义,蕴含变量之间是否有直接运算关系,由语义导图库、语义特征库和子句框架库共同综合表示。

需要说明的是,本发明实施例提供的子句框架库、语义特征库和语义导图库是设定的处理中间步骤,不同技术方案中这个中间步骤的设定可能不同。可理解的是,上述语义、语料积累可以归纳为两个问题:(1)数据元变量积累。(2)数据元变量蕴含公式的积累。在解决具体语义工程问题时,如图3所示,可以归纳为两个步骤(1)数据元变量匹配。(2)数据元变量蕴含公式的确定。

本发明提供的语义工程平台的构建方法还包括:在进行语料积累过程中,采用了语义语料全索引技术。具体的,本发明针对数学公式、语义边、语义圈和变量命名等问题求解环节积累相关上下文语料,并为语料建立语义工程平台属性全索引,方便了知识检索和回溯探究,减少了求解环节错误检测难度。而且,本发明遵循程序与数据分离的原则,使用大量数据配置文件提高平台系统的灵活性,通过按照预设的数据规则对变量标签、变量的上下文分词、语义圈、语义边以及数学公式进行数据文件配置,针对每种数据配置文件都配备了格式和内容对应的机器识别算法,这些数据配置文本文件格式识别算法整体上构成了配置文件格式识别技术系列。

下面通过具体实施例对数学公式、语义边、语义圈和变量命名等问题求解环节积累相关上下文语料实例积累进行解释说明。

1.数学公式积累

数学公式库由6元组<ID,MK,NA,BL,TZ,GS>的集合组成,其中ID是公式标识,MK是库特征,NA是公式名称,BL是公式的变量表,TZ是相应变量表的变量特征表,GS是公式的表述形式。其中,变量的命名规则是修饰语在前,核心词在后;数学操作符号使用双写形式,这样便于语义识别,如表1所示。

表1:数学公式表

本发明对300多道初等数学应用题进行测试,从测试结果来看,数学公式的使用数量是有限的,大约50多条,涉及等量赋值、加、减、乘、除运算以及三角形、正方形、长方形和梯形面积计算等。数学公式积累的关键在于和语义边对应关系的确定,单方面地扩充数学公式的集合没有意义。

2.语义边积累

语义边是体现数学计算关系的一组有语义的变量。比如,长度、速度和时长,总长度(AU┐A)、A部分长度和┐A部分长度。每条语义边对应相应的数学公式,体现其数学意义。语义边由四元组<ID,EQU_ID,DMVT,EQVT,XPIM>构成,其中,ID是语义边标识,EQU_ID是此语义边对应的数学计算公式标识,DMVT是数据元变量表,EQVT是对应的公式变量表,XPIM是显式表述或者隐含意义。语义边的实例如下表2所示:

表2:语义边表

3.语义圈积累

语义圈定义为紧密关联的数据元变量集合,描述为五元组<ID,VarNum,VarTable,EquNum,EquTable>的集合,其中ID为语义圈标识,VarNum为语义圈数据元变量的个数,VarTable为数据元变量表,EquNum为语义边的个数,EquTable为语义边表。比如,往返距离问题的语义圈描述如下:

1

10

距离,去::时::距离,回来::时::距离,去::时::速度,去::时::时间,回来::时::速度,回来::时::时间,往返::距离,往返::速度,往返::时间,

9

9::距离,去::时::距离=-左端,右端

9::距离,回来::时::距离=-左端,右端

1::去::时::距离,去::时::速度,去::时::时间=-长度,效率,时间

1::回来::时::距离,回来::时::速度,回来::时::时间=-长度,效率,时间

1::往返::距离,往返::速度,往返::时间=-长度,效率,时间

6::去::时::距离,回来::时::距离,往返::距离=-A部分,B部分,总量

6::去::时::时间,回来::时::时间,往返::时间=-A部分,B部分,总量

3::往返::距离,2,去::时::距离=-1变量,倍数,2变量

3::往返::距离,2,回来::时::距离=-1变量,倍数,2变量

如图4,为本发明语义圈示意图,如图4所示,可以看出:(1)只有数值的多少(和差)和倍数(积商)变量关系,才有必要显式文字描述;上述距离、速度、时间关系,往返距离和来/去距离的关系,距离和来/去距离的关系都是隐式表述,不会反应到文字描述上。(2)显式数值关系都是同类型核心概念变量或者常数/倍数变量关系。题目表述的变化在于同核心概念变量的显式数值关系的表述。拓展不同的显式数值关系表述就可以实现题型的各种变化。

4.变量上下文积累

变量上下文库由四元组<ID,CNUM,TVAR,TCTX>的集合,其中ID为变量ID,CNUM是上下文内容信息条数,TVAR是变量表,TCTX是上下文信息表。下面是变量“距离”和“去::时::速度”的上下文信息:

1

2

距离||205,

学校::离::目的地::有::XX::千米::

2

3

去::时::速度||206、219,

去::时::每::小时::行::XX::千米::

一辆::汽车::上::山::每::小时::行::XX::千米::

5.变量标签积累

本发明能够规范表示变量的标签,比如,核心词:产量、距离、长度,时间、时长,速度、效率;修饰词:计划、原来,实际、现在,总,等词汇;统一构成标签集合,为机器自动变量命名奠定基础。变量名中冒号隔离的单元作为标签。

本发明实施例提供的语义工程平台的构建方法还包括对语料的内部管理。包括变量命名、变量查重、变量别名、语义圈识别和数值运算关系语义边处理等环节,具体如下:

1.变量命名

根据积累的变量标签集合,选择场景单元框架涉及的变量的核心词集合及其修饰词集合。比如,“学校离目的地有8千米,去时每小时行5千米,回来时每小时行4千米,往返平均每小时行多少千米?”,四个变量分别命名为:两::地::距离、去::时::速度、返回::时::速度和往返::平均::速度。

2.变量查重

当检测到重复命名的变量时,则根据相关语义圈相应变量名和语义特征库进行修正,或,增加场景修饰词汇以去除重名。

本实施例中,根据命名规则命名的变量可能重名,这时候要根据语义圈相应变量名和语义特征总表进行修正,也可以增加场景修饰词汇去除重名的情况。

3.变量别名

语义圈可以有多种场景,不同场景中变量名可能不同,对于语义圈变量而言,他们是别名,背后的计算规则和方法完全相同。比如,下面的变量上下文中:

4

4

往返::速度||208、221,往返::平均::速度||423,

往返::平均::每::小时::行::XX::千米::

求::汽车::上::山::下::山::平均::速度::

求::这::辆::汽车::往返::平均::速度::是::XX::

其中,子句框架423的变量“往返::平均::速度”就是子句框架208和221的变量“往返::速度”的别名。

4.语义圈识别

若已知问题的变量都在一个语义圈变量集合内包含,则该语义圈被识别出来;若已知问题的变量都在一个语义圈常识规则的表达范围,而数值传递公式不在这个语义圈表达范围,则向这个语义圈增加数值传递规则公式,且识别出该语义圈。语义圈识别的关键是识别问题变量和语义圈变量的语义对应关系,以及常识规则和数值传递规则的对应关系。

5.变量概念识别

变量概念的识别依靠的是特征属性的综合分析。比如,距离、路程、长度,速度、效率、密度,时间、时长、次数,倍数,疑问词(多少)等的识别,以及概念属性:总量(不变)/总量(变化)、时间先后(计划/实际)等的识别。

a.量词识别

依据数值后的量词识别变量概念。比如距离的量词为公里和千米等;时间的量词是小时和分钟等;速度的表达复杂一些,以特征词“每”开头的时间量词和距离量词的组合表达。依据量词的识别,对变量概念有一个类别层次上的认识。

b.概念属性识别

一般而言,距离数值变量最近的一个名词,表示了变量的概念属性。比如,“100立方米的正方体”,“正方体”是距离数据元“100立方米”最近的一个名词,表示了类别为体积的概念属性为正方体。

c.概念关系识别

可以设计如下格式的概念属性关系常识描述文件:

1 ///序号

2 ///描述条目的个数

烟囱、 ///宏观概念

表面积、;截面边长、;长、;///包含的属性概念

在确定题目中包含宏观概念和属性概念之一的情况下,确定含有属性概念的数据元素具有相应的宏观概念约束。比如,“有一个长2米的铁皮烟囱”,数据元素“2米”的属性概念为“长”,宏观概念为“烟囱”。

d.指代识别

可以设计如下格式的指代关系常识描述文件:

1

长方体、钢材、

方、钢、

2

长方体、钢材、

钢材、

对应原题目指代实例有“一段长方体钢材,……,这块方钢重多少?”和“……,锻成……长方体钢材,锻成的钢材有多长?”通过指代关系确定数据元素“多少”和“多长”的概念属性和关系。

e.时间分段识别

使用时间特征词,对于数据元变量的时间属性进行区分。比如,如下“总分分”结构的关键词列表:

总:计划、打算、筹划、设想、盘算、

分:了、

分:余下、剩余、剩下、剩下的、

如下“总分分总”结构关键词列表:

总:TIME-MK、

分:前、

分:后、

总:求、问、TIME-MK、

时间分段识别除了时间属性识别以外,还蕴含着常识关系识别,即总时间等于分时间之和。

f.常识关系识别

常识特征词一般是语义段(用符号和前后变量划分)中含有的关键词,比如,“前/后”、“了”和“计划/剩余”等。确定常识关系的途径除了前述的子句框架方式(用子句的模式匹配)直接定义和概念属性推导方式之外,还有特征模式识别方式,比如,特征关键词“照这样计算”蕴含常识关系前后2个概念的速度和效率相同;特征模式“钢坯…锻…钢材”,蕴含钢坯和钢材前后2个概念的体积、重量和密度属性相同。

进一步地,所述方法还包括其他平台管理内容,具体如下:

第一、对语义边的数值运算关系进行匹配处理,比如,差和关系、倍比关系识别所需要的变量匹配,语料积累,上下文词汇次序等;

第二、知识学习和表达补充:比如,对同类型变量的数值关系补充和类似模型的类比关系扩展等。

在本发明的另一个实施例中,所述方法还包括基于所述语义工程平台对待计算的初等数学应用题进行分析计算和结果输出。

进一步地,所述基于所述语义工程平台对待计算的初等数学应用题进行计算和结果输出,具体包括以下步骤:

识别所述待计算的初等数学应用题中的数据元变量、上下文显式数值关系和数据元变量的逻辑关系;

根据识别出的数据元变量、上下文显式数值关系和数据元变量的逻辑关系进行语义表示实例数据匹配,生成待计算的初等数学应用题对应的动态语义圈,以描述数据元变量与相应公式变量的一一对应关系;

基于所述动态语义圈进行模拟求解计算。

本发明在解决具体语义工程问题时,可以归纳为两个步骤(1)数据元变量匹配。(2)数据元变量蕴含公式的确定。

数据元变量匹配指的是在题目上下文中明确数据元的位置及其匹配的语义特征库中的变量。数据元的位置相对比较容易识别,即数字串和表征数据提问的汉字串。匹配语义特征库中的变量需要一定的上下文实例积累,然后用机器学习算法进行分类预测。除了要克服单个数据元变量匹配中的小样本多分类的语义稀疏问题,还要考虑题目所有数据元变量的组合逻辑意义的匹配问题。也就是说,除了子句,还要考虑题目全文的逻辑意义。本发明实施例中,匹配单个数据元变量上下文后,还包括匹配题目中其他数据元变量上下文,选择所有匹配数据元变量在一个逻辑语义圈中的匹配对应关系对数据元变量进行命名。

语义导图由许多封闭的语义圈组成,每个语义圈包含多个语义边,每条语义边对应一个数学公式计算操作,比如,速度*时长=距离,或者赋值操作等。明确了题目中数据元集合所在的语义圈和数据元变量的对应关系,就蕴含找到了求解所需要的数学公式集合,下一步只要基于所述动态语义圈进行模拟求解计算,以寻找公式匹配的最少求解次序进行计算即可。

下面通过一个具体示例对采用语义工程平台对待计算的初等数学应用题进行类人求解进行说明。

类人求解实例

“公园南面要修一道长30米,宽0.24米,高5米的围墙。如果每立方米用砖500块,共需要多少块砖?”

A.变量概念识别

分词后,通过量词识别、概念属性识别、概念关系识别、指代识别或者时间分段识别,依次识别出用关键语义词组成的数据元变量名,得到如下结果:

长::围墙::长度(30米)

宽::围墙::长度(0.24米)

高::围墙::长度(5米)

砖::体积::个数::密度(500)

总:围墙::砖::个数(多少块)

B.常识关系识别

这个问题蕴含的常识关系有两个:

长方体长**长方体宽**长方体高-=长方体体积

长方体体积**密度(个数/体积)-=总砖个数

注:依据长、宽、高的表述特征可以推断围墙是长方体。

C.动态语义圈

依据题目表述的数值关系和蕴含的常识关系,生成系统运行时参照的动态语义圈:

21::长::围墙::长度,宽::围墙::长度,高::围墙::长度,围墙::体积=-长方体长,长方体宽,长方体高,长方体体积

22::围墙::体积,砖::体积::个数::密度,总::围墙::砖::个数=-体积,密度(个数/体积),个数

注:其中“21”和“22”表示了相应公式ID号;“=-”符号前部是数据元变量列表,后部是规则公式的变量列表;动态语义圈描述了数据元变量与相应公式变量的一一对应关系。

D.模拟运行求解

平台对依据公式知识表示的求解规则列表进行遍历,满足动态语义圈中的语义边激活条件的变量集合,对应变量概念识别中的数值取值,采用求解规则中的计算公式进行计算求解。问题疑问变量被赋值后,所有有后续计算的步骤被保留,删除中断的无意义运算步骤,输出系统模拟运行的求解步骤和结果。

比如,上述实例中,依据语义边1中公式21,可以计算出:

长::围墙::长度**宽::围墙::长度**高::围墙::长度-=围墙::体积

这又使得语义边2中公式22被激活,可以求解出:

围墙::体积**砖::体积::个数::密度-=总::围墙::砖::个数

“总::围墙::砖::个数”为疑问变量,所以问题求解成功,输出求解步骤22、21和运算结果。

与直接机器学习的技术路线相比,本发明方案可以用可解释的中间步骤实现类人的求解过程,实现真正的类人思维,在在线教育辅助学生学习领域会有应用价值;与依存语法等语料库建设和词典建设的技术方案,本发明更针对数学应用题类人求解的实际问题的解决,不像语料库和词典建设那样,功能单一,只关心通用使用价值,而是针对数学应用题类人求解实际问题,分析求解的需要,设计具体专门的语义语料积累、分析和管理功能。对于自然语言复杂语义工程类问题,本发明方案是从基础做起,扎实推进的渐进式、增量式解决方法。

此外,本发明还提供了一种语义工程平台,所述语义工程平台采用如上所述的方法构建。

本发明提出的语义工程平台的构建方法及语义工程平台,通过对从自然语言初等数学应用题提取的语义工程问题进行语料和语义分析,得到语义表示实例数据,并基于得到的语义表示实例数据构建面向问题的语义工程平台,能够针对数学应用题类人求解实际问题,实现具体专门的语义、语料积累,为实现真正的类人思维的求解提供数据基础。

进一步地,本发明构建的语义工程平台能够用可解释的中间步骤实现类人的求解过程,实现真正的类人思维,对在线教育辅助学生学习领域具有重要的应用价值。

上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

完整详细技术资料下载
上一篇:石墨接头机器人自动装卡簧、装栓机
下一篇:文本可读性评价方法、计算机设备及计算机存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!