基于在线学习行为和深度神经网络的元认知能力评估模型
技术领域
本发明属于计算机应用
技术领域
,具体是涉及一种基于在线学习行为和深度神经网络的元认知能力评估模型。背景技术
在线学习打破了传统教育围墙式的固有环境,逐渐发展成为当前教育的重要形式。在线学习环境下学习者与教师通常是异步在线,这种情况大大减少了教师对学习者学习情况的有效监督。因此,学习者需要对个体与环境有清晰的认识,能够自主的对学习过程合理计划、监控与调节,从而实现有效的在线学习。元认知可以使学习者认识到自身认知水平和技能水平,是学习者进行有效在线学习的关键要素。然而,元认知属于个体内部的心理过程,在实践中难以对其进行直接的判断。通过人工智能深度学习技术构建元认知能力模型对学习者元认知准确评估,可以帮助学生成为更好的学习者。
元认知不容易观察和获取,而目前针对元认知能力模型的研究还是一个较新的研究领域,基本处于模型的理论研究阶段,缺乏有效的模型构建技术对其外显化。虽然已有研究者从学习行为分析的角度出发,对学习者的元认知策略进行了分析与研究,但主要还是基于传统的机器学习技术对行为进行挖掘,无法满足对学习者元认知能力的精准化、智能化评估。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种基于在线学习行为和深度神经网络的元认知能力评估模型。
为了达到上述目的,本发明提供的基于在线学习行为和深度神经网络的元认知能力评估模型具体包括以下步骤:
1)构建深度神经网络模型的S1阶段:以融合自注意力机制的双向门控循环单元构成双通道结构的深度神经网络模型;
2)获取在线学习行为数据并进行预处理的S2阶段:选定一门在线学习课程,首先从在线学习平台中获取学习者的基本行为数据,并按照平台记录的行为发生时间处理成行为序列,例如“签到”→“测验”→“观看视频”....。然后,设计爬虫程序获取讨论区的交互文本数据,对数据进行了去除特殊字符与停用词的预处理操作,此外,考虑到交互文本中蕴含的学习者认知水平特征会对行为序列产生影响,使用布鲁姆认知分类理论对交互文本进行人工分析,获取学习者的认知水平,例如,记忆、理解、应用、分析、评价和创造;最后,将数据集按照4:1的比例划分为训练集X(train)和测试集X(test);
3)对在线学习行为数据进行标签标注的S3阶段:有监督的深度神经网络需要有标签的数据集,因此要对收集的在线学习行为数据进行标签标注。通过对学习者发放具有较高信效度的元认知能力调查问卷,基于问卷分数将学习者分为“元认知能力较高者”和“元认知能力较低者”两个层次,并对应学习者的行为数据进行标签标注;
4)词向量训练的S4阶段:深度神经网络的输入是一组或多组多维特征,针对提取的交互讨论文本数据以及分析得出的认知水平特征,主要采用Word2Vec词向量工具对其进行训练,从而得到对应的交互文本向量和认知水平向量;针对行为序列数据,主要采用Item2Vec算法对其进行编码,从而得到对应的行为序列向量,并且将行为序列向量与认知水平向量与进行了融合得到更复杂特征的融合向量;
5)深度神经网络模型训练的S5阶段:采用不同的模型参数,将训练集X(train)分小批量多次输入到步骤1)所构建的深度神经网络模型中,对构建的模型进行训练;其中BiGRU中的更新门和重置门使用的是‘sigmoid’激活函数,在模型的输出时,使用的激活函数是‘sigmoid’,模型的优化器选择的是‘Adam’,使用的损失函数为交叉熵损失函数;
6)深度神经网络模型测试的S6阶段:将上述步骤2)得到的测试数据集X(test)输入到步骤5)已经训练好的深度神经网络模型中,获得学习者的学习行为数据的二分类结果;
7)学习者元认知能力的评估S7阶段:将上述步骤6)获得的二分类结果即为元认知能力所属层次的概率p,以中间值0.5为界限将学习者元认知能力层次分为元认知能力较高者和元认知能力较低者。
在步骤2)中所述的根据布鲁姆认知目标分类理论分析得到的认知水平具体表现为:记忆、理解、应用、分析、评价和创造;
在步骤4)中将行为序列向量V与认知水平向量C与进行了融合得到更复杂特征的融合向量M,其融合方式即为向量的拼接,具体计算如下:
M=contact(V,C)
其中,contact表示向量的拼接;
在步骤7)中对学习者元认知能力评估的效果衡量指标为:
表1、元认知能力评估模型效果衡量指标
TP(True Positive,简称TP)为该评估模型正确评估的正样本数;
FP(False Positive,简称FP)为错误分类的正样本数;
TN(True Negative,简称TN)表示正确分类的负样本数;
FN(False Negative,简称FN)表示错误分类的负样本数。
根据概论P进行元认知能力分层时,具体原则是,当概率值p>0.5时,则属于元认知较高者,当概率值p≤0.5时则属于元认知较低者。
本发明提供的基于在线学习行为和深度神经网络的元认知能力评估模型具体有如下有益效果:本发明提出的基于在线学习行为和深度神经网络模型可以自动化、精准化和智能化的的评估在线学习者的元认知能力。此外,在模型中采用Item2Vec算法对行为序列数据进行向量化表示,能够保留行为数据的内在语义信息,并且考虑从多种在线学习行为数据提取元认知特征能够实现更精准的元认知能力评估。基于本发明能够实现更准确、直观的表示在线学习者当前的元认知能力状态,以学习行为数据外显化学习者的元认知,为教师更好的实现分层教学提供了参考。
附图说明
附图1为本发明提供的解释发明内容基于在线学习行为和深度神经网络的元认知能力评估模型流程图;
附图2为本发明中所构建的深度神经网络模型示意图。
具体实施方式
下面结合附图以及具体实施对本发明做进一步的详细说明。
如图2所示,本发明提供的基于在线学习行为和深度神经网络的元认知能力评估模型,主要由是由融合自注意力机制(Self-Attention)的双向门控循环单元(BiGRU)构成的双通道结构形成;该方法能够根据学习者的在线学习行为对学习者元认知能力进行评估,主要是将学习者和元认知能力分为元认知能力较高者和元认知能力较低者。具体由输入层、向量层、特征提取层、特征融合层和输出层5个层次的网络组成,具体实施如下:
1)输入层:选定一批在线学习者,从MOOC在线学习平台中根据每位学习者的ID逐一提取其发生的基本学习行为,例如“登录”、“签到”等,按照行为发生的时间先后顺序整理成行为序列数据。同时借助Python+Selenium框架编写爬虫程序爬取学习者在课程讨论区发布的交互文本讨论数据,并根据布鲁姆认知分类理论对文本数据进行分析,得到其中蕴含的学习者的认知水平。最后将行为序列、认知水平和交互文本三类数据共同输入到模型中。
2)向量层:针对输入的数据,将其由非结构化的文本数据转化为计算机能够识别的空间向量表示形式。针对学习行为序列数据,采用Item2Vec算法将每一个行为ii转化为所对应的d维的行为向量vi∈Rd,针对每条行为序列数据Ii={i1→i2→…→in},将其对应的行为向量组成一个行为序列向量Vi∈Rn×d。对于认知水平首先进行One-hot编码,然后映射到高维的向量空间形成一个查找表,每一个认知水平的One-hot编码在查找表中对应一个d维的向量表示Ci∈Rd,本文在学习者当前的认知水平的基础上考虑学习者行为序列特征,将学习行为序列与当前认知水平进行融合得到融合特征向量Mi∈R(n+1)×d。针对交互文本数据,采用Word2Vec模型将n个词语组成的句子文本转化为d维的词向量表示Wi∈Rn×d。
3)特征提取层:主要由Self-Attention机制与BiGRU网络构成。Self-Attention机制能够更好的关注到行为序列数据中与元认知相关的重要学习行为序列或重要词语。针对向量层输出得到的两种向量Mi∈R(n+1)×d和Wi∈Rn×d,进一步输入到Self-Attention机制中,分别得到对应的注意力权重值,然后将注意力权重对向量进行加权,得到赋有注意力特征的向量Ni和Si。双向GRU网络能够较好的提取行为序列中的时间先后顺序以及交互文本中的上下文语义信息。将经过注意力机制层输出的向量Ni和Si进一步输入到BiGRU网络中,得到特征向量Ui和Gi∈Rk。
4)特征融合层:主要将双通道的Att-BiGRU模型提取的元认知特征向量Ui和Gi∈Rk进行融合,经过一个全连接层输出融合特征Z∈Rk。
5)输出层:根据特征融合层的输出,经过softmax函数最终输出学习者的元认知能力层次所属类别的概率p。概率值p>0.5时,则属于元认知较高者,当p≤0.5时则属于元认知较低者。
概率p的计算方式如下:
p=softmax(WcZ+bc)
最后利用真实标签,计算损失函数值,进而使用随机梯度下降算法进行参数优化。
损失函数计算方式如下:
其中,为学习者d的元认知能力属于类别j的概率。模型的训练目标就是最小化交叉熵损失函数。