本申请实施例提供了一种基于神经网络模型的数据识别方法、装置、设备及介质,该方法涉及人工智能技术领域,该方法包括:获取待识别数据;基于待识别数据,通过各特征提取层,提取得到待识别数据分别对应于各特征提取层的输出特征;基于各特征提取层的输出特征,通过注意力网络,得到各特征提取层的权重,并基于各特征提取层的权重、以及各特征提取层的输出特征,得到待识别数据对应的数据特征;基于待识别数据对应的数据特征,得到待识别数据对应的识别结果。在本申请实施例中,注意力网络可以在特征提取层之间建立更加直接的连接,此时将有利于特征提取层之间梯度的传播,可以缓解梯度消失的问题。