本发明实施例公开了一种样本处理方法、装置、设备和介质,其中,方法包括:获取预设文本匹配模型的初始训练样本,并对所述初始训练样本中的查询文本进行聚类处理,其中,所述查询文本为输入至所述预设文本匹配模型中的关键字;根据聚类处理的结果及各初始训练样本的时间戳,对所述初始训练样本中负样本进行去重和修正,得到目标模型训练样本。解决了现有技术中采集到的预设文本匹配模型的训练样本数据中负样本标签错误及重复率高,导致样本数据质量低的问题,实现了根据初始训练样本中查询文本相似度及样本时间戳进行样本去重,提升预设文本匹配模型的训练样本的质量。