本申请提供一种机器翻译结果的评估方法、装置、设备及存储介质,涉及自然语言技术领域。该方法包括:获取多个机器系统对同一个源语言语料分别进行翻译后得到的目标语言语料;根据各机器系统的目标语言语料以及参考语言语料,确定各机器系统的实际匹配分数;根据各机器系统的实际匹配分数,确定该参考语言语料中各语义单元的第一困难权重;根据目标机器系统的目标语言语料中各语义单元是否存在于该参考语言语料中,得到该目标机器系统的目标语言语料中各语义单元的第二困难权重;根据第一困难权重以及第二困难权重,确定该目标机器系统的翻译结果的评估分数。应用本申请实施例,可以提高对机器翻译结果进行评估的准确性。