本申请涉及一种基于深度学习的AR人像拍照方法和系统,其中,该方法包括:获取带有人像的图像,通过语义深度神经网络对带有人像的图像进行人体语义分割,得到语义mask;接着,通过带有深度分支的语义深度神经网络对带有人像的图像进行深度估计,得到人体像素的深度,确定图像中人像和虚拟内容的相对遮挡关系;最后,对语义mask进行腐蚀膨胀和高斯滤波处理,并通过导向滤波将已经确定相对遮挡关系的人像和虚拟内容进行融合,得到融合图像。通过本申请,解决了在对处于虚拟场景中的人物进行照相时,存在的人像被虚拟物体遮挡,导致用户体验差的问题,提升了图像质量,提高了用户体验感。