晶圆测试机台及训练人工智能模型以测试晶圆的方法
技术领域
本案是关于半导体制造,尤其是关于晶圆的测试。
背景技术
稳态供电电流(Supply Current Quiescent,IDDQ)在互补式金属氧化物半导体(CMOS)电路测试中,是一种常见的用来侦测晶粒(die)是否故障(fault)的特征项。对于功能正确的晶粒,它们在不同笔测试型样间,电流的变异量(variation)会十分微小,也就是说,之于不同笔测试型样的IDDQ量测值,应该会趋近于单一晶粒电路的IDDQ平均值。传统上便是以单一的IDDQ阀值来决定晶粒是否故障。
然而,因为在互补式金属氧化物半导体电路中,晶体管的漏电流占了IDDQ主要的一部分,而制程变异(process variation)会导致漏电流变异,因此,受制程变异的影响,同一晶圆上的不同晶粒会有IDDQ值的变异。换言之,在传统IDDQ测试中使用单一的IDDQ阀值不符合实际的需求。
发明内容
鉴于先前技术的不足,本案的一目的在于提供一种晶圆测试机台及训练人工智能模型以测试晶圆的方法,以解决先前技术所遭遇的问题。
本案揭露一种晶圆测试机台,用来测试包含复数个晶粒的一晶圆。该晶圆测试机台包含一量测设备、一数据库、一储存电路,以及一计算电路。量测设备用来量测该些晶粒以得到每一晶粒的一量测值。数据库用来储存该些量测值。储存电路用来储存复数个程序指令或程序代码,以及储存用来测试该晶圆的一人工智能模型。计算电路耦接该储存电路及该数据库,用来执行该些程序指令或程序代码以执行以下步骤来训练该人工智能模型:从该些晶粒中决定一目标晶粒;根据该目标晶粒及一预设范围选择邻近该目标晶粒的复数个参考晶粒;产生一主要训练数据,该主要训练数据包含该目标晶粒的该量测值及该些参考晶粒的该量测值;产生一辅助训练数据,该辅助训练数据指示该些参考晶粒为一合格晶粒或一不合格晶粒;以及以该主要训练数据及该辅助训练数据训练该人工智能模型。
本案另揭露一种训练一人工智能模型以测试一晶圆的方法。该晶圆包含复数个晶粒。该方法包含:从该些晶粒中决定一目标晶粒;根据该目标晶粒及一预设范围选择邻近该目标晶粒的复数个参考晶粒;产生一主要训练数据,该主要训练数据包含该目标晶粒的一量测值及该些参考晶粒的该量测值;产生一辅助训练数据,该辅助训练数据指示该些参考晶粒为一合格晶粒或一不合格晶粒;以及以该主要训练数据及该辅助训练数据训练该人工智能模型。
本案的晶圆测试机台及训练人工智能模型以测试晶圆的方法将目标晶粒四周的晶粒纳入考虑,并且以人工智能模型来协助判断目标晶粒是否故障,所以相较于传统技术可以更准确且快速地找出故障的晶粒。
有关本案的特征、实作与功效,兹配合图式作实施例详细说明如下。
附图说明
图1为本案晶圆测试机台的一实施例的功能方块图;
图2为本案的人工智能模型及训练数据的一实施例的功能方块图;
图3为本案训练人工智能模型以测试晶圆的方法的一实施例的流程图;
图4显示一个包含复数个晶粒的晶圆;
图5为图2的人工智能模型内部架构的示意图;
图6为本案基于人工智能模型进行晶圆测试的流程图;以及
图7为本案训练人工智能模型以测试晶圆的方法的另一实施例的流程图。
具体实施方式
以下说明内容的技术用语系参照本技术领域的习惯用语,如本说明书对部分用语有加以说明或定义,该部分用语的解释系以本说明书的说明或定义为准。
本案的揭露内容包含晶圆测试机台及训练人工智能模型以测试晶圆的方法。由于本案的晶圆测试机台所包含的部分元件单独而言可能为已知元件,因此在不影响该装置实施例的充分揭露及可实施性的前提下,以下说明对于已知元件的细节将予以节略。此外,本案的训练人工智能模型以测试晶圆的方法的部分或全部流程可以是软件及/或韧体的形式,并且可藉由本案的晶圆测试机台或其等效装置来执行,在不影响该方法实施例的充分揭露及可实施性的前提下,以下方法实施例的说明将着重于步骤内容而非硬件。
图1为本案晶圆测试机台的一实施例的功能方块图。晶圆测试机台100包含量测设备110、数据库120、计算电路130,以及储存电路140。一个晶圆包含复数个晶粒。在被晶圆测试机台100测试之前,晶圆上的每个晶粒已经经过其他的测试机台的测试,而被判定为合格(passed)晶粒或不合格(failed)晶粒。合格晶粒是可以正常运作的晶粒,而不合格晶粒是无法正常运作的晶粒。量测设备110量测合格晶粒的目标特性,以得到每一合格晶粒的一个量测值。在一些实施例中,目标特性可以是前述的稳态供电电流,而量测值则是稳态供电电流的电流值。在其他的实施例中,目标特性可以是环形振荡器频率(ring oscillatorfrequency)、测热计值(thermal meter value),或是电压感测器值(voltage sensorvalue),而对应的量测值分别是频率、温度,以及电压。类似于稳态供电电流,环形振荡器频率、测热计值,或是电压感测器值也可以作为判断晶粒是否故障的特征项。本技术领域具有通常知识者知悉如何量测晶粒的稳态供电电流、环形振荡器频率、测热计值,以及电压感测器值,故不再赘述量测设备110的构造及操作细节。以下的说明以稳态供电电流为例,但本案不限于稳态供电电流。
数据库120储存量测设备110所量测或所输出的量测值,以及储存指示晶粒为合格或不合格的数据。储存电路140可以由挥发性记忆体及/或非挥发性记忆体实作,且储存电路140储存复数个程序指令或程序代码,以及储存用来测试晶圆的人工智能模型(AImodel)。计算电路130可以是具有程序执行能力的电路或电子元件,例如中央处理器、微处理器、微处理单元或图形处理单元(Graphics Processing Unit,GPU),其藉由执行该些程序指令或程序代码以训练该人工智能模型。一旦人工智能模型训练完成后,晶圆测试机台100即可利用该人工智能模型判断合格的晶粒是否故障。
图2为本案的人工智能模型及训练数据的一实施例的功能方块图。图3为本案训练人工智能模型以测试晶圆的方法的一实施例的流程图。以下的说明请参考图1至图3。
首先,计算电路130从一个晶圆的复数个晶粒中决定一个目标晶粒,再根据该目标晶粒及一个预设范围选择邻近该目标晶粒的复数个参考晶粒(步骤S310)。请参阅图4,图4显示一个晶圆400包含复数个晶粒。晶粒410、晶粒420及晶粒430可以是前述的目标晶粒,而区域415、区域425及区域435可以是前述的预设范围。在图4的范例中,预设范围为7x7的矩形(最多包含49个晶粒)且目标晶粒位于预设范围的中心;然而,本案的预设范围不限于7x7的矩形,也可以是其他的大小及形状,例如5x5的矩形或3x10的矩形。再者,目标晶粒也不限于位于预设范围的中心。
图4中的每一个以灰阶(不含白色)表示的方块代表一个晶粒,而空白的区域(包含但不限于白色的方块)代表该处没有晶粒或是该处的晶粒为不合格的晶粒。举例来说,区域415包含4个不合格晶粒及45个合格晶粒,位于晶圆400边缘的区域425包含3个不合格晶粒及33个合格晶粒,以及区域435包含5个不合格晶粒及44个合格晶粒。灰阶值可以代表晶粒的目标特性的量测值的大小,举例来说,灰阶值可以与量测值成正比。
步骤S310完成后(亦即目标晶粒及复数个参考晶粒被决定后),计算电路130根据该目标晶粒及该些参考晶粒的量测值产生主要训练数据202(步骤S320),也就是说主要训练数据202包含该目标晶粒的量测值及该些参考晶粒的量测值。举例来说,对应于区域415的主要训练数据202可以表示为(其中I(x,y)为目标晶粒的量测值,x及y为整数):
由于不合格晶粒没有量测值,所以步骤S320还包含以下的子步骤:以邻近的合格晶粒量测值的平均作为遗漏的量测值(步骤S325)。在一些实施例中,计算电路130计算遗漏的量测值的周围八个量测值的平均值,并且以该平均值作为该遗漏的量测值。举例来说, 其中I(p,q)为遗漏的量测值(p及q为整数,代表不合格晶粒的坐标),而当不合格晶粒的邻近合格晶粒不足八个时,则仅计算邻近合格晶粒量测值的平均。需注意的是,因为目标晶粒是预测的目标,所以计算电路130会将目标晶粒的量测值视为遗漏的量测值,并且以目标晶粒的周围的参考晶粒的量测值的平均作为目标晶粒的量测值。
接下来,计算电路130根据目标晶粒及参考晶粒是否为合格晶粒来产生辅助训练数据204(步骤S330)。辅助训练数据204指示该些参考晶粒为合格晶粒或不合格晶粒。举例来说,对应于区域415、区域425及区域435的辅助训练数据204如下所示(「1」代表不合格晶粒):
于主要训练数据202及辅助训练数据204产生之后,计算电路130以主要训练数据202及辅助训练数据204训练人工智能模型210(步骤S340),也就是将主要训练数据202及辅助训练数据204输入人工智能模型210。人工智能模型210包含特征萃取算法212以及机器学习算法模型214。
特征萃取算法212用来挑选主要训练数据202及辅助训练数据204中具代表性的特征值组(feature set)。特征萃取算法212除了能够降低过度拟合(over-fitting)的现象,也可以降低数学模型的复杂度。文献「L.C.Molina,L.Belanche,A.Nebot(2002).Featureselection algorithms:a survey and experimental evaluation.2002 IEEEInternational Conference on Data Mining,2002.Proceedings.」讨论数种特征萃取算法的范例,本技术领域具有通常知识者可以参考该文献来完成特征萃取算法212,故不再赘述。
机器学习算法模型214用来处理特征萃取算法212所产生的特征值组。本案所使用的机器学习算法可以包含贝叶斯脊回归(Bayesian Ridge Regression)算法、高斯过程回归(Gaussian Process Regression)算法、可调变分高斯过程(scalable variationalGaussian process)算法,或是卷积神经网络(Convolutional Neural Network,CNN)算法。因为卷积神经网络算法包含特征萃取的功能,所以当机器学习算法模型214所使用的算法是卷积神经网络算法时,可以省略特征萃取算法212(亦即特征萃取算法212被整合进卷积神经网络算法)。
图5为图2的人工智能模型210(例如深度学习算法模型)的其中一种内部架构的示意图。在图5的实施例中,人工智能模型210以深度学习算法模型实作,其中深度学习算法模型包含卷积神经网络算法模型216以及混合密度神经网络算法模型218。卷积神经网络算法模型216的各卷积层的滤波器个数可以任意设定。相较于图2,因为图5的深度学习算法模型采用卷积神经网络算法模型216,故图5的实施例可以省略图2的特征萃取算法212。
混合密度神经网络(Mixture Density Neural Networks,MDNN)算法模型218用来预测完整的机率分布。混合密度神经网络算法的大致架构与一般多层感知器(MultipleLayer Perceptron)一样,但混合密度神经网络算法除了全连接层(fully connectionlayer)之外,还会在最后接至三个独立的层(layer),分别为「Alpha(α)」、「Mu(μ)」和「Sigma(σ)」。在本案中,「Alpha(α)」可以被忽略。本案的混合密度神经网络算法所使用的损失函数(loss function)如下面的方程式所示。本技术领域具有通常知识者可以参考文献「Bishop,Christopher M.(1994).Mixture density networks.Technical Report.AstonUniversity,Birmingham.」及下方的损失函数来完成混合密度神经网络算法模型218。
主要训练数据202及辅助训练数据204被馈入人工智能模型210的卷积神经网络算法模型216的卷积层510,并且经过卷积层510的处理后被展开成一维张量(tensor),接着一维张量被输入至混合密度神经网络算法模型218的全连接层530,然后区分为两个独立的全连接层:全连接层(μ)540及全连接层(σ)550。在一些实施例中,如果主要训练数据202及辅助训练数据204各为一个NxN的矩阵(N为正整数),则卷积层510包含12个卷积核(kernel),其输出的特征映射(feature map)为12个N’xN’的矩阵(N'≤N);如此一来,一维张量的维度为12xN’xN’,全连接层530的维度为(12xN’xN’)x512,而全连接层(μ)540及全连接层(σ)550的维度皆为512x256。本技术领域具有通常知识者可以根据上述的实施例来实作人工智能模型210。
请参阅图3。步骤S340结束后,计算电路130在目前的晶圆上选取下一个目标晶粒,然后再次执行步骤S310至S340,直到目前的晶圆上的所有晶粒都曾被用作目标晶粒。于目前的晶圆的所有晶粒都曾被用作目标晶粒后,计算电路130可以从数据库120中选择下一个晶圆的量测值来继续执行步骤S310至S340。
在训练的过程中,人工智能模型210以目标晶粒的量测值作为目标平均值,来持续调整参数。经过训练后,人工智能模型210即可预测目标晶粒的量测值的阀值的范围,即平均值μ±设定系数x标准差σ,其中设定系数为可调整阀值范围的一参数,当设定系数为1,则μ-σ为下阀值,而μ+σ为上阀值。如果目标晶粒的量测值大于等于μ-σ且小于等于μ+σ,则目标晶粒被判定为非故障的晶粒。
请参阅图6,图6为本案基于人工智能模型进行晶圆测试的流程图。首先量测设备110量测晶圆的复数个晶粒的目标特性,以得到每一合格晶粒的量测值(步骤S610)。接着,计算电路130决定一目标晶粒,并根据该目标晶粒及一预设范围选择邻近该目标晶粒的复数个参考晶粒(步骤S620)。步骤S620与步骤S310相似,故不再赘述。接着,计算电路130产生主要测试数据(步骤S630),步骤S630包含子步骤S635。主要测试数据的格式与主要训练数据202相同。由于步骤S630及步骤S635分别与步骤S320及步骤S325相似,故不再赘述。接着,计算电路130产生辅助测试数据(步骤S640),辅助测试数据的格式与辅助训练数据204相同。由于步骤S640与步骤S330相似,故不再赘述。接着,计算电路130将主要测试数据及辅助测试数据输入已完成训练的人工智能模型210,以判断目标晶粒是否故障(步骤S650)。人工智能模型210以参考晶粒的量测值预测目标晶粒的量测值的阀值的范围,然后判断目标晶粒的量测值是否落于阀值的范围内。如果是,则人工智能模型210(或计算电路130)判断该目标晶粒非故障;如果否,则人工智能模型210(或计算电路130)判断该目标晶粒故障。
图7为本案训练人工智能模型以测试晶圆的方法的另一实施例的流程图。步骤S710、步骤S720、步骤S725、步骤S730分别与图3的步骤S310、步骤S320、步骤S325、步骤S330相似,故不再赘述。步骤S730的第一辅助训练数据即步骤S330辅助训练数据。在图7的实施例中,计算电路130更产生第二辅助训练数据(步骤S740),第二辅助训练数据指示该目标晶粒及/或该些参考晶粒是否位于该晶圆的边缘,或指示该些参考晶粒是否存在。举例来说,请参阅图4,因为区域415及区域435皆包含NxN个晶粒(合格或不合格),所以对应于区域415及区域435的第二辅助训练数据可以表示为(「0」代表该位置有晶粒):
另举例来说,因为区域425包含晶圆400的内部及外部,所以对应于区域425的第二辅助训练资料可以表示为(「0」代表该位置有晶粒,「1」代表该位置没有晶粒):
如以上的范例所示,当该目标晶粒及/或该些参考晶粒位于该晶圆的边缘时(如区域425所示),第二辅助训练数据包含两种数值(「0」及「1」);而当该目标晶粒及/或该些参考晶粒不位于该晶圆的边缘时(如区域415及区域435所示),第二辅助训练数据只包含一种数值(「0」)。
于主要训练数据、第一辅助训练数据及第二辅助训练数据产生之后,计算电路130以主要训练数据、第一辅助训练数据及第二辅助训练数据训练人工智能模型210(步骤S750)。
在另一个实施例中,图3的辅助训练数据可以指示该些参考晶粒为合格晶粒或不合格晶粒,及/或指示该目标晶粒及/或该些参考晶粒是否位于该晶圆的边缘。举例来说,请参阅图4,对应于区域415及区域435的辅助训练数据可以表示为(「0」代表该位置为合格晶粒,「1」代表为位置为不合格晶粒或没有晶粒):
另举例来说,对应于区域425的辅助训练数据可以表示为:
如以上的范例所示,本实施例将没有晶粒的位置视为不合格晶粒,换句话说,本实施例的辅助训练数据等效于图7实施例的第一辅助训练数据与第二辅助训练数据的联集。
因为晶圆上邻近的晶粒所受的制程条件近似,所以以局部范围内的晶粒而非整个晶圆中全部的晶粒来作判断更能准确地得到目标特性的量测值的阀值,可以减少误判的机率。举例来说,图4的晶粒410的IDDQ可能没有超过传统的IDDQ阀值,但与其四周的晶粒(即区域415中的参考晶粒)相比较其IDDQ值可能仍落于阀值的范围(即平均值μ±设定系数x标准差σ)之外。经实验发现,此类的晶粒410极有可能是故障的晶粒,然而传统的测试方法却无法发现晶粒410是故障的晶粒。
如前述的范例所示,主要训练数据及辅助训练数据是以矩阵或阵列的形式呈现,并且矩阵或阵列的元素的相对位置反应目标晶粒及参考晶粒在晶圆上的相对位置,换言之,矩阵或阵列的元素是依照目标晶粒及参考晶粒在晶圆上的位置来排列。如此一来,晶圆可以视为图像(每一个晶粒代表一个像素),而主要训练数据及辅助训练数据的元素可以模拟为图像的像素值。
在一些实施例中,主要训练数据及辅助训练数据对应于单一的电压及温度的组合,也就是说,主要训练数据及辅助训练数据是在单一的电压及温度组合下所量测得到。然而,因为晶粒的量测值与晶粒是否合格与电压及温度相依,因此,在其他的实施例中,主要训练数据及辅助训练数据可以对应于复数个的电压及温度组合。举例来说,如果有四个电压-温度的组合(例如两种温度搭配两种电压),则在图3及图7的实施例中,训练资料实际上包含四个主要训练数据及辅助训练数据的组合,每一组合对应于一个电压及温度的组合。
综上所述,本案将目标晶粒四周的晶粒纳入考虑,并且以人工智能模型来协助判断目标晶粒是否故障,可以更准确且快速地找出故障的晶粒。再者,经实验发现,以主要训练数据及辅助训练数据训练人工智能模型,比起单纯以主要训练数据训练人工智能模型可以得到更准确的结果。
由于本技术领域具有通常知识者可藉由本案的装置实施例的揭露内容来了解本案的方法实施例的实施细节与变化,因此,为避免赘文,在不影响该方法实施例的揭露要求及可实施性的前提下,重复的说明在此予以节略。请注意,前揭图示中,元件的形状、尺寸、比例以及步骤的顺序等仅为示意,系供本技术领域具有通常知识者了解本案之用,非用以限制本案。
虽然本案的实施例如上所述,然而该些实施例并非用来限定本案,本技术领域具有通常知识者可依据本案的明示或隐含的内容对本案的技术特征施以变化,凡此种种变化均可能属于本案所寻求的专利保护范畴,换言之,本案的专利保护范围须视本说明书的申请专利范围所界定者为准。
【符号说明】
100:晶圆测试机台
110:量测设备
120:数据库
130:计算电路
140:储存电路
400:晶圆
410,420,430:晶粒
415,425,435:区域
202:主要训练数据
204:辅助训练数据
210:人工智能模型
212:特征萃取算法
214:机器学习算法模型
216:卷积神经网络算法模型
218:混合密度神经网络算法模型
510:卷积层
530:全连接层
540:全连接层(μ)
550:全连接层(σ)
S310~S340,S610~S650,S710~S750:步骤
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:半导体装置以及测量处理系统