文件重要信息撷取方法

文档序号:7739 发布日期:2021-09-17 浏览:26次 英文

文件重要信息撷取方法

技术领域

本发明涉及一种文件重要信息的撷取,特别是涉及一种文件重要信息撷取方法。

背景技术

目前电子产品的设计及整合越来越复杂,各类零组件的产品规格书的数量大量时可能具有上千页,需要通过多个人员例如工程师巨细靡遗的去检视文件,因此必须费时相当多的时间甚至数周才能理解其产品规格或找出特定产品规格的信息,例如找出处理器(CPU)的产品规格或动态随机存取内存(DRAM)的产品规格并进行理解或找出特定规格信息,因此对于研发工作者来说是相当耗时耗工的事情。

而且,例如服务器产品的电路板布局导引(Layout Guideline)的资料做成,也非简单的资料拼凑,都是从各种产品规格手册(datasheet)的上千页的规格书中,根据我们要设计产品的功能、特征等等而撷取出来做成的信息。因此在设计电子产品的过程中,对于如何快速取得或分类信息以及取得文件重要的产品设计的信息就是一大难题。

发明内容

有鉴于先前技术所提出的问题,本发明提供一种文件重要信息撷取方法,予以解决产品规格资料如何快速撷取并分类信息以及取得产品规格重要信息的问题。

根据本发明的一实施例,提出了一种文件重要信息撷取方法,以一特定电子产品或一软件的至少一产品规格资料生成一组或多组建议信息,所述方法包括:建立该产品规格资料的项目和对应的该产品规格资料的一或多个资料特征;撷取该特定电子产品或该软件所对应的该产品规格资料的项目;撷取该产品规格资料的项目对应的该产品规格资料的该一或多个资料特征;根据该特定电子产品或该软件对应的该一或多个资料特征读取对应该特定电子产品或该软件的该产品规格资料;以及根据分析该特定电子产品或该软件对应的该产品规格资料的文字信息并分类,生成该一组或多组建议信息。

本发明的可能技术效果在于可以快速撷取产品规格书的规格内容,生成建议的信息,可以大幅减低对于产品规格书的所需阅读及整理时间,快速撷取产品规格书的信息,并减少因为阅读大量产品规格书撷取信息资料的出错几率与时间。本发明可以通过撷取产品规格书上的技术规格,能够直接撷取特定产品规格项目的技术规格并撷取出关键的信息,并可快速整理出各式各样产品规格书的信息。

为了能更进一步了解本发明为达成既定目的所采取的技术、方法及功效,请参阅以下有关本发明的详细说明、图式,相信本发明的目的、特征与特点,当可由此得以深入且具体的了解,然而所附图式仅提供参考与说明之用,并非用来对本发明加以限制者。

附图说明

图1呈现本发明一实施例所绘示文件重要信息撷取方法的细部流程。

具体实施方式

以下是通过特定的具体实施例来说明本发明所公开有关“文件重要信息撷取方法”的实施方式,本领域技术人员可由本说明书所公开的内容了解本发明的优点与效果。本发明可通过其它不同的具体实施例加以施行或应用,本说明书中的各项细节也可基于不同观点与应用,在不悖离本发明的构思下进行各种修改与变更。另外,本发明的附图仅为简单示意说明,并非依实际尺寸的描绘,事先声明。以下的实施方式将进一步详细说明本发明的相关技术内容,但所公开的内容并非用以限制本发明的保护范围。

为了更清楚的说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域通常知识及普通技能技术人员来说,在不付出过多努力的前提下,还可以根据这些附图获得其它的附图。

本发明公开一种文件重要信息撷取方法,所述方法可以根据资料库或服务器中建立的多个产品规格书的资料进而撷取想要或重要的信息,例如产品规格资料的图标(Figure)对应的信息、表格(Table)的信息、文本(Text)的信息、注意事项(Notes)的信息以及任何产品规格资料中的参考信息。本发明通过语言分析或文字分析进行对产品规格资料中的文字信息进行分类,除了可以撷取想要或重要的产品规格资料的信息,也可以将产品规格资料的相关信息整合,整理出文字段落、关键词、信息相关的程度或文字段落对应的参考信息的整体建议信息,参考信息例如是表格信息包含文字信息或段落文字信息。

本发明撷取产品规格资料的文字信息并进行整理,让用户可以实时性的进行产品规格资料的信息判断,根据整理的多个建议的产品规格资料的信息来判断,以决定撷取适当的产品规格资料信息来使用或做成特定的资料,例如电路板布局导引(LayoutGuideline)的资料、文字段落、文章或表格。本发明让用户可以大幅降低阅读产品规格资料的时间并快速取得产品规格资料的内容,或者撷取产品规格资料的重要文字段落或信息,可以轻易做成工作中供人阅读的书表资料或文章,减轻研发人员在研发过程中阅读大量资料的负担。

根据本发明的一实施例,请参阅图1,图1呈现本发明一实施例所绘示文件重要信息撷取方法的流程。本发明提供一种文件重要信息撷取方法,以一特定电子产品或一软件的至少一产品规格资料生成一组或多组建议信息,所述方法包括但不限于:步骤S101,去读取想要撷取的产品规格资料的项目。步骤S103,撷取产品规格资料的项目对应的产品规格资料的一或多个资料特征。步骤S105,根据一或多个资料特征读取对应的产品规格资料。步骤S115,分析对应的产品规格资料的文字信息并分类。步骤S117,生成一组或多组建议信息。

请继续参阅图1,本发明文件重要信息撷取方法可执行在电子装置内例如计算机,通过一计算机用户操作接口而点选所要撷取的产品规格资料的项目的程序操作接口。而且本发明文件重要信息撷取方法可撷取出例如动态随机存取内存的多个资料特征(依据程序操作接口)。

在一实施例中,本发明文件重要信息撷取方法可包括建立产品规格资料的项目和对应的产品规格资料的一或多个资料特征,让各式各样的产品规格书的项目及对应的资料特征可以内建于资料库或服务器的资料库中。

在一实施例中,产品规格资料的建立过程中,产品规格资料的项目例如是各厂商所提供的处理器或内存的规格书(datasheet)所具有的产品名称,以及对应规格书的资料特征予以建构出大资料量的产品规格资料。

在一实施例中,产品规格资料的项目以及资料特征所建构成的产品规格资料可以是整份电子文件或多份电子文件构成一份电子文件而构成。

因此在一实施例中,产品规格资料的项目可以做成程序接口的多个选单,而选择想要撷取的产品规格资料的项目,根据图1,即执行步骤S101,去读取想要撷取的产品规格资料的项目。

在一实施例中,通过程序选单的操作,可以选择一个产品规格资料的项目或一次选择多个产品规格资料的多个项目,单一产品规格资料内或多个产品规格资料之间的资料特征也可以相互链接。本实施例中,单一产品规格资料的项目以及对应的多个资料特征中,所述多个资料特征可以是单一产品规格资料的多个特征,可借程序选单来选择项目所对应的特征。

在一实施例中,当想要撷取产品规格资料的项目对应的资料特征时,即执行步骤S103,撷取产品规格资料的项目对应的产品规格资料的一或多个资料特征。根据程序选单的操作,选择根据处理器(CPU)的数量选为一个,每通道插槽数(Slot Per Channel)为两通道插槽,双线内存模块(Dual In-line Memory Module,DIMM)的形式为表面黏着技术(SMT),以及内存的形式为第五代双倍资料率同步动态随机存取内存(double data ratefifth-generation synchronous dynamic random-access memory,DDR5 SDRAM)。

在一实施例中,为了便于使用者直接撷取想要的产品规格资料,产品规格资料的一或多个项目的程序选单建立,是根据单一产品规格资料的项目或多个产品规格资料的项目及所对应的资料特征整合所获得。

经由多个选单接口的选择后,就可产生产品规格资料的项目所对应的资料特征,例如是以一表格及文字来呈现,且所呈现的是撷取出第五代动态随机存取内存根据处理器数量为一个、两通道插槽、表面黏着技术形式的多个资料特征,例如可以呈现信号群组(Siganl Group)例如为源同步信号(Source-Synchronous Signal)、源定时信号(SourceClocked Signal)、定时信号(Clocked Signal)或杂类信号(Miscellaneous Signal)的使用种类,上述信号的使用种类的个别类型,例如以所显现的次群组(Sub Group)资料特征来归纳。

因此根据图1,即继续执行步骤S105,根据一或多个资料特征读取对应的产品规格资料。

在一实施例中,步骤S105即以计算机程序抓取到产品规格资料的资料特征就开启对应的产品规格资料,其中资料特征例如产品规格资料中的图片、表格、表格中的文字、单字、文字段落、词汇、文章段落等等。

在一实施例中,读取对应的产品规格资料,即通过软件程序例如现有的文字处理软件(OFFICE)、可携式文件格式(Portable Document Format,PDF)软件或任何可以打开电子文件的软件于计算机接口中来开启产品规格资料,就可以进行后续的语言分析以及文字分类。根据图1,然后就可以根据上述撷取特定电子产品的项目以及对应的资料特征并读取产品规格资料后而继续执行步骤S115,分析对应的产品规格资料的文字信息并分类,将产品规格资料的信息整理并分类,且尤其是文字,以及执行步骤S117,生成一组或多组建议信息。

本发明进一步说明如下,请继续参阅图1,本发明文件重要信息撷取方法进而根据产品规格书的注意事项(Notes)生成多组建议信息(依据程序操作接口)。而且本发明文件重要信息撷取方法根据产品规格资料的建议信息,修正电路板布局导引资料的规格资料,以呈现正确的电路板布局导引资料(依据程序操作接口)。本发明也可将修正建议信息的规格资料更新至表格中(依据程序操作接口)。

在一实施例中,如果根据步骤S105,根据一或多个资料特征读取对应的产品规格资料,之后,还包括步骤S107,即读取对应特定电子产品或软件的产品规格资料后,分析判断产品规格资料中是否有对应的一或多个资料特征的文字信息,进而执行步骤S109,撷取产品规格资料的部分范围或特定章节的文字信息,例如是注意事项(Notes)的文字信息。如果执行步骤S107时判断产品规格资料中没有对应的资料特征的文字信息时,就执行步骤S119,继续判断产品规格资料中是否有对应的一或多个资料特征的文字信息,进行资料特征文字信息的持续搜寻,文字信息的搜寻也可以是通过搜寻算法达成,但不以此为限。

在一实施例中,于步骤S107中,判断产品规格资料中对应的资料特征文字信息例如是在产品规格资料中随机的在某页数的内容上开始搜寻资料特征的文字信息,或是在产品规格资料中的开头页数或尾端页数执行资料特征的文字信息的搜寻,而且均不以此限制,借以快速取得产品规格资料中资料特征的关键或重要的文字段落。

在一实施例中,如果执行步骤S107判断为是,就可以执行步骤S109,撷取产品规格资料的部分范围或特定章节的文字信息。此时的文字信息的信息已经可以是产品规格资料的局部重点或特定章节重点,如果要进一步撷取更仔细的内容,可以继续执行步骤S111到S113,步骤S111中,分析判断获取产品规格资料的部分范围或特定章节中是否有一规格资料图或一规格资料表,以及执行步骤S113,撷取规格资料图或规格资料表后,取得规格资料图或规格资料表,并根据规格资料图或规格资料表对应的文字信息撷取具有一或多个资料特征的文字信息,即从规格资料图或规格资料表可以撷取关键的规格资料例如产品重要参数以取得对应的资料特征的文字信息。

在一实施例中,执行步骤S111时,获取规格资料图可以是当搜寻到产品规格资料中具有产品的一张相关图片时就进行获取,或是可同时获取产品规格资料的多张相关图片。而且获取规格资料表时例如是搜寻到产品的规格、数据时就进行获取。另外执行步骤S113时,撷取规格资料图或规格资料表对应的文字信息中的资料特征文字信息,可以是搜寻规格资料图或规格资料表的编号而对应于文字段落编号或文字描述,以及搜寻规格资料表对应的规格、参数或数据予以对应到文字叙述。

在一实施例中,基本上不断的执行步骤S107、S109、S119、S111以及S113就可以撷取出多个产品规格资料的重要参数以及对应的资料特征的文字信息,换句话说,例如可以从执行步骤S105后,撷取特定产品规格资料的注意事项(Notes)的多项文字信息,经由执行步骤S115,分析对应的产品规格资料的文字信息并分类,再来执行步骤S117,生成多组的建议信息,就可以产生经过分类的文字信息,所述经过分类的文字信息是经由产品规格资料的注意事项(Notes)的资料撷取并进行文字撷取及分类而获得。

在一实施例中,如果生成一组或多组建议信息中如果对应于特定电子产品的产品规格资料时,还包括一电路板布局导引(Layout Guideline)资料的一修正建议信息。

因此,所述修正建议信息可以将产品规格建议修正的数值更新至电路板布局导引(Layout Guideline)资料里,电路板布局导引(Layout Guideline)资料可以包含图片、表格、文本、注意事项或参考资料,所述表格例如是产品规格资料中提供的规格对照表,甚至不排除是自行制作的表格,本实施例中将所述修正建议信息例如6.9mils的走线宽度(Trace Width)对应DIMM_2_DIMM修正为4mils,就可以通过本发明的方法快速且直接得知产品规格资料的建议信息,并迅速做成提供给其它用户阅读的资料例如电路板布局导引(Layout Guideline)资料。

在一实施例中,执行步骤S111以及步骤S113时,还包括对规格资料图或规格资料表作存储,例如存盘、复制、剪贴等等。

进一步的,本发明文件重要信息撷取方法可根据产品规格书的文本(Text)生成多组建议信息(依据程序操作接口)。而且呈现的文本的多组建议信息中,可撷取并生成目标重要信息(依据程序操作接口)。

在一实施例中,如果执行步骤S109、S111以及S113所获取的是产品规格资料的文本(Text)文字信息,可以同样的生成多组的建议信息,即步骤S117。根据多组的建议信息中,例如即有DIMM通孔样式(via pattern)的建议信息的条列信息,就根据该建议信息,撷取建议信息的条列信息,生成一目标重要信息,即可以将所述建议信息的内容填入表格予以形成所述目标重要信息,便于用户快速取得重要的产品规格资料的规格建议信息,例如得知孔径的使用大小。所述目标重要信息是可以提供给用户参阅、制作资料或电路布局软件使用的信息,但不以此为限。

在一实施例中,例如是使用于电路板布局导引资料而生成修正建议信息后,即步骤S117之后,还包括执行步骤S119,即继续判断产品规格资料中是否有对应的一或多个资料特征的文字信息,当又判断有资料特征的文字信息时借以再执行步骤S109、S111及S113,当执行步骤S119如果判断为否,则执行步骤S121,结束判断产品规格资料中对应的一或多个资料特征的文字信息。

在一实施例中,在步骤S115中,即根据分析特定电子产品或软件对应的产品规格资料的文字信息并分类的步骤中,其分类是以自然语言处理(Natural LanguageProcessing,NLP)算法或机器学习(Machine Learning ML)算法分析文字信息并分类。

〔本发明的可能技术效果〕

本发明的可能技术效果在于可以快速撷取产品规格书的规格内容,生成建议的信息,快速撷取产品规格书的信息,并可以大幅减低对于产品规格书的所需阅读及整理时间,除了生成产品规格的建议信息以外,更可产生产品规格的重要运用的信息,减少因为阅读大量产品规格书撷取信息资料的出错几率与时间,以及减少所做成产品规格的重要运用资料的出错几率。

本发明可以通过撷取产品规格书上的技术规格,能够直接撷取特定产品或软件规格项目的技术规格并撷取出关键的信息,可整理出各式各样产品规格书的信息或做成产品规格重要的规格资料。

最后需要说明的是,于前述说明中,尽管已将本发明技术的概念以多个示例性实施例具体地示出与阐述,然而在此项技术之领域中具有通常知识者将理解,在不背离由以下权利要求所界定的本发明技术的概念之范围的条件下,可对其作出形式及细节上的各种变化。

完整详细技术资料下载
上一篇:石墨接头机器人自动装卡簧、装栓机
下一篇:一种相似文本检索方法、装置、电子设备和存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!