检索用资料信息存储装置
本申请是申请日为2018年5月7日、申请号为201880035902.5、发明名称为“检索用资料信息存储装置”的申请的分案申请。
技术领域
本发明涉及一种检索用资料信息存储装置。更详细而言,本发明涉及一种检索用资料信息存储装置,其能以有效检索简报资料各页的方式有效建议与各页相关的检索用语,然后使各页相关的信息与各页相关的检索用语相关联并存储。
背景技术
在日本特开2019-16355号公报中公开了一种检索信息管理装置、检索信息管理方法及检索信息管理程序。这样在各种资料中使进行检索的检索用语相关联很常用。用户可通过使用检索用语寻找适合的资料。另一方面,各资料所附的检索用语不一定适用于检索,因此,希望能建议适用于检索的检索用语并可根据用户的意图。
现有技术文献
专利文献
专利文献1:日本特开2019-16355号公报
发明内容
发明所欲解决的课题
本发明目的在于提供一种系统,其可适当地建议关于资料各页的检索用语的候选。本发明目的在于提供一种检索用资料信息存储装置,其能以有效检索资料各页的方式,使各页相关的信息与各页相关的检索用语相关联并存储。
解决课题的技术方案
本发明基本上是基于以下的知识:在提取资料各页所包含的用语作为关键字,并提取与关键字相关的主题词之后,显示评分高的主题词,由此可建议适用于资料各页的检索用语的候选。
本发明涉及检索用资料信息存储装置。
此装置是凭借计算机的处理装置,其包含:用语提取手段3、关键字存储手段5、关键字提取手段7、主题词存储手段9、主题词提取手段11、检索用语候选提取手段13、检索用语候选显示手段17、检索用语输入手段19、资料检索信息存储手段21。各手段是凭借计算机的手段,通过硬件与软件的协同合作通而达成。
用语提取手段3是用于提取资料中用语的手段,所述资料中用语是资料的某一页所包含的用语。
关键字存储手段5是用于存储用语的手段,所述用语是成为与资料中用语相关联的关键字。
关键字提取手段7是用于使用用语提取手段3所提取的资料中用语,从关键字存储手段5提取多个与资料中用语相关联的关键字的手段。
主题词存储手段9是用于存储与关键字相关联的主题词的手段。
主题词提取手段11是用于使用关键字提取手段7所提取的多个关键字,从主题词存储手段9提取与关键字相关联的主题词的手段。
检索用语候选提取手段13是用于从主题词提取手段11所提取的主题词及关键字提取手段7所提取的多个关键字,提取资料的某一页的检索用语的候选的手段。
检索用语候选显示手段17是用于将检索用语候选提取手段13所提取的检索用语的候选显示于显示部15的手段。
检索用语输入手段19是用于接收指示在显示部15所显示的检索用语候选中的检索用语的输入。
资料检索信息存储手段21是用于使通过检索用语输入手段19所输入的检索用语与资料的某一页相关的信息相关联并存储的手段。
所述检索用资料信息存储装置也可进一步具有分类语存储手段25、分类语提取手段27。
分类语存储手段25是用于存储与主题词相关联的分类语的手段。
分类语提取手段27是用于使用主题词提取手段11所提取的主题词,从分类语存储手段25提取与主题词相关联的分类语的手段。
接着,此检索用资料信息存储装置的检索用语候选显示手段17进一步将分类语提取手段27所提取的分类语作为检索用语的一个候选而提取。
所述检索用资料信息存储装置中,关键字存储手段5可使多个关键字与个自的关键字分数相关联并存储,
关键字提取手段7可提取多个关键字,并同时提取个自的关键字分数。
所述检索用资料信息存储装置中,
主题词存储手段9也可使主题词与个自的主题词分数相关联并存储,
主题词提取手段11也可将关键字提取手段7所提取的多个关键字中的分数较高的预定个数关键字(一个或二个以上)作为主题词有力候选,并从主题词存储手段9提取与预定个数(一个或二个以上)主题词有力候选相关联的主题词,
检索用语候选提取手段13也可在将关键字提取手段7所提取的多个关键字中分数较高的预定个数关键字(一个或二个以上)作为检索用语的候选而提取的同时,使用关键字的分数及主题词的分数,从主题词提取手段11所提取的主题词提取预定个数主题词(一个或二个以上)作为检索用语的候选。
所述检索用资料信息存储装置中,
检索用语候选显示手段17可在将作为检索用语的候选所提取的预定个数(一个或二个以上)的关键字,及作为检索用语的候选所提取的预定个数(一个或二个以上)的主题词作为检索用语的候选而显示于显示部15的同时,将关键字提取手段7所提取的多个关键字中未作为检索用语候选提取者,及主题词提取手段11所提取的主题词中未作为检索用语候选提取者,作为检索用语的予备候选而显示于显示部15,
检索用语输入手段19,
对于检索用语的予备候选,在接收到指示作为检索用语的输入时,将检索用语的予备候选作为检索用语,
对于作为检索用语的候选而显示者,除了接收到指示不作为检索用语的输入者以外,也可将其作为检索用语。
本发明也提供用于使计算机作为下述手段而发挥功能的检索用资料信息存储用程序或存储有此程序的计算机可读取记录媒体。
所述手段包括:
用语提取手段3,提取资料中用语,即资料的某一页所包含的用语;
关键字存储手段5,存储成为与资料中用语相关联的关键字的用语;
关键字提取手段7,使用用语提取手段3所提取的资料中用语,从关键字存储手段5提取多个成为与资料中用语相关联的关键字;
主题词存储手段9,存储与关键字相关联的主题词;
主题词提取手段11,使用关键字提取手段7所提取的多个关键字,从主题词存储手段9提取与关键字相关联的主题词;
检索用语候选提取手段13,从主题词提取手段11所提取的主题词及关键字提取手段7所提取的多个关键字,提取资料的某一页的检索用语的候选;
检索用语候选显示手段17,将检索用语候选提取手段13所提取的检索用语的候选显示于显示部15;
检索用语输入手段19,接收输入所述输入是指示在显示部15所显示的检索用语候选中的检索用语;及
资料检索信息存储手段21,使通过检索用语输入手段19所输入的检索用语与资料的某一页相关的信息相关联并存储。
发明效果
本发明能提供可适当地建议资料各页数相关的检索用语候选的系统。本发明能提供一种检索用资料信息存储装置,其以可有效检索资料各页的方式,使各页相关的信息与各页相关的检索用语相关联并存储。
附图说明
图1是用于说明本发明的检索用资料信息存储装置的方框图。
图2是表示计算机的基本构成的方框图。
图3是表示本发明的系统例的概念图。
图4是简报资料的一页的例子。
图5是表示关键字存储手段的存储例的概念图。
图6是表示主题词存储手段的存储例的概念图。
图7是表示分类语存储手段的存储例的概念图。
图8是表示提取的(分类语)、主题词、关键字及资料中用语的概念图。
图9是显示画面的例子。
图10是用于说明本发明的检索用资料信息存储装置的使用例的流程图。
图11是用于说明本发明的检索用资料信息存储装置的使用例的概念图。
具体实施方式
以下使用图面说明本发明具体实施方式。本发明不限定于以下说明的方式,也包括本领域技术人员从以下方式在所知范围内进行适当修正者。
图1是用于说明本发明的检索用资料信息存储装置的方框图。此装置为凭借计算机的处理装置。计算机可为行动终端设备、台式个人计算机及服务器中任一个或两个以上的组合。这些通常以能通过互联网(内联网)等进行收发信息的方式连接。也可使任一台计算机具备一部分的功能等,并使用多台计算机分担功能。
图2是表示计算机的基本结构的方框图。如此图所示,计算机具有输入部31、输出部33、控制部35、运算部37及存储部39,各要件通过总线41等连接并以能进行收发信息的方式而构成。例如,存储部中可存储控制程序,也可存储各种信息。从输入部输入预定信息时,控制部读取存储于存储部的控制程序。接着,控制部适当地读取存储部所存储的信息并传递至运算部。另外,控制部将适当的输入信息传递至运算部。运算部使用接收到的各种信息进行运算处理,并存储于存储部。控制部读取存储部所存储的运算结果并从输出部输出。以这样的方式实行各种处理。实行该各种处理者为各手段。
图3是表示本发明的系统例的概念图。如图3所示,本发明的系统(包含本发明的装置的系统)也可以是包含与互联网或内联网43连接的行动终端设备45,及与互联网或内联网43连接的服务器47的系统。当然,单个计算机或行动终端设备也可作为本发明的装置而发挥功能,且也可存在多个服务器。
检索用资料信息存储装置1以容易检索用户所需要的信息的方式,使用于读取简报资料各页的信息(例如简报资料的识别编号与页码)与该页相关的一个或多个检索用语相关联并存储。检索用资料信息存储装置1也可包含任一个终端设备装置、计算机(或服务器)的存储部(存储装置)。另外,检索用资料信息存储装置也可包含数据库及数据库管理软件。在检索用资料信息存储装置中,也可以对每个检索用语进行简报资料页的分级或计分。例如考虑对多页进行与名为糖尿病的检索用语相关联并存储的情况。此情况下,对于名为糖尿病的检索用语,可将等级最高的页、等级次高的页、最高分的页及次高分的页的信息存储于存储部。
如图1所示,检索用资料信息存储装置1包含用语提取手段3、关键字存储手段5、关键字提取手段7、主题词存储手段9、主题词提取手段11、检索用语候选提取手段13、检索用语候选显示手段17、检索用语输入手段19、及资料检索信息存储手段21。各手段为凭借计算机的手段,并通过硬件与软件的协同合作而达成各处理。
用语提取手段3是用于提取资料中用语的手段,所述资料中用语是资料的某一页所包含的用语。资料的例子有所谓的简报资料。简报资料的格式没有特别限制。简报用软件的例子有微软公司(注册商标)PowerPoint(注册商标)、金山软件股份有限公司(注册商标)WPS OFFICE(注册商标)、Apache(注册商标)OpenOffice Impress(注册商标)、Keynote(注册商标)、Lotus Freelance(注册商标)、Illustrator(注册商标)、PDF(注册商标)及Prezi(注册商标)。资料的例子有例如用这些简报用软件中的任一者所制作的资料。简报用软件为例如能在画面等的显示部中,显示每页其内容的软件。
图4是简报资料的某一页的例子。如图4所示,在简报资料中包含制作者所输入的多个文本。用户可用眼睛识别多个文字。另一方面,计算机将用户所输入的文本、或文本相关的输入信息(文字大小、文字颜色、有无动画)等信息与文本共同存储。用语提取手段3的优选例为在提取文本时根据文本相关的输入信息(文字大小、文字颜色、有无动画)赋予文本的评分(分数)者。例如,文字越大,常是表示简报资料的内容者,故赋予高分。另外,例如附上红色系的文字颜色时或附上动画的文本为表示简报资料的内容较多者,故赋予高分。用语提取手段3预先存储有与文本相关联的效果的评分(分数),在提取用语时,读取作为文本相关联的分数,在计算后述分数时,可与其他分数加法运算或乘法运算并进行评分。
另一方面,用语提取手段3本身为公知技术。简报资料具有多个文本信息。接着,简报资料存储于例如服务器(或计算机内的)存储部。用语提取手段3读取所存储简报资料的各页,并读取各页所包含的文本。接着,用语提取手段3将读取的文本进行词类分析。此时,存储部中例如存在有词类数据库,并存储了各种用语与其词类。此时,可根据用途将作为各种用语的检索用语的分数也共同存储于存储部。例如,检索用资料信息存储装置如果为药品制造商、MR(医药信息负责人)、MS(医药品批发)用,相较于一般名词可分配较高的分数给各种疾病名称。另外,各种药剂名称或有效成分虽然重要性比疾病名称低,但相对于一般名词也可分配较高的分数。接着,用语提取手段3可提取文本所包含的用语(特别是名词),并可使用其频率或存储于存储部的用语分数,提取一个或多个资料中用语。例如,用语提取手段3从某一页中提取用语A、用语B及用语C,用语C出现两次且用语A及B出现一次,存储部所存储的用语A、B及C的分数分别为5、50、及40时,可让用语A、B及C的分数分别为5、50及80。例如,资料中用语的提取数目设定为2时,用语提取手段3可将用语C及B提取作为资料中用语。接着,使已提取的资料中用语(用语C及B)与可读取该页的页数相关的信息相关联,并存储于存储部。如此一来,则可与该页一起读取用语C及B。用语提取手段3的其他例子有识别简报某一页中使用最大字型的部分者。接着,对于使用最大字型的部分所包含的资料中用语赋予预定系数。系数(第一系数:a1)可存储于存储部。用语提取手段3将第一系数与使用最大字型的部分所包含的资料中用语一起存储于存储部。另外,用语提取手段3也可将根据字型的大小的系数(第二系数:a2)与资料中用语一起存储于存储部。
关键字存储手段5是用于存储用语的手段,所述用语是成为与资料中用语相关联的关键字。关键字存储手段5可通过存储部、及用于从存储部读取信息的要件(例如控制程序)而实现。关键字是在检索各页时,不仅是多个资料中用语,也是通过将与该些相关连的用语作为检索用语而用于容易检索各页的用语。由此与各页相关联并存储的检索用语变少,而成为能迅速检索的方式。可是也有资料中用语直接就是关键字的情形。关键字可称为与资料中用语相关的第一转换语。关键字也可从多个种类的资料中用语选择适合使用于检索的某一用语。
资料中用语是简报所包含的用语。因此,资料中用语也有不一定与检索用语一致或不适合作为检索用语的情况。例如简报包含名为ob基因或ob/ob小鼠的用语。其为与肥胖基因(及肥胖症、肥胖症实验动物)相关联。因此,关键字存储手段5将作为关键字的肥胖基因(及肥胖症、肥胖症实验动物)与作为资料中用语的ob基因或ob/ob小鼠相关联并存储。
因为存在有关键字存储手段5,所以与各页相关联并存储的检索用语成为统一的用语。因此,在进行检索时可迅速读取关连页数。
图5是表示关键字存储手段的存储例的概念图。如图5所示,关键字存储手段针对多个资料中用语分别使一个或多个关键字相关联并存储,并同时对个别的关键字使分数(此分数为b1)与其相关联并存储。该分数优选为以愈适合作为检索使用的用语者分数愈高的方式预先输入。
关键字提取手段7为用于使用用语提取手段3所提取的资料中用语,并从关键字存储手段5提取多个成为与资料中用语相关联的关键字的手段。关键字存储手段5存储有成为与资料中用语相关联的关键字的用语。因此,关键字提取手段7可使用资料中用语,并从关键字存储手段5读取成为与资料中用语相关联的关键字的用语。通常会从某一页提取多个资料中用语。因此,通常会提取多个成为与此页相关的关键字的用语。另外,成为与资料中用语相关联的关键字的用语通常也为多个(也可分别分配分数)。因此,通常会提取多个成为与此页相关的关键字的用语。此外,当然也存在有资料中用语成为关键字的用语的情况。亦即,也可直接提取资料中用语作为关键字。关键字提取手段7可使用存储部所存储的资料中用语的系数及关键字的分数,并对个别关键字的分数进行评价。关键字的分数的例子为a1×a2×b1。为了计算分数,在存储部存储有用于进行上述运算的控制程序,故控制部可在读取该控制程序的同时,读取存储部所存储的各系数及分数,且于运算部进行求出a1×a2×b1的运算,并将运算结果存储于存储部。另外,可先使资料中用语的出现频率(其系数为a21)或从多个种类的资料中用语提取某一特定的关键字时的加算系数(其系数为a22)事先存储于存储部,通过求出a1×a2×a21×a22×b1,从而求出关键字的分数并存储于存储部。此外,也可对某一页所包含的强调色赋予较强系数。此时,可具有从页中分析用语颜色的手段,及存储每个颜色的系数的存储部,并可使用已分析的用语颜色,从存储部读取该颜色相关的系数。此外,不仅是关键字,主题词及分类语基本上也是同样地预先存储关于各种要件的系数或分数,且将其读取并进行乘法运算或加法运算等而求出分数,存储个别语种的分数并比较,由此求出优先顺序的候选。
主题词存储手段9是用于存储与关键字相关联的主题词的手段。主题词存储手段9可通过存储部,及用于从存储部读取信息的要件(例如控制程序)而实现。
例如,在主题词存储手段中,可将名为肥胖的主题词与名为肥胖基因、肥胖症、肥胖症实验动物等的关键字相关联并存储。主题词可为将多个关键字进一步统一的用语或上位概念化用语。通过使用主题词可更迅速地进行检索。主题词的例子有疾病名称、药剂名称、有效成分名称及制药企业名称。亦即,主题词可称为资料中用语相关的第二转换语。主题词也可为对多个种类的关键字选出适合于检索使用的用语。另外,主题词也可是信息相关者。
主题词提取手段11是用于使用关键字提取手段7所提取多个关键字,并从主题词存储手段9提取与关键字相关联的主题词的手段。
主题词存储手段9中存储有与关键字相关联的主题词。因此,主题词提取手段11使用关键字提取手段7所提取多个关键字,并从主题词存储手段9提取与关键字相关联的主题词。
图6是表示主题词存储手段的存储例的概念图。如图6所示,主题词存储手段针对多个关键字的各个,分别使一个或多个主题词相关联并存储,并同时对个别的主题词使分数与其相关联并存储。此分数优选为以愈适合作为于检索使用的用语者分数愈高的方式预先输入。
检索用语候选提取手段13是用于从主题词提取手段11所提取的主题词及关键字提取手段7所提取的多个关键字,提取资料的某一页的检索用语的候选的手段。
例如与某一页相关联的主题词存储于一个或多个存储部。另外,存储有与某一页相关联的多个关键字。
控制程序例如在进行将主题词作为全部检索用语的候选,并将关键字作为数个(例如考虑显示于显示部的大小为四个)检索用语的候选的控制时,检索用语候选提取手段13将读取的主题词作为全部检索用语的候选并将关键字中的四个关键字作为检索用语的候选。
此外,关键字存储手段5也可以是使多个关键字与个别的关键字的分数相关联并存储者,关键字提取手段7也可以是在提取多个关键字的同时,提取个别关键字的分数者。此时,例如提取分数较高的关键字作为检索用语的候选。
主题词存储手段9也可将主题词与个别主题词的分数相关联并存储,主题词提取手段11也可将关键字提取手段7所提取的多个关键字中的分数较高的预定个数关键字(一个或二个以上)作为主题词有力候选,并从主题词存储手段9提取与预定个数的主题词有力候选相关联的主题词。
上述检索用资料信息存储装置也可进一步具有分类语存储手段25及分类语提取手段27。
分类语存储手段25是用于存储与主题词相关联的分类语的手段。
分类语提取手段27是用于使用主题词提取手段11所提取主题词,并从分类语存储手段25提取与主题词相关联的分类语的手段。分类语可称为资料中用语相关的第三转换语。分类语也可以是对多个种类的主题词选择出适合于分类检索的某一用语。分类语的例子也可为显示对资料有兴趣的对象。例如若资料的某一页为MR用的某个糖尿病用的药剂(此可例如为与主题词相关联并存储),则分类语的例子也可为“MR”、“糖尿病”、“医药”。另外,资料的某一页若为面向银行行员用的会计信息,则分类语的例子可为行员等,也可为“行员”及“会计”等。另外,分类语可为制品相关的信息。接着,此检索用资料信息存储装置的检索用语候选显示手段17进一步将分类语提取手段27所提取的分类语作为检索用语的候选之一而提取。图7是表示分类语存储手段的存储例的概念图。分类语存储手段针对多个主题词分别使一个或多个分类语相关联并存储,并同时对个别的分类语使分数与其相关联并存储。该分数优选为以愈适合作为于检索使用的用语者分数愈高的方式预先输入。
图8是表示提取的(分类语)、主题词、关键字及资料中用语的概念图。
检索用语候选提取手段13也可将关键字提取手段7所提取多个关键字中的分数较高的预定个数关键字(一个或二个以上)作为检索用语的候选而提取。另外,检索用语候选提取手段13也可以使用关键字的分数及主题词的分数,并从主题词提取手段11所提取的主题词中提取预定个数(一个或二个以上)的检索用语的候选者。例如,主题词存储手段9使主题词与个别的主题词的分数相关联并存储。另外,关键字存储手段5使多个关键字与个别的关键字的分数相关联并存储。一主题词存在其来源的关键字。亦即,主题词是使用关键字所读取者。主题词常与一个或多个关键字相关连。此时,检索用语候选提取手段13在从主题词存储手段9读取某一主题词相关的分数的同时,从关键字存储手段5读取所提取主题词的来源的各关键字的分数。接着,例如,检索用语候选提取手段13在某一主题词存在多个关键字时,使运算部合计各关键字的分数,并同时将主题词的分数与关键字的分数(或关键字的合计分数)进行乘法计算。以所述方式进行,求出关于主题词的合计后的分数并存储于存储部。检索用语候选提取手段13对于多个主题词读取合计后的分数,且使运算部进行比较并提取预定个数(一个或二个以上)的主题词。以所述方式进行,即使是已决定主题词提取数目的情况,检索用语候选提取手段13也可提取预定数目的主题词。
检索用语候选显示手段17是用于将检索用语候选提取手段13所提取的检索用语的候选显示于显示部15的手段。
检索用语候选显示手段17是,
在将作为检索用语的候选所提取的预定个数(一个或二个以上)的关键字,及作为检索用语的候选所提取的预定个数(一个或二个以上)的主题词作为检索用语的候选而显示于显示部15的同时,
将关键字提取手段7所提取的多个关键字中未的作为检索用语的候选而提取者,及主题词提取手段11所提取的主题词中的未作为检索用语的候选而提取者作为检索用语的予备候选而显示于显示部15,
检索用语输入手段19
对于检索用语的予备候选,在接收到指示作为检索用语的输入时,可将检索用语的予备候选作为检索用语,
对于作为检索用语的候选而显示者,除了接收到指示不作为检索用语的输入者以外,可将其作为检索用语。
资料检索信息存储手段21是用于使通过检索用语输入手段19所输入的检索用语与资料的某一页的信息相关联并存储的手段。
本发明的装置也可进一步根据简报资料的种类显示内容类型的候选,并使内容的类型与简报的各页(或简报本身)相关联并存储。此时,本发明的装置读取存储于存储部的简报的格式(PowerPoint(注册商标)、PDF(注册商标)、Word(注册商标)等)。本发明的装置是读取已读取出的格式所包含的文本。本发明的装置包含已存储内容分析用用语的内容分析用用语数据库。接着,本发明的装置使用内容分析用用语数据库所存储的用语来分析内容的类型。例如,资料为PDF(注册商标),名为“随附文件”的文本存在于较开头时,提取“随附文件”作为该资料的内容类型的候选。接着,于显示部显示作为内容类型的“随附文件”,并在用户输入确认时,将其与该资料相关联,并存储与内容类型相关的“随附文件”。
图9是显示画面的例子。此例中,于显示画面上半部分显示简报资料的某一页。接着,关于检索用语的候选,显示采用及不采用的图标(核取方块),并同时显示各检索用语的候选。检索用语的候选在图9的例中从左边起依照分类语、主题词、及关键字的顺序排列。也可于显示部显示资料中用语。图9的例子中,关于检索用语候选提取手段13所提取的作为检索用语的用语是在采用核取方块里打勾。于显示画面的下部有确认按键,用户若使用确认按键,且于计算机(终端设备)输入确认指示,则检索用语的候选被确认。从计算机接收了输入的装置1使简报的某一页与已确认的检索用语(及个别的检索用语的分数)相关联并存储于存储部。
检索用语输入手段19是用于接收输入的手段,所述输入指示在显示部15所显示的检索用语候选中的检索用语。图9的例子中,凭借核取方块的输入是作为检索用语输入手段19而发挥功能。在用户将采用状态的检索用语的候选输入为不采用时,例如在不采用的核取方块输入打勾。接收到来自核取方块的不采用的输入的装置1会将所指示的检索用语的候选成为不采用状态。接着,用户若使用确认按键,并于计算机(终端设备)输入确认指示,则检索用语的候选不被采用。此外,也可在装置1降低不采用的检索用语的候选的分数(例如使分数减半)之后,将其作为与所述页相关联的检索用语并存储。检索用语候选提取手段13对于作为检索用语而未提取的用语是打勾不采用核取方块(或不打勾任何核取方块)。用户将为不采用状态的检索用语的候选进行作为采用的输入时,例如于采用核取方块输入打勾。接收到来自核取方块的采用输入的装置1会使所指示的检索用语的候选成为采用状态。接着,用户若使用确认按键于计算机(终端设备)输入确认指示,则会采用检索用语的候选。亦即,该检索用语会作为某一页的检索用语而与此页相关联并存储。此时,也可从用户所选择的检索用语在将分数进行加分或乘法计算的状态下存储该检索用语。
图10是用于说明本发明的检索用资料信息存储装置的使用例的流程图。亦即,该图是用于说明使用检索用资料信息存储装置的检索用资料信息存储方法的图。图中S表示工序(步骤)。
用户制作简报资料(S101)。如此一来,用户的终端设备或计算机会于存储部(或服务器的存储部)存储简报资料。
装置1对简报资料的各页提取该页所包含的用语,即资料中用语(S102)。此时,装置1也可对资料中用语赋予分数。例如,在资料中用语的出现频率较高时,或伴随有粗体字、有色文字、动画等时,可预先进行加分并登录,且可使用已登录的加分信息对资料中用语赋予分数。另外,装置1可具有资料中用语的字典,且可于字典中,对于各种资料中用语,使资料中用语与分数相关联并存储,装置1也可读取资料中用语的分数。之后,也可使用存在于字典的资料中用语的分数及加分相关的分数(例如加法运算或乘法运算),而求出资料中用语的分数。此时,在预先设定资料中用语的数目的情况下,可将分数较高者作为资料中用语。
装置1使用所提取的一个或多个资料中用语,并从存储部提取多个成为与资料中用语相关联的关键字(S103)。存储部记录成为与资料中用语相关联的关键字的用语。因此,装置1可使用资料中用语,由此从存储部提取与其相关的关键字。此时,可对于每个关键字赋予作为检索用语的分数。另外,从不同的资料中用语选择相同关键字时,其关键字成为检索用语的可能性较高,故也可作为加分对象。此情况下,可预先登录关于关键字频率较高的加分,且读取根据关键字重复次数的加分,并将分数进行加法运算或乘法运算。如此一来可求出多个关键字(及个别关键字)的分数。
若装置1使用多个关键字,并从存储部提取与关键字相关联的主题词(S104),则此处理与关键字的提取工序相同。
装置1可使用所提取的主题词,并从存储部提取与主题词相关联的分类语(S105)。其工序为任意工序。
装置1从主题词、多个关键字(及分类语)提取资料的某一页的检索用语的候选(S106)。装置1可预先存储有用于提取检索用语的候选的控制指令,且可根据该控制指令从主题词、多个关键字(及分类语)提取资料的某一页的检索用语的候选。控制指令的例子为将多个关键字中分数较高的四个、主题词中分数较高的两个(及所有的分类语)提取作为检索用语的候选。以此方式进行,会自动地提取关于简报资料的某一页的检索用语的候选。此外,存储部也可将提取的检索用语的候选存储作为某一页的检索用语。
接着,在用户确认或决定检索用语时,装置1可将提取的检索用语的候选显示于显示部(S107)。此时,也可将简报的对象页(缩小者)、未作为检索用语的候选的主题词、多个关键字(及分类语)一并显示于显示部。此情况下,用户能够选择检索用语。
在用户直接确认的情况下,终端设备接收关于确认的输入,并将装置1所提取的检索用语的候选直接作为与简报资料的某一页相关联的检索用语并存储于存储部(S111)。
另一方面,在终端设备接收到不采用检索用语的候选的输入的情况,或在终端设备接收到采用并非检索用语的候选的用语的输入的情况下,将反映这些修正的检索用语的候选作为与存储部中的某一页相关联的检索用语(S121)。
进行所述修正后,在用户已确认的情况下,终端设备接受关于确认的输入,并将修正后的检索用语的候选作为与简报资料的某一页相关联的检索用语而存储于存储部(S122)。
本发明也提供用于使计算机作为下述手段而发挥功能的检索用资料信息存储用程序或可读取存储有该程序的计算机可读取记录媒体。
所述手段包括:
用语提取手段3,提取资料中用语,即资料的某一页所包含的用语;
关键字存储手段5,存储成为与资料中用语相关联的关键字的用语;
关键字提取手段7,使用用语提取手段3所提取的资料中用语,并从关键字存储手段5提取多个成为与资料中用语相关联的关键字;
主题词存储手段9,存储与关键字相关联的主题词;
主题词提取手段11,使用关键字提取手段7所提取的多个关键字,并从主题词存储手段9提取与关键字相关联的主题词;
检索用语候选提取手段13,从主题词提取手段11所提取的主题词及关键字提取手段7所提取的多个关键字,提取资料的某一页的检索用语的候选;
检索用语候选显示手段17,将检索用语候选提取手段13所提取的检索用语的候选显示于显示部15;
检索用语输入手段19,接收输入,所述输入是指示在显示部15所显示的检索用语候选中的检索用语;及
资料检索信息存储手段21,使通过检索用语输入手段19所输入的检索用语与资料的某一页相关的信息相关联并存储。
图11是用于说明本发明的检索用资料信息存储装置的使用例的概念图(方框图)。该例子中,基本数据库(DB)包含内容DB、顾客DB、记录DB、及存储其他信息的DB。接着,这些的数据库通过接口与称为Interactive-PRO框架的引擎连接。此引擎能通过应用程序编程接口(API)与各种终端设备(例如平板电脑、行动终端设备、行动电话)进行信息的收发。另外,此引擎可与用户端的控制程序或应用程序、HTML资料、动画资料、PowerPoint资料、PDF资料、文件资料、数据库管理软件进行信息的收发。另外,该引擎能与服务器(云端)同步并进行信息的收发。另一方面,图11的例子中,通过此服务器可与包含顾客的BI(商务智能)、CRM(顾客关系管理)、及DWH(数据仓库)的各种数据库及软件进行信息的收发。
产业上的利用可性
本发明可利用于信息提供产业。
附图标记说明
1 检索用资料信息存储装置
3 用语提取手段
5 关键字存储手段
7 关键字提取手段
9 主题词存储手段
11 主题词提取手段
13 检索用语候选提取手段
15 显示部
17 检索用语候选显示手段
19 检索用语输入手段
21 资料检索信息存储手段
23 检索用资料信息存储手段
25 分类语存储手段
27 分类语提取手段