语音转换方法、装置、终端及存储介质
技术领域
本申请属于终端
技术领域
,具体而言,涉及一种语音转换方法、装置、终端及存储介质。背景技术
随着终端技术的快速发展,终端支持的功能越来越多,可以不断丰富用户的生活。例如,用户可以使用终端听音乐、观看视频、接收语音信息等。
其中,当用户接收到语音信息但不方便播放该语音信息时,可以使用终端的语音转换文字功能,将接收到的语音信息转换成文字信息,从而,用户可以看到相应的文字信息,但却感受不到发送该语音信息的说话者的情绪,从而出现信息丢失。
发明内容
本申请实施例提供一种语音转换方法、装置、终端及存储介质,可以准确反映语音信息中的情绪特征。
第一方面,本申请实施例提供一种语音转换方法,应用于发送终端,包括:
获取语音信息,获取所述语音信息对应的文字信息、声音响度以及情绪特征;
将所述语音信息、所述文字信息、所述声音响度以及所述情绪特征发送至接收终端,所述接收终端用于显示所述语音信息并在接收到针对所述语音信息的转换指令时显示所述文字信息、所述声音响度以及所述情绪特征。
第二方面,本申请实施例提供一种语音转换方法,应用于接收终端,包括:
接收发送终端发送的语音信息以及所述语音信息对应的文字信息、声音响度以及情绪特征;
显示所述语音信息,并在接收到针对所述语音信息的转换指令时显示所述文字信息、所述声音响度以及所述情绪特征。
第三方面,本申请实施例提供一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述的方法。
第五方面,本申请实施例提供一种计算机程序产品,其中,上述计算机程序产品包括存储计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
本申请实施例提供一种语音转换方法,发送终端在获取到用户的语音信息时,获取该语音信息对应的文字信息、声音响度以及情绪特征,一并发送至接收终端,使得接收终端可以在接收到针对语音信息的转换指令时显示语音信息对应的文字信息、声音响度以及情绪特征。由于发送终端除了发送语音信息外,还发送了相应的文字信息以及情绪特征等信息,在接收者不方便收听语音信息时,让接收者看到文字信息的同时感受到发送者的声音响度和情绪特征,从而可以提高用户的使用体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出应用于本申请实施例的语音转换方法或者语音转换装置的应用场景示意图;
图2示出本申请实施例的一种终端界面的举例示意图;
图3示出本申请实施例的一种语音转换方法的流程示意图;
图4示出本申请实施例的一种终端界面的举例示意图;
图5示出应用于本申请实施例的语音转换方法的应用场景示意图;
图6示出本申请实施例的一种语音转换方法的流程示意图;
图7示出应用于本申请实施例的语音转换方法的应用场景示意图;
图8示出本申请实施例的一种终端界面的举例示意图;
图9示出应用于本申请实施例的语音转换方法的应用场景示意图;
图10示出本申请实施例一种语音转换装置的结构示意图;
图11示出本申请实施例的一种语音转换方法的流程示意图;
图12示出本申请实施例的一种语音转换方法的交互示意图;
图13示出本申请实施例的一种终端界面的举例示意图;
图14示出本申请实施例的一种终端界面的举例示意图;
图15示出本申请实施例一种语音转换装置的结构示意图;
图16示出本申请实施例的一种终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅为本申请实施例的一部分,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着终端技术的快速发展,终端支持的功能越来越多,可以不断丰富用户的生活。例如,用户与亲朋好友进行交流时,用户与亲朋好友之间可以使用终端进行视频通话,用户可以直观的看到对方说话时的情绪特征。
图1示出应用于本申请实施例的语音转换方法或者语音转换装置的应用场景示意图。如图1所示,发送终端可以接收发送者输入的语音信息,在接收到针对该语音信息的发送指令时,发送终端可以将该语音信息发送至接收终端。接收终端可以到针对该语音信息的播放指令时,播放该语音信息。接收者可以听到发送者发送的语音信息,并基于该语音信息,接收者可以使用接收终端发送回复信息至发送终端。当接收者不方便播放该语音信息时,接收者可以发送语音转换指令至接收终端。接收终端接收到接收者发送的语音转换指令时,接收终端可以将接收到的语音信息转换为文字信息。
根据一些实施例,例如A用户可以在a终端上与B用户的聊天界面上输入语音信息,该语音信息例如可以是“你什么时候下班?”。当a终端接收A用户输入的语音信息时,a终端可以将该语音信息发送至B用户所在的b终端。b终端接收到该语音信息时,b终端可以显示该语音信息对应的用户界面(User Interface,UI)图标。当b终端接收到B用户针对该UI图标的点击指令时,b终端可以播放接收到的语音信息。B用户可以获取到该语音信息。B用户获取到该语音信息时,B用户可以在b终端上与A用户的聊天界面上输入回复语音信息,该回复语音信息例如可以是“六点”。当B用户不方便播放该语音信息时,B用户可以发送语音转换文字指令至b终端。当b终端接收到语音转换文字指令时,b终端可以将接收到的语音信息转换成文字信息,并将该文字信息显示在b终端的显示界面上,此时b终端显示界面可以如图2所示。B用户看到b终端的显示界面上显示的文字信息,B用户可以根据该文字信息及时进行回复。
易于理解的是,接收终端将接收到的语音信息转换为文字信息时,接收终端只能将获取到该语音信息对应的文字信息,并不能获取到该语音信息对应的情绪特征,因此接收终端获取到的语音信息对应的文字信息并不能准确反映发送者发送的语音信息中包含的情绪特征,使得用户的使用体验较差。
下面将结合附图3-附图9,对本申请实施例提供的语音转换方法进行详细介绍。附图3-附图9所示实施例的执行主体为发送终端。
请参见图3,为本申请实施例提供了一种语音转换方法的流程示意图。如图3所示,本申请实施例的所述方法可以包括以下步骤S101-步骤S102。
S101,获取语音信息,获取语音信息对应的文字信息、声音响度以及情绪特征。
根据一些实施例,语音信息可以是发送终端接收到的发送者输入的语音信息,该语音信息例如还可以是发送终端从存储器中获取到的语音信息。发送者可以在发送终端的显示屏上选择发送对象,该发送对象即为接收者。当发送者选择完成发送对象时,发送者可以点击发送终端的显示屏上语音输入按钮。当发送者持续按压语音输入按钮时,发送者可以开始输入语音信息,此时发送终端可以开始获取语音信息。当发送者语音信息输入完成时,发送终端可以获取到发送者输入的语音信息。该语音信息例如可以是“我从明天开始要放寒假了”。
易于理解的是,声音响度可以是指发送者输入语音信息时的声音分贝值。该声音响度的显示形式包括但不限于数字形式、曲线形式等。情绪特征是指发送者输入语音信息时的情绪。该情绪特征包括但不限于喜、怒、哀、乐、惊、恐、思等等,其中各个情绪特征包括至少一种情感。例如思包括但不限于思念、想念、思慕等情感。
根据一些实施例,发送终端获取到语音信息时,发送终端可以采用语音识别算法本地识别语音信息对应的文字信息、声音响度以及情绪特征,发送终端可以获取到语音信息对应的文字信息、声音响度以及情绪特征。在发送终端获取语音信息对应的情绪特征之前,发送终端可以对大量的语音信息进行学习,得到语音识别算法。该语音识别算法包括但不限于BP神经网络、基于PAC的神经网络等等。发送终端采用语音识别算法本地识别语音信息对应的文字信息、声音响度以及情绪特征时,发送终端可以同时获取到语音信息对应到的文字信息、声音响度以及情绪特征,发送终端不需要通过获取语音信息对应的文字信息获取语音信息对应的情绪特征。
易于理解的是,当发送终端获取到语音信息时,发送终端可以获取语音信息对应的文字信息、声音响度以及情绪特征。例如发送终端获取到的语音信息可以是“我从明天开始要放寒假了”。发送终端可以采用BP神经网络本地识别该语音信息对应的文字信息、声音响度以及情绪特征,发送终端可以获取到语音信息“我从明天开始要放寒假了”对应的文字信息、声音响度以及情绪特征。发送终端获取到的文字信息例如可以是“我从明天开始要放寒假了”。发送终端获取到的语音信息“我从明天开始要放寒假了”对应的声音响度可以是语音信息中每个文字对应的分贝值。例如发送终端获取到的声音响度可以是指数字形式的分贝值,发送终端获取到的“我从明天开始要放寒假了”每个文字对应的分贝值例如可以是20分贝、21分贝、22分贝、20分贝、21分贝、22分贝、21分贝、22分贝、20分贝、21分贝和20分贝。当发送终端获取到每个文字对应的分贝值时,发送终端可以计算语音信息对应的分贝平均值、分贝中位值等等。本申请实施例的发送终端可以计算语音线对应的分贝中位值,该分贝中位值例如可以是21分贝。发送终端获取到的语音信息“我从明天开始要放寒假了”对应的情绪特征例如可以是高兴。
S102,将语音信息、文字信息、声音响度以及情绪特征发送至接收终端,接收终端用于显示语音信息并在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征。
根据一些实施例,发送终端获取到语音信息对应的文字信息、声音响度以及情绪特征时,发送终端可以将获取到的语音信息、文字信息、声音响度以及情绪特征直接发送至接收终端。当接收终端接收到发送终端送的语音信息、文字信息、声音响度以及情绪特征时,接收终端可以显示该语音信息并在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征。
易于理解的是,当发送终端获取到语音信息“我从明天开始要放寒假了”对应的文字信息为“我从明天开始要放寒假了”、声音响度为21分贝以及情绪特征为高兴时,发送终端可以将语音信息“我从明天开始要放寒假了”、文字信息为“我从明天开始要放寒假了”、声音响度为21分贝以及情绪特征为高兴发送至接收终端。接收终端接收到发送终端发送的语音信息“我从明天开始要放寒假了”、文字信息为“我从明天开始要放寒假了”、声音响度为21分贝以及情绪特征为高兴时,接收终端可以显示该语音信息对应的UI图标。接收者可以点击该UI图标,点击语音转换控件。此时,接收终端可以接收到接收者针对语音信息的转换指令时,接收终端可以显示文字信息为“我从明天开始要放寒假了”、声音响度为21分贝以及情绪特征为高兴,此时接收终端的显示界面可以如图4所示。
根据一些实施例,图5示出应用于本申请实施例的语音转换方法的应用场景示意图。如图5所示,发送终端获取到语音信息对应的文字信息、声音响度以及情绪特征时,发送终端可以将获取到的语音信息、文字信息、声音响度以及情绪特征通过服务器发送至接收终端。其中该服务器可以只用于发送语音信息、文字信息、声音响度以及情绪特征。例如发送终端可以将语音信息“我从明天开始要放寒假了”、文字信息为“我从明天开始要放寒假了”、声音响度为21分贝以及情绪特征为高兴发送至服务器。当服务器接收到发送终端发送的语音信息、文字信息、声音响度以及情绪特征时,服务器可以将接收到的语音信息、文字信息、声音响度以及情绪特征发送至接收终端。接收终端接收到服务器发送的语音信息、文字信息、声音响度以及情绪特征时,接收终端可以在接收到接收者针对语音信息的转换指令时,接收终端可以显示该语音信息对应的文字信息、声音响度以及情绪特征。
申请实施例提供一种语音转换方法,发送终端在获取到用户的语音信息时,获取该语音信息对应的文字信息、声音响度以及情绪特征,一并发送至接收终端,使得接收终端可以在接收到针对语音信息的转换指令时显示语音信息对应的文字信息、声音响度以及情绪特征。由于发送终端除了发送语音信息外,还发送了相应的文字信息以及情绪特征等信息,在接收者不方便收听语音信息时,让接收者看到文字信息的同时感受到发送者的声音响度和情绪特征,从而可以提高用户的使用体验。
请参见图6,为本申请实施例提供了一种语音转换方法的流程示意图。如图6所示,本申请实施例的所述方法可以包括以下步骤S201-步骤S204。
S201,获取语音信息,将语音信息发送至服务器,服务器用于采用语音识别算法识别语音信息对应的文字信息、声音响度以及情绪特征。
根据一些实施例,发送终端获取到的语音信息例如可以是发送终端从发送终端的存储器中读取到的语音信息。当发送终端获取到该语音信息时,发送终端可以将该将语音信息发送至服务器。其中该服务器为语音转换服务器。该服务器用于在确定语音信息标识为允许识别时,语音转换服务器可以采用语音识别算法识别语音信息对应的文字信息、声音响度以及情绪特征。当语音转换服务器获取到语音信息对应的文字信息、声音响度以及情绪特征时,语音转换服务器可以将该语音信息对应的文字信息、声音响度以及情绪特征发送至发送终端。
易于理解的是,图7示出应用于本申请实施例的语音转换方法的应用场景示意图。如图7所示,发送终端获取到的语音信息例如可以是发送终端从发送终端的存储器中读取到的语音信息,该语音信息例如可以是“今天晚上有流星雨哦”。当发送终端获取到该语音信息“今天晚上有流星雨哦”时,发送终端可以将该将语音信息“今天晚上有流星雨哦”发送至语音转换服务器。当语音转换服务器接收到该语音信息时,语音转换服务器可以获取该语音信息对应的语音信息标识。在语音转换服务器确定语音信息标识为允许识别时,语音转换服务器可以采用语音识别算法获取到该语音信息“今天晚上有流星雨哦”对应的文字信息例如可以是“今天晚上有流星雨哦”、声音响度例如可以是声音响度曲线以及情绪特征例如可以是兴奋。当语音转换服务器获取到该语音信息“今天晚上有流星雨哦”对应的文字信息、声音响度以及情绪特征时,语音转换服务器可以将该语音信息“今天晚上有流星雨哦”对应的文字信息、声音响度以及情绪特征发送至发送终端。发送终端可以接收语音转换服务器发送的语音信息对应的文字信息、声音响度以及情绪特征。
根据一些实施例,当发送终端获取到语音信息时,发送终端还可以采用语音识别算法本地识别该语音信息对应的文字信息、声音响度以及情绪特征。当发送终端获取到语音信息时,发送终端可以直接获取该语音信息对应的语音信息标识。当发送终端获取到该语音信息对应的语音信息标识为允许识别时,发送终端可以采用语音识别算法本地识别语音信息对应的文字信息、声音响度以及情绪特征。
易于理解的是,当发送终端获取到语音信息“今天晚上有流星雨哦”时,发送终端还可以采用语音识别算法本地识别语音信息“今天晚上有流星雨哦”对应的文字信息、声音响度以及情绪特征。当发送终端获取到语音信息“今天晚上有流星雨哦”时,发送终端可以直接获取该语音信息“今天晚上有流星雨哦”对应的语音信息标识。当发送终端获取到该语音信息对应的语音信息标识为允许识别时,发送终端可以采用语音识别算法本地识别到语音信息对应的文字信息例如可以是“今天晚上有流星雨哦”、声音响度例如可以是声音变换曲线以及情绪特征例如可以是兴奋。
可选的,当语音转换服务器将语音信息对应的文字信息、声音响度以及情绪特征发送至发送终端,发送终端接收到语音信息对应的文字信息、声音响度以及情绪特征时,发送终端还可以采用语音识别算法本地识别该语音信息对应的文字信息、声音响度以及情绪特征,以便提高发送终端获取语音信息对应的文字信息、声音响度以及情绪特征的准确性。
S202,接收服务器发送的文字信息、声音响度以及情绪特征。
根据一些实施例,当发送终端将语音信息发送至服务器时,服务器可以基于接收到的语音信息采用语音识别算法获取到该语音信息对应的文字信息、声音响度以及情绪特征。当服务器获取到该语音信息对应的文字信息、声音响度以及情绪特征时,服务器可以将该语音信息对应的文字信息、声音响度以及情绪特征发送至发送终端。
易于理解的是,当发送终端将语音信息“今天晚上有流星雨哦”发送至服务器时,服务器可以基于接收到的语音信息“今天晚上有流星雨哦”采用语音识别算法获取到该语音信息对应的文字信息、声音响度以及情绪特征。服务器获取到的该语音信息“今天晚上有流星雨哦”对应的文字信息例如可以是“今天晚上有流星雨哦”、声音响度例如可以是声音响度曲线以及情绪特征例如可以是兴奋。服务器可以将该语音信息“今天晚上有流星雨哦”对应的文字信息“今天晚上有流星雨哦”、声音响度曲线以及兴奋的情绪特征发送至发送终端。发送终端可以接收该语音信息“今天晚上有流星雨哦”对应的文字信息“今天晚上有流星雨哦”、声音响度曲线以及兴奋的情绪特征。
S203,显示语音信息,并在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征。
根据一些实施例,当发送终端接收到语音信息时,发送终端可以显示该语音信息。当发送终端获取到语音信息对应的文字信息、声音响度以及情绪特征之后,发送终端在接收到针对语音信息的转换指令时,发送终端可以显示文字信息、声音响度以及情绪特征。例如发送终端可以采用语音识别算法本地识别语音信息对应的文字信息、声音响度以及情绪特征,发送终端还可以接收服务器发送的语音信息对应的文字信息、声音响度以及情绪特征。当发送终端在接收到针对语音信息的转换指令时,发送终端可以显示文字信息,并将声音响度显示在文字信息的底层,将情绪特征显示在文字信息的周围。
易于理解的是,例如发送终端获取到的语音信息可以是“今天晚上有流星雨哦”。发送终端可以接收服务器发送的语音信息对应的文字信息、声音响度以及情绪特征。例如基于接收到的语音信息,服务器可以采用语音转换算法获取到该语音信息“今天晚上有流星雨哦”对应的文字信息“今天晚上有流星雨哦”、声音响度曲线以及兴奋的情绪特征,并将获取到的文字信息、声音响度曲线以及兴奋的情绪特征发送至发送终端。发送终端可以接收该语音信息“今天晚上有流星雨哦”对应的文字信息“今天晚上有流星雨哦”、声音响度曲线以及兴奋的情绪特征。当发送终端在接收到针对语音信息的转换指令时,发送终端可以显示文字信息,并将声音响度曲线显示在文字信息的底层,将兴奋的情绪特征显示在文字信息的周围。此时,发送终端的显示界面可以如图8所示。
S204,将语音信息、文字信息、声音响度以及情绪特征发送至接收终端,接收终端用于显示语音信息并在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征。
根据一些实施例,当发送终端获取到服务器发送的语音信息对应的文字信息、声音响度以及情绪特征,发送终端可以将获取到的语音信息、文字信息、声音响度以及情绪特征直接发送至接收终端。当接收终端接收到语音信息时,接收终端可以显示语音信息并在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征。
易于理解的是,如图7所示,当发送终端接收到语音转换服务器发送的文字信息“今天晚上有流星雨哦”、声音响度曲线以及兴奋的情绪特征时,发送终端可以将该语音信息“今天晚上有流星雨哦”、文字信息“今天晚上有流星雨哦”、声音响度曲线以及兴奋的情绪特征发送至接收终端。当接收终端接收到语音信息时,接收终端可以显示语音信息并在接收到针对语音信息“今天晚上有流星雨哦”的转换指令时显示文字信息“今天晚上有流星雨哦”、声音响度曲线以及兴奋的情绪特征。
根据一些实施例,图9示出应用于本申请实施例的语音转换方法的应用场景示意图。如图9所示,当发送终端接收到语音转换服务器发送的语音信息对应的文字信息、声音响度以及情绪特征,发送终端可以将获取到的语音信息、文字信息、声音响度以及情绪特征通过转发服务器发送至接收终端。该转发服务器仅仅用于将接收到的语音信息、文字信息、声音响度以及情绪特征发送至接收终端,并不对接收到的语音信息进行语音转换处理。当接收终端接收到语音信息时,接收终端可以显示语音信息并在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征。
本申请实施例提供一种语音转换方法,通过发送终端将从服务器获取到的语音信息对应的文字信息、声音响度以及情绪特征发送至接收终端,使得接收终端可以在接收到针对语音信息的转换指令时显示语音信息对应的文字信息、声音响度以及情绪特征。由于服务器可以将获取到的语音信息、文字信息、声音响度以及情绪特征发送至发送终端,进而发送终端可以将语音信息发送至接收终端,因此可以让接收者看到文字信息的同时感受到发送者的声音响度和情绪特征,相较于接收者只看到文字信息,本申请实施例的技术方案可以让接收者及时明确地知道发送者的情绪状态,从而可以提高用户的使用体验。
下面将结合附图10,对本申请实施例提供的语音转换装置进行详细介绍。需要说明的是,附图10所示的语音转换装置,用于执行本申请图4-图9所示实施例的方法,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请图4-图9所示的实施例。
请参见图10,其示出本申请实施例的语音转换装置的结构示意图。该语音转换装置1000可以通过软件、硬件或者两者的结合实现成为用户终端的全部或一部分。根据一些实施例,该语音转换装置1000包括信息获取单元1001和信息发送单元1002,具体用于:
信息获取单元1001,用于获取语音信息,获取语音信息对应的文字信息、声音响度以及情绪特征;
信息发送单元1002,用于将语音信息、文字信息、声音响度以及情绪特征发送至接收终端,接收终端用于显示语音信息并在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征。
根据一些实施例,信息获取单元1001,用于获取语音信息对应的文字信息、声音响度以及情绪特征时,具体用于:
将语音信息发送至服务器,服务器用于采用语音识别算法识别语音信息对应的文字信息、声音响度以及情绪特征;
接收服务器发送的文字信息、声音响度以及情绪特征。
根据一些实施例,信息发送单元1002,用于将语音信息发送至服务器,服务器用于采用语音识别算法识别语音信息对应的文字信息、声音响度以及情绪特征时,具体用于:
将语音信息发送至服务器,服务器用于在确定语音信息标识为允许识别时,采用语音识别算法识别语音信息对应的文字信息、声音响度以及情绪特征。
根据一些实施例,信息获取单元1001,用于获取语音信息对应的文字信息、声音响度以及情绪特征时,具体用于:
采用语音识别算法本地识别语音信息对应的文字信息、声音响度以及情绪特征。
根据一些实施例,信息获取单元1001,用于采用语音识别算法本地识别语音信息对应的文字信息、声音响度以及情绪特征时,具体用于:
在确定语音信息标识为允许识别时,采用语音识别算法本地识别语音信息对应的文字信息、声音响度以及情绪特征。
根据一些实施例,该语音转换装置1000还包括信息显示单元1003,用于获取语音信息对应的文字信息、声音响度以及情绪特征之后,显示语音信息,并在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征。
根据一些实施例,信息显示单元1003,用于在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征时,具体用于:
在接收到针对语音信息的转换指令时,显示文字信息,并将声音响度显示在文字信息的底层,将情绪特征显示在文字信息的周围。
本申请实施例提供一种语音转换装置,通过信息获取单元1001获取语音信息,获取语音信息对应的文字信息、声音响度以及情绪特征,以便信息发送单元1002可以将语音信息、文字信息、声音响度以及情绪特征发送至接收终端,接收终端用于显示语音信息并在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征。语音转换装置可以让接收者及时明确地知道发送者的情绪状态,可以提高接收者与发送者之间交流的效率,从而可以提高用户的使用体验。
下面将结合附图11-附图13,对本申请实施例提供的语音转换方法进行详细介绍。附图11-附图13所示实施例的执行主体为接收终端。
请参见图11,为本申请实施例提供了一种语音转换方法的流程示意图。如图11所示,本申请实施例的所述方法可以包括以下步骤S301-步骤S302。
S301,接收发送终端发送的语音信息以及语音信息对应的文字信息、声音响度以及情绪特征。
根据一些实施例,发送终端获取到语音信息对应的文字信息、声音响度以及情绪特征时,发送终端可以将语音信息、文字信息、声音响度以及情绪特征直接发送至接收终端。当接收终端检测到发送终端发送的语音信息、文字信息、声音响度以及情绪特征时,接收终端可以接收语音信息、文字信息、声音响度以及情绪特征。
易于理解的是,发送终端获取到的语音信息例如可以是“今天准备出门逛街,但是忽然下起了大雨”。当发送终端采用语音识别算法本地识别获取到语音信息对应的文字信息、声音响度以及情绪特征时,发送终端可以直接将语音信息、文字信息、声音响度以及情绪特征直接发送至接收终端。发送终端获取到的语音信息对应的文字信息例如可以是“今天准备出门逛街,但是忽然下起了大雨”、声音响度例如可以是声音响度曲线以及情绪特征例如可以是悲伤的情绪特征。当接收终端检测到发送终端发送的语音信息、文字信息、声音响度以及情绪特征时,接收终端可以接收语音信息、文字信息、声音响度以及情绪特征。
根据一些实施例,发送终端获取到语音信息对应的文字信息、声音响度以及情绪特征时,发送终端可以将语音信息、文字信息、声音响度以及情绪特征直接发送至服务器。其中该服务器可以用于基于接收到的语音信息,将该语音信息转换为该语音信息对应的文字信息、声音响度以及情绪特征,该服务器还可以用于将接收到的语音信息、文字信息、声音响度以及情绪特征直接发送至接收终端。当接收终端检测到服务器发送的语音信息、文字信息、声音响度以及情绪特征时,接收终端可以接收语音信息、文字信息、声音响度以及情绪特征。
易于理解的是,图12示出本申请实施例一种语音转换方法的交互示意图。如图12所示,发送终端获取到的语音信息例如可以是“今天准备出门逛街,但是忽然下起了大雨”。当发送终端可以将该语音信息发送至语音转换服务器。当语音转换服务器采用语音识别算法获取到语音信息对应的文字信息、声音响度以及情绪特征时,语音转换服务可以直接将语音信息、文字信息、声音响度以及情绪特征发送至发送终端。发送终端获取到的语音信息对应的文字信息例如可以是“今天准备出门逛街,但是忽然下起了大雨”、声音响度例如可以是声音响度曲线以及情绪特征例如可以是悲伤的情绪特征。发送终端可以将获取到的语音信息、文字信息、情绪特征通过转发服务器发送至接收终端。当接收终端检测到发送终端发送的语音信息、文字信息、声音响度以及情绪特征时,接收终端可以接收语音信息、文字信息、声音响度以及情绪特征。
S302,显示语音信息,并在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征。
根据一些实施例,当发送终端获取到语音信息对应的文字信息、声音响度以及情绪特征时,发送终端可以将语音信息、文字信息、声音响度以及情绪特征发送至接收终端。其中,发送终端可以将语音信息、文字信息、声音响度以及情绪特征直接发送至接收终端,发送终端还可以将语音信息、文字信息、声音响度以及情绪特征通过服务器发送至接收终端。当接收终端接收到语音信息、文字信息、声音响度以及情绪特征时,接收终端可以显示语音信息,并在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征。接收终端可以显示文字信息,并将声音响度显示在文字信息的底层,将情绪特征显示在文字信息的周围。
易于理解的是,例如发送终端获取到的语音信息例如可以是“今天准备出门逛街,但是忽然下起了大雨”。当发送终端采用语音识别算法本地识别到该语音信息对应的文字信息“今天准备出门逛街,但是忽然下起了大雨”、声音响度曲线以及悲伤的情绪特征时,发送终端可以将语音信息、文字信息、声音响度以及情绪特征直接发送至接收终端。当接收终端接收到语音信息时,接收终端可以显示该语音信息,此时,接收终端的显示界面可以如图13所示。
可选的,例如接收终端接收到语音信息时,接收终端可以在接收终端的显示屏上显示该语音信息对应的UI图标。接收者可以长按该UI图标,接收终端检测到接收者长按该UI图标时,接收终端可以显示选择框。接收者可以点击语音转换文字控件。此时,接收终端的显示界面可以如图14所示。当接收终端检测到接收者点击语音转换文字控件时,接收终端可以接收语音信息的转换指令。当接收终端在接收到针对语音信息的转换指令时,接收终端可以显示文字信息,并将声音响度曲线显示在文字信息的底层,将兴奋的情绪特征显示在文字信息的周围。
易于理解的是,当发送终端在接收到针对语音信息的转换指令时,发送终端可以显示文字信息,还可以将声音响度显示在文字信息的上部,将情绪特征显示在文字信息的后边。
本申请实施例提供一种语音转换方法,通过接收发送终端发送的语音信息以及语音信息对应的文字信息、声音响度以及情绪特征,接收终端可以显示语音信息,并在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征,不仅可以让接收者明确知道发送者发送的语音信息对应的文字信息,还可以让接受者获取到发送者在发送语音信息时的声音响度以及发送者当前的情绪特征,进而可以提高接收者的使用体验。
下面将结合附图15,对本申请实施例提供的语音转换装置进行详细介绍。需要说明的是,附图15所示的语音转换装置,用于执行本申请图11-图14所示实施例的方法,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请图11-图14所示的实施例。
请参见图15,其示出本申请实施例的语音转换装置的结构示意图。该语音转换装置1500可以通过软件、硬件或者两者的结合实现成为用户终端的全部或一部分。根据一些实施例,该语音转换装置1500包括信息接收单元1501和信息显示单元1502,具体用于:
信息接收单元1501,用于接收发送终端发送的语音信息以及语音信息对应的文字信息、声音响度以及情绪特征;
信息显示单元1502,用于显示语音信息,并在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征。
根据一些实施例,信息显示单元1502,用于在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征时,具体用于:
在接收到针对语音信息的转换指令时,显示文字信息,并将声音响度显示在文字信息的底层,将情绪特征显示在文字信息的周围。
本申请实施例提供一种语音转换装置,通过信息接收单元1501接收发送终端发送的语音信息以及语音信息对应的文字信息、声音响度以及情绪特征,信息显示单元1502可以显示语音信息,并在接收到针对语音信息的转换指令时显示文字信息、声音响度以及情绪特征。相较于只显示语音信息对应的文字信息的技术方案而言,本申请实施例的技术方案不仅可以让接收者明确知道发送者发送的语音信息对应的文字信息,还可以让接受者获取到发送者在发送语音信息时的声音响度以及发送者当前的情绪特征,减少发送者信息的丢失,进而可以提高接收者的使用体验。
请参见图16,为本申请实施例提供的一种终端的结构示意图。如图16所示,所述终端1600可以包括:至少一个处理器1601,至少一个网络接口1604,用户接口1603,存储器1605,至少一个通信总线1602。
其中,通信总线1602用于实现这些组件之间的连接通信。
其中,用户接口1603可以包括显示屏(Display)和GPS,可选用户接口1103还可以包括标准的有线接口、无线接口。
其中,网络接口1604可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,处理器1601可以包括一个或者多个处理核心。处理器1601利用各种借口和线路连接整个终端1600内的各个部分,通过运行或执行存储在存储器1605内的指令、程序、代码集或指令集,以及调用存储在存储器1605内的数据,执行终端1600的各种功能和处理数据。可选的,处理器1601可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器1601可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1601中,单独通过一块芯片进行实现。
其中,存储器1605可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器1605包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器1605可用于存储指令、程序、代码、代码集或指令集。存储器1605可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器1605可选的还可以是至少一个位于远离前述处理器1601的存储装置。如图16所示,作为一种计算机存储介质的存储器1605中可以包括操作系统、网络通信模块、用户接口模块以及用于语音转换的应用程序。
在图16所示的终端1600中,用户接口1603主要用于为用户提供输入的接口,获取用户输入的数据;而处理器1601可以用于调用存储器1605中存储的语音转换方法的应用程序,并具体执行以下操作:
获取语音信息,获取所述语音信息对应的文字信息、声音响度以及情绪特征;
将所述语音信息、所述文字信息、所述声音响度以及所述情绪特征发送至接收终端,所述接收终端用于显示所述语音信息并在接收到针对所述语音信息的转换指令时显示所述文字信息、所述声音响度以及所述情绪特征。
根据一些实施例,处理器1601用于所述获取所述语音信息对应的文字信息、声音响度以及情绪特征时,具体用于执行以下步骤:
将所述语音信息发送至服务器,所述服务器用于采用语音识别算法识别所述语音信息对应的文字信息、声音响度以及情绪特征;
接收所述服务器发送的所述文字信息、所述声音响度以及所述情绪特征。
根据一些实施例,处理器1601用于所述将所述语音信息发送至服务器,所述服务器用于采用语音识别算法识别所述语音信息对应的文字信息、声音响度以及情绪特征时,具体用于执行以下步骤:
将所述语音信息发送至服务器,所述服务器用于在确定所述语音信息标识为允许识别时,采用语音识别算法识别所述语音信息对应的文字信息、声音响度以及情绪特征。
根据一些实施例,处理器1601用于所述获取所述语音信息对应的文字信息、所述声音响度以及情绪特征时,具体用于执行以下步骤:
采用语音识别算法本地识别所述语音信息对应的文字信息、声音响度以及情绪特征。
根据一些实施例,处理器1601用于所述采用语音识别算法本地识别所述语音信息对应的文字信息、声音响度以及情绪特征时,具体用于执行以下步骤:
在确定所述语音信息标识为允许识别时,采用语音识别算法本地识别所述语音信息对应的文字信息、声音响度以及情绪特征。
根据一些实施例,处理器1601用于所述获取所述语音信息对应的文字信息、声音响度以及情绪特征之后,还用于执行以下步骤:
显示所述语音信息,并在接收到针对所述语音信息的转换指令时显示所述文字信息、所述声音响度以及所述情绪特征。
根据一些实施例,处理器1601用于所述在接收到针对所述语音信息的转换指令时显示所述文字信息、所述声音响度以及所述情绪特征,包括:
在接收到针对所述语音信息的转换指令时,显示所述文字信息,并将所述声音响度显示在所述文字信息的底层,将所述情绪特征显示在所述文字信息的周围。
根据一些实施例,处理器1601还用于时执行以下步骤:
接收发送终端发送的语音信息以及所述语音信息对应的文字信息、声音响度以及情绪特征;
显示所述语音信息,并在接收到针对所述语音信息的转换指令时显示所述文字信息、所述声音响度以及所述情绪特征。
根据一些实施例,处理器1601用于所述在接收到针对所述语音信息的转换指令时显示所述文字信息、所述声音响度以及所述情绪特征时,具体用于执行以下步骤:
在接收到针对所述语音信息的转换指令时,显示所述文字信息,并将所述声音响度显示在所述文字信息的底层,将所述情绪特征显示在所述文字信息的周围。
本申请实施例提供一种装置,通过将获取到的语音信息、所述文字信息、所述声音响度以及所述情绪特征发送至接收终端,以便接收终端可以显示所述语音信息并在接收到针对所述语音信息的转换指令时显示所述文字信息、所述声音响度以及所述情绪特征。相较于只显示语音信息对应的文字信息的技术方案而言,本申请实施例的终端不仅可以让接收者明确知道发送者发送的语音信息对应的文字信息,还可以让接受者获取到发送者在发送语音信息时的声音响度以及发送者当前的情绪特征,进而可以提高终端的使用范围。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。其中,计算机可读存储介质可以包括但不限于任何类型的盘,包括软盘、光盘、DVD、CD-ROM、微型驱动器以及磁光盘、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、闪速存储器设备、磁卡或光卡、纳米系统(包括分子存储器IC),或适合于存储指令和/或数据的任何类型的媒介或设备。
本申请实施例还提供一种计算机程序产品,该计算机程序产品包括存储计算机程序的非瞬时性计算机可读存储介质,该计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种语音转换方法的部分或全部步骤。
本领域的技术人员可以清楚地了解到本申请的技术方案可借助软件和/或硬件来实现。本说明书中的“单元”和“模块”是指能够独立完成或与其他部件配合完成特定功能的软件和/或硬件,其中硬件例如可以是现场可编程门阵列(Field-ProgrammaBLE GateArray,FPGA)、集成电路(Integrated Circuit,IC)等。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些服务接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通进程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random AccessMemory,RAM)、磁盘或光盘等。
以上所述者,仅为本公开的示例性实施例,不能以此限定本公开的范围。即但凡依本公开教导所作的等效变化与修饰,皆仍属本公开涵盖的范围内。本领域技术人员在考虑说明书及实践这里的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未记载的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的范围和精神由权利要求限定。