百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
语音识别处理方法、装置、电子设备及存储介质
本申请提供了一种语音识别处理方法、装置、电子设备及计算机可读存储介质;涉及语音技术中的自动语音识别;方法包括:对多媒体文件中的语音进行语音识别,以得到包括多个词语的语句,其中,所述多个词语用于作为初始识别结果;根据与每个所述词语的识别确定程度对应的显示方式,显示包括所述多个词语的所述语句;显示至少一个所述词语的候选词语;响应于选择操作,根据被选中的候选词语替换所述语句中与所述被选中的候选词语处于相同位置的词语。通过本申请,能够在语音识别过程中提高获得符合用户需求的识别结果的效率。
一种房间智能控制系统和方法
本发明提供了一种房间智能控制系统和方法,所述系统包括取电盒、远红外传感器和智能语音插座,取电盒与激光传感器和智能语音插座通信连接;取电盒,用于检测用户进出房间的次数,并根据检测结果判断房间内是否有人存在,并将其判断结果传输给远红外传感器;远红外传感器,用于接收取电盒的判断结果,并根据判断结果进行再次检测房间内是否有人存在,并将其检测结果传输给智能语音插座;智能语音插座,用于接收远红外传感器的检测结果,并根据检测结果输出控制指令,进而控制与智能语音插座连接的大功率耗电电器的开关,进而为酒店节省大量的电费,也为碳的减排做出贡献。
一种无感调度BI大屏的方法、装置及系统
本发明提供了一种无感调度BI大屏的方法、装置及系统,该方法通过Subox进行无感调度BI大屏,包括以下步骤:Subox接收用户输入的语音指令,并上传至ASR云服务;Subox接收ASR云服务返回的获取的所述语音指令的语义结果;Subox将获取的所述语义结果转换为对应的操作指令;Subox接收BI大屏需要播报的TTS文本,并进行TTS播报;其中,所述BI大屏需要播报的TTS文本,是基于所述操作指令获得的。本发明提供的方法,对已有BI无侵入,只需要接入指令下发MQTT和TTS播报MQTT消息,即可实现语音与BI之间交互以及对BI数据处理结果内容进行播报,让BI更智能化、人性化。
一种应用于测量仪器的语音控制系统及方法
本发明公开了一种应用于测量仪器的语音控制系统及方法,属于测量技术领域,本发明针对仪器参数资源需求,将仪器参数资源分类并定义了一套资源逻辑结构,奠定了语音转换的基础;本发明提出的语音信息到SCPI命令的转换方法,不依赖任何操作系统平台,所以可应用于多种类型的终端,并且有利于于测量仪器的推广使用。
一种编码器及采用该编码器的基于局部生成式注意力机制的端到端语音识别系统
本发明为一种编码器及采用该编码器的基于局部生成式注意力机制的端到端语音识别系统,本发明属于端到端语音识别技术,用低复杂度的生成式注意力计算代替点积式的注意力机制,减少了计算复杂度,同时提高了语音识别的正确率;所提出一种基于DSA的语音识别模型来减少计算复杂度。我们进一步提出了局部DSA,将DSA的注意范围限制在当前语音帧周围的若干帧之内。本发明将LDSA与SA结合起来让模型具有同时提取局部和全局信息的能力。在Ai-shell1普通话语音识别语料库上的实验结果显示,所提出的LDSA-Transformer实现了6.49%的字符错误率。相比于SA-Transformer,LDSA-Transformer正确率更高,计算复杂度更低。所提出的组合注意力方法在参数量和计算复杂度与SA-Transformer大致相同的情况下,取得了显著优于后者的正确率。
多任务环境中的智能数字助理
本发明提供用于操作数字助理的系统和过程。在一个实施例中,一种方法包括从用户接收第一语音输入。该方法还包括识别上下文信息,以及基于第一语音输入和上下文信息确定用户意图。该方法还包括确定用户意图是使用搜索过程还是对象管理过程来执行任务。搜索过程被配置为搜索数据,而对象管理过程被配置为管理对象。该方法还包括,根据确定用户意图是使用搜索过程来执行任务,使用搜索过程来执行任务;以及根据确定用户意图是使用对象管理过程来执行任务,使用对象管理过程来执行任务。