“苏集创”www.优德88.cpm 创新成果推介(65)——语音处理及应用领域专利精选(一)

发布者:柳鑫发布时间:2023-09-12浏览次数:756

“苏集创”是依托www.优德88.cpm 国家技术转移中心(www.优德88.cpm 知识产权运营中心),紧密围绕苏州产业创新集群布局,以www.优德88.cpm 等国内外知名高校、科研院所、技术创新中心的集成创新成果为标的,构建科技、产业、资本深度融合的成果发布平台。


本期向大家推介的是www.优德88.cpm 语音处理及应用领域的一批优质专利:


1、一种语音播报药盒识别装置及药盒识别方法

专利号:ZL202310411759.8

专利类型:发明专利

发明人:张晓俊;周嘉成;姜余杰;邱志昕;黄嘉敏;陶智

专利权人:www.优德88.cpm

专利摘要:

本发明涉及一种语音播报药盒识别装置及药盒识别方法,包括基座;滑动组件,其包括丝杆、滑台和移动平台,丝杆转动设置于基座上,丝杆的一端连接驱动源,滑台与丝杆螺纹连接,移动平台设置于滑台上;控制组件,其包括控制器、摄像头和扬声器,控制器设置于基座上,控制器分别连接驱动源、摄像头和扬声器,且摄像头正对移动平台设置;还包括对药盒图像进行处理的获取模块、判断模块和识别模块;本发明的药盒识别方法配合语音播报药盒识别装置,能够精确地找到并识别药盒上的药品信息,通过语音播报药品名称及服药的注意事项,可以辅助盲人等有视力缺陷的群体服药;语音播报药盒识别装置的结构简单,操作方便,容错率高,适于实用。


2、一种面向语音识别的特征迁移学习方法及系统

专利号:ZL202210427775.1

专利类型:发明专利

发明人:张晓俊;章溢华;钱金阳;许宜申;陶智

专利权人:www.优德88.cpm

专利摘要:

本发明公开了一种面向语音识别的特征迁移学习方法及系统,包括以下步骤:获取制作为训练集和测试集;计算训练集和测试集的特征边缘分布差异和特征间条件分布差异;建立特征分布差异目标,求解一个映射矩阵,使得训练集和测试集映射到同一子空间上的特征分布差异尽可能小;其中,特征分布差异目标以最小化训练集和测试集的特征边缘分布差异和特征间条件分布差异为基础,将类内距、类间距和图嵌入矩阵作为正则项,使得映射后不同类别的样本的中心投影点之间的距离尽可能地大,同一类别的样本投影后距离应尽可能地小,且保持邻域间样本的相似关系作为分布差异约束。本发明有效减少各种不确定因素对语音信号的干扰,从而提升语音识别率。


3、小样本不均衡语音数据库的生成式数据增强方法及系统

专利号:ZL202210050846.0

专利类型:发明专利

发明人:陶智;钱金阳;章溢华;张晓俊;许宜申

专利权人:www.优德88.cpm

专利摘要:

本发明公开了一种小样本不均衡语音数据库的生成式数据增强方法,包括S1、对原始语音数据进行信号预处理,并对预处理后的语音数据划分训练集与测试集;S2、对训练集数据和测试集数据进行压缩;S3、对压缩后的训练集数据和测试集数据进行独热编码;S4、使用独热编码后的训练集数据训练低残差WaveNet神经网络;S5、使用独热编码后的测试集数据和训练好的低残差WaveNet神经网络生成原始数据库中不存在的语音样本。本发明小样本不均衡语音数据库的生成式数据增强方法及系统可以生成准确、多样的语音样本以扩充现有小样本不均衡语音数据库,使数据库能够应用更复杂的机器学习算法。


4、一种基于声门波信息的语音识别方法

专利号:ZL202110063110.2

专利类型:发明专利

发明人:陶智;伍远博;孙宝印;张晓俊;周长伟;范子琦

专利权人:www.优德88.cpm

专利摘要:

本发明公开了一种基于声门波信息的语音识别方法,包括源信号预处理、特征提取和分类识别三个步骤,源信号预处理提取原始语音信号的声门波信号作为特征提取的源信号;特征提取采用动态图像专家组标准MPEG-7提取音频高阶统计量特征与openSMILE特征和经典声门特征相结合作为声门波信号识别的特征集;分类识别基于随机森林分类器采用十倍交叉验证方法进行语音识别的预测分类。本发明以声门波作为源信号,充分表征声门激励与声带振动机理在语音识别中的作用,并且提出了动态图像专家组标准MPEG-7提取音频高阶统计量特征与openSMILE特征和经典声门特征相结合作为识别特征集,解决了帧间重复与过拟合的问题同时不依赖于基音频率估计结果。


5、一种联合混合采样和随机森林的语音样本均衡方法

专利号:ZL202210083571.0

专利类型:发明专利

发明人:张晓俊;周长伟;朱欣程;陶智;赵鹤鸣

专利权人:www.优德88.cpm

专利摘要:

本发明涉及一种联合混合采样和随机森林的语音样本均衡方法,首先对初始语音数据集进行特征提取;然后利用SMOTE-ENN混合采样对提取后的语音数据特征集进行均衡处理,获得当前均衡的语音数据集;其次将当前均衡的语音数据集输入至双因子随机森林模型中,输出双因子随机森林模型的分类评估指标和袋外错误分类率;最后判断分类评估指标是否收敛,若分类评估指标收敛,则输出当前均衡的语音数据集;否则根据袋外错误分类率更新SMOTE-ENN混合采样的混合采样率,返回重新对提取后的语音数据集进行均衡处理,直至分类评估指标收敛,输出当前均衡语音数据集。本发明最大化保留了信息价值高的样本数据。


6、一种在声门闭相下估计声道面积的方法

专利号:ZL201711206456.3

专利类型:发明专利

发明人:陶智;孙宝印;邵雅婷;张晓俊;吴迪;肖仲喆

专利权人:www.优德88.cpm

专利摘要:

本发明公开了一种在声门闭相下声道面积的估计方法,首先采用DYPSA算法确定声门两个相邻闭合点位置,以相邻的两个闭合点为单位同步计算衰减的权重激励函数;接着利用加权线性预测方法计算声门闭相下声道模型的反射系数;然后迭代计算离散声道面积函数。从逆滤波角度验证本方法的优越性,选取六类声道面积特征进行识别分析,相比于用同一个语音库的特征融合优化算法实现了7%的准确率提升。