“苏集创”www.优德88.cpm 创新成果推介(67)——文本图像处理领域专利精选

发布者:柳鑫发布时间:2023-09-25浏览次数:766

“苏集创”是依托www.优德88.cpm 国家技术转移中心(www.优德88.cpm 知识产权运营中心),紧密围绕苏州产业创新集群布局,以www.优德88.cpm 等国内外知名高校、科研院所、技术创新中心的集成创新成果为标的,构建科技、产业、资本深度融合的成果发布平台。


本期向大家推介的是www.优德88.cpm 文本图像处理领域的一批优质专利。


1、多模态蕴含增强图像文本检索的方法和系统

专利号:ZL202310031393.1

专利类型:发明专利

发明人:曹自强;闫旭;艾春辉;曹敏;付国宏

专利权人:www.优德88.cpm

专利摘要:本发明涉及图像处理技术领域,公开一种多模态蕴含增强图像文本检索的方法和系统,方法包括:获取图像文本检索数据集得到训练集和测试集,使用多模态蕴含模型筛选图像文本检索数据集中存在蕴含关系的图像文本对并作为弱正例;将训练集中的正例和弱正例输入图像文本检索模型,使用对比学习方法训练图像文本检索模型,使用弱正例部分的学习率低于使用正例部分的学习率;将测试集输入训练完成的图像文本检索模型得到检索结果;系统包括:数据获取模块、蕴含关系判别模块、训练模块和测试模块。本发明可以降低人工标注成本、易于扩展、有效提高检索性能。


2、视觉定位驱动的跨模态行人检索方法

专利号:ZL202210989022.X

专利类型:发明专利

发明人:王海光;曹敏;张民

专利权人:www.优德88.cpm

专利摘要:本发明涉及一种视觉定位驱动的跨模态行人检索方法,包括获取候选文本和候选图像、输入文本和待检索图像,提取文本的短语;使用训练完成的跨模态预训练模型提取候选文本的短语的特征和候选图像的特征并输入跨模态交互模块计算候选图像对于每个候选文本的短语的热点图,使用热点图训练跨模态交互模块;使用训练完成的跨模态预训练模型提取输入文本的特征、输入文本的短语的特征和待检索图像的特征并输入训练完成的跨模态交互模块计算待检索图像与候选图像的相似度,选择相似度最大的候选图像作为检索结果。本发明可以提高文本和图像语义信息的对应能力、提升局部对应能力,从而提高检索的准确率。


3、一种融合上下文信息的行人重识别方法及系统

专利号:ZL202110722073.1

专利类型:发明专利

发明人:曹敏;丁聪;张民

专利权人:www.优德88.cpm

专利摘要:本发明公开了一种融合上下文信息的行人重识别方法及系统,包括以下步骤:选取行人重识别数据集,提取数据集中所有行人特征;选取每个行人的上下文信息,构造图结构;对构造好的图结构进行结点信息更新;将更新后的图结构经过带权重的池化操作后得到结合上下文信息的行人特征;将池化后的行人特征与相应的原始行人特征进行拼接,构建行人重识别模型;将待识别的行人图片输入行人重识别模型,并与所有最终行人分类特征进行相似度比较,得到行人重识别的匹配结果。本发明解决现有特征学习方法在信息上的不足和获取辅助信息的成本过大问题,使得行人重识别模型在不增加额外信息情况下提高模型的准确率。


4、一种基于检索和多阶段的中文文本校对方法、系统及设备

专利号:ZL202211639239.4

专利类型:发明专利

发明人:曹自强;宋思琦;吕奇;耿磊;付国宏

专利权人:www.优德88.cpm

专利摘要:本发明实施例提供了一种基于检索和多阶段的中文文本校对方法、系统及设备,该方法包括输入纠错文本,在数据库中寻找与纠错文本最相似的文本,并将最相似文本和所述纠错文本进行拼接,得到拼接文本;对所述拼接文本进行拼写纠正;对拼写纠正后的文本进行基于序列到编辑的语法纠正得到修改结果一;将所述修改结果一和纠错文本基于序列到序列的语法纠正通过设置阈值范围得到的修改结果二进行困惑度比较;将困惑度低的修改结果作为最后的修改结果。本发明能有效提升系统的鲁棒性,在改善多种类型文本错误的同时提升检测错误和纠正错误的准确率。