其它通知

首页 - 其它通知 - 正文
成果转化公示2025-09
作者:邵祥东    来源:科学研究发展院    时间: 2025-11-26

根据学校相关规定,现对发明专利“一种基于文本反演的构图理解方法、系统”专利权转让相关事项公示:

一、成果名称及简介

发明专利:一种基于文本反演的构图理解方法、系统

发明人:叶正、万嘉贺、刘晶、张潇

专利号:ZL202510156595.8

专利权人:中南民族大学

专利简介:该专利公开了一种基于文本反演的构图理解系统,旨在提升视觉语言模型对图像和文本构图表征(对象、属性和关系)的理解能力。针对现有方法依赖昂贵监督数据、易过拟合且硬负例数据稀缺的问题,提出通过两阶段预训练在无标签纯图像数据集上训练神经网络。

第一阶段,通过基于优化的文本反演和负正则化损失,为每张图像找到代表其结构语义的pseudo-token。该pseudo-token需准确表示图像内容并能与其他令牌交互,通过三元损失使图像与正向文本特征距离小于负向文本距离,并结合正则化技术将其限制在CLIP令牌嵌入流形中以增强推理能力。

第二阶段,为解决基于优化的文本反演时间开销大的问题,通过知识蒸馏将其提炼为单一模型。设计含三个线性层(带GELU激活和dropout)的文本反转网络,利用对称对比损失等优化,使其能将任意图像映射为pseudo-token,实现即插即用。

该系统减少了对监督数据的依赖,生成的pseudo-token兼具图像表征准确性和令牌交互能力,蒸馏后的模型有效降低了时间成本,提升了构图理解效率。

二、拟交易价格/是否有关联关系

协议转让:5万元

是否有关联关系:否

三、价格形成过程

经全体发明人同意,并与湖北多优多建筑工程有限公司协商,双方同意该成果以5万元转让。

特此公示,公示期15日,自2025年11月26日起至2025年12月10日止。如有异议,请于公示期内以书面形式实名向我处反映。

联系人:张老师 邵老师

联系电话:027-67841106

技术转移中心

2025年11月26日

   责编:侯睿    审核:张道洪    上传:邵祥东