根据学校相关规定,现对发明专利“一种基于文本反演的构图理解方法、系统”专利权转让相关事项公示:
一、成果名称及简介
发明专利:一种基于文本反演的构图理解方法、系统
发明人:叶正、万嘉贺、刘晶、张潇
专利号:ZL202510156595.8
专利权人:中南民族大学
专利简介:该专利公开了一种基于文本反演的构图理解系统,旨在提升视觉语言模型对图像和文本构图表征(对象、属性和关系)的理解能力。针对现有方法依赖昂贵监督数据、易过拟合且硬负例数据稀缺的问题,提出通过两阶段预训练在无标签纯图像数据集上训练神经网络。
第一阶段,通过基于优化的文本反演和负正则化损失,为每张图像找到代表其结构语义的pseudo-token。该pseudo-token需准确表示图像内容并能与其他令牌交互,通过三元损失使图像与正向文本特征距离小于负向文本距离,并结合正则化技术将其限制在CLIP令牌嵌入流形中以增强推理能力。
第二阶段,为解决基于优化的文本反演时间开销大的问题,通过知识蒸馏将其提炼为单一模型。设计含三个线性层(带GELU激活和dropout)的文本反转网络,利用对称对比损失等优化,使其能将任意图像映射为pseudo-token,实现即插即用。
该系统减少了对监督数据的依赖,生成的pseudo-token兼具图像表征准确性和令牌交互能力,蒸馏后的模型有效降低了时间成本,提升了构图理解效率。
二、拟交易价格/是否有关联关系
协议转让:5万元
是否有关联关系:否
三、价格形成过程
经全体发明人同意,并与湖北多优多建筑工程有限公司协商,双方同意该成果以5万元转让。
特此公示,公示期15日,自2025年11月26日起至2025年12月10日止。如有异议,请于公示期内以书面形式实名向我处反映。
联系人:张老师 邵老师
联系电话:027-67841106
技术转移中心
2025年11月26日