SemiHMER: Semi-supervised Handwritten Mathematical Expression Recognition using pseudo-labels
Kehua Chen, Haoyang Shen·February 11, 2025
Summary
本文介绍了一种名为SemiHMER的半监督手写数学表达式识别框架,通过引入伪标签的双分支学习简化深度共训练。采用弱到强策略增强网络,提出全局动态计数模块提升长距离公式和重复字符识别。该模型在半监督学习中表现出色,代码将在GitHub上公开。新方法跨伪监督通过两个参数初始化不同的网络处理有标签和无标签图像,引入全局动态计数模块解决识别问题。提出弱到强增强策略提高模型鲁棒性,通过伪监督学习扩展训练数据。综述手写数学表达式识别领域研究,涵盖多项技术应用,包括语义图表示学习、增强学习、一致性训练、领域适应等。总结近年来研究进展,关注自训练方法在识别中的应用,如Adadelta、GRU、注意力机制等,旨在提高识别精度和效率。
引言
背景
手写数学表达式识别的挑战
目标
SemiHMER框架的开发目的
框架设计
双分支学习与伪标签引入
深度共训练简化
弱到强策略
网络增强机制
全局动态计数模块
提升长距离公式与重复字符识别
模型实现
数据收集
数据来源与类型
数据预处理
数据清洗与格式化
性能评估
半监督学习表现
实验设计与结果分析
代码公开
GitHub资源链接
创新点
伪监督跨图像处理
两个参数初始化网络
全局动态计数模块应用
解决识别问题的策略
提升模型鲁棒性
弱到强增强策略
提高模型稳定性
伪监督学习扩展
增加训练数据多样性
手写数学表达式识别领域综述
技术应用
语义图表示学习
增强学习
一致性训练
领域适应
自训练方法
Adadelta、GRU、注意力机制
研究进展与应用
提高识别精度与效率的策略
结论
总结
SemiHMER框架的贡献
展望
未来研究方向与挑战
Basic info
papers
computer vision and pattern recognition
artificial intelligence
Advanced features