wms/nflg-qms-pdf-extract/src/main/java
曹鹏飞 f67ccb5796 refactor(extraction): 优化尺寸识别与文本预处理逻辑
- 使用统一Unicode字符替代多种编码符号,提升尺寸与公差识别的准确性
- 增加自动推断直径符号Φ的启发式方法,支持根据配合公差上下文自动标记
- 添加查找前导符号函数,处理分开文本元素中的工程符号与数字合并
- 引入文本序号seqNum,用于排序过滤和错误匹配排除
- 在文本合并逻辑中允许工程符号忽略字体大小差异合并文本单元
- 新增文本纠错函数,修正PDF符号字体乱码,提升解析文本质量
- 完善公差识别与尺寸字符串拼接的内部逻辑,统一±符号为Unicode编码
- 为文本元素添加seqNum属性,支持序号管理与日志打印
- 采纳文本归一化处理,做NFC标准化,修正编码混乱文本
- 杜绝无用的日志打印,保留必要信息用于调试与后续支持
2026-05-11 19:03:24 +08:00
..
extraction refactor(extraction): 优化尺寸识别与文本预处理逻辑 2026-05-11 19:03:24 +08:00
model refactor(extraction): 优化尺寸识别与文本预处理逻辑 2026-05-11 19:03:24 +08:00
service feat(pdf-extract): 新增PDF尺寸区域提取功能 2026-05-08 09:03:02 +08:00