- 使用统一Unicode字符替代多种编码符号,提升尺寸与公差识别的准确性 - 增加自动推断直径符号Φ的启发式方法,支持根据配合公差上下文自动标记 - 添加查找前导符号函数,处理分开文本元素中的工程符号与数字合并 - 引入文本序号seqNum,用于排序过滤和错误匹配排除 - 在文本合并逻辑中允许工程符号忽略字体大小差异合并文本单元 - 新增文本纠错函数,修正PDF符号字体乱码,提升解析文本质量 - 完善公差识别与尺寸字符串拼接的内部逻辑,统一±符号为Unicode编码 - 为文本元素添加seqNum属性,支持序号管理与日志打印 - 采纳文本归一化处理,做NFC标准化,修正编码混乱文本 - 杜绝无用的日志打印,保留必要信息用于调试与后续支持 |
||
|---|---|---|
| .. | ||
| extraction | ||
| model | ||
| service | ||