曹鹏飞
|
6ebacd0b9b
|
docs(pdf-extraction): 编写PDF尺寸标注提取方案文档
- 详细说明项目概述及技术栈,包括Java、Spring Boot和PDFBox 3.x
- 描述直径符号Φ的识别方案,区分文字形式和矢量图形两种情况
- 介绍乱码字符映射及文本提取管线流程
- 提供正则模式匹配优先级及关键文件职责说明
- 明确启发式推断规则及已知局限,指导用户手动校正矢量Φ符号情况
- 包含乱码映射表及配合公差识别规则,提升提取精度和可维护性
|
2026-05-12 08:07:32 +08:00 |