OCRmyPDF · runs locally · zero key

扫描 PDF → 同版式可搜 PDF Same layout. Now Cmd-F finds every word.

两份扫描风格 PDF(脚本生成的公开样张,无第三方版权)在本地经 ocrmypdf 处理后变成可搜、可复制、可被检索系统索引的同版式 PDF。左边是输入:只有图像、没有文字层; 右边是输出:版面一致、加了一层不可见的 OCR 文字。两份都可以下载,直接打开试着 Cmd-F / Ctrl-F 搜下方提示的关键词——左边搜不到,右边即刻命中。

01合同 · contract-scan.pdf → contract-searchable.pdf
samples-in / contract-scan.pdf2 pages · image-only
NO TEXT LAYER
samples-out / contract-searchable.pdf2 pages · OCR added
SEARCHABLE
F / CtrlF 试着搜 Effective Date — 左边 0 hit;右边 2 hits(page 1 起首段、page 2 续约条款)。
02发票 · invoice-scan.pdf → invoice-searchable.pdf
samples-in / invoice-scan.pdf1 page · image-only
NO TEXT LAYER
samples-out / invoice-searchable.pdf1 page · OCR added
SEARCHABLE
F / CtrlF 试着搜 Heliotrope — 左边 0 hit;右边在 Billed-to 区域命中并高亮。