Files
tldr/pages.zh/common/ocrmypdf.md

28 lines
953 B
Markdown

# ocrmypdf
> 从扫描的 PDF 或文本图像生成可搜索的 PDF 或 PDF/A。
> 更多信息:<https://ocrmypdf.readthedocs.io/en/latest/cookbook.html>。
- 从扫描的 PDF 或图像文件创建一个新的可搜索 PDF/A 文件:
`ocrmypdf {{path/to/input_file}} {{path/to/output.pdf}}`
- 用可搜索的 PDF 文件替换扫描的 PDF 文件:
`ocrmypdf {{path/to/file.pdf}} {{path/to/file.pdf}}`
- 跳过已经包含文本的混合格式输入 PDF 文件的页面:
`ocrmypdf --skip-text {{path/to/input.pdf}} {{path/to/output.pdf}}`
- 清理、去歪,并旋转质量差的扫描页面:
`ocrmypdf --clean --deskew --rotate-pages {{path/to/input_file}} {{path/to/output.pdf}}`
- 设置可搜索 PDF 文件的元数据:
`ocrmypdf --title "{{title}}" --author "{{author}}" --subject "{{subject}}" --keywords "{{keyword; key phrase; ...}}" {{path/to/input_file}} {{path/to/output.pdf}}`
- 显示帮助信息:
`ocrmypdf --help`