tldr/pages.zh/common/ocrmypdf.md

# ocrmypdf

> 从扫描的 PDF 或文本图像生成可搜索的 PDF 或 PDF/A。
> 更多信息：<https://ocrmypdf.readthedocs.io/en/latest/cookbook.html>。

- 从扫描的 PDF 或图像文件创建一个新的可搜索 PDF/A 文件：

`ocrmypdf {{path/to/input_file}} {{path/to/output.pdf}}`

- 用可搜索的 PDF 文件替换扫描的 PDF 文件：

`ocrmypdf {{path/to/file.pdf}} {{path/to/file.pdf}}`

- 跳过已经包含文本的混合格式输入 PDF 文件的页面：

`ocrmypdf --skip-text {{path/to/input.pdf}} {{path/to/output.pdf}}`

- 清理、去歪，并旋转质量差的扫描页面：

`ocrmypdf --clean --deskew --rotate-pages {{path/to/input_file}} {{path/to/output.pdf}}`

- 设置可搜索 PDF 文件的元数据：

`ocrmypdf --title "{{title}}" --author "{{author}}" --subject "{{subject}}" --keywords "{{keyword; key phrase; ...}}" {{path/to/input_file}} {{path/to/output.pdf}}`

- 显示帮助信息：

`ocrmypdf --help`