Files
tldr/pages.zh/common/tabula.md

736 B

tabula

从 PDF 文件中提取表格。 更多信息:https://tabula.technology

  • 将 PDF 中的所有表格提取到 CSV 文件中:

tabula -o {{file.csv}} {{file.pdf}}

  • 将 PDF 中的所有表格提取到 JSON 文件中:

tabula --format JSON -o {{file.json}} {{file.pdf}}

  • 从 PDF 的第 1、2、3 和 6 页提取表格:

tabula --pages {{1-3,6}} {{file.pdf}}

  • 从 PDF 的第 1 页提取表格,猜测要检查的页面部分:

tabula --guess --pages {{1}} {{file.pdf}}

  • 从 PDF 中提取所有表格,使用划线确定单元格边界:

tabula --spreadsheet {{file.pdf}}

  • 从 PDF 中提取所有表格,使用空白空间确定单元格边界:

tabula --no-spreadsheet {{file.pdf}}