社内では、お客様から届く数百枚の注文書・納品書PDFを印刷して、 手作業で納期順に並べ替えるという作業が発生していました。 各PDFは「納品書」「入庫票」「受領書」の3点セット(3ページ構成) 途中に「注文書」(1〜2ページ構成)も混在 すべて1つの ...
今回はブラザーのスキャナーでスキャンした結果を自動的にOCRを実行します。SambaやOCRmyPDF、Tesseract OCRなど、オープンソースソフトウェアだけで構成します。 紙の書類をなんとかしたい ペーパーレスなんて言葉はもう聞き飽きてしまいましたが、実際に ...
PDF ファイル 1 つ、またはディレクトリ内の PDF ファイル一式を OCR し、同じディレクトリに同名の Markdown ファイルを出力するスクリプトです。 すでに一度インストールしている場合は、修正版のラッパーに差し替えるためにもう一度このスクリプトを実行し ...
PDF ファイル 1 つ、またはディレクトリ内の PDF ファイル一式を OCR し、同じディレクトリに同名の Markdown ファイルを出力 ...