このツールは、PDFファイルのコンテンツを校正するのに多くの時間を費やす必要がある人々のために設計されたもので、異なるPDFファイル間の差異を効果的に比較します。このツールで生成された比較結果のサンプルを通じて、PDFファイル間のピクセルとテキストの違いを迅速に識別できます。
比較結果のサンプル:
このツールは、2つのPDFファイル間のピクセルの違いに基づいて比較結果を生成し、4つの画像を含んでいます。上の2つの画像では、赤いオーバーレイがピクセルの違いのある領域を示しています。違いをより明確にするために、下に2つの追加の画像が提供されます。左下の画像が真っ白であるか、右下の画像が真っ黒である場合、2つのPDF間に違いがないことを示します。
このツールは、PDF内のすべての認識可能なテキストを色付きのマスクで表示し、異なる色には異なる意味があります。
- 緑色:単語は変更されていません。
- オレンジ色:単語のフォントサイズとカラーが変更されました。
- 赤色:単語は新しく追加されたか変更されたものです。
以下の手順に従って操作してください:
- GitHubリポジトリのクローン: 次のコマンドを使用してリポジトリをクローンします:
git clone https://github.com/VintLin/pdf-comparator.git
- Python環境の設定: "pdf-comparator"プロジェクトディレクトリを開き、Python 3.8以上のバージョンがインストールされていることを確認してください。次のコマンドを使用して、環境を作成しアクティブにします。必要に応じて "venv" を好きな環境名に置き換えてください:
cd pdf-comparator
python3 -m venv venv
- 依存関係のインストール: 次のコマンドを実行して必要な依存関係をインストールします:
pip3 install -r requirements.txt
- コードを直接実行: 次のコマンドを使用してPDFファイルを比較します:
python3 -m pdfcomparator "/compare_file_1.pdf" "/compare_file_2.pdf" "/result_folder/"
- 実行可能ファイルのビルド: 必要に応じて、cx-Freezeを使用して実行可能ファイルをビルドできます(成功した場合、実行可能ファイルは "/build/" ディレクトリにあります):
python3 setup.py build
- 実行可能ファイルを実行: 次のコマンドを使用してPDFファイルを比較します:
./pdfcomparator.exe "/compare_file_1.pdf" "/compare_file_2.pdf" "/result_folder/"
このプログラムは次のコマンドライン引数を受け付けます:
-
file1
(必須):ファイル1のパス。比較したい最初のファイルのパスを指定してください。 -
file2
(必須):ファイル2のパス。比較したい第二のファイルのパスを指定してください。 -
output_folder
(必須):出力フォルダのパス。比較結果はこのフォルダに保存されます。 -
--cache
または-c
:オプションの引数で、キャッシュのパスを指定します。キャッシュパスが指定されている場合、プログラムは比較プロセスを高速化するためにキャッシュを使用します。デフォルトではキャッシュは無効です。
以下はいくつかの使用例です:
# 比較を実行
python3 -m pdfcomparator file1.pdf file2.pdf output_folder/
# 比較を実行し、キャッシュを有効にする
python3 -m pdfcomparator file1.pdf file2.pdf output_folder/ --cache /path/to/cache
contrib.rocksで作成されました。
- ソースコードライセンス: 当プロジェクトのソースコードはMITライセンスの下でライセンスされています。このライセンスにはMITライセンスの指定条件が含まれており、コードの使用、変更、配布が許可されています。
- プロジェクトのオープンソースステータス: このプロジェクトは確かにオープンソースですが、この指定は主に非営利目的を意図しています。コミュニティからの研究および非商用アプリケーションへの協力と寄付を奨励していますが、プロジェクトのコンポーネントを商業目的で利用する場合、別途ライセンス契約が必要です。
質問、フィードバック、またはお問い合わせがある場合は、vintonlin@gmail.com までお気軽にお問い合わせください。