【Python】名刺画像をテキスト抽出してPDF化するツールを公開
GitHubに名刺画像からテキストを抽出し、PDFに変換するツールをアップしました。
本記事では、このツールの概要と使い方について解説します。
ツールの概要
このツールはGoogleが提供しているAIツールGeminiを活用し、名刺画像から文字情報を取得してPDFに整理するものです。日本語のテキストも抽出可能です。名刺管理の手間を減らしデジタル化をスムーズに進めることができます。
Pythonプログラムから画像をGeminiに転送し、そこで抽出されたテキストを利用するというのが大まかな原理です。
必要な環境
本ツールを利用するには、以下の環境が必要です。
- Python 3.8以上
- GeminiのAPIキー取得
- 依存ライブラリ(pip install -r requirements.txt でインストール可能)
Geminiを利用するには、APIキーが必要です。Geminiの公式ウェブサイトで取得してください。Geminiの公式ウェブサイト(https://ai.google.dev/gemini-api/docs?hl=ja)
詳しくは以下の記事の手順を参考にしてください。
Pythonプログラム(create_meishi_PDF.py)と同じフォルダ内に以下2つのフォルダを設置してください。imgフォルダに撮影した名刺画像を保存します。(複数可)
- img
インストールと使用方法
リポジトリをクローンします。
git clone https://github.com/satoshi71/business-card-pdf.git cd business-card-pdf
必要なライブラリをインストールします。
pip install google-generativeai reportlab pillow
名刺画像を用意し、imgフォルダに保存します。(複数可)
その上で以下のように実行するとpdfフォルダ内に名刺画像とテキストが一緒になったPDFファイルが生成されます。(Linuxの場合はpython3コマンド)
python create_meishi_PDF.py
スポンサーリンク
