非IT企業に勤める中年サラリーマンのIT日記

非IT企業でしかもITとは全く関係ない部署にいる中年エンジニア。唯一の趣味がプログラミングという”自称”プログラマー。

【Python】名刺画像をテキスト抽出してPDF化するツールを公開

2025/03/04

GitHubに名刺画像からテキストを抽出し、PDFに変換するツールをアップしました。

GitHubリポジトリはこちら

本記事では、このツールの概要と使い方について解説します。

目次

1 ツールの概要
2 必要な環境
3 インストールと使用方法

ツールの概要

このツールはGoogleが提供しているAIツールGeminiを活用し、名刺画像から文字情報を取得してPDFに整理するものです。日本語のテキストも抽出可能です。名刺管理の手間を減らしデジタル化をスムーズに進めることができます。

Pythonプログラムから画像をGeminiに転送し、そこで抽出されたテキストを利用するというのが大まかな原理です。

必要な環境

本ツールを利用するには、以下の環境が必要です。

Python 3.8以上
GeminiのAPIキー取得
依存ライブラリ（pip install -r requirements.txt でインストール可能）

Geminiを利用するには、APIキーが必要です。Geminiの公式ウェブサイトで取得してください。Geminiの公式ウェブサイト（https://ai.google.dev/gemini-api/docs?hl=ja）

詳しくは以下の記事の手順を参考にしてください。

非IT企業に勤める中年サラリーマンのIT日記

【Python】Gemini APIでAI結果を取得できたので手順を書く

ChatGPTに肩を並べるAIとしてGoogleのGeminiが注目を集めています。ChatGPT同様、専用のWebサイト上で質問をして回答を得ることができますが、ChatGPTは有償プランのみで提供されているのに対し、Geminiは無償でAPIを提供している点が大きな特徴です。この無償APIを利用することで、Geminiの先進的な機能をプログラムから操作でき、自動化によって迅速かつ的確な応答を得ることが可能になります。本記事では、Pythonを使って実際にGeminiに質問を投げ、応答を取得する方法を解説します。APIキーの取得からPythonでの実装まで手順をわか...

Pythonプログラム（create_meishi_PDF.py）と同じフォルダ内に以下２つのフォルダを設置してください。imgフォルダに撮影した名刺画像を保存します。（複数可）

img
pdf

インストールと使用方法

リポジトリをクローンします。

git clone https://github.com/satoshi71/business-card-pdf.git
cd business-card-pdf

必要なライブラリをインストールします。

pip install google-generativeai reportlab pillow

名刺画像を用意し、imgフォルダに保存します。（複数可）

その上で以下のように実行するとpdfフォルダ内に名刺画像とテキストが一緒になったPDFファイルが生成されます。（Linuxの場合はpython3コマンド）

python create_meishi_PDF.py

スポンサーリンク

関連記事

: Pythonで文字列操作（len/要素取り出し/加算・乗算/検索）

Pythonで文字列操作で、文字長さの取得、要素取り出し、加算・乗算、文字列の中 …

: 【Python】DataFrameの欠損値処理：dropnaで行や列を簡単に削除

データ分析を行う際、欠損値の存在は結果に影響を及ぼすため、適切な処理が重要です。 …

: PyQtでHello World（Anaconda3/Spyderで作ってみた）

前回、Anacondaのインストール方法について書きましたが、Anacondaに …

: Pythonとyfinanceで日本株のデータを取得する方法

Pythonには、株価データを簡単に取得できる便利なライブラリがいくつかあります …

: Google Colaboratory からスプレッドシートに書き込む方法

前回に続きGoogle Colaboratoryからスプレッドシートに書き込む方 …

PREV: 【Python】ファイル一覧をサブフォルダも含めて取得する方法
NEXT: 【GAS】Googleフォームの回答時にGASでイベントを発生させる方法