【GAS】Googleドライブ上の画像からからテキストをOCRで抽出する方法
2023/07/07
画像をGoogleドライブ上に置いて、それをGoogle Apps Script(GAS)で文字起こし(OCRで文字抽出)する方法について解説します。GoogleドキュメントのOCR機能を用いて行います。
今回使用する画像は以下の名刺(を模したもの)をカメラで撮影したものです。仕事でもらった名刺をスマホで撮影して保存するというイメージです。(社名、氏名は架空のものです)
これをGoogleドライブ上のあるフォルダ内に保存しておきます。これで準備はできました。
フォルダ内の画像を文字起こしするソース高度です。要所要所にコメントで説明を入れています。
//画像の入ったフォルダを取得
const folderID = '<フォルダID>';
let files = DriveApp.getFolderById(folderID).getFiles();
//Googleドキュメントに渡すオプション。OCR設定
let option = {
'ocr': true, // OCRを行う
'ocrLanguage': 'ja',// OCRを行う言語
}
while(files.hasNext()){
let file = files.next();
//Googleドキュメントのファイル名=画像ファイル名
subject = file.getName();
let resource = {
title: subject
};
//画像をGoogleドキュメントで開いて文字起こしをする。
let image = Drive.Files.copy(resource, file.getId(), option);
//文字起こししたテキストを取得
let text = DocumentApp.openById(image.id).getBody().getText();
//コンソールに出力
console.log(text);
// 生成されたGoogleドキュメントを削除
// 削除したくなければコメントアウト
Drive.Files.remove(image.id);
}
実行結果は以下の通りです。文字起こしできました。
スポンサーリンク


