【GAS】Googleドライブ上の画像からからテキストをOCRで抽出する方法
2023/07/07
画像をGoogleドライブ上に置いて、それをGoogle Apps Script(GAS)で文字起こし(OCRで文字抽出)する方法について解説します。GoogleドキュメントのOCR機能を用いて行います。
今回使用する画像は以下の名刺(を模したもの)をカメラで撮影したものです。仕事でもらった名刺をスマホで撮影して保存するというイメージです。(社名、氏名は架空のものです)
これをGoogleドライブ上のあるフォルダ内に保存しておきます。これで準備はできました。
フォルダ内の画像を文字起こしするソース高度です。要所要所にコメントで説明を入れています。
//画像の入ったフォルダを取得 const folderID = '<フォルダID>'; let files = DriveApp.getFolderById(folderID).getFiles(); //Googleドキュメントに渡すオプション。OCR設定 let option = { 'ocr': true, // OCRを行う 'ocrLanguage': 'ja',// OCRを行う言語 } while(files.hasNext()){ let file = files.next(); //Googleドキュメントのファイル名=画像ファイル名 subject = file.getName(); let resource = { title: subject }; //画像をGoogleドキュメントで開いて文字起こしをする。 let image = Drive.Files.copy(resource, file.getId(), option); //文字起こししたテキストを取得 let text = DocumentApp.openById(image.id).getBody().getText(); //コンソールに出力 console.log(text); // 生成されたGoogleドキュメントを削除 // 削除したくなければコメントアウト Drive.Files.remove(image.id); }
実行結果は以下の通りです。文字起こしできました。
スポンサーリンク