非IT企業に勤める中年サラリーマンのIT日記

非IT企業でしかもITとは全く関係ない部署にいる中年エンジニア。唯一の趣味がプログラミングという”自称”プログラマー。

【GAS】Googleドライブ上の画像からからテキストをOCRで抽出する方法

      2023/07/07

画像をGoogleドライブ上に置いて、それをGoogle Apps Script(GAS)で文字起こし(OCRで文字抽出)する方法について解説します。GoogleドキュメントのOCR機能を用いて行います。

今回使用する画像は以下の名刺(を模したもの)をカメラで撮影したものです。仕事でもらった名刺をスマホで撮影して保存するというイメージです。(社名、氏名は架空のものです)

 

これをGoogleドライブ上のあるフォルダ内に保存しておきます。これで準備はできました。

 

フォルダ内の画像を文字起こしするソース高度です。要所要所にコメントで説明を入れています。

//画像の入ったフォルダを取得
const folderID = '<フォルダID>';
let files = DriveApp.getFolderById(folderID).getFiles();
//Googleドキュメントに渡すオプション。OCR設定
let option = {
  'ocr': true,        // OCRを行う
  'ocrLanguage': 'ja',// OCRを行う言語
}
while(files.hasNext()){
  let file = files.next();
  //Googleドキュメントのファイル名=画像ファイル名
  subject = file.getName();
  let resource = {
    title: subject
  };
  //画像をGoogleドキュメントで開いて文字起こしをする。
  let image = Drive.Files.copy(resource, file.getId(), option);
  //文字起こししたテキストを取得
  let text = DocumentApp.openById(image.id).getBody().getText();
  //コンソールに出力
  console.log(text);

  // 生成されたGoogleドキュメントを削除
  // 削除したくなければコメントアウト
  Drive.Files.remove(image.id);
}
 

 

実行結果は以下の通りです。文字起こしできました。

 

スポンサーリンク

 - Google Apps Script