非IT企業に勤める中年サラリーマンのIT日記

非IT企業でしかもITとは全く関係ない部署にいる中年エンジニア。唯一の趣味がプログラミングという”自称”プログラマー。

ColaboratoryでGoogleドライブ上のファイルを読み込む

   

前回、Colaboratoryでローカルファイルのアップロードの方法を書きましたが、今回はGoogleドライブ上のファイルを利用する方法についてです。

ただ、Googleドライブ上のファイルを扱うとは言っても、Colaboratoryのワークスペース上にアップロードするためローカルファイルの扱いとあまり変わりません。

今回使用するファイル

今回扱うファイルはCSVファイルです。以下のような簡単なデータが書かれているものです。Googleドライブ上にtest.csvというファイル名で置いています。

[ad#top-1]

Googleドライブに接続するための設定

まずはGoogleドライブに接続します。以下のコードを実行しましょう。接続方法は前回の記事をご覧ください。

from google.colab import drive
drive.mount('/content/gdrive')
 

 

次にPython上でGoogleドライブに接続するためのライブラリをインストールします。

!pip install -U -q PyDrive
 

 

GoogleクラウドSDKの認証を行います。次のコードを実行しましょう。

from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from google.colab import auth
from oauth2client.client import GoogleCredentials

auth.authenticate_user()
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)
 

 

これを実行すると認証のためにIDを取得して入力します。

 

利用するファイルの共有設定とID取得

Googleドライブに置かれているファイルの共有設定とIDを取得します。

対象のファイルを右クリックして「共有可能なリンクを取得」を選択します。

 

すると、以下のようなウィンドウが現れてます。「リンクの共有がオンです」となっていることを確認し(なっていなければ右側のスイッチをONする)、リンクのid=以降のコードをコピーします。

 

ファイルをワークスペースにダウンロード

Googleドライブ上のファイルをワークスペース上にアップロードしましょう。以下のソースコードを実行すると指定のファイルがアップロードされます。


id = '1sY....sJvac_Y'  #共有リンクで取得したid=以降の部分
downloaded = drive.CreateFile({'id': id})
downloaded.GetContentFile('test.csv')

!ls コマンドでファイルがアップロードされているか確認しましょう。

 

Pyhtonでファイルを読み込む

あとは普通のPythonプログラムでファイルを読み込むことができます。

import pandas as pd
import io
data = pd.read_csv("test.csv")
data.head()
 

 

ご覧の通りcsvファイルの中身を読み込んで表示することができました。

 

[ad#ad-1]

スポンサーリンク

 - Google Dirve, Python