ColaboratoryでGoogleドライブ上のファイルを読み込む
前回、Colaboratoryでローカルファイルのアップロードの方法を書きましたが、今回はGoogleドライブ上のファイルを利用する方法についてです。
ただ、Googleドライブ上のファイルを扱うとは言っても、Colaboratoryのワークスペース上にアップロードするためローカルファイルの扱いとあまり変わりません。
今回使用するファイル
今回扱うファイルはCSVファイルです。以下のような簡単なデータが書かれているものです。Googleドライブ上にtest.csvというファイル名で置いています。
[ad#top-1]
Googleドライブに接続するための設定
まずはGoogleドライブに接続します。以下のコードを実行しましょう。接続方法は前回の記事をご覧ください。
from google.colab import drive drive.mount('/content/gdrive')
次にPython上でGoogleドライブに接続するためのライブラリをインストールします。
!pip install -U -q PyDrive
GoogleクラウドSDKの認証を行います。次のコードを実行しましょう。
from pydrive.auth import GoogleAuth from pydrive.drive import GoogleDrive from google.colab import auth from oauth2client.client import GoogleCredentials auth.authenticate_user() gauth = GoogleAuth() gauth.credentials = GoogleCredentials.get_application_default() drive = GoogleDrive(gauth)
これを実行すると認証のためにIDを取得して入力します。
利用するファイルの共有設定とID取得
Googleドライブに置かれているファイルの共有設定とIDを取得します。
対象のファイルを右クリックして「共有可能なリンクを取得」を選択します。
すると、以下のようなウィンドウが現れてます。「リンクの共有がオンです」となっていることを確認し(なっていなければ右側のスイッチをONする)、リンクのid=以降のコードをコピーします。
ファイルをワークスペースにダウンロード
Googleドライブ上のファイルをワークスペース上にアップロードしましょう。以下のソースコードを実行すると指定のファイルがアップロードされます。
id = '1sY....sJvac_Y' #共有リンクで取得したid=以降の部分 downloaded = drive.CreateFile({'id': id}) downloaded.GetContentFile('test.csv')
!ls
コマンドでファイルがアップロードされているか確認しましょう。
Pyhtonでファイルを読み込む
あとは普通のPythonプログラムでファイルを読み込むことができます。
import pandas as pd import io data = pd.read_csv("test.csv") data.head()
ご覧の通りcsvファイルの中身を読み込んで表示することができました。
[ad#ad-1]
スポンサーリンク