非IT企業に勤める中年サラリーマンのIT日記

非IT企業でしかもITとは全く関係ない部署にいる中年エンジニア。唯一の趣味がプログラミングという”自称”プログラマー。

PythonでGoogle Analyticsからデータを取得する方法(2) Pythonプログラミング

      2020/06/15

PythonでGoogle Analyticsからデータを取得する方法について、前回はGoogle Analytics Reporting APIの設定方法について書きました。

今回はPython側のプログラミングについて説明します。

ライブラリのインストール

まず、コンソールで以下のコマンドを打ち込んでGoogle Analyticsにアクセスするためのライブラリをインストールします。

$ pip install --upgrade google-api-python-client
$ pip install --upgrade oauth2client

 

サンプルプログラムを試す

以下のサイトにサンプルプログラムが掲載されているので、まずは単純にそれをコピペして実行しましょう。

https://developers.google.com/analytics/devguides/reporting/core/v4/quickstart/installed-py?hl=ja

赤枠で囲ったところがサンプルプログラムです。

 

KEY_FILE_LOCATION VIEW_IDを書き換えます。これらは前回の記事で説明したものであらかじめ控えていたと思います。

早速実行してみましょう。以下のように国別のセッションが現れれば成功です。

ほしいデータを取得できるよう修正する

どんなデータがほしいかによりますが、ページごとのPVを取得するケースが多いんじゃないかと。指定した期間の記事ごとのPVを出力する方法について書きます。

以下の箇所を書き換えればOKです。下の段の赤枠をコメントアウトして上段のコードに書き換えています。※ソースコード全文は一番下に掲載しています。

以下の通りページごとのPVが現れれば成功です。

 

以下がソースコード全文です。pageSizeやdateRangesを変えることで取得データ数や取得期間を変えられます。

from apiclient.discovery import build
from oauth2client.service_account import ServiceAccountCredentials

SCOPES = ['https://www.googleapis.com/auth/analytics.readonly']
KEY_FILE_LOCATION = 'bamboo-reason-XXXX-XXXX.json'
VIEW_ID = 'XXXXXXXXXXXX'

def initialize_analyticsreporting():
  credentials = ServiceAccountCredentials.from_json_keyfile_name(
  KEY_FILE_LOCATION, SCOPES)

  # Build the service object.
  analytics = build('analyticsreporting', 'v4', credentials=credentials)

  return analytics

def get_report(analytics):
  return analytics.reports().batchGet(
    body={
      'reportRequests': [
      {
        'viewId': VIEW_ID,
        'pageSize': 100,
        'dateRanges': [{'startDate': '2019-11-01', 'endDate': 'today'}],
        'metrics': [{'expression': 'ga:pageviews'}],
        'dimensions': [{'name': 'ga:pagePath'}, {'name': 'ga:pageTitle'}],
        'orderBys': [{'fieldName': 'ga:pageviews', 'sortOrder': 'DESCENDING'}]
      }]
    }
  ).execute()

def print_response(response):
  for report in response.get('reports', []):
    columnHeader = report.get('columnHeader', {})
    dimensionHeaders = columnHeader.get('dimensions', [])
    metricHeaders = columnHeader.get('metricHeader', {}).get('metricHeaderEntries', [])

    for row in report.get('data', {}).get('rows', []):
      dimensions = row.get('dimensions', [])
      dateRangeValues = row.get('metrics', [])

      for header, dimension in zip(dimensionHeaders, dimensions):
        print(header + ":" + dimension)

      for i, values in enumerate(dateRangeValues):
        print('Date range: ' + str(i))
        for metricHeader, value in zip(metricHeaders, values.get('values')):
          print(metricHeader.get('name') + ': ' + value)

def main():
  analytics = initialize_analyticsreporting()
  response = get_report(analytics)
  print_response(response)

if __name__ == '__main__':
  main()
 

 

スポンサーリンク

 - Python