非IT企業に勤める中年サラリーマンのIT日記

非IT企業でしかもITとは全く関係ない部署にいる中年エンジニア。唯一の趣味がプログラミングという”自称”プログラマー。

PythonでGoogle Analyticsから直近30日分のデータを取得してCSVファイルに保存する方法

      2020/06/16

前回2回に分けてPythonでGoogle Analyticsからデータを取得する方法について書きました。

今回はこれを応用して直近30日分のPVを収集してそれをCSVファイルに保存する方法について書きます。30日でなくても60日でも90日でもOKですが、個人的にブログの記事PVを30日分のデータで評価しているのでそのようにしているだけです。

こんな感じでCSVファイルが生成されます。URLとタイトル、30日分のPVです。

 

ソースコードは以下の通り。

8行目のstartDate = '30daysAgo'の日付を変えれば遡る日数を変えられます。

from apiclient.discovery import build
from oauth2client.service_account import ServiceAccountCredentials

SCOPES = ['https://www.googleapis.com/auth/analytics.readonly']
KEY_FILE_LOCATION = 'bamboo-reason-XXXXX-XXXXXXXXXXX.json'
VIEW_ID = 'XXXXXXXX'

startDate = '30daysAgo' #この変数で何日前のデータかを示している
endDate = 'today'

def initialize_analyticsreporting():
  credentials = ServiceAccountCredentials.from_json_keyfile_name(
  KEY_FILE_LOCATION, SCOPES)

  analytics = build('analyticsreporting', 'v4', credentials=credentials)

  return analytics

def get_report(analytics):
  return analytics.reports().batchGet(
    body={
      'reportRequests': [
      {
        'viewId': VIEW_ID,
        'pageSize': 1000,
        'dateRanges': [{'startDate': startDate, 'endDate': endDate}],
        'metrics': [{'expression': 'ga:pageviews'}],
        'dimensions': [{'name': 'ga:pagePath'}, {'name': 'ga:pageTitle'}],
        'orderBys': [{'fieldName': 'ga:pageviews', 'sortOrder': 'DESCENDING'}]
      }]
    }
  ).execute()

def print_response(response):
  result = ""
  #タイトルの中にブログタイトルが入っているのでそれを消すためのもの
  delcode = ' | 非IT企業に勤める中年サラリーマンのIT日記'
  cnt=1
  for report in response.get('reports', []):
    columnHeader = report.get('columnHeader', {})
    dimensionHeaders = columnHeader.get('dimensions', [])
    metricHeaders = columnHeader.get('metricHeader', {}).get('metricHeaderEntries', [])

    for row in report.get('data', {}).get('rows', []):
      dimensions = row.get('dimensions', [])
      dateRangeValues = row.get('metrics', [])
      result += str(cnt) +','
      for header, dimension in zip(dimensionHeaders, dimensions):
        result += dimension.replace(',', '_') + ','
      for i, values in enumerate(dateRangeValues):
        for metricHeader, value in zip(metricHeaders, values.get('values')):
          result += value + ','
      result += "\n"
      cnt+=1
  #ブログタイトル削除
  result = result.replace(delcode,'')

  #CSV保存
  f = open('out.csv','w')
  f.write(result)
  f.close()

def main():
  analytics = initialize_analyticsreporting()
  response = get_report(analytics)
  print_response(response)

if __name__ == '__main__':
  main()
 

 

スポンサーリンク

 - Python