非IT企業に勤める中年サラリーマンのIT日記

非IT企業でしかもITとは全く関係ない部署にいる中年エンジニア。唯一の趣味がプログラミングという”自称”プログラマー。

GoogleスプレッドシートでもExcelの分析ツールみたいなことをする方法

   

自宅でほとんどWindowsを使わなくなったのと(ほぼLinuxMint)、近い将来Chromebookを購入しようと思っていることもあり、Windows唯一の神アプリExcelからの脱出を目指しているわけです。

LibreOfficeはクソすぎなので、なんとかGoogleスプレッドシートを使い倒したいなと思っております。

その中で、理系職ではおなじみの「分析ツール」と同等の機能がGoogleスプレッドシートにもないかなと探してみたら、いくつか確認できたので書き留めておきます。

広告

ヒストグラム

Excelでヒストグラムを作る時は「分析ツール」から「ヒストグラム」を選択してデータを選んで作りますが、Googleスプレッドシートの場合はグラフで一発で作れます。

 

Googleスプレッドシートでどうやれば良いかというと、これはExcelよりはるかに楽にできます。

それは、単純にデータを選択してグラフを作るだけです。

生データをグラフ化するだけでヒストグラムは作ることができます。ヒスト用のデータを作る必要がないのが楽です。

 

横軸のデータ数も当然カスタマイズできます。

 

 

平均値の検定(t検定)

理系職ではよく使われる平均値の検定(t検定)ですが、Excelではやはり分析ツールから作ります。

 

Googleスプレッドシートは関数でt値を出します。

 

パラメータはこんな感じです。(Googleスプレッドシートのヘルプから抜粋)

  • 範囲1 – t 検定で考慮するデータまたはセル範囲の一方の標本を指定します。
  • 範囲2 – t 検定で考慮するデータまたはセル範囲のもう一方の標本を指定します。
  • 尾部 – 使用する分布の尾部を示す数値を指定します。
    • 1 の場合: 片側分布を使用します。
    • 2 の場合: 両側分布を使用します。
  • 種類 – t 検定の種類を指定します。
    • 1 の場合: 対をなすデータの t 検定を実行します。
    • 2 の場合: 等分散の 2 標本を対象とする t 検定を実行します。
    • 3 の場合: 非等分散の 2 標本を対象とする t 検定を実行します。

こんな風に2つのデータ群の平均値の検定をしてくれます。残念なことにt値のみで、比較する基準値は自分で調べなければいけないってところです。自由度(n-1)から基準値を出す関数があったらうれしいのですが…。

 

広告

 - Google Dirve