1 イントロダクション

佐久間 智広

神戸大学大学院経営学研究科

2024/04/08


1 授業の概要

1.1 授業の概要・到達目標

社会調査の目的・類型・プロセス等の概要を説明できる

  • 社会調査は広い概念です。個々の社会調査の事例を見てもそれが何かを理解することは難しいです(共通点が見えないから)
  • 今日とか次回とか,最初の方で社会調査って何,という共通理解を作りたいです

統計解析用ソフトウェアを用いて基礎的な分析ができる

  • 授業のほとんどの時間は,社会調査の中でも定量的な調査を行う際の分析方法について扱います
  • 「分析ができる」というのにもさまざまなレベルがありますが,「基本的な分析手法を理解し,正しく運用できる」ようになることを目指します。

1.2 この授業の位置付け

データ分析をするための基礎的知識を確認します


平均値

Aクラスのテストの結果は
100, 50, 30, 50, 40, 50, 40, 80, 30, 30 → 平均50点

Bクラスのテストの結果は
100,0,0,100,0,100,0,0,100,100 → 平均50点

  • 平均値50点とは何を意味している?
  • これを知って何に使える?
  • 同じ平均点でも,AとBでは全く違うような気もするけど?

分析をするための道具としてのRの使い方を学びます


  • 統計的分析は,エクセルでもできないことはないです
  • でも専門のツールを使った方がはるかに便利です
  • この授業では,データ分析に特化したプログラミング言語であるRを使います

さっきの平均値はこんなふうに計算できる

Code
x <- c(100,50,30,50,40,50,40,80,30,30)
mean(x)
[1] 50
Code
y <- c(100,0,0,100,0,100,0,0,100,100)
mean(y)
[1] 50

データ分析の考え方と,実行方法を並行して学びます

2 社会調査?

2.1 定義

この授業では, 佐藤 (2015a, 31) に従い社会調査を

新しい知識や情報を得るために,システマティックに探求されるもの

として

理論的枠組みや先行研究を踏まえて適切な問いを立て,確実な調査技法を用いて良質のデータを獲得し,的確な方法で分析を行うことによって,問いに対する答えを導き出す(佐藤 2015a, 25)

プロセスとみます

2.1.1 新しい知識と情報?

  • 調査というものは,そもそもまだ誰も知らない何かを知るために行われるもの
    • 新しい知見を得るために行われている
    • 特に社会的もしくは理論的に重要だけどわかっていない何かを明らかにしたい

2.1.2 システマティックに探求?

  • 社会科学の領域で広く認められた手順や方法を踏まえて調査する
    • 適当な方法では,明らかにしたいことがわからない
    • もっと酷い場合は間違った結論を出してしまうかもしれない

  • 社会調査とは,適切な方法で獲得したデータを的確な方法で分析することで,問いに対する答えを証拠を持って提示するもの

2.2 エビデンスの提供元としての社会調査

  • 社会調査によって得られたデータの分析結果は,国家・地方公共団体の政策や企業の経営判断に役立てられる(かもしれない)
職人の目利きは常に有効なのか?

職人の目利きは常に有効なのか?

データが集計されていないと,経験や勘に頼るしかない

  • 勘や経験も重要
    • 全てをデータ分析に置き換えることはできない
  • でも,データを蓄積して,それをうまく分析できたらより良い判断ができるかもしれない。
    • 世の中には,直感に反する関係がいっぱいある。良いと思って実行していたことが,実は逆効果だったり
  • しかし,調査の仕方がまずかったり,分析の仕方がまずいと誤った結果をエビデンスとして提供してしまう可能性も
    • 関係のないものを関係あると示す
    • 関係のあるものを関係ないと示す
    • 正の関係のものを負の関係として示す
  • 正しい社会調査を行えるようになりましょう

3 社会調査の流れ

社会調査は以下のような流れに従ってなされます

  1. リサーチ・クエスチョンの設定(問い)
  2. リサーチ・デザインの策定
  3. データ収集・データ分析
  4. 論文や報告書の作成(答え)

3.1 リサーチクエスチョンの設定

  • 調査の目的は,何かしらの新しい知識や情報を得ることにある
  • 社会調査は調査なので,何かしら調査するべき課題・疑問がある
    • まだわかっていないことの中で社会的もしくは理論的に重要なもの

例:オンデマンド授業は学習成果を高めるの?

好きなペースで進められる。何度でも復習できる

集中できない。どうせ見ない

3.2 リサーチ・デザインの設定

  • 問いが定まっても,闇雲にアンケートを行えば良いわけではない
    • 問いに関連してすでにわかっていることは何かを把握する
      • 理論や専門知識,過去の調査結果
    • 問いの答えとその理由に関する仮説を立てる
    • データをどのように取るのかを検討する

例:オンデマンド授業は学習成果を高めるの?

  • 学習成果を規定する要因についてすでにわかっていることは?

  • 教室での学習とオンデマンド学習の違いは?

3.3 データ収集・分析

  • リサーチデザインに従って収集したデータを適切に分析して,仮説を検証する
  • 仮説の検証結果を根拠に当初の問いの答えを決める

例:オンデマンド授業は学習成果を高めるの?

  • オンデマンド学習の受講生の学習成果データ

  • 教室授業の受講生の学習成果データ

(ハイブリッド授業で授業内容が一緒だと良さそう。ただしオンラインか教室かは学籍番号で決められている設定じゃないと困る)

  • 分析の結果,教室授業の受講生の方が良い成績→教室授業の方が成果が高いと結論

3.4 論文や報告書の作成

  • 分析結果は(学術研究としてなら)論文,(コンサルティングや社内プロジェクトなら)報告書のような形でまとめられます。
  • まとめられた結果は多くの場合「これからどうするか」といった将来の意思決定に役立てられます。

例:オンデマンド授業は学習成果を高めるの?

  • 「教室授業の受講生の方が良い成績→教室授業の方が成果が高い」という分析結果を,問題意識や調査設計・データの概要とともに調査レポートとしてまとめる
  • オンデマンド授業の拡大の是非を検討する材料として利用

4 この授業でやること

4.1 データを使って分析の形を理解する

統計分析の背後にある理論は難しいです

  • 確率論
  • 計量経済学
  • 心理統計

理論を学んで分析できるようになる,に越したことはありませんが,理論→実践だと実際分析できるようになるまでにすごく長い時間がかかります。

そこで…

最低限の理屈を,実際に分析をしながら学ぶ

を目指します。

4.2 定量的データの分析方法を理解する

  • 社会調査の一連の流れには,たくさんの論点があり全てを15回で扱うことはできません。

問いの設定や,リサーチデザインについては,例えば 佐藤 (2015a), 佐藤 (2015b), 伊丹 (2001) などが詳しいです。また,事例が経営学に寄っていますが, 田村 (2006), 須田 (2019) などもわかりやすいです。

  • 社会調査士プログラムの1授業として,この授業では定量的なデータの分析部分を中心に扱います。
    • データの種類
    • データのまとめ方
    • 母集団と標本
    • 推定と検定
    • 回帰分析
    • 分散分析
  • これは,得られたデータからなるべく間違いのない結果を提示するための方法に関する部分です

4.3 プログラミング言語Rを使った分析方法の習得

  • この授業では,特に統計的な処理にRというプログラミング言語を使います
  • Rは特に統計分析に特化したプログラミング言語で,Pythonのような汎用性がない代わりに,統計的な処理に関わる機能や操作性が高いです
    • ただし,統計処理に関わる前後の処理も得意で,例えばレポートやスライド資料も作れます

Tip

ちなみに…この授業資料も全部Rで作っています

4.4 この授業でのデータ分析の考え方

この授業では,ユーザーとしての統計分析方法について説明します(統計理論の証明等はしません)

車を運転するにあたって,

  • エンジンの仕組み内燃機関がどうたらこうたら,
  • ハイオクガソリンのハイオクとは?

は詳しく知っている必要はないですでも,

  • レギュラーガソリンで走る普通車にハイオクを入れても問題はないけど,軽油を入れたら壊れる
  • 一方通行の標識の意味

といった知識は運転するにあたって必要です。

統計分析でも,分析する上で

  • ガウス積分を使った正規分布の積率母関数の導出

は知らなくても支障はないけれど,

  • 統計的仮説検定の結果の意味
  • 分析上の仮定とその仮定が成り立たない時に起こる問題

等を知っていないと,間違った結果を計算してしまったりするという意味で問題です

この授業では,分析上の大きな間違い(プラスの関係があるものをマイナスと推定したり,関係ある(ない)ものを関係ない(ある)と推定したり)が起こらない程度の知識を得つつ,実際に分析作業ができるようになることを目指します。

「データサイエンティスト」の需要増と「プログラミングなんてAIに取って代わられる」論

データサイエンティスト,とかいう職業が注目を集めて久しいです

  • 給料も爆上がりだとか。羨ましい。

一方で,「生成AIの発展によってプログラマーは失業する」とか言われたりもします

じゃあ,「データ分析のためにプログラムする」のはどうなんでしょうか?

  • 単純作業や,仮説を見つけるという意味での関係性の発見は,確かにAIが得意とするところです。
    • 一方で,原因と結果を同定する,といった因果関係の推論は少なくとも現代のAIにはできません。
      • AIには理解するという概念がないので,物事のありようを理解し,因果関係について考察するということはできないらしいです。
  • 分析の目的の多くは,因果関係の同定であることを鑑みると,データ分析の技能がAIに取って代わられることはしばらくの間なさそうです。

5 授業の流れ

5.1 全体像

社会調査のプロセスのうち特に定量的分析部分を中心に,以下のような順番で進めます。

  1. Rのインストールと基礎的な使い方
  2. 調査の目的と様々な方法
  3. データを要約する(1変数)
  4. データを要約する(複数変数)
  5. 実習1
  6. 統計的推測:母集団と標本
  7. 検定
  1. 単回帰分析
  2. 重回帰分析
  3. ダミー変数・交互作用・対数回帰
  4. 因果推論
  5. 実験的方法
  6. 分析の実習
  7. 社会調査法のまとめ

Note

授業の進捗度合いに応じて前後する場合があります

5.2 授業中

  • 授業中は,こちらからのレクチャーと,(主に)Rを使った実習からなります
レクチャーでやったことを

レクチャーでやったことを

自分で実装

自分で実装

Caution

毎回パソコンを持ってきてください!

5.3 評価

授業中に何度か分析実習レポートを提出してもらいます。データ分析を伴うレポートを通して,授業で学習した内容の理解度及び分析手法の習得状況を問います

評価は以下の基準で行います

  • 授業中の実習 (70%)
    • 授業中・授業後課題への取り組み
  • 調査レポート (期末) (30%)
    • 自身で問題を設定し,自身で得たデータを分析することを通して答える

6 Rについて

6.1 Rとは

Rは,統計分析に強みを持つコンピュータ言語です(統計ソフトと呼ぶこともあるけど,厳密な違いはよくわかりません)。

6.2 他のソフト・方法との比較

  • 覚えさえすればエクセルよりもはるかに簡単

  • エクセルでできる分析は限られていますが,Rではそれよりもはるかに高度なことができます

  • エクセルはそもそも表計算ソフトです。

    • データが簡単にいじれてしまう(書き換えられてしまう)状態で分析作業をするのは好ましくありません。
  • フリーです。

    • 卒業後も使えます。
  • 機械学習との絡みでPythonが流行ってきています。

    • ただ,統計分析に関してはRに一日の長があるという印象です。

    • コンピュータ言語のとっかかりはRでも,Rを使えるようになったらPythonもそこまで負担なく覚えられるでしょう。

6.3 Rstudio

Posit社の提供する統合開発環境(IDE)。RはそれだけだとWindowsのconsoleとか,Macのterminalみたいな,コマンドだけの画面

これで使えないわけでもなけれど,もっと使いやすい方が良い。Rをもっと使いやすい状態にしてくれるアプリがRstudioです。

  • Rの画面(左下)
  • Rのプログラムを書くスペース(左上)
  • 読み込んだデータや,過去に実行したコマンドが見れるスペース(右上)
  • パッケージやファイル,作った図表などがみれるスペース(右下)1

  • Rstudioを使うと,分析結果レポートを文書やプレゼン用スライドに直接書き出すこともできます。

    • いまこの資料もRstudioで書いています。
  • 文献リストの挿入などの機能も実装できるので,その気になればデータ分析から論文執筆まで全てRstudioでできます。

Google colabなど,他の開発環境もありますが,インストールさえしてしまえば,Rstudioの方が便利だと思います。

7 RとRstudioのインストール

7.1 Rのインストール

  1. R の公式サイトに行くhttps://cloud.r-project.org
  2. 自分のOSに合ったものを選択
    • WindowsならDownload R for Windows
      • Base を選ぶ
    • MacならDownload R for macOS
      • SliconならR-X.X.X-arm64.pkg
      • IntelならR-X.X.X.pkg
  3. ダウンロードしたものを実行してインストール

X.X.X という部分はバージョン番号です。

Macの方で自分がどっちかわからない場合は,左上のマーク→「About This Mac」

7.2 Rstudioのインストール

  1. RStudio の公式サイトに行くhttps://posit.co/products/open-source/rstudio/
  2. 無料版(Open Source Edition)を選択
  3. 自分のOSに合ったものを選んでダウンロード
  4. ダウンロードしたものを実行してインストール
1. 右上のDownload RStudioボタン

1. 右上のDownload RStudioボタン

2. 真ん中左あたりのDownload RStudioボタン

2. 真ん中左あたりのDownload RStudioボタン

3. 右のDownload RStudioボタン

3. 右のDownload RStudioボタン

7.3 Posit cloudへの登録

  • 多様な機能を利用する場合は,RとRstudioをパソコンにインストールすることをお勧めします。
  • 一方で,個々人のパソコンの環境によってまれにうまくインストールできない場合等があります。
  • そこで,予備としてposit cloudへの登録をお願いします。
  1. リンク(https://posit.co/)からサイトへアクセスし、ProductsタブからPosit Cloudを選択する
  1. その後、進んだ画面で “Get Started” →Free planを選択し “Sign up” を押す
  1. 好きな方法でアカウントを作成する
  2. 登録が完了すると、自身のアカウントのホーム画面へ移動する。新しいR studio セッションを開始するためには、画面右上の New projectボタンを押し、“New Rstudio Project” を選択する。

8 自己紹介

  佐久間智広

  神戸大学大学院経営学研究科・准教授

  学歴

  • 2007-2011: 神戸大学経営学部
  • 2011-2016: 神戸大学大学院経営学研究科
    • 博士(経営学), 2016

経歴

専門

会計学者です

専門は管理会計,特に業績評価システム

  • 従業員を評価し,報酬を与えることでやる気になってもらう仕組み
    • どんな目標を設定すれば良いか?
    • 目標は途中で変えるべきか?
    • 上司の主観的評価の落とし穴は?
    • 創造的(クリエイティブ)なタスクはどう評価する?

企業のデータや実験により得たデータ,公表財務データなどを統計的に分析することで,これらの問題を研究しています。

参考文献

伊丹敬之. 2001. 創造的論文の書き方. 東京: 有斐閣.
佐藤郁哉. 2015a. 社会調査の考え方 上. 東京大学出版会.
佐藤郁哉. 2015b. 社会調査の考え方 下. 東京大学出版会.
田村正紀. 2006. リサーチ・デザイン : 経営知識創造の基本技術. 東京: 白桃書房.
須田敏子. 2019. マネジメント研究への招待 : 研究方法の種類と選択. 東京: 中央経済社.