0 授業の概要

立命館大学政策科学部 社会調査法 2025年度

佐久間 智広

神戸大学大学院経営学研究科

2025/03/24


1 授業の概要

  1. 授業の概要

  2. この授業でやること

  3. 授業の流れと評価

  4. 課題

  5. 参考文献

1.1 授業の概要・到達目標

社会調査の目的・類型・プロセス等の概要を説明できる

  • 社会調査は広い概念です。個々の社会調査の事例を見てもそれが何かを理解することは難しいです(共通点が見えないから)
  • 次回この授業での社会調査って何,という共通理解を作りたいです

統計解析用ソフトウェアを用いて基礎的な分析ができる

  • 授業のほとんどの時間は,社会調査の中でも定量的な調査を行う際の分析方法について扱います
  • 「分析ができる」というのにもさまざまなレベルがありますが,「基本的な分析手法を理解し,正しく運用できる」ようになることを目指します

1.2 この授業の位置付け

データ分析をするための基礎的知識を確認します

平均値

Aクラスのテストの結果は
100, 50, 30, 50, 40, 50, 40, 80, 30, 30 → 平均50点

Bクラスのテストの結果は
100,0,0,100,0,100,0,0,100,100 → 平均50点

  • 平均値50点とは何を意味している?
  • これを知って何に使える?
  • 同じ平均点でも,AとBでは全く違うような気もするけど?

分析をするための道具としてのRの使い方を学びます

  • 統計的分析は,エクセルでもできないことはない
  • でも専門のツールを使った方がはるかに便利
  • この授業では,データ分析に特化したプログラミング言語であるRを使います

さっきの平均値はこんなふうに計算できる

x <- c(100, 50, 30, 50, 40, 50, 40, 80, 30, 30)
mean(x)
[1] 50
y <- c(100, 0, 0, 100, 0, 100, 0, 0, 100, 100)
mean(y)
[1] 50

データ分析の考え方と,実行方法を並行して学びます

先ほどの2つのクラスのデータ

 [1] 100  50  30  50  40  50  40  80  30  30
 [1] 100   0   0 100   0 100   0   0 100 100

表にまとめたり

datasummary_balance(score ~ class, data = datax)
A (N=10) B (N=10)
Mean Std. Dev. Mean Std. Dev. Diff. in Means Std. Error
score 50.0 23.1 50.0 52.7 0.0 18.2

平均値は同じだけど、標準偏差は異なる

図示したり

boxplot(score ~ class, data = datax, main = "箱ひげ図:クラスごとのスコア")

Bクラスの方がバラついている

1.3 例:アイスの売れ行き

  • アイスクリーム屋さんの日次売上データ

  • その日の最高気温と天気についても記録されている

  • 気温と売上の関係を分析する

    • 天気予報に合わせてより正確な営業計画を立てたい

1.3.1 アイスクリームの売上と気温の関係

Code
ggplot(icecream_data, aes(x = temperature, y = sales)) +
  geom_point( size = 3) +
  labs(title = "気温とアイスクリームの売上", 
       x = "気温 (°C)", y = "売上 (個)") +
  theme_ggdist()

1.3.2 データから予測される関係

Code
# 単回帰分析
model1 <- lm(sales ~ temperature, data = icecream_data)

# 回帰直線を描く
ggplot(icecream_data, aes(x = temperature, y = sales)) +
  geom_point( size = 3) +
  geom_smooth(method = "lm", color = "#4753a2", se = FALSE) +
  labs(title = "単回帰分析: 気温とアイスクリームの売上", 
       x = "気温 (°C)", y = "売上 (個)") +
  theme_ggdist()

特に高気温では、予測される関係から大きく外れるものがある。

1.3.3 天気によって色分けしてみる

Code
ggplot(icecream_data, aes(x = temperature, y = sales, color = weather)) +
  geom_point(size = 3) +
  labs(title = "気温とアイスクリームの売上 (天気ごとに色分け)", 
       x = "気温 (°C)", y = "売上 (個)") +
  theme_ggdist()

1.3.4 天気の要素を考慮した分析

Code
# 重回帰分析のモデル作成
model <- lm(sales ~ temperature + weather, data = icecream_data)

# 結果を表示
summary(model)

Call:
lm(formula = sales ~ temperature + weather, data = icecream_data)

Residuals:
    Min      1Q  Median      3Q     Max 
-22.592  -5.053   1.816   7.132  22.131 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  -40.1586    16.3328  -2.459  0.03175 *  
temperature    3.5263     0.6086   5.794  0.00012 ***
weatherrainy -25.6184     8.9092  -2.875  0.01509 *  
weathersunny  24.6052     8.1653   3.013  0.01179 *  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 13.28 on 11 degrees of freedom
Multiple R-squared:  0.883, Adjusted R-squared:  0.8511 
F-statistic: 27.68 on 3 and 11 DF,  p-value: 2.005e-05
Code
ggplot(icecream_data, aes(x = temperature, y = sales, color = weather)) +
  geom_point(size = 3) +
  geom_smooth(method = "lm", se = FALSE) +
  labs(title = "重回帰分析: 気温・天気とアイスクリームの売上", 
       x = "気温 (°C)", y = "アイスクリームの売上 (個)") +
  theme_ggdist()

天気と気温両方を考慮することで精度の高い売上予測が可能に

1.3.5 実際に予測してみる

  • 27 (晴れ), 27 (雨), 33 (晴れ), 33 (曇り), 38 (晴れ), 38 (雨)
Code
# 予測データ
new_data <- data.frame(
  temperature = c(27, 27, 33, 33, 38, 38),
  weather = c("sunny", "rainy", "sunny", "cloudy", "sunny", "rainy")
)

# 予測
predicted_sales <- predict(model, new_data)

# 予測結果を表示
data.frame(new_data, Predicted_Sales = predicted_sales)

2 この授業でやること

  1. 授業の概要

  2. この授業でやること

  3. 授業の流れと評価

  4. 課題

  5. 参考文献

2.1 データを使って分析の形を理解する

統計分析の背後にある理論は難しいです

  • 確率論
  • 計量経済学
  • 心理統計

理論を学んで分析できるようになる,に越したことはありませんが,理論→実践だと実際分析できるようになるまでにすごく長い時間がかかります。

そこで…

最低限の理屈を,実際に分析をしながら学ぶ

を目指します。

2.2 定量的データの分析方法を理解する

  • 社会調査の一連の流れには,たくさんの論点があり全てを15回で扱うことはできません。

問いの設定や,リサーチデザインについては,例えば 佐藤 (2015a), 佐藤 (2015b), 伊丹 (2001) などが詳しいです。また,事例が経営学に寄っていますが, 田村 (2006), 須田 (2019) などもわかりやすいです。

  • 社会調査士プログラムの1授業として,この授業では定量的なデータの分析部分を中心に扱います。
    • データの種類
    • データのまとめ方
    • 母集団と標本
    • 推定と検定
    • 回帰分析
    • 分散分析
  • これは,得られたデータからなるべく間違いのない結果を提示するための方法に関する部分です

2.3 プログラミング言語Rを使った分析方法の習得

  • この授業では,特に統計的な処理にRというプログラミング言語を使います
  • Rは特に統計分析に特化したプログラミング言語で,Pythonのような汎用性がない代わりに,統計的な処理に関わる機能や操作性が高いです
    • ただし,統計処理に関わる前後の処理も得意で,例えばレポートやスライド資料も作れます

ちなみに…この授業資料も全部Rで作っています

2.4 この授業でのデータ分析の考え方

この授業では,ユーザーとしての統計分析方法について説明します(統計理論の証明等はしません)

車を運転するにあたって,

  • エンジンの仕組み内燃機関がどうたらこうたら,
  • ハイオクガソリンのハイオクとは?

は詳しく知っている必要はないです。でも,

  • レギュラーガソリンで走る普通車に軽油を入れたら壊れる
  • 一方通行の標識の意味

といった知識は運転するにあたって必要です。

統計分析でも,分析する上で

  • ガウス積分を使った正規分布の積率母関数の導出

は知らなくても支障はないけれど,

  • 統計的仮説検定の結果の意味
  • 分析上の仮定とその仮定が成り立たない時に起こる問題

等を知っていないと,間違った結果を計算してしまったりする

この授業では,分析上の大きな間違い(プラスの関係があるものをマイナスと推定したり,関係ある(ない)ものを関係ない(ある)と推定したり)が起こらない程度の知識を得つつ,実際に分析作業ができるようになることを目指します。

3 授業の流れと評価

  1. 授業の概要

  2. この授業でやること

  3. 授業の流れと評価

  4. 課題

  5. 参考文献

3.1 全体像

社会調査のプロセスのうち特に定量的分析部分を中心に,以下のような順番で進めます。

  1. Rのインストールと基礎的な使い方
  2. 調査の目的と様々な方法
  3. データを要約する(1変数)
  4. データを要約する(複数変数)
  5. 実習1
  6. 統計的推測:母集団と標本
  7. 検定
  1. 単回帰分析
  2. 重回帰分析
  3. ダミー変数・交互作用・対数回帰
  4. 因果推論
  5. 実験的方法
  6. 社会調査法のまとめと分析の実習

授業の進捗度合いに応じて前後する場合があります

3.2 授業中

  • 授業中は,こちらからのレクチャーと,(主に)Rを使った実習からなります

レクチャーでやったことを

レクチャーでやったことを

自分で実装

自分で実装

Caution

毎回パソコンを持ってきてください!

3.3 評価

授業中に何度か分析実習レポートを提出してもらいます。データ分析を伴うレポートを通して,授業で学習した内容の理解度及び分析手法の習得状況を問います

評価は以下の基準で行います

  • 授業中の実習 (70%)
    • 授業中・授業後課題への取り組み
  • レポート (2回) (30%)
    • 自身で問題を設定し,自身で得たデータを分析することを通して答える

Important

昨年度

  • 96名の履修登録のうち単位が出たのが64名(67%)
  • ただし,最終レポートを提出された方は93%程度単位が出ています
    • 当然授業中課題や1回目のレポートが提出されている方々です
  • 最初で諦めないでくださったら単位は多分大丈夫なので,頑張って来てください!

4 課題

  1. 授業の概要

  2. この授業でやること

  3. 授業の流れと評価

  4. 課題

  5. 参考文献

事前アンケート

  • 対面授業初回までに、Manaba+Rにある「初回アンケート」にお答えください
  • 統計学やプログラミング言語に対する経験を聞くものです
    • 授業進行の際の参考にします
    • 成績には影響しません

参考文献

伊丹敬之. 2001. 創造的論文の書き方. 東京: 有斐閣.
佐藤郁哉. 2015a. 社会調査の考え方 上. 東京大学出版会.
佐藤郁哉. 2015b. 社会調査の考え方 下. 東京大学出版会.
田村正紀. 2006. リサーチ・デザイン : 経営知識創造の基本技術. 東京: 白桃書房.
須田敏子. 2019. マネジメント研究への招待 : 研究方法の種類と選択. 東京: 中央経済社.