1
|
- 1次元のデータ
- 度数分布・ヒスト=
2464;ラム
- 代表値と散らばり
- 2次元のデータ
|
2
|
|
3
|
- データ [土日の来店=
23458;数の1年間のデータ]
|
4
|
- 度数分布表[土日の=
6469;店客数の1年間のデ}=
40;タ]
|
5
|
- 度数分布表[土日の=
6469;店客数の1年間のデ}=
40;タ]
|
6
|
|
7
|
- 階級数8(階級幅38)&=
#12391;書くと…
|
8
|
|
9
|
- 累積度数分布表[累=
1309;度数,累積相対度ਤ=
8;]
|
10
|
- 問題:以下の度数=
998;布が与えられている=
;とき,平均来店客数=
12434;求めなさい.
|
11
|
- ヒストグラム(histogram)・&=
#26609;状グラフ
|
12
|
- ヒストグラム(histogram)・&=
#26609;状グラフ
|
13
|
|
14
|
|
15
|
- 幹葉プロット,ス=
486;ムプロット(stem-and-leaf
diagram[plot])
|
16
|
- 箱ひげ図,箱型図 =
5288;box
plot)
|
17
|
- 人口推計(総務省 =
113;計局
人口推計 H18.8[4月確定=
516;])
|
18
|
- 度数分布・ヒスト=
464;ラムを作成しよう
- 以下に20個のデータ&=
#12364;ある.これより,=
230;数分布を作成せよ.=
;
- 作成した度数分布=
2395;相対度数・累積度ਤ=
8;を付加せよ.
- 作成した度数分布=
2434;もとにヒストグラӣ=
2;を作成せよ.
- 幹葉プロットを作=
104;しよう
- 以下の20個のデータ&=
#12363;ら幹葉プロット(=
473;テムプロット)を作=
;成せよ.
|
19
|
|
20
|
- 測定(measurement)と尺度(scale)
- 名義(名目)尺度
nominal scale
- 属性を表す基準(=
23550;象に区別がつけら|=
28;る)
- 例:性別(男,女&=
#65292;それ以外),パソ=
467;ン保有(保有,非保=
;有)
- 順序尺度 ordinal scale
- 対象間に順序がつ=
12369;られる基準
- 例:成績(A>B>Cᦃ=
0;D),居住性(住みや=
すい>まあまあ>す=
2415;にくい)
- 間隔尺度 interval scale
- 間隔のみが意味を=
25345;つ基準
- 例:温度(摂氏℃=
65292;華氏゜F),時刻(=
320;後3時から1時間後)
- 比率尺度 ratio scale
- 比が意味を持つ基=
28310;
- 例:身長(父は子&=
#12398;1.5倍の背),体重(5=
kg重い),絶対温度(&=
#12444;K,絶対零度)
|
21
|
|
22
|
- データの代表値
- 算術平均
- 幾何平均,調和平=
2343;
- 中央値,最頻値
- 四分位点
- ミッド・レンジ
|
23
|
- 平均(算術平均,=
456;加平均)
arithmetic mean
|
24
|
|
25
|
|
26
|
- 中央値 median
- データをソート し=
12383;とき,ちょうど真|=
35;中に来る値
- 最頻値 mode
|
27
|
|
28
|
|
29
|
- 四分位点 quartile
- データをソートし=
5292;4等分したときの3つ=
398;分割点の値
- 第1四分位点 Q1
- 第2四分位点 Q2 =
5309;中央値(Median)
- 第3四分位点 Q3
- 四分位数の定義は=
2356;くつかある
- n個のデータ(x1,x
2,…,xn)について=
5292;
- k :=3D p×(n-1) とし, &=
#12288; 第1四分位の時
p=3D0.25,
- =
1532;3四分位の時
p=3D0.75
- ..., etc.
|
30
|
|
31
|
- 代表値を計算しよ=
358;
- 総務省統計局(http://www.=
stat.go.jp)の
[家計調査]ー[貯蓄・=
負債編]ー[調査結果]ー=
[詳細結果表:年度平=
22343;]ー[表8-11:貯蓄・純貯=
;蓄・負債現在高階級=
21029;]から,貯蓄額を世=
111;ごとの度数で表した=
;データを取得し,グ=
12521;フ化せよ.グラフ{=
98;形状はどのようにな=
るか?
- 次に,このデータ=
2398;「算術平均」「中࣫=
0;値」「最頻値」を計&=
#31639;し,分布の代表値=
392;して最も適切だと思=
;われるのはどれか考=
23519;せよ.ただし,100万=
26410;満,及び4000万以上の&=
#38542;級値はそれぞれ50万=
65292;5000万とする.
- 中央値以外の四分=
0301;点と,ミッドレンӟ=
2;を計算せよ.
- 以下の10個のデータ=
12395;ついて「算術平均{=
01;「中央値」「最頻値=
」「第1四分位数」「=
31532;3四分位数」「ミッ=
489;レンジ」を求めよ.=
;
|
32
|
|
33
|
|
34
|
|
35
|
|
36
|
|
37
|
|
38
|
|
39
|
- 以下の10個のデータ=
12395;ついて散らばりをš=
36;算せよ.(式だけで=
もよい)
- このデータの「範=
2258;」を計算せよ.
- 例) data[ 1, 5, 7, 9, 3 ] → 範囲=
5306;9
– 1=3D 8
- このデータの「四=
0998;位偏差」を計算せӚ=
4;.
- このデータの「偏=
4046;」をだし,合計がᦁ=
6;になることを確かめ&=
#12424;.
- このデータの「平=
2343;偏差」を計算せよᦁ=
4;
- このデータの「分=
5955;」を計算せよ.
- このデータの「標=
8310;偏差」を計算せよᦁ=
4;
|
40
|
|
41
|
- 標準化 standardization
- 各データについて=
5292;平均を引き標準偏।=
6;で割る
|
42
|
|
43
|
|
44
|
- 偏差値を計算しよ=
358;
- 以下のデータはあ=
2427;試験の16人の学生の =
080;果である.
- 英語の結果につい=
2390;,各学生の得点をજ=
1;準化し,z得点を出せ=
.
- 国語の結果につい=
2390;,各学生の偏差値ӛ=
4;計算せよ.
- 3教科合計点につ=
2356;て,各学生の偏差ࠃ=
6;を計算せよ.
|
45
|
- 車のドライバーに
- 「あなたは安全運=
36578;か?」
- と尋ねたところ,=
2823;半のドライバーが
- 「平均以上です」=
li>
- と答えた.
- さて,大半のドラ=
452;バーが「平均よりも=
;安全」だということ=
12364;あり得るだろうかʍ=
11;
- もしあり得るのだ=
392;すればその理由を推=
;測せよ.
|
46
|
- 1次元のデータ
- 度数分布・ヒスト=
2464;ラム
- 代表値と散らばり
- 2次元のデータ
|
47
|
|
48
|
- 2次元データ x , y の比$=
611;
- 相関 correlation
- x と y との間に区別|=
34;つけず対等に見る見=
方・方法
- 例:身長と体重,&=
#25968;学の成績と英語の=
104;績
- 回帰 regression
- x から y を見る見方}=
39;方法
- ある一方が他方を=
24038;右する場合
- 例:年齢と血圧,&=
#25152;得と消費,人口と=
830;業,気候と住環境
|
49
|
|
50
|
|
51
|
|
52
|
|
53
|
- 共分散と関係の強=
373;
- 例:文教太郎君と=
8248;南花子さんの昼食ฒ=
7;
|
54
|
- 相関係数 correlation coefficient
|
55
|
- 相関を計算しよう
- 以下のデータはあ=
2427;試験の結果であるᦁ=
4;
- 英語と国語,英語=
2392;数学,国語と数学ӗ=
8;結果について,それ&=
#12382;れ共分散を計算せ=
424;.
- 英語と国語,英語=
2392;数学,国語と数学ӗ=
8;結果について,それ&=
#12382;れ(ピアソンの積=
575;)相関係数を計算せ=
;よ.
- 各教科のテスト結=
6524;に相関はみられるӔ=
3;?
- (例えば,国語が=
12391;きる学生は英語も{=
91;きるとか,数学がで=
きる学生は国語がで=
2365;ない,など)
|
56
|
- 変動係数 coefficient of variation
- 分布の中心が著し=
2367;異なる場合,分散ӗ=
1;単純に散らばりを比&=
#36611;できない ⇒ 相ë=
50;比を指標として用い=
る
|
57
|
|
58
|
- 東大教養統計教室=
2232;
「統計学入門」 東=
22823;出版会(1991)
- 東大教養統計教室=
2232;
「自然科学の統計=
3398;」
東大出版会(1992)
- 宮川公男他 「入=
8272;経営科学」 実教࠲=
6;版(1999)
- 荒木勉他 「Excelで学|=
06;統計解析」
実教出版(2000)
- 荒木勉 「Excelで学ぶƂ=
56;要予測」
実教出版(2000)
- 多田実他 「Excelで学|=
06;経営科学」
オーム社(2003)
- 村上雅人 「なるほ=
12393;統計学」
海鳴社(2002)
- 丹慶勝市 「図解雑=
23398;
統計解析」 ナツメ=
31038;(2003)
- 桑田秀夫 「経営・=
32076;済系のための統計é=
98;」
日科技連(1992)
- J.アルバート&J.ベネ=
12483;ト,加藤貴昭訳「}=
13;ジャーリーグの数理=
科学
上・下」シュプリ=
2531;ガー(2004)
- 間瀬茂他「工学の=
2383;めのデータサイエӥ=
1;ス入門」数理工学社(=
2004)
|