松原望 改訂版 統計の考え方 (2000) 

2020.5.21

 統計学の教科書を、あまり持っていなかったので、何冊か購入した中の一冊です。

この本は、放送大学でのテキストとして使用したもので、私は、古本として入手しましたが、

東京図書から『入門統計解析』として再刊されているようです。

 分厚い本なので、勉強には、時間がかかりそうですが、

最初の「統計とは何か」で、データの平均と標準偏差を説明したあと、標準誤差の概念が登場します。

 データ全体の替わりに平均単独でいうためには、この平均自体の信頼性(標準誤差)を表す必要があるが、

それは s/√n で与えられる。

 自然科学の全般で、データ処理の方法を勉強しますが、平均と標準偏差は、必ず、勉強しますが、

標準誤差という概念は、統計学という名前の学問で、初めて扱う概念だと思います。

 しかし、なぜ、標準偏差を√n で割るかは、後の頁を調べても、そんなに明確には説明されていないようです。

この理解ためには、中心極限定理を説明しないといけないのですが、この本では、145頁になって説明されます。

私は、中心極限定理で扱う現象は、統計学を理解するためには、最初に説明しておくべきだと考えます。

 

 私なりに、中心極限定理を、以下のように説明してみたいと思います。

 例えば、生徒1000人の身長のデータセットがあるとします。

平均値µと、標準偏差sを計算して、データのばらつきを記述することができます。

 次に、このデータから、n個のデータをランダムサンプリングして、平均値µnを求めるときに、

その確かさを評価することを考えます。

そのためには、n個のランダムサンプリングを何度か繰り返して、平均値を求め、

その平均値と標準偏差を求めます。

 n個の平均値なので、そのバラツキは、もとのデータのバラツキよりも小さく、

nが大きくなるほど、バラツキは、小さくなることが予測されます。

 この問題は数学的に解くことができて、標準偏差が、s/√n となります。

 これを、中心極限定理と呼びます。

 n=1の場合は、一個一個取り出すという、通常の方法です。

10個取り出して、平均をとり、また、10個取り出して平均を取るというとき、

10個平均の平均値の方が、バラツキが小さくなることは、当然です。

 

 このことを理解すると、標準誤差の意味が理解できます。また、

ステューデントのt分布を考えるときに、n個のサンプルの統計解析のために、

 t=(µn−µ)/s√n  という変数変換を行う意味が理解できると思います。

 

 さて、本書は、放送大学の通信講座で行われたため、ネットに通信指導問題が残っています。

2000年度版『統計の考え方』の通信指導問題の解答例

2000年度第2学期『統計の考え方』通信指導問題

  問題文  評価基本方針  評価細目  逐問解説  感想文紹介

2001年度第1学期『統計の考え方』通信指導問題解答例

2001年度第2学期『統計の考え方』通信指導問題解答例

2002年度第1学期『統計の考え方』通信指導問題解答例

2002年度第2学期『統計の考え方』通信指導問題解答例

2003年度第1学期『統計の考え方』通信指導問題解答例

 先生の講義を受けることのできなかった人も、その雰囲気を味わう事ができます。

 また、エクセルによる統計計算の勉強ために、次の頁があります。

Excel統計方法解説辞典

 

 本書は、大学で学ぶべき、統計学の理論と実践をまとめたものです。

本書の姉妹書として、数学が嫌いな人のための『わかりやすい統計学』、

統計学の哲学や思想をまとめた『松原望 統計学』、

実践の統計学に疑問をもった人のための『実践としての統計学』などがあります。

 

 本書がカバーする内容を明確化るために、目次を再録します。

統計とは何か

1.1 統計の期限

1.2 統計の考え方

誤差と最小二乗法

2.1 最尤原理とガウスの誤差法則

2.2 最小二乗法

2.3 推定値の信頼性

相関

3.1 相関関係と相関係数

3.2 相関関係の考え方

3.3 その他の重要な相関係数

クロス表

4.1 クロス表の考え方

4.2 対数線形モデル

4.3 クロス表の検証

時系列データ

5.1 時系列の分析と計算

5.2 時系列の確率過程モデル

5.3 時系列の予測

確率と確率分布

6.1 統計量の確率分布

6.2 基本的統計量の標本分布の導出

6.3 中心極限定理

仮説と仮説検定

7.1 検定の考え方

7.2 正規母集団に対する仮説検定

7.3 いろいろのχ2検定

7.4 中心極限定理を用いる検定

あてはまりのよさ

8.1 最尤原理

8.2 最尤法の実際

パラメータ推定と信頼区間

9.1 区間推定

9.2 多重比較

9.3 コンピュータ統計学

分散分析

10.1 分散分析の考え方

10.2 多元配置から要因実験へ

10.3 ランダマイゼーションとラテン方格

10.4 分散分析に関する他の有用な方法

ノンパラメトリック統計学

11.1 ノンパラメトリック検定法

11.2 符号を用いる検定

11.3 ランを用いる検定

11.4 順位を用いる検定

11.5 タイの修正

ベイズ的意思決定

12.1 ベイズの定理

12.2 ベイズ推定

12.3 適用例:医薬とベイズ統計学

12.4 適用例:医学的意思決定

多変量解析の考え方(I) 重回帰分析

13.1 単回帰

13.2 重回帰

13.3 重回帰の結果の読み方 (例) 多重共線

13.4 重回帰分析の一般的方法

多変量解析の考え方 () 判別分析と主成分分析

14.1 多変量解析の考え方

14.2 判別分析

14.3 主成分分析

生存時間分析

15.1 生存関数

15.2 生存関数の推定

 

 

 

     

 ご意見等がありましたら、think0298(@マーク)ybb.ne.jp におよせいただければ、幸いです。

 ホームページアドレス: https://think0298.stars.ne.jp