ここまで【偏差】、【変動】、【分散】、【標準偏差】、【正規分布】、【標本と推測統計】と書いてきましたが、ここで要点だけまとめておきます。
 

偏差

偏差とは、個体の値から平均値を引いて得られる値のこと、すなわち、偏差とは「平均値からのズレを表した数値」のことである。

変動

偏差をすべて足すと、それぞれの個性が持つ平均からのズレ(プラスとマイナス同士)が打ち消し合って、値が0(すなわち平均値)になってしまうため、それぞれの偏差(平均値からのズレ)を2条してから足し算をするようにする。

分散

分散は、「データの範囲が平均からどのくらいの広さに散らばっているか」を表した数値である。つまり、データが散らばっている広がりの範囲を数値化したものが分散である。

標準偏差

分散の正の平方根(ルート:√)を標準偏差という。√する理由は、2つある。1つは、分散のままだとデータが大きすぎるので、株価データの幅として採用することができないため。もう1つは、」(偏差)2という単位になっているため、元の変量データに戻してあげる必要があるため。

標準偏差は山の高さと横幅、すなわちブレ幅の大きさを合わせてあげることで、標準偏差の大きい銘柄の片張り投資になるのを防ぐために行う必要がある。これにより、一方の銘柄が他方の銘柄に対して十分なヘッジ効果を高め、マーケットに対してニュートラル(中立的)なポジションが組めると考えられる。

正規分布

本来は、現実に起こった分布を当てはめて分析を行うべきだが、理論的には関数のわかっている分布でないと分析ができなくなる。そのため、関数のよくわかっている正規分布を仮定として用いる。つまり、分散が有限であれば、「あらゆる分布の平均は、標本数の増加とともに正規分布に近づく」という「中心極限定理」の特徴を使って推測統計を行う。このとき、データ数が少ないと、中心極限定理の特徴がうまく作用せず、分析データの信頼度が低下してしまうため注意が必要。また、中心極限定理の特徴には「データ数が多ければ多いほど、標本平均は母集団平均に近い数値をとる可能性が高くなる」という「大数の法則」がある。

マーケットは正規分布ではない。そのため、あくまでも正規分布であると仮定として中心極限定理の特徴を利用するために用いる。よって検証結果と実際のデータの間には一定の誤差が生じる。この問題は解決できないが、推測統計によって誤差を埋めていくことにより、推測値を大幅に改善することができる。しかし、データ数が一定以上ないと、「偶然」の発生確率が上がり、推測統計に十分な信頼が得られない可能性が高い(想定外の誤差が発生する可能性が上がる)。よって、最低限6か月、できれば1年以上のデータ標本を用意するのが望ましいと考えられる(6か月は信用倍率の決済期限でもあるため、やはり最低限6か月以上は遡ってデータ収集すべきだと考えられる)。

標本と推測統計

世の中に存在するデータは有限であるが、母集団そのもののデータを知ることはほぼ不可能である。そこで、「標本から母集団の性質を間接的に推測する」必要がある。正規分布の中心から見た範囲の大きさを指定してあげれば、その範囲の中に標本平均が含まれる確率を推測することができる(区間推定)。区間推定により、正規分布は、「中心から±標準偏差分の範囲内(σ1)に全データの68.3%を、±2個分の標準偏差分の範囲内(σ2)に全データの95.44%を、±3個分の標準偏差分の範囲内(σ3)に全データの99.74%を含む」という特徴を持っていることがわかる。一般的には、標準偏差±2個分の95.44%を用いるのが習慣となっていて、正規分布表を参照すると、信頼区間の範囲が95.44%になるのは、標準偏差1.96倍のときであることがわかる。このとき、母集団平均がわからず、標準偏差が算出できない問題がある。標準偏差=√分散であるが、このとき、データ数30個以上のものに関しては「大標本法」を用いて標本の分散を母集団の平均とみなして使うことができる。

一定のデータ数を用いて、推測統計によって得られたデータは、「理論的には、正規分布を前提としているものの、現実的に、平均からの誤差は正規分布から大きく離れた分布となる。そのため、あくまでも、ボラティリティを測る尺度として、√(誤差)2が使われている」という点に注意。この辺りに金融工学の限界があると思われる。
 

にほんブログ村 先物取引ブログ サヤ取りへ
にほんブログ村

金融・投資 ブログランキングへ