条件付き分散と予測:7つの重要な事実

この記事では、いくつかの例を使用して、さまざまな種類の確率変数の条件付き期待値を使用した条件付き分散と予測について説明します。

条件付き分散

Yが与えられた確率変数Xの条件付き分散は、Yが与えられた確率変数Xの条件付き期待値と同様の方法で定義されます。

(X | Y)= E [(XE [X | Y])2| Y]

ここで、分散は、Yの値が与えられたときに、Yが与えられたときの確率変数とXの条件付き期待値のXNUMX乗との間の差の条件付き期待値です。

との関係 条件付き分散と条件付き期待値 is

(X | Y)= E [X2| Y] –(E [X | Y])2

E [(X | Y)] = E [E [X2| Y]] – E [(E [X | Y])2]

= E [X2] – E [(E [X \ Y])2]

E [E [X | Y]] = E [X]なので、次のようになります。

(E [X | Y])= E [(E [X | Y])2] –(E [X])2

これは、無条件分散と期待値の関係から何とか似ています。

Var(X)= E [X2] –(E [X])2

条件付き分散を使用して分散を見つけることができます。

Var(X) = E[var(X|Y] + var(E[X|Y])

条件付き分散の例

バス停に到着した人が平均λtで分布し、バス停に到着した最初のバスが人とは無関係に間隔(0、T)に均一に分布している場合に、バスに乗車する旅行者数の平均と分散を求めます。到着したかどうか。

溶液:

任意の時間tの平均と分散を見つけるために、Yはバスが到着する時間の確率変数であり、N(t)は到着数です。

E [N(Y)| Y = t] = E [N(t)| Y = t]

YとN(t)の独立性による

=λt

N(t)は平均のポアソンであるため \lambda t
したがって

E [N(Y)| Y] =λY

だから期待を持って

E [N(Y)] = λE [Y] = λT / 2

Var(N(Y))を取得するには、条件付き分散式を使用します

こうして

(N(Y)| Y)= λY

E [N(Y)| Y] = λY

したがって、条件付き分散の式から、

Var(N(Y))= E [λY] +(λY)

=λT/2 + λ2T2/ 12

ここで、Var(Y)= Tという事実を使用しました2 / 12。

ランダムな数の確率変数の合計の分散

独立した同一のシーケンスを検討してください 配布 確率変数X1,X2,X3、………。 そして、このシーケンスから独立した別の確率変数Nは、次のようになります。 合計の分散 このシーケンスの

使用して

これは、個々の確率変数の分散と条件付き分散をランダム変数のシーケンスの合計に定義することで明らかです。

予測

予測では、ある確率変数の値は別の確率変数の観測に基づいて予測できます。確率変数Yの予測では、観測された確率変数がXの場合、予測値を示す関数としてg(X)を使用します。これにはYに近いg(X)を選択してみてください。これに最適なgはg(X)= E(Y | X)です。これには、不等式を使用してgの値を最小化する必要があります。

私たちが得ることができるこの不等式

ただし、Xが与えられると、Xの関数であるE [Y | X] -g(X)は定数として扱うことができます。 したがって、

これは必要な不等式を与えます

予測の例

1.人の身長は1フィートであることが観察されます。これは、現在xインチの息子の身長が平均x +4と分散XNUMXで正規分布している場合、大人になった後の息子の身長の予測はどうなるでしょうか。

解決策:Xを人の身長を表す確率変数、Yを息子の身長の確率変数とすると、確率変数Yは次のようになります。

Y = X + e + 1

ここで、eは、平均がゼロで分散がXNUMXの確率変数Xに依存しない正規確率変数を表します。

したがって、息子の身長の予測は

したがって、息子の身長は成長後73インチになります。

2.ロケーションAとロケーションBから信号を送信する例を考えてみましょう。ロケーションAから信号値sが送信され、ロケーションBで平均sと分散1の正規分布で受信され、Aで送信された信号Sが正規分布である場合平均\ muと分散\ sigma ^ 2を使用して、場所Aから送信された信号値Rが場所Bのrであるとどのように予測できますか?

解決策:信号値SとRは、ここでは正規分布の確率変数を示しています。最初に、Rが次のように与えられた条件付き密度関数Sを見つけます。

このKはSから独立しています。

ここもC1 およびC2 はSに依存しないため、条件付き密度関数の値は次のようになります。

Cもsに依存しないため、ロケーションAからRとして送信され、ロケーションBでrとして受信される信号は、平均と分散を伴う正規分布です。

この状況の平均二乗誤差は

線形予測子

XNUMXつの確率変数間の平均、分散、相関がわかっていても、同時確率密度関数が見つからない場合は常に、ある確率変数と別の確率変数の線形予測子が非常に役立ち、最小値を予測できます。したがって、確率変数Xに関する確率変数Yの線形予測子の場合、最小化するためにaとbを取ります。

ここで、aとbに関して部分的に区別します。

これらのXNUMXつの方程式をndbについて解くと、次のようになります。

したがって、この期待値を最小化すると、線形予測子は次のようになります。

ここで、平均は確率変数XとYのそれぞれの平均であり、線形予測子の誤差は次の期待値で取得されます。

条件付き分散
条件付き分散:予測のエラー

相関が完全に正または完全に負の場合、つまり相関係数が+1または-1の場合、この誤差はゼロに近くなります。

まとめ

さまざまな例を使用した離散確率変数と連続確率変数の条件付き分散について説明しました。予測における条件付き期待値の重要なアプリケーションのXNUMXつについても、適切な例と最良の線形予測子を使用して説明します。さらに読む必要がある場合は、以下のリンクを参照してください。

数学に関するその他の投稿については、 数学のページ

シェルドンロスによる確率の最初のコース

シャウムの確率と統計の概要

ROHATGIとSALEHによる確率と統計の紹介

上へスクロール