確率・統計

■条件付き確率

ある事象Xが起きるという条件の元で、事象Yが起こる確率。 P(Y|X)=P(X∩Y)/P(X) 最初はなぜP(X)が分母に来るのか分からなかったが、ベン図を書いてみると理解ができた。 ベイズの定理に繋がる大事な公式。条件付き確率を変形し、導くことが出来る。

 

ベイズの定理

P(YlX)=P(Y)P(XlY)/P(X) ただの式変形ではなく、事後確率P(Y|X)が事前確率P(Y)と尤度関数P(XlY)の積で表せることにある。 尤度関数は新しいデータによって更新することができるので、予測を扱う機械学習と相性が良い。

 

■確率変数

ある現象がいろいろな値を取るとき、とりうる値全てを確率変数Xで表す。

サイコロを例にすると確率変数は、

X ={1,2,3,4,5,6}

と表される。

 

■確率分布

ある事象が発生する確率を分布で表したもの。

有名な確率分布として、二項分布や正規分布ポアソン分布などがある。

 

■期待値

確率変数とその確率を乗算し、確率分布全てにおいて和をとったもの。

その確率分布において、もっともらしい値を示す。

 

■分散・偏差

サンプリングしたデータとその平均値の差をとり、平均したもの。

データのばらつき具合を表す。

分散はデータを二乗しており、元の次元と合わないため、平方根をとった偏差sを使用することがある。

 \displaystyle s^2 = \dispalystyle \frac{1}{n} \sum_{i = 1}^n {(x_i - \overline{x})^2}

 

■ベルヌーイ分布

何かを行った時に起こる結果が二つしかない試行のこと。 コイントスがわかりやすい(表と裏しか起きない) P(X|μ)=μ^X×(1-μ)^(1-μ) ロジスティック回帰などの二値分類でよく見かける。 マルチヌーイ分布は拡張版で、他クラス分類等で使用する。

 

正規分布

中心極限定理より、どんな確率分布でもその平均値に対しては正規分布を取ることからもっともよく見かける確率分布。