kernel density estimationについて
Stata本がCh.3まで進んだ,Ch.3の後半を担当したのですが,kernel density distributionでぶち当たった.ノンパラの推計方法の一つらしい.
Stata上のコマンドは,
.kdensity var_name
histogramコマンドのオプションでも利用可能.
以下,kernel density distributionについて僕なりに理解した内容を書いてみる.
- ヒストグラムに似たもの
- ヒストグラムはバンド幅とその中央値が1対1対応.kernelは違う.
- estimation pointの数を決める.
- ごとに,すべてのxがどれだけ離れているかを評価する.
- 密度関数の推定値は,
- はカーネル関数と呼ばれる.とが近いほど,高い値になる.また,ある閾値以上離れていたら0
- のまわりに多くのxがあるほど,密度が高くなる.
- 最後に,estimation pointsごとに均等化する.
直感的には,たぶんこんな感じ.間違えていたらご指摘お願いします.
Cameron and TrivediのStata本では,ヒストグラムをよりスムーズに描く手法として紹介されていた.Microeconometricsの方では,ノンパラの導入として,より詳しく書かれている.