kernel density estimationについて
Stata本がCh.3まで進んだ,Ch.3の後半を担当したのですが,kernel density distributionでぶち当たった.ノンパラの推計方法の一つらしい.
Stata上のコマンドは,
.kdensity var_name
histogramコマンドのオプションでも利用可能.
以下,kernel density distributionについて僕なりに理解した内容を書いてみる.
- ヒストグラムに似たもの
- ヒストグラムはバンド幅とその中央値が1対1対応.kernelは違う.
- estimation point
の数を決める.
ごとに,すべてのxがどれだけ離れているかを評価する.
- 密度関数
の推定値は,
はカーネル関数と呼ばれる.
と
が近いほど,高い値になる.また,ある閾値以上離れていたら0
のまわりに多くのxがあるほど,密度が高くなる.
- 最後に,estimation pointsごとに均等化する.
直感的には,たぶんこんな感じ.間違えていたらご指摘お願いします.
Cameron and TrivediのStata本では,ヒストグラムをよりスムーズに描く手法として紹介されていた.Microeconometricsの方では,ノンパラの導入として,より詳しく書かれている.