kernel density estimationについて

Stata本がCh.3まで進んだ,Ch.3の後半を担当したのですが,kernel density distributionでぶち当たった.ノンパラの推計方法の一つらしい.
Stata上のコマンドは,
.kdensity var_name
histogramコマンドのオプションでも利用可能.

以下,kernel density distributionについて僕なりに理解した内容を書いてみる.

  • ヒストグラムに似たもの
  • ヒストグラムはバンド幅とその中央値が1対1対応.kernelは違う.
  • estimation pointx_0の数を決める.
  • x_0ごとに,すべてのxがどれだけ離れているかを評価する.
  • 密度関数f(x)の推定値は, \hat f(x_0) = \frac{1}{Nh} \sum^N_{i=1}k(\frac{x_i - x_0}{h})
  • k(.)カーネル関数と呼ばれる.x_0xが近いほど,高い値になる.また,ある閾値以上離れていたら0
  • x_0のまわりに多くのxがあるほど,密度が高くなる.
  • 最後に,estimation pointsごとに均等化する.

直感的には,たぶんこんな感じ.間違えていたらご指摘お願いします.

Cameron and TrivediのStata本では,ヒストグラムをよりスムーズに描く手法として紹介されていた.Microeconometricsの方では,ノンパラの導入として,より詳しく書かれている.