コレログラム分析に使う自己相関、偏自己相関分析について

情報分析
にほんブログ村 為替ブログ FX投資情報へ
にほんブログ村 にほんブログ村に登録しています。 よければクリックお願いします!

今回は、以前のコレログラム分析記事でも簡単に触れた自己相関分析と偏自己相関分析について、改めて詳細に説明しようと思います。

自己相関係数について

自己相関分析とは、時系列データの自己相関を調べることで、過去のデータが現在のデータにどのような影響を与えているかを分析する手法です。自己相関分析により、データの周期性やトレンド、ランダムな要素を把握し、未来の予測やトレンドの予想に役立てることができます。

例えば、株価のデータを時系列データとして扱った場合、ある日の株価が前日の株価にどの程度影響を受けているかを自己相関分析で調べることができます。具体的には、時点1と時点2の株価データがどの程度相関しているか、時点1と時点3の株価データがどの程度相関しているかなどを調べることができます。

以下で述べるように相関分析では、2つの変数X,Yデータの集まりについて、それぞれの関係を調べる分析を行うのですが、自己相関ではX=日経平均指数:現時点から遡って100コのデータ、Y=日経平均指数宇:(現時点-10)から遡って100コのデータ、という風に同じ指標を時間をずらして別のものとして扱います。

そもそも相関分析とは

自己相関に関連して、そもそも相関とは何かを説明します。

相関分析とは、2つの変数の間にどの程度の関連性があるかを調べる統計分析のことです。変数は数値データである必要があります。

2つの変数が正の相関を持つ場合、片方が増加するともう一方も増加する傾向があります。逆に、負の相関を持つ場合、片方が増加するともう一方は減少する傾向があります。

相関分析の一般的な計算式は、以下の通りです。

2つの変数XとYがあり、n個のデータがあるとします。

相関係数は-1から1までの値をとり、1に近づくほど強い正の相関があることを示し、-1に近づくほど強い負の相関があることを示します。0に近い場合、相関はほとんどないと言えます。

  1. 平均値を計算します。
    • Xの平均値: X̄
    • Yの平均値: Ȳ
  2. 分散を計算します。
    • Xの分散: Sx^2
    • Yの分散: Sy^2
  3. 共分散を計算します。
    • XとYの共分散: Sxy
  4. 相関係数を計算します。
    • 相関係数: r = Sxy / (Sx * Sy)

計算式で書くと共分散等また異なる数値について解説が必要になるのですが、相関係数の計算自体はエクセルで簡単に出来てしまいます。

エクセルで相関係数を計算するには、CORREL関数を使用します。例えば、A列とB列にそれぞれデータが入力されている場合、以下のように書くことができます。

=CORREL(A1:A10, B1:B10)

この関数は、A列とB列の各データ点の間の相関係数を計算し、結果を返します。相関係数は-1から1の範囲で値を取り、1に近いほど強い正の相関があり、-1に近いほど強い負の相関があることを示します。0に近い場合、相関はほとんどないと言えます。

偏自己相関分析について

偏自己相関分析は、自己相関分析の一種であり、ある変数の影響を除いた時系列データの自己相関を調べることで、個々の変数の影響を分離する手法です。

偏自己相関分析は、時系列データの分析において、特にトレンドや季節性のあるデータにおいて有用です。

偏自己相関分析では、ある時点tにおける時系列データの値をytとします。このytを説明するために、直前の時点t-1までの値y1, y2, …, yt-1を使った線形回帰モデルを考えます。

つまり、yt = β0 + β1y1 + β2y2 + … + βp-1yt-1 + ε
という式で表現される回帰モデルを考えます。ここで、β0, β1, β2, …, βp-1は回帰係数であり、εは誤差項です。

偏自己相関係数は、この回帰モデルで用いられる回帰係数の推定値を用いて計算されます。具体的には、ytとyt-k(k=1,2,…,p-1)の偏自己相関係数は、回帰係数を推定するときにytとyt-k以外のすべての説明変数を用いたときのytとyt-kの相関係数から求められます。

偏自己相関係数は、時系列データの自己相関係数と同様に、-1から1までの値を取ります。一般的に、偏自己相関係数が0である場合、ytとyt-kの間には独立な関係があると解釈されます。偏自己相関係数が正である場合、ytとyt-kの間に正の相関があることを示し、負である場合は負の相関があることを示します。

何をやっているのかいまいちわかりづらいですが、つまりは偏自己相関分析は、特定の要因を取り除いた上で、その要因が取り除かれた後のデータ同士の相関を調べる方法です。これによって、その要因が与える影響を分離することができます。

線形回帰モデルについては、Trading View等で線形回帰チャネルを引く際計算式を確認された方もいるでしょう。以前記事でも説明した内容の繰り返しですが、

要はデータの集まりについて、図にプロットし最も分散の少ないところ(中央らしいところ)に近似直線を引いて傾きや切片を計算するのが回帰係数の考え方です。

偏自己相関に話を戻すと、2つの時間軸をずらしたデータについて回帰分析したうえで自己相関分析するということなのです。

こうすることで、例えば季節により大きく需給がばらつくパターンでもその影響を排除して分析できます。

コメント

タイトルとURLをコピーしました