H.O.g機能記述子

を取るH.O.Gがどのように機能するかを知る前に、この文脈での勾配が何であるかを教えてください。 例えば、次の画像を見てみましょう:

画像のグラデーション

ピクセルごとに左から右にステップすると、いくつかのステップの後、ピクセル値に急激な変化があることがわかります。 この色の急激な変化はグラデーションと呼ばれ、暗いトーンから明るいトーンに行くことは正のグラデーションと呼ばれ、その逆も同様です。 左から右に行くと水平方向の勾配が得られ、上から下に行くと垂直方向の勾配が得られます。

H.O.Gの仕組み

HOGはスライディングウィンドウに似たブロックと呼ばれるもので動作します。 ブロックは、ブロック内のピクセルの強度の変化の大きさと方向から勾配が構成されるピクセルグリッドと考えられます。

注意すべきこと:HOGはグレースケール画像で動作します。

1 — そのため、最初のステップはRGB画像をグレースケールに変換することです。

2 — 詳しく見るために、サイズ8*8のそのようなグリッドに焦点を当てましょう。 次の写真を見てください。

64ピクセルのブロックでは、各ピクセルについて、水平および垂直の勾配が計算されます。 上の写真のように、水平勾配と垂直勾配は次のように計算されます。

水平勾配:120-70=50
垂直勾配: 100 -50 = 50

3 — 勾配を取得したら、64ピクセルごとに勾配の大きさと勾配の角度と呼ばれるものを計算しようとします。

これらの64個の勾配ベクトルで、それらを9個のベクトルに圧縮して、最大構造を保持しようとします。 これを行うには、大きさと角度のヒストグラムをプロットしようとします。 ここで、x軸は角度であり、それらはそれぞれ20度のサイズの9つのビンにビン詰めされています。

注:9つのビンを作成することは、HOG paperの著者によって決定されます。 だから、それはどこでもかなり一定です。

上記の結果は1つの8*8グリッドのもので、表現を9つのベクトルに圧縮しました。

4—その8*8グリッドを画像全体に沿ってスライドさせ、ヒストグラムの結果を解釈しようとすると、以下のようなものが得られます。

5 — そして、HOGの特徴をプロットすることによって、オブジェクトまたは面の構造が十分に維持され、すべての重要でない特徴を失うことがわかります。

そして、そのような入力は、分類または回帰を行うために任意の機械学習アルゴリズムによって活用することができます。

それは今日でも使用されている非常に強力な技術であり、DLからの重いアーキテクチャを使用せずにオブジェクト検出を達成することができます。

HOG検出機能を取得するのに最適な場所は、ライブラリDlibからのものです。

圧縮形式で画像を表現するための古い便利なツールを知っていて、その構造を維持しているので、これを多くのコンピュータビジョンのユースケースに組

コメントを残す

メールアドレスが公開されることはありません。

More: