A Take on H. O. G Feature Descriptor

Before know how how H. O. G works we know what are gradients in this context. Ota esimerkiksi seuraava kuva:

gradientit kuvassa

kun astut vasemmalta oikealle pikseli pikseliltä, huomaat, että joidenkin vaiheiden jälkeen pikselin arvo muuttuu äkisti eli mustasta Pienemmästä pikseliluvusta valkoiseen korkeampaan pikselilukuun. Tätä äkillistä värin muutosta kutsutaan gradientiksi ja siirtymistä tummemmasta sävystä vaaleampaan kutsutaan positiiviseksi gradientiksi ja päinvastoin. Vasemmalta oikealle meneminen antaa meille vaakasuoran kaltevuuden ja odotetusti ylhäältä alas meneminen antaa pystysuoran kaltevuuden.

How the H. O. G works

HOG works with something called a block which is similar to a sliding window. Lohkoa pidetään pikseliruudukkona, jossa gradientit muodostuvat lohkon sisällä olevan pikselin intensiteettien muutoksen suuruudesta ja suunnasta.

huomioitavaa: HOG työstää harmaasävykuvia.

1 — ensimmäinen askel olisi siis muuntaa RGB-kuva harmaasävyksi.

2 — lähempää tarkastelua varten keskitytään yhteen tällaiseen ruudukkoon, jonka koko on 8 * 8. Katso seuraavaa kuvaa.

64 pikselin lohkossa kullekin pikselille lasketaan vaaka-ja pystysuuntaiset kaltevuudet. Kuten yllä olevassa kuvassa, vaaka-ja pystykaltevuus lasketaan seuraavasti:

Vaakagradientti: 120 -70 = 50
Pystykaltevuus : 100 -50 = 50

3 — Kun saamme gradientit, yritämme laskea jotain, jota kutsutaan gradientin suuruudeksi ja gradienttikulmaksi jokaiselle 64 pikselille.

nyt noilla 64 gradienttivektorilla yritämme puristaa ne 9 vektoriin, yrittäen säilyttää maksimirakenteen. Voit tehdä tämän yritämme piirtää histogrammi magnitudeja ja kulmia. Tässä x-akseli on kulmat ja ne on binned osaksi 9 astiat kunkin Koko 20 astetta.

Huom: SIKAPAPERIN laatijat päättävät 9 astiaston perustamisesta. Joten se on melko vakio kaikkialla.

yllä olevat tulokset ovat yhdelle 8 * 8 ruudukolle ja pakkasimme edustuksen 9 vektoriin.

4 – kun liu’utamme tuota 8 * 8 ruudukkoa pitkin koko kuvaa ja yritämme tulkita histogrammin tuloksia, saamme jotain alle.

5 — ja piirtämällä sian ominaisuuksia huomaamme, että esineen tai kasvojen rakenne on hyvin säilynyt ja menettää kaikki merkityksettömät piirteet.

ja tällainen panos voidaan hyödyntää millä tahansa koneoppimisen algoritmilla luokituksen tai regression tekemiseen.

se on erittäin tehokas tekniikka, jota käytetään vielä tänäkin päivänä ja objektien tunnistus voidaan saavuttaa ilman DL: n raskaita arkkitehtuureja.

paras paikka saada HOG detection-toiminto on kirjastosta Dlib.

nyt kun tunnet vanhan kätevän työkalun, jolla voit esittää kuvan pakatussa muodossa ja säilyttää sen rakenteen, voit sisällyttää tämän moniin tietokonenäön käyttötapauksiin.

Vastaa

Sähköpostiosoitettasi ei julkaista.

More: