o ia pe H. O. G caracteristică Descriptor

înainte de a ști cum funcționează H. O. G să ne spui ce sunt gradienți în acest context. Luați următoarea imagine, de exemplu:

gradienți în imagine

când pas de la stânga la dreapta pixel cu pixel, veți găsi că, după câțiva pași, există o schimbare bruscă a valorii pixel adică, de la un număr de pixeli negru mai mic la un număr de pixeli alb mai mare. Această schimbare bruscă a culorii se numește gradient și trecerea de la un ton mai întunecat la un ton mai deschis se numește gradient pozitiv și invers. Trecerea de la stânga la dreapta ne oferă gradientul orizontal și, așa cum era de așteptat, trecerea de sus în jos oferă un gradient vertical.

cum funcționează H. O. G

HOG funcționează cu ceva numit un bloc care este similar cu o fereastră glisantă. Un bloc este considerat ca o grilă de pixeli în care gradienții sunt constituiți din magnitudinea și direcția de schimbare a intensităților pixelului din bloc.

lucruri de reținut: HOG funcționează pe imagini în tonuri de gri.

1 — deci, primul pas ar fi să convertiți o imagine RGB în tonuri de gri.

2 — Pentru a arunca o privire mai atentă, să ne concentrăm pe o astfel de grilă de dimensiune 8*8. Uită-te la următoarea imagine.

în blocul de 64 de pixeli, pentru fiecare pixel, se calculează gradienții orizontali și verticali. Ca și în imaginea de mai sus, gradienții orizontali și verticali sunt calculați ca:

Gradient orizontal: 120 -70 = 50
Gradient Vertical : 100 -50 = 50

3 — Odată ce obținem gradienții, încercăm să calculăm ceva numit magnitudinea gradientului și unghiul gradientului pentru fiecare dintre cei 64 de pixeli.

acum, cu cei 64 de vectori de gradient, încercăm să-i comprimăm la 9 vectori, încercând să păstrăm structura maximă. Pentru a face acest lucru, încercăm să trasăm o histogramă de magnitudini și unghiuri. Aici axa x este unghiuri și sunt binned în 9 containere fiecare cu o dimensiune de 20 de grade.

notă: crearea a 9 coșuri este decisă de autorii lucrării HOG. Deci, este destul de mult constantă peste tot.

rezultatele de mai sus sunt pentru o grilă 8*8 și am comprimat reprezentarea la 9 vectori.

4 — Când glisăm acea grilă 8*8 de-a lungul întregii imagini și încercăm să interpretăm rezultatele histogramei, obținem ceva de genul de mai jos.

5 — și prin trasarea caracteristicilor porcului vom constata că structura obiectului sau a feței este bine întreținută, pierzând toate caracteristicile nesemnificative.

și o astfel de intrare poate fi folosită de orice algoritm de învățare automată pentru a face clasificarea sau regresia.

este o tehnică foarte puternică folosită și astăzi, iar detectarea obiectelor poate fi realizată fără utilizarea arhitecturilor grele de la dl.

cel mai bun loc pentru a obține funcționalitatea de detectare a porcilor este din biblioteca Dlib.

acum, că știți un instrument vechi la îndemână pentru a reprezenta o imagine într-un format comprimat și menține în continuare structura acesteia, puteți încorpora acest lucru în multe cazuri de utilizare a viziunii pe computer.

Lasă un răspuns

Adresa ta de email nu va fi publicată.

More: