Vzít na H. O. G Feature Deskriptor

předtím, Než vědět, jak H. O. G funguje, dejte nám vědět, jaké jsou přechody v této souvislosti. Vezměte následující obrázek například:

Přechody v obrazu

Když vyjdete zleva doprava pixel po pixelu, zjistíte, že po nějaké kroky, tam je náhlá změna v pixel hodnotu jsem.e, z černé nižší počet pixelů na bílé vyšší počet pixelů. Tato náhlá změna barvy se nazývá gradient a přechod z tmavšího tónu na světlejší tón se nazývá pozitivní gradient a naopak. Přechod zleva doprava nám dává horizontální gradient a podle očekávání přechod shora dolů dává vertikální gradient.

jak funguje H. O. G

HOG pracuje s něčím, co se nazývá blok, který je podobný posuvnému oknu. Blok je považován za mřížku pixelů, ve které jsou gradienty tvořeny z velikosti a směru změny intenzit pixelu v bloku.

Věci na vědomí: PRASE funguje na obrázky ve stupních šedi.

1 — Prvním krokem by tedy bylo převést obraz RGB na stupně šedi.

2 — dostat Se blíže podívat, pojďme se zaměřit na jeden takový mřížce velikosti 8*8. Podívejte se na následující obrázek.

V bloku 64 pixelů, pro každý pixel, horizontální a vertikální přechody jsou vypočteny. Jako ve výše uvedeném obrázku, horizontální a vertikální přechody jsou vypočteny jako :

Horizontální Gradient: 120 -70 = 50
Vertikální Gradient : 100 -50 = 50

3 — Jakmile budeme mít sklony se snažíme vypočítat něco, co se nazývá gradient velikost a úhel sklonu pro každý z 64 pixelů.

Teď s těmi 64 gradientních vektorů, zkusíme komprimovat je do 9 vektorů, se snaží zachovat maximální struktury. K tomu se snažíme vykreslit histogram velikostí a úhlů. Zde je osa x úhly a jsou vázány do 9 koše každý o velikosti 20 stupňů.

poznámka: o vytvoření 9 popelnic rozhodují autoři prasečího papíru. Takže je to skoro všude konstantní.

výše uvedené výsledky jsou pro jednu 8*8 grid a my stlačený zastoupení na 9 vektory.

4 — Když jsme slide 8*8 mřížka po celý obrázek a pokusit se interpretovat histogram výsledků dostaneme něco jako níže.

5 — A vynesením PRASE funkce, zjistíme, že struktura objektu nebo obličeje, je dobře udržován, ztrácí všechny bezvýznamné funkce.

A jako vstup lze využít podle libovolného algoritmu Strojového Učení, aby udělat klasifikaci nebo regresi.

je to velmi silná technika, která se používá dodnes a detekce objektů lze dosáhnout bez použití těžkých architektur od DL.

nejlepší místo pro získání funkce detekce prasat je z knihovny Dlib.

Nyní, když znáte Starý šikovný nástroj, který reprezentuje obraz v komprimovaném formátu a stále udržuje jeho strukturu, můžete jej začlenit do mnoha případů použití počítačového vidění.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.

More: