předtím, Než vědět, jak H. O. G funguje, dejte nám vědět, jaké jsou přechody v této souvislosti. Vezměte následující obrázek například:
Když vyjdete zleva doprava pixel po pixelu, zjistíte, že po nějaké kroky, tam je náhlá změna v pixel hodnotu jsem.e, z černé nižší počet pixelů na bílé vyšší počet pixelů. Tato náhlá změna barvy se nazývá gradient a přechod z tmavšího tónu na světlejší tón se nazývá pozitivní gradient a naopak. Přechod zleva doprava nám dává horizontální gradient a podle očekávání přechod shora dolů dává vertikální gradient.
jak funguje H. O. G
HOG pracuje s něčím, co se nazývá blok, který je podobný posuvnému oknu. Blok je považován za mřížku pixelů, ve které jsou gradienty tvořeny z velikosti a směru změny intenzit pixelu v bloku.
Věci na vědomí: PRASE funguje na obrázky ve stupních šedi.
1 — Prvním krokem by tedy bylo převést obraz RGB na stupně šedi.
2 — dostat Se blíže podívat, pojďme se zaměřit na jeden takový mřížce velikosti 8*8. Podívejte se na následující obrázek.
V bloku 64 pixelů, pro každý pixel, horizontální a vertikální přechody jsou vypočteny. Jako ve výše uvedeném obrázku, horizontální a vertikální přechody jsou vypočteny jako :
Horizontální Gradient: 120 -70 = 50
Vertikální Gradient : 100 -50 = 50
3 — Jakmile budeme mít sklony se snažíme vypočítat něco, co se nazývá gradient velikost a úhel sklonu pro každý z 64 pixelů.
Teď s těmi 64 gradientních vektorů, zkusíme komprimovat je do 9 vektorů, se snaží zachovat maximální struktury. K tomu se snažíme vykreslit histogram velikostí a úhlů. Zde je osa x úhly a jsou vázány do 9 koše každý o velikosti 20 stupňů.
poznámka: o vytvoření 9 popelnic rozhodují autoři prasečího papíru. Takže je to skoro všude konstantní.
výše uvedené výsledky jsou pro jednu 8*8 grid a my stlačený zastoupení na 9 vektory.
4 — Když jsme slide 8*8 mřížka po celý obrázek a pokusit se interpretovat histogram výsledků dostaneme něco jako níže.
5 — A vynesením PRASE funkce, zjistíme, že struktura objektu nebo obličeje, je dobře udržován, ztrácí všechny bezvýznamné funkce.
A jako vstup lze využít podle libovolného algoritmu Strojového Učení, aby udělat klasifikaci nebo regresi.
je to velmi silná technika, která se používá dodnes a detekce objektů lze dosáhnout bez použití těžkých architektur od DL.
nejlepší místo pro získání funkce detekce prasat je z knihovny Dlib.
Nyní, když znáte Starý šikovný nástroj, který reprezentuje obraz v komprimovaném formátu a stále udržuje jeho strukturu, můžete jej začlenit do mnoha případů použití počítačového vidění.