Before knowing how H. O. G works let us know what are gradients in this context. Levar a imagem a seguir, por exemplo,:
Quando passo da esquerda para a direita, pixel-a-pixel, você vai descobrir que, depois de alguns passos, há uma mudança repentina no valor de pixel eu.e, a partir de um preto menor o número de pixels para um branco mais o número de pixels. Esta mudança súbita na cor é chamada de gradiente e passar de um tom mais escuro para um tom mais claro é chamado de gradiente positivo e vice-versa. Ir da esquerda para a direita dá-nos o gradiente horizontal e, como esperado, ir de cima para baixo dá um gradiente vertical.
How the H. O. G works
HOG works with something called a block which is similar to a sliding window. Um bloco é considerado como uma grade de pixels em que gradientes são constituídos a partir da magnitude e direção de mudança nas intensidades do pixel dentro do bloco.
observe o seguinte: HOG funciona em imagens em tons de cinza.
1 — Então o primeiro passo seria converter uma imagem RGB para tons de cinza.
2 — Para obter um olhar mais atento, vamos nos concentrar em uma grade de tamanho 8*8. Veja a seguinte foto.
No bloco de 64 pixels, para cada pixel, horizontal e vertical, os gradientes calculados. Como na imagem acima, horizontal e vertical, os gradientes são calculados como :
Gradiente Horizontal: 120 -70 = 50
Gradiente Vertical : 100 -50 = 50
3 — uma Vez que temos os gradientes tentamos calcular algo chamado gradiente de magnitude e ângulo do gradiente para cada um dos 64 pixels.
Agora, com os 64 gradiente de vetores, podemos tentar comprimi-los a 9 de vetores, tentando manter o máximo de estrutura. Para fazer isso, tentamos traçar um histograma de magnitudes e ângulos. Aqui o eixo x é ângulos e eles são colocados em 9 caixas cada um com um tamanho de 20 graus.Nota: A criação de 9 caixas é decidida pelos autores do papel de porco. Por isso é praticamente constante em todo o lado.
Os resultados acima são para uma 8*8 grade e nós comprimido a representação de 9 de vetores.
4-Quando deslizamos essa grade de 8*8 ao longo de toda a imagem e tentamos interpretar os resultados do histograma obtemos algo como abaixo.
5 — E traçando o DEVORADOR de recursos, vamos encontrar que a estrutura do objeto ou rosto está bem mantido, a perda de todos os insignificante recursos.
E tais entrada pode ser aproveitado por qualquer algoritmo de Aprendizado de Máquina para fazer a classificação ou regressão.
é uma técnica muito poderosa sendo usada ainda hoje e a detecção de objetos pode ser alcançada sem o uso de arquiteturas pesadas de DL.
o melhor lugar para obter a funcionalidade de detecção de porcos é a biblioteca Dlib.
agora que você conhece uma ferramenta útil antiga para representar uma imagem em um formato comprimido e ainda mantém a estrutura dele, você pode incorporar isso em muitos casos de uso de visão de computador.