O que é uma pirâmide gaussiana?

A pirâmide gaussiana é uma técnica no processamento de imagens que decompõe uma imagem em grupos sucessivamente menores de pixels, em etapas repetidas, com o objetivo de desfocá-la. É nomeado em homenagem ao matemático alemão Johann Carl Friederich Gauss. Esse tipo de desfoque matemático preciso é usado extensivamente na visão computacional artificialmente inteligente como uma etapa de pré-processamento. Por exemplo, quando uma fotografia digital é desfocada dessa maneira, as bordas dos objetos são muito mais fáceis de detectar, permitindo que um computador as identifique automaticamente.

Como funciona?

A "pirâmide" é construída calculando repetidamente uma média ponderada dos pixels vizinhos de uma imagem de origem e redimensionando a imagem para baixo. Pode ser visualizado empilhando versões progressivamente menores da imagem umas sobre as outras. Esse processo cria uma forma de pirâmide na qual a base da pirâmide é a imagem original e a ponta é um único pixel que representa o valor médio da imagem inteira.

Termos de programação