Preparação dos Dados
Dataset
Para o desenvolvimento de um modelo de Inteligência Artificial de Classificação, como é o caso da IA deste projeto, o primeiro passo é elaborar um dataset. Esse passo foi cumprido pelo próprio parceiro do projeto, o IPT, o qual reuniu sessenta imagens de drones:
- 30 imagens de fissuras térmicas (primeira categoria);
- 30 imagens de fissuras de retração (segunda categoria);
Percebe-se que esse dataset não é abrangente. Portanto, há um risco maior de falhas no modelo devido à falta de dados.
Pré-processamento
O segundo passo é o pré-processamento dos dados. Abaixo vê-se o exemplo de uma das imagens que a SOD recebeu.
Figura 1: Fissura de Retração Antes do Processamento

Fonte: IPT (2024?).
Para tratar essas imagens, resolveu-se por seguir o pré-processamento realizado por especialistas, como se segue:
- Redimensionamento de 640x640 (Ultranalytics, 2023)
- Conversão para a escala de cinza (CHUN, P. et al, 2020)
- Correção com filtro mediano (ibid.)
A primeira transformação foi feita para que o dataset se adequasse ao dataset de trincas criado pela Ultranalytics. Visa-se, com isso, reaproveitar imagens dessa coleção no treinamento ou na validação da primeira (filtro para fissuras) ou da segunda IA (classificação de fissuras).
A segunda transformação foi feita visando diminuir o tempo de cálculo da IA. Evidencia-se, porém, que para a seleção do valor do pixel central, não foi usada qualquer média do RGB. Em vez disso, aplicou-se o valor máximo dentre os canais, a fim de clarear a superfície que contém a rachadura, deixando-a mais evidente (ibid.).
A terceira transformação foi feita para que se diminuísse o efeito de sombras e contaminações nas imagens. Para tanto, aplicou-se o filtro mediano de 41x41, utilizando a biblioteca OpenCV. Segundo CHUN, P. et al(2020), apesar do tamanho do filtro não ter uma forte influência no resultado das imagens - filtros menores deixam as fissuras mais finas e vice-versa, o tamanho 41x41 permite a correção, sem grande influência no tamanho da fissura. Em seguida, aplicou-se a fórmula que se segue na imagem:
Figura 2: Fórmula de Correção
Fonte: CHUN, P. et al (2020).
Em que:
- Ia = imagem após a correção
- Ib = imagem antes da correção
- Im = filtro de mediana antes da correção
- bm = valor máximo do pixel (ibid.)
Isso permite que se corrija diferenças em contrastes e sombras sem que se perca variações locais pequenas, como as rachaduras. Isso pode ser percebido na Figura 3.
Figura 3: Fórmula de Correção

Fonte: CHUN, P. et al (2020).
Todas essas transformações estão expostas no seguinte arquivo: [src/IA_classificacao/pre-processamento/pre-processamento.py
] em que se define uma função para processar cada imagem e retorna a própria imagem filtrada.
Resultado
Abaixo, compara-se a imagem antes do tratamento e após o tratamento.
Figura 4: Comparação

Fonte: CHUN, P. et al (2020).
Legenda: À esquerda vê-se a imagem sem correção. À direita, a imagem pré-processada.
OBS: Para efeitos de comparação, redimensionou-se ambas as imagens.
Como se percebe, remove-se a complexidade da imagem transformando-a em escala de cinza. Além disso, as rachaduras estão mais realçadas (na medida do possível), enquanto algumas manchas, principalmente no centro da parede foram retiradas. Imagens como essa serão usadas no treinamento da IA na seção que se segue.
Bibliografia
-
CHUN, P.; IZUMI, S.; YAMANE, T. Automatic detection method of cracks from concrete surface imagery using two‐step light gradient boosting machine. Computer-Aided Civil and Infrastructure Engineering, v. 36, n. 1, p. 61–72, 20 maio 2020.
-
ULTRALYTICS. Crack Segmentation Dataset. Disponível em: https://docs.ultralytics.com/datasets/segment/crack-seg/. Acesso em: 8 maio. 2025.