Primeiro Modelo - ResNet-18

Este modelo desenvolvido pela SOD utiliza a arquitetura ResNet-18 como baseline inicial para classificação de fissuras. O modelo apresentou resultados satisfatórios e serviu como uma implementação sólida para validação da abordagem técnica.

Por que Começar com ResNet-18?

O ResNet-18 foi selecionado como ponto de partida pelos seguintes critérios:

Prototipagem rápida: 11.7M parâmetros, adequado para validação inicial
Transfer learning: Aproveitamento de conhecimento pré-treinado no ImageNet
Baseline estabelecida: Referência para desenvolvimento de modelos avançados
Implementação conhecida: Arquitetura bem documentada para desenvolvimento ágil

Configurações e Implementação

Arquitetura

Base: ResNet-18 pré-treinado no ImageNet
Entrada: Imagens 224×224 pixels, 3 canais RGB
Classificador: Três camadas lineares (512→256→2) com dropout

Treinamento

Épocas: 50 com early stopping (paciência 10)
Batch Size: 32
Learning Rate: 1e-3 com scheduler Cosine Annealing
Data Augmentation: Rotação, flips, variação de brilho/contraste, CLAHE

Resultados Obtidos

O ResNet-18 apresentou resultados consistentes e satisfatórios para a tarefa de classificação de fissuras:

Tabela 1: Métricas do ResNet-18

Métrica	Valor	Avaliação
Acurácia	91.5%	Resultado satisfatório
Precisão	92.3%	Boa capacidade de classificação
Recall	90.8%	Detecção adequada de fissuras
F1-Score	91.5%	Desempenho equilibrado

Fonte: Experimentos realizados pelos Autores com validação cruzada 5-fold (2025).

Embasamento das métricas: Os valores foram obtidos através de múltiplas execuções com diferentes seeds aleatórias, demonstrando consistência nos resultados e validando a eficácia da abordagem.

Desempenho e Características

Pontos Fortes

O modelo ResNet-18 demonstrou:

Generalização adequada: Performance consistente entre treino e validação
Estabilidade: Métricas reproducíveis entre diferentes execuções
Eficiência: Tempo de treinamento e inferência adequados
Robustez: Comportamento confiável em imagens de teste

Análise Técnica

A implementação apresentou características positivas:

Aprendizado efetivo: Boa capacidade de distinção entre fissuras e não-fissuras
Utilização de features: Aproveitamento adequado do conhecimento pré-treinado
Arquitetura apropriada: Capacidade suficiente para o problema específico
Desempenho consistente: Resultados estáveis em diferentes cenários

Decisão de Implementação

Embora o ResNet-18 tenha apresentado resultados satisfatórios, a equipe optou por:

Implementar o Swin Transformer V2 no frontend do sistema SOD
Manter o ResNet-18 como modelo alternativo válido
Utilizar ambos os modelos para comparação e validação
Focar no Swin Transformer V2 como solução principal

Contribuições para o Projeto

O ResNet-18 forneceu:

Validação do pipeline: Estabelecimento da infraestrutura de treinamento
Benchmark sólido: Referência para avaliar outras abordagens
Aprendizado técnico: Insights sobre o problema de classificação de fissuras
Base para comparação: Modelo de referência para avaliar melhorias

Conclusões

O modelo ResNet-18 demonstrou ser uma solução eficaz para classificação de fissuras, cumprindo adequadamente seu papel como baseline inicial. Seus resultados satisfatórios validaram a abordagem técnica e forneceram uma base sólida para o desenvolvimento do projeto.

A escolha pelo Swin Transformer V2 para implementação no frontend representa uma decisão estratégica para explorar arquiteturas mais modernas, mantendo o ResNet-18 como uma alternativa comprovadamente eficaz.

Esta abordagem dupla demonstra a maturidade técnica do projeto, oferecendo tanto uma solução consolidada (ResNet-18) quanto uma implementação de vanguarda (Swin Transformer V2) para classificação de fissuras em inspeção de infraestrutura.

A experiência com o ResNet-18 estabeleceu uma base sólida de conhecimento que informou as decisões subsequentes no desenvolvimento da solução de IA, contribuindo para o sucesso geral do sistema SOD.

Bibliografia

HE, Kaiming et al. Deep Residual Learning for Image Recognition. IEEE CVPR, 2016.
GOODFELLOW, Ian; BENGIO, Yoshua; COURVILLE, Aaron. Deep Learning. MIT Press, 2016.

Por que Começar com ResNet-18?​

Configurações e Implementação​

Arquitetura​

Treinamento​

Resultados Obtidos​

Desempenho e Características​

Pontos Fortes​

Análise Técnica​

Decisão de Implementação​

Contribuições para o Projeto​

Conclusões​

Bibliografia​