Como funciona

Deep Learning directamente en 3D

A diferenza doutros enfoques, VL3D++ non converte a nube en imaxes 2D.
A aprendizaxe realízase directamente sobre a estrutura espacial dos puntos.
Isto permite:

Maior precisión xeométrica
Mellor comprensión de formas complexas
Aplicación en dominios moi distintos co mesmo enfoque

Como se fai?

Veciñanzas e campos receptivos

Son a base da entrada aos modelos. VL3D++ utiliza veciñanzas esféricas ou rectangulares para capturar a contorna local de cada punto. Empréganse métodos avanzados como o Grid Subsampling (división en celas), FPS (Furthest Point Sampling) para unha cobertura óptima, e versións xerárquicas que permiten á rede aprender características a diferentes escalas de resolución.

Arquitecturas neuronais

O framework implementa o estado da arte en procesamento 3D. Soporta dende o clásico PointNet/PointNet++ ata convolucións sobre puntos (KPConv) e redes de convolución dispersa (Sparse 3D) que optimizan drasticamente o uso de memoria. Estes modelos adoitan envolverse en estruturas de tipo autocodificador xerárquico (U-Net) para unha segmentación densa e precisa.

Inferencia

Os modelos adestrados intégranse nun Predictive Pipeline. Durante a inferencia, procésase a nube por bloques ou veciñanzas solapadas, permitindo analizar nubes de puntos masivas que superan a capacidade da memoria RAM mediante secuenciadores especializados.

O pipeline completo de VL3D++

01/Importar a nube de puntos en bruto

VL3D++ traballa directamente sobre nubes de puntos 3D xeradas por LiDAR aéreo ou terrestre, fotogrametría, escáneres 3D, reconstrucións volumétricas (TAC/RM), sensores de profundidade, batimetría ou escaneo industrial, etc. Opera sobre a xeometría 3D sen necesidade de converter os datos en imaxes nin pasar por representacións 2D intermedias.

02/Preprocesado

Aplicación de compoñentes de Data Mining para a extracción de características xeométricas, volumétricas, de altura e cor (HSV). Uso de Transformers para a normalización e limpeza de datos (Imputers), xunto a Decoradores que permiten o submostraxe intelixente (FPS) e o suavizado da estrutura (Simple smoother).

03/Selección de puntos e definición da súa veciñanza

Para poder analizar a nube, o sistema non procesa todos os puntos á vez. Selecciona puntos de interese e define a súa veciñanza local, é dicir, o conxunto de puntos próximos que achegan contexto xeométrico. Esa veciñanza defínese mediante volumes xeométricos como esferas, cubos ou cilindros que encapsulan a contorna espacial de cada punto.

04/Adestramento

Configuración modular mediante arquivos JSON que definen o fluxo exacto do pipeline. Inclúe estratexias avanzadas de validación como Stratified K-folding, técnicas de balanceo de clases (SMOTE) e optimización dinámica de hiperparámetros (Grid/Random Search).

04.1/Campo receptivo: ordenar o desordenado

As nubes de puntos son desordenadas por natureza. Unha rede neuronal necesita entradas ordenadas e de tamaño fixo. Aquí está unha das claves técnicas de VL3D++. As veciñanzas transfórmanse en estruturas regulares chamadas campos receptivos. Esta é a clave: converter puntos desordenados en entradas que unha rede neuronal poida procesar.

04.2/Procesamento Deep Learning en 3D

Os campos receptivos alimentan á rede neuronal profunda. A rede aprende patróns xeométricos complexos directamente sobre a estrutura 3D, sen traballar con imaxes nin proxeccións 2D.

04.3/Predición sobre cada fragmento de nube

O modelo xera unha predición para cada campo receptivo, asignando clases e niveis de confianza aos puntos analizados nesa contorna local. Neste punto, o resultado aínda está fragmentado en pequenas porcións de nube.

04.4/Propagación e reconstrución da nube completa

As predicións locais propáganse e agréganse ata reconstruír a nube de puntos orixinal, agora completamente clasificada. Este proceso repítese de forma sistemática ata cubrir toda a nube.

05/Predición e avaliación do modelo: erros, incerteza e métricas

Xeración dun Predictive Pipeline serializado que encapsula todo o coñecemento do modelo. Avaliación automática de resultados mediante métricas estándar (OA, R, P, F1-score, IoU) e creación de informes visuais detallados. Unha vez construído o modelo, o sistema xera información adicional para avaliar a calidade do resultado: • Zonas onde o modelo se equivoca • Zonas onde o modelo ten dúbidas • Métricas cuantitativas estándar punto a punto.

Como aprende o modelo a clasificar mellor as nubes de puntos?

O modelo aprende, detecta onde dubida, o experto corrixe erros e o sistema mellora só.

Paradigma "Human-in-the-loop".
Un enfoque de adestramento semiautomático onde un experto humano (oráculo) colabora co modelo. Permite traballar con grandes volumes de datos non etiquetados, optimizando o tempo de supervisión manual.

Ciclo de Refinamento Iterativo.
O proceso comeza cun "orzamento inicial" (un pequeno conxunto de datos etiquetados). O modelo adestra, predí sobre o resto da nube e o experto intervén para corrixir e validar os resultados máis críticos.

Selección Guiada por Incerteza.
O sistema identifica automaticamente as rexións onde o modelo ten máis dúbidas (alta incerteza). O experto só etiqueta estas zonas clave, o que maximiza a mellora do modelo co mínimo esforzo humano.

Eficiencia no Etiquetado.
Ao centrar a atención humana nos puntos máis informativos, lógrase unha precisión de vangarda sen a necesidade de procesar manualmente miles de millóns de puntos de forma exhaustiva.

Métricas que validan o resultado

Cada clasificación acompáñase de métricas estándar
que permiten avaliar obxectivamente o resultado:

Exactitude Global

É a porcentaxe total de acertos do modelo. Indica cantos puntos, de entre todos os procesados, foron asignados á súa categoría correcta. É a métrica máis sinxela para entender o rendemento xeral.

Precisión

Mide a fiabilidade das predicións do modelo. Se o modelo clasifica un punto como "árbore", a precisión indica que probabilidade hai de que realmente o sexa, evitando falsas alarmas.

Exhaustividade

Avalía a capacidade do modelo para atopar todos os elementos dunha clase. Unha exhaustividade alta significa que o modelo identifica case todos os obxectos presentes (por exemplo, edificios), sen deixar case ningún fóra.

Puntuación F1

É unha combinación equilibrada entre a precisión e a exhaustividade. Proporciona unha visión conxunta da calidade do modelo, asegurando que sexa tanto fiable como capaz de detectar a maioría dos puntos.

Jaccard Index

Mide canto se solapa a predición do modelo coa realidade. É unha métrica fundamental en segmentación 3D que premia que a silueta predita encaixe perfectamente coa real.

wP, wR, wF1, wIoU

Versións das métricas anteriores que se axustan segundo a abundancia de cada categoría. Evitan que o éxito en clases moi frecuentes (como o terreo) enmascare erros en clases escasamente representadas (como o mobiliario urbano).

MCC

É unha métrica que mide a correlación real entre as predicións do modelo e a realidade física. A diferenza doutras métricas, ten en conta todos os acertos e erros (tanto positivos como negativos) de forma equilibrada. O seu valor oscila entre -1 e +1, onde +1 indica un modelo perfecto, 0 un rendemento non mellor que o azar, e -1 unha total contradición; o que a converte nunha das probas de fiabilidade máis esixentes en ciencia de datos.

Kappa

Mide canto mellor é o modelo en comparación cunha clasificación feita por puro azar. É unha garantía extra de que os resultados son froito da aprendizaxe real do sistema.

Fomentamos un ecosistema de innovación aberta e colaboración continua entre a academia e a industria. O noso equipo técnico e investigador pode orientarte para explorar como aplicar VL3D++ no teu caso, colaborar en investigación ou estudar vías de transferencia tecnolóxica. Todo aquel interesado na clasificación profesional de nubes de puntos, ou que requira o desenvolvemento dalgunha funcionalidade técnica concreta para os seus fluxos de traballo, pode poñerse en contacto directamente co noso equipo de desenvolvemento. Estamos abertos a proxectos de investigación conxunta, transferencia tecnolóxica e soporte avanzado para a implementación do framework en contornos produtivos.