Cómo funciona

Deep Learning directamente en 3D

A diferencia de otros enfoques, VL3D++ no convierte la nube en imágenes 2D.
El aprendizaje se realiza directamente sobre la estructura espacial de los puntos.
Esto permite:

Mayor precisión geométrica
Mejor comprensión de formas complejas
Aplicación en dominios muy distintos con el mismo enfoque

¿Cómo se hace?

Vecindades y campos receptivos

Son la base de la entrada a los modelos. VL3D++ utiliza vecindades esféricas o rectangulares para capturar el entorno local de cada punto. Se emplean métodos avanzados como el Grid Subsampling (división en celdas), FPS (Furthest Point Sampling) para una cobertura óptima, y versiones jerárquicas que permiten a la red aprender características a diferentes escalas de resolución.

Arquitecturas neuronales

El framework implementa el estado del arte en procesamiento 3D. Soporta desde el clásico PointNet/PointNet++ hasta convoluciones sobre puntos (KPConv) y redes de convolución dispersa (Sparse 3D) que optimizan drásticamente el uso de memoria. Estos modelos suelen envolverse en estructuras de tipo autoencodificador jerárquico (U-Net) para una segmentación densa y precisa.

Inferencia

Los modelos entrenados se integran en un Predictive Pipeline. Durante la inferencia, se procesa la nube por bloques o vecindades solapadas, permitiendo analizar nubes de puntos masivas que superan la capacidad de la memoria RAM mediante secuenciadores especializados.

El pipeline completo de VL3D++

01/Importar la nube de puntos en bruto

VL3D++ trabaja directamente sobre nubes de puntos 3D generadas por LiDAR aéreo o terrestre, fotogrametría, escáneres 3D, reconstrucciones volumétricas (TAC/RM), sensores de profundidad, batimetría o escaneo industrial, etc. Opera sobre la geometría 3D sin necesidad de convertir los datos en imágenes ni pasar por representaciones 2D intermedias.

02/Preprocesado

Aplicación de componentes de Data Mining para la extracción de características geométricas, volumétricas, de altura y color (HSV). Uso de Transformers para la normalización y limpieza de datos (Imputers), junto a Decoradores que permiten el submuestreo inteligente (FPS) y el suavizado de la estructura (Simple smoother).

03/Selección de puntos y definición de su vecindad

Para poder analizar la nube, el sistema no procesa todos los puntos a la vez. Selecciona puntos de interés y define su vecindad local, es decir, el conjunto de puntos cercanos que aportan contexto geométrico. Esa vecindad se define mediante volúmenes geométricos como esferas, cubos o cilindros que encapsulan el entorno espacial de cada punto.

04/Entrenamiento

Configuración modular mediante archivos JSON que definen el flujo exacto del pipeline. Incluye estrategias avanzadas de validación como Stratified K-folding, técnicas de balanceo de clases (SMOTE) y optimización dinámica de hiperparámetros (Grid/Random Search).

04.1/Campo receptivo: ordenar lo desordenado

Las nubes de puntos son desordenadas por naturaleza. Una red neuronal necesita entradas ordenadas y de tamaño fijo. Aquí está una de las claves técnicas de VL3D++. Las vecindades se transforman en estructuras regulares llamadas campos receptivos. Esta es la clave: convertir puntos desordenados en entradas que una red neuronal pueda procesar.

04.2/Procesamiento Deep Learning en 3D

Los campos receptivos alimentan a la red neuronal profunda. La red aprende patrones geométricos complejos directamente sobre la estructura 3D, sin trabajar con imágenes ni proyecciones 2D.

04.3/Predicción sobre cada fragmento de nube

El modelo genera una predicción para cada campo receptivo, asignando clases y niveles de confianza a los puntos analizados en ese entorno local. En este punto, el resultado aún está fragmentado en pequeñas porciones de nube.

04.4/Propagación y reconstrucción de la nube completa

Las predicciones locales se propagan y agregan hasta reconstruir la nube de puntos original, ahora completamente clasificada. Este proceso se repite de forma sistemática hasta cubrir toda la nube.

05/Predicción y evaluación del modelo: errores, incertidumbre y métricas

Generación de un Predictive Pipeline serializado que encapsula todo el conocimiento del modelo. Evaluación automática de resultados mediante métricas estándar (OA, R, P, F1-score, IoU) y creación de informes visuales detallados. Una vez construido el modelo, el sistema genera información adicional para evaluar la calidad del resultado: • Zonas donde el modelo se equivoca • Zonas donde el modelo tiene dudas • Métricas cuantitativas estándar punto a punto.

¿Cómo el modelo aprende a clasificar mejor las nubes de puntos?

El modelo aprende, detecta dónde duda, el experto corrige errores y el sistema mejora solo.

Paradigma "Human-in-the-loop".
Un enfoque de entrenamiento semiautomático donde un experto humano (oráculo) colabora con el modelo. Permite trabajar con grandes volúmenes de datos no etiquetados, optimizando el tiempo de supervisión manual.

Ciclo de Refinamiento Iterativo.
El proceso comienza con un "presupuesto inicial" (un pequeño conjunto de datos etiquetados). El modelo entrena, predice sobre el resto de la nube y el experto interviene para corregir y validar los resultados más críticos.

Selección Guiada por Incertidumbre.
El sistema identifica automáticamente las regiones donde el modelo tiene más dudas (alta incertidumbre). El experto solo etiqueta estas zonas clave, lo que maximiza la mejora del modelo con el mínimo esfuerzo humano.

Eficiencia en el Etiquetado.
Al centrar la atención humana en los puntos más informativos, se logra una precisión de vanguardia sin la necesidad de procesar manualmente miles de millones de puntos de forma exhaustiva.

Métricas que validan el resultado

Cada clasificación se acompaña de métricas estándar
que permiten evaluar objetivamente el resultado:

Exactitud Global

Es el porcentaje total de aciertos del modelo. Indica cuántos puntos, de entre todos los procesados, han sido asignados a su categoría correcta. Es la métrica más sencilla para entender el rendimiento general.

Precisión

Mide la fiabilidad de las predicciones del modelo. Si el modelo clasifica un punto como "árbol", la precisión indica qué probabilidad hay de que realmente lo sea, evitando falsas alarmas.

Exhaustividad

Evalúa la capacidad del modelo para encontrar todos los elementos de una clase. Una exhaustividad alta significa que el modelo identifica casi todos los objetos presentes (por ejemplo, edificios), sin dejarse casi ninguno fuera.

Puntuación F1

Es una combinación equilibrada entre la precisión y la exhaustividad. Proporciona una visión conjunta de la calidad del modelo, asegurando que sea tanto fiable como capaz de detectar la mayoría de los puntos.

Jaccard Index

Mide cuánto se solapa la predicción del modelo con la realidad. Es una métrica fundamental en segmentación 3D que premia que la silueta predicha encaje perfectamente con la real.

wP, wR, wF1, wIoU

Versiones de las métricas anteriores que se ajustan según la abundancia de cada categoría. Evitan que el éxito en clases muy frecuentes (como el terreno) enmascare errores en clases escasamente representadas (como el mobiliario urbano).

MCC

Es una métrica que mide la correlación real entre las predicciones del modelo y la realidad física. A diferencia de otras métricas, tiene en cuenta todos los aciertos y errores (tanto positivos como negativos) de forma equilibrada. Su valor oscila entre -1 y +1, donde +1 indica un modelo perfecto, 0 un rendimiento no mejor que el azar, y -1 una total contradicción; lo que la convierte en una de las pruebas de fiabilidad más exigentes en ciencia de datos.

Kappa

Mide cuánto mejor es el modelo en comparación con una clasificación hecha por puro azar. Es una garantía extra de que los resultados son fruto del aprendizaje real del sistema.

Fomentamos un ecosistema de innovación abierta y colaboración continua entre la academia y la industria. Nuestro equipo técnico e investigador puede orientarte para explorar cómo aplicar VL3D++ en tu caso, colaborar en investigación o estudiar vías de transferencia tecnológica. Todo aquel interesado en la clasificación profesional de nubes de puntos, o que requiera el desarrollo de alguna funcionalidad técnica concreta para sus flujos de trabajo, puede ponerse en contacto directamente con nuestro equipo de desarrollo. Estamos abiertos a proyectos de investigación conjunta, transferencia tecnológica y soporte avanzado para la implementación del framework en entornos productivos.