Computer Vision Toolbox™ proporciona algoritmos, funciones y apps para diseñar y probar sistemas de procesamiento de vídeo, visión artificial y visión 3D. Puede realizar detección y seguimiento de objetos, así como detección, extracción y coincidencia de características. También puede automatizar los flujos de trabajo de calibración de cámaras simples, estéreo y ojo de pez. En el caso de la visión 3D, la toolbox soporta SLAM visual y de nubes de puntos, visión estéreo, estructura a partir del movimiento y procesamiento de nubes de puntos. Las apps de visión artificial automatizan los flujos de trabajo de etiquetado de validación (ground-truth) y de calibración de cámaras.
Puede entrenar detectores de objetos personalizados mediante algoritmos de Deep Learning y Machine Learning, tales como YOLO v2, SSD y ACF. Para la segmentación semántica y de instancias, puede utilizar algoritmos de Deep Learning tales como U-Net y Mask R-CNN. La toolbox ofrece algoritmos de detección y segmentación de objetos para analizar imágenes que son demasiado grandes para la capacidad de la memoria. Los modelos previamente entrenados permiten detectar caras, peatones y otros objetos comunes.
Puede acelerar los algoritmos mediante su ejecución en procesadores multinúcleo y GPU. Los algoritmos de esta toolbox soportan la generación de código C/C++ para su integración con el código existente, el prototipado en escritorio y el despliegue de sistemas de visión embebidos.
Más información:
Detección y reconocimiento de objetos
Entrene, evalúe y despliegue detectores de objetos, tales como YOLO v2, Faster R-CNN, ACF y Viola-Jones. Realice el reconocimiento de objetos con OCR y bolsa de palabras visuales. Utilice modelos previamente entrenados para detectar caras, peatones y otros objetos comunes.
Segmentación semántica
Segmente imágenes y volúmenes 3D mediante la clasificación de píxeles y vóxeles individuales con redes tales como SegNet, FCN, U-Net y DeepLab v3+. Utilice la segmentación de instancias para generar mapas de segmentación y detectar instancias únicas de objetos.
Etiquetado de validación (ground-truth)
Automatice el etiquetado de detección de objetos, segmentación semántica, segmentación de instancias y clasificación de escenas con las apps Video Labeler e Image Labeler.
Calibración de una sola cámara
Automatice la detección del tablero de ajedrez y calibre las cámaras estenopeicas y ojo de pez mediante la app Camera Calibrator.
Calibración de cámaras estéreo
Calibre pares de cámaras estéreo para calcular la profundidad y reconstruir escenas 3D.
SLAM visual y odometría visual
Extraiga la estructura a partir del movimiento y la odometría visual.
Visión en estéreo
Estime la profundidad y reconstruya escenas 3D usando pares de cámaras estéreo.
Procesamiento de nubes de puntos 3D y de LiDAR
Organice en clusters, segmente, agrupe, reduzca la tasa de muestreo, elimine el ruido, registre y ajuste formas geométricas con datos de nubes de puntos 3D o de LiDAR. Lidar Toolbox™ ofrece funcionalidades adicionales para diseñar, analizar y probar sistemas de procesamiento de LiDAR.
E/S de nubes de puntos y de LiDAR
Lea, escriba y visualice nubes de puntos a partir de archivos, sistemas de LiDAR y sensores RGB-D.
Registro de nubes de puntos
Registre nubes de puntos 3D mediante los algoritmos NDT (transformada de distribuciones normales), ICP (punto más cercano iterativo) y CPD (movimiento de puntos coherente).
Segmentación y ajuste de formas
Segmente nubes de puntos en clusters y ajuste las formas geométricas a nubes de puntos. Segmente el plano de tierra de los datos de LiDAR para aplicaciones de conducción autónoma y robótica.
Detección, extracción y coincidencia de características
Detecte, encuentre coincidencias y extraiga características de interés, tales como blobs, bordes y esquinas, en diversas imágenes.
Registro de imágenes basado en características
Encuentre coincidencias entre características de varias imágenes para estimar la transformación geométrica entre imágenes y registrar la secuencia de imágenes.
Seguimiento de objetos
Realice un seguimiento de las trayectorias de los objetos de un cuadro a otro en secuencias de vídeo.
Estimación del movimiento
Estime el movimiento entre distintos cuadros de vídeo mediante flujo óptico, coincidencia de bloques y coincidencia de plantillas.
Generación de código
Genere código C/C++, código CUDA y funciones MEX para funciones, clases, System objects y bloques de toolbox.