Predictive Analytics

 

Análisis predictivo

Tres cosas que es necesario saber

El análisis predictivo emplea datos históricos para predecir eventos futuros. Normalmente, los datos históricos se utilizan para crear un modelo matemático que capture las tendencias importantes. Este modelo predictivo se usa entonces con los datos actuales para predecir lo que pasará a continuación, o bien para sugerir acciones que llevar a cabo con el fin de obtener resultados óptimos.

El análisis predictivo ha recibido mucha atención en los últimos años debido a los avances en la tecnología que lo respalda, especialmente en las áreas de big data y aprendizaje automático.

Por qué es importante el análisis predictivo

Aumento del big data

A menudo se habla del análisis predictivo en el contexto del big data; los datos de ingeniería, por ejemplo, proceden de sensores, instrumentos y sistemas conectados del mundo real. Los datos de sistemas empresariales de una compañía podrían incluir datos de transacciones, resultados de ventas, quejas de clientes e información sobre marketing. Cada vez más, los negocios toman decisiones basadas en los datos procedentes de esta valiosa mina de información.

Aumento de la competitividad

Con el aumento en la competitividad, los negocios buscan una ventaja a la hora de proporcionar productos y servicios a mercados saturados. Los modelos predictivos basados en datos pueden ayudar a las empresas a resolver problemas de toda la vida de maneras nuevas.

Los fabricantes de equipos, por ejemplo, pueden encontrar difícil innovar en el hardware exclusivamente. Los desarrolladores de productos pueden agregar capacidades predictivas a las soluciones existentes para aumentar el valor de cara al cliente. El uso del análisis predictivo para el mantenimiento de equipos, o mantenimiento predictivo, puede anticipar fallos de los equipos, pronosticar las necesidades de energía y reducir los costes operativos. Por ejemplo, los sensores que miden las vibraciones de las piezas de automoción pueden indicar la necesidad de mantenimiento antes de que el vehículo falle en carretera.

Las empresas también utilizan el análisis predictivo para crear predicciones más precisas, tales como pronosticar la demanda de electricidad de la red de suministro. Estas predicciones permiten planificar los recursos (por ejemplo, la planificación de diversas plantas de energía) de manera más efectiva.

Tecnologías de vanguardia para big data y aprendizaje automático

Con el propósito de extraer valor del big data, los negocios aplican algoritmos a grandes conjuntos de datos mediante herramientas como Hadoop y Spark. Las fuentes de datos pueden ser bases de datos transaccionales, archivos de registro de equipos, imágenes, vídeo, audio, datos de sensores u otros tipos de datos. La innovación a menudo surge de la combinación de los datos de diversas fuentes.

Con todos estos datos, se necesitan herramientas para extraer conocimiento y tendencias. Las técnicas de aprendizaje automático se emplean para localizar patrones en los datos y crear modelos que pronostiquen los resultados futuros. Hay disponible una amplia gama de algoritmos de aprendizaje automático, incluidos regresión lineal y no lineal, redes neuronales, máquinas de vectores de soporte, árboles de decisión, etc.

Ejemplos de análisis predictivo

El análisis predictivo ayuda a los equipos de sectores tan diversos como los siguientes: financiero, sanidad, farmacéutico, automoción, aeroespacial y fabricación.

  • Automoción: innovación en el ámbito de los vehículos autónomos
    Las empresas que desarrollan tecnología de asistencia a la conducción y nuevos vehículos autónomos utilizan el análisis predictivo para analizar los datos de los sensores de los vehículos conectados y para crear algoritmos de asistencia a la conducción.
  • Aeroespacial: supervisión del estado del motor de la aeronave
    Con objeto de aumentar el tiempo productivo de la aeronave y de reducir los costes de mantenimiento, un fabricante de motores ha creado una aplicación de análisis en tiempo real para predecir el rendimiento de los subsistemas en relación con el aceite, el combustible, el despegue, el buen estado mecánico y los controles.
  • Producción energética: predicción del precio y la demanda de electricidad
    Las modernas apps de predicción emplean modelos que supervisan la disponibilidad de las plantas, las tendencias históricas, la estacionalidad y la meteorología.
  • Servicios financieros: desarrollo de modelos de riesgo crediticio
    Las instituciones financieras utilizan técnicas de aprendizaje automático y herramientas cuantitativas para predecir el riesgo crediticio.
  • Maquinaria y automatización industriales: predicción de los fallos de la maquinaria
    Un productor de plástico y papel film ahorra 50 000 euros mensuales gracias al uso de una aplicación de supervisión de estado y mantenimiento predictivo que reduce el tiempo de inactividad y minimiza los residuos.
  • Dispositivos médicos: uso de algoritmos de detección de patrones para detectar asma y EPOC
    Un dispositivo de gestión del asma registra y analiza los sonidos respiratorios de los pacientes y proporciona información inmediata a través de una app para smartphone con objeto de ayudar a los pacientes a controlar el asma y la EPOC.
Predictive Analytics Applications

Cómo funciona el análisis predictivo

El análisis predictivo es el proceso de utilizar el análisis de datos para realizar predicciones basadas en los datos. En este proceso se hace uso de los datos junto con técnicas analíticas, estadísticas y de aprendizaje automático a fin de crear un modelo predictivo para predecir eventos futuros.

El término “análisis predictivo” describe la aplicación de una técnica estadística o de aprendizaje automático para crear una predicción cuantitativa sobre el futuro. Con frecuencia, se utilizan técnicas de aprendizaje automático supervisado para predecir un valor futuro (¿Cuánto tiempo puede funcionar esta máquina antes de necesitar mantenimiento?) o para calcular una probabilidad (¿Qué posibilidad existe de que este cliente no pueda pagar un préstamo?).

El análisis predictivo empieza con un objetivo comercial: utilizar los datos para reducir los residuos, ahorrar tiempo o reducir costes. El proceso emplea conjuntos de datos heterogéneos, a menudo masivos, en modelos que pueden generar resultados claros y permiten actuar sobre ellos con el objetivo de lograr el resultado en cuestión, ya sea reducir los materiales de desecho, reducir el inventario o fabricar productos que coincidan con las especificaciones.

Flujo de trabajo de análisis predictivo

Todos estamos familiarizados con los modelos predictivos para la previsión meteorológica. Una de las aplicaciones cruciales de los modelos predictivos está relacionada con la predicción de la carga energética para pronosticar la demanda. En este caso, los productores de energía, los operadores de la red de suministro y los distribuidores necesitan predicciones precisas sobre la carga energética para tomar decisiones encaminadas a la gestión de las cargas en la red eléctrica. Hay disponibles grandes cantidades de datos y, mediante el análisis predictivo, los operadores pueden convertir esta información en conocimiento que permite pasar a la acción.

Figura 1. Flujo de trabajo de análisis predictivo.

Flujo de trabajo paso a paso para predecir cargas energéticas

Normalmente, el flujo de trabajo para una aplicación de análisis predictivo incluye los siguientes pasos básicos.

  1. Importar datos de varias fuentes, tales como archivos web, bases de datos y hojas de cálculo.
    Las fuentes de datos incluyen los datos de carga energética de un archivo CSV y los datos meteorológicos nacionales que muestran la temperatura y el punto de condensación.
  2. Limpiar los datos mediante la eliminación de los valores atípicos y la combinación de las fuentes de datos.
    Es necesario identificar los picos de datos, los datos ausentes o los puntos anómalos que se deben eliminar de los datos. A continuación, se combinan las distintas fuentes de datos (en este caso, creando una única tabla que incluye la carga energética, la temperatura y el punto de condensación).
  3. Desarrollar un modelo predictivo preciso basado en los datos agregados mediante estadísticas, herramientas de ajuste de curvas o aprendizaje automático.
    La predicción energética es un proceso complejo con muchas variables, así que podría utilizar las redes neuronales para crear y entrenar un modelo predictivo. Realice varias iteraciones con el conjunto de datos de entrenamiento para probar diversos enfoques. Una vez finalizado el entrenamiento, puede probar el modelo con datos nuevos para ver cómo se comporta.
  4. Integrar el modelo en un sistema de predicción de la carga en un entorno de producción.
    Una vez localizado un modelo que pronostique la carga con precisión, puede aplicarlo a su sistema de producción para poner los análisis a disposición de programas de software o dispositivos, incluidos apps web, servidores o dispositivos móviles.
Predictive analytics application for energy load forecasting in New York State.

Figura 2. Aplicación de análisis predictivo para la predicción de la carga energética en el estado de Nueva York.

Desarrollo de modelos predictivos

Los datos agregados cuentan una historia compleja. Para extraer el conocimiento que albergan, se necesita un modelo predictivo preciso.

El modelado predictivo utiliza métodos matemáticos y de cálculo para predecir un evento o un resultado. Estos modelos pronostican un resultado en algún estado o tiempo futuros en función de los cambios en las entradas del modelo. Mediante un proceso iterativo, se desarrolla el modelo mediante un conjunto de datos de entrenamiento y después se prueba y se valida para determinar su precisión con el fin de realizar predicciones. Puede probar distintos enfoques de aprendizaje automático para localizar el modelo más efectivo.

Algunos ejemplos son modelos de regresión de series temporales para predecir el volumen de tráfico aéreo o predecir la eficiencia del combustible en función de un modelo de regresión lineal del motor frente a la carga.

Análisis predictivo frente a análisis prescriptivo

La organizaciones que han implementado correctamente el análisis predictivo consideran el análisis prescriptivo como el siguiente objetivo. El análisis predictivo crea una estimación de lo que pasará a continuación; el análisis prescriptivo indica cómo reaccionar de la mejor forma posible de acuerdo con la predicción.

El análisis prescriptivo es una rama del análisis de datos que emplea modelos predictivos para sugerir las acciones que realizar a fin de obtener resultados óptimos. El análisis prescriptivo confía en la optimización y en las técnicas basadas en reglas para tomar decisiones. Pronosticar la carga en la red eléctrica durante las siguientes 24 horas es un ejemplo de análisis predictivo, mientras que decidir cómo gestionar las plantas energéticas en función de esta predicción representa el análisis prescriptivo.

Ejemplos interesantes de análisis predictivo con MATLAB

Las empresas están encontrando formas innovadoras de aplicar el análisis predictivo mediante MATLAB® para crear nuevos productos y servicios, así como para resolver problemas de toda la vida de maneras nuevas.

Los ejemplos siguientes ilustran el análisis predictivo en acción.

Baker Hughes desarrolla software de mantenimiento predictivo para equipos de extracción de gas y petróleo mediante el análisis de datos y el aprendizaje automático

Los camiones de Baker Hughes están equipados con bombas de desplazamiento positivo que inyectan una mezcla de agua y arena en lo más profundo de los pozos perforados. Estas bombas suponen alrededor de 100 000 dólares de los 1,5 millones que cuesta en total el camión, así que Baker Hughes necesitaba determinar cuándo una bomba estaba a punto de fallar. Procesaron y analizaron un terabyte de datos recopilados en 50 000 muestras por segundo mediante sensores instalados en diez camiones que trabajaban sobre el terreno, y entrenaron una red neuronal para utilizar los datos de los sensores con objeto de predecir los fallos de las bombas. Se espera que el software reduzca los costes de mantenimiento en un 30 %-40 % (es decir, más de diez millones de dólares).

MATLAB customer Baker Hughes used predictive analytics and machine learning to develop predictive maintenance software.

BuildingIQ desarrolla algoritmos proactivos para la optimización energética de la climatización en edificios de gran tamaño

Los sistemas de calefacción, ventilación y aire acondicionado (HVAC) de grandes edificios comerciales son ineficientes a menudo porque no tienen en cuenta los patrones de clima variables, los costes variables de la energía o las propiedades térmicas de los edificios. La plataforma de software basada en la nube de BuildingIQ emplea algoritmos avanzados para procesar continuamente gigabytes de información procedente de medidores de potencia, termómetros y sensores de presión HVAC. El aprendizaje automático se emplea para segmentar los datos y determinar las contribuciones relativas del gas, la electricidad, el vapor y la energía solar en los procesos de calefacción y refrigeración. Se emplea la optimización para determinar la mejor planificación de calefacción y refrigeración en cada edificio a lo largo del día. La plataforma de BuildingIQ reduce el consumo de energía de climatización en edificios comerciales de gran tamaño en un 10%–25% durante el funcionamiento normal.

MATLAB customer BuildingIQ used predictive analytics for HVAC energy optimization in large-scale buildings.

Desarrollo de algoritmos de detección para reducir las falsas alarmas en unidades de cuidados intensivos

Las falsas alarmas de los electrocardiógrafos y otros dispositivos de monitorización de pacientes son un problema serio en las unidades de cuidados intensivos (UCI). El ruido de las falsas alarmas perturba el sueño de los pacientes y las alarmas falsas frecuentes insensibilizan al personal clínico frente a las advertencias reales. Los participantes en el PhysioNet/Computing in Cardiology Challenge debían desarrollar algoritmos que pudieran distinguir entre alarmas reales y falsas en las señales registradas por los dispositivos de monitorización de la UCI. Los investigadores de la Academia de las Ciencias de la República Checa obtuvieron el primer puesto en la categoría de tiempo real del reto con algoritmos de MATLAB que podían detectar complejos QRS, distinguir entre latidos normales y ventriculares, y filtrar los complejos QRS falsos provocados por estímulos de un marcapasos. Los algoritmos produjeron una tasa de positivos reales (TPR) y una tasa de negativos reales (TNR) del 92% y el 88%, respectivamente.

Predictive analytics was used to develop detection algorithms to reduce false alarms in ICUs.

Análisis predictivo con MATLAB

Para desvelar el valor de los datos empresariales y de ingeniería con objeto de tomar decisiones informadas, los equipos que desarrollan aplicaciones de análisis predictivo recurren a MATLAB cada vez con más frecuencia.

Mediante las herramientas y las funciones de MATLAB, es posible llevar a cabo análisis predictivos con datos de ingeniería, datos científicos y datos de campo, así como datos empresariales y transaccionales. MATLAB permite implementar aplicaciones predictivas en sistemas de producción a gran escala y sistemas embebidos.

Figura 3. MATLAB para el análisis predictivo.

¿Por qué usar MATLAB para el análisis predictivo?

  1. Los análisis de MATLAB funcionan con datos tanto empresariales como de ingeniería.
    MATLAB admite de forma nativa formatos de datos de sensores, imágenes, vídeos, telemetría, datos binarios y otros formatos en tiempo real. Explore estos datos con tall arrays de MATLAB para Hadoop y Spark, así como mediante la conexión de interfaces con bases de datos ODBC/JDBC.
  2. MATLAB permite a los ingenieros utilizar la ciencia de los datos.
    Permita que sus expertos utilicen la ciencia de los datos con herramientas potentes que les ayudarán a emplear el aprendizaje automático, el aprendizaje profundo, la estadística, la optimización, el análisis de señales y el procesamiento de imágenes.
  3. Los análisis de MATLAB se ejecutan en sistemas embebidos.
    Desarrolle análisis para su ejecución en plataformas embebidas gracias a la creación de código C y C++ portátil a partir del código de MATLAB.
  4. Los análisis de MATLAB se despliegan en sistemas de TI empresariales.
    MATLAB se integra en los sistemas, clusters y nubes empresariales con un runtime desplegable libre de regalías.

Sus datos + MATLAB = éxito con análisis predictivo

Según esta visión simplificada, los datos de ingeniería proceden de sensores, instrumentos y sistemas conectados del mundo real. Los datos se recopilan y almacenan en un sistema de archivos, ya sea de forma local o en la nube.

Figura 4. Arquitectura del análisis basado en los datos de ingeniería.

“No importa el sector al que pertenezca el cliente ni los datos que nos pida analizar —texto, audio, imágenes o vídeo—, el código de MATLAB nos permite proporcionar resultados claros con mayor rapidez.”

Dr. G. Subrahamanya VRK Roo, Cognizant

Estos datos se combinan con datos procedentes de sistemas empresariales tradicionales tales como datos sobre costes, resultados de ventas, quejas de clientes e información sobre marketing.

Tras ello, un ingeniero o experto en la materia desarrolla los análisis mediante MATLAB. Casi siempre se requiere preprocesamiento para gestionar los datos ausentes, los datos atípicos u otros problemas de calidad de los datos no previstos. Al hilo de esto, se emplean métodos analíticos tales como las estadísticas y el aprendizaje automático para producir una “analítica”, es decir, un modelo predictivo de su sistema.

Para que resulte útil, ese modelo predictivo se despliega entonces —ya sea en un entorno de TI de producción que alimente un sistema transaccional o de TI en tiempo real, como un sitio de comercio electrónico o un dispositivo embebido— en un sensor, un controlador o un sistema inteligente del mundo real, como podría ser un vehículo autónomo.

La aplicación de MATLAB y Simulink® como parte de esta arquitectura resulta ideal, ya que las herramientas permiten vías de implementación fáciles en sistemas embebidos gracias al diseño basado en modelos, o bien en sistemas de TI gracias a productos de despliegue de aplicaciones.

Figura 5. Implementación de modelos predictivos en sistemas embebidos y sistemas de TI.

“MATLAB ha contribuido a acelerar nuestros procesos de I+D y despliegue con sus robustos algoritmos numéricos, sus exhaustivas herramientas de visualización y análisis, las rutinas de optimización fiables, soporte a la programación orientada a objetos y la capacidad de ejecución en la nube con nuestras aplicaciones Java de producción.”

Borislav Savkovic, científico de datos principal en BuildingIQ