Procesamiento de eventos complejos
El procesamiento de eventos complejos también conocido como procesamiento de eventos, flujos o flujos de eventos es el uso de tecnología para consultar datos antes de almacenarlos en una base de datos o, en algunos casos, sin que se almacenen.El procesamiento de eventos complejos es una herramienta organizativa que ayuda a agregar una gran cantidad de información diferente y que identifica y analiza las relaciones de causa y efecto entre eventos en tiempo real. El CEP compara continuamente los eventos entrantes con un patrón y proporciona información sobre lo que está sucediendo. y le permite tomar acciones efectivas de forma proactiva.Los eventos complejos se relacionan comúnmente con eventos empresariales importantes con la implicación de que se responderán en tiempo real o al menos en algo que se aproxime al tiempo real.
Principales Áreas de Aplicación para el Procesamiento de Eventos Complejos:
- El Monitoreo de la Actividad Empresarial tiene como objetivo identificar problemas y oportunidades en las primeras etapas mediante el monitoreo de los procesos comerciales y otros recursos críticos.
- Redes de sensores que se utilizan para la supervisión de instalaciones industriales. Por lo general, se derivan de mediciones numéricas brutas .
- Los datos de mercado, como los precios de las acciones o de las materias primas, deben derivarse de varios acontecimientos y de sus relaciones a través del CEP.
Las Herramientas Más Comunes Utilizadas para el Procesamiento de Eventos Complejos Son:
- Streaming de Apache Spark utilizado por Databricks
- Apache Flink utilizado por artesanos de datos
- Apache Samza utilizado por LinkedIn
- Apache Storm utilizado por Twitter
- Hadoop / MapReduce.
- Amazon Kinesis Analytics
- Microsoft Azure Stream Analytics, Stream Insight
- Servidor de procesamiento de eventos Complejos de Big Data entre etapas de Software Fujitsu
- IBM Streams, Operational Decision Manager
- Oracle Stream Analytics y Stream Explore
El procesamiento de eventos complejos se utiliza principalmente para cumplir los siguientes requisitos:La latencia debe ser baja. Por lo general, se espera que sea menos de unos pocos milisegundos, pero a veces podemos tener tan poco como menos de un milisegundo, entre el momento en que llega un evento y el momento en que se procesa.El volumen de eventos de entrada por segundo es bastante alto. Por lo general, podemos esperar tener cientos o incluso algunos miles de eventos por segundo.Los patrones de eventos a detectar son complejos: como los patrones basados en relaciones temporales o espaciales.