Simplificando un poco, Big Data engloba todo tratamiento de datos que, por su volumen, representa un problema de procesamiento si se utilizan metodologías estándar y que requiere, por lo tanto, de herramientas especializadas en la gestión de grandes volúmenes de información. Bajo esta definición encontramos que el paraguas de Big Data es muy amplio y, en ocasiones, esta transversalidad dificulta la visualización de su aplicación de forma práctica.
Actualmente la mayoría de empresas almacenan, con mayor o menor grado de consciencia, una gran cantidad de datos que pueden tener diversos orígenes: clientes, ventas, compras, producción, marketing, etc., pero solo un pequeño porcentaje del tejido empresarial tiene implementadas estrategias eficaces de explotación de datos o Business Intelligence.
¿Cómo puede arrancar una empresa un proyecto de Big Data?
El primer paso es olvidarse del Big Data. No se trata de implantar Big Data per se, sino de resolver problemas, detectar oportunidades, optimizar procesos y contar con Big Data como una de las posibles herramientas.
Es necesario tomar conciencia de los datos que la empresa posee y empezar a tratarlos como un verdadero activo. Además, se han de analizar aquellos datos que, aunque no se posean, son potencialmente accesibles; como por ejemplo fuentes de terceros, posibilidad de construir nuevas bases de datos mediante estrategias de captación de información o estudios de mercado. Una vez la empresa posee una visión clara de la base de sus sistemas de información, o lo que es lo mismo, conoce la información que maneja o simplemente posee, puede comenzar a relacionarla con su actividad y diferentes procesos. Es muy importante tener claro cómo la información interviene en cada proceso o el potencial que un dato puede tener en un momento concreto dentro de un flujo de trabajo.
¿Cómo lo están haciendo diferentes sectores? Big Data en el día a día
Si algo ofrece el tratamiento de datos a gran escala es pasar de un tratamiento meramente descriptivo, es decir, orientado a conocer qué ha pasado (reporting) o qué está pasando (Alertas) a un análisis predictivo sobre qué es posible que suceda. Esta capacidad de predicción está permitiendo, por ejemplo, seleccionar los mejores productos u ofertas a los clientes adecuados.
Es un sistema de Big Data el que permite a tu banco ofrecerte a través de la banca on line o incluso a través del comercial bancario en la sucursal los productos más adecuados a tu perfil. El banco simplemente compara tu perfil (edad, profesión, patrimonio, perfil financiero, comportamiento de pagos, tarjetas…) con otros miles de usuarios, identifica patrones de éxito, productos que han sido contratados por clientes que son similares, es decir, pertenecen a lo que podemos denominar tu cluster de usuario, y lanza una oferta o un mix.
El Big Data bien implementado no se queda en una predicción básica, si existe una buena estrategia será capaz de recoger información de vuelta (feedback) y valorar si la predicción que realizó fue acertada, generando iteraciones que mejoran de forma continua el acierto.
Por ejemplo, accedes a la banca en línea y observas que un aviso te ofrece un nuevo producto como podría ser un préstamos personal de 15.000€, esta oferta será lanzada a cientos o miles de clientes con variaciones (por ejemplo en el importe concedido o en las condiciones), el sistema recogerá qué éxito tiene cada configuración de producto para identificar aquel con mayor éxito de ventas.
Esto es la base del denominado Machine Learning, la capacidad de un sistema de aprender de sus propias decisiones e ir ajustando sus predicciones.
Siguiendo con el ejemplo del banco, vemos utilidades en otros ámbitos no comerciales, como en el análisis de riesgos (scoring de clientes). Antes esta evaluación recaía en personas que podrían ser desde el gestor de la cuenta hasta el director de oficina o central de riesgos dependiendo, por ejemplo, del importe solicitado para un préstamo. Ahora el análisis de riesgos está centralizado, especialmente (y curiosamente) el riesgo menor, ya que el volumen de operaciones de un banco comercial se mueve en muchos préstamos de menores importes. Centralizar estas decisiones permite analizar la información de forma global; de hecho, el riesgo que el banco puede asumir contigo está pre-evaluado sin que ni siquiera hayas realizado una solicitud. De nuevo el banco compara tu perfil con el de todos sus clientes y observa el comportamiento de clientes con el mismo patrón de datos que el tuyo, por lo que puede obtener un perfil de riesgo bastante certero ya que cuenta con datos de mora, impago o cumplimiento. De esta forma, un agente introduciendo el DNI en su ordenador puede observar si tienes preautorizado un importe de riesgo y conceder productos en base al mismo de forma inmediata.
Estas mismas estrategias son utilizadas por aseguradoras para valorar las primas de sus seguros en base al histórico de datos, por supermercados para predecir las ventas de sus productos en función de su precio, ubicación en el lineal o época del año o por una cadena hotelera para predecir cancelaciones o personalizar la oferta en base a tipologías de usuarios.
Uno de los ámbitos donde mayor impacto está teniendo el análisis de grandes cantidades de datos es en el industrial. Las fábricas han pasado de ser máquinas inertes a centros inteligentes que recogen grandes volúmenes de datos a través de sensores (temperaturas, regímenes de funcionamiento, pesos, energía y hasta miles de variables distintas). Estos datos son centralizados en almacenes de datos (data warehouse) y permiten no solo controlar lo que está pasando en una fábrica, sino anticipar posibles problemas, lo que se denomina mantenimiento predictivo. Antes estos mantenimientos se basaban en indicaciones del fabricante; ahora, a través de estos sensores e información, se analizan los patrones de comportamiento, dicho de otro modo, los valores de los sensores en diferentes escenarios. Podemos tener un patrón de normalidad donde todo va bien, pero también análisis de estos patrones predictivios que anticipan una posible rotura, determinados escenarios de variables que alertan a tiempo de que algo puede ir mal en un periodo de tiempo determinado, indicando una actuación preventiva. Todos sabemos que es mucho mejor prevenir que curar, así que no es lo mismo anticiparse al cambio de una pieza a punto de romper la maquinaria que esperar a que la misma rompa y pueda afectar a todo el sistema.
Aplicar metodologías de Business Analytics, basado en Big Data no solo puede ser muy interesante, en un plazo muy corto de tiempo será un estándar necesario si una empresa quiere seguir siendo competitiva.
Las dificultades del Big Data
El Big Data no solo está afectando al mundo empresarial, este conjunto de tecnologías se aplica desde hace mucho tiempo en otras áreas de la ciencia o la seguridad. Por ejemplo, para detectar o predecir comportamientos criminales o riesgos de seguridad o para las predicciones meteorológicas.
Una vez repasados los aspectos positivos, ¿qué dificultades o problemas puede presentar? En primer lugar, es una tecnología con cierta complejidad, que requiere de perfiles multidisciplinares, profesionales que entiendan el negocio y expertos en tratamiento y análisis de datos y programadores que manejen las herramientas y lenguajes de programación adecuados. Por otro lado se encuentran las implicaciones legales y éticas, evidenciado en los últimos tiempos por la famosa implantación del RGPD o los escándalos de Cambridge Analytica.
Nuevo eBook
Descubre todas las claves para digitalizar la cadena de suministro y aportar más valor a tus clientes
Acceder a la descarga
Otros usos y aplicaciones a través de Big Data
Es muy importante recordar que siempre se debe abordar e iniciar un proyecto de análisis de datos desde la perspectiva de negocio, ya que empieza a no ser raro ver implementaciones de herramientas de análisis de datos bastante potentes totalmente infrautilizadas por desconocimiento en cuanto a interpretación de los datos y su uso integrado en la operativa del negocio. Es cierto que un panel (dashboard) en un monitor gigante puede ser algo muy cool, pero será mucho más útil si sabemos qué hacer con esa información.
Como sucede con cualquier otra tecnología, poco a poco emergen plataformas y herramientas que simplifican el tratamiento de datos, ERPs que ya integran las soluciones de analítica para que la empresa pueda centrarse en el diseño de estrategias y toma de decisiones y se pueda olvidar parcialmente de la parte técnica. En este caso, el primer paso y el aspecto más importante es comenzar a tratar la información y los datos como un verdadero activo que la empresa debe gestionar y contar con profesionales capaces y experimentados en la utilización de datos.
Meteorología
Predicción del tiempo en base al análisis de todos los datos recogidos en las estaciones de meteorología mundial. Los motores de predicción nos dan la predicción del tiempo, luego el sistema recoge a través de las estaciones de meteorología los datos reales y de nuevo el sistema realiza nuevos ajustes para tratar de mejorar la predicción.
Predicción del tráfico
Si utilizas Google Maps habrás comprobado como la ruta para desplazarse entre dos puntos concretos puede variar según la hora o el día en el que se solicite (incluso durante la ruta). A través del análisis del geoposicionamiento de todos los usuarios de Google Maps y otros servicios de Android así como del histórico se predice el tráfico en ese momento en las diferentes rutas, optimizando así el cálculo de tiempos entre diferentes opciones.
Recomendación de películas o series
Basándose en tu propio consumo y en el consumo de usuarios que se asemejan a ti, plataformas como Amazon y Netflix te recomiendan nuevas series o películas de “tu gusto”.
Sistemas Anti-Fraude
Detección de intentos de fraude por ejemplo en uso de tarjetas de crédito, identificando los patrones utilizados por los delincuentes (horarios, orígenes, tipología de compras, importes, etc.).
Predicción de valores en Bolsa
Es uno de los campos más intensivos en utilización de BigData, con múltiples estrategias, algoritmos orientados a medir las emociones de los inversores hacia una empresa concreta en base a los twitts, identificación de patrones que predicen subidas o bajadas de cotización, etc.
Diagnóstico de enfermedades
Comienzan a cruzarse datos a gran escala de salud que permiten identificar patrones a través de variables de salud (síntomas, hábitos, indicadores) que actúan como señales de predicción de enfermedades. Clasificando a pacientes de riesgo y permitiendo aplicar medicina preventiva.
Desarrollo de nuevos productos
Análisis de datos de consumo masivos para extraer las características de los productos más vendidos o buscados para dar lugar a productos blockbuster.
Lead Scoring
Análisis de clientes potenciales para clasificarlos en grupos según el nivel de potencial basándose en datos de históricos, perfil social, datos en redes sociales, etc.