¿Qué es Analítica de Datos?
De acuerdo a Cloudera “la analítica de datos es la practica de trabajar con datos que brindarán información relevante para la toma de decisiones”.
Cualquier persona al usar una aplicación, tarjeta o dispositivo tecnológico comienza a producir datos, por ejemplo: hora de conexión, que pagina web visitó, hora y lugar de donde compro con la tarjeta de crédito, y demás. Todos estos datos son aprovechados por las empresas para determinar cuando son las temporadas que aumentan o bajan las ventas, en cuales tiendas compran más, etc.
Ahora es necesario tomar en cuenta que muchos de estos datos se encuentran almacenados, pero no quiere decir que estén en orden y listos para usarse, imagina que se encuentra en un almacén aglomerado de objetos, no tienes idea de como esta clasificado ni en que hay exactamente en cada caja, que se puede utilizar y que no.
De tal forma que son necesarios ciertos pasos básicos y un proceso adecuado para otorgar valor a la información.
-
Identifica la pregunta empresarial que te gustaría responder. ¿Qué problema está tratando de resolver la empresa? ¿Qué necesitas medir y cómo lo medirás?
-
Recopila los conjuntos de datos brutos que necesitarás para ayudarte a responder la pregunta identificada. La recopilación de datos puede provenir de fuentes internas, como el software de gestión de relaciones con los clientes (CRM) de una empresa, o de fuentes secundarias, como registros gubernamentales o interfaces de programación de aplicaciones (API) de redes sociales.
-
Limpia los datos para prepararlos para el análisis. Esto a menudo implica eliminar datos duplicados y anómalos, conciliar inconsistencias, estandarizar la estructura y el formato de los datos, y manejar espacios en blanco y otros errores de sintaxis.
-
Analiza los datos. Manipulando los datos mediante diversas técnicas y herramientas de análisis de datos, puedes comenzar a encontrar tendencias, correlaciones, valores atípicos y variaciones que cuenten una historia. Durante esta etapa, puedes utilizar la minería de datos para descubrir patrones dentro de las bases de datos o software de visualización de datos para transformar los datos en un formato gráfico fácil de entender.
