¿Ciencia de Datos o Análisis de Datos?

¿Ciencia de Datos o Análisis de Datos?

Cuál es la relevancia de conocer sobre estos términos y tenerlos perfectamente entendidos en una era en la cual hay una vorágine de cambios tecnológicos, transformaciones digitales y procesos disruptivos con tecnologías innovadoras que nos hacen sentir, por momentos y solo momentos, que estamos viviendo en una película de aquellas ochenteras en donde se iban al futuro. Y digo momentos, porque no importa en donde nos encontremos leyendo este articulo, vas a terminar cerrando la pantalla y contestando varios mensajes por múltiples plataformas de redes sociales, probablemente cambies la canción que estas escuchando y luego regresas a la realidad diaria: el semáforo descompuesto, o la fila de ventanilla de servicio de algún proveedor de telecomunicaciones que sigue atendiendo con turnos de papel o aun peor en la fila de algún servicio de gobierno que todavía no se sube a la ola digital.

Por eso pensamos: ¿en realidad estamos listos para estos? ¿De verdad, ya llegamos al futuro? Y si es así, porque seguimos teniendo que hacer filas en algunos servicios que podrían ser virtuales y fáciles. Sencillo, por eso mismo es relevante tener perfectamente claro de que estamos hablando cuando decimos Ciencia de Datos, Analítica o aun mejor, transformación digital y toda está nueva corriente de términos de moda de la industria 4.0. Hoy vamos a limitarnos a comprender únicamente estos 2 términos: Ciencia de Datos y Análisis de Datos.

Aunque ustedes no lo crean, el término Ciencia de Datos se viene usando desde hace varias décadas, según algunos eruditos en la materia, data de 1960`s – 1970s. Algunos nombran a John W. Tukey como unos de los primeros en utilizar el término. Lo relevante de usar fechas es recordarles que esto no es nuevo y es el primer paradigma importante para romper. Aunque la idea es entender la definición y diferencias de cada término, es aun más importante que ustedes tengan claro algo: el manejo de los datos para resolver problemas complejos se viene haciendo desde hace mucho tiempo atrás. Ya se que todos van a pensar: es obvio, tengo que analizar los datos para tomar decisiones. Y si, pero la ciencia de datos no se queda en los datos obvios del día a día o de la operación semanal, mensual o con el periodo que le quieran poner. Sino que profundiza e incorpora datos que parecerían no ser relevantes, para luego analizarlos de forma científica, es decir con matemática avanzada, para determinar si en efecto son o no relevantes y no quedarnos son el prejuicio inicial con el cual vimos esos datos. Últimamente se ha intensificado porque finalmente se gestaron empresas basadas en estas técnicas para crecer, conquistar y globalizar servicios. Esto es lo que ha puesto estos términos en lo que nosotros llamamos: mainstream media. Hoy todos hablamos de ciencia de datos, analítica predictiva, análisis de datos, científico de datos, inteligencia artificial y más.

LEER: ¿CÓMO ARMAR UN EQUIPO DE DESARROLLO DE SOFTWARE?

Para concluir, la ciencia de datos no es más que un campo interdisciplinario en el cual se usan múltiples métodos científicos, matemáticos, procesos y sistemas para comprender datos generados de múltiples formas, ya sean datos estructurados o no estructurados y finalmente habilitar información para toma de decisiones. Es decir, en términos más aterrizados, el objetivo de la ciencia de datos es hacer que los datos generen respuestas útiles y acciones concretas con los cuales puedan resolver problemas complejos. Es importante comprender porque usamos el término, problemas complejos. Ya que los problemas sencillos no requieren mucho análisis, pero aquellos que involucran muchas personas, procesos, tecnologías y muchos datos, son los que califican para usar técnicas de estadística, minería de datos y análisis detallado para resolver las hipótesis.

Por lo cual el análisis de los datos viene siendo una de las etapas de la ciencia de datos. Y de las etapas iniciales y de alto impacto en la resolución de problemas, comprobación de hipótesis o generación de respuestas. El análisis de los datos es el proceso que consiste en la recopilación de los datos, limpieza de estos, transformación y correlación entre ellos para determinar cuales son relevantes y cuales no, cómo se relacionan y qué tipos de impactos generan.

Por poner un ejemplo sencillo, si yo estoy en una tienda de publico en general, hoy en día hay mucha información que llega al equipo encargo de los sistemas de la información: las cajas registradoras, las tarjetas de crédito, las tarjetas de vales de comida, la información de inventarios, las entradas y salidas de las personas, las compras de mercancía y luego entra en juego las encuestas de servicio, la percepción de los clientes, la percepción de los proveedores, la competencia. Y cada una de esas fuentes puede ser totalmente diferente, independiente y no centralizada. Por eso hablamos de datos estructurado y no estructurados, cuando nos referimos al análisis de los datos. El trabajo que viene a continuación es la limpieza de toda es información, es decir cuál información si es verídica y cuál no, porque siempre hay errores. Luego, hay que homogenizar esa información, a eso le llamamos transformación de la información y esto es necesario para poder relacionar la información entre sí. Ya que tenemos esa labor hecha, viene el análisis detallado y el relacionamiento de los datos entre si o más conocido como minería de datos.

Aunque hoy en día hay herramientas y plataformas que te apoyan en algunos de estos pasos, quien lo debe hacer es alguien que tenga conocimientos suficientes en matemática avanzada. Y no señores, no solo se trata de querer, es sumamente importante tener una preparación en la materia para no salir frustrados en el intento. Quien tiene habilidad para la estadística, facilidad para la matemática avanzada e interés porque análisis detallado, ya tiene los soft skills necesarios, pero es fundamental pulirlo con conocimiento de técnica.

En resumen, hay mucha información ya generada sobre estos temas. Lo más importante es tener una noción clara del panorama y ver los jugadores más importantes, que están diciendo y cómo definen los términos, pero aun más relevante, cómo lo aterrizamos en acciones. A titulo personal si recomiendo leer más sobre estos temas en 2 vertientes. 1) los expertos de industria como: Gartner, Forrester, IDC, entre otros; aunque hay más. 2) los jugadores más importantes que ofrecen plataformas de Ciencia de Datos: Microsoft, SAS Institute, IBM, , SAP. Y en está misma categoría hace sentido también investigar lo que la comunidad de científicos de datos que usan R y Python, tienen que decir.

 

“Somos la mejor opción para acompañar a tu Organización durante su Transformación Digital. Más de 20 años colaborando con empresas nacionales e internacionales.

Si estás próximo a arrancar un proyecto de migración a La Nube, Desarrollo de Software o Aplicaciones Móviles Empresariales y tienes dudas sobre este tema, te invito a que nos contactes”.

 

Somos una Empresa de Desarrollo de Software, especialista en Desarrollo de Aplicaciones WebDesarrollo de Apps EmpresarialesMicrosoft Dynamics 365 y Fábrica de Software. Desarrollamos software basado en Microsoft .NET, y aplicaciones nativas en iOS o Android; para aquellas empresas que sólo requieren la contratación directa de especialistas, brindamos asesoría especializada de acuerdo a las necesidades de nuestros clientes con experiencia en las tecnologías más avanzadas para apoyar tu estrategia en desarrollo de sistemas y desarrollo de app.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *