Si quieres hacer carrera en Data Science, este es el itinerario educativo perfecto (y en línea)

data science
Sin comentarios Facebook Twitter Flipboard E-mail
wbct-colaborador

WSL Branded Content

Expertos en Branded Content

Vivimos en la era de la información. Los datos son moneda de cambio y las empresas se enfrentan a acumulaciones de proporciones mayúsculas que necesitan ser gestionadas. Esto implica directamente una necesidad de espacio de almacenamiento extra, servidores y ordenadores más potentes para gestionarlos y un personal que agrupe y clasifique, interprete y, finalmente, arroje unas conclusiones a todo ese embrollo.

Necesitamos algoritmos —y personas que los programen— junto a redes capaces de ocuparse de estas rutinas: minería, clasificación, inferencia estadística y análisis. Precisamente, la buena minería mide el tiempo, la velocidad con la que esos datos pueden decirnos algo.

Es aquí donde entra la ciencia de datos, el campo interdisciplinar que engloba estadística, analítica, machine learning y minería de datos. «Un científico de datos es un estadista que puede programar», diría Cassie Kozyrkov. Científicos, procesos y sistemas. Una sentencia algo sesgada pero que arroja luz a la realidad: la ciencia de datos es imprescindible en el presente y futuro que estamos construyendo. Allá donde haya datos debe haber alguien que sepa interpretarlos.

El hoy y el ahora

No decimos nada nuevo, la data science no es ninguna “tendencia” moderna. Podríamos remontarnos a principios de los 60, a los primeros ensayos de John W. Tukey y la influencia de Frederick Mosteller, para entender esta disciplina educativa. Es solo que ahora necesitamos expertos con urgencia.

Las empresas, más que nunca, demandan profesionales que aceleren la innovación, aumenten la productividad y mejoren la competitividad, que puedan obtener conclusiones con las que resolver problemas con mayor agilidad. Según varios informes, la demanda es tal que cada año habrá más y más vacantes. Un conocimiento que puede adquirirse fundamentalmente vía online.

edX

Siempre leemos «todo está en Internet y, si no, es que no has buscado bien». Miles de cursos y plataformas para visitar museos, aprender idiomas y hasta estudiar una carrera.

Y en momentos en que pasamos más tiempo en casa, es hora de aprovechar la oportunidad. Plataformas como edX, una organización sin fines de lucro, permiten acceder a más de 2.500 cursos en línea, desde instituciones tan prestigiosas como el MIT, Berkeley, Harvard o el Tec de Monterrey e IBM. Cultura y educación esencialmente gratuita para comenzar nuestro itinerario en la ciencia de datos.

Distintas ramas para distintos profesionales

data 1

Pero enfrentarse a los distintos algoritmos de clasificación, regresión y análisis, sin una mano amiga, puede resultar muy árido. En estos campos, la tutela es esencial para separar el grano de la paja y para medrar en el menor tiempo posible. Es aquí donde plataformas como edX brindan un importante ecosistema educativo. Al registrarnos pasamos a ser parte de su gigantesco campus virtual.

De hecho, fueron Harvard y MIT quienes desarrollaron esta plataforma para construir un organismo global libre de horarios restrictivos, sin costes de desplazamiento o acceso. Con los años, edX se ha convertido en el único proveedor de MOOCs sin ánimo de lucro y apadrinado por más de 140 partners internacionales.

La mayor parte de estos cursos son completamente gratuitos, salvo la certificación, que garantiza tanto el mantenimiento de la plataforma y su sustento económico, como el beneficio de poder oficializar en nuestro CV esta formación.

Tampoco hay un horario establecido. Aunque debemos acogernos a unos plazos de apertura y cierre, nosotros elegimos el cuándo y el cómo dentro de ese plazo. Y con cada curso se sugiere material de libre acceso, lecturas y bibliografía disponible para descargar y utilizar como apoyo complementario. Desde edX podemos acceder tanto a cursos en español como en inglés. Si nuestro foco de interés es la ciencia de datos, a continuación veremos los principales cursos para dar el primer paso.

data 2

> Introducción a la Ciencia de Datos y el Big Data

Una buena forma de comenzar. Este curso sirve como puerta de entrada para adquirir conocimiento en los conceptos clave del Big Data y la ciencia de datos. Un ameno enfoque histórico impartido por parte del profesor del Instituto Tecnológico de Monterrey Jesús Aguilar.

Si preferimos este mismo modelo introductorio pero en la lengua de Shakespeare, este otro curso con seis semanas de duración e impartido por el profesional de IBM Alex Aklson nos dará un mapa claro sobre las necesidades que necesitamos adquirir y las herramientas de trabajo diario en la ciencia de datos.

> Big Data sin misterios

Con 53.000 inscripciones, este MOOC impartido por el el BID (Banco Interamericano de Desarrollo) se focaliza en los fundamentos y aplicaciones del Big Data, con ejemplos reales, metodología y un amplio glosario para entender las herramientas utilizadas en este campo.

> Aprendizaje automático y ciencia de datos

Por otro lado, e impartido por los instructores de la Universitat Politècnica de Valencia José Hernández-Orallo, María José Ramírez Quintana y Fernando Martínez Plumed, este curso —a ritmo del estudiante— cuenta con un sencillo plan de estudios para aterrizar en el machine learning, con un tema dedicado a la programación en R, otro enfocado en la evaluación de modelos de aprendizaje automático, un epígrafe dedicado en las técnicas básicas y un último bloque centrado en el pre-procesamiento de datos.

> Internet de las cosas (IoT) y Big Data

Para entrar en materia sobre la denominada revolución 4.0, el equipo docente de la Universidad del Rosario ha desarrollado este curso que puedes estudiar a tu propio ritmo y que parte desde los primeros comandos en GIT, pasando por las herramientas para gestionar bases de datos (a través de sistemas como MySQL) o los distintos módulos para crear ecosistemas IoT a nivel industrial.

> Ciencia de datos: visualización

La Universidad de Harvard, una de las escuelas más prestigiosas del mundo y hogar de ilustres estudiantes como Barack Obama o Mark Zuckerberg oferta esta formación gratuita para entender la ciencia de datos desde una perspectiva visual recurriendo a ggplot2, un paquete de visualización de datos escrito en R. De esta forma aprenderemos a detectar errores y comunicar hallazgos clave.

> Analizando datos con Python

Y de la mano del profesor de IBM Joseph Santarcangelo, este curso brinda una experiencia de primera mano en análisis de datos en Python usando la extensión NumPy y distintos datasets y dataframes, además de trabajar en rutinas matemáticas y machine learning aprovechando las biblioteca SciPy y Scikit-learn, ambas software libre y gratuito.

Si quieres explorar más cursos en ciencia de datos, puedes hacerlo aquí.

Imágenes | Unsplash (1, 2 y 3)

Comentarios cerrados
Inicio