Ciencia de Datos Aplicada: modalidad online
Contenidos
En 5 sesiones se cubrirán temas avanzados de ciencia de datos aplicada como los siguientes:
- Scraping: ¿Cómo obtener datos desde internet? Introducción básica a la estructura de las páginas web. Programación de scrapers, cómo almacenar los datos y cómo consultarlos.
- Análisis de texto: introducción al procesamiento y análisis de textos. Ejemplo con noticias de distintos medios de comunicación. Aplicación a la medición del conflicto social en base a noticias de medios masivos.
- Aprendizaje Automático: Introducción a las técnicas de aprendizaje automático. Aprendizaje supervisado: regresión y clasificación. Aprendizaje no supervisado: agrupamiento y reducción de la dimensionalidad. Sobreajuste y métricas de evaluación de modelos. Casos de implementación.
- Shiny: Cómo diseñar aplicaciones interactivas de manera rápida utilizando R. Consideraciones del alojamiento de datos y rendimiento para aplicaciones web. Publicación de aplicaciones.
Bibliografía de consulta
General: R for data science: Import, tidy, transform, visualize, and model data. - Wickham, H., & Grolemund, G. (En español en https://es.r4ds.hadley.nz/ )
1) Web Scraping - Steve Pittard (https://steviep42.github.io/webscraping/book/)
2) Text Mining with R – Silge y Robinson (https://www.tidytextmining.com/)
3) An introduction to statistical learning - James, G., Witten, D., Hastie, T., & Tibshirani, R. (https://hastie.su.domains/ISLR2/ISLRv2_website.pdf)
4) Mastering Shiny – Hadley Wickham (https://mastering-shiny.org/)
Este curso forma parte de la oferta académica de la Diplomatura en Ciudades y Políticas Urbanas y de la Diplomatura en Uso de Datos y Evidencia para Políticas Públicas.
Admisiones
(54 11) 5169 7231/7251
WhatsApp (54 911) 5571 9552
posgradosditella@utdt.edu
El horario de atención es de 10 a 19h.
Solicitar información
Muchas gracias.