1. Inicios en R ¿Qué es R y R studio? Instalación de R y R studio. Conociendo la interfaz de R studio. 2. Introducción a la programación con R. Estructuras de datos en R Estructuras de control, ciclos y funciones Funciones especializadas en R Ficheros en R. Web Scraping 3. Limpieza y preparación de datos. Imputación de datos. Tratamiento de outliers. Expresiones regulares. Reescalar, normalizar y variables indicadoras. 4. Estadística descriptiva Tipos de variables. Subconjunto y partición de datos. Transformación de datos. Medidas de centralidad y sesgo. Gráficos descriptivos. 5. Métodos de clasificación y regresión (Aprendizaje supervisado) Validación cruzada. Curva ROC, matriz de confusión y Error cuadrático medio Árboles de clasificación y regresión. Bosques aleatorios Bagging, y Boosting. Máquinas de soporte vectorial. K Nearest Neighbors. Naïve Bayes. Regresión logística. Regresión lineal.
1. Inicios en Python Instalar paquetes con pip Python, Comandos básicos Kaggle y Google colab 2. Introducción a la programación con Python Variables y tipos de variables Estructuras de datos Condicionales, ciclos y funciones Ficheros Py 3. Limpieza y preparación de datos. Imputación de datos. Tratamiento de outliers. Expresiones regulares Reescalar, normalizar y variables indicadoras. 4. Estadística descriptiva Subconjunto y partición de datos Transformación de datos Medidas de centralidad y sesgo Visualización 5. Métodos de clasificación y regresión (Aprendizaje supervisado) Regresión lineal. Regresión logística. Validación cruzada. Curva ROC, matriz de confusión y Error cuadrático medio Árboles de decisión Árboles de clasificación y regresión. Bosques aleatorios Bagging, y Boosting. Máquinas de soporte vectorial. K Nearest Neighbors. Naïve Bayes.