Aprendizaje Estadístico: un enfoque práctico con R
Material adaptado de ISLR2
Prefacio
En este “Quarto Book” se ha integrado parte del material para la asignatura Aprendizaje Estadísitico y Otras Técnicas Analíticas Avanzadas del Máster MUMADE. Concretamente la parte de Aprendizaje Estadístico.
El material, con un enfoque totalmente práctico/aplicado, es una traducción/adaptación de los “Labs” del libro An Introduction to Statistical Learning, with applications in R, que está accesible libremente en formato PDF en https://www.statlearning.com. También está accesible en https://www.statlearning.com/resources-second-edition numeroso material asociado al libro: slides, los citados Labs originales (en formato .Rmd y .html), los scripts de R de los Labs, etc. Aquí aprovecho dicho material que los autores ponen a nuestra disposición para fines educativos.
En el proceso de traducción/adaptación me he tomado la licencia de omitir algunas partes, recortar otras (principalmente por duplicidades), renombrar secciones y crear un anexo con elementos transversales que aparecían en el material original.
- Un comentario importante: en la adaptación de los Labs originales he omitido intencionadamente la función
attach()
, cuyo uso desaconsejo, como muchos expertos de R (pude verse una discusión sobre ello aquí)
Un par de buenas alternativas (en castellano) a este material (para profundizar y ampliar contenidos, consultar detalles u otros enfoques) son:
El libro Métodos predictivos de aprendizaje estadístico. Por el nombre ya queda claro la similitud con este material, y el contenido del libro es más extenso y profundo que lo que se presenta en este material. En algún Capítulo/Técnica el libro utiliza otro enfoque y otras funciones de
R
. Asociado con el libro se puede encontrar el paquete de Rmpae
que incluye funciones y datos utilizados en el libro.El libro Fundamentos de ciencia de datos con R. El nombre no refleja tan claramente la similitud, pero, entre el numeroso contenido se pueden encontrar todas las técnicas que se presentan en este material. También tiene asociado un paquete de R:
CDR
, que contiene los conjuntos de datos que aparecen en el libro y no están disponibles en otros paquetes.