Introducción a la Estadística para Científicos de Datos. Capítulo 6. Descripción numérica de variables
Descripción numérica de variables Se comienza con la recopilación de datos, la tabulación de los mismos y el establecimiento de la tipología y el rol que juegan estos en el conjunto de datos. Establecido ese marco, es necesario describir los datos; recordemos que, por sí mismos, los datos no dicen nada, no resuelven nada. Esa información la suministra un análisis. Transformar datos in información Recordando lo tratado en el capítulo 2, el álgebra lineal define el análisis estadístico; la estructura más sencilla es el vector, donde aplicaría el análisis univariable: el inicio de todo. Si se dispone de más de una variable, ya podemos disponer esa serie de datos in forma matricial; buscar estructuras dentro de esas matrices nos produce el análisis multivariable. Conforme ha mejorado la capacidad de computación, se han podido crear sistemas estadísticos capaces de aprender de los propios datos; al conjunto de análisis basados en estos sistemas se le denomina machine learning. Actualmente se está avanzando más: hay entornos más sofisticados capaces de trabajar con tensores matemáticos, estructuras algebraicas multidimensionales que permiten implementar algoritmos que imitan los procesos de aprendizaje humano; este conjunto de técnicas y algoritmos se recogen dentro del ámbito de la inteligencia artificial. ...