Está en la página 1de 15

Ciencia de los Datos

ING. SHARON LISSETH PÉREZ


Tipos de análisis de datos

Podemos distinguir diferentes tipos de análisis de datos en función de cuál


sea nuestro objetivo al realizarlo.
 Si queremos saber Cómo actuar nos encontraremos con un
Análisis Prescriptivo.
 Si queremos saber Qué sucederá tendremos un Análisis Predictivo.
 Si queremos saber Por qué ha sucedido estaremos ante un Análisis de
tipo Diagnóstico.
 Si queremos saber Qué hacer para que suceda tendremos un
Análisis Descriptivo.
Análisis de correlación

 Esta es una técnica de análisis datos estadístico. Sirve para determinar si existe una relación
entre dos variables cuantitativas diferentes y cuan fuerte es esa relación entre las variables.
Suele utilizarse cuando se sospecha que dos variables siguen o tiene una evolución similar.

 En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal


y proporcionalidad entre dos variables estadísticas. Se considera que dos variables
cuantitativas están correlacionadas cuando los valores de una de ellas varían
sistemáticamente con respecto a los valores de la otra: si tenemos dos variables (A y B) existe
correlación entre ellas si al disminuir los valores de A lo hacen también los de B y viceversa. La
correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad.
Análisis de regresión

 Se trata de otra de las técnicas de análisis de datos estadísticos para investigar la relación entre
diferentes variables. Se utiliza cuando una se sospecha que una de las variables puede estar
afectando (variable independiente) al comportamiento de la otra (variable dependiente) u otras.

 La regresión es sin duda el caballo de batalla de la estadística, existe un gran número de métodos
estadísticos que se llaman regresión o fundamentados en la idea principal de la regresión que no
es más que la relación lineal entre dos o más variables.

 Un método para abordar el análisis lineal, es el método de mínimos cuadrados, que minimiza la
suma de los residuos. La diferencia entre el valor ajustado del modelo y el valor observado, es
decir, el error entre los valores predecidos y los valores reales.
Mínimos Cuadrados

Es un procedimiento de análisis numérico en la que, dados un conjunto de datos (pares


ordenados y familia de funciones), se intenta determinar la función continua que mejor
se aproxime a los datos (línea de regresión o la línea de mejor ajuste), proporcionando
una demostración visual de la relación entre los puntos de los mismos.

En su forma más simple, busca minimizar la suma de cuadrados de las diferencias


ordenadas (llamadas residuos) entre los puntos generados por la función y los
correspondientes datos.
Mínimos Cuadrados

Este método se utiliza comúnmente para analizar una serie de datos que se obtengan
de algún estudio, con el fin de expresar su comportamiento de manera lineal y así
minimizar los errores de la data medida.

La creación del método de mínimos cuadrados generalmente se le acredita al


matemático alemán Carl Friedrich Gauss, quien lo planteó en 1794 pero no lo publicó
sino hasta 1809. El matemático francés Andrien-Marie Legendre fue el primero en
publicarlo en 1805, este lo desarrolló de forma independiente.
Su expresión general se basa en la ecuación de una recta y = mx + b.
Donde m es la pendiente y b el punto de corte, y vienen expresadas de la
siguiente manera:
Σ𝑦Σ𝑥 2 − Σ𝑥 Σ𝑥𝑦
𝑏=
𝑛Σ𝑥 2 − (Σ𝑥)2
𝑛 Σ𝑥𝑦 − Σ𝑥 Σ𝑦
𝑚=
𝑛Σ𝑥 2 − (Σ𝑥)2
Σ𝑦 − 𝑚Σ𝑥
𝑏=
𝑛

Σ Es el símbolo sumatoria de todos los términos, mientas (x, y) son los datos en
estudio y n la cantidad de datos que existen.
El método de mínimos cuadrados calcula a partir de los n pares de datos
experimentales (x, y), los valores m y b que mejor ajustan los datos a una recta. Se
entiende por el mejor ajuste aquella recta que hace mínimas las distancias d de los
puntos medidos a la recta.
Ecuación de la Recta

y = mx +b
𝑛 𝛴𝑥𝑦 −𝛴𝑥 𝛴𝑦 𝛴𝑦 −𝑏𝛴𝑥
𝑦= x+
𝑛𝛴𝑥 2 −(𝛴𝑥)2 𝑛
Datos/Puntos xy
n x y xy x2
1 7 2 14 49
2 1 9 9 1
3 10 2 20 100
4 5 5 25 25
5 4 7 28 16 Ejemplo
6 3 11 33 9
7 13 2 26 169
8 10 5 50 100
9 22 14 28 4
55 57 233 473
Reemplazamos

𝑛 Σ𝑥𝑦 − Σ𝑥 Σ𝑦
𝑚=
𝑛Σ𝑥 2 − (Σ𝑥)2

9 (233) − (55) (57)


𝑚=
9(473) − (55)2

−1038
𝑚= = −0.84
1232
Reemplazamos

Σ𝑦 − 𝑚Σ𝑥
𝑏=
𝑛

57 − −0.84 (55)
𝑏=
9

𝑏 = 11.48 𝑜 11.46
Ecuación de la Recta

y = -0.84x + 11.46
Ecuación de
la Recta

También podría gustarte