Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Computación III-Tema 08 Estad Inferenc
Computación III-Tema 08 Estad Inferenc
08
Capacidad:
Realiza y obtiene el coeficiente de correlación y regresión en base a
una aplicación del mundo real.
Contenidos:
MÓDULO DE COMPUTACIÓN 3 2
Coeficiente de Correlación de Pearson: Conocido como coeficiente de correlación
lineal de Pearson de n pares de valores (X1, Y1), (X2, Y2), … (Xn, Yn) de una variable
bidimensional (X e Y).es el número abstracto r que se calcula por:
𝑆𝑋𝑌
r=
𝑆𝑋 𝑆 𝑌
Donde:
SXY : es la covarianza de X e Y.
SX : es la desviación estándar de X
SY : es la desviación estándar de X
El valor de “r” de Pearson, se considera de “Alta relación” cuando sur valor de acerca a
+1 (relación directa) o -1 (relación inversa).
MÓDULO DE COMPUTACIÓN 3 3
Ejemplo 03: Se realizó un estudio durante las últimas lluvias del verano de 2017 en
Chiclayo; y se evaluaron 15 avenidas principales de la ciudad y se midió el volumen de
llvua caída (m3) y su repercusión de desborde (m3) que presentó. Evaluar el nivel de
asociación entre ambas variables y determinar si existe relación entre ellas.
Volumen Volumen
Lluvia (m3) Desborde (m3)
5 4
12 10
14 13
17 15
23 15
30 25
40 27
47 46
55 38
67 46
72 53
81 70
96 82
112 99
127 100
Fuente: Senamhi – Verano 2018
MÓDULO DE COMPUTACIÓN 3 4
2º. Luego aplicamos la ruta de “”correlación”, para así poder determinar la
existencia de relación entre las variables de estudio.
Entonces podemos apreciar a través de la matriz de correlación, que existe una “Alta
Relación” a un 98.8% entre el “Volumen de lluvia” y el “Volumen de
Desbordamiento”.
2. Regresión
En este caso, abordaremos regresión lineal simple, la cual estima los coeficientes
de la ecuación lineal, con una o más variables independientes, que mejor prediga
el valor de la variable dependiente.
Por ejemplo:
“Intentar predecir el total de ventas anuales de un vendedor (la variable
dependiente) a partir de variables independientes tales como la edad, la formación
y los años de experiencia”.
MÓDULO DE COMPUTACIÓN 3 5
Podemos encontrar dicha opción mediante la siguiente ruta:
MÓDULO DE COMPUTACIÓN 3 6
***Luego visualizaremos en la “Ventana de Resultados” la obtención y evaluación del
modelo de regresión.
Y = 0.827 X – 1.128
MÓDULO DE COMPUTACIÓN 3 7
3. Estadística Paramétrica
Dentro de las medidas de resumen que pueden realizarse, existen 02 tipos de
enfoque:
- Parámetro: Es una medida (central, dispersión, distribución, etc.) que
puede obtenerse a partir de la población. En la práctica dicho valor
usualmente no es conocido ya que no podemos examinar toda la
población (factores económicos, temporales, necesidad, limitación, etc.)
MÓDULO DE COMPUTACIÓN 3 8
3.1. Prueba de Media contra un valor hipotético
Este procedimiento nos permite verificar si una muestra puede proceder
de una población en la cual la variable de interés presenta una media
determinada.
Por ejemplo: Las cajas de cierto tipo de cereal procesadas por una
fábrica deben tener un contenido promedio de 160 g. Por una queja ante
el INDECOPI de que tales cajas de cereal tienen menos contenido, un
inspector tomó una muestra aleatoria de 10 cajas (provienen de una
población normal) encontrando los siguientes pesos de cereal en gramos:
157, 157, 163, 158, 161, 159, 162, 159, 158, 156
Accedemos a la opción:
MÓDULO DE COMPUTACIÓN 3 9
Figura 12: Asignación de Datos – “Prueba T para una muestra”
1 2 3
4 5
MÓDULO DE COMPUTACIÓN 3 10
3.2. Prueba de Media para dos muestras Independientes
Este procedimiento nos sirve para contrastar la hipótesis nula de
que las medias de dos muestras no difieren entre sí. Este
procedimiento de comparación deberá ser utilizado en aquellos
casos en que los grupos sean independientes (grupos
categóricos: género, NSE, escuelas profesionales, etc.), es decir,
no exista ningún tipo de relación entre los términos de error de
ambos grupos.
14 6 4 15 3 3 6 5 6 3 0 0 3 20 0 0 1 1 1 0
A A A A A A A A A A N N N N N N N N N N
Solución: H0: μA = μ N
H1: μA ≠ μN
Accedemos a la opción:
MÓDULO DE COMPUTACIÓN 3 11
Figura 13: Procedimiento – “Prueba T para muestras Independientes”
2
3
Previo Posterior
94,07 89,41 86,59 85,45
96,79 85,31 93,08 84,59
92,15 89,25 87,85 84,89
92,30 93,20 86,83 93,10
96,50 89,17 92,70 86,87
83,11 93,51 76,80 86,36
91,16 88,85 83,40 83,24
90,81 88,40 86,74 81,20
81,37 82,45 77,67 77,18
89,81 96,47 85,70 88,61
84,92 99,48 79,96 94,67
84,43 99,95 79,80 93,87
86,33 100,05 81,15 94,15
87,60 87,33 81,92 82,17
81,08 87,61 76,32 86,01
92,07 89,28 90,20 83,78
81,14 89,72 73,34 83,56
96,87 95,57 93,58 89,58
99,59 97,71 92,36 91,35
83,90 98,73 77,23 97,82
Accedemos a la opción:
MÓDULO DE COMPUTACIÓN 3 13
Figura 15: Procesamiento – “Prueba T para dos muestras independientes”
4
3
MÓDULO DE COMPUTACIÓN 3 14
3.4 Prueba de ANOVA Paramétrica
El análisis de la varianza (ANOVA) es el método que nos permite determinar
diferencias significativas entre el “efecto medio” que producen los “distintos
tratamientos” o niveles del factor estudiado.
Accedemos a la opción:
MÓDULO DE COMPUTACIÓN 3 15
Figura 17: Procesamiento – “Prueba ANOVA UN FACTOR”
MÓDULO DE COMPUTACIÓN 3 16
Referencias Bibliográficas:
Enlace Web
Statistics, I. S. (2017). Documentación técnica del producto de IBM.
Obtenido de https://www.ibm.com/support/knowledgecenter/es/
APA, N. (2017). Normas APA. Obtenido de Normas APA:
http://normasapa.com/insercion-de-tablas-y-figuras/
MÓDULO DE COMPUTACIÓN 3 17