Está en la página 1de 54

Estadística II

Facilitador: Nataly Domínguez


Estadística II
1. Las pruebas de hipótesis para una muestra
2. Las pruebas de hipótesis para dos muestras
3. Análisis de varianza
4. Pruebas no paramétricas
5. Análisis de regresión
Trabajos a realizar
Dinámica de trabajo
Foro
• 2 aportaciones, cuidar las fechas y el mínimo de cada aportación así como la estructura.
• No hay prorrogas
• Cuidar el formato APA, incluir citas y referencias así como no utilizar más del 20% de cita textual en
cada una de sus aportaciones.
Cuestionarios y Ejercicios
• Leer bien los temas previo a su realización
• Cuidar el tiempo
• Encontrar el mejor momento para poder presentar las actividades
Proyecto
• Cuidar las fechas de semana de entrega oficial del primer avance, de entregar semana posterior se
recibe al 80%
• Entrega final del proyecto no tiene semana de entrega extemporánea.
• En ambas entregas, cuidar el formato APA en sus introducciones y respuesta, incluir citas y
referencias así como no utilizar más del 20% de cita textual.
Recordemos
Recordemos
¿Qué es?

¿Cómo se divide?
Estadística
¿Cuáles son los campos de
aplicación?
¿Qué es población, muestra,
unidad de análisis ?
Recordemos
Población: Conjunto de elementos por los cuales se tiene un
interés; las poblaciones pueden ser finitas o infinitas.

Muestra: Subconjunto representativo de una población.

Unidad de análisis: Es cada uno de los individuos/elementos que


forman parte de mi muestra.

Variable: Característica que toma valores diferentes en diferentes


personas o elementos.
Recordemos
Media (X): Es el valor promedio de un conjunto de datos
numéricos.

Mediana (Me(x)): Es el valor numérico de posición central en un


conjunto de datos ordenados.

Moda (Mo(x)): Es el valor numérico que está representado más


veces dentro de esos datos, o en otras palabras, es el numero
que aparece con mayor frecuencia.
Recordemos
Varianza: Me dice que tan próximos están a su media un
conjunto de datos
Varianza muestra (S2 )
Varianza Poblacional (σ2)
Desviación estándar (S): Medida de variación dentro de un
conjunto de datos. Mientras mayor es la desviación estándar,
mayor es la dispersión de la población.
Desviación estándar muestral (S)
Desviación estándar Poblacional (σ)
Recordemos
Recordemos
Distribución Binomial: Distribución de probabilidad discreta que
describe el número de éxitos al realizar n experimentos
independientes entre sí, cada experimento es dicotómico porque
o es verdadero o falso con: Un jugador de baloncesto tiene un 80% de aciertos en tiros
libres. Si lanza 3 veces ¿Qué probabilidad hay de que enceste
2?
p= probabilidad de éxito P= p*p*q= (0.8)(0.8)(0.2)= 0.128
q= probabilidad de fracaso

Nota: recuerda que parte del diagrama


de árbol.
Recordemos
Distribución Binomial
𝑛 𝑥 𝑛−𝑥
𝑃 𝑥 é𝑥𝑖𝑡𝑜𝑠 = 𝑝 ∗ 1−𝑝 en donde 1 − 𝑝 = 𝑞
𝑥
Un jugador de baloncesto tiene un 80% de aciertos en tiros libres. Si lanza 20 lanzamientos
seguidos ¿Cuál es la probabilidad acertar 13?

𝑛 𝑥 𝑛−𝑥
𝑃 𝑥 é𝑥𝑖𝑡𝑜𝑠 = 𝑝 ∗ 1−𝑝
𝑥
20!
𝑃 𝑥 é𝑥𝑖𝑡𝑜𝑠 = (0.813 ) ∗ (0.27 )
13!7!

𝑃 𝑥 é𝑥𝑖𝑡𝑜𝑠 = 0.0545
Recordemos
Distribución Normal: Es un modelo teórico capaz de aproximar
satisfactoriamente el valor de una variable aleatoria a una
situación ideal.
• Campana de Gauss
• Distribución Gaussiana

• Asíntota horizontal
• El área bajo la curva es 1 (100%)
• Es simétrica
• En el centro está µ, Me y Mo
Recordemos
Distribución Normal
1 𝑋−𝜇 2
1
f 𝑥 = 𝑒 2 𝜎
𝜎 2𝜋

En un país la estatura de la población posee una distribución normal de media 170cm y una
desviación de 12cm ¿qué porcentaje de la población mide más de 170cm

1. Como se que el área total bajo la curva es de 1, y la media es de


170cm, por grafica se deduce que es el 50%
2. También se puede resolver la integral con valores de 170 a ∞
3. Tabla Z, al revisar se poseen los elementos de una normal estándar
Y establecer el nivel de significancia (α)
Recordemos
Aproximación de la Binomial a la Normal

Binomial aproximar Distribución Normal aproximar D. Normal Std.

B(n,p) N(np, 𝑛𝑝𝑞) N(0, 1)

Requisitos
• No. de experimentos suficientes
• n*p ≥ 5
• n*q ≥ 5
• Se debe de hacer una corrección de continuidad
Pruebas de hipótesis
para una muestra
¿Hipótesis?
Es una afirmación sobre los valores de los parámetros de una población o proceso que
puede probarse a partir de la información contenida en una muestra (Gutiérrez y De la
Vara, 2004)

Afirmación o aseveración acerca de una propiedad de una población (Triola, 2013)

Formulas la Nace la
Observas
idea hipótesis
Pruebas Hipótesis
Hipótesis = Afirmación + propiedad observada

Prueba de Hipótesis = Procedimiento basado en evidencia de la


muestra y la teoría de la probabilidad para determinar si la
hipótesis es una afirmación razonable.

(Lind, 2015)
Pruebas Hipótesis
Hipótesis Nula (H0) La H es de hipótesis y el subíndice cero
indica que no hay diferencia, por lo tanto indica que el valor de
un parámetro población es igual a un valor establecido.

Hipótesis Alternativa (H1)  La H es de hipótesis y el subíndice


uno indica que es la alternativa o de investigación, y se relaciona
a la información que brinda la muestra para rechazar a la
hipótesis nula, es decir su valor afirma que difiere de la hipótesis
nula.
Pruebas Hipótesis
¿La H0 se acepta o se rechaza?
Nuestro nivel de significancia es
de 0.05, es decir es muy poco
Zona de aceptación
probable que de los extremos
de la gráfica se tenga un caso
mientras que del área blanca
sería más probable.

Por lo que por arriba o debajo


del valor de z se rechaza la H0 y
entre estos valores se acepta.

Zona de rechazo (Bologna, 2011)


Pruebas Hipótesis
¿La H0 se acepta o se rechaza?

Confianza Significancia Cola Izq. Cola Der. Ambas


90% 10% -1.28 1.28 ±1.64
95% 5% -1.64 1.64 ±1.96
99% 1% -2.33 2.33 ±2.58

(Bologna, 2011)
Pruebas Hipótesis: Bilateral
Confianza Significancia Cola Izq. Cola Der. Ambas
¿Cómo buscar en la tabla? 90% 10% -1.28 1.28 ±1.64
95% 5% -1.64 1.64 ±1.96
99% 1% -2.33 2.33 ±2.58
Zona de aceptación
Primero ubicas nivel de significancia:
0.05

Luego conoces la confianza:


1-0.05=0.95
0.025 0.025
Cuando trabajamos con extremos se obtiene la mitad de la
confianza:
0.475 0.95/2= 0.475

Zona de rechazo Buscas en la tabla 0.475 para obtener el valor de z que es


±1.96
Pruebas Hipótesis: Unilateral
Confianza Significancia Cola Izq. Cola Der. Ambas
¿Cómo buscar en la tabla? 90% 10% -1.28 1.28 ±1.64
95% 5% -1.64 1.64 ±1.96
99% 1% -2.33 2.33 ±2.58
Zona de aceptación
Primero ubicas nivel de significancia:
0.05

Luego conoces la confianza:


1-0.05=0.95
0.05 Cuando trabajamos con un extremo, a la mitad de la campana (0.5) le
resto el nivel de confianza:
0.5-0.05= 0.45
0.45
Buscas en la tabla 0.45 para obtener el valor de z que es 1.64 (cuando
Zona de rechazo no sea exacto se elige el valor más cercano por debajo o promedio
entre los dos valores más próximos)
Pruebas Hipótesis
Una cola Cuando la H1 nos menciona alguna dirección, es
decir si será mayor o menor.
Pruebas Hipótesis
Dos colas Cuando la H1 no menciona ninguna dirección, solo
menciona que es diferente a un valor.
𝐻0: 𝜇 = 𝑋
𝐻1: 𝜇 ≠ 𝑋
Pruebas Hipótesis
1. Se establecen las hipótesis nula y alternativa

2. Se selecciona el nivel de significancia


Importante: la prueba
de hipótesis no
3. Se identifica el estadístico de prueba
define que algo es
verdadero, pero si
4. Se formula la regla de decisión brinda una prueba
más allá de una duda
5. Se toma una muestra y se decide razonable.

6. Se interpreta el resultado
Pruebas Hipótesis: Tipos de errores

ERROR TIPO I
ERROR TIPO II
Rechazar la H0
Aceptar la H0
cuando es
cuando es falsa.
verdadera.
Pruebas Hipótesis: Ejemplos
Una empresa que fabrica computadoras personales utiliza una gran
cantidad de tarjetas con circuitos impresos. Los proveedores participan en
una licitación y el que presenta la cotización más baja obtiene el contrato.
Esta específica que el departamento del control de calidad del fabricante
de computadoras tomará una muestra de los envíos que llegan; si más del
6% de las tarjetas de la muestra no cumple con las normas, el envío será
rechazado.

¿Cuál es la H0 y la H1?
Pruebas Hipótesis: Ejemplos
H0: El envío de tarjetas contiene 6% o menos tarjetas que no satisfacen las
normas.
H1: Más del 6% de las tarjetas están defectuosas.
Pruebas Hipótesis: Ejemplos
Embarque: 4000 tarjetas
N= 50
Defectos: 4 tarjetas = 8%

¿El embarque se acepta o rechaza?


Pruebas Hipótesis: Ejemplos
Embarque: 4000 tarjetas
N= 50
Defectos: 4 tarjetas = 8%

Como el embarque fue rechazado, el proveedor hace revisión de sus


tarjetas y encuentra que del total solo esas 4 estaban dañadas, es decir el
0.1%.

 Fue un error rechazar el embarque, es decir se rechaza la H0 cuando no


debió rechazarse, esto es un error de tipo I y la probabilidad de este error
es α.
Pruebas Hipótesis: Nivel de significancia(α)
Se establece como la probabilidad de que la H0 sea rechazada
cuando es verdadera.

• Se aplica a todas las pruebas


• 0.05 (5%), es el más común, muy utilizado en temas de proyectos de investigación y
del consumidor.
• 0.01 (1%), utilizado en temas de calidad, fármacos y encuestas políticas.
Estadístico de muestra
Estadístico de Prueba
Es aquel valor empleado para tomar la decisión sobre la H0, y
este se obtiene al convertirlo al estadístico muestral (Triola,
2013).
• Proporción muestral
• Media muestral
• Desviación estándar muestral

Lo anterior en una puntuación como


• z
• t
• X2
Estadístico t Student (t)
Modelo teórico que se utiliza para realizar una aproximación de una
población que tiende a la distribución normal

• Comparación de medias
• Tamaño de muestra pequeño (n<30)
• Los datos presentan tendencia a la normalidad
• Cuando no se tiene la desviación estándar poblacional

𝑋−𝜇
𝑡=
𝑆/ 𝑛
Estadístico t Student (t): Ejemplo
Una fabrica de tornillos tiene un promedio de producción de 25 horas por
lote; para mantener este promedio se realizan muestreos cada mes con un
α de 0.01 en 16 tornillos; al tomar una muestra se obtiene una media de
27.5 horas con una desviación estándar de 5 ¿qué puedes concluir?
H0: µ=25 -2.6025 < 2 < 2.6025
H1: µ≠25 𝑡𝑐(0.01,15) = 2.6025
Debido a que el valor observado
𝑋−𝜇 de t cae en la zona de aceptación
X= 27.5 𝑡=
𝜎/ 𝑛 de H0, se concluye que existe
S=5 27.5 − 25 2.5
= = evidencia estadística con una
µ=25
-2.6025 +2.6025 5/√16 1.25 significancia de 0.01 que no hay
n=16 Zona de =2 diferencia entre las horas de
α=0.01 aceptación producción.
g=15 (g=n-1)
Estadístico t Student (t): Ejercicio
Para que los alimentos sean asimilados por el organismo, deben tener un pH mínimo
de 7, se esta formulando un nuevo producto alimenticio y se toman 13 muestras
obteniendo una media de 6.69 y una desviación estándar de 1.037. ¿Con un α de 0.05
se puede decir que este producto es apto para el consumo humano?
-1.072 < 1.7822
H0: µ≤7
H1: µ>7 𝑡𝑐(0.05,12) = 1.7822
Debido a que el valor observado
𝑋−𝜇 de t cae en la zona de aceptación
X= 6.69 𝑡=
𝜎/ 𝑛 de H0, se concluye que existe
S=1.037 6.69 − 7 evidencia estadística con una
µ=7 = significancia de 0.05 que este
+1.7822 1.037/√13
n=13 Zona de −0.31 nuevo producto alimenticio es
α=0.05 aceptación = = −1.07 optimo para el consumo humano.
0.299
g=12
Normal (Z)
Se interpreta como el número de desviaciones estándar que están
comprendidas entre el promedio y un cierto valor de variable x. En otras
palabras, se puede decir que es la diferencia entre un valor de la variable y el
promedio, expresada esta diferencia en cantidad de desviaciones estándar.

• Comparación de medias
• Tamaño de muestras grandes (n>30)
• Los datos tienen una distribución normal

𝑋−𝜇
𝑍=
𝑆/ 𝑛
Normal (Z): Ejemplo

Gender Choice (Triola, 2009)


H0: µ=50 𝑍(0.05) = 1.96 -1.96 < 1.96 < 4
H1: µ≠50
Zobs = 52 – 50 / (5/√100) Debido a que el valor observado
X= 52 = 2/0.5 = 4 de Z cae en la zona de rechazo
S=5 de H0, se concluye que existe
µ=50 evidencia estadística con una
-1.96 +1.96
n=100 Zona de significancia de 0.05 que Gender
α=0.05 aceptación Choice no tiene influencia en el
nacimiento de niñas.
Normal (Z): Ejercicio
Se ha implementado un cambio de plan de estudios y se quiere conocer si habrá una
diferencia en el nivel de aprovechamiento en donde el promedio es de 6.5 de
calificación. Para ello se toma una muestra de 100 egresados con el nuevo plan y
obtenemos un promedio de 6.65 en las calificaciones con una desviación de 0.6;
¿existe una diferencia en al nivel de aprovechamiento entre los planes de estudio?
H0: µ=6.5 𝑍(0.05/2) = 1.96 -1.96 < 1.96 < 2.5
H1: µ≠6.5
Zobs = 6.65 – 6.5 / Debido a que el valor observado
X= 6.65 (0.6/√100) = 0.15/0.06 = de Z cae en la zona de rechazo
S=0.6 2.5 de H0, se concluye que existe
µ=6.5 evidencia estadística con una
n=100 -1.96 +1.96 significancia de 0.05 que el
Zona de promedio con el nuevo plan de
α=0.05 aceptación estudios es diferente al
promedio del plan de estudios
anterior.
Normal (Z)
Hasta ahora se ha empleado los niveles de Z críticos en función de los niveles de
significancia, pero que pasaría si estos niveles de Z críticos se establecieran en función
del promedio (X), los cuales se conocerán como Xc
𝑆
𝑋𝑐 = 𝜇 ± 𝑍𝑐 ∗
𝑛
Retomando nuestro ejemplo de los promedio y calculando nuestros nuevos valores
críticos en función del promedio:
0.6
𝑋𝑐 = 6.5 ± 1.96 ∗ = 6.5 ± 0.12
100
𝑋𝑐 = 6.38 y 6.62

Nuevamente se rechaza Se rechaza H0, porque 6.65 esta por arriba de 6.62.
Pruebas de hipótesis
para una proporción

Prueba sobre proporciones (𝑃)
Son adecuadas cuando los datos que se están analizando constan de cuentas o frecuencias
de elementos de dos o más clases. En este caso se trata de probar la hipótesis de que la
proporción de éxito en una situación de comportamiento binomial sea igual a un cierto valor
especifico.

𝑋
Por lo que la información que se utilizará será una proporción muestral 𝑃෠ = , donde X es el
𝑛
número de veces que ocurre el evento en n ensayos.

• Se toman muestras grandes


• Se utiliza la distribución normal estándar
• Al aumentar n, la distribución normal tiende a la binomial.

Prueba sobre proporciones (𝑃)
Hacer una prueba de hipótesis sobre una proporción, conlleva los mismos pasos que cuando
se trata de la media. En esta prueba, debemos tomar en cuenta el cálculo del error estándar
de la proporción.
𝑃 ∗ (1 − 𝑃)
𝜎𝑝ො =
𝑛

Antes teníamos que hacer aproximaciones, porque no se conocía el valor de la proporciona de


la población, pero ahora tenemos la P poblacional hipotética, por lo que el transformar el valor
observado a valor de Z es:
𝑃෠𝑜𝑏𝑠 − 𝑃 𝑃෠𝑜𝑏𝑠 − 𝑃
𝑍𝑜𝑏𝑠 = =
𝜎𝑝ො 𝑃 ∗ (1 − 𝑃)
𝑛
෠ Ejemplo
Prueba sobre proporciones (𝑃):
En una universidad del estado de Nuevo León, se tiene una proporción de ingreso a
ingeniería de 0.4 mujeres y desea saber el comportamiento en su ultimo examen de
ingreso por lo que toma una muestra de 200 aspirantes en la cual se observa una
proporción de 0.45 mujeres, ¿existe una variación en el ingreso a aspirantes mujeres?,
considera un nivel de significancia de 0.01.
-2.56 < 1.47 < 2.56
H0: 𝑝Ƹ =0.4 𝑍(0.01/2) = 2.56
H1: 𝑝Ƹ ≠0.4 El valor de Zobs cae en la zona
𝑃෠𝑜𝑏𝑠 − 𝑃 de aceptación, por lo que se
෠ 𝑍𝑜𝑏𝑠 = concluye que existe evidencia
𝑃o=0.45 𝑃 ∗ (1 − 𝑃)
n=200 𝑛 estadística con una
α=0.01 0.45 − 0.4 0.05 significancia de 0.01 que no
-2.56 +2.56 = =
0.4 ∗ (1 − 0.4) 0.034 hay variación en la proporción
Zona de
aceptación
200 de ingreso de mujeres en la
= 1.47 facultad de ingeniería.
෠ Ejemplo
Prueba sobre proporciones (𝑃):
Un candidato de una alcaldía al inicio de su campaña tenia una intención de voto del
30%, ahora se hace una encuesta a 200 ciudadanos de los cuales 65 votan por este
candidato y se desea conocer si la intención del voto ha aumentado considerando un
nivel de significancia del 0.05.

𝑍(0.05) =1.64
H0: 𝑝Ƹ ≤0.3 0.77 < 1.64
𝑋 65
H1: 𝑝Ƹ >0.3 ෠ =
𝑃o = = 0.325
𝑛 200 El valor de Zobs cae en la zona
𝑃෠𝑜𝑏𝑠 − 𝑃 de aceptación, por lo que se
෠ =?
𝑃o 𝑍𝑜𝑏𝑠 =
X=65 𝑃 ∗ (1 − 𝑃) concluye que existe evidencia
𝑛 estadística con una significancia
n=200 0.325 − 0.3 0.025
α=0.05 +1.64 = = de 0.05 que no hay variación en
Zona de 0.3 ∗ (1 − 0.3) 0.0324 intención de voto para el
aceptación 200 candidato a la alcaldía.
= 0.77
෠ Ejercicio
Prueba sobre proporciones (𝑃):
Unos investigadores sospechan que la miopía es cada vez más común con una
proporción entre la población de 0.23, en el 2020 se hace un estudio y se encontraron
228 casos de entre 600 personas. ¿Con un nivel de significancia del 5% y una confianza
del 95%, se puede sugerir que la miopía ha aumentado en la población?
𝑍(0.05) =1.64 1.64<8.73
𝑋 228
H0:𝑝Ƹ ≤0.23 𝑝Ƹ 2015 = = = 0.38 El valor de Zobs cae en la zona
H1:𝑝Ƹ >0.23 𝑛 600
𝑃෠𝑜𝑏𝑠 − 𝑃 de rechazo, por lo que se
𝑍𝑜𝑏𝑠 =
෠ =?
𝑃o 𝑃 ∗ (1 − 𝑃) concluye que existe evidencia
X=228 𝑛 estadística con una significancia
n=600 0.38 − 0.23 0.15
= = de 0.05 que se tiene un
α=0.05 +1.64 0.23 ∗ (1 − 0.23) 0.0171
Zona de 600
incremento en casos de miopía
aceptación = 8.73 entre la población.
Importante
• Las conclusiones son probabilísticas, no son verdaderas ni
falsas.
• Toda conclusión proveniente de estos procedimientos está
sujeta a error.
• Para minimizar la posibilidad de error siempre es deseable
tener un tamaño de muestra representativo
Actividades
Semana 2
Actividades Ejercicio de evaluación

Semana 1 • Leer contenidos


• Leer instrucciones
Cuestionario • Buscar el mejor momento para
presentarlo
• Leer contenido
• Leer instrucciones Proyecto entrega 1
• Buscar el mejor momento para
presentarlo • Leer contenidos
• Cuidar las fechas debido a que no • Leer instrucciones
hay prorrogas • Trabajar con la plantilla
• Única actividad que tiene entrega
extemporánea de 1 semana al 80%
Estadística II
1. Las pruebas de hipótesis para una muestra
2. Las pruebas de hipótesis para dos muestras
3. Análisis de varianza
4. Pruebas no paramétricas
5. Análisis de regresión
Bibliografía
Bologna, E. (2013) Estadística para psicología y educación (3ª. ed). Argentina:
Brujas.
Gutiérrez, H., de la Vara, R. (2009). Control estadístico de la calidad y seis
sigma (2ª. ed). México
Lind, D., Marchal, W., Wathen, S. (2015). Estadística aplicada a los negocios y a
la economía. (10ª. ed). México
Montgomery, D. (2005). Diseño y análisis de experimentos (2ª. ed). México
Triola, M. F. (2013). Estadística. (11ª ed.). Pearson Educación.

También podría gustarte