Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste
involucra la toma de decisión acerca de las hipótesis. La decisión consiste en rechazar o
no una hipótesis en favor de la otra. Una hipótesis estadística se denota por “H” y son
dos: - Ho: hipótesis nula - H1: hipótesis alternativa Partes de una hipótesis 1-La hipótesis
nula “Ho” 2-La hipótesis alternativa “H1” 3-El estadístico de prueba 4-Errores tipo I y II 5-
La región de rechazo (crítica) 6-La toma de decisión 1. Concepto: Una prueba de
hipótesis estadística es una conjetura de una o más poblaciones. Nunca se sabe con
absoluta certeza la verdad o falsedad de una hipótesis estadística, a no ser que se
examine la población entera. Esto por su puesto sería impráctico en la mayoría de las
situaciones. En su lugar, se toma una muestra aleatoria de la población de interés y se
utilizan los datos que contiene tal muestra para proporcionar evidencia que confirme o no
la hipótesis. La evidencia de la muestra que es un constante con la hipótesis planteada
conduce a un rechazo de la misma mientras que la evidencia que apoya la hipótesis
conduce a su aceptación.
Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en
la distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no
se puede rechazar) de la región de rechazo. A hora bien el valor crítico depende del
tamaño de la región de rechazo.
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-
4.2 DISTRIBUCIÓN NORMAL Y DISTRIBUCIÓN T DE STUDENT
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
La importancia
naturales, de esta
sociales distribución radica
y psicológicos. en que permite
Mientras modelar numerosos
los mecanismos fenómenos
que subyacen a gran
parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables
incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse
asumiendo que cada observación se obtiene como la suma de unas pocas causas
independientes.
De hecho, la estadística es un modelo matemático que sólo permite describir un
fenómeno, sin explicación alguna. Para la explicación causal es preciso el diseño
experimental, de ahí que al uso de la estadística en psicología y sociología sea conocido
como método correlacional.
La distribución normal también es importante por su relación con la estimación por
mínimos cuadrados, uno de los métodos de estimación más simples y antiguos.
La distribución normal también aparece en muchas áreas de la propia estadística. Por
ejemplo, la distribución muestral de las medias muéstrales es aproximadamente normal,
cuando la distribución de la población de la cual se extrae la muestra no es normal. [1]
Además, la distribución normal maximiza la entropía entre todas las distribuciones con
media y varianza conocidas, lo cual la convierte en la elección natural de la distribución
subyacente a una lista de datos resumidos en términos de media muestral y varianza. La
distribución normal es la más extendida en estadística y muchos tests estadísticos están
basados en una supuesta "normalidad".
En probabilidad y estadística, la distribución t (de Student) es una distribución de
probabilidad que surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño.
Aparece deentre
diferencias maneradosnatural
mediasalmuestrales
realizar la prueba t de
y para la Student para
construcción dellaintervalo
determinación de las
de confianza
para la diferencia entre las medias de dos poblaciones cuando se desconoce la
desviación típica de una población y ésta debe ser estimada a partir de los datos de una
muestra.
La distribución t de Student es la distribución de probabilidad del cociente
Donde
• Z tiene una distribución normal de media nula y varianza 1
• V tiene una distribución chi-cuadrado con grados de libertad
• Z y V son independientes
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
o
docenci varianzas
a iguales
En muchos estudios, incluidos la mayoría de los ensayos clínicos, es necesario comparar
ciertas características en dos o más grupos de sujetos. Tal sería el caso, por ejemplo, si
pensamos
otro estándar,que ouncuando
tratamiento
nos nuevo puedesitener
planteamos los un porcentaje
niños de mejoría
de las distintas mayor que
comunidades
autónomas tienen o no la misma altura. En este artículo se analizará únicamente el
problema de la comparación de dos grupos con respecto a una variable continua. La
elección de un método de análisis apropiado en este caso dependerá de la naturaleza de
los datos y la forma en la que estos hayan sido obtenidos. Fundamentalmente, cuando se
comparan dos o más grupos de observaciones pueden darse dos tipos de diseño: aquel
en el que las observaciones se refieren a dos grupos independientes de individuos, o el
caso en el que cada serie de datos se recoge en los mismos sujetos bajo condiciones
diferentes. El tipo de metodología será distinto según el caso en el que nos encontremos.
Otro aspecto a tener en consideración será el tipo y distribución de los datos. Para grupos
independientes, los métodos paramétricos requieren que las observaciones en cada
grupo provengan de una distribución aproximadamente normal con una variabilidad
semejante, de modo que si los1,2,3datos disponibles no verifican tales condiciones, puede
resultar útil una transformación de los mismos (aplicación del logaritmo, raíz cuadrada,
etc.) o, en todo caso, se debería recurrir a la utilización de procedimientos no
paramétricos 4.
Normalmente en este tipo de análisis podremos establecer una hipótesis de partida
(hipótesis nula), que generalmente asume que el efecto de interés es nulo, por ejemplo
que la tensión arterial es la misma en hombres y mujeres o que dos tratamientos para la
hipercolesterolemia son igualmente efectivos. Posteriormente se puede evaluar la
probabilidad de haber obtenido los datos observados si esa hipótesis es correcta. El valor
de esta probabilidad coincide con el valor-p que nos proporciona cada test estadístico, de
modo que cuanto menor sea éste más improbable resulta que la hipótesis inicial se
verifique.
En un primer apartado, se presentará el test t de Student para dos muestras
independientes, introduciendo las modificaciones necesarias en el caso de que la
variabilidad de ambos grupos sea distinta. A continuación se introducirá el test t de
Student para el caso de dos muestras dependientes.
t de Student para dos muestras independientes
Uno de los análisis estadísticos más comunes en la práctica es probablemente el utilizado
para comparar dos grupos independientes de observaciones con respecto a una variable
numérica. Como ejemplo, consideremos los datos que se muestran en la Tabla 1,
correspondientes a 75 individuos con sobrepeso sometidos a dos dietas alimenticias
distintas, de modo que se desea comparar el peso de los individuos que iniciaron cada
una de las dietas.
Como ya se ha adelantado, la aplicación de un contraste paramétrico requiere la
normalidad de las observaciones para cada uno de los grupos. La comprobación de esta
hipótesis puede realizarse tanto por métodos gráficos (por medio de histogramas,
diagramas de cajas o gráficos de normalidad) como mediante tests estadísticos 5 (test de
Kolmogorov-Smirnov, test de Shapiro-Wilks). Un número suficiente de observaciones
(digamos mayor de 30) como ocurre en el ejemplo planteado justifica, no obstante, la
utilización del mismo test. Así mismo, este tipo de metodología exigirá que la varianza en
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-
ambos grupos de observaciones sea la misma. En primer lugar se desarrollará el test t de
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
(1)
Con lo cual, en este caso particular, el valor utilizado para el contraste será:
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Donde denota el valor que según la distribución t de Student con n+m-2 grados de
libertad deja a su derecha el 2.5% de los datos. En el ejemplo, el intervalo de confianza
con una seguridad del 95% para la diferencia de peso viene dado por:
Que expresa en definitiva un rango de valores entre los que se puede encontrar el valor
real de la diferencia entre los pesos de ambos grupos. Proporciona además la misma
información que obteníamos del contraste estadístico. El hecho de que el valor cero
pertenezca al intervalo indica que no se dispone de evidencia para concluir que el peso
sea distinto en ambos grupos.
A medida que el tamaño muestral aumenta, la distribución del estadístico (1) se hace más
próxima a la de una variable Normal estándar. De este modo, en algunos textos se opta
por utilizar esta distribución para realizar la comparación de medias. Aunque esta
aproximación es correcta para muestras suficientemente grandes, ambos métodos
proporcionan en este caso resultados prácticamente idénticos, por lo que resulta más
simple utilizar, independientemente del tamaño de la muestra, la misma metodología a
partir de la distribución t. El mismo planteamiento podría utilizarse en el caso de varianzas
distintas o de muestras apareadas.
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
cada sujeto su peso antes y después de someterse a la dieta. En este tipo de análisis el
interés no se centra en la variabilidad que puede haber entre los individuos, sino en las
diferencias que se observan en un mismo sujeto entre un momento y otro. Por este
motivo, resulta intuitivo trabajar con la diferencia de ambas observaciones (en el ejemplo
será la pérdida de peso), de modo que se quiere contrastar la hipótesis:
H0: La pérdida de peso es nula frente a la alternativa de que la pérdida de peso sea
importante (es decir, distinta de cero).
La veracidad de dicha hipótesis puede ser contrastada igualmente mediante el test t de
Student. Como se ha dicho, este tipo de métodos tienen como hipótesis fundamental la
normalidad de los datos. En este caso, sin embargo, no será necesario que las
observaciones en ambos grupos provengan de poblaciones normales, sino que
frente a la alternativa
A partir de las observaciones muéstrales {Y1,Y2,..., Yn} e {Y1,Y2,...,Yn} en cada uno de los
grupos se calcula la diferencia de peso para cada sujeto {d 1,d2,...,dn} con d j=X j-Y j
j=1,2,...,n. Nótese que en este caso un requisito fundamental es que se tenga un número
igual de observaciones en ambos grupos. A partir de estos datos, el contraste se basa en
el estadístico:
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
a comparar del modo habitual con la distribución t de Student con n-1=74 grados de
libertad. El intervalo de confianza para la pérdida media de peso correspondiente a una
seguridad del 95%distinta
significativamente es dede(3.56;4.41),
cero, tal ylo como
cual se traduce
indica en unacorrespondiente
el valor-p pérdida de peso
de
p<0.001.
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
A 89,28 83,78
A 89,72 83,56
A 95,57 89,58
A 97,71 91,35
A 98,73 97,82
poca evidencia para indicar que y no son iguales. Por otra parte, un valor muy
grande o muy pequeño para s21/s22, proporcionará evidencia de una diferencia en las
varianzas de las poblaciones.
La variable aleatoria F se define como el cociente de dos variables aleatorias ji-cuadrada
independientes, cada una dividida entre sus respectivos grados de libertad. Esto es,
y respectivamente.
Sean U y V dos variables aleatorias independientes que tienen distribución ji cuadradas
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
para
para
Para manejar las tablas de Fisher del libro de Introducción a la Inferencia Estadística del
autor Güenther,
localizar se tendrá que buscar
el área correspondiente, primero loscon
relacionándola grados de libertad
los grados dos para
de libertad uno,luego
para
calcular el valor de F.
Las tablas tienen la siguiente estructura:
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
P
1 2 3 ……. ….. 500 …
6 0.0005
0.001
0.005
.
.
0.9995 30.4
El valor de 30.4 es el correspondiente a una Fisher que tiene 3 grados de libertad uno y 6
grados de libertad dos con un área de cero a Fisher de 0.995. Si lo vemos gráficamente:
Como nos podemos imaginar existen varias curvas Fisher, ya que ahora su forma
depende de dos variables que son los grados de libertad.
Ejemplos:
1. Encontrar el valor de F, en cada uno de los siguientes casos:
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
=24
Solución:
Como el área que da la tabla es de cero a Fisher, se tiene que localizar primero los
grados de libertad dos que son 9, luego un área de 0.75 con 4 grados de libertad uno.
En este caso se puede buscar el área de 0.95 directamente en la tabla con sus
respectivos grados de libertad.
Se tiene que buscar en la tabla un área de 0.05, puesto que nos piden un área a la
derecha de F de 0.95.
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Este valor de 2.42 se busca en la columna de 9 grados de libertad uno, con 15 grados de
libertad dos, y se encuentra el siguiente:
Area
0.90 2.09
0.95 2.59
Area
0.95 2.39
0.975 2.84
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
15 0.933
20 0.9516
Solución:
Calcular el valor de Fisher:
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
las dos varianzas muestrales. Se desea conocer un intervalo de confianza del 100(
2 2
) por ciento para el cociente de las dos varianzas, 1 / 2 .
Método 1 Método 2
n1 = 31 n2 = 25
s12 = 50 s22 = 24
2 2
Construya un intervalo de confianza del 90% para 1 / 2 .
Solución:
Por la recomendación de que la varianza muestral mayor va en el numerador se tiene la
siguiente fórmula:
al despejar: .
F toma dos valores dependiendo del nivel de confianza y de los grados de libertad. En
este caso los grados de libertad uno valen 30 y los grados de libertad dos 24.
1.
2. y
4.6 COMPARACIONES DE DOS MUESTRAS PAREADAS
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Una de las hipótesis sobre las que habitualmente se fundamentan las pruebas
estadísticas de comparación es que las observaciones pertenecientes a cada una de las
muestras son independientes entre sí, no guardan relación; siendo precisamente ese uno
de los objetivos de la aleatorización (elección aleatoria de los sujetos o unidades de
observación). Sin embargo, la falta de independencia entre las observaciones de los
grupos puede ser una característica del diseño del estudio para buscar fundamentalmente
una mayorcon
ocasiones eficiencia
este tipo del contraste
de diseño estadístico
pareado al busca
lo que se disminuir
es darlauna
variabilidad. En aotras
mayor validez las
inferencias obtenidas, controlando o eliminando la influencia de variables extrañas cuyo
efecto ya es conocido o sospechado, y no se desea que intervenga en el estudio actual
pudiendo enmascarar el efecto del tratamiento o de la variable de interés.
Las muestras apareadas se obtienen usualmente como distintas observaciones realizadas
sobre los mismos individuos. Un ejemplo de observaciones pareadas consiste en
considerar a un conjunto de n personas a las que se le aplica un tratamiento médico y se
mide por ejemplo el nivel de insulina en la sangre antes (X) y después del mismo (Y). En
este ejemplo no es posible considerar aX eY como variables independientes ya que va a
existir una dependencia clara entre las dos variables.
4.7 MODELO TOTALMENTE ALEATORIO: ANÁLISIS DE VARIANZA DE UN FACTOR.
Hay varias formas en las cuales puede diseñarse un experimento ANOVA. Quizás el más
común es el diseño completamente aleatorizado a una vía. El término proviene del hecho
que varios sujetos o unidades experimentales se asignan aleatoriamente a diferentes
niveles de un solo factor. Por ejemplo: varios empleados (unidades experimentales)
pueden seleccionarse aleatoriamente para participar en diversos tipos (niveles diferentes)
de un programa de capacitación (el factor).
El análisis de varianza se basa en una comparación de la cantidad de variación en cada
uno de los tratamientos. Si de un tratamiento al otro la variación es significativamente alta,
puede concluirse que los tratamientos tienen efectos diferentes en las poblaciones.
a. Esta variación entre el número total de las 14 observaciones. Esto se llama variación
total.
b. Existe variación entre los diferentes tratamientos (muestras). Esto se llama variación
entre muestras.
c. Existe variación dentro de un tratamiento dado (muestra). Esto se denomina
variación dentro de la muestra.
4.8 SELECCIÓN DEL TAMAÑO DE MUESTRA PARA ESTIMAR LA DIFERENCIA DE
DOS MEDIAS
En Estadística el tamaño de la muestra es el número de sujetos que componen la muestra
extraída de una población, necesarios para que los datos obtenidos sean representativos
de la población.
1. Estimar un parámetro determinado con el nivel de confianza deseado.
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Altos
mayorniveles de confianza
confianza o esté másy libre
bajo de
margen de error no significan
error necesariamente; antesque la encuesta
es preciso sea de
minimizar la
principal fuente de error que tiene lugar en la recogida de datos. Para calcular el tamaño
de la muestra suele utilizarse la siguiente fórmula:
Otra fórmula para calcular el tamaño de la muestra es:
n=(Nσ^2 Z^2)/((N-1) e^2+σ^2 Z^2 ) Donde: n = el tamaño de la muestra.
N = tamaño de la población.
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviación
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
3.43< B- <8.57
A
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
La interpretación de este ejemplo sería que con un nivel de confianza del 96% la
diferencia del rendimiento promedio esta entre 3.43 y 8.57 millas por galón a favor del
motor B. Esto quiere decir que el motor B da mas rendimiento promedio que el motor A,
ya que los dos valores del intervalo son positivos.
Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o de la B
para su flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un
experimento utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se
desgastan, dando como resultado promedio para la marca A 36,300 kilómetros y para la
marca B 38,100 kilómetros. Calcule un intervalo de confianza de 95% para la diferencia
promedio de las dos marcas, si se sabe que las poblaciones se distribuyen de forma
aproximadamente normal con desviación estándar de 5000 kilómetros para la marca A y
6100 kilómetros para la marca B.
Solución:
-2662.68< B- A <6262.67
Gráficamente:
Como el intervalo contiene el valor "cero", no hay razón para creer que el promedio de
duración del neumático de la marca B es mayor al de la marca A, pues el cero nos está
indicando que pueden tener la misma duración promedio.
4.9 APLICACIONES
El concepto de prueba de hipótesis se puede utilizar para probar hipótesis en relación con
datos cualitativos. Por ejemplo, en el problema anterior el gerente de la fábrica de llantas
quería determinar la proporción de llantas que se reventaban antes de 10,000 millas. Este
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
En donde
= .05
Y entonces,
= −1.107
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Ho: p = p0
H1: p ¹ p0
La situación más frecuente es suponer que existen diferencias entre las proporciones de
dos poblaciones, para ello suelen enunciarse las hipótesis de forma similar al caso de las
medias:
Ho: p1 = p2 Þ p1 - p2 = 0
H1: p1 ¹ p2
Está de más que te diga que este estadígrafo se distribuye normal estándar.
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
H1: p1 ¹ p2
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Ho: Lo que pagan las mujeres en el fondo de pensión es igual o mayor a lo que pagan
los hombres (algunos autores solo le colocan igual).
Ha: _______________________________________
(El estudiante debe describir la Ha)
La hipótesis alternativa es lo que las mujeres del grupo activista desean demostrar.
Paso 2.
Determinar el nivel de significancia. Definida por el analista, en este casi se desea usar α
= 0.01
Gráficamente el nivel de significancia se distribuye en la curva de distribución normal
como se muestra en la figura:
Paso 3.
Calcular los intervalos que implican ese nivel de significancia
Para dicho nivel de significancia el valor de Z es: Z=-2.326
Gráficamente queda de la siguiente manera:
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Paso 4
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Proporción π1 π2 p1 p2
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
El error estándar de la diferencia entre dos proporciones es dado por la raíz cuadrada de
la varianza.
ES (p1-p2)= √[p1(1-p1)/n1 + p2(1-p2)/n2]
Para calcular el intervalo de confianza necesitamos conocer el error estándar de la
diferencia entre dos proporciones.
El error estándar de la diferencia entre dos proporciones es la combinación del error
estándar de las dos distribuciones independientes, ES (p1) y ES (p2).
Hemos estimado la magnitud de la diferencia de dos proporciones de las muestras; ahora
calcularemos el intervalo de confianza para esa estimación.
La fórmula general para el intervalo de confianza al 95% es:
Estimado ±1.96 x ES
La fórmula para 95% IC de dos proporciones sería:
(p1-p2) ± 1.96 ES(p1-p2)
En el estudio de infección de vías urinarias, la proporción en el grupo de fosfomicina/
trometamol fue 0.92 y para trimetoprim/ sulfametoxazol fue 0.61
Diferencia en proporciones = 0.92-0.61=0.31
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Hipótesis alternativa:
Es usualmente que las dos proporciones no son iguales.
H1: π1 ≠ π2
Es lo mismo que la diferencia en proporciones no es igual a cero.
H1: π1 – π2 ≠ 0
0.92 de éxito para fosfomicina / trometamol y 0.61 para trimetoprim / sulfametoxazol
ES = 0.019
(p1-p2) – 0 0.31 - 0
z= -------------- = -----------= 16.3
ES(p1-p2) 0.019
P<0.05
Rechazamos la hipótesis nula de que las dos proporciones son iguales y aceptamos la
hipótesis alternativa de que son diferentes.
5.2 PRUEBA PARA LA DIFERENCIA ENTRE DOS PROPORCIONES.
Las pruebas de hipótesis a partir de proporciones se realizan casi en la misma forma
utilizada cuando nos referimos a las medias, cuando se cumplen las suposiciones
necesarias para cada caso. Pueden utilizarse pruebas unilaterales o bilaterales
dependiendo de la situación particular.
Ho: p = p0
H1: p ¹ p0
En caso de que la muestra sea grande n>30, el estadígrafo de prueba es: se distribuye
normal estándar.
La situación más frecuente es suponer que existen diferencias entre las proporciones de
dos poblaciones, para ello suelen enunciarse las hipótesis de forma similar al caso de las
medias:
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
Ho: p1 = p2 Þ p1 - p2 = 0
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
H1: p1 ¹ p2
Está de más que te diga que este estadígrafo se distribuye normal estándar.
H1: p1 ¹ p2
Aquí se tiene el mismo caso que en la estimación de una proporción, ya que al hacer el
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
despeje nos queda las dos proporciones poblacionales y es precisamente lo que
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
-0.0017<P1-P2<0.0217
Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo
procedimiento producirá una disminución significativa en la proporción de artículos
defectuosos comparado con el método existente.
Un artículo relacionado con la salud, reporta los siguientes datos sobre la incidencia de
disfunciones importantes entre recién nacidos con madres fumadoras de marihuana y de
madres que no la fumaban:
Usuaria No Usuaria
Número de 42 294
disfunciones
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
-0.0064<P1-P2<0.0212
Este intervalo es bastante angosto, lo cual sugiere que P 1-P2 ha sido estimado de manera
precisa.
Determinación de Tamaños de Muestra para Estimaciones
Al iniciar cualquier investigación, la primer pregunta que surge es: ¿de qué tamaño debe
ser la o las muestras?. La respuesta a esta pregunta la veremos en esta sección, con
conceptos que ya se han visto a través de este material.
EJEMPLO: Oficiales escolares comparan el coeficiente intelectual entre niños de dos
grupos.
De una muestra de 159 niños del grupo 1 78 califican con más de 100 puntos, de una
muestra de 250 niños del grupo 2 123 califican con más de 100 puntos.
Construya un intervalo de confianza par a la diferencia entre las dos proporciones del
grupo 1 y 2 de los niños con califican con más de 100.
Ejemplo:
proporcionesAlgunas veces estamos
de poblaciones interesados
de grupos en analizar
con distintas la diferencia
características. Por entre las
ejemplo,
pensemos que la administración de las tiendas Oxxo cree, sobre la base de una
investigación, que el porcentaje de hombres que visitan sus tiendas 9 o más veces al mes
(clientes frecuentes) es mayor que el porcentaje de mujeres que hacen lo mismo. Las
especificaciones requeridas y el procedimiento para probar esta hipótesis es la siguiente:
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
1. Las hipótesis nula y alternativa son las siguientes:
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
P H = .58 P M = .42
1 1
s p h−m = P (1 − P ) +
n H nM
donde:
n H P H + nM P M
P =
H n M + n
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Por lo tanto:
45(.58) + 71(.42)
P = = 0.48
45 + 71
= .48(1 − .48)
1 + 1 = 0.10
s p h−m
45 71
(diferencia
_ entre _ proporcion
es _ observadas
) (diferencia
− _ entre _ proporcion
es _ H o )
Z =
s ph m
−
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
0.0237<P<0.0376
Se sabe con un nivel de confianza del 90% que la proporción de discos
defectuosos que no pasan la prueba en esa población está entre 0.0237 y 0.0376.
Ejemplo: En una muestra de 400 pilas tipo B fabricadas por la Everlast Company, se
encontraron 20 defectuosas. Si la proporción p de pilas defectuosas en esa muestra se
usa para estimar P, que vendrá a ser la proporción verdadera de todas las pilas
defectuosas tipo B fabricadas por la Everlast Company, encuentre el máximo error de
estimación tal que se pueda tener un 95% de confianza en que P dista menos de
de p.
Solución:
p=x/n = 20/400=0.05
z(0.95)=1.96
Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del 95% se
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
sabe que la proporción de pulas defectuosas de esta compañía está entre 0.029 y 0.071.
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Si se requiere un menor error con un mismo nivel de confianza sólo se necesita aumentar
el tamaño de la muestra.
5.4 PRUEBA DE INDEPENDENCIA (ji-CUADRADA).
Cuando comparamos dos situaciones podemos esperar que sean ya bien dependientes o
independientes esto quiere decir que pueden o no estar relacionados sus datos debido a
muchos
otro. factores que pueden influir en ellos o bien, un problema no tenga relación con
La prueba de independencia trata sobre esto, ya que su objetivo es determinar si alguna
situación es afectada por otra, basándose en datos estadísticos y valores probabilístico
obtenidos de la fabulación de datos o de pronósticos por medio de fórmulas y tablas, para
esto se basa en un nivel de significancia en un caso y en el otro a comparar, valiéndonos
de tablas de contingencia para obtener frecuencias esperadas y poder aplicarlas, para así
obtener datos comparativos que son determinantes en la decisión de independencia.
La estadística de prueba que será utilizada en la toma de una decisión acerca de la
hipótesis nula es ji cuadrado, X2 (X es la letra griega ji minúscula. Los valores de ji
cuadrado se obtienen con las siguientes formula:
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Solución:
Paso 1
Ho: La preferencia por matemáticas, ciencias sociales o humanidades es independiente
del sexo de los estudiantes de la escuela.
Ha: La preferencia por las áreas es no independiente del sexo de los estudiantes.
Pasó 2
Para determinar el valor crítico de la ji cuadrada debe conocerse los grados de libertad,
implicado. En el caso de tablas de contingencia, este número es exactamente el número
de celdas en la tabla que puede ser llenadas libremente cuando se conocen los totales.
Estos últimos se indican en la tabla siguiente.
122
178
72 113 115 300
Dados estos totales, solo pueden llenarse dos celdas antes que las restantes queden
determinadas. (por supuesto, los totales deben ser los mismos.) Por ejemplo, una vez que
se seleccionen dos valores arbitrarios (por ejemplo, 50 y 60) para las dos primeras
celdas de la primera fila (véase la tabla siguiente), quedan fijos los otros cuatro valores.
50 60 C 122
D E F 178
72 113 115 300
Dichos valores deben ser C=12, D=22, E=53 y F=103. De otra manera los totales no
serán correctos. En consecuencia, para este problema existen dos selecciones libres.
Cada una de estas corresponde a un grado de libertad. Así, el número de grados de
libertada en este ejemplo es 2 (v=2). Por esta razón, si se utiliza =0.05, el valor critico
es X2 (2, 0.05) = 6. Véase la siguiente figura.
Pasó 3
Antes de poder hallar el valor calculado de ji cuadrada, es necesario examinar los valores
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
esperados E para cada celda. Para tal fin debe recordarse la hipótesis nula, la cual
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
asevera que estos factores son independientes. En consecuencia, se espera que los
valores estén distribuidos en proporción a los totales marginales. Hay 122 hombres; se
espera que estén distribuidos entre M, CS y H proporcionalmente a los totales 72, 113 y
115. Así, para los hombres las cuentas esperadas de celda son:
72/300 x 122 113/300 x 122 115/300 x 122
Similarmente, se esperan:
72/300 x 178 113/300 x 178 115/300 x 178
Para las mujeres. Entonces los valores esperados son como se indica en la tabla
siguiente (siempre verifíquense los totales nuevos contra los antiguos.)
M CS H Total
29.28 45.95 46.77 122
42.72 67.05 68.23 178
Total
Nota 72.00 113.00 115.00 300.00
El cálculo de los valores esperados puede verse de manera alternativa. Recuérdese que
la hipótesis nula se supone cierta en tanto no haya evidencia para rechazarla. Habiendo
hecho este supuesto en el ejemplo, de hecho sé está afirmando que son independientes
los eventos un estudiante seleccionado aleatoriamente es hombre, y un estudiante
elegido al azar prefiere cursos de matemáticas. El estimador puntual para la probabilidad
de que un estudiante sea hombre es 122/300, y para la probabilidad de que un estudiante
prefiera los cursos de matemática es 72/300. En consecuencia, la probabilidad de que
ocurran ambos eventos es el producto de las probabilidades.
Para estudiar la dependencia entre la práctica de algún deporte y la depresión, se
seleccionó una muestra aleatoria simple de 100 jóvenes, con los siguientes resultados:
Sin depresión Con depresión
Deportista 38 9 47
No deportista 31 22 53
69 31 100
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Cada persona
ejemplo de la puede
una persona muestra
sersehombre
clasificará en una
y prefiera de las seis
la cerveza claraceldas
[celda de la tabla.
(1,2)], Por
una mujer
que prefiere la cerveza ligera [celda (2,1)], una mujer que prefiere la cerveza oscura
[celda (2,3)] y así sucesivamente. Como en la lista aparecen todas las combinaciones
posibles de predilección de cerveza y género, en otras palabras aparecen todas las
contingencias
Cerveza preferida posibles, a la tabla se
le llama tabla de
Ligera Clara Oscura contingencia.
Género Hombre Celda (1,1) Celda (1,2) Celda (1,3)
Mujer Celda (2,1) Celda (2,2) Celda (2,3)
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Cerveza preferida
Ligera Clara Oscura Total
Si podemos determinar las
Género Hombre 20 40 20 80 frecuencias esperadas bajo la
hipótesis de independencia entre la
Mujer 30 30 10 70 preferencia de cerveza
del consumidor, y el usar
podemos género
la
Total 50 70 30 150 distribución ji cuadrada para
determinar si existe una diferencia
significativa entre la frecuencia
observada y la esperada.
Las frecuencias esperadas en las celdas de la tabla de contingencia se basan en el
siguiente razonamiento. Primero suponemos que es verdadera la hipótesis nula, de
independencia entre la cerveza preferida y el género del consumidor. A continuación
observamos que en toda la muestra de 150 consumidores, hay 50 que prefieren la
cerveza ligera, 70 la cerveza clara y 30 la cerveza oscura. Expresada en fracción, la
conclusión es que de 50/150 = 1/3 de los consumidores de cerveza prefieren la ligera;
70/150 = 7/15 la clara y 30/150 = 1/5 la oscura. Si es válida la hipótesis de independencia,
decimos que estas fracciones se deben de aplicar por igual a los consumidores hombres y
mujeres. Así bajo la hipótesis de independencia, esperaríamos que la muestra de 80
consumidores hombres indicara que (1/3) 80 = 26.7 prefieren cerveza ligera, (7/15) 80 =
37.33 la clara y (1/5) 80 = 16 la oscura. La aplicación de las mismas fracciones a las 70
consumidoras mujeres produce las frecuencias esperadas que aparecen en la tabla.
Cerveza preferida eij
Ligera Clara Oscura Total Sea la frecuencia esperada en
la categoría del renglón i y la
Género Hombre 26.67 37.33 16.00 80 columna j de la tabla de
contingencia. Con esta notación
Mujer 23.33 32.67 14.00 70 reconsideremos el cálculo de la
frecuencia esperada para los
Total 50.00 70.00 30.00 150 hombres (renglón i = 1) que
prefieren la cerveza clara (columna j
= 2) esto es, la frecuencia esperada
e1, 2
. Apegándonos al esquema anterior para el cálculo de las frecuencias esperadas,
podemos demostrar que
e1, 2
= (7/15) 80 = 37.33
Esta ecuación se puede escribir como sigue
e1, 2
= (7/15) 80 = (70/150) 80 = 37.33
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Observe que 80 es la cantidad total de hombres (total del renglón 1), 70 es la cantidad
total de individuos (hombres y mujeres) que prefieren la cerveza clara (total de la columna
2) y 150 es el tamaño de la muestra total. En consecuencia vemos
Al generalizar la ecuación vemos que la fórmula siguiente determina las frecuencias
esperadas de una tabla de contingencias para la prueba de independencia.
Frecuencias esperadas en la tabla de contingencia suponiendo independencia
El procedimiento de prueba para comparar frecuencias observadas con las frecuencias
esperadas, se parece a los cálculos de bondad de ajuste. Específicamente, el valor de
2
χ
basados en las frecuencias observadas y esperadas se calcula como sigue:
k [ f
oi − f ei ] 2
∑
2
χ =
i =1 f ei
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
diferencias.
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Por tanto, todo lo que necesitamos serán unas estimas de las funciones de probabilidad
de ambas variables por separado (f(x) y f(y)) y de la función de probabilidad conjunta
(f(x,y))
Empezaremos la prueba tomando una muestra de parejas de valores sobre la que
contaremos la frecuencia absoluta con la que aparece cada combinación de valores (xi,y j)
o de grupos de valores (i,j) (O ij) La tabla siguiente, en la que se recogen estos datos, es
en realidad nuestra estimación de la función de probabilidad conjunta multiplicada por el
número total de datos (T).
Para obtener las estimas de las funciones de probabilidad marginales debemos sumar por
filas y por columnas los valores de las frecuencias conjuntas. Las sumas de filas (F i) son,
en cada caso, el número de veces que hemos obtenido un valor de X (x i) en cualquier
combinación con distintos valores de Y, es decir, son nuestra estima de la función de
probabilidad de X multiplicada
sumas de columnas (C j) sonpor el número
nuestra totalde
estima de la
observaciones; análogamente,
función de probabilidad delas
Y
multiplicada por el número total de observaciones.
El número total de observaciones lo podemos obtener como la suma de todas las
frecuencias observadas o, también, como la suma de las sumas de filas o de las sumas
de columnas:
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Naturalmente, nadie espera que esta condición se cumpla exactamente debido al efecto
de los errores de muestreo aleatorio. Por tanto, nuestro problema consiste en distinguir
entre las diferencias producidas por efecto del muestreo y diferencias que revelen falta de
independencia.
Podemos convertir la ecuación anterior a frecuencias absolutas multiplicando por T:
Por otra parte, si las variables no son independientes, las diferencias entre las series de
frecuencias observadas y esperadas serán mayores que las atribuibles al efecto del azar
y, al estar elevadas al cuadrado en el numerador de la expresión anterior, ésta tenderá a
ser mayor que lo que suele ser el valor de una variable chi-cuadrado.
Estadístico de contraste
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
Tal como ocurría en la prueba anterior lo corriente es que queramos demostrar que dos
variables son independientes, es decir, que, habitualmente, nos veremos obligados a
colocar nuestra hipótesis en la hipótesis nula. El número de grados de libertad de la chi-
cuadrado que sirve de contraste se calcula de la siguiente forma:
A priori tendremos tantos grados de libertad como combinaciones de valores xi, y j
tengamos (I J)
A este número tendremos que restarle I debido a que, para calcular las frecuencias
esperadas, necesitamos calcular las I sumas de filas en la tabla anterior. Conocidas las
sumas de filas obtenemos el número total de observaciones sin perder ningún grado de
libertad.
A continuación, necesitaremos calcular, a partir de las frecuencias observadas J - 1 de las
sumas de columnas; la restante podemos obtenerla restando la suma de las anteriores
del total de observaciones (T).
En resumen, el número de grados de libertad de la prueba es el producto del número de
filas menos uno por el número de columnas menos uno.
Se analizarán dos pruebas básicas que pueden aplicarse: La prueba Chi - Cuadrado y la
prueba de Smirnov-Kolmogorov. Ambas pruebas caen en la categoría de lo que en
estadística se denominan pruebas de “Bondad de Ajuste” y miden, como el nombre lo
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
indica, el grado de ajuste que existe entre la distribución obtenida a partir de la muestra y
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
la distribución teórica que se supone debe seguir esa muestra. Ambas pruebas están
basadas en la hipótesis nula de que no hay diferencias significativas entre la distribución
muestral y la teórica. Ambas pruebas están basadas en las siguientes hipótesis:
Para formular la hipótesis nula deberán tenerse en cuenta los siguientes aspectos o
criterios:
a) La naturaleza de los datos a analizar. Por ejemplo, si tratamos de investigar la
distribución que siguen los tiempos de falla de unos componentes, podríamos pensar en
una distribución exponencial, o una distribución gama o una distribución Weibull, pero en
principio no consideraríamos una distribución normal. Si estamos analizando los caudales
de un río en un determinado sitio, podríamos pensar en una distribución logarítmica
normal, pero no en una distribución normal.
5.7 APLICACIONES.
Para la ocurrencia de dos eventos, en la cual se desea observar si son dependientes o
independientes.
La distribución ji cuadrada sirve para todas las inferencias sobre la variancia de una
población.
Existen muchos problemas para los cuales los datos son categorizados y los resultados
expuestos en forma de conteos o cuentas.
Se pueden aplicar en: un conjunto de calificaciones de un examen final puede ser
representado como una distribución de frecuencias. Estos valores son cuentas: él numera
de datos que caen en cada celda.
En una encuesta
candidatos A, B o determinada se podría
C, por lo general, preguntarsea indican
los resultados unas personas si votarían
en una gráfica por los
que informa
acerca del número de votantes para cada categoría posible.
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO
5/13/2018 UNIDADIVPRUEBASDEHIPOTESISCONDOSMUESTRASYVARIASMUESTRASDEDATOSNUM RICOS-s...
http://slidepdf.com/reader/full/unidad-iv-pruebas-de-hipotesis-con-dos-muestras-y-varias-muestras-de-d
TRABAJO EN EQUIPO