Está en la página 1de 25

Índice

Unidad 6: Estadística Aplicada ....................................................................................................... 1


6.1 Muestreo. ................................................................................................................................ 1
6.1.1 Tipos de muestreo .......................................................................................................... 2
6.1.2 Teorema de limite Central ............................................................................................. 4
6.1.3 Distribución muestral de la media ................................................................................ 5
6.1.4 Distribución muestral de una proporción .................................................................... 7
6.2 Estimación............................................................................................................................. 11
6.2.1 Estimación puntual ....................................................................................................... 11
6.2.2 Estimacion por intervalos ............................................................................................ 12
6.2.3 Intervalo de Confianza para una Media .................................................................... 13
6.2.4 Intervalos de Confianza para la Proporción ............................................................. 15
6.3 Prueba De Hipotesis ........................................................................................................... 16
6.3.1 Errores del tipo I y tipo II. ............................................................................................ 17
6.3.2 Pasos para realizar una hipótesis .............................................................................. 18
6.3.3 Pruebas de hipótesis para una media ....................................................................... 19
6.3.4 Pruebas de hipótesis para una Proporción .............................................................. 21
7 bibliografía...................................................................................................................................... 23

Unidad 6: Estadística Aplicada

6.1 Muestreo.
El muestreo es la técnica o método con que se extraen los elementos de la
población a estudiar. Existen dos tipos de muestreo Probabilístico y no
probabilístico.
En este último (no probabilístico) puede haber clara influencia de la persona o
personas que seleccionan la muestra o simplemente se realiza atendiendo a
razones de comodidad.
Salvo en situaciones muy concretas, en la que los errores cometidos no son
grandes, debido a la homogeneidad de la población, en general no es un tipo de
muestreo riguroso y científico, dado que no todos los elementos de la población
pueden formar parte de la muestra.
Por ejemplo, si hacemos una encuesta telefónica por la mañana, las personas que
no tienen teléfono o que están trabajando, no podrán formar parte de la muestra.
Muestreo probabilístico: En este tipo de muestreo es en el que todos los individuos
de la población, tienen la misma probabilidad de ser parte de la muestra.
Se denomina población a un conjunto homogéneo de individuos sobre los que se
estudian una o varias características que son, de alguna forma, observables. Una
muestra es un subconjunto de la población.
El tamaño muestral es el número de elementos de la muestra. Un método de
muestreo no es más que el procedimiento empleado para la obtención de la
muestra. Un parámetro es cualquier característica medible (normalmente
numérica) de la población.

6.1.1 Tipos de muestreo

Existen diferentes criterios de clasificación de los diferentes tipos de muestreo,


aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo
probabilísticos y métodos de muestreo no probabilísticos.

Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el
principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamaño n tienen la misma
probabilidad de ser seleccionadas. Sólo estos métodos de muestreo
probabilísticos nos aseguran la representatividad de la muestra extraída y son, por
tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos
encontramos los siguientes tipos:
Muestreo aleatorio simple:
El procedimiento empleado es el siguiente:
1) se asigna un número a cada individuo de la población y 2) a través de algún
medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios,
números aleatorios generados con una calculadora u ordenador, etc.) se eligen
tantos sujetos como sea necesario para completar el tamaño de muestra
requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad
práctica cuando la población que estamos manejando es muy grande.
Muestreo aleatorio sistemático:
Este procedimiento exige, como el anterior, numerar todos los elementos de la
población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se
parte de ese número aleatorio i, que es un número elegido al azar, y los elementos
que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k,
es decir se toman los individuos de k en k, siendo k el resultado de dividir el
tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que
empleamos como punto de partida será un número al azar entre 1 y k.
El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en
la población ya que al elegir a los miembros de la muestra con una periodicidad
constante (k) podemos introducir una homogeneidad que no se da en la población.
Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos
en los que los 5 primeros son varones y las 5 últimas mujeres, si empleamos un
muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo
hombres o sólo mujeres, no podría haber una representación de los dos sexos.

Muestreo aleatorio estratificado:


Trata de obviar las dificultades que presentan los anteriores ya que simplifican los
procesos y suelen reducir el error muestral para un tamaño dado de la muestra.
Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen
gran homogeneidad respecto a alguna característica (se puede estratificar, por
ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil,
etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos
los estratos de interés estarán representados adecuadamente en la muestra. Cada
estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos
que formarán parte de la muestra. En ocasiones las dificultades que plantean son
demasiado grandes, pues exige un conocimiento detallado de la población.
(Tamaño geográfico, sexos, edades,).
La distribución de la muestra en función de los diferentes estratos se denomina
afijación, y puede ser de diferentes tipos:
Afijación Simple: A cada estrato le corresponde igual número de elementos
muéstrales. Afijación Proporcional: La distribución se hace de acuerdo con el peso
(tamaño) de la población en cada estrato.
Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de
modo que se considera la proporción y la desviación típica. Tiene poca aplicación
ya que no se suele conocer la desviación.
Muestreo aleatorio por conglomerados:
Los métodos presentados hasta ahora están pensados para seleccionar
directamente los elementos de la población, es decir, que las unidades muéstrales
son los elementos de la población. En el muestreo por conglomerados la unidad
muestral es un grupo de elementos de la población que forman una unidad, a la
que llamamos conglomerado. Las unidades hospitalarias, los departamentos
universitarios, una caja de determinado producto, etc., son conglomerados
naturales. En otras ocasiones se pueden utilizar conglomerados no naturales
como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas
geográficas suele hablarse de "muestreo por áreas". El muestreo por
conglomerados consiste en seleccionar aleatoriamente un cierto número de
conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en
investigar después todos los elementos pertenecientes a los conglomerados
elegidos.

6.1.2 Teorema de limite Central


El teorema del límite central es un teorema fundamental de probabilidad y
estadística. El teorema establece que la distribución de , que es la media de una
muestra aleatoria de una población con varianza finita, tiene una distribución
aproximadamente normal cuando el tamaño de la muestra es grande,
independientemente de la forma de la distribución de la población. Muchos
procedimientos estadísticos comunes requieren que los datos sean
aproximadamente normales, pero el teorema del límite central le permite aplicar
estos procedimientos útiles a poblaciones que son marcadamente no normales. El
tamaño que debe tener la muestra depende de la forma de la distribución original.
Si la distribución de la población es simétrica, un tamaño de muestra de 5 podría
generar una aproximación adecuada; si la distribución de la población es
marcadamente asimétrica, se requiere un tamaño de muestra de 50 o más. Las
siguientes gráficas muestran ejemplos de cómo la distribución afecta el tamaño de
la muestra que usted necesita.
Distribución uniforme Medidas de las muestras

Una población que sigue una distribución uniforme es simétrica, pero


marcadamente no normal, como lo indica el primer histograma. Sin embargo, la
distribución de 1000 medias de la muestra (n=5) de esta población es
aproximadamente normal debido al teorema del límite central, como lo demuestra
el segundo histograma. Este histograma de medias de la muestra incluye una
curva normal superpuesta para ilustrar esta normalidad.

Distribución exponencial Medidas de las muestras

Una población que sigue una distribución exponencial es asimétrica y no normal,


como lo demuestra el primer histograma. Sin embargo, la distribución de medias
de la muestra de 1000 muestras de tamaño 50 de esta población es
aproximadamente normal, debido al teorema del límite central, como lo demuestra
el segundo histograma. Este histograma de medias de la muestra incluye una
curva normal superpuesta para ilustrar esta normalidad.

6.1.3 Distribución muestral de la media

Si tenemos una muestra aleatoria de una población N (ms), se sabe (Teorema del
límite central) que la fdp de la media muestral es también normal con media m y
varianza s2/n. Esto es exacto para poblaciones normales y aproximado (buena
aproximación con n>30) para poblaciones cualesquiera. Es decir es el error
típico, o error estándar de la media.

¿Cómo usamos esto en nuestro problema de estimación?


1º problema: No hay tablas para cualquier normal, sólo para la normal m=0 y s=1
(la llamada z); pero haciendo la transformación (llamada tipificación)

una normal de media m y desviación s se transforma en una z.

Llamando za al valor de una


variable normal tipificada que
deja a su derecha un área bajo
la curva de a, es decir, que la
probabilidad que la variable sea
mayor que ese valor es a (estos
son los valores que ofrece la
tabla de la normal)

podremos construir intervalos


de la forma

para los que la probabilidad es


1 - a.

Teniendo en cuenta la simetría de la normal y manipulando algebraicamente

que también se puede escribir


o, haciendo énfasis en que es el error estándar de la media,

Recuérdese que la probabilidad de que m esté en este intervalo es 1 - a. A un


intervalo de este tipo se le denomina intervalo de confianza con un nivel de
confianza del 100(1 - a) %, o nivel de significación de 100a%. El nivel de confianza
habitual es el 95%, en cuyo caso a=0,05 y za /2=1,96. Al valor se le denomina
estimación puntual y se dice que es un estimador de m.

Ejemplo: Si de una población normal con varianza 4 se extrae una muestra


aleatoria de tamaño 20 en la que se calcula se puede decir que m tiene
una probabilidad de 0,95 de estar comprendida en el intervalo

que sería el intervalo de confianza al 95% para m

En general esto es poco útil, en los casos en que no se conoce m tampoco suele
conocerse s2; en el caso más realista de s2 desconocida los intervalos de
confianza se construyen con la t de Student (otra fdp continua para la que hay
tablas) en lugar de la z.

o, haciendo énfasis en que es el error estándar estimado de la media,

Esta manera de construir los intervalos de confianza sólo es válida si la variable es


normal. Cuando n es grande (>30) se puede sustituir t por z sin mucho error.

6.1.4 Distribución muestral de una proporción

Existen ocasiones en las cuales no estamos interesados en la media de la


muestra, sino que queremos investigar la proporción de artículos defectuosos o la
proporción de alumnos reprobados en la muestra. La distribución muestral de
proporciones es la adecuada para dar respuesta a estas situaciones. Esta
distribución se genera de igual manera que la distribución muestral de medias, a
excepción de que al extraer las muestras de la población se calcula el estadístico
proporción (p=x/n en donde "x" es el número de éxitos u observaciones de interés
y "n" el tamaño de la muestra) en lugar del estadístico media.

Una población binomial está estrechamente relacionada con la distribución


muestral de proporciones; una población binomial es una colección de éxitos y
fracasos, mientras que una distribución muestral de proporciones contiene las
posibilidades o proporciones de todos los números posibles de éxitos en un
experimento binomial, y como consecuencia de esta relación, las afirmaciones
probabilísticas referentes a la proporción muestral pueden evaluarse usando la
aproximación normal a la binomial, siempre que np 5 y
n(1-p) 5. Cualquier evento se puede convertir en una proporción si se divide el
número obtenido entre el número de intentos.

Generación de la Distribución Muestral de Proporciones

Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos


defectuosos. Se van a seleccionar 5 artículos al azar de ese lote sin reemplazo.
Genere la distribución muestral de proporciones para el número de piezas
defectuosas.

Como se puede observar en este ejercicio la Proporción de artículos defectuosos


de esta población es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas
de este lote están defectuosas.
El número posible de muestras de tamaño 5 a extraer de una población de 12
elementos es 12C5=792, las cuales se pueden desglosar de la siguiente manera:

Artículos Artículos Proporción Número de


Buenos Malos de artículos maneras en las
defectuoso que se puede
obtener la
muestra
1 4 4/5=0.8 8C1*4C4=8
2 3 3/5=0.6 8C2*4C3=112
3 2 2/5=0.4 8C3*4C2=336
4 1 1/5=0.2 8C4*4C1=280
5 0 0/5=0 8C5*4C0=56
Total 792

Para calcular la media de la distribución muestral de proporciones se tendría que


hacer la sumatoria de la frecuencia por el valor de la proporción muestral y dividirla
entre el número total de muestras. Esto es:

Como podemos observar la media de la distribución muestral de proporciones es


igual a la Proporción de la población.

p =P

También se puede calcular la desviación estándar de la distribución muestral de


proporciones:

La varianza de la distribución binomial es 2= npq, por lo que la varianza de la


distribución muestral de proporciones es 2 =(Pq)/n. Si se sustituyen los valores
p
en esta fórmula tenemos que:
, este valor no coincide con el de 0.1681,
ya que nos falta agregar el factor de corrección para una población finita y un
muestreo sin reemplazo:

La fórmula que se utilizará para el cálculo de probabilidad en una distribución


muestral de proporciones está basada en la aproximación de la distribución normal
a la binomial. Esta fórmula nos servirá para calcular la probabilidad del
comportamiento de la proporción en la muestra.

A esta fórmula se le puede agregar el factor de corrección de si se cumple


con las condiciones necesarias.
6.2 Estimación

De ser un elemento muy claramente estadístico, está muy enraizado en nuestra


cotidianidad. Dentro de ello, además hacemos estimaciones dentro de un intervalo
de posibilidades. Por ejemplo: “creo que terminaré la tarea en unos 5-6 días”. Lo
que hacemos en el terreno del análisis de datos es aplicar matizaciones técnicas a
este hábito. Vamos a dedicar este documento al concepto de estimación,
comenzando con la estimación puntual. Después nos ocuparemos de desarrollar
un modelo de estimación por intervalo donde identificaremos los elementos
fundamentales, con su significado y símbolo. Y, por último, habrá que desarrollar
cómo se calculan esos elementos.

6.2.1 Estimación puntual

Un estimador es una regla, a menudo expresada como una fórmula, que indica
cómo calcular el valor de una estimación con base en las mediciones contenidas
en una muestra. Existen dos tipos de estimaciones concernientes a una población:
la estimación por intervalo y la estimación puntual.
Una estimación puntual, es un solo valor o número que se utiliza para estimar un
parámetro de población desconocido. A menudo una estimación puntual es
insuficiente debido a que ya en resultado, solo se tienen dos opciones: el valor de
estimador es correcta o no. Por ejemplo, mediante una estimación puntual se
afirmará que para el año 2030, la proporción de enfermos de sida a nivel mundial
será 0.70, pudiera ser cierta o no.
Un estimador puntual es una variable aleatoria con una distribución de muestreo
que depende de la población y de su parámetro. Un buen estimador debe de
contener dos propiedades muy importantes, para evaluar la bondad del estimador,
que son que el estimador sea incestado respecto al parámetro a estimar y que

tenga varianza mínima. Por ejemplo, la media muestral es un


estimador puntual de la media de la población 𝜇.
Los estimadores puntuales más usuales son los de la distribución binomial (𝜌), de
la distribución de Poisson del parámetro 𝜆 y la distribución normal (𝜐, 𝜎).
Antes de utilizar un estadístico muestral como estimador puntual, se verifica si el
estimador puntual tiene ciertas propiedades que corresponden a un buen
estimador puntual. Como hay distintos estadísticos muéstrales que se usan como
estimadores puntual es de sus correspondientes parámetros poblacionales, se
usará la notación general siguiente:
: es el parámetro poblacional de interés.
: es el estadístico muestral o estimador puntual de .
En general representa cualquier parámetro poblacional como, por ejemplo, la
media poblacional, la desviación estándar poblacional, etc.; y representa el
correspondiente estadístico muestral, por ejemplo, la media muestral, la
desviación estándar muestral y la proporción muestral.
Las propiedades de un buen estimador son:
Incestadas: Si el valor del estadístico muestral es igual al parámetro poblacional
que se estudia, se dice que el estudio muestral es un estimador incestado del
parámetro poblacional.
El estadístico muestral es un estimador incestado del parámetro poblacional si
, donde valor esperado del estadístico muestral.
Por lo tanto, el valor esperado, o media, de todos los posibles valores de un
estadístico muestral incestado es igual al parámetro poblacional de interés.
Eficiencia: Se dice que el estimador puntual con menor error estándar tiene mayor
eficiencia relativa que los otros. Cuando se muestrean poblaciones normales, el
error estándar de la media muestral es menor que el error estándar de la mediana
muestral. Por tanto, la media muestral es más eficiente que la mediana muestral.
Consistencia: Un estimador puntual es consistente si el valor del estimador puntual
tiende a estar más cerca del parámetro poblacional a medida que el tamaño de la
muestra aumenta. En otras palabras, una muestra grande tiende a proporcionar
mejor estimación puntual que una pequeña.

Los estimadores son estimadores incestado de ,


respectivamente (Galope, Ronald E., 2007).

6.2.2 ESTIMACION POR INTERVALOS

Tomando en cuenta que la mayoría de las veces el parámetro poblacional es


desconocido, conveniente obtener límites entre los cuales se encuentre el dicho
parámetro con un cierto nivel de confianza estadística, en este caso se trata de la
estimación por intervalos. Es decir, la estimación por intervalos da por
consecuencia un intervalo de confianza en el que se espera que se encuentre el
parámetro poblacional con una alta probabilidad de certeza. Por ejemplo, el
intervalo de confianza para la media poblacional es el intervalo de valores que
tiene una alta probabilidad de contener a la media de la población como se ilustra
en la figura 6.2. En la estimación por intervalos de un parámetro población, resulta
adecuado hablar en términos de probabilidad de que el estimador cubra el
verdadero valor del parámetro, como se muestra en la figura 6.2.
Por lo tanto, si se seleccionan 100 muestras de una población y se calcula cada
media de las muestras, de las cuales se les estima sus correspondientes
intervalos de confianza del 95%, se tendría que aproximadamente 95 de los 100
intervalos de confianza contienen la media poblacional.

El nivel de confianza 𝛼 (alfa) es el valor de la probabilidad de que el parámetro


poblacional se encuentre dentro del intervalo; los niveles de confianza más
ampliamente usados son: 𝛼 = 0.10, 𝛼 = 0.05, 𝑦 𝛼 = 0.01ccorrespondientes al 90%,
95% y 99% de confianza estadística, respectivamente.

6.2.3 Intervalo de Confianza para una Media

Supongamos que la estatura de los niños de 2 años está distribuida normalmente


con una media de 90 cm y una desviación estándar de 36 cm. ¿Cuál sería la
distribución muestral de la media para una muestra de tamaño 9? Recordemos
que la media de una distribución muestral de medias es igual a μ: μ = μ x
Para nuestro ejemplo, la distribución muestral de la media tendría una media de
90 y una desviación estándar de 36/3 = 12. Recordemos que la desviación
estándar de una distribución muestral es igual al error estándar.
La siguiente figura muestra esta distribución en donde el área sombreada
representa el 95% del total, encontrándose entre los valores de 66.48 y 113.52.
Estos límites fueron calculados añadiendo y restando 1.96 desviaciones estándar
del valor de la media de 90, lo que equivale al 95% del área bajo una curva normal
estándar, es decir:
90 - (1.96 x 12) =
90 - 23.52 = 66.48
90 + (1.96 x 12) =
90 + 23.52 = 113.52

Lo que nos muestra la figura es que 95% de las medias se encontrarían a no más
de 23.52 de la media de 90 (o sea a 1.96 desviaciones estándar). Ahora si
consideramos la probabilidad de que la media de una muestra aleatoria se
encuentre a cierta distancia de la media de la población, entonces podemos decir
que como 95% de la distribución está a 23.5 de 90, la probabilidad de que la
media de cualquier muestra esté a 23.52 de 90 es de 0.95.
Lo anterior significa que, si calculamos repetidamente la media de una muestra, y
consideramos un intervalo que vaya de - 23.52 a + 23.52, este intervalo contendrá
a la media de la población 95% de las veces. En general, podemos calcular el
intervalo de confianza con la siguiente fórmula:

Notar que no es otra cosa que despejar μ de la fórmula para el valor Z de la


distribución de medias

Donde z es el valor de la curva estándar normal para la confianza que se requiere.


En el caso de 95% de confianza:
De esta fórmula se puede observar que tanto el tamaño de la muestra como el
valor de σ se deben conocer. Z se puede obtener de la tabla de la distribución
normal a partir del nivel de confianza establecido. Como en muchas ocasiones se
desconoce σ en esos casos lo correcto es utilizar otra distribución para muestras
(la llamada “t” de student que veremos en la siguiente sesión) si la población de
donde provienen los datos es normal. En este caso se puede utilizar una
estimación puntual de la desviación estándar de la población por medio de la
desviación estándar de la muestra, es decir (σ ~ s).

6.2.4 Intervalos de Confianza para la Proporción

Un estimador puntual de la proporción P en un experimento binomial está dado


por la estadística P=X/N, donde X representa el número de éxitos en N pruebas.
Por tanto, la proporción de la muestra p=x/n se utilizará como estimador puntual
del parámetro P. Si no se espera que la proporción P desconocida esté demasiado
cerca de 0 ó de 1, se puede establecer un intervalo de confianza para P al
considerar la distribución muestral de proporciones.
Considerando el valor z para la distribución de proporciones

Si intentamos despejar el valor de P nos encontramos con que

Pero ¿cómo podemos encontrar P si también está del lado derecho de la


ecuación? Lo que haremos es aproximar la proporción de la población por la de la
muestra, es decir sustituir P por la proporción de la muestra p siempre
cuando el tamaño de muestra no sea pequeño.
Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a
1, el procedimiento del intervalo de confianza que se establece aquí no es
confiable ya que realmente se debería emplear la distribución binomial, por tanto,
no se debe utilizar. Para estar seguros, se debe requerir que np y n(1-p) sea
mayor o igual a 5. El error de estimación será la diferencia absoluta entre p y P, y
podemos tener el nivel de confianza de que esta diferencia no excederá el valor de

6.3 PRUEBA DE HIPOTESIS

En muchos problemas de la ciencia, de la ingeniería y de la administración, se


requiere que se toma una decisión entre aceptar y rechazar una proposición sobre
algún parámetro. Esta proposición recibe el nombre de hipótesis. Y el
procedimiento sobre la toma de decisión sobre la hipótesis, se le conoce como
prueba de hipótesis.
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de
una o más poblaciones.
Ejemplo:
Considerando los datos de las estaturas en centímetros de los estudiantes de
alguna universidad. El interés se centra sobre la estatura promedio de los
estudiantes, de manera específica, el interés recae en decir si la estatura
promedio es o no de 165 centímetros, esto lo podemos expresar simbólicamente
como:
H0:𝜇 = 165 centimetros.
(H0: la estatura promedio de los estudiantes es de 165 centímetros)
Hα: 𝜇 ≠ 165 𝑐𝑒𝑛𝑡𝑖𝑚𝑒𝑡𝑟𝑜𝑠
(Hα: La estructura promedio de los estudiantes es diferente de 165 centímetros)

La proposición H0:𝜇 = 165 centímetros, se conoce como Hipótesis nula, mientras


que la proposición Hα: 𝜇 ≠ 165 𝑐𝑒𝑛𝑡𝑖𝑚𝑒𝑡𝑟𝑜𝑠, recibe el nombre de Hipótesis
alternativa. En la hipótesis alternativa se especifican los valores de 𝜇 que pueden
ser mayores o menores que 165 centímetros, también se conoce como Hipótesis
alternativa bilateral. En algunas situaciones, lo que se desea es formular una
Hipótesis alternativa unilateral, como pudieran ser:

De este modo, en forma general podemos decir que la Hipótesis nula,


representada por H0, es la afirmación sobre una o más características de
poblaciones que al inicio se supone cierta (es decir, una "creencia a priori"). La
Hipótesis alternativa, representada por Hα, es la afirmación contradictoria a H0, y
ésta es la hipótesis del investigador.

6.3.1 ERRORES DEL TIPO I Y TIPO II.


El procedimiento de contrastar la hipótesis nula contra la hipótesis alternativa con
base de la información obtenida en una muestra aleatoria, puede llevar a cometer
dos posibles errores, debido a fluctuaciones o variaciones del azar en el muestreo.
Si la hipótesis nula es en realidad verdadera, pero los datos de la muestra
aleatoria la contradicen entonces la hipótesis nula es rechazada y entonces se
estará cometiendo el Error Tipo I.
Por otro lado, si la hipótesis nula es falsa y los datos de la muestra conllevan a no
rechazarla, se estará cometiendo el Error Tipo II. En otras palabras, El Error tipo I
se define como el rechazo de la hipótesis nula H0 cuando esta es verdadera y el
Error tipo II se define como la aceptación de la hipótesis nula H0 cuando esta es
falsa. Por lo tanto, al probar cualquier hipótesis estadística, existen cuatro
situaciones diferentes que determinan si la decisión final es correcta o errónea.
Estas situaciones aparecen en la tabla 6.4

Decisión
Eventos No se rechaza H0 Rechazar H0
H0 es Verdadera No hay error con la Error tipo I con la
probabilidad 1-α probabilidad α

H0 es Falsa Error tipo II No hay error


con probabilidad 𝛽 (Potencia)
con la probabilidad 1- 𝛽

Tabla 6.4 Situaciones que determinan si la decisión final fue correcta o errónea.
Algunas veces, la probabilidad del error tipo I recibe el nombre de nivel de
significancia de la prueba y se denota con α y La probabilidad de cometer un error
Tipo II se denota por . La probabilidad de no rechazar una hipótesis nula
verdadera es la confianza 1-α, con la cual se trabajó para hacer estimaciones por
intervalo. Cuando se rechaza una hipótesis nula falsa se ha tomado una decisión
correcta y la probabilidad de hacerlo se denomina potencia o poder de la prueba y
es denotada por 1 . En símbolos esto se expresa de la siguiente manera:

El nivel de significancia  lo fija el investigador, y en la práctica se suelen usar


valores de 0.01, 0.05 o el 0.1
En la figura se ilustran las reglas de decisión y los tipos de error:

6.3.2 Pasos para realizar una hipótesis

Una vez que se han formulado las hipótesis nulas H0, y la hipótesis alternativa, Hα,
se debe realizar un procedimiento de comparación‚ por medio del cual se toma
una decisión basada en la muestra aleatoria seleccionada de la población en
estudio. Para llevar a cabo este procedimiento es necesario seleccionar el
estadístico de prueba adecuado, calcularlo con base en la muestra y luego tomar
la decisión de rechazar o no H0 con respecto a un nivel de significancia . Se
recomienda utilizar los siguientes pasos al aplicar la metodología de prueba de
hipótesis
Los pasos que seguir en una prueba de hipótesis son:

 Identificar el parámetro de interés, el cual se deriva del problema.


 Formular las hipótesis nulas0 H0 y la hipótesis alternativa Ha.
 Escoger un nivel de significancia .
 Seleccionar el estadístico de prueba adecuado a la distribución muestral.
 Determinar la región crítica o de rechazo para el estadístico de prueba.
 Calcular el estadístico de prueba.
 Tomar una decisión de rechazar H0 o no rechazarla.
 Dar una conclusión al problema

6.3.3 Pruebas de hipótesis para una media

En vez de estimar el valor de un parámetro, a veces se debe decidir si una


afirmación relativa a un parámetro es verdadera o falsa. Es decir, probar una
hipótesis relativa a un parámetro. Se realiza una prueba de hipótesis cuando se
desea probar una afirmación realizada acerca de un parámetro o parámetros de
una población.

Una hipótesis es un enunciado acerca del valor de un parámetro (media,


proporción, etc.).
Prueba de Hipótesis es un procedimiento basado en evidencia muestral
(estadístico) y en la teoría de probabilidad (distribución muestral del estadístico)
para determinar si una hipótesis es razonable y no debe rechazarse, o si es
irrazonable y debe ser rechazada.

La hipótesis de que el parámetro de la población es igual a un valor determinado


se conoce como hipótesis nula. Una hipótesis nula es siempre una de estatus quo
o de no6 diferencia.
En toda prueba de hipótesis se presentan 3 casos de zonas críticas o llamadas
también zonas de rechazo de la hipótesis.

sis nula,
estos casos son los siguientes:

En toda prueba de hipótesis se pueden cometer 2 tipos de errores:


6.3.4 Pruebas de hipótesis para una Proporción

Sea π la proporción de éxitos en una población Binomial. Sea p la proporción de


éxitos en una muestra de tamaño n extraída de dicha población. A continuación,
pasamos a recordar los tres modelos de hipótesis aplicados para una proporción
poblacional:
Modelo de cola a la izquierda:
Ho: π ≥ πo
H1: π < πo
Estadístico de la prueba:
Aplicando el Teorema del Límite Central, el estadístico de prueba es
ZC = (p-π0) /√ ((π0 (1-π0)) /n)
El valor crítico es Zα

El criterio de decisión:
Si ZC < Zα entonces se rechazará la hipótesis nula, en caso contrario no se
rechazará.
Modelo de cola a la derecha:
Ho: π ≤ πo
H1: π > πo
En cuanto al estadístico de la prueba es el mismo.
El gráfico muestra que Z1-α será el valor crítico.

Criterio de decisión:
Si ZC >Zα entonces se rechazará la hipótesis nula, en caso contrario no se
rechazará.
Modelo de cola bilateral:
Ho: π = πo
H1: π ≠ πo
En este caso tenemos dos valores críticos:
Zα y Z(1-α/2), como se muestra en la gráfica.
Criterio de decisión:
Si ZC < Zα/2 o si ZC > Z(1-α/2) entonces se rechazará la hipótesis nula, en caso
contrario no se rechazará.

7 bibliografía

6.1 Muestreo Ricardo Cao. (2007-08). Estadística Aplicada. 2007-08, de


Universidad de A Coruña Sitio web:
http://dm.udc.es/profesores/ricardo/Archivos/Presentaciones.pdf

6.1.1 Tipos de muestreo: Universidad de sonora. (2007). El muestreo. 2015, de


Universidad de Sonora Sitio web:
http://www.estadistica.mat.uson.mx/Material/elmuestreo.pdf

6.1.2 Teorema de limite Central: Minitab 17. (2011). El teorema del límite central:
las medias de muestras grandes y aleatorias son aproximadamente normales.
2016, de Minitab 17 Sitio web: http://support.minitab.com/es-mx/minitab/17/topic-
library/basic-statistics-and-graphs/introductory-concepts/basic-concepts/central-
limit-theorem/

6.1.3 Distribución muestral de la media: Hospital Universitario Ramón y Cajal.


(1995). Distribución muestral de medias. 2014, de Hospital Universitario Ramón y
Cajal Sitio web: http://www.hrc.es/bioest/esti_medias.html

6.1.4 Distribución muestral de una proporción: INSTITUTO TECNOLOGICO DE


CHIHUAHUA. (2003). Distribución muestral de Proporciones. 2003, de
INSTITUTO TECNOLOGICO DE CHIHUAHUA Sitio web:
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap01b.html

6.2 Estimación: Vicente Manzano Arrondo. (2012). Estimación estadística. 2014,


de asignatura.us Sitio web:
http://asignatura.us.es/dadpsico/apuntes/EstimacionEstadistica.pdf

6.2.1 Estimación Puntual: Ronald E. (2007). Probabilidad: Galope.

6.2.2 Estimación por intervalo: Matematicos, S.d. (2006). http://seraace.com.


Obtenido de: http://seraace.com/files/CAPITULO-6B_e88ap342.pdf

6.2.3 Intervalo de Confianza para una Media: Instituto Tecnológico de Chihuahua.


(2012). Apuntes de Estadística Inferencial. 2012, de centro de geociencias unam
Sitio web: http://www.geociencias.unam.mx/~ramon/EstInf/Clase6.pdf
6.2.4 Intervalos de Confianza para la Proporción: Instituto Tecnológico de
Chihuahua. (2012). Apuntes de Estadística Inferencial. 2012, de centro de
geociencias unam Sitio web:
http://www.geociencias.unam.mx/~ramon/EstInf/Clase6.pdf

6.3 Prueba de Hipótesis: Matematicos, S.d. (2006). http://seraace.com. Obtenido


de: http://seraace.com/files/CAPITULO-6B_e88ap342.pdf

6.3.1 Errores tipo I y tipo II: Matematicos, S.d. (2006). http://seraace.com.


Obtenido de: http://seraace.com/files/CAPITULO-6B_e88ap342.pdf

6.3.2 Pasos para realizar una prueba de hipótesis: Matematicos, S.d. (2006).
http://seraace.com. Obtenido de: http://seraace.com/files/CAPITULO-
6B_e88ap342.pdf

6.3.3 Pruebas de hipótesis para una media: Mario Orlando Suárez Ibujes. (2012).
Pruebas de hipótesis para medias. 2012, de Interaprendizaje de Probabilidades y
Estadística Inferencial con Excel Sitio web:
http://www.monografias.com/trabajos91/prueba-hipotesis-medias-excel-y-
winstats/prueba-hipotesis-medias-excel-y-winstats.shtml

6.3.4 Pruebas de hipótesis para una Proporción: aula clic. (2013). PRUEBA DE
HIPÓTESIS. 2013, de aula clic Sitio web: http://www.aulaclic.es/estadistica-
excel/t_7_6.htm
Instituto Tecnológico de
Cd. Madero

Trabajo engargolado: Unidad 6

Alumno: Hector Rodríguez Arteaga

Asignatura: Probabilidad y Estadística

Carrera: Ingeniería en Sistemas


Computacionales

Semestre: 2

Periodo: Enero-Junio

Profesor: Francisco Alonso Pecina

También podría gustarte