Está en la página 1de 8

Unidad 4 Estadística I

4.1 CONCEPTO DE MUESTREO


Muestreo es un término mayormente utilizado en el campo de la estadística, la cual para
poder realizar estudios a una población (que es el conjunto de elementos físicos, que
presentan alguna característica en común, situados en un espacio geográfico
determinado en un lapso de tiempo específico, y sobre los cuales se desea investigar),
es necesario tomar una muestra de esa población dada, debido a que estas pueden ser
finitas o infinitas, y aún en el caso en el que sean finitas estas pueden estar formadas
por una gran cantidad de elementos lo que hace imposible un análisis completo.

4.1.1 TIPOS DE MUESTREO


o Muestreo aleatorio simple: es aquel en el cual se eligen al azar n individuos de la
muestra; todos los individuos de la población tienen igual probabilidad de ser
elegidos.

o Muestreo aleatorio estratificado: es el caso en el que la población se divide en


grupos homogéneos (que presentan características similares) llamados
estratos, y posteriormente se extrae una muestra aleatoria simple de cada uno.
La distribución de la muestra tomada de la población es llamada “Fijación” y se
pueden conocer los tres que se muestran a continuación:
 Afijación simple: Donde cada grupo formado cuenta con la misma
cantidad de número de elementos.
 Afijación proporcional: Donde las distribuciones se hacen de acuerdo al
tamaño de la población o sujetos de cada estrato.
 Afijación óptima: Fijando la cantidad de sujetos que pueden ser
admitidos en la muestra

o Muestreo aleatorio sistemático: se ordenan numéricamente todos los individuos


de la población; se divide el tamaño de la población entre el tamaño de la
muestra, resultando un cociente k; finalmente, se elige al azar un elemento de la
población, y a partir de él se seleccionan de k en k todos los elementos siguientes.

o Muestreo por conglomerados y áreas: se divide la población en distintas


secciones o conglomerados, es decir, subconjuntos de la población donde la
variabilidad de características es similar a la de la población entera; se eligen al
azar unas pocas de estas secciones, y se forma la muestra con todos los
elementos de las secciones elegidas.

4.2. CONCEPTO DE DISTRIBUCIÓN DE MUESTREO DE LA MEDIA.


El Teorema del Límite Central también nos indica que cuando se extraen muestras de
tamaño mayor a 30 o bien de cualquier tamaño pero provenientes de una población
normal, la distribución muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la fórmula de la distribución
normal con

=x Y 𝑺 = 𝐧

S, es equivalente al error estándar de la media, entonces la fórmula para calcular la


probabilidad del comportamiento del estadístico, en este caso la media de la muestra ,
quedaría de la siguiente manera:
𝑿
𝒛= 
𝐧

4.2.3 DISTRIBUCIÓN MUESTRAL DE PROPORCIONES


En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos
la variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir
sigue una distribución binomial y cuando la extensión de la población es grande la
distribución binomial B(n,p) se aproxima a la normal .

Para muestras de tamaño n>30, la distribución muestral de proporciones sigue una


distribución normal

Donde p es la proporción de uno de los valores que presenta la variable estadística en


la población y q=1-p.
EJEMPLO
Si tiramos una moneda no trucada 100 veces, ¿cuál es la probabilidad de que
obtengamos más de 55 caras?
En una moneda no trucada la proporción de caras es 0,5, con lo que p=0,5 q=0,5
n=100
La distribución muestral de proporciones se distribuye
N(0,5;0,05)
Si llamamos p' a la proporción en la muestra hemos de calcular la probabilidad
P(p'>0,55) = P(z>1) =
=1-P(z£1) = 1-0,8413 = 0,1587

4.2.4. DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE DOS


PROPORCIONES.
Cuando se requiere investigar la proporción de algún atributo en una muestra
(variables cualitativas), la distribución muestral de proporciones es la adecuada para
dar respuesta a dichas situaciones. Esta distribución se genera de igual manera que la
distribución muestral de medias, a excepción de que al extraer las muestras de la
población, se calcula el estadístico proporción (p=x/n en donde "x" es el número de
éxitos u observaciones de interés y "n" el tamaño de la muestra), en lugar del estadístico
promedio. La fórmula que se utilizará para el cálculo de probabilidad en una
distribución muestral de proporciones, está basada en la aproximación de la
distribución normal a la binomial. Esta fórmula servirá para calcular la probabilidad del
comportamiento de la proporción en la muestra.
Si es una población finita:

4.3 HIPÓTESIS ESTADÍSTICA.


Las secciones anteriores han mostrado cómo puede estimarse un parámetro a partir de
los datos contenidos en una muestra. Puede encontrarse ya sea un sólo número
(estimador puntual) o un intervalo de valores posibles (intervalo de confianza). Sin
embargo, muchos problemas de ingeniería, ciencia, y administración, requieren que se
tome una decisión entre aceptar o rechazar una proposición sobre algún parámetro.
Esta proposición recibe el nombre de hipótesis. Este es uno de los aspectos más útiles
de la inferencia estadística, puesto que muchos tipos de problemas de toma de
decisiones, pruebas o experimentos en el mundo de la ingeniería, pueden formularse
como problemas de prueba de hipótesis.
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o
más poblaciones.
Suponga que se tiene interés en la rapidez de combustión de un agente propulsor sólido
utilizado en los sistemas de salida de emergencia para la tripulación de aeronaves. El
interés se centra sobre la rapidez de combustión promedio. De manera específica, el
interés recae en decir si la rapidez de combustión promedio es o no 50 cm/s. Esto puede
expresarse de manera formal como
Ho; = 50 cm/s
H1; 50 cm/s
La proposición Ho; = 50 cm/s, se conoce como hipótesis nula, mientras que la
proposición H1; 50 cm/s, recibe el nombre de hipótesis alternativa. Puesto que la
hipótesis alternativa especifica valores de que pueden ser mayores o menores que 50
cm/s, también se conoce como hipótesis alternativa bilateral. En algunas situaciones, lo
que se desea es formular una hipótesis alternativa unilateral, como en
Ho; = 50 cm/s Ho; = 50 cm/s ó H1; < 50 cm/s H1; > 50 cm/s

4.4 TIPOS DE ERRORES. (I Y II)


En un estudio de investigación, el error de tipo I, también denominado error de tipo alfa
(α)1 o falso positivo, es el error que se comete cuando el investigador rechaza
la hipótesis nula H siendo esta verdadera en la población. Es equivalente a encontrar
un resultado falso positivo, porque el investigador llega a la conclusión de que existe
una diferencia entre las hipótesis cuando en realidad no existe. Se relaciona con el nivel
de significancia estadística.

Representación de los valores posibles de la probabilidad de un error tipo II (rojo) en el ejemplo de un test de significancia estadística para el parámetro μ. El error tipo II

depende del parámetro μ. Cuanto más cerca se encuentre este del valor supuesto bajo la hipótesis nula, mayor es la probabilidad de ocurrencia del error tipo II. Debido a que

el verdadero valor de μ es desconocido al hacer la presunción de la hipótesis alternativa, la probabilidad del error tipo II, en contraste con el error tipo I (azul), no se puede

calcular.

La hipótesis de la que se parte H aquí es el supuesto de que la situación experimental


presentaría un «estado normal». Si no se advierte este «estado normal», aunque en
realidad existe, se trata de un error estadístico tipo I. Algunos ejemplos para el error
tipo I serían:

 Se considera que el paciente está enfermo, a pesar de que en realidad está sano;
hipótesis nula: El paciente está sano.
 Se declara culpable al acusado, a pesar de que en realidad es inocente; hipótesis
nula: El acusado es inocente.
 No se permite el ingreso de una persona, a pesar de que tiene derecho a ingresar;
hipótesis nula: La persona tiene derecho a ingresar.
En un estudio de investigación, el error de tipo II, también llamado error de tipo beta
(β) (β es la probabilidad de que exista este error) o falso negativo, se comete cuando el
investigador no rechaza la hipótesis nula siendo esta falsa en la población. Es
equivalente a la probabilidad de un resultado falso negativo, ya que el investigador llega
a la conclusión de que ha sido incapaz de encontrar una diferencia que existe en la
realidad.
Se acepta en un estudio que el valor del error beta esté entre el 5 y el 20%.
Contrariamente al error tipo I, en la mayoría de los casos no es posible calcular la
probabilidad del error tipo II. La razón de esto se encuentra en la manera en que se
formulan las hipótesis en una prueba estadística. Mientras que la hipótesis nula
representa siempre una afirmación enérgica la hipótesis alternativa, debido a que
engloba todas las otras posibilidades, es generalmente de naturaleza global. El gráfico
de la derecha ilustra la probabilidad del error tipo II (rojo) en dependencia del
promedio μ desconocido.
El poder o potencia del estudio representa la probabilidad de observar en
la muestra una determinada diferencia o efecto, si existe en la población. Es el
complementario del error de tipo II (1-β).

4.5. PROCEDIMIENTO PARA LA PRUEBA DE HIPÓTESIS


POBLACIONAL.
Se realiza mediante un procedimiento sistemático de cinco paso:
1. Se plantea la hipótesis nula y la alternativa.
2. Se selecciona el nivel.
3. Se identifica el estadístico de prueba.
4. Se forma la regla de decisión.
5. Se toma una muestra y se decide.

4.6 INTERVALOS DE CONFIANZA POBLACIONAL


En estadística, se llama intervalo de confianza a un par o varios pares de números entre
los cuales se estima que estará cierto valor desconocido con una determinada
probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se
calcula a partir de datos de una muestra, y el valor desconocido es un parámetro
poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se
denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o
nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación
mediante tal intervalo.1
El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un
intervalo más amplio tendrá más probabilidad de acierto (mayor nivel de confianza),
mientras que para un intervalo más pequeño, que ofrece una estimación más precisa,
aumenta su probabilidad de error.
Para la construcción de un determinado intervalo de confianza es necesario conocer la
distribución teórica que sigue el parámetro a estimar, θ.2 Es habitual que el parámetro
presente una distribución normal. También pueden construirse intervalos de confianza
con la desigualdad de Chebyshev.