Está en la página 1de 9

7ma.

Semana:

Intervalo de confianza para una población

Un intervalo de confianza es un rango de valores, derivado de los estadísticos de


la muestra, que posiblemente incluya el valor de un parámetro de población
desconocido. Debido a su naturaleza aleatoria, es poco probable que dos
muestras de una población en particular produzcan intervalos de confianza
idénticos. Sin embargo, si usted repitiera muchas veces su muestra, un
determinado porcentaje de los intervalos de confianza resultantes incluiría el
parámetro de población desconocido.

En este caso, la línea negra horizontal representa el valor fijo de la media


desconocida de la población, µ. Los intervalos de confianza azules verticales que
se sobreponen a la línea horizontal contienen el valor de la media de la población.
El intervalo de confianza rojo que está completamente por debajo de la línea
horizontal no lo contiene. Un intervalo de confianza de 95% indica que 19 de 20
muestras (95%) de la misma población producirán intervalos de confianza que
contendrán el parámetro de población.

Utilice el intervalo de confianza para evaluar la estimación del parámetro de


población. Por ejemplo, un fabricante desea saber si la longitud media de los
lápices que produce es diferente de la longitud objetivo. El fabricante toma una
muestra aleatoria de lápices y determina que la longitud media de la muestra es
52 milímetros y el intervalo de confianza de 95% es (50,54). Por lo tanto, usted
puede estar 95% seguro de que la longitud media de todos los lápices se
encuentra entre 50 y 54 milímetros.

El intervalo de confianza se determina calculando una estimación de punto y luego


determinando su margen de error.
8va. Semana:

Intervalo para media con muestra grande

Bajo ciertas condiciones de regularidad, es posible construir intervalos de


confianza asintóticos de una manera bastante general.

Si suponemos que un parámetro θ tiene una estimación máximo verosímil θ*,


la distribución asintótica del estimador, bajo condiciones generales de regularidad,
es Normal, de media el valor verdadero del parámetro θ y varianza igual a la cota
de Cramér-Rao σ2(θ*).

Bajo las suposiciones anteriores, es posible construir un intervalo de confianza


asintótico y con nivel de confianza (1 − α) · 100 % a partir de

Donde los valores de zα/2 se calculan a partir de la distribución N(0, 1) de forma


que P(|Z| > zα/2) = α.

Es decir, se utiliza como estadístico pivote

El intervalo de confianza aproximado que resulta es:


Intervalo para media con muestra pequeña

Intervalos de confianza para muestras pequeñas (n < 30)

Cuando tratamos con muestras pequeñas, no podemos invocar el teorema del


límite central. Por lo tanto, no podemos utilizar la fórmula para los intervalos de
confianza a menos que sean muestras desde una variable aleatoria normalmente
distribuida.

Sin embargo, hay una cuestión más: Si conocemos la desviación estándar


poblacional σ, entonces todo está bien, y podemos seguir adelante y utilizar la
fórmula anterior para el intervalo de confianza para muestras pequeñas
(suponiendo que estamos tomando muestras de una variable distribuida
normalmente). Pero si, como suele ser el caso, no sabemos σ, entonces si
seguimos adelante y utilizamos en su lugar la desviación estándar muestral s, es
probable que obtengamos intervalos de confianza que son demasiado pequeños.
La razón es que, mientras que la distribución muestral de (x − μ)/σ, es normal
(siempre que x es normal) la distribución muestral de (x − μ)/s no es normal (a
menos que se trate de muestras grandes, en cuyo caso es aproximadamente
normal).

P ¿Por qué hay que preocuparse de la distribución muestral de (x − μ)/s?


R La razón que nos debemos preocupar es que, cuando utilizamos s en lugar
de σ, entonces el cálculo del intervalo de confianza se basa en la probabilidad de
que x está dentro de un cierto número de desviaciones estándar de la media μ.

Este número de desviaciones estándar es (x − μ)/σ. Entonces establecemos que


equivale a valor−z deseado y resolverlo para x para obtener el intervalo de
confianza (después de dividir la desviación estándar por √n). Cuando utilizamos s
en vez de σ, no podemos utilizar un valor−z, ya que la distribución
de (x − μ)/s no es normal, pero se distribuye de acuerdo con la "distribución−t".
Resulta que, en lugar de utilizar zα/2 en la fórmula, tenemos que
utilizar tα/2. Además, obtenemos diferentes distribuciones t para diferentes
tamaños muéstrales, y utilizamos el valor de tα/2 correspondiente a "n − 1 grados
de libertad", que podemos obtener de una tabla.
9na. Semana:

Intervalo para proporción

En la inferencia sobre una proporción el problema se concreta en estimar y


contrastar la proporción p de individuos de una población que presentan una
determinada característica A (proporción de votantes a un partido político,
proporción de parados, ...). El problema se modeliza mediante una variable
dicotómica que toma el valor 1 si se presenta la característica de interés y 0 en

caso contrario, esto es, una variable de Bernoulli, ,de la que se dispone
de una muestra de tamaño n. Entonces, la proporción poblacional p no es otra
cosa que la media poblacional de dicha variable, estimándose con la
correspondiente proporción muestral o media muestral, .

Intervalo para varianza

Dada una variable aleatoria con distribución Normal N(μ σ, el objetivo es la
construcción de un intervalo de confianza para el parámetro σ, basado en una
muestra de tamaño n de la variable.

A partir del estadístico

la fórmula para el intervalo de confianza, con nivel de confianza 1 − α es la


siguiente

Donde χ2α/2 es el valor de una distribución ji-cuadrado con n − 1 grados de


libertad que deja a su derecha una probabilidad deα/2

Por ejemplo, dados los datos siguientes:

 Distribución poblacional: Normal


 Tamaño de muestra: 10
 Confianza deseada para el intervalo: 95 %
 Varianza muestral corregida: 38,5

Un intervalo de confianza al 95 % para la varianza de la distribución viene dado


por:

que resulta, finalmente


10ma. Semana:

Ensayos de hipótesis

Un ensayo de hipótesis se puede utilizar para tomar una decisión respecto a una
afirmación hecha sobre el valor de uno o más parámetros poblacionales, sobre la
forma específica de la distribución de una determinada característica, sobre la
independencia (o correlación) de distintas variables, sobre mejoras introducidas
(por ej. en tratamientos o procesos), etc. GENERALIDADES En principio se
establece una hipótesis nula (H0) y se analiza si la información estadística
obtenida es suficiente o no para rechazarla. Por otro lado, se define la hipótesis
alternativa (H1), que sería la afirmación a “aceptar” cuando la H0 es rechazada. El
resultado del test puede ser “rechazar H0 en favor de H1” o “no rechazar H0”
(también puede “no hacerse nada” y pedir más datos antes de decidir)

Hipótesis nula

La hipótesis nula (H0) constituye una parte esencial de cualquier diseño de


investigación y siempre es puesta a prueba, aunque sea indirectamente.

La definición simplista de la hipótesis nula es casi contraria a la de la hipótesis


alternativa (H1), aunque el principio es un poco más complejo.

La hipótesis nula (H0) es una hipótesis que el investigador trata de refutar,


rechazar o anular.

Generalmente, "nula" se refiere a la opinión general de algo, mientras que la


hipótesis alternativa es lo que el investigador realmente piensa que es la causa de
un fenómeno.

La conclusión de un experimento siempre se refiere a la nula, es decir, rechaza o


acepta la H0en lugar de la H1.

A pesar de esto, muchos investigadores descuidan la hipótesis nula cuando


están probando hipótesis, lo que constituye una práctica mala y puede tener
efectos adversos.
Hipótesis alternativa

Se entiende por hipótesis alternativa a la suposición alternativa a la hipótesis


nula formulada en un experimento y/o investigación. Esta surge como resultado de
una determinada investigación realizada sobre una población o muestra.

Entendida de manera sencilla, la hipótesis alternativa representa la conclusión que


el investigador quiere demostrar o afirmar tras su estudio. Esta se expresa con la
expresión “H1” y va a representar, por lo general, lo contrario a la hipótesis nula.

El método científico, al contrario de lo que podría pensarse, no trata de demostrar


la hipótesis alternativa (conclusión alcanzada a través de la investigación). Lo que
pretende el método científico, es demostrar que lo contrario a la hipótesis
alternativa (hipótesis nula), no es cierto. De esta manera, quedaría demostrada la
hipótesis alternativa.
11va. Semana:

Nivel de significancia

En estadística, un resultado o efecto es estadísticamente significativo cuando es


improbable que haya sido debido al azar. Una "diferencia estadísticamente
significativa" solamente significa que hay evidencias estadísticas de que hay una
diferencia; no significa que la diferencia sea grande, importante o radicalmente
diferente.

El nivel de significación de una prueba estadística es un concepto estadístico


asociado a la verificación de una hipótesis. En pocas palabras, se define como la
probabilidad de tomar la decisión de rechazar la hipótesis nula cuando ésta es
verdadera (decisión conocida como error de tipo I, o "falso positivo"). La decisión
se toma a menudo utilizando el valor p: si el valor p es inferior al nivel de
significación, entonces la hipótesis nula es rechazada. Cuanto menor sea el
valor p, más significativo será el resultado.

En otros términos, el nivel de significación de un contraste de hipótesis es una


probabilidad p tal que la probabilidad de tomar la decisión de rechazar la hipótesis
nula - cuando ésta es verdadera - no es mayor que p.

Error tipo I y tipo II

En un estudio de investigación, el error de tipo I también denominado error de tipo


alfa (α)1 o falso positivo, es el error que se comete cuando el investigador rechaza

la hipótesis nula ({\displaystyle H_{0}} : el supuesto inicial) siendo esta


verdadera en la población. Es equivalente a encontrar un resultado falso positivo,
porque el investigador llega a la conclusión de que existe una diferencia entre las
hipótesis cuando en realidad no existe. Se relaciona con el nivel de significancia
estadística.

La hipótesis de la que se parte {\displaystyle H_{0}} aquí es el supuesto de que


la situación experimental presentaría un «estado normal». Si no se advierte este
«estado normal», aunque en realidad existe, se trata de un error estadístico tipo I.
Algunos ejemplos para el error tipo I serían:

 Se considera que el paciente está enfermo, a pesar de que en realidad está


sano; hipótesis nula: El paciente está sano.
 Se declara culpable al acusado, a pesar de que en realidad es inocente;
hipótesis nula: El acusado es inocente.
 No se permite el ingreso de una persona, a pesar de que tiene derecho a
ingresar; hipótesis nula: La persona tiene derecho a ingresar.

En un estudio de investigación, el error de tipo II, también llamado error de tipo


beta (β) (β es la probabilidad de que exista este error) o falso negativo, se comete
cuando el investigador no rechaza la hipótesis nula siendo esta falsa en
la población. Es equivalente a la probabilidad de un resultado falso negativo, ya
que el investigador llega a la conclusión de que ha sido incapaz de encontrar una
diferencia que existe en la realidad.

Se acepta en un estudio que el valor del error beta esté entre el 5 y el 20%.

Contrariamente al error tipo I, en la mayoría de los casos no es posible calcular la


probabilidad del error tipo II. La razón de esto se encuentra en la manera en que
se formulan las hipótesis en una prueba estadística. Mientras que la hipótesis nula
representa siempre una afirmación enérgica (como por ejemplo {\displaystyle

H_{0}:} «Promedio μ = 0») la hipótesis alternativa, debido a que engloba todas


las otras posibilidades, es generalmente de naturaleza global (por

ejemplo {\displaystyle H_{1}:} «Promedio μ ≠ 0» ). El gráfico de la derecha


ilustra la probabilidad del error tipo II (rojo) en dependencia del promedio μ
desconocido.

El poder o potencia del estudio representa la probabilidad de observar en


la muestra una determinada diferencia o efecto, si existe en la población. Es el
complementario del error de tipo II (1-β).

También podría gustarte