Está en la página 1de 17

Estadística Aplicada

Nombre: Diana González

C.I: 23.486.567

Comercio Exterior

Porlamar 17 de Febrero 2022

1
INTRODUCCION

Uno de los objetivos de la estadística es hacer inferencias acerca de


parámetros desconocidos de una población con base en información obtenida en
una muestra aleatoria. Estas inferencias pueden hacerse de dos forma: por medio
de estimaciones de los parámetros o por medio de pruebas de hipótesis para
verificar si una cierta afirmación acerca del parámetro puede considerarse como
válida basándose en los resultados de una muestra, en este trabajo hablaremos
un poco de ello.

2
INDICE

1.- PORTADA

2.- INTRODUCCION

4.-CONTENIDO (HIPOTESIS)

6.- REGLAS DE DECISION

7.- POTENSIAL DE UN TEST

9.- NIVEL DE SIGNIFICACION

11.- CONTRASTE DE HIPOTESIS

16.- CONCLUSION

17.- REFERENCIAS

3
HIPOTESIS

Una hipótesis es una suposición de algo, en estadística se trabaja con hipótesis


como afirmación de hechos que suceden en la población estudiada. La hipótesis
nula es la afirmación contraria a lo que tomamos como hipótesis, a esta segunda
la llamado hipótesis alternativa. La hipótesis nula tiene, en su redacción, una
negación: la palabra no o su equivalente.

Es decir, para estudiar un parámetro concreto de nuestra población formulamos


primero la hipótesis alternativa y, para poder comprobar si es válida, lo que
hacemos es estudiar su realidad opuesta (hipótesis nula) y si podemos demostrar
que esta segunda es falsa habremos confirmado la primera.

Por ejemplo, si estudiamos como hipótesis alternativa que la estatura media de


la población de un pueblo de 20.000 habitantes es de 1,70 y tomamos como
muestra a 50 habitantes, ha hipótesis nula sería la contraria: que la estatura media
no es de 1.70; si de esos cincuenta habitantes la estatura media es de 1.70
rechazamos la hipótesis nula y aceptaremos la alternativa.

Debe quedar claro que estamos hablando de hipótesis estadísticas que, por
tanto, nos dicen los datos con un porcentaje de error (dependiendo, sobre todo,
del tamaño de la muestra): la hipótesis nula puede ser rechazada con la
información de una muestra pero no puede ser demostrada con una muestra, para
demostrar la hipótesis nula deberíamos comprobar a toda la población.

En el ejemplo que hemos puesto si resulta que la muestra de cincuenta


habitantes no tiene la estatura media de 1.70 no habremos negado la hipótesis
nula y, por tanto, no habremos demostrado la hipótesis alternativa (que era lo que
queríamos hacer), pero eso no significa que la hipótesis nula sea cierta, es posible
que esos cincuenta habitantes de la muestra no tengan esa media pero que si
pudiéramos estudiar a toda la población si la tuviera, no podemos afirmar tampoco
la hipótesis nula.

4
Por otro lado la hipótesis alternativa es la suposición alternativa a la hipótesis
nula formulada en un experimento y/o investigación. Esta surge como resultado de
una determinada investigación realizada sobre una población o muestra, la
hipótesis alternativa representa la conclusión que el investigador quiere demostrar
o afirmar tras su estudio. Esta se expresa con la expresión “H1” y va a
representar, por lo general, lo contrario a la hipótesis nula.

Supongamos que un investigador ha realizado un estudio acerca del salario


medio mensual en un determinado barrio de una ciudad. Imaginemos que de la
población de ese barrio, el investigador ha encuestado a 1.000 personas llegando
a la conclusión de que el salario medio mensual por habitante es de 1.500 u.m.
(unidades monetarias).

Por tanto, el investigador quiere contrastar si ese salario medio mensual es


igual a 1.500 u.m. (conclusión del estudio y por ende hipótesis alternativa) o si por
el contrario el salario medio mensual es distinto a 1.500 u.m. (conclusión contraria
a la del estudio que se pretende negar y por ende hipótesis nula)

El contraste a realizar sería el siguiente:

H0: El salario medio mensual es distinto a 1.500 u.m.

H1: El salario mensual es igual a 1.500 u.m.

Como vemos, la hipótesis alternativa (H1), es la conclusión alcanzada por el


investigador. Para demostrarla el investigador va a tratar de probar que lo
contrario a su hipótesis alternativa (hipótesis nula, H0), no es cierto. Como
conclusión, podemos deducir que la formulación de la hipótesis alternativa es la
que nos va a conducir a la formulación de la hipótesis nula.

Tras el contraste realizado el investigador podrá rechazar o no la hipótesis nula


(probando así que la hipótesis alternativa es cierta). Lo correcto para comentar el

5
resultado de un contraste de hipótesis es siempre hablar en términos de la
hipótesis nula.

En caso de haber rechazado la hipótesis se puede utilizar la siguiente


afirmación, “a la luz de los datos y tras el resultado obtenido a través del contraste
de hipótesis realizado, se dispone de evidencia suficiente para poder rechazar la
hipótesis nula”. Por tanto, la conclusión sería que el salario medio mensual es
igual a 1.500 u.m. Por el contrario, si no hemos podido rechazar la hipótesis del
contraste realizado, se podría utilizar la siguiente afirmación, “a la luz de los datos
y tras el resultado obtenido a través del contraste de hipótesis realizado, no se
dispone de evidencia suficiente para poder rechazar hipótesis nula”. De ser así, la
conclusión sería que el salario medio mensual no es igual a 1.500 u.m.

REGLAS DE DECISIÓN

El error de tipo I se comete cuando la hipótesis nula es verdadera y, como


consecuencia del contraste, se rechaza.

El error de tipo II se comete cuando la hipótesis nula es falsa y, como


consecuencia del contraste se acepta.

H0 Verdadera Falsa

Decisón correcta Decisión incorrecta:


Aceptar
Probabilidad = 1 − α ERROR DE TIPO II

Rechaza ERROR DE TIPO I


Decisión correcta
r Probabilidad = α

La probabilidad de cometer Error de tipo I es el nivel de significación α. La


probabilidad de cometer Error de tipo II depende del verdadero valor del
parámetro. Se hace tanto menor cuanto mayor sea n.

Ejemplo de error de tipo I y tipo II

6
Para entender la interrelación entre los errores de tipo I y tipo II, y para
determinar cuál error tiene consecuencias más graves para su situación, considere
el siguiente ejemplo.

Un investigador médico desea comparar la efectividad de dos medicamentos.


Las hipótesis nula y alternativa son:

Hipótesis nula (H0): μ1= μ2

Los dos medicamentos tienen la misma eficacia.

Hipótesis alternativa (H1): μ1≠ μ2

Los dos medicamentos no tienen la misma eficacia.

Un error de tipo I se produce si el investigador rechaza la hipótesis nula y


concluye que los dos medicamentos son diferentes cuando, en realidad, no lo son.
Si los medicamentos tienen la misma eficacia, el investigador podría considerar
que este error no es muy grave, porque de todos modos los pacientes se
beneficiarían con el mismo nivel de eficacia independientemente del medicamento
que tomen. Sin embargo, si se produce un error de tipo II, el investigador no
rechaza la hipótesis nula cuando debe rechazarla. Es decir, el investigador
concluye que los medicamentos son iguales cuando en realidad son diferentes.
Este error puede poner en riesgo la vida de los pacientes si se pone en venta el
medicamento menos efectivo en lugar del medicamento más efectivo.

Cuando realice las pruebas de hipótesis, considere los riesgos de cometer


errores de tipo I y tipo II. Si las consecuencias de cometer un tipo de error son más
graves o costosas que cometer el otro tipo de error, entonces elija un nivel de
significancia y una potencia para la prueba que reflejen la gravedad relativa de
esas consecuencias.

Potencial de un test

La potencia de una prueba de hipótesis es la probabilidad de que la prueba


rechace correctamente la hipótesis nula. La potencia de una prueba de hipótesis

7
se ve afectada por el tamaño de la muestra, la diferencia, la variabilidad de los
datos y el nivel de significancia de la prueba.

Si una prueba tiene poca potencia, es posible que usted no detecte un efecto y
concluya erróneamente que no existe ninguno. Si la potencia de una prueba es
demasiado alta, efectos muy pequeños y posiblemente sin importancia podrían
parecer significativos.

Ninguna prueba es perfecta, siempre existe la posibilidad de que los resultados


de una prueba conduzcan a rechazar la hipótesis nula (H0) cuando en realidad
sea verdadera (un error de tipo I) o a no rechazar H0 cuando realmente sea falsa
(error de tipo II). Esto se debe a que para poder estimar las medias de la
población, usted tiene que utilizar muestras aleatorias, y las muestras aleatorias
son precisamente eso, aleatorias. Por lo tanto, siempre es posible que la media de
la muestra resulte muy diferente de la media de la población.

Por ejemplo, supongamos que cierta población distribuida normalmente tiene


una media (μ) de 10 y una desviación estándar (σ) de 2. Esta distribución indica
que 95.44% de los valores de esta población se encuentran entre 6 y 14. Sin
embargo, siempre es posible que usted seleccione 10 observaciones de forma
aleatoria y termine con una media de la muestra de 4. ¡Con una muestra como
esa, usted no podría inferir que la media de la población es realmente 10!

Por supuesto, las probabilidades de obtener una muestra como esa son
increíblemente pequeñas, aunque no deja de ser posible. Un error de muestreo a
veces puede conducir a una conclusión equivocada. Aunque usted no puede
saber cuándo ocurrirá esto, sí puede estimar la frecuencia con la que ocurrirá. Ahí
es donde la potencia entra en juego.

Por ejemplo, supongamos que usted realiza una prueba t de 1 muestra para
determinar si el volumen medio de producto dispensado en las botellas de champú
en su fábrica es diferente del volumen objetivo de 8 oz. Usted decide tomar una
muestra aleatoria de 10 botellas. Si μ realmente es 7.5 oz. (las botellas se están

8
llenando con 0.5 oz. menos de lo esperado) y σ en realidad es 0.43 oz., entonces
la prueba tiene una potencia de 0.9039.

Un valor de potencia de 0.9039 significa que si usted decide repetir el


experimento muchas veces, (con una nueva muestra aleatoria cada vez),
alrededor de 90.39% de las veces, usted terminará rechazando correctamente la
hipótesis nula. En el 9.61% restante de las veces, un error de muestreo hará que
usted no rechace H0, aunque realmente sea falsa. Por supuesto, es poco probable
que usted realice la prueba más de una vez, pero es bueno saber que las
probabilidades de obtener una muestra engañosa son relativamente bajas.

Nivel de significación

Los niveles de significación son el complemento al intervalo de confianza de


una distribución y se utilizan para contrastar la hipótesis nula (H0) en una prueba
de inferencia estadística. En otras palabras, los niveles de significación son las
probabilidades que dejamos fuera del intervalo de confianza de una distribución y
nos ayudan a determinar si el estadístico de contraste está en zona de rechazo o
no. Es el límite para juzgar un resultado como estadísticamente significativo. Si el
valor de significación es menor que el nivel de significación, se considera que el
resultado es estadísticamente significativo. El nivel de significación también se
conoce como el nivel alfa.

Por ejemplo, un nivel de significancia de 0.05 indica un riesgo de 5% de concluir


que existe una diferencia cuando en realidad no hay ninguna diferencia. Estos
tipos de definiciones pueden ser difíciles de entender debido a su carácter técnico.
¡Una imagen hace que sea mucho más fácil entender los conceptos!

El nivel de significancia determina qué tan lejos del valor de la hipótesis nula
dibujaremos esa línea en la gráfica. Para graficar un nivel de significancia de 0.05,
debemos sombrear el 5% de la distribución que está más alejado de la hipótesis
nula.

9
En la gráfica anterior, las dos áreas sombreadas son equidistantes del valor de
la hipótesis nula y cada área tiene una probabilidad de 0.025, para un total de
0.05. En estadística, nos referimos a estas áreas sombreadas como la región
crítica para una prueba de dos colas. Si la media de la población es de 260,
esperaríamos obtener una media de la muestra que estuviera en la región crítica
el 5% de las veces. La región crítica define qué tan lejos debe estar nuestro
estadístico de muestra del valor de la hipótesis nula para que podamos decir que
es lo suficientemente inusual como para rechazar la hipótesis nula.

La media de la muestra (330.6) se encuentra dentro de la región crítica, lo que


indica que es estadísticamente significativa al nivel 0.05.

También podemos ver si es estadísticamente significativa usando el otro nivel


de significancia común de 0.01.

10
Cada una de las dos áreas sombreadas tiene una probabilidad de 0.005, lo que
suma una probabilidad total de 0.01. Esta vez nuestra media de la muestra no está
dentro de la región crítica y no podemos rechazar la hipótesis nula. Esta
comparación muestra por qué debe elegir su nivel de significancia antes de
comenzar un estudio. ¡Lo protege de elegir un nivel de significancia porque
convenientemente le da resultados significativos!

Gracias a la gráfica, pudimos determinar que los resultados son


estadísticamente significativos al nivel 0.05 sin utilizar un valor p. Sin embargo,
cuando use la salida numérica producida por el software estadístico, deberá
comparar el valor p con su nivel de significancia para tomar esa decisión.

Contrastes de hipótesis

Una hipótesis estadística es una asunción relativa a una o varias poblaciones,


que puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la
información extraída de las muestras y tanto si se aceptan como si se rechazan se
puede cometer un error.

La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se


representa por H0. Rechazar H0 implica aceptar una hipótesis alternativa (H1).

La situación se puede esquematizar:

H0 cierta H0 falsa
H1 cierta
H0 rechazada Error tipo I ( ) Decisión correcta (*)

H0 no rechazada Decisión correcta Error tipo II ( )

(*) Decisión correcta que se busca

a = p(rechazar H0|H0 cierta)


b = p(aceptar H0|H0 falsa)
Potencia =1-b = p(rechazar H0|H0 falsa)

11
Detalles a tener en cuenta

1) a y b están inversamente relacionadas.


2) Sólo pueden disminuirse las dos, aumentando n.

Los pasos necesarios para realizar un contraste relativo a un parámetro q son:

1. Establecer la hipótesis nula en términos de igualdad

2. Establecer la hipótesis alternativa, que puede hacerse de tres maneras,


dependiendo del interés del investigador

En el primer caso se habla de contraste bilateral o de dos colas, y en los otros


dos de lateral (derecho en el 2º caso, o izquierdo en el 3º) o una cola.

3. Elegir un nivel de significación: nivel crítico para a

4. Elegir un estadístico de contraste: estadístico cuya distribución muestral se


conozca en H0 y que esté relacionado con q y establecer, en base a dicha
distribución, la región crítica: región en la que el estadístico tiene una probabilidad
menor que a si H0 fuera cierta y, en consecuencia, si el estadístico cayera en la
misma, se rechazaría H0.

Obsérvese que, de esta manera, se está más seguro cuando se rechaza una
hipótesis que cuando no. Por eso se fija como H 0 lo que se quiere rechazar.
Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha podido
rechazar. Por otro lado, la decisión se toma en base a la distribución muestral en
H0, por eso es necesario que tenga la igualdad.

12
5. Calcular el estadístico para una muestra aleatoria y compararlo con la región
crítica, o equivalentemente, calcular el "valor p" del estadístico (probabilidad de
obtener ese valor, u otro más alejado de la H 0, si H0 fuera cierta) y compararlo
con a.

Ejemplo:

Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra


hipótesis es que la presión sistólica media en varones jóvenes estresados es
mayor que 18 cm de Hg. Estudiamos una muestra de 36 sujetos y encontramos

1. Se trata de un contraste sobre medias. La hipótesis nula (lo que queremos
rechazar) es:

2. la hipótesis alternativa

Es un contraste lateral derecho.

3. Fijamos "a priori" el nivel de significación en 0,05 (el habitual en Biología).

4. El estadístico para el contraste es

Y la región crítica T>ta


Si el contraste hubiera sido lateral izquierdo, la región crítica sería T<t 1-a
y si hubiera sido bilateral T<t1- a/2 o T>t a/2
En este ejemplo t(35)0,05=1,69.

13
5. Calculamos el valor de t en la muestra

No está en la región crítica (no es mayor que 1,69), por tanto no rechazamos H 0.

Otra manera equivalente de hacer lo mismo (lo que hacen los paquetes
estadísticos) es buscar en las tablas el "valor p" que corresponde a T=0,833, que
para 35 g.l. es aproximadamente 0,20. Es decir, si H 0 fuera cierta, la probabilidad
de encontrar un valor de T como el que hemos encontrado o mayor (¿por qué
mayor? Porque la H1 es que m es mayor , lo que produciría una media muestral
mayor y por tanto mayor valor de t) es 0,20, dicho de otra manera la probabilidad
de equivocarnos si rechazamos H 0 es 0,20, como la frontera se establece en 0,05
no la rechazamos.

Este valor crítico de 0,05 es arbitrario pero es la convención habitual. ¿Cuán


razonable es?

Problema al respecto: en la hipótesis de que un mazo de cartas esté bien


barajado, la probabilidad de que al sacar dos cartas sean, p.e.:1 el as de oros y 2
el rey de bastos es 1/40 x 1/39=0,000833.

Si hacemos la experiencia y obtenemos ese resultado ¿rechazaríamos la


hipótesis de que el mazo está bien barajado? ¿Cuánto se parece esto a la lógica
del contraste de hipótesis? Volvamos al problema del estrés. Como no se rechaza
H0, se puede cometer un error tipo II. ¿Cuál es b ?. De hecho, sería la información
relevante a comunicar en este estudio (la probabilidad del error que se pude
cometer en él). Habitualmente, sin embargo, no se da porque los paquetes
estadísticos no la calculan.
Para calcularla se debe concretar H 1, p.e. m = 20 (el criterio para este valor no es
estadístico)

14
b =p (aceptar H0|H1 cierta)

Supongamos que el tamaño muestral sea suficientemente grande para poder


aproximar t a z.

¿Cuándo se acepta H0? si z £ 1,69

Es decir, se acepta H0 si 

¿Qué probabilidad hay de encontrar  si m = 20 (zona verde del gráfico)?


En esta hipótesis lo que se distribuye como una z es

15
Conclusión

Ninguna prueba de hipótesis es 100% cierta. Puesto que la prueba se basa en


probabilidades, siempre existe la posibilidad de llegar a una conclusión incorrecta.
Cuando usted realiza una prueba de hipótesis, puede cometer dos tipos de error:
tipo I y tipo II. Los riesgos de estos dos errores están inversamente relacionados y
se determinan según el nivel de significancia y la potencia de la prueba. Por lo
tanto, usted debe determinar qué error tiene consecuencias más graves para su
situación antes de definir los riesgos.

Cuando se rechaza la hipótesis nula, quiere decir que se acepta la hipótesis


alterna; Sin embargo cuando no se rechaza la hipótesis nula, no podemos decir
que se acepta la hipótesis nula, porque se podría estar cometiendo el error tipo II.
En este caso sólo podremos decir que no existe suficiente evidencia estadística
para rechazar Ho. Un investigador lo que debe hacer es analizar los resultados de
la prueba de hipótesis comparando dichos resultados con una significancia
practica y de esta forma tomar decisiones válidas y objetivas.

16
REFERENCIAS

 Cánavos, G. C. (1999). Probabilidad y Estadística: Aplicaciones y Métodos.


México: McGraw-Hill.
 ALEA, V. et al. (1999) Estadística Aplicada a les Ciències Econòmiques i
Socials. Barcelona: Edicions McGraw-Hill EUB.
 CANAVOS, G. (1988) Probabilidad y Estadística. Aplicaciones y Métodos.
México: McGraw-Hill.
 DURA PEIRó, J. M. y LóPEZ CUñAT, J.M. (1992) Fundamentos de
Estadística. Estadística Descriptiva y Modelos Probabilísticos para la
Inferencia. Madrid: Ariel Editorial.
 ESCUDER, R. y SANTIAGO, J. (1995) Estadística aplicada. Economía y
Ciencias Sociales. Valencia: Tirant lo Blanch.

17

También podría gustarte