Introducción a la inferencia estadística: estimación y contraste de hipótesis

INTRODUCCION
En este proyecto se busca definir lo que es una inferencia estadística y su estimación, la

estadística inferencial utiliza métodos que permiten estimar características de la población,
tomar decisiones sobre ella, a partir de los resultados obtenidos de muestras representativas
de la población. Su finalidad consiste en estimar parámetros, construir intervalos de
confianza, realizar pruebas de hipótesis, pruebas de independencia, efectuar análisis de
varianza y relacionar dos o más variables a través de regresión simple y múltiple.
De igual manera tener cada uno de los temas de la unidad con una buena definición entendible
para todo lector.
La Estadística descriptiva y la teoría de la Probabilidad van a ser los pilares de un nuevo
procedimiento con los que se va a estudiar el comportamiento global de un fenómeno. La
probabilidad y los modelos de distribución junto con las técnicas descriptivas, constituyen la
base de una nueva forma de interpretar la información suministrada por una parcela de la
realidad que interesa investigar.
Los métodos básicos de la estadística inferencial son la estimación y el contraste de hipótesis,

que juegan un papel fundamental en la investigación. Por tanto, algunos de los objetivos que
se persiguen en este tema son:
• Calcular los parámetros de la distribución de medias o proporciones muestrales de
tamaño n, extraídas de una población de media y varianza conocidas.
• Estimar la media o la proporción de una población a partir de la media o proporción
muestral.
• Utilizar distintos tamaños muestrales para controlar la confianza y el error admitido.
• Contrastar los resultados obtenidos a partir de muestras.
• Visualizar gráficamente, mediante las respectivas curvas normales, las estimaciones
realizadas.
En la mayoría de las investigaciones resulta imposible estudiar a todos y cada uno de los
individuos de la población ya sea por el coste que supondría, o por la imposibilidad de
acceder a ello. Mediante la técnica inferencial obtendremos conclusiones para una población
no observada en su totalidad, a partir de estimaciones o resúmenes numéricos efectuados
sobre la base informativa extraída de una muestra de dicha población.
INFERENCIA ESTADISTICA: ESTIMACION.
La inferencia estadística es el conjunto de métodos y técnicas que permiten inducir, a partir
de la información empírica proporcionada por una muestra, cual es el comportamiento de
una determinada población con un riesgo de error medible en términos de probabilidad.
Los métodos paramétricos de la inferencia estadística se pueden dividir, básicamente, en dos:
métodos de estimación de parámetros y métodos de contraste de hipótesis. Ambos métodos
se basan en el conocimiento teórico de la distribución de probabilidad del estadístico muestral
que se utiliza como estimador de un parámetro.
La estimación de parámetros consiste en asignar un valor concreto al parámetro o parámetros

que caracterizan la distribución de probabilidad de la población.
Cuando se estima un parámetro poblacional, aunque el estimador que se utiliza posea todas
las propiedades deseables, se comete un error de estimación que es la diferencia entre la
estimación y el verdadero valor del parámetro. El error de estimación es desconocido por lo
cual es imposible saber en cada caso cual ha sido la magnitud o el signo del error; para valorar
el grado de precisión asociado con una estimación puntual se parte de dicha estimación para
construir un intervalo de confianza. En síntesis, un intervalo de confianza está formado por
un conjunto de valores numéricos tal que la probabilidad de que éste contenga al verdadero
valor del parámetro puede fijarse tan grande como se quiera. Esta probabilidad se denomina
grado de confianza del intervalo, y la amplitud de éste constituye una medida del grado de
precisión con el que se estima el parámetro.
2.1 CONCEPTOS BASICOS.

Población: Conjunto de elementos sobre los que se observa un carácter común. Se representa
con la letra N.
Muestra: Conjunto de unidades de una población. Cuanto más significativa sea, mejor será
la muestra. Se representa con la letra n.
Unidad de muestreo: Está formada por uno o más elementos de la población. El total de
unidades de muestreo constituyen la población. Estas unidades son disjuntas entre sí y cada
elemento de la población pertenece a una unidad de muestreo.
Parámetro: Es un resumen numérico de alguna variable observada de la población. Los
parámetros normales que se estudian son:
La media poblacional: X
Total, poblacional: X
Proporción: P
Estimador: Un estimador θ* de un parámetro θ, es un estadístico que se emplea para conocer
el parámetro θ desconocido.
Estadístico: Es una función de los valores de la muestra. Es una variable aleatoria, cuyos
valores dependen de la muestra seleccionada. Su distribución de probabilidad, se conoce
como “Distribución muestral del estadístico”.
Estimación: Este término indica que a partir de lo observado en una muestra (un resumen
estadístico con las medidas que conocemos de Descriptiva) se extrapola o generaliza dicho
resultado muestral a la población total, de modo que lo estimado es el valor generalizado a
la población. Consiste en la búsqueda del valor de los parámetros poblacionales objeto de
estudio. Puede ser puntual o por intervalo de confianza:
Puntual: cuando buscamos un valor concreto.
-Intervalo de confianza: cuando determinamos un intervalo, dentro del cual se supone que va
a estar el valor del parámetro que se busca con una cierta probabilidad.
Contrate de hipótesis: Consiste en determinar si es aceptable, partiendo de datos muestrales,
que la característica o el parámetro poblacional estudiado tome un determinado valor o esté
dentro de unos determinados valores.
Nivel de confianza: Indica la proporción de veces que acertaríamos al afirmar que el
parámetro θ está dentro del intervalo al seleccionar muchas muestras.
2.2 DISTRIBUCIONES DE MUESTREO

Se denomina muestreo al proceso por el que generamos las muestras. Una muestra es una
parte (un subconjunto) de la población, y se desea que la muestra sea lo más representativa
posible de la población de la que procede. Sin embargo, por muy cuidadosa que sea la
selección de la muestra difícilmente será una representación exacta de la población. Esto
significa que su tendencia central, variabilidad, etc., aproximarán las de la población, pero
habrá cierta diferencia, que interesa sea lo menor posible. Un concepto clave de muestreo es
el de representatividad: Los procedimientos de muestreo tienen por objeto generar muestras
lo más representativas posible de las poblaciones dados los objetivos de la investigación y
las circunstancias que afectan al muestreo.
Desde un punto de vista aplicado, se denomina muestreo el proceso de selección de la
muestra o muestras a utilizar para la investigación. Esto supone generar una o pocas muestras.
Actualmente es de interés la selección de muestras para la simulación informática de los
procesos de muestreo, particularmente para la obtención de distribuciones muestrales. En
estos casos el número de muestras generadas puede ser muy grande (10.000, 80.000, o más)
y el procedimiento de muestreo se realiza informáticamente y con procedimientos
específicos.
Desde un punto de vista teórico, el concepto de muestreo es fundamental para la Inferencia
Estadística. El hecho de que las muestras no sean exactamente representativas de las
poblaciones significa que las inferencias presentan cierto margen de incertidumbre. Para
cuantificarlo y definir técnicas inferenciales es necesario conocer cómo se comportan los
estadísticos obtenidos en las muestras, esto es, cómo son las distribuciones muestrales de los
estadísticos habitualmente utilizados para la inferencia.
Las muestras singulares generadas para investigación con sujetos suelen utilizarse para
obtener algunos estadísticos (Media, proporción, cuasivarianza, etc.) con los que se realiza
el proceso de inferencia. En cambio, las muestras simuladas por ordenador suelen ser
utilizadas para obtener distribuciones muestrales y realizar inferencia. Esto es de interés
cuando se dan circunstancias especiales que no aconsejan utilizar los procedimientos
habituales. Las distribuciones muestrales son las distribuciones de estadísticos de muestras
que pertenecen a la misma población. Por ejemplo, la distribución muestral de la Media es la
distribución de las Medias de muestras de un mismo tamaño extraídas de la misma población.
Ejemplo
Sea un curso con 40 estudiantes (el número de datos es pequeño para facilitar la comprensión
del ejemplo). Queremos conocer la Media de las puntuaciones del curso, pero por diversas
razones no tenemos acceso a todos los datos (que se denomina población). Pero supongamos
que podemos seleccionar cinco puntuaciones aleatoriamente y obtener la Media de la
muestra. Si repetimos el proceso y generamos más muestras tendremos más Medias
muestrales y podremos ver cómo se distribuyen:
La Media de los datos seleccionados aleatoriamente (son las señaladas en negrita) es:
Si repetimos el procedimiento 25 veces generamos 25 muestras. Las Medias de cada muestra

son:
El Histograma de la distribución de las Medias de las 25 muestras es

con 100 muestras,
y con 1000 muestras
La forma del Histograma se acerca a la del modelo Normal cuanto mayor es el número de
muestras. Esta es una característica de la distribución muestral de Medias que permite
conocer si la media obtenida en la muestra es muy diferente a la media de la población, dado
que tenemos la siguiente información:
a) La distribución de Medias muestrales es Normal.
b) La Media y Desviación Típica de la distribución de Medias muestrales son 4.7 y
1.52 (Nota: La diferencia entre la Media de la distribución muestral y la Media de la
población se debe a que la muestra es pequeña).
e) Por tanto, sabemos lo siguiente:
* El 95% (aproximadamente) de las Medias muestrales obtenidas en el muestreo del ejemplo
tienen valores entre 1.7 y 7.7
* El valor obtenido (4.2) está entre ambos límites, que definen el conjunto de valores que
obtenemos al hacer un muestreo aleatorio con muestras de 5 datos de la población del
ejemplo.
* Como conclusión, vemos que 4.2 es un valor esperable cuando efectuamos un muestreo
aleatorio con muestras de 5 datos. Diremos que la diferencia observada respeto de la Media
del curso es explicada por el azar (ya que la selección de las muestras ha sido aleatoria y
asumimos que no han influido otros factores).
2.3 ESTIMACIÓN PUNTUAL

La estimación de parámetros tiene por finalidad asignar valores a los parámetros
poblacionales a partir de los estadísticos obtenidos en las muestras. Dicho de otra manera, la
finalidad de la estimación de parámetros es caracterizar las poblaciones a partir de la
información de las muestras (por ejemplo, inferir el valor de la Media de la población a partir
de los datos de la muestra).
La estimación puntual consiste en atribuir un valor (la estimación) al parámetro poblacional.
Si la muestra es representativa de la población, podemos esperar que los estadísticos
calculados en las muestras tengan valores semejantes a los parámetros poblacionales, y la
estimación consiste en asignar los valores de los estadísticos muestrales a los parámetros
poblacionales. Los estadísticos con que obtenemos las estimaciones se denominan
estimadores.
Ejemplo
Se desea estimar la Media de las puntuaciones del curso 2003/4, pero solo se dispone de 50
puntuaciones seleccionadas aleatoriamente. La Media de la muestra (el estimador), es igual
a 5.6 y atribuimos este valor (la estimación) a la Media del Resumiendo:
Podemos utilizar como estimadores de la Media de la población otros estadísticos de
tendencia central como la Moda o la Mediana, pero NO todos los estimadores son apropiados.
Los estimadores deben satisfacer ciertos requisitos, y por esta razón, interesa conocer sus
propiedades a fin de utilizar los que sean adecuados según las circunstancias de la estimación.
2.4 ESTIMACIÓN DE INTERVALOS

La estimación por intervalos consiste en establecer el intervalo de valores donde es más
probable se encuentre el parámetro. La obtención del intervalo se basa en las siguientes
consideraciones:
a) Si conocemos la distribución muestral del estimador podemos obtener las probabilidades
de ocurrencia de los estadísticos muestrales.
b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la probabilidad
de que el estimador se halle dentro de los intervalos de la distribución muestral.
c) El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se
establece alrededor del estimador. Si repetimos el muestreo un gran número de veces y
definimos un intervalo alrededor de cada valor del estadístico muestral, el parámetro se sitúa
dentro de cada intervalo en un porcentaje conocido de ocasiones. Este intervalo es
denominado "intervalo de confianza".
Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución
Normal, y resulta:
La distribución de las Medias muestrales aproxima al modelo Normal:

En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es
(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución muestral
son los valores cuya función de distribución es igual a 0.975 y 0.025 respectivamente y se
pueden obtener en las tablas de la distribución Normal estandarizada o de funciones en
aplicaciones informáticas como Excel).
Seguidamente generamos una muestra de la población y obtenemos su Media, que es igual a

4.5. Si establecemos el intervalo alrededor de la Media muestral, el parámetro poblacional
(5.1) está incluido dentro de sus límites:
Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa razón,
la distancia desde m a la Media muestral es la misma que va de la Media muestral a m. En
consecuencia, si hacemos un muestreo con un número grande de muestras observamos que
el 95% de las veces (aproximadamente) el valor de la Media de la población (m) se encuentra
dentro del intervalo definido alrededor de cada uno de los valores de la Media muestral. El
porcentaje de veces que el valor de m se halla dentro de alguno de los intervalos de confianza
es del 95%, y es denominado nivel de confianza.
Si queremos establecer un intervalo de confianza en que el % de veces que m se halle dentro

del intervalo sea igual al 99%, la expresión anterior es:
(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución muestral

en las tablas de la distribución Normal estandarizada o de funciones en aplicaciones
informáticas como Excel), y son los valores cuya función de probabilidad es igual a 0.995 y
0.005 respectivamente).
Ejemplo
La siguiente imagen muestra la distribución de las Medias muestrales obtenidas de 100000
muestras aleatorias y los intervalos alrededor de cada una de las Medias obtenidas de diez de
las muestras:
donde ls y le simbolizan los límites superior e inferior del intervalo de confianza al 95%.
Nueve de los diez intervalos (salvo el definido alrededor de la Media muestral igual a 3.7)
incluyen el valor del parámetro dentro sus límites.
2.5 INTERVALOS DE CONFIANZA PARA MEDIAS

La distribución muestral de la Media depende de varias circunstancias como la distribución
de la población de la que se extrae las muestras:
1) La población se distribuye según el modelo Normal. La distribución de Medias muestrales
sigue el modelo Normal, con parámetros mu y sigma
donde sigma al cuadrado y n son la Varianza de la distribución poblacional y el tamaño de la

muestra respectivamente.
2) La población no sigue la distribución Normal. En este caso la distribución de Medias
muestrales se acerca al modelo Normal (con los mismos parámetros que hemos visto al
apartado a) cuanto mayor sea el tamaño de la muestra.
Algunas características de la distribución muestral de la Media
1) La variación de la distribución muestral es menor cuanto mayor sea n (tamaño de la muestra)
siempre que la Varianza de la población sea la misma.
Explicación: La fórmula de la Varianza de la distribución muestral de la Media es:
cuanto mayor es el denominador (n), más pequeño es el valor del término a la izquierda del
"igual".
Ejemplo
A continuación, se presenta las Varianzas y los Histogramas de tres distribuciones muestrales
de la Media (número de muestras=100) en que los tamaños de las muestras son n=25, n= 100
y n=1000.
n=25
Varianza= 0.43
n=100
Varianza= 0.11
n= 1000
Varianza= 0.01
Los valores de la Varianza de la distribución de Medias muestrales son inferiores y la dispersión
observada en los Histogramas (ver en el eje horizontal que la amplitud de la variable disminuye)
cuanto mayor es n.
2) Cuando la distribución de Medias muestrales aproxima la distribución Normal, podemos obtener
probabilidades de las Medias muestrales.
Ejemplo
Si obtenemos una Media muestral igual a 6, y sabemos que la distribución muestral es Normal (5,2)
-el 5 es la media y el 2 la Desviación Típica de la distribución muestral- la probabilidad de obtener
puntuaciones iguales o inferiores a 6 es
La probabilidad de obtener valores iguales o inferiores a 0.5 en una distribución Normal es 0.69
(consultar tablas o funciones de probabilidad de la distribución Normal).
2.6 INTERVALOS DE CONFIANZA PARA DIFERENCIA ENTRE MEDIAS

Sean x11, x12, ... x1n1, una muestra aleatoria de n1 observaciones tomadas de una primera población
con valor esperado μ1, y varianza σ 2; y x , x , ... x , una muestra aleatoria de n2
observaciones tomada de la segunda población con valor esperado 1
μ2 y21varianza
22
σ222n2
. Si x1 y x2 son
las medias muestrales, la estadística x1
– x2 es un estimador puntual de μ1 – μ2, y tiene una distribución normal si las dos poblaciones son
normales, o aproximadamente normal si cumple con las condiciones del teorema del límite central
(tamaños de muestras relativamente grandes). Por lo tanto,
Para calcular el intervalo de confianza para la diferencia de dos medias se debe saber si las
varianzas poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas, se debe
probar si son igual es o diferentes. Cada uno de estos tres casos se analizarán por separado
Ejemplo
En un ensayo clínico para evaluar un hipotensor se compara un grupo placebo con el grupo tratado.
La variable medida es la disminución de la presión sistólica y se obtiene: grupo placebo n = 35; =
3,7 mm de Hg. y s2 = 33,9; grupo tratado n = 40; = 15,1 mm de Hg. y s2 = 12,8. ¿Es eficaz el
tratamiento?
Se trata de un contraste sobre diferencias de medias
H0: mT - mP = 0
H1: mT - mP> 0
Como no conocemos las varianzas, para realizarlo debemos decidir si son iguales o distintas, para
ello se plantea el contraste
H0:
H1:
El estadístico es , para el que p<0,05, en consecuencia,

rechazamos la H0 y concluimos que las varianzas son distintas. Por lo tanto, usaríamos la t para
varianzas distintas. Haciendo los cálculos t=-10,2 p<0,05 rechazamos la H0 y concluimos que las
medias son distintas.
2.7 INTERVALOS DE CONFIANZA PARA PROPORCIONES

En la inferencia sobre una proporción el problema se concreta en estimar y contrastar la proporción
p de individuos de una población que presentan una determinada característica A (proporción de
votantes a un partido político, proporción de parados, ...). El problema se modeliza mediante una
variable dicotómica que toma el valor 1 si se presenta la característica de interés y 0 en
caso contrario, esto es, una variable de Bernoulli, , de la que se dispone de una
muestra de tamaño n. Entonces, la proporción poblacional p no es otra cosa que la media
poblacional de dicha variable, estimándose con la correspondiente proporción muestral o media
muestral, .
En el caso de dos poblaciones, se trata de comparar la proporción en la que se presenta una cierta
característica A en las mismas (comparar la proporción de voto a un partido en dos regiones,
comparar la proporción de parados entre hombres y mujeres, ...). El problema se modeliza mediante
dos variables de Bernoulli independientes, de las que se dispone de sendas muestras aleatorias de
tamañoy , respectivamente.
Ejemplo
2.8 INTERVALOS DE CONFIANZA PARA DIFERENCIAS ENTRE PROPORCIONES

Un intervalo de confianza (IC) para una diferencia en proporciones es un rango de valores que
probablemente contenga la verdadera diferencia entre dos proporciones de población con un cierto
nivel de confianza.
A menudo, los investigadores están interesados en estimar la diferencia entre dos proporciones de
población. Para estimar esta diferencia, saldrán y recolectarán una muestra aleatoria de cada
población y calcularán la proporción para cada muestra. Luego, pueden comparar la diferencia
entre las dos proporciones.
Sin embargo, no pueden saber con certeza si la diferencia en las proporciones de la muestra
coincide con la verdadera diferencia en las proporciones de la población, por lo que pueden crear
un intervalo de confianza para la diferencia entre las dos proporciones. Esto proporciona un rango
de valores que probablemente contenga la verdadera diferencia entre las proporciones de
población.
Por ejemplo, supongamos que queremos estimar la diferencia en la proporción de residentes que
apoyan una determinada ley en el condado A en comparación con la proporción que apoya la ley
en el condado B.
Dado que hay miles de residentes en cada condado, llevaría demasiado tiempo y sería demasiado
costoso recorrer y encuestar a cada residente individual en cada condado.
En cambio, podríamos tomar una muestra aleatoria simple de residentes de cada condado y usar la
proporción a favor de la ley en cada muestra para estimar la verdadera diferencia en proporciones
entre los dos condados:
Dado que nuestras muestras son aleatorias, no se garantiza que la diferencia de proporciones entre
las dos muestras coincida exactamente con la diferencia de proporciones entre las dos poblaciones.
Entonces, para capturar esta incertidumbre, podemos crear un intervalo de confianza que contenga
un rango de valores que probablemente contengan la verdadera diferencia en las proporciones entre
las dos poblaciones.
diferencia en proporciones: fórmula
Usamos la siguiente fórmula para calcular un intervalo de confianza para una diferencia entre dos
proporciones de población:
Intervalo de confianza = (p 1 –p 2 ) +/- z * √ (p 1 (1-p 1 ) / n 1 + p 2 (1-p 2 ) / n 2 )

dónde:
• p 1 , p 2 : proporción de muestra 1, proporción de muestra 2

• z: el valor crítico de z basado en el nivel de confianza
• n 1 , n 2 : tamaño de la muestra 1, tamaño de la muestra 2
El valor z que utilizará depende del nivel de confianza que elija. La siguiente tabla muestra el valor
z que corresponde a las opciones de nivel de confianza más populares:
Nivel de confianza valor z
0,90 1.645
0,95 1,96
0,99 2,58
Tenga en cuenta que los niveles de confianza más altos corresponden a valores z más grandes, lo
que conduce a intervalos de confianza más amplios. Esto significa que, por ejemplo, un intervalo
de confianza del 95% será más amplio que un intervalo de confianza del 90% para el mismo
conjunto de datos.
Ejemplo
Suponga que queremos estimar la diferencia en la proporción de residentes que apoyan una
determinada ley en el condado A en comparación con la proporción que apoya la ley en el condado
B. Aquí están los datos resumidos para cada muestra:
Muestra 1:
• n 1 = 100
• p 1 = 0,62 (es decir, 62 de cada 100 residentes apoyan la ley)
Muestra 2:
• n 2 = 100
• p 2 = 0.46 (es decir, 46 de cada 100 residentes apoyan la ley)
A continuación, se muestra cómo encontrar varios intervalos de confianza para la diferencia en las
proporciones de población:
Intervalo de confianza del 90%:

(.62-.46) +/- 1.645 * √ (.62 (1-.62) / 100 + .46 (1-.46) / 100) = [.0456, .2744]
(.62-.46) +/- 1.96 * √ (.62 (1-.62) / 100 + .46 (1-.46) / 100) = [.0236, .2964]
(.62-.46) +/- 2.58 * √ (.62 (1-.62) / 100 + .46 (1-.46) / 100) = [-0.0192, 0.3392]
2.9 INTERVALOS DE CONFIANZA PARA VARIANZAS

a) Supuestos:
La población sigue la distribución Normal. Los datos son independientes.
b) Hipótesis:
c) Estadístico de contraste:
d) Distribución del estadístico de contraste: Ji Cuadrado con n-1 grados de libertad.

e) Significación del estadístico de contraste.
f) Intervalo de confianza:
Ejemplo
Unos psicólogos piensan que una terapia nueva no mejora el sido de los pacientes de depresión,
pero sí reduce la variabilidad. Para probarlo seleccionan una muestra aleatoria de pacientes a los
que aplican la nueva terapia. Poner a prueba la Hipótesis de que los pacientes de depresión a los
que han administrada la terapia presentan la misma variabilidad que los pacientes a los que no la
han administrada. (a=.05)
Datos:
Varianza de la población: 8
Cuasivarianza obtenida en la muestra de pacientes a los que administran la terapia: 7
Tamaño de la muestra: 20
a) Supuestos: Dado que la muestra ha sido generada aleatoriamente se supone que los datos son
independientes.
b) Hipótesis:
d) Distribución del estadístico de contraste: Ji Cuadrado con 19 grados de libertad.

e) Significación del estadístico de contraste: 0.61
f) Decisión: La significación del estadístico de contraste es mayor que el valor de alfa (0.05). En
consecuencia, se acepta la Hipótesis Nula.
g) Intervalo de confianza:
Con un nivel de confianza del 95% pensamos que la varianza poblacional se sitúa entre 4.05 y
14.93
Conclusión: Los datos recogidos respaldan la hipótesis de que la nueva terapia reduce las
diferencias en el estado de los pacientes.
2.10 INTERVALOS DE CONFIANZA PARA RAZONES DE DOS VARIANZAS
a) Supuestos:
Las poblaciones siguen la distribución Normal. Los datos son independientes.
b) Hipótesis:
d) Distribución del estadístico de contraste: F con n1-1 y n2-1 grados de libertad.

e) Significación del estadístico de contraste
Ejemplo
Quieren someter a contraste la hipótesis de igualdad de las Varianzas de las puntuaciones obtenidas
por dos grupos de individuos en una prueba de extraversión.
a) Supuestos: Dado que las muestras han sido generadas aleatoriamente, se supone que los datos son
independientes.
b) Hipótesis:
d) Distribución del estadístico de contraste: F con 31-1 y 41-1 grados de libertad.

e) Significación del estadístico de contraste: 0.63
f) Decisión: La significación del estadístico de contraste es superior a 0.01, y en consecuencia se
acepta la Hipótesis Nula.
CONCLUSIÓN
Con la realización de este proyecto se puede observar que la estadística ha jugado un papel
primordial en este desarrollo, al proporcionar herramientas metodológicas generales para analizar
la variabilidad, determinar relaciones entre variables, diseñar de forma óptima experimentos,
mejorar las predicciones y la toma de decisiones en situaciones de incertidumbre.
Dada una muestra aleatoria simple proveniente de una variable aleatoria con función de densidad
o masa de probabilidad , el interés se centrará en encontrar un método para calcular intervalos de
confianza a partir de una función de valores muestrales que contenga bajo un nivel de confianza
dado, al parámetro, con la condición de que su distribución no contenga al parámetro Se toma como
base el método de cantidades pivótales para la obtención de los intervalos por su facilidad de
cálculo tanto en el caso de una o dos poblaciones que por simplicidad se estudiaran en conjunto.
REFERENCIAS BIBLIOGRÁFICAS
http://www5.uva.es/estadmed/inferen/estima_inter/intervalos3.html
https://www.studocu.com/es-mx/document/instituto-tecnologico-y-de-estudios- superiores-de-
occidente/analitica/estadistica-inferencial-unidad-2- estimaciones/3164546
https://www.uv.es/webgid/Inferencial/21_introduccin.html
https://www.ugr.es/~eues/webgrupo/Docencia/MonteroAlonso/estadisticaII/tema4.pdf
http://www.hrc.es/bioest/ch_medias.html http://www.hrc.es/bioest/ch_medias.html
https://proyectodescartes.org/iCartesiLibri/materiales_didacticos/EstadisticaProbab
ilidadInferencia/IntervalosConfianza/3_1IntervConfianzaProporcion/img/ProblemaR
esueltoProporcion.png
https://statologos.com/diferencia-de-intervalo-de-confianza-en-
proporciones/#:~:text=Un%20intervalo%20de%20confianza%20(IC,un%20cierto
%20nivel%20de%20confianza.

Introducción a la inferencia estadística: estimación y contraste de hipótesis

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Introducción a la inferencia estadística: estimación y contraste de hipótesis

Cargado por

Copyright:

Formatos disponibles

INTRODUCCION

En este proyecto se busca definir lo que es una inferencia estadística y su estimación, la

Los métodos básicos de la estadística inferencial son la estimación y el contraste de hipótesis,

La estimación de parámetros consiste en asignar un valor concreto al parámetro o parámetros

2.1 CONCEPTOS BASICOS.

2.2 DISTRIBUCIONES DE MUESTREO

Si repetimos el procedimiento 25 veces generamos 25 muestras. Las Medias de cada muestra

El Histograma de la distribución de las Medias de las 25 muestras es

y con 1000 muestras

2.3 ESTIMACIÓN PUNTUAL

2.4 ESTIMACIÓN DE INTERVALOS

La distribución de las Medias muestrales aproxima al modelo Normal:

Seguidamente generamos una muestra de la población y obtenemos su Media, que es igual a

Si queremos establecer un intervalo de confianza en que el % de veces que m se halle dentro

(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución muestral

2.5 INTERVALOS DE CONFIANZA PARA MEDIAS

donde sigma al cuadrado y n son la Varianza de la distribución poblacional y el tamaño de la

2.6 INTERVALOS DE CONFIANZA PARA DIFERENCIA ENTRE MEDIAS

El estadístico es , para el que p<0,05, en consecuencia,

2.7 INTERVALOS DE CONFIANZA PARA PROPORCIONES

2.8 INTERVALOS DE CONFIANZA PARA DIFERENCIAS ENTRE PROPORCIONES

diferencia en proporciones: fórmula

Intervalo de confianza = (p 1 –p 2 ) +/- z * √ (p 1 (1-p 1 ) / n 1 + p 2 (1-p 2 ) / n 2 )

• p 1 , p 2 : proporción de muestra 1, proporción de muestra 2

Nivel de confianza valor z

Intervalo de confianza del 90%:

2.9 INTERVALOS DE CONFIANZA PARA VARIANZAS

d) Distribución del estadístico de contraste: Ji Cuadrado con n-1 grados de libertad.

d) Distribución del estadístico de contraste: Ji Cuadrado con 19 grados de libertad.

d) Distribución del estadístico de contraste: F con n1-1 y n2-1 grados de libertad.

d) Distribución del estadístico de contraste: F con 31-1 y 41-1 grados de libertad.

También podría gustarte