Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En la mayoría de las investigaciones resulta imposible estudiar a todos y cada uno de los
individuos de la población ya sea por el coste que supondría, o por la imposibilidad de
acceder a ello. Mediante la técnica inferencial obtendremos conclusiones para una población
no observada en su totalidad, a partir de estimaciones o resúmenes numéricos efectuados
sobre la base informativa extraída de una muestra de dicha población.
INFERENCIA ESTADISTICA: ESTIMACION.
La inferencia estadística es el conjunto de métodos y técnicas que permiten inducir, a partir
de la información empírica proporcionada por una muestra, cual es el comportamiento de
una determinada población con un riesgo de error medible en términos de probabilidad.
Los métodos paramétricos de la inferencia estadística se pueden dividir, básicamente, en dos:
métodos de estimación de parámetros y métodos de contraste de hipótesis. Ambos métodos
se basan en el conocimiento teórico de la distribución de probabilidad del estadístico muestral
que se utiliza como estimador de un parámetro.
Cuando se estima un parámetro poblacional, aunque el estimador que se utiliza posea todas
las propiedades deseables, se comete un error de estimación que es la diferencia entre la
estimación y el verdadero valor del parámetro. El error de estimación es desconocido por lo
cual es imposible saber en cada caso cual ha sido la magnitud o el signo del error; para valorar
el grado de precisión asociado con una estimación puntual se parte de dicha estimación para
construir un intervalo de confianza. En síntesis, un intervalo de confianza está formado por
un conjunto de valores numéricos tal que la probabilidad de que éste contenga al verdadero
valor del parámetro puede fijarse tan grande como se quiera. Esta probabilidad se denomina
grado de confianza del intervalo, y la amplitud de éste constituye una medida del grado de
precisión con el que se estima el parámetro.
Las muestras singulares generadas para investigación con sujetos suelen utilizarse para
obtener algunos estadísticos (Media, proporción, cuasivarianza, etc.) con los que se realiza
el proceso de inferencia. En cambio, las muestras simuladas por ordenador suelen ser
utilizadas para obtener distribuciones muestrales y realizar inferencia. Esto es de interés
cuando se dan circunstancias especiales que no aconsejan utilizar los procedimientos
habituales. Las distribuciones muestrales son las distribuciones de estadísticos de muestras
que pertenecen a la misma población. Por ejemplo, la distribución muestral de la Media es la
distribución de las Medias de muestras de un mismo tamaño extraídas de la misma población.
Ejemplo
Sea un curso con 40 estudiantes (el número de datos es pequeño para facilitar la comprensión
del ejemplo). Queremos conocer la Media de las puntuaciones del curso, pero por diversas
razones no tenemos acceso a todos los datos (que se denomina población). Pero supongamos
que podemos seleccionar cinco puntuaciones aleatoriamente y obtener la Media de la
muestra. Si repetimos el proceso y generamos más muestras tendremos más Medias
muestrales y podremos ver cómo se distribuyen:
La Media de los datos seleccionados aleatoriamente (son las señaladas en negrita) es:
La forma del Histograma se acerca a la del modelo Normal cuanto mayor es el número de
muestras. Esta es una característica de la distribución muestral de Medias que permite
conocer si la media obtenida en la muestra es muy diferente a la media de la población, dado
que tenemos la siguiente información:
a) La distribución de Medias muestrales es Normal.
b) La Media y Desviación Típica de la distribución de Medias muestrales son 4.7 y
1.52 (Nota: La diferencia entre la Media de la distribución muestral y la Media de la
población se debe a que la muestra es pequeña).
e) Por tanto, sabemos lo siguiente:
* El 95% (aproximadamente) de las Medias muestrales obtenidas en el muestreo del ejemplo
tienen valores entre 1.7 y 7.7
* El valor obtenido (4.2) está entre ambos límites, que definen el conjunto de valores que
obtenemos al hacer un muestreo aleatorio con muestras de 5 datos de la población del
ejemplo.
* Como conclusión, vemos que 4.2 es un valor esperable cuando efectuamos un muestreo
aleatorio con muestras de 5 datos. Diremos que la diferencia observada respeto de la Media
del curso es explicada por el azar (ya que la selección de las muestras ha sido aleatoria y
asumimos que no han influido otros factores).
Ejemplo
Se desea estimar la Media de las puntuaciones del curso 2003/4, pero solo se dispone de 50
puntuaciones seleccionadas aleatoriamente. La Media de la muestra (el estimador), es igual
a 5.6 y atribuimos este valor (la estimación) a la Media del Resumiendo:
Podemos utilizar como estimadores de la Media de la población otros estadísticos de
tendencia central como la Moda o la Mediana, pero NO todos los estimadores son apropiados.
Los estimadores deben satisfacer ciertos requisitos, y por esta razón, interesa conocer sus
propiedades a fin de utilizar los que sean adecuados según las circunstancias de la estimación.
Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución
Normal, y resulta:
(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución muestral
son los valores cuya función de distribución es igual a 0.975 y 0.025 respectivamente y se
pueden obtener en las tablas de la distribución Normal estandarizada o de funciones en
aplicaciones informáticas como Excel).
Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa razón,
la distancia desde m a la Media muestral es la misma que va de la Media muestral a m. En
consecuencia, si hacemos un muestreo con un número grande de muestras observamos que
el 95% de las veces (aproximadamente) el valor de la Media de la población (m) se encuentra
dentro del intervalo definido alrededor de cada uno de los valores de la Media muestral. El
porcentaje de veces que el valor de m se halla dentro de alguno de los intervalos de confianza
es del 95%, y es denominado nivel de confianza.
donde ls y le simbolizan los límites superior e inferior del intervalo de confianza al 95%.
Nueve de los diez intervalos (salvo el definido alrededor de la Media muestral igual a 3.7)
incluyen el valor del parámetro dentro sus límites.
cuanto mayor es el denominador (n), más pequeño es el valor del término a la izquierda del
"igual".
Ejemplo
A continuación, se presenta las Varianzas y los Histogramas de tres distribuciones muestrales
de la Media (número de muestras=100) en que los tamaños de las muestras son n=25, n= 100
y n=1000.
n=25
Varianza= 0.43
n=100
Varianza= 0.11
n= 1000
Varianza= 0.01
Los valores de la Varianza de la distribución de Medias muestrales son inferiores y la dispersión
observada en los Histogramas (ver en el eje horizontal que la amplitud de la variable disminuye)
cuanto mayor es n.
2) Cuando la distribución de Medias muestrales aproxima la distribución Normal, podemos obtener
probabilidades de las Medias muestrales.
Ejemplo
Si obtenemos una Media muestral igual a 6, y sabemos que la distribución muestral es Normal (5,2)
-el 5 es la media y el 2 la Desviación Típica de la distribución muestral- la probabilidad de obtener
puntuaciones iguales o inferiores a 6 es
La probabilidad de obtener valores iguales o inferiores a 0.5 en una distribución Normal es 0.69
(consultar tablas o funciones de probabilidad de la distribución Normal).
Para calcular el intervalo de confianza para la diferencia de dos medias se debe saber si las
varianzas poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas, se debe
probar si son igual es o diferentes. Cada uno de estos tres casos se analizarán por separado
Ejemplo
En un ensayo clínico para evaluar un hipotensor se compara un grupo placebo con el grupo tratado.
La variable medida es la disminución de la presión sistólica y se obtiene: grupo placebo n = 35; =
3,7 mm de Hg. y s2 = 33,9; grupo tratado n = 40; = 15,1 mm de Hg. y s2 = 12,8. ¿Es eficaz el
tratamiento?
Se trata de un contraste sobre diferencias de medias
H0: mT - mP = 0
H1: mT - mP> 0
Como no conocemos las varianzas, para realizarlo debemos decidir si son iguales o distintas, para
ello se plantea el contraste
H0:
H1:
En el caso de dos poblaciones, se trata de comparar la proporción en la que se presenta una cierta
característica A en las mismas (comparar la proporción de voto a un partido en dos regiones,
comparar la proporción de parados entre hombres y mujeres, ...). El problema se modeliza mediante
dos variables de Bernoulli independientes, de las que se dispone de sendas muestras aleatorias de
tamañoy , respectivamente.
Ejemplo
Sin embargo, no pueden saber con certeza si la diferencia en las proporciones de la muestra
coincide con la verdadera diferencia en las proporciones de la población, por lo que pueden crear
un intervalo de confianza para la diferencia entre las dos proporciones. Esto proporciona un rango
de valores que probablemente contenga la verdadera diferencia entre las proporciones de
población.
Por ejemplo, supongamos que queremos estimar la diferencia en la proporción de residentes que
apoyan una determinada ley en el condado A en comparación con la proporción que apoya la ley
en el condado B.
Dado que hay miles de residentes en cada condado, llevaría demasiado tiempo y sería demasiado
costoso recorrer y encuestar a cada residente individual en cada condado.
En cambio, podríamos tomar una muestra aleatoria simple de residentes de cada condado y usar la
proporción a favor de la ley en cada muestra para estimar la verdadera diferencia en proporciones
entre los dos condados:
Dado que nuestras muestras son aleatorias, no se garantiza que la diferencia de proporciones entre
las dos muestras coincida exactamente con la diferencia de proporciones entre las dos poblaciones.
Entonces, para capturar esta incertidumbre, podemos crear un intervalo de confianza que contenga
un rango de valores que probablemente contengan la verdadera diferencia en las proporciones entre
las dos poblaciones.
Usamos la siguiente fórmula para calcular un intervalo de confianza para una diferencia entre dos
proporciones de población:
0,90 1.645
0,95 1,96
0,99 2,58
Tenga en cuenta que los niveles de confianza más altos corresponden a valores z más grandes, lo
que conduce a intervalos de confianza más amplios. Esto significa que, por ejemplo, un intervalo
de confianza del 95% será más amplio que un intervalo de confianza del 90% para el mismo
conjunto de datos.
Ejemplo
Suponga que queremos estimar la diferencia en la proporción de residentes que apoyan una
determinada ley en el condado A en comparación con la proporción que apoya la ley en el condado
B. Aquí están los datos resumidos para cada muestra:
Muestra 1:
• n 1 = 100
• p 1 = 0,62 (es decir, 62 de cada 100 residentes apoyan la ley)
Muestra 2:
• n 2 = 100
• p 2 = 0.46 (es decir, 46 de cada 100 residentes apoyan la ley)
A continuación, se muestra cómo encontrar varios intervalos de confianza para la diferencia en las
proporciones de población:
c) Estadístico de contraste:
Datos:
Varianza de la población: 8
Cuasivarianza obtenida en la muestra de pacientes a los que administran la terapia: 7
Tamaño de la muestra: 20
a) Supuestos: Dado que la muestra ha sido generada aleatoriamente se supone que los datos son
independientes.
b) Hipótesis:
c) Estadístico de contraste:
Con un nivel de confianza del 95% pensamos que la varianza poblacional se sitúa entre 4.05 y
14.93
Conclusión: Los datos recogidos respaldan la hipótesis de que la nueva terapia reduce las
diferencias en el estado de los pacientes.
2.10 INTERVALOS DE CONFIANZA PARA RAZONES DE DOS VARIANZAS
a) Supuestos:
Las poblaciones siguen la distribución Normal. Los datos son independientes.
b) Hipótesis:
c) Estadístico de contraste:
Ejemplo
Quieren someter a contraste la hipótesis de igualdad de las Varianzas de las puntuaciones obtenidas
por dos grupos de individuos en una prueba de extraversión.
a) Supuestos: Dado que las muestras han sido generadas aleatoriamente, se supone que los datos son
independientes.
b) Hipótesis:
c) Estadístico de contraste:
Con la realización de este proyecto se puede observar que la estadística ha jugado un papel
primordial en este desarrollo, al proporcionar herramientas metodológicas generales para analizar
la variabilidad, determinar relaciones entre variables, diseñar de forma óptima experimentos,
mejorar las predicciones y la toma de decisiones en situaciones de incertidumbre.
Dada una muestra aleatoria simple proveniente de una variable aleatoria con función de densidad
o masa de probabilidad , el interés se centrará en encontrar un método para calcular intervalos de
confianza a partir de una función de valores muestrales que contenga bajo un nivel de confianza
dado, al parámetro, con la condición de que su distribución no contenga al parámetro Se toma como
base el método de cantidades pivótales para la obtención de los intervalos por su facilidad de
cálculo tanto en el caso de una o dos poblaciones que por simplicidad se estudiaran en conjunto.
REFERENCIAS BIBLIOGRÁFICAS
http://www5.uva.es/estadmed/inferen/estima_inter/intervalos3.html
https://www.studocu.com/es-mx/document/instituto-tecnologico-y-de-estudios- superiores-de-
occidente/analitica/estadistica-inferencial-unidad-2- estimaciones/3164546
https://www.uv.es/webgid/Inferencial/21_introduccin.html
https://www.ugr.es/~eues/webgrupo/Docencia/MonteroAlonso/estadisticaII/tema4.pdf
http://www.hrc.es/bioest/ch_medias.html http://www.hrc.es/bioest/ch_medias.html
https://proyectodescartes.org/iCartesiLibri/materiales_didacticos/EstadisticaProbab
ilidadInferencia/IntervalosConfianza/3_1IntervConfianzaProporcion/img/ProblemaR
esueltoProporcion.png
https://statologos.com/diferencia-de-intervalo-de-confianza-en-
proporciones/#:~:text=Un%20intervalo%20de%20confianza%20(IC,un%20cierto
%20nivel%20de%20confianza.