Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICO
INFERENCIAL
ESTADÍSTICA DESCRIPTIVA
Muestra:
Es un subconjunto que se selecciona de la población con fines de
análisis.
Muestra representativa:
Muestra que contiene las características más importantes de
la población en las mismas proporciones en que están
contenidas en ella. 10% de la población.
Los datos recolectados de la muestra y sus resultados estadísticos se
denominan estadígrafos. Las estadísticas de la población son los
parámetros, no son calculados, porque no se recolectan datos de toda
la población, pero pueden ser inferidos de los estadígrafos.
Distribución muestral:
Conjunto de valores sobre una estadística calculada de todas las muestras
posibles de determinado tamaño de una población.
Las distribuciones muestrales de medias son las más conocidas.
Universo: personas de una ciudad. Queremos averiguar cuanto café
beben al día. Muestra representativa = 675. Se extraen al azar muestras
de 675 personas hasta agotar todas las muestras posibles. En cada
muestra se obtiene una media, con éstas elaboramos una distribución
de medias. Si calculamos la media de todas las medias de las muestras,
obtendremos el valor de la media poblacional. Casi nunca se obtiene la
distribución muestral (la distribución de las medias de todas las
muestras posibles), lo que se hace es extraer una sola muestra.
Si nuestra media calculada se encuentra cerca de la media de la
distribución muestral podremos tener una estimación precisa de la
media poblacional (el parámetro poblacional es prácticamente el
mismo que el de la distribución muestral).
La probabilidad de que un evento ocurra oscila entre cero (0) y uno (1), cero implica
imposibilidad y uno certeza. Al lanzar una moneda, la probabilidad de que salga “cruz”
es 0.50. Con un dado, la probabilidad de obtener cualquiera de sus caras al lanzarlo es
de 1/6 = 0.1667. La suma de posibilidades siempre es uno.
Para probar hipótesis inferenciales, el investigador debe evaluar si es alta o baja la
probabilidad de que la estadística de la muestra esté cerca de la estadística de la
distribución muestral. Si es baja, el investigador dudará de generalizar a la población.
Si es alta, el investigador podrá hacer generalizaciones. El nivel de significancia es el
nivel de probabilidad de equivocarse y lo fija el investigador antes de probar hipótesis
inferenciales.
El investigador busca un alto porcentaje de certeza, una probabilidad elevada, porque
sabe que tal vez haya error de muestreo.
El porcentaje de confianza o el nivel de significancia mínimo aceptable con el
cual el investigador generaliza, para suponer que tal cercanía es real y no por
un error de muestreo, es definido o convenido por las asociaciones científicas
correspondientes al ramo o área en la cual se investiga. Existen dos niveles:
a) Nivel de significancia de 0.05, el cual implica que el investigador tiene 95%
de seguridad para generalizar y 5% en contra. En términos de probabilidad,
0.95 y 0.05. Este nivel es el más común en ciencias sociales.
b) Nivel de significancia de 0.01, el cual implica que el investigador tiene 99%
a su favor y 1% en contra (0.99 y 0.01 = 1.00). Muy utilizado cuando las
generalizaciones implican riesgos vitales para las personas (pruebas de
vacunas, medicamentos, arneses de aviones, etc).
A veces, el nivel de significancia puede ser todavía más riguroso (0.001,
0.00001, 0.00000001) pero mínimo debe ser de 0.05.
Resultados significativos al nivel de 0.05 (p < 0.05) = 5% de posibilidad de
error al aceptar la hipótesis al aplicar una prueba estadística; o 5% de riesgo
de que se rechace una hipótesis nula cuando era verdadera.
El nivel de significancia se expresa en términos de probabilidad (0.05 y
0.01) y la distribución muestral también (el área total de ésta como
1.00). Podemos expresarlo en proporciones o porcentajes (5%, 1%).
El nivel de significación representa áreas de riesgo o confianza en la
distribución muestral.
Los resultados posibles al probar hipótesis son: