Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Angie Mendoza
Nayelis Cárdenas
Santiago Linero
Shania Gnecco
Universidad de La Guajira
Facultad de Ciencias económicas y Administrativas
Administración de empresas
Riohacha – La Guajira
2019
La inferencia estadística
Es el conjunto de métodos que permiten inducir, a través de una muestra, el
comportamiento de una determinada población. La inferencia estadística estudia
entonces, como sacar conclusiones sobre los parámetros de población de datos.
De la misma manera estudia también el grado de fiabilidad de los resultados
extraídos del estudio.
Para entender el concepto es importante entender tres conceptos:
Población: Una población de datos, es el conjunto total de datos que existen sobre
un variable.
Teniendo claro a lo que nos referimos con el concepto de inferir, una de las dudas
fundamentales recae en el hecho de elegir una muestra en lugar de una población.
Extracción de la muestra
Para que una muestra posea validez técnico estadística es necesario que cumpla
con los siguientes requisitos:
Los pasos a seguir para la recolección de una muestra son los siguientes:
- Definir la población en estudio especificando las unidades que la componen, el
área geográfica donde se realiza el estudio (si procede) y el periodo de tiempo en
el que se realizará el mismo.
- Definir el marco: listado o descripción de los elementos que forman la población.
- Definir las variables a medir o las preguntas que se harán si se trata de una
encuesta.
Recuérdese que "al azar" no significa "de cualquier manera", para que el
procedimiento de muestreo sea válido es necesario utilizar correctamente el
proceso de generación de números aleatorios.
MUESTREO SISTEMATICO
-La ventaja principal es que es más sencillo y más barato que el muestreo
aleatorio simple, además, se comporta igual si no hay patrones o periodicidades
en los datos.
MUESTREO ESTRATIFICADO
-Se selecciona una muestra aleatoria de cada estrato tratando de que todos los
estratos de la población queden representados.
-Optima.
Datos cuantitativos:
Estos datos pueden ser mostrados mediante representaciones gráficas:
*Diagrama de barras
*Polígono de frecuencias
Ejemplo de diagrama de barras:
Datos cualitativos
Estos datos pueden ser mostrados mediante representaciones gráficas:
*Histogramas,
*Ciclogramas
*Pictogramas
Ejemplo de ciclograma:
La distribución normal Muchas pruebas en estadística se basan en el principio de
que se aplican a conjuntos de valores que se acercan a la distribución normal.
Uniendo mediante una línea curva los extremos de cada una de las barras,
obtendríamos lo que se conoce como campana de Gauss, o curva de la
distribución normal, caracterizada por su forma simétrica respecto del punto más
alto.
Curva de la distribución de notas en un grupo de 30 estudiantes correspondiente a
una distribución normal.
Valor de una distribución para el que se encuentra el mismo número de casos con
un valor más alto que con un valor más bajo.
Valor situado en el centro de la distribución.
Moda
Estimación de parámetros
Una estimación es puntual cuando se obtiene un sólo valor para el parámetro. Los
estimadores más probables en este caso son los estadísticos obtenidos en la
muestra, aunque es necesario cuantificar el riesgo que se asume al considerarlos.
Recordemos que la distribución muestral indica la distribución de los valores que
tomará el estimador al seleccionar distintas muestras de la población. Las dos
medidas fundamentales de esta distribución son la media que indica el valor
promedio del estimador y la desviación típica, también denominada error típico de
estimación, que indica la desviación promedio que podemos esperar entre el
estimador y el valor del parámetro.
Más útil es la estimación por intervalos en la que calculamos dos valores entre los
que se encontrará el parámetro, con un nivel de confianza fijado de antemano.
Contrastes de hipótesis
Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que
puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la
información extraída de las muestras y tanto si se aceptan como si se rechazan se
puede cometer un error.
H0 cierta H0 falsa
H1 cierta (*) Decisión
H0 rechazada Error tipo I ( ) Decisión correcta (*) correcta que se
H0 no rechazada Decisión correcta Error tipo II ( ) busca
a = p(rechazar
H0|H0 cierta)
b = p(aceptar H0|H0 falsa)
Potencia =1-b = p(rechazar H0|H0 falsa)
en el primer caso se habla de contraste bilateral o de dos colas, y en los otros dos
de lateral (derecho en el 2º caso, o izquierdo en el 3º) o una cola.
Obsérvese que, de esta manera, se está más seguro cuando se rechaza una
hipótesis que cuando no. Por eso se fija como H0 lo que se quiere rechazar.
Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha podido
rechazar. Por otro lado, la decisión se toma en base a la distribución muestral en
H0, por eso es necesario que tenga la igualdad.
Ejemplo:
Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra hipótesis
es que la presión sistólica media en varones jóvenes estresados es mayor que 18
cm de Hg. Estudiamos una muestra de 36 sujetos y encontramos
no está en la región crítica (no es mayor que 1,69), por tanto no rechazamos H0.
Otra manera equivalente de hacer lo mismo (lo que hacen los paquetes
estadísticos) es buscar en las tablas el "valor p" que corresponde a T=0,833, que
para 35 g.l. es aproximadamente 0,20. Es decir, si H0 fuera cierta, la probabilidad
de encontrar un valor de T como el que hemos encontrado o mayor (¿por qué
mayor? Porque la H1 es que m es mayor , lo que produciría una media muestral
mayor y por tanto mayor valor de t) es 0,20, dicho de otra manera la probabilidad
de equivocarnos si rechazamos H0 es 0,20, como la frontera se establece en 0,05
no la rechazamos.
es decir, se acepta H0 si