Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Modulo 1
Modulo 1
DISTRIBUCION EN EL MUESTREO
CONCEPTOS BASICOS
ESTADISTICA:
- La estadística es una rama de las matemáticas que se ocupa de la obtención,
orden y análisis de un conjunto de datos con el fin de obtener explicaciones y
predicciones sobre fenómenos observados.
- Ciencia (rama de la matemática) que estudia la recolección, análisis e
interpretación de datos ya sea para ayudar en la toma de decisiones o para
explicar condiciones regulares o irregulares de algún fenómeno o estudio
aplicado».
TÉCNICAS DE MUESTREO
• Probabilístico: Cada elemento de la población tiene una probabilidad conocida
de ser seleccionado. Puede calcularse el error muestral. (Aleatorio simple -
Sistemático - Estratificado - Por conglomerados - Por áreas)
• No probabilístico: La selección de un elemento de la población no tiene una
probabilidad conocida. No puede calcularse el error muestral. (Por
conveniencia - Por juicio - Por cuotas – Etc)
VARIABLE: Característica a analizar de los individuos de una población (que tenga
la particularidad de variar).
- Categorías: Posibles valores que puede tomar la variable. La categorización
debe cumplir con las condiciones de exhaustividad y exclusión.
- Tipos de variables: Cualitativa o cuantitativa.
- Escala de medición: Nominal, ordinal, de intervalos, de razones.
- Dato: Valor observado de una variable.
Herramientas de estadística descriptiva para el Análisis Univariado
Organización y tabulación de datos (frecuencias absolutas, relativas y
porcentuales)
Gráficos
Resumen de la información mediante indicadores
de posición (y de tendencia central): Resumen la información en un
valor de variable
de dispersión: Miden la dispersión del conjunto de datos
Objetivo: Entender mejor los datos
MEDIDAS NUMÉRICAS (INDICADORES)
Medidas de tendencia central y de posición: Se usan para resumir los
datos en un único valor de variable.
Media, mediana, moda, cuartiles, deciles, percentiles, etc.
Medidas de dispersión: Miden la dispersión de los datos con respecto a
un valor central.
Recorrido, recorrido intercuartílico, varianza, desviación estándar,
coeficiente de variación.
Indicadores de posición
Media aritmética (promedio)
- Medida más común en la que todos los valores desempeñan el mismo papel.
- Sirve como “punto de equilibrio”.
- Se calcula sumando todos los valores del conjunto de datos y dividiendo por la
cantidad total de datos.
x i
i 1
N
Poblacional
Mediana: Valor que divide en dos partes de igual cantidad de datos a un conjunto de
datos ya ordenado. El 50% de los datos tiene un valor menor (o igual) que la mediana y
el 50% de los datos tienen un valor mayor (o igual) que la mediana.
n 1
me dato(posicion( ))
2 Cuartiles, deciles, percentiles, …
Moda:Valor de variable que más se repite.
Indicadores de dispersión
Recorrido o rango: Medida numérica más sencilla para el cálculo de la distribución
total de un conjunto de datos. Se calcula como la diferencia entre el valor máximo y el
valor mínimo
rango x max x min
Varianza:
N n
N (n 1)
Poblacional Muestral
Desviación estándar (o desvío estándar):
2 S S2
Poblacional Muestral
CV x 100%
Funciones de la estadística
Descripción: recolección, organización, presentación, resumen y
análisis de datos (Estadística descriptiva)
Inducción: formulación de generalizaciones sobre una población a
partir de una muestra (estimación, prueba de hipótesis, generación de
modelos, predicciones, etc…) (Estadística inductiva)
La inferencia estadística se define como la colección de técnicas que permiten
formular inferencias inductivas y que proporcionan una medida del riesgo de éstas.
Si se obtiene una muestra técnicamente buena, puede contener información útil con
respecto al estado de la naturaleza y a partir de ello se podrán formular inferencias. (Se
está sujeto a riesgo dado que representa un razonamiento que va de lo particular a lo
general)
Muestra
x1,x2,……xn
Inferencia
Población
(Distribución de
probabilidad)
Para poder generalizar los valores muéstrales a la población, es necesario tener en
cuenta:
• Tamaño de la muestra (n)
• Método de selección de la muestra
MUESTRA ALEATORIA: Base teórica para la inferencia estadística.
Cada objeto de la población tiene una posibilidad igual e independiente de ser
incluido en la muestra.
Cada muestra de tamaño n tenga la misma probabilidad de ser seleccionada.
Variable aleatoria.
Cualquier función de las variables aleatorias que observaron en la muestra de
2
manera que esta función no contiene cantidades desconocidas (, s , s,
proporción estimada).
Muestra Estadístico
x1,x2,……xn
Inferencia
Población
Parámetro
(Distribución de probabilidad)
Distribución en el muestreo
Los datos de la muestra se usan para corroborar o rechazar alguna hipótesis
planteada. COMPROBACIÓN DE HIPÓTESIS
DISTRIBUCION EN EL MUESTREO
Parámetro: Caracterización numérica de la distribución de la población de manera que
describe, parcial o completamente, la función de densidad de la característica de interés
(, 2, , p).Valor fijo desconocido.
Estadístico: Variable aleatoria. Cualquier función de las variables aleatorias que
observaron en la muestra de manera que esta función no contiene cantidades
desconocidas (, s2, s, proporción estimada).
Los parámetros o sus funciones se estiman con base en estadísticos que, a su vez, se
obtienen a partir de la información contenida en una muestra aleatoria.
MUESTRA ALEATORIA
(Canavos, 1988)
Comportamiento típico de la desviación estándar de la media muestral como función del tamaño de muestra
Mayor tamaño de muestra, menor variabilidad de la media muestral
Teorema central del límite
σ =
Error estándar para la proporción
p
Si se seleccionan todas las muestras posibles de cierto tamaño, la distribución de todas
las proporciones muestrales posibles se denomina distribución muestral de la
proporción.
Ante muestras con reemplazo de una población finita, la distribución muestral de la
proporción sigue la distribución binomial.
Puede usarse la distribución normal para aproximar la distribución binomial cuando:
ESTIMACION PUNTUAL
El problema es encontrar una función que proporcione la “mejor” estimación del
parámetro
El estimador de un parámetro debe tener una distribución de muestreo concentrada
alrededor del parámetro y la varianza debe ser la menor posible
Una estadística suficiente para un parámetro es aquélla que utiliza toda la información
contenida en la muestra aleatoria con respecto al parámetro.
Es deseable que un estimador tenga una media igual a la del parámetro que se está
estimando.
=0
Estimadores consistentes:
Es razonable esperar que un buen estimador de un parámetro sea cada vez mejor
conforme crece el tamaño de la muestra.
Dentro de los estimadores insesgados, debe buscarse aquél con mínima varianza
Estadísticas suficientes:
Una estadística suficiente para un parámetro es aquélla que utiliza toda la información
contenida en la muestra aleatoria con respecto al parámetro.
Algunos métodos de estimación puntual
Máxima verosimilitud: En general, proporciona estimadores que son funciones de
estadísticas suficientes, estimadores eficientes y sesgados.
Momentos
Mínimos cuadrados
n
1
ˆ X X i ¿Parámetro?
i 1 n ¿Estadístico?
¿Estimador?
¿Estimación?
Valor / resultado
i 1
Un estimador de σ2 es la “varianza muestral”
¿Parámetro?
X X
N 2
¿Estadístico?
i ¿Estimador?
2
S i1
Valor / resultado ¿Estimación?
n 1 ¿Por qué el denominador de S2 es (n-1)?
Porque la distribución del muestreo de S2 sigue una distribución Chi-cuadrada con (n-1)
grado de libertad.
Notación:
P (xinf < < xsup) = (1-)
IC (xinf ; xsup) con una confianza (1-)
(1-) x 100% /2
(1-) = 0,95
= 0,05
/2= 0,025
# exitos
pˆ
n
Con remplazo
Sin remplazo
(distribución chi-cuadrado)
IC para el cociente de dos varianzas cuando se muestrean dos distribuciones normales
independientes (distribución F)
n= Z2
x σ 2 e : error máximo
e2
Estimación de la proporción
n= Z xpxq
2 Z correspondiente al nivel de confianza
p x q: varianza poblacional o p(1-p)
e : error máximo
e2
Forma general de los Intervalos de Confianza
PRUEBA DE HIPOTESIS
Otra área de la inferencia prueba o contraste de una hipótesis estadística
Hipótesis estadística:
Afirmación con respecto a alguna característica desconocida de una población de
interés.
Probar una hipótesis estadística:
Decidir si la afirmación se encuentra apoyada por la evidencia experimental que se
obtiene a través de una muestra aleatoria.
Ejemplo: Una máquina encargada del llenado de cajas de cereal funciona correctamente
si carga 368 gr. con una desviación estándar de 15 gr. Se supone normalidad en la
distribución de los datos. El gerente de producción ha decidido que la máquina no
funciona correctamente si no se llena con la cantidad apropiada (es decir, 368 gr. en más
o en menos).
La evidencia estará en una muestra aleatoria de tamaño n obtenida de la distribución
de interés para la cantidad de gramos que se carga en cada caja.
No es de interés la estimación de la cantidad de gramos promedio sino determinar si
el promedio es 368 grs.
(Antes de obtener la muestra, se conjeturó que el muestreo se llevará a cabo sobre una
distribución cuya media es 368 grs.)
Entonces….
Se busca validar una afirmación:
Prueba de hipótesis
µ = 368 grs.
Utilizando:
Considera la evidencia
Para ver si respalda
H0 o H1
µ = 368 grs.
µ ≠ 368 grs.
Siempre es una hipótesis de status quo (creencia actual en una situación dada)
H0: µ = 368
grs.
Se escribe en términos de Población Con signo =
Hipótesis de afirmación de investigación o inferencia
H0 : µ = #
H1: µ #
Casos:
H0 : µ = # H0 : µ #
H 1: µ #
H1: µ > #
Test a dos colas
H0 : µ #
H1: µ < #
Test a una cola
H0 : µ #
H1: µ > #
H0 : µ #
H1: µ < #
Test a una cola
µ µ
µ µ
H0 : µ =
Se rechaza:#concluye que µ #,
porque ese valor (#) tiene pocas posibilidades de presentarse si la H0 es cierta.
Llegar a una
conclusión Utilizo estadístico de muestra
Qué puede Por
equivocada para decidir sobre parámetro
pasar? qué?
poblacional