Está en la página 1de 31

FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS

Departamento de Estadística
Universidad de Concepción

Clase 1: Introducción a la Inferencia


Estadística

Prof: Andrea Fernández Jerez.

Agosto 2019
Estadística:
La Estadística se ocupa de los métodos y
procedimientos para recoger, clasificar, resumir,
hallar regularidades y analizar los datos, siempre
y cuando la variabilidad e incertidumbre sea una
causa intrínseca de los mismos; así como de
realizar inferencias a partir de ellos, con la
finalidad de ayudar a la toma de decisiones y en
su caso formular predicciones.
Áreas de aplicación:
Economía Gobierno
Bioestadística Deportes
Ingeniería Educación
Medicina Nutrición
Retail Inglés
Etc….
Estadística

Estadística descriptiva: Describe, Estadística inferencial: Apoyándose


analiza y representa un grupo de en el cálculo de probabilidades y a
datos utilizando métodos numéricos partir de datos muéstrales, efectúa
y gráficos que resumen y presentan la estimaciones, decisiones,
información contenida en ellos. predicciones u otras generalizaciones
sobre un conjunto mayor de datos.
Definiciones: Población: conjunto de elementos (individuos,
objetos, etc.) con alguna característica común
observable. A los elementos que conforman la
población se les llama unidad observable o
unidad de observación. Cuando se posee
información de todas las unidades observables
de la población se está en presencia de un
CENSO.

Muestra: Parte o porción extraída de una


población por métodos que permitan
considerarla como representativa de la misma
(TAMAÑO DE MUESTRA).
Población y muestra
La selección de los elementos (objetos,
individuos, etc.) que conformen la
muestra, debe ser al azar, de tal forma
que cada elemento tenga la misma
probabilidad de pertenecer a la
muestra.

La selección al azar garantiza que la


muestra sea representativa de la
población.
Las características numéricas de la población se denominan parámetros y las
características numéricas de la muestra se llaman estadísticos o estadígrafos.

Parámetro: función definida sobre los valores numéricos de


características medibles de una población.

Estadístico: función definida sobre los valores numéricos de una


muestra.
Definiciones:
Error Muestral. (Si te pesas, ¿más menos cuánto permites que la
balanza se equivoque: 100 gramos, 500 gramos, 3 kilos, 10 kilos?)
Nivel de Confianza. Probabilidad de que la estimación efectuada se
ajuste a la realidad.
Distribuciones Muestrales.
Dependiendo del tamaño de una población, no siempre es posible
obtener conclusiones generales relativas a características de toda la
población. En tales casos podremos considerar sólo una fracción,
que llamaremos muestra.

Lo anterior implica que la calidad de las conclusiones respecto de la


población, que se obtengan a partir de esta muestra, dependerá de
la calidad de la muestra obtenida.
La calidad de la inferencia depende de las propiedades de la
muestra, entre ellas, la aleatoriedad es la más importante.

Definición. Sean X1,...,Xn variables aleatorias, si ellas son


independientes e idénticamente distribuidas (iid), diremos que
X1,...,Xn, es una muestra aleatoria.
Recordemos que las inferencias están basadas en lo que
llamaremos estadísticos los cuales son funciones del
conjunto de variables aleatorias X1,...,Xn que constituyen
una muestra aleatoria de una población determinada.

Así, inferimos acerca de algún parámetro poblacional


desconocido mediante un estadístico obtenido desde la
muestra.
Tamaño de muestra para estimar la media de la
población
Pasos necesarios para determinar el tamaño de una
muestra empleando el muestreo aleatorio simple.
En primer lugar el nivel de confianza al que queremos
trabajar; en segundo lugar, cual es el error máximo que
estamos dispuestos a admitir en nuestra estimación, en
tercer lugar conocer la varianza de la variable que
queremos medir en la población.
Observar que:
Mientras mayor sea la varianza de la población mayor será el
tamaño de la muestra.

Un investigador que quiere tener mucha confianza en su estimación,


tiene que pagar el precio con un mayor tamaño de la muestra.

Intervalos de confianza estrechos requieren muestras grandes.


Distribución Muestral de Medias.
Teorema. Si X1,...,Xn es una muestra aleatoria de una
población con media  y varianza 2, entonces:
Distribución Muestral de Proporciones
Suponga que se tiene una población infinita distribuida binomialmente, donde p
y q son las probabilidades respectivas de que cualquier miembro de la
población, presente o no cierta propiedad.
Considere todas las muestras posibles de tamaño n extraídas de esta población,
y para cada muestra determine el estadístico proporción P de éxitos .

µ=p σ=√(pq/n)
Distribución Chi-Cuadrado

•Tiene un sólo parámetro denominado grados de libertad.

•La función de densidad es asimétrica positiva. Sólo tienen


densidad los valores positivos.

•La función de densidad se hace más simétrica cuando aumentan


los grados de libertad.
Sea una v.a. que se distribuye si se estandariza se tiene
y si se eleva al cuadrado se obtiene una nueva variable
que no se distribuye normalmente puesto que si está contenida
en el intervalo (-∞, ∞), varía en el rango de 0≤ ≤ ∞ y se llama
; ; continuemos esta operación hasta sumar n variables.
O sea que la variable aleatoria se define como la suma de n
variables aleatorias estandarizadas al cuadrado con v=n grados de
libertad. En este punto el concepto de grados de libertad es solamente
el número de variables aleatorias estandarizadas al cuadrado
La función de densidad de probabilidad de esta variable
aleatoria es la siguiente:
Uso de la tabla Chi-cuadrado

Considere 6 g.l. y determine w1 tal


que el área en color sea 0,75.
Distribución t-Student
•Tiene un parámetro denominado grados de libertad.

•Cuando aumentan los grados de libertad, se acerca a


la N(0,1).

•Es simétrica con respecto al cero


Uso de la Tabla de la t - Student
Aquí debemos observar los grados de libertad, g.l., antes de
observar el valor. La diferencia con la tabla normal es que
aquí aparece afuera el área y los grados de libertad, a
dentro aparecen los valores del eje, en este caso le
llamaremos t.
 El área bajo la curva hasta el
punto t0= -2,02 con 5 g.l. es de
0,050.

 El punto que deja un área de 0,975


considerando 5 g.l. es 2,57.
Distribución F -Snedecor

Tiene dos parámetros denominados grados de


libertad.

Sólo toma valores positivos. Es asimétrica.


Uso de la Tabla F Fisher-Snedecor.

En esta tabla tenemos dos grados de libertad, n1 g.l. asociados al numerador y n2 g.l.
asociados al denominador. Observar que aquí se presentan dos tablas, una para el área
de 0,95 y el otro para el área de 0,975. Es posible determinar los valores para áreas 0,05
y 0,025 a partir de la siguiente propiedad.

1 1
f m;n;0,05  f m;n;0,025 
f n;m;0,95 f n;m;0,975

Veremos más adelante que esta tabla será usada para realizar pruebas de
homogeneidad de varianzas (homocedasticidad o heterogeneidad).
F7;3;0,95= F7;3;0,05=

También podría gustarte