Está en la página 1de 12

ESTADISTICA INFERENCIAL

1- INTRODUCCION
El termino muestreo se refiere al proceso seguido para extraer una muestra de una
población. El muestreo puede ser: probabilístico y no probabilístico.

2- CONCEPTOS BASICOS
PROBABILIDAD:
- La PROBABILIDAD es un valor numérico que indica la posibilidad de ocurrencia
de un evento específico.
- La PROBABILIDAD es una proporción o fracción cuyo valor está entre 0 y 1
- Si un evento no tiene posibilidad de ocurrir tiene PROBABILIDAD = 0
- Un evento que ocurrirá con seguridad tiene PROBABILIDAD = 1
- El término PROBABILIDAD se utiliza para sugerir que existe incertidumbre sobre
un hecho que ocurrió o puede ocurrir.
Experimentos aleatorios: Cualquier experimento real o hipotético que pueda dar lugar a
varios resultados sin que sea posible anunciar con certeza cuál de estos resultados va a ser
el observado (ejemplo: juegos de azar)
 Se lo puede repetir bajo las mismas condiciones tantas veces como se desee.
 No se puede predecir con exactitud el resultado de dicho experimento, pero se
puede decir cuáles son los posibles resultados del mismo.
Ejemplos: Tirar un dado (y registrar el numero en la cara de arriba)/ tirar una moneda (y
registrar la “cara” que se ve)
Espacio muestral: conjunto de todos los resultados posibles de un experimento aleatorio y
lo denominaremos con la letra S.
Evento o suceso: todo subconjunto del espacio muestral. Cada posible tipo de ocurrencia
de un experimento aleatorio. Un evento simple es un evento que se puede describir con una
característica única.
EJEMPLOS: A= {salga un uno} B= {salga un seis} C= {sea par} D= {sea mayor de 3}

OPERACIONES ENTRE EVENTOS:


 Si A y B son eventos, entonces A∪B (se lee A unión B) es otro evento, A∪B ocurre
si y solo si ocurre A u ocurre B.
 Si A y B son eventos, entonces A∩B (se lee A intersección B) es otro evento, A∩B
ocurre si y solo si ocurre A y ocurre B.
 Si A es un evento, A es el evento complementario es decir A ocurre si y solo si A
no ocurre.
DEFINICIONES DE PROBABILIDAD:
PROBABILIDAD CLÁSICA (a priori):
- La probabilidad de éxito se basa en el conocimiento previo del proceso.
- Cada resultado es igualmente posible y los posibles resultados son mutuamente
excluyentes.
Ejemplo: posibilidad de que salga una carta “oro” de la baraja, posibilidad de que salga
un “uno” al arrojar un dado
numeros de casos favorables
P ( A )=
numeros total de casos posibles
PROBABILIDAD CLÁSICA EMPÍRICA (a posteriori): la probabilidad de éxito se basa en
datos observados. Ejemplo: proporción de individuos en una encuesta que compran un
producto, que prefieren cierto candidato político o que tienen un trabajo de tiempo parcial
Na
P ( A )=log ∞
N
N es el número de repeticiones
Na el número de ellas en que el suceso A ocurrió.
La fracción NA /N es la frecuencia relativa de A en N repeticiones.
PROBABILIDAD SUBJETIVA:
- Es la posibilidad de ocurrencia asignada a un evento por una persona particular.
- Generalmente la asignación de probabilidades subjetivas se basa en la combinación
de la experiencia de una persona, su opinión personal y el análisis de la situación
específica.
Ejemplo: probabilidad de que un nuevo producto tenga éxito en el mercado.

REGLAS PARA EL CALCULO DE PROBABILIDADES


PROBABILIDAD SIMPLE: Es la que se asigna a un evento descripto por una sola
categoría P(A).
Ejemplo: Experimento aleatorio: “Tirar una moneda una vez” S = {C, S} A = {salga cara}
P(A)=1/2

 P (A  B) = P (A) + P (B) – P (A  B) (Probabilidad de que suceda A o B)


 P (A  B) = P (A) * P (B/A) (Probabilidad de que suceda A y B)
P ( A B)
 P (B/A) = (Probabilidad de que suceda un evento B, sabiendo que ya
p( A)
sucedió el evento A.
Eventos independientes: Dos eventos A y B son independientes cuando la ocurrencia de
uno de ellos no modifica la probabilidad de ocurrencia del otro. Si los eventos son
independientes:
 P (B / A) = P (B)
 P (A  B) = P(A) * P (B )
Eventos mutuamente excluyentes: Ocurre un evento u ocurre el otro.
 P (A  B) = 0
 P (A  B) = P (A) + P (B)

3- VARIABLE ALEATORIA
¿QUÉ ES UNA VARIABLE ALEATORIA?: Una variable aleatoria (v.a.) es una función
que asocia a cada elemento del espacio muestral un número real.
X: S →ℜ
En general se denota la variable aleatoria con X (mayúscula) y los resultados posibles con x
(minúscula).
- VARIABLE: característica a observar
- ALEATORIA: surge de un experimento aleatorio.

Variable aleatoria discreta:


Si una variable aleatoria puede tomar solamente un número finito de valores o un número
infinito numerable de valores se llaman discreta. Son respuestas numéricas que surgen de
un proceso de conteo.

 TABLA DE DISTRIBUCIÓN DE PROBABILIDADES: Por ser X el resultado de


un experimento aleatorio, cada xi es un evento, por consiguiente le corresponde una
determinada probabilidad P(X=xi ). La tabla está formada por el conjunto de
posibles resultados de la v.a que son mutuamente excluyentes y sus probabilidades.

 FUNCION MASA DE PROBABILIDAD: Si X es una variable aleatoria discreta, a


cada valor xₒ que asume dicha variable se le asigna un valor:
P( xi)= p(x=xi)
Debe cumplir las siguientes condiciones:

1. P ( xi ) ≥ 0 para todo i
2. ∑ P ( xi )=1

 FUNCION DE DISTRIBUCION / ACUMULADA DE PROBABILIDADES: Si x


es una variable aleatoria y x es un numero real, la función de distribución de x
representada por F(X), da la probabilidad de que x adopte valores menores o iguales
que x.
F ( x )= p ( X ≤ x ) =∑ xi≤ x p( xi)
Debe cumplir las siguientes condiciones:

1. 0 ≤ F (x )≤ 1
2. Si a < b entonces F(a) ≤ F(b)
3. F ( ∞ ) =p ( x ≤∞ ) =1 y F (−∞ )= p ( x ≤−∞) = 0
4. p ( a< x ≤b )=F ( b )−F ( a )

 ESPERANZA MATEMATICA: Promedio a largo plazo, valor esperado o media.


Indica dónde está ubicado el centro de gravedad de la distribución de una variable
aleatoria si el mismo experimento se repite una y otra vez. Solamente se va a
cumplir si el experimento ocurre infinitas veces.
E ( x )=∑ xi∗p( xi)
x=valores de la variable
p= probabilidades respectivas
 VARIANZA:
 La esperanza matemática no dice nada acerca de cómo se dispersan o
concentran los resultados de una ejecución a otra del experimento.
 La varianza es un indicador de variabilidad

2
V ( x )=E ( x 2) −[ E ( x ) ]
donde : E ( x 2 ) =x ₁2∗p1 + x 22∗p2 +… xₙ2∗pₙ

 DESVIO: σ =√ V (x)
PROPIEDADES DE LA ESPERANZA Y VARIANZA:
- E ( ax )=a∗E ( x)
- E ( x+ b )=E ( x ) +b
- V ( ax )=a 2∗V ( x )
- V ( x+ b )=V ( x )
Donde a y b son constantes.

EJEMPLO:
3) El presidente regional de una sociedad de fomento barrial está tratando de estimar la
cantidad que cada simpatizante donara durante la reunión anual de la sociedad. Empleando
los datos recabados durante los últimos 10 años, ha calculado las siguientes probabilidades
de las donaciones:
Pesos
25 50 75 100 125
promedios
Probabilidad
0.45 0.25 0.15 0.10 0.05
P(x=x)
F(x) 0.45 0.70 0.85 0.95 1

E(x) = 25*0,45 + 50*0, 25 + 75*0, 85 + 100*0,10 + 125*0,05


E(x) = 51,25 pesos.
Ante gran cantidad de reuniones anuales se espera recibir en promedio 51,25 pesos por
donante.
V(x) = 904,69 pesos 2
D(x) = 30,05 pesos

DISTRIBUCIONES DISCRETAS:
BINOMIAL: n pruebas de Bernoulli independientes.
P ( x=k ) = n ∗p k∗qn−k
() k
n=tamaño de la muestra
p=probabilidad de éxito

 Cada observación se puede considerar como seleccionada de una población infinita


sin reemplazo o de una población finita con remplazo.
 Cada observación se puede clasificar en una de dos categorías colectivamente
exhaustivas y mutuamente excluyentes: éxito (p) o fracaso 1-p (q).
 El resultado de cualquier observación es independiente del resultado de cualquier
otra observación.
E (X)= n*p
V (X)= n*p*q

HIPERGEOMETRICA: n pruebas de Bernoulli dependientes.


m ∗ N−k
P( x=k)
( )( )
k n−k
N
( )
n
N=tamaño de la población
n=tamaño de la muestra
m= número de éxitos en la población
N-m=número de fracasos de la población
 Tanto la distribución binomial como la hipergeometrica se refieren a la misma V.A:
el número de éxitos en una muestra que contiene n observaciones.
 Para el modelo hipergeometrico los datos de la muestra se obtienen sin reemplazo
de una población finita.
 La probabilidad de obtener un éxito no es constante. El resultado de una
observación es afectado por los resultados de las observaciones previas.

POISSON: representa el número de eventos independientes que ocurren, a una velocidad


constante, en el tiempo o en el espacio.
e− λ∗λ k
P ( x=k ) =
k!
λ=numero promedio de ocurrencias en un intervalode espacio o tiempo
e: constante matemática aprox. igual a 2.71828 x: número de éxitos
 : Parámetro, esperanza del número de éxitos
Existe un proceso de Poisson si podemos observar eventos discretos en un área de
oportunidad (un intervalo continuo de tiempo, longitud o superficie), de tal manera que si
se reduce lo suficiente el intervalo:
 La probabilidad de observar exactamente un éxito en el intervalo es constante 2.
 La probabilidad de observar más de un éxito en el intervalo es 0 3.
 La probabilidad de observar un éxito en cualquier intervalo es estadísticamente
independiente de cualquier otro intervalo.

Variable aleatoria continúas: puede tomar infinitos valores en un continuo. Son


respuestas numéricas que surgen de un proceso de medición.

DISTRIBUCIONES CONTINUAS: a continuación se presentan casos en que la variable


aleatoria puede tomar cualquier valor que este en un intervalo de valores.

DISTRIBUCION NORMAL:
Importancia:
 Es la distribución de probabilidades más conocida e importante.
 Muchas de las variables aleatorias siguen una distribución normal o
aproximadamente normal.
 Sirve como aproximación a diversas distribuciones de probabilidad discreta
(Binomial y Poisson).
 Proporciona la base para la estadística inferencial clásica.
Propiedades:
- Tiene forma de campana (simétrica).
- Las medidas de tendencia central (media, mediana, moda) son idénticas.
- Es unimodal.
- El área debajo de la curva es igual a 1.
- Presenta puntos de inflexión en los valores de abscisas 𝜇 + 𝜎 y 𝜇 – 𝜎
- La variable aleatoria asociada tiene un intervalo de −∞ ≤ 𝑥 ≤ +∞ (asintótica)

Función de densidad de probabilidad:


−1
1 ¿¿
F ( x )= ∗e 2
σ √2 π
𝜇 es la media o esperanza de la variable 𝑥
𝜎 es la desviación estándar
𝜋 y 𝑒 son constantes matemáticas
𝜇 y 𝜎 son los parámetros de la distribución normal

Gráfico de la función de densidad y una regla empírica:

Propiedades de la variable aleatoria:


 La v.a. generada por una suma (finita) de v.a. normales es normal (si X1 ,…,Xn son
v.a. normales, Y = a1 X1+…+an Xn es también una v.a. Normal)
 Por ser una v.a. continua:
P( x <k )=P( x ≤ k )
P( x=k)=0
 Por tener una distribución simétrica:
P( x ≤ µ−k)=P(x ≥ μ+k )

Gráfico de la función de densidad:


LEY NORMAL ESTÁNDAR: PROCESO DE ESTANDARIZACIÓN
Estandarización: toda variable aleatoria con distribución normal puede expresarse con
una distribución N (0,1)

BUSCAR EN TABLA LAS PROBABILIDADES

APROXIMACIÓN A BINOMIAL:
Condiciones:
1) n . p ≥ 5
2) n .(1−p) ≥5
MUESTREO
Representacion de población y muestra:

Muestreo:

CONCEPTOS:
- Error muestral: Diferencia entre el valor estimado y el valor real desconocido, se
denota con la letra e.
- Error Sistemático: Ajenos al muestreo o sesgos.
- Muestreo: Procedimiento por el cual se obtiene una muestra.

TIPOS DE MUESTREO:
Muestreo Probabilístico:
 Cada unidad de muestreo de la población objetivo definida tiene una probabilidad
conocida de ser elegida para la muestra.
 La probabilidad real de selección de cada unidad de muestreo puede no ser igual a
las demás.
 Los resultados se generalizan a la población dentro de un margen de error calculado.
Muestreo No Probabilístico:
 Se desconoce la probabilidad de seleccionar cada unidad de muestreo. Se desconoce
el porcentaje de error.
 La selección de unidades de muestreo se basa en algún juicio intuitivo o
conocimiento del investigador.
 Los resultados se limitan a la muestra.

Tipos de Diseño de Muestreo Probabilístico:


Muestreo Aleatorio Simple (SRS - simple random sampling):
- Cada muestra de tamaño n tiene la misma probabilidad de ser seleccionada.
- Cada elemento de la población N tiene la misma probabilidad de ser seleccionado.
- Método de extracción aleatorio de elementos de la muestra (tablas de números
aleatorios, marcación aleatoria de dígitos, etc.)
- Se pueden obtener cálculos de la población sin sesgos.
- Requiere conocer todos los elementos de la población.
Muestreo Aleatorio Sistemático (SYMRS – systematic random sampling):
- Requiere que la población se ordene de alguna manera y conocer el número de
unidades de muestreo.
- Se seleccionan las unidades de muestreo de acuerdo con su posición utilizando un
intervalo de salto (tamaño de la lista de la población / tamaño de la muestra
deseada)
- Elegir aleatoriamente el punto de partida.
- Es menos costoso y más rápido.
- Motivos de sesgos: Riesgo de patrones ocultos en los datos - Ordenamiento de datos
por profesión, prestigio o edad.
- Si la ordenación de la lista es al azar con respecto a la variable que se mide, el
muestreo sistemático es equivalente al aleatorio simple.
Muestreo Aleatorio Estratificado (STRS – stratified random sampling)
- Se divide a la población en subgrupos homogéneos llamados estratos (por ejemplo
para efectuar comparaciones por género). Hay variación de un grupo a otro.
- Se seleccionan muestras aleatorias o sistemáticas de cada estrato.
- Se combinan las muestras de cada estrato en una sola muestra de la población
objetivo.
- Muestreo estratificado proporcionado (afijación proporcional): el tamaño de la
muestra de cada estrato depende de su tamaño en relación con la población objetivo.
n
n h= ∗N h
N
- Muestreo estratificado desproporcionado (afijación simple): el tamaño de la muestra
de cada estrato es independiente de la proporción de ese estrato respecto de la
población objetivo.
Muestreo por Conglomerado:
- Las unidades de muestreo se dividen en subpoblaciones mutuamente excluyentes y
colectivamente exhaustivas, llamadas conglomerados.
- Hay variaciones dentro de cada grupo pero los grupos son similares entre sí.
- Una vez seleccionado el conglomerado, se eligen las unidades de muestreo
aplicando un muestreo aleatorio simple o un censo.
- Una de las principales desventajas es que los conglomerados a menudo son
homogéneos, lo ideal es que las personas de un conglomerado sean heterogéneas
como la población.
- Es un método rentable y fácil de ejecutar.
Ejemplos: – muestreos de área donde se forman conglomerados por designaciones
geográficas – Muestreos por distritos electorales

Tipos de Diseño de Muestreo No Probabilístico:


Muestreo por conveniencia:
 Las muestras se extraen sobre la base de la comodidad.
 Supone que la población es homogénea y que las personas encuestadas son
semejantes a la población definida.
 Permite relevar un gran número de individuos en tiempos cortos.
 Los resultados no son generalizables, no se puede medir la representatividad de la
muestra.
Muestreo por juicio:
 Se elige a los individuos porque el investigador cree que cumplen con los requisitos
del estudio.
 Supone de fondo que las opiniones de un grupo de expertos percibidos son
representativas de la población objetivo.
 Si el juicio del investigador es correcto, la muestra por juicio será mejor que la
generada por el muestreo por conveniencia.
 Los resultados no son generalizables, no se puede medir la representatividad de la
muestra.
Muestreo por cuota:
 Selección de los participantes en perspectiva conforme a cuotas pre-especificadas de
características demográficas, actitudes o comportamientos específicos.
 El propósito es asegurar que los subgrupos pre especificados de la población queden
representados en el muestreo.
 Reduce el sesgo de selección de los trabajadores de campo.
 Las cuotas pueden ser determinadas por la naturaleza de los objetivos de la
investigación.
 El tamaño de la cuota es subjetivo.
 Los resultados no son generalizables, no se puede medir la representatividad de la
muestra.
Muestreo por bola de nieve:
 Identificar y calificar un conjunto de individuos iniciales, los cuales a su vez ayudan
al investigador a identificar individuos adicionales (recomendación).
 Es un método razonable para identificar a individuos que son miembros de
poblaciones objetivo definidas en forma única, y que además son pequeñas y de
acceso difícil.
 Se puede producir sesgo en el estudio, si hubiera diferencias significativas entre los
individuos que se conoce en ciertos círculos sociales y los que no.
 Los resultados no son generalizables, no se puede medir la representatividad de la
muestra.
Factores que influyen la selección del método de muestreo:
■ Objetivos de la investigación
■ Grado de precisión
■ Recursos y marco de tiempo
■ Conocimiento de la población objetivo
■ Alcance de la investigación
■ Necesidad de análisis estadístico

También podría gustarte