Está en la página 1de 24

7/9/18

Psicología Matemática y Metodología II


Grado de Psicología URJC

Tema 1. Muestreo

David Martínez Íñigo


Departamento de Psicología
Universidad Rey Juan Carlos

Texto de referencia: Pardo, A. y San Martín, R. (2006) Cap. 1

Introducción
n Análisis de datos inferencial: busca extraer
conclusiones generales a partir de unos
pocos datos particulares

n Þ Técnica de análisis de datos para hacer la


inferencia

n Þ Seleccionar adecuadamente los datos que se van a


analizar

1
7/9/18

¿Qué es el análisis de datos?


Seleccionar datos Caracterizarlos Extraer conclusiones

Muestreo Estadística descriptiva Estadística Inferencial

Probabilidad Margen y tipo


de error

Selección Estud Ψ Media y Dt en: Perfil Estudiante Ψ


• 2º curso URJC • CI •CI Medio Alto
•10% Univ Madrid • Personalidad •Extrovertido

Generalización

¿Por qué es importante el muestreo?

¿Este plato de
comida es
saludable?

2
7/9/18

¿Por qué es importante el muestreo?

¿Cómo evitamos errores en


la inferencia?
n Utilizando un procedimiento de selección de datos que
ofrezcan garantía de que cualquier elemento de la
población ha tenido la oportunidad de ser escogido para la
descripción.

TÉCNICAS DE MUESTREO

3
7/9/18

Conceptos básicos
Población (o universo) Muestra
Conjunto de elementos Subconjunto de elementos de
(sujetos, objetos, entidades una población
abstractas, etc) que poseen
una o más características en
común

Ej. Todas las personas que Ej. 145 personas que tienen
sufren depresión depresión

Parámetro Estadístico
Valor numérico que describe Valor numérico que describe
una característica de una una característica de una
POBLACIÓN MUESTRA

Conceptos básicos
Población (o universo)
Conjunto de elementos (sujetos, objetos, entidades
abstractas, etc) que poseen una o más características en
común
n Dificultad de acceso en la realidad a la población

n Redefinición de la población a partir del muestreo (población


muestreada)
• Ejemplo: Encuesta condiciones de trabajo a empleados (trabajadores de la economía
formal)

n Tipos
• Finitas (habitual en Y, aunque tan
grandes que se consideran infinitas)
n
• Infinitas

4
7/9/18

Conceptos básicos
Muestra
Subconjunto de elementos de una población

n De la muestra se obtiene información necesaria para poder


describir las propiedades de la población

n Extraer conclusiones referidas a los elementos de la población a


partir de la observación de sólo unos pocos de esos elementos

n Necesario que las muestras sean REPRESENTATIVAS de la


población

n Procedimiento para ello: MUESTREO

Conceptos básicos
Parámetro
Valor numérico que describe una característica de una
POBLACIÓN
n Los elementos de una población comparten la/s modalidad/es de
una variable/es (constante) pero difieren en otros. El parámetro
describe en las que difieren.

n Cuando la media, la varianza, la proporción, etc se refieren a alguna


característica de la población, se llaman parámetros

n En general los parámetros son valores poblacionales


desconocidos

n Los parámetros son valores constantes (no variables)

n Nos referimos a ellos con letras griegas minúsculas: p, s, µ, etc

5
7/9/18

Conceptos básicos
Estadístico Valor numérico que describe una característica de una MUESTRA
n A partir de un muestra, se puede medir una o varias de sus características y
aplicar distintas transformaciones sobre ellas para describirla.

n Frecuencia, frecuencia acumulada, media, mediana, varianza, proporción,


correlación, etc. observada en la muestra

n A partir de los valores de los estadísticos muestrales nos hacemos una idea los
valores de los parámetros poblacionales
n ESTIMACIÓN de parámetros (clave en estadística inferencial)

n Es un valor variable: dependerá de la muestra tomada

n El estadístico es una variable aleatoria que resulta de la combinación de n


variables aleatorias

n Es una variable aleatoria cuyo valor dependerá de la muestra seleccionada y la


probabilidad de las características en la población

n Se representan por letras latinas mayúsculas: S, P,

Resumiendo: ¿Cuáles de las siguientes


afirmaciones con correctas?

n En un estudio sobre el bienestar de los alumnos universitarios de la Comunidad de


Madrid. Un grupo de 500 alumnos de la URJC voluntarios para participar en el
estudio sería.

A. Una muestra representativa de la población universitaria


B. Una muestra representativa solo de la URJC
C. La población objeto de estudio
D. Una muestra de estudiantes universitarios de la Comunidad de Madrid.

n Si calculamos la media de consumo de alcohol entre los 500 estudiantes


obtendremos:

A. Una estimación del consumo medio de alcohol entre los estudiantes


universitarios
B. Una estimación del consumo medio de alcohol entre los estudiantes de la URJC
C. El valor del parámetro “consumo medio de alcohol” entre los alumnos
voluntarios en el estudio.

6
7/9/18

Resumiendo: ¿Cuáles de las siguientes


afirmaciones con correctas?

n Si elegimos los 500 estudiantes de la URJC al azar, obtendremos:

A. Una muestra representativa de la población universitaria


B. Una muestra representativa de la URJC
C. Una muestra representativa de los de estudiantes universitarios de la zona sur
de la Comunidad de Madrid.

n Si calculamos la media de de consumo de alcohol entre los 500 estudiantes elegidos


al azar, obtendremos:

A. Una estimación del consumo medio de alcohol entre los estudiantes


universitarios
B. Una estimación del consumo medio de alcohol entre los estudiantes de la URJC
C. Las dos anteriores, si bien B ofrece una estimación menos precisa.

Tipos de muestreo
Probabilístico: cada Aleatorio CON
elemento poblacional reposición (pobl.
posee una finita)
probabilidad conocida
o calculable de Aleatorio
Aleatorio SIN simple o
pertenecer a la reposición (pobl.
muestra Muestreo
finita) aleatorio
Muestreo
Aleatorio en
Proceso seguido Permite conocer grado
de representatividad, población infinita
para extraer una base para la inducción con/sin reposición
muestra de una
población Aleatorio
sistemático
No probabilístico:
seleccionada en Aleatorio
función de criterio del estratificado
investigador,
accesibilidad, Aleatorio por
comodidad, coste… conglomerados

7
7/9/18

Resumiendo: ¿Cuáles de las siguientes


muestras son el resultado de un muestreo
probabilístico?

A. Los primeros 500 pacientes en recibir un tratamiento psicológico


B. Los pacientes con número de expediente par.
C. Elegido un número de expediente al azar, los 500 siguientes tomados de 4 en
cuatro.
D. 500 pacientes elegidos mediante un sorteo con bolas que recogen su número de
expediente.

n Encuales de las muestras anteriores, podemos conocer a priori la probabilidad de que


un paciente forme parte del estudio:

A. En todos.
B. En el B, C, y D.
C. En C y el D.

n Cuáles de las siguientes afirmaciones son correctas.


A. El mejor procedimiento de muestreo sería B
B. Los muestreos B y D ofrecen garantías de aleatoriedad.
C. El sistema C ofrece garantías de aleatoriedad mayores que el B y que el D.
D. Todas son incorrectas

Ejercicios: Primera parte ejemplo 1.1 p. 49

n Consideremos una población formada por N = 5 puntuaciones: P = {1, 2, 3, 4, 5}.


Extraigamos de ella, con reposición muestras aleatorias de tamaño n = 2.

8
7/9/18

Muestreo aleatorio en
población finita
Aleatorio CON reposición (pobl. finita) o muestreo
aleatorio simple

vCada elemento seleccionado es devuelto a la población antes de la siguiente extracción.

Resultados posibles 2ª extracción


Resultados posibles 1ª extracción

1 2 3 4 5

1 1, 1 1, 2 1, 3 1, 4 1, 5

2 2, 1 2, 2 2, 3 2, 4 2, 5

3 3, 1 3, 2 3, 3 3, 4 3,5

4 4, 1 4, 2 4, 3 4, 4 4, 5

5 5, 1 5, 2 5, 3 5, 4 5, 5

Muestreo aleatorio en
población finita
Aleatorio CON reposición (pobl. finita) o muestreo aleatorio simple

vCada elemento de los n que componen la muestra puede ser definido como una variable aleatoria
(valor que toma la variable X en la extracción i).

X1 = valor del nº 1ª Extracción X2 = valor del nº 2ª Extracción


x1i f (x1i) x2i f (x2i)
1 1/5 1 1/5
2 1/5 2 1/5
3 1/5 3 1/5
4 1/5 4 1/5
5 1/5 5 1/5

v La probabilidad de que un elemento sea elegido es siempre 1/N (N=tamaño de población).


Igualdad de funciones de probabilidad individuales de las variables aleatorias X1, X2 …,Xn
f1(x1)= f2(x2)=…= fn(xn)= f(x)

9
7/9/18

Muestreo aleatorio en
población finita
Aleatorio CON reposición (pobl. finita) o muestreo aleatorio simple

vEl resultado de cada extracción es independiente del resultado de las restantes extracciones.

Ejemplo:
P (x2i/x1i) = P (x2i) P (x2i = 2/x1i =1 ) = 1/5
P (x2i =2) = 1/5

vFunción de probabilidad conjunta de las variables aleatorias X1, X2 …,Xn es:

f(x1,x2,…,xn) = f1(x1) f2(x2)…fn(xn)

P (x1 x2 xn) = P (x1) · P(x2) · P(xn)

Ejemplo:

P (1 2 5) = 1/5 · 1/5 · 1/5

Muestreo aleatorio en
población finita
Aleatorio CON reposición (pobl. finita) o muestreo aleatorio simple

n
vNúmero posible de muestras diferentes es VR N =N
n

1 2 3 4 5

1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

n
vProbabilidad de obtener una muestra concreta es 1/ N

10
7/9/18

Muestreo aleatorio en
población finita
Aleatorio CON reposición (pobl. finita) o muestreo aleatorio simple

Una muestra tamaño n obtenida a partir de un muestreo con reposición en una población finita
puede definirse como:
vSecuencia de variables aleatorias (resultado obtenido en la n extracción)
v igualmente distribuidas [f(x1i)= f2 (x2i)=…= fn(xni)= f(x)] e
v independientes [f(x1i,x2i,…,xni) = f(x1i) f(x2i)…f(xni) ]

X2 f2 (x2)

1 2 3 4 5

1 1/25 1/25 1/25 1/25 1/25 1/5

2 1/25 1/25 1/25 1/25 1/25 1/5


X1
3 1/25 1/25 1/25 1/25 1/25 1/5

4 1/25 1/25 1/25 1/25 1/25 1/5

5 1/25 1/25 1/25 1/25 1/25 1/5

f2 (x2) 1/5 1/5 1/5 1/5 1/5 1

Muestreo aleatorio en
población finita
Muestreo aleatorio: Todos los elementos de la población tienen la misma probabilidad de
formar parte de la muestra, es decir, de ser elegidos. La extracción de elementos poblacionales
se hace al AZAR.

Muestreo aleatorio: proceso que garantiza que


todas las muestras posibles de tamaño n tienen la
misma probabilidad de ser seleccionadas

Aleatorio CON reposición


n
1/ N

Aleatorio SIN reposición

1/(N-n)!/N!

11
7/9/18

• Ejercicio (p. 51-52):


Población N = 10.
4 varones y 6 mujeres.
n = 2 con reposición

• ¿Cuántas muestras distintas podemos obtener, teniendo en cuenta el número de V y M y el


orden en el que aparecen?

1ª Extracción 2ª Extracción Nº de muestras


V V (4) · (4) = 16
V M (4)· (6) = 24
M V (6) · (4) =36
M N (6) · (6) = 36
100
• ¿De cuántas formas distintas podemos obtener cada una de las muestras anteriores?

V1 V2 V3 V4

V1 V2 V3 V4 V1 V2 V3 V4 V1 V2 V3 V4 V1 V2 V3 V4

• Ejercicio (p. 51-52):


Población N = 10.
4 varones y 6 mujeres.
n = 2 con reposición

• Si definimos la variable x1 como sexo de la persona extraída en primer lugar y x2 como sexo
de la persona extraída en segundo lugar ¿Cuáles son sus funciones de distribución? ¿ Cuál es
su función de distribución conjunta?

x1
V M f2(x2)
x2 V 16/100 24/100 4/10

M 24/100 36/100 6/10

f1(x1) 4/10 6/10 1

12
7/9/18

Muestreo aleatorio en población infinita


(muestreo aleatorio simple o muestreo
aleatorio)

Dos características:
q Número infinito de elementos poblacionales
q Número infinito de muestras posibles de cualquier tamaño

Propiedades

Las funciones de densidad de probabilidad individuales de X1, X2 …,Xn serán


iguales (igualdad de distribuciones)

f1(x1)= f2(x2)=…= fn(xn)= f(x)

La función de densidad de probabilidad conjunta de las variables X1, X2


…,Xn será igual al producto de sus funciones de probabilidad individuales
(independencia)

f(x1,x2,…,xn) = f1(x1) f2(x2)…fn(xn)

Resumen de propiedades
Muestreo Igualdad Independencia de
distribuciones las variables
función probabilidad aleatorias en
individual términos de
probabilidad
Aleatorio CON
reposición (pobl.
Sí Sí
finita)
Aleatorio SIN
reposición (pobl.
Sí No
Finita)
Aleatorio en pobl.
infinita
Sí Sí

Aleatorio simple o Muestreo


aleatorio

13
7/9/18

Distribuciones muestrales:
concepto
Distribución poblacional: función que asigna a cada valor de una variable la
probabilidad de que extraído un único caso dicha variable tome ese valor.

Distribución muestra de un estadístico: función que determina la probabilidad de


que extraídos de la población un número de casos n (muestra) el estadístico
para esa muestra tome un valor concreto.

Distribuciones muestrales:
concepto
Si de un saco con 1000 bolas, extraemos 50 de las que 25 son blancas y 25 son
negras.

¿De cuantos colores distintos son las bolas contenidas en el saco?

Si sacamos 10 bolas 9 son negras y 1 blanca:


¿Dirías que hay el mismo número de bolas negras que blancas?

Si seleccionamos 50 alumnos, medimos el número de horas de deporte que


hacen y obtenemos una media de 7 horas 47 minutos semanales:

¿Dirías que la población de alumnos es sedentaria?

Si la varianza de la muestra fuera de de 3 horas 20 minutos:

¿Dirías que en general todos los alumnos tienen un nivel aceptable de actividad
física?

14
7/9/18

Distribuciones muestrales:
concepto
Inferencia estadística: va de lo concreto a lo
general à conocer parámetros a partir de
estadísticos

Se basa en el conocimiento de la variabilidad


mostrada por un estadístico de una muestra a otra
(cómo el estadístico se comporta en diferentes
muestras de la población)

Distribución muestral
• Función de probabilidad (o de densidad de probabilidad) de un estadístico

• Es una distribución teórica que asigna una probabilidad concreta a cada uno de los
valores que puede tomar un estadístico en todas las muestras del mismo tamaño
que es posible extraer de una determinada población.
• Es un concepto fundamental para el contraste de hipótesis

Distribuciones muestrales:
concepto
Si de un saco con 1000 bolas, extraemos 50 de las que 25 son blancas y 25 son
negras.

¿De cuantos colores distintos son las bolas contenidas en el saco?

Si sacamos 10 bolas 9 son negras y 1 blanca:


¿Dirías que hay el mismo número de bolas negras que blancas?

Si seleccionamos 5 alumnos, medimos el número de horas de deporte que hacen


y obtenemos una media de 7 horas 47 minutos semanales:

¿Dirías que la población de alumnos es sedentaria?

15
7/9/18

Ejemplo distribución
muestral: N=5; n=2

Muestras n= 2 posibles a
partir de la población

Valor de la media para las


distintas muestras n =2
posibles

Distribución muestral de las


medias de tamaño n = 2
extraídas de la población (N =5)

Distribuciones muestrales.

Cuando la población es infinita o muy grande no es posible extraer todas las


muestras para determinar su distribución de probabilidad. Podemos:

• muestrear las muestras.

• Calcular por procedimiento matemáticos las principales características de


la función de probabilidad (forma, esperanza, desviación típica).

16
7/9/18

Distribuciones muestrales
Los estadísticos son variables aleatorias:

• Su valor varía entre las distintas muestras.

• Su valor no puede ser predicho con certeza antes de extraer la


muestra.

• Tienen una función de probabilidad asociada

Como cualquier función de distribución, la función de probabilidad de un


estadístico (H) puede ser caracterizada a partir de:

• Su valor esperado o media:


E(H) = Σ H f(h)

• Su varianza:
σ2H = E(H2) - [E(H)] 2

Distribuciones muestrales
xi f(xi) xi f(xi) xi2 f(xi)

1,0 1/25 0,04 0,04

1,5 2/25 0,12 0,18

2,0 3/25 0,24 0,48

2,5 4/25 0,4 1

3,0 5/25 0,6 1,8

3,5 4/25 0,56 1,96

4,0 3/25 0,48 1,92

4,5 2/25 0,36 1,62

5,0 1/25 0,2 1

E(xi)= 3 E(xi2)= 10

σ2xi = E(xi2) - [E(xi)] 2


σ2xi = 10 – 32 ; σ2xi =1

17
7/9/18

Distribuciones muestrales
• Cuando caracterizamos la distribución muestral de un estadístico, nos referimos
habitualmente a la desviación típica de la distribución muestral (σh) y no a la
varianza (σh2).

• La desviación típica de la distribución muestral del estadístico se denomina el


error típico al representar el promedio de los que las medias muestrales se
alejan de la media poblacional.

Distribuciones muestral:
• Los estadísticos son combinaciones lineales de variables aleatorias.

• Una combinación de variables aleatorias es otra variable aleatoria

X= K1 X1 +K2 X2 +…..+K n Xn

• Si las variables que la componen son independientes entre sí y se distribuyen


igualmente:

• Mismo valor esperado: E(X1)=E(X2)=E(Xn)=µ.


• Misma varianza: σ2x1=σ2x2=σ2xn=σ2

• Entonces la variable aleatoria será una variable con la misma distribución (p. ej.
normal) que las variables que la compone con:

• Valor esperado E(X)= Σ Ki E(Xi)


• Varianza: σ2x=Σ Ki2 σ2xi

18
7/9/18

Distribución muestral de la
media

Distribución muestral de la
media

19
7/9/18

Distribuciones muestral de la
media
La distribución muestral de la media es normal N (µ,s/ n), independientemente de
n, cuando son normales las distribuciones de las variables X1, X2 …,Xn de las que se
obtiene la media

Tiende a la normal N (µ,s/ n ),independientemente de la distribución de X1, X2 …,Xn


a medida que n va aumentando

Distribuciones muestral de la
media
Si la distribución muestral de la media se distribuye conforme a la normal, podremos
tipificar el valor de la media en una muestra concreta y, a través de la distribución normal
unitaria [N (0,1)]determinar la probabilidad de que para un determinado valor esperado en
la población se verifique el valor de la media__ hallado para nuestra muestra. En estas
circunstancias, la variable tipificada X-µ
Z= s n

Observación: cuando el tamaño de la muestra tiende a infinito, el error típico de la media (o


__
su cuadrado, la varianza) va tendiendo a cero à los posibles valores que podrá tomar la ( X)
se parecerán más a la media de la población (µ).

20
7/9/18

Distribuciones muestral de la
media
Ejemplo 1.3: Una población de estudiantes de psicología se distribuye N (100, 15) en una escala
de inteligencia espacial. Extraemos una muestra n= 100.
1. ¿Cuál es la probabilidad de extraer una media de 103 o mayor?
2. ¿Cuál es la probabilidad de obtener una media comprendida entre 98 y 102? (p. 69)

Dado que la muestra es grande la distribución muestral de la media se aproximará a la normal.


Por tanto:

0,9772
1- 0,9772 = 0,0228

Z=2

Distribuciones muestral de la
media
Ejemplo 1.3: Una población de estudiantes de psicología se distribuye N (100, 15) en una escala
de inteligencia espacial. Extraemos una muestra n= 100.
1. ¿Cuál es la probabilidad de extraer una media de 103 o mayor?
2. ¿Cuál es la probabilidad de obtener una media comprendida entre 98 y 102? (p. 69)

0,8164 0,0918
0,0918

Z = -1,33 Z = 1,33

21
7/9/18

Distribución muestral de la media con varianza


poblacional desconocida: modelo de probabilidad t
de Student
En el caso de que la variable estudiada se distribuye normalmente, pero
desconocemos s y la muestra no es muy grande podemos hacer una
trasformación de la media tipificada, dividiéndola por una variable que se distribuye
según chi cuadrado:

Obteniendo en una variable que se distribuye según tn-1 (cociente entre una variable
normal tipificada y otro que se distribuye según chi cuadrado dividida por sus grados
de libertad):

__
X-µ
T=
S n -1
n

Distribución muestral de la varianza


La varianza es un indicador de las dispersión de las puntuaciones entorno a la media.
Puede se medida de dos maneras principales.

Varianza sesgada Varianza insesgada

Si extraemos todas las muestras posibles de tamaño n y calculamos su varianza,


obtendremos la distribución muestral de la varianza (igual que en el caso de la
media).
También podemos deducir matemáticamente la función de distribución a la que se
ajusta la varianza, sin necesidad de extraer infinitas muestra.

22
7/9/18

Distribución muestral de la varianza


Podemos descomponer la varianza, en la distancia de las puntuaciones a la media de
la muestra más la distancia de la media de la muestra a la media poblacional.

Si lo elevamos al cuadrado:

Lo sumamos para todas las puntuaciones:

Distribución muestral de la varianza


Desarrollando:

Obtenemos

(A) (B) (C) (D)


donde:

D = 0

23
7/9/18

Distribución muestral de la varianza


Dado que B se basa en la varianza C en la media y que la varianza y la media de una distribución
normal son independientes y, teniendo en cuenta la propiedad aditiva de chi-cuadrado:

A=B+C
Despejando:

A medida que aumenta el tamaño muestral, la distribución muestral de la varianza se aproxima a


la norma, según la siguiente variable

24

También podría gustarte