Está en la página 1de 78

INTRODUCCION AL ANÁLISIS DE DATOS

TEMA 1. CONCEPTOS BÁSICOS


POBLACIÓN, COLECTIVO O UNIVERSO: CONJUNTO DE PERSONAS O COSAS AL QUE SE
REFIERE EL OBJETO DE LA INVESTIGACIÓN.
MUESTRA: SUBCONJUNTO REPRESENTATIVO DE UNA POBLACIÓN.
PARÁMETRO: VALOR NUMÉRICO QUE DESCRIBE UNA CARACTERÍSTICA DE LA POBLACIÓN.
ESTADÍSTICO: VALOR NUMÉRICO QUE DESCRIBE UNA CARACTERÍSTICA DE LA MUESTRA.
VARIABLE CUALITATIVA: SON LAS VARIABLES QUE EXPRESAN DISTINTAS CUALIDADES,
CARACTERÍSTICAS O MODALIDAD. CADA MODALIDAD QUE SE PRESENTA SE DENOMINA
ATRIBUTO O CATEGORÍA, Y LA MEDICIÓN CONSISTE EN UNA CLASIFICACIÓN DE DICHOS
ATRIBUTOS. LAS VARIABLES CUALITATIVAS PUEDEN SER DICOTÓMICAS CUANDO SÓLO
PUEDEN TOMAR DOS VALORES POSIBLES, COMO SÍ Y NO, HOMBRE Y MUJER O SER
POLITÓMICAS CUANDO PUEDEN ADQUIRIR TRES O MÁS VALORES. DENTRO DE ELLAS
PODEMOS DISTINGUIR:
1. VARIABLE CUALITATIVA ORDINAL O VARIABLE CUASICUANTITATIVA: LA VARIABLE PUEDE
TOMAR DISTINTOS VALORES ORDENADOS SIGUIENDO UNA ESCALA ESTABLECIDA,
AUNQUE NO ES NECESARIO QUE EL INTERVALO ENTRE MEDICIONES SEA UNIFORME, POR
EJEMPLO: LEVE, MODERADO, FUERTE.
2. VARIABLE CUALITATIVA NOMINAL: EN ESTA VARIABLE LOS VALORES NO PUEDEN SER
SOMETIDOS A UN CRITERIO DE ORDEN, COMO POR EJEMPLO LOS COLORES.
VARIABLES CUANTITATIVAS: SON LAS VARIABLES QUE TOMAN COMO ARGUMENTO,
CANTIDADES NUMÉRICAS, SON VARIABLES MATEMÁTICAS. LAS VARIABLES CUANTITATIVAS
ADEMÁS PUEDEN SER:
DISCRETAS: NO INCLUYE DECIMALES (NUMERO DE HIJOS, AVIONES QUE
ATERRIZAN EN UN AEROPUERTO)
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 1. CONCEPTOS BÁSICOS
CONTINUAS: ADMITE DECIMALES (ALTURA, PESO, TEMPERATURA, NOTAS
ACADÉMICAS ETC)
ESCALAS DE MEDIDA: ASIGNAN NUMEROS A OBJETOS O CARARCTERÍSTICAS,
SEGÚN CIERTAS REGLAS.
ESCALA NOMINAL: SÓLO PERMITE ASIGNAR UN NOMBRE AL ELEMENTO MEDIDO. ESTO
LA CONVIERTE EN LA MENOS INFORMATIVA DE LAS ESCALAS DE MEDICIÓN.
LOS SIGUIENTES SON EJEMPLOS DE VARIABLES CON ESTE TIPO DE ESCALA:
NACIONALIDAD.
NÚMERO DE CAMISETA EN UN EQUIPO DE FÚTBOL.
NÚMERO DE DNI.
A PESAR DE QUE ALGUNOS VALORES SON FORMALMENTE NUMÉRICOS, SÓLO ESTÁN
SIENDO USADOS PARA IDENTIFICAR A LOS INDIVIDUOS MEDIDOS.
ESCALA ORDINAL: ADEMÁS DE LAS PROPIEDADES DE LA ESCALA NOMINAL, PERMITE
ESTABLECER UN ORDEN ENTRE LOS ELEMENTOS MEDIDOS.
EJEMPLOS DE VARIABLES CON ESCALA ORDINAL:
PREFERENCIA A PRODUCTOS DE CONSUMO.
ETAPA DE DESARROLLO DE UN SER VIVO.
CLASIFICACIÓN DE PELÍCULAS POR UNA COMISIÓN ESPECIALIZADA.
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 1. CONCEPTOS BÁSICOS
MADUREZ DE UNA FRUTA AL MOMENTO DE COMPRARLA.
ESCALA DE INTERVALO: ADEMÁS DE TODAS LAS PROPIEDADES DE LA ESCALA ORDINAL,
HACE QUE TENGA SENTIDO CALCULAR DIFERENCIAS ENTRE LAS MEDICIONES.
LOS SIGUIENTES SON EJEMPLOS DE VARIABLES CON ESTA ESCALA:
TEMPERATURA DE UNA PERSONA.
UBICACIÓN EN UNA CARRETERA RESPECTO DE UN PUNTO DE REFERENCIA
(KILÓMETRO 85 RUTA 5).
SOBREPESO RESPECTO DE UN PATRÓN DE COMPARACIÓN.
NIVEL DE ACEITE EN EL MOTOR DE UN AUTOMÓVIL MEDIDO CON UNA VARA
GRADUADA.
ESCALA DE RAZÓN: CUANDO UNA ESCALA TIENE TODAS LAS CARACTERÍSTICAS DE UNA
ESCALA DE INTERVALO Y ADEMÁS UN PUNTO CERO REAL EN SU ORIGEN
EJEMPLO: SUPONGA QUE EL PESO DE CUATRO PIEZAS FUNDIDAS DE METAL SON 2.0, 2.1, 2.3
Y 2.5 KG. EL ORDEN (ORDINAL) Y LA DIFERENCIA (INTERVALO) EN LOS PESOS PUEDE SER
COMPARADO. ASÍ, EL INCREMENTO DE PESO DE 2.0 A 2.1 ES DE 0.1 KG, EL CUAL ES EL MISMO
QUE EL QUE EXISTE ENTRE 2.3 Y 2.4 KG. TAMBIEN, CUANDO COMPARAMOS LOS PESOS DE 2.0 A
2.4 KG, SE ENCUENTRA UNA RAZÓN SIGNIFICATIVA: EL PESO DE UNA PIEZA DE METAL DE 2.4
KG ES UN 20% MÁS PESADA QUE UNA QUE PESE 2.0 KG. EXISTE UN CERO NATURAL O REAL
PARA LA ESCALA, ASÍ 0KG IMPLICA NO PESO.
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 1. CONCEPTOS BÁSICOS
DISTRIBUCION DE FRECUENCIAS
PRÁCTICA COMÚN DE ORGANIZACIÓN DE LOS DATOS REGISTRADOS QUE PERMITE AGRUPAR
DE MANERA ORDENADA, ASCENDENTE O DESCENDENTE, UNA GRAN MASA DE DATOS.
1. FRECUENCIA ABSOLUTA (nI) → Nº DE OBSERVACIONES EN CADA CATEGORÍA
2. FRECUENCIA RELATIVA O PROPORCIÓN (pI) → SE OBTIENE DIVIDIENDO LA FRECUENCIA
ABSOLUTA ENTRE EL Nº TOTAL DE OBSERVACIONES (N).
SE PUEDE EXPRESAR EN PORCENTAJE (pI): SE MULTIPLICA CADA UNA DE LAS
PROPORCIONES POR 100.
3. FRECUENCIA ABSOLUTA ACUMULADA (nA) → ACUMULAR (SUMAR), DESDE LA CATEGORÍA DE
MENOR VALOR DE LA VARIABLE A LA DE MAYOR VALOR LAS FRECUENCIAS ABSOLUTAS.
4. FRECUENCIA RELATIVA ACUMULADA O PROPORCIÓN ACUMULADA (PA) → ID.. LAS
PROPORCIONES. ES EL COCIENTE ENTRE LA FRECUENCIA ABSOLUTA ACUMULADA Y EL TOTAL
DE OBSERVACIONES.
SE PUEDE EXPRESAR EN PORCENTAJE ACUMULADO (PA): ID.. LOS PORCENTAJES. ES EL
VALOR DE LA PROPORCIÓN ACUMULADA POR 100.
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 1. CONCEPTOS BÁSICOS
Frecuencia Frecuencia
DATOS VARIABLE Frecuencia absoluta Frecuencia relativa Relativa
ESTUDIO absoluta acumulada acumulada
1 3 3 3/14 0,21428571 0,21428571
2 4 7 4/14 0,28571429 0,5
3 1 8 1/14 0,07142857 0,57142857
4 2 10 2/14 0,14285714 0,71428571
5 1 11 1/14 0,07142857 0,78571429
6 3 14 3/14 0,21428571 1
14 1
- LA DISTRIBUCIÓN DE FRECUENCIAS DE LOS VALORES DE UNA VARIABLE CONTINUA DEBE
REALIZARSE TENIENDO EN CUENTA LOS LÍMITES EXACTOS DE MEDIDA, NO LOS VALORES
INFORMADOS.
LÍMITES EXACTOS = VALOR INFORMADO 0,5
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 1. CONCEPTOS BÁSICOS
- NO NECESARIAMENTE LOS INTERVALOS DEBEN TENER LA MISMA AMPLITUD (LIMITE
SUPERIOR-LIMITE INFERIOR +1) NI LOS INTERVALOS EXTREMOS DE LA DISTRIBUCIÓN
DEBEN ESTAR CERRADOS
LA ESTATURA EN CM DE 100 NIÑOS SE RECOGE EN LA SIGUIENTE TABLA:
ESTATURA NUMERO DE NIÑOS
79-81 10
76-78 25
73-75 45
72-70 20
FREC.
FRECUENCIAS RELATIVAS
FRECUENCIAS ABSOLUTAS FREC. RELATIVAS
ESTATURA ABSOLUTAS ACUMULADAS ACUMULADAS
69,5-72,5 20 20 20/100 0,2 0,2
72,5-75,5 45 65 45/100 0,45 0,65
75,5-78,5 25 90 25/100 0,25 0,9
78,5-81,5 10 100 10/100 0,1 1
100 1
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 1. CONCEPTOS BÁSICOS
REPRESENTACIONES GRAFICAS
PARA VARIABLES CATEGÓRICAS O ATRIBUTOS, COMO EL SEXO, PROFESIÓN, ETC., SE QUIERE
CONOCER LA FRECUENCIA Y EL PORCENTAJE DEL TOTAL DE CASOS QUE "CAEN" EN CADA
CATEGORÍA.
UNA FORMA MUY SENCILLA DE REPRESENTAR GRÁFICAMENTE ESTOS RESULTADOS ES
MEDIANTE DIAGRAMAS DE BARRAS O DIAGRAMAS DE SECTORES.
EN LOS GRÁFICOS DE SECTORES, TAMBIÉN CONOCIDOS COMO DIAGRAMAS DE "TARTAS", SE
DIVIDE UN CÍRCULO EN TANTAS PORCIONES COMO CLASES TENGA LA VARIABLE, DE MODO
QUE A CADA CLASE LE CORRESPONDE UN ARCO DE CÍRCULO PROPORCIONAL A SU
FRECUENCIA ABSOLUTA O RELATIVA.
100; 22%
150; 33%
ALEMAN
BRITANICO
NORDICOS
200; 45%
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 1. CONCEPTOS BÁSICOS
LOS DIAGRAMAS DE BARRAS SON SIMILARES A LOS GRÁFICOS DE SECTORES.
SE REPRESENTAN TANTAS BARRAS COMO CATEGORÍAS TIENE LA VARIABLE, DE MODO QUE LA
ALTURA DE CADA UNA DE ELLAS SEA PROPORCIONAL A LA FRECUENCIA O PORCENTAJE DE
CASOS EN CADA CLASE.
2
1
NUMERO
DE HIJOS
0 2 4 6 8
ESTOS MISMOS GRÁFICOS PUEDEN UTILIZARSE TAMBIÉN PARA DESCRIBIR VARIABLES
NUMÉRICAS DISCRETAS QUE TOMAN POCOS VALORES (NÚMERO DE HIJOS, ETC.).
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 1. CONCEPTOS BÁSICOS
PARA VARIABLES NUMÉRICAS CONTINUAS, TALES COMO LA EDAD, LA TENSIÓN ARTERIAL O EL
ÍNDICE DE MASA CORPORAL, EL TIPO DE GRÁFICO MÁS UTILIZADO ES EL HISTOGRAMA
12
F
R 10
A
E B
C S 8
U O
L 6
E
N U
4
C T
I A
2
A S
S
0
20-25 25-30 30-40 40-50
PESOS
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 1. CONCEPTOS BÁSICOS
EJEMPLOS:
COMPLETA LA TABLA DE FRECUENCIAS CON LOS DATOS QUE PROPORCIONA LA SIGUIENTE GRÁFICA
7
6
5
4
FAMILIAS

3
2
1
0
1 2 3 4
NUMERO DE HIJOS
FAMILIAS FRECUENCIAS FRECUENCIAS
NUMERO DE (FRECUENCIAS ABSOLUTAS FRECUENCIAS RELATIVAS
HIJOS ABSOLUTAS) ACUMULADAS RELATIVAS ACUMULADAS
1 5 5 0,4 0,4
2 6 11 0,4 0,8
3 2 13 0,1 0,9
4 1 14 0,1 1
14 1,0
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 1. CONCEPTOS BÁSICOS
PROPIEDADES DE LA DISTRIBUCIÓN DE FRECUENCIAS
TENDENCIA CENTRAL: LUGAR DONDE SE CENTRA LA DISTRIBUCIÓN
ASIMETRIA: GRADO EN EL QUE LOS DATOS SE REPARTEN EN FUNCIÓN DE LA TENDENCIA
CENTRAL
VARIABILIDAD: CÓMO SE CONCENTRAN EL RESTO DE LAS OBSERVACIONES DE LA
DISTRIBUCIÓN EN TORNO AL PROMEDIO O TENDENCIA CENTRAL.
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 1. CONCEPTOS BÁSICOS
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN
LA MEDIDAS DE CENTRALIZACIÓN NOS INDICAN EN TORNO A QUÉ VALOR (CENTRO) SE
DISTRIBUYEN LOS DATOS.
1. MEDIA ARTIMÉTICA
BUSCA SER EL CENTRO DE GRAVEDAD DE LA DISTRIBUCIÓN.
ES LA SUMA DE LOS VALORES DE LA DISTRIBUCIÓN, DIVIDIDO POR LA FRECUENCIA TOTAL.
n
n
Xi X i ni
i 1 i 1
X X
N N
EJEMPLO:
SE HA PREGUNTADO A 50 FAMILIAS EL NÚMERO DE HIJOS QUE TENIA. LOS DATOS SE
RECOGEN EN LA SIGUIENTE TABLA. CUÁL ES EL NÚMERO MEDIO DE HIJOS?
Nº HIJOS (X) ni
0 20
1 15
2 10
3 3
4 2
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN
X ni X·ni
0 20 0
1 15 15
n
2 10 20 Xin
i 1 52
3 3 9 X 1,04
4 2 8 N 50
50 52
CON LOS SIGUIENTES DATOS AGRUPADOS, CALCULAR LA MEDIA ARITMÉTICA
X ni
1-5 2 AL TRABAJAR CON DATOS AGRUPADOS, ES NECESARIO CALCULAR LA MARCAS DE
6-8 3 CLASE
9-11 2
12-18 3
10 LimiteSUPERIOR Limiteinf erior
X
2
X ni X X·ni n
1-5 2 6/2=3 6 Xin
6-8 3 14/2=7 21 i 1 92
X 9,2
9-11 2
12-18 3
20/2=10 20
30/2=15 45
N 10
10 92
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN
PROPIEDADES
LA SUMA DE LAS DESVIACIONES DE LOS VALORES CON RESPECTO A LA MEDIA ES
SIEMPRE CERO.
AL APLICAR UNA TRANSFORMACION LINEAL DEL TIPO Y=Bx+a (ESO SIGNIFICA UN CAMBIO
DE ORIGEN Y ESCALA) LA MEDIA DE LA NUEVA VARIABLE SE VERÁ AFECTADA POR ESE
CAMBIO DE LA SIGUIENTE FORMA Y bX a
NO SE PUEDE CALCULAR CUANDO LA DISTRIBUCIÓN ESTÁ AGRUPADA EN INTERVALOS Y
TANTO EL INTERVALO MÍNIMO O MÁXIMO NO TIENEN LOS LÍMITES DEFINIDOS (YA QUE NO
PODEMOS CALCULAR LAS MARCAR DE CLASE.
CON EL EJEMPLO ANTERIOR:
n
( X i X )ni (3 9,2)·2 (7 9,2)·3 (10 9,2)·2 (15 9,2)·3 ( 6,2)·2 ( 2,2)·3 0,8·2 5,8·3
i 1
0
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN
SABIENDO QUE LA MEDIA DE UNA DISTRIBUCIÓN ES 5,2, SI APLICAMOS UN CAMBIO DE
ORIGEN DE a=5 UNIDADES Y UN CAMBIO DE ESCALA DE b=2, CUÁL SERÁ LA MEDIA DE LA
NUEVA VARIABLE?
Y bX a
Y 2·(5,2) 5 15,4
2. MEDIANA
LA MEDIANA ES EL VALOR QUE DIVIDE EXACTAMENTE EN DOS A LA DISTRIBUCIÓN, ES DECIR
DEJA EL 50% DE LOS DATOS A UN LADO Y EL 50% RESTANTE AL OTRO.
SI LOS DATOS NO ESTÁN ORDENADOS, ES NECESARIO ORDENARLOS DE MENOR A MAYOR.
CALCULAR LA MEDIANA CON LAS SIGUIENTES DISTRIBUCIONES
20 10 3 5 18
SE ORDENAN LOS DATOS 3 5 10 18 20
EN ESTE CASO COMO TENEMOS UN NÚMERO IMPAR DE DATOS, LA MEDIANA SERÁ EL VALOR
CENTRAL 3 5 10 18 20 Md = 10
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN
20 10 3 5
ORDENAMOS LOS DATOS 3 5 10 20
EN ESTE CASO COMO TENEMOS UN NÚMERO PAR DE DATOS, TOMAMOS LOS DOS DATOS
CENTRALES 3 5 10 20 Y CALCULAMOS UNA MEDIA ENTRE ESOS DOS DATOS.
Md 5 10 7,5
2
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN
X LIMITES ni na
EXACTOS INVERTIMOS EL ORDEN DE LA TABLA
1-5 0,5-5,5 2 2
6-8 5,5-8,5 3 5
HACEMOS
N 5 Y AHORA BUSCAMOS ESE VALOR EN LA COLUMNA
9-11 8,5-11,5 2 7
12-18 11,5-18,5 3 10
2
10 DE FRECUENCIA ABSOLUTAS ACUMULADAS (EL VALOR QUE IGUALA
O SUPERE)
X ni na EL INTERVALO CRÍTICO, ES DECIR DONDE SE ENCUENTRA LA MEDIANA ES EL
11,5-18,5 3 10 5,5- 8,5
8,5-11,5 2 7 N n
5,5-8,5 3 5 2 d
0,5-5,5 2 2 AHORA APLICAMOS LA FÓRMULA M d LINF ·I
n
C
10
M d 5,5 5 2 (8 6 1) 8,5
3
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN
X ni na N 12 6
11,5-18,5 3 12 2 2
8,5-11,5 4 7 BUSCAMOS EL 6 EN LA COLUMNA DE FRECUENCIAS ABSOLUTAS ACUMULADAS
5,5-8,5 3 4 (COMO NO ENCONTRAMOS EL 6, BUSCAMOS EL PRIMER VALOR QUE LO SUPERE,
0,5-5,5 2 2
EN ESTE CASO EL 7)
12
EL INTERVALO CRÍTICO SERÁ EL 8,5 - 11,5
12 4
M d 8,5 2 (11 9 1) 8,5 2·3 10
4 4
3. MODA
ES AQUEL VALOR QUE MÁS VECES SE REPITE, EL QUE MAYOR FRECUENCIA ABSOLUTA TIENE.
SE PUEDE CALCULAR CON CUALQUIER TIPO DE VARIABLE.
X nI
ROJO 5
BLANCO 7
AMARILLO 10
MO AMARILLO
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN
X nI
1 2 MO 2
2 5
3 4
CALCULAR LA MODA CON DATOS AGRUPADOS
X LIMITES ni
EXACTOS
1-5 0,5-5,5 2 BUSCAMOS EL INTERVALO QUE MÁS SE REPITE. EN ESTE CASO
6-8 5,5-8,5 3 TENEMOS DOS, POR LO TANTO ESTAMOS ANTE UNA DISTRIBUCIO´N
9-11 8,5-11,5 2
BIMODAL.
12-18 11,5-18,5 3
TENEMOS QUE CALCULAR DOS MODAS
10
E
EL PRIMER INTERVALO CRÍTICO ES 5,5 -8,5, EL VALOR DE LA MODA ES EL PUNTO MEDIO
M O 5,5 8,5 14 7
2 2
EL SEGUNDO INTERVALO ES EL 11,5 – 18,5
M O 11,5 18,5 30 15
2 2
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN
MEDIDAS DE POSICIÓN (NO CENTRAL)
NOS INDICAN LA POSICIÓN DE UN SUJETO RESPECTO A SU GRUPO DE REFERENCIA
SE LLAMAN CUANTILES. DENTRO DE LOS CUANTILES ENCONTRAMOS CUARTILES, DECILES Y
PERCENTILES.
CUARTILES
SON TRES VALORES QUE DIVIDEN EN CUATRO UNA DISTRIBUCIÓN
n·k
4
DECILES
SON NUEVE VALORES QUE DIVIDEN EN DIEZ UNA DISTRIBUCIÓN
n·k
10
PERCENTILES
SON NOVENTA Y NUEVE VALORES QUE DIVIDEN EN CIEN UNA DISTRIBUCIÓN
n·k
100
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN
CALCULAR EL PRIMER CUARTIL, SEPTIMO DECIL Y PERCENTIL 72
X LIMITES nI na
EXACTOS 15 1
3,75
18-20 17,5-20,5 2 15 PRIMER CUARTIL 4
15-17 14,5-17,5 4 13 EL INTERVALO CRITICO ES (5,5 -9,5)
10-14 9,5- 14,5 3 9
6-9 5,5-9,5 4 6 n·k n
2-5 1,5-5,5 2 2 Q1 LINF 4 d
·I 5,5 3,75 2·(9 6 1) 7,25
15 nc 4
SEPTIMO DECIL
15 7 10,5 EL INTERVALO CRÍTICO ES (14,5 -17,5)
10
n·k n
D7 LINF 10 d · I 14,5 10,5 9·(17 15 1) 15,625
nC 4
15·72 10,8
PERCENTIL 72 EL INTERVALO CRÍTICO ES (14,5- 17,5)
100
n·k n
P72 LINF 100 d · I 14,5 10,8 9·(17 15 1) 15,85
nC 4
INTRODUCCION AL ANÁLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN
TAMBIÉN PODEMOS CALCULAR EL VALOR DEL PERCENTIL, CONOCIENDO EL VALOR DE LA
PUNTUACIÓN.
SI SABEMOS QUE LA PUNTUACIÓN ES 12, QUÉ PERCENTIL LE CORRESPONDE
X LIMITES nI na EL VALOR X=12, SE ENCUENTRA EN EL INTERVALO (9,5 – 14,5)
EXACTOS
18-20 17,5-20,5 2 15
15-17 14,5-17,5 4 13 ( Pk LINF )·nC 12 9,5 ·3
9,5- 14,5 3 9 nd 6
10-14
I (14 10 1)
6-9 5,5-9,5 4 6 k ·100 ·100
2-5 1,5-5,5 2 2 n 15
15
7,5
6 1,5 6
5 ·100 ·100 0,5·100 50
15 15
EL VALOR X=12 SE CORRESPONDE CON EL P50
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
LA VARIABILIDAD MIDE EL GRADO EN EL QUE LAS PUNTUACIONES SE ALEJAN O
APROXIMAN A LA TENDENCIA CENTRAL.
CUANTO MÁS SE ACERQUEN MENOR VARIABILIDAD DE LAS PUNTUACIONES (HABRÁ MÁS
HOMOGENEIDAD ENTRE LOS DATOS)
CUANTO MÁS SE ALEJEN, MAYOR SERÁ LA VARIABILIDAD (LOS DATOS SON MENOS
HOMOGÉNEOS, DIFIEREN MÁS ENTRE SÍ)
AMPLITUD O RANGO
ES LA DIFERENCIA ENTRA LA PUNTUACION MAYOR Y MENOR DE LA DISTRIBUCIÓN
AT X MAX X MIN
X ni
(PUNTUACION DE UN EXAMEN) (FRECUENCIA ABSOLUTA)
5 10
6 5
7 15
8 12
9 8
40
1
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
COMO LAS NOTAS DE UN EXAMENES SON VARIABLES CONTÍNUAS, CALCULAMOS LOS
LÍMITES EXACTOS.
X ni
(PUNTUACION DE UN EXAMEN) (FRECUENCIA ABSOLUTA)
4,5 - 5,5 10
5,5 - 6,5 5
6,5 - 7,5 15
7,5 - 8,5 12
8,5 - 9,5 8
40
LA AMPLITUD TOTAL O RANGO AT 9,5 4,5 5
VARIANZA Y DESVIACIÓN TÍPICA
n n
X i2 2 X i2ni 2
S X2 i 1 X S X2 i 1 X
n n
2
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
EJEMPLO
APLICAMOS UN APRUEBA A UN GRUPO DE 100 ALUMNOS, OBTENIENDO LOS SIGUIENTES
RESULTADOS…. CALCULAR LA VARIANZA Y LA DESVIACIÓN TÍPICA
INTERVALOS ni
5–7 4
8 – 10 7 LIMITES X ni X·ni X2·ni
11 - 13 26 EXACTOS
14 - 16 41 4,5 – 7,5 (4,5+7,5)/2= 6 4 24 36·4= 144
17 – 19 14 7,5 – 10,5 (7,5+10,5)/2= 9 7 63 81·7=567
20 - 22 8 10,5 – 13,5 (10,5+13,5)/2= 12 26 312 144·26=3744
100 13,5 – 16,5 (13,5+16,5)/2= 15 41 615 225·41= 9225
16,5 – 19,5 (16,5+19,5)/2= 18 14 252 324·14 =4536
19,5 – 22,5 (19,5+22,5)/2= 21 8 168 441·8= 3528
100 1434 21744
X 1434 14,34
100
S X2 21744 14,34 217,44 205,64
2
100
11,80
3
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
LA DESVIACIÓN TIPICA ES LA RAIZ CUADRADA DE LA VARIANZA
SX 11,80 3,435
PROPIEDADES
USA TODOS LAS PUNTUACIONES DE LA DISTRIBUCIÓN PARA SU CÁLCULO
MIDEN LA VARIABILIDAD DE LOS DATOS CON LA MEDIA ARITMÉTICA (SOLO PUEDE USARSE
SI UTILIZAMOS ESE PROMEDIO)
SON NO NEGATIVAS (POSITIVAS O CERO). SERÁ CERO CUANDO TODAS LAS
PUNTUACIONES SEAN IGUALES Y POSITIVA EN EL RESTO DE CASOS.
SI APLICAMOS UN CAMBIO DE ORIGEN Y ESCALA, SÓLO AFECTARÁ AL CAMBIO DE ESCALA,
YA QUE LA VARIANZA DE UNA CONSTANTE ES CERO. EL CAMBIO DE ESCALA QUEDARÁ
ELEVADO AL CUADRADO.
Y bX a
SY2 b2 X
SY bX
4
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
CUASIVARIANZA.
MEDIDA DE DISPERSION USADA EN INFERENCIA, ES IGUAL QUE LA VARIANZA, PERO
DIVIDIMOS POR n-1
n n
( Xi X )2 ( X i X )2
Sn2 1 i 1 Sn i 1
n 1 1 n 1
COEFICIENTE DE VARIACIÓN
USADO PARA PODER COMPARAR LA VARIABILIDAD DEDISTRIBUCIONES MEDIDAS EN
DISTINTAS UNIDADES
SX
CV ·100
X
ES PREFERIBLE USARLO CUANDO AMBAS MEDIAS SON IGUALES Y MAYORES DE CERO
LA VARIABILIDAD ES MENOR CUANTO MAS CERCANO A CERO SE ENCUENTRE.
EJEMPLO
DEL EJERCICIO ANTERIOR HEMOS VISTO QUE LA MEDIA VALE 14,34 Y LA DESVIACIÓN
TÍPICA 3,435. CON ESTOS DATOS PODEMOS DECIR QUE LA MEDIA ES REPRESENTATIVA
PARA EL CONJUNTO DE DATOS?
5
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
CV 3,435 100 23,954%
14,34
LA REPRESENTATIVIDAD DE LA MEDIA ES RELATIVAMENTE ALTA (CERCANA A CERO Y
MENOR QUE 0,5)
ESTUDIAR LA VARIABILIDAD DE DOS DISTRIBUCIONES A Y B, CON LOS SIGUIENTES
DATOS: MEDIA Y VARIANZA DE A 20,2 Y 16,4, SIENDO LOS DATOS DE B, MEDIA 21,3 Y
17,2
PRIMERO CALCULAMOS LAS DESVIACIONES TÍPICAS DE AMBAS DISTRIBUCIONES
SA 16,4 4,05
SB 17,2 4,15
CVA 4,05·100 20,05% CVB 4,15·100 19,484%
20,2 21,3
LA DISTRIBUCIÓN B TIENE MENOS VARIABILIDAD, EL RESULTADO ES MENOR (SU MEDIA
REPRESENTA MEJOR A LA DISTRIBUCIÓN)
LA DISTRIBUCIÓN DE A TIENE MAYOR VARIABILIDAD, SU MEDIA REPRESENTA PEOR AL
RESTO DE DATOS DE LA DISTRIBUCIÓN.
6
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
AMPLITUD O RECORRIDO SEMI-INTERCUARTILICO
EN DISTRIBUCIONES ASIMÉTRICAS, ES NECESARIO USAR MEDIDAS DE DISPERSIÓN
DISTINTAS A LA VARIANZA Y DESVIACIÓN TIPICA
Q3 Q1 P75 P25
Q
2 2
SÓLO NOS INFORMA DE LA VARIABILIDAD DEL 50% DE LAS OBSERVACIONES
COMPRENDIDAS ENTRE LOS CUANTILES.
EJEMPLO
LOS SIGUIENTES DATOS REPRESENTAN LAS NOTAS QUE PUEDEN OBTENER UN
GRUPO DE 200 ALUMNOS. SE PIDE CALCULAR EL RECORRIDO O AMPLITUD SEMI-
INTERCUARTILICO
X LIM. ni na 75·200 150 25·200 50
EXACTOS
9 8,5 – 9,5 20 200 100 100
8 7,5 – 8,5 42 180
EL PRIMER INTERVALO CRÍTICO ES 7,5 – 8,5
7 6,5 -7,5 10 138
P 7,5 150 138 8,5 7,5 7,786
6 5,5 -6,5 50 128
5 4,5 -5,5 78 78
200
75 42
7
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
EL SEGUNDO INTERVALO CRÍTICO ES 4,5 – 5,5
P25 4,5 50 0 5,5 4,5 5,141
78
LA AMPLITUD SEMI- INTERCUARTILICA ES: Q 7,786 5,141 1,3225
2
INDICE DE ASIMETRÍA DE PEARSON
LA ASIMETRÍA ESTABLECE EL NÚMERO DE PUNTUACIONES QUE SE COLOCAN A UN
LADO U OTRO DE LA MEDIDA DE TENDENCIA CENTRAL.
X MO
AS SX
CUANDO X MO AS = 0 LA DISTRIBUCIÓN ES SIMÉTRICA
SI X MO AS > 0 LA DISTRIBUCION ES ASIMÉTRICA POSITIVA O ASIMÉTRICA A LA
DERECHA
8
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
SI X MO AS < 0 LA DISTRIBUCIÓN ES ASIMÉTRICA NEGATIVA O ASIMÉTRICA A LA
IZQUIERDA
CALCULAR LA ASIMETRÍA
X 1276 6,38
X LIM. ni X·ni X2ni
EXACTOS
9 8,5 – 9,5 20 180 92·20= 1620 200
8 7,5 – 8,5 42 336 82·42= 2688
7 6,5 -7,5 10 70 72·10= 490
S X2 8548 6,38 2 2,04
62·50= 1800
6
5
5,5 -6,5
4,5 -5,5
50
78
300
390 52·78= 1950
200
200 1276 8548 SX 2,04 1,43
PARA LA MODA ELEGIMOS EL INTERVALO QUE MÁS SE REPITE 4,5 – 5,5
M O 4,5 5,5 10 5
2 2
AS 6,38 5 0,965
EL INDICE DE ASIMETRÍA ES: ASIMÉTRICA POSITIVA
1,43
9
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
PUNTUACIONES DIFERENCIALES
ESTAS PUNTUACIONES NOS PERMITEN HACER COMPARACIONES ENTRE DISTINTAS
zX X X
VARIABLES.
SX
LA MEDIA DE LAS PUNTUACIONES DIFERENCIALES ES SIEMPRE CERO Y SU DESVIACIÓN
TÍPICA ES UNO.
UNA VEZ TIPIFICADAS UNAS PUNTUACIONES DIRECTAS NOS INDICAN COMO SE
APARTAN CADA UNA DE ESAS PUNTUACIONES CON RESPECTO A LA MEDIA, MEDIDAS
EN DESVIACIONES TÍPICAS.
TIPIFICAR LAS PUNTUACIONES DIRECTAS, SABIENDO QUE LA MEDIA ES 7 Y LA
DESVIACIÓN TÍPICA 2
X X X X X
SX
9 9 -7= 3 3/2 =1,5
8 8 -7=1 ½=0,5
7 7-7 =0 0
6 6-7 =-1 -1/2=-0,5
5 5 -7 =-2 -2/2= -1
10
TEMA 4
ANÁLISIS CONJUNTO DE DOS VARIABLES
VARIABLES CUALITATIVAS
ELABORAMOS UNA TABLA DE CONTINGENCIA ENTRE LAS DOS VARIABLES CUALITATIVAS.
PARA ESTUDIAR SI ESAS DOS VARIABLES TIENEN RELACION ENTRE SI, CALCULAMOS EL
COEFICIENTE DE CONTINGENCIA.
EJEMPLO
ESTUDIAR EL EFECTO DEL USO DE UN MEDICAMENTO O UN PLACEBO EN LA MEJORA O
NO DE UNA ENFERMEDAD. EL ESTUDIO SE REALIZA ENTRE 201 PACIENTES. LOS DATOS
SE RECOGEN EN LA SIGUIENTE TABLA DE CONTINGENCIA
CON MEDICAMENTO CON PLACEBO
MEJORAN 75 45
NO MEJORAN 28 53
LOS VALORES NUMÉRICOS QUE ENCONTRAMOS DENTRO DE LA TABLA SON LAS
FRECUENCIAS OBSERVADAS
CON MEDICAMENTO CON PLACEBO
MEJORAN 75 45 120
NO MEJORAN 28 53 81
103 98 n= 201
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Página 1
TEMA 4
ANÁLISIS CONJUNTO DE DOS VARIABLES
CON MEDICAMENTO CON PLACEBO
CALCULAMOS LAS
MEJORAN 120 103 61,5 120 98 58,5 120
FRECUENCIAS TEÓRICAS
201 201
NO MEJORAN 81 103 81 98 39,5 81
41,5 201
201
103 98 n= 201
CALCULAMOS LA DIFERENCIA ENTRE VARIABLES OBSERVADAS Y LAS TEÓRICAS
CON MEDICAMENTO CON PLACEBO LA SUMA DE LAS DIFERENCIAS
MEJORAN 75 – 61,5 =13,5 45 – 58,5 = -13,5 ANTERIORES SIEMPRE DA CERO
NO MEJORAN 28 – 41,5 =-13,5 53 – 39,5 =13,5
2
ne nt
CALCULAMOS EL ESTADISTICO X2
nt
2 2 2 2
75 61,5 45 58,5 28 41,5 53 39,5
X2
61,5 58,5 41,5 39,5
2 2
13,52 13,5 13,52 13,5
2,963 3,115 4,392 4,614 15,084
61,5 58,5 41,5 39,5
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Página 2
TEMA 4
ANÁLISIS CONJUNTO DE DOS VARIABLES
C X2
EL COEFICIENTE DE CONTINGENCIA ES 0 C 1
X2 n
CUANTO MÁS NOS ACERQUEMOS A 1, MAYOR RELACIÓN HABRÁ ENTRE LAS VARIABLES
CUANDO EL COEFICIENTE DE CONTINGENCIA ES CERO, SIGNIFICA QUE LAS VARIABLES NO
TIENEN RELACIÓN ENTRE ELLAS
CUANDO LA TABLA TIENE EL MISMO NÚMERO DE FILAS Y COLUMNAS, PODEMOS
C k 1
ESTABLECER UN VALOR MÁXIMO DEL COEFICIENTE
k
EN NUESTRO EJEMPLO TENEMOS DOS FILAS Y DOS COLUMNAS, POR LO TANTO EL VALOR
MÁXIMO QUE PUEDE ALCANZAR ES
C 2 1 0,707
2
C 15,084 0,2642
NUESTRO COEFICIENTE SERÁ 15,084 201
EL VALOR OBTENIDO ES MENOR DE LA MITAD DE MÁXIMO POSIBLE, POR LO QUE LA
RELACION EN MEDIO-BAJA
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Página 3
TEMA 4
ANÁLISIS CONJUNTO DE DOS VARIABLES
EJEMPLO:
EN UN ESTUDIO SE INVESTIGÓ LA RELACIÓN ENTRE LA ANSIEDAD DE EJECUCIÓN (BAJA
Ó ALTA) Y LA REALIZACIÓN CORRECTA DE UNA TAREA (SI Ó NO) EN 400 PERSONAS. EN
LA TABLA SE MUESTRAN ALGUNAS FRECUENCIAS OBSERVADAS Y ENTRE PARÉNTESIS,
ALGUNAS FRECUENCIAS TEÓRICAS.
COMPLETAR LA TABLA DE CORRELACIÓN
SI NO
68 ----
BAJA 160
(84,8) (---)
--- 96
ALTA 240
(---) (112,8)
212 --- 400
OBTENEMOS LAS CANTIDADES BUSCADAS POR DIFERENCIA, RECORDANDO QUE LAS
FRECUENCIAS MARGINALES SE OBTIENEN SUMANDO LAS FILAS Y LAS COLUMNAS
SI NO
68 160-68=92
BAJA 160
(84,8) (160-84,8)=75,2
240-96=144 96
ALTA 240
(240-112,8)=127,2 (112,8)
212 188 400
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Página 4
TEMA 4
ANÁLISIS CONJUNTO DE DOS VARIABLES
VARIABLES CUANTITATIVAS
ELABORAMOS UNA TABLA DE CORRELACIÓN
VENDEDOR FLUIDEZ VENTAS REPRESENTAR GRÁFICAMENTE, CALCULAR LA
VERBAL (X) DIARIAS (Y) RELACIÓN LINEAL ENTRE LAS VARIABLES
1 10 2
2 50 4 6
3 50 5
4 60 3 5
5 20 1 50, 5
4

VENTAS DIARIAS
50, 4
3
60, 3
2
10, 2
1
20, 1
0
0 20 40 60 80
FLUIDEZ VERBAL
CALCULAMOS LA COVARIANZA
X Y
S XY X Y
n
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Página 5
TEMA 4
ANÁLISIS CONJUNTO DE DOS VARIABLES
X 190 38
VENDEDOR FLUIDEZ VENTAS X·Y
VERBAL (X) DIARIAS (Y)
1 10 2 20
5
2 50 4 200
Y 15 3
3 50 5 250 5
4 60 3 180
5 20 1 20
190 15 670
S XY 670 38 3 20
5
AL TENER SIGNO POSITIVO PODEMOS DECIR QUE EL COEFICIENTE DE CORRELACION DE
PEARSON TENDRÁ SIGNO POSITIVO
PARA MEDIR ESA FUERZA LINEAL ENTRE VARIABLES, CALCULAMOS EL COEFICIENTE DE
CORRELACIÓN DE PEARSON
S XY
rxy 1 rxy 1
S X SY
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Página 6
TEMA 4
ANÁLISIS CONJUNTO DE DOS VARIABLES
X2 Y2 2
S X2 9100 38
VENDEDOR FLUIDEZ VENTAS X·Y
VERBAL (X) DIARIAS (Y) 376
1 10 2 20 102=100 22=4 5
2
2 50 4 200 502=2500 16
250 502=2500 25 SY2 55 3 2
3 50 5 5
4 60 3 180 602=3600 9
5 20 1 20 202=400 1
190 15 670 9100 55
SX 376 19,391
SY 2 1,414
rxy 20 0,73 COMO EL VALOR ES BASTANTE CERCANO A UNO PODEMOS
19,391 1,414
AFIRMAR QUE CASI EXISTE FUERTE RELACIÓN LINEAL POSITIVA ENTRE LAS DOS
VARIABLES.
CUANDO rXY =1 EXISTE UNA RELACION LINEAL PERFECTA Y POSITIVA ENTRE VARIABLES
(CUANDO X AUMENTA Y AUMENTA EN LA MISMA CANTIDAD, Y VICEVERSA)
CUANDO rXY = -1 EXISTE UNA RELACION LINEAL PERFECTA Y NEGATIVA ENTRE LAS
VARIABLES (CUANDO X AUMENTA Y DISMINUYE, Y VICEVERSA)
CUANDO rXY = 0 NO EXISTE RELACIÓN LINEAL ENTRE LAS VARIABLES
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Página 7
TEMA 4
ANÁLISIS CONJUNTO DE DOS VARIABLES
REGRESION LINEAL
UNA VEZ DETERMINADA LA RELACION LINEAL ENTRE LAS VARIABLES, LA REGRESIÓN
LINEAL NOS PERMITE HACER PREDICCIONES.
DEBEMOS DETERMINAR LA RECTA DE REGRESIÓN A TRAVÉS DE Yi' a bX i SIENDO b LA
PENDIENTE DE LA RECTA Y a LA ORDENADA EN EL ORIGEN.
S XY
b
S X SY Y a bX a Y -bX
b 20 0,053 a 3 (0,053 38) 0,986
376
Y ' 0,986 0,053X
CUAL SERÍA EL VALOR DE LA VENTA DIARIA SI UN VENDEDOR CONSIGUIERA UNA
PUNTUACIÓN EN LA PRUEBA DE FLUIDEZ VERBAL DE 80?
Y ' 0,986 0,053 80 5,23
A LAS PUNTUACIONES Y’ OBTENIDAS MEDIANTE LA RECTA DE REGRESIÓN SE LES LLAMA
PUNTUACIONES PRONOSTICADAS.
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Página 8
TEMA 4
ANÁLISIS CONJUNTO DE DOS VARIABLES
A LA DIFERENCIA ENTRE LAS PUNTUACIONES DIRECTAS Y LAS PRONOSTICADAS SE LE
DENOMINAN ERRORES E Y Y '
SY2 SY2' SE2 LA VARIANZA DE LAS PUNTUACIONES DIRECTAS ES IGUAL A LA SUMA DE
LAS VARIANZAS DE LAS PUNTUACIONES PRONOSTICASAS MÁS LA VARIANZA DE LOS
RESIDUOS.
LOS RESULTADOS OBTENIDOS EN UN TEST DE AGUDEZA VISUAL (X) DE SIETE PERSONAS
EN UNA INVESTIGACIÓN SOBRE LA MIOPIA SON LOS SIGUIENTES:
SY2' 4 rxy 0,68 CALCULAR LA VARIANZA DE LOS RESIDUOS
2 SY2' SY2' 4
rxy SY2 SY2 8,65
SY2 rxy 2 0,682
SY2 SY2' SE2 SE2 SY2 SY2' SE2 8,65 4 4,65
SY2'
LA PROPORCION DE VARIANZA EXPLICADA rxy 2 NOS INDICA SI EL AJUSTE LINEAL
SY2
QUE HEMOS CALCULADO ES VÁLIDO PARA HACER PREDICCIONES. TAMBIÉN SE PUEDE
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Página 9
TEMA 4
ANÁLISIS CONJUNTO DE DOS VARIABLES
CALCULAR SI CONOCEMOS EL COEFICIENTE DE CORRELACION LINEAL, SIMPLEMENTE LO
ELEVAREMOS AL CUADRADO.
SE UTILIZA LA REGRESIÓN LINEAL PARA PRONOSTICAR EL RENDIMIENTO DE UN GRUPO
DE ESTUDIANTES EN FUNCIÓN DE SU MOTIVACIÓN. ¿CUAL SERÁ EL COEFICIENTE DE
CORRELACIÓN DE PEARSON ENTRE AMBAS VARIABLES SI LA PROPORCIÓN DE
VARIANZA EXPLICADA ES rXY2 =0,36
rxy2 0,36 rxy 0,36 0,6
LOS RESULTADOS OBTENIDOS EN UNA MUESTRA DE ADOLESCENTES EN LAS VARIABLES
ESTRÉS DEL ENTORNO FAMILIAR (X) Y AGRESIVIDAD DE LOS ADOLESCENTES (Y) SON:
X 7 MEDIA DE X CALCULAR SY
Y 7,4 MEDIA DE Y
S2
b 0,9 PENDIENTE DE LA rxy 2 1 E 0,8485 1 0,6272
RECTA ENTRE X E Y SY2 SY2
rxy 0,8485 COEF.CORRELACION
DE PEARSON 0,6272 1 0,8485 0,6272 S 2
SE2 0,6272 VARIANZA DE LOS SY2 1 0,8485 Y
ERRORES
DE PRONOSTICOS SY2 2,24 SY 2,24 1,5
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Página 10
TEMA 5. NOCIONES BÁSICAS DE PROBABILIDAD
EXPERIMENTO ALEATORIO ES UN PROCESO QUE REPETIDO DE FORMA INDEFINIDA
TIENE UN RESULTADO QUE NO SE PUEDE PREDECIR CON CERTEZA.
ESPACIO MUESTRALES EL CONJUNTO DE RESULTADOS POSIBLES DE UN
EXPERIMENTO ALEATORIO.
EJEMPLO:
AL LANZAR UN DADO PERFECTO, LOS POSIBLES RESULTADOS SON: E= 1, 2, 3, 4, 5, 6
SUCESO SIMPLE O ELEMENTAL: CONSTA DE UN SOLO RESULTADO (OBTENER UN 6)
SUCESO COMPUESTO: CONSTA DE DOS O MÁS RESULTADOS (OBTENER NÚMERO
PAR)
SUCESO IMPOSIBLE: NO PUEDE OCURRIR NUNCA (OBTENER UN 8)
SUCESO UNIÓN: OCURRE A O B, O A AMBOS A LA VEZ
A 2,3 B 3,4,5
A B 2,3,4,5
SUCESO INTERSECCIÓN: OCURRE A Y B AL MISMO TIEMPO.
A 2,3 B 3,4,5
A B 3
ANA M. RAMÍREZ ANAYA C.A. LAS PALMAS DE GC Página 1
TEMA 5. NOCIONES BÁSICAS DE PROBABILIDAD
CUANDO LA INTERSECCION NO CONTIENE NINGÚN ELEMENTO EN COMÚN SE DICE
LOS SUCESOS SON INCOMPATIBLES O MUTUAMENTE EXCLUYENTES.
A 2,3 B 4,5
A B
SUCESO COMPLEMENTARIO: FORMADO POR LOS SUCESOS QUE NO PERTENECEN
AL SUBCONJUNTO A
A 1,3,5
A 2,4,6
TEOREMA DE LA SUMA:
ESTABLECE LA PROBABILIDADDE QUE OCURRA EL SUCESO A O B
P A B P( A) P(B) P( A B)
ANA M. RAMÍREZ ANAYA C.A. LAS PALMAS DE GC Página 2
TEMA 5. NOCIONES BÁSICAS DE PROBABILIDAD
LANZAMOS AL AIRE UNA VEZ UN
DADO, DEFINIENDO DOS SUCESOS:
A = “OBTENER UN NÚMERO MENOR
QUE TRES” Y B = “OBTENER UN
NÚMERO IMPAR”. EN EL DIAGRAMA
DE VENN SE REPRESENTA UNA
OPERACIÓN ENTRE AMBOS
SUCESOS.
SE ESTABLECE UN NUEVO SUCESO C =OBTENER UN NÚMERO PAR.
CUÁL ES P A C
P A C P( A) P(C ) P( A C )
P A C 2 3 1 4
6 6 6 6
LA ZONA SOMBREADA ESTABLECE LA SITUACIÓN A B
ANA M. RAMÍREZ ANAYA C.A. LAS PALMAS DE GC Página 3
TEMA 5. NOCIONES BÁSICAS DE PROBABILIDAD
EN UN ESPACIO MUESTRAL HAY DOS SUCESOS A Y B. SABEMOS QUE P(A)= 0,4
P(B) 0,75 Y QUE P A B 0,55 . CUAL ES LA PROBABILIDAD DE LA
INTERSECCIÓN DE A Y B?
P(B) 1 P(B) 1 0,75 0,25
P A B P A PB P A B
0,55 0,4 0,25 P A B
P A B 0,4 0,25 0,55 0,1
PROBABILIDAD CONDICIONADA: CUANDO LA APARICIÓN DE UN SUCESO DEPENDE
DE LA APARICIÓN DE OTRO.
P A B
P AB
P B
EN ESTE CASO EL HECHO CIERTO ES B Y EL SUCESO CONDICIONADO ES A.
ANA M. RAMÍREZ ANAYA C.A. LAS PALMAS DE GC Página 4
TEMA 5. NOCIONES BÁSICAS DE PROBABILIDAD
EN UNA CLASE, LA MITAD SON CHICOS Y LA OTRA MITAD SON CHICAS. LA MITAD
DE LOS CHICOS Y LA MITAD DE LAS CHICAS HAN ELEGIDO INGLÉS COMO
OPTATIVA. SI ELEGIMOS UNA PERSONA AL AZAR DE ESTA CLASE ¿CUÁL ES LA
PROBABILIDAD DE QUE SEA CHICA Y ESTUDIE INGLÉS?:
P(chica) 0,5 P ingles 0,5
chica
P ingles chica P ingles chica
P ingles 0,5
chica P(chica) 0,5
P ingles chica 0,5 0,5 0,25
CUANDO DOS SUCESOS SON INDEPENDIENTES P A B P A PB
LA PROBABILIDAD DE CADA UNO DE ESOS SUCESOS NO INFLUYE EN LA
OCURRENCIA O NO DEL OTRO.
LANZAMOS UN DADO PERFECTO DOS VECES CONSECUTIVAS, CUAL ES LA
PROBABILIDAD DE SACAR UN CUATRO Y UN SEIS
EN ESTE CASO AL LANZAR EL DADO DOS VECES, NINGUNO DE LOS RESULTADOS
INFLUYE EN EL OTRO.
ANA M. RAMÍREZ ANAYA C.A. LAS PALMAS DE GC Página 5
TEMA 5. NOCIONES BÁSICAS DE PROBABILIDAD
P 4 6 P(4) P(6) 1 1 1 0,03
6 6 36
TENEMOS UNA URNA CON CUATRO BOLAS BLANCAS Y DOS NEGRAS. SI SACAMOS
UNA BOLA (NO LA VOLVEMOS A METER EN LA URNA) Y SACAMOS UNA SEGUNDA
BOLA, CUÁL ES LA PROBABILIDAD DE QUE LA PRIMERA SEA BLANCA Y LA
SEGUNDA NEGRA?
AL NO REEMPLAZAR LA BOLA, EL PRIMER SUCESO SÍ QUE INFLUYE EN EL SEGUNDO
P(B) 4 P( N ) 2 ESTAS PROBABILIDADES APARECEN EN LA PRIMERA
6 6
EXTRACCIÓN
P NB 2 EN LA SEGUNDA EXTRACCIÓN HAY UNA BOLA MENOS EN LA URNA.
5
PB N P(B) P N 4 2 8 0,27
B 6 5 30
ANA M. RAMÍREZ ANAYA C.A. LAS PALMAS DE GC Página 6
TEMA 5. NOCIONES BÁSICAS DE PROBABILIDAD
TEOREMA DE BAYES
LA IMPORTANCIA DE ESTE TEOREMA SE ENCUENTRA EN QUE POR EJEMPLO
SABIENDO LA PROBABILIDAD DE TENER UN DOLOR DE CABEZA DADO QUE SE TIENE
GRIPE, SE PODRÍA SABER (SI SE TIENE ALGÚN DATO MÁS), LA PROBABILIDAD DE
TENER GRIPE SI SE TIENE UN DOLOR DE CABEZA.
GRÁFICA 2: REPRESENTACIÓN GRÁFICA DEL PORCENTAJE DE ALUMNOS EN DOS
ASIGNATURAS (A Y B) SEGÚN HAYAN REALIZADO O NO UNA PEC (PRUEBA DE
EVALUACIÓN CONTINUA). EN LA ASIGNATURA A HAY MATRICULADOS 100
ALUMNOS Y, EN LA ASIGNATURA B, 100 ALUMNOS
120
100
30
80
60
60 SI
NO
40
70
20 40
0
ASIGNATURA A ASIGNATURA B
60304070 TENIENDO EN CUENTA LOS
DATOS REPRESENTADOS EN LA GRÁFICA 2, SI ELEGIMOS UN ALUMNO AL AZAR
¿CUÁL ES LA PROBABILIDAD DE QUE HAYA REALIZADO LA PEC?:
P A 100 0,5 P(B) 100 0,5
200 200
P(PEC ) P( A) P PEC P(B) P PEC B 0,5 0,60 0,5 0,30 0,45
A
ANA M. RAMÍREZ ANAYA C.A. LAS PALMAS DE GC Página 7
TEMA 5. NOCIONES BÁSICAS DE PROBABILIDAD
SI ELEGIMOS UN ALUMNO AL AZAR, TENIENDO EN CUENTA LOS DATOS
REPRESENTADOS EN LA GRÁFICA 2, ¿CUÁL ES LA PROBABILIDAD DE QUE ESTÉ
MATRICULADO EN LA ASIGNATURA A Y HAYA ENTREGADO LA PEC?: A) 0,1; B) 0,2;
C) 0,5
P PEC P( A PEC )
A P( A)
0,60 P( A PEC ) P( A PEC ) 0,60 0,5 0,30
0,5
ELEGIDO UN ALUMNO AL AZAR, TENIENDO EN CUENTA LOS DATOS PRESENTADOS
EN LA GRÁFICA 2, HA RESULTADO QUE HA ENTREGADO LA PEC ¿CUÁL ES LA
PROBABILIDAD DE QUE ESTÉ MATRICULADO EN LA ASIGNATURA B?: A) 0,2; B) 0,4;
C) 0,5
P(B) P PEC
P B
B 0,5 0,3 0,33
PEC P(PEC ) 0,45
ANA M. RAMÍREZ ANAYA C.A. LAS PALMAS DE GC Página 8
TEMA 5. NOCIONES BÁSICAS DE PROBABILIDAD
SITUACIÓN 2: EL 20% DE LOS ALUMNOS DE UNA DETERMINADA UNIVERSIDAD
CURSAN EL GRADO EN PSICOLOGÍA (P). EL 70% DE ELLOS ELIGE EL ITINERARIO DE
PSICOLOGÍA CLÍNICA (C), EL 20% EL DE PSICOLOGÍA EDUCATIVA (E) Y EL 10% EL
DE PSICOLOGÍA DEL TRABAJO (T).
P( P) 0,20
P C P 0,70
P E P 0,20
P T P 0,10
TENIENDO EN CUENTA LA SITUACIÓN 2, ELEGIMOS UN ALUMNO AL AZAR ¿CUÁL ES
LA PROBABILIDAD DE QUE NO CURSE EL GRADO EN PSICOLOGÍA?
P P 1 0.20 0.80
TENIENDO EN CUENTA LA SITUACIÓN 2, ELEGIMOS UN ALUMNO AL AZAR ¿CUÁL ES
LA PROBABILIDAD DE QUE CURSE EL GRADO EN PSICOLOGÍA Y HAYA ELEGIDO EL
ITINERARIO DE PSICOLOGÍA CLÍNICA?
P P C P( P) P C P
P P C 0,20 0,70 0,14
ANA M. RAMÍREZ ANAYA C.A. LAS PALMAS DE GC Página 9
TEMA 5. NOCIONES BÁSICAS DE PROBABILIDAD
TABLA 3: ELECCIÓN DEL ITINERARIO EN EL GRADO DE PSICOLOGÍA EN FUNCIÓN
DEL SEXO DE LOS ESTUDIANTES DE SEGUNDO DE GRADO QUE ASISTEN A UN
CENTRO ASOCIADO DE LA UNED
ITINERARIO
CLINICA EDUCA CION TRABAJO
SEXO HOMBRE 5 15 25
MUJER 25 15 5
ITINERARIO
CLINICA EDUCACION TRABAJO
SEXO HOMBRE 5 15 25 45
MUJER 25 15 5 45
30 30 30 90
P H 5 0,16 P H 15 0,5 P H 25 0,833
C 30 E 30 T 30
P(H ) 45 0,5 P(M)= 45 0,5
90 90
P M 25 0,83 P M 15 0,5 P M 5 0,16
C 30 E 30 T 30
ANA M. RAMÍREZ ANAYA C.A. LAS PALMAS DE GC Página 10
TEMA 5. NOCIONES BÁSICAS DE PROBABILIDAD
ITINERARIO
CLINICA EDUCACION TRABAJO
SEXO HOMBRE 5/90=0,05555 15/90=0,16666 25/90=0,27777 45/90=0,5
MUJER 25/90=0,2777 15/90=0,16666 5/90=0,05555 45/90=0,5
30/90=0,333 30/90=0,3333 30/90=0,3333 90/90=1
P(H ) P H C PH E PH T 0,05 0,16 0,27 0,5
PH C 5 0,05 P H E 15 0,166 P H T 25 0,27
90 90 90
P H P(H C ) 0,05 0,16
C P(C ) 0,33
ELEGIMOS UN ALUMNO AL AZAR Y RESULTA SER HOMBRE, CUÁL ES LA
PROBABILIDAD DE QUE HAYA ELEGIDO EL ITINERARIO CLINICA
P C P HC
P CH 0,33 0,16 0,11
P( H ) 0,5
ANA M. RAMÍREZ ANAYA C.A. LAS PALMAS DE GC Página 11
TEMA 5. NOCIONES BÁSICAS DE PROBABILIDAD
ANA M. RAMÍREZ ANAYA C.A. LAS PALMAS DE GC Página 12
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
SI REPETIMOS UN EXPERIMENTO ALEATORIO, OBTENEMOS LOS RESULTADOS
POSIBLES, CADA UNO CON SU PROBABILIDAD.
UNA VARIABLE ALEATORIA ES UNA FUNCIÓN QUE ASIGNA UN NÚMERO REAL A CADA
UNO DE LOS RESULTADOS DE UN EXPERIMENTO ALEATORIO.
FUNCIÓN DE PROBABILIDAD DE UNA VARIABLE DISCRETA ES AQUELLA FUNCIÓN QUE
ESTABLECE PARA CADA VALOR DE LA VARIABLE, LA PROBABILIDAD DE QUE ÉSTA
ADOPTE ESE VALOR
f (X ) P X x
LANZAMOS UN DADO PERFECTO, LOS POSIBLES RESULTADOS SON:
X 1 2 3 4 5 6
f(x) 0,166 0,166 0,166 0,166 0,166 0,166
UNA FUNCIÓN DE PROBABILIDAD PUEDE REPRESENTARSE A TRAVÉS DE UN DIAGRAMA
DE BARRAS
ANA M. RAMÍREZ ANAYA. CA LAS PALMAS DE GC Página 1
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
0,2
0,166 0,166 0,166 0,166 0,166 0,166
0,15
0,1
Series1
0,05
0
1 2 3 4 5 6
LAS FUNCIONES DE PROBABILIDAD SON SIEMPRE POSITIVAS O NULAS (NUNCA
NEGATIVAS) f (X ) 0
LA SUMA DE TODAS LAS PROBABILIDADES DE CADA VALOR DE X ES SIEMPRE IGUAL A 1
FUNCIÓN DE DISTRIBUCIÓN RECOGE LA PROBABILIDAD ACUMULADA DESDE EL INICIO
DE LA DISTRIBUCIÓN, HASTA EL DATO QUE NOS INDIQUEN.
F(X ) P X x
CON EL EJEMPLO ANTERIOR, CUAL SERÁ LA PROBABILIDAD DE QUE CONSIGAMOS UN
VALOR MENOR O IGUAL A 4
P( X 4) P( X 1) P( X 2) P( X 3) P( X 4) 0,166
0,166 0,166 0,166 0,664
ANA M. RAMÍREZ ANAYA. CA LAS PALMAS DE GC Página 2
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
ES EL MISMO CONCEPTO DE FRECUENCIA RELATIVA ACUMULADA
X f(X) F(X) F(x) ES SIEMPRE POSITIVA O NULA F(X ) 0
1 0.166 0.166
2 0.166 0.322 F(X)=0 PARA VALORES INFERIORES AL VALOR MÁS PEQUEÑO DE LA
3 0.166 0.498 DISTRIBUCIÓN.
4 0.166 0.664
5 0.166 0.83 F(X)=1 PARA VALORES SUPERIORES AL MAYOR VALOR DE LA
6 0.166 1 DISTRIBUCIÓN
F(X) ES UNA FUNCIÓN NO DECRECIENTE, YA QUE VA ACUMULANDO PROBABILIDADES.
P( x1 X x2 ) F ( x2 ) F ( x1)
SIGUIENDO CON EL EJEMPLO
P1 X 4 F (4) F (1) 0,664 0,166 0,498
MEDIA O ESPERANZA MATEMÁTICA
E( X ) x f ( x)
1 0,166 2 0,166 3 0,166 4 0,166 5 0,166 6 0,166 3,486
VARIANZA
ANA M. RAMÍREZ ANAYA. CA LAS PALMAS DE GC Página 3
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
2
2 E( X 2 ) E( X )
E ( X 2 ) 12 0,166 22 0,166 32 0,166 42 0,166 52 0,166 62 0,166
15,106
2
2 15,106 3,486 2,954
DISTRIBUCIÓN BINOMIAL
ESTA DISTRIBUCIÓN SOLO PUEDE TOMAR DOS VALORES (VARIABLES DICOTÓMICAS)
GENERALMENTE 0 Y 1
ESTA DISTRIBUCIÓN TIENE COMO PARAMETROS LOS VALORES n (NUMEROS DE VECES
QUE REPETIMOS EL EXPERIMENTO) Y p (PROBABILIDAD DE OBTENER ÉXITO)
POR LO TANTO LA PROBABILIDAD DE FRACASO SERÁ q = 1-p
MEDIA E( X ) np
VARIANZA 2 npq
ANA M. RAMÍREZ ANAYA. CA LAS PALMAS DE GC Página 4
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
LANZAMOS AL AIRE UNA MONEDA NO TRUCADA 10 VECES, CUAL ES LA PROBABILIDAD
DE SACAR 4 CARAS.
ESTAMOS ANTE UNA DISTRIBUCIÓN BINOMIAL SIENDO n=10, x=4. SIENDO LA
PROBABILIDAD DE SACAR CARA p=0,5
BUSCAMOS EN LA TABLA I P( X 4) 0,2051
CUÁL SERÁ SU MEDIA Y SU VARIANZA
n p 10 0,5 5
2 n pq 210 0,5 0,5 2,5
EL 20% DE LOS ALUMNOS DE UNA DETERMINADA UNIVERSIDAD CURSAN EL GRADO EN
PSICOLOGÍA (P). EL 70% DE ELLOS ELIGE EL ITINERARIO DE PSICOLOGÍA CLÍNICA (C),
EL 20% EL DE PSICOLOGÍA EDUCATIVA (E) Y EL 10% EL DE PSICOLOGÍA DEL TRABAJO
(T).
ELEGIMOS AL AZAR 10 ALUMNOS Y DEFINIMOS LA VARIABLE ALEATORIA X COMO
“NÚMERO DE ALUMNOS QUE CURSAN EL GRADO EN PSICOLOGÍA”, LA MEDIA Y
VARIANZA DE X ES?
10 0,2 2
2 10 0,2 0,8 1,6
ANA M. RAMÍREZ ANAYA. CA LAS PALMAS DE GC Página 5
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
RATA SITUADA EN UN LABERINTO CON CUATRO SALIDAS (A,
B, C Y D) EQUIPROBABLES
SI COLOCAMOS UNA RATA EN UN LABERINTO, COMO EL
RECOGIDO EN LA FIGURA, Y LA VARIABLE ALEATORIA X
TOMA EL VALOR 1 CUANDO LA RATA ESCOGE LA SALIDA A Y
0 EN OTRO CASO. ¿CUÁNTO VALE LA MEDIA DE X?:
X f(X) X·f(X)
1 1/4 1/4 x f ( x) 0,25
0 3/4 0
1 1/4
SI ELEGIMOS AL AZAR 10 ALUMNOS ¿CUÁL ES LA PROBABILIDAD DE QUE
EXACTAMENTE 2 CURSEN EL GRADO EN PSICOLOGÍA?
PARA n=10, x=2 Y p=0,2 BUSCAMOS EN LA TABLA I
P( X 2) 0,3020
ANA M. RAMÍREZ ANAYA. CA LAS PALMAS DE GC Página 6
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
SI ELEGIMOS AL AZAR 10 ALUMNOS ¿CUÁL ES LA PROBABILIDAD DE QUE NINGUNO
CURSE EL GRADO EN PSICOLOGÍA?:
PARA n=10, x=0 Y p=0,2 BUSCAMOS EN LA TABLA I
P( x 0) 0,1074
SE SABE QUE UN 30% DE LAS PERSONAS QUE ACUDEN A UNA PRIMERA CONSULTA EN
UN CENTRO DE PSICOLOGÍA CLÍNICA PRESENTAN UN TRASTORNO DEPRESIVO. SI
ELEGIMOS AL AZAR UNA MUESTRA DE 10 PERSONAS QUE ACUDEN AL CENTRO, LA
PROBABILIDAD DE QUE DOS O MÁS NO TENGAN DEPRESIÓN ES?
n =10, p =0,30 q= 0,70 x 2
LA PROBABILIDAD DE QUE DOS O MÁS PERSONAS NO TENGAN DEPRESIÓN, EQUIVALE A
QUE NINGUNA O UNA SÍ TENGAN DEPRESIÓN
P( X 2) P( X 2) P( X 1)
BUSCAMOS EN LA TABLA II
P( X 1) 0,1493
ANA M. RAMÍREZ ANAYA. CA LAS PALMAS DE GC Página 7
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
¿CUÁL ES LA PROBABILIDAD DE QUE UN ESTUDIANTE QUE RESPONDE AL AZAR LAS 20
PREGUNTAS DE UN EXAMEN DE VERDADERO O FALSO ACIERTE MÁS DE 15?
n =20, x =15 Y p=0,5 BUSCAMOS EN LA TABLA II
P( X 15) 1 P( X 15) 0,9941
LA PROBABILIDAD DE QUE UN PACIENTE CON ESQUIZOFRENIA SE RECUPERE CON UN
TRATAMIENTO DETERMINADO ES DE 0,40. UN PSICÓLOGO ESTÁ TRATANDO INDIVIDUAL
E INDEPENDIENTEMENTE A 10 PACIENTES CON ESTE TRASTORNO. LA PROBABILIDAD
DE QUE SE RECUPEREN AL MENOS 7 PACIENTES ES DE?
n =10, x=6, p=0,40 EN LA TABLA II
P( X 7) 1 P( X 6) 0,9452
ANA M. RAMÍREZ ANAYA. CA LAS PALMAS DE GC Página 8
TEMA 7. DISTRIBUCIONES CONTINUAS
PARA LAS VARIABLES CONTINUAS NO ES POSIBLE QUE SE DE P(X=a)
DISTRIBUCIÓN NORMAL
X N ;
ESTA DISTRIBUCIÓN SE CORRESPONDE CON UNA FAMILIA EN LA QUE EN TODOS LOS
CASOS DEPENDEN DE SU MEDIA µ Y SU DESVIACIÓN TÍPICA
TIENE FORMA DE CAMPANA, QUE SERÁ:
MÁS APUNTADA CUANTO MENOR SEA SU DESVIACIÓN TÍPICA
MENOS APUNTADA CUANTO MAYOR SEA SU DESVIACIÓN TÍPICA
ANA M. RAMÍREZ ANAYA. C.A. LAS PALMAS DE GC Página 1
TEMA 7. DISTRIBUCIONES CONTINUAS
CUANDO LA VARIABLE X SE TIPIFICA (RESTANDO LA MEDIA Y DIVIDIENDO POR LA
DESVIACIÓN TIPÍCA) LA VARIABLE QUEDA:
Z N 0,1
PROPIEDADES:
SIMÉTRICA RESPECTO A SU MEDIA
TIENE DOS PUNTOS DE INFLEXION
ES ASINTÓTICA CON RESPECTO AL EJE DE ABCISAS
AL CALCULAR Z, LO QUE ESTAMOS
HACIENDO, EN REALIDAD, ES UN CAMBIO
DE VARIABLE POR EL CUAL MOVEMOS LA
CAMPANA DE GAUSS CENTRÁNDOLA EN
EL 0 DEL EJE X, Y MODIFICAMOS EL
ANCHO PARA QUE LA DESVIACIÓN TÍPICA
SEA 1.
AL TIPIFICAR ESTAMOS
HOGOMEGEIZANDO LA DISTRIBUCIÓN,
PARA PODER USAR LAS TABLAS.
ANA M. RAMÍREZ ANAYA. C.A. LAS PALMAS DE GC Página 2
TEMA 7. DISTRIBUCIONES CONTINUAS
SI UNA VARIABLE SE DISTRIBUYE NORMALMENTE CON MEDIA 1 Y DESVIACIÓN TÍPICA
3. CUÁL ES LA PROBABILIDAD DE OBTENER VALORES MENORES O IGUALES A -2?
COMO LA VARIABLE NO TIENE MEDIA 0 Y DESVIACIÓN TÍPICA 1, ESTAMOS OBLIGADOS A
TIPIFICAR.
P X 2 P Z 2 1 PZ 1 0,1587 TABLA III
3
PARA UNA DISTRIBUCIÓN NORMA TIPIFICADA, CUÁL ES LA PROBABILIDAD DE
OBTENER VALORES MAYORES 0,25
P Z 0,25 1 P Z 0,25 1 0,5987 0,4013 TABLA IV
PARA UNA DISTRIBUCIÓN DE MEDIA 1 Y DESVIACIÓN 3. CUÁL ES LA PROBABILIDAD DE
OBTENER VALORES ENTRE -2 Y 5?
TIPIFICAMOS
P 2 X 4 P 2 1 Z 4 1 P 1 Z 1 PZ 1 PZ 1
3 3
0,8413 0,1587 0,6826
ANA M. RAMÍREZ ANAYA. C.A. LAS PALMAS DE GC Página 3
TEMA 7. DISTRIBUCIONES CONTINUAS
LAS NOTAS DE UN EXAMEN REALIZADO POR 4000 ALUMNOS SE DISTRIBUYE
NORMALMENTE CON MEDIA 4,7 Y DESVIACIÓN TIPICA 3. CUÁNTOS ALUMNOS
OBTUVIERON UNA CALIFICACIÓN MENOR O IGUAL QUE 5?
P X 5 P Z 5 4,7 P Z 0,1 0,5398
3
CALCULAMOS EL NUMERO DE ALUMNOS CON UNA NOTA DE CICO O MENOS
4.000 x 0,5398 =2.159,2 =2159 ALUMNOS
EN UNA DISTRIBUCIÓN NORMAL TIPIFICADA, QUÉ PERCENTIL SE CORRESPONDE CON
EL VALOR Z=0,44?
BUSCAMOS EN LA TABLA EL VALOR 0,44 Y OBSERVAMOS QUE LA PROBABILIDAD ES
0,6700
POR LO QUE EL PERCENTIL ES EL 67.
EN UNA DISTRIBUCIÓN NORMAL TIPIFICADA, EL PERCENTIL 97 ES?
EL PERCENTIL 97 ES AQUEL VALOR QUE DEJA POR DEBAJO DE SÍ EL 97% DE LOS
DATOS Y POR ENCIMA UN 3%
BUSCAMOS EN LA DENTRO DE LA TABLA EL VALOR 0,9700 (O EL MÁS CERCANO)
Z =1,88
ANA M. RAMÍREZ ANAYA. C.A. LAS PALMAS DE GC Página 4
TEMA 7. DISTRIBUCIONES CONTINUAS
LAS PUNTUACIONES DE UN TEST DE MEMORIA SIGUEN UNA DISTRIBUCIÓN NORMAL
CON MEDIA 100 Y DESVIACIÓN TIPICA 12. EL PERCENTIL 67 ES?
EN LAS TABLAS HALLAMOS EL VALOR DEL PERCENTIL 67 TIPIFICADO.
PARA UNA PROBABILIDAD 0,67, EL VALOR DE Z=0,44
CUANDO TIPIFICAMOS HACEMOS
Z X
EN NUESTRO EJEMPLO
Z 0,44 100 12
P 100
0,44 67 0,44 12 P67 100 (0,44 2) 100 P67
12
P67 105,28
APROXIMACIÓN DE LA DISTRIBICION BINOMIAL A LA NORMAL
CUANDO ESTAMOS ANTE UNA DISTRIBUCIÓN BINOMIAL CON VALORES MAYORES A 20,
TENEMOS QUE APROXIMAR A LA DISTRIBUCIÓN NORMAL, REALIZANDO UNA
CORRECCIÓN POR CONTINUIDAD (RESTANDO 0,5 POR LA IZQUIERDA Y SUMANDO 0,5
POR LA DERECHA)
ANA M. RAMÍREZ ANAYA. C.A. LAS PALMAS DE GC Página 5
TEMA 7. DISTRIBUCIONES CONTINUAS
LANZAMOS AL AIRE 100 VECES UNA MONEDA NO TRUCADA Y CALCULAMOS LA
PROBABILIDAD DE QUE SALGAN MÁS DE 48 CARAS Y LA PROBABILIDAD DE QUE
SALGAN AL MENOS DE 48 CARAS.
ESTAMOS ANTE UNA DISTRIBUCIÓN BINOMIAL CON n= 100 Y p= 0,5
APROXIMAMOS A LA NORMAL
P X 48 P X 49 P Z 49 0,5 100 0,5 P Z 1,5 PZ 0,3
100 0,5 0,5 5
1 PZ 0,3 1 0,3821 0,6179
P X 48 P Z 48 0,5 100 0,5 P Z 2,5 PZ 0,5
100 0,5 0,5 5
1 0,3085 0,6915
ANA M. RAMÍREZ ANAYA. C.A. LAS PALMAS DE GC Página 6
TEMA 8. ESTIMACIÓN
ESTIMACIÓN DE LA MEDIA
LA MEDIA DE UNA DISTRIBUCIÓN MUESTRAL DE LA MEDIA ES IGUAL A LA MEDIA DE
LA POBLACIÓN. ESO INDICA QUE LA MEDIA MUESTRAL ES UN ESTIMADOR
INSESGADO DE LA MEDIA POBLACIONAL
X
2
LA VARIANZA DE UNA DISTRIBUCIÓN MUESTRAL DE LA MEDIA ES IGUAL A
n
SU DESVIACIÓN TIPICA NOS INDICA LA PRECISIÓN DE LA ESTIMACION DE LA
n
MEDIA, CUANTO MENOR SEA LA DESVICIÓN TIPICA DE LA POBLACIÓN, MENOR
SERÁ EL ERROR TÍPICO DE LA MEDIA
PARA MUESTRAS GRANDES n 30 , LA FORMA DE LA DISTRIBUCION MUESTRAL DE
LA MEDIA ES IGUAL A LA DISTRIBUCIÓN NORMAL, AUNQUE LA DISTRIBUCIÓN
ORIGEN DE LA MUESTRA NO SEA NORMAL.(APLICACIÓN DEL TEOREMA CENTRAL
DEL LÍMITE). CUANTO MAYOR SEA n, MENOR SERÁ EL ERROR TÍPICO DE LA MEDIA.
COMO NO ES FACTIBLE TRABAJAR CON TODA UNA POBLACIÓN, ESTIMAREMOS LOS
PARÁMETROS POBLACIONES A TRAVÉS DE ESTADÍSTICOS MUESTRALES.
1
TEMA 8. ESTIMACIÓN
X
2
X X
2 Sn2 1
X n 1
SI EXTRAEMOS UNA MUESTRA ALEATORIA DE 25 ELEMENTOS DE UNA POBLACIÓN
NORMAL EN LA QUE LA VARIANZA VALE 9, CUÁNTO VALE LA DESVIACIÓN TIPICA DE
LA DISTRIBUCION MUESTRAL DE LA MEDIA?
2 9 0,36
2
X n 25
X
0,36 0,6
SABEMOS QUE EL ERROR TÍPICO DE LA DE LA MEDIA VALE 1,5 Y EL TAMAÑO DE LA
MUESTRA ES 100. ¿CUANTO VALE LA VARIANZA DE LA POBLACIÓN? Y LA DESVIACIÓN
TIPICA?
2 2
2 1,52
X n 100
2 1,52 100 225 225 15
2
TEMA 8. ESTIMACIÓN
ESTIMACIÓN DE LA PROPORCIÓN
CUANDO ESTIMAMOS UNA PROPORCIÓN,
P P
2
P1 P
P n
A MEDIDA QUE EL TAMAÑO DE LA MUESTRA CRECE POR EL TEOREMA CENTRAL DEL
LÍMITE, LA DISTRIBUCIÓN TIENDE A LA NORMAL
CUANDO LA PROBABILIDAD ES 0,5 O MÁS, MÁS ELEMENTOS DEBE TENER LA MUESTRA
PARA APROXIMARSE A LA NORMAL.
EN UN CENTRO ESCOLAR HAY 500 ALUMNOS MATRICULADOS EN LA ASIGNATURA A Y
500 EN LA B. EN AMBAS ASIGNATURAS HAY 400 MUJERES. SI QUEREMOS UNA
MUESTRA DE 100 ALUMNOS PARA REALIZAR UNA ENCUESTA CON UNA PROPORCIÓN
DE MUJERES Y HOMBRES EN CADA ASIGNATURA IDENTICA A LA DEL CENTRO
ESCOLAR ¿CUANTOS ALUMNOS VARONES DE CADA ASIGNATURA DEBE TENER LA
MUESTRA?
PROPORCIÓN DE MUJERES Y HOMBRES EN LA ASIGNATURA A Y B ES:
400 0,8 100 0,20
500 500
SI LA MUESTRA ES DE 100 ENTONCES 100 X 0,20 =20 HOMBRES
POR LO TANTO 10 HOMBRES DE CADA UNA DE LAS ASIGNATURAS.
3
TEMA 8. ESTIMACIÓN
INTERVALOS DE CONFIANZA
PARA CALCULAR EL TAMAÑO DE UNA MUESTRA CUANDO ESTIMAMOS LA MEDIA DE UNA
DISTRBUCION NORMAL CON VARIANZA POBLACIONAL CONOCIDA
Z2 2
1
n 2
2
EMAX
SIENDO EL ERROR DE ESTIMACIÓN MAXIMO
E MAX
Z
1
2 n
AL CALCULAR UN INTERVALO PRETENDEMOS QUE LA MEDIA QUE ESTAMOS
ESTIMANDO SE ENCUENTRE DENTRO DE ÉL CON UNA PROBABILIDAD 1 LLAMADA
NIVEL DE CONFIANZA
LA PROBABILIDAD DE QUEDAR FUERA DE ESE INTERVALO SE DIVIDE EN LOS DOS
EXTREMOS QUE QUEDAN A CADA LADO DE ESE INTERVALO Y QUE VALEN
2
LOS INTERVALOS DEPENDEN DE LOS DATOS QUE TENGAMOS:
CONOCEMOS LA DESVIACIÓN TIPICA DE LA POBLACIÓN
LA DISTRIBUCIÓN ES NORMAL O SI NO ES NORMAL PERO EL TAMAÑO DE LA
MUESTRA ES GRANDE (TEOREMA CENTRAL DE LÍMITE)
4
TEMA 8. ESTIMACIÓN
X Z1 ;X Z
2 n 1
2 n
NO CONOCEMOS LA DESVIACIÓN TIPICA DE LA POBLACIÓN, POR LO QUE USAMOS
LA CUASIDESVIACIÓN TIPICA DE LA MUESTRA
LA DISTRIBUCIÓN ES NORMAL O SI NO ES NORMAL PERO EL TAMAÑO DE LA
MUESTRA ES GRANDE (TEOREMA CENTRAL DE LÍMITE)
X tn;1 s
n 1;X tn;1 snn1
2 n 2
NO CONOCEMOS LA DESVIACIÓN TIPICA DE LA POBLACIÓN, POR LO QUE USAMOS
LA CUASIDESVIACIÓN TIPICA DE LA MUESTRA
LA DISTRIBUCIÓN ES NORMAL O SI NO ES NORMAL PERO EL TAMAÑO DE LA
MUESTRA ES MAYOR DE 100 (TEOREMA CENTRAL DE LÍMITE)
X Z1
s
n 1;X Z
s
n 1
2 n 1
2 n
INTERVALO PARA LA PROPORCIÓN
5
TEMA 8. ESTIMACIÓN
n 5
P(1 P)
P Z P(1 P) ; P Z P(1 P)
1
2
n 1
2
n
EJERCICIOS
PARA UN NIVEL DE CONFIANZA DE 0,95 CUANTO VALE Z
1
2
1 1 0,95 0,05 0,05 0,025 1 1 0,025 0,975
2 2 2
AHORA BUSCAMOS EN LA TABLA DE LA NORMAL EL VALOR DE Z QUE SE
CORRESPONDE CON LA PROBABILIDAD 0,975…Z=1,96
PARA MEDIR LA INTELIGENCIA EMOCIONAL SE EXTRAE UNA MUESTRA DE 100
JOVENES. SABEMOS QUE LA DESVIACION TIPICA DE LA VARIABLE EN LA
POBLACIÓN VALE 6, CUANTO SERÁ EL ERROR DE ESTIMACIÓN MÁXIMO DE LA
MEDIA PARA UN NIVEL DE CONFIANZA DE 0,95?
E MAX
Z1
2 n
6
TEMA 8. ESTIMACIÓN
1 0,95 1 0,95 0,05 0,025 1 1 0,025 0,975
2 2
Z0,975 1,96
EMAX 1,96 6 1,176 1,2
100
LA INTELIGENCIA PRÁCTICA, MEDIDA EN UNA ESCALA DE 0 A 40, SE DISTRIBUYE
NORMALMENTE EN LA POBLACIÓN DE ADOLESCENTES CON UNA DESVIACIÓN
TÍPICA DE 6. SUPONIENDO QUE SE DESEA UN ERROR DE ESTIMACIÓN NO
SUPERIOR A 2, CON UN NIVEL DE CONFIANZA DE 0,95 ¿QUÉ TAMAÑO DEBE TENER
LA MUESTRA?
1 0,95 0,05 0,025 1- 0,975 Z0,975 1.96
2 2
Z2 2
1 2 2
n 2
2 n 1,96 2 6 34,57 35
EMAX 2
CALCULAR EL INTERVALO PARA LA MEDIA, SABIENDO QUE PARA ESA MUESTRA
DE 35 ADOLESCENTES HEMOS OBTENIDO UNA INTELIGENCIA PRECTICA MEDIA
DE 28
X EMAX ; X EMAX 28 2;28 2 26;30
7
TEMA 8. ESTIMACIÓN
LA VARIABLE DEPRESIÓN SE DISTRIBUYE NORMALMENTE EN LA POBLACIÓN DE
ANCIANOS. SE MIDIÓ DICHA VARIABLE EN UNA MUESTRA ALEATORIA DE 16
ANCIANOS, OBTENIENDO UNA MEDIA DE 80 Y UNA CUASIVARIANZA DE 100.
¿CUANTO VALE EL ERROR TÍPICO? ¿Y EL ERROR DE ESTIMACIÓN MÁXIMO PARA
UN NIVEL DE CONFIANZA DE 0,99?
Sn 1 100 10 2,5
SX
n 16 4
0,01
1 0,99 0,01 0,005 1 0,995
2 2 2
TRABAJAMOS CON UNA MUESTRA Y NO CONOCEMOS LA VARIANZA DE LA
POBLACION, POR LO QUE TRABAJAREMOS CON LA DISTRIBUCIÓN T – STUDENT,
CON n-1 GRADOS DE LIBERTAD
t16 1;0,995 2,947
Sn
EMAX t
n 1;1
1 2,947 100 7,37
2 n 16
8
TEMA 8. ESTIMACIÓN
EN UNA MUESTRA ALEATORIA DE 100 UNIVERSITARIOS, 75 ESTÁN A FAVOR DEL
MOVIMIENTO 15-M. DADA LA PROPORCIÓN DE UNIVERSITARIOS A FAVOR Y PARA
UN NIVEL DE CONFIANZA DE 0,99 ¿CUAL SERÁ EL ERROR MÁXIMO DE
ESTIMACIÓN? ¿CUALES SON LOS LÍMITES DEL INTERVALO?
1 0,99 0,01 0,005 1 0,995 Z0,995 2,57 2,58 2,575
2 2 2
75 1 75
P(1 P) 2,575 100 100
E Z 2,575 0,75 0,25 0,11
MAX 1
2 n 100 100
LOS LIMITES SON:
P EMAX ; P EMAX 0,75 0,11;0,75 0,11 0,64;0,86
9

También podría gustarte