Unidad 3.
ANALISIS E INTERPRETACION
DE LOS DATOS
Guarionex Gomez T.
Prof. Guarionex Gómez T.
ANALISIS E INTERPRETACION DE LOS DATOS
Medidas de Tendencia Central
1. Media Aritmética
Datos
2. Mediana Me Simples
3. Moda Mo No tiene formula
Promedios: se situan en el centro
Prof. Guarionex Gómez T.
ANALISIS E INTERPRETACION DE LOS DATOS
Medidas de Tendencia Central
1. Media Aritmética
2. Mediana Datos
Agrupados
3. Moda
Prof. Guarionex Gómez T.
Datos simples: Ejemplo
Los datos a continuación corresponden a las calificaciones de 7 estudiantes:
80, 97, 98, 80, 96, 85, 87
80+97+98+80+96+85+87
1. Media Aritmética = 89
7
La calificación promedio es de 89 puntos.
2. Mediana Me = 80 80 85 87 96 97 98 = 87
El 50% de los estudiantes obtuvo una calificación ≤ 93 puntos.
3. Moda Mo = 80 La calificación mas frecuente es 80 puntos.
X > Me > Mo → Asimetría (+)
Prof. Guarionex Gómez T.
Datos Agrupados: Ejemplo – X: Edad de una muestra de profesores
Edad
Li Ls Xi fi Xifi Fa (-)
25 29 27 2 54 2
30 34 32 12 384 14
35 39 37 20 740 34
2755
40 44 42 26 1092 60 = = 39.4 años
45 49 47 7 329 67
70
50 54 52 3 156 70
Total 70 2755
(35 – 34) * 5 = 40.19 años
= 40 +
26
(26 – 20)
= 40 + * 5 = 41.20 años
(26-20) + (26-7)
X < Me < Mo → Asimetría (-)
Prof. Guarionex Gómez T.
Ventajas y desventajas de la Media Aritmética
Ventajas:
1. Es un concepto familiar para muchos investigadores
2. Es única para cada conjunto de datos
3. Es la única medida de tendencia central que reproduce el total
4. Es posible comparar medias de diferentes muestras
Desventajas:
1. Se ve afectada por valores extremos
2. Si la muestra es grande, su calculo es tedioso
3. No se puede calcular con clases abiertas
Prof. Guarionex Gómez T.
Ventajas y desventajas de la Mediana
Ventajas:
1. Es una medida de fácil calculo e interpretación
2. No es sensible a los valores extremos
3. Se utiliza cuando los datos están fuertemente sesgados
4. Se puede calcular aunque haya clases abiertas
Desventajas:
1. Se deben ordenar los datos para su calculo
2. No toma en cuenta todos los valores
Prof. Guarionex Gómez T.
Ventajas y desventajas de la Moda
Ventajas:
1. Es la única medida de tendencia central que se puede calcular
en datos cualitativos
2. Es útil cuando hay agrupaciones con diferentes valores
3. Se puede calcular con clases abiertas
Desventajas:
1. No es única, o puede haber mas de una
2. Puede estar demasiado lejos de la mitad de los datos
3. Puede no existir
Prof. Guarionex Gómez T.
EJERCICIOS
2. Con los datos de la BD, para la edad, usando Excel:
a) Calcular la Media Aritmética
b) Calcular la Mediana
c) Calcular la Moda
d) Diga cual de las tres es mas recomendable
Prof. Guarionex Gómez T.
Medidas de Posición
1. Cuartiles
2. Deciles
3. Percentiles
Cuantilos: se situan en cualquier lugar de los datos.
Prof. Guarionex Gómez T.
Medidas de Posición
Datos
simples
Calificaciones: 80, 80 85, 87, 96, 97, 98
1(7+1)
1. Cuartiles Q1 = =2 Posición
4
Q1 = 80
2. Deciles
25% de las calificaciones
son ≤ a 80 puntos,
mientras que 75% son ≥ a
3. Percentiles 80 puntos.
Prof. Guarionex Gómez T.
Medidas de Posición
Datos
agrupados
1. Cuartiles
2. Deciles
(56 – 34)
P80 = 40 + * 5 = 44.23 años
3. Percentiles 26
El 80% de los maestros tienen ≤
80 x 70 44 años, mientras que 20%
P80 = = 56 tienen ≥ 44 años.
100
Prof. Guarionex Gómez T.
Medidas de Variación
Datos Datos
Simples Agrupados
1. Desviación Standard
2. Coef. de Variación
Prof. Guarionex Gómez T.
Desviacion Standard y Coef. de Variacion
Datos
Simples
Xi Xi - X (Xi - X)2 = √ 376/7 S = 7.3
80 -9 81
En promedio, las calificaciones de los
80 -9 81
estudiantes pudieran estar alejadas± 7.3 de la
85 -4 16 media, o sea: 89 ± 7.3.
87 -2 4
96 7 49
97 8 64
98 9 81 = (7.3 / 89) x 100 = 8.2%
∑= 623 0 376
El grado de variacion de las
X= 89
calificaciones es de 8.2%.
Prof. Guarionex Gómez T.
Desviacion Standard y Coef. de Variacion
Datos
Agrupados
Edad
= √ 2136.1/70 S = 5.5
2 2
Li Ls Xi fi Xifi Xi - X (Xi - X) (Xi - X) fi En promedio, las edades de los
25 29 27 2 54 -12.4 152.70 305.40 profesores pudieran estar alejadas± 5.5
30 34 32 12 384 -7.4 54.13 649.53 de la media, o sea: 39.4 ± 5.5.
35 39 37 20 740 -2.4 5.56 111.12
40 44 42 26 1092 2.6 6.98 181.60 = (5.5 / 39.4) x 100
45 49 47 7 329 7.6 58.41 408.89 = 14%
50 54 52 3 156 12.6 159.84 479.53
Total 70 2755 2136.1 El grado de variacion de las
calificaciones es de 14%.
Prof. Guarionex Gómez T.
Medidas de Asimetría
La asimetría nos permite visualizar hacia donde se inclina la
grafica de una distribución de valores.
X < Me < Mo X = Me = Mo X > Me > Mo
39.4 < 40.19 < 40.20 Asimétrica Negativa
Prof. Guarionex Gómez T.
Medidas de Asimetría
Existen tres (3) maneras de conocer la asimetría de un conjunto de
datos:
1. La grafica: Histograma
2. Relación entre las medidas de tendencia central
3. Coeficientes de asimetría
Coeficientes de asimetría mas usados
1. Coeficiente de Asimetría de Pearson
2. Coeficiente de Asimetría de Fisher
3. Coeficiente de Asimetría de Youle Bowley
Prof. Guarionex Gómez T.
Coeficiente de Asimetría de Fisher
1. Si As < 0 Asimétrica Negativa
2. Si As = 0 Simetrica
3. Si As > 0 Asimétrica Positiva
Coeficiente de Asimetría de Pearson
As = (39.4 – 40.2) / 5.5
As = - 0.15
La media aritmetica es 15%
Coeficiente de Asimetría de Bowley
menor que la moda, en relacion a
la desviación standard. La media
aritmetica de la edad de los
profesores se concentra 15% por
debajo de la moda de la edad.
Prof. Guarionex Gómez T.
Medidas de Curtosis
La Curtosis nos permite visualizar la forma (Estrechez o Anchura) de la
grafica de una distribución de valores.
Coeficiente de Curtosis
Nos muestra el grado de
concentración de los
1. Si α4 – 3 < 0 Platicurtica
datos alrededor de la 2. Si α4 – 3 = 0 Mesocurtica
media aritmética. 3. Si α4 – 3 > 0 Leptocurtica
M4
α4 = = 2.83 – 3 = - 0.17 Es platicurtica
(M2 )2
Prof. Guarionex Gómez T.
La Probabilidad
Es la capacidad de estimar o predecir un evento. Cuanto mayor sea la
cantidad de datos disponibles para calcular la probabilidad de un
acontecimiento, mas preciso sera el resultado calculado. El estudio de la
probabilidad se fundamenta en la teoria de Experimentos y Eventos.
Experimento Aleatorio (E): es una prueba o ensayo cuyos resultados no
son predecibles sin haberse realizado previamente la prueba.
E1 = Se lanza un dado y se observa el número que resulta.
E2 = Se lanza una moneda dos veces y se observa los resultados
posibles.
Prof. Guarionex Gómez T.
Espacio Muestral (S): es el conjunto de todos los resultados posibles
diferentes, de un determinado experimento aleatorio.
S = Kr → Puede construirse tambien a través del diagrama del árbol.
S1: {1,2,3,4,5,6} S2: {(C,C); (C,E); (E,C); (E,E)}
Evento o Suceso: es uno de los posibles resultados del experimento
aleataorio.
A = En los dos lanzamientos sale una cara, por lo menos.
A = {(C,C); (C,E); (E,C)}
Prof. Guarionex Gómez T.
Relación de la Probabilidad y los Juegos de Azar
Diagrama del árbol Dados
⁺ 1 2 3 4 5 6
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
Monedas 3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
Cartas J Q K
- 13 Cartas de Corazones 1,2,3,4,….. 11, 12, 13
- 13 Cartas de Diamantes 1,2,3,4,….. 11, 12, 13
- 13 Cartas de Tréboles 1,2,3,4,….. 11, 12, 13
- 13 Cartas de Espadas 1,2,3,4,….. 11, 12, 13
Prof. Guarionex Gómez T.
Operaciones entre Eventos
• AUB : Ocurre A, ocurre B o ambos; ocurre al menos uno de los dos.
• A∩B : Ocurre A y ocurre B; ocurre ambos a la vez.
• A - B : Ocurre solamente A; ocurre A pero no B.
• A' : No ocurre el evento A.
AUB A∩B A-B A'
Prof. Guarionex Gómez T.
Clases de Eventos Probabilísticos
Eventos Mutuamente Excluyentes: Si un evento sucede significa
que el otro no puede ocurrir.
A∩B = Ø
Ejemplo: Edad de los maestrantes del programa de Estadística
A: Un grupo son menores a 25 anos.
B: Un grupo tiene más de 25 pero no más de 45.
C: Un grupo son mayores de 45 anos.
Si se elige un maestrante, este pertenece a alguno de los tres
grupos, pero no a dos ni tres a la vez.
Prof. Guarionex Gómez T.
Eventos Compatibles: Pueden presentarse simultáneamente.
Ejemplo: Lanzar dos dados
Eventos Independientes: La ocurrencia de un evento no depende
de la ocurrencia del otro.
Ejemplo: Se lanza un dado dos veces
A: Sale 1 en el primer lanzamiento
B: Sale 6 en el segundo lanzamiento
Prof. Guarionex Gómez T.
Eventos Dependientes: Cuando la ocurrencia de uno de ellos
depende de la ocurrencia del otro.
Ejemplo: Se tienen 2 urnas
I: 2 bolas rojas, 1 bola azul y 3 bolas verdes
II: 1 bola roja, 2 bolas azules y 1 bola verde
Si se saca de la urna I una bola y se deposita en la urna II; al
sacar una bola de la urna II, el resultado dependerá de la bola
que se sacó de la urna I.
Prof. Guarionex Gómez T.
Con reposición
S=9
Sin reposición
S=6
Prof. Guarionex Gómez T.
Tres definiciones de Probabilidad
Es la frecuencia relativa con la que puede
1. Frecuentista esperarse que ocurra un evento, si fuera
repetido muchas veces.
Es la que se basa en experiencias y
2. Sujetiva conocimientos sobre la ocurrencia de un
determinado evento.
Es la relacion de casos favorables y casos
3. Clásica posibles de ocurrir al realizar un
experimento.
Prof. Guarionex Gómez T.
Reglas Básicas de Probabilidad
1. 0 ≤ P(A) ≤ 1 2. P(S) = 1 3. P(Ac) = 1 – P(A)
La probabilidad será 1 cuando el evento sea seguro.
La probabilidad será 0 cuando el evento sea imposible.
Teoremas de la Adicción
4. P(AUB) = P(A) + P(B) – P(A∩B)
Eventos No Mutuamente
Excluyentes
Eventos Mutuamente
5. P(AUB) = P(A) + P(B) Excluyentes o Separados
(A∩B) = Ø P(A∩B) = 0
Prof. Guarionex Gómez T.
Teoremas de la Multiplicación
Si A y B son Eventos Dependientes: P(A∩B) = P(A) x P(B/A)
Ejemplo:
Una urna contiene 6 bolas verdes y 4 negras. Se extraen 2 bolas
sucesivamente y sin reposición. Calcular la probabilidad de que la
primera sea negra y la segunda verde.
P(N∩V) = P(N) x P(V/N)
n(N) = 4 = 4/10 * 6/9
n(V) = 6 = 24/90
= 4/15 = 0.267 ≈ 26.7%
n(S) = 10
Prof. Guarionex Gómez T.
Teoremas de la Multiplicación
Si A y B son Eventos Independientes: P(A∩B) = P(A) x P(B)
Ejemplo:
Una urna contiene 6 bolas verdes y 4 negras. Se extraen 2 bolas
sucesivamente con reposición. Calcular la probabilidad de que la
primera sea negra y la segunda verde.
P(N∩V) = P(N) x P(V)
n(V) = 6 = 4/10 * 6/10
n(N) = 4 = 24/100
= 6/25 = 0.24 ≈ 24%
n(S) = 10
Prof. Guarionex Gómez T.
Ejercicio: Diagrama del arbol y Teoremas de la Multiplicación
En una urna tenemos 6 bolas negras, 5 bolas rojas y 7 azules. El
experimento consiste en extraer dos bolas. Hallar la probabilidad de
que:
a) La primera bola sea roja y la segunda azul
b) Se extraigan dos bolas del mismo color
c) Dos bolas de diferente color
Prof. Guarionex Gómez T.
Uso del Análisis Combinatorio en la Probabilidad
r=3
k=4
Ejemplo: n = 10
Una urna contiene 4 bolas negras, 5 blancas y 7 verdes. Al extraer
tres de ellas, Cual es la probabilidad de que sean negras?
k 4 4!
Cr C3 1! 3!
P(k) = = = = 0.0071 ≈ 0.71%
n 16 16!
Cr C3 3! 13!
P(k) = 4/16 x 3/15 x 2/14 = 24/3360 = 0.0071 ≈ 0.71%
Prof. Guarionex Gómez T.
Ejercicios:
1. De una caja que contiene 5 bolas rojas y 3 negras, se extrae una de ellas al azar.
Determinar la probabilidad de que sea negra. Resp. = 3/8
2. De un mazo de 52 cartas, Cuál es la probabilidad de que al extraer tres al azar,
estas sean una figura (J,Q,K)? Resp. = 33/3315
3. De un mazo, se extraen 2 cartas, Cuál es la probabilidad de que sean espadas?
Resp. = 1/17
4. Se tienen 10 objetos buenos, 4 dañados y otros 2 daños importantes. Cuál es la
probabilidad de que al sacar 2 objetos al azar, estos sean buenos? Resp. = 3/8
5. Determina la probabilidad de realizer el siguiente evento: “Obtener cara por lo
menos 2 veces al lanzar al aire 3 veces una moneda”. Resp. = 1/2
6. En una caja hay 5 bolas rojas y 3 negras. Sin mirar se saca una bola y no se
devuelve a la caja, luego se saca otra bola. Cual es la probabilidad de que las dos
bolas que se sacaron sean rojas? Resp. = 5/14
7. Un professor de aula ha seleccionado a 10 niños y 4 niñas para recitar 3 poesias
para actuación central del aniversario del plantel. Cual es la probabilidad de que los
dos primeros sean niños y la ultima sea niña? Resp. = 15/91
8. Nueve personas se sientan al azar en una mesa redonda, Cuál es la probabilidad
de que 3 personas queden contiguas? Resp. = 3/20
Prof. Guarionex Gómez T.
Ejemplo:
Profesores
Nivel
Facultad Total
Grado Maestria Doctorado
FE 4 16 4 24
FH 8 25 6 39
FI 3 32 5 40
FM 7 38 3 48
FAV 5 42 2 49
Total 27 153 20 200
40
a) P(FI) = = 0.20 = 20%
200
24 + 49 73
b) P(FE o FAV) = = = 36.5%
200 200 200
48 200 38 163
c) P(FM o Maestría) = + - = = 81.5%
200 153 200 200
Prof. Guarionex Gómez T.
Probabilidad Condicional
Diremos que dos eventos son independientes si el resultado de uno de
ellos no depende del resultado de los demás, en caso contrario son
eventos dependientes.
Son eventos independientes, lanzamiento de monedas, de dados o
extracciones con reemplazamiento. Son eventos dependientes todos
aquellos que son extracciones sin reemplazamiento, o lanzar un dado y
extraer una bola de una urna u otra dependiendo del número sacado en el
dado.
En el caso de ser sucesos dependientes, tiene sentido hablar
de probabilidad condicionada.
Prof. Guarionex Gómez T.
Probabilidad Condicional: es la probabilidad de que un evento
ocurra dado que ocurrio otro.
Lamamos probabilidad del evento A condicionado al evento B,
denotado de la siguiente manera: P(A/B) o P(B/A) a:
De lo anterior, obtenemos la probabilidad compuesta o probabilidad
del producto para eventos dependientes:
P(A∩B) = P(B/A) . P(A)
• Si dos eventos son dependientes:
P(A∩B) = P(A/B) . P(B)
• Si dos eventos son independientes: P(A∩B) = P(A) . P(B)
Prof. Guarionex Gómez T.
Ejemplo:
P(CSA ∩ Maestría) 32 / 200
P(FI / Maestría) = =
P(Maestria) 153 / 200
32
= = 20.9%
153
Si un professor elegido al azar tiene maestría, existe una
probabilidad de 20.9% de que sea de la Facultad de Ingeniería.
Prof. Guarionex Gómez T.
Probabilidad Total
Si tenemos un evento A, condicionado por otros eventos Bi
incompatibles dos a dos y de tal manera que:
B1 U B2 U B3 U … U Bn = E, como se observa en la grafica siguiente:
La probabilidad del evento A es igual a:
Prof. Guarionex Gómez T.
Teorema de Bayes
Baye nos ayuda para calcular probabilidades a posteriori de diversas
causas, una vez observado un evento A. Si tenemos varios eventos Bi
incompatibles dos a dos y de tal manera que:
B1 U B2 U B 3 U … U Bn = E
Tenemos por definición:
Si lo combinamos con la probabilidad total:
Obtenemos:
Prof. Guarionex Gómez T.
Ejemplo:
En la Facultad de Economía hay tres distinguidos profesores de
Estadística. Cuando un alumno se matricula en el semestre
correspondiente tiene igual probabilidad de que le asignen uno que otro
de los tres profesores. La probabilidad de obtener como nota final un
sobresaliente con el profesor A es 0.3; la de obtenerlo con el professor B
es de 0.28; y la de obtenerlo con el profesor C es de 0.35.
Calcular la probabilidad de que, sabiendo que un alumno matriculado en
Estadística ha obtenido sobresaliente. Cuál es la probabilidad de que le
hubiesen asignado al profesor C?
a) P(S) = P(A∩S) + P(B∩S) + P(C∩S)
= P(A) . P(S/A) + P(B) . P(S/B) + P(C) . P(S/C)
1/3. 0.30 + 1/3 . 0.28 + 1/3 . 0.35 = 0.31
P(C∩S) P(C) . P(S/C) 1/3 . 0.35
b) P(C/S) = = = = 0.3763 ≈ 37.63%
P(S) P(S) 0.31
Prof. Guarionex Gómez T.
Ejercicio:
En una clase de Matemáticas de 50 alumnos se hacen tres grupos de
trabajo, A, B y C, para preparar una batería de preguntas. En el grupo A
hay 10 alumnos mientras que en el B y en el C hay 20 alumnos. La
probabilidad de que un alumno del grupo A acierte una determinada
pregunta es 0.6; un alumno del grupo B la acierta con una probabilidad de
0.9 y un alumno del grupo C la acierta con una probabilidad de 0.8.
Elegido al azar un alumno de esa clase:
a) Calcula la probabilidad de que no acierte esa pregunta.
b) Si ha acertado esa pregunta, calcula la probabilidad de que sea del
grupo B.
Prof. Guarionex Gómez T.
Distribuciones de probabilidad
Distribución de probabilidad de una variable aleatoria es una función que
asigna a cada suceso definido sobre la variable aleatoria la probabilidad de que
dicho suceso ocurra.
∑ P(xi) = 1
Ejemplo:
Número de hijos de una muestral de 15 profesores:
203011521034322
X 0 1 2 3 4 5
P (Xi) 3/15 3/15 4/15 3/15 1/15 1/15 ∑=1
Prof. Guarionex Gómez T.
Distribuciones de probabilidad
X 0 1 2 3 4 5
P (Xi) 3/15 3/15 4/15 3/15 1/15 1/15 ∑=1
a) P(X < 3) = 3/15 + 3/15 + 4/15 = 10/15 = 0.667 = 66.7%
b) P( Al menos 4) = 1/15 + 1/15 = 2/15 = 0.133 = 13.3%
c) P(No tenga hijos) = 3/15 = 0.20 = 20%
d) Promedio de hijos) =
= 0(3/15) + 1( 3/15) + 2(4/15) + 3(3/15) + 4(1/15) + 5(1/15)
= 29/15 = 1.93 ≈ 2 hijos
Prof. Guarionex Gómez T.
Distribución Normal
En estadística y probabilidad se llama distribución normal, distribución
de Gauss o distribución gaussiana, a una de las distribuciones de
probabilidad de variable continua que con más frecuencia aparece
aproximada en fenómenos reales.
Prof. Guarionex Gómez T.
Características de la Distribución Norma Standard
Prof. Guarionex Gómez T.
Casos posibles
Prof. Guarionex Gómez T.
Ejemplo:
Se asume que las edades de una muestra de profesores de la
UASD tienen un comportamiento normal, con una media de
39.4 años y una desviación standard igual a 5.5 anos.
a) Halle la probabilidad de que un profesor tenga menos de 35 años
b) Halle la probabilidad de que un profesor tenga entre 40 y 45 años
c) Halle la probabilidad de que un profesor tenga entre 33 y 42 años
d) Halle la probabilidad de que un profesor tenga mas de 36 años
e) Halle la probabilidad de que un profesor tenga menos de 40 años
f) Halle la probabilidad de que un profesor tenga menos de 37 años
o mas de 47 años
.
Prof. Guarionex Gómez T.
Prof. Guarionex Gómez T.