Está en la página 1de 57

ESPOL 60 años Crea  Crece  Innova

ESTADÍSTICA DESCRIPTIVA

2.- PARTE 2: ORGANIZACIÓN , TABULACIÓN Y GRÁFICA DE


DATOS

Profesora: Eva María Mera Intriago

Facultad de Ciencias Naturales y Matemáticas Guayaquil, mayo de 2019


Quintiles

• Son los valores que dividen a las observaciones


ordenadas en forma ascendente de la muestra en 5
partes iguales.
• Es posible definir cuatro quintiles
• Así, el primer quintil representa al 20% de la muestra
que es menor o igual al valor del primer quintil.
• Así, el segundo quintil representa al 40% de la muestra
que es menor o igual al valor del primer quintil.

Estadística descriptiva
@evamariamera 2
Fuente Principal: Texto GZurita
Quintiles en la Ojiva

1
Frecuencia Relativa Acumulada

0,8

0,6

0,4

0,2

0
1,2 1,26 1,32 1,38 1,44 1,5 1,56 1,62 1,68 1,74 1,8 1,86 1,92 1,98
Estatura

Estadística descriptiva
@evamariamera 3
Fuente Principal: Texto GZurita
Deciles

• Son los valores que dividen a las observaciones ordenadas en


forma ascendente de la muestra en 10 partes iguales.
• Es posible definir nueve Deciles.
• Los Deciles Muestrales se los denota por D1, D2, D3, hasta D9.
• Se puede decir que cuando mas el diez por ciento de los
elementos en la Muestra toman valores menores o iguales al
Primer Decil D1;
• El veinte por ciento de los elementos en la Muestra toman
valores menores o iguales a D2; y,
• Así hasta llegar al Noveno Decil, D9, cuando el noventa por
ciento de las observaciones que conforman la Muestra toman
valores menores o iguales que D9.

Estadística descriptiva
@evamariamera 4
Fuente Principal: Texto GZurita
Deciles en la Ojiva

1
Frecuencia Relativa Acumulada

0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
1,2 1,26 1,32 1,38 1,44 1,5 1,56 1,62 1,68 1,74 1,8 1,86 1,92 1,98
Estatura

Estadística descriptiva
@evamariamera 5
Fuente Principal: Texto GZurita
Percentiles en la ojiva

• Son los valores que dividen a las observaciones


ordenadas en forma ascendente de la muestra en 100
partes iguales.
• Es posible definir noventa y nueve Percentiles.
• El uno por ciento de los elementos en la Muestra toman
valores menores o iguales que P1, que es el denominado
Primer Percentil de la Muestra; y,
• El noventa y nueve por ciento son menores o iguales
que P99 el Nonagésimo Noveno Percentil de la
Muestra.

Estadística descriptiva
@evamariamera 6
Fuente Principal: Texto GZurita
1
0,99
0,98
0,97
0,96
0,95

Percentiles
0,94
0,93
0,92
0,91
0,9
0,89
0,88
0,87
0,86
0,85
0,84
0,83
0,82
0,81
0,8
0,79
0,78
0,77
0,76
0,75
Frecuencia Relativa Acumulada

0,74
0,73
0,72
0,71
0,7
0,69
0,68
0,67
0,66
0,65
0,64
0,63
0,62
0,61
0,6
0,59
0,58
0,57
0,56
0,55
0,54
0,53
0,52
0,51
0,5
0,49
0,48
0,47
0,46
0,45
0,44
0,43
0,42
0,41
0,4
0,39
0,38
0,37
0,36
0,35
0,34
0,33
0,32
0,31
0,3
0,29
0,28
0,27
0,26
0,25
0,24
0,23
0,22
0,21
0,2
0,19
0,18
0,17
0,16
0,15
0,14

Percentiles
0,13
0,12
0,11
0,1
0,09
0,08
0,07
0,06
0,05
0,04
0,03
0,02
0,01
0
1,2 1,26 1,32 1,38 1,44 1,5 1,56 1,62 1,68 1,74 1,8 1,86 1,92 1,98

Estatura
Estadística descriptiva
@evamariamera 7
Fuente Principal: Texto GZurita
Es procedente decir que

Q1 = P25
Q2 = D5 = P50 =Mediana
Q3 = P75

Estadística descriptiva
@evamariamera 8
Fuente Principal: Texto GZurita
Medidas de Posición

• Los percentiles, deciles, quintiles y cuartiles son medidas


de posición, dentro de los estimadores y parámetros que
se calculan en la estadística descriptiva.

Estadística descriptiva
@evamariamera 9
Fuente Principal: Texto GZurita
Cuantiles

• Se denominan Cuantiles a los Percentiles, Deciles y


Cuartiles.

• Existen los Cuantiles que denominaremos Enteros y


Decimales.

Estadística descriptiva
@evamariamera 10
Fuente Principal: Texto GZurita
Recordar

• Un Cuantil no es un punto sobre el plano sino


una coordenada sobre el eje horizontal, por
tanto es un valor numérico; además los
Cuantiles no tienen que necesariamente ser
valores que pertenezcan a la Muestra.

Estadística descriptiva
@evamariamera 11
Fuente Principal: Texto GZurita
La Característica de Interés: Edad al 20
de mayo de 2019
PERCENTILES PERCENTILES PERCENTILES PERCENTILES DECILES
1 6,00 26 16,26 51 22,01 76 28,00 1 9,10
2 6,02 27 16,77 52 22,52 77 28,54 2 14,00
3 6,53 28 17,28 53 23,00 78 29,56 3 18,00
4 7,00 29 17,79 54 23,00 79 30,29 4 20,00
5 7,00 30 18,00 55 23,05 80 30,80 5 22,00
6 7,06 31 18,00 56 23,56 81 31,00 6 24,00
7 7,57 32 18,00 57 24,00 82 31,00 7 26,00
8 8,08 33 18,00 58 24,00 83 31,33 8 30,80
9 8,59 34 18,34 59 24,00 84 31,84 9 35,00
10 9,10 35 18,85 60 24,00 85 32,00
CUARTILES
11 9,61 36 19,00 61 24,11 86 32,00
1 15,75
12 10,00 37 19,00 62 24,62 87 33,11
2 22,00
13 10,00 38 19,38 63 25,00 88 34,64
3 28,00
14 10,14 39 19,89 64 25,00 89 35,00
15 10,65 40 20,00 65 25,15 90 35,00 QUINTILES
16 11,16 41 20,00 66 25,66 91 35,41 1 14,00
17 11,67 42 20,42 67 26,00 92 35,92 2 20,00
18 12,36 43 20,93 68 26,00 93 36,86 3 24,00
19 13,38 44 21,00 69 26,00 94 37,88 4 30,80
20 14,00 45 21,00 70 26,00 95 38,00
21 14,00 46 21,46 71 26,21 96 38,00
22 14,22 47 21,97 72 26,72 97 38,00 CUANTILES DE
23 14,73 48 22,00 73 27,23 98 38,00
24
25
15,24
15,75
49
50
22,00
22,00
74
75
27,74
28,00
99 38,00 LA MUESTRA
Estadística descriptiva
@evamariamera 12
Fuente Principal: Texto GZurita
Rango Intercuartil (RI)

• Se lo determina a través de la diferencia entre el Tercer


Cuartil y el Primer Cuartil

RI = Q3 – Q1

• Intervalo que incluye el “cincuenta por ciento central” de


observaciones en la Muestra.

• Es considerado una medida de dispersión

Estadística descriptiva
@evamariamera 13
Fuente Principal: Texto GZurita
Ejercicio 3: Calcule el rango
Intercuartil del Ejercicio 2

• Se encuentra que:
Q1 = 17; y, Q3 = 28

• Por lo que el Rango Intercuartil de la Muestra es:

RI = 28 – 17 = 11

Estadística descriptiva
@evamariamera 14
Fuente Principal: Texto GZurita
Algoritmo para el cálculo de Cuantiles

• Decidir el Cuantil a calcular


• Identificar tamaño de la muestra.
• Ordenar los datos y obtener los Estadísticos de orden usuales que los
denominaremos Estadísticos de orden Entero.
• Encontrar m
– m=frecuencia relativa acumulada del Cuantil a determinar*(n+1)
• Determinar el Estadístico de Orden m: X(m)
– Si el estadístico de Orden es Entero, de la muestra ordenada se
observa el estadístico de Orden correspondiente y si el Estadístico
de orden es Decimal se calcula con la respectiva definición.
• Así, X(m) es el valor del Cuantil que se quiere determinar.

Estadística descriptiva
@evamariamera 15
Fuente Principal: Texto GZurita
Determinación Estadístico de Orden
Decimal

• En general, se define X(i.a), de la siguiente manera:

X(i.a) = X(i) + 0.a (X(i+1) - X(i));

i = 1,2,...,(n – 1), a real positivo

Estadística descriptiva
@evamariamera 16
Fuente Principal: Texto GZurita
Ejercicio 4

• Se tiene una muestra de tamaño n=5


• xT=(2, 3, 8, 7, 4)
• Calcular el Cuantil Q2

Estadística descriptiva
@evamariamera 17
Fuente Principal: Texto GZurita
Ejercicio 6

• Supongamos que tenemos una muestra de tamaño n=6


• xT=(2, 3, 8, 5, 7, 9)
• Calcular el Cuantil Q2

X(i.a) = X(i) + 0.a (X(i+1) - X(i));

Estadística descriptiva
@evamariamera 18
Fuente Principal: Texto GZurita
Valores, atípicos, aberrantes, extremos
o “outlier”

• Son valores, que se muestran fuera de los valores


usuales en la muestra, en términos numéricos, distante
de todos los demás datos observados.
• Los valores atípicos, sino se detectan podrían dar como
resultado, estimadores que lleven a concluir no
adecuadamente.

Estadística descriptiva
@evamariamera 19
Fuente Principal: Texto GZurita
Detección de valores atípicos a través
del Diagrama de Caja

• Utilizando un Diagrama de Caja, se considera que una


observación constituye un presunto valor atípico, si se ubica a
1.5RI abajo de Q1 o 1.5RI arriba de Q3.

Estadística descriptiva
@evamariamera 20
Fuente Principal: Texto GZurita
Ejercicio7: Determinar posibles valores
atípicos usando el Rango Intercuartil:

• Calcular el Rango Intercuartil de una muestra si se sabe


que:
Q1 = X(19.75) = 1.61; y, Q3 = X(59.25) = 1.73

• Por lo que el Rango Intercuartil de la Muestra es:

RI = 1.73 – 1.61 = 0.12

X(1) = 1.5 X(n) = 1.89

Estadística descriptiva
@evamariamera 21
Fuente Principal: Texto GZurita
Valores Observados en la
…viene Ejercicio 7:
Muestra sospechosos de convertirse en Valores
Aberrantes

• Q1 = 1.61; Q3 = 1.73

• Q1 - 1.5RI
• Q3 + 1.5RI

• Posible Observación Aberrante Inferior


• Q1 - 1.5RI = 1.61 – (1.5)(0.12) = 1.61 - 0.18 = 1.43
• Posible Observación Aberrante Superior
• Q3 + 1.5RI = 1.73 + (1.5)(0.12) = 1.73 + 0.18 = 1.91

Estadística descriptiva
@evamariamera 22
Fuente Principal: Texto GZurita
Valores Observados en la Muestra sospechosos
de convertirse en Valores Aberrantes

X(1) = 1.5 X(n) = 1.89

1.5RI 1.5RI
1.91
1.43

• La observación podría ser aberrante si es menor a 1.43 o


si es mayor a 1.91.
• Recordemos que la mínima estatura es 1,50 y que la
máxima es 1.82.

Estadística descriptiva
@evamariamera 23
Fuente Principal: Texto GZurita
Construcción de Diagramas de Caja,
teniendo en cuenta posibles valores
atípicos

– Determinar los cuartiles Q1, Q2 y Q3.


– Calcular el rango intercuartil RI = Q3 – Q1.
– Determinar los límites a partir de los cuales se considera
que un valor atípico.
– Valores < Q1 – 1.5RI  valor atípico inferior
– Valores > Q3 + 1.5RI  valor atípico superior
– Construir una caja usando como límites Q1 y Q3 y dibujando
la mediana (Q2) con una línea interior.
– Si no hay valores aberrantes, se extiende una línea desde los
extremos de la caja hacia X(1) y X(n); caso contrario, los
bigotes se extienden hasta la observación más cercana a Q1
– 1.5RI y Q3 + 1.5RI.
– Finalmente, se marcan con círculos los valores aberrantes.

Estadística descriptiva
24
@evamariamera
Fuente Principal: Texto GZurita
Deber

• De una población de 500 jefes de hogares se investigan


a 10 de ellos y una de sus características anotada es el
ingreso semanal que perciben en dólares:

• 100 145 150 154 157 160 164 165 181 231

• Determine qué valores observados en la Muestra serían


“sospechosos” de convertirse en Valores Aberrantes y
grafique el correspondiente Diagrama de Caja(use el
algoritmo previo usando valores atípicos)

Estadística descriptiva
25
@evamariamera
Fuente Principal: Texto GZurita
Datos del problema

• Población Objetivo:
• Jefes de hogares de Guayaquil a mayo de 2019
• Tamaño de la población objetivo:
• N=500
• Tamaño de la muestra:
• n=10
• Unidades de investigación:
• Jefes de hogares que pertenecen a la población objetivo.
• Característica de interés o variable aleatoria:
• X: Sueldo semanal en dólares
• ¿Cuál es el soporte de la variable aleatoria?
• Soporte de Variable aleatoria X: {xR 100 ≤ x ≤ 231} = [100, 231]
• ¿La variable aleatoria X es continua o discreta?
• Soporte de Variable aleatoria X es continua

Estadística descriptiva
@evamariamera 26
Fuente Principal: Texto GZurita
…viene Construcción de Diagramas de Caja,
teniendo en cuenta posibles valores
atípicos

• Con el algoritmo para el cálculo de cuantiles se encuentra que:


• Q1 = X(2.75) = 148.75
• Q2 = X(5.50) = 158.50
• Q3 = X(8.25) = 169.00

• De donde el Rango Intercuartil es igual a:

• RI = 169.00 – 148.75 = 20.25


• Además:
• X(1)= 100
• X(10)= 231

Estadística descriptiva
27
@evamariamera
Fuente Principal: Texto GZurita
…viene Construcción de Diagramas de Caja,
teniendo en cuenta posibles valores
atípicos
• Los límites a partir de los cuales una observación puede ser
atípica son:
• Q1 – 1.5RI = 148.75 – 1.5(20.25) = 118.38
• Q3 + 1.5RI = 169.00 + 1.5(20.25) = 199.38
• Sabemos que:
• X(1)= 100 X(2)= 145 X(3)= 150 X(4)= 154 X(5)=157 X(6)= 160 X(7)= 164 X(8)=
165 X(9)= 181 X(10)= 231
• Por lo tanto, un valor atípico está:
– abajo de Q1 es 100; y,
– arriba de Q3 y es 231.
• El valor del Bigote mas cercano a la observación atípica
inferior y superior es:
– inferior: 145
– superior: 181
Estadística descriptiva
28
@evamariamera
Fuente Principal: Texto GZurita
…viene Valores Aberrantes detectados
utilizando Diagramas de Caja

• Quedando
el Diagrama
de Caja de
la siguiente
manera:

Estadística descriptiva
29
@evamariamera
Fuente Principal: Texto GZurita
Interpretación de Diagramas de Cajas

Proyecto de Autoevaluación con fines de acreditación ESPOL 2005-2006


Indicadores por Función

VINCULAC
Función

INVESTIG

DOCENCIA

ADMINIST

30.00 40.00 50.00 60.00 70.00 80.00 90.00 100.00


Valor del Indicador

Estadística descriptiva
@evamariamera 30
Fuente Principal: Texto GZurita
Diagrama de Caja ilustración de valores
aberrantes

Edades de niños entre 6 y 12 años

Estadística descriptiva
@evamariamera 31
Fuente Principal: Texto GZurita
Diagrama de Caja ilustración de valores
aberrantes

Edades de niños entre 6 y 12 años

Estadística descriptiva
@evamariamera 32
Fuente Principal: Texto GZurita
Diagrama de Caja ilustración de valores
aberrantes

Edades de niños entre 6 y 12 años

Estadística descriptiva
@evamariamera 33
Fuente Principal: Texto GZurita
Tareas

• Ejercicio propuestos del Texto guía:

• 1.3
• 1.4
• 1.5
• 1.6
• 1.7

Estadística descriptiva
@evamariamera 34
Fuente Principal: Texto GZurita
Diferencias entre gráficos

• La diferencia está en si las variables a 40 0


419

375

graficar son continuas, discretas 30 0

• Diagramas barras para v. discretas o


255

Recuento
215

característica cualitativas
20 0

127

– Se deja una separación entre barras para 10 0

54

indicar los valores que no son posibles 24 23 17

• Histogramas para variables continuas


0 1 2 3 4 5 6 7 Ocho o má s

Núme ro de hijos

25 0

20 0
Recuento

15 0

10 0

50

20 40 60 80

Edad del e ncue stado

Estadística descriptiva @evamariamera 35


Diagrama de Barras de la Variable Categórica Tipo de Bachiller
Graduado en la ESPOL”

Físico M atemático 0,73

Electricidad 0,08

Informática 0,06

Químico Biólogo 0,03

M ecánica 0,03

Electrónica 0,02

Ciencias 0,02

Sociales 0,01

Otras 0,01

0,00 0,20 0,40 0,60 0,80


Fuente de Datos: Registros Administrativos de la Secretaría Técnica Académica de la ESPOL

Estadística descriptiva
@evamariamera 36
Fuente Principal: Texto GZurita
1,00 1,00
El Profesional Politécnico desarrolla su
actividad favoreciendo al medio ambiente
y haciendo uso racional de los recursos
puestos a su disposición.

0,90 0,90
Programas de educación a distancia y
semipresenciales son opciones válidas en
el contexto de la educación politécnica.

0,80 0,80
Cada vez son mas escasas las
oportunidades de trabajo, por lo que el

Gráfico “de tallarín”


profesional de hoy y del futuro debe
poseer “ Espíritu Emprendedor” , para en
muchos casos generar su propia
ocupación.
0,70 0,70
para características Una vez que me he graduado y realizado
actividades fuera de las aulas politécnicas,
comprendo que es importante aprender

investigadas
con la ayuda de un profesor, pero mas
importante es que se llegue a “ saber
aprender” sin esa ayuda.
0,60 0,60
No siempre el Profesional Politécnico

utilizando recibe una remuneración concordante con


su preparación.

proposiciones a un 0,50 0,50 La receptividad del empleador es siempre

grupo de graduados lo suficientemente amplia para que se le


permita al profesional politécnico sugerir
e implantar nuevos esquemas de trabajo,
para los procesos que efectúa la empresa.
de la ESPOL durante 0,40 0,40 La carrera de la que soy graduado de la
ESPOL cumplió con mis expectativas.

el Proceso de
Autoevaluación 0,30 0,30 La formación que la ESPOL da a sus
graduados supera los requerimientos de

institucional el año los puestos en las organizaciones


ecuatorianas.

2006 0,20 0,20 La ESPOL se preocupa de mantener una


comunicación con sus graduados.

0,10 0,10 La ESPOL a través de su actividad


docente da respuestas válidas a las
necesidades de desarrollo del país.

0,00 0,00 Es evidente, que la ESPOL es una


institución con capacidad para mejorar
Co mpleto P arcial Indiferencia P arcial A cuerdo Co mpleto de manera permanente y continua, en lo
Desacuerdo Desacuerdo A cuerdo referente a las actividades que como
centro de educación superior ejecuta.
Estadística descriptiva
@evamariamera La ESPOL es una institución que ha 37
merecido un alto reconocimiento de la
Fuente
colectividad.Principal: Texto GZurita
1,00 1,00 En t érminos generales la f ormación que da la ESPOL
garant iza el éxit o de los prof esionales que f orma.

La f ormación Mat emát ica que recibí durant e mi est adí a


como est udiant e en la ESPOL
f ue la adecuada.
0,90 0,90

La f ormación en Ciencias Nat urales (Fí sica, Quí mica,


Biologí a) que recibí durant e mi est adí a como est udiant e
en la ESPOL f ue la adecuada.

La f ormación en Ciencias Humaní st icas que recibí


0,80 0,80 durant e mi est adí a como est udiant es en la ESPOL f ue la
adecuada.

La f ormación en Inf ormát ica que recibí durant e mi

Gráfico “de tallarín”


est adí a como est udiant e en la ESPOL f ue la adecuada.

0,70 0,70

para características
En la enseñanza que of rece la ESPOL se equilibra lo t eórico
y lo práct ico.

investigadas utilizando 0,60 0,60


La ESPOL deberí a involucrarse de f orma cont inua en
Proyect os de Invest igación que sean t rascendent es para
la sociedad.

proposiciones a un Desde mi perspect iva como prof esional polit écnico, en


est e moment o puedo asegurar que la calidad del

grupo de graduados de 0,50 0,50


prof esorado por el cual f ui f ormado, t ení a un nivel t eórico
y de práct ica prof esional que era sat isf act orio.
La present ación y comport amient o de un graduado de la

la ESPOL durante el ESPOL son siempre adecuados para la ocasión.

Proceso de 0,40 0,40


Uno de los mayores obst áculos para el desarrollo del
prof esional polit écnico es su escasa f ormación en
comunicación oral.

Autoevaluación Uno de los mayores obst áculos para el desarrollo del


prof esional polit écnico es su escasa f ormación en

institucional el año 2006


comunicación escrit a.

Uno de los mayores obst áculos para el desarrollo del


0,30 0,30 prof esional polit écnico es su escasa habilidad para
relacionarse con t erceros.

Uno de los mayores obst áculos para el desarrollo del


prof esional polit écnico es su escasa habilidad para
t rabajar en equipo.
0,20 0,20
Uno de los mayores obst áculos para el desarrollo del
prof esional polit écnico es su escasa habilidad para
organizar y planif icar.

Uno de los mayores obst áculos para el desarrollo del


prof esional polit écnico es su escasa habilidad para t omar
0,10 0,10
decisiones oport unas.

Uno de los mayores obst áculos para el desarrollo del


prof esional polit écnico es su escasa capacidad para
adapt arse a los cambios.

0,00 0,00 Uno de los mayores obst áculos para el desarrollo del
prof esional polit écnico es su escasa habilidad para innovar
Estadística descriptiva Co mpleto P arcial Indiferencia P arcial A cuerdo Co mpleto
y crear.
Desacuerdo Desacuerdo A cuerdo
@evamariamera 38
Fuente Principal: Texto GZurita
Gráfico de Media y Error Estándar de un conjunto de
proposiciones investigadas a un grupo de estudiantes al
ingresar a la ESPOL, Mayo de 2009

0.30 1. Confianza en conocimientos de álgebra para


resolver problemas de planteamiento de ecuaciones.

2. Confianza en conocimientos de trigonometría para


0.25 resolver problemas sobre triángulos rectángulos.
4
8 3. Confianza en conocimientos de trigonometría para
10 resolver problemas sobre triángulos oblicuángulos.
0.20 9
4. He utilizado frecuentemente una calculadora
6
Error Estándar

básica.
7 5. He utilizado frecuentemente una calculadora
0.15 científica.
5
3 6. He utilizado frecuentemente una calculadora
gráfica.
2
0.10 7. He utilizado frecuentemente una calculadora
1 programable.

8. He utilizado una calculadora para determinar el


0.05 promedio de un conjunto de datos.

9. He utilizado una calculadora para determinar la


desviación estándar de un conjunto de datos.
0.00 10. Tengo confianza en mis habilidades para graficar e
2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 interpretar un histograma de frecuencias.

Media
Estadística descriptiva
@evamariamera 39
Fuente Principal: Texto GZurita
Distribución Empírica

La Distribución Empírica de una Muestra Aleatoria


XT = (X1 X2 … Xn) de tamaño n, tomada de una población
X es definida como:

0; si X  x (1)

k
F̂(x)   ; si x (k )  X  x (k 1) , k 1, 2,..., n 1
n
1; si X  x (n )

Estadística descriptiva
@evamariamera 40
Fuente Principal: Texto GZurita
…viene Ejemplo 1.6: En la Cuenca del Guayas se han
efectuado 5 lecturas de la concentración de
arsénico, en partes por millón

Desarrollo.
X: concentración de arsénico, en partes por millón
Tenemos que n = 5 y además: xT = (4 7 3 2 5)
Siendo:
X1 = 4; X2 = 7; X3 = 3; X4 = 2; y, X5 = 5;

Si ordenamos la Muestra obtenemos los siguientes Estadísticos


de Orden:

X(1) = 2; X(2) = 3; X(3) = 4; X(4) = 5; y , X(5) = 7;

Estadística descriptiva
@evamariamera 41
Fuente Principal: Texto GZurita
0; si X  x (1)

k xT = (4 7 3 2 5)
(x)   ; si x (k )  X  x (k 1) , k 1, 2,..., n 1
n
1; si X  x (n ) X(1) = 2; X(2) = 3; X(3) = 4; X(4) = 5; y , X(5) = 7;

Por lo que:
0 ; x  x (1) 0 ; x2
 
 15 ; x (1)  x  x (2)  15 ; 2x3
 2 ; x (2)  x  x (3)  2
F̂(x)   5 ; 3 x  4
F̂(x)   5
5
3
; x (3)  x  x (4) 5
3
; 4x5
4 ; x (4)  x  x (5) 4 ; 5x 7
5 5
1 ; x  x (5) 1 ; x7
El gráfico de esta función se lo puede apreciar en la
Figura 8.17. Nótese que cada observación produce un
“salto” de 1 .
5
Estadística descriptiva
@evamariamera 42
Fuente Principal: Texto GZurita
…viene Ejemplo 1.6

Figura 8.17
Distribución Empírica n = 5
Ejemplo 1.6 :Contaminación de Ríos
X:Concentración de arsénico en partes por millón

Estadística descriptiva
@evamariamera 43
Fuente Principal: Texto GZurita
Ejemplo 1.16

Si a la muestra del problema previo, se le añade una


nueva lectura (observación) que resulta ser igual a 3,
ocurre que la misma es igual a:

xT = (4 7 3 2 5 3)

Construir la Distribución Empírica correspondiente.

Estadística descriptiva
@evamariamera 44
Fuente Principal: Texto GZurita
…viene Ejemplo 1.17

Desarrollo. El Tamaño de la Muestra es n = 6 y además,

X1 = 4 ; X2 = 7 ; X3 = 3 ; X4 = 2 ; X5 = 5; y , X6 = 3.

Ordenando la muestra:

X(1) = 2 ; X(2) = 3 ; X(3) = 3 ; X(4) = 4 ; X(5) = 5 ; y , X(6) = 7

Estadística descriptiva
@evamariamera 45
Fuente Principal: Texto GZurita
…viene Ejemplo 8.12 xT = (4 7 3 2 5 3)
X(1) = 2 ; X(2) = 3 ; X(3) = 3 ; X(4) = 4 ; X(5) = 5 ; y , X(6) = 7

En este caso una de las observaciones, dos y tres, está


repetida. Siendo F̂(x) lo siguiente: 0 ; x2
0 Frecuencia 
; x  x (1)  16 ; 2x3
X(i) Frecuencia
acumulada

 16 ; x (1)  x  x (3) 2 1 1  3 ; 3 x  4
 3 ; x (3)  x  x (4) 3 2 3 F̂(x)   6
F̂(x)   6 ; 4x5
6
4
6
4
; x (4)  x  x (5) 4 1 4
5 ; x (5)  x  x (6) 5 1 5 5 ; 5x 7
6 7 1 6
6
1 ; x  x (6)
n=6
1 ; x7

En la nueva situación, cada observación produce un “salto” de 1 y


6
no
Estadística de un
descriptiva
@evamariamera
quinto como en el caso previo. 46
Fuente Principal: Texto GZurita
…viene Ejemplo 8.12

El gráfico de F̂(x) se muestra en la Figura 1.18. Nótese


que en X = 3 se produce un “salto” de dos sextos , por la
repetición del valor X = 3
Figura 1.18
Distribución Empírica n = 6
Contaminación de Ríos
X:Concentración de arsénico en partes
por millón

Estadística descriptiva
@evamariamera 47
Fuente Principal: Texto GZurita
Deber

• Realice la interpretación de los resultados del ejercicio1.4


al 1.6.

Estadística descriptiva
@evamariamera 48
Fuente Principal: Texto GZurita
Diagrama de Paretto

• El diagrama de Paretto es un diagrama de barras, donde


el valor de la altura de cada barra se presenta en orden
descendente.
• En el diagrama de barra la distribución de frecuencias,
puede ser de frecuencias relativas o de porcentajes.
• Además en el mismo diagrama, se grafica la
acumulación de la frecuencia relativa.
• Se usa en aplicaciones de Control Estadístico de la
Calidad para identificar las principales causas de
variabilidad de un problema.

Estadística descriptiva
@evamariamera Sección 12.3.3 Diagrama de Paretto del texto guía-Gzurita 49
Fuente Principal: Texto GZurita
…viene Diagrama de Paretto

• Fue Joseph Juran quien introdujo los Diagramas de


Paretto al Control Estadístico de la Calidad.
• Lleva su nombre en honor al economista italiano Alfredo
Paretto, quien utilizó este gráfico para medir la
concentración de la riqueza en el siglo XIX.

Estadística descriptiva
@evamariamera 50
Fuente Principal: Texto GZurita
…viene Diagrama de Paretto

• Se recomienda atacar las causas que cubran al menos el


80% del Total.
• Es conocida como la regla del ochenta-veinte o regla de
Paretto.
• Concentrarse en esas causas para resolver el problema,
ayuda a la mejora continua y es parte de las
denominadas ”Siete herramientas de calidad”

Estadística descriptiva
@evamariamera 51
Fuente Principal: Texto GZurita
Ilustración de Diagrama de Paretto

Figura 12.2
Diagrama de Paretto
Causas de llegar Atrasado a la Primera Hora de Clase en una Universidad
Fi /n

1.0
0.99 1.00
0.94

CAUSAS:
A = Transporte Inaccesible
0.55 B = Se quedó dormido
0.5 C = Demora en preparar el
0.39 desayuno
D = Otros

0.05
0.01
Causas
A B C D

• Lo que representa cada barra son las causas de un problema, ordenadas de


la que tuvo mayor frecuencia relativa a menor frecuencia relativa.
Estadística descriptiva
@evamariamera 52
Fuente Principal: Texto GZurita
Ejercicio

• En una compañía el producto A, ha sufrido una caída del


50% de sus ventas durante el último mes del año. La
compañía está implantando un Sistema de Gestión de la
Calidad.
• Esta empresa tiene un sistema que permite el registro de
quejas de clientes para los productos que ofrecen. Se
detectó el aumento del 40% de quejas y reclamos de
clientes en relación al producto A, durante el último mes
del año.
• Con la filosofía de mejora continua, deciden atacar y
resolver el problema encontrado con un análisis de
Paretto.
• A continuación se muestra el detalle:
Estadística descriptiva
@evamariamera 53
Fuente Principal: Texto GZurita
A través del sistema identifican las quejas encontradas para el
producto A, como las causas del problema en la disminución
del 50% de las ventas

Causas # de quejas
El producto tiene corta duración 50
El personal de postventa no instala correctamente el producto 20
El personal que atiende las llamadas no sabe de servicio al cliente 10
El personal de postventa es grosero 8
El precio del producto es mas caro que su competencia equivalente 7
El servicio postventa no llega a la hora pactada con el cliente 5
100

Estadística descriptiva
@evamariamera 54
Fuente Principal: Texto GZurita
Solución al problema: Disminución venta
50% durante el último mes del año

Causas detectadas Nº de Frecuencia Porcentaje


quejas relativa Porcentaje acumulado

Poca durabilidad del producto 50 0,500 50,0 50,0


Instalación incorrecta 20 0,200 20,0 70,0
Call center mal servicio 10 0,100 10,0 80,0
Personal Postventa es grosero 8 0,080 8,0 88,0
Producto es caro 7 0,070 7,0 95,0
Serv- Postventa no es puntual 5 0,050 5,0 100,0
100 1,000 100,0

Estadística descriptiva
@evamariamera 55
Fuente Principal: Texto GZurita
Solución

Diagrama de pareto : Disminución de venta del producto A


120,0

100,0

80,0
Porcentaje

60,0

40,0
80% acumulado Porcentaje
Porcentaje acumulado
20,0

0,0
Poca durabilidad Instalación Call center mal Personal Producto es caro Serv- Postventa
del producto incorrecta servicio Postventa es no es puntual
grosero
Causas

• Concentrarse en tratar el las 3 primeras causas


Estadística descriptiva
@evamariamera 56
Fuente Principal: Texto GZurita
REFERENCIAS BIBLIOGRÁFICAS

• ZURITA, G. (2010), “Probabilidad y Estadística, Fundamentos


y Aplicaciones”, Segunda Edición, Ediciones del Instituto de
Ciencias Matemáticas ESPOL, Guayaquil, Ecuador.

Estadística descriptiva
@evamariamera 57
Fuente Principal: Texto GZurita

También podría gustarte