Está en la página 1de 52

ESPOL 60 años Crea  Crece  Innova

ESTADÍSTICA DESCRIPTIVA

2.- ORGANIZACIÓN , TABULACIÓN Y GRÁFICA DE DATOS

Profesora: Eva María Mera Intriago

Facultad de Ciencias Naturales y Matemáticas Guayaquil, mayo de 2019


Obtención de Información
a partir de los datos de una
muestra o de una población

¿Qué necesitamos hacer para convertir los datos en


material estadísticamente útil, esto es, convertirlos
en información?
Acciones para convertir los datos en
información

• 1)Ordenar los datos,


• 2)Tabular los datos ordenados,
• 3)Graficar los datos ordenados utilizando el concepto de
frecuencia relativa ;y,
• 4)Calcular a partir de la muestra o de la población los
estimadores y parámetros según corresponda.

Estadística descriptiva 3
1) Ordenar los datos

• Ordenar datos, es una operatoria que ya conocemos, en


Estadística a cada elemento ordenado y la posición que
este ocupa se le da el nombre de:
• Estadísticos de Orden
• Número de posición que ocupan los elementos de la
muestra, cuando los elementos están ordenados.

Estadística descriptiva 4
Estadísticos de Orden

• Primer Estadístico de Orden


• X(1) = min{X1 , X2,..., Xn}
• Dada una Muestra X de tamaño n, al Primer Estadístico de Orden lo
denotamos por X(1) y lo definimos como el mínimo valor entre los elementos
que constituyen la Muestra, esto es,
• X(1) = min{X1 , X2 , ... , Xn}

• El Estadístico de Orden n se lo denota como X(n) y lo definimos como el


máximo valor que constituye la Muestra, esto es,
• X(n) = max{X1, X2,..., Xn}

Estadística descriptiva 5
…Estadísticos de Orden

• De forma similar definimos Estadístico de Orden dos,


tres, y así pasando por el i–ésimo orden, llegamos al de
orden (n – 1) y de orden n, esto significa que:

• X(1) ≤ X(2) ≤ ... ≤ X(i) ≤ … ≤ X(n – 1) ≤ X(n)

Estadística descriptiva 6
2)Tabular datos

• Para tabular datos cuantitativos se requiere conocer los


siguientes términos: Clase, marca de clase, frecuencia
absoluta, frecuencia relativa, frecuencia acumulada,
frecuencias relativa acumulada.
• Todos estos términos están asociados a una Tabla de
frecuencia

Estadística descriptiva 7
Términos a conocer para elaborar una
Tabla de Frecuencias

• Clase: Intervalos de igual longitud, que son exhaustivos


y mutuamente excluyentes.
• Intervalo de clase: Intervalos i que pertenecen a la clase
• Marca de clase: El punto medio de cada una de las
clases

Estadística descriptiva 8
Ejemplo 1.4
Tomado del texto guía Probabilidad y Estadística,
Fundamentos y Aplicaciones, Segunda Edición, G. Zurita

Se tiene una Muestra de tamaño n = 50 datos y el


mínimo X(1) es igual a 42 mientras que el máximo X(50)
es 106. Se requiere determinar Clases y Marcas de Clase
para la Muestra.

Desarrollo.

Se nos sugiere tomar k = 7, de tal manera que


consideramos pertinente tomar,

A = {xR 40 ≤ x ≤ 110} = [40, 110]

Estadística descriptiva 9
…viene Ejemplo 1.4
Tomado del texto guía Probabilidad y Estadística,
Fundamentos y Aplicaciones, Segunda Edición, G. Zurita

Restamos el valor del extremo superior del último intervalo de clase


menos el primer valor o extremo inferior del primer intervalo de
clase: 110-40=70
Ese valor lo dividimos para el número de clase y de esta forma
tenemos la longitud del intervalo : 10
Esto hace posible que:

la primera Clase = [40, 50);


la segunda Clase = [50 , 60);
y, la séptima Clase = [100 , 110]

Bajo estas condiciones, la primera Marca de Clase es


(40+50)/2=45; la segunda Marca de Clase es 55; la tercera es 65; y
de esta manera hasta llegar a la séptima Marca de Clase que es
105.

Estadística descriptiva 10
Figura 1.2
Tomado del texto guía Probabilidad y Estadística,
Fundamentos y Aplicaciones, Segunda Edición, G. Zurita

Intervalo A (unión de las siete Clases)

Estadística descriptiva 11
Tabla de Frecuencias

Frecuencia
Ordinal de la Marca de Frecuencia Frecuencia Frecuencia Absoluta
Clase Relativa
Clase Clase Absoluta Relativa Acumulada
Acumulada

Estadística descriptiva 12
Tabla de Frecuencias

Frecuencia
Ordinal de la Marca de Frecuencia Frecuencia Frecuencia Absoluta
Clase Relativa
Clase Clase Absoluta Relativa Acumulada
Acumulada

1 [a1,a2)
2 [a2,a3)
3 [a3,a4)
. .
. .
. .
k [ak,ak+1)

Clases
Intervalos de igual longitud, que son exhaustivos y
mutuamente excluyentes en una Muestra o Población
Estadística descriptiva 13
Tabla de Frecuencias

Frecuencia
Ordinal de la Marca de Frecuencia Frecuencia Frecuencia Absoluta
Clase Relativa
Clase Clase Absoluta Relativa Acumulada
Acumulada

1 [a1,a2) (a1+a2)/2
2 [a2,a3) (a2+a3)/2
3 [a3,a4) (a3+a4)/2
. . .
. . .
. . .
k [ak,ak+1) (ak+ak+1)/2

Marca de Clase
Valor central de cada una de las Clases

Estadística descriptiva 14
Tabla de Frecuencias

Frecuencia
Ordinal de la Marca de Frecuencia Frecuencia Frecuencia Absoluta
Clase Relativa
Clase Clase Absoluta Relativa Acumulada
Acumulada

1 [a1,a2) (a1+a2)/2 f1
2 [a2,a3) (a2+a3)/2 f2
3 [a3,a4) (a3+a4)/2 f3
. . . .
. . . .
. . . .
k [ak,ak+1) (ak+ak+1)/2 fk

Frecuencia Absoluta
Número de observaciones en la Muestra o Población que pertenecen a cada
una de las Clases
Estadística descriptiva 15
Tabla de Frecuencias

Frecuencia
Ordinal de la Marca de Frecuencia Frecuencia Frecuencia Absoluta
Clase Relativa
Clase Clase Absoluta Relativa Acumulada
Acumulada

1 [a1,a2) (a1+a2)/2 f1 f1/n


2 [a2,a3) (a2+a3)/2 f2 f2/n
3 [a3,a4) (a3+a4)/2 f3 f3/n
. . . . .
. . . . .
. . . . .
k [ak,ak+1) (ak+ak+1)/2 fk fk/n

Frecuencia Relativa
Número de observaciones de la clase i ,dividida para el tamaño de la muestra o de
la población.
Toda Frecuencia Relativa f
es un número mayor o igual a cero pero menor o igual
Estadística descriptiva i 16
que uno, esto es, 0 ≤ n ≤ 1; siendo, i = 1, 2,..., k.
Tabla de Frecuencias

Frecuencia
Ordinal de la Marca de Frecuencia Frecuencia Frecuencia Absoluta
Clase Relativa
Clase Clase Absoluta Relativa Acumulada
Acumulada

1 [a1,a2) (a1+a2)/2 f1 f1/n F1 = f1


2 [a2,a3) (a2+a3)/2 f2 f2/n F2 = f1 + f2
3 [a3,a4) (a3+a4)/2 f3 f3/n F3 = f1 + f2 + f3
. . . . . .
. . . . . .
. . . . . .
Fk= f1 + f2 + f3 +…+ fk
k [ak,ak+1) (ak+ak+1)/2 fk fk/n
=n
Frecuencia Absoluta Acumulada
F1 se la define igual a f1; F2 = f1 + f2; y así sucesivamente Fk = f1 + f2 + ... + fk - 1 + fk
Es claro que Fk es igual a n.
Estadística descriptiva 17
Tabla de Frecuencias

Frecuencia
Ordinal de la Marca de Frecuencia Frecuencia Frecuencia Absoluta
Clase Relativa
Clase Clase Absoluta Relativa Acumulada
Acumulada

1 [a1,a2) (a1+a2)/2 f1 f1/n F1 = f1 F1/n


2 [a2,a3) (a2+a3)/2 f2 f2/n F2 = f1 + f2 F2/n
3 [a3,a4) (a3+a4)/2 f3 f3/n F3 = f1 + f2 + f3 F3/n
. . . . . . .
. . . . . . .
. . . . . . .
Fk= f1 + f2 + f3 +…+ fk
k [ak,ak+1) (ak+ak+1)/2 fk fk/n Fk/n = 1
=n
Frecuencia Relativa Acumulada
La Frecuencia Acumulada Relativa de la i-ésima Clase resulta de dividir Fi para n,
siendo i = 1; 2;...; k. Ocurre por tanto que Fk es igual a uno.
n
Estadística descriptiva 18
Ejercicio 2

• De una población de 11mil estudiantes que se registraron en una


unidad educativa de Guayaquil, en el primer término académico
2019-2020.Se toma una muestra aleatoria de tamaño n=50,.
• Se les pregunta la fecha de nacimiento al 20 de mayo de 2019 y
se calcula la edad respectiva de cada estudiante a esta fecha.
• Defina:
– Población objetivo.
– Tamaño N de la población objetivo.
– Tamaño n de la muestra.
– Unidades de investigación.
– Característica de interés o variable aleatoria.
• ¿Cuál es el soporte de la variable aleatoria?
• ¿La variable aleatoria es continua o discreta?
• Construya la Tabla de Frecuencia para la variable de interés
Estadística descriptiva 19
…viene Ejercicio 2

• Convierta los datos en información a través del


procesamiento estadístico, en este caso, a través de la
Tabulación de datos y con ellos la elaboración de la Tabla de
Frecuencias.
• Grafique el histograma de frecuencias, el polígono de
frecuencias y la ojiva.
• Los datos, en este caso, la edad de cada estudiante se
muestra en la siguiente Tabla:
xT = ( 20 25 21 26 21 26 22 26 22 22
23 31 6 9 14 18 23 27 32 36
7 10 14 18 24 28 32 38 7 10
15 19 24 28 35 38 8 11 16 19
Estadística descriptiva 20
24 30 35 38 12 17 20 25 31 18 )
…viene Ejercicio 2: Desarrollo

• Población Objetivo:
• Estudiantes de una unidad educativa de Guayaquil registrados
durante el primer término académico 2019-2020.
• Tamaño de la población objetivo:
• N=11mil
• Tamaño de la muestra:
• n=50
• Unidades de investigación:
• Estudiantes de una unidad educativa que pertenecen a la
población objetivo.
• Característica de interés o variable aleatoria:
• Edad de los estudiantes al 20 de mayo de 2019 a la que
llamaremos X

Estadística descriptiva 21
…viene Ejercicio 2: Desarrollo para
determinar la Tabla de Frecuencias
• Ordenar los datos
xT = ( 6 7 7 8 9 10 10 11 12 14
14 15 16 17 18 18 18 19 19 20
20 21 21 22 22 22 23 23 24 24
24 25 25 26 26 26 27 28 28 30
31 31 32 32 35 35 36 38 38 38 )
• Encontrar el estadístico de orden 1, equivalente al mínimo
valor en los datos, en este caso la edad de los estudiantes: mínimo
X(1) = 6
• Encontrar el estadístico de orden n, equivalente al máximo
valor en los datos: máximo: X(50) = 38
• ¿Cuál es el soporte de la variable aleatoria?
• Soporte de Variable aleatoria X: {xR 6 ≤ x ≤ 38} = [6, 38]

Estadística descriptiva 22
Vamos a determinar el número de intervalos
de clase y la longitud de cada intervalo i de
clase
• K=7
• Max-Min=38-6=32
• 32/ k=7
• 4.57
• Decidimos que la longitud será 5, es mejor un número entero.
• Recordemos que el mínimo es 6 y llegamos hasta 38
• Los intervalos serían de [6,11), [11,16),…,[31,36),[36,41)
• También, podríamos considerar un intervalo que resulte más
natural a quién visualiza el gráfico.
• [5,10), [10,15),…,[35,40)
• El ultimo valor del último intervalo es opcional incluir o no el valor
en este caso, en el caso previo, debe incluirse el último valor.
Estadística descriptiva 23
Tabla de Frecuencias

n=50

Frecuencia
Ordinal de la Marca de Frecuencia Frecuencia Frecuencia Absoluta
Clase Relativa
Clase Clase Absoluta Relativa Acumulada
Acumulada

Estadística descriptiva 24
Tabla de Frecuencias de la Edad de los
estudiantes de la ESPOL al 20 de mayo de
2019

Frecuencia
Ordinal de la Marca de Frecuencia Frecuencia Frecuencia Absoluta
Clase Relativa
Clase Clase Absoluta Relativa Acumulada
Acumulada
1 [5 , 10) 7.5 5 0.10 5 0.10
2 [10 , 15) 12.5 6 0.12 11 0.22
3 [15 , 20) 17.5 8 0.16 19 0.38
4 [20 , 25) 22.5 12 0.24 31 0.62
5 [25 , 30) 27.5 8 0.16 39 0.78
6 [30 , 35) 32.5 5 0.10 44 0.88
7 [35 , 40] 37.5 6 0.12 50 1.00

Precisión de decimales con los que se trabaja, es importante conservarla en un reporte ,


así como la separación de decimales y la de miles.
En términos comparativos es siempre mejor utilizar la frecuencia relativa
Si multiplicamos x 100 a la frecuencia relativa obtenemos el porcentaje
Recordar: la frecuencia relativa es una probabilidad,
Estadística descriptiva 25
Un porcentaje no es una probabilidad.
Histograma de Frecuencias Relativas de la
edad de los estudiantes de la ESPOL, primer
término 2019

HISTOGRAMA DE FRECUENCIAS RELATIVAS


1,00
0,90
0,80
Frecuencia Relativa

0,70
0,60
0,50
0,40
0,30 0,24
0,20 0,16 0,16
0,10 0,12 0,10 0,12
0,10
0,00
[5,10) [10,15) [15,20) [20,25) [25,30) [30,35) [35,40]

Estadística descriptiva 26
Histograma de Frecuencias Relativas de la
edad de los estudiantes de la ESPOL, primer
término 2019

HISTOGRAMA DE FRECUENCIAS RELATIVAS


0,30

0,25 0,24
Frecuencia Relativa

0,20
0,16 0,16
0,15
0,12 0,12
0,10 0,10
0,10

0,05

0,00
[5,10) [10,15) [15,20) [20,25) [25,30) [30,35) [35,40]

Estadística descriptiva 27
Histograma de Frecuencias Absolutas de la
edad de los estudiantes de la ESPOL, primer
término 2019

HISTOGRAMA DE FRECUENCIAS ABSOLUTAS


14
12
12
Frecuencia Absoluta

10
8 8
8
6 6
6 5 5
4
2
0
[5 , 10) [10 , 15) [15 , 20) [20 , 25) [25 , 30) [30 , 35) [35 , 40]

Estadística descriptiva 28
La Característica de Interés es la Edad
al 20 de mayo de 2019 de estudiantes
ESPOL
POLÍGONO DE FRECUENCIAS ABSOLUTAS
14
12
12
Frecuencia Absoluta

10
8 8
8
6 6
6 5 5
4
2
0
[5 , 10) [10 , [15 , [20 , [25 , [30 , [35 ,
15) 20) 25) 30) 35) 40]

Estadística descriptiva 29
La Característica de Interés es la Edad
al 3 de marzo de 2011

POLÍGONO DE FRECUENCIAS RELATIVAS


1,00
0,90
0,80
Frecuencia Relativa

0,70
0,60
0,50
0,40
0,30 0,24
0,20 0,16 0,16
0,10 0,12 0,10 0,12
0,10
0,00
[5,10) [10,15) [15,20) [20,25) [25,30) [30,35) [35,40]

Estadística descriptiva 30
Ojiva

• Gráfico que presenta en el eje horizontal la característica


cuantitativa que se está investigando y en el eje
vertical la Frecuencia Relativa Acumulada

Estadística descriptiva 31
Pasos para graficar una ojiva

• 1)Determinar (k+1) valores


• 2)Luego conectarlos de manera sucesiva con trazos
continuos,
• 3) El primer punto tiene coordenadas (a1 , 0) donde a1 es
el extremo inferior de la Primera Clase;
• 4) El segundo punto tiene coordenadas  a 2 , Fn1  siendo a2 el
extremo inferior de la Segunda Clase;
 F2 
• 5) El tercer punto tiene coordenadas  3 n  a , y así
sucesivamente hasta llegar al penúltimo punto que tiene
 Fk 1 
como coordenadas  k n  ; siendo el último punto el que
 a ,

tiene coordenadas a k +1 , Fk  .
 n
• Finalmente, n =1
Fk

Estadística descriptiva 32
Distribución de frecuencia relativa
acumulada

OJIVA
1,00
Frecuencia Relativa Acumulada

0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0,00
5 10 15 20 25 30 35 40
El gráfico de la ojiva es continuo y creciente y Fk es igual a 1
n
Estadística descriptiva 33
Preguntas que son posibles responder
a través de una Ojiva

• ¿Qué porcentaje de estudiantes tiene una edad menor a


10 años?
• ¿Qué porcentaje de estudiantes tiene un edad superior a
21 años?
• ¿Cuál es la edad en la que la mitad de los estudiantes
tiene menos de ese valor(edad)?
• ¿Cuál es la edad de los estudiantes, de tal forma que el
25% de ellos tenga menos de esa edad?

Estadística descriptiva 34
Cuartiles

• Son los valores que dividen a las observaciones


ordenadas en forma ascendente de la muestra en 4
partes iguales.
• Es posible definir tres cuartiles

Estadística descriptiva 35
Primer Cuartil (Q1)

• Valor de X tal que nos mas del veinticinco por


ciento de las observaciones en la Muestra toman
valores menores o iguales que Q1.

Estadística descriptiva 36
Segundo Cuartil (Q2)

• Valor de X tal que nos mas del cincuenta por


ciento de las observaciones en la Muestra son
menores o iguales que Q2.

Estadística descriptiva 37
Tercer Cuartil (Q3)

• Valor de X tal que el setenta y cinco por ciento


de los elementos en la Muestra toman valores
menores o iguales que Q3.

Estadística descriptiva 38
Diagrama de Cajas como subproducto
de la Ojiva

• Una vez que se han determinado los Cuartiles


Muestrales, es posible obtener el denominado
Diagrama de Caja.

Libro Probabilidad y Estadística, Fundamentos y Aplicaciones (Segunda Edición)


Autor: Gaudencio Zurita Herrera

Estadística descriptiva 39
Ojiva y Diagrama de Caja

OJIVA y DIAGRAMA DE CAJA


1,00
Frecuencia Relativa

0,75
Acumulada

0,50

0,25

0,00
5 10 15 20 25 30 35 40

X(1)=6 X(50)=38

Estadística descriptiva 40
Utilidad de la Ojiva cuando se comparan dos
gráficos en los que tiene la misma característica
para dos muestras o poblaciones.

• Ingresos mensuales en dólares en dos comunidades.


• ¿En cuál quieres vivir?
Figura 1.9
Ojivas A y B para una variable X
Fi

1.00
Frecuencia Acumulada Relativa

0.75

A A’
0.50

0.25

0.00
X
Q1 Q2 Q3 Q1 Q2 Q3
Ojiva A Ojiva B

• SiEstadística
se tratara
descriptiva
de la nota de Estadística de dos paralelos diferentes. 41
• ¿Qué curso presenta mayor dificultad para aprobar?.
Quintiles

• Son los valores que dividen a las observaciones


ordenadas en forma ascendente de la muestra en 5
partes iguales.
• Es posible definir cuatro quintiles
• Así, el primer quintil representa al 20% de la muestra
que es menor o igual al valor del primer quintil.
• Así, el segundo quintil representa al 40% de la muestra
que es menor o igual al valor del primer quintil.

Estadística descriptiva 42
Quintiles en la Ojiva

1
Frecuencia Relativa Acumulada

0,8

0,6

0,4

0,2

0
1,2 1,26 1,32 1,38 1,44 1,5 1,56 1,62 1,68 1,74 1,8 1,86 1,92 1,98
Estatura

Estadística descriptiva 43
Deciles

• Son los valores que dividen a las observaciones ordenadas en


forma ascendente de la muestra en 10 partes iguales.
• Es posible definir nueve Deciles.
• Los Deciles Muestrales se los denota por D1, D2, D3, hasta D9.
• Se puede decir que cuando mas el diez por ciento de los
elementos en la Muestra toman valores menores o iguales al
Primer Decil D1;
• El veinte por ciento de los elementos en la Muestra toman
valores menores o iguales a D2; y,
• Así hasta llegar al Noveno Decil, D9, cuando el noventa por
ciento de las observaciones que conforman la Muestra toman
valores menores o iguales que D9.

Estadística descriptiva 44
Deciles en la Ojiva

1
Frecuencia Relativa Acumulada

0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
1,2 1,26 1,32 1,38 1,44 1,5 1,56 1,62 1,68 1,74 1,8 1,86 1,92 1,98
Estatura

Estadística descriptiva 45
Percentiles en la ojiva

• Son los valores que dividen a las observaciones


ordenadas en forma ascendente de la muestra en 100
partes iguales.
• Es posible definir noventa y nueve Percentiles.
• El uno por ciento de los elementos en la Muestra toman
valores menores o iguales que P1, que es el denominado
Primer Percentil de la Muestra; y,
• El noventa y nueve por ciento son menores o iguales
que P99 el Nonagésimo Noveno Percentil de la
Muestra.

Estadística descriptiva 46
1
0,99
0,98
0,97
0,96
0,95

Percentiles
0,94
0,93
0,92
0,91
0,9
0,89
0,88
0,87
0,86
0,85
0,84
0,83
0,82
0,81
0,8
0,79
0,78
0,77
0,76
0,75
0,74
0,73
Frecuencia Relativa Acumulada

0,72
0,71
0,7
0,69
0,68
0,67
0,66
0,65
0,64
0,63
0,62
0,61
0,6
0,59
0,58
0,57
0,56
0,55
0,54
0,53
0,52
0,51
0,5
0,49
0,48
0,47
0,46
0,45
0,44
0,43
0,42
0,41
0,4
0,39
0,38
0,37
0,36
0,35
0,34
0,33
0,32
0,31
0,3
0,29
0,28
0,27
0,26
0,25
0,24
0,23
0,22
0,21
0,2
0,19
0,18
0,17
0,16
0,15
0,14
0,13
0,12
0,11
0,1

Percentiles
0,09
0,08
0,07
0,06
0,05
0,04
0,03
0,02
0,01
0
Estadística descriptiva 47
1,2 1,26 1,32 1,38 1,44 1,5 1,56 1,62 1,68 1,74 1,8 1,86 1,92 1,98
Es procedente decir que

Q1 = P25
Q2 = D5 = P50
Q3 = P75

Estadística descriptiva 48
Medidas de Posición

• Los percentiles, deciles, quintiles y cuartiles son medidas


de posición, dentro de los estimadores y parámetros que
se calculan en la estadística descriptiva.

Estadística descriptiva 49
Cuantiles

• Se denominan Cuantiles a los Percentiles, Deciles y


Cuartiles.

• Existen los Cuantiles que denominaremos Enteros y


Decimales.

Estadística descriptiva 50
Recordar

• Un Cuantil no es un punto sobre el plano sino


una coordenada sobre el eje horizontal, por
tanto es un valor numérico; además los
Cuantiles no tienen que necesariamente ser
valores que pertenezcan a la Muestra.

Estadística descriptiva 51
Gracias

Estadística descriptiva 52

También podría gustarte