Está en la página 1de 8

Lorena Brun González. lorenabrun@unisinu.edu.

co

Estadı́stica descriptiva F Conceptos generales

Ejemplo:

1. Con la información entregada, identifica la población, la muestra y la variable estadı́stica evaluada en las siguientes
situaciones:

1.1 En una escuela se quiere saber cuál es el deporte más practicado por los alumnos. Se realiza una encuesta a cinco
alumnos de cada curso.

1.2 Se desea conocer cuál es la estatura de los alumnos de una escuela. Se miden 10 alumnos por curso.

1.3 Un fabricante de tornillos desea hacer un control de calidad. Para ello, toma 1 de cada 100 tornillos producidos y
analiza si son o no defectuosos.

2. Identifique la variable y clasifı́quela.

2.1 Un grupo de cientı́ficos desea conocer el I.Q. de un grupo de niños.

2.2 El director de una obra teatral desea conocer el color de ojos de un grupo seleccionado para el montaje

2.3 El director General del Colegio de Bachilleres desea conocer el ı́ndice de aprovechamiento de los alumnos de un
plantel, en la materia de Estadı́stica.

Variables cualitativas − − − Representación tabular

Una tabla de frecuencias es un arreglo tabular de las frecuencias con que ocurre cada caracterı́stica en que se han dividido
los datos.

1
Categorı́as fi fr fr %
A
B
.. .. .. ..
. . . .
Total n 1 100

Diagrama de barras

Se utiliza para graficar las frecuencias absolutas o relativas de una variable cualitativa, en el eje x situaremos las diferentes
categorı́as de las variable. En el eje de la ordenada (y) la frecuencia. Se levantan barras o columnas separadas de altura
correspondiente a la frecuencia adecuada.
Ejemplo Se muestran los registros del tipo de sangre de 200 cientı́ficos.

Tipo fi fr fr %
O 90
Tipo O A B AB A
Frecuencia 90 20 10 B 20
AB 10
Total 200 1

Distribución de frecuencias
100
80
Frecuencia

60
40
20
0

A AB B O

Tipo de sangre

Diagrama circular

Llamado también el gráfico de sectores, corresponde a la representación de los datos en una circunferencia. Es un gráfico
en forma de cı́rculo, donde las categorı́as se basan en una proporcionalidad entre la frecuencia y el ángulo central de la
circunferencia, de tal manera que a la frecuencia total le corresponde el ángulo de 360o .
Ejemplo: Se tiene la información del color del cabello de un grupo de 160 estudiantes de una institución. Los resultados se
presentan a continuación:

2
Categorı́as N de personas % ángulo
Rubio 34 21.25 =100*(34/160) 76.5o = (34 ∗ 360o )/160
Castaño 89 55.62 200.25o
Negro
Rojo 12 7.5 27o
Total 160

Diagrama circular Distribución de frecuencias

100
A

80
Rubio
AB

Frecuencia

60
Castaño B

40
Rojo

20
Negro
O

0
A AB B O

Tipo de sangre

Variables cuantitativas

Representación tabular

Proceso de Agrupamiento en Intervalos (Clases):


XCantidad de intervalos: [a; b) [Sturges: I = 1 + (3.3 log10 (n))]
XRango: R = X1 − Xn .
R
XAmplitud: A = I.
Linf +Lsup
XMarca de clase: es el punto medio de cada intervalo y se calcula para cada intervalo: Xi = 2

Intervalos=I fi fr fr % Fi FR FR % Xi
[X1 − X1 + A) f1 fi /n fr ∗ 100 F1 = f 1 Fi /n FR ∗ 100
F2 = f1 + f2

[Xn−1 − Xn−1 + A) fI FI = n 1 100


P P P
Total fi = n fr = 1 fr % = 100

Cuadro 1: Tabla de frecuencias para variables cuantitativas

Ejemplo
Se presentan las estaturas en metros de 98 estudiantes de una universidad.
1.48 1.62 1.64 1.63 1.68 1.61 1.73 1.50 1.78 1.60 1.92 1.72 1.65 1.58 1.65 1.55 1.65 1.56 1.69 1.72 1.56 1.68 1.58 1.70 1.75 1.63
1.68 1.59 1.75 1.63 1.78 1.59 1.67 1.80 1.70 1.57 1.72 1.85 1.80 1.70 1.86 1.55 1.58 1.65 1.65 1.76 1.62 1.71 1.60 1.57 1.59 1.75

3
1.52 1.74 1.73 1.68 1.64 1.68 1.48 1.72 1.70 1.60 1.52 1.63 1.57 1.86 1.61 1.67 1.76 1.86 1.72 1.65 1.50 1.68 1.83 1.57 1.80 1.50
1.58 1.58 1.75 1.59 1.79 1.76 1.78 1.72 1.91 1.54 1.93 1.68 1.70 1.60 1.74 1.48 1.53 1.73 1.76 1.88
XSolución:
Número de intervalos: I = 1 + (3.3 ∗ log(n)) = 1 + (3.3 ∗ log(98)) = 7.57
Rango: R = Xn − X1 = 1.93 − 1.48 = 0.45
R 0.45
Amplitud: A = I = 8 = 0.05625 = 0.06

Intervalos fi fr Fi FR % Xi
[1.48− ) 9
[ − ) 18
[ − ) 20
[ − )
[ − ) 19
[ − ) 8
[ − ) 5
[ − ) 3
Total

Ejercicio.
El gerente de una compañı́a de ventas de diferentes tipos de mercancı́as desea conocer el comportamiento de las llamadas
telefónicas durante los meses de marzo y abril del año en curso; por lo que le encomienda a su secretaria que realice esa
investigación. La secretaria obtuvo los siguientes datos, en número de llamadas por dı́a:
30, 38, 36, 35, 29, 28, 30, 35, 40, 48, 50, 20, 25, 56, 30, 27, 29, 46, 41, 31, 31, 31, 39, 28, 36, 37, 52, 44, 49, 52, 56, 58, 40, 39,
38, 40, 27, 24, 30, 32, 35, 38, 26, 25, 24, 60, 55, 48, 37, 31, 30, 22, 20, 24, 26, 23, 22, 28, 27, 48.
Construir la tabla de frecuencias. Analiza la tabla y contesta las siguientes preguntas:

1.1 Escribe el lı́mite inferior de la clase de mayor frecuencia

1.2 Escribe el lı́mite superior de la clase de menor frecuencia

1.3 ¿Qué porcentaje representa la clase de mayor frecuencia?

Representación gráfica 1

Histograma

Recomendados para muestras moderadas o grandes, es un gráfico de barras verticales pegadas con igual amplitud y centradas
en la marca de clase, para construirlo, se colocan en el eje vertical las frecuencias y en el eje horizontal los intervalos. Se
emplea para ilustrar muestras agrupadas en intervalos. Está formado por rectángulos unidos a otros, cuyos vértices de la
base coinciden con los lı́mites de los intervalos y el centro de cada intervalo es la marca de clase, la altura de cada rectángulo
es proporcional a la frecuencia del intervalo respectivo. Es para variables continuas.

4
Polı́gono de frecuencia

Gráfico de trazos, cerrado, que se hace uniendo los puntos medios superiores de un histograma. Para construirlo, se colocan
en el eje vertical las frecuencias o frecuencias relativas y en el eje horizontal las marcas de clase de la variable. Este gráfico
se utiliza para el caso de variables cuantitativas, tanto discretas como continuas, partiendo del histograma.

Resumen numérico

5
Medidas de tendencia central

Media aritmética: Pn
i=1 χi
X= (1)
n
Mediana 
 χ n+1 , si n es impar
 [ 2 ]



Med = (2)

 χ +χ
 [ n2 ] [ n2 +1] , si n es par.


2

Moda: La moda para datos no agrupados es el dato con mayor frecuencia absoluta.

Medidas de localización

Cuartiles

Son aquellos números que dividen a los datos en cuatro partes porcentualmente iguales. Cada una de estas partes contiene
el 25 % de los datos. Son tres y se representan por: Q1 , Q2 y Q3 .
El primer cuartil Q1 , es el valor en el cual o por debajo del cual queda aproximadamente un cuarto (25 %) de todos los
valores de la sucesión (ordenada); El segundo cuartil Q2 es el valor por debajo del cual queda el 50 % de los datos (Mediana),
el tercer cuartil Q3 es el valor por debajo del cual quedan las tres cuartas partes (75 %) de los datos.

Los cuartiles para datos no agrupados (ordenados), se calculan como sigue, Q1 = X n + 1 , Q2 = Me y Q3 = X 3(n + 1) . En
4 4
algunos casos la posición del cuartil no da un número entero, en estos casos se deben seguir las siguientes reglas:
Regla 1. Si el resultado posicional es un número entero, entonces el cuartil es igual al valor clasificado de esa posición.
Ejemplo. Sea n = 11. Q1 = X n+1 = X 11+1 = X3 . (El cuartil es entonces, el dato ubicado en la posición 3)
4 4

Regla 2. Si el resultado posicional es una fracción de mitad (2.5, 3.5, 4.5), entonces el cuartil es igual al promedio de los
X7 + X8
valores clasificados correspondientes. Ejemplo. Sea n = 9. Q3 = X 3(n+1) = X 4(9+1) = X7.5 =
4 4 2
Regla 3. Si el resultado obtenido no es un entero, ni una fracción de mitad, se redondea al entero más cercano y se selecciona
ese valor clasificado. Ejemplo. Sea n = 10 Q1 = X n+1 = X 10+1 = X2.75 = X3
4 4

Ejemplo. Considere los tiempos registrados por el empleado de una empresa de transporte para llegar a su trabajo. Calcular
el rango, la varianza, la desviación estándar, el coeficiente de variación y los cuartiles para estos datos. Interpretar.
39 29 43 52 39 44 40 31 44 35
Ejemplo
Complete la tabla correspondiente a la muestra del número de defunciones reportadas por dı́a, en una entidad de salud de
la ciudad.

6
Li − Ls fi Fi fr % Xi
10-12 6
-14 8 13
24
16-18 11
5 40

Interpretar.

Representación gráfica 2

Boxplot

Los Boxplots o diagramas de caja se construyen a partir de los cuartiles.

Se construye un rectángulo usando entre el primer y el tercer cuartil (Q1 y Q3 ).

La altura del rectángulo es el rango intercuartil RIC (Q3 − Q1 ).

La mediana es una lı́nea que divide el rectángulo.

De cada extremo del rectángulo se extiende con una recta hasta Q1 − 1.5RIC y Q3 + 1.5RIC .

Los valores más extremos que el largo de los brazos son considerados atı́picos.

El boxplot nos entrega información sobre la simetrı́a de la distribución de los datos.

Si la mediana no está en el centro del rectángulo, la distribución no es simétrica.

Son ùtiles para ver la presencia de valores atı́picos u outliers.

Diagrama de caja estatura de los estudiantes


1.9
Estatura de los estudiantes

1.8
1.7
1.6
1.5

7
8

También podría gustarte