Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La estadística descriptiva se encarga de la descripción de datos (es decir, de información recogida a partir de un estudio).
Por ejemplo, en un estudio demográfico sobre los nacidos en 2019 en Medellín, la estadística descriptiva se encargaría
de extraer los datos de la edad media de las madres. La estadística inferencial, en cambio, se ocupa de extrapolar los
datos extraídos de un estudio realizado sobre una muestra del conjunto total de datos para así aplicarlos al conjunto
completo, ya que en ocasiones la población total de la que extraer información es demasiado grande e inabarcable. Por
lo tanto, la estadística inferencial realiza un análisis a partir de la generalización de las muestras que estudia, mientras
que la descriptiva no lo hace.
Variables estadísticas
Se clasifican en:
1. Variables cualitativas: 2. Variables cuantitativas:
Se refieren a características o cualidades que no pueden Es la que se expresa mediante un número, por tanto se
ser medidas con números. Permiten clasificar o describir pueden realizar operaciones aritméticas con ella. Permiten
cada elemento de la muestra o población. cuantificar cada elemento de la muestra o población.
Pueden ser:
Cualitativa nominal Cualitativa ordinal Cuantitativa discreta Cuantitativa continua
Una variable cualitativa Una variable cualitativa Una variable discreta es Una variable continua es
nominal presenta ordinal presenta aquella que solo puede aquella que puede tomar un
modalidades no numéricas modalidades no numéricas, tomar un número finito de número infinito de valores
que no admiten un criterio en las que existe un orden. valores entre dos valores entre dos valores
de orden. cualesquiera de una cualesquiera de una
característica característica.
Ejemplo: El estado civil, Ejemplos: La nota en un Ejemplo: El número de Ejemplos: La altura de los 5
con las siguientes examen: bajo, básico, alto, hermanos de 5 amigos: 2, 1, amigos: 1.63, 1.72, 1.57,
modalidades: soltero, superior 0, 1, 3. 1.69, 1.75.
casado, separado,
divorciado y viudo.
L, S, S, S, M, X, J, J, L, V, V, V, S, L, S, J, J, S, M, J, X, X, L,
S, S, X, J, X, V, S, M, L, M, V, J, V, X, S, M, L, V, V, S, S, S.
Tipo de Variable
Ejemplo 2: Una prueba de inglés arrojo los siguientes resultados con respecto al nivel de lectura en este idioma de un
grupo de 40 estudiantes:
Tipo de Variable
Ejemplo: Un estudio hecho al conjunto de los 42 alumnos de una clase para determinar su grupo sanguíneo ha dado
el siguiente resultado:
Tipo de Variable
Grupo Sanguíneo fi Fi ni Ni °
A 12
B 8
AB 5
O 17
N= 42
15
10
0
A B AB O
A B AB O
Diagrama Circular: En un diagrama circular o de sectores los datos se representan en un círculo dividido en
sectores, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente.
360°
Ecuación diagrama de sectores: ∝= ∗ 𝑓𝑖
𝑁
El diagrama de circular se construye con la ayuda de un transportador de ángulos. Y se usa la frecuencia porcentual
para completar la gráfica. Se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables
cualitativas.
Pictograma: Un pictograma es un tipo de gráfico que representa mediante dibujos la característica estudiada. Éstos
representan las frecuencias relativas o absolutas de una variable cualitativa o discreta. Cada uno de los dibujos o
símbolos equivale a ciertas unidades de frecuencia relativa o absoluta. Cuantos más dibujos haya en cada categoría,
mayor será la frecuencia. Un pictograma se puede construir con escala o sin ella.
o En un pictograma con escala o pictograma proporcional, los símbolos usados tienen un tamaño
proporcional a las frecuencias que representan.
o En un pictograma sin escala, se le asigna un valor al símbolo usado y se repite hasta completar la
frecuencia de cada categoría.
Diagrama circular:
29%
40% A
AB
O
19%
12%
Pictograma
Serie 1
Tablas de contingencia:
Un método útil para clasificar los datos obtenidos en un recuento es mediante las tablas de contingencia.
En estadística, se emplean para registrar y analizar la asociación entre dos o más variables, habitualmente de naturaleza
cualitativa (nominales u ordinales). Se trata de tablas en cuyas celdas figuran probabilidades, y en la cual podemos
determinar unas probabilidades conociendo otras de la tabla.
Análisis de variables estadísticas cualitativas provenientes de diversas fuentes.
En la información que se presenta a diario en televisión, el internet, los periódicos y las revistas, se puede observar la
presencia de variables estadísticas cualitativas organizadas en tablas o representadas en diferentes tipos de gráficas.
Para analizar de manera adecuada las variables estadísticas cualitativas provenientes de diversas fuentes, se sugiere
prestar atención a los siguientes aspectos:
o Revisar el título de la tabla o gráfica o leer el contexto en el que aparece.
o Identificar la variable estadística representada y sus categorías.
o Determinar el tipo de tabla o gráfica.
o Identificar las frecuencias.
o Describir con una frase cada idea.
En el siguiente link podemos encontrar un artículo que nos habla sobre “El papel de la opinión publicada en la
prensa escrita colombiana antes del plebiscito del 2 de octubre de 2016”. En el encontramos diferentes tipos de
gráficas estadísticas y tablas de frecuencia. Tomemos un ejemplo.
https://palabraclave.unisabana.edu.co/index.php/palabraclave/article/view/8576/html
La opinión publicada sobre el plebiscito de 2016 en Colombia
por los diferentes medios escritos.
Notas del III bimestre del 4to grado, sección D; área de matemáticas; I.E. INEI
Notas fi Fi ni Ni °
9
10
11
12
13
14
15
16
N=
Datos agrupados: La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables
toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la
misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.
o Límites de la clase: Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
o Amplitud de la clase: La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase
o Marca de clase: La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el
intervalo para el cálculo de algunos parámetros. La marca de clase se representa por Ci.
Fórmula de marca de clase
Ejemplo 2: Los siguientes datos corresponden a los puntajes alcanzados en una prueba de aptitud de un grupo de
estudiantes
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44,
31, 26, 20, 11, 13,22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1. Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
2. Rango: Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número
de intervalos que queramos establecer. Es conveniente que el número de intervalos oscile entre 4 y 15.En este
caso, 48 - 3 = 45, incrementamos el número hasta 50, 50 \div 5 = 10 intervalos.
3. Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el
límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.
4. Ci es la marca de clase que es el punto medio de cada intervalo.
Ejemplo 3: Un grupo de atletas se está preparando para una maratón siguiendo una dieta muy estricta. A continuación,
viene el peso en kilogramos que ha logrado bajar cada atleta gracias a la dieta y ejercicios.
Solución:
1. Se localizan los valores menor y mayor de la distribución. En este caso son 0,2 y 19,8.
2. Rango: En este caso, 19,8 – 0,2 = 19,6; incrementamos el número hasta 20, 20 \div 4 = 5 intervalos.
3. Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el
límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.
4. Ci es la marca de clase que es el punto medio de cada intervalo.
Peso en kilogramos que ha logrado bajar cada atleta en la preparación
para una maratón
Clase Intervalo Ci fi Fi ni Ni
1 [0 – 4) 2 5 5 0,25 0,25
2 [4 – 8) 6 5 10 0,25 0,5
3 [8 – 12) 10 4 14 0,2 0,7
4 [12 – 16) 14 4 18 0,2 0,9
5 [16 – 20] 18 2 20 0,1 1
Total 20 1
Representación gráfica de variables cuantitativas
Representación de variables cuantitativas discretas:
Podemos representar los datos no agrupados en cuatro gráficos, diagrama de barras, polígono de frecuencias y
gráfico de sectores.
Diagrama de barras: usado para variables cuantitativas discretas. En el eje OX se señalan los valores de la variable
y en el eje OY los valores de la frecuencia absoluta. Se levantan barras de altura igual a la frecuencia absoluta.
Polígono de frecuencias: se obtiene uniendo los extremos superiores de las barras del diagrama.
Gráfico de sectores: es el resultado de dividir un círculo en sectores circulares de ángulos proporcionales a las
frecuencias absolutas de cada valor de la variable. Para calcular los grados de cada sector se divide la frecuencia
entre el número de datos y se multiplica por 360.Se utiliza para variable discreta y continua.
Gráfica de puntos: para hacer una gráfica de puntos sobre los pulsos, primero traza una recta numérica con el valor
mínimo, en el extremo izquierdo. Selecciona una escala y marca intervalos iguales hasta que alcances un valor
máximo. Por cada valor del conjunto de datos, coloca un punto sobre el valor en la recta numérica. Cuando un
valor aparece más de una vez, apila los puntos. Asegúrate de rotular el eje de manera que quede claro cuáles son
los datos.
Ejemplos: La siguiente información corresponde al número de goles convertidos por los jugadores de un equipo de
futbol, en el último torneo local.
0 1 2 3 4
0 1 2 3 4
0 1 2 3 1
0 1 2 0 1
0 1 2 5 1
Diagrama de barras:
Número de goles convertidos por los jugadores
de un equipo de futbol en el último torneo local.
9
8
Cantidad de jugadores
7
0
6
5 1
4 2
3
3
2
1 4
0 5
0 1 2 3 4 5
Número de goles
Gráfico de sectores Polígono de frecuencias
Número de goles convertidos por los jugadores Número de goles convertidos por los
de un equipo de futbol en el último torneo local. jugadores de un equipo de futbol en el último
torneo local.
4%
8% 8
24%
Cantidad de jugadores
0
12% 1 6
5
2
3 3
4 2
20% 1
5
32% 0 1 2 3 4 5
Número de goles
El polígono de frecuencias, fue tomado de la página de internet del periódico El Colombiano y nos habla sobre
el crecimiento de la economía en Colombia, trimestre a trimestre desde el 2015 al 2019.
https://www.elcolombiano.com/negocios/economia/pib-de-colombia-en-2019-KB12467287
Actividad #1 Variables estadísticas
1. La siguiente tabla de distribución de frecuencia contiene los resultados de un estudio sobre el medio de transporte
utilizado de 400 trabajadores de una empresa:
___________________________Titulo?_______________________________
Transporte fi Fi ni Ni %
Automóvil 150
Taxi 0.125
Autobús 250
Tren 0.7
Bicicleta 400 1.00 30
N= 400 1 100
a. Completa la tabla de distribución de frecuencias
b. ¿Qué porcentaje de trabajadores utilizan autobús o tren?
c. ¿Cuántos empleados utilizan la bicicleta y cuántos el Taxi?
d. Elabora un pictograma. (utiliza la fi)
e. Elabora diagrama circular. (utiliza el %)
f. ¿A qué tipo de variable corresponde la información?
2. Los siguientes datos corresponden a los desempeños alcanzados por los estudiantes del grado noveno, en un quiz de
matemáticas.
No presento, bajo, básico, alto, superior, No presento, bajo, No presento, superior, básico, bajo, alto,
superior, básico, bajo, alto, bajo, alto, básico, bajo, alto, bajo, básico, bajo, básico, superior, básico, bajo,
alto, superior, básico, bajo, alto, bajo, alto, básico, bajo, alto, básico, bajo, básico, alto.
a. Realizar una tabla de distribución de frecuencias.
b. ¿A qué tipo de variable corresponde la información?
c. ¿Cuántos estudiantes ganaron el quiz de matemáticas?
d. ¿Qué porcentaje de estudiantes perdieron o no presentaron el quiz de matemáticas?
e. Elabora un diagrama de barras.
3. Los siguientes son los resultados de una encuesta en la que se preguntó a 120 familias por la cantidad de teléfonos
celulares que tienen en su casa.
Cantidad de fi Fi ni Ni %
teléfonos
1 10
2 30
3 40
4 25
5 15
N= 120
a. Completa la tabla de distribución de frecuencias
b. Realizar un diagrama de barras.
c. Realizar un polígono de frecuencias.
4. Una tienda en línea registra el tiempo que tarda la empresa de correos en hacer llegar su mercadería a los clientes.
Los tiempos en días registrados son los siguientes:
2 2 3 4 5 5 7 9 10 13
14 14 15 17 19 21 21 25 28 29
30 30 30 30 33 34 35 35 36 36
37 38 38 39 40 40 40 41 42 42
45 45 45 48 50 50 52 54 56 58
a. Realizar una tabla de distribución de frecuencias para datos agrupados.
b. Realizar un histograma.
c. Realizar un polígono de frecuencia para datos agrupados.
d. ¿Cuál es el porcentaje de entrega de mercancía menor o igual a 30 días?
e. Sí la empresa tiene como política devolver el 5% del valor de la compra, a las entregas después de los 50
días, ¿a qué porcentaje de clientes debe hacer devolución de dicho dinero?