Está en la página 1de 9

Estadística Descriptiva

Unidad 2
Descripción de Datos con Medidas Numéricas

Índice
Introducción
Estructura de Contenidos
Mapa Conceptual
2.1 Gráficas para datos categóricos y cuantitativos
2.2 Histogramas de frecuencias relativas
2.3 Diagrama de Pareto
2.4 Medidas de tendencia central
2.5 Medidas de dispersión
Actividades de afianzamiento
Recursos Bibliográficos

Introducción
En este apartado se manejará la presentación y la descripción de datos con medidas numéricas,
elementos que son de gran utilidad ya que el hecho de contar con métodos de organización y
presentación de los datos, nos permite conocer cómo se comportan estos entre los posibles valores de
la variable que se está trabajando.

Estructura de contenidos
Unidad 2: Descripción de datos con medidas numéricas
2.1 Gráficas para datos categóricos y cuantitativos.
a. Gráficas de sectores o de pastel
b. Gráfica de barras.
c. Gráficas de líneas.
d. Gráficas de puntos.
e. Diagramas de tallo y hojas.
2.2. Histogramas de frecuencias relativas.
2.3. Diagrama de Pareto.
2.4. Medidas de tendencia central.
a. Media, mediana, moda.
b. Cuándo usar la media o mediana.
2.5. Medidas de dispersión.

Mapa Conceptual
Unidad 2:
Descripción de datos
con medidas numéricas

2.1. 2.2. 2.3. 2.4.


Gráficas para datos Histogramas de Medidas de 2.5 Medidas
categóricos y cuantitativos Diagrama de Pareto de dispersión
frecuencias relativas tendencia central
a. Gráficas de sectores o de pastel a. Media, mediana,
b. Gráfica de barras. moda.
c. Gráficas de líneas.
d. Gráficas de puntos. b. Cuándo usar la media
e. Diagramas de tallo y hojas o mediana

2.1. Gráficas para datos categóricos


y cuantitativos
Uno de los objetivos principales de graficar es mostrar de forma visual, ordenada y sencilla la
información obtenida; una de las ventajas es que las gráficas nos ayudan a obtener conclusiones de
forma directa.

Elegir entre los distintos tipos de gráficas es muy importante, ya que cada una de ellas arroja distinta
información, de tal modo que utilizar el gráfico adecuado ayudará a interpretar los datos de forma
correcta.

a) Gráficas de sectores o de pastel.

Las gráficas de sectores se utilizan para mostrar porcentajes y proporciones. Son figuras en formas de
pastel, donde cada sector representa una división, el cual está expresado en porcentaje o división,
donde el total vale 100% o 3600.

Ejemplo: Se preguntó a 80 personas acerca de su preferencia de líquido para beber y se recabó la


siguiente información:
Líquido Número
personas
Té 15
Café 20
Agua 10
Refresco 35

Para encontrar el porcentaje que representa a cada líquido es necesario aplicar la regla de tres simple
de tal manera que:

80 personas encuestadas = 100%


15 personas que toman té = ¿qué porcentaje es?

Se aplica la fórmula:
Donde x = 18.75 %

Se repite la misma operación para todos los líquidos

Líquido Número
%
personas
Té 15 18.75
Café 20 25
Agua 10 12.5
Refresco 35 43.75

b) Gráfica de barras

En este tipo de gráfica, se requiere trabajar en el plano cartesiano, donde en el eje x siempre se colocan
los valores de la variable en cuestión, y sobre el eje y las frecuencias. Cada una de las barras
corresponde a un valor de la variable, y estas deben mantener la proporción en cuanto a anchura y
distancia entre las barras.

Ejemplo: Se obtuvo información sobre el número de vacunas que tienen los niños de 1 a 5 años en el
maternal de cierta zona escolar y se recabó la siguiente información

Edad Número
de niños
1 4
2 2
3 8
4 1
5 9

c) Gráfica de líneas

Los gráficos de líneas muestran una serie como un conjunto de puntos conectados mediante una sola
línea. Los gráficos de líneas se usan para representar grandes cantidades de datos que tienen lugar
durante un período continuado de tiempo.
Ejemplo: Se muestra el comportamiento a lo largo de 5 años acerca de las ganancias y pérdidas
promedio de un negocio local.

Año Venta
1 $65,932
2 $24,567
3 $89,673
4 $19,876
5 $93,987

d) Gráfica de puntos

Estas gráficas facilitan la observación de espacios vacíos y la forma en que se agrupan los datos, así
como la manera en que se distribuyen estos mismos a lo largo del eje x para analizar su
comportamiento.

Ejemplo: En cierta clínica se lleva un control acerca de los pacientes con epilepsia. Los siguientes datos
representan dos variables: Edad y Número de ataques epilépticos durante el último año que ha
presentado cada paciente.

e) Diagramas de tallo y hojas.

Este diagrama permite obtener a la vez la distribución de frecuencia de una variable, así como su
representación gráfica. Se construye separando en cada dato el último dígito de la derecha, al cual se le
constituye como la hoja, del bloque de cifras restantes que se consideran como tallo.

Para construir el diagrama de tallo y hojas, es necesario realizar los siguientes pasos:

1. Ordenar los datos.


2. Reducir los números decimales con base en las cifras que se requieren.
3. Realizar una tabla con dos columnas:
a. La primera columna es para el tallo, donde se registran en orden descendente, cada uno se escribe
solo una vez.
b. La segunda columna es para las hojas, en donde se registran en orden creciente junto al tallo
correspondiente.

Ejemplo: Se tienen los resultados de una prueba de aptitud aplicada a 40 alumnos de cierta escuela. Se
desea representar en un diagrama de tallo y hoja para visualizar de forma gráfica los resultados. Los
puntajes son los siguientes:

145 153 157 162 164 168 171 174 176 181
147 154 158 163 165 169 171 174 178 183
149 154 162 163 167 169 172 175 179 185
152 156 162 164 167 170 173 176 180 186

Solución:
1) Ordenar los datos:

145 147 149 152 153 154 154 156 157 158
162 162 162 163 163 164 164 165 167 167
168 169 169 170 171 171 172 173 174 174
175 176 176 178 179 180 181 183 185 186

2) En este caso no hay decimales, por lo que los dos primeros dígitos serán el tallo y el último la hoja.
Se puede observar que hay tres números que comienzan con 14, siete con 15, trece con 16, doce
con 17 y cinco con 18.

3) Para la tabla es necesario tener dos columnas:


a) En la primera se colocan los tallos ordenados de menor a mayor, en este caso: 14, 15, 16, 17, 18.
b) En la otra columna se registran todas las hojas de forma ordenada, junto al tallo correspondiente.

Tallo Hoja
14 579
15 2344678
16 122334457789
9
17 011234456689
18 01356

2.2. Histogramas de frecuencias relativas


Son gráficas de barras empleadas para resumir y mostrar el comportamiento que se presenta en un
conjunto de datos. En este caso, se representa la proporción general de valores de datos que caen en
cada intervalo. Si el 100% es igual a 1, todas las barras deben tener una altura de 0 a 1. Por lo tanto, las
alturas de todas las barras de nuestro histograma de frecuencia relativa deben sumar 1.

Ejemplo: Se tiene la tabla de las edades de pacientes que van al psicólogo en cierta clínica de salud:

8 10 11 15 16 17 17 21 23 24
24 25 25 26 27 28 30 32 38 46

Lo primero es agrupar los datos en clases del igual tamaño. Una clase es la división en intervalos
similares de un rango de datos, por lo que se requiere obtener el rango del conjunto de datos. Para esto,
al valor mayor se le resta el valor menor:
Es decir, el conjunto de datos tiene una amplitud de clase de 38 unidades. Si lo dividimos en dos partes
se tendría dos Clases de 19 unidades cada una, en donde en la primera clase estarían las edades entre
8 y 27 años (8+19) y en la segunda clase las edades entre 28 y 47 (28+19).

Para saber cuántas clases realizar en un conjunto de datos, se suele utilizar la siguiente fórmula:

Donde K es el número de clases y N es el número de datos que tenemos. Para el ejemplo:

Y se redondea al próximo entero, ya que los datos representan valores enteros, por lo que se tendrán 5
clases.

A continuación, se obtiene la amplitud de la clase, mediante la fórmula:

Para el ejemplo:

Y redondeando al próximo entero, se tendrá una amplitud de clase de 8 unidades.

Con esto, se realiza una tabla de Intervalos de edades, frecuencia y frecuencia relativa:

Intervalos de Frecuencia
Frecuencia
edades relativa
8-16 5 25%
17-25 8 40%
26 - 34 5 25%
34 - 42 1 5%
42 - 50 1 5%

Se grafica cada intervalo, y su frecuencia relativa:


2.3 Diagrama de Pareto
Es una herramienta de análisis que ayuda a tomar decisiones en función de prioridades, el diagrama se
basa en el principio enunciado por Vilfredo Pareto que dice:

"El 80% de los problemas se pueden solucionar, si se eliminan el 20% de las causas que los originan".

El diagrama de Pareto es un caso particular del gráfico de barras, en el que las barras que representan
los factores correspondientes a una magnitud cualquiera están ordenados de mayor a menor (en orden
descendente) y de izquierda a derecha.

Ejemplo: Un fabricante de accesorios plásticos desea analizar cuáles son los defectos más frecuentes
que aparecen en las unidades al salir de la línea de producción. Para esto, empezó por clasificar todos
los defectos posibles en sus diversos tipos. Posteriormente, un inspector revisa cada accesorio a medida
que sale de producción registrando sus defectos de acuerdo con dichos tipos. Al finalizar la jornada, se
obtuvo una tabla como la siguiente, donde la tercera columna muestra el número de accesorios que
presentaban cada tipo de defecto, es decir, la frecuencia con que se presenta cada defecto.

Tipo de defecto Detalle del problema Frecuencia


Desbalanceo El accesorio requiere contrapesos adicionales 2
Mal terminación Aparición de rebabas 7
Aplastamiento El accesorio se aplasta durante la instalación 20
Fuera de medida Ovalización mayor admitida 12
Mal alabeo Nivel de alabeo no aceptable 10
Incompleto Fala alguno de los insertos metálicos 7
Rotura El accesorio se quiebra durante la instalación 16
Mal color El color no se ajusta a lo requerido por el cliente 8
Ingeniero César Rovira
http://www.op-group.net/

Solución: Para realizar el Diagrama de Pareto, se ordenan los defectos de mayor a menor frecuencia y
se obtiene la frecuencia relativa y acumulada:
Frecuencia Frecuencia relativa
Tipo de defecto Frecuencia
relativa acumulada
Aplastamiento 20 24% 24%
Rotura 16 20% 44%
Fuera de medida 12 15% 59%
Mal alabeo 10 12% 71%
Mal color 8 10% 80%
Mal terminación 7 9% 89%
Incompleto 7 9% 98%
Desbalanceo 2 2% 100%

Se realiza una gráfica de barras de la frecuencia y una de línea de la frecuencia relativa acumulada.
2.4 Medidas de tendencia central
Indican cuál es el valor representativo central en el que los datos tienden a agruparse. Existen 3 medidas
de tendencia central:

a) Media, mediana, moda.

Media: Es el valor promedio de los datos.

O lo que es lo mismo:

Mediana: Es el valor que ocupa la posición central al ordenarse los datos y divide al grupo de números
en dos partes.

Moda: Es el valor más frecuente o que más veces se repite, en un conjunto de datos.

b) Cuándo usar la media o mediana.

Por lo general, la mediana se utiliza para interpretar datos cualitativos, que solo reflejan características
o cualidades. En cambio, la media se utiliza para dar resultados cuantitativos.

2.5 Medidas de dispersión


Indican cuánto se acercan o alejan los datos respecto de la media. Y existen dos medidas: varianza y
desviación estándar.

Varianza: Indica cuánto varían los datos respecto a la media.

Desviación estándar: Indica cuánto se desvían los datos respecto a la media.

Recursos Bibliográficos
García, P. A. 2014. La interpretación de los datos: una introducción a la estadística aplicada. Madrid, ES:
UNED - Universidad Nacional de Educación a Distancia. Recuperado de http://www.ebrary.com

Rodríguez, F. J., Rodríguez, J. E. 2016. Estadística para administración (2a. ed.). Distrito Federal, México:
Grupo Editorial Patria. Recuperado de http://www.ebrary.com

Sánchez, S. E. A., Inzunza, C. S., Ávila, A. R. 2015. Probabilidad y estadística 1. Distrito Federal, México:
Grupo Editorial Patria. Recuperado de http://www.ebrary.com

Sarabia, J. M., & Trueba, C. 2014. Problemas resueltos de estadística para las ciencias sociales. Madrid,
España: Difusora Larousse - Ediciones Pirámide. Recuperado de http://www.ebrary.com

También podría gustarte