Está en la página 1de 40

Contenido

Temática 1: Muestreo y estadística descriptiva

1. ¿Qué es estadística?
2. Definiciones de varios autores
3. Terminología estadística
4. Etapas de la Investigación Estadística
5. Resúmenes estadístico
6. Métodos Tabulares y gráficos para resumir datos
7. Medidas de Tendencia Central
Temática 1: Conceptualización Estadística

1.1 ¿Qué es estadística?

Puede decirse que la estadística es un campo de la ciencia relacionado con:

1. La recopilación, organización, procesamiento, análisis y resumen de datos y


2. La obtención de inferencias acerca de un conjunto de datos (Población) cuando sólo se observa una
parte de ellos (Muestra)

En una forma práctica, la ESTADÍSTICA nos proporciona los métodos científicos para la recopilación,
organización, resumen, representación y ANALISIS de DATOS, o análisis de hechos, que se presenten a una
valuación numérica; tales como son: Características biológicas o sociológicas, fenómenos físicos, producción,
calidad, población, riqueza, impuestos, cosechas, etc.

La cualidad de CIENCIA de la Estadística se presta aún como polémica; pero es un hecho indiscutible el que
viene a constituir un auxiliar maravilloso y sobretodo insustituible para la investigación científica, al permitir
que se aproveche el material cuantitativo que arrojan las observaciones y los experimentos.

En sus comienzos, la Estadística sólo era aplicada al estudio y valuación numérica de manifestaciones
inherentes al ESTADO: De allí sale nombre, del vocablo latino “status”, que fue utilizado por primera vez en
Alemania, en el siglo XVII específicamente.

Cuando coloquialmente se habla de estadística, se suele pensar en una relación de datos numéricos
presentada de forma ordenada y sistemática. Esta idea es la consecuencia del concepto popular que existe
sobre el término y que cada vez está más extendido debido a la influencia de nuestro entorno, ya que hoy
en día es casi imposible que cualquier medio de difusión, periódico, radio, televisión, etc, que nos aborde
diariamente con cualquier tipo de información estadística sobre accidentes de tráfico, índices de
crecimiento de población, turismo, tendencias políticas, etc.

Sólo cuando nos adentramos en un mundo más específico como es el campo de la investigación de las
Ciencias Sociales: Medicina, Biología, Psicología, ... empezamos a percibir que la Estadística no sólo es algo
más, sino que se convierte en la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y
por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad
intrínseca, no puedan ser abordadas desde la perspectiva de las leyes deterministas. Podríamos, desde un
punto de vista más amplio, definir la estadística como la ciencia que estudia cómo debe emplearse la
información y cómo dar una guía de acción en situaciones prácticas que entrañan incertidumbre.
1.2 Definiciones de varios autores

1. Ardila (2007). Conjunto de métodos, técnicas y herramientas que se utilizan para la


recolección, procesamiento, análisis e interpretación de datos o información.
2. Bacchini (2007). Aplica el método científico con el fin de medir la incertidumbre de los
fenómenos aleatorios. Su objetivo principal es analizar datos números para obtener
conclusiones que permitan tomar decisiones racionales.
3. Núñez (2007). Disciplina científica que observa la realidad, construye datos cuantitativos,
los analiza y ofrece conclusiones numéricas confiables.
4. Bargas y Camargo (2006). Rama de la matemática que se encarga de la recopilación,
organización, presentación, análisis e interpretación de una muestra de datos tomados de
una población.
5. Johnson y Kuby (2004). Es el lenguaje universal de la ciencia. Ciencia que se ocupa de
recolectar, describir e interpretar datos.
6. Lind, Marchal y Mason (2004). Es la ciencia que se ocupa de recolectar, organizar,
presentar, analizar e interpretar datos para ayudar a una toma de decisiones más efectiva.

1.2 Terminología Estadística

El primer campo de actuación de la estadística, como se ha visto, es la demografía. De esta ciencia se ha


tomado la nomenclatura población, individuo, etc…

 Población: Grupo de individuos con una característica en común. Conjunto de todas los elementos
o unidades de interés para un estudio determinado. (Díaz, 2013)

Adicionalmente, los elementos deben ser observables y susceptible de ser medida.

• Muestra: Subconjunto de elementos de la población. (Diaz 2013) Tiene la característica


fundamental de ser representativa de la población.

• Elemento muestral: Es el objeto del cual se desea obtener información

Componentes de una población

a) Unidad de Análisis (UA): Es la unidad definida por el investigador para realizar mediciones.
Se conoce con el nombre de elemento muestral.

b) Unidad de Observación (UO) o unidad muestral: Es la unidad dimensional para evaluar la


variable de estudio.
La unidad de observación debe estar perfectamente definida, es decir, su descripción debe
ser tal que no permita la posibilidad de incluir unidades que no corresponda al estudio.

• Marco Poblacional / muestral: Es una lista donde están identificados todos los elementos de la
población / muestra.

• Variable: Característica de interés sobre cada elemento individual de una población o muestra.

• Datos: Conjunto de valores recolectados para la variable de cada uno de los elementos que
pertenecen a una población o muestra

Se llama población al conjunto de todos los elementos cuyo conocimiento interesa. Cada uno de esos
elementos es un individuo. Si se está estudiando el resultado de ciertos experimentos químicos, cada uno de
esos experimentos será un individuo estadístico y el conjunto de todos los posibles experimentos en esas
condiciones será la población.

Población finita: Cuando el número de elementos que la forman es finito, por ejemplo el número de
alumnos de un centro de enseñanza, o grupo clase.

Población infinita: Cuando el número de elementos que la forman es infinito, o tan grande que pudiesen
considerarse infinitos como por ejemplo si se realizase un estudio sobre los productos que hay en el
mercado. Hay tantos y de tantas calidades que esta población podría considerarse infinita.

a) Parámetro: Valor numérico que se resume todos los datos de una población completa. Se
utilizan letras griegas para simbolizar un parámetro como lo son µ y σ.

b) Estadístico: Valor numérico que resume los datos de una muestra. Se utilizan letras del
alfabeto español para simbolizarlas como lo son 𝑋̅ y S.

La Estadística se divide en:

1. Descriptiva e
2. Inferencial

La estadística descriptiva analiza, estudia y describe a la totalidad de individuos de una población. Su


finalidad es obtener información, analizarla, elaborarla y simplificarla lo necesario para que pueda ser
interpretada cómoda y rápidamente y, por tanto, pueda utilizarse eficazmente para el fin que se desee.

El proceso que sigue la estadística descriptiva para el estudio de una cierta población consta de los
siguientes pasos:

 Selección de variables para ser estudiadas.


 Mediante encuesta o medición, obtención del valor de cada individuo en los caracteres
seleccionados.
 Elaboración de tablas de frecuencias, mediante la adecuada clasificación de los individuos dentro
de cada carácter.
 Representación gráfica de los resultados (elaboración de gráficas estadísticas).
 Obtención de parámetros estadísticos, números que sintetizan los aspectos más relevantes de una
distribución estadística.

La estadística descriptiva trabaja con todos los individuos de la población. La estadística inferencial, sin
embargo, trabaja con muestras, subconjuntos formados por algunos individuos de la población. A partir del
estudio de la muestra se pretende inferir sobre algunas características de la población con base en una
muestra, buscando probar la validez de los resultados.

1.3 Etapas de la Investigación Estadística

El proceso de investigación estadística se fundamenta en los siguientes pasos:

1. Formulación del problema.

2. Diseño del experimento.

3. Recolector de datos.

4. Organiza y clasificar de datos.

5. Análisis y conclusiones

En los siguientes videos encontrará información relacionada

https://www.youtube.com/watch?v=fRvL6WGEF9U
https://www.youtube.com/watch?v=HA68b_KVn1k
https://www.youtube.com/watch?v=OPkGxnEXLsI

2 LAS VARIABLES
Se define como una VARIABLE, a una característica observable o a un aspecto discernible en un objeto de
estudio, que puede adoptar diferentes valores o expresarse en varias categorías, o a una característica
observable ligada, con una relación determinada, a otros aspectos observables.
TIPO DE DATOS

Naturaleza Categórica Numérica

a. Naturaleza: Cualitativa a. Naturaleza: Cuantitativa


b. Categorías o atributos b. Variables que se expresan
c. Las operaciones aritméticas numéricamente
no son significativas c. Las operaciones obtenidas
son promedios, sumas,
multiplicaciones,…
Desde el punto de vista de su naturaleza, se habla de variables CUALITATIVAS para referirse a aquellas cuyos
elementos de variación tienen un carácter cualitativo, no susceptible de observación medible
numéricamente y de variables CUANTITATIVAS como aquellas cuyas propiedades pueden presentarse en
diversos grados o intensidades de carácter numérico.

De acuerdo con su naturaleza matemática, se diferencian las variables cuantitativas en DISCRETAS Y


CONTINUAS, siendo las primeras aquellas que están definidas sobre recorridos finitos o infinitos
numerables; no pueden tomar valores intermedios entre dos valores dados. Las continuas son aquellas
definidas sobre recorridos infinitos no numerables; pueden tomar cualquier valor dentro de un recorrido
dado.

Para clasificar o categorizar variables, se utilizan diferentes tipos de escalas, siendo las más comunes las
NOMINALES, las ORDINALES, las DE INTERVALO, y las DE RAZON, cuyo uso depende básicamente de los
objetivos del estudio y de la naturaleza de la variable.

Ejemplo:

En cada una de las siguientes situaciones, identificar la variable de estudio. Determinar si es cualitativa o
cuantitativa.

• En un barrio de la ciudad se aplicó una encuesta para conocer el consumo, en centímetros cúbicos,
del servicio de gas natural.
• El alcalde de la ciudad quiere revisar la situación de violencia intrafamiliar en las familias de estrato
3, 4, 5.
• El número de hermanos de cada jugador del equipo de futbol.
• En un café gourmet, se decidió preguntar por el tipo de variedad que más consumen sus clientes.
Solución

1. La variable es consumo de gas. Es cuantitativa y continua.


2. La variable es situación de violencia. Es cualitativa.
3. La variable es número de hermanos. Es cuantitativa y discreta.
4. La variable es variedad de café. Es cualitativa.

2.1 La Medición

En el sentido más corriente y elemental, el concepto de medir es utilizado para significar la asignación de
valores numéricos o dimensiones a un objeto u objetos mediante la utilización de determinados
procedimientos. En términos más estrictamente metodológicos, la medición consiste sustancialmente en
una observación cuantitativa, atribuyendo un número a determinadas características o rasgos del hecho o
fenómeno observado. Esto no presenta mayores inconvenientes si se trata de medir aspectos materiales y
morfológicos de los objetos de estudio; la dificultad aparece cuando se desean expresar numéricamente
aspectos más evanescentes e intangibles.

El nivel de medida o escala de medida, expresiones aceptadas casi universalmente, está formado por un
conjunto de numerales distintos y un conjunto de modalidades distintas relacionadas biunivocamente. Se
suelen distinguir cuatro niveles de medición que dan lugar a cuatro niveles de escalas: nominal, ordinal o de
orden jerárquico, de intervalos y de razón o cociente. Ahora bien, el tipo de escala estará dado, según sea
verificable uno u otro tipo de relación.

Escalas o niveles de medición: Grado de precisión de cómo se expresa la medida de una variable. El
investigador construye las categorías de la variable y ello a su vez determina la escala de medición
apropiada.

El tipo de variable y la escala de medición determinan los métodos estadísticos que se emplearán para
analizar los datos.

Escala Escala Escala de Escala de


Nominal Ordinal Intervalos Razón

Mayor
precisión y
confiabilidad
TIPO DE DATOS

Naturaleza Categórica Numérica

Escalas de
medición Razón
Nominal Categórica Intervalo

Dicotómicas
Discreta
Policotómicas
Continua

2.2 La Escala Nominal


En el caso del nivel nominal de medición, las observaciones acerca de una variable cualitativa sólo se
clasifican y se cuentan. No existe una forma particular para ordenar las etiquetas.

Consiste en clasificar objetos o fenómenos, según ciertas características, tipologías o nombres, dándoles una
denominación o símbolo, sin que implique ninguna relación de orden, distancia o proporción entre los
objetos o fenómeno. La medición se da a un nivel elemental cuando los números u otros símbolos se usan
para la distinción y clasificación de objetos, persona o características. Cuando se utilizan números para
representar las diferentes clases de una escala nominal, estos no poseen propiedades cuantitativas y sirven
solamente para identificar las clases.

Ejemplo:

Cuando un producto se rotula de acuerdo al cumplimiento de las especificaciones de diseño como


"conforme y no conforme" o "crítico, grave, y menor". No se obtienen valores numéricos y no se puede
realizar un orden de las observaciones con sentido.

Resumiendo, el nivel nominal tiene las siguientes propiedades:


 La variable de interés se divide en categorías o resultados.
 No existe un orden natural de los resultados.

Lind. Estadística aplicada a los negocios y la economía. McGraw-Hill Interamericana, 2005.

2.3 La Escala Ordinal

El nivel inmediato superior de datos es el nivel ordinal.

Llamada también escala de orden jerárquico, con ella se establecen posiciones relativas de los objetos o
fenómenos en estudio, respecto a alguna característica de interés, sin que se reflejen distancias entre ellos.
Puede suceder que los objetos de una categoría de las escala no sean precisamente diferentes a los objetos
de otra categoría de la escala, sino que están relacionados entre sí. Los numerales empleados en las escalas
ordinales no son cuantitativos, sino que indican exclusivamente la posición en la serie ordenada y no "cual
es" la diferencia entre posiciones sucesivas de la escala.

Ejemplo:

Suponga que a los clientes en un almacén se les hace unas preguntas para valorar la calidad del servicio. Los
clientes valoran la calidad de acuerdo a las siguientes respuestas: 1 (excelente), 2 (bueno), 3 (regular), 3
(malo) 4 (pésimo). Estos datos son ordinales. Note que una valoración de 1 no indica que el servicio es dos
veces mejor que cuando se da una valoración de 2. Sin embargo podemos decir que la valoración de 1 es
preferiblemente mejor que 2, y así en los demás casos.

En resumen, las propiedades del nivel ordinal de los datos son las siguientes:

 Las clasificaciones de los datos se encuentran representadas por conjuntos de etiqueta o nombres
(alto, medio, bajo), las cuales tienen valores relativos.
 En consecuencia, los valores relativos de los datos se pueden clasificar u ordenar.

2.4 La Escala de Intervalo

El nivel de intervalo de medición es el nivel inmediato superior. Incluye todas las características del nivel
ordinal, pero, además, la diferencia entre valores constituye una magnitud contante. Un ejemplo de nivel de
intervalo de medición es la temperatura.

Representa un nivel de medición más preciso, matemáticamente hablando, que las anteriores; no solo se
establece un orden en las posiciones relativas de los objetos o individuos, sino que se mide también la
distancia entre los intervalos o las diferentes categorías o clases. En este caso, la medición se ejecuta en el
sentido de una escala de intervalo; esto es, si la asignación de números a varias clases de objetos es tan
precisa que se sabe la magnitud de los intervalos (distancias) entre todos los objetos de la escala, se ha
obtenido una medida de intervalo. Una escala de intervalo está caracterizada por una unidad de medida
común y constante que asigna un número real a todos los pares de objetos en un conjunto ordenado. En
esta clase de medida, la proporción de dos intervalos cualesquiera es independiente de la unidad de medida
y del punto cero. En una escala de intervalo, el punto cero y la unidad de medida son arbitrarios.

Ejemplo:

Suponga que se está interesado en la temperatura del fundido de acero. Se toman cuatro lecturas cada dos
horas: 2050, 2100, 2150 y 2200 ° F. Obviamente los datos pueden ser ordenados (semejante a los datos
ordinales) en orden ascendente de temperatura indicando temperatura más fría, menos fría, y así
sucesivamente. Además, las diferencias entre los valores ordenados pueden ser comparadas. Aquí el
intervalo entre los valores de los datos 2050 y 2100 representan un incremento en la temperatura de 50°F, y
así los demás intervalos. Hay que tener en cuenta que en esta escala no hay un cero absoluto o real, el cero
es arbitrario; por tanto no se puede decir que 76°F es el doble de temperatura que 38°F.

En resumen, las propiedades de los datos de nivel de intervalo son las siguientes:

1. Las clasificaciones de datos se ordenan de acuerdo con la cantidad de características que poseen.
2. Diferencias iguales en la característica representan diferencias iguales en los números asignados a
las clasificaciones.
3. El punto cero representa la ausencia de características y la razón entre dos número es significativa

2.5 La Escala de Razón


Todos los datos cuantitativos son registrados en el nivel de razón de la medición. El nivel de razón es el más
alto. Posee todas las características del nivel de intervalo, aunque, además, el punto 0 tiene sentido y la
razón entre dos números es significativa. Ejemplos de la escala de razón de medición incluyen salarios,
unidades de producción, peso, cambios en los precios de las acciones, la distancia entre sucursales y la
altura. El dinero ilustra bien el caso. SI tiene cero dólares, entonces no tiene dinero.
TALLERES

Primer punto: El gerente de Mac Donald solicitó una muestra de 1.960 personas de la ciudad de Bogotá,
estrato 4 para ingresar al mercado colombiano con nuevo tipo de hamburguesa. De los 1.960 que
participaron en la muestra, 1.176 informaron que comprarían el producto.

a. De acuerdo a esta información, ¿Cuál sería el porcentaje de aceptación entre la población?


b. Es un ejemplo de: ¿Estadística descriptiva o Estadística inferencial?

Segundo Punto: Un laboratorio de control de calidad de una empresa quiere lanzar al mercado un nuevo
ambientador en atomizador; seleccionó cincuenta apartamentos de una urbanización para determinar el
tiempo de permanencia del aroma.

a. Defina la población (tamaño, unidad de análisis)


b. ¿Cuál es la muestra?
c. ¿Cuál es la variable?
d. ¿De qué tipo es la variable?

Tercer punto: En los siguientes enunciados diga si es finita o infinita las siguientes poblaciones.

Cerrojos producidos por una fábrica en un día.


Resultados obtenidos en sucesivas tiradas de una moneda.
Habitantes de la ciudad de Ibagué.
Acciones diarias vendidas en la bolsa de valores.
Papeletas extraídas de una en una, en extracciones con remplazamiento.

Cuarto Punto: Para afianzar conocimientos teóricos efectúe la siguiente clasificación de acuerdo al siguiente
cuadro. Sea específico en la clasificación de las variables cualitativas. Ver tabla 1

Quinto punto: En las siguientes situaciones, indique es la población (P) y cuál es la muestra (M).

• Toneladas de plátano producidas en Colombia anualmente. ( )


• Número de hijos por familia en la región A. ( )
• Pulgadas de precipitación en Barranquilla durante 6 meses. ( )
• Rendimiento académico de los estudiantes de tercer semestre de la Universidad Cooperativa de
Colombia en el primer semestre de este año. ( )
• Número de habitantes de Cali. ( )
• Estudiantes matriculados en una Institución de Educación Superior. ( )
• Inspección de cada artículo ensamblado. ( )
• Inspección de cada decimo artículo ensamblado. ( )
Tabla 1

VARIABLE Cualitativa Discreta Continua Nivel de medición

Numero de artículos defectuosos producidos por dia


Clasificación según estado conyugal
Ingresos mensuales
Gastos en alimentación
Tasa anual de desempleo
Clasificación según el grado de escolaridad
Ventas diarias de un artículos ($)
Clasificación según ocupación
Peso en kilogramos de una persona
Tasa mensual de accidentalidad ocupacional en un sector
de la economía
Niveles de contaminación por ruido
Número de camas autilizadas por día en una clínica
Clasificación según genero
Número de auditorías realizada por año en una empresa
Demanda semanal de un producto
Número de estudios de crédito realizados por mes por una
entidad financiera

Costo de producción anual de un producto

Clasificación según cargo que se ocupa en una empresa


Saldos en cuentas de ahorros

Sexto Punto: Diga si las siguientes afirmaciones corresponden a estadística descriptiva o estadística
inferencial.

a) Describir los grupos en términos de promedio de estatura


b) Determinar la probabilidad de que muestras de observaciones sean solo el resultado de
variaciones de azar.
c) Encontrar una diferencia consistente entre dos métodos específicos de enseñanza.
d) Determinar la vida media de lámparas producidas por determinada fabrica.
e) Analizar la conducta de un grupo escolar frente a una prueba de lectura.

Séptimo punto: APLICACIÓN DE CASOS. CASO DE LA GESTION DEL GOBIERNO

El alcalde de un pequeño pueblo, el Dr. Fernández, se siente preocupado por ciertos comentarios que
rondan en la calle, en los cuales, lo critican de haberse desempeñado mal en el cargo. El asesor de imagen
cree que estas conjeturas son falsas, y propone al Centro de Planeación que realice una encuesta sobre
algunas familias (Según el DANE, el pueblo cuenta con 1.500 familias) con el propósito de obtener cierta
información de la gestión del gobierno actual.

La encuesta presentada por planeación fue la siguiente:

1. Califique de 1 a 5 la gestión del gobierno municipal (Siendo 1 el menor valor y 5 el máximo).

_________________________

2. Marque con una X. En cuál de las siguientes áreas el gobierno presento la mejor gestión:

1. Economía
2. Obras civiles
3. Servicios Públicos
4. Eventos culturales

3. ¿Aprobaría usted la reelección del alcalde?

Sí _____ No_____

4. ¿Cuántos empleos cree usted que generó la Alcaldía municipal en el período actual de mandato?
___________________________

La información recolectada se muestra en la siguiente tabla:

Familia Valoración Áreas Reelección Empleos


1 3 Economía Si 150
2 3 Eventos culturales No 0
3 4 Eventos culturales Si 200
4 5 Economía Si 350
5 5 Servicios Públicos Si 250
6 4 Eventos culturales No 100
7 2 Economía No 100
8 1 Servicios Públicos No 20
9 5 Obras Civiles Si 240
10 1 Economía No 25
11 3 Eventos culturales No 100
12 4 Servicios Públicos No 0
13 5 Economía Si 250
14 5 Servicios Públicos Si 450
15 4 Economía Si 100
16 3 Servicios Públicos No 0
17 5 Eventos culturales Si 150
18 5 Economía Si 50
19 3 Eventos culturales No 20
20 4 Servicios Públicos Si 300
21 2 Economía No 120
22 2 Obras Civiles No 10
23 5 Eventos culturales Si 410
24 1 Eventos culturales No 50
25 2 Eventos culturales No 0
26 5 Economía Si 150
27 4 Eventos culturales Si 20
28 4 Eventos culturales Si 300
29 5 Economía Si 400
30 3 Eventos culturales No 250

El departamento de planeación lo contrata a usted para que resuma la anterior información en


tablas de frecuencias, e interprete los resultados sobre las 30 familias encuestadas. Además,
conteste las siguientes preguntas:

a. ¿Qué tipo de variables puede identificar en la encuesta?

b. ¿Qué tipo de tablas y por qué, recomendaría utilizar para el resumen de los datos en cada
pregunta?

c. Defina, ¿cuál es la población, la muestra y el fenómeno estudiado por el departamento de


planeación?

d. ¿Qué puede concluir de los resultados de la encuesta?

e. ¿Cree usted que la encuesta permite resolver todas las dudas sobre la gestión del gobierno
del pueblo? Sustente.
3 Métodos Tabulares y gráficos para resumir datos

Descripción de datos

Métodos tabulares Métodos gráficos

*Distribuciones de frecuencia a) Gráficos de Barras


b) Gráficos circulares o de pastel
a)Distribuciones de c) Histogramas
frecuencia relativa d) Ojivas
b) Distribuciones de e) Polígonos de frecuencia
frecuencia acumulada f) Diagrama de caja Box-Plot
*Tabulaciones cruzadas (2 variables) g) Gráficos de líneas ( Series de tiempo)

3.1 Caracterización de variables cualitativas


Caracterizar una variable significa describir su comportamiento en la población, según algunos parámetros
establecidos. De acuerdo con el tipo de variable estadística que se debe estudiar existen distintas técnicas
para caracterizarla.

Ejemplo:

Una agencia de noticias quiere saber cuál es el medio de comunicación por el cual se informan las personas,
sobre las noticias del país. Para ello, realizó un estudio a cuarenta personas a quienes se les preguntó por su
medio de información de noticias preferido. Se obtuvo la siguiente lista de datos.

Radio Televisión Televisión Internet Televisión Prensa


Televisión Radio Radio Prensa Radio Televisión
Radio Internet Televisión Radio Televisión Internet
Radio Televisión Prensa Televisión Radio Prensa
Televisión Radio Televisión Prensa Radio Televisión
Radio Prensa Prensa Televisión Radio Televisión
Televisión Internet Radio Prensa Radio

El tipo de variable que se registra en este estudio es cualitativa, puesto que pregunta por el medio de
información.
El estudio de una variable cualitativa requiere de la incorporación de algunos criterios, de tal manera que al
obtener una lista de preferencias, cualidades o gustos, se pueda analizar su comportamiento en la
población. Para caracterizar una variable cualitativa se utilizan tres herramientas.

1. Tablas de frecuencias
2. Representaciones gráficas

Como se indicó anteriormente, los datos se clasifican en cualitativos o cuantitativos. Los datos cualitativos
emplean etiquetas o nombres para determinar categorías de elementos iguales. Los datos cuantitativos son
números que indican cuánto o cuántos.

En este capítulo se presentan los métodos tabulares y gráficos empleados para datos cualitativos y
cuantitativos Los resúmenes gráficos o tabulares de datos se encuentran en reportes anuales, en artículos
en los periódicos y en estudios de investigación. Todo el mundo se encuentra con este tipo de
presentaciones. Por tanto, es útil saber cómo se hacen y se interpretan. Se empezará con los métodos
tabulares y gráficos para resumir datos que se refieren a una sola variable. En la última sección se
introducen los métodos para resumir datos cuando lo que interesa es la relación entre dos variables.

Los paquetes modernos de software para estadística proporcionan muchas posibilidades para resumir datos
y elaborar presentaciones gráficas. Minitab y Excel son dos paquetes muy empleados.

Una distribución de frecuencia es un resumen tabular de datos que muestra el número (frecuencia) de
elementos en cada una de las diferentes clases. Las clases deben ser mutuamente excluyentes. +

Proceso estadístico

Recolectar Clasificar Organizar Analizar Interpretar

Distribución de Frecuencia

3.2 METODOS TABULARES VARIABLES CUALITATIVAS

DISTRIBUCIONES DE FRECUENCIA

La construcción de una tabla de frecuencia para datos cualitativos requiere solo del conteo del número de
elementos o individuos que caen dentro de cierta clase o categoría.
Tablas de frecuencias. Una tabla de frecuencia contiene:

a. Clases: Que corresponden a opiniones, gustos, preferencias, cualidades o características.

b. Frecuencia: Es el número de datos que pertenece a cada clase. La frecuencia se simboliza con la
letra f. El conteo de la frecuencia de cada clase de puede registrar mediante marcar en grupos.

c. Frecuencia Relativa: Es el cociente entre la frecuencia y el número total de datos, se simboliza hi.
La frecuencia relativa representa un porcentaje, que se haya multiplicado por 100 al cociente
indicado de la frecuencia relativa.

La siguiente tabla de frecuencias corresponde a los datos de la variable medio de comunicación del ejemplo:

Tabla de distribuciones de frecuencia de los medios de información

Es necesario interpretar la información contenida en las tablas de frecuencia, para deducir cuales son las
principales características de la variable en estudio.

Por ejemplo, en la tabla anterior elabore dos conclusiones. Se puede apreciar que:

3.3 MÉTODOS O REPRESENTACIONES GRÁFICAS

Representaciones
gráficas
Cuantitativas Cuantitativas

 Gráfico de Barras  Histograma


 Gráfico Circular o de Pastel  Polígono de Frecuencia
 Diagrama de Barras Estratificado  Ojivas
 Diagrama de Tallo y Hojas
 Diagrama de Puntos
 Diagrama de Box-Plot
 Lineal
Un gráfico estadístico es un resumen visual de la tabla de frecuencias. Hay varios tipos de representaciones
gráficas para las variables cualitativas: Los diagramas de barras, los diagramas circulares, entre otros.

3.3.1 Presentación de la información


Anteriormente se mencionó que la organización y el resumen de la información son dos procesos distintos
que se ejecutan en forma independiente. Ya se ha desarrollado todo cuanto tiene que ver la organización de
la información, se verá ahora lo que implica el resumen o presentación de la información. Se trata pues de
conocer algunas técnicas de construcción de gráficas, que es la mejor manera para resumir una
investigación estadística.

A continuación, se tratarán las partes más fundamentales de una gráfica y los aspectos a tener en cuenta
para su construcción, luego se presentarán los distintos tipos de gráficas usadas más comúnmente en
estadística entre las cuales se encuentran el histograma, el polígono de frecuencias, la ojiva, os gráficos de
puntos, lineales, de barras y circulares y los pictogramas.

Componentes de una gráfica

Cuando se diseña una gráfica, sea esta cual fuere, deben tenerse en cuenta ciertos aspectos con el fin de
mejorar su apariencia y mostrar con claridad lo que se quiera que ella refleje.

Una gráfica siempre debe poseer un título que indique la descripción del contenido de ella. En muchas
ocasiones, es importante indicar la escala con la cual se trabajó. Es decir, identificar los ejes coordenados (X
y Y) e indicar sus magnitudes correspondientes. La escala se aplica para saber la dimensión del fenómeno
graficado. Otro aspecto importante a tener en cuenta es la fuente de información, que indique de donde
han sido tomados los datos incluyendo el tipo de publicación, el año de registro y otros indicadores que
resulten importantes para la investigación.

La forma y el tipo de la gráfica que se seleccione depende en gran parte del investigador o de quien la
elabora, sin embargo debe tenerse en cuenta para quien va dirigida esta, el lugar de exposición y otros
factores de logística que intervienen en la decisión del mejor diseño. Existen ciertos principios generales que
se debe tener en cuenta en el logro de una buena gráfica:

 Si en la investigación se tienen varias gráficas, estas deben estar enumeradas en forma consecutiva.
 Toda gráfica debe tener un título que aclare su contenido.
 En los diagramas, las líneas de la ordenada y la abscisa que llevan escala, deben ser más gruesas
que las demás.
 La mejor grafica es la más sencilla. Evite saturar la gráfica de datos o textos innecesarios. Haga uso
de sólo lo estrictamente necesario.
 La gráfica no sustituye el cuadro o la tabla, debe ser el complemento.
 Toda grafica debe ir acompañada de convenciones para identificar las características que se
grafican
 La lectura de la escala del eje horizontal se hace de izquierda a derecha y la del eje vertical se hace
de abajo hacia arriba.
 La representación del hecho debe variar solo en una dimensión.
 En toda grafica se debe explicar la fuente de donde fueron obtenidos os datos, aclarar las escalas,
leyendas, notas, llamadas y convenciones que ayuden a identificar e interpretar las características
presentadas.
 Las gráficas nunca preceden al texto.

3.3.2 Representaciones Gráficas Cualitativas

GRÁFICO DE BARRAS

El instrumento más común para representar una variable cualitativa en forma gráfica es la gráfica de barras.
En la mayoría de los casos, el eje horizontal muestra la variable de interés y el eje vertical la cantidad,
número o fracción de cada uno de los posibles resultados. Una característica distintiva de la gráfica de
barras es que existe una distancia o espacio entre las barras

La gráfica de barras se puede usar para describir una serie de datos de cualquier nivel de medición

Diagrama de Barras Medios de Comunicación

16
14
12
10
8
6
4
2
0
Televisión Radio Internet Prensa
El diagrama de barras se puede trabajar para describir una sola característica de la variable, diagrama de
barras simple, o bien describir y comparar dos o más características de ella de forma segmentada o
agrupada. Para diferenciar una característica de otra en la misma barra se recurre a diferenciarlas usando
colores, sombreándolas o rellanándolas con tramas.

Ejemplo:

La siguiente información corresponde a las ventas por departamento, al contado y a crédito, de un almacén
de cadena en la ciudad de Bucaramanga en el mes de marzo de 2005. Los valores representan las ventas en
millones de pesos.

Tabla 2. Ventas por departamento al contado y a crédito en marzo de 2005

Departamento Contado Crédito Total


Alimentos 200 120 320
Ropa 180 110 290
Calzado 150 90 240
Electrodomésticos 300 210 510

Los siguientes diagramas de barras verticales describen las ventas por departamento del almacén.
Obsérvese que tanto la figura 1 y 2, aunque sean visualmente diferentes, ofrecen los mismo resultaos.
Inténtelo haciendo los diagramas de forma horizontal, ¿Es clara la información? ¿Cuál tipo de diagrama de
barras elegiría usted para una investigación? ¿Por qué?

Obsérvese además, en la figura 1, que también se puede graficar una barra más, la correspondiente al total
de ventas, la cual permitiría una comparación eficiente de las ventas del almacén ¿cómo sería esta grafica?

Figura 1.
Grafico de Barras agrupadas de las ventas por
dpto al contado y a crédito en Marzo de 2005

Electrodomésticos 210
300

Calzado 90
150

Ropa 110
180

Alimentos 120
200

0 50 100 150 200 250 300 350

Crédito Contado

Figura 2.

Grafico de Barras segmentadas de las ventas


por dpto al contado y a crédito en Marzo de
2005

Electrodomésticos 300 210

Calzado 150 90

Ropa 180 110

Alimentos 200 120

0 100 200 300 400 500 600

Contado Crédito

Construya una tabla de frecuencias relativas para los datos de la tabla 2. y con elle elabore por lo menos dos
diagramas de barra diferentes en los que muestre el porcentaje de ventas de contado y a crédito alcanzadas
durante ese mes en el almacén de cadena para cado uno de los departamentos evaluados. Elabore una
pequeña síntesis de los resultados que arrojan las gráficas que ha construido.
DIAGRAMA CIRCULAR

Es otro tipo de grafico que permite observar los componentes de un total, como sectores de un círculo. Se
utiliza para representaciones gráficas de distribuciones porcentuales. Es una forma efectiva de representar
distribuciones de frecuencias en las que la característica es cualitativa.

Los ángulos de los sectores son proporcionales a los componentes del total. Se construye subdividiendo los
360° de un círculo, proporcionalmente al número o al porcentaje de cada una de las clases que se ha
dividido la observación. Una mayor apreciación se logra coloreando distintamente los sectores o dándole
una trama a cada sector.

Ejemplo:

En una entrevista masiva de una multinacional, asistieron 1250 personas con expectativas de emplearse. De
ellas el 50% eran casados, 25% solteros, 15% separados y 10% en unión libre. SI se quisiera mostrar en un
diagrama circular estas proporciones, se debe tener en cuenta que los 360° del círculo equivalen al 100%,
debe pues plantearse una regla de tres simple:

Porcentaje Grados Donde:


50 𝑋 360
100% 36 0° 𝑋= = 180°
100
50% X

De la misma manera, el 25% equivale a 90° en el círculo, 15% a 54° y 10% a 36°. Compruébelo. Así pues, se
grafica el diagrama circular:

Diagrama Circular para el estado civil de 1250


aspirantes a empleo

10%

15%
50%

25%

Casado Soltero Separado Unión Libre


GRÁFICA DE LÍNEAS

Está compuesta de segmentos de líneas que unen los pares ordenados a representar. Sirven para describir
los cambios o fluctuaciones que sufre un fenómeno, generalmente durante un tiempo. Pueden ser simples,
cuando se dibuja una sola serie de datos o compuestos, cuando se comparan dos o más series de datos,
generalmente a través del tiempo (series cronológicas)

Ejemplo:

Tabla: Egresados en el período 2000-2004

Facultad 2000 2001 2002 2003 2004


Ciencias Administrativas 1391 2192 1549 1773 2328
Ciencias Básica e Ingeniería 533 603 708 517 830
Ciencias Agrarias 161 147 130 197 280
C. Soc. Humanas y Educación 1243 1415 1013 1210 1281

La tabla indica el número de egresados de la universidad en el periodo 2000-2004, discriminados por


facultad.

En el siguiente gráfico de puntos, se ve claramente el comportamiento y fluctuación en el tiempo de cada


facultad respecto a sus egresados.

Diagrama de líneas
Egresados en el periodo 2000- 2004
2500
Número de Egresados

2000
1500
1000
500
0
2000 2001 2002 2003 2004
Años

Ciencias Administativas Ciencias Básica e Ingeniería


Ciencias Agrarias C. Soc. Humanas y Educación
De allí se puede ver como en 2004 hubo un aumento considerado en todas las facultades, de igual forma en
2002 disminuyó estrepitosamente el número de egresados en las facultades de Ciencias Administrativas y
Ciencias Sociales Humanas y Educativas, mientras que en Ciencias Básicas e Ingeniería se daba un ascenso.

También se puede leer de este tipo de gráficos que, independientemente de las fluctuaciones en el tiempo,
la Facultad de Ciencias Administrativas es la que se reporta mayor número de egresado anuales, seguida de
Ciencias Sociales Humanas y Educativas, Ciencias Básicas e Ingeniería y por ultimo Ciencias Agrarias.

CÓMO CREAR UNA DISTRIBUCIÓN DE FRECUENCIA (Variables cuantitativas)


Metodología:
1. Defina el número de clases k. Emplear suficientes agrupamientos o clases de manera que se perciba
la forma de la distribución.

k k
Formula Sturges: 𝑘 = 1 + 3,3 log 𝑛 o 2 , si se cumple 2 > n

2. Determine el intervalo o ancho de clase i. Todas las clases deben cubrir el valor más bajo y el valor
más alto.

𝑅𝑎𝑛𝑔𝑜 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟−𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟


𝑖= =
𝑘 𝑘

3. Establecer los límites de cada clase. Cada observación se debe incluir en una sola categoría.
4. Ingresar los datos de la variable en cada clase
5. Contar el número de elementos de cada clase.

Desarrollar la metodología propuesta anteriormente con el siguiente ejercicio. La empresa de distribuciones


Vehicar desea desarrollar tablas y gráficos relacionados con ganancia de cada uno de los 180 vehículos que
se vendieron durante un mes en particular. Los datos están dados en miles de pesos. (Ejercicio tomado del
Libro Estadística Aplicada a los negocios y la Economía de Douglas, Lind, William Marchall, Samuel Wathen)

Tabla Precios de vehículos vendidos en el mes

1 387 2 148 2 201 963 820 2 230 3 043 2 584 2 370


1 754 2 207 996 1 298 1 266 2 341 1 059 2 666 2 637
1 817 2 252 2 813 1 410 1 741 3 292 1 674 2 991 1 426
1 040 1 428 323 1 553 1 772 1 108 1 807 934 2 944
1 273 1 889 352 1 648 1 932 1 295 2 056 2 063 2 147
1 529 1 166 482 2 071 2 350 1 344 2 236 2 083 1 973
3 082 1 320 1 144 2 116 2 422 1 906 2 928 2 856 2 502
1 951 2 265 1 485 1 500 2 446 1 952 1 269 2 989 783
2 692 1 323 1 509 1 549 369 2 070 1 717 910 1 538
1 206 1 761 1 638 2 348 978 2 454 1 797 1 536 2 339
1 342 1 919 1 961 2 498 1 238 1 606 1 955 1 957 2 700
443 2 357 2 127 294 1 818 1 680 2 199 2 240 2 222
754 2 866 2 430 1 115 1 824 1 827 2 482 2 695 2 597
1 621 732 1 704 1 124 1 907 1 915 2 701 1 325 2 742
870 1 464 1 876 1 532 1 938 2 084 3 210 2 250 1 837
1 174 1 626 2 010 1 688 1 940 2 639 377 2 279 2 842
1 412 1 761 2 165 1 822 2 197 842 1 220 2 626 2 434
1 809 1 915 2 231 1 897 2 646 1 963 1 401 1 501 1 640
2 415 2 119 2 389 2 445 1 461 2 059 2 175 1 752 1 821
1 546 1 766 335 2 886 1 731 2 338 1 118 2 058 2 487

Paso 1: Defina el número de clases. El objetivo consiste en emplear suficientes agrupamientos o clases,
de manera tal que se perciba la forma de la distribución. Aquí se necesita criterio. Una gran cantidad de
clases o muy pocas podrían no permitir ver la forma fundamental del conjunto de datos. Una gran
cantidad de clases o muy pocas podrían no permitir ver la forma fundamental del conjunto de datos. En el
ejemplo de la ganancia del vehículo, tres clases no darían mucha información sobre el patrón de los datos
(vea la tabla 1).
Tabla 1.

Ganancia por Número de


vehículo en $ vehículos
200 a 1 400 42
1 400 a 2 600 115
2 600 a 3 800 23
Total 180

Utilizando la fórmula de Sturges:


𝑘 = 1 + 3,3 log (180) = 8,44. El número de clases a utilizar corresponde a 8.

Paso 2: Determine el intervalo o ancho de clase. El intervalo o ancho de clase debería ser el mismo para
todas las clases. Todas las clases juntas deben cubrir por lo menos la distancia del valor más bajo al más
alto de los datos. Expresado esto en una fórmula sería:
𝑅𝑎𝑛𝑔𝑜 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟
𝑖= =
𝑘 𝑘
𝑅𝑎𝑛𝑔𝑜 = 𝑅 = 𝑉𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑉𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜
𝑅 = 3 292 − 294 = 2 998
2 998
𝐴𝑛𝑐ℎ𝑜 = 𝑖 = = 374,75
8
En la práctica, se redondea a una cifra conveniente, tal como un múltiplo de 10 o 1000. En este caso, el
valor de $ 400 podrá emplearse sin inconvenientes.
En las distribuciones de frecuencia son preferibles los intervalos de clase iguales. Sin embargo, en ciertos
casos se necesita que no lo sean para evitar un gran número de clases vacías o casi vacías.

Paso 3: Establezca los limites de cada clase. Este paso es importante para que sea posible incluir cada
observación en una sola categoría. Esto significa que debe evitar la superposición de límites de clase
confusos.
Se recomienda elegir límites convenientes de clase. Una directriz consiste en convertir el límite inferior de
la primera clase en un múltiplo del intervalo de clase. A veces esto no es posible, pero se recomienda en la
medida de lo posible, debe redondearse. Para el ejercicio, las clases que podrían utilizarse para esos datos
son:

Clases
$ 200 a $ 600
600 a 1 000
1 000 a 1 400
1 400 a 1 800
1 800 a 2 200
2 200 a 2 600
2 600 a 3 000
3 000 a 3 400

Paso 4: Ingresar los datos de la variable en cada clase. Anote las ganancias de venta en las clases. Para
comenzar, la ganancia de venta del primer vehículo en la tabla de precios es de $ 1 387, cifra que se debe
anotar en la clase de $ 1 000 a $ 1 400. La segunda ganancia de la primera columna de la tabla es de $ 2 148.
Se anota en la clase de $ 1 800 a $ 2 200. El resto de las ganancias se cuadran de forma similar

Paso 5: Cuente el número de elementos de cada clase. El número de elementos que hay en cada clase
recibe el nombre de frecuencia de clase. En la clase de $200 a $ 600 hay 8 observaciones y así
sucesivamente.
Ganancia en $ Frecuencia
200 a 600 8
600 a 1 000 11
1 000 a 1 400 23
1 400 a 1 800 38
1 800 a 2 200 45
2 200 a 2 600 32
2 600 a 3 000 19
3 000 a 3 400 4
Total 180

De forma general, una tabla de distribución de frecuencias para una variable cuantitativa debe contener
como mínimo la siguiente información.

Cuadro No xxxx. Título del cuadro

Frecuencia
Nombre de la variable Frecuencia Frecuencia relativa
Frecuencia (fi)
que se observa relativa (hi) acumulada Fi acumulada
(Hi)

TOTAL
Fuente xxxx

Relacionar un texto que permita entender la relación de los valores dentro de un cuadro

La distribución de frecuencias acumuladas se construye con el cálculo de la frecuencia absoluta acumulada y


la frecuencia relativa acumulada. La primera es la acumulación sucesiva en forma descendente o ascendente
de las frecuencias absolutas. Si la frecuencia absoluta acumulada es ascendente, la primera frecuencia
absoluta corresponderá a la primera frecuencia absoluta acumulada. La segunda acumulada se obtiene
sumando las dos primeras absolutas, y así sucesivamente. La última frecuencia absoluta acumulada
corresponderá al número total de frecuencias.
De la misma manera, la frecuencia relativa acumulada es una acumulación sucesiva en forma ascendente o
descendente de frecuencias relativas. Si es ascendente, la última frecuencia relativa acumulada tendrá un
valor del 100%

Representación Gráfica de Distribuciones de Frecuencia para Datos cuantitativos

En la mayoría de los casos, es de mucha utilidad e importancia hacer resaltar la información que se
encuentra contenida en las tablas de distribución de frecuencias.

Por lo general, se acompaña siempre una tabla o cuadro de resúmenes de los datos con su respectiva
gráfica. Existe una gran variedad de formas para presentar los datos en forma gráfica. La variedad de formas
y disposición de las gráficas depende del investigador que desea resaltar ciertas características principales
de los datos que se estén estudiando. Dentro de los gráficos más representativos se cuenta con Histograma,
Polígono de frecuencias, Ojiva (menor que y mayor que), Diagrama de puntos, Diagrama de Tallo y Hojas,
Diagrama de Caja (Box-Plot).

HISTOGRAMA DE FRECUENCIAS

En el caso de las distribuciones de frecuencia agrupada, la forma de representación gráfica más común, se
conoce con el nombre de histograma de frecuencias. Estos se construyen representando los intervalos de
clase en la escala horizontal y las frecuencias de clase (absolutas o relativas) en la escala vertical y trazando
rectángulos cuyas bases equivalen a la amplitud de los intervalos de clase y sus alturas corresponden a las
frecuencias de cada clase.

Características

 Representación gráfica más usual para datos cuantitativos


 El área de cada rectángulo representa la proporción de la muestra que está en el intervalo de clase
correspondiente
 El área total bajo el histograma es igual a 1
Histograma de Ganancias de Vehicar Ltda
50
45
Frecuencia de Vehiculos vendidos

40 38

32

30

23

20 19

11
10 8

0
200 600 1000 1400 1800 2200 2600 3000 3400
utilidad
Fuente: Departamento de Ventas
A partir del histograma es posible concluir lo siguiente:

• La ganancia que se obtuvo por la venta de un vehículo está en un rango de $ 200 a $ 3 400.
• Las ganancias se concentran entre $ 1 000 y $ 3 000. La ganancia sobre 157 vehículos, u 87%,
cayeron dentro de este rango.
• La mayor concentración, o frecuencia más alta, se encuentra en la clase de $ 1 800 a $ 2 200. La
mitad de esta clase es $ 2 000. Por lo tanto, la ganancia típica en la venta de un vehículo es de $ 2
000.

POLÍGONO DE FRECUENCIAS

Describe también la información de la distribución de frecuencias absolutas o relativas. Pero se grafican las
marcas de clase de cada intervalo, generando una secuencia de puntos que se unen en segmentos de recta
para formar un polígono, de ahí el nombre.

El polígono puede dibujarse sobre el histograma de frecuencias o de manera independiente. En el primer


caso, se unen los centros de las bases superiores de los rectángulos; en el segundo caso, se unen los puntos
de cada intersección de la abscisa, que corresponde a la marca de clase, con la ordenada correspondiente a
la frecuencia relativa o absoluta. La figura representa el polígono de frecuencias de los datos graficados en el
histograma.

50 POLIGONO DE FRECUENCIA
40
30
Frecuencia

20
10
0

Ganancias (en miles $)

Tanto el histograma como el polígono de frecuencias permiten tener una vista rápida de las principales
características de los datos (máximos, mínimos, puntos de concentración, etc.). Aunque las dos
representaciones tienen un propósito similar, el histograma posee la ventaja de que describe cada clase
como un rectángulo, en el que la barra de altura de éste representa el número de elementos que hay en
cada clase. El polígono de frecuencias, en cambio, tiene una ventaja con respecto al histograma. También
permite comparar directamente dos o más distribuciones de frecuencias.

OJIVA

La ojiva es el gráfico de una distribución de frecuencias acumuladas (relativas o absolutas) y puede ser
descendente o ascendente. Ella permite presentar en un mismo gráfico, diferentes curvas lo que no permite
el histograma de frecuencias. En el eje horizontal se ubican el límite superior de cada intervalo de clase y en
el vertical, las respectivas frecuencias acumuladas, ya sean relativas o absolutas. Luego se unen estos puntos
en una curva suavizada, partiendo desde el límite inferior del primer intervalo.

Las frecuencias acumuladas pueden emplearse para determinar cuántos datos u observaciones están por
arriba o por debajo de cierto valor. La ojiva para el caso de las ganancias de Vehicar se observa en la
siguiente figura:

HISTOGRAMAS DE DENSIDAD

En distribuciones agrupadas en intervalos de amplitud desigual es importante calcular la densidad de cada


intervalo de clase. La densidad de un intervalo de clase es la frecuencia relativa por unidad de amplitud y se
calcula dividiendo la frecuencia entre la amplitud del intervalo.

En este caso se representa en el eje vertical la densidad. Este tipo particular de histograma se denomina
histograma de densidad y tiene la misma forma que el histograma de frecuencias cuando la amplitud de los
intervalos es la misma.
a. Determine los puntos límite para los intervalos de clase.
b. Calcule las frecuencias y las frecuencias relativas para cada clase.
c. Calcule la densidad para cada clase.

𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎
𝐷𝑒𝑛𝑠𝑖𝑑𝑎𝑑 =
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒

d. Dibuje un rectángulo para clase, cuya altura sea igual a la densidad. Use los mismos pasos para
dibujar una distribución de frecuencia, excepto que la escala del eje vertical es la escala de
densidad.
e. En un histograma de densidad el área de la barra representa el porcentaje valores que
corresponden a la clase.

Por lo tanto, para un histograma de densidad

Á𝑟𝑒𝑎 = 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒

La altura de cada intervalo es la densidad de la muestra en ese intervalo de clase.

Ejemplo: La siguiente tabla corresponde a las emisiones de gas de 62 vehículos conducidos a una gran
altitud. El rango de la muestra va desde un mínimo 1,11 a un máximo de 23,38 en unidades de gramos de
emisiones por galón de combustible

Tabla de distribución de frecuencia de las emisiones de gas de vehículos en gran altitud

Intervalo de Clase ( Frecuencia


Frecuencia (fi) Densidad Densidad (%)
g/gal) relativa (hi)
[1-3) 12 0,1935 0,0968 9,7
[3-5) 11 0,1774 0,0887 8,9
[5-7) 18 0,2903 0,1452 14,5
[7-9) 9 0,1452 0,0726 7,3
[9-11) 5 0,0806 0,0403 4,0
[11-15) 3 0,0484 0,0121 1,2
[15-25) 4 0,0645 0,0065 0,6
TOTAL 62 1
Fuente Estadística para Ingenieros de Navidi
Histograma de Densidad
Emisiones de partículas (g/gal) vehiculos conducidos a gran altitud
0,16

0,14

0,12

0,10
Densidad

0,08

0,06

0,04

0,02

0,00
1 3 5 7 9 11 15 25
emisiones (g/gal)

 Determine la proporción de los vehículos en la muestra con emisiones entre 7 y 11 g/galón


 Use el histograma para calcular la proporción de vehículos en la muestra con emisiones entre 6 y
10 g/ galón.

DIAGRAMA DE TALLO DE HOJAS

El arreglo de tallo y hojas es una técnica que resume de manera simultánea los datos en forma numérica y
presenta una ilustración grafica de la distribución.

Se trata de organizar los datos numéricos en dos columnas divididas por una línea vertical. La primera
denominada tallo, corresponderá a las decenas, centenas o unidades que representan el grupo de datos y
en la segunda, llamada hojas irán las correspondientes decenas, unidades o décimas.

El procedimiento a seguir en la elaboración el diagrama es:

 Ordenar los valores de las hojas de menor a mayor.


 Hacer una lista de valores de tallo en una columna vertical.
 Registrar las hojas por cada observación junto al valor correspondiente del tallo.
 Indicar las unidades para tallos y hojas en algún lugar del diagrama.
 El diagrama de tallos y hojas tiene forma de campana.
Los diagramas de tallos y hojas nos dan una idea de la localización de los datos y de la forma de la
distribución. Esta técnica funciona bien para los conjuntos de datos que no tienen una dispersión muy
grande.
Para el ejercicio de las emisiones de gas de acuerdo a MINITAB es el siguiente

Tallo y hoja de emisiones N = 62


Unidad de hoja = 1,0

4 0 1111
19 0 222222223333333
(14) 0 44445555555555
29 0 66666666777777
15 0 8889999
8 1 0
7 1 233
4 1
4 1 7
3 1 89
1 2
1 2 3

DIAGRAMA DE PUNTOS. Es un gráfico que se puede usar para tener una impresión aproximada de la forma
de la muestra. Es útil cuando el tamaño de la muestra no es demasiado grande y cuando contiene algunos
valores repetidos. El diagrama de puntos da una buena indicación de dónde se concentran los valores de la
muestra y dónde hay separaciones.

En la siguiente figura se presenta el diagrama de puntos para los datos de emisiones de vehículos
conducidos a mayor altitud. El diagrama de puntos da una buena indicación de dónde se concentran los
valores de la muestra y donde hay separaciones. Por ejemplo, se observa que en la figura xxx se muestra
que no se detectan emisiones en los lapsos de 10 y 12 g/gal, entre 14 y 17 g/gal entre otros.

Commented [L1]: Falta caja box-plot


EJERCICIOS

Primer Punto: A continuación se muestran los ingresos registrados en 50 familias seleccionadas al azar de
estrato 3 en una importante ciudad:

$ 582.400 $ 841.210 $ 458.882 $ 535.211


$ 283.427 $ 433.792 $ 413.914 $ 485.925
$ 463.710 $ 848.607 $ 417.028 $ 550.409
$ 291.932 $ 538.597 $ 438.579 $ 223.878
$ 280.678 $ 947.218 $ 240.334 $ 391.814
$ 622.441 $ 781.633 $ 503.314 $ 700.010
$ 762.212 $ 681.517 $ 593.656 $ 221.135
$ 570.688 $ 382.734 $ 431.972 $ 718.487
$ 688.648 $ 775.123 $ 592.240 $ 317.555
$ 341.204 $ 1.147.607 $ 303.165 $ 716.003
$ 696.637 $ 926.773 $ 380.497 $ 647.222
$ 315.031 $ 584.599 $ 635.302 $ 345.931
$ 753.701 $ 500.558 $ 617.137 $ 285.715
$ 262.217 $ 1.115.432 $ 551.668 $ 698.338
$ 398.000 $ 655.230 $ 821.100 $ 293.312
$ 346.031 $ 415.560 $ 558.260 $ 306.300
$ 394.019 $ 347.485 $ 341.103 $ 400.496
$ 469.799 $ 773.411 $ 357.441 $ 192.019
$ 191.021 $ 810.474 $ 504.725 $ 489.025
$ 382.482 $ 353.289 $ 376.616 $ 480.314
$ 385.656 $ 705.757 $ 978.298 $ 272.328
$ 452.318 $ 736.707 $ 576.128 $ 310.504
$ 384.916 $ 584.196 $ 465.540 $ 828.898
$ 690.247 $ 920.824 $ 310.504 $ 480.314
$ 750.317 $ 1.115.851 $ 828.898 $ 272.328

Segundo Punto: Construya una tabla de frecuencia que agrupe los datos en 10 intervalos de clase.

A partir de la siguiente tabla de frecuencias con datos parciales:


Nc Lm Ls f F h H
1 (10 14] 10
2 (14 18] 15
3 (18 22] 31
4 (22 26] 42
5 (26 30] 55
TOTAL

 Calcule las frecuencias faltantes (f, h y H)


 Modifique la tabla de frecuencia para que incluya los siguientes datos: 14, 22, 26, 27 y 28.

Tercer Punto: Debido a un grave accidente, el gerente de una compañía consultora perdió información de
un estudio de mercado que realizó a una importante compañía a nivel nacional de gaseosas. Solo se conoce
algunos datos parciales sobre una entrevista que se elaboró a 150 personas.

Nc Lm Ls f F h H
1 0 2,1 24
2 2,1 4,1 0,25
3 4,1 6,1 0,71
4 6,1 8,1 123
5 8,1 10,1 8
6 10,1 12,1
7 12,1 14 1
TOTAL 150 1

Reconstruya la tabla de frecuencia.

1. ¿Cuántas personas toman menos de 4 gaseosas por semana?


2. ¿Cuántas personas toman al menos 3 gaseosas por semana?

Cuarto Punto: La siguiente gráfica muestra los salarios por hora de una muestra de soldadores en una
determinada región.
a) ¿A cuántos soldadores se estudió?
b) ¿Cuál es el intervalo de clase?
c) ¿Aproximadamente cuántos soldadores ganan menos de $10.00 la hora?
d) ¿Cerca de 75% de los soldadores ganan menos de qué cantidad?
e) ¿Diez de los soldadores estudiados ganan menos de qué cantidad?
f) ¿Qué porcentaje de soldadores gana menos de $20.00 la hora?

Quinto Punto: Una cadena de tiendas deportivas que satisface las necesidades de los esquiadores
principiantes, planea llevar a cabo un estudio sobre la cantidad de dinero que un esquiador principiante
gasta en su compra inicial de equipo y provisiones. Con base en estas cantidades, desea analizar la
posibilidad de ofrecer equipo, como un par de botas y un par de esquís, para inducir a los clientes a comprar
más. Una muestra de los comprobantes de la caja registradora reveló las siguientes compras iniciales:

$140 $82 $265 $168 $90 $114 $172 $230 $142


86 125 235 212 171 149 156 162 118
139 149 132 105 162 126 216 195 127
161 135 172 220 229 129 87 128 126
175 127 149 126 121 118 172 126

1. Sugiera un intervalo de clase. (Efectúe la metodología planteada en clase)


2. Organice los datos y elabore una distribución de frecuencias
3. Construya un histograma para estos datos y presente conclusiones al respecto.
Sexto Punto: La siguiente gráfica muestra los precios de venta (miles de dólares) de casas vendidas en
determinada zona.

a) ¿Cuántas casas se estudiaron?


b) ¿Cuál es el intervalo de clase?
c) ¿En menos de qué cantidad se vendieron 100 casas?
d) ¿En menos de qué cantidad se vendió aproximadamente 75% de las casas?
e) Aproxime el número de casas vendidas en la clase que va de $150 000 a $200

Séptimo Punto: A partir del gráfico de ojiva, responda las siguientes preguntas (Tamaño de la muestra es
500):

a) ¿Qué cantidad de datos hay acumulado hasta 260.5?


b) ¿Sirve este tipo de gráfico para mostrar la frecuencia absoluta (f)?
c) Diseñe la tabla de frecuencia respetiva
Octavo Punto: Cree una tabla de frecuencia que contenga 7 intervalos de clase, para los siguientes datos:

31,2 44,3 31,8


19 59,9 87,9
66,1 5,4 47,9
96,6 36,5 74
42,7 10,6 56
87,7 11,7 30,1
5,3 11,7 31,4
51,2 67 46,8
60,7 29,6 55,6
67 32,1 82,2
81,2 75,5 91
40,4 42,4 31,8
26,6 70,1 30,4
6,4 19,1 77,6
57,3 62,1 40,9

Construya el histograma respectivo.

Noveno Punto: El cuadro que figura más abajo da los caudales mensuales del río Magdalena observados
durante los meses de abril y mayo, desde 1988 a 2005 (la unidad de medida no se precisa).

Año Abril Mayo


1988 600 512
1989 227 211
1990 487 469
1991 560 370
1992 521 363
1993 423 272
1994 307 241
1995 390 253
1996 364 408
1997 284 233
1998 415 245
1999 255 199
2000 209 215
2001 230 297
2002 424 309
2003 528 303
2004 258 196
2005 242 166

Se desea ordenar estos datos y efectuar el análisis siguiente:


a) Dar una representación global de los caudales de abril y mayo. Graficar mediante dos histogramas
los datos resumidos.
b) ¿Qué comportamiento puede observar en las frecuencias en ambos meses?

CUESTIONARIO DE REPASO

Selección múltiple con única respuesta: Marque con una X la respuesta correcta.

Para las preguntas 1 y 2: A partir del siguiente gráfico de Ojiva.

a) Se puede concluir:
a) El 60% de la población ganas más de $ 400.000
b) El 50% equivale a un ingreso de $ 200.000
c) El 80% de la población gana más de $ 100.000
d) Todas las anteriores

b) Se puede concluir:
a. El 50% de la población gana más de $ 300.000
b. El 30% de la población gana menos de $ 200.000
c. El sueldo máximo registrado fue de $600.000
d. Todas las anteriores

c) Los gráficos de sectores son usados para:


1. Mostrar frecuencias acumuladas
2. Mostrar las marcas de clase de una tabla de frecuencia tipo B
3. Mostrar solo las frecuencias absolutas
4. Mostrar frecuencias no acumuladas

También podría gustarte