Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Apuntes Estadistica Descriptiva v.1
Apuntes Estadistica Descriptiva v.1
1. ¿Qué es estadística?
2. Definiciones de varios autores
3. Terminología estadística
4. Etapas de la Investigación Estadística
5. Resúmenes estadístico
6. Métodos Tabulares y gráficos para resumir datos
7. Medidas de Tendencia Central
Temática 1: Conceptualización Estadística
En una forma práctica, la ESTADÍSTICA nos proporciona los métodos científicos para la recopilación,
organización, resumen, representación y ANALISIS de DATOS, o análisis de hechos, que se presenten a una
valuación numérica; tales como son: Características biológicas o sociológicas, fenómenos físicos, producción,
calidad, población, riqueza, impuestos, cosechas, etc.
La cualidad de CIENCIA de la Estadística se presta aún como polémica; pero es un hecho indiscutible el que
viene a constituir un auxiliar maravilloso y sobretodo insustituible para la investigación científica, al permitir
que se aproveche el material cuantitativo que arrojan las observaciones y los experimentos.
En sus comienzos, la Estadística sólo era aplicada al estudio y valuación numérica de manifestaciones
inherentes al ESTADO: De allí sale nombre, del vocablo latino “status”, que fue utilizado por primera vez en
Alemania, en el siglo XVII específicamente.
Cuando coloquialmente se habla de estadística, se suele pensar en una relación de datos numéricos
presentada de forma ordenada y sistemática. Esta idea es la consecuencia del concepto popular que existe
sobre el término y que cada vez está más extendido debido a la influencia de nuestro entorno, ya que hoy
en día es casi imposible que cualquier medio de difusión, periódico, radio, televisión, etc, que nos aborde
diariamente con cualquier tipo de información estadística sobre accidentes de tráfico, índices de
crecimiento de población, turismo, tendencias políticas, etc.
Sólo cuando nos adentramos en un mundo más específico como es el campo de la investigación de las
Ciencias Sociales: Medicina, Biología, Psicología, ... empezamos a percibir que la Estadística no sólo es algo
más, sino que se convierte en la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y
por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad
intrínseca, no puedan ser abordadas desde la perspectiva de las leyes deterministas. Podríamos, desde un
punto de vista más amplio, definir la estadística como la ciencia que estudia cómo debe emplearse la
información y cómo dar una guía de acción en situaciones prácticas que entrañan incertidumbre.
1.2 Definiciones de varios autores
Población: Grupo de individuos con una característica en común. Conjunto de todas los elementos
o unidades de interés para un estudio determinado. (Díaz, 2013)
a) Unidad de Análisis (UA): Es la unidad definida por el investigador para realizar mediciones.
Se conoce con el nombre de elemento muestral.
• Marco Poblacional / muestral: Es una lista donde están identificados todos los elementos de la
población / muestra.
• Variable: Característica de interés sobre cada elemento individual de una población o muestra.
• Datos: Conjunto de valores recolectados para la variable de cada uno de los elementos que
pertenecen a una población o muestra
Se llama población al conjunto de todos los elementos cuyo conocimiento interesa. Cada uno de esos
elementos es un individuo. Si se está estudiando el resultado de ciertos experimentos químicos, cada uno de
esos experimentos será un individuo estadístico y el conjunto de todos los posibles experimentos en esas
condiciones será la población.
Población finita: Cuando el número de elementos que la forman es finito, por ejemplo el número de
alumnos de un centro de enseñanza, o grupo clase.
Población infinita: Cuando el número de elementos que la forman es infinito, o tan grande que pudiesen
considerarse infinitos como por ejemplo si se realizase un estudio sobre los productos que hay en el
mercado. Hay tantos y de tantas calidades que esta población podría considerarse infinita.
a) Parámetro: Valor numérico que se resume todos los datos de una población completa. Se
utilizan letras griegas para simbolizar un parámetro como lo son µ y σ.
b) Estadístico: Valor numérico que resume los datos de una muestra. Se utilizan letras del
alfabeto español para simbolizarlas como lo son 𝑋̅ y S.
1. Descriptiva e
2. Inferencial
El proceso que sigue la estadística descriptiva para el estudio de una cierta población consta de los
siguientes pasos:
La estadística descriptiva trabaja con todos los individuos de la población. La estadística inferencial, sin
embargo, trabaja con muestras, subconjuntos formados por algunos individuos de la población. A partir del
estudio de la muestra se pretende inferir sobre algunas características de la población con base en una
muestra, buscando probar la validez de los resultados.
3. Recolector de datos.
5. Análisis y conclusiones
https://www.youtube.com/watch?v=fRvL6WGEF9U
https://www.youtube.com/watch?v=HA68b_KVn1k
https://www.youtube.com/watch?v=OPkGxnEXLsI
2 LAS VARIABLES
Se define como una VARIABLE, a una característica observable o a un aspecto discernible en un objeto de
estudio, que puede adoptar diferentes valores o expresarse en varias categorías, o a una característica
observable ligada, con una relación determinada, a otros aspectos observables.
TIPO DE DATOS
Para clasificar o categorizar variables, se utilizan diferentes tipos de escalas, siendo las más comunes las
NOMINALES, las ORDINALES, las DE INTERVALO, y las DE RAZON, cuyo uso depende básicamente de los
objetivos del estudio y de la naturaleza de la variable.
Ejemplo:
En cada una de las siguientes situaciones, identificar la variable de estudio. Determinar si es cualitativa o
cuantitativa.
• En un barrio de la ciudad se aplicó una encuesta para conocer el consumo, en centímetros cúbicos,
del servicio de gas natural.
• El alcalde de la ciudad quiere revisar la situación de violencia intrafamiliar en las familias de estrato
3, 4, 5.
• El número de hermanos de cada jugador del equipo de futbol.
• En un café gourmet, se decidió preguntar por el tipo de variedad que más consumen sus clientes.
Solución
2.1 La Medición
En el sentido más corriente y elemental, el concepto de medir es utilizado para significar la asignación de
valores numéricos o dimensiones a un objeto u objetos mediante la utilización de determinados
procedimientos. En términos más estrictamente metodológicos, la medición consiste sustancialmente en
una observación cuantitativa, atribuyendo un número a determinadas características o rasgos del hecho o
fenómeno observado. Esto no presenta mayores inconvenientes si se trata de medir aspectos materiales y
morfológicos de los objetos de estudio; la dificultad aparece cuando se desean expresar numéricamente
aspectos más evanescentes e intangibles.
El nivel de medida o escala de medida, expresiones aceptadas casi universalmente, está formado por un
conjunto de numerales distintos y un conjunto de modalidades distintas relacionadas biunivocamente. Se
suelen distinguir cuatro niveles de medición que dan lugar a cuatro niveles de escalas: nominal, ordinal o de
orden jerárquico, de intervalos y de razón o cociente. Ahora bien, el tipo de escala estará dado, según sea
verificable uno u otro tipo de relación.
Escalas o niveles de medición: Grado de precisión de cómo se expresa la medida de una variable. El
investigador construye las categorías de la variable y ello a su vez determina la escala de medición
apropiada.
El tipo de variable y la escala de medición determinan los métodos estadísticos que se emplearán para
analizar los datos.
Mayor
precisión y
confiabilidad
TIPO DE DATOS
Escalas de
medición Razón
Nominal Categórica Intervalo
Dicotómicas
Discreta
Policotómicas
Continua
Consiste en clasificar objetos o fenómenos, según ciertas características, tipologías o nombres, dándoles una
denominación o símbolo, sin que implique ninguna relación de orden, distancia o proporción entre los
objetos o fenómeno. La medición se da a un nivel elemental cuando los números u otros símbolos se usan
para la distinción y clasificación de objetos, persona o características. Cuando se utilizan números para
representar las diferentes clases de una escala nominal, estos no poseen propiedades cuantitativas y sirven
solamente para identificar las clases.
Ejemplo:
Llamada también escala de orden jerárquico, con ella se establecen posiciones relativas de los objetos o
fenómenos en estudio, respecto a alguna característica de interés, sin que se reflejen distancias entre ellos.
Puede suceder que los objetos de una categoría de las escala no sean precisamente diferentes a los objetos
de otra categoría de la escala, sino que están relacionados entre sí. Los numerales empleados en las escalas
ordinales no son cuantitativos, sino que indican exclusivamente la posición en la serie ordenada y no "cual
es" la diferencia entre posiciones sucesivas de la escala.
Ejemplo:
Suponga que a los clientes en un almacén se les hace unas preguntas para valorar la calidad del servicio. Los
clientes valoran la calidad de acuerdo a las siguientes respuestas: 1 (excelente), 2 (bueno), 3 (regular), 3
(malo) 4 (pésimo). Estos datos son ordinales. Note que una valoración de 1 no indica que el servicio es dos
veces mejor que cuando se da una valoración de 2. Sin embargo podemos decir que la valoración de 1 es
preferiblemente mejor que 2, y así en los demás casos.
En resumen, las propiedades del nivel ordinal de los datos son las siguientes:
Las clasificaciones de los datos se encuentran representadas por conjuntos de etiqueta o nombres
(alto, medio, bajo), las cuales tienen valores relativos.
En consecuencia, los valores relativos de los datos se pueden clasificar u ordenar.
El nivel de intervalo de medición es el nivel inmediato superior. Incluye todas las características del nivel
ordinal, pero, además, la diferencia entre valores constituye una magnitud contante. Un ejemplo de nivel de
intervalo de medición es la temperatura.
Representa un nivel de medición más preciso, matemáticamente hablando, que las anteriores; no solo se
establece un orden en las posiciones relativas de los objetos o individuos, sino que se mide también la
distancia entre los intervalos o las diferentes categorías o clases. En este caso, la medición se ejecuta en el
sentido de una escala de intervalo; esto es, si la asignación de números a varias clases de objetos es tan
precisa que se sabe la magnitud de los intervalos (distancias) entre todos los objetos de la escala, se ha
obtenido una medida de intervalo. Una escala de intervalo está caracterizada por una unidad de medida
común y constante que asigna un número real a todos los pares de objetos en un conjunto ordenado. En
esta clase de medida, la proporción de dos intervalos cualesquiera es independiente de la unidad de medida
y del punto cero. En una escala de intervalo, el punto cero y la unidad de medida son arbitrarios.
Ejemplo:
Suponga que se está interesado en la temperatura del fundido de acero. Se toman cuatro lecturas cada dos
horas: 2050, 2100, 2150 y 2200 ° F. Obviamente los datos pueden ser ordenados (semejante a los datos
ordinales) en orden ascendente de temperatura indicando temperatura más fría, menos fría, y así
sucesivamente. Además, las diferencias entre los valores ordenados pueden ser comparadas. Aquí el
intervalo entre los valores de los datos 2050 y 2100 representan un incremento en la temperatura de 50°F, y
así los demás intervalos. Hay que tener en cuenta que en esta escala no hay un cero absoluto o real, el cero
es arbitrario; por tanto no se puede decir que 76°F es el doble de temperatura que 38°F.
En resumen, las propiedades de los datos de nivel de intervalo son las siguientes:
1. Las clasificaciones de datos se ordenan de acuerdo con la cantidad de características que poseen.
2. Diferencias iguales en la característica representan diferencias iguales en los números asignados a
las clasificaciones.
3. El punto cero representa la ausencia de características y la razón entre dos número es significativa
Primer punto: El gerente de Mac Donald solicitó una muestra de 1.960 personas de la ciudad de Bogotá,
estrato 4 para ingresar al mercado colombiano con nuevo tipo de hamburguesa. De los 1.960 que
participaron en la muestra, 1.176 informaron que comprarían el producto.
Segundo Punto: Un laboratorio de control de calidad de una empresa quiere lanzar al mercado un nuevo
ambientador en atomizador; seleccionó cincuenta apartamentos de una urbanización para determinar el
tiempo de permanencia del aroma.
Tercer punto: En los siguientes enunciados diga si es finita o infinita las siguientes poblaciones.
Cuarto Punto: Para afianzar conocimientos teóricos efectúe la siguiente clasificación de acuerdo al siguiente
cuadro. Sea específico en la clasificación de las variables cualitativas. Ver tabla 1
Quinto punto: En las siguientes situaciones, indique es la población (P) y cuál es la muestra (M).
Sexto Punto: Diga si las siguientes afirmaciones corresponden a estadística descriptiva o estadística
inferencial.
El alcalde de un pequeño pueblo, el Dr. Fernández, se siente preocupado por ciertos comentarios que
rondan en la calle, en los cuales, lo critican de haberse desempeñado mal en el cargo. El asesor de imagen
cree que estas conjeturas son falsas, y propone al Centro de Planeación que realice una encuesta sobre
algunas familias (Según el DANE, el pueblo cuenta con 1.500 familias) con el propósito de obtener cierta
información de la gestión del gobierno actual.
_________________________
2. Marque con una X. En cuál de las siguientes áreas el gobierno presento la mejor gestión:
1. Economía
2. Obras civiles
3. Servicios Públicos
4. Eventos culturales
Sí _____ No_____
4. ¿Cuántos empleos cree usted que generó la Alcaldía municipal en el período actual de mandato?
___________________________
b. ¿Qué tipo de tablas y por qué, recomendaría utilizar para el resumen de los datos en cada
pregunta?
e. ¿Cree usted que la encuesta permite resolver todas las dudas sobre la gestión del gobierno
del pueblo? Sustente.
3 Métodos Tabulares y gráficos para resumir datos
Descripción de datos
Ejemplo:
Una agencia de noticias quiere saber cuál es el medio de comunicación por el cual se informan las personas,
sobre las noticias del país. Para ello, realizó un estudio a cuarenta personas a quienes se les preguntó por su
medio de información de noticias preferido. Se obtuvo la siguiente lista de datos.
El tipo de variable que se registra en este estudio es cualitativa, puesto que pregunta por el medio de
información.
El estudio de una variable cualitativa requiere de la incorporación de algunos criterios, de tal manera que al
obtener una lista de preferencias, cualidades o gustos, se pueda analizar su comportamiento en la
población. Para caracterizar una variable cualitativa se utilizan tres herramientas.
1. Tablas de frecuencias
2. Representaciones gráficas
Como se indicó anteriormente, los datos se clasifican en cualitativos o cuantitativos. Los datos cualitativos
emplean etiquetas o nombres para determinar categorías de elementos iguales. Los datos cuantitativos son
números que indican cuánto o cuántos.
En este capítulo se presentan los métodos tabulares y gráficos empleados para datos cualitativos y
cuantitativos Los resúmenes gráficos o tabulares de datos se encuentran en reportes anuales, en artículos
en los periódicos y en estudios de investigación. Todo el mundo se encuentra con este tipo de
presentaciones. Por tanto, es útil saber cómo se hacen y se interpretan. Se empezará con los métodos
tabulares y gráficos para resumir datos que se refieren a una sola variable. En la última sección se
introducen los métodos para resumir datos cuando lo que interesa es la relación entre dos variables.
Los paquetes modernos de software para estadística proporcionan muchas posibilidades para resumir datos
y elaborar presentaciones gráficas. Minitab y Excel son dos paquetes muy empleados.
Una distribución de frecuencia es un resumen tabular de datos que muestra el número (frecuencia) de
elementos en cada una de las diferentes clases. Las clases deben ser mutuamente excluyentes. +
Proceso estadístico
Distribución de Frecuencia
DISTRIBUCIONES DE FRECUENCIA
La construcción de una tabla de frecuencia para datos cualitativos requiere solo del conteo del número de
elementos o individuos que caen dentro de cierta clase o categoría.
Tablas de frecuencias. Una tabla de frecuencia contiene:
b. Frecuencia: Es el número de datos que pertenece a cada clase. La frecuencia se simboliza con la
letra f. El conteo de la frecuencia de cada clase de puede registrar mediante marcar en grupos.
c. Frecuencia Relativa: Es el cociente entre la frecuencia y el número total de datos, se simboliza hi.
La frecuencia relativa representa un porcentaje, que se haya multiplicado por 100 al cociente
indicado de la frecuencia relativa.
La siguiente tabla de frecuencias corresponde a los datos de la variable medio de comunicación del ejemplo:
Es necesario interpretar la información contenida en las tablas de frecuencia, para deducir cuales son las
principales características de la variable en estudio.
Por ejemplo, en la tabla anterior elabore dos conclusiones. Se puede apreciar que:
Representaciones
gráficas
Cuantitativas Cuantitativas
A continuación, se tratarán las partes más fundamentales de una gráfica y los aspectos a tener en cuenta
para su construcción, luego se presentarán los distintos tipos de gráficas usadas más comúnmente en
estadística entre las cuales se encuentran el histograma, el polígono de frecuencias, la ojiva, os gráficos de
puntos, lineales, de barras y circulares y los pictogramas.
Cuando se diseña una gráfica, sea esta cual fuere, deben tenerse en cuenta ciertos aspectos con el fin de
mejorar su apariencia y mostrar con claridad lo que se quiera que ella refleje.
Una gráfica siempre debe poseer un título que indique la descripción del contenido de ella. En muchas
ocasiones, es importante indicar la escala con la cual se trabajó. Es decir, identificar los ejes coordenados (X
y Y) e indicar sus magnitudes correspondientes. La escala se aplica para saber la dimensión del fenómeno
graficado. Otro aspecto importante a tener en cuenta es la fuente de información, que indique de donde
han sido tomados los datos incluyendo el tipo de publicación, el año de registro y otros indicadores que
resulten importantes para la investigación.
La forma y el tipo de la gráfica que se seleccione depende en gran parte del investigador o de quien la
elabora, sin embargo debe tenerse en cuenta para quien va dirigida esta, el lugar de exposición y otros
factores de logística que intervienen en la decisión del mejor diseño. Existen ciertos principios generales que
se debe tener en cuenta en el logro de una buena gráfica:
Si en la investigación se tienen varias gráficas, estas deben estar enumeradas en forma consecutiva.
Toda gráfica debe tener un título que aclare su contenido.
En los diagramas, las líneas de la ordenada y la abscisa que llevan escala, deben ser más gruesas
que las demás.
La mejor grafica es la más sencilla. Evite saturar la gráfica de datos o textos innecesarios. Haga uso
de sólo lo estrictamente necesario.
La gráfica no sustituye el cuadro o la tabla, debe ser el complemento.
Toda grafica debe ir acompañada de convenciones para identificar las características que se
grafican
La lectura de la escala del eje horizontal se hace de izquierda a derecha y la del eje vertical se hace
de abajo hacia arriba.
La representación del hecho debe variar solo en una dimensión.
En toda grafica se debe explicar la fuente de donde fueron obtenidos os datos, aclarar las escalas,
leyendas, notas, llamadas y convenciones que ayuden a identificar e interpretar las características
presentadas.
Las gráficas nunca preceden al texto.
GRÁFICO DE BARRAS
El instrumento más común para representar una variable cualitativa en forma gráfica es la gráfica de barras.
En la mayoría de los casos, el eje horizontal muestra la variable de interés y el eje vertical la cantidad,
número o fracción de cada uno de los posibles resultados. Una característica distintiva de la gráfica de
barras es que existe una distancia o espacio entre las barras
La gráfica de barras se puede usar para describir una serie de datos de cualquier nivel de medición
16
14
12
10
8
6
4
2
0
Televisión Radio Internet Prensa
El diagrama de barras se puede trabajar para describir una sola característica de la variable, diagrama de
barras simple, o bien describir y comparar dos o más características de ella de forma segmentada o
agrupada. Para diferenciar una característica de otra en la misma barra se recurre a diferenciarlas usando
colores, sombreándolas o rellanándolas con tramas.
Ejemplo:
La siguiente información corresponde a las ventas por departamento, al contado y a crédito, de un almacén
de cadena en la ciudad de Bucaramanga en el mes de marzo de 2005. Los valores representan las ventas en
millones de pesos.
Los siguientes diagramas de barras verticales describen las ventas por departamento del almacén.
Obsérvese que tanto la figura 1 y 2, aunque sean visualmente diferentes, ofrecen los mismo resultaos.
Inténtelo haciendo los diagramas de forma horizontal, ¿Es clara la información? ¿Cuál tipo de diagrama de
barras elegiría usted para una investigación? ¿Por qué?
Obsérvese además, en la figura 1, que también se puede graficar una barra más, la correspondiente al total
de ventas, la cual permitiría una comparación eficiente de las ventas del almacén ¿cómo sería esta grafica?
Figura 1.
Grafico de Barras agrupadas de las ventas por
dpto al contado y a crédito en Marzo de 2005
Electrodomésticos 210
300
Calzado 90
150
Ropa 110
180
Alimentos 120
200
Crédito Contado
Figura 2.
Calzado 150 90
Contado Crédito
Construya una tabla de frecuencias relativas para los datos de la tabla 2. y con elle elabore por lo menos dos
diagramas de barra diferentes en los que muestre el porcentaje de ventas de contado y a crédito alcanzadas
durante ese mes en el almacén de cadena para cado uno de los departamentos evaluados. Elabore una
pequeña síntesis de los resultados que arrojan las gráficas que ha construido.
DIAGRAMA CIRCULAR
Es otro tipo de grafico que permite observar los componentes de un total, como sectores de un círculo. Se
utiliza para representaciones gráficas de distribuciones porcentuales. Es una forma efectiva de representar
distribuciones de frecuencias en las que la característica es cualitativa.
Los ángulos de los sectores son proporcionales a los componentes del total. Se construye subdividiendo los
360° de un círculo, proporcionalmente al número o al porcentaje de cada una de las clases que se ha
dividido la observación. Una mayor apreciación se logra coloreando distintamente los sectores o dándole
una trama a cada sector.
Ejemplo:
En una entrevista masiva de una multinacional, asistieron 1250 personas con expectativas de emplearse. De
ellas el 50% eran casados, 25% solteros, 15% separados y 10% en unión libre. SI se quisiera mostrar en un
diagrama circular estas proporciones, se debe tener en cuenta que los 360° del círculo equivalen al 100%,
debe pues plantearse una regla de tres simple:
De la misma manera, el 25% equivale a 90° en el círculo, 15% a 54° y 10% a 36°. Compruébelo. Así pues, se
grafica el diagrama circular:
10%
15%
50%
25%
Está compuesta de segmentos de líneas que unen los pares ordenados a representar. Sirven para describir
los cambios o fluctuaciones que sufre un fenómeno, generalmente durante un tiempo. Pueden ser simples,
cuando se dibuja una sola serie de datos o compuestos, cuando se comparan dos o más series de datos,
generalmente a través del tiempo (series cronológicas)
Ejemplo:
Diagrama de líneas
Egresados en el periodo 2000- 2004
2500
Número de Egresados
2000
1500
1000
500
0
2000 2001 2002 2003 2004
Años
También se puede leer de este tipo de gráficos que, independientemente de las fluctuaciones en el tiempo,
la Facultad de Ciencias Administrativas es la que se reporta mayor número de egresado anuales, seguida de
Ciencias Sociales Humanas y Educativas, Ciencias Básicas e Ingeniería y por ultimo Ciencias Agrarias.
k k
Formula Sturges: 𝑘 = 1 + 3,3 log 𝑛 o 2 , si se cumple 2 > n
2. Determine el intervalo o ancho de clase i. Todas las clases deben cubrir el valor más bajo y el valor
más alto.
3. Establecer los límites de cada clase. Cada observación se debe incluir en una sola categoría.
4. Ingresar los datos de la variable en cada clase
5. Contar el número de elementos de cada clase.
Paso 1: Defina el número de clases. El objetivo consiste en emplear suficientes agrupamientos o clases,
de manera tal que se perciba la forma de la distribución. Aquí se necesita criterio. Una gran cantidad de
clases o muy pocas podrían no permitir ver la forma fundamental del conjunto de datos. Una gran
cantidad de clases o muy pocas podrían no permitir ver la forma fundamental del conjunto de datos. En el
ejemplo de la ganancia del vehículo, tres clases no darían mucha información sobre el patrón de los datos
(vea la tabla 1).
Tabla 1.
Paso 2: Determine el intervalo o ancho de clase. El intervalo o ancho de clase debería ser el mismo para
todas las clases. Todas las clases juntas deben cubrir por lo menos la distancia del valor más bajo al más
alto de los datos. Expresado esto en una fórmula sería:
𝑅𝑎𝑛𝑔𝑜 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟
𝑖= =
𝑘 𝑘
𝑅𝑎𝑛𝑔𝑜 = 𝑅 = 𝑉𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑉𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜
𝑅 = 3 292 − 294 = 2 998
2 998
𝐴𝑛𝑐ℎ𝑜 = 𝑖 = = 374,75
8
En la práctica, se redondea a una cifra conveniente, tal como un múltiplo de 10 o 1000. En este caso, el
valor de $ 400 podrá emplearse sin inconvenientes.
En las distribuciones de frecuencia son preferibles los intervalos de clase iguales. Sin embargo, en ciertos
casos se necesita que no lo sean para evitar un gran número de clases vacías o casi vacías.
Paso 3: Establezca los limites de cada clase. Este paso es importante para que sea posible incluir cada
observación en una sola categoría. Esto significa que debe evitar la superposición de límites de clase
confusos.
Se recomienda elegir límites convenientes de clase. Una directriz consiste en convertir el límite inferior de
la primera clase en un múltiplo del intervalo de clase. A veces esto no es posible, pero se recomienda en la
medida de lo posible, debe redondearse. Para el ejercicio, las clases que podrían utilizarse para esos datos
son:
Clases
$ 200 a $ 600
600 a 1 000
1 000 a 1 400
1 400 a 1 800
1 800 a 2 200
2 200 a 2 600
2 600 a 3 000
3 000 a 3 400
Paso 4: Ingresar los datos de la variable en cada clase. Anote las ganancias de venta en las clases. Para
comenzar, la ganancia de venta del primer vehículo en la tabla de precios es de $ 1 387, cifra que se debe
anotar en la clase de $ 1 000 a $ 1 400. La segunda ganancia de la primera columna de la tabla es de $ 2 148.
Se anota en la clase de $ 1 800 a $ 2 200. El resto de las ganancias se cuadran de forma similar
Paso 5: Cuente el número de elementos de cada clase. El número de elementos que hay en cada clase
recibe el nombre de frecuencia de clase. En la clase de $200 a $ 600 hay 8 observaciones y así
sucesivamente.
Ganancia en $ Frecuencia
200 a 600 8
600 a 1 000 11
1 000 a 1 400 23
1 400 a 1 800 38
1 800 a 2 200 45
2 200 a 2 600 32
2 600 a 3 000 19
3 000 a 3 400 4
Total 180
De forma general, una tabla de distribución de frecuencias para una variable cuantitativa debe contener
como mínimo la siguiente información.
Frecuencia
Nombre de la variable Frecuencia Frecuencia relativa
Frecuencia (fi)
que se observa relativa (hi) acumulada Fi acumulada
(Hi)
TOTAL
Fuente xxxx
Relacionar un texto que permita entender la relación de los valores dentro de un cuadro
En la mayoría de los casos, es de mucha utilidad e importancia hacer resaltar la información que se
encuentra contenida en las tablas de distribución de frecuencias.
Por lo general, se acompaña siempre una tabla o cuadro de resúmenes de los datos con su respectiva
gráfica. Existe una gran variedad de formas para presentar los datos en forma gráfica. La variedad de formas
y disposición de las gráficas depende del investigador que desea resaltar ciertas características principales
de los datos que se estén estudiando. Dentro de los gráficos más representativos se cuenta con Histograma,
Polígono de frecuencias, Ojiva (menor que y mayor que), Diagrama de puntos, Diagrama de Tallo y Hojas,
Diagrama de Caja (Box-Plot).
HISTOGRAMA DE FRECUENCIAS
En el caso de las distribuciones de frecuencia agrupada, la forma de representación gráfica más común, se
conoce con el nombre de histograma de frecuencias. Estos se construyen representando los intervalos de
clase en la escala horizontal y las frecuencias de clase (absolutas o relativas) en la escala vertical y trazando
rectángulos cuyas bases equivalen a la amplitud de los intervalos de clase y sus alturas corresponden a las
frecuencias de cada clase.
Características
40 38
32
30
23
20 19
11
10 8
0
200 600 1000 1400 1800 2200 2600 3000 3400
utilidad
Fuente: Departamento de Ventas
A partir del histograma es posible concluir lo siguiente:
• La ganancia que se obtuvo por la venta de un vehículo está en un rango de $ 200 a $ 3 400.
• Las ganancias se concentran entre $ 1 000 y $ 3 000. La ganancia sobre 157 vehículos, u 87%,
cayeron dentro de este rango.
• La mayor concentración, o frecuencia más alta, se encuentra en la clase de $ 1 800 a $ 2 200. La
mitad de esta clase es $ 2 000. Por lo tanto, la ganancia típica en la venta de un vehículo es de $ 2
000.
POLÍGONO DE FRECUENCIAS
Describe también la información de la distribución de frecuencias absolutas o relativas. Pero se grafican las
marcas de clase de cada intervalo, generando una secuencia de puntos que se unen en segmentos de recta
para formar un polígono, de ahí el nombre.
50 POLIGONO DE FRECUENCIA
40
30
Frecuencia
20
10
0
Tanto el histograma como el polígono de frecuencias permiten tener una vista rápida de las principales
características de los datos (máximos, mínimos, puntos de concentración, etc.). Aunque las dos
representaciones tienen un propósito similar, el histograma posee la ventaja de que describe cada clase
como un rectángulo, en el que la barra de altura de éste representa el número de elementos que hay en
cada clase. El polígono de frecuencias, en cambio, tiene una ventaja con respecto al histograma. También
permite comparar directamente dos o más distribuciones de frecuencias.
OJIVA
La ojiva es el gráfico de una distribución de frecuencias acumuladas (relativas o absolutas) y puede ser
descendente o ascendente. Ella permite presentar en un mismo gráfico, diferentes curvas lo que no permite
el histograma de frecuencias. En el eje horizontal se ubican el límite superior de cada intervalo de clase y en
el vertical, las respectivas frecuencias acumuladas, ya sean relativas o absolutas. Luego se unen estos puntos
en una curva suavizada, partiendo desde el límite inferior del primer intervalo.
Las frecuencias acumuladas pueden emplearse para determinar cuántos datos u observaciones están por
arriba o por debajo de cierto valor. La ojiva para el caso de las ganancias de Vehicar se observa en la
siguiente figura:
HISTOGRAMAS DE DENSIDAD
En este caso se representa en el eje vertical la densidad. Este tipo particular de histograma se denomina
histograma de densidad y tiene la misma forma que el histograma de frecuencias cuando la amplitud de los
intervalos es la misma.
a. Determine los puntos límite para los intervalos de clase.
b. Calcule las frecuencias y las frecuencias relativas para cada clase.
c. Calcule la densidad para cada clase.
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎
𝐷𝑒𝑛𝑠𝑖𝑑𝑎𝑑 =
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
d. Dibuje un rectángulo para clase, cuya altura sea igual a la densidad. Use los mismos pasos para
dibujar una distribución de frecuencia, excepto que la escala del eje vertical es la escala de
densidad.
e. En un histograma de densidad el área de la barra representa el porcentaje valores que
corresponden a la clase.
Á𝑟𝑒𝑎 = 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒
Ejemplo: La siguiente tabla corresponde a las emisiones de gas de 62 vehículos conducidos a una gran
altitud. El rango de la muestra va desde un mínimo 1,11 a un máximo de 23,38 en unidades de gramos de
emisiones por galón de combustible
0,14
0,12
0,10
Densidad
0,08
0,06
0,04
0,02
0,00
1 3 5 7 9 11 15 25
emisiones (g/gal)
El arreglo de tallo y hojas es una técnica que resume de manera simultánea los datos en forma numérica y
presenta una ilustración grafica de la distribución.
Se trata de organizar los datos numéricos en dos columnas divididas por una línea vertical. La primera
denominada tallo, corresponderá a las decenas, centenas o unidades que representan el grupo de datos y
en la segunda, llamada hojas irán las correspondientes decenas, unidades o décimas.
4 0 1111
19 0 222222223333333
(14) 0 44445555555555
29 0 66666666777777
15 0 8889999
8 1 0
7 1 233
4 1
4 1 7
3 1 89
1 2
1 2 3
DIAGRAMA DE PUNTOS. Es un gráfico que se puede usar para tener una impresión aproximada de la forma
de la muestra. Es útil cuando el tamaño de la muestra no es demasiado grande y cuando contiene algunos
valores repetidos. El diagrama de puntos da una buena indicación de dónde se concentran los valores de la
muestra y dónde hay separaciones.
En la siguiente figura se presenta el diagrama de puntos para los datos de emisiones de vehículos
conducidos a mayor altitud. El diagrama de puntos da una buena indicación de dónde se concentran los
valores de la muestra y donde hay separaciones. Por ejemplo, se observa que en la figura xxx se muestra
que no se detectan emisiones en los lapsos de 10 y 12 g/gal, entre 14 y 17 g/gal entre otros.
Primer Punto: A continuación se muestran los ingresos registrados en 50 familias seleccionadas al azar de
estrato 3 en una importante ciudad:
Segundo Punto: Construya una tabla de frecuencia que agrupe los datos en 10 intervalos de clase.
Tercer Punto: Debido a un grave accidente, el gerente de una compañía consultora perdió información de
un estudio de mercado que realizó a una importante compañía a nivel nacional de gaseosas. Solo se conoce
algunos datos parciales sobre una entrevista que se elaboró a 150 personas.
Nc Lm Ls f F h H
1 0 2,1 24
2 2,1 4,1 0,25
3 4,1 6,1 0,71
4 6,1 8,1 123
5 8,1 10,1 8
6 10,1 12,1
7 12,1 14 1
TOTAL 150 1
Cuarto Punto: La siguiente gráfica muestra los salarios por hora de una muestra de soldadores en una
determinada región.
a) ¿A cuántos soldadores se estudió?
b) ¿Cuál es el intervalo de clase?
c) ¿Aproximadamente cuántos soldadores ganan menos de $10.00 la hora?
d) ¿Cerca de 75% de los soldadores ganan menos de qué cantidad?
e) ¿Diez de los soldadores estudiados ganan menos de qué cantidad?
f) ¿Qué porcentaje de soldadores gana menos de $20.00 la hora?
Quinto Punto: Una cadena de tiendas deportivas que satisface las necesidades de los esquiadores
principiantes, planea llevar a cabo un estudio sobre la cantidad de dinero que un esquiador principiante
gasta en su compra inicial de equipo y provisiones. Con base en estas cantidades, desea analizar la
posibilidad de ofrecer equipo, como un par de botas y un par de esquís, para inducir a los clientes a comprar
más. Una muestra de los comprobantes de la caja registradora reveló las siguientes compras iniciales:
Séptimo Punto: A partir del gráfico de ojiva, responda las siguientes preguntas (Tamaño de la muestra es
500):
Noveno Punto: El cuadro que figura más abajo da los caudales mensuales del río Magdalena observados
durante los meses de abril y mayo, desde 1988 a 2005 (la unidad de medida no se precisa).
CUESTIONARIO DE REPASO
Selección múltiple con única respuesta: Marque con una X la respuesta correcta.
a) Se puede concluir:
a) El 60% de la población ganas más de $ 400.000
b) El 50% equivale a un ingreso de $ 200.000
c) El 80% de la población gana más de $ 100.000
d) Todas las anteriores
b) Se puede concluir:
a. El 50% de la población gana más de $ 300.000
b. El 30% de la población gana menos de $ 200.000
c. El sueldo máximo registrado fue de $600.000
d. Todas las anteriores