Está en la página 1de 13

CORPORACIÓN UNIVERSITARIA PARA EL DESARROLLO

EMPRESARIAL Y SOCIAL
GUÍA BÁSICA DE ESTADÍSTICA DESCRIPTIVA
DOCENTE: LUIS FERNANDO VALENCIA G.
Estándar: Interpreto analítica y críticamente información estadística proveniente de diversas fuentes
(prensa, revistas, televisión, experimentos, consultas, entrevistas).
Interpreto y utilizo conceptos de media, mediana y moda y explicito sus diferencias en distribuciones de
distinta dispersión y asimetría.

Habilidades científicas: Definir proceso, relacionar información previa vs información solicitada. Formular los
métodos adecuados según el caso. Seleccionar y manipular variables. Encontrar resultados. Analizar resultados.

Proceso de pensamiento en el aula: Reconozco los aportes de conocimientos de diferentes científicos en los
procesos estadísticos. Evidencio el uso de esta disciplina en el resto de las áreas del conocimiento.

Competencia ciudadana: Conozco y utilizo estrategias creativas para solucionar conflictos. (Por ejemplo, la
lluvia de ideas).

Ejes temáticos.
►Datos estadísticos: variables cualitativas y cuantitativas.
►Estadística descriptiva: obtención y ordenación de datos
 Frecuencias agrupadas
 Frecuencias acumuladas
►Medidas de centralización
 Media aritmética
 Mediana
 Moda
 Cuantiles: cuartiles, quintiles, deciles, percentiles
 Usos y limitaciones
►Medidas de dispersión
 Desviación
 Desviación media
 Varianza
 Desviación típica
 Coeficiente de variación
►Ejercicios resueltos explicativos

INDICADORES DE DESEMPEÑO
► Resuelvo problemas aplicando los conceptos básicos de la estadística descriptiva, organizando los datos y
encontrando las principales medidas de dispersión

► Interpreto y utilizo conceptos de media, mediana y moda y explicito sus diferencias en distribuciones de
distinta dispersión y asimetría.

► Interpreto analítica y críticamente información estadística proveniente de diversas fuentes (prensa, revistas,
televisión, experimentos, consultas, entrevistas).

INTRODUCCIÓN

Docente: Ing. Luis Fernando Valencia. ― ESTADÍSTICA DESCRIPTIVA ― CUDES ― Página 1


¿QUE ES LA ESTADÍSTICA? su enseñanza universitaria, fueron H. Conring (1660) y G.
Achenwall (1746). En este proceso se ha de mencionar al belga
Etimológicamente: La palabra estadística procede del latín Adolfo Quetelet (1796-1874) quién usó métodos modernos para el
“consejo de Estado” y de su derivado italiano “hombre de Estado o estudio de datos, razón por la cual se le conoce como “el padre de
político”, el término alemán que fue introducido por (Gottfried la estadística moderna”. Quetelet no sólo concibió la estadística
Achenwall). En 1749 designaba originalmente el análisis de datos como la ciencia de los bienes del Estado, sino también como
del Estado, es decir, la ciencia del Estado o también llamada la aquella que fija las leyes que regulan el comportamiento del
aritmética política. No fue hasta el siglo XIX cuando el término conjunto de fenómenos presentes en la vida humana, disciplina que
estadística adquirió el significado de recolector y clasificar datos; él llama physique sociale.
este concepto fue introducido por el inglés Jhon Sinclair. En su Contemporáneo de Quetelet es K. F. Gauss (1777-1855), quién
origen, por tanto, la estadística estuvo asociada a datos, a ser estudió el comportamiento de los errores en las mediciones en
utilizados por el gobierno y cuerpos administrativos. La colección diferentes disciplinas, en particular en la astronomía, dando lugar a
de datos acerca de Estados y Localidades continúa ampliamente a la curva normal de errores o distribución de Gauss, que hoy es la
través de los servicios de estadísticas nacionales e internacionales. base de la inferencia estadística.
En particular, los censos suministran información regular acerca de Un poco después F. Galton (1822-1911) y G Mendel (1822-1884),
la población. separadamente, aplicaron métodos estadísticos y probabilísticos al
estudio de la herencia y desarrollaron modelos para la regresión y
Matemáticamente: La estadística es una ciencia matemática que la correlación estadística; sus trabajos fueron seguidos y
estudia la recolección, análisis e interpretación de datos de una perfeccionados por K. Pearson (1857-1936), quien inició y aplicó
muestra representativa de una población, ya sea para ayudar en la muchos de los métodos estadísticos que hoy se usan y encontró,
toma de decisiones o para explicar condiciones regulares o en 1900, la distribución Chi-cuadrado.
irregulares de algún fenómeno o estudio aplicado, de ocurrencia en La Estadística y la Probabilidad. Además de la certeza de la
forma aleatoria o condicional. Sin embargo, la estadística es más muerte, de que algún día moriremos y que tendremos que pagar
que eso, es decir, es el vehículo que permite llevar a cabo el los impuestos. Pocos son los aspectos de nuestra vida que eluden
proceso relacionado con la investigación científica. la influencia de la suerte. Un agrupamiento imprevisible de genes
determina nuestra constitución física. Un encuentro imprevisto
La estadística es un potente auxiliar de muchas ciencias y puede decidir la persona que se elija para el matrimonio o para un
actividades humanas, como la sociología, la psicología, la empleo. Un paso en falso puede llevarnos a un hospital. En
geografía humana y la economía, entre otras. Se emplea para general, un suceso puede cambiar nuestra vida para bien o para
mostrar los aspectos cuantitativos de una situación compleja, con mal.
un gran número de datos, y es una herramienta indispensable para Incapaces de controlar la suerte hacemos lo mejor posible:
la toma de decisiones. tratamos de evaluar la probabilidad de que ocurra un suceso
Las predicciones estadísticas difícilmente hacen referencia a particular. La probabilidad en la forma que la conocemos en la
sucesos concretos, aunque describen con considerable precisión el actualidad fue propugnada por un trío de franceses a mediados del
comportamiento global de grandes conjuntos de sucesos siglo XVII; un noble de elevada posición, el caballero De Méré, y
particulares. Son predicciones que, por ejemplo, no acostumbran a dos matemáticos esporádicos, Blaise Pascal y Pierre de Fermat.
resultar útiles para saber quién, de entre los miembros de una En 1651 ó 1652 De Méré y Pascal coincidieron en un viaje a la
población importante, va a encontrar trabajo, o a quedarse sin él; o ciudad de Poitu (Francia). Al tratar de encontrar un tópico de
en cuántos miembros va a verse aumentada o disminuida una conversación mutuamente interesante con el cual distraerse en el
familia concreta en los próximos meses. Pero, en cambio puede viaje, el mundano De Méré presentó al espiritual Pascal un
proporcionar estimaciones fiables del próximo aumento o problema matemático que había producido grandes controversias
disminución de la tasa de desempleo referida al conjunto de la desde la Edad Media: Cómo dividir la polla en un juego de dados
población, o sobre la posible variación de los índices de natalidad o que tenía que interrumpirse. Pascal reflexionó sobre el problema
mortalidad. Brinda información sobre el comportamiento de muchos durante un par de años y finalmente en 1654, lo comunicó a Fermat
datos, pero no sobre datos en particular. para conocer su opinión.
En la célebre correspondencia que siguió al problema puesto por
¿CÓMO SURGIÓ? De Méré, Pascal y Fermat empezaron por estar de acuerdo en que
un juego de dados no terminado las apuestas en la mesa deberían
La Estadística. La transformación de la sociedad medieval y la dividirse según las perspectivas de ganar que tuviese cada jugador.
aparición del estado político que necesitaba y exigía información La probabilidad y su colaboradora La estadística, en un sentido,
sobre su extensión, sus habitantes y sus bienes, así como también son como dos personas que van a la misma casa desde extremos
la necesidad de establecer perspectivas del comportamiento futuro opuestos de la calle. En la probabilidad los factores influyentes son
de las condiciones en las cuales se fundamenta, impulsaron el conocidos, mientras que en la estadística el producto final se
desarrollo de la estadística concebida como un “conjunto de conoce pero las causas están en duda.
métodos para la recolección y análisis de los datos del Estado”. Los
primeros en aportar a este desarrollo y a su difusión, por medio de ¿EN QUÉ SE APLICA?

Docente: Ing. Luis Fernando Valencia. ― ESTADÍSTICA DESCRIPTIVA ― CUDES ― Página 2


edad de una población, altura de los estudiantes de una escuela,
La estadística, integrada a la probabilidad, se usa como temperatura en los meses de verano, etc.) con el fin de describir
herramienta para el estudio de ciertos comportamientos de apropiadamente las diversas características de ese conjunto.
poblaciones de seres vivos que interesan a ciencias como la
bilogía, la física y la química, y a otras como la sicología y la La Estadística Inferencial (o Inductiva): De acuerdo con el
sociología. diccionario de la Real Academia Española, inferir significa "sacar
En la actualidad, censos y sondeos de opinión permiten a las una consecuencia o deducir algo de otra cosa".
empresas planear sus futuras políticas de mercado y prever el ►Teniendo en cuenta esto, podemos decir que la Estadística
comportamiento de los consumidores y de la competencia. Inferencial es una parte de la estadística que comprende los
Por otra parte, procesos de la biología, la química y la física se métodos y procedimientos por medio de los cuales genera los
rigen por reglas probabilísticas que establecen las expectativas de modelos, inferencias y predicciones asociadas a los fenómenos en
sus resultados. La estadística y la probabilidad también se usan en cuestión teniendo en cuenta la aleatoriedad de las observaciones.
los juegos de azar. Por medio de la inducción determina propiedades de una población
La estadística, o métodos estadísticos como a veces se llama, está estadística, a partir de una pequeña parte de la misma.
desempeñando un importante papel ascendente en casi todas las ►Extrae conclusiones útiles sobre la totalidad de todas las
facetas del progreso humano. Anteriormente solo era aplicada a los observaciones posibles basándose en la información recolectada.
asuntos de estado, de donde viene su nombre; pero ahora la ►Apoyándose en el cálculo de probabilidades y a partir de datos
influencia de la estadística se extiende a la agricultura, biología, muestrales, efectúa estimaciones, decisiones, predicciones u otras
negocios, química, comunicaciones, economía, enseñanza, generalizaciones sobre un conjunto mayor de datos.
electrónica, medicina, física, ciencias políticas, psicología, ►El principal objetivo de la Estadística consiste en poder decir
sociología y otros muchos campos de la ciencia e ingeniería, y algo con respecto a un gran conjunto de personas, mediciones u
también de las ciencias humanísticas. otros entes (población) con base en las observaciones hechas
sobre sólo una parte (muestra) de dicho gran conjunto. La
¿CÓMO SE CLASIFICA? capacidad para "decir algo" sobre poblaciones con base en
muestras está basada en supuestos con respecto a algún modelo
La estadística se clasifica principalmente en dos grandes ramas: La de probabilidad que permite explicar las características del
estadística descriptiva y la estadística inferencial. fenómeno bajo observación. Al conjunto de procedimientos
estadísticos en los que interviene la aplicación de modelos de
La Estadística Descriptiva (o Deductiva): probabilidad y mediante los cuales se realiza alguna afirmación
►Se dedica a los métodos de recolección, descripción, sobre poblaciones con base en la información producida por
visualización y resumen de datos originados a partir de los muestras se le llama Inferencia Estadística o Estadística
fenómenos en estudio. Los datos pueden ser resumidos numérica o Inferencial.
gráficamente. Ejemplos básicos de parámetros estadísticos son: la ►Estadística inferencial se refiere a un conjunto de métodos
media y la desviación estándar. Algunos ejemplos gráficos son: mediante los cuales podemos hacer afirmaciones con respecto a
histograma, pirámide poblacional, gráfico circular, entre otros. una población completa a partir únicamente de la observación de
►Describe, analiza y representa un grupo de datos utilizando una parte de ella.
métodos numéricos y gráficos que resumen y presentan la ►Realiza el estudio descriptivo sobre un subconjunto de la
información contenida en ellos. población llamado muestra y, posteriormente, extiende los
►Método de recolectar, organizar, resumir y presentar los datos resultados obtenidos a toda la población.
en forma informativa ►Estadística Inferencial se refiere al proceso de lograr
►Realiza el estudio sobre la población completa, observando una generalizaciones acerca de las propiedades del todo, población,
característica de la misma y calculando unos parámetros que den partiendo de lo específico, muestra. Las cuales llevan implícitos
información global de toda la población. una serie de riesgos. Para que éstas generalizaciones sean válidas
►Estadística Descriptiva se refiere a la recolección, presentación, la muestra deben ser representativa de la población y la calidad de
descripción, análisis e interpretación de una colección de datos, la información debe ser controlada, además puesto que las
esencialmente consiste en resumir éstos con uno o dos elementos conclusiones así extraídas están sujetas a errores, se tendrá que
de información (medidas descriptivas) que caracterizan la totalidad especificar el riesgo o probabilidad con que se pueden cometer
de los mismos. La estadística Descriptiva es el método de obtener esos errores. La estadística inferencial es el conjunto de técnicas
de un conjunto de datos conclusiones sobre sí mismos y no que se utiliza para obtener conclusiones que sobrepasan los límites
sobrepasan el conocimiento proporcionado por éstos. Puede del conocimiento aportado por los datos, busca obtener información
utilizarse para resumir o describir cualquier conjunto ya sea que se de un colectivo mediante un metódico procedimiento del manejo de
trate de una población o de una muestra, cuando en la etapa datos de la muestra.
preliminar de la Inferencia Estadística se conocen los elementos de
una muestra. Ambas ramas (descriptiva e inferencial) comprenden la estadística
►La estadística descriptiva es la rama de las Matemáticas que aplicada. Hay también una disciplina llamada estadística
recolecta, presenta y caracteriza un conjunto de datos (por ejemplo, matemática, la que se refiere a las bases teóricas de la materia. La

Docente: Ing. Luis Fernando Valencia. ― ESTADÍSTICA DESCRIPTIVA ― CUDES ― Página 3


palabra «estadísticas» también se refiere al resultado de aplicar un de números (en este caso, números enteros), se clasifica como una
algoritmo estadístico a un conjunto de datos, como en estadísticas variable cuantitativa discreta.
económicas, estadísticas criminales, entre otros.
Variable Cualitativa:
DATOS ESTADÍSTICOS Las variables cualitativas se denominan así porque sus valores son
datos expresados con palabras denotando cualidades o atributos
La estadística estudia características o propiedades de los los cuales no corresponden propiamente a los de una escala de
individuos, objetos o acontecimientos que integran un conjunto medida que permita interpretar mediante cifras las diferencias entre
determinado. Al que se denomina genéricamente Población. Para ellos. A su vez, las variables cualitativas pueden ser ordinales o
que dichas características o propiedades puedan ser objeto de nominales
estudio estadístico, es preciso obtener previamente una medida de Las Variables Cualitativas Ordinales: Son aquellas que producen
las mismas. una clasificación de los individuos según un orden o jerarquía: la
En estadística, se puede definir la medición como un procedimiento calificación obtenida en un examen por los integrantes de un curso,
para asignar un número a cada uno de los miembros de la por ejemplo, expresada en términos de «suspenso», «aprobado»,
población estudiada, de acuerdo con unas reglas determinadas. «notable», «sobresaliente», corresponde a una variable estadística
cuyos valores pueden ser para cada una de las calificaciones
Una variable estadística: mencionadas, 1, 2, 3 y 4, respectivamente. Sin embargo, la
►Una variable es una característica que al ser medida en diferencia entre los valores asignados al suspenso y al aprobado no
diferentes individuos es susceptible de adoptar diferentes valores pueden interpretarse como equivalente a la existente entre los
►Es cualquier característica o propiedad de los miembros de una valores atribuidos al notable y el sobresaliente. Con todo, el orden
población susceptible de tomar determinados valores mediante un entre los números 1, 2, 3 y 4 reproduce el orden de superioridad de
procedimiento de medición, de modo que dichos valores puedan las calificaciones consideradas, del suspenso al sobresaliente. Por
ser clasificados de forma exhaustiva en un cierto número de estas razones, se trata de una variable ordinal.
categorías posibles. Las Variables Cualitativas Nominales: Son aquellas en las que el
►Es cualquier característica que cambia en una situación único objetivo pretendido es el de obtener una clasificación en
experimental o fenómeno; de ello se deduce que no todas las categorías mutuamente exclusivas, que puedan diferenciarse o
variables estadísticas son del mismo tipo: por lo general se dividen considerarse equivalentes. Por ejemplo, el sexo de los niños
en variables cualitativas y cuantitativas. nacidos en una maternidad durante el período determinado es una
variable estadística a la que se pueden atribuir los valores 1 y 2,
Variable Cuantitativa: según que el sexo sea masculino o femenino. Con ello, tan sólo se
Las denominadas variables cuantitativas se caracterizan por tener pretende distinguir dos tipos, sin establecer ninguna jerarquía.
valores que vienen determinados por la existencia de una unidad
de medida definida con independencia de los objetivos del estudio ESTADÍSTICA DESCRIPTIVA: OBTENCIÓN Y ORDENACIÓN DE
estadístico. Esto permite no sólo clasificar a los miembros del DATOS
conjunto estudiado, sino también interpretar las diferencias entre
categorías distintas de clasificación en términos de cantidades. El objetivo de los estudios estadísticos es, con frecuencia, facilitar
Las variables cuantitativas, a su vez, pueden ser continuas o el establecimiento de comparaciones que se consideran pertinentes
discretas. entre determinados procesos, fenómenos o situaciones. Para ello,
Las Variables Cuantitativas Continuas: Son aquellas que pueden es imprescindible organizar antes los datos de manera resumida y
tener como valor efectivo cualquier número real. operativa. A ello está dedicada la estadística descriptiva.
Ejemplo: La estatura de los alumnos de un determinado centro de Cuando se manejan grandes conjuntos de datos, el procedimiento
enseñanza, por ejemplo, es una variable estadística que toma preliminar más adecuado para su tratamiento consiste en
como valores el número de centímetros que mide cada uno de los distribuirlos en clases o categorías, de acuerdo con el número de
alumnos. Se utiliza una unidad de medida definida con casos que pertenecen a cada una de dichas clases. Se supone, por
independencia del estudio estadístico, por lo que se trata de una ejemplo, que se quiere estudiar la demanda existente en el
variable cuantitativa. Además, teniendo en cuenta que el valor mercado respecto de un cierto artículo de consumo y que, para
efectivo de la medición puede ser cualquier número real, esta ello, se procede a anotar las cantidades de artículos vendidos en
variable se considera como una variable cuantitativa continua. una semana en cuarenta y ocho puntos de venta, de lo cual se
Las Variables Cuantitativas Discretas: Son aquellas que sólo obtiene la siguiente colección de valores.
pueden tomar valores en un conjunto discreto (es decir, no 75 78 78 68 76 75 62 73 77 88 88 74
continuo) de números. 60 62 83 71 73 95 75 72 79 74 76 98
Ejemplo: La asistencia de alumnos a las clases de una materia 95 82 85 82 90 65 94 88 67 69 73 78
determinada a lo largo de un curso es, desde el punto de vista de la 89 93 76 75 59 81 60 87 63 97 62 75
estadística, una variable que toma como valores el número de los
asistentes a cada una de las clases. También se trata de una
variable cuantitativa, que como sólo se toma una cantidad discreta

Docente: Ing. Luis Fernando Valencia. ― ESTADÍSTICA DESCRIPTIVA ― CUDES ― Página 4


Para facilitar el análisis, se ordenan los datos en orden creciente. 𝒏 = 𝒇𝟏 + 𝒇𝟐 + 𝒇𝟑 + ⋯ + 𝒇𝒏
Este trabajo resulta sin duda, algo laborioso. Será entonces También se puede escribir de una forma más resumida utilizando el
necesario condensar los datos. símbolo de sumatoria, representado por la letra griega sigma
El modo más sencillo y práctico de hacerlo es agruparlos mediante mayúscula “”:
un tabla que indique, para cada uno de los valores de la colección, 𝒊=𝒏 𝒏
el número de veces que aparece, es decir, su frecuencia de 𝒏 = ∑ 𝒇𝒊 = ∑ 𝒇𝒊 = ∑ 𝒇𝒊
aparición, la cual recibe el nombre de frecuencia absoluta y se 𝒊=𝟏 𝒊=𝟏
denota por la letra ().
La frecuencia absoluta de un valor de una variable estadística es el Frecuencias agrupadas:
número de veces que se observa dicho valor, o el número de casos Cuando un conjunto de datos estadísticos corresponde a un
clasificados en la clase definida por él. número muy grande de observaciones de los valores de una
variable, el manejo de todos ellos puede resultar difícil. Por ello, se
recurre a menudo a agrupar los datos en categorías o clases, cada
Demanda
Frecuencia
Demanda
Frecuencia
Demanda
Frecuencia una de ellas correspondiente a un grupo de valores de la variable.
absoluta () absoluta () absoluta () Por otro lado, se determinan las frecuencias con las que se
presentan cada una de las clases.
59 1 73 3 85 1
60 2 74 2 87 1 Intervalos de clase
Para las variables cuantitativas, la agrupación de frecuencias se
62 3 75 5 88 3 hace dividiendo el rango de la variable en intervalos consecutivos,
63 1 76 3 89 1 denominados intervalos de clase, que se acostumbran a tomar de
65 1 77 1 90 1 la misma amplitud.
67 1 78 3 93 1 En el ejemplo del análisis de la venta de un artículo, si se toma un
68 1 79 1 94 1 tamaño de clase igual a 5, se obtiene la siguiente agrupación:
69 1 81 1 95 2 59–63, 64–68, 69–73, 74–78, 79–83, 84–88, 89–93, 94–98.
71 1 82 2 97 1 Los valores extremos, que delimitan cada intervalo de clase, se
72 1 83 1 98 1 conocen con el nombre de límites de clase: el menor es el límite
inferior. La siguiente tabla presenta las frecuencias agrupadas del
Frecuencia Absoluta Total () 48 ejemplo tomado:

En resumen, para agrupar los datos por su frecuencia, en primer Intervalo Frecuencia
lugar, se ordenan los datos en orden creciente, y luego, se cuenta de clase absoluta ()
la frecuencia absoluta de cada valor. 59–63 7
En la tabla anterior se han anotado las frecuencias de las distintas 64–68 3
demandas: cada casilla de la columna de frecuencias indica en 69–73 6
cuántos establecimientos se han venido un número determinado de 74–78 14
artículos, recogidos en la segunda columna. 79–83 5
Se observa que el menor de los valores obtenidos es 59, y que el
84–88 5
mayor es 98. De esta observación surge el concepto de rango,
89–93 3
recorrido o amplitud de la variable, que se define como la diferencia
94–98 5
entre el mayor y el menor de los valores obtenidos. En el ejemplo,
el rango es: 98 – 59 = 39. En resumen, el método general para la distribución de frecuencias
La frecuencia relativa de un valor observado es el cociente entre la consiste en, primero, determinar el mayor y el menor de entre los
frecuencia con que se presenta dicho valor y el total de datos registrados, a partir de los que se calcula el rango; a
observaciones y se calcula mediante la fórmula: continuación, se divide el rango en un número conveniente de
𝒇𝒊 intervalos de clase del mismo tamaño, y por fin se determina el
𝒇𝒓 = número de observaciones que caen dentro de cada intervalo de
𝒏 clase, es decir, se encuentran las frecuencias de clase.
Si se quiere dar porcentual se calculará así:
𝒇𝒊
𝒇𝒓 % = 𝟏𝟎𝟎 × Frecuencias acumuladas:
𝒏 Si se indica, para cada clase, el número de observaciones que
Dónde 𝑓𝑟 es la frecuencia relativa, 𝑓𝑟 % es la frecuencia relativa
porcentual, 𝑓𝑖 es la frecuencia absoluta correspondiente a cada corresponden a los valores de la variable iguales o inferiores al
límite superior de la clase, se obtiene una distribución de
valor 𝑖, y 𝑛 es el número total de observaciones, es decir, es la
frecuencias acumuladas. Este valor se representa mediante la letra
suma total de todas las frecuencias o la frecuencia absoluta total:
𝔽. En la práctica, la distribución de frecuencias acumuladas se
Docente: Ing. Luis Fernando Valencia. ― ESTADÍSTICA DESCRIPTIVA ― CUDES ― Página 5
obtiene mediante la suma de la frecuencia de cada clase con los Un primer tipo de estos parámetros lo constituyen los llamados
valores de las frecuencias correspondientes a las clases de valores estadísticos de centralización o de tendencia central, que permiten
menores. describir, de forma cuantitativa y resumida, la posición de los
Intervalo Frecuencia Frecuencia valores de la variable a lo largo de su rango o recorrido.
de clase absoluta () acumulada (𝔽) Se trata de algún tipo de promedio de los valores de la variable,
59–63 7 7 definido de manera que se tengan en cuenta las características de
64–68 3 10 la variable, así como el hecho de que los distintos valores pueden
69–73 6 16 presentarse con frecuencias diferentes. Los más utilizados son la
74–78 14 30 media aritmética, la mediana y la moda. La media aritmética sólo
79–83 5 35 está definida para variables cuantitativas, la mediana puede
84–88 5 40 utilizarse también para variables ordinales, y la moda está definida
89–93 3 43 para todo tipo de variables. También son importantes los cuantiles,
94–98 5 48 en los que se incluyen los cuartiles, los quintiles, los deciles y los
percentiles.
La frecuencia relativa acumulada o se calcula con la fórmula:
𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂 𝒂𝒄𝒖𝒎𝒖𝒍𝒂𝒅𝒂
𝒇𝒓𝒂 = Media aritmética:
𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂 𝒕𝒐𝒕𝒂𝒍 Dado un conjunto de 𝑛 números, 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 , la media
Si se desea mostrar como porcentaje, se llama: «frecuencia aritmética, o simplemente media, se define como el valor 𝑥̅ dado
porcentual acumulada» y su fórmula es: por la siguiente expresión:
𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂 𝒂𝒄𝒖𝒎𝒖𝒍𝒂𝒅𝒂 𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ + 𝒙𝒏
𝒇𝒓𝒂 % = 𝟏𝟎𝟎 × ̅=
𝒙
𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂 𝒕𝒐𝒕𝒂𝒍 𝒏
En el ejemplo que estamos desarrollando, en el primer intervalo de El numerador de la expresión anterior se puede escribir también
clase la frecuencia acumulada es 7; como la frecuencia total es mediante una sumatoria de la siguiente manera:
igual a 48, para hallar la frecuencia relativa acumulada se divide: 𝒏
7 ÷ 48 = 0,1458 𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ + 𝒙𝒏 = ∑ 𝒙𝒊
Este resultado se multiplica por cien para dar el resultado en tanto 𝒊=𝟏
porciento: Es decir, la sumatoria desde el valor de 𝑖 igual a 1 hasta el valor 𝑛.
0,1458 × 100 = 14.58% De esta manera, la fórmula de la medida queda como sigue:
En la siguiente tabla se añade una columna para las frecuencias
relativas y las frecuencias relativas acumuladas: ∑𝒏𝒊=𝟏(𝒙𝒊 )
̅=
𝒙
𝒏
Frecuencia relativa
Frecuencia absoluta

Frecuencia relativa (𝒇𝒓 ) acumulada(𝒇𝒓𝒂) Por ejemplo, la media aritmética de 1, 5 y 6 es:


acumulada (𝔽)
absoluta ()
Frecuencia

1+5+6
Intervalo
de clase

̅=
𝒙 =4
Frecuencia relativa Frecuencia relativa 3
porcentual (𝒇𝒓 %) acumulada porcentual Si se dan un conjunto de valores 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 y se indican,
(𝒇𝒓𝒂 %) también, sus frecuencias respectivas, 𝑓1 , 𝑓2 , 𝑓3 , ⋯ , 𝑓𝑛 , la media
59–63 7 7 748= 0,1458= 14,58% 748= 0,1458= 14,58% aritmética se calcula de la siguiente forma:
64–68 3 10 348= 0,0625= 6,25% 1048= 0,2083= 20,83%
69–73 6 16 648= 0,1250= 12,50% 1648= 0,3333= 33,33% 𝒇𝟏 ∙ 𝒙𝟏 + 𝒇𝟐 ∙ 𝒙𝟐 + 𝒇𝟑 ∙ 𝒙𝟑 + ⋯ + 𝒇𝒏 ∙ 𝒙𝒏
̅=
𝒙
74–78 14 30 1448= 0,2917= 29,17% 3048= 0,6250= 62,50% 𝒏
79–83 5 35 548= 0,1042= 10,42% 3548= 0,7292= 72,92% En este caso, mediante la notación de sumatoria la formula se
84–88 5 40 548= 0,1042= 10,42% 4048= 0,8333= 83,33% resume así:
89–93 3 43 348= 0,0625= 6,25% 4348= 0,8958= 89,58% ∑𝒏 (𝒇𝒊 ∙ 𝒙𝒊 )
94–98 5 48 548= 0,1042= 10,42% 4848=1,0000=100,00% ̅ = 𝒊=𝟏
𝒙
𝒏
Marca de Clase
MEDIDAS DE CENTRALIZACIÓN Cuando los valores se agrupan en intervalos de clases, se calculan
en primer lugar el valor medio de cada una de las clases. Para ello,
Los procedimientos de representación gráfica de las distribuciones se suman los extremos y el resultado se divide entre 2. El resultado
estadísticas facilitan las comparaciones que, con relativa obtenido se denomina marca de clase. Para calcular el valor de la
frecuencia, son el objetivo que persiguen los estudios estadísticos, media, se utiliza en estos casos la marca de clase.
pero lo hacen en un sentido cualitativo. En el ejemplo de la venta de un artículo, se habían hallado las
Para obtener datos más precisos en forma numérica, la distribución clases de intervalo, por lo que es necesario calcular las marcas de
de frecuencias de una variable se caracteriza mediante parámetros clase respectivas: se suman los extremos de los intervalos y se
o estadísticos que permiten obtener una descripción cuantitativa de dividen entre 2. Los resultados se anotan en una nueva columna de
dicha distribución.

Docente: Ing. Luis Fernando Valencia. ― ESTADÍSTICA DESCRIPTIVA ― CUDES ― Página 6


la tabla, así como la multiplicación de cada marca de clase por su Cuartiles: Son los tres valores de la distribución que la dividen en
frecuencia absoluta correspondiente: cuatro partes iguales, Para cada rango existen tres cuartiles.
Intervalo Marca de Frecuencia Primer cuartil: Se representa mediante la letra 𝑄1 , y su valor es
𝒙𝒊 ∙ 𝒇
de clase clase (𝒙𝒊 ) absoluta (𝒇) igual a la mediana de la primera mitad de valores, o dicho de otro
59–63 61 7 427 modo, es el valor de la variable cuya frecuencia absoluta es la
64–68 66 3 198 primera que excede al cociente del total de valores dividido entre 4,
𝒏
69–73 71 6 426 es decir, a 𝟒.
74–78 76 14 1 064 Segundo cuartil: Se representa mediante la letra 𝑄2 y es el valor de
79–83 81 5 405 la variable cuya frecuencia absoluta es la primera que excede al
84–88 86 5 430 cociente del doble del total de frecuencias dividido entre 4, es decir,
89–93 91 3 273 2𝑛
a 4 . Su valor coincide con el de la mediana.
94–98 96 5 480
Tercer cuartil: Se representa mediante la letra 𝑄3 , y es el valor de
Para hallar la media, se suman los valores de la última columna:
la variable cuya frecuencia absoluta es la primera que excede al
427 + 198 + 426 + 1 064 + 405 + 430 + 273 + 480 = 3 703
cociente del triple del total de frecuencias dividido entre 4, es decir,
Y el resultado se divide entre 𝑛 = 48, puesto que es el número de 𝟑𝒏
muestras tomadas: a 𝟒 . Este valor es igual a la mediana de la segunda mitad de los
3 703 valores.
̅=
𝒙 = 77,15
48
Por tanto, la media del conjunto de datos anteriores es 77,15 Quintiles: Dividen el total de observaciones en cinco partes iguales.
Existen cuatro quintiles:
Mediana: Primer quintil: Es el valor de la variable cuya frecuencia absoluta es
La mediana de una serie de datos estadísticos es el valor para el la primera que excede al cociente del total de frecuencias dividido
𝒏
cual el número de observaciones mayores que él es igual al por 5, es decir, a 𝟓.
número de observaciones menores que él. Segundo quintil: Es el valor de la variable cuya frecuencia absoluta
Cuando el número de observaciones resulta impar, la mediana se es la primera que excede al cociente del doble del total de
define como el valor correspondiente a la observación que ocupa la 𝟐𝒏
posición central. Si el número de observaciones es par, el valor de frecuencias dividido por 5, es decir, a 𝟓 .
la mediana se determina como promedio de las dos observaciones Tercer quintil: Es el valor de la variable cuya frecuencia absoluta es
centrales. la primera que excede al cociente del triple del total de frecuencias
𝟑𝒏
Por ejemplo, la mediana de los valores 4, 8, 7, 3, 1, 5, 9 es igual a dividido por 5, es decir, a 𝟓 .
5, ya que al ordenar los números de menos a mayor (1, 3, 4, 5, 7, 8
Cuarto quintil: Es el valor de la variable cuya frecuencia absoluta es
y 9), se observa que en el centro queda el número 5.
la primera que excede al cociente de cuatro veces el total de
Al calcular la mediana de 10, 15, 25 y 42, el número de 𝟒𝒏
observaciones es par, por lo que se calcula la media de los valores frecuencias dividido por 5, es decir, a .
𝟓
centrales:
15 + 25 Deciles: Dividen el total de observaciones en diez partes iguales.
= 20 Existen nueve deciles.
2
La mediana es igual a 20. Primer decil: Se representa mediante la letra 𝑫𝟏 . Es el valor de la
variable cuya frecuencia absoluta es la primera que excede al
𝒏
Moda: cociente del total de frecuencias dividido por 10, es decir, a .
𝟏𝟎
La moda de una serie de datos estadísticos es aquel valor que se Segundo decil: Se representa mediante la letra 𝑫𝟐 . Es el valor de
presenta con la mayor frecuencia. Puede decirse que es el valor la variable cuya frecuencia absoluta es la primera que excede al
más común. Por ejemplo, la moda de los números 7, 4, 8, 6, 2, 7, 3, cociente del doble del total de frecuencias dividido por 10, es decir,
7 es igual a 7, puesto que el número que se repite más veces. 𝟐𝒏
La moda puede no existir e incluso, si existe, puede no ser única: a 𝟏𝟎.
no existe cuando todos los valores se repiten un mismo número de Tercer decil: Se representa mediante la letra 𝑫𝟑 . Es el valor de la
veces, y un conjunto de números tiene varias modas cuando hay variable cuya frecuencia absoluta es la primera que excede al
varios números que se repiten más que el resto una cantidad igual cociente del triple del total de frecuencias dividido por 10, es decir,
de veces. 𝟑𝒏
a 𝟏𝟎.
𝟒𝒏 𝟓𝒏
Cuantiles: cuartiles, quintiles, deciles, percentiles Cuarto decil: 𝑫𝟒 = 𝟏𝟎 Quinto decil: 𝑫𝟓 = 𝟏𝟎
Mediante los cuantiles se pone en relación un valor con el resto de Sexto decil: 𝑫𝟔 = 𝟏𝟎
𝟔𝒏
Séptimo decil: 𝑫𝟕 = 𝟏𝟎
𝟕𝒏

los del rango de datos. Existen diferentes tipos de cuantiles: los 𝟖𝒏 𝟗𝒏


más comunes son los cuartiles, los quintiles, los deciles y los Octavo decil: 𝑫𝟖 = 𝟏𝟎 Noveno decil: 𝑫𝟗 = 𝟏𝟎
percentiles o centiles.

Docente: Ing. Luis Fernando Valencia. ― ESTADÍSTICA DESCRIPTIVA ― CUDES ― Página 7


Percentiles: También llamados centiles, son los cuantiles que los valores y alguna medida de centralización. Para las variables
dividen el total de observaciones en cien partes iguales. Existen 99 cuantitativas, los estadísticos de dispersión más utilizados son la
percentiles o centiles: primer percentil o centil, segundo percentil o desviación media, la varianza, la desviación típica y el coeficiente
centil, tercer percentil o centil, y así sucesivamente hasta el número de variación. Para definir estas magnitudes, se introduce antes la
noventa y nueve. medida de la desviación.
Primer percentil o centil: Se representa mediante la letra 𝑃1 . Es el
valor de la variable cuya frecuencia absoluta es la primera que Desviación (𝒅):
excede al cociente del total de frecuencias dividido por 100, es La desviación de un valor de un conjunto de datos estadísticos es
𝒏
decir, a 𝟏𝟎𝟎. igual a la diferencia entre dicho valor y la media aritmética del
Segundo percentil o centil: Se representa mediante la letra 𝑃2 . Es conjunto. Se representa mediante la letra 𝑑, y su fórmula es:
el valor de la variable cuya frecuencia absoluta es la primera que 𝒅 = (𝒙𝒊 − 𝒙̅)
excede al cociente del doble del total de frecuencias dividido por Muchas veces, al calcular la desviación no se tiene en cuenta el
𝟐𝒏 signo, sino la cantidad. En ese caso, se toman los valores
100, es decir, a 𝟏𝟎𝟎. absolutos:
El resto de percentiles o centiles se calcula de manera similar. La |𝒅| = |𝒙𝒊 − 𝒙̅|
fórmula general de los percentiles o centiles es: Se puede verificar que la suma de las desviaciones del conjunto de
𝒊∙𝒏 los valores equivale a cero:
𝑷𝒊 = 𝒏
𝟏𝟎𝟎
Donde el índice 𝑖, menor que 100, sirve para indicar el número de ̅) = 𝟎
∑(𝒙𝒊 − 𝒙
orden del percentil o centil correspondiente. Los percentiles o 𝒊=𝟏
centiles más usados en la práctica son 𝑃10 , 𝑃25 , 𝑃50 , 𝑃75 𝑦 𝑃90 . Por ejemplo, se mide la distancia que hay entre dos ciudades: La
medición se repite en cinco ocasiones, con los siguientes
Usos y limitaciones resultados: 143,8 km; 144,3 km; 143,6 km; 144,0 km y por último
143,9 km. Para calcular las desviaciones, en primer lugar se halla
La estadística proporciona información útil sobre un grupo o la media, del siguiente modo:
conjunto o conjunto, pero tiene limitaciones y hay que saber 143,8 + 144,3 + 143,6 + 144,0 + 143,9
̅=
𝒙 = 143,92 𝑘𝑚
interpretar sus resultados. Si se calcula, por ejemplo, el sueldo 5
medio de los trabajadores de un país, se obtendrá un determinado En segundo lugar, se restan cada una de las distancias respecto a
valor, pero esto no significa que todos los trabajadores cobren lo la media obtenida. Como no se tiene en cuenta el signo, se calcula
mismo. el valor absoluto:
Lo mismo se aplica a las medidas de centralización: dos |𝑑1 | = |143,8 − 143,92| = 0,12
situaciones muy distintas pueden ofrecer valores de, por ejemplo, |𝑑2 | = |144,3 − 143,92| = 0,38
media muy similares. Imagínese una estadística sobre los sueldos |𝑑3 | = |143,6 − 143,92| = 0,32
de un país donde la mayor parte de la población tiene un sueldo |𝑑4 | = |144,0 − 143,92| = 0,08
medio: la media puede tener un valor muy similar a la de la |𝑑5 | = |143,9 − 143,92| = 0,02
estadística de otro país, en el que existe un gran número de
trabajadores con un sueldo muy bajo y un gran número con un Desviación media (𝑫𝒙 ̅):
sueldo muy alto. Esto se debe a que las diferencias quedan Se llama también promedio de desviación, y se simboliza como
anuladas al calcular la media. 𝑫𝒙̅. Es igual a la media aritmética de las desviaciones de una serie
En un ejemplo numérico sencillo, se observa que la media de los de valores respecto de su media aritmética. Para una serie de 𝑛
valores 20, 19, 21 y 20 es igual a 20, y que la media de los valores valores 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 , se obtiene a través de la siguiente
1, 3, 40 y 36 es también 20. Sin embargo, se trata de dos expresión:
situaciones muy diferentes, homogénea la primera y con grandes |𝒙𝟏 − 𝒙̅| + |𝒙𝟐 − 𝒙 ̅| + |𝒙𝟑 − 𝒙
̅| + ⋯ + |𝒙𝒏 − 𝒙 ̅|
desequilibrios la segunda. Para corregir esta situación, se 𝑫𝒙̅=
𝒏
introducen en estadística otras medias, denominadas de Esta expresión es equivalente a la siguiente, que está resumida
dispersión. utilizando el signo de sumatoria:
∑𝒏𝒋=𝟏|𝒙𝒋 − 𝒙
̅|
MEDIAS DE DISPERSIÓN 𝑫𝒙̅=
𝒏
Cada valor |𝒙𝒋 − 𝒙 ̅| es un valor absoluto de una desviación
Los también llamados estadísticos de dispersión miden el grado de
variación de los valores, a través de una estimación cuantitativa de respecto de la media.
su distribución en torno a puntos determinados del rango de la Para el ejemplo anterior tenemos que
0,12 + 0,38 + 0,32 + 0,08 + 0,02 0,92
variable. La primera medida del grado de variación de los valores 𝑫𝒙 ̅= = = 0,184
de una variable estadística la proporciona el propio rango o 5 5
recorrido de la variable. Lo más frecuente, sin embargo es calibrar Para calcular, por ejemplo, la desviación media de 4, 6, 12, 16, 22,
las características de esa variación mediante las diferencias entre se opera del siguiente modo:

Docente: Ing. Luis Fernando Valencia. ― ESTADÍSTICA DESCRIPTIVA ― CUDES ― Página 8


Hay cinco valores, por lo que 𝑛 = 5. Primero se calcula la media En el ejemplo anterior, se ha obtenido un valor para la varianza de
aritmética 𝑥̅ : 0,04628 𝑚2. Para calcular la desviación típica, se halla la raíz
4 + 6 + 12 + 16 + 22 cuadrada de dicho valor. De esta manera se obtiene el siguiente
̅=
𝒙 = 12
5 resultado:
El siguiente paso es calcular la desviación de cada uno de los 𝝈 = √𝜎 2 = √0,04628 = 0,215127869
valores: Como la varianza se había calculado en metros cuadrados, la
|4 − 12| = 8 desviación típica obtenida son metros. Por tanto la desviación típica
|6 − 12| = 6 es igual a 0,215127869 𝑚𝑒𝑡𝑟𝑜𝑠.
|12 − 12| = 0
|16 − 12| = 4 Coeficiente de variación (𝑽):
|22 − 12| = 10 La última medida de dispersión introducida es el llamado
A continuación se suman los valores obtenidos y se dividen por 5: coeficiente de variación, que equivale al cociente entre la
8 + 6 + 0 + 4 + 10 28
̅=
𝑫𝒙 = = 5,6 desviación típica, 𝜎, y la media aritmética, 𝑥̅ . Se representa
5 5 mediante el símbolo 𝑉, y su fórmula es:
Así pues, la desviación media en el ejemplo anterior es de 5,6. 𝝈
𝑽=
̅
𝒙
Varianza (𝝈𝟐 ): Según esto, el coeficiente de variación del ejemplo anterior es:
La varianza se calcula elevando al cuadrado las desviaciones, 𝜎 0,215127869
sumándolas y dividiendo el resultado entre el total 𝑛 de 𝑽= = = 0,08242447088
𝑥̅ 2,61
observaciones. Se representa mediante la expresión 𝜎 2 (𝜎 es la
letra griega sigma minúscula): RESUMEN DE FÓRMULAS
̅)𝟐 + (𝒙𝟐 − 𝒙
(𝒙𝟏 − 𝒙 ̅)𝟐 + ⋯ + (𝒙𝒏 − 𝒙 ̅)𝟐
𝝈𝟐 =
𝒏 ►Variable Cualitativa
Esta expresión es equivalente a:  Cualitativa Ordinal
𝟐
∑𝒏𝒋=𝟏(𝒙𝒋 − 𝒙 ̅)  Cualitativa Nominal
𝟐
𝝈 =
𝒏
Por ejemplo, se tienen los siguientes valores medidos en metros: ►Variable Cuantitativa
2,44; 2,49; 3,01; 2,66; 2,45  Cuantitativa Discreta
Para calcular la varianza se calcula, en primer lugar, la media:  Cuantitativa Continua
2,44 + 2,49 + 3,01 + 2,66 + 2,45
̅=
𝒙
5 MEDIDAS DE DISPERSIÓN
Después, se emplea la fórmula para el cálculo de la varianza de la
manera siguiente: Desviación (𝑑) ̅), o bien |𝒅| = |𝒙𝒊 − 𝒙
𝒅 = (𝒙𝒊 − 𝒙 ̅|
(2,44 − 2,61)2 + (2,49 − 2,61)2 + (3,01 − 2,61)2
+ (2,66 − 2,61)2 + (2,45 − 2,61)2 ∑𝒏 ̅|
𝒋=𝟏|𝒙𝒋 −𝒙
Desviación media (𝐷𝑥̅ ) ̅=
𝑫𝒙
= 0,2314 𝒏
Una vez calculados los cuadrados de cada una de las restas de las 𝟐
que se compone la operación anterior, se obtiene el siguiente valor ∑𝒏 ̅)
𝒋=𝟏(𝒙𝒋 −𝒙
Varianza (𝜎 2 ) 𝝈𝟐 =
para la varianza: 𝒏
0,0289 + 0,0144 + 0,16 + 0,0025 + 0,0256
𝝈𝟐 = Desviación típica (𝜎) 𝝈 = √𝝈𝟐
5
0,2314
= = 0,04628 𝝈
5 Coeficiente de variación (𝑉) 𝑽 = 𝒙̅
Como los valores estaban medidos en metros, la varianza es igual
a 0,04628 𝑚2.
̅)𝟐 + (𝒙𝟐 − 𝒙
√(𝒙𝟏 − 𝒙 ̅)𝟐 + ⋯ + (𝒙𝒏 − 𝒙
̅)𝟐
𝒏
La desviación típica (𝝈): 𝑉=
∑𝒏𝒊=𝟏(𝒙𝒊 )
La desviación típica se representa mediante la letra 𝜎. Su valor se
𝒏
halla al extraer la raíz cuadrada de la varianza. La desviación típica
es igual a:
̅)𝟐 + (𝒙𝟐 − 𝒙
√(𝒙𝟏 − 𝒙 ̅)𝟐 + ⋯ + (𝒙𝒏 − 𝒙
̅)𝟐
𝝈 = √𝝈𝟐 𝒏
Dicho de otro modo: 𝑉=
∑𝒏𝒊=𝟏(𝒇𝒊 ∙ 𝒙𝒊 )
̅)𝟐 + (𝒙𝟐 − 𝒙
(𝒙𝟏 − 𝒙 ̅)𝟐 + ⋯ + (𝒙𝒏 − 𝒙
̅)𝟐 𝒏
𝝈=√
𝒏

Docente: Ing. Luis Fernando Valencia. ― ESTADÍSTICA DESCRIPTIVA ― CUDES ― Página 9


y no se pretende establecer ninguna jerarquía. Se trata, por tanto,
MAGNITUDES ESTADÍSTICAS GENERALES de una variable cualitativa nominal.
3.) Establecer qué tipo de variable responde la clasificación de
Frecuencia absoluta (𝑓) Número de ocurrencias de un valor un programa de televisión en bueno, regular y malo. R/
Cualitativa
Frecuencia total Número total de valores 4.) La nacionalidad de una persona, ¿es una variable
estadística cualitativa o cuantitativa? R/ Cualitativa
Rango Valor mayor menos valor menor 5.) ¿Se puede considerar el peso de una persona una variable
estadística cuantitativa? R/ Sí
Frecuencia relativa (𝑓𝑟 ) 𝒇𝒓 =
𝒇𝒊 6.) La clasificación de los sabores de dulces y salados, ¿qué
𝒏 tipo de variable usa? R/ Cualitativa
7.) Indicar si el color de los ojos de los estudiantes de una
Frecuencia acumulada (𝔽) 𝔽𝒊 = 𝒇𝟏 + 𝒇𝟐 + ⋯ + 𝒇𝒊 clase es una variable cualitativa o cuantitativa. R/ Cualitativa
𝔽 ∙𝟏𝟎𝟎 8.) El número de golpes que ha marcado un equipo de fútbol,
Frecuencia relativa acumulada (𝑓𝑟𝑎 ) 𝒇𝒓𝒂 = 𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂
𝒊
𝒕𝒐𝒕𝒂𝒍 ¿corresponde a una variable cualitativa o cuantitativa? R/
Cuantitativa
MEDIDAS DE CENTRALIZACIÓN 9.) Valorar qué tipo de variable estadística es el número de los
animales que hay en una casa. R/ Cuantitativa
∑𝒏
𝒊=𝟏(𝒙𝒊 ) 10.) La distancia que existe entre dos ciudades, ¿a qué tipo de
Media 𝑥̅ de 𝑛 valores ̅=
𝒙 𝒏 variable pertenece, a las cualitativas o a las cuantitativas? R/ A
las cuantitativas
𝒂+𝒃
Marca de clase (𝑥𝑖 ) de un intervalo (𝑎 − 𝑏) 𝒙𝒊 = 11.) Al clasificar el olor de un perfume en agradable o
𝟐
desagradable, ¿se usa una variable de qué tipo? R/ Cualitativa
∑𝒏
𝒊=𝟏(𝒇𝒊 ∙𝒙𝒊 )
12.) Decidir si el deporte favorito de una persona corresponde
Media 𝑥̅ de 𝑛 valores, agrupados ̅=
𝒙 a una variable cualitativa o cuantitativa. R/ Cualitativa
𝒏
en intervalos de clase
MEDIDAS DE CENTRALIZACIÓN
Mediana Valor central o promedio de los valores centrales
13.) Calcular la medida de los valores 4, 7 y 3. R/ Se suman los
Moda Valor o valores con mayor frecuencia absoluta tres valores: 5+7+3=15; el resultado se divide entre el número de
casos que hay en el enunciado, Son 3, por lo que: 153=5; La
𝒏 𝟐𝒏 𝟑𝒏
Cuartiles 𝑸𝟏 = 𝟒; 𝑸𝟐 = ; 𝑸𝟑 = media de 5, 7 y 3 es igual a 5.
𝟒 𝟒
14.) ¿Cuál es la media aritmética de 11, 32, 14, 1, 9 y 43? R/ Se
𝒏 𝟐𝒏 𝟑𝒏 𝟒𝒏 suman todos los valores: 11+32+14+1+9+43=110; el resultado se
Quintiles 𝟓
; 𝟓
; 𝟓
; 𝟓 divide entre el número de casos, es decir, la frecuencia total, que
es igual a 6: 1106=18,33; La media es igual a 18,33
𝒏 𝟐𝒏 𝒊∙𝒏
Deciles 𝑫𝟏 = 𝟏𝟎; 𝑫𝟐 = 𝟏𝟎; ⋯ , 𝑫𝒊 = 𝟏𝟎 15.) Rocío tiene cuatro canicas, Juanita posee once, y Rosa,
tres. ¿Cuál es el número medio de canicas que tienen? R/ Se
𝒊∙𝒏 suman las canicas que tienen en total: 4+11+3=18; El resultado se
Percentiles o Centiles 𝑷𝒊 = 𝟏𝟎𝟎
divide entre 3 personas: 183=6; El número medio de canicas es
de 6.
EJERCICIOS RESUELTOS EXPLICATIVOS 16.) Sonia cuenta las ramas que tiene cada uno de los árboles
de un jardín. Anota el número de ramas de cada árbol en una
VARIABLES CUALITATIVAS Y CUANTITATIVAS libreta. El resultado es el siguiente: 4, 8, 6, 7, 4, 3, 4, 8, 8, 3, 4 y
7. ¿Cuántos árboles hay en el jardín? ¿Cuáles son las
1.) Indicar si la temperatura es una variable cuantitativa o frecuencias de cada número de ramas? Calcular también el
cualitativa. R/ La temperatura es una magnitud definida en Física, número medio de las ramas por árbol. R/ El número de árboles
que cuenta con distintas escalas, como la centígrada, o la Kelvin, del jardín es igual al número de anotaciones que hace Sonia. Ha
definidas con independencia de posibles análisis estadísticos. Se escrito 12 números en su libreta por lo que hay 12 árboles. La
trata, por tanto, de una variable cuantitativa. frecuencia es el número de veces que aparece cada uno de los
2.) La clasificación entre música clásica y música no clásica, valores. Por ejemplo el valor de 3 ramas aparece repetido dos
¿corresponde a una variable cualitativa o cuantitativa? R/ Esta veces, por lo que la frecuencia es 2. Es preferible colocar estos
clasificación no es numérica y no hay una escala de medida que valores en una tabla:
permita apreciar la diferencia entre ambas categorías, Además,
sólo se pretende obtener una clasificación en categorías exclusivas

Docente: Ing. Luis Fernando Valencia. ― ESTADÍSTICA DESCRIPTIVA ― CUDES ― Página 10


Número de Frecuencia La suma de las frecuencias coincide el número de goles por el número de jugadores y el resultado es
ramas (𝒙𝒊 ) absoluta (𝒇) con el número total de árboles, es 61
igual a la media: 𝑥̅ = 18 = 3,39; la media de goles es 3,39.
3 2 decir: 2+4+1+2+3=12 Para hallar la
19.) En un almacén se hace un inventario y se pesan todos los
4 4 media, se suman todos los valores
paquetes que hay. El responsable del almacén confecciona la
6 1 que tiene anotados Sonia en su
siguiente tabla, donde relaciona intervalos de pesos con el
7 2 cuaderno y el resultado se divide
número de paquetes encontrados:
8 3 entre el número de árboles que hay
Kilogramos Paquetes Calcular la media del peso de los
Total (𝒇) 12 en el jardín:
[0-10) 32 paquetes que hay en el almacén. R/
4+8+6+7+4+3+4+8+8+3+4+7=66
[10-20) 25 Se calcula la marca de clase de cada
La división da como resultado: 𝑥̅ =6612=5,5; Los árboles tiene de uno de los intervalos que aparecen en
media 5,5 ramas. Este resultado se podía haber hallado de otra [20-30) 11
[30-40) 7 la tabla, con la suma de los dos
manera. Se multiplica el número de ramas por la frecuencia y el extremos del intervalo y su división por
resultado se escribe en forma de tabla: [40-50) 1
2, así: «1ra marca de clase
Número de Frecuencia Se suman los resultados (1+10)/2=5»; «2da marca de clase: (10+20)/2»; «3ra marca de
𝒙𝒊 ∙ 𝒇𝒊
ramas (𝒙𝒊 ) absoluta (𝒇) obtenidos en la última clase: (20+30)/2=25»; «4ta marca de clase: (30+40)/2=35»; «5ta
3 2 6 columna y el resultado de marca de clase: (40+50)/2=45»; el número de paquetes indica la
4 4 16 dicha suma se divide por la frecuencia con la que aparece cada clase. Se calcula el producto
6 1 6 suma de las frecuencias de la marca de clase (𝑥𝑖 ) por la frecuencia (𝑓), para saber el total
7 2 14 que, como se ha obtenido de kilogramos que suman todos los paquetes: del primer intervalo
8 3 24 anteriormente, es 12: son 5∙32=160; del segundo, 15∙25=375, y se prosigue hasta el
 Total 12 66 6+16+6+14+24=66 último intervalo. Los datos obtenidos se incorporan en una nueva
La división es igual a: columna:
𝑥̅ =6612=5,5; En ambos casos se obtiene el mismo resultado. Marca Frecuencia Se suman los
17.) Juan compra tres sacos de patatas de 5 kilogramos, dos Intervalo 𝒙𝒊 ∙ 𝒇𝒊 valores de las
de clase absoluta ()
sacos de 7 kilogramos y cuatro sacos de 10 kilogramos. ¿Cuál frecuencias para
[0-10) 5 32 160
es la media del peso de los sacos de patatas? R/ Se colocan los saber el total de
[10-20) 15 25 375
valores en una tabla: frecuencias que
Se calcula la media [20-30) 25 11 275
Números de sacos 3 2 4 hay:
[30-40) 35 7 245
Kilogramos 5 7 10 multiplicando el número de 32+25+11+7+1
sacos por los kilogramos que [40-50) 45 1 45
pesa cada saco. Se suman todos los valores y se divide el Total 76 1 100 =76 paquetes; se
suman los valores
resultado entre el número de sacos que ha comprado Juan. de la última columna, lo que permite saber cuántos kilogramos
3∙5+2∙7+4∙10
𝑥̅ = Se calculan las operaciones del numerador y el suman todos los paquetes: 160+375+275+245+45=1 100 kg; se
9
resultado se divide entre el denominador: 𝑥̅ =
15+14+40 69
= 9 = divide la suma de los productos entre la suma de las frecuencias y
9 1 100
7,67; Por tanto, el peso medio de los sacos que ha comprado es el resultado es la media: 𝑥̅ = = 14,47; por tanto, el peso
76
de 7,67 kilogramos. medio de los paquetes es de 14,47 kilogramos.
18.) En un equipo de fútbol hay tres jugadores que no han 20.) Sergio posee 20 CD-ROM. La lista de los números de
marcado ningún gol, otros seis que han marcado 1 gol, tres canciones que contiene cada uno es la siguiente: 14, 33, 10,
que han marcado 5 goles, cuatro que han marcado 6 goles y, 22, 15, 16, 22, 11, 17, 19, 22, 12, 14, 22, 27, 18, 19, 22, 17 y 17.
por último, dos jugadores que han conseguido marcar 8 goles. Hacer una tabla de distribución de frecuencias en la que el
¿Cuántos goles han marcado en total los 18 jugadores? intervalo sea de tres. La tabla debe contener el intervalo de
Calcular la media en goles que ha conseguido cada uno de clase, la marca de clase, la frecuencia (absoluta), frecuencia
ellos. R/ Para disponer de estos valores, se confecciona una tabla absoluta acumulada, frecuencia relativa (porcentual),
con los jugadores y el número de goles que ha logrado cada uno de frecuencia relativa acumulada (porcentual). R/ Se ordenan los
ellos. valores de menor a mayor: 10, 11, 12, 14, 14, 15, 16, 17, 17, 17,
Goles 0 1 5 6 8 Para calcular el 18, 19, 19, 22, 22, 22, 22, 22, 27, 33; se escogen los intervalos
Número de jugadores (𝒇) 3 6 3 4 2 número de goles menores y mayores. Como el valor más pequeño es 10, se escoge
que han marcado como límite inferior del primer intervalo de clase; el valor máximo es
todos los jugadores en total, se multiplica el número de jugadores 33 y será el límite superior del último intervalo. Como se pide que la
que ha marcado un determinado número de jugadores que han amplitud de cada intervalo de clase sea tres, estos resultan: 10-12,
marcado un determinado número de goles por dicho número de 13-15, 16-18, 19-21, 22-24, 25-27, 28-30 y 31-33. Se contabiliza el
goles, y se suman los resultados: 3∙0+6∙1+3∙5+4∙6+2∙8=61; se número de CD-ROM que hay en cada intervalo para averiguar las
calcula el número de jugadores que hay. Para ello, se suman las frecuencias:
referencias: 3+6+3+4+2=18; Se divide el número de jugadores que
hay. Para ello, se suman las frecuencias: 3+6+3+4+2=18; Se divide

Docente: Ing. Luis Fernando Valencia. ― ESTADÍSTICA DESCRIPTIVA ― CUDES ― Página 11


Valores que Se calculan las Frecuencia Frecuencia
Frecuencia 2ª fila: se suman las
Intervalo caen dentro Frecuencia marcas de clase 𝒙𝒊 absoluta acumulada frecuencias de la
relativa (𝒇𝒓 )
() (𝔽)
del intervalo sumando el valor primera fila y de la
de los extremos y 3 2 segunda. El resultado
10-12 10, 11, 12 3
dividiendo el 5 4 es: 2+4=6
13-15 14, 14, 15 3
resultado por 2. 6 3 3ª fila: se suman las
16-18 16, 17, 17, 17, 18 5
Para el primer 7 6 frecuencias anteriores
19-21 19, 19 2
valor, la operación 8 5 más la frecuencia de
22-24 22, 22, 22, 22, 22 5
25-27 27 1 es:
10+12
= 11; de esta fila. El resultado es: 2+4+3=9
2
28-30 0 4ª fila: 2+4+3+6=15
la misma manera se
31-33 33 1 5ª fila: 2+4+3+6+5=20
calculan el resto de
La frecuencia relativa se calcula dividiendo la frecuencia absoluta
marcas de clase, y se anotan en la tabla solicitada:
por la suma de todas las frecuencias que es igual al último valor
Marca de Frecuencia La frecuencia también se
Intervalo obtenido al calcular las frecuencias acumuladas, es decir, 20.
Clase (𝒙𝒊 ) () denomina frecuencia
𝑓𝑟1 = 2 ÷ 20 = 0,1 𝑓𝑟2 = 4 ÷ 20 = 0,2
10-12 11 3 absoluta, la frecuencia
𝑓𝑟3 = 3 ÷ 20 = 0,15 𝑓𝑟4 = 6 ÷ 20 = 0,3
13-15 14 3 absoluta acumulada de un
intervalo de clase 𝑓𝑟5 = 5 ÷ 20 = 0,25
16-18 17 5 Se escribe la misma tabla del enunciado y de los valores obtenidos:
19-21 20 2 determinado se calcula
sumando las frecuencias Frecuencia Frecuencia Frecuencia
22-24 23 5 𝑥𝑖
absoluta () acumulada (𝔽) relativa (𝑓𝑟 )
25-27 26 1 absolutas de los intervalos
de clase anteriores (una 3 2 2 0,1
28-30 29 0 5 4 6 0,2
31-33 32 1 vez están organizados de
menor a mayor), por 6 3 9 0,15
Total 20 7 6 15 0,3
ejemplo la frecuencia
absoluta acumulada para el intervalo de clase 22-24 será así: 8 5 20 0,25
3+3+5+2+5=18 y así para los demás. La frecuencia relativa se 22.) Establecer cuál es la mediana del conjunto de valores:
calcula dividiendo la frecuencia absoluta del intervalo en cuestión 4, 8, 5, 7 y 5 R/ Se escriben los números en orden de menor a
entre la frecuencia total (o suma de todas las frecuencias) y si se mayor: 4, 5, 5, 7, 8; El número que se encuentra en el centro es el
desea dejar expresada en notación porcentual, se multiplica por número 5, por lo que la mediana es igual a 5.
100, calcémonosla por ejemplo para el intervalo de clase 22-24: 23.) Determinar cuál es la mediana del conjunto de valores:
5/20=0,25, y en notación porcentual: 100∙5/20%=25%. La 19, 11, 4, 19, 17, 9, 5, 8, 7 y 5 R/ Se ordenan los números de
frecuencia relativa acumulada se calcula dividiendo la frecuencia menor a mayor: 4, 5, 5, 7, 8, 9, 11, 17, 19, 19; Al haber un número
absoluta acumulada del intervalo en cuestión y se divide entre la par de números, se cogen los dos valores centrales, 8 y 9, se
frecuencia total acumulada, calculemos por ejemplo la del intervalo suman y se dividen entre dos para hallar la media de ambos:
8+9 17
de clase 22-24: 18/20=0,9 o en notación porcentual: = 2 = 8,5; la mediana es igual a 8,5
2
100∙18/20%=90%. Para todos los intervalos de clase los cálculos 24.) En una tienda hay mesas de distintas longitudes. Calcular
darán como resultado la siguiente tabla: la mediana de las longitudes de las mesas a partir de la
información que se encuentra en la siguiente tabla:
Acumulada

Acumulada
Frecuencia

Frecuencia

Frecuencia

Frecuencia
Clase (𝒙𝒊 )
Marca de
Intervalo

Relativa

Relativa

Longitud Frecuencia R/ Se suman las frecuencias de todos


()

(en cm) absoluta () los valores: 3+5+5+8+1=22; Para


75 3 hallar el valor central, se divide este
100 5 término por 2, es decir 222=11. Se
10-12 11 3 3 3/20=0,1515% 3/20=0,1515%
calculan las frecuencias absolutas
125 5
13-15 14 3 6 3/20=0,1515% 6/20=0,330%
acumuladas. Para ello, en cada caso,
150 8
16-18 17 5 11 5/20=0,2525% 11/20=0,5555%
se suman todas las frecuencias
200 1
19-21 20 2 13 2/20=0,110% 13/20=0,6565%
previas.
22-24 23 5 18 5/20=0,2525% 18/20=0,990% El primer valor de la columna de las frecuencias acumuladas que
25-27 26 1 19 1/20=0,055% 19/20=0,9595% supera el número 11 es el tercero, por lo que la longitud mediana
28-30 29 0 19 0/20=00% 19/20=0,9595% de las mesas es igual a 125 centímetros.
31-33 32 1 20 1/20=0,055% 20/20=1100%
Total 20 1100%
21.) Completar la siguiente tabla:
R/ La frecuencia acumulada se calcula sumando las frecuencias
previas a cada uno de los valores. 1ª fila: el valor es igual a 2.

Docente: Ing. Luis Fernando Valencia. ― ESTADÍSTICA DESCRIPTIVA ― CUDES ― Página 12


Frecuencia El primer valor de la 29.) Determinar la moda a partir de la siguiente tabla:
Frecuencia
Longitud absoluta columna de las 𝒙𝒊 2 4 6 8 10 R/ La frecuencia más alta es 7, que
absoluta
(en cm) acumulada frecuencias acumuladas 𝒇 3 2 7 6 1 corresponde al número 6. Este resultado
() que supera el número 11 significa que el número 6 se repite 7
(𝔽)
75 3 3 es el tercero, por lo que veces, por lo que la moda es igual a 6.
100 5 8 la longitud mediana de 30.) Calcular, la media y la moda del conjunto de valores
125 5 13 las mesas es igual a 125 formado por 3, 5, 3, 4, 7, 7, 8, 7 y 2. R/ Se suman todos los
150 8 21 centímetros. valores:
200 1 22 25.) Un estudio calcula 3+5+3+4+7+7+8+7+2=46; El resultado se divide entre 9, que es el
el tiempo que tardan número de valores que hay en el conjunto y se obtiene la media:
los trabajadores de una empresa en llegar de su casa a la 𝑥̅ =469=5,11; Para calcular la mediana, se escriben los números
oficina. Calcular la mediana, teniendo en cuenta que los de forma ordenada: 2, 3, 3, 4, 5, 7, 7, 7, 8. El término que se
resultados se encuentran en la siguiente tabla, ordenados encuentra en el centro es el número 5. Esto significa que la
según el número de trabajadores que tarda el intervalo de mediana es igual a 5. La moda es el término que se repite con más
tiempo indicado: frecuencia. En este caso concreto es el número 7, dado que se
Frecuencia R/ Se calcula el término medio. repite 3 veces. Tal y como puede comprobarse, los valores de la
Tiempo
(nº de Para ello, se calcula el número de media, la mediana y la moda no tienen que coincidir.
(en minutos)
trabajadores) trabajadores que hay en la 31.) A partir de la siguiente tabla, hallar la media, la mediana y
[10-20) 4 empresa, por lo que se suman la moda:
[20-30) 6 todas las frecuencias: 𝒙𝒊 5 8 9 15 16 20 R/ Se suman todas las
[30-40) 11 4+6+11+9=30; el resultado se 𝒇 2 3 2 7 11 9 frecuencias
[40-50) 9 divide por 2: 302=15. En
segundo lugar, se calcula la
frecuencia absoluta acumulada de la tabla anterior. Para ello, se
suman, e cada intervalo, todas las frecuencias previas:
Tiempo Frecuencia Frecuencia El tercer intervalo
(en (nº de absoluta tiene una frecuencia
minutos) trabajadores) acumulada absoluta acumulada
[10-20) 4 4 superior a 15, por lo
[20-30) 6 10 que la mediana se
[30-40) 11 21 encuentra en este
[40-50) 9 30 intervalo. Para
obtener una
aproximación más precisa, se calcula la marca de la clase de este
intervalo. Se suman los dos extremos del intervalo y el resultado se
divide por 2: (30+40)/2=35; los trabajadores tardan una mediana de
entre 30 y 40 minutos en llegar al trabajo, o más en concreto, 35
minutos.
26.) Encontrar cuál es la moda de los siguientes valores:4, 5, 4,
2. R/ El término que más se repite es el número 4, por lo que la
moda de este conjunto de valores es el 4.
27.) Calcular la moda del conjunto de valores 7, 9, 2, 4, 7, 2, 5 y
6. R/ Hay dos números que se repiten dos veces, esto significa que
en este conjunto de números hay dos modas: 2 y 7.
28.) En una fiesta de disfraces hay cuatro personas
disfrazadas de Superman, cinco de Batman, cinco de princesa,
cuatro de Robin Hood y seis de león. ¿A qué disfraz
corresponde la moda de los disfraces de la fiesta? R/
Disfraz Frecuencia Se confecciona una tabla para ver los
Superman 5 valores:
Batman 5 El valor más alto de la frecuencia es
Princesa 4 6, por lo que la moda es 6, que
Robin Hood 4 corresponde al disfraz de león.
León 6
Total 24

Docente: Ing. Luis Fernando Valencia. ― ESTADÍSTICA DESCRIPTIVA ― CUDES ― Página 13

También podría gustarte