Está en la página 1de 252

ESTADÍSTICA GENERAL

INTRODUCCIÓN
• Los métodos y las técnicas estadísticas, se emplean en la actualidad, prácticamente en
todas las ramas de la actividad humana. No importa si lo que nos interesa es predecir el
estado del tiempo, combatir una enfermedad con un nuevo medicamento, prevenir el
crimen o los accidentes, hacer proyecciones del crecimiento de una población, predecir
el porcentaje de aprobados y desaprobados en una asignatura, evaluar el costo de vida
de las familias, contratar o nombrar un nuevo empleado en una empresa, etc. En todas
estas acciones siempre existirá un nivel de incertidumbre, cualquiera sea su naturaleza,
el cual es necesario manipularlo en una forma científica y objetiva, si se desea obtener
resultados eficientes.
• Por otro lado, todos nosotros tenemos algo de investigadores o directores, casi a diario
hacemos pronósticos relativos a los acontecimientos futuros de nuestra vida con el fin
de predecir lo que sucederá ante nuevas situaciones o experiencias. A medida que
aparecen estas nuevas situaciones, con frecuencia apoyamos o confirmamos nuestras
ideas, pero a veces tenemos que confrontar desagradables sorpresas y/o consecuencias.
INTRODUCCIÓN
• Lo mencionado no tendría solución objetiva si no existiera un método científico que los
avalara, este método es el estadístico, y precisamente con este método es posible
desempeñarse con eficiencia en estados de incertidumbre. Si el manejo de los datos es
óptimo, los errores que se cometerán al tomar las decisiones serán mínimos.
• Las técnicas estadísticas necesitan de un conocimiento matemático de acuerdo al
mayor o menor grado de aplicación que se quiera hacer, en el presente curso la
necesidad de un conocimiento avanzado de las matemáticas no es primordial, pero si
un conocimiento mediano.
• La información ha sido siempre, y con mayor razón hoy en día, muy importante para la
toma de decisiones en todo nivel, por ello las mismas deben ser oportunas y óptimas.
Con mala o insuficiente información posiblemente la decisión sea mala, por muy bueno
que sea el procesamiento que se haya hecho de ésta. Por el contrario, por muy buena
que sea la información si el procesamiento ha sido malo seguramente también la
decisión será equivocada. En consecuencia, un sólido respaldo para una acertada toma
de decisiones, contempla ambos aspectos: información buena y suficiente, con un
procesamiento correcto.
INTRODUCCIÓN
• La estadística resulta fundamental para conocer el comportamiento de ciertos eventos,
por lo que ha adquirido un papel clave en la investigación. Se usa como una valiosa
herramienta en los diferentes campos del conocimiento y en las variadas ciencias. Es
un lenguaje universal que permite comunicar información verídica de los hechos
basada en datos cuantitativos.
• Es tan importante que casi no existe actividad humana en que no esté involucrada la
Estadística. Las decisiones más importantes de nuestra vida diaria se toman
generalmente en base a la información Estadística.
• La evolución de la estadística ha llegado al punto en que su proyección se percibe en
casi todas las áreas de trabajo. Abarca la recolección, presentación y caracterización
de la información para ayudar tanto en el análisis e interpretación de datos como en el
proceso de la toma de decisiones. Ahora la Estadística es parte esencial de la vida
profesional, es hasta cierto punto una competencia específica para todo profesional.
HISTORIA DE LA ESTADÍSTICA
• Historia de la estadística
• Los antecedentes de la estadística abundan en la Antigüedad, especialmente cuando
surgieron los primeros grandes imperios de numerosa población, como Babilonia,
Egipto o China, en los que se impuso la necesidad de contabilizar la población y
obtener información relevante para el Estado, respecto al cobro de impuestos,
necesidad de reforzar el ejército y otras materias similares.
• Formalmente, la Estadística surgió en el siglo XIX, cuando se la reconoció como
ciencia al conjugarse las probabilidades con lo que era la Estadística hasta ese
entonces “ciencia de los asuntos del Estado (status)”, que tenía el nombre de Statistik
(alemán), traducido al inglés como “aritmética política”
• En la actualidad ya con los aportes de numerosos matemáticos, se ha convertido en
una ciencia formal y que sirve como base científica en la investigación científica, lo

cual es usada por todas las áreas del conocimiento humano .


INTRODUCCIÓN

• La estadística es la base del conocimiento práctico y real. Su


definición.- La estadística es una de las ramas de la ciencia
matemática que se centra en el trabajo con datos e
informaciones que son ya de por sí numéricos o que ella misma
se encarga de transformar en números. La estadística, si bien
es una ciencia de extracción exacta, tiene una injerencia directa
en cuestiones sociales por lo cual su utilidad práctica es mucho
más comprensible que lo que sucede normalmente con otras
ciencias exactas como la matemática.
INTRODUCCIÓN
• A diferencia de otras ramas de la matemática que poseen una parte importante de abstracción, la
estadística tiene aplicaciones directas y concretas en la vida real ya que toma los números y
cifras de diferentes fenómenos sociales como por ejemplo la desocupación, la tasa de
mortalidad, la tasa de natalidad, número de habitantes de una ciudad, ingresos y egresos
económicos y muchos otros datos incluso más complejos.
• Podemos decir que la función principal de la estadística es justamente la recolección y
agrupamiento de datos de diverso tipo para construir con ellos informes estadísticos que nos den
idea sobre diferentes y muy variados temas, siempre desde un punto de vista cuantitativo y no
cualitativo. Esto es muy importante de remarcar ya que la estadística se convierte entonces en
una ciencia que nos habla de cantidades (por ejemplo, cuántas personas viven en un país por

metro cuadrado) pero no nos da información directa sobre la calidad de vida de esas personas.
INTRODUCCIÓN
• IMPORTANCIA DE LA ESTADÍSTICA EN LA INGENIERÍA
• Un ingeniero es alguien que cumple una importante función en la sociedad, un rol que consiste
en la aplicación de los principios de la ciencia para la formulación de soluciones a los
problemas enfocados en la satisfacción de las necesidades del entorno al cual pertenece. Este
proceso debe dar solución a un problema se encuentra ligado a un conjunto de pasos en los
cuales se encuentra fundamentado el método científico o método de la ingeniería que puede
resumirse como:
• 1. Observación: Mirar con atención y seriedad el comportamiento del fenómeno o problema a
estudiar.
• 2. Análisis: Identificar y analizar las variables que pueden intervenir y jugar un papel
preponderante en la generación del problema, así como en su solución.
• 3. Hipótesis: Proponer una alternativa o modelo tentativo de solución apoyado en postulados
científicos que expliquen el problema en estudio.
• 4. Prueba de la hipótesis: teniendo en cuenta la alternativa de solución o la utilización del
modelo propuesto, ejecutar un proceso de experimentación realizando los ajustes necesarios
para mejorar su semejanza con la realidad, obteniendo así información relevante para el
INTRODUCCIÓN
• 5. Demostración o refutación de la hipótesis: Verificar que los resultados
obtenidos son coherentes con la realidad estudiada.
• 6. Teoría científica o tesis: Generar conclusiones basadas en los resultados
obtenidos de la simulación procurando siempre la solución del problema.
• En el proceso de la aplicación del método científico el ingeniero deberá
entonces realizar una toma de datos que luego deberá analizar para encontrar
una relación con una teoría científica o tendencia y así poder formular un modelo
el cual puede consistir en un conjunto de expresiones matemáticas que permiten
describir la situación analizada finalmente realizar una simulación y obtener las
respectivas conclusiones. Puede inferirse entonces que al momento de realizar
las acciones descritas se deberá hacer uso de la matemática en sus diferentes
áreas. Entonces la matemática puede ser considerada como una caja de
herramientas en la cual se encuentran disponibles gran variedad de
herramientas con diferentes aplicaciones y complejidades, una de estas
herramientas es la Estadística.
INTRODUCCIÓN
• La Estadística aparece de la necesidad de entender y describir la variabilidad que se presenta en la
naturaleza de un parámetro de interés, un claro ejemplo puede citarse en el estudio del caudal de un
rio donde su variabilidad con respecto al tiempo resulta de gran importancia al momento del diseño
de una estructura para la captación del agua. La variables de interés para el ingeniero varían de
acuerdo a su
• campo de acción un ejemplo de esta afirmación puede observarse en el campo de la Ingeniería Civil
que tiene diferentes escenarios de actuación, el Ingeniero Hidráulico estará interesado en el estudio
del caudal de un rio con el objetivo del suministro del líquido a una red de acueducto, el Ingeniero
Estructural se interesara por la resistencia a la compresión del concreto utilizado en la construcción
de una columna, el Ingeniero de Transportes por la cantidad de vehículos que circulan en las horas
pico en una zona alta de congestión vehicular, El Ingeniero de Minas por el porcentaje de metales
pesados en una muestra de una zona minera. El Ingeniero Agrícola por la cantidad de lluvia caída en
una zona agrícola. Etc.
• Las necesidades del entorno pueden llegar a ser tan simples como estudiar la edad de los obreros
presentes en un fundo agrícola o asentamiento minero, o complicadas como puede observarse en el
estudio de los fenómenos climáticos actuales pues hay serias complicaciones para lograr una
predicción exacta de los potenciales desastres. En otros casos hay que estructurar una base de datos
DEFINICIÓN DE ESTADÍSTICA
• DEFINICIÓN DE ESTADÍSTICA
• A la fecha aún no es factible dar una definición exacta de la Estadística, porque los conceptos
fundamentales no tienen una definición explícita universal, o si lo tienen, no es ella suficientemente
clara para darnos una idea acabada de su significado. Por eso trataremos de presentar una
caracterización conceptual sucinta, tal como sigue:
• La Estadística es una ciencia aplicada, que nos proporciona un conjunto de
métodos y técnicas para planificar, recopilar, clasificar, presentar y analizar
datos en forma tal, que nos permita sacar conclusiones e inferencias acerca de
la población, a partir de un conjunto de datos extraídos de la misma llamada
muestra.

• En las definiciones que diversos autores dan sobre estadística, ponen especial énfasis en el hecho
de que, la palabra Estadística proviene de la palabra latina “status” que significa “Estado” y del
alemán “statistik”, en la actualidad es una ciencia, rama de la matemática cuyos métodos permiten
tener decisiones respecto a las características de una población usando solo los datos recopilados
de una muestra representativa de dicha población. Estas definiciones nos permiten además
ESTADÍSTICA
• 1.1. Estadística Descriptiva
• Es la parte de la Estadística que trata de planificar, recolectar, clasificar, presentar y
describir los datos en estudio.
• 1.2. Estadística Inferencial
• Es la parte de la Estadística que se ocupa de los métodos que nos permiten sacar
conclusiones, generalizaciones o inferencias acerca de las características de una población,
que pueden ser los parámetros o variables aleatorias, tomando decisiones generales a partir
de los datos proporcionados por la muestra.
• La Estadística es una ciencia que tiene una metodología cíclica de trabajo, empieza
estudiando la población, y cuando no es posible estudiar una población u obtener
información completa de ella, por ser muy grande o por ser a veces infinita, entonces es
necesario extraer muestras representativas de ella, mediante las técnicas de Muestreo, y
usando la información proporcionada por dicha muestra, pero analizados con la ayuda de la
Estadística Descriptiva, se sacan conclusiones e inferencias acerca de la población en
estudio, gracias a la Inferencia Estadística, cuya base es el Cálculo de las Probabilidades, y
este a su vez estudia las características teóricas de la población, todo lo demás gira
ETAPAS DE UNA INVESTIGACIÓN ESTADÍSTICA
Las etapas de una investigación usando la estadística varía de acuerdo a los objetivos del trabajo,
los cuales se pueden resumir a lo siguiente:
Determinación del problema.
 Plantear objetivos.
Planeamiento del trabajo a realizar. Variables, cuestionario, fuente de información, muestra, tamaño
de muestra, unidad de investigación o elemental, manual del encuestador, recursos humanos,
capacitación de recursos humanos, cronograma, presupuesto, etc.
Trabajo de campo, aplicación de la encuesta, recopilación de la información.
Clasificación de la información, procesamiento de datos.
Presentación de la información en cuadros y gráficas.
Análisis descriptivo de la información.
Obtención de conclusiones y realizar inferencias.
Presentación del informe final.
DEFINICIÓN DE TÉRMINOS USADOS
• Términos Usados:
• Muchos autores usan indistintamente ciertos términos estadísticos, por lo que es
necesario unificarlos bajo un solo criterio para el presente texto.
• Una población es un conjunto de datos proporcionados por las unidades
elementales que lo conforman, las decisiones y conclusiones basadas en ellas
pueden hacerse con absoluta certeza, en otras palabras, si se dispone de
información sobre la población en forma completa, el riesgo de las decisiones
incorrectas desaparece; en cambio, una muestra es solo una parte de la población y
las conclusiones hechas en base a ella pueden ser erróneas, en todo caso se hacen
con un riesgo, cuantificado en términos probabilísticos. En tanto que, universo es el
conjunto de unidades elementales en general, que tienen alguna característica en
común, quienes al ser medidos u observados respecto a una o más características
en estudio nos proporcionan datos, por lo que de un universo se puede obtener una
o más poblaciones como características medibles u observables se tenga. Sin
embargo, para los propósitos de este texto, universo y población tendrán la misma
DEFINICIÓN DE TÉRMINOS USADOS
• 2.1. Universo
• Es el conjunto total de unidades elementales o de análisis (pueden ser
personas, animales, cosas o fenómenos) que tienen alguna característica en
común, al cual se quiere estudiar.
•Ejemplo:
•Todos los alumnos matriculados en el país.
•El conjunto de los colegios del país.
•Los docentes del Perú.
•los ríos de la tierra.
•Los habitantes de la tierra.
•Las estrellas del Universo. Etc.
• 2.2. Población.
• La población se define como la totalidad de los valores posibles (mediciones o
conteos) de una característica particular de un grupo especificado de personas,
DEFINICIÓN DE TÉRMINOS USADOS
• 2.2. Población
• Se llama población en estadística al conjunto de valores de las unidades elementales (personas,
animales o cosas) que tienen alguna característica en común, cuyos datos (valores cualitativos o
cuantitativos) son obtenidos de cada una de dichas unidades elementales, como consecuencia de la
medición u observación de una o más características particulares que se quiere estudiar. La población es
un conjunto especificado y delimitado tanto en el tiempo como en el espacio, del cual se obtendrá la
muestra. A esta población se le conoce también como población objeto u objetivo. La población puede
ser finita o infinita
• Ejemplo:
• •Todos los alumnos de la UNASAM, matriculados en el semestre 2021-II (El universo sería
• todos los alumnos universitarios)
• • Todos los colegios estatales del país que funcionaron en el 2021
• (El universo sería todos los colegios)
• • Todos los ríos afluentes del Amazonas.
• • Todos los habitantes de la Región Ancash, en el mes de diciembre del 2021.
• • Todas las municipalidades provinciales del Perú.
DEFINICIÓN DE TÉRMINOS USADOS
• 2.3. Muestra
• Es una parte o subconjunto representativo de la población, seleccionados de acuerdo a las
técnicas de muestreo. Cabe recordar que se pueden seleccionar no solo uno, sino varias
muestras de una población, e incluso de diferentes tamaños y no necesariamente coincidentes.
• Ejemplo:
• • 50 alumnos de la UNASAM, matriculados en el semestre 2021-II
• • 85 colegios nacionales del país que funcionaron el 2021.
• • 15 ríos afluentes del río Amazonas.
• • 2500 habitantes de la Región Ancash, en el mes de diciembre
• del 2021.
• • 20 municipalidades provinciales del Perú.
• • 35 granjas avícolas del Dpto. de Lima que tributaron en el
• 2021. etc.
DEFINICIÓN DE TÉRMINOS USADOS
• 2.4. Parámetro
• Es un valor que describe a alguna característica de la población y para determinarlo mayormente se necesitan
todos los datos de la población; generalmente se les representa con letras griegas minúsculas.
• Ejemplo:
• μ = Media poblacional.
• σ = Desviación estándar poblacional.
• = Coeficiente de correlación poblacional.
• N = Tamaño de la población. P = proporción poblacional

• 2.5. Estadístico.
• Es un valor representativo de la muestra, que se obtiene a partir de los datos muestrales y describe alguna
característica de la muestra. Se les representa con letras latinas.
• Ejemplo:
• = Media muestral.
• S = Desviación estándar muestral.
• r = Coeficiente de correlación muestral.
DEFINICIÓN DE TÉRMINOS USADOS

• .6. Unidad Elemental


• Se le llama también unidad de análisis, es el ente que proporciona al ser medido u
observado, un dato, correspondiente a la característica que se quiere estudiar; o
pueden ser dos o más datos, de acuerdo a si se quiere medir u observar dos o más
características, por lo tanto, los datos pueden ser unidimensionales, bidimensionales
o multidimensionales. Por su parte las unidades elementales pueden ser: Simples
(son indivisibles), como una persona, un animal, una planta, un auto, etc. o pueden
ser: Compuestos, como una familia, un colegio, una granja, una tribu, etc.
• 2.7. Dato
• Se le conoce también como observación o registro, es el valor que resulta al
medirse u observarse una unidad elemental con relación a la característica que se
quiere estudiar; en otras palabras, es la información expresada en forma cuantitativa
o cualitativa de los hechos de la realidad, esta información, es lo que constituye el
fundamento básico del análisis estadístico. Sin embargo, es preciso indicar que a la
Estadística no le interesa un dato en particular, sino el conjunto de datos.
DEFINICIÓN DE TÉRMINOS USADOS
• Ejemplo:
• • La edad de un alumno (20 años).
• • El ingreso mensual de un profesor (2500 soles).
• • El número de alumnos de un aula de un colegio (35 alumnos)
• • La nota de un alumno en el curso de Estadística (11)
• • El monto pagado por un infractor de tránsito vehicular (460 soles)
• • El ingreso mensual de una familia (3800 soles),
• • El porcentaje de microrganismos en litro de agua del río Santa, (12%), etc.
• CENSO. Es el procedimiento mediante el cual se obtiene información de todos los elementos de la población
• 2.8. Muestreo
• En el sentido restringido, es el procedimiento mediante el cual se obtiene la muestra, en el sentido más
amplio, es la parte de la Estadística que se ocupa del estudio de los diferentes métodos y técnicas para
seleccionar las muestras, incluyendo el tamaño que deben tener.
• 2.9. Marco Muestral
• Es la relación ordenada de todos las unidades elementales de la población, del cual se sacará la
muestra. Ejemplo, si consideramos población para un estudio determinado a todos los alumnos
matriculados de la UNASAM, entonces el marco muestral es la lista de todos los alumnos matriculados
DEFINICIÓN DE TÉRMINOS USADOS
• Escalas de medición
• El término “medición” puede definirse desde diversos puntos de vista o en términos que no
necesariamente coincidan, pero lo esencial de la acepción, es que por medición se entiende a
la asignación de números o valores a las unidades elementales según determinadas reglas.
Ampliando algo más, se puede decir que sin medición no habría estadística. Stanley Smith
Stevens ha escrito mucho sobre tipos de escalas de medición que se realizan en la ciencia,
aún cuando no todos los estadísticos están de acuerdo con Stevens, él ha ideado cuatro tipos
de escalas de medición, a saber:
• 3.1. Nominal
• La medida nominal consiste en asignar membretes (etiquetas) o nombres a cada uno de los
grupos o categorías que tienen las unidades elementales en estudio, en consecuencia se
trata de agrupar a los datos en clases mutuamente excluyentes, de modo que todos los que
pertenecen a la misma sean equivalentes respecto al atributo o característica que los
distingue, después del cual se les puede asignar nombres o números a tales clases.
• Ejemplo:
• El sexo, el estado civil, el nombre de las personas, el número del DNI, los password, o los
DEFINICIÓN DE TÉRMINOS USADOS
• 3.2. Ordinal
• En el caso de que puedan detectarse diversos grados de un atributo o
característica en estudio de una unidad a otra, entonces es necesario
diferenciar esta propiedad, asignando a las unidades elementales en estudio,
nombres o números que resalten estas diferencias y sea factible su ordenación
de mayor a menor o viceversa, es decir importa no solo el nombre sino el orden
de las unidades elementales.
• Ejemplo:
• El orden de mérito asignado a los alumnos después de una evaluación.
• El grado de aceptación dado por un juez a un determinado producto alimenticio.
• Los niveles asignados en una escala de Likert (Ejemplo: Excelente, bueno,
regular, malo, pésimo).
• En este caso la diferencia entre los números no tiene importancia.
DEFINICIÓN DE TÉRMINOS USADOS
• 3.3. Intervalo
• Cuando no sólo es posible distinguir las diferencias entre los diversos grados de
propiedad de una unidad elemental (característica de la medida ordinal), sino también
pueden discernirse diferencias entre dichos grados, entonces se recurre a la medida
llamada por intervalo. En este caso el origen es arbitrario y se elige de acuerdo a las
conveniencias, por lo tanto, además de ordenarlos se pueden hacer operaciones
aritméticas, en consecuencia, los valores asignados son numéricos.
• Ejemplo:
• La medida de la temperatura.
• Los números asignados a los años de nuestro calendario.
• Las puntuaciones que se les asigna a los resultados de los test de inteligencia o a los
resultados de las evaluaciones que se hacen a los alumnos o docentes.
• En un sistema de calificación vigesimal, si un alumno obtiene 16 y otro alumno
obtiene 8, entonces no se puede concluir que el primero es dos veces más inteligente o
más capaz que el segundo, sin embargo, en este grupo es factible obtener promedios
DEFINICIÓN DE TÉRMINOS USADOS
• 3.4. Razón
• Se le llama también de cociente. Esta escala de medición se diferencia del anterior, porque
en este caso, el punto cero u origen ya no es arbitrario y corresponde realmente a una total
ausencia de la propiedad estudiada. Si se observa una carencia total de la propiedad
estudiada se le asigna el valor cero, además a iguales diferencias entre los números
corresponden iguales diferencias en el grado del atributo presente en la unidad elemental
en estudio. Siendo el cero ya no un valor arbitrario, sino un valor absoluto. Podemos decir
que A tiene 2, 3, 4 o más veces la magnitud de la propiedad presente en B.
• Ejemplo:
• La estatura de las personas.
• La edad de las personas.
• El peso de las personas.
• La cantidad de papa vendida en un mercado el 2021.
• El ingreso mensual de los obreros de una empresa.
• El número de hijos de las familias, etc.
VARIABLE
• Variable
• Es la característica que se quiere estudiar, y viene a ser una cualidad o propiedad de
las unidades elementales, de que al ser medidos u observados tomen diferentes
valores o atributos.
• Ejemplo:
•• La estatura, la edad, el peso, la temperatura, el lugar de nacimiento, el estado
civil, los ingresos económicos mensuales, el grado de instrucción, la profesión, el
nivel del colesterol, etc. de las personas.
•• El número de trabajadores, las ganancias netas, el capital, el número de
locales, el volumen de ventas, etc. de las empresas.
•• El número de docentes, el número de alumnos, el número de administrativos,
el número de aulas, el número de centros de cómputo, el número de laboratorios, el
gasto mensual por alumno, etc. de las universidades.
•• Cantidad de lluvia por metro cuadrado (mm), la temperatura del medio
ambiente, la velocidad del viento, etc. en un lugar determinado.
VARIABLE
• Tipos de Variables:
• Las variables de acuerdo a su naturaleza pueden ser:
• 4.1. Cualitativas
• Son las que indican una cualidad o atributo de las unidades elementales, por
consiguiente, pueden ser clasificados solo como poseedoras o no poseedoras de
una cualidad o propiedad. Esta variable resulta de la medición con escalas nominal
u ordinal, se les puede asignar números o códigos para facilitar su manejo.
• Muchos autores dividen a las variables cualitativas en dos grupos: las nominales y
las ordinales. Las nominales son las que presentan modalidades excluyentes y
que no admiten un criterio de orden, por ejemplo, el estado civil de las personas, el
Número del DNI, entre otros. En cambio, las ordinales presentan modalidades
excluyentes pero que si admiten un orden, como ejemplo el nivel educativo de las
personas, en este grupo están las clasificaciones dadas en las escalas de Rensis
Likert (Ej. Muy de acuerdo, de acuerdo, indiferente, en desacuerdo y totalmente en
desacuerdo).
VARIABLE
• Ejemplo:
• El estado civil de las personas (N)
• El lugar de nacimiento de las personas (N)
• El color de los ojos de los gatos (N)
• El grado de instrucción de los empleados públicos. (O)
• El sexo de las personas (N)
• El grupo sanguíneo de los obreros (N)
• La religión de los padres de familia (N)
• El nivel socio-económico de los trabajadores (O). etc.

• 4.2. Cuantitativas
• Son los que indican una cantidad, es decir, son los que pueden ser contados o medidos,
y resultan de las escalas de medición de intervalo y de razón. A su vez pueden ser:

• a) Discretas
• Son las que resultan del conteo y por consiguiente, sólo pueden tomar algunos valores
dentro de un intervalo dado, generalmente son los números naturales o enteros.
VARIABLE
• Ejemplo:
• El número de hijos que tiene una persona.
• El número de inasistencias en un salón de clase.
• El número de vehículos que pasan por una carretera en una hora determinada.
• El número de accidentes de trabajo en una empresa, en una semana dada.
• El número de artículos defectuosos manufacturados por hora.
• El número de créditos aprobados por los alumnos en un semestre.
• El número de parcelas productivas que tienen las familias en una comunidad
campesina. Etc.
• b) Continuas
• Son las que resultan de la medición con cualquier unidad de medida, y por lo
tanto pueden tomar cualquier valor dentro de un intervalo dado. Se les
representa con los números reales.
VARIABLE
• Ejemplo:
• • El peso de las personas.
• • La talla de las personas.
• • La edad de las personas.
• • El ingreso económico mensual de las familias.
• • La temperatura del medio ambiente a las 12 m.
• • La velocidad del viento o de los vehículos, etc.

• A las variables se les representa generalmente con las últimas letras del alfabeto,
tales como X, Y, Z. cuando se quieren distinguir los valores individuales se usan
subíndices, para lo cual se utilizan las letras intermedias como: i, j, k, l, etc. En ese
sentido Xi representa al i-ésimo valor de la variable X.
• En la práctica muchas variables continuas son redondeadas a números enteros,
VARIABLE
• A su vez, las variables según su función pueden clasificarse como: Dependientes,
independientes e intervinientes (exógenas, endógenas), también pueden ser:
unidimensionales, bidimensionales, tridimensionales o multidimensionales (dos o más
dimensiones).
• Constante
• Se denomina así a la variable que toma un solo valor. Es un dato que no cambia de valor. Se
le representa con las primeras letras del alfabeto, tales como a, b, c, etc.
• Ejemplo:
• Si todos los obreros de un centro minero o agrícola tuvieran sus dos padres vivos, entonces
la variable, número de padres vivos por obrero sería el número 2.
• Las variables también pueden ser unidimensionales, cuando se estudia solo una
característica de las unidades elementales (ejemplo: la edad de las personas),
bidimensionales si se estudia a la vez dos características de una unidad elemental
(ejemplo: la edad y el peso de las personas), multi o n – dimensionales si se estudian a la
vez más de dos características de las unidades elementales ( ejemplo, la edad, el peso, la
estatura, los ingresos económicos, el grado de estudios, etc. de las personas)
REDONDEO DE DATOS
• 5. Redondeo de datos
• La necesidad del redondeo de datos es más por la facilidad de los cálculos o por comodidad de su
manejo, que, por razones prácticas, pues el manejo inadecuado puede traer más errores de los
previstos. El redondeo de un número hasta el entero o decimal más próximo obedece a los
siguientes criterios.
• a) Si el dígito a redondear es menor que cinco, se le desprecia.
• Ejemplo:
• Aproximar o redondear a un entero: 7,234 = 7
• Aproximar o redondear a un decimal: 7,234 = 7,2
• Aproximar o redondear a dos decimales:7,234 = 7,23
• b) Si el dígito a redondear es mayor que cinco, al dígito anterior se le agrega una unidad.
• Ejemplo:
• Aproximar o redondear a un entero: 7,678 = 8
• Aproximar o redondear a un decimal: 7,678 = 7,7
• Aproximar o redondear a dos decimales: 7,678 = 7,68
REDONDEO DE DATOS
• c) Cuando el último dígito o el dígito a redondear es igual a cinco, entonces se
desprecia el cinco si el dígito anterior es par y se agrega una unidad al dígito anterior
si éste es impar.
• Ejemplo:
• Aproximar o redondear a un entero: 47,500 = 48,0
• Aproximar o redondear a un decimal: 47,550 = 47,6
• Aproximar o redondear a un decimal: 47,650 = 47,6
• Aproximar o redondear a dos decimales: 47,545 = 47,54

• 6. Notación Sumatoria
• Para describir y analizar los datos, es necesario el manejo más o menos eficiente de
las operaciones aritméticas, en especial el de la suma de los datos; es decir, de la
serie: x1, x2, x3, ……, xn, en estudio, para ello se hará una breve descripción de las
SUMATORIAS
La letra griega mayúscula , es una notación abreviada para designar una suma, tal
como:
x1 + x2 +x3 + ……+ xn
Esta suma se puede resumir y expresarla de la forma siguiente:
n

X
i 1
i

Que se lee como la suma de los Xi de i=1 hasta i=n, donde i = 1, 2, 3,…..,n. El índice
es arbitrario, pues se puede usar, j, k o l. La expresión i=1 debajo del signo  indica que
uno (puede ser otro) es el valor inicial de i y n encima del signo  indica que n (puede ser
otro) es el valor final de i, a la expresión Xi colocado después del signo  se le llama
sumando y representa a cada uno de los valores de la variable X.
Ejemplos:
5
a) X
i 1
i  X1  X 2  X 3  X 4  X 5
PROPIEDADES DE LAS SUMATORIAS
a) Suma de una constante. Es igual a n veces la constante, si se inicia con i=1
n n

 a  a  a  a  .......  a  na
i 1
 a  (n  k  1)a
i k

Ejemplo:
4 4

 7  7  7  7  7  4 x7  28
i 1
 3  3  3  3  3  3  (4  0  1)3  5 x3  15
i 0

b) Suma de una constate por una variable. Es igual a lo constante por la suma de la
variable.
Ejemplo:
n n

 ax
i 1
i  ax1  ax 2  ax3  .....  ax n  a  xi
i 1

Ejemplo:
5 5

 5x
i 1
i  5 x1  5 x 2  5 x3  5 x 4  5 x5  5 xi
i 1
PROPIEDADES DE LAS SUMATORIAS
c) Suma de una variable más una constante. Es igual a la suma de la variable más la
constante multiplicada por n, si se inicia en i=1
n n

 (x
i 1
i  a )  ( x1  a )  ( x 2  a )  ( x3  a )  ....  ( x n  a )  x
i 1
i  na

Ejemplo:
4 4 4

 (x
i 1
i  3)  ( x1  3)  ( x 2  3)  ( x3  3)  ( x 4  3)  x
i 1
i  4 x3  x
i 1
i  12

d) Suma conjunta de variables. Es igual a la suma individual de cada variable.

 (x
i 1
i  y i  z i )  ( x1  y1  z1 )  ( x 2  y 2  z 2 )  ( x3  y 3  z 3 )  .....  ( x n  y n  z n )

= (x1+ x2 + x3 +….+xn) + (y1 + y2 + y3 +….+ yn) - (z1 + z2 + z3 +…+zn)


n n n
= x
i 1
i   yi   z i
i 1 i 1
Ejemplo:
4

 (x
i 1
i  y i  z i )  ( x1  y1  z1 )  ( x 2  y 2  z 2 )  ( x3  y 3  z 3 )  ( x 4  y 4  z 4 )

 ( x1  x 2  x3  x 4 )  ( y1  y 2  y 3  y 4 )  ( z1  z 2  z 3  z 4 )
4 4 4
 x
i 1
i   yi   zi
i 1 i 1
PROPIEDADES DE LAS SUMATORIAS
e) Suma de un producto de variables.
n n n

x
i 1
i y i  ( xi )(  y i ) Pues
i 1 i 1

x
i 1
i y i  x1 y1  x 2 y 2  x3 y 3  .....  x n y n
n n
( xi )(  y i )  ( x1  x 2  x3  ...x n )( y1  y 2  y 3  ...  y n )
i 1 i 1

 ( x1 y1  x1 y 2  x1 y 3  ...  x1 y n )  ( x 2 y1  x 2 y 2  x 2 y 3  ...  x 2 y n )  ....  ( x n y1  x n y 2  x n y 3  ...  x n y n )


Ejemplo:
3 3 3

x
i 1
i y i  ( xi )(  y i )
i 1 i 1
3

x
i 1
i y i  x1 y1  x 2 y 2  x3 y 3
3 3
( xi )(  y i )  ( x1  x 2  x3 )( y1  y 2  y 3 )
i 1 i 1

 ( x1 y1  x1 y 2  x1 y 3 )  ( x 2 y1  x 2 y 2  x 2 y 3 )  ( x3 y1  x3 y 2  x3 y 3 )
PROPIEDADES DE LAS SUMATORIAS
f) Sumas parciales.
n k n


i 1
xi  
i 1
xi  x
i  k 1
i

Ejemplo:
8

x
i 1
i  x1  x 2  x 3  x 4  x 5  x 6  x 7  x8

 ( x1  x 2  x 3  x 4 )  ( x 5  x 6  x 7  x8 )
4 8
= 
i 1
xi  x
i 5
i

Nota.- La suma cuando es tediosa o larga, se puede desdoblar en subsumas o sumas


parciales, y la suma de estas sumas parciales es igual a la suma total.
g) Sumas con exponentes.
n n

i 1
x ik  (  x i ) k
i 1
 k  1

Nota. - La igualdad se presenta sólo en casos especiales, como cuando todos los valores
de la serie sean ceros.
Si k = -1
n
1 1
 xi
 n
i 1
x i 1
i

Si k = 2
n n


i 1
x i2  (  x i ) 2
i 1
Si k = ½
n n

x
i 1
1/ 2
i  (  x i )1 / 2
i 1
La demostración se deja como ejercicio.
SUMAS DE INTERÉS
n
n(n  1) n
n(n  1)( 2n  1)
a)  i  b) i2 
i 1 2 i 1 6
2
n
 n( n  1)  n
c)  i 3  
i 1  2 
d) (X
i 1
n  X n 1 )  ( X n  X 0 )

 
1 1
e)  r 
i 0 1 r
i
 r 1 f)  (1 / 2) i 
i 0 1  1/ 2
2


r 
r2  r
g)  ir  i
 r 1 h)  i r  2 i
 r 1
i 0 (1  r ) 2 i 0 (1  r ) 3
 
1 1
i)  ir
i 0
i 1

(1  r ) 2
 r 1 j)  (i  1)r i 
i 0 (1  r ) 2
 r 1


r 1 n
n
k) i r
i 0
2 i 1

(1  r ) 3
 r 1 l)  
  
x 0  x 
 2 n

 n  x n x
n 
xi
m)   P Q 1  P Q 1 n)   ex
x
x 0   i 0 i!
RECOLECCIÓN DE DATOS
• I. RECOLECCIÓN Y CLASIFICACIÓN DE DATOS
• Los datos estadísticos se obtienen como es sabido, midiendo u
observando las unidades elementales, asimismo para el estudio de una
o más características de la población no se necesita de un solo dato,
sino de una colección de datos, ya sea los correspondientes a la
población o a los de la muestra, estos datos para ser estudiados
necesitan ser recolectados; la misma, se puede hacer de múltiples
maneras, dependiendo de la variable a estudiar.
• En ciertos casos, los datos se encuentran a disposición del investigador
en documentos oficiales, como los boletines estadísticos, anuarios,
memorias, informes, registros públicos, revistas, etc., solo hay que
transcribirlos, en otros casos, hay que obtenerlos en la misma fuente,
para ello, también existen múltiples formas como los obtenidos mediante
RECOLECCIÓN DE DATOS
• Puesto que los datos dependen también del tipo de análisis que se quiera
hacer, en este sentido se pueden clasificar en:
• a) De corte transversal. Es decir, del momento, precisamente en este caso,
es cuando hay que obtenerlos, pues en la mayoría de los casos no están
disponibles.
• b) De corte longitudinal. Es decir, los que sucedieron en el pasado en
períodos de tiempo constantes, en estos casos generalmente se encuentran
en los archivos de las instituciones.
• 1. Censo y Muestreo
• Los métodos que nos permiten recopilar la información son:
• Censo
• Es el procedimiento por el cual se obtiene información de todos los elementos que
conforman la población, relacionado a la variable o variables que se quiere investigar
RECOLECCIÓN DE DATOS
• Siempre que no se cometan errores en la recopilación y/o procesamiento de los datos, los
resultados que se obtengan serán los verdaderos y los que se quiere conocer; sin embargo,
se tiene la desventaja de que por lo general es muy difícil practicar un censo, sobre todo
cuando la población es muy grande, muchas veces infinita o cuando para estudiar a las
unidades elementales hay que sacrificarlos.
• Por ejemplo, los censos nacionales de población, de vivienda, el económico, el
agropecuario, etc. no se realizan cada año, sino entre cada cinco a diez años. Para analizar
la sangre de una persona no se usa toda su sangre sino una pequeña muestra. No sería
lógico ni posible analizar toda el agua del mar para determinar su salinidad. Para determinar
la calidad del arroz tampoco es necesario cocinar toda la cosecha, para medir el porcentaje
de impurezas que tiene el agua de un río tampoco es necesario analizar todo el agua del río,
etc.
• Muestreo
• Además de la definición dada en el primer capítulo, se puede decir que el muestreo es el
procedimiento por el cual se obtiene información de solo una parte representativa de la
población. sin embargo, debe entenderse, que este procedimiento no puede ser usado
indiscriminadamente; es decir, sin tener en cuenta las características de la población y las
RECOLECCIÓN DE DATOS
• TIPOS DE MUESTREO
• Existe dos tipos de muestreo, los cuales son:

• 1. Probabilísticos. Son los que se basan en el principio de la equiprobabilidad, es decir, cuando cada
elemento de la población tiene la misma posibilidad de ser seleccionado. Los cuales a su vez son:
• 1.1. Muestreo aleatorio simple.
• 1.2. Muestreo aleatorio estratificado.
• 1.3. Muestreo aleatorio por conglomerados.
• 1.4. Muestreo aleatorio sistemático.
• 1.5. Muestreo de aceptación,
• 1.6. Muestreo aleatorio por etapas. etc.

• 2. No Probabilísticos. Son los que se basan en el principio de la representatividad, es decir, aquí lo


único que importa es que sea representativo, los criterios son los de los expertos. A su vez pueden ser:
• 2.1. muestreo por cuotas.
• 2.2. muestreo de la bola de nieve.
• 2.3. Muestreo de Expertos.
• 2.4. Muestreo de casos-tipo
• 2.5. Muestras casuales.
• 2.6. Muestreo para poblaciones móviles, etc.
RECOLECCIÓN DE DATOS
• Ventajas del muestreo sobre el censo
• El muestreo es un método estadístico diseñado para obtener solo una parte de
la población, pero haciendo que esta parte sea la más representativa posible de
la población, a pesar de ello siempre existirán errores, en comparación con los
resultados del censo; sin embargo, existen ciertas ventajas que lo hacen
aplicable, de lo contrario no sería recomendable usar este método. Las ventajas
más importantes son los siguientes:
• 2.1. Menor Costo.
• Como los datos a recolectar y procesar son relativamente pocos en relación a la
de la población estudiada, los gastos que ocasionen serán por consiguiente
mucho más reducidos.
• 2.2. Menor Tiempo.
• Como los datos son en menor cuantía que los de la población estudiada, la
recolección y el procesamiento de los mismos se harán en mucho menor tiempo.
RECOLECCIÓN DE DATOS
2.3. Mayor Posibilidad.
• Precisamente por el menor costo y el menor tiempo empleado, así como de
la imposibilidad de practicar un censo en ciertas poblaciones, hacen que el
muestreo sea mucho más factible de realizarse que un censo.
2.4. Mayor Exactitud.
• Debido a que el volumen de trabajo es mucho más reducido que cuando se
practica un censo, se puede emplear personal más calificado, e incluso a
quienes se les puede capacitar más eficientemente, por consiguiente, el
trabajo realizado por ellos será mucho más confiable y preciso.
• Como se dijo anteriormente, la recolección de datos se puede hacer de
muchas formas, usando múltiples recursos y empleando técnicas diversas,
en la actualidad la tecnología tiene un avance bastante significativo en este
aspecto, muchos de ellos recién se van aplicando en los países en
desarrollo, pero uno de los métodos más tradicionales es el de la encuesta.
RECOLECCIÓN DE DATOS
• Encuesta
• Es el procedimiento por el cual se recolecta la información usando un
instrumento llamado cuestionario de preguntas estructuradas o
semiestructuradas. En una forma no del todo correcta se da el nombre de
encuesta sólo al cuestionario de preguntas, sin embargo, la encuesta tiene una
acepción mucho más amplia; es decir, es todo el procedimiento de recolección
de datos. La encuesta es muy usada en la investigación de mercados. Se puede
ejecutar usando diferentes medios como: La entrevista directa o cara a cara, por
teléfono, por correo o por Internet.
• La encuesta según sus objetivos puede clasificarse en dos grandes grupos:
• 3.1. Descriptivas
• Es cuando el objetivo de la misma, es sólo la de obtener información cuantitativa
de los grupos que constituyen la población, así por ejemplo conocer el
porcentaje de personas que están de acuerdo con un determinado proyecto de
RECOLECCIÓN DE DATOS
• 3.2. Analíticas
• Es cuando el objetivo de la misma es hacer un análisis cualitativo y comparativo entre
los grupos que conforman la población, así, por ejemplo, qué opinión tienen los
hombres y las mujeres sobre el proyecto de ley, o del programa de TV. que vieron.
• Cuando se realiza una encuesta es preciso tener en cuenta ciertas recomendaciones,
pues los resultados que se obtendrán mucho dependerán de los datos recolectados.
Estas recomendaciones están dirigidas en primer lugar a las diferentes fases que tiene
la encuesta, así toda investigación en que se use la encuesta como medio de
recolección de datos, debe tener en cuenta por lo menos los siguientes pasos:

• PASOS PARA REALIZAR UNA ENCUESTA

• Plantear objetivos bien precisos y claros.


• Delimitar la población a estudiar.
• Señalar los datos suficientes y necesarios a recolectarse.
• Indicar el nivel de precisión deseada.
RECOLECCIÓN DE DATOS
• Realizar una encuesta piloto para estimar ciertos valores, reestructurar
las preguntas, determinar la confiabilidad del instrumento (cuestionario),
entre otros aspectos.
• Organizar el trabajo de campo en forma eficiente.
• Capacitar a los encuestadores proporcionándoles el manual del
encuestador y el material necesario.
• Ejecutar la encuesta.
• Consistenciar los datos obtenidos.
• Procesar la información, haciendo los cuadros resumen por pregunta.
• Analizar la información procesada.
• Sacar conclusiones y recomendaciones.
• Presentar el Informe Final.
DIFERENCIA ENTRE ENCUESTA Y CUESTIONARIO
• La Encuesta: es un procedimiento para la recogida de información en una población concreta
y a su vez la técnica que se utiliza para guiar la recogida de la misma. Aravena y cols. (2006) la
definen como “una estrategia de investigación basada en las declaraciones verbales de una
población concreta, a la que se realiza una consulta para conocer determinadas circunstancias
políticas, sociales o económicas, o el estado de opinión sobre un tema en particular.
• La elaboración de una estrategia: requiere de una indagación exploratoria sobre lo que se
quiere lograr. Se preparan las preguntas y posibles respuestas en función de las variables,
categorías y dimensiones a estudiar. Se analiza el tiempo, espacio y población a encuestar
para definir el instrumento a utilizar, su formato y aplicación.
• El Cuestionario: es el instrumento, que tiene forma material impresa o digital, utilizado para
registrar la información que proviene de personas que participan en una encuesta; en una
entrevista o en otros procedimientos como son los experimentos.
• Para el diseño de un cuestionario, al igual que otros instrumentos, se debe recurrir a la
operacionalización de variables de la investigación. Se puede tomar un cuestionario existente y
adaptarlo o crear uno nuevo, en cuyo caso debe hacer una validación previa. En todos los
casos el diseño estará determinado por el procedimiento que se utilizará para abordar a los
RECOLECCIÓN DE DATOS
• Por otro lado, debe tenerse en cuenta que toda encuesta tiene su tiempo oportuno para
ejecutarse, las personas a entrevistar no están disponibles a toda hora, ni en el momento
que crea el entrevistador, por lo que la encuesta está sujeta al tiempo disponible del
entrevistado.
• Las personas que servirán como encuestadores deben haber sido seleccionados de
acuerdo al perfil que debe tener un entrevistador, de lo contrario se corre el riesgo de ser
rechazado y no obtener la información requerida, en el mejor de los casos la información
no será la verdadera en su totalidad.
• En lo referente a la persona a entrevistar (unidad elemental), este debe ser la persona
idónea y no reemplazarlo en caso de no encontrarlo.
• Así mismo las recomendaciones también alcanzan a las preguntas y hojas del
cuestionario, y estas son:
• Claridad en las preguntas, a fin de que las respuestas no sean ambiguas.
• Las preguntas deben ser de acuerdo al nivel cultural de los entrevistados.
• El cuestionario debe ser completo, comprender las preguntas que interesan, pero sólo las
necesarias.
RECOLECCIÓN DE DATOS
• En algunos casos deben incluirse preguntas de comprobación a las
preguntas principales.
• Si el cuestionario incluye preguntas de carácter confidencial, deben ser
anónimas, esto originará mayor veracidad en las respuestas.
• Las hojas del cuestionario deber ser atractivas a la vista por la calidad y
color del papel, tipo de letra, diagramación, presentación, etc.
• Las preguntas deben ser fáciles de contestar, con unas cuantas palabras, o
sólo para hacer marcas. Las preguntas pueden ser: dicotómicas, múltiples o
libres (abiertas). Recuerde que los entrevistados son reacios a cuestionarios
muy extensos, o cuando las preguntas incluyen respuestas libres, es decir,
en las que el entrevistado debe redactar su respuesta.
• El cuestionario de ser validado con expertos y debe tener confiabilidad, si
las preguntas son de tipo Likert, se usa el alfa de Cronbach, si las preguntas
son dicotómicas, se usa el Kuder y Richardson (KR 20)
CUESTIONARIO
• Ejemplo de Hoja de Encuesta

• ENCUESTA SOBRE EL SERVICIO DE UN RESTAURANTE:
• (ENCABEZAMIENTO)
• Para brindarle un mejor servicio, por favor responda a estas preguntas:

1.- ¿Qué le pareció la comida?
Mala
Regular
Buena
Muy buena
Excelente
2.- ¿Qué opina de la variedad de nuestros platillos?
Son pocos
Regular
Suficientes para elegir
¡Muy surtidos!
3.- ¿Qué tal le atendió el mesero?
Mal
Regular
Bien
Muy bien
CUESTIONARIO
4.- ¿Qué le parece el lugar?
 Desagradable
 Puede mejorar
 A gusto
 Muy agradable
 Excelente
5.- Si visitó los baños, ¿qué le parecieron?
 Dejan mucho qué desear
 Sucios
 Necesita algo de limpieza
 Limpios
 Impecables
6.- El servicio de estacionamiento fue:
 Muy reducido
 Reducido
 Regular
 Suficiente
CUESTIONARIO
7.- Los precios resultaron:
Altos
No tan altos
Justos
Accesibles
Bajos.
8.- ¿Regresaría a comer aquí?
Sí
Puede ser
no
9.- ¿Recomendaría el lugar?
Sí
Podría ser
No
10.- ¿Algún comentario adicional que guste dejarnos?
.....................................................................................................................
Agradecemos su tiempo, fue un placer servirle. ¡Vuelva pronto!
NIVEL DE SERVICIOS DE LA CLÍNICA ODONTOLÓGICA DE LA
UNMSM

• CUESTIONARIO
• INTRODUCCIÓN
• El presente cuestionario tiene por objeto recabar información acerca del nivel de servicio que presta la
Clínica Odontológica de la UNMSM, por lo que se le solicita contestarla de manera objetiva y veraz.
• La información es de carácter confidencial y reservada, ya que los resultados serán manejadas sólo
para la investigación y con ella mejorar los servicios de la clínica en beneficio de los clientes.
• Se agradece con anticipación su colaboración.
• INSTRUCCIONES
• En las preguntas de respuesta múltiple marque con un aspa la alternativa que cree que es la más
correcta.
• Edad……………… Sexo……………… Distrito donde vive
………………………………………………..
• Tipo de usuario: Docente ( ), Administrativo ( ), Alumno ( ), Particular ( )
• Carrera profesional en la que trabaja o estudia ……………………………………………………..
NIVEL DE SERVICIOS DE LA CLÍNICA ODONTOLÓGICA DE LA
UNMSM
• 1. ¿De qué forma se enteró de la existencia de la Clínica Odontológica de la UNMSM?
a. Por recomendación
b. Por TV
c. Internet
d. Radio
e. Otro

2. ¿Considera a la sala de espera confortable?


a. Si b. No
Indique a qué servicio se refiere:
a. General b. Diagnóstico c. Radiología d. Odontopediatría.

3. ¿Qué opinión le merece la atención recibida por parte del personal administrativo?
a. Excelente
b. Buena
c. Regular
d. Mala
e. Pésima

4. ¿Qué opinión le merece la atención recibida por parte del operador?


a. Excelente
b. Buena
c. Regular
d. Mala
e. Pésima
NIVEL DE SERVICIOS DE LA CLÍNICA ODONTOLÓGICA DE LA
UNMSM
• 5. ¿La calidad del trabajo recibida en la clínica es?
a. Excelente
b. Buena
c. Regular
d. Mala
e. Pésima
6. Con respecto a los precios de los servicios que ofrece la clínica, le parece:
a. Muy altos
b. Altos
c. Regulares
d. Bajos
e. Muy bajos
7. Con respecto a la ubicación de la clínica, le parece:
a. Excelente
b. Buena
c. Adecuada
d. Mala
e. Pésima
8. Con respecto al tiempo de atención, le parece:
a. Rápido
b. Tolerable
c. Necesario
d. más de la necesario
e. Mucho más de lo necesario
9. ¿Algún comentario adicional?.............................................................................
PRÁCTICA DIRIGIDA
1. Indique ¿De qué tipo específico son las siguientes variables?
a.- Número de nacimientos por día en una ciudad.
b.- Los ingresos económicos mensuales de los docentes de la UNASAM.
c.- La cantidad de sangre extraída a los pacientes con fines de análisis.
d.- Granitos de arena en una playa determinada.
e.- La temperatura en una ciudad a las 12 m.
f.- Las velocidades de los vehículos en el panamericano norte.
g.- El grupo sanguíneo de los docentes de la UNASAM.
h.- La cantidad de lluvia que cae cada día en la ciudad de Huaraz.
i.- Calidad de las comidas de los restaurantes del Callejón de Huaylas.
j.- Lugar de procedencia de los alumnos de la Universidad.
k.- Orden de mérito obtenido por los alumnos al finalizar el semestre
académico.
l.- Número asignado al asiento de un ómnibus interprovincial.
PRÁCTICA DIRIGIDA
2. ¿Con qué tipo de escala se miden a las siguientes variables?

a.- Color del cabello de las personas.


b.- Grado de instrucción de los padres de familia de un Centro Educativo.
c.- Número de robos realizados en un centro de abastos.
d.- Notas finales de los alumnos en el SVA de la UNASAM.
e.- Temperatura de los pacientes de un determinado Hospital.
f.- Sexo de los empleados de una empresa.
g.- Profesión de cada uno de los padres de familia de un colegio.
h.- Número del DNI de las personas que asisten a un centro comercial.
i.- Estado civil de las personas.
j.- Edad de los árboles de un determinado bosque.
k.- Porcentaje de impurezas del agua de río.
l.- Capacidad del tanque de agua que tienen las casas.
PRÁCTICA DIRIGIDA
3. Se ha hecho un estudio con la finalidad de estimar el promedio del cociente de inteligencia de los
escolares de la provincia de Huaraz, para ello se seleccionó 260 niños de diferentes centros educativos
de la provincia de Huaraz, a quienes se les sometió a un test, luego de las calificaciones se obtuvo un
promedio de 95 puntos.
• a.- Indique la población y la muestra.
• b.- Especifique el parámetro, el estadístico y la unidad elemental.
• c.- Determine la variable, el tipo de variable y la escala de medida usada.

4. Se realizó un estudio en el distrito de Carhuaz, para determinar la proporción de familias que tienen

hijos en la universidad, para lo cual se escogió a 150 familias, encontrando que 95 familias
tenían hijos en la universidad. Indique:
• a.- La población y la muestra.
• b.- El parámetro, el estadístico, la unidad elemental y el tipo de la unidad elemental.
• c.- La variable, tipo de variable, y el tipo de escala de medición.
CLASIFICACIÓN DE DATOS
• CLASIFICACIÓN DE DATOS
• Después de recolectar los datos, éstos se encuentran en la forma como fueron
compilados; es decir, no necesariamente ordenados, por lo tanto, en este estado son
difíciles de ser analizados y por consiguiente de ser interpretados, con dificultad se puede
obtener el mínimo y el máximo, se puede sumar los valores cuantitativos y dividirlo entre el
número de valores existentes y obtener así el promedio, pero esto no nos garantiza una
descripción completa de los datos, por lo que es necesario ordenarlos y clasificarlos, ya
sea en grupos, categorías o intervalos dependiendo del tipo o tipos de variables en estudio
• Para comenzar a clasificar los datos, lo primero que se debe tener en cuenta es el tipo de
variable que se tiene, además usar una sola variable; si la variable es del tipo cualitativo,
no existen mayores recomendaciones ni normas, sino ordenarlos y clasificarlos de
acuerdo al atributo que tiene cada unidad elemental, cuando la variable es del tipo
cuantitativo discreto y la amplitud de la variable es pequeña, el tratamiento es similar a la
de las variables cualitativas, cuando la variable es del tipo cuantitativo, en especial
continuo, se tendrán en cuenta ciertas reglas en el que los diferentes autores no se han
puesto de acuerdo, pero que en el presente caso se dará una secuencia consensuada, por
lo menos por la mayoría de ellos.
CLASIFICACIÓN DE DATOS
• Ejemplo 01. Con fines didácticos se usará un ejemplo como guía, cuya variable
es del tipo cuantitativo continuo, el mismo es el siguiente: con la finalidad de
dar una orientación de los hábitos alimenticios a los niños de su aula un
profesor de una zona rural obtuvo el peso en kg. de cada uno de sus 50
alumnos, que son los que a continuación se dan:
• 51,2 46,1 38,6 25,1 47,3 37,3 40,8 48,4 39,1 41,3 46,2 31,4 36,0
48,6 44,2 42,3 49,5 59,9 44,5 40,9 41,4 52,3 38,7 33,5 28,4 44,1
54,5 43,9 53,3 44,8 42,6 34,8 26,2 37,2 47,7 43,2 58,4 36,9
52,8 41,6 39,8 43,7 56,0 32,0 46,8 38,1 49,8 30,9 47,2 37,5

• Como se puede apreciar no se puede hacer alguna descripción de interés sobre
el conjunto de datos, por lo que es necesario ordenarlos y agruparlos en grupos
(intervalos), para lo cual se sigue los siguientes pasos:
CLASIFICACIÓN DE DATOS
• 1.- Determinar los límites superior e inferior de la distribución.
• Esto significa obtener el valor más alto y el valor más bajo de los datos.
• Límite Superior (Ls): Es el valor más alto del conjunto de datos en estudio, en
nuestro caso es igual a 59,9 kg.
• Límite Inferior (Li): Es el valor más bajo del conjunto de datos, en nuestro caso es igual
a 25,1 kg.
• En conclusión, el alumno con mayor peso es el que tiene 59,9 kg y el de menor peso es
el que tiene 25,1 kg.
• 2.- Obtener el Rango de variación.
• Rango (R): Es la diferencia entre el mayor valor y el menor valor de los datos.
• R = Ls – Li
• R = 59,9 – 25,1 = 34,8 kg.
• En el caso discreto R = (Ls – Li) + 1
• Para el ejemplo, la diferencia en peso entre dos alumnos cualesquiera no pude ser
superior a 34,8 kg., o la diferencia en el peso de los alumnos es máximo 34,8 kg.
CLASIFICACIÓN DE DATOS
• 3.- Determinación del Número de Intervalos de Clase (m).
• Para una descripción más detallada, se agrupa a los datos en intervalos más
pequeños, con la única condición de que no se intersequen (intersecten) y que al
unirlos deben coincidir con el rango de variación, las amplitudes de estos intervalos
pueden ser diferentes o constantes, en el caso de ser diferentes no existe mayores
requisitos que los dados por la persona que está haciendo la clasificación, según
los intereses de su investigación. En el caso de que las amplitudes sean
constantes, se tiene la necesidad de conocer el número de dichos intervalos en
primera instancia. Se recomienda que el número de intervalos (m) no deben ser
menores de cinco ni mayores de veinte. Pues al ser muy pocos intervalos se
pierde mucha información, en tanto que al haber muchos intervalos los cálculos se
vuelven muy engorrosos. Hay varias reglas para calcular el número de intervalos,
en este caso usaremos el de Herbert Sturges, que es un buen aproximador.

• m = 1 + log2 (n)
• m = 1 + 3,322 log10(n)
CLASIFICACIÓN DE DATOS
• Para nuestro ejemplo se tiene:
• m = 1 + 3,322 log10(50)
• = 1 + 3,322 (1,69897)
• = 1 + 5,644
• = 6,644
• m=7
• Esto indica que el número de intervalos para nuestro ejemplo debe ser 7, sin embargo, esto no impide que
pueda ser otro número próximo a 7, pues como se dijo la fórmula es un aproximador y no una regla infalible,
lo importante es tener el número de intervalos adecuados que con la experiencia se va adquiriendo.
• Otra regla para calcular el número de intervalos de clase es sacar la raíz cuadrada de n si este es menor que
200, en nuestro ejemplo también es 7, pues
• 4.- Determinar la amplitud de los intervalos (C).
• Como se dijo anteriormente es necesario conocer la amplitud de los intervalos, cuando estos son
constantes, los cuales se obtienen dividiendo el rango entre el número de intervalos:
• C = R/m

• Para el ejemplo, el valor es el siguiente :


CLASIFICACIÓN DE DATOS

• C = (34.8)/7 = 4.97143 5.0


• Como los datos del ejemplo están expresados o redondeados a un
decimal, el tamaño de la amplitud interválica, puede ser redondeada
también a un decimal, pero en nuestro caso, el redondeo a un decimal se
convierte a un entero (5,0), esto hace que la distribución sea más
manejable, así como se reduzcan algunos detalles, que con la práctica se
harán más comprensibles. En la mayoría de los casos la división del rango
entre el número de intervalos no es un número exacto, por lo que se
necesita redondear, recomendando a que sea al número de decimales que
tienen los datos, si no los tiene será a un entero, pero el redondeo es
siempre a un número mayor, sólo por esta vez no se tendrá en cuenta las
reglas dadas para el redondeo de datos.
CLASIFICACIÓN DE DATOS
• 5.- Distribución del incremento ()
• Si volvemos a multiplicar el número de intervalos (m) por el valor de la
amplitud interválica ( C ) establecida, se tendrá un incremento () en el
rango, de no haber habido un redondeo a una cifra mayor no habría tal
incremento, en el ejemplo que se tiene sí debe existir pues hubo
redondeo a 5,0; en consecuencia existe un nuevo rango R’, tal como se
puede apreciar:
• R’ = C x m = R +  = R’ - R
• Para el ejemplo, tenemos:
• R’ = 5 x 7 = 35; = 35,0 – 34,8 = 0,2 kg
• Este incremento se debe repartir en ambos lados del rango, en lo
posible en forma equitativa, pero siempre evitando la propagación de los
CLASIFICACIÓN DE DATOS

Si el incremento es impar, la repartición debe ser un tanto equitativa, pues si es


equitativa se estaría aumentando un decimal al ya existente, así por ejemplo si el
incremento fuera 0,1 se recomendaría distribuirlo a un solo lado, a donde más
convenga, si el incremento fuera 0,3, la repartición sería 0,1 y 0,2 y la distribución
sería a donde más convenga, si el incremento fuera 0,5 la repartición sería 0,2 y 0,3
repartiendo 0,2 a un lado y 0,3 a otro lado, de acuerdo a la conveniencia del
investigador. Simbolizando este procedimiento se tiene:
’’ R ’
¡…….¡---------------------------¡…….¡
LI Li Ls LS
 = ’ + ’’
LS = Ls + ’
CLASIFICACIÓN DE DATOS
Para el ejemplo:
LS = Límite Superior de la distribución.
= 59,9 + 0,1 = 60,0
LI = Li - ’’
Para el ejemplo:
LI = Límite Inferior de la distribución
= 25,1 – 0,1 = 25,0
Estos son los valores que se tendrán en el cuadro de distribución de frecuencias.
6.- Tabulación
Después de obtener los verdaderos límites, tanto superior como inferior, se hace
la distribución de los intervalos de clase, los mismo se establecen ya sea en forma
creciente o decreciente según el interés del trabajo en ejecución. Teniendo los intervalos
de clase se hace la tabulación de los datos, que consiste en distribuir cada dato al
intervalo que le corresponde.
CLASIFICACIÓN DE DATOS
Si la distribución es manual se usan las famosas tarjas u otro mecanismo de conteo de
datos, como también se puede ordenar los datos en forma creciente o decreciente y
contar los datos del intervalo correspondiente. Para nuestro ejemplo la distribución
con sus respectivas tarjas es el siguiente:
Pesos en Kg. Número de alumnos
25 – 30 ///
30 – 35 /////
35 – 40 ///// /////
40 – 45 ///// ///// ////
45 – 50 ///// /////
50 – 55 /////
55 - 60 ///
CLASIFICACIÓN DE DATOS
• 1.- INTERVALO DE CLASE
• Son las categorías o grupos en las que se deben distribuir los datos
para una mejor descripción de las variables cuantitativas. Los intervalos
pueden ser cerrados, cuando las variables son discretas; pueden ser
semiabiertos o semicerrados, cuando las variables son continuas,
asimismo los intervalos pueden ser constantes o variables (de diferente
amplitud) como ya se dijo anteriormente. Cuando existen datos
extremos o muy aislados, el primero, el último o ambos pueden se
abiertos, esto es, con la finalidad de no usar demasiados intervalos
innecesariamente, muchos de ellos con frecuencias nulas.
• En el caso de las variables cualitativas no se usan intervalos, sino
categorías o atributos excluyentes. Generalmente los intervalos para
variables continuas deben ser semicerrados, cerrados a la izquierda y
CLASIFICACIÓN DE DATOS
2.- Límite de Clase (Yi ' )
Son las fronteras o límites de cada uno de los intervalos de clase, también existe un
' '
Límite superior (Yi ) y un límite inferior (Yi 1 ) , el tamaño o amplitud de cada uno de
estos intervalos se obtiene, además de lo expuesto anteriormente, de la siguiente
manera y si los intervalos son semiabiertos:
Ci  Yi '  Yi ' 1
Ejemplo:
C1  Y  Y  30  25  5
1
'
0
'

Nota.- En el caso de variables discretas, se usan los verdaderos límites de clase.


CLASIFICACIÓN DE DATOS
3.- Marca de Clase (Yi=Xi)
Se llama también punto medio de clase y sirve para representar al conjunto de datos
que pertenecen al intervalo de clase correspondiente, es decir al valor supuesto de la
variable en este intervalo (éste es la razón por la que se pierde la información original),
además se usa para obtener los estadígrafos o parámetros necesarios para la
descripción. Se obtiene sumando el límite inferior más el límite superior y dividiendo
esta suma entre dos:
Yi ' 1  Yi '
Yi 
2
Ejemplo:
Y0'  Y1' 25  30
Y1    27,5 kg.
2 2
Y1'  Y2' 30  35
Y2    32,5 kg.
2 2
CLASIFICACIÓN DE DATOS
3.- Frecuencia
Es el valor que representa a la cantidad de datos que pertenecen a cada uno de los
intervalos de clase, categorías o atributos de clasificación.
Tipos:
Existen tres tipos de frecuencias, aparte de las simples (de cada intervalo) y
acumuladas (de un conjunto de intervalos contiguos)
3.1. Absolutas:
Son los números que representan a la cantidad de datos que pertenecen a cada una
de las categorías o intervalos de clase, tienen la característica de ser números enteros
positivos, a su vez se clasifican en:

a) Simples (ni , fi):


Son los que corresponden a cada uno de los intervalos de clase o categorías de
clasificación, se les representa por ni o fi y tienen la característica de que la suma de todas
ellas debe ser igual a n, es decir:
m m

n
i 1
i   fi  n
i 1
0  ni  n
CLASIFICACIÓN DE DATOS
Ejemplo: (Para el ejemplo que se tiene)
n1 = 3, esto indica que existen 3 alumnos cuyos pesos oscilan entre 25 y 30 kg.
n5 = 10, esto indica que hay 10 alumnos cuyos pesos oscilan entre 50 y 55 kg.
a) Acumuladas (Ni, Fi)
Son los que corresponden a uno o más intervalos contiguos, por lo tanto, corresponden
a la suma de las frecuencias absolutas simples de cada uno de los intervalos que lo forman,
se les representa por Ni o Fi
0  Ni  n
N1 = n1
N2 = n1 + n2 = N1 + n2
N3 = n1 + n2 + n3 = N2 + n3
................
Ni = Ni-1 + ni
................
Nm = n

Ejemplo: (Para el ejemplo que se tiene)

N2 = 3 + 5 = 8, esto indica que hay 8 estudiantes cuyos pesos fluctúan entre 25 y 35 kg.
N4 = 3 +5+10+14 = 32, esto indica que hay 32 alumnos con pesos entre 25 y 45 kg. o con
pesos menores que 45 kg.
CLASIFICACIÓN DE DATOS
3.2. Relativas
Son las que resultan de dividir las frecuencias absolutas entre el número total de datos en
estudio, se les llama también tanto por uno, o probabilidades de ocurrencia de los datos
en los intervalos o categorías correspondientes, a su vez se clasifican en:
a.- Simples (hi)
Son los que resultan de dividir una frecuencia absoluta simple entre el número total
de datos, en consecuencia, indican la probabilidad de ocurrencia de los datos en el
intervalo de clase o categoría correspondiente, se les representa por h i
ni fi m
hi 
n

n
0  hi  1 
i 1
hi  1

Ejemplo: (Para el ejemplo que se tiene)


n 5
h2  2   0,1 es la probabilidad o proporción de que un alumno tenga un peso
n 50
entre 30 y 35 kg.
n5 10
h5    0,2 es la probabilidad de que un alumno pese entre 45 y 50 kg.
n 50
CLASIFICACIÓN DE DATOS
b.- Acumulada (Hi)
Son las que resultan de dividir una frecuencia absoluta acumulada entre el número
total de datos en estudio, o sumando las frecuencias relativas simples que los conforman,
se les representa por Hi
Ni F i
Hi 
n
 i
n
0  Hi  1 Hi  h
j 1
j

H1 = h1
H2 = h1 + h2
H3 = h1 + h2 + h3
…………….
Hi = Hi-1 + hi
…………….
Hm = 1,0

Ejemplo: (Para el ejemplo que se tiene)

H3 = N3/n = 18/50 = 0,36


= 0,06 + 0,10 + 0,20 = 0,36 esto indica que la probabilidad de que un alumno tenga
un peso entre 25 y 40 kg. es de 0,36
H4 = N4/n = 32/50 = 0,64
= 0,06 + 0,10 + 0,20 + 0,28 = 0,64 esto indica que la probabilidad de que un alumno
tenga un peso entre 25 y 45 kg. es igual a 0,64
CLASIFICACIÓN DE DATOS
3.3. Porcentuales
Son los que resultan de multiplicar una frecuencia relativa por cien. Como quiera que
las frecuencias relativas no son usadas por el común de la gente, se ha preferido utilizar
los porcentajes que son más comunes y entendibles. A su vez se clasifican en:

a.- Simples (pi)


Son las que resultan de multiplicar una frecuencia relativa simple por cien, e indican el
porcentaje de datos que corresponden al intervalo de clase o categoría de clasificación
dada. Se les representa por pi
m
pi  hi x100  100hi 0  pi  100% p
i 1
i  100%

Ejemplo: (Para el ejemplo que se tiene)

p3 = h3 x 100 = 0,2 x 100 = 20%


Esto indica que el 20% de los alumnos pesan entre 35 y 40 kg.
p7 = h7 x 100 = 0,06 x 100 = 6%
Esto indica que el 6% de los alumnos pesan entre 55 y 60 kg.
CLASIFICACIÓN DE DATOS
b.- Acumuladas (Pi)
Son los que resultan de multiplicar una frecuencia relativa acumulada por cien. O de
sumar las frecuencias porcentuales simples que lo conforman, e indican el porcentaje de
datos que corresponden a los intervalos acumulados. Se les representa por Pi
i
Pi  H i x100  100 H i 0  Pi  100% Pi  p
j 1
j

P1 = p1
P2 = p1 + p2
P3 = p1 + p2 + p3
…………
Pi = Pi-1 + pi
…………
Pm = 100%

Ejemplo: (Para el ejemplo que se tiene)

P2 = H2 x 100 = 0,16 x 100 = 16%


= 6% + 10% = 16%
Esto indica que el 16% de los alumnos pesan entre 25 y 35 kg.
P5 = H5 x 100 = 0,84 x 100 = 84%
= 6% + 10% + 20% + 28% + 20% = 84%
Esto indica que el 84% de los alumnos pesan entre 25 y 50 kg.
CLASIFICACIÓN DE DATOS
2. Cuadro de Distribución de frecuencias.
Es un cuadro preliminar de trabajo que contiene todas las frecuencias, parte del cual
se usará para la presentación de datos ya sea en cuadros o en gráficas estadísticas, también
se usa para hacer la descripción completa de los datos en estudio.
Cuadro de Distribución de Frecuencias
Y '
i 1  Yi '  Yi ni Ni hi Hi pi Pi
Y 0
'

 Y1' Y1 n1 N 1 h1 H 1 p1 P1
Y 1
'
Y  2
' Y2 n2 N 2 h2 H 2 p2 P2
Y 2
'
Y  3
' Y3 n3 N 3 h3 H 3 p3 P3
………. … …. …. … …. … ….

Ym' 1  Ym'  Ym nm N m  n hm H m  1,0 p m Pm  100%
Total n 1,0 100%
CLASIFICACIÓN DE DATOS
Ejemplo: Use los datos del ejemplo en estudio, para construir el cuadro de distribución
de frecuencias correspondiente.
Solución:
Yi ' 1  Yi '  Yi ni Ni hi Hi pi Pi
25 – 30 27,5 3 3 0,06 0,06 6% 6%
30 – 35 32,5 5 8 0,10 0,16 10% 16%
35 – 40 37,5 10 18 0,20 0,36 20% 36%
40 – 45 42,5 14 32 0,28 0,64 28% 64%
45 – 50 47,5 10 42 0,20 0,84 20% 84%
50 – 55 52,5 5 47 0,10 0,94 10% 94%
55 - 60 57,5 3 50 0,06 1,00 6% 100%
Total 50 1,00 100%
CLASIFICACIÓN DE DATOS

• Se nota que el alumno con mayor peso es el de 60 kg. y el de menor peso es el de
25 kg, la distribución de los alumnos según su peso es simétrica, alrededor de los
42,5 kg., la mayor cantidad de alumnos (28%) pesan entre los 40 a 45 kg. el 36% de
los alumnos pesan menos de 40 kg. y el 84% de los alumnos pesan menos de 50
kg. etc. Este es una pequeña descripción de la distribución de los alumnos según su
peso, es bueno recordar que cuando todavía no estaba ordenado no pudimos hacer
mayores descripciones, que el peso mínimo y el máximo y esto con gran esfuerzo.
• Para un conocimiento más completo de las técnicas de clasificación de datos, es
necesario extender las recomendaciones a los casos de clasificación
correspondientes a variables discretas y cualitativas.
• En el caso de las variables cualitativas, la clasificación no tiene mayores
complicaciones, pues los datos se distribuyen de acuerdo a los atributos que posean
las unidades de análisis, en estos casos no se usan los intervalos de clase, ni
marcas de clase, aun cuando sean codificadas, pero si se obtienen todas las
frecuencias mencionadas.
CLASIFICACIÓN DE DATOS
Ejemplo 02. Se hizo una encuesta para determinar cuáles son los problemas sociales más
álgidos que tienen los habitantes de la ciudad de Huaraz, para ello se escogió a 250
ciudadanos en forma aleatoria, los resultados se dan en cuadro siguiente.
Tabla Nº 001: DISTRIBUCIÓN DE LOS CIUDADANOS SEGÚN EL PROBLEMA
SOCIAL QUE LOS AQUEJA
NÚMERO DE %
Nº PROBLEMA SOCIAL
CIUDADANOS
01 Falta de trabajo Formal 48 19.2
02 Corrupción 65 26.0
03 Salud 16 6.4
04 Inseguridad y violencia 24 9.6
05 Educación 08 3.2
06 Carencia de recursos 32 12.8
económicos
07 Acceso a vivienda propia 23 9.2
08 Drogadicción 15 6.0
09 Terrorismo 07 2.8
10 Otros 12 4.8
Total 250 100.0
TABLA ESTADÍSTICA SEGÚN APA
Tabla 001: DISTRIBUCIÓN DE LOS CIUDADANOS SEGÚN EL PROBLEMA SOCIAL QUE LOS
AQUEJA
Número Problema Social Número de ciudadanos %
01 Falta de trabajo formal 48 19.2
02 Corrupción 65 26.0
03 Salud 16 6.4
04 Inseguridad y Violencia 24 9.6
05 Educación 08 3.2
06 Carencia de recursos económicos 32 12.8
07 Acceso a la vivienda propia 23 9.2
08 Drogadicción 15 6.0
09 Terrorismo 07 2.8
10 Otros 12 4.8
Total 250 100.0

Nota: Fuente Base de Datos del MTPE


CLASIFICACIÓN DE DATOS
Ejemplo 03. A un conjunto de 40 alumnos de la UNASAM se les preguntó sobre su
estado civil, a los que contestaron según la serie siguiente:
Soltero, soltero, casado, soltero, conviviente, soltero, casado, soltero, casado, divorciado,
casado, soltero, casado, divorciado, viudo, soltero, casado, soltero, casado, divorciado,
casado, conviviente, casado, soltero, soltero, soltero, viudo, conviviente, conviviente,
soltero, casado, conviviente, soltero, conviviente, soltero, conviviente, divorciado,
soltero, soltero, conviviente.
Solución:
En este caso sólo son necesarias las tarjas a fin de contar con facilidad el número de
alumnos por cada estado civil.
Estado ni Ni hi Hi pi Pi
Civil
Soltero 16 16 0,40 0,40 40% 40%
Casado 10 26 0,25 0,65 25% 65%
Conviviente 8 34 0,20 0,85 20,% 85%
Divorciado 4 38 0,10 0,95 10% 95%
Viudo 2 40 0,05 1,00 5% 100,%
Total 40 1,00 100%

En el caso de las variables cuantitativas discretas, las recomendaciones mayormente


recaen en los intervalos de clase, estos deben ser cerrados como ya se dijo, en cuanto a
los límites y marcas de clase se recomienda que sean números enteros en lo posible, y en
lo referente a las frecuencias, también se obtienen todas las mencionadas.
CLASIFICACIÓN DE DATOS
Ejemplos 4:
El siguiente, corresponde al número de defectos que tienen 50 productos después de
un control de calidad, en una fábrica determinada. Construya un cuadro de distribución
de frecuencias.
0, 1, 2, 0, 3, 1, 4, 2, 3, 1, 4, 5, 2, 1, 0, 0, 1, 2, 0, 3, 4, 2, 0,
1, 2, 3, 1, 0, 2, 3, 0, 2, 1, 1, 0, 2, 4, 0, 1, 4, 2, 1, 2, 3, 5, 5,
1, 1, 0, 3
Solución:
Como es pequeño el rango de variación: R = 5 – 0 + 1= 6 (caso discreto), entonces se
usará 6 intervalos de clase y no tendremos los intervalos de clase, sólo las marcas de clase.
Yi ni Ni hi Hi pi Pi
0 11 11 0,22 0,22 22% 22%
1 13 24 0,26 0,48 26% 48%
2 11 35 0,22 0,70 22% 70%
3 7 42 0,14 0,84 14% 84%
4 5 47 0,10 0,94 10% 94%
5 3 50 0,06 1,00 6% 100%
50 1,0 100%
CLASIFICACIÓN DE DATOS
• Ejemplo 5.
• El siguiente cuadro indica el número de créditos aprobados por 50 alumnos del
segundo ciclo
23 de Estadística.
25 30 24 37 32 27 44 18 32
41 27 35 10 31 15 28 25 22 20
31 16 21 26 24 34 29 17 30 38
28 36 29 33 39 28 13 38 18 26
21 26 12 22 25 19 27 43 23 33

[)
10 – 14 12 3 3 0.06 0.06 6 6

• Ls = 44; Li =1520 ––10;


19
24
R =1744 – 106 = 34; m9 = 1+3.322
22 9 18
0.12
0.18
log 0.18
(50) = 7;12C = 34/7
0.36 18
18
36
= 4.857
= 5; R’ = 5x7
25 –=2935 27 14 32 0.28 0.64 28 64

• = 35 – 34 = 351;- 39LI = 10-0


30 - 34
37
32 9 41
= 10; LS = 44+1 = 45
6 47 0.12
0.18 0.82
0.94
18
12
82
94
PRESENTACIÓN DE DATOS
• PRESENTACIÓN DE DATOS
• La presentación de los datos, después de haberlos ordenado y clasificado, se puede hacer de dos
maneras: por medio de los cuadros estadísticos y por medio de las gráficas estadísticas. Sin embargo,
cabe aclarar que la mayoría de las gráficas o figuras se utilizan por razones diferentes que, por la simple
presentación de datos, una de esas razones es la publicidad, a pesar de que, como método para presentar
datos, la gráfica es inferior a la de un cuadro, pues de la gráfica sólo se puede obtener aproximaciones
visuales acerca de la distribución de los datos, en cambio de un cuadro se obtiene la información
precisa de dicha distribución.

• No cabe duda de que la presentación por medio de gráficas de los datos es un valioso suplemento
para el análisis y resumen de la información para muchas personas, ya que una gráfica bien construida
es más comprensible, que muchas palabras dadas sobre el tema, por eso se dice que una gráfica vale
más que mil palabras, además las gráficas llaman poderosamente la atención del lector o del
observador, en cambio los números son poco apreciados.

• La gran importancia de las gráficas radica en la facilidad de ser asimilados visualmente, mucho más
que los números, pero hay que tener en cuenta que ninguna gráfica puede ser construida si no existe un
cuadro estadístico que lo sustente, además no se puede usar para obtener otros indicadores numéricos
PRESENTACIÓN DE DATOS
• 1. CUADROS ESTADÍSTICOS
• Se le llama también Tabla Estadística, este es un método de presentar ordenadamente los datos, después de que éstos
hayan sido agrupados y distribuidos en uno o más sistemas de clasificación. Existen diferentes tipos de tablas, pero lo
agruparemos en sólo dos grupos.
1. Cuadros Analíticos.
• Son los diseñados para ayudar al análisis formal de las relaciones mutuas entre variables y categorías de clasificación.
• 2. Cuadros de Referencia.
• Son los diseñados para servir como depósito de información estadística, éstos se encuentran generalmente en los
apéndices de los informes o reportes.
• La diferencia entre estos dos tipos de cuadros radica fundamentalmente en el uso y no tanto en su construcción, pues
las características básicas son las mismas.
• ELEMENTOS ESTRUCTURALES DE UN CUADRO ESTADÍSTICO
• Todo proceso de producción de información estadística culmina en la publicación y divulgación de los resultados y es que
el objetivo de toda investigación estadística es dar a conocer a los usuarios, con oportunidad y calidad, los datos estadísticos
obtenidos en dicho proceso, cualquiera que sea la naturaleza de ellos: demográficos, económicos, sociales, geográficos, etc.
• La presentación de los datos debe ser ordenada, coherente y de fácil utilización e interpretación por la diversidad de
usuarios. Con este fin se utilizan los “Cuadros estadísticos” llamados también “Tablas estadísticas”, en los que se presentan
los datos para su utilización e interpretación.
PRESENTACIÓN DE DATOS
• El cuadro estadístico debe estructurarse teniendo en cuenta la utilidad que preste al usuario común, es
decir, quien lo diseña debe colocarse en el lugar del que utilizará la información. La construcción del
mismo es una labor aparentemente sencilla, sin embargo, en la práctica es necesario tener en cuenta
elementos que faciliten la lectura, comprensión e interpretación de los datos. Por otro lado, siempre hay
que tener en cuenta los lineamientos proporcionados por el ente rector que en este caso es el INEI.
• Los elementos que se presentan a continuación, son los de un cuadro de clasificación matricial o de
clasificación cruzada de dos variables, pudiendo en algunos casos obviarse de alguno de los elementos
dados. Para mayor referencia leer la Resolución Jefatural Nº 312-2006-INEI de fecha: 25-10-06.
• 2.1. Número del Cuadro (Tabla).
• Todo cuadro debe tener un número que lo identifique, para facilitar su referencia. Las tablas se
enumeran de acuerdo al orden de su presentación o aparición en un reporte, salvo que se presente un
solo cuadro. Generalmente se colocan en la parte superior izquierda del cuadro.
• 2.2. Título.
• El título de un cuadro indica el contenido del mismo, y debe responder a las siguientes
preguntas: ¿Qué?, ¿Cuándo?, ¿Dónde? Y ¿Cómo? Están clasificados los datos. Al redactar un título se
debe evitar un enunciado demasiado extenso, así como una extrema brevedad.
PRESENTACIÓN DE DATOS
2.3. Notas en el Encabezado de la tabla.
• Estas notas se colocan cerca del título, generalmente entre paréntesis y con letras más
pequeñas que las del título. El objetivo de estas notas es proporcionar información
complementaria o adicional al título, si es necesario por su puesto, como por ejemplo para
indicar la unidad de medida de los datos, la fecha, lugar u otro indicador.
2.4. Talón.
• Es la parte de la tabla que contiene al conjunto de encabezados o rótulos de las hileras,
que corresponde a una de las clasificaciones. Está situado al lado izquierdo del observador.
Cada hilera de la tabla debe tener un rótulo que describa los datos presentados en dicha hilera.
Se le llama también columna matriz.
2.5. Cajón.
• Es la parte de la tabla que contiene los encabezados o rótulos de las columnas.
Corresponden a otra de las clasificaciones y está situado al lado superior derecho del
observador, así como en las hileras cada columna debe tener un rótulo que describa los datos
que en ella se presentan. Se le llama también encabezado del cuadro.
PRESENTACIÓN DE DATOS
2.6. Campo.
• Se le conoce también como el cuerpo de la tabla, y es la parte que contiene los datos numéricos o estadísticos,
cada registro se presenta en una Celda o Casilla que viene a ser la unidad básica de presentación de la tabla. Una
celda resulta de la intersección de una columna con una hilera, ya que el significado del dato presentado en ella se
indica con la combinación de los rótulos de la hilera y de la columna correspondiente.
• Es necesario que en cada celda se registre algo, si el registro es cero, este debe figurar, pero si no existe
información, se debe registrar una raya, adicionalmente se le puede aclarar con una nota al pie de la tabla, pero de
ninguna manera se le debe dejar en blanco, ya que esto está sujeto a especulaciones o manipuleos voluntarios o
involuntarios.

2.7. Notas al pie de la tabla.
• Se llaman también notas al calce (footnotes), estas notas o llamadas se usan muy a menudo para explicar o aclarar
un dato o grupo de datos de la tabla; esto, si es necesario especificar alguna característica particular del dato o datos
presentados, evitando así alguna confusión en su interpretación.

2.8. Fuente de datos.
• Estas notas indican el origen de los datos presentados en la tabla, sirven para identificar o reconocer a la persona
o institución que lo confeccionó y lo publicó; sirve también como una ayuda para evaluar la confiabilidad y permitir
PRESENTACIÓN DE DATOS
Nº de la Tabla TÍTULO
(Notas en el encabezado)

Encabezado Encabezado Principal (Cajón)


del Talón (Clasificación B)
(Clasificación Rótulo de la Rótulo de la Rótulo de la
………
A) columna: B1 columna: BS columna: Total B
Rótulo de la
hilera: A1
…………..
Celda
Rótulo de la
hilera: AR
Rótulo de la
hilera: Total A
- Notas o llamadas al pie de la tabla.
- Fuente de datos.
PRESENTACIÓN DE DATOS
Ejemplo:
A continuación, se presenta un cuadro resumen del número de docentes nombrado y
contratados de la UNASAM en el semestre 2007-II, de acuerdo a su categoría y a la
facultad a la que pertenecen.

C. Nº 1. NÚMERO DE DOCENTES NOMBRADOS DE LA UNASAM,


SEGÚN CATEGORIA Y FACULTAD
(Semestre 2007-II)

Categoría
Facultad
Principal Asociado Auxiliar J. de P. Total
1. Ciencias 18 29 13 1 61
2. Cs. Agrarias 14 17 6 0 37
3. Cs. del Ambiente 5 9 9 0 23
4. Cs. Econ.Adm. y C. 13 27 18 0 58
5. Cs. Médicas 4 15 10 0 29
6. Derecho y Cs. P. 1 7 11 0 19
7. Educ. y C.S. 3 23 10 0 36
8. Ing. Civil 1 18 8 8 35
9. Ing. de Ind. Alim. 2 13 2 2 19
10.Ing. de Min. G.y M. 3 14 0 0 17
11. Barranca 2/. 2 7 13 0 22
Total 66 179 100 1/. 11 356
1/. Las Jefatura de Práctica no es una categoría docente, sin embargo, es contabilizado
como tal.
2/. Barranca no es una facultad, sino una sede.
Fuente de Datos. OGE-UNASAM.2008
PRESENTACIÓN DE DATOS
• 3. GRÁFICAS (FIGURAS) ESTADÍSTICAS

• La representación gráfica de los datos contenidos en una tabla estadística, tiene la finalidad de ofrecer una visión
de conjunto del fenómeno sometido a investigación en forma tal que sea más rápidamente perceptible que la
observación directa de los datos numéricos; de aquí, que la representación gráfica sea un medio eficaz para el
análisis de las estadísticas, ya que las magnitudes y las regularidades se aprecian y recuerdan con más facilidad
cuando se les examina gráficamente. Sin embargo, la representación gráfica es sólo un medio auxiliar del análisis
estadístico; puesto que ésta, es netamente numérica.

• Entre las funciones que cumplen las gráficas o diagramas se pueden señalar las siguientes:

 Hacen más visibles los datos, sistemas y procesos

 Ponen de manifiesto sus variaciones y su evolución histórica o espacial.

 Pueden evidenciar las relaciones entre los diversos elementos de un sistema o de un proceso y representar la
correlación entre dos o más variables.

 Sistematizan y sintetizan los datos, sistemas y procesos.

 Aclaran y complementan las tablas y las exposiciones teóricas o cuantitativas.


PRESENTACIÓN DE DATOS
• 3.1. Partes:
• Las representaciones gráficas por ser medios plásticos, los detalles incluidos en las mismas pueden variar
grandemente, yendo de unos pocos puntos a una estructura bastante complicada, las distintas complicaciones
dependen no solamente de la cantidad de datos a ser presentados, sino también de la variedad y su consecuente
diseño artístico de los dibujos a ser incluidos; sin embargo, las partes principales, siempre deberán estar presentes
en cualquiera de ellas, y estas son las siguientes:

• 3.1.1. Número.
• Toda gráfica debe tener un número que lo identifique, cumple el mismo objetivo que el de las tablas estadísticas,
salvo que sea una sola gráfica la que se presenta en el reporte.

• 3.1.2. Título.
• El título tiene las mismas características que la de una tabla estadística; es decir, el título es una descripción del
contenido de la gráfica, con la diferencia de que pueden ser colocados ya sean en la parte superior o en la parte
inferior de la gráfica.

• 3.1.3. Diagrama.

• Los diagramas, como el cuerpo de una tabla estadística, son usados para representar los datos mostrados en la
gráfica. Se recomienda identificar claramente las clases o categorías de clasificación, poniendo a cada uno de
ellos el nombre y si es posible el valor que le corresponde.
PRESENTACIÓN DE DATOS
• 3.1.4. Escala.
• Toda gráfica debe proveer una escala que le permita al lector, interpretar el significado de las
magnitudes de las líneas, barras u otras formas que sirvan para representar tanto a las
frecuencias como a las categorías. Las escalas se ubican generalmente en los ejes cartesianos,
cuando las gráficas son presentadas usando el plano cartesiano, con frecuencia el eje de las X o
de las abscisas son para las variables, en tanto que el eje de las Y o de las ordenadas son para las
frecuencias. El punto cero u origen debe ser indicado con claridad, en caso de que el origen y la
parte de la escala a ser usada sea muy distante se hace una línea quebrada como:
• -/\/\/\/- o se corta la línea como: -/ /-
• 3.1.5. Fuente de datos.
• Se debe indicar la fuente de donde se obtuvo los datos para construir el diagrama o la gráfica, el
cual dará mayor formalidad a la presentación.
• 3.2. Clases.
• Existe una gamma bastante extensa de diagramas y gráficas para presentar los datos, de acuerdo
a la variable o variables en estudio, los mismo se pueden clasificar de la forma siguiente:
PRESENTACIÓN DE DATOS
• 3.2.1. Con coordenadas ortogonales.
• a. Con divisiones equidistantes:
• - Histograma de frecuencias.
• - Polígono de frecuentas.
• - Pirámide poblacional
• - Ojivas.
• - Diagrama de barras.
• - Diagrama de bastones.
• - Gráfico de tendencia.
• - Gráfico de Gantt.
• - Gráfico de cajas o de bigotes
• - Gráfico de Pareto.
• - Curva de Lorenz.
• - Estereogramas. Etc.
• b. Con divisiones semi-equidistantes:
• - Gráficos logarítmicos.
• - Gráficos semilogarítmicos.
• 3.2.2. De coordenadas no ortogonales:
• - De coordenadas polares – En espiral.
• - De coordenadas triangulares.
• - De coordenadas angulares.
PRESENTACIÓN DE DATOS
• 3.2.3. Sin coordenadas:
• - De superficies – gráfico de sectores.

• - De volúmenes – cubos, esferas, etc.

• - De figuras – pictogramas. Gráfico de tallos y hojas.

• - Mapas – cartogramas o carto diagramas. Etc.

• La presente clasificación puede no ser completa, pues existen otras que no se les ha mencionado, pero esto no le
quita la validez e importancia de lo presentado. Por razones didácticas y de espacio no es posible presentar el
uso, la forma de construcción y las características de las diferentes gráficas enunciadas, sólo se hará de los más
conocidos e importantes y estos son los siguientes:

• 4. Gráficas más usadas:


• 4.1. Histograma de Frecuencias:
• Es una gráfica muy usada para presentar variables cuantitativas continuas, distribuidas en un cuadro de
distribución de frecuencias. Consiste en un conjunto de rectángulos unidos, cuyas bases son proporcionales a los
intervalos de clase y cuyas alturas corresponden a las frecuencias respectivas.

• Ejemplo.1.
• El siguiente cuadro corresponde a las temperaturas en grados centígrados en una ciudad determinada durante 52
PRESENTACIÓN DE DATOS
C.Nº 2.
Temperatura en Número
Xi Fi
Grados Centígrados de días
31,5 – 32,5 32,0 3 3
32,5 – 33,5 33,0 6 9
33,5 – 34,5 34.0 10 19
34,5 – 35,5 35.0 15 34
35,5 – 36,5 36.0 8 42
36,5 – 37,5 37,0 6 48
37,5 – 38,5 38.0 4 52
Total 52

F. Nº 1. Temperatura en Grados Centígrados en una Ciudad durante 52 días


PRESENTACIÓN DE DATOS
• Figura N° 2: POLÍGONO DE FRECUENCIAS

NÚMERO DE ALUMNOS SEGÚN PESO EN KG.


16

14

12
N° de Alumnos

10

0
27,5 32,5 37,5 42,5 47,5 52,5 57,5

Peso en kg.

• Fuente:
PRESENTACIÓN DE DATOS
4.2. Polígono de Frecuencias:
Son polígonos formados uniendo con semirrectas los puntos medios superiores
(Xi, ni) de las barras de un histograma de frecuencias; es decir, las marcas de clase y las
frecuencias correspondientes, para cerrar el polígono, se unen también el punto medio
anterior a la primera clase y el punto medio posterior a la última clase.
Nota. - El área del polígono de frecuencias es igual al del histograma de frecuencias.
Por razones de comparación se ha incluido el polígono de frecuencias al histograma
de frecuencias. Ver F. Nº 2.

F. Nº 3. POLÍGONO DE FRECUENCIAS
16

14

12
Número de Alumnos

10

2
27.5 32.5 37.5 42.5 47.5 52.5 57.5

Peso en kg.
PRESENTACIÓN DE DATOS
• Gráfico de Tendencia:

• Son gráficas usadas generalmente para presentar series cronológicas (series de tiempo); es decir,
las fluctuaciones de los datos a través del tiempo, se les llama también cronodiagramas. Consiste en un
conjunto de semirrectas unidas entre sí, esta línea quebrada indica las variaciones que sufren los datos a
medida que transcurre el tiempo; en otras palabras, la tendencia que siguen los datos a través del tiempo,
que puede ser ascendente, descendente o estable. Los puntos a ser unidos son los puntos (X i, fi), donde Xi
es el tiempo i-ésimo al que corresponde el dato f i.
Gráfico de tendencia

• NÚMERO DE ALUMNOS MTRICULADOS EN UN INSTITUTO POR


8,000

7,000

6,000
AÑOS
NÚMERO DE ALUMNOS

5,000

4,000

3,000

2,000

1,000

0
2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021

AÑOS
GRÁFICO DE LA TENDENCIA
• TASA DE DESERCIÓN
PRESENTACIÓN DE DATOS
Ejemplo. Se hizo una encuesta a 88 obreros sobre su jornal. Los resultados son los
siguientes.
C. Nº 4.

Jornal fi Obreros Fi
[38, 44) 7 7
[44, 50) 8 15
[50, 56) 15 30
[56, 62) 25 55
[62, 68) 18 73
[68, 74) 9 82
[74, 80) 6 88

F. Nº 6. POLÍGONO DE FRECUENCIAS ACUMULADAS – OJIVA


DIAGRAMA DE PARETO
• RETARDOS AL TRABAJO POR CAUSAS
PRESENTACIÓN DE DATOS
• Pirámide Poblacional:

• Es la gráfica formada por dos histogramas de frecuencias, correspondiente a las edades de los varones
y de las mujeres de una determinada población, colocadas en forma opuesta a los intervalos de clase, que
generalmente es de 5 años (llamados cohortes), por su parte las alturas de los rectángulos corresponden a
las frecuencias, que en este caso se presentan en forma horizontal. Casi siempre en la base se representa a
las frecuencias de las edades inferiores (0, 5 años), encima de ellos al del siguiente grupo (5, 10 años) y así
sucesivamente hasta el últimoPOBLACIONAL
PIRÁMIDE grupo. En resumen,
DE UNenPAÍS
el eje
ENvertical se coloca la variable edad.
DESARROLLO
PIRÁMIDE POBLACIONAL

• PIRÁMIDE POBLACIONAL DE ESPAÑA (2020)


PRESENTACIÓN DE DATOS
Diagrama de Barras:
Son gráficas usadas para presentar variables cuantitativas discretas y variables
cualitativas. Este diagrama está formado por un conjunto de barras o rectángulos
separados equidistantemente unos de otros, la base de cada barra debe ser proporcional a
los intervalos de clase en caso de que la variable sea cuantitativa discreta, o tener una
misma anchura en caso de que las variables sean cualitativas. En tanto que las alturas
deben ser proporcionales a las frecuencias.

Ejemplo. - Representar gráficamente los datos del siguiente cuadro.

C. Nº.5. Número de obreros según número de hijos

Número de Número de personas


hijos Total Varones Mujeres
0 18 12 6
1 12 8 4
2 10 6 4
3 6 4 2
4 4 3 1
5o+ 2 1 1
Total 52 34 18

F. Nº 7. NÚMERO DE PERSONAS SEGÚN NÚMERO DE HIJOS

20

10
Personas

Mujeres

0 Varones
0 1 2 3 4 5o+

Número de Hijos
DIAGRAMA DE BARRAS

• PERSONAS
DIAGRAMA DE BARRAS
GRÁFICO DE BASTONES

• DÍAS
• DIAS
PRESENTACIÓN DE DATOS
Ejemplo:
Se hizo una encuesta a 220 alumnos ingresantes a la UNASAM, sobre el promedio
de notas que obtuvieron el quinto de secundaria, los cuales fueron agrupados de acuerdo
a sus ingresos económicos, los resultados se presentan en la siguiente gráfica.

F. Nº 11. GRÁFICO DE CAJAS


18

17
218

16

15

14
Puntaje en 5to secundaria

13

12

11

10
N= 17 150 55

Alto Medio Bajo

Nivel socio económico


PRESENTACIÓN DE DATOS
C. Nº 8. Distribución promedio del gasto mensual de una familia del sector medio
2008.
Sector Soles % % Acum. Grados Grados A
Alimentación 1500 50 50 180 180
Vivienda 450 15 65 54 134
Educación 600 20 85 72 206
Vestido 150 5 90 18 224
Otros 300 10 100 36 360
Total 3000 100 360

F. Nº 12. GRÁFICO DE SECTORES

Vivienda

Vestido

Otros Alimentación

Educación
GRÁFICO DE SECTORES

• DISTRIBUCIÓN DEL PRESUPUESTO DE LA COMUNA DE PUTINA


PRESENTACIÓN DE DATOS
4.11. Pictogramas
Como su nombre etimológico lo indica, son gráficas formadas por figuras (siluetas)
relacionadas a la variable que se quiere mostrar, donde cada silueta o figura representa
una cantidad determinada, por lo tanto, dos figuras similares representan dos cantidades
determinadas de igual magnitud. Con este tipo de gráficas se pueden mostrar variables
cualitativas, además son muy usadas en publicidad.

Ejemplo: Número de habitantes de un país, según año dado.


Cada silueta representa a dos millones de habitantes.

F. Nº 13. PICTOGRAMAS
PICTOGRAMAS
• PROMEDIO DE ÁRBOLES PLANTADOS POR DÍAS EN UNA CIUDAD
PRESENTACIÓN DE DATOS
• . Gráfico de Gantt:

• El objetivo de esta gráfica es la de mostrar comparativamente las metas propuestas con las metas
alcanzadas; en otras palabras, sirve para fiscalizar el trabajo del hombre como de las máquinas, en
consecuencia, es importante para la planificación y organización científica del trabajo, razón por el cual es
muy usado por los directores y gerentes. La construcción puede tener algunas variaciones, pero todos
cuentan con barras horizontales, el número depende de la cantidad de actividades que se quieren mostrar.
CURVA DE LORENZ
MEDIDAS DESCIPTIVAS

• MEDIDAS DESCRIPTIVAS

• En los capítulos anteriores se indicó con bastante claridad, que la distribución de los datos en cuadros y
su respectiva presentación tenía un objetivo, y éste era la de describir en forma eficiente al conjunto de
datos en estudio, asimismo al ordenar y agrupar los datos se pretendía reducir el conjunto amorfo de
observaciones recolectadas, a un reducido número de características que nos den una idea lo más completa
posible de ese conjunto de datos.

• Sin embargo, esta reducción todavía puede ser incompleta, si se pretende describir con un solo un valor
las características del conjunto de datos, este único valor se llama estadístico si el conjunto corresponde a
una muestra, y parámetro si el conjunto corresponde a la población.

• En la práctica, por las razones expuestas en la Unidad I, raras veces estudiaremos poblaciones enteras; en
cambio, es más frecuente el uso de la muestra; por lo tanto, se incidirá más en el estudio del estadístico para
describir los datos, de ahí que el estadístico tomará el nombre de medida descriptiva.

• Como se dijo anteriormente para hacer descripciones, es factible tener un solo valor, de tal manera que,
por sí solo represente a todo el conjunto de datos en estudio, pero a pesar de la ventaja que tiene de
describir en forma sucinta o condensada un cúmulo de observaciones individuales, puede perder
información detallada o muy fina, el cual es compensado con otros estadísticos que complementan la
MEDIDAS DESCIPTIVAS
• Los estadísticos que se estudiarán en esta unidad, son los que describen las siguientes características:
• - La localización puede ser el centro u otro punto de la distribución; es decir, medidas de centralización y de
posición.

• - El grado de variación o dispersión de los datos, alrededor de un punto determinado.


• - El grado de asimetría o sesgo respecto al punto de mayor densidad de datos.
• - El grado de concentración de los datos alrededor de un punto determinado.
• Con el apoyo de este conjunto de medidas descriptivas, indudablemente mejorará la descripción de los
datos realizados con sólo el cuadro de distribución de frecuencias.

• MEDIDAS DE CENTRALIZACIÓN
• Si el conjunto de datos no tienen el mismo valor, entonces existirá un valor mínimo y un valor máximo,
asimismo existirá un valor que no es superior al máximo ni inferior al mínimo; es decir, un valor
intermedio, este valor típico que se empleará para representar a todos los valores individuales, se llamará
promedio o media; por lo tanto, un promedio es una magnitud que pretende identificar al centro de una
distribución, o que centraliza los datos y alrededor del cual los datos se acumulan, por ello reciben el
nombre de medida de tendencia central (tienden al centro), centralización (centralizan), de localización
MEDIDAS DESCIPTIVAS
1.1. Clases:
1.1.1. Medias fijas.
Se les llama también medias matemáticas o medidas de centralización, ya que se
ubican generalmente en el centro de la distribución y poseen las siguientes características:
- Para la obtención de su valor se usan todos los datos en estudio.
- Son afectados por los valores extremos o aislados (outliers) de los datos en estudio.
- Pueden ser sometidos a operaciones algebraicas.
Entre las medidas más conocidas podemos citar a los siguientes:
- Media Aritmética.
- Media Geométrica.
- Media Armónica.
- Media Cuadrática, etc.

1.1.2. Medias Móviles.


Se les llama también medias no matemáticas o de posición, estas medias tienen las
siguientes características:
- Para obtener su valor, sólo se usa algunos valores del conjunto de datos en estudio.
- No son afectados por los valores extremos o aislados del conjunto de datos en estudio.
- No pueden ser sometidos a operaciones algebraicas.
Entre las medias móviles podemos citar a los siguientes:
- Mediana.
- Moda.
- Fractiles: - Cuartiles.
- Deciles.
- Percentiles.
MEDIDAS DESCIPTIVAS
1.2. MEDIA ARITMÉTICA.
Es la medida más conocida, usada y representativa de las medias o promedios. Su
nombre proviene de lo asignado al promedio de una serie aritmética. Físicamente tiene
una acepción muy importante, que es la de ser el centro de gravedad o punto de equilibrio
de toda distribución de masa de los datos en estudio.
El valor se obtiene dividiendo la suma de todos los valores de los datos en estudio,
entre el número total de los mismos, y se expresa de la siguiente manera:
N

X i
  i 1
…………….Media Aritmética Poblacional.
N
n

X i
X i 1
………….. Media Aritmética Muestral, para datos no agrupados.
n
m

X i fi
X i 1
…………..Media Aritmética muestral, para datos agrupados
n
Donde: Xi = es el i-ésimo valor de la variable X, o la i-ésima marca de clase, en el caso
de datos agrupados
i = 1, 2, 3, ….., n o N, según sea el caso.
fi = i – ésima frecuencia absoluta simple.
N = tamaño de la población.
n = tamaño de la muestra.
m = Número de intervalos de clase.
En forma general se le puede representar como M(X), media aritmética de la variable X.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 1:
Los siguientes son notas de dos alumnos con rendimientos diferentes en un determinado
curso. Obtenga el promedio de cada alumno:
Alumno Variable Notas
A X 11, 12, 10, 14, 13
B Y 17, 15, 11, 9, 8
Solución:
5

X i
X 1  X 2  X 3  X 4  X 5 11  12  10  14  13 60
XA i 1
    12
5 5 5 5
5

YY1  Y2  Y3  Y4  Y5 17  15  11  9  8 60
i 1
i
XB     12
5 5 5 5
Como se puede apreciar, ambos promedios son iguales, pero el rendimiento de los
alumnos es diferente, mientras que el alumno A va superándose, el alumno B va
decayendo en su rendimiento. Esto implica que sólo con el promedio no se puede sacar
conclusiones exactas.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 2:
Se ha registrado el número de inasistencias de los obreros a un centro laboral durante una
semana, los resultados se presentan en el siguiente cuadro. Obtenga el promedio de
inasistencias.
Nº de
Días
Inasistencias
Lunes 2
Martes 0
Miércoles 6
Jueves 7
Viernes 5
Sábado 4
Total 24

Solución:
Como la variable es cualitativa, no se usará la propia variable, sino se usará a las
frecuencias como si fueran los valores de la variable.
6

X i
X 1  X 2  X 3  X 4  X 5  X 6 2  0  6  7  5  4 24
X i 1
    4 inasistencias por
6 6 6 6
día
MEDIDAS DESCIPTIVAS
Ejemplo Nº 3.
El cuadro siguiente corresponde a la distribución de los puntajes obtenidos por 100
empleados de un centro laboral después de una evaluación, obtenga el puntaje promedio
de los empleados.

Nº de
Puntaje
Empleados
40 – 50 6
50 – 60 25
60 – 70 24
70 – 80 20
80 – 90 15
90 - 100 10
Total 100

Solución:
En este caso usaremos la fórmula para datos agrupados.
6

X i fi
X 1 f1  X 2 f 2  X 3 f 3  X 4 f 4  X 5 f 5  X 6 f 6
X  i 1

100 100
45(6)  55( 25)  65( 24)  75( 20)  85(15)  95(10) 6930
X    69,3 pts.
100 100
El puntaje promedio de los 100 empleados es de 69,3 pts. Para simplificar los cálculos,
se usará el siguiente cuadro.

Puntaje Xi fi Xifi
40 – 50 45 6 270
50 – 60 55 25 1375
60 – 70 65 24 1460
70 – 80 75 20 1500
80 – 90 85 15 1275
90 - 100 95 10 950
Total -- 100 6930
MEDIDAS DESCIPTIVAS
1.2.1. Propiedades de la media Aritmética.
a) La suma algebraica de las diferencias de cada uno de los valores respecto a su media
aritmética, es igual a cero.
n

(X
i 1
i  X )  0 ….. Para datos no agrupados
m

(X
i 1
i  X ) f i  0 .... Para datos agrupados.

b) La media aritmética de una constante, es igual a la constante

M(K) = K

c) La media aritmética de una constante por una variable, es igual a la constante por la
media aritmética de la variable.

M(XK) = K M(X)

d) La media aritmética de una variable más (menos) una constante, es igual a la media
aritmética de la variable mas (menos) la constante.

M(X  K) = M(X)  K
M(aX  b) = a M(X)  b

e) La media aritmética de una suma de variables, es igual a la suma de las medias


aritméticas de cada una de las variables.

M(X + Y – Z) = M(X) + M(Y) – M(Z)

f) La suma de los cuadrados de las desviaciones de cada uno de los datos respecto a su
media aritmética es mínima (Teorema de Köning).
n n

 (X i  X )2 
i 1
(X
i 1
i  a ) 2 ……para datos no agrupados.
m m

 ( X i  X )2 fi 
i 1
(X
i 1
i  a ) 2 f i …..para datos agrupados
MEDIDAS DESCIPTIVAS
• 1.2.2. Ventajas de la media Aritmética.
- Es un concepto muy familiar para la mayoría de las personas e intuitivamente claro y usada muy a menudo.
- Es una medida que puede ser calculada y es única. Pues cada conjunto de datos tiene una y sola una media
aritmética.

• - Para calcular su valor se usa todos los valores de los datos en estudio.
• - Es una medida bastante representativa del conjunto de datos.
• - En una gráfica de frecuencias representa el centro de gravedad

- Es sensible a cualquier cambio en los datos (puede ser usado como un detector de
variaciones en los datos).
• 1.2.3. Desventajas de la media aritmética.
- Se ve afectado por los valores extremos o aislados del conjunto de datos en estudio, por lo que no es recomendable usarlo
en distribuciones muy sesgadas.

- Su cálculo es tedioso, porque se usan todos los valores.


- No se puede calcular la media aritmética para datos agrupados, cuyos intervalos de clase en los extremos son abiertos.
- Si se emplean variables discretas o cuasi-cualitativas, la media aritmética puede no
MEDIDAS DESCIPTIVAS
Ejemplo Nº 4.
Los sueldos de 5 empleados de una institución particular pequeña son los siguientes:
1500, 800, 2200, 1600 y 1400 soles. En vista de que sus sueldos han sido congelados hace
bastante tiempo, consigue una entrevista con el gerente para tratar ese tema. El gerente
les da dos propuestas para modificar sus sueldos, la primera consiste en un aumento de
500 soles a cada uno y la segunda consiste en un aumento del 35% a cada sueldo. ¿Cuál
de las propuestas debe ser aceptada por convenir a la mayoría?
Solución:
Sea X1 = 1500 soles
X2 = 800 ” _
X3 = 2200 ” X = 7500/5 = 1500 soles
X4 = 1600 ”
X5 = 1400 ”
---------------------
Total = 7500 soles
Primera propuesta: Yi = Xi + 500  Y  X  500 = 1500 + 500 = 2000 soles
Y1 = 1500 + 500 = 2000 soles
Y2 = 800 + 500 = 1300 ” _
Y3 = 2200 + 500 = 2700 ” Y = 10000/5 = 2000 soles
Y4 = 1600 + 500 = 2100 ”
Y5 = 1400 + 500 = 1900 ”
---------------------------------
Total = 10000 soles
Segunda propuesta: Z i = 1,35Xi  Z  1,35 X = 1,35 (1500) = 2025 soles
Z1 = 1,35(1500) = 2025 soles
Z2 = 1,35(800) = 1080 ” _
Z3 = 1,35(2200) = 2970 ” Z = 10125/5 = 2025 soles
Z4 = 1,35(1600) = 2160 ”
Z5 = 1,35(1400) = 1890 ”
----------------------------------
Total = 10125 soles
En conclusión, se puede apreciar que la segunda propuesta es más favorable a la mayoría
de los empleados, pero es discriminatoria, pues el que gana más recibe un mayor aumento.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 5.
Siguiendo la carretera principal se encuentran las ciudades A, B, C, D y E, en ese orden,
las distancias son: 6 km. entre A y B, 4 km entre B y C, 8 km. entre C y D, 2 km. entre D
y E. Un club deportivo tiene socios repartidos en las 5 ciudades de la forma siguiente:
10% en A, 20% en B, 15% en C, 30% en D y el resto en E. Se quiere construir un campo
deportivo en algún punto de la carretera, de tal manera que concurran los socios con el
menor costo posible en el transporte. Los expertos indican que el costo del viaje para cada
socio es proporcional al cuadrado de la distancia que tenga que recorrer. Como el club
paga los pasajes quiere reducir dicho gasto, ¿a qué distancia de la ciudad A debe
construirse dicho campo?

Solución:

Aplicando la propiedad f de la media aritmética. Este debe ser el promedio aritmético de


las distancias de las ciudades respecto a la ciudad A. por lo tanto, estas distancias son los
siguientes:

Ciudad Distancia: Xi % de Socios Xifi


A 0 10 0
B 6 20 120
C 10 15 150
D 18 30 540
E 20 25 500
Total 100 1310

1310
X   13,1 km. , el campo deportivo debe construirse a 13,1 km de la ciudad A,
100
es decir entre las ciudades C Y D.
MEDIDAS DESCIPTIVAS
1.3. Media Aritmética Ponderada

En muchos casos el valor de un dato de una variable puede no tener el mismo peso
que el de los demás, por lo que es necesario ponderarlo, asignando a cada uno de ellos
pesos de acuerdo a su importancia. La media aritmética obtenida así, se llama media
aritmética ponderada y su valor se obtiene usando la siguiente expresión:
r

X i wi
X  i 1
r

w i 1
i

Donde wi es la ponderación de Xi

Ejemplo Nº 6.
Un alumno obtuvo las siguientes notas en un determinado curso:
1er. examen = 11, 2do. examen = 13 y 3er. examen = 08. ¿Cuál es el promedio de notas
de este alumno, si:
a.- cada examen tiene igual peso?
b.- las ponderaciones de los exámenes son: 2, 1 y 3 respectivamente?

Solución:
3

X i
11  13  08 32
a.- X  i 1
   10,67  11
3 3 3
3

X i wi
11( 2)  13(1)  08(3) 59
b.- X  i 1
   9,833  10
r
2 1 3 6
w i 1
i

Indudablemente el alumno en el segundo caso desaprobará, por lo que se le recomienda


darle mayor importancia al 3er. examen.
MEDIDAS DESCIPTIVAS
1.3.1. Casos Especiales.
a.- La media aritmética para datos agrupados, es una forma particular de la media
aritmética ponderada, pues:
m
Si wi = fi, r = m, f i 1
i n
r m m

 X i wi  X i fi X i fi
X  i 1
r
 i 1
m
 i 1

n
w i 1
i f i 1
i

b.- La media aritmética ponderada, también se puede obtener usando las frecuencias
relativas simples, pues:
m
hi = fi / n, wi = hi, r = m, h
i 1
i 1
r m m

 X i wi X i hi X i hi m
X  i 1
r
 i 1
m
 i 1

1
 X i hi
w i 1
i h i 1
i
i 1

c.- La media aritmética ponderada también sirve para obtener el promedio de


promedios.
r
Sí X i  X i ; wi = fi, f i 1
i n

r r r

 X i wi  X i fi X i fi
X  i 1
r
 i 1
r
 i 1

n
w i 1
i f i 1
i
MEDIDAS DESCIPTIVAS

Ejemplo Nº 7.
Después de una evaluación a los trabajadores de una empresa, divididos en tres grupos:
Profesionales, Técnicos y Auxiliares, se obtuvo la siguiente información:

Grupo Nº de
Promedio
Ocupacional Trabajadores
Profesional 12 40
Técnico 13 60
Auxiliar 09 50
Total 11,4 150

Solución:
12(40) + 13(60) + 09(50) 1710
𝑋= = = 11,4
150 150
El promedio general de los 150 trabajadores es de 11,4
MEDIDAS DESCIPTIVAS
Ejemplo Nº 8
La producción de la empresa A es el triple de la de B, y la de ésta es 25% inferior a la de
C. si los costos unitarios correspondientes, todos inferiores en 20% de sus respectivos
precios de venta, siendo los costos unitarios de 20, 24 y 28 soles respectivamente,
determinar el precio promedio de venta por unidad.
Solución:
Sea Xi el costo unitario, y Yi el precio de venta unitario, donde Xi = Yi – 0,2Yi = 0,8Yi
Luego Yi = Xi/0,8
XA = 20 soles, XB = 24 soles y Xc = 28 soles.
YA = 20/0,8 = 25 soles, YB = 24/0,8 = 30 y YC = 28/0,8 = 35 soles.
fA = Número de artículos producidos por A.
fB = Número de artículos producidos por B.
fC = Número de artículos producidos por C.
fB = fC – 0,25 fC = 0,75 fC
fA = 3 fB = 3(0,75 fC) = 2,25 fC

Precio de Número de
venta Yi artículos Yifi
producidos(fi)
25 2,25 fC 56,25 fC
30 0,75 fC 22,50 fC
35 fC 35,00 fC
Total 4 fC 113,75 fC

113 ,75
𝑌 = = 28,4375𝑠𝑜𝑙𝑒𝑠
4
MEDIDAS DESCIPTIVAS
1.4. MEDIA GEOMÉTRICA.

Se le representa por Mg. La media geométrica, es la raíz n-ésima del producto de los
n valores de los datos en estudio. Se usa como promedio de series geométricas y en ciertos
casos especiales como el índice de precios, tasas de crecimiento poblacional, tasas de
interés bancario, etc. Se puede presentar de dos formas, a saber:

1.4.1. Media geométrica para datos no agrupados.


𝑀𝑔 = 𝑛ඥ𝑋1 𝑋2 𝑋3 . . . . . 𝑋𝑛 = 𝑛ඥς 𝑛𝑖=1 𝑋𝑖
σ 𝑛𝑖=1 𝒍𝒐𝒈 𝑋 𝑖
𝑀𝑔 = 𝐴𝑛𝑡𝑖 𝒍𝒐𝒈 ቂ ቃ
𝑛

1.4.2. Media Geométrica para datos agrupados.


Se llama también Media Geométrica Ponderada, es la raíz n-ésima del producto de
las marcas de clase elevadas a sus respectivas frecuencias absolutas.
𝑛 𝑛1 𝑛2 𝑛3 𝑛𝑚 𝑛 𝑛𝑖
𝑀𝑔 = ට 𝑋1 𝑋2 𝑋3 . . . . 𝑋𝑚 = ට ς 𝑚 𝑋
𝑖=1 𝑖
σ𝑚
𝑖=1 𝑛 𝑖 𝒍𝒐𝒈 𝑋 𝑖
𝑀𝑔 = 𝐴𝑛𝑡𝑖 𝒍𝒐𝒈 ቂ 𝑛

MEDIDAS DESCIPTIVAS
Ejemplo Nº 1.
Obtenga la media aritmética y geométrica de las siguientes ternas: (2, 4, 6) y (2, 4, 8)

Solución:
a) Media Aritmética:
2+4+6 12
𝑋= 3 = 3 =4
Media Geométrica:
3 3
𝑀𝑔 = ξ 2𝑥4𝑥6 = ξ 48 = 3,634
En este caso el promedio más representativo sería la media aritmética.

b) Media aritmética:
2+4+8 14
𝑋= = = 4,67
3 3
Media Geométrica:
3 3
𝑀𝑔 = ξ 2𝑥4𝑥8 = ξ 64 = 4
Como se puede apreciar la media más representativa sería la geométrica.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 2.
Hallar la media geométrica de los siguientes datos dados en el siguiente cuadro.

Puntaje Xi fi log Xi nilogXi


40 – 50 45 6 1,653212514 9,919275082
50 – 60 55 25 1,740362690 43,50906724
60 – 70 65 24 1,812913357 43,50992056
70 – 80 75 20 1,875061263 37,50122527
80 – 90 85 15 1,929418926 28,94128389
90 - 100 95 10 1,977723605 19,77723605
Total -- 100 183,1580081

Solución:
183,1580081
𝑀𝑔 = 𝐴𝑛𝑡𝑖 𝑙𝑜𝑔 = 67,855𝑝𝑡𝑠.
100
Ejemplo Nº 3.
Suponga que se depositó mil soles en un ente financiero, y que los intereses se acumulan
a tasas variables de 5, 8, 10, 12, y 15% anual durante 5 años. Halle la tasa promedio anual
de interés.

Solución:

Tasa de Factor de Ahorro al


Año
Interés % crecimiento final del año
2003 5 1,05 1000 x 1,05 = 1050,00
2004 8 1,08 1050,00 x 1,08 = 1134,00
2005 10 1,10 1134,00 x 1,10 = 1247,40
2006 12 1,12 1247,40 x 1,12 = 1397,088
2007 15 1,15 1397,088 x 1,15 = 1606,65

5 5
𝑀𝑔 = ඥ1,05𝑥1,08𝑥1,10𝑥1,12𝑥1,15 = ඥ1,6066512 = 1,09947 = 9,947%
La tasa promedio anual de interés es del 9,947%
MEDIDAS DESCIPTIVAS
1.4.3. Desventajas de la Mg.
- Su cálculo es muy engorroso.
- Está limitado sólo para valores positivos, si hay algún valor negativo, entonces el
resultado podría ser imaginario.
- Si uno o más valores son iguales a cero, la Mg es cero.

1.4.4. Propiedades de Mg.


- Si todos los valores de los datos son iguales a una cantidad determinada (constante), la
Mg es igual a esa cantidad determinada.
- La media geométrica de dos series de datos, es igual al producto de sus medias
geométricas.
- La media geométrica de un conjunto de datos es siempre menor o igual a la media
aritmética. 𝑀𝑔 ≤ 𝑋
MEDIDAS DESCIPTIVAS
1.5. MEDIA ARMÓNICA
Se le representa por Mh. La media armónica es el recíproco de la media aritmética del
recíproco de los datos. Se usa para obtener el promedio en series armónicas, y en casos
especiales como para obtener el promedio de velocidades, productividad en tiempos
dados o de datos inversamente proporcionales. Se presentan dos casos, a saber:

1.5.1. Media Armónica para datos no agrupados.


𝑛
𝑀ℎ = 𝑛 1
σ 𝑖=1
𝑋𝑖
1.5.2. Media Armónica para datos agrupados.
Se le llama también media armónica ponderada, es el recíproco de la media aritmética
de la división de cada frecuencia absoluta entre su respectiva marca de clase.
𝑛
𝑀ℎ = 𝑚 𝑛 𝑖
σ 𝑖=1
𝑋𝑖

Ejemplo Nº 1.
Obtenga la media aritmética, la media geométrica y la media armónica de los siguientes
números: 3, 4 y 6.

Solución:
3 + 4 + 6 13
𝑋= = = 4,33
3 3
3 3
𝑀𝑔 = ξ 3𝑥4𝑥6 = ξ 72 = 4,16
3 3 3𝑥12
𝑀ℎ = = = =4
1 1 1 4+3+2 9
+ +
3 4 6 12
Se nota que la media armónica es la más representativa para estos tres valores.
MEDIDAS DESCIPTIVAS

Ejemplo Nº 2.
Obtenga la media armónica de los datos que corresponden al siguiente cuadro de puntajes
de 100 alumnos.

Puntaje Xi fi
40 – 50 45 6
50 – 60 55 25
60 – 70 65 24
70 – 80 75 20
80 – 90 85 15
90 - 100 95 10
Total -- 100
Solución:
100 100
𝑀ℎ= = = 66,42𝑝𝑡𝑠.
6 25 24 20 15 10 1,50550997
+ + + + +
45 55 65 75 85 95
MEDIDAS DESCIPTIVAS
Ejemplo Nº 3.
Suponga que ha gastado seis soles por tres docenas de tornillos en una ferretería, otros 6
soles en 4 docenas de tornillos en otra ferretería y otros 6 soles por 5 docenas de tornillos
en otra ferretería. Determine el precio promedio por docena de tornillos.

Solución:
Se obtendrá en primer lugar el precio por docena de tornillo en cada ferretería.
X1 = 6/3 = 2 soles por docena, en la primera ferretería.
X2 = 6/4 = 1,5 soles por docena en la segunda ferretería.
X3 = 6/5 = 1,2 soles por docena en la tercera ferretería.
3 3 18
𝑀ℎ = = = = 1,5𝑠𝑜𝑙𝑒𝑠
1 1 1 3 + 4 + 5 12
+ +
2 1,5 1,2 6
Comprobación: Se gastó 18 soles y se compró 12 docenas, por lo tanto, el precio por
docena es igual a 18/12 = 1,5 soles por docena de tornillo.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 4.
Un automovilista recorre 600 km de una autopista, de la siguiente manera: los primeros
200 km a 90 km por hora, los segundos 200 km a 120 km por hora y los últimos 200 km
a 180 km por hora, calcule la velocidad promedio del automovilista.

Solución:
Como las velocidades y el tiempo son inversamente proporcionales se usa la media
armónica para obtener el promedio.
3 3 3𝑥360
𝑀ℎ = = = = 120𝑘𝑚/ℎ𝑟.
1 1 1 4+3+2 9
+ +
90 120 180 360
200𝑘𝑚 200𝑘𝑚 200𝑘𝑚
Comprobación: Se recorrió 600 km y se usó 90𝑘𝑚 /ℎ𝑟 + 120𝑘𝑚 /ℎ𝑟 + 180𝑘𝑚 /ℎ𝑟 =
5 hrs. por lo tanto, la velocidad promedio por hora es igual a 600/5 = 120 km/hr.

1.5.3. Propiedad.
La media armónica para datos positivos, es siempre menor o igual que la media
geométrica. Por consiguiente, se presenta la siguiente desigualdad:

Mh  Mg  M(X)

1.5.4. Desventaja.
Cuando por lo menos un valor del conjunto de datos en estudio es cero, la media
armónica para ese conjunto no está definida.
MEDIDAS DESCIPTIVAS
1.6. MEDIA CUADRÁTICA: Mc(X)
Es una medida poco usada y viene a ser la raíz cuadrada de la media aritmética de los
cuadrados de los valores de los datos en estudio. Se puede presentar de dos formas, a
saber:

1.6.1. Media Cuadrática para datos no agrupados.


σ 𝑛𝑖=1 𝑋𝑖2
𝑀𝑐(𝑋) = ට
𝑛
Donde Xi es el valor de cada dato.

1.6.2. Media Cuadrática para datos agrupados:


σ𝑚 2
𝑖=1 𝑋𝑖 𝑓 𝑖
𝑀𝑐(𝑋) = ට 𝑛
Donde Xi es la marca de clase y fi es su frecuencia absoluta correspondiente.

1.6.3. Propiedad.
La media cuadrática es siempre mayor o igual a la media aritmética.

M(X)  Mc(X)

Mh  Mg  M(X)  Mc(X)
MEDIDAS DESCIPTIVAS
Ejemplo Nº 1.
Hallar la media cuadrática de los siguientes valores: 2, 3, 4, 5, 6

Solución:
22 + 32 + 42 + 52 + 62 90
𝑀𝑐(𝑋) = ඨ =ඨ = ξ 18 = 4,24264 ≈ 4,24
5 5

M(X) = 4, Mg = 3,73, Mh = 3,45, se nota la siguiente desigualdad:


Mh  Mg  M(X)  Mc(X)

Ejemplo Nº 2.
Hallar la media cuadrática de los datos que se presentan en el siguiente cuadro de puntajes
de 100 alumnos.

Puntaje Xi fi 𝑋𝑖2 𝑋𝑖2 𝑓𝑖


40 – 50 45 6 2025 12150
50 – 60 55 25 3025 75625
60 – 70 65 24 4225 101400
70 – 80 75 20 5625 112500
80 – 90 85 15 7225 108375
90 - 100 95 10 9025 90250
Total -- 100 500300

Solución:
500300
𝑀𝑐(𝑋) = ඨ = ξ 5003 = 70,73𝑝𝑡𝑠.
100
M(X) = 69,3 pts., Mg = 67,855 pts., Mh = 66,42 pts. En este caso también se comprueba
la siguiente desigualdad.
Mh  Mg  M(X)  Mc(X)
Nota. La igualdad se presenta cuando todos los datos son iguales
MEDIAS MATEMÁTICAS
• 1. los siguientes datos corresponden al número de accidentes ocurridos en los 5
días anteriores en una avenida de una ciudad: 12,16, 14, 10, 8; hallar las medias
matemáticas correspondientes.
• Solución.
• = = 12 accidentes por día
• Mg = = = 11.655 accidentes por día
• Mh = = = 11.3055 accidentes por día
• Mc(X) = = = 12.33 accidentes por día
• 12.33 > 12 > 11.655 > 11.3055
MEDIAS MATEMÁTICAS
• 2. El siguiente cuadro corresponde a las edades de 50 alumnos, hallar las medias matemáticas
[Edades
- años) Xi fi Xifi Xi^fi fi/Xi

15 - 18 16.5 15 247.5 1.82919^18 0.909091 4083.75


18 - 21 19.5 18 351.0 1.661969^23 0.923077 6844.5
21 - 24 22.5 12 270.0 1.686411^16 0.533333 6075.0
24 - 27 25.5 3 76.5 16581.375 0.117647 1950.75
27 - 30 28.5 2 57.0 812.25 0.070175 1624.5
Total 50 1002 9.072627^64 2.553242 20578.5

• = 1002/50 = 20.04 años; Mg. = = 19.91 años; Mh = = 19.58 años


• Mc(X) = = = 20.287 años
• 20.287 > 20.04 > 19.91 > 19.58
MEDIDAS DESCIPTIVAS
1.7. MEDIANA: Me
Cuando la media aritmética es un promedio no representativo de los datos en estudio,
por haber sido afectado o distorsionado por lo valores extremos del conjunto de datos, se
tiene que usar otro tipo de promedios y este en primer lugar es la mediana, que viene a
ser el valor que se encuentra en la parte central de una serie ordenada de datos, por lo que
se le puede definir como: el valor que tiene la propiedad de que el número de datos
menores que él, es igual al número de datos mayores que él; por lo tanto, es el valor que
divide a la distribución en dos partes iguales, 50% para cada parte. 50% de datos menores
y 50% de datos mayores. El valor se obtiene teniendo en cuenta lo siguiente:
a.- Para datos no agrupados:
El primer paso es ordenar los datos en orden creciente o decreciente.
a.1. Si el número de datos es impar.
La mediana es el valor del dato que se encuentra exactamente en la parte central.
𝑀𝑒 = 𝑋𝑛 +1
2
Ejemplo Nº 1.
Los siguientes son sueldos de 4 empleados y un gerente de un banco: 4200, 5200,
4800, 5800 y 50000 soles respectivamente. Obtenga el sueldo promedio de los 5
trabajadores.
Solución:
4200 +5200 +4800 +5800+50000 70000
𝑋= = = 14000𝑠𝑜𝑙𝑒𝑠
5 5
Se puede apreciar que este promedio no es lo más representativo para ninguno de los
trabajadores.
Ordenando los datos en forma creciente se tiene la siguiente serie:
4200, 4800, 5200, 5800, 50000
Luego la media es el tercer valor, es decir Me = 5200 soles, este valor por lo menos
es representativo de la mayoría de los trabajadores.
MEDIDAS DESCIPTIVAS
a.2. Si el número de datos es par.
La mediana es la semisuma de los valores de los dos datos que se encuentran en
la parte central.
𝑋 𝑛 +𝑋 𝑛 +2
𝑀𝑒 = 2 2
2
Ejemplo Nº 1.
Si se deja de lado el sueldo del gerente dado en el ejemplo anterior, entonces
obtenga el sueldo mediano de los 4 empleados.
Solución:
4200, 4800, 5200, 5800
4800 +5200
𝑀𝑒 = = 5000𝑠𝑜𝑙𝑒𝑠
2
En este caso los dos promedios son representativos, pues los datos son un tanto
homogéneos, pues el valor extremo no se tiene en cuenta, pero no siempre sucede
esta coincidencia.

b.- Para datos agrupados.


En este caso se usa el cuadro de distribución de frecuencias, aplicando la siguiente
fórmula.
𝑛
' −𝐹𝑖−1
𝑀𝑒 = 𝑌𝑖−1 + 𝐶𝑖 ൤ 2
𝑓𝑖
൨ Usando las frecuencias absolutas.
'
Donde: 𝑌𝑖−1 = Límite inferior de la clase de la mediana.
Ci = Amplitud de la clase de la mediana.
𝐹𝑖−1 = Frecuencia absoluta acumulada anterior a la clase de la mediana.
fi = Frecuencia absoluta simple de la clase de la mediana.
n = Número de datos en estudio.
' 0,5−𝐻𝑖−1
𝑀𝑒 = 𝑌𝑖−1 + 𝐶𝑖 ቂ ቃUsando las frecuencias relativas.
ℎ𝑖
Nota.- En una distribución simétrica la media aritmética y la mediana son iguales.
M(X) = Me
MEDIDAS DESCIPTIVAS
Ejemplo Nº 1.
Obtenga la mediana de los datos del siguiente cuadro de puntajes de 100 alumnos.

Puntaje Xi fi Fi
40 – 50 45 6 6
50 – 60 55 25 31
60 – 70 65 24 55
70 – 80 75 20 75
80 – 90 85 15 90
90 - 100 95 10 100
Total -- 100

Solución:
50−31 190
𝑀𝑒 = 60 + 10 ቂ ቃ= 60 + = 67,92𝑝𝑡𝑠.
24 24
Esto indica que el 67.92 es el máximo puntaje del 50% de los alumnos con menor
puntaje y a su vez es el mínimo puntaje obtenido por el otro 50% de los alumnos con
mayor puntaje.
El cálculo de la mediana cuando los datos están agrupados, es como sigue:
- Primer paso.- Dividir el número de datos entre dos. En nuestro ejemplo es 100/2 =
50
- Segundo paso.- Ubicar la clase de la mediana. Es el primer intervalo de clase que
contiene a n/2, o a la mitad del total de datos. En nuestro caso es el de 60 – 70,
pues tiene F3 = 55 datos (puntajes). El tercer intervalo.
-Tercer paso.- Reemplazar los datos de la fórmula.
Y2 = 60 pts., F2 = 31, f3 = 24, n/2 = 100/2 = 50
MEDIDAS DESCIPTIVAS
Ejemplo Nº 2.
El siguiente cuadro muestra la distribución de los obreros según el número de faltas
a su centro laboral durante un mes determinado. Obtenga la mediana.

Nº de Nº de
Fi
faltas obreros
0 17 17
1 13 30
2 8 38
3 6 44
4 3 47
5 2 49
6 1 50
Total 50

Me = 1 falta
No es necesario usar la fórmula, a pesar de ser un conjunto de datos agrupados, pues
si se ordenan los datos en forma ascendente o descendente, como n es par, la
mediana sería la semisuma de los valores de los datos 25 y 26 y ellos son unos y por
lo tanto la mediana sería uno. Este es una variable discreta; por lo tanto, basta con
ubicar el intervalo de la clase de la mediana y con ello el valor de la marca de clase
y este valor es la mediana.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 3.
De una distribución de frecuencias simétrica de igual amplitud, de las edades de 80
empleados de una empresa, se sabe sólo algunos datos como son: f4 – f5 = 5, f3 - f4
– f5 = 5; Y1'  17,5 ; Y3' f 3  825 . Calcule la mediana y la media aritmética.
Solución:
80 = f1 + f2 + f3 + f4 + f5 = 2f5 + 2f4 + f3 = 2(f5 + f4) + f3….. (1)
f3 - f4 – f5 = 5  f3 – 5 = f4 + f5….. (2)
Reemplazando en (1)
80 = 2(f3 – 5) + f3 = 2f3 – 10 + f3
90 = 3f3  f3 = 30
De (2) se tiene: 30 – 5 = 25 = f4 + f5……(3)
Además se tiene por enunciado que f4 – f5 = 5….(4)
De (3) y (4) se obtiene f4 = 15 y f5 = 10
Por otro lado se tiene: Y3' f 3  825  Y3' (30)  825  Y3'  27,5
C  ( 27,5  17,5) / 2  5

Y  Yi ' 
'
i 1
Yi fi Fi Yi fi
12,5 – 17,5 15 10 10 150
17,5 – 22,5 20 15 25 300
22,5 – 27,5 25 30 55 750
27,5 – 32,5 30 15 70 450
32,5 – 37,5 35 10 80 350
Total 80 2000

 40  25 
Me  22,5  5   25 años. M(X) = 25 años
 30 
MEDIDAS DESCIPTIVAS
• Ejemplo 4. El siguiente cuadro corresponde a las pesos en kg de 75 bultos en un camión determinado, siendo
el ancho de clase constante, además se sabe que el 10,67 % de los bultos pesaron menos de 30 kg.
• a. ¿Qué porcentaje de los bultos tuvieron un peso de 60 o más kg?
• b. obtenga el promedio aritmético y la mediana de los pesos.
hi
[Notas) Xi fi Fi hi Hi Xifi
[Notas) Xi ni Fi
- 7.5 0.04 00 - 15 7.5 3 3 0.04 0.04 22.5
- a 15 - 30 22.5 5 8 0.0667 0.1067 112.5
- 0.12
30 - 45 37.5 9 17 0.12 0.2267 337.5
- 4a
- 67.5 5a 45 - 60 52.5 20 37 0.2667 0.4934 1050.0
- 60 - 75 67.5 25 62 0.3333 0.8267 1687.5
- 6 75 - 90 82.5 7 69 0.0933 0.92 577.5
--- 75 1.00
90 - 105 97.5 6 75 0.08 1.00 585.0
Total 75 1.00 4372.5

• a. P = [(25+7+6)/75]x100 = 50.67%
• b. M(X) = 4372.5/75 = 58.3 kg. Me = 60 + 15[(37.5 – 37)/25] = 60.3 kg
MEDIDAS DESCIPTIVAS
Ejemplo Nº 5.
Obtenga la media aritmética y la mediana del siguiente cuadro de distribución de
frecuencias, que corresponde a los ingresos mensuales en miles de soles de un
conjunto de empleados.

2-4 k
4-6 3k
6-8 7k
8 - 10 10k
10 - 12 12k

Solución:

hi Hi hi Hi
2–4 3 k k 1/12 1/12
4–6 5 2k 3k 2/12 3/12
6–8 7 4k 7k 4/12 7/12
8 – 10 9 3k 10k 3/12 10/12
10 - 12 11 2k 12k 2/12 1,0
Total 1,0 1,0

La media aritmética se puede obtener usando la siguiente fórmula dada


anteriormente.
 3(1/12) + 5(2/12) + 7(4/12) + 9(3/12) + 11(2/12)
= 90/12

= 7,5 mil soles.

Me = 6 + 2[
MEDIDAS DESCIPTIVAS
• 1.7.1. Propiedades.
• La suma de las desviaciones absolutas de los valores de los datos con respecto a la mediana es mínima. Es decir, es
menor que la suma de las desviaciones absolutas con relación a cualquier otro valor de la distribución.

• Es mínimo, para datos no agrupados.

• Es mínimo, para datos agrupados.


• Donde a es cualquier valor.
• Donde a es cualquier valor.
• 1.7.2. Ventajas.
• - El cálculo de su valor es bastante sencillo sobre todo si los datos no están agrupados.
• - No es necesario que todos los intervalos sean cerrados o semiabiertos, para calcular su valor. Los extremos pueden ser
intervalos abiertos, salvo en que el intervalo de la clase de la mediana sea uno de ellos.

• - La mediana no es afectado por valores extremos.


• - No se usan todos los valores para calcular su valor.
• 1.7.3. Desventajas.
• - No se puede calcular la mediana para variables cualitativas con escala de medición nominal, salvo que sea ordinal.

• - No se pueden hacer operaciones algebraicas.


• - La mediana para valores
MEDIDAS DESCIPTIVAS
1.8. MODA: Mo
En toda distribución de datos estadísticos, salvo en raras excepciones existen datos,
categorías o intervalos en los que la incidencia es más acentuada; esto indica que hay
valores o categorías, si así se les quiere llamar, con mayor preferencia que los demás, en
otros casos no puede ser la preferencia, sino la regularidad de los datos por tomar un
determinado valor o categoría. En consecuencia, llamaremos moda o modo, al valor de la
distribución que se repite con mayor frecuencia; es decir, a la posición de mayor densidad
o al valor más común o predominante.
En un conjunto de datos, la moda puede no existir, por no existir ningún dato que se repita
más veces que los demás; por lo tanto, la distribución se llama uniforme. Si el conjunto
de datos tiene una sola moda, a la distribución se le llama unimodal. Si tiene dos o más
modas, la distribución toma el nombre de multimodal, pudiendo ser bimodal, trimodal,
etc.

1.8.1. Moda Para datos no agrupados.


En este caso la moda se obtiene sólo por conteo.

Ejemplo Nº 1.
Los siguientes datos corresponden al número de hijos de 6 personas: 2, 4, 3, 0, 1, 5.
Determine la moda.
Solución:
Como se puede apreciar en este conjunto de datos no existe ninguno que se repita más
veces que los demás, por lo tanto, en este conjunto no existe la moda.
MEDIDAS DESCIPTIVAS
• Ejemplo Nº 2.

• Los siguientes datos corresponden al número de faltas a clases en un determinado mes, de 7 alumnos: 2, 3,
2, 4, 5, 2, 1.

• Solución:

• En este conjunto existe un valor que se repite más veces que los demás y este valor es el dos, por lo tanto,
la moda es dos faltas, o la mayoría tiene dos faltas. La distribución es unimodal.

• Ejemplo Nº 3.

• Los siguientes datos corresponden al número de sanciones recibidas por dos grupos de 10 obreros durante
un año de trabajo:

• Grupo A: 4, 2, 1, 4, 2, 0, 2, 4, 1, 3.

• Grupo B: 3, 2, 4, 2, 3, 1, 0, 4, 5, 6.

• Solución:

• En el grupo A, hay dos valores que se repiten más veces que los demás, estos son el 2 y el 4, por lo tanto,
estos valores son las modas, la distribución es bimodal.

• En el grupo B existen tres valores que se repiten más veces que los demás, y estos valores son: 2, 3 y 4,
MEDIDAS DESCIPTIVAS
• 1.8.2. Moda Para datos agrupados.
• En este caso la moda se obtiene usando una fórmula, que resulta de la interpolación
de las frecuencias adyacentes a la frecuencia simple de mayor valor. La fórmula es el
siguiente:

• Donde:

• = Límite inferior de la clase modal.

• Ci = Amplitud de la clase modal.

• fi = Frecuencia absoluta simple de mayor valor, o

• hi = Frecuencia relativa simple de mayor valor.

• La clase modal es el intervalo de clase donde se encuentra la frecuencia simple de


mayor valor.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 1.
Obtenga la moda del siguiente cuadro de distribución de frecuencias.

Puntaje Xi fi
40 – 50 45 6
50 – 60 55 25
60 – 70 65 24
70 – 80 75 20
80 – 90 85 15
90 - 100 95 10
Total -- 100

Solución:
La clase modal es el segundo intervalo, por ser 25 la frecuencia absoluta simple de mayor
valor, la distribución tiene una sola moda.
(25 − 6) 19 190
𝑀𝑜 = 50 + 10 ൤ ൨= 50 + 10 ൤ ൨= 50 + = 59,5𝑝𝑡𝑠.
(25 − 6) + (25 − 24) 19 + 1 20
La mayoría de los empleados obtuvieron alrededor de 59,5 pts.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 2.
Obtenga la moda del siguiente cuadro, que corresponde al número de inasistencias de por
día, durante la semana que duró el curso.

Nº de
Días
Inasistencias
Lunes 2
Martes 0
Miércoles 6
Jueves 7
Viernes 5
Sábado 4
Total 24

Solución:
En este caso, estamos frente a una variable cualitativa, pero la moda se obtiene de acuerdo
a la mayor incidencia de los valores de la variable, por consiguiente, el día jueves es el
que presenta la mayor frecuencia, por lo tanto, la moda es el jueves.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 3.
Obtenga la moda del siguiente cuadro, que corresponde también al número de faltas de
un conjunto de obreros.

Nº de Nº de
faltas obreros
0 17
1 13
2 8
3 6
4 3
5 2
6 1
Total 50

Solución:
En este caso la variable es discreta y el tratamiento es similar a la de una variable
cualitativa, sólo se observa en que valor de la variable se presenta la mayor frecuencia
absoluta simple, en consecuencia la moda en este caso es cero faltas, es decir la mayoría
de los obreros no tiene faltas.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 4.
Obtenga la moda del siguiente cuadro de distribución de frecuencias, que corresponde a
los pesos en kg de 80 personas.
Nº de
Peso en Kg.
personas
55 – 60 5
60 – 65 15
65 – 70 20
70 – 75 20
75 – 80 15
80 – 85 5
Total 80
Solución: M(X) = 70 kg. y la Me = 70 kg
En este caso se observa que hay dos frecuencias absolutas que son los de mayor valor
(20), por consiguiente, se pensaría que estamos frente a una distribución bimodal, pero
no es así, pues hay una sola moda que es 70 kg.
Si usamos el tercer intervalo como la clase modal, la moda sería el siguiente:
 ( 20  15)   5 
Mo  65  5   65  5    65  5  70kg .
 ( 20  15)  ( 20  20)  5  0
Si usamos el cuarto intervalo como la clase modal, la moda sería el siguiente:
(20 − 20) 0
𝑀𝑜 = 70 + 5 ൤ ൨= 70 + 5 ൤ ൨= 70 + 0 = 70𝑘𝑔.
(20 − 20) + (20 − 15) 0+5
MEDIDAS DESCIPTIVAS
Ejemplo Nº 5.
Obtenga la moda del siguiente cuadro de distribución de frecuencias, que corresponde a
los cocientes de inteligencia de 160 alumnos.

Cociente de Nº de
inteligencia alumnos
65 – 70 10
70 – 75 15
75 – 80 20
80 – 85 30
85 – 90 25
90 - 95 20
95 - 100 30
100- 105 10
Total 160

Solución:
En esta distribución se nota que existen dos frecuencias absolutas simples separadas que
más veces se repiten (30), por consiguiente, hay dos modas y son los siguientes:
(30 − 20) 10 50
𝑀𝑜 = 80 + 5 ൤ ൨= 80 + 5 ൤ ൨= 80 + = 83,33𝑝𝑡𝑠.
(30 − 20) + (30 − 25) 10 + 5 15
(30 − 20) 10 50
𝑀𝑜 = 95 + 5 ൤ ൨= 95 + 5 ൤ ൨= 95 + = 96,67𝑝𝑡𝑠.
(30 − 20) + (30 − 10) 10 + 20 30
La distribución es bimodal.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 6
Obtenga las modas, si el cuadro anterior tuviera la siguiente configuración.

Cociente de Nº de
inteligencia alumnos
65 – 70 30
70 – 75 15
75 – 80 20
80 – 85 10
85 – 90 25
90 - 95 20
95 - 100 10
100- 105 30
Total 160

Solución: M(X) = 84.84 pts. y la Me = 86 pts.


En esta distribución las frecuencias de mayor valor se encuentran en los extremos, por
consiguiente, también tendremos dos modas diferentes, que son los siguientes:
 (30  00)   30  150
Mo  65  5   65  5   65   68,33 pts.
 (30  00)  (30  15)   30  15  45

 (30  10)   20  100


Mo  100  5   100  5   100   102 pts.
 (30  10)  (30  00)   20  30  50
MEDIDAS DESCIPTIVAS: EJEMPLO 7
Una pequeña distribución simétrica de frecuencias presenta los siguientes datos, donde la
variable son las notas de un conjunto de alumnos.
3 3 3

f
i 1
i  5; X
i 1
i
fi
 233280;  X i f i  60; f1  1 ,
i 1

a) Construya el cuadro de distribución de frecuencias.


b) Obtenga la media, mediana y la moda.

• Solución
• f1 + f2 + f3 = 5, f1 = 1, f2 + f3 = 4, → f2 = 3 y f3 = 1, asimismo X2 = 12, pues = 60/5 = 12
• X1 +[Notas)
X f Xf F
12x3 + X3 = 60 → X1 + X3 = 24, (X1)(123)(X3) = 233280 → (X1)(X3) = 135 → (135/X3) +
i i 1 i i

7.5 – 10.5 9 1 9 1
X3 = 24
10.5 – 13.5 12 3 36 4
• - 24X
13.53 –+16.5 0 →1X315
135 = 15 = 15 5y X1 = 9; Me = 10.5 + 3[2.5 – 1]/3 = 12; Mo = 10.5 +
3[2/(2+2)]
Total = 12 5 60
MEDIDAS DESCIPTIVAS
• Problemas propuesto.
• 1. Si la suma de los cubos de 3 notas es igual a 6156, la mediana es igual a 11, el promedio aritmético
igual a 12, obtenga el valor de las notas y obtenga la moda, la media armónica y la media geométrica de
dichas notas.

• 2. La fábrica A produce n artículos, la fábrica B produce el doble de A y la fábrica C produce el 20% más
que B. si los costos unitarios son 108, 135 y 162 soles respectivamente, calcular el precio promedio
unitario de venta decuadro
El siguiente todos los artículos,
muestra si a cada precio
la distribución unitario
de las notassede
le un
agrega un 30%
conjunto decomo parte de las
estudiantes,
cuyo promedio aritmético es de 8,9. Con los cuales obtenga la mediana y la moda
utilidades de las notas.

• 3. %º de
Notas
alumnos
0,5 – 2,5 4
2,5 – 4,5 8
4,5 – 6,5
6,5 – 8,5 16
8,5 – 10,5
10,5 – 12,5 30
12,5 – 14,5 10
Total 100
PRÁCTICA DIRIGIDA

• Determine la falsedad o veracidad de las siguientes afirmaciones:


• a) La mediana es la mitad del número de datos.
• b) La moda es la frecuencia más alta.
c) Si se multiplican por 3 a cada una de las frecuencias, entonces la media aritmética
queda multiplica por 3.
d) Si en un cuadro de distribución de frecuencias, se multiplica por dos a cada una de las
marcas de clase, la media aritmética queda multiplicada por dos.
e) Cuando se trabaja con datos agrupados, se calcula una media aritmética aproximada, por
cuanto se supone que cada dato tiene el valor de una marca de clase.
f) Cuanto mayor es el número de los intervalos de clase usado en el cuadro de distribución de
frecuencias, menor es la representatividad de la media aritmética.
g) Si una distribución es simétrica, siempre serán iguales la media aritmética y la mediana,
¿se dirá lo mismo con la moda?
• h) La mediana de un conjunto de 20 datos es igual al valor del dato número 10.
MEDIDAS DESCIPTIVAS
1.8.3. Ventajas.
- La moda se puede usar como un punto de localización tanto para datos cualitativos
como cuantitativos.
- La moda no es afectado por valores extremos.
- La moda puede calcularse aún cuando uno o los dos intervalos de los extremos sean
abiertos.
1.8.4. Desventajas.
- La moda puede no existir y si existe puede haber dos o más modas, por lo que su
interpretación no es sencilla.
- La moda no se presta a manipulaciones algebraicas.

1.9. FRACTILES
Son estadígrafos de posición, se les conoce también como cuantiles. Son medidas que
dividen a la distribución en tantas partes como se requiera para la descripción de los
mismos. Entre ellos los más conocidos son: los Cuartiles, los Deciles y los Percentiles o
Centiles.

1.9.1. CUARTILES: QJ
Son los que dividen a la distribución en cuatro partes iguales, de tal manera que, cada
parte contiene un 25% de los datos debidamente ordenados en forma ascendente.
a) Primer Cuartil: Q1 Es el valor que supera a no más de un cuarto de las
observaciones y es superado por no más de las tres cuartas partes de ellas; es decir,
es el valor que separa el 25% de las observaciones menores o iguales a él y al 75% de
las observaciones superiores a él.
b) Segundo Cuartil: Q2 = Me Es lo mismo que la mediana.
MEDIDAS DESCIPTIVAS

c) Tercer Cuartil: Q3 Es el valor que supera a no más de las tres cuartas partes de las
observaciones y es superado por no más de una cuarta parte de ellas; es decir es el
valor que separa al 75% de las observaciones menores que él y al 25% de las
observaciones mayores que él.
d) Cuarto Cuartil Q4 = LS Abarca el 100% de los datos.
Q1 Me Q3 Q4
LI¡----------------¡---------------------¡-------------------¡-------------------¡LS
25% 25% 25% 25%
Q1 para datos no agrupados.
Cuando los datos no están en un cuadro de distribución de frecuencias, en primer lugar
se ordenan los datos en forma ascendente, luego se obtiene (n+1)/4 que es el punto de
posición donde debe estar ubicado Q1. Si este valor es entero, entonces el Q1 es el valor
del dato que se encuentra en ese lugar. Si el valor de (n+1)/4 no es un entero, entonces
hacemos una interpolación lineal entre los dos valores correspondientes a las dos
observaciones entre las cuales se encuentra la fracción.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 1.
Al examinar una muestra de 11 facturas de una empresa, se nota que se ha pagado montos
diferentes en miles de soles para un solo bien a diferentes proveedores, los mismos son
los siguientes: 8, 5, 6, 7, 9, 12, 15, 7, 13, 14, 12. Determine Q 1

Solución:
Se ordenan los datos.
5, 6, 7, 7, 8, 9, 12, 12, 13, 14, 15
Como n = 11, entonces (n+1)/4 = (11+1)/4 = 3, en consecuencia Q 1 es el tercer valor; es
decir, 7.

Ejemplo Nº 2.
Si los siguientes valores son salarios por día de 12 trabajadores seleccionados de una
empresa: 30, 29, 32, 23, 25, 27, 35, 32, 28, 31, 33, 35. Determine Q1.

Solución:
Se ordenan los datos.
23, 25, 27, 28, 29, 30, 31, 32, 32, 33, 35, 35
Como n=12, entonces (n+1)/4 = (12+1)/4 = 3,25. Esto significa que el Q1 es el tercer dato
más el 25% de la diferencia entre los valores de las observaciones tercero y cuarto, luego:
Q1 = 27 + (28 – 27)(0,25) = 27 + 0,25 = 27,25 soles.
MEDIDAS DESCIPTIVAS
• Q3 para datos no agrupados.

• Cuando los datos no están en un cuadro de distribución de frecuencias, en primer lugar se ordenan los
datos en forma ascendente, luego se obtiene 3(n+1)/4 que es el punto de posición donde debe estar
ubicado Q3. Si este valor es entero, entonces el Q 3 es el valor del dato que se encuentra en esa posición. Si
el valor de 3(n+1)/4 no es un entero, entonces hacemos una interpolación lineal entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentra la fracción.


• Ejemplo Nº 1.

• Use los dos ejemplos anteriores para determinar Q 3

• a) 5, 6, 7, 7, 8, 9, 12, 12, 13, 14, 15

• Como n = 11, entonces 3(n+1)/4 = 3(11+1)/4 = 9, en consecuencia Q 3 es el noveno valor; es decir,


13.

• b) 23, 25, 27, 28, 29, 30, 31, 32, 32, 33, 35, 35

• Como n=12, entonces 3(n+1)/4 = 3(12+1)/4 = 9,75. Esto significa que el Q 3 es el noveno dato más
el 75% de la diferencia entre los valores de las observaciones noveno y décimo luego: Q3 = 32 +
MEDIDAS DESCIPTIVAS
Cuartiles para datos agrupados.
En este caso se usará la siguiente fórmula:
𝑗𝑛
−𝐹𝑖 −1
𝑄𝑗 = 𝑌𝑖'−1 + 𝐶𝑖 ቈ 4
቉Cuando se usa las frecuencias absolutas.
𝑓𝑖
𝑗
−𝐻 𝑖 −1
𝑄𝑗 = 𝑌𝑖'−1 + 𝐶𝑖 ቈ 4
቉Cuando se usa las frecuencias relativas.
ℎ𝑖

 j = 1, 2, 3, 4

Ejemplo Nº 1.
Obtenga los cuartiles del siguiente cuadro de distribución de frecuencias e interprételo.

Puntaje Empleados Fi
40 – 50 6 6
50 – 60 25 31
60 – 70 24 55
70 – 80 20 75
80 – 90 15 90
90 - 100 10 100
Total 100 --

El cálculo de los valores de los cuartiles es similar a la mediana.


Para el primer cuartil se obtiene n/4 = 100/4 = 25 y el primer intervalo que contiene a 25
es el intervalo del cuartil uno, en este caso es el segundo intervalo.
MEDIDAS DESCIPTIVAS

Para el segundo cuartil se obtiene n/2, similar al de la mediana. n/2 = 50 y el primer


intervalo que contiene a 50 es el tercer intervalo.

Para el tercer cuartil se obtiene 3n/4 = 300/4 = 75 y el primer intervalo que contiene a 75
es el intervalo del tercer cuartil, en este caso es el cuarto intervalo.

Q4 = 100 pts.
Como quiera que hay en total 100 empleados, cada rango intercuartil contiene 25
empleados. Esto indica que el puntaje mínimo del 25% de los empleados con más bajo
puntaje es igual a 40 pts. y el puntaje máximo es igual a 57,6 pts., de igual manera el
puntaje mínimo del 25% de los empleados con mayor puntaje es igual a 80 pts. y su
puntaje máximo es igual a 100 pts. Hay un 50 % de empleados que tienen como puntaje
mínimo 57,6 pts. y como máximo a 80 pts.
MEDIDAS DESCIPTIVAS
• Ejemplo 2.
La siguiente información corresponde al tiempo en horas en que permanecieron
almacenados, un grupo de artículos antes de ser comercializados. Y5'  90 hrs. , H6 = 1,0;
H5 = 0,9; H2 = 0,3; h3 = 0,3; h2 = 0,2; X  68 hrs. ; Me  ( 200 / 3) hrs. Calcule la la moda
y el cuartil tres.
Solución:
H1 = h1= H2 – h2 = 0,3 – 0,2 = 0,1
H6 – H5 = 1,0 – 0,9 = 0,1 = h6
0,1 + 0,2 + 0,3 + h4 + h5 + 0,1 = 1,0  h4 + h5 = 0,3
 0,5  0,3 
Me = 200/3 = (90 – 3C) + C 
0,3   200/3 – 90 = - 3C + (2/3)C -70/3 = -(7/3)C
 
 C = 10
M(X) = 68 = 45(0,1) + 55(0,2) + 65(0,3) + 75h4 + 85 h5 + 95(0,1)
68 = 44,5 + 75h4 + 85 h5
23,5 = 75h4 + 85 h5
4,7 = 15h4 + 17 h5
0,3 = h4 + h5
De las dos ecuaciones anteriores se despeja que h4 = 0,2; h5 = 0,1; el cuadro de
distribución es como sigue:
Horas Xi hi Hi Xihi
40 - 50 45 0,1 0,1 4,5
50 - 60 55 0,2 0,3 11,0
60 - 70 65 0,3 0,6 19,5
70 - 80 75 0,2 0,8 15,0
80 – 90 85 0,1 0,9 8,5
90 - 100 95 0,1 1,0 9,5
Total 1,0 68,0

 0,1 
Mo  60  10    65 hrs. Q1 = 57.5 hrs., Me = Q2 = 66.67 hrs.
 0,1  0,1 
 0,75  0,60 
Q3  70  10    77,5 hrs.
 0, 2 
MEDIDAS DESCIPTIVAS
DECILES: DJ
Son las medidas que dividen a la distribución en 10 partes iguales, de tal manera que
cada parte contiene el 10% de las observaciones o datos.
El cálculo de los deciles para datos no agrupados, es similar a la de los cuartiles; es decir,
en primer lugar, se ordenan los datos en forma ascendente, pero son muy poco usados,
por lo que no se ahondará como en el caso de los cuartiles. En cambio, para el cálculo de
los deciles cuando los datos están agrupados se usa la siguiente fórmula.
𝑗𝑛
' −𝐹𝑖−1
10
𝐷𝑗 = 𝑌𝑖−1 + 𝐶𝑖 ቈ ቉Cuando se usan las frecuencias absolutas.
𝑓𝑖
𝑗
' −𝐻𝑖−1
10
𝐷𝑗 = 𝑌𝑖−1 + 𝐶𝑖 ቈ ቉Cuando se usan las frecuencias relativas.
ℎ𝑖
MEDIDAS DESCIPTIVAS
Ejemplo Nº 1.
Obtenga los deciles uno y ocho del siguiente cuadro de distribución de frecuencias.

Puntaje Empleados Fi
40 – 50 6 6
50 – 60 25 31
60 – 70 24 55
70 – 80 20 75
80 – 90 15 90
90 - 100 10 100
Total 100 --

Solución:

El 10% de los empleados con más bajo puntaje tienen como puntaje máximo a 51,6 pts.
El 20% de los empleados con mayor puntaje tienen como puntaje mínimo a 83,33 pts.
MEDIDAS DESCIPTIVAS
PERCENTILES: PJ
Se les llama también centiles. Son las medidas que dividen a la distribución en 100
partes iguales, de tal manera que cada parte contiene el uno por ciento de los datos. Estas
medidas incluyen a los cuartiles y a los deciles, e incluso a los quintiles. Los percentiles
para datos no agrupados son calculados de igual manera que para los cuartiles, pero como
no son muy usados no se les analizará por ahora. En cambio para datos agrupados, los
valores se calculan usando la siguiente fórmula, que es similar a los ya usados para la
mediana, los cuartiles y los deciles.
Pj indica que el j% de los datos están incluidos hasta este punto; en otras palabras Pj es el
valor máximo del j% de los datos.

𝑗𝑛
−𝐹𝑖−1
𝑃𝑗 = 𝑌𝑖'−1 + 𝐶𝑖 ቈ 100
቉Cuando se usa las frecuencias absolutas.
𝑓𝑖
𝑗
−𝐻 𝑖−1
𝑃𝑗 = 𝑌𝑖'−1 + 𝐶𝑖 ቈ 100
቉Cuando se usa las frecuencias relativas.
ℎ𝑖

P00 = LI
P10 = D1 P60 = D6
P20 = D2 P70 = D7
P25 = Q1 P75 = Q3
P30 = D3 P80 = D8
P40 = D4 P90 = D9
P50 = D5 = Q2 = Me P100 = D10 = Q4 = LS
MEDIDAS DESCIPTIVAS
Ejemplo Nº 1.
Obtener el percentil 5 y el 95 del siguiente cuadro de distribución de frecuencias.

Puntaje Empleados Fi
40 – 50 6 6
50 – 60 25 31
60 – 70 24 55
70 – 80 20 75
80 – 90 15 90
90 - 100 10 100
Total 100 --
Solución:

El puntaje máximo del 5% de los empleados con más bajo rendimiento es de 48,33 pts. y
el puntaje mínimo del 5% de los empleados con mayor rendimiento es de 95 pts.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 4.
El siguiente cuadro muestra los gastos efectuados por 80 empresas, en remodelar sus
oficinas, los datos están dados en miles de soles. Obtenga:
a) Los cuartiles e interprételos.
b) La media, mediana y la moda.
Gasto (m. de s.) Nº de Empresas Xi Fi Xifi
0,5 – 1,5 10 1,0 10 10,0
1,5 – 2,5 15 2,0 25 30,0
2,5 – 5,5 20 4,0 45 80,0
5,5 – 10,5 15 8,0 60 120,0
10,5 – 19,5 10 15,0 70 150,0
19,5 – 30,5 6 25,0 76 150,0
30,5 – 39,5 4 35,0 80 140,0
Total 80 680,0

a)

El 25% de las empresas han gastado menos de mil ochocientos treinta soles, pero mas
de quinientos soles, en la refacción de sus oficinas. Hay otros 25% de empresas que han
gastado por lo menos diez mil quinientos soles en dicha refacción, pero menos de treinta
y nueve mil quinientos soles, y hay un 50% de empresas que han gastado de mil
ochocientos treinta soles y diez mil quinientos soles.

b)

Me = 4,75 mil soles


MEDIDAS DESCIPTIVAS: EJEMPLO 5
De una distribución simétrica e unimodal con 8 intervalos, correspondiente a los salarios
diarios de 200 obreros de una empresa se sabe que: Mo = 26 soles, Q 1 = 22 soles, C = 4
soles, f1 = 10 obreros, F6 = 175 obreros. Determine:
a) El salario mínimo del 30% de los obreros que mayor salario tienen.
b) Se sabe que los que ganan de 30 a más soles diarios son los mejor pagados, ¿qué
porcentaje de obreros pertenecen a este grupo?
c) El ingreso modal, el ingreso mediano y el ingreso promedio.

Solución:
f1 = f8 = 10, f2 = f7, f3 = f6, f4 = f5
F7 = 200 – 10 = 190
F7 = 190 = F6 + f7 = 175 + f7  f7 = 190 – 175 = 15 = f2, F2 = 25
f1 + f2 + f3 + f4 = 100 f3 + f4 = 100 – 25 = 75
Por otro lado, se tiene que Mo = 26, es unimodal y de distribución simétrica entonces
Y4'  26

 50  25 
Además Q1  22  18  4    f 3  25, f 4  50
 f3 
MEDIDAS DESCIPTIVAS

Salario (soles) Xi Obreros Fi Xifi


10 – 14 12 10 10 120
14 – 18 16 15 25 240
18 – 22 20 25 50 500
22 – 26 24 50 100 1200
26 – 30 28 50 150 1400
30 – 34 32 25 175 800
34 – 38 36 15 190 540
38 – 42 40 10 200 400
Total 200 5200

140  100 
a) P70  26  4    29,2 soles
 50 
b) Hay 25 + 15 + 10 = 50 obreros con este salario, por lo tanto hay (50/200)100 = 25%
de obreros.
5200
c) X   26 soles de ingreso promedio.
200
100  50 
Me  22  4    26 soles de ingreso mediano.
 50 
 25 
Mo  22  4    26 soles de ingreso modal.
 25  00 
Las tres son iguales por ser la distribución simétrica y unimodal.
MEDIDAS DESCIPTIVAS: EJEMPLO 6
Se tiene la distribución de las edades de un grupo de alumnos, el cual tiene 5 intervalos
de clase con amplitud constante y de ella se conoce también: h1 = 0,1; h2 = 0,1; H3 = 0,4;
h4 = 0,4; Mo = 30 años; Me = 28,75 años. Determine el cuartil uno y el cuartil tres.
Solución:
h3 = H3 – h2 – h1 = 0,4 -0,1 -0,1 = 0,2; H4 = 0,1 + 0,1 + 0,2 + 0,4 = 0,8
h5 = 1 – H4 = 1,0 – 0,8 = 0,2
 0,2  C
Mo = Y3'  C    30  Y3'   Y3'  30  C / 2
 0,2  0,2  2

 0,5  0,4 
Me  Y3'  C    28,75  Y3'  C / 4  Y3'  28,75  C / 4
 0,4 
De las dos ecuaciones anteriores se obtiene C = 5, entonces la distribución es como sigue:
Años Xi hi Hi
12,5 – 17,5 15 0,1 0,1
17,5 – 22,5 20 0,1 0,2
22,5 – 27,5 25 0,2 0,4
27,5 – 32,5 30 0,4 0,8
32,5 – 37,5 35 0,2 1,0
Total 1,0

 0,25  0,20 
Q1  22,5  5   23,75 años
 0, 20 
 0,75  0,40 
Q3  27,5  5   31,875 años
 0,40 
MEDIDAS DESCIPTIVAS: EJEMPLO 7
• El siguiente cuadro corresponde a la distribución de un grupo de docentes según
su cociente de inteligencia. a) obtenga la media, mediana y la moda. b) Obtenga
los[ cuartiles
IQ ) N°
e de [ IQ
interprételo. c) )
Obtenga Xi IQ mínimo
el fi yFi máximo
Xifi del 35% de los
Docentes
docentes con mayor IQ. 70 - 75 72.5 4 4 290
70 - 75 4
75 - 80 77.5 6 10 465
• 75 - 80 6
80 - 85 82.5 10 20 825
80 - 85 10
85 - 90 87.5 12 32 1050
85 - 90 12
90 - 95 92.5 16 48 1480
90 - 95 16
95 - 100 20 95 - 100 97.5 20 68 1950

100 - 105 8 100 - 105 102.5 8 76 820

105 - 110 4 105 - 110 107.5 4 80 430


80 Total -- 80 -- 7310
MEDIDAS DESCIPTIVAS: EJEMPLO 7
• Respuesta.
• a) = 7310/80 = 91.375 pts.; Me = 90 + 5[40-32]/16 = 92.5 pts.; Mo = 95 + 5[4/(4+12)] = 96.25 pts.
• < Me < Mo
b) Q1 = 80 + 5[20-10]/10 = 85 pts.; Q2 = Me = 92.5; Q3 = 95 + 5[60-48]/20 = 98 pts.; Q4 = LS = 110 pts.
Hay 20 (25%) docentes que tienen un IQ mínimo de 70 pts. y un IQ máximo de 85 pts.
Hay otros 20 (25%) docentes que tienen un IQ mínimo de 85 pts. Y máximo de 92.5 pts.
Hay otros 20 (25%) docentes con un IQ mínimo de 92.5 pts. Y máximo de 98 pts.
Hay también 20 (25%) docentes con un IQ mínimo de 98 Pts. y máximo de 110 pts. Estos docente son los que tienen
un IQ superior a los demás.
c) P65 = 95 + 5[52-48]/20 = 96 pts.
para este grupo el IQ mínimo de 96pts. Y el IQ máximo es de 110 pts.
Hay un 65% de docentes que tienen un IQ menor que 96 pts.
Por otro lado,
P35 = 85 + 5[28-20]/12 = 88.33 pts. Indica que:
Hay un 35% de docentes con los menores IQ y que tienen un IQ mínimo de 70 pts y máximo de 88.33 pts.
Hay también un 65% de docentes con un IQ superiores a los 88.33 pts.
El 15% de los docentes tienen un IQ superior o igual a los 100 pts.
MEDIDAS DESCIPTIVAS: EJEMPLO 8

• El siguiente cuadro corresponde a la distribución de un grupo de docentes según


su cociente de inteligencia. a) obtenga la media, mediana y la moda. b) Obtenga
[los
IQ cuartiles
) % dee interprételo.[ IQ
c) Obtenga
) el
Xi IQ mínimo
hi y máximo
Hi del 35%
Xihi de los
Docentes
docentes con mayor IQ 70 - 75 72.5 0.05 0.05 3.625
70 - 75 5.0
75 - 80 77.5 0.075 0.125 5.8125
• 75 - 80 7.5
•[ IQ 80 - 85 82.5 0.125 0.25 10.3125
80 -)85 12.5
•% Docentes
85 - 90 15.0
85 - 90 87.5 0.15 0.40 13.125
90 - 95 92.5 0.20 0.60 18.5
90 - 95 20.0
95 - 100 25.0 95 - 100 97.5 0.25 0.85 24.375
100 - 105 10.0 100 - 105 102.5 0.10 0.95 10.25
105 - 110 5.0 105 - 110 107.5 0.05 1.0 5.375
100.0 1.00 91.375
MEDIDAS DESCIPTIVAS: EJEMPLO 8
• a) = = 91.375 pts.; Me = 90 + 5[0.5 – 0.4]/(0.2) = 92.5 pts.;
• Mo = 95+5[ 0.05/(0.05+0.15)] = 96.25 pts. → < Me < Mo
• b) Q1 = 80 + 5[0.25-0.125]/0.125 = 85 pts.; Q2 = Me = 92.5;
• Q3 = 95 + 5[0.75-0.60]/0.25 = 98 pts.; Q4 = LS = 110 pts.

• G.1. Im = 70 pts. e IM = 85 pts. Cuarto inferior


• G.2. Im = 85 pts. e IM = 92.5 pts.
• G.3. Im = 92.5 pts. e IM = 98 pts.
• G.4. Im = 98 pts. e IM = 110 pts. cuarto superior.
c) P65 = 95 + 5[0.65-0.60]/0.25 = 96 pts.
para este grupo el IQ mínimo de 96pts. Y el IQ máximo es de 110 pts.
Hay un 65% de docentes que tienen un IQ menor que 96 pts.
Por otro lado,
P35 = 85 + 5[0.35-0.25]/0.15 = 88.33 pts. Indica que:
Hay un 35% de docentes con los menores IQ y que tienen un IQ mínimo de 70 pts. y máximo de 88.33 pts.
MEDIDAS DE DISPERSIÓN
• Ninguna de las medidas de tendencia central o localización es suficiente, por
si sola, para describir a la distribución de un conjunto de datos; pues, a pesar de que
dos conjuntos de datos puedan tener la misma media; sin embargo, esto no implica
que sean idénticos, ya que sus datos pueden ser homogéneos o heterogéneos.
• Las medidas de tendencia central tienen como objetivo el de sintetizar los datos en un
valor representativo, alrededor del cual se concentran o centralizan los datos; sin
embargo, los datos no necesariamente se agrupan o concentran alrededor de este
punto, sino que pueden dispersarse de este punto, en algunos casos más que en
otros, a las medidas que indican este grado de concentración o dispersión se les
llamará medidas de dispersión. Estas medidas de dispersión nos dirán hasta qué
punto estas medidas de tendencia central son representativas como síntesis de la
información. Las medidas de dispersión cuantifican la separación, la dispersión, la
variabilidad de los valores de la distribución respecto al valor central determinado.
• Al igual que sucede con cualquier conjunto de datos, las medidas de tendencia
central sólo nos revelan una parte de la información que necesitamos acerca de las
características de los datos. Para aumentar nuestro entendimiento del patrón de los
MEDIDAS DE DISPERSIÓN
• Conocer la dispersión es importante porque:
• - Nos proporciona información adicional que permite juzgar la confiabilidad de la medida de
tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos
representativa de los datos.
• - Cuando la dispersión es grande es necesario escoger una muestra de tamaño mayor a que si
la dispersión fuera pequeña.
• - Cuando existen problemas característicos para datos ampliamente dispersos, debemos ser
capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.
• - Cuando se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una
amplia dispersión de valores con respecto al centro de distribución y si este presenta riesgos
inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan
las dispersiones más grandes.
• Pero debemos tener presente que de todas maneras hay dispersión en la mayoría de los datos, por lo
que debemos estar en capacidad de describirla. Ya que la dispersión ocurre frecuentemente y su
grado de variabilidad es importante conocerlo.
• Los datos pueden tener la misma magnitud; es decir, pueden ser constantes o no tener variabilidad,
pueden variar moderadamente e incluso pueden ser muy dispersos unos de otros o respecto a un
valor central, y de acuerdo a ese grado de variabilidad una medida de tendencia central o posición
MEDIDAS DE DISPERSIÓN
• 2.1. Tipos de medidas de Dispersión.
• Hay dos tipos de medidas de dispersión. A saber:

• 2.1.1. Absolutas.
• Son las que vienen expresadas en las mismas unidades de medida de la variable en estudio, por lo tanto, son
afectados por estas unidades y los valores extremos; dentro de ellas tenemos:

• - Rango de Variación: R.
• - Desviación Media: DM(X)
• - Recorrido Intercuartílico: RIQ(X)
• - Varianza: V(X)
• - Desviación Estándar o Típica: Sx
• 2.1.2. Relativas.
• Son las que vienen expresadas en términos porcentuales. Por lo tanto, no son distorsionados por las unidades de
medida.
MEDIDAS DE DISPERSIÓN
• 2.2. Rango: R

• Cuando se trata de averiguar el grado de variabilidad o dispersión de los datos en


estudio, lo primero que se piensa es en el campo de variación o dominio de los
mismos, esta amplitud o rango de variación es la diferencia del dato de mayor valor y
el dato de menor valor, se le representa por R, es la medida de variabilidad más fácil
de calcular para datos finitos y sin agrupar, el valor se obtiene de la siguiente forma:

• R = Xmáx.- Xmín
• Cuando los datos están agrupados, el rango se obtiene restando el límite superior
del último intervalo de clase menos el límite inferior del primer intervalo de clase; es
decir:

• R = LS – LI
• Cuando el último intervalo de clase no tiene límite superior o cuando el primer
intervalo de clase no tiene límite inferior, entonces es casi imposible obtener el rango.

• Por otro lado, se debe tener en cuenta las siguientes propiedades:


MEDIDAS DE DISPERSIÓN
• 2.2.1. Propiedades del Rango o Recorrido:
• - El recorrido es la medida de dispersión más sencilla de calcular e interpretar puesto
que simplemente es la distancia entre los valores extremos (máximo y mínimo) en una
distribución.
• - Puesto que el recorrido se basa en los valores extremos, éste tiende a ser errático.
No es extraño que en una distribución de datos económicos o comerciales se incluya a
unos pocos valores en los extremos pequeños o grandes. Cuando tal cosa sucede,
entonces el recorrido solamente mide la dispersión con respecto a esos valores
anormales, ignorando a los demás valores de la variable.
• - La principal desventaja del recorrido es que está influenciado por los valores
extremos, puesto que no cuenta con los demás valores de la variable. Por tal razón,
siempre existe el peligro de que el recorrido ofrezca una descripción
distorsionada de la dispersión.
• - En el control de la calidad se hace un uso extenso del recorrido cuando la distribución
a utilizarse no la distorsiona y cuando el ahorro del tiempo al hacer los cálculos
es un factor de importancia.
MEDIDAS DE DISPERSIÓN

• Ejemplo Nº 1:
• Los siguientes son las notas en matemática y estadística de 8 alumnos:
• Matemática: 08, 15, 07, 10, 12, 14, 05, 09
• Estadística: 18, 09, 10, 12, 13, 06, 04, 08
• Obtenga el promedio y el rango de variación de las notas, para los dos cursos.
• Solución:
• Curso Promedio Rango
• Matemática 10 15 – 05 = 10
• Estadística 10 18 – 04 = 14

• Se nota que, aunque en promedio las notas son iguales; sin embargo, la dispersión de las
notas no son iguales. Las notas de estadística son más variables que las notas de matemática.
• El rango, si bien brinda una primera idea acerca de la homogeneidad de los datos, tiene el
inconveniente de que es distorsionado por lo valores extremos, a veces único; en estos casos
el recorrido indica una variación exagerada, para corregir este inconveniente se usa el rango
intercuartílico, que viene a ser la diferencia entre el tercer cuartil y el primer cuartil: RIQ = Q3 –

Q1; o el recorrido interdecílico: RID = D9 – D1. En estas medidas no se usan los datos extremos.
MEDIDAS DE DISPERSIÓN
2.3. DESVIACIÓN MEDIA: DM(X)
Por los inconvenientes mencionados al describir el rango, se ha pensado en un promedio
de desviaciones de los datos respecto a un punto central, pero si se usa el promedio
aritmético como punto central, este promedio de desviaciones es igual a cero,
por una de las propiedades de la media aritmética. Por lo que se le ha reemplazado por
las desviaciones absolutas , en consecuencia, la desviación media es el promedio
de las desviaciones absolutas de cada uno de los datos respecto a su media aritmética. El
valor se obtiene usando las siguientes fórmulas.

………… Para datos no agrupados.

………. Para datos agrupados.

Ejemplo Nº 1.
Obtenga las desviaciones medias de las notas dadas en el ejemplo anterior.
Solución:
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 1.
Obtenga las desviaciones medias de las notas dadas en el ejemplo anterior.
Solución:
Matemática: Estadística:
Xi Xi  X Yi Yi  Y
8 2 18 8
15 5 09 1
07 3 10 0
10 0 12 2
12 2 13 3
14 4 06 4
05 5 04 6
09 1 08 2
Total: 80 22 80 26

M(X) = 80/8 = 10; M(Y) = 80/8 = 10


22 26
DM ( X )   2,75 DM (Y )   3,25
8 8
Se aprecia que las notas de estadística son más variables que las de matemática, aún
cuando este resultado ya se había mencionado en el caso de los rangos.
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 2.
Obtenga el rango y la desviación media para los datos del siguiente cuadro de distribución
de frecuencias, que corresponde a los ingresos en miles de soles de 80 obreros.
Miles de soles Nº de obreros
0,5 – 0,7 6
0,7 – 0,9 12
0,9 – 1,1 14
1,1 – 1,3 20
1,3 – 1,5 16
1,5 – 1,7 8
1,7 - 1,9 4
Total 80
Solución:
Miles de Xi  X X i  X fi
Xi fi
soles
0,5 – 0,7 0,6 6 0,57 3,42
0,7 – 0,9 0,8 12 0,37 4,44
0,9 – 1,1 1,0 14 0,17 2,38
1,1 – 1,3 1,2 20 0,03 0,60
1,3 – 1,5 1,4 16 0,23 3,68
1,5 – 1,7 1,6 8 0,43 3,44
1,7 - 1,9 1,8 4 0,63 2,52
Total 80 20,48
M(X) = 93.6/80 = 1.17 miles de soles
R = 1,9 – 0,5 = 1,4 mil soles o 1400 soles
20,48
DM ( X )   0,256 miles de soles = 256 soles
80
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 3.
Obtenga el rango y la desviación media de los datos del siguiente cuadro de distribución
de frecuencias, que son los ingresos en miles de soles de 60 familias.

Miles de soles Nº de familias


0,5 – 1,0 10
1,0 – 1,5 18
1,5 – 2,0 14
2,0 – 2,5 8
2,5 – 3,0 5
3,0 – 3,5 3
3,5 – 4,0 2
Total 60
Solución:
Miles de Xi  X X i  X fi
Xi fi
soles
0,5 – 1,0 0,75 10 0,975 9,75
1,0 – 1,5 1,25 18 0,475 8,55
1,5 – 2,0 1,75 14 0,025 0,35
2,0 – 2,5 2,25 8 0,525 4,20
2,5 – 3,0 2,75 5 1,025 5,125
3,0 – 3,5 3,25 3 1,525 4,575
3,5 – 4,0 3,75 2 2,025 4,05
Total 60 36,60

R = 4,0 – 0,5 = 3,5 mil soles; M(X) = 103.5/60 = 1.725 mil soles
36,6
DM ( X )   0,61 mil soles  610 soles
60
MEDIDAS DE DISPERSIÓN
• Ejemplo 4
MEDIDAS DE DISPERSIÓN
• Solución
• G.1. [miles de
soles) Xi fi Fi Xi fi fi
• Q1 = 48 + 4[10 -8]/8 = 49 m.s.
• Im = 40 mil soles 40 - 44 42 3 3 126 34.5
• IM = 49 mil soles 44 - 48 46 5 8 230 37.5
• G.2. 48 - 52 50 8 16 400 28.0
• Q2 = Me = 52 + 4[20-16]/10 = 52 - 56 54 10 26 540 5.0
• 53.6 miles de soles
56 - 60 58 8 34 464 36.0
• Im = 49 mil soles 60 - 64 62 4 38 248 34.0
• IM = 53.6 miles de soles
64 - 68 66 2 40 132 25.0
• G.3
Total 40 2140 200.0
• Q3 = 56 + 4[30 - 26]/8 = 58
• mil soles
• Im = 53.6 mil soles
• IM = 58 mil soles
• G.4.
• Im = 58 mil soles
• IM = 68 mil soles
• = 2140/40 = 53.5 miles de soles, Me = 53.6 miles de soles. , Mo = 52 + 4[2/(2+2)] = 54 Mil de soles
MEDIDAS DE DISPERSIÓN
2.4. VARIANZA: V(X)
En vista de que la desviación media no tiene en cuenta los signos de las desviaciones
y que el simple promedio de las desviaciones es igual cero, se ha ideado otra medida, que
es el promedio del cuadrado de las desviaciones de los datos respecto a la media
aritmética, que es mucho más manuable que las desviaciones absolutas. Esta medida es
muy usada en la Estadística Inferencial como el análisis de varianza, por las propiedades
que posee. Su valor se obtiene usando las siguientes fórmulas:

………………….Varianza poblacional

………………….Varianza muestral
Con fines prácticos, se puede usar las siguientes fórmulas:

……. Para datos no agrupados. ....(1)

…. Para datos agrupados.


MEDIDAS DE DISPERSIÓN
Ejemplo Nº 1 y 2.
Los siguientes datos corresponden a las notas promocionales de dos grupos de alumnos
escogidos aleatoriamente de dos salones de clase, obtenga la varianza para cada grupo.
Solución:
Salón A Salón B
Xi ( X i  X ) ( X i  X )2 Yi (Yi  Y ) (Yi  Y ) 2
10 -1 1 12 1 1
12 1 1 18 7 49
14 3 9 08 -3 9
11 0 0 14 3 9
09 -2 4 09 -2 4
10 -1 1 06 -5 25
11 0 0 10 -1 1
Total 16 Total 98
M(X) = 77/7 = 11, DM(X) = 8/7 =1.143 M(Y) = 77/7 = 11, DM(Y) = 22/7 = 3.143
V(X) = 16/7 = 2,2857 V(Y) = 98/7 = 14,0
Las notas del salón A son más homogéneas que las notas del salón B.
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 3.
Obtenga la varianza para los datos del siguiente cuadro de distribución de frecuencias,
que corresponde al número de hijos de los 50 obreros de una empresa.
Nº de Nº de
hijos obreros
0 17
1 13
2 8
3 6
4 3
5 2
6 1
Total 50
Solución:
Xi fi Xifi (Xi  X ) ( X i  X )2 ( X i  X )2 fi X i2 f i
0 17 00 -1,5 2,25 38,25 00
1 13 13 -0,5 0,25 3,25 13
2 8 16 0,5 0,25 2,00 32
3 6 18 1,5 2,25 13,50 54
4 3 12 2,5 6,25 18,75 48
5 2 10 3,5 12,25 24,50 50
6 1 6 4,5 20,25 20.25 36
Total 50 75 120,50 233

V(X) = 120,50/50 = 2,41 hijos2 M(X) = 75/50 = 1.5 hijos; DM(X) = 1.28 hijos
V(X) = (233/50) – (1,5)2 = 4,66 – 2,25 = 2,41 hijos2
Se nota que la segunda fórmula es más fácil que la primera.
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 4.
Obtenga la varianza para los datos del siguiente cuadro de distribución de frecuencias,
que corresponden a los ingresos en miles de soles de 60 familias de una ciudad.
Miles de soles Nº de familias
0,5 – 1,0 10
1,0 – 1,5 18
1,5 – 2,0 14
2,0 – 2,5 8
2,5 – 3,0 5
3,0 – 3,5 3
3,5 – 4,0 2
Total 60
Solución:
Xi fi Xifi (Xi  X ) ( X i  X )2 ( X i  X )2 fi X i2 f i
0,75 10 7,50 -0,975 0,950625 9,50625 5,625
1,25 18 22,50 -0,475 0,225625 4,06125 28,125
1,75 14 24,50 0,025 0,000625 0,00875 42,875
2,25 8 18,00 0,525 0,275625 2,20500 40,500
2,75 5 13,75 1,025 1,050625 5,253125 37,8125
3,25 3 9,75 1,525 2,325625 6,976875 31,6875
3,75 2 7,50 2,025 4,100625 8,201250 28,125
Total 60 103,5 36,2125 214,75

V(X) = 36,2125/60 = 0,60354 mil soles2 M(X) = 1.725 m. de s. DM(X) = 0.61


mil soles
V(X) = (214,75/60) – (103,5/60)2 = 3,57917 – 2,97563 = 0,60354 mil soles2
En este caso también el segundo método es más fácil de calcularlo.
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 5.
El cuadro siguiente corresponde a los puntos obtenidos por 100 empleados después de
una evaluación.
Nº de
Puntos
empleados
30 - 40 5
40 - 50 20
50 - 60 25
60 - 70 20
70 - 80 15
80 - 90 10
90 - 100 5
Total 100
Solución:
Xi fi Xifi (Xi  X ) ( X i  X )2 ( X i  X )2 fi X i2 f i
35 5 175 -27 729 3645 6125
45 20 900 -17 289 5780 40500
55 25 1375 -7 49 1225 75625
65 20 1300 3 9 180 84500
75 15 1125 13 169 2535 84375
85 10 850 23 529 5290 72250
95 5 475 33 1089 5445 45125
Total 100 6200 24100 408500

V(X) = 24100/100 = 241 pts2; M(X) = 62 pts. DM(X) = 1300/100 = 13 pts.


V(X) = (408500/100) – (62)2 = 4085 – 3844 = 241 pts2
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 6.
Obtenga la varianza para los datos del siguiente cuadro de distribución de frecuencias,
que corresponde a los ingresos en miles de soles de 80 obreros.
Miles de soles Nº de obreros
0,5 – 0,7 6
0,7 – 0,9 12
0,9 – 1,1 14
1,1 – 1,3 20
1,3 – 1,5 16
1,5 – 1,7 8
1,7 - 1,9 4
Total 80
Solución:
Xi fi Xifi (Xi  X ) ( X i  X )2
( X i  X )2 fi X i2 f i
0,6 6 3,6 -0,57 0,3249 1,9494 2,16
0,8 12 9,6 -0,37 0,1369 1,6428 7,68
1,0 14 14,0 -0,17 0,0289 0,4046 14,00
1,2 20 24,0 0,03 0,0009 0,0180 28,80
1,4 16 22,4 0,23 0,0529 0,8464 31,36
1,6 8 12,8 0,43 0,1849 1,4792 20,48
1,8 4 7,2 0,63 0,3969 1,5876 12,96
Total 80 93,6 7,928 117,44
M(X) = 93.6/80 = 1.17 mil soles; DM(X) = 20.48/80 = 0.256 miles de soles
V(X) = 7,928/80 = 0,0991 mil soles2
V(X) = (117,44/80) – (93,6/80)2 = 1,468 – 1,3689 = 0,0991 miles de soles2
MEDIDAS DE DISPERSIÓN
2.4.1. Propiedades de la varianza
a) La varianza de cualquier conjunto de números (valores de los datos), es siempre un
número no negativo, puesto que las diferencias cuadráticas son siempre números no
negativos.
V(X)  0
b) La varianza de una constante es igual a cero, esto significa que si una variable toma
un solo valor entonces no existe variación entre ellos y el valor de la varianza es
igual a cero.
V(K) = 0
c) La varianza del producto de una variable por una constante, es igual al cuadrado de
la constante por la varianza de la variable.
V(XK) = K2 V(X)
d) La varianza de una variable más una constante, es igual a la varianza de la variable,
por cuanto la dispersión no cambia, sino sólo ha sido trasladado a otro punto.
V(X K) = V(X)
V(aX+b) = a2V(X)
MEDIDAS DE DISPERSIÓN
e) La varianza de una suma o diferencia de variables, es igual a la suma de las varianzas
más o menos el doble de la covarianza.
V(XY) = V(X) + V(Y) ± 2 Cov(X,Y)
n n

(X i  X )(Yi  Y ) X Y i i
Donde: Cov( X , Y )  i 1
 i 1
 X Y ..Covarianza
n n
Si las variables son independientes, entonces Cov(x, y) = 0
f) Si un conjunto de datos tiene distribución normal, entonces el área comprendida entre:
f.1. abarca el 38,3% de la distribución; es decir, incluye el 38,3% de
los datos.
f.2. abarca el 68,26% de la distribución; es decir, incluye el 68,26% de
los datos.
f.3. abarca el 86,64% de la distribución; es decir, incluye el 86,64% de
los datos.
f.4. abarca el 95,44% de la distribución; es decir, incluye el 95,44% de
los datos.
MEDIDAS DE DISPERSIÓN
f.5. abarca el 98,76% de la distribución; es decir, incluye el 98,76% de
los datos.
f.6. abarca el 99,74% de la distribución; es decir, incluye el 99,74% de
los datos.
f.7. ± (3.5) abarca el 99.95% de la distribución; es decir, incluye el 99.95% de
los datos
Nota.- Las propiedades del a) a la e) son demostrables por lo que se deja al lector
demostrarlos como ejercicio.
g) Si se tienen k submuestras, niveles o estratos de tamaños ni, tales que , con
medias y varianzas, entonces la varianza de la muestra de tamaño n está dado
por la siguiente expresión:

Donde, la primera componente se llama Intravarianza; es decir, la varianza de cada


estrato, y la segunda componente se llama Intervarianza; es decir, la varianza entre
estratos. (Si se quiere usar sólo n, entonces se reemplaza (n-1) por n y (ni -1) por ni.
MEDIDAS DE DISPERSIÓN

h) si se tiene k grupos de datos con la misma media, entonces la varianza del total de los
datos es igual a

=
Si los grupos tienen diferentes cantidades de datos, pero de tal manera que

Entonces la varianza general es igual a:

=
PROPIEDADES DE LA VARIANZA
Ejemplo Nº 1.
Los siguientes son notas de química y física de un grupo de 8 alumnos.
Química: 14, 13, 10, 09, 12, 07, 11, 12
Física: 11, 15, 12, 13, 11, 05, 06, 15
Obtenga la varianza:
a) Para cada grupo.
b) Si se le agrega a cada nota 3 puntos.
c) Si se multiplica cada nota por dos.
d) Si se multiplica por 3 y además se le agrega dos a cada nota.
e) Si se suma la nota de química y física.
Solución: a)
Química Física
Xi (Xi  X ) ( X i  X )2 Yi (Yi  Y ) (Yi  Y ) 2
14 3 9 11 0 0
13 2 4 15 4 16
10 -1 1 12 1 1
09 -2 4 13 2 4
12 1 1 11 0 0
07 -4 16 05 -6 36
11 0 0 06 -5 25
12 1 1 15 4 16
88 36 88 98

M(X) = 88/8 = 11; DM(X) = 14/8 = 1.75; M(Y) = 88/8 = 11; DM(Y) = 22/8 = 2.75
PROPIEDADES DE LA VARIANZA
b) Ahora cada nota es más 3 puntos.
Química Física
Xi ( X i  X ) ( X i  X )2 Yi (Yi  Y ) (Yi  Y ) 2
17 3 9 14 0 0
16 2 4 18 4 16
13 -1 1 15 1 1
12 -2 4 16 2 4
15 1 1 14 0 0
10 -4 16 08 -6 36
14 0 0 09 -5 25
15 1 1 18 4 16
112 14 36 112 22 98

M(X) = 112/8 = 14; DM(X) = 14/8 = 1.75; M(Y) = 112/8 = 14; DM(Y) = 22/8 = 2.75
V(X) = 36/8 = 4,5 V(Y) = 98/8 = 12,25
Las varianzas no han cambiado de valor
PROPIEDADES DE LA VARIANZA
c) Ahora cada nota es el doble del anterior.
Química Física
Xi ( X i  X ) ( X i  X )2 Yi (Yi  Y ) (Yi  Y ) 2
28 6 36 22 0 0
26 4 16 30 8 64
20 -2 4 24 2 4
18 -4 16 26 4 16
24 2 4 22 0 0
14 -8 64 10 -12 144
22 0 0 12 -10 100
24 2 4 30 8 64
176 28 144 176 44 392

M(X) = 176/8 = 22; DM(X) = 28/8 = 3.5 = 2x1.75; M(Y) = 176/8 = 22 = 2x11,
DM(Y) = 44/8 = 5.5 = 2x2.75
V(X) = 144/8 = 18 = 22 x 4,5 V(Y) = 392/8 = 49 = 22 x 12,25
PROPIEDADES DE LA VARIANZA
d) Ahora las notas son tres veces la nota anterior más dos.
Química Física
Xi ( X i  X ) ( X i  X )2 Yi (Yi  Y ) (Yi  Y ) 2
44 9 81 35 0 0
41 6 36 47 12 144
32 -3 9 38 3 9
29 -6 36 41 6 36
38 3 9 35 0 0
23 -12 144 17 -18 324
35 0 0 20 -15 225
38 3 9 47 12 144
280 42 324 280 66 882

M(X) = 280/8 = 35 = 3(11)+2; DM(X) = 42/8 = 5.25 = 3x1.75


M(Y) = 280/8 = 35; DM(Y) = 66/8 = 8.25 = 3x2.75
V(X) = 324/8 = 40,5 = 32 x 4,5 V(Y) = 882/8 = 110,25 = 32 x 12,25
PROPIEDADES DE LA VARIANZA
e) Ahora se tendrá la suma de las notas de Química y Física
Z=X+Y

Química + Física Covarianza


Zi (Z i  Z ) (Z i  Z ) 2 (Xi  X ) (Yi  Y ) ( X i  X )(Yi  Y )
25 3 9 3 0 0
28 6 36 2 4 8
22 0 0 -1 1 -1
22 0 0 -2 2 -4
23 1 1 1 0 0
12 -10 100 -4 -6 24
17 -5 25 0 -5 0
27 5 25 1 4 4
176 30 196 31

M(Z) = 176/8 = 22 = 11 + 11; DM(Z) = 30/8 = 3.75 ≠ 1.75 + 2.75 = 4.5


V(Z) = 196/8 = 24,5 = V(X) + V(Y) + 2Cov(x,y) = 4,5 + 12,25 + 2(31/8)
MEDIDAS DE DISPERSIÓN
2.5. DESVIACIÓN ESTÁNDAR O TÍPICA: S X

Nuevamente la varianza como medida de dispersión tiene el inconveniente de que son


valores cuadráticos; por lo tanto, como medida descriptiva no es lo adecuado, en ese
sentido, se ha optado por sacarle la raíz cuadrada positiva y tener una medida que viene
expresada en las mismas unidades de medida de la variable, en consecuencia, la
desviación estándar viene a ser la raíz cuadrada positiva de la varianza.
…. Desviación estándar de la variable X
…….. Desviación estándar poblacional
S……...Desviación estándar muestral.
La desviación estándar es la medida absoluta más adecuada para hacer una
descripción del grado de dispersión de un conjunto de datos. Posee las mismas
propiedades que la varianza.
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 1.
Los siguientes son capitales en miles de soles de dos grupos de 10 comerciantes a pequeña
escala cada uno.
Grupo A:15, 12, 18, 23, 42, 28, 20, 25, 32, 35.
Grupo B: 14, 17, 13, 12, 16, 18, 11, 10, 20, 19
Obtenga la desviación estándar de cada uno y compárelo.
Solución:
Grupo A Grupo B
Xi (Xi  X ) ( X i  X )2 Yi (Yi  Y ) (Yi  Y ) 2
15 -10 100 14 -1 1
12 -13 169 17 2 4
18 -7 49 13 -2 4
23 -2 4 12 -3 9
42 17 289 16 1 1
28 3 9 18 3 9
20 -5 25 11 -4 16
25 0 0 10 -5 25
32 7 49 20 5 25
35 10 100 19 4 16
250 74 794 150 30 110

M(X) = 250/10 = 25 miles de soles; M(Y) = 150/10 = 15 mil soles


V(X) = 794/10 = 79,4  S x  79,4  8,91 mil soles ; DM(X) = 74/10 = 7.4 m.s.

V(Y) = 110/10 = 11  S y  11  3,317 mil soles ; DM(Y) = 30/10 = 3 m.s.

El segundo grupo o grupo B es más homogéneo en sus capitales que el grupo A


MEDIDAS DE DISPERSIÓN
Ejemplo Nº 2.
El siguiente cuadro muestra los salarios en dólares de 80 obreros de una empresa. Obtenga
la desviación estándar de los salarios.
Salario en
Nº de obreros
dólares
15 – 25 4
25 – 35 8
35 – 45 12
45 – 55 16
55 – 65 20
65 – 75 14
75 - 85 6
Total 80
Solución:
Y
 Yi ' 
'
i 1
Xi fi (Xi  X ) ( X i  X )2 ( X i  X )2 fi
15 – 25 20 4 -33,25 1105,5625 4422,25
25 – 35 30 8 -23,25 540,5625 4324,50
35 – 45 40 12 -13,25 175,5625 2106,75
45 – 55 50 16 -3,25 10,5625 169,00
55 – 65 60 20 6,75 45,5625 911,25
65 – 75 70 14 16,75 280,5625 3927,875
75 - 85 80 6 26,75 715,5625 4293,375
Total 80 20155,00
M(X) = 4260/80 = 53.25 dólares; DM(X) = 1060/80 = 13.25 dólares
V(X) = 20155/80 = 251,9375 dólares2  Sx = 15,873 dólares
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 3.
El siguiente cuadro muestra las inversiones realizadas en 80 obras de construcción civil,
los cuales están dados en miles de soles. Obtenga la desviación estándar de las
inversiones.
Miles de soles Nº de obras
5,5 – 10,5 10
10,5 – 19,5 16
19,5 – 30,5 20
30,5 – 59,5 14
59,5 – 100,5 10
100,5 – 149,5 6
149,5 – 200,5 4
Total 80
Solución:
Y Yi ' 
'
i 1
Xi fi (Xi  X ) ( X i  X )2 ( X i  X )2 fi
5,5 – 10,5 8 10 -38,25 1463,0625 14630,625
10,5 – 19,5 15 16 -31,25 976,5625 15625,00
19,5 – 30,5 25 20 -21,25 451,5625 9031,25
30,5 – 59,5 45 14 -1,25 1,5625 21,875
59,5 – 100,5 80 10 33,75 1139,0625 11390,625
100,5 – 149,5 125 6 78,75 6201,5625 37209,375
149,5 – 200,5 175 4 128,75 16576,5625 66306,25
Total 80 154215,00
M(X) = 3700/80 = 46.25 miles de soles; DM(X) = 2650/80 = 33.125 miles de soles
V(X) = 154215/80 = 1927,6875  Sx = 43,905 miles de soles o 43905 soles, se nota que
MEDIDAS DE DISPERSIÓN
2.6. COEFICIENTE DE VARIACIÓN: CV(X)
En ciertas ocasiones es necesario contar con una medida de dispersión, sin que esté
influenciado por las unidades de medida de la variable; es decir, un número puro que sirva
para comparar varios conjuntos de datos que usan unidades de medida diferentes unos de
otros, pues cuando están con sus unidades de medida no es posible tal comparación. En
ese sentido se ha ideado varias medidas relativas dividiendo una medida de dispersión
absoluta entre una medida de posición y una de ellas es el coeficiente de variación, que
es el cociente entre la desviación estándar y la media aritmética, lo que significa el número
de veces de la desviación estándar respecto a la media aritmética. Generalmente se le
multiplica por cien para expresarlo en términos porcentuales. Su valor se obtiene usando
la siguiente expresión:

Ejemplo Nº 1.
Obtenga los coeficientes de variación para los ejemplos dados en el acápite de las
desviaciones estándar.
Solución:
1.1.A.

1.1.B.

1.2.
COEFICIENTE DE VARIACIÓN
Ejemplo Nº 2.
n
De un conjunto de datos se sabe lo siguiente: X
i 1
i  1000 ; σ 𝑛𝑖=1 𝑋𝑖2 = 25000;

V(X) = 100, e Y = (2X + 8)/5. Hallar el coeficiente de variación de Y.


Solución:
La desviación estándar de Y es como sigue:
V(Y) = (2/5)2 V(X)  Sy = (2/5) Sx = (2/5) 100 = 4
La media aritmética de Y es como sigue:
Y  (2 / 5) X  (8 / 5)
1000
X  , pero como no se conoce n, se debe calcular su valor usando la fórmula de la
n
varianza.
25000 1000 2
100  ( )  100n 2  25000n  1000000  n 2  250n  10000  0 
n n
n = 50 ó n = 200
COEFICIENTE DE VARIACIÓN
Si n = 50 entonces X  1000 / 50  20
Y  (2 / 5)( 20)  (8 / 5)  9,6
4
CV (Y )  x100  41,67%
9,6
Si n = 200, entonces X  1000 / 200  5
Y  (2 / 5)(5)  (8 / 5)  3,6
4
CV (Y )  x100  111,11 % , hay una 111.11% de variación de la desviación estándar
3,6
respecto al promedio, es una variación bastante alta.
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 3.
Si el promedio de sueldos de los empleados de una empresa es igual a 1800 soles y la
desviación estándar es igual a 50 soles, después de un reclamo los empleados reciben un
reajuste de sueldos, que consiste en un aumento del 25% del sueldo anterior más una
bonificación de 120 soles, obtenga el nuevo coeficiente de variación de los sueldos
reajustados.
Solución:
Y = sueldo reajustado; X = sueldo anterior.

Y = 1,25 X + 120
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 4.
El coeficiente de variación de los sueldos de 200 empleados de una CIA fue del 7,2%,
después de reajustar los sueldos con un aumento de 150 soles este coeficiente bajó al 6%;
sin embargo, la gerencia fija un sueldo mínimo de 850 soles, lo que beneficia a 35
empleados que antes del reajuste ganaban menos de 700 soles, con un sueldo promedio
de 600 soles mensuales. Determine el dinero necesario para pagar los nuevos sueldos.
Solución:
X = sueldo antes del reajuste.
Y = sueldo reajustado.
Y = X + 150  Y  X  150
Sx
CV ( X )  x100  7,2%  S x  0,072 X …(1)
X
Sy
CV (Y )  x100  6%  S y  0,06Y
Y
MEDIDAS DE DISPERSIÓN
Sx  Sy

S y  0,06( X  150)  0,06 X  9 …..(2)

De (1) y (2) se tiene:


0,072 X  0,06 X  9  X  750 soles
Sin embargo, este promedio, es un promedio ponderado de dos grupos:
Grupo A: 35 empleados con un promedio de 600 soles.
Grupo B: 165 empleados con un promedio X B , luego:
35(600)  165( X B )
750   X B  781,82 soles
200
El primer grupo o grupo A, tiene ahora un sueldo promedio de 850 soles y el segundo
grupo o grupo B, tiene un promedio de 781,82 + 150 0 931,82 soles, por lo que el nuevo
promedio es de:
35(850)  165(931,82)
Y   917,5 soles
200
En consecuencia, se necesita 200(917,5) = 183500 soles.
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 5.
Los sueldos de 150 trabajadores de una empresa tienen un coeficiente de variación del
5% en el mes de mayo, para el mes de julio se hará un aumento del 20%, más una
bonificación de 80 soles a cada sueldo y el coeficiente de variación bajará al 4,5%.
a) Calcular la media y la desviación estándar de los sueldos del mes de julio.
b) Calcular la cantidad de dinero que se necesitará para pagar los sueldos en el mes de
julio.
Solución:
X = sueldo en el mes de mayo.
Y = sueldo en el mes de julio.
Y = 1,2 X + 80
Y  1,2Y  80
S Y  1,2 S X ; S X  0,05 X ; S Y  1,2(0,05 X )  0,06 X ….(1)
S Y  0.045Y  0,045(1,2 X  80)  0,054 X  3,6 ….(2)
De (1) y (2) se tiene la siguiente igualdad:
0,06 X  0,054 X  3,6  X  600 soles
S X  0,05(600)  30 soles
a) Y  1,2(600)  80  800 soles
S Y  0,045(800)  36 soles
b) 150(800) = 120000 soles.
MEDIDAS DE DISPERSIÓN
• Ejemplo Nº 6.
• La edad de 4 amigos tiene como moda 28 años, como mediana 27 años y como promedio
aritmético 26 años. Obtenga el coeficiente de variación de las edades.

• Solución:
• Las edades son: a, b, c, d, si lo ordenamos, c y d deben ser 28 cada uno, pues para que haya moda
debe haber dos edades como mínimo con 28 años, si es tres entonces la mediana sería 28 años y
como hay un número par de datos la mediana es la semisuma de b y c; es decir de b y 28, y para
que la mediana sea 27 años b debe ser 26 años, por otro lado, el promedio aritmético es la suma de
las 4 edades dividido entre 4, entonces:

• 26 = ( a + 26 + 28 + 28)/4  a = 22 años
• V(X) = (22 – 26)2 + (26 – 26)2 + (28 – 26)2 + (28 – 26)2/4 = 24/4 = 6
• Sx = 2,4495
MEDIDAS DE DISPERSIÓN
• Observación:
• Las medidas de dispersión son bastante importantes para la determinación del tipo de distribución que
se tiene, especialmente cuando se trata de la medida del rendimiento de los alumnos, de las inversiones
realizadas, de los resultados- de una investigación científica, etc., en ese sentido es preciso dar algunas
consideraciones que son de importancia para su mejor comprensión e interpretación, estos son los
siguientes:

• - Las medidas de dispersión tienen un valor mínimo que es cero, en este caso todos los datos tienen el
mismo valor; es decir, no existe variabilidad entre los datos, a medida que el valor de la medida de
dispersión crece, los datos se irán siendo más variables.

• - Si la medida de dispersión es grande, significa que los datos son bastante desiguales o dispersos, esto
significa que los datos están mezclados entre los que tienen menor magnitud y los que tienen mayor
magnitud, si estos datos fueran notas entonces tendríamos alumnos de diferente rendimiento.

• - Si la medida de dispersión es pequeña significa que los datos son homogéneos, este tipo de datos son
descritos con bastante certeza, si los datos fueran notas, entonces estaríamos frente a un conjunto
de alumnos con rendimientos parejos.

• - Si se quiere comparar la variabilidad entre dos o más grupos, es necesario que la medida de dispersión
absoluta tenga la misma unidad de medida, de lo contrario es preferible usar una medida de dispersión
relativa como el coeficiente de variación.
PRÁCTICA DIRIGIDA
• Ejercicios:
• Teoría.
• 1. Determine la veracidad o falsedad de las siguientes afirmaciones:
• a) Si la desviación estándar de una variable es 40 y a los valores de la variable se aumentan en un 40%, entonces la nueva
varianza es 3136.
• b) Tanto la desviación media como la desviación típica son afectados por los valores extremos o atípicos.
• c) La varianza indica la distancia promedio que tienen los datos con respecto a la media aritmética.
• d) El rango intercuartílico es más representativo que el rango interdecílico.
• e) El coeficiente de variación es una medida de dispersión absoluta.
• f) El cuartil cuatro es siempre superior al límite superior de la distribución.

• Práctica
• 2.- De cuatro amigos: A, B, C y D cuyas edades tienen como moda 22 años, como mediana 23
años y como promedio aritmético 24 años, se desea saber la edad de cada uno de ellos.
• 3.- Una empresa A produce artículos con un peso medio de 50 kg y una desviación estándar de
5 kg, una segunda empresa B produce los mismos artículos con un peso medio de 60 kg y una
desviación estándar de 4 kg, un comerciante compra los artículos en la proporción de 6 a 4 de
la empresa A con respecto a la empresa B. determine el peso medio y la desviación típica de
los artículos comprados por el comerciante.
PRÁCTICA DIRIGIDA
• 4.- El siguiente cuadro muestra la distribución del número de accidentes ocurridos en un año a lo largo de una autopista.
• a) obtenga la media, mediana y moda e indique la forma de la distribución.
• b) obtenga el número mínimo y máximo del 20% de accidentes ubicado en quinto superior.
• c) Obtenga los rangos e interprételos.
• d) Obtenga el coeficiente de variación e interprételo.
[ N° de N° de [ ] Xi fi Fi Xifi (Xi- (Xi-2fi
Accidentes ] Vehículos
0-2 1 20 20 20 20 -6.1 744.2
0-2 20
3-5 4 55 75 220 880 -3.1 528.55
3-5 55
6-8 25 6-8 7 25 100 175 1225 -0.1 0.25
9 - 11 20 9 - 11 10 20 120 200 2000 2.9 168.2
12 - 14 15 12 - 14 13 15 135 195 2535 5.9 522.15
15 - 17 10 15 - 17 16 10 145 160 2560 8.9 792.1
18 - 20 5 18 - 20 19 5 150 95 1805 11.9 708.05
Total 150
Total 150 1065 11025 3463.5

• a. = 1065/150 = 7.1 accidentes; Me = 3 + 2[75 – 20]/55 = 5 accidentes; Mo = 3 + 2[35/(35+30)] = 4.077


PRÁCTICA DIRIGIDA
• b) P80 = 9 + 2[120-100]/20 = 11 accidentes
• Rpta. Como mínimo 11 accidentes y como máximo 20 accidentes al año.
• c) R = 20 – 0 = 20 accidentes
• Q1 = 3 + 2[37.5-20]/55 = 3.636 accidentes
• Q3 = 9 + 2[112.5-100]/20 = 10.25 accidentes
• RQ = 10.25 – 3.636 = 6.614 entre 6 a 7 accidentes al año.
• P10 = 0 + 2[15-0]/20 = 1.5 accidentes
• P90 = 12 + 2[135-120]/15 = 14 accidentes
• RP = 14 – 1.5 = 12.5 accidentes, o sea entre 12 a 13 accidentes al año
d) V(X) = 11025/150 – (7.1)2 = 73.5 – 50.41 = 23.09;
= 3463.5/150= 23.09
Sx = = 4.8052 accidentes
CV(X) = x 100 = 67.68%; hay una variación del 67.68% de la desviación estándar respecto a la
MEDIDAS DE FORMA - SESGO
• 3. MEDIDAS DE ASIMETRÍA
• Las medidas de dispersión sólo indican la magnitud de las variabilidad de los datos, ya sea en
forma absoluta o en forma relativa, pero no indican nada acerca de la dirección hacia dónde tienden a
acentuarse dichas variaciones; para suplir esta deficiencia se obtienen otras medidas llamadas de
asimetría; por tanto, estas deben indicar la existencia o falta de simetría de la distribución, mostrando
la dirección hacia donde se inclina la distribución, esta asimetría o simetría debe ser respecto a un
punto de referencia de la variable, pudiendo ser la media aritmética. Según su forma las distribuciones
pueden ser de dos formas: simétricas o asimétricas.
• 3.1. Simétricas.
• Una distribución es simétrica, cuando los datos están distribuidos equitativamente en ambos
lados del centro de la distribución; por lo tanto, la curva resultante del polígono de frecuencias
suavizado, es semejante al de la curva normal (forma acampanada), en consecuencia, la media
aritmética y la mediana coinciden, la moda coincidirá con estas medidas si la distribución es unimodal,
esto es,
• 3.2. Asimétricas.
• Una distribución es asimétrica, cuando la distribución de los datos no es equitativa en ambos
lados de la distribución, en consecuencia, hay mayor concentración de los datos es en un lado de la
distribución y por ende la media aritmética, la mediana y la moda son diferentes, esto es: . A su vez
pueden ser de dos tipos:
MEDIDAS DE FORMA - SESGO
• 3.2.1. Positivas.
• Es cuando la acumulación de los datos es mayoritariamente a lado izquierdo o en la parte
inferior y muy suavemente hacia el extremo superior o derecho de la distribución. En este caso y
cuando la distribución es unimodal, se presenta la siguiente desigualdad:
• Mo < Me <
• A este tipo de distribución se les conoce con el nombre de sesgados hacia la derecha, porque la
cola más larga de la distribución se extiende hacia la derecha o datos con mayor valor.
• 3.2.2. Negativas.
• Es cuando la acumulación de los datos es mayoritariamente a lado derecho o en la parte
superior y muy suavemente hacia el extremo inferior o izquierdo de la distribución. En este caso y
cuando la distribución es unimodal, se presenta la siguiente desigualdad:
• Mo > Me >

• A este tipo de distribución se les conoce con el nombre de sesgados hacia la izquierda, porque la
cola más larga de la distribución se extiende hacia la izquierda o datos con menor valor.
• Si se quiere una visión gráfica de los tres casos, el siguiente es un indicador, aun cuando, la
separación de las medidas no es tanto como se aprecia.
MEDIDAS DE FORMA - SESGO
MEDIDAS DE FORMA - SESGO
Coeficiente de Asimetría. CS(X)
Las fórmulas para obtener el coeficiente de asimetría son los siguientes:
a) Fórmula de Pearson:
X  Mo 3( X  Me )
a.1. CS ( X )  , a.2. CS ( X ) 
SX SX
b) Fórmula de Bowley
𝑄3 −2𝑄2 +𝑄1 P90  2 P50  P10
b.1. 𝐶𝑆(𝑋) = b.2. CS ( X ) 
𝑄3 −𝑄1 P90  P10
c) Fórmula de momentos o de Fisher:
M3
CS ( X ) 3
SX
Donde M3 = Es el momento de orden 3 respecto a la media.
n

(X i  X )3
M3  i 1
…….. para datos no agrupados.
n
m

(X i  X )3 fi
M3  i 1
……para datos agrupados.
n
3
SX = Es el cubo de la desviación estándar de la variable.
Es última fórmula proporciona una cuantificación más precisa del coeficiente de sesgo
que las demás fórmulas. La interpretación de los valores proporcionados por estas
fórmulas es como sigue:
- Si el CS(X) = 0, entonces la distribución es simétrica.
- Si el CS(X) > 0, entonces la distribución es sesgada hacia la derecha, o tiene sesgo
positivo.
- Si el CS(X) < 0, entonces la distribución es sesgada hacia la izquierda, o tiene sesgo
negativo.
MEDIDAS DE FORMA - SESGO
Ejemplo Nº 1.
El siguiente cuadro de distribución de frecuencias, corresponde a las notas obtenidas por
80 alumnos en el curso de Estadística. Determine el coeficiente de sesgo de la
distribución.
Nº de
Notas
alumnos
4-6 5
6-8 10
8 - 10 15
10 - 12 20
12 - 14 15
14 - 16 10
16 – 18 5
Total 80

Solución:

Notas Xi fi Fi Xifi X i2 f i X i3 f i
4-6 5 5 5 25 125 625 180 -1080
6-8 7 10 15 70 490 3430 160 -640
8 - 10 9 15 30 135 1215 10935 60 -120
10 - 12 11 20 50 220 2420 26620 0.0 0.0
12 - 14 13 15 65 195 2535 32955 60 120
14 - 16 15 10 75 150 2250 33750 160 640
16 – 18 17 5 80 85 1445 24565 180 1080
Total 80 880 10480 132880 800 0.0
MEDIDAS DE FORMA - SESGO
5
X  880 / 80  11 ; Mo  10  2( )  11
55
20  15
Q1  8  2( )  8,67
15
40  30
Q2  P50  Me  10  2( )  11
20
60  50
Q3  12  2( )  13,33
15
85
P10  6  2( )  6,6
10
72  65
P90  14  2( )  15,4
10
10480
V (X )   (11) 2  131  121  10 = 800/80
80
Sx = 3,1623
a) Pearson:
X  Mo
a.1. CS ( X )  = (11 – 11)/(3,1623) = 0,0
SX

3( X  Me )
a.2. CS ( X )  = 3(11 – 11)/(3,1623) = 0,0
SX
MEDIDAS DE FORMA - SESGO
b) Bowley

𝑄3 −2𝑄2 +𝑄1 13,33  2(11)  8,67


b.1. 𝐶𝑆(𝑋) = =  0,0
𝑄3 −𝑄1 13,33  8,67

P90  2 P50  P10 15,4  2(11)  6,6


b.2. CS ( X )  =  0,0
P90  P10 15,4  6,6

c) Momentos:
m m m

(X i  X ) fi
3
X i
3
fi X i
2
fi
3
M3  i 1
 i 1
 3X i 1
 2X
n n n

M3 = (132880/80) – 3(11)(131) + 2(11)3 = 0,0 = 0.0/80

S X3  (3,1623)(10)  31,623

CS(X) = (0,0)/(31,623) = 0,0

Todos los coeficientes nos indican que la distribución es simétrica, en efecto incluso
se presenta: X  Me  Mo = 11
MEDIDAS DE FORMA - SESGO
Ejemplo Nº 2.
El siguiente cuadro de distribución de frecuencias, corresponde también a las notas
obtenidas por 80 alumnos en el curso de Matemática. Determine el coeficiente de sesgo
de la distribución.
Nº de
Notas
alumnos
4-6 5
6-8 15
8 - 10 25
10 - 12 15
12 - 14 10
14 - 16 5
16 – 18 5
Total 80

Solución:
Notas Xi fi Fi Xifi X i2 f i X i3 f i
4-6 5 5 5 25 125 625 131.328125 -673.05664
6-8 7 15 20 105 735 5145 146.484375 -457.76367
8 - 10 9 25 45 225 2025 18225 31.640625 -35.59570
10 - 12 11 15 60 165 1815 19965 11.484375 10.04883
12 - 14 13 10 70 130 1690 21970 82.65625 237.63672
14 - 16 15 5 75 75 1125 16875 118.828125 579.28711
16 – 18 17 5 80 85 1445 24565 236.328125 1624.75586
Total 80 810 8960 107370 758.75 1285.31251
MEDIDAS DE FORMA - SESGO
10
X  810 / 80  10,125 ; Mo  8  2( ) 9
10  10
20  5
Q1  6  2( )  8,0
15
40  20
Q2  P50  Me  8  2( )  9,6
25
60  45
Q3  10  2( )  12
15
85
P10  6  2( )  6,4
15
72  70
P90  14  2( )  14,8
5
8960
V (X )   (10,125) 2  112  102,5156  9,484375 = 758.75/80
80
Sx = 3,08
a) Pearson:
X  Mo
a.1. CS ( X )  = (10,125 – 9)/(3,08) = 0,365
SX
3( X  Me)
a.2. CS ( X )  = 3(10,125 – 9,6)/(3,08) = 0,511
SX
MEDIDAS DE FORMA - SESGO
b) Bowley

𝑄3 −2𝑄2 +𝑄1 12  2(9,6)  8


b.1. 𝐶𝑆(𝑋) = =  0,2
𝑄3 −𝑄1 12  8

P90  2 P50  P10 14,8  2(9,6)  6,4


b.2. CS ( X )  =  0,238
P90  P10 14,8  6,4

c) Momentos:
m m m

(X i  X ) fi
3
X i
3
fi X i
2
fi
3
M3  i 1
 i 1
 3X i 1
 2X
n n n

M3 = (107370/80) – 3(10,125)(112) + 2(10,125)3 = 16,0664 = 1285.31251/80

S X3  (3,08)(9,484375)  29,212

CS(X) = (16,0664)/(29,212) = 0,55

Todos los coeficientes nos indican que la distribución es asimétrica, con sesgo a la
derecha, es decir con sesgo positivo, en efecto incluso se presenta: X  Me  Mo =
10,125 > 9,6 > 9,0.
MEDIDAS DE FORMA - SESGO
Ejemplo Nº 3.
El siguiente cuadro de distribución de frecuencias, corresponde también a las notas
obtenidas por 80 alumnos en el curso de Sociología. Determine el coeficiente de sesgo de
la distribución.

Nº de
Notas
alumnos
4-6 5
6-8 5
8 - 10 10
10 - 12 15
12 - 14 25
14 - 16 15
16 – 18 5
Total 80
Solución:
Notas Xi fi Fi Xifi X i2 f i X i3 f i
4-6 5 5 5 25 125 625 -1624.7559
6-8 7 5 10 35 245 1715 -579.2871
8 - 10 9 10 20 90 810 7290 -237.6367
10 - 12 11 15 35 165 1815 19965 -10.0488
12 - 14 13 25 60 325 4225 54925 35.5957
14 - 16 15 15 75 225 3375 50625 457.7637
16 – 18 17 5 80 85 1445 24565 673.0566
Total 80 950 12040 159710 -1285.3125
MEDIDAS DE FORMA - SESGO
10
X  950 / 80  11,875 ; Mo  12  2( )  13
10  10
20  10
Q1  8  2( )  10
10
40  35
Q2  P50  Me  12  2( )  12,4
25
60  35
Q3  12  2( )  14
25
85
P10  6  2( )  7,2
5
72  60
P90  14  2( )  15,6
15
12040
V (X )   (11,875) 2  150,5  141,015625  9,484375
80
Sx = 3,08
a) Pearson:
X  Mo
a.1. CS ( X )  = (11,875 – 13)/(3,08) = -0,365
SX
3( X  Me)
a.2. CS ( X )  = 3(11,875 – 12,4)/(3,08) = -0,511
SX
MEDIDAS DE FORMA - SESGO
b) Bowley

𝑄3 −2𝑄2 +𝑄1 14  2(12,4)  10


b.1. 𝐶𝑆(𝑋) = =  0,2
𝑄3 −𝑄1 14  10

P90  2 P50  P10 15,6  2(12,4)  7,2


b.2. CS ( X )  =  0,238
P90  P10 15,6  7,2

c) Momentos:
m m m

(X i  X ) fi
3
X i
3
fi X i
2
fi
3
M3  i 1
 i 1
 3X i 1
 2X
n n n

M3 = (159710/80) – 3(11,875)(150,5) + 2(11,785)3 = -16,0664

M3 = -1285.3125/80 = - 16.0664

S X3  (3,08)(9,484375)  29,212

CS(X) = (16,0664)/(29,212) = -0,55

Todos los coeficientes nos indican que la distribución es asimétrica, con sesgo a la
izquierda, es decir con sesgo negativo, en efecto incluso se presenta: X  Me  Mo =
11,875 < 12,4 < 13.
MEDIDAS DE APUNTAMIENTO - CURTOSIS
• 4. MEDIDAS DE APUNTAMIENTO.
• Otra característica importante de una distribución de frecuencias es su curtosis, o sea el grado de
apuntamiento vertical o achatamiento que exhibe un polígono de frecuencias, este grado de apuntamiento, es
consecuencia de la concentración de los datos alrededor de un punto de referencia, mientras más se
concentren los datos, mayor será su apuntamiento y mientras mayor sea la dispersión de los datos respecto a
ese punto, más achatado será su polígono de frecuencias.

• La comparación de las distribuciones es teniendo en cuenta a la curva de la distribución normal, en ese


sentido las distribuciones pueden ser de tres tipos:

• a) Platicúrtica: Es cuando la forma de la distribución es achatada; esto es, cuando la distribución de los
datos es bastante dispersa alrededor del punto de referencia o valores centrales. Es menos apuntada que la
curva normal y tiene la forma de un plato o aplanada. (Plati  plano)

• b) Mesocúrtica: Es cuando la forma de la distribución es moderada o mesurada; es decir, la distribución de


los datos es mesurada alrededor del punto de referencia o valores centrales; por lo tanto, el apuntamiento
es similar al de la curva normal correspondiente. (Meso  mitad)

• c) Leptocúrtica: Es cuando la concentración de los datos es bastante pronunciada alrededor del punto de
referencia o valores centrales, en consecuencia, la forma de la distribución es apuntada o levantada; es decir,
MEDIDAS DE APUNTAMIENTO - CURTOSIS
MEDIDAS DE APUNTAMIENTO - CURTOSIS
El coeficiente de la curtosis K se obtiene con las siguientes fórmulas:
a) Fórmula en función de los cuantiles:
(Q3  Q1 )
K 
2( P90  P10 )
- Si K = 0,263, la distribución es mesocúrtica; e incluso se puede considerar como
mesocúrtica a una distribución si (0,125 <K< 0,375)
- Si K > 0,263, la distribución es leptocúrtica; más precisamente cuando (0,375  K
 0,5)
- Si K < 0,263, la distribución es Platicúrtica; más precisamente cuando (0,125 > K
 0,0)
b) Fórmula de momentos de Fisher
M4
K  4
SX
n

(X i  X )4
Donde: M 4  i 1
…….. Para datos no agrupados.
n
m

(X i  X )4 fi
M4  i 1
……Para datos agrupados.
n
(Momento cuatro respecto a la media)
 V ( X )  ……… (Momento dos respecto a la media al cuadrado)
4 2
SX
Varianza al cuadrado
Si K = 3, entonces la distribución es Mesocúrtica. (Incluso 30,5)
Si K > 3, entonces la distribución es Leptocúrtica.
Si K < 3, entonces la distribución es Platicúrtica.
Nota. - Esta fórmula, es más precisa que la fórmula de los frectiles.
MEDIDAS DE APUNTAMIENTO - CURTOSIS
Ejemplo Nº 1.
El siguiente cuadro de distribución de frecuencias, corresponde a las notas obtenidas por
80 alumnos en el curso de Estadística, determine el tipo de apuntamiento de la
distribución.
Nº de
Notas
alumnos
4-6 5
6-8 10
8 - 10 15
10 - 12 20
12 - 14 15
14 - 16 10
16 – 18 5
Total 80
Solución:
Notas Xi fi Fi Xifi X i  X ൫
𝟐
𝑋𝑖 − 𝑋൯ 𝑓𝑖 X i X  fi
4

4-6 5 5 5 25 -6 180 6480


6-8 7 10 15 70 -4 160 2560
8 - 10 9 15 30 135 -2 60 240
10 - 12 11 20 50 220 0 00 00
12 - 14 13 15 65 195 2 60 240
14 - 16 15 10 75 150 4 160 2560
16 – 18 17 5 80 85 6 180 6480
Total 80 880 800 18560
MEDIDAS DE APUNTAMIENTO - CURTOSIS
X  880 / 80  11 ;
20  15
Q1  8  2( )  8,67
15
40  30
Q2  P50  Me  10  2( )  11
20
60  50
Q3  12  2( )  13,33
15
85
P10  6  2( )  6,6
10
72  65
P90  14  2( )  15,4
10
10480
V (X )   (11) 2  131  121  10 = 800/80
80
Sx = 3,1623
18560
M4   232
80
(Q3  Q1 ) (13,33  8,67) 4,66
a) K  =   2,6477  0,263 ; sin embargo, es muy
2( P90  P10 ) 2(15,4  6,6) 2 x8,8
próximo a la de una distribución mesocúrtica.
232
b) K   2,32 <3, con la fórmula de los momentos se tiene una distribución
100
platicúrtica.
Se debe tener en cuenta, que las dos fórmulas no conducen a valores similares, en el caso
de los momentos es muy reservada.
MEDIDAS DE APUNTAMIENTO - CURTOSIS
Ejemplo Nº 2.
El siguiente cuadro de distribución de frecuencias, corresponde también a las notas
obtenidas por 80 alumnos en el curso de Matemática, obtenga el coeficiente de
apuntamiento de la distribución.
Nº de
Notas
alumnos
4-6 5
6-8 15
8 - 10 30
10 - 12 15
12 - 14 8
14 - 16 5
16 – 18 2
Total 80
Solución:

Notas Xi fi Fi Xifi X i  X ൫
𝟐
𝑋𝑖 − 𝑋൯ 𝑓𝑖 X  X  fi
i
4

4-6 5 5 5 25 -4,725 111.628125 2492,167658


6-8 7 15 20 105 -2,725 111.384375 827,0985996
8 - 10 9 30 50 270 -0,725 15.768750 8,288449219
10 - 12 11 15 65 165 1,275 24.384375 39,63984961
12 - 14 13 8 73 104 3,275 85.805 920,3122531
14 - 16 15 5 78 75 5,275 139.128125 3871,327033
16 – 18 17 2 80 34 7,275 105.85125 5602,243563
Total 80 778 593.95 13761,0774
MEDIDAS DE APUNTAMIENTO - CURTOSIS
778
X   9,725
80
40  20
Me  8  2( )  9,33
30
20  5
Q1  6  2( )8
15
60  50
Q3  10  2( )  11,33
15
85
P10  6  2( )  6,4
15
72  65
P90  12  2( )  13,75
8
V(X) = 593,95/80 = 7,424375
S X4  (7,424375) 2  55,1213
13761,0774
M4   172,0135
80
(11,33  8) 3,33
a) K    0,2265
2(13,75  6,4) 2 x 7,35
b) K = 172,0135/55,1213 = 3,12; entonces la distribución es leptocúrtica.
MEDIDAS DE APUNTAMIENTO - CURTOSIS
Ejemplo Nº 3.
El siguiente cuadro de distribución de frecuencias, corresponde a las notas obtenidas por
80 alumnos en el curso de Física, determine el tipo de apuntamiento de la distribución.
Nº de
Notas
alumnos
4-6 5
6-8 5
8 - 10 15
10 - 12 30
12 - 14 15
14 - 16 5
16 – 18 5
Total 80
Solución:
Notas Xi fi Fi Xifi X i  X ൫
𝟐
𝑋𝑖 − 𝑋൯ 𝑓𝑖 X i X  fi
4

4-6 5 5 5 25 -6 180 6480


6-8 7 5 10 35 -4 80 1280
8 - 10 9 15 25 135 -2 60 240
10 - 12 11 30 55 330 0 00 00
12 - 14 13 15 70 195 2 60 240
14 - 16 15 5 75 75 4 80 1280
16 – 18 17 5 80 85 6 180 6480
Total 80 880 640 16000
MEDIDAS DE APUNTAMIENTO - CURTOSIS
;

; la distribución es simétrica unimodal.

V(X) = 640/80 = 8

a) > 0,263

b) K = 200/64 = 3,125 > 3; entonces la distribución es leptocúrtica.


MEDIDAS DE APUNTAMIENTO - CURTOSIS
Ejemplo Nº 4.
El siguiente cuadro corresponde a la distribución de las notas de 80 alumnos de una
Universidad en el curso de Razonamiento Lógico. Determine el coeficiente de curtosis.
Nº de
Notas
alumnos
5-7 3
7-9 8
9 - 11 15
11 - 13 28
13 - 15 15
15 - 17 8
17 – 19 3
Total 80
Solución:
Notas Xi fi Fi Xifi X i  X ൫
𝟐
𝑋𝑖 − 𝑋൯ 𝑓𝑖 X i X  fi
4

1085 - 7 6 3 3 18 -6 108 3888


7-9 8 8 11 64 -4 128 2048
9 - 11 10 15 26 150 -2 60 240
11 - 13 12 28 54 336 0 00 00
13 - 15 14 15 69 210 2 60 240
15 - 17 16 8 77 128 4 128 2048
17 – 19 18 3 80 54 6 108 3888
Total 80 960 592 12352
MEDIDAS DE APUNTAMIENTO - CURTOSIS
960 13
X   12 ; Mo  11  2( )  12
80 13  13
40  26
Me  11  2( )  12 ; la distribución es simétrica unimodal.
28
20  11
Q1  9  2( )  10,2
15
60  54
Q3  13  2( )  13,8
15
83
P10  7  2( )  8,25
8
72  69
P90  15  2( )  15,75
8
V(X) = 592/80 = 7,4
S X4  (7,4) 2  54,76
12352
M4   154,4
80
(13,8  10,2) 3,6
a) K    0,24 < 0,263
2(15,75  8,25) 2 x 7,5
b) K = 154,4/54,76 = 2,82 < 3; entonces la distribución es platicúrtica.
MEDIDAS DESCRIPTIVAS
• TAREA
La distribución de frecuencias de los tiempos empleados por los trabajadores de una
• 1. Institución en ir de sus domicilios a la Institución, está dado en el siguiente cuadro.

Tiempo en Nº de
minutos trabajadores
05 – 15 10
15 - 25 15
25 - 35 20
35 - 45 30
45 - 55 20
55 - 65 15
65 - 75 10
Total 120
a) Obtenga la medida, mediana y moda e indique la forma de la distribución.
b) Obtenga el coeficiente de variación e interprételo.
c) Obtenga el coeficiente de sesgo usando la fórmula de momentos e interprételo.
d) Obtenga el coeficiente de curtosis usando la fórmula de los momentos e
interprételo.

También podría gustarte