Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCIÓN
• Los métodos y las técnicas estadísticas, se emplean en la actualidad, prácticamente en
todas las ramas de la actividad humana. No importa si lo que nos interesa es predecir el
estado del tiempo, combatir una enfermedad con un nuevo medicamento, prevenir el
crimen o los accidentes, hacer proyecciones del crecimiento de una población, predecir
el porcentaje de aprobados y desaprobados en una asignatura, evaluar el costo de vida
de las familias, contratar o nombrar un nuevo empleado en una empresa, etc. En todas
estas acciones siempre existirá un nivel de incertidumbre, cualquiera sea su naturaleza,
el cual es necesario manipularlo en una forma científica y objetiva, si se desea obtener
resultados eficientes.
• Por otro lado, todos nosotros tenemos algo de investigadores o directores, casi a diario
hacemos pronósticos relativos a los acontecimientos futuros de nuestra vida con el fin
de predecir lo que sucederá ante nuevas situaciones o experiencias. A medida que
aparecen estas nuevas situaciones, con frecuencia apoyamos o confirmamos nuestras
ideas, pero a veces tenemos que confrontar desagradables sorpresas y/o consecuencias.
INTRODUCCIÓN
• Lo mencionado no tendría solución objetiva si no existiera un método científico que los
avalara, este método es el estadístico, y precisamente con este método es posible
desempeñarse con eficiencia en estados de incertidumbre. Si el manejo de los datos es
óptimo, los errores que se cometerán al tomar las decisiones serán mínimos.
• Las técnicas estadísticas necesitan de un conocimiento matemático de acuerdo al
mayor o menor grado de aplicación que se quiera hacer, en el presente curso la
necesidad de un conocimiento avanzado de las matemáticas no es primordial, pero si
un conocimiento mediano.
• La información ha sido siempre, y con mayor razón hoy en día, muy importante para la
toma de decisiones en todo nivel, por ello las mismas deben ser oportunas y óptimas.
Con mala o insuficiente información posiblemente la decisión sea mala, por muy bueno
que sea el procesamiento que se haya hecho de ésta. Por el contrario, por muy buena
que sea la información si el procesamiento ha sido malo seguramente también la
decisión será equivocada. En consecuencia, un sólido respaldo para una acertada toma
de decisiones, contempla ambos aspectos: información buena y suficiente, con un
procesamiento correcto.
INTRODUCCIÓN
• La estadística resulta fundamental para conocer el comportamiento de ciertos eventos,
por lo que ha adquirido un papel clave en la investigación. Se usa como una valiosa
herramienta en los diferentes campos del conocimiento y en las variadas ciencias. Es
un lenguaje universal que permite comunicar información verídica de los hechos
basada en datos cuantitativos.
• Es tan importante que casi no existe actividad humana en que no esté involucrada la
Estadística. Las decisiones más importantes de nuestra vida diaria se toman
generalmente en base a la información Estadística.
• La evolución de la estadística ha llegado al punto en que su proyección se percibe en
casi todas las áreas de trabajo. Abarca la recolección, presentación y caracterización
de la información para ayudar tanto en el análisis e interpretación de datos como en el
proceso de la toma de decisiones. Ahora la Estadística es parte esencial de la vida
profesional, es hasta cierto punto una competencia específica para todo profesional.
HISTORIA DE LA ESTADÍSTICA
• Historia de la estadística
• Los antecedentes de la estadística abundan en la Antigüedad, especialmente cuando
surgieron los primeros grandes imperios de numerosa población, como Babilonia,
Egipto o China, en los que se impuso la necesidad de contabilizar la población y
obtener información relevante para el Estado, respecto al cobro de impuestos,
necesidad de reforzar el ejército y otras materias similares.
• Formalmente, la Estadística surgió en el siglo XIX, cuando se la reconoció como
ciencia al conjugarse las probabilidades con lo que era la Estadística hasta ese
entonces “ciencia de los asuntos del Estado (status)”, que tenía el nombre de Statistik
(alemán), traducido al inglés como “aritmética política”
• En la actualidad ya con los aportes de numerosos matemáticos, se ha convertido en
una ciencia formal y que sirve como base científica en la investigación científica, lo
metro cuadrado) pero no nos da información directa sobre la calidad de vida de esas personas.
INTRODUCCIÓN
• IMPORTANCIA DE LA ESTADÍSTICA EN LA INGENIERÍA
• Un ingeniero es alguien que cumple una importante función en la sociedad, un rol que consiste
en la aplicación de los principios de la ciencia para la formulación de soluciones a los
problemas enfocados en la satisfacción de las necesidades del entorno al cual pertenece. Este
proceso debe dar solución a un problema se encuentra ligado a un conjunto de pasos en los
cuales se encuentra fundamentado el método científico o método de la ingeniería que puede
resumirse como:
• 1. Observación: Mirar con atención y seriedad el comportamiento del fenómeno o problema a
estudiar.
• 2. Análisis: Identificar y analizar las variables que pueden intervenir y jugar un papel
preponderante en la generación del problema, así como en su solución.
• 3. Hipótesis: Proponer una alternativa o modelo tentativo de solución apoyado en postulados
científicos que expliquen el problema en estudio.
• 4. Prueba de la hipótesis: teniendo en cuenta la alternativa de solución o la utilización del
modelo propuesto, ejecutar un proceso de experimentación realizando los ajustes necesarios
para mejorar su semejanza con la realidad, obteniendo así información relevante para el
INTRODUCCIÓN
• 5. Demostración o refutación de la hipótesis: Verificar que los resultados
obtenidos son coherentes con la realidad estudiada.
• 6. Teoría científica o tesis: Generar conclusiones basadas en los resultados
obtenidos de la simulación procurando siempre la solución del problema.
• En el proceso de la aplicación del método científico el ingeniero deberá
entonces realizar una toma de datos que luego deberá analizar para encontrar
una relación con una teoría científica o tendencia y así poder formular un modelo
el cual puede consistir en un conjunto de expresiones matemáticas que permiten
describir la situación analizada finalmente realizar una simulación y obtener las
respectivas conclusiones. Puede inferirse entonces que al momento de realizar
las acciones descritas se deberá hacer uso de la matemática en sus diferentes
áreas. Entonces la matemática puede ser considerada como una caja de
herramientas en la cual se encuentran disponibles gran variedad de
herramientas con diferentes aplicaciones y complejidades, una de estas
herramientas es la Estadística.
INTRODUCCIÓN
• La Estadística aparece de la necesidad de entender y describir la variabilidad que se presenta en la
naturaleza de un parámetro de interés, un claro ejemplo puede citarse en el estudio del caudal de un
rio donde su variabilidad con respecto al tiempo resulta de gran importancia al momento del diseño
de una estructura para la captación del agua. La variables de interés para el ingeniero varían de
acuerdo a su
• campo de acción un ejemplo de esta afirmación puede observarse en el campo de la Ingeniería Civil
que tiene diferentes escenarios de actuación, el Ingeniero Hidráulico estará interesado en el estudio
del caudal de un rio con el objetivo del suministro del líquido a una red de acueducto, el Ingeniero
Estructural se interesara por la resistencia a la compresión del concreto utilizado en la construcción
de una columna, el Ingeniero de Transportes por la cantidad de vehículos que circulan en las horas
pico en una zona alta de congestión vehicular, El Ingeniero de Minas por el porcentaje de metales
pesados en una muestra de una zona minera. El Ingeniero Agrícola por la cantidad de lluvia caída en
una zona agrícola. Etc.
• Las necesidades del entorno pueden llegar a ser tan simples como estudiar la edad de los obreros
presentes en un fundo agrícola o asentamiento minero, o complicadas como puede observarse en el
estudio de los fenómenos climáticos actuales pues hay serias complicaciones para lograr una
predicción exacta de los potenciales desastres. En otros casos hay que estructurar una base de datos
DEFINICIÓN DE ESTADÍSTICA
• DEFINICIÓN DE ESTADÍSTICA
• A la fecha aún no es factible dar una definición exacta de la Estadística, porque los conceptos
fundamentales no tienen una definición explícita universal, o si lo tienen, no es ella suficientemente
clara para darnos una idea acabada de su significado. Por eso trataremos de presentar una
caracterización conceptual sucinta, tal como sigue:
• La Estadística es una ciencia aplicada, que nos proporciona un conjunto de
métodos y técnicas para planificar, recopilar, clasificar, presentar y analizar
datos en forma tal, que nos permita sacar conclusiones e inferencias acerca de
la población, a partir de un conjunto de datos extraídos de la misma llamada
muestra.
• En las definiciones que diversos autores dan sobre estadística, ponen especial énfasis en el hecho
de que, la palabra Estadística proviene de la palabra latina “status” que significa “Estado” y del
alemán “statistik”, en la actualidad es una ciencia, rama de la matemática cuyos métodos permiten
tener decisiones respecto a las características de una población usando solo los datos recopilados
de una muestra representativa de dicha población. Estas definiciones nos permiten además
ESTADÍSTICA
• 1.1. Estadística Descriptiva
• Es la parte de la Estadística que trata de planificar, recolectar, clasificar, presentar y
describir los datos en estudio.
• 1.2. Estadística Inferencial
• Es la parte de la Estadística que se ocupa de los métodos que nos permiten sacar
conclusiones, generalizaciones o inferencias acerca de las características de una población,
que pueden ser los parámetros o variables aleatorias, tomando decisiones generales a partir
de los datos proporcionados por la muestra.
• La Estadística es una ciencia que tiene una metodología cíclica de trabajo, empieza
estudiando la población, y cuando no es posible estudiar una población u obtener
información completa de ella, por ser muy grande o por ser a veces infinita, entonces es
necesario extraer muestras representativas de ella, mediante las técnicas de Muestreo, y
usando la información proporcionada por dicha muestra, pero analizados con la ayuda de la
Estadística Descriptiva, se sacan conclusiones e inferencias acerca de la población en
estudio, gracias a la Inferencia Estadística, cuya base es el Cálculo de las Probabilidades, y
este a su vez estudia las características teóricas de la población, todo lo demás gira
ETAPAS DE UNA INVESTIGACIÓN ESTADÍSTICA
Las etapas de una investigación usando la estadística varía de acuerdo a los objetivos del trabajo,
los cuales se pueden resumir a lo siguiente:
Determinación del problema.
Plantear objetivos.
Planeamiento del trabajo a realizar. Variables, cuestionario, fuente de información, muestra, tamaño
de muestra, unidad de investigación o elemental, manual del encuestador, recursos humanos,
capacitación de recursos humanos, cronograma, presupuesto, etc.
Trabajo de campo, aplicación de la encuesta, recopilación de la información.
Clasificación de la información, procesamiento de datos.
Presentación de la información en cuadros y gráficas.
Análisis descriptivo de la información.
Obtención de conclusiones y realizar inferencias.
Presentación del informe final.
DEFINICIÓN DE TÉRMINOS USADOS
• Términos Usados:
• Muchos autores usan indistintamente ciertos términos estadísticos, por lo que es
necesario unificarlos bajo un solo criterio para el presente texto.
• Una población es un conjunto de datos proporcionados por las unidades
elementales que lo conforman, las decisiones y conclusiones basadas en ellas
pueden hacerse con absoluta certeza, en otras palabras, si se dispone de
información sobre la población en forma completa, el riesgo de las decisiones
incorrectas desaparece; en cambio, una muestra es solo una parte de la población y
las conclusiones hechas en base a ella pueden ser erróneas, en todo caso se hacen
con un riesgo, cuantificado en términos probabilísticos. En tanto que, universo es el
conjunto de unidades elementales en general, que tienen alguna característica en
común, quienes al ser medidos u observados respecto a una o más características
en estudio nos proporcionan datos, por lo que de un universo se puede obtener una
o más poblaciones como características medibles u observables se tenga. Sin
embargo, para los propósitos de este texto, universo y población tendrán la misma
DEFINICIÓN DE TÉRMINOS USADOS
• 2.1. Universo
• Es el conjunto total de unidades elementales o de análisis (pueden ser
personas, animales, cosas o fenómenos) que tienen alguna característica en
común, al cual se quiere estudiar.
•Ejemplo:
•Todos los alumnos matriculados en el país.
•El conjunto de los colegios del país.
•Los docentes del Perú.
•los ríos de la tierra.
•Los habitantes de la tierra.
•Las estrellas del Universo. Etc.
• 2.2. Población.
• La población se define como la totalidad de los valores posibles (mediciones o
conteos) de una característica particular de un grupo especificado de personas,
DEFINICIÓN DE TÉRMINOS USADOS
• 2.2. Población
• Se llama población en estadística al conjunto de valores de las unidades elementales (personas,
animales o cosas) que tienen alguna característica en común, cuyos datos (valores cualitativos o
cuantitativos) son obtenidos de cada una de dichas unidades elementales, como consecuencia de la
medición u observación de una o más características particulares que se quiere estudiar. La población es
un conjunto especificado y delimitado tanto en el tiempo como en el espacio, del cual se obtendrá la
muestra. A esta población se le conoce también como población objeto u objetivo. La población puede
ser finita o infinita
• Ejemplo:
• •Todos los alumnos de la UNASAM, matriculados en el semestre 2021-II (El universo sería
• todos los alumnos universitarios)
• • Todos los colegios estatales del país que funcionaron en el 2021
• (El universo sería todos los colegios)
• • Todos los ríos afluentes del Amazonas.
• • Todos los habitantes de la Región Ancash, en el mes de diciembre del 2021.
• • Todas las municipalidades provinciales del Perú.
DEFINICIÓN DE TÉRMINOS USADOS
• 2.3. Muestra
• Es una parte o subconjunto representativo de la población, seleccionados de acuerdo a las
técnicas de muestreo. Cabe recordar que se pueden seleccionar no solo uno, sino varias
muestras de una población, e incluso de diferentes tamaños y no necesariamente coincidentes.
• Ejemplo:
• • 50 alumnos de la UNASAM, matriculados en el semestre 2021-II
• • 85 colegios nacionales del país que funcionaron el 2021.
• • 15 ríos afluentes del río Amazonas.
• • 2500 habitantes de la Región Ancash, en el mes de diciembre
• del 2021.
• • 20 municipalidades provinciales del Perú.
• • 35 granjas avícolas del Dpto. de Lima que tributaron en el
• 2021. etc.
DEFINICIÓN DE TÉRMINOS USADOS
• 2.4. Parámetro
• Es un valor que describe a alguna característica de la población y para determinarlo mayormente se necesitan
todos los datos de la población; generalmente se les representa con letras griegas minúsculas.
• Ejemplo:
• μ = Media poblacional.
• σ = Desviación estándar poblacional.
• = Coeficiente de correlación poblacional.
• N = Tamaño de la población. P = proporción poblacional
• 2.5. Estadístico.
• Es un valor representativo de la muestra, que se obtiene a partir de los datos muestrales y describe alguna
característica de la muestra. Se les representa con letras latinas.
• Ejemplo:
• = Media muestral.
• S = Desviación estándar muestral.
• r = Coeficiente de correlación muestral.
DEFINICIÓN DE TÉRMINOS USADOS
• a) Discretas
• Son las que resultan del conteo y por consiguiente, sólo pueden tomar algunos valores
dentro de un intervalo dado, generalmente son los números naturales o enteros.
VARIABLE
• Ejemplo:
• El número de hijos que tiene una persona.
• El número de inasistencias en un salón de clase.
• El número de vehículos que pasan por una carretera en una hora determinada.
• El número de accidentes de trabajo en una empresa, en una semana dada.
• El número de artículos defectuosos manufacturados por hora.
• El número de créditos aprobados por los alumnos en un semestre.
• El número de parcelas productivas que tienen las familias en una comunidad
campesina. Etc.
• b) Continuas
• Son las que resultan de la medición con cualquier unidad de medida, y por lo
tanto pueden tomar cualquier valor dentro de un intervalo dado. Se les
representa con los números reales.
VARIABLE
• Ejemplo:
• • El peso de las personas.
• • La talla de las personas.
• • La edad de las personas.
• • El ingreso económico mensual de las familias.
• • La temperatura del medio ambiente a las 12 m.
• • La velocidad del viento o de los vehículos, etc.
• A las variables se les representa generalmente con las últimas letras del alfabeto,
tales como X, Y, Z. cuando se quieren distinguir los valores individuales se usan
subíndices, para lo cual se utilizan las letras intermedias como: i, j, k, l, etc. En ese
sentido Xi representa al i-ésimo valor de la variable X.
• En la práctica muchas variables continuas son redondeadas a números enteros,
VARIABLE
• A su vez, las variables según su función pueden clasificarse como: Dependientes,
independientes e intervinientes (exógenas, endógenas), también pueden ser:
unidimensionales, bidimensionales, tridimensionales o multidimensionales (dos o más
dimensiones).
• Constante
• Se denomina así a la variable que toma un solo valor. Es un dato que no cambia de valor. Se
le representa con las primeras letras del alfabeto, tales como a, b, c, etc.
• Ejemplo:
• Si todos los obreros de un centro minero o agrícola tuvieran sus dos padres vivos, entonces
la variable, número de padres vivos por obrero sería el número 2.
• Las variables también pueden ser unidimensionales, cuando se estudia solo una
característica de las unidades elementales (ejemplo: la edad de las personas),
bidimensionales si se estudia a la vez dos características de una unidad elemental
(ejemplo: la edad y el peso de las personas), multi o n – dimensionales si se estudian a la
vez más de dos características de las unidades elementales ( ejemplo, la edad, el peso, la
estatura, los ingresos económicos, el grado de estudios, etc. de las personas)
REDONDEO DE DATOS
• 5. Redondeo de datos
• La necesidad del redondeo de datos es más por la facilidad de los cálculos o por comodidad de su
manejo, que, por razones prácticas, pues el manejo inadecuado puede traer más errores de los
previstos. El redondeo de un número hasta el entero o decimal más próximo obedece a los
siguientes criterios.
• a) Si el dígito a redondear es menor que cinco, se le desprecia.
• Ejemplo:
• Aproximar o redondear a un entero: 7,234 = 7
• Aproximar o redondear a un decimal: 7,234 = 7,2
• Aproximar o redondear a dos decimales:7,234 = 7,23
• b) Si el dígito a redondear es mayor que cinco, al dígito anterior se le agrega una unidad.
• Ejemplo:
• Aproximar o redondear a un entero: 7,678 = 8
• Aproximar o redondear a un decimal: 7,678 = 7,7
• Aproximar o redondear a dos decimales: 7,678 = 7,68
REDONDEO DE DATOS
• c) Cuando el último dígito o el dígito a redondear es igual a cinco, entonces se
desprecia el cinco si el dígito anterior es par y se agrega una unidad al dígito anterior
si éste es impar.
• Ejemplo:
• Aproximar o redondear a un entero: 47,500 = 48,0
• Aproximar o redondear a un decimal: 47,550 = 47,6
• Aproximar o redondear a un decimal: 47,650 = 47,6
• Aproximar o redondear a dos decimales: 47,545 = 47,54
•
• 6. Notación Sumatoria
• Para describir y analizar los datos, es necesario el manejo más o menos eficiente de
las operaciones aritméticas, en especial el de la suma de los datos; es decir, de la
serie: x1, x2, x3, ……, xn, en estudio, para ello se hará una breve descripción de las
SUMATORIAS
La letra griega mayúscula , es una notación abreviada para designar una suma, tal
como:
x1 + x2 +x3 + ……+ xn
Esta suma se puede resumir y expresarla de la forma siguiente:
n
X
i 1
i
Que se lee como la suma de los Xi de i=1 hasta i=n, donde i = 1, 2, 3,…..,n. El índice
es arbitrario, pues se puede usar, j, k o l. La expresión i=1 debajo del signo indica que
uno (puede ser otro) es el valor inicial de i y n encima del signo indica que n (puede ser
otro) es el valor final de i, a la expresión Xi colocado después del signo se le llama
sumando y representa a cada uno de los valores de la variable X.
Ejemplos:
5
a) X
i 1
i X1 X 2 X 3 X 4 X 5
PROPIEDADES DE LAS SUMATORIAS
a) Suma de una constante. Es igual a n veces la constante, si se inicia con i=1
n n
a a a a ....... a na
i 1
a (n k 1)a
i k
Ejemplo:
4 4
7 7 7 7 7 4 x7 28
i 1
3 3 3 3 3 3 (4 0 1)3 5 x3 15
i 0
b) Suma de una constate por una variable. Es igual a lo constante por la suma de la
variable.
Ejemplo:
n n
ax
i 1
i ax1 ax 2 ax3 ..... ax n a xi
i 1
Ejemplo:
5 5
5x
i 1
i 5 x1 5 x 2 5 x3 5 x 4 5 x5 5 xi
i 1
PROPIEDADES DE LAS SUMATORIAS
c) Suma de una variable más una constante. Es igual a la suma de la variable más la
constante multiplicada por n, si se inicia en i=1
n n
(x
i 1
i a ) ( x1 a ) ( x 2 a ) ( x3 a ) .... ( x n a ) x
i 1
i na
Ejemplo:
4 4 4
(x
i 1
i 3) ( x1 3) ( x 2 3) ( x3 3) ( x 4 3) x
i 1
i 4 x3 x
i 1
i 12
(x
i 1
i y i z i ) ( x1 y1 z1 ) ( x 2 y 2 z 2 ) ( x3 y 3 z 3 ) ..... ( x n y n z n )
(x
i 1
i y i z i ) ( x1 y1 z1 ) ( x 2 y 2 z 2 ) ( x3 y 3 z 3 ) ( x 4 y 4 z 4 )
( x1 x 2 x3 x 4 ) ( y1 y 2 y 3 y 4 ) ( z1 z 2 z 3 z 4 )
4 4 4
x
i 1
i yi zi
i 1 i 1
PROPIEDADES DE LAS SUMATORIAS
e) Suma de un producto de variables.
n n n
x
i 1
i y i ( xi )( y i ) Pues
i 1 i 1
x
i 1
i y i x1 y1 x 2 y 2 x3 y 3 ..... x n y n
n n
( xi )( y i ) ( x1 x 2 x3 ...x n )( y1 y 2 y 3 ... y n )
i 1 i 1
x
i 1
i y i ( xi )( y i )
i 1 i 1
3
x
i 1
i y i x1 y1 x 2 y 2 x3 y 3
3 3
( xi )( y i ) ( x1 x 2 x3 )( y1 y 2 y 3 )
i 1 i 1
( x1 y1 x1 y 2 x1 y 3 ) ( x 2 y1 x 2 y 2 x 2 y 3 ) ( x3 y1 x3 y 2 x3 y 3 )
PROPIEDADES DE LAS SUMATORIAS
f) Sumas parciales.
n k n
i 1
xi
i 1
xi x
i k 1
i
Ejemplo:
8
x
i 1
i x1 x 2 x 3 x 4 x 5 x 6 x 7 x8
( x1 x 2 x 3 x 4 ) ( x 5 x 6 x 7 x8 )
4 8
=
i 1
xi x
i 5
i
i 1
x ik ( x i ) k
i 1
k 1
Nota. - La igualdad se presenta sólo en casos especiales, como cuando todos los valores
de la serie sean ceros.
Si k = -1
n
1 1
xi
n
i 1
x i 1
i
Si k = 2
n n
i 1
x i2 ( x i ) 2
i 1
Si k = ½
n n
x
i 1
1/ 2
i ( x i )1 / 2
i 1
La demostración se deja como ejercicio.
SUMAS DE INTERÉS
n
n(n 1) n
n(n 1)( 2n 1)
a) i b) i2
i 1 2 i 1 6
2
n
n( n 1) n
c) i 3
i 1 2
d) (X
i 1
n X n 1 ) ( X n X 0 )
1 1
e) r
i 0 1 r
i
r 1 f) (1 / 2) i
i 0 1 1/ 2
2
r
r2 r
g) ir i
r 1 h) i r 2 i
r 1
i 0 (1 r ) 2 i 0 (1 r ) 3
1 1
i) ir
i 0
i 1
(1 r ) 2
r 1 j) (i 1)r i
i 0 (1 r ) 2
r 1
r 1 n
n
k) i r
i 0
2 i 1
(1 r ) 3
r 1 l)
x 0 x
2 n
n x n x
n
xi
m) P Q 1 P Q 1 n) ex
x
x 0 i 0 i!
RECOLECCIÓN DE DATOS
• I. RECOLECCIÓN Y CLASIFICACIÓN DE DATOS
• Los datos estadísticos se obtienen como es sabido, midiendo u
observando las unidades elementales, asimismo para el estudio de una
o más características de la población no se necesita de un solo dato,
sino de una colección de datos, ya sea los correspondientes a la
población o a los de la muestra, estos datos para ser estudiados
necesitan ser recolectados; la misma, se puede hacer de múltiples
maneras, dependiendo de la variable a estudiar.
• En ciertos casos, los datos se encuentran a disposición del investigador
en documentos oficiales, como los boletines estadísticos, anuarios,
memorias, informes, registros públicos, revistas, etc., solo hay que
transcribirlos, en otros casos, hay que obtenerlos en la misma fuente,
para ello, también existen múltiples formas como los obtenidos mediante
RECOLECCIÓN DE DATOS
• Puesto que los datos dependen también del tipo de análisis que se quiera
hacer, en este sentido se pueden clasificar en:
• a) De corte transversal. Es decir, del momento, precisamente en este caso,
es cuando hay que obtenerlos, pues en la mayoría de los casos no están
disponibles.
• b) De corte longitudinal. Es decir, los que sucedieron en el pasado en
períodos de tiempo constantes, en estos casos generalmente se encuentran
en los archivos de las instituciones.
• 1. Censo y Muestreo
• Los métodos que nos permiten recopilar la información son:
• Censo
• Es el procedimiento por el cual se obtiene información de todos los elementos que
conforman la población, relacionado a la variable o variables que se quiere investigar
RECOLECCIÓN DE DATOS
• Siempre que no se cometan errores en la recopilación y/o procesamiento de los datos, los
resultados que se obtengan serán los verdaderos y los que se quiere conocer; sin embargo,
se tiene la desventaja de que por lo general es muy difícil practicar un censo, sobre todo
cuando la población es muy grande, muchas veces infinita o cuando para estudiar a las
unidades elementales hay que sacrificarlos.
• Por ejemplo, los censos nacionales de población, de vivienda, el económico, el
agropecuario, etc. no se realizan cada año, sino entre cada cinco a diez años. Para analizar
la sangre de una persona no se usa toda su sangre sino una pequeña muestra. No sería
lógico ni posible analizar toda el agua del mar para determinar su salinidad. Para determinar
la calidad del arroz tampoco es necesario cocinar toda la cosecha, para medir el porcentaje
de impurezas que tiene el agua de un río tampoco es necesario analizar todo el agua del río,
etc.
• Muestreo
• Además de la definición dada en el primer capítulo, se puede decir que el muestreo es el
procedimiento por el cual se obtiene información de solo una parte representativa de la
población. sin embargo, debe entenderse, que este procedimiento no puede ser usado
indiscriminadamente; es decir, sin tener en cuenta las características de la población y las
RECOLECCIÓN DE DATOS
• TIPOS DE MUESTREO
• Existe dos tipos de muestreo, los cuales son:
• 1. Probabilísticos. Son los que se basan en el principio de la equiprobabilidad, es decir, cuando cada
elemento de la población tiene la misma posibilidad de ser seleccionado. Los cuales a su vez son:
• 1.1. Muestreo aleatorio simple.
• 1.2. Muestreo aleatorio estratificado.
• 1.3. Muestreo aleatorio por conglomerados.
• 1.4. Muestreo aleatorio sistemático.
• 1.5. Muestreo de aceptación,
• 1.6. Muestreo aleatorio por etapas. etc.
• CUESTIONARIO
• INTRODUCCIÓN
• El presente cuestionario tiene por objeto recabar información acerca del nivel de servicio que presta la
Clínica Odontológica de la UNMSM, por lo que se le solicita contestarla de manera objetiva y veraz.
• La información es de carácter confidencial y reservada, ya que los resultados serán manejadas sólo
para la investigación y con ella mejorar los servicios de la clínica en beneficio de los clientes.
• Se agradece con anticipación su colaboración.
• INSTRUCCIONES
• En las preguntas de respuesta múltiple marque con un aspa la alternativa que cree que es la más
correcta.
• Edad……………… Sexo……………… Distrito donde vive
………………………………………………..
• Tipo de usuario: Docente ( ), Administrativo ( ), Alumno ( ), Particular ( )
• Carrera profesional en la que trabaja o estudia ……………………………………………………..
NIVEL DE SERVICIOS DE LA CLÍNICA ODONTOLÓGICA DE LA
UNMSM
• 1. ¿De qué forma se enteró de la existencia de la Clínica Odontológica de la UNMSM?
a. Por recomendación
b. Por TV
c. Internet
d. Radio
e. Otro
3. ¿Qué opinión le merece la atención recibida por parte del personal administrativo?
a. Excelente
b. Buena
c. Regular
d. Mala
e. Pésima
4. Se realizó un estudio en el distrito de Carhuaz, para determinar la proporción de familias que tienen
hijos en la universidad, para lo cual se escogió a 150 familias, encontrando que 95 familias
tenían hijos en la universidad. Indique:
• a.- La población y la muestra.
• b.- El parámetro, el estadístico, la unidad elemental y el tipo de la unidad elemental.
• c.- La variable, tipo de variable, y el tipo de escala de medición.
CLASIFICACIÓN DE DATOS
• CLASIFICACIÓN DE DATOS
• Después de recolectar los datos, éstos se encuentran en la forma como fueron
compilados; es decir, no necesariamente ordenados, por lo tanto, en este estado son
difíciles de ser analizados y por consiguiente de ser interpretados, con dificultad se puede
obtener el mínimo y el máximo, se puede sumar los valores cuantitativos y dividirlo entre el
número de valores existentes y obtener así el promedio, pero esto no nos garantiza una
descripción completa de los datos, por lo que es necesario ordenarlos y clasificarlos, ya
sea en grupos, categorías o intervalos dependiendo del tipo o tipos de variables en estudio
• Para comenzar a clasificar los datos, lo primero que se debe tener en cuenta es el tipo de
variable que se tiene, además usar una sola variable; si la variable es del tipo cualitativo,
no existen mayores recomendaciones ni normas, sino ordenarlos y clasificarlos de
acuerdo al atributo que tiene cada unidad elemental, cuando la variable es del tipo
cuantitativo discreto y la amplitud de la variable es pequeña, el tratamiento es similar a la
de las variables cualitativas, cuando la variable es del tipo cuantitativo, en especial
continuo, se tendrán en cuenta ciertas reglas en el que los diferentes autores no se han
puesto de acuerdo, pero que en el presente caso se dará una secuencia consensuada, por
lo menos por la mayoría de ellos.
CLASIFICACIÓN DE DATOS
• Ejemplo 01. Con fines didácticos se usará un ejemplo como guía, cuya variable
es del tipo cuantitativo continuo, el mismo es el siguiente: con la finalidad de
dar una orientación de los hábitos alimenticios a los niños de su aula un
profesor de una zona rural obtuvo el peso en kg. de cada uno de sus 50
alumnos, que son los que a continuación se dan:
• 51,2 46,1 38,6 25,1 47,3 37,3 40,8 48,4 39,1 41,3 46,2 31,4 36,0
48,6 44,2 42,3 49,5 59,9 44,5 40,9 41,4 52,3 38,7 33,5 28,4 44,1
54,5 43,9 53,3 44,8 42,6 34,8 26,2 37,2 47,7 43,2 58,4 36,9
52,8 41,6 39,8 43,7 56,0 32,0 46,8 38,1 49,8 30,9 47,2 37,5
•
• Como se puede apreciar no se puede hacer alguna descripción de interés sobre
el conjunto de datos, por lo que es necesario ordenarlos y agruparlos en grupos
(intervalos), para lo cual se sigue los siguientes pasos:
CLASIFICACIÓN DE DATOS
• 1.- Determinar los límites superior e inferior de la distribución.
• Esto significa obtener el valor más alto y el valor más bajo de los datos.
• Límite Superior (Ls): Es el valor más alto del conjunto de datos en estudio, en
nuestro caso es igual a 59,9 kg.
• Límite Inferior (Li): Es el valor más bajo del conjunto de datos, en nuestro caso es igual
a 25,1 kg.
• En conclusión, el alumno con mayor peso es el que tiene 59,9 kg y el de menor peso es
el que tiene 25,1 kg.
• 2.- Obtener el Rango de variación.
• Rango (R): Es la diferencia entre el mayor valor y el menor valor de los datos.
• R = Ls – Li
• R = 59,9 – 25,1 = 34,8 kg.
• En el caso discreto R = (Ls – Li) + 1
• Para el ejemplo, la diferencia en peso entre dos alumnos cualesquiera no pude ser
superior a 34,8 kg., o la diferencia en el peso de los alumnos es máximo 34,8 kg.
CLASIFICACIÓN DE DATOS
• 3.- Determinación del Número de Intervalos de Clase (m).
• Para una descripción más detallada, se agrupa a los datos en intervalos más
pequeños, con la única condición de que no se intersequen (intersecten) y que al
unirlos deben coincidir con el rango de variación, las amplitudes de estos intervalos
pueden ser diferentes o constantes, en el caso de ser diferentes no existe mayores
requisitos que los dados por la persona que está haciendo la clasificación, según
los intereses de su investigación. En el caso de que las amplitudes sean
constantes, se tiene la necesidad de conocer el número de dichos intervalos en
primera instancia. Se recomienda que el número de intervalos (m) no deben ser
menores de cinco ni mayores de veinte. Pues al ser muy pocos intervalos se
pierde mucha información, en tanto que al haber muchos intervalos los cálculos se
vuelven muy engorrosos. Hay varias reglas para calcular el número de intervalos,
en este caso usaremos el de Herbert Sturges, que es un buen aproximador.
• m = 1 + log2 (n)
• m = 1 + 3,322 log10(n)
CLASIFICACIÓN DE DATOS
• Para nuestro ejemplo se tiene:
• m = 1 + 3,322 log10(50)
• = 1 + 3,322 (1,69897)
• = 1 + 5,644
• = 6,644
• m=7
• Esto indica que el número de intervalos para nuestro ejemplo debe ser 7, sin embargo, esto no impide que
pueda ser otro número próximo a 7, pues como se dijo la fórmula es un aproximador y no una regla infalible,
lo importante es tener el número de intervalos adecuados que con la experiencia se va adquiriendo.
• Otra regla para calcular el número de intervalos de clase es sacar la raíz cuadrada de n si este es menor que
200, en nuestro ejemplo también es 7, pues
• 4.- Determinar la amplitud de los intervalos (C).
• Como se dijo anteriormente es necesario conocer la amplitud de los intervalos, cuando estos son
constantes, los cuales se obtienen dividiendo el rango entre el número de intervalos:
• C = R/m
n
i 1
i fi n
i 1
0 ni n
CLASIFICACIÓN DE DATOS
Ejemplo: (Para el ejemplo que se tiene)
n1 = 3, esto indica que existen 3 alumnos cuyos pesos oscilan entre 25 y 30 kg.
n5 = 10, esto indica que hay 10 alumnos cuyos pesos oscilan entre 50 y 55 kg.
a) Acumuladas (Ni, Fi)
Son los que corresponden a uno o más intervalos contiguos, por lo tanto, corresponden
a la suma de las frecuencias absolutas simples de cada uno de los intervalos que lo forman,
se les representa por Ni o Fi
0 Ni n
N1 = n1
N2 = n1 + n2 = N1 + n2
N3 = n1 + n2 + n3 = N2 + n3
................
Ni = Ni-1 + ni
................
Nm = n
N2 = 3 + 5 = 8, esto indica que hay 8 estudiantes cuyos pesos fluctúan entre 25 y 35 kg.
N4 = 3 +5+10+14 = 32, esto indica que hay 32 alumnos con pesos entre 25 y 45 kg. o con
pesos menores que 45 kg.
CLASIFICACIÓN DE DATOS
3.2. Relativas
Son las que resultan de dividir las frecuencias absolutas entre el número total de datos en
estudio, se les llama también tanto por uno, o probabilidades de ocurrencia de los datos
en los intervalos o categorías correspondientes, a su vez se clasifican en:
a.- Simples (hi)
Son los que resultan de dividir una frecuencia absoluta simple entre el número total
de datos, en consecuencia, indican la probabilidad de ocurrencia de los datos en el
intervalo de clase o categoría correspondiente, se les representa por h i
ni fi m
hi
n
n
0 hi 1
i 1
hi 1
H1 = h1
H2 = h1 + h2
H3 = h1 + h2 + h3
…………….
Hi = Hi-1 + hi
…………….
Hm = 1,0
P1 = p1
P2 = p1 + p2
P3 = p1 + p2 + p3
…………
Pi = Pi-1 + pi
…………
Pm = 100%
[)
10 – 14 12 3 3 0.06 0.06 6 6
• No cabe duda de que la presentación por medio de gráficas de los datos es un valioso suplemento
para el análisis y resumen de la información para muchas personas, ya que una gráfica bien construida
es más comprensible, que muchas palabras dadas sobre el tema, por eso se dice que una gráfica vale
más que mil palabras, además las gráficas llaman poderosamente la atención del lector o del
observador, en cambio los números son poco apreciados.
• La gran importancia de las gráficas radica en la facilidad de ser asimilados visualmente, mucho más
que los números, pero hay que tener en cuenta que ninguna gráfica puede ser construida si no existe un
cuadro estadístico que lo sustente, además no se puede usar para obtener otros indicadores numéricos
PRESENTACIÓN DE DATOS
• 1. CUADROS ESTADÍSTICOS
• Se le llama también Tabla Estadística, este es un método de presentar ordenadamente los datos, después de que éstos
hayan sido agrupados y distribuidos en uno o más sistemas de clasificación. Existen diferentes tipos de tablas, pero lo
agruparemos en sólo dos grupos.
1. Cuadros Analíticos.
• Son los diseñados para ayudar al análisis formal de las relaciones mutuas entre variables y categorías de clasificación.
• 2. Cuadros de Referencia.
• Son los diseñados para servir como depósito de información estadística, éstos se encuentran generalmente en los
apéndices de los informes o reportes.
• La diferencia entre estos dos tipos de cuadros radica fundamentalmente en el uso y no tanto en su construcción, pues
las características básicas son las mismas.
• ELEMENTOS ESTRUCTURALES DE UN CUADRO ESTADÍSTICO
• Todo proceso de producción de información estadística culmina en la publicación y divulgación de los resultados y es que
el objetivo de toda investigación estadística es dar a conocer a los usuarios, con oportunidad y calidad, los datos estadísticos
obtenidos en dicho proceso, cualquiera que sea la naturaleza de ellos: demográficos, económicos, sociales, geográficos, etc.
• La presentación de los datos debe ser ordenada, coherente y de fácil utilización e interpretación por la diversidad de
usuarios. Con este fin se utilizan los “Cuadros estadísticos” llamados también “Tablas estadísticas”, en los que se presentan
los datos para su utilización e interpretación.
PRESENTACIÓN DE DATOS
• El cuadro estadístico debe estructurarse teniendo en cuenta la utilidad que preste al usuario común, es
decir, quien lo diseña debe colocarse en el lugar del que utilizará la información. La construcción del
mismo es una labor aparentemente sencilla, sin embargo, en la práctica es necesario tener en cuenta
elementos que faciliten la lectura, comprensión e interpretación de los datos. Por otro lado, siempre hay
que tener en cuenta los lineamientos proporcionados por el ente rector que en este caso es el INEI.
• Los elementos que se presentan a continuación, son los de un cuadro de clasificación matricial o de
clasificación cruzada de dos variables, pudiendo en algunos casos obviarse de alguno de los elementos
dados. Para mayor referencia leer la Resolución Jefatural Nº 312-2006-INEI de fecha: 25-10-06.
• 2.1. Número del Cuadro (Tabla).
• Todo cuadro debe tener un número que lo identifique, para facilitar su referencia. Las tablas se
enumeran de acuerdo al orden de su presentación o aparición en un reporte, salvo que se presente un
solo cuadro. Generalmente se colocan en la parte superior izquierda del cuadro.
• 2.2. Título.
• El título de un cuadro indica el contenido del mismo, y debe responder a las siguientes
preguntas: ¿Qué?, ¿Cuándo?, ¿Dónde? Y ¿Cómo? Están clasificados los datos. Al redactar un título se
debe evitar un enunciado demasiado extenso, así como una extrema brevedad.
PRESENTACIÓN DE DATOS
2.3. Notas en el Encabezado de la tabla.
• Estas notas se colocan cerca del título, generalmente entre paréntesis y con letras más
pequeñas que las del título. El objetivo de estas notas es proporcionar información
complementaria o adicional al título, si es necesario por su puesto, como por ejemplo para
indicar la unidad de medida de los datos, la fecha, lugar u otro indicador.
2.4. Talón.
• Es la parte de la tabla que contiene al conjunto de encabezados o rótulos de las hileras,
que corresponde a una de las clasificaciones. Está situado al lado izquierdo del observador.
Cada hilera de la tabla debe tener un rótulo que describa los datos presentados en dicha hilera.
Se le llama también columna matriz.
2.5. Cajón.
• Es la parte de la tabla que contiene los encabezados o rótulos de las columnas.
Corresponden a otra de las clasificaciones y está situado al lado superior derecho del
observador, así como en las hileras cada columna debe tener un rótulo que describa los datos
que en ella se presentan. Se le llama también encabezado del cuadro.
PRESENTACIÓN DE DATOS
2.6. Campo.
• Se le conoce también como el cuerpo de la tabla, y es la parte que contiene los datos numéricos o estadísticos,
cada registro se presenta en una Celda o Casilla que viene a ser la unidad básica de presentación de la tabla. Una
celda resulta de la intersección de una columna con una hilera, ya que el significado del dato presentado en ella se
indica con la combinación de los rótulos de la hilera y de la columna correspondiente.
• Es necesario que en cada celda se registre algo, si el registro es cero, este debe figurar, pero si no existe
información, se debe registrar una raya, adicionalmente se le puede aclarar con una nota al pie de la tabla, pero de
ninguna manera se le debe dejar en blanco, ya que esto está sujeto a especulaciones o manipuleos voluntarios o
involuntarios.
•
2.7. Notas al pie de la tabla.
• Se llaman también notas al calce (footnotes), estas notas o llamadas se usan muy a menudo para explicar o aclarar
un dato o grupo de datos de la tabla; esto, si es necesario especificar alguna característica particular del dato o datos
presentados, evitando así alguna confusión en su interpretación.
•
2.8. Fuente de datos.
• Estas notas indican el origen de los datos presentados en la tabla, sirven para identificar o reconocer a la persona
o institución que lo confeccionó y lo publicó; sirve también como una ayuda para evaluar la confiabilidad y permitir
PRESENTACIÓN DE DATOS
Nº de la Tabla TÍTULO
(Notas en el encabezado)
Categoría
Facultad
Principal Asociado Auxiliar J. de P. Total
1. Ciencias 18 29 13 1 61
2. Cs. Agrarias 14 17 6 0 37
3. Cs. del Ambiente 5 9 9 0 23
4. Cs. Econ.Adm. y C. 13 27 18 0 58
5. Cs. Médicas 4 15 10 0 29
6. Derecho y Cs. P. 1 7 11 0 19
7. Educ. y C.S. 3 23 10 0 36
8. Ing. Civil 1 18 8 8 35
9. Ing. de Ind. Alim. 2 13 2 2 19
10.Ing. de Min. G.y M. 3 14 0 0 17
11. Barranca 2/. 2 7 13 0 22
Total 66 179 100 1/. 11 356
1/. Las Jefatura de Práctica no es una categoría docente, sin embargo, es contabilizado
como tal.
2/. Barranca no es una facultad, sino una sede.
Fuente de Datos. OGE-UNASAM.2008
PRESENTACIÓN DE DATOS
• 3. GRÁFICAS (FIGURAS) ESTADÍSTICAS
• La representación gráfica de los datos contenidos en una tabla estadística, tiene la finalidad de ofrecer una visión
de conjunto del fenómeno sometido a investigación en forma tal que sea más rápidamente perceptible que la
observación directa de los datos numéricos; de aquí, que la representación gráfica sea un medio eficaz para el
análisis de las estadísticas, ya que las magnitudes y las regularidades se aprecian y recuerdan con más facilidad
cuando se les examina gráficamente. Sin embargo, la representación gráfica es sólo un medio auxiliar del análisis
estadístico; puesto que ésta, es netamente numérica.
• Entre las funciones que cumplen las gráficas o diagramas se pueden señalar las siguientes:
Pueden evidenciar las relaciones entre los diversos elementos de un sistema o de un proceso y representar la
correlación entre dos o más variables.
• 3.1.1. Número.
• Toda gráfica debe tener un número que lo identifique, cumple el mismo objetivo que el de las tablas estadísticas,
salvo que sea una sola gráfica la que se presenta en el reporte.
• 3.1.2. Título.
• El título tiene las mismas características que la de una tabla estadística; es decir, el título es una descripción del
contenido de la gráfica, con la diferencia de que pueden ser colocados ya sean en la parte superior o en la parte
inferior de la gráfica.
• 3.1.3. Diagrama.
• Los diagramas, como el cuerpo de una tabla estadística, son usados para representar los datos mostrados en la
gráfica. Se recomienda identificar claramente las clases o categorías de clasificación, poniendo a cada uno de
ellos el nombre y si es posible el valor que le corresponde.
PRESENTACIÓN DE DATOS
• 3.1.4. Escala.
• Toda gráfica debe proveer una escala que le permita al lector, interpretar el significado de las
magnitudes de las líneas, barras u otras formas que sirvan para representar tanto a las
frecuencias como a las categorías. Las escalas se ubican generalmente en los ejes cartesianos,
cuando las gráficas son presentadas usando el plano cartesiano, con frecuencia el eje de las X o
de las abscisas son para las variables, en tanto que el eje de las Y o de las ordenadas son para las
frecuencias. El punto cero u origen debe ser indicado con claridad, en caso de que el origen y la
parte de la escala a ser usada sea muy distante se hace una línea quebrada como:
• -/\/\/\/- o se corta la línea como: -/ /-
• 3.1.5. Fuente de datos.
• Se debe indicar la fuente de donde se obtuvo los datos para construir el diagrama o la gráfica, el
cual dará mayor formalidad a la presentación.
• 3.2. Clases.
• Existe una gamma bastante extensa de diagramas y gráficas para presentar los datos, de acuerdo
a la variable o variables en estudio, los mismo se pueden clasificar de la forma siguiente:
PRESENTACIÓN DE DATOS
• 3.2.1. Con coordenadas ortogonales.
• a. Con divisiones equidistantes:
• - Histograma de frecuencias.
• - Polígono de frecuentas.
• - Pirámide poblacional
• - Ojivas.
• - Diagrama de barras.
• - Diagrama de bastones.
• - Gráfico de tendencia.
• - Gráfico de Gantt.
• - Gráfico de cajas o de bigotes
• - Gráfico de Pareto.
• - Curva de Lorenz.
• - Estereogramas. Etc.
• b. Con divisiones semi-equidistantes:
• - Gráficos logarítmicos.
• - Gráficos semilogarítmicos.
• 3.2.2. De coordenadas no ortogonales:
• - De coordenadas polares – En espiral.
• - De coordenadas triangulares.
• - De coordenadas angulares.
PRESENTACIÓN DE DATOS
• 3.2.3. Sin coordenadas:
• - De superficies – gráfico de sectores.
• La presente clasificación puede no ser completa, pues existen otras que no se les ha mencionado, pero esto no le
quita la validez e importancia de lo presentado. Por razones didácticas y de espacio no es posible presentar el
uso, la forma de construcción y las características de las diferentes gráficas enunciadas, sólo se hará de los más
conocidos e importantes y estos son los siguientes:
• Ejemplo.1.
• El siguiente cuadro corresponde a las temperaturas en grados centígrados en una ciudad determinada durante 52
PRESENTACIÓN DE DATOS
C.Nº 2.
Temperatura en Número
Xi Fi
Grados Centígrados de días
31,5 – 32,5 32,0 3 3
32,5 – 33,5 33,0 6 9
33,5 – 34,5 34.0 10 19
34,5 – 35,5 35.0 15 34
35,5 – 36,5 36.0 8 42
36,5 – 37,5 37,0 6 48
37,5 – 38,5 38.0 4 52
Total 52
14
12
N° de Alumnos
10
0
27,5 32,5 37,5 42,5 47,5 52,5 57,5
Peso en kg.
• Fuente:
PRESENTACIÓN DE DATOS
4.2. Polígono de Frecuencias:
Son polígonos formados uniendo con semirrectas los puntos medios superiores
(Xi, ni) de las barras de un histograma de frecuencias; es decir, las marcas de clase y las
frecuencias correspondientes, para cerrar el polígono, se unen también el punto medio
anterior a la primera clase y el punto medio posterior a la última clase.
Nota. - El área del polígono de frecuencias es igual al del histograma de frecuencias.
Por razones de comparación se ha incluido el polígono de frecuencias al histograma
de frecuencias. Ver F. Nº 2.
F. Nº 3. POLÍGONO DE FRECUENCIAS
16
14
12
Número de Alumnos
10
2
27.5 32.5 37.5 42.5 47.5 52.5 57.5
Peso en kg.
PRESENTACIÓN DE DATOS
• Gráfico de Tendencia:
• Son gráficas usadas generalmente para presentar series cronológicas (series de tiempo); es decir,
las fluctuaciones de los datos a través del tiempo, se les llama también cronodiagramas. Consiste en un
conjunto de semirrectas unidas entre sí, esta línea quebrada indica las variaciones que sufren los datos a
medida que transcurre el tiempo; en otras palabras, la tendencia que siguen los datos a través del tiempo,
que puede ser ascendente, descendente o estable. Los puntos a ser unidos son los puntos (X i, fi), donde Xi
es el tiempo i-ésimo al que corresponde el dato f i.
Gráfico de tendencia
7,000
6,000
AÑOS
NÚMERO DE ALUMNOS
5,000
4,000
3,000
2,000
1,000
0
2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021
AÑOS
GRÁFICO DE LA TENDENCIA
• TASA DE DESERCIÓN
PRESENTACIÓN DE DATOS
Ejemplo. Se hizo una encuesta a 88 obreros sobre su jornal. Los resultados son los
siguientes.
C. Nº 4.
Jornal fi Obreros Fi
[38, 44) 7 7
[44, 50) 8 15
[50, 56) 15 30
[56, 62) 25 55
[62, 68) 18 73
[68, 74) 9 82
[74, 80) 6 88
• Es la gráfica formada por dos histogramas de frecuencias, correspondiente a las edades de los varones
y de las mujeres de una determinada población, colocadas en forma opuesta a los intervalos de clase, que
generalmente es de 5 años (llamados cohortes), por su parte las alturas de los rectángulos corresponden a
las frecuencias, que en este caso se presentan en forma horizontal. Casi siempre en la base se representa a
las frecuencias de las edades inferiores (0, 5 años), encima de ellos al del siguiente grupo (5, 10 años) y así
sucesivamente hasta el últimoPOBLACIONAL
PIRÁMIDE grupo. En resumen,
DE UNenPAÍS
el eje
ENvertical se coloca la variable edad.
DESARROLLO
PIRÁMIDE POBLACIONAL
20
10
Personas
Mujeres
0 Varones
0 1 2 3 4 5o+
Número de Hijos
DIAGRAMA DE BARRAS
• PERSONAS
DIAGRAMA DE BARRAS
GRÁFICO DE BASTONES
• DÍAS
• DIAS
PRESENTACIÓN DE DATOS
Ejemplo:
Se hizo una encuesta a 220 alumnos ingresantes a la UNASAM, sobre el promedio
de notas que obtuvieron el quinto de secundaria, los cuales fueron agrupados de acuerdo
a sus ingresos económicos, los resultados se presentan en la siguiente gráfica.
17
218
16
15
14
Puntaje en 5to secundaria
13
12
11
10
N= 17 150 55
Vivienda
Vestido
Otros Alimentación
Educación
GRÁFICO DE SECTORES
F. Nº 13. PICTOGRAMAS
PICTOGRAMAS
• PROMEDIO DE ÁRBOLES PLANTADOS POR DÍAS EN UNA CIUDAD
PRESENTACIÓN DE DATOS
• . Gráfico de Gantt:
• El objetivo de esta gráfica es la de mostrar comparativamente las metas propuestas con las metas
alcanzadas; en otras palabras, sirve para fiscalizar el trabajo del hombre como de las máquinas, en
consecuencia, es importante para la planificación y organización científica del trabajo, razón por el cual es
muy usado por los directores y gerentes. La construcción puede tener algunas variaciones, pero todos
cuentan con barras horizontales, el número depende de la cantidad de actividades que se quieren mostrar.
CURVA DE LORENZ
MEDIDAS DESCIPTIVAS
• MEDIDAS DESCRIPTIVAS
• En los capítulos anteriores se indicó con bastante claridad, que la distribución de los datos en cuadros y
su respectiva presentación tenía un objetivo, y éste era la de describir en forma eficiente al conjunto de
datos en estudio, asimismo al ordenar y agrupar los datos se pretendía reducir el conjunto amorfo de
observaciones recolectadas, a un reducido número de características que nos den una idea lo más completa
posible de ese conjunto de datos.
• Sin embargo, esta reducción todavía puede ser incompleta, si se pretende describir con un solo un valor
las características del conjunto de datos, este único valor se llama estadístico si el conjunto corresponde a
una muestra, y parámetro si el conjunto corresponde a la población.
• En la práctica, por las razones expuestas en la Unidad I, raras veces estudiaremos poblaciones enteras; en
cambio, es más frecuente el uso de la muestra; por lo tanto, se incidirá más en el estudio del estadístico para
describir los datos, de ahí que el estadístico tomará el nombre de medida descriptiva.
• Como se dijo anteriormente para hacer descripciones, es factible tener un solo valor, de tal manera que,
por sí solo represente a todo el conjunto de datos en estudio, pero a pesar de la ventaja que tiene de
describir en forma sucinta o condensada un cúmulo de observaciones individuales, puede perder
información detallada o muy fina, el cual es compensado con otros estadísticos que complementan la
MEDIDAS DESCIPTIVAS
• Los estadísticos que se estudiarán en esta unidad, son los que describen las siguientes características:
• - La localización puede ser el centro u otro punto de la distribución; es decir, medidas de centralización y de
posición.
• MEDIDAS DE CENTRALIZACIÓN
• Si el conjunto de datos no tienen el mismo valor, entonces existirá un valor mínimo y un valor máximo,
asimismo existirá un valor que no es superior al máximo ni inferior al mínimo; es decir, un valor
intermedio, este valor típico que se empleará para representar a todos los valores individuales, se llamará
promedio o media; por lo tanto, un promedio es una magnitud que pretende identificar al centro de una
distribución, o que centraliza los datos y alrededor del cual los datos se acumulan, por ello reciben el
nombre de medida de tendencia central (tienden al centro), centralización (centralizan), de localización
MEDIDAS DESCIPTIVAS
1.1. Clases:
1.1.1. Medias fijas.
Se les llama también medias matemáticas o medidas de centralización, ya que se
ubican generalmente en el centro de la distribución y poseen las siguientes características:
- Para la obtención de su valor se usan todos los datos en estudio.
- Son afectados por los valores extremos o aislados (outliers) de los datos en estudio.
- Pueden ser sometidos a operaciones algebraicas.
Entre las medidas más conocidas podemos citar a los siguientes:
- Media Aritmética.
- Media Geométrica.
- Media Armónica.
- Media Cuadrática, etc.
X i
i 1
…………….Media Aritmética Poblacional.
N
n
X i
X i 1
………….. Media Aritmética Muestral, para datos no agrupados.
n
m
X i fi
X i 1
…………..Media Aritmética muestral, para datos agrupados
n
Donde: Xi = es el i-ésimo valor de la variable X, o la i-ésima marca de clase, en el caso
de datos agrupados
i = 1, 2, 3, ….., n o N, según sea el caso.
fi = i – ésima frecuencia absoluta simple.
N = tamaño de la población.
n = tamaño de la muestra.
m = Número de intervalos de clase.
En forma general se le puede representar como M(X), media aritmética de la variable X.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 1:
Los siguientes son notas de dos alumnos con rendimientos diferentes en un determinado
curso. Obtenga el promedio de cada alumno:
Alumno Variable Notas
A X 11, 12, 10, 14, 13
B Y 17, 15, 11, 9, 8
Solución:
5
X i
X 1 X 2 X 3 X 4 X 5 11 12 10 14 13 60
XA i 1
12
5 5 5 5
5
YY1 Y2 Y3 Y4 Y5 17 15 11 9 8 60
i 1
i
XB 12
5 5 5 5
Como se puede apreciar, ambos promedios son iguales, pero el rendimiento de los
alumnos es diferente, mientras que el alumno A va superándose, el alumno B va
decayendo en su rendimiento. Esto implica que sólo con el promedio no se puede sacar
conclusiones exactas.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 2:
Se ha registrado el número de inasistencias de los obreros a un centro laboral durante una
semana, los resultados se presentan en el siguiente cuadro. Obtenga el promedio de
inasistencias.
Nº de
Días
Inasistencias
Lunes 2
Martes 0
Miércoles 6
Jueves 7
Viernes 5
Sábado 4
Total 24
Solución:
Como la variable es cualitativa, no se usará la propia variable, sino se usará a las
frecuencias como si fueran los valores de la variable.
6
X i
X 1 X 2 X 3 X 4 X 5 X 6 2 0 6 7 5 4 24
X i 1
4 inasistencias por
6 6 6 6
día
MEDIDAS DESCIPTIVAS
Ejemplo Nº 3.
El cuadro siguiente corresponde a la distribución de los puntajes obtenidos por 100
empleados de un centro laboral después de una evaluación, obtenga el puntaje promedio
de los empleados.
Nº de
Puntaje
Empleados
40 – 50 6
50 – 60 25
60 – 70 24
70 – 80 20
80 – 90 15
90 - 100 10
Total 100
Solución:
En este caso usaremos la fórmula para datos agrupados.
6
X i fi
X 1 f1 X 2 f 2 X 3 f 3 X 4 f 4 X 5 f 5 X 6 f 6
X i 1
100 100
45(6) 55( 25) 65( 24) 75( 20) 85(15) 95(10) 6930
X 69,3 pts.
100 100
El puntaje promedio de los 100 empleados es de 69,3 pts. Para simplificar los cálculos,
se usará el siguiente cuadro.
Puntaje Xi fi Xifi
40 – 50 45 6 270
50 – 60 55 25 1375
60 – 70 65 24 1460
70 – 80 75 20 1500
80 – 90 85 15 1275
90 - 100 95 10 950
Total -- 100 6930
MEDIDAS DESCIPTIVAS
1.2.1. Propiedades de la media Aritmética.
a) La suma algebraica de las diferencias de cada uno de los valores respecto a su media
aritmética, es igual a cero.
n
(X
i 1
i X ) 0 ….. Para datos no agrupados
m
(X
i 1
i X ) f i 0 .... Para datos agrupados.
M(K) = K
c) La media aritmética de una constante por una variable, es igual a la constante por la
media aritmética de la variable.
M(XK) = K M(X)
d) La media aritmética de una variable más (menos) una constante, es igual a la media
aritmética de la variable mas (menos) la constante.
M(X K) = M(X) K
M(aX b) = a M(X) b
f) La suma de los cuadrados de las desviaciones de cada uno de los datos respecto a su
media aritmética es mínima (Teorema de Köning).
n n
(X i X )2
i 1
(X
i 1
i a ) 2 ……para datos no agrupados.
m m
( X i X )2 fi
i 1
(X
i 1
i a ) 2 f i …..para datos agrupados
MEDIDAS DESCIPTIVAS
• 1.2.2. Ventajas de la media Aritmética.
- Es un concepto muy familiar para la mayoría de las personas e intuitivamente claro y usada muy a menudo.
- Es una medida que puede ser calculada y es única. Pues cada conjunto de datos tiene una y sola una media
aritmética.
• - Para calcular su valor se usa todos los valores de los datos en estudio.
• - Es una medida bastante representativa del conjunto de datos.
• - En una gráfica de frecuencias representa el centro de gravedad
- Es sensible a cualquier cambio en los datos (puede ser usado como un detector de
variaciones en los datos).
• 1.2.3. Desventajas de la media aritmética.
- Se ve afectado por los valores extremos o aislados del conjunto de datos en estudio, por lo que no es recomendable usarlo
en distribuciones muy sesgadas.
Solución:
1310
X 13,1 km. , el campo deportivo debe construirse a 13,1 km de la ciudad A,
100
es decir entre las ciudades C Y D.
MEDIDAS DESCIPTIVAS
1.3. Media Aritmética Ponderada
En muchos casos el valor de un dato de una variable puede no tener el mismo peso
que el de los demás, por lo que es necesario ponderarlo, asignando a cada uno de ellos
pesos de acuerdo a su importancia. La media aritmética obtenida así, se llama media
aritmética ponderada y su valor se obtiene usando la siguiente expresión:
r
X i wi
X i 1
r
w i 1
i
Donde wi es la ponderación de Xi
Ejemplo Nº 6.
Un alumno obtuvo las siguientes notas en un determinado curso:
1er. examen = 11, 2do. examen = 13 y 3er. examen = 08. ¿Cuál es el promedio de notas
de este alumno, si:
a.- cada examen tiene igual peso?
b.- las ponderaciones de los exámenes son: 2, 1 y 3 respectivamente?
Solución:
3
X i
11 13 08 32
a.- X i 1
10,67 11
3 3 3
3
X i wi
11( 2) 13(1) 08(3) 59
b.- X i 1
9,833 10
r
2 1 3 6
w i 1
i
X i wi X i fi X i fi
X i 1
r
i 1
m
i 1
n
w i 1
i f i 1
i
b.- La media aritmética ponderada, también se puede obtener usando las frecuencias
relativas simples, pues:
m
hi = fi / n, wi = hi, r = m, h
i 1
i 1
r m m
X i wi X i hi X i hi m
X i 1
r
i 1
m
i 1
1
X i hi
w i 1
i h i 1
i
i 1
r r r
X i wi X i fi X i fi
X i 1
r
i 1
r
i 1
n
w i 1
i f i 1
i
MEDIDAS DESCIPTIVAS
Ejemplo Nº 7.
Después de una evaluación a los trabajadores de una empresa, divididos en tres grupos:
Profesionales, Técnicos y Auxiliares, se obtuvo la siguiente información:
Grupo Nº de
Promedio
Ocupacional Trabajadores
Profesional 12 40
Técnico 13 60
Auxiliar 09 50
Total 11,4 150
Solución:
12(40) + 13(60) + 09(50) 1710
𝑋= = = 11,4
150 150
El promedio general de los 150 trabajadores es de 11,4
MEDIDAS DESCIPTIVAS
Ejemplo Nº 8
La producción de la empresa A es el triple de la de B, y la de ésta es 25% inferior a la de
C. si los costos unitarios correspondientes, todos inferiores en 20% de sus respectivos
precios de venta, siendo los costos unitarios de 20, 24 y 28 soles respectivamente,
determinar el precio promedio de venta por unidad.
Solución:
Sea Xi el costo unitario, y Yi el precio de venta unitario, donde Xi = Yi – 0,2Yi = 0,8Yi
Luego Yi = Xi/0,8
XA = 20 soles, XB = 24 soles y Xc = 28 soles.
YA = 20/0,8 = 25 soles, YB = 24/0,8 = 30 y YC = 28/0,8 = 35 soles.
fA = Número de artículos producidos por A.
fB = Número de artículos producidos por B.
fC = Número de artículos producidos por C.
fB = fC – 0,25 fC = 0,75 fC
fA = 3 fB = 3(0,75 fC) = 2,25 fC
Precio de Número de
venta Yi artículos Yifi
producidos(fi)
25 2,25 fC 56,25 fC
30 0,75 fC 22,50 fC
35 fC 35,00 fC
Total 4 fC 113,75 fC
113 ,75
𝑌 = = 28,4375𝑠𝑜𝑙𝑒𝑠
4
MEDIDAS DESCIPTIVAS
1.4. MEDIA GEOMÉTRICA.
Se le representa por Mg. La media geométrica, es la raíz n-ésima del producto de los
n valores de los datos en estudio. Se usa como promedio de series geométricas y en ciertos
casos especiales como el índice de precios, tasas de crecimiento poblacional, tasas de
interés bancario, etc. Se puede presentar de dos formas, a saber:
Solución:
a) Media Aritmética:
2+4+6 12
𝑋= 3 = 3 =4
Media Geométrica:
3 3
𝑀𝑔 = ξ 2𝑥4𝑥6 = ξ 48 = 3,634
En este caso el promedio más representativo sería la media aritmética.
b) Media aritmética:
2+4+8 14
𝑋= = = 4,67
3 3
Media Geométrica:
3 3
𝑀𝑔 = ξ 2𝑥4𝑥8 = ξ 64 = 4
Como se puede apreciar la media más representativa sería la geométrica.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 2.
Hallar la media geométrica de los siguientes datos dados en el siguiente cuadro.
Solución:
183,1580081
𝑀𝑔 = 𝐴𝑛𝑡𝑖 𝑙𝑜𝑔 = 67,855𝑝𝑡𝑠.
100
Ejemplo Nº 3.
Suponga que se depositó mil soles en un ente financiero, y que los intereses se acumulan
a tasas variables de 5, 8, 10, 12, y 15% anual durante 5 años. Halle la tasa promedio anual
de interés.
Solución:
5 5
𝑀𝑔 = ඥ1,05𝑥1,08𝑥1,10𝑥1,12𝑥1,15 = ඥ1,6066512 = 1,09947 = 9,947%
La tasa promedio anual de interés es del 9,947%
MEDIDAS DESCIPTIVAS
1.4.3. Desventajas de la Mg.
- Su cálculo es muy engorroso.
- Está limitado sólo para valores positivos, si hay algún valor negativo, entonces el
resultado podría ser imaginario.
- Si uno o más valores son iguales a cero, la Mg es cero.
Ejemplo Nº 1.
Obtenga la media aritmética, la media geométrica y la media armónica de los siguientes
números: 3, 4 y 6.
Solución:
3 + 4 + 6 13
𝑋= = = 4,33
3 3
3 3
𝑀𝑔 = ξ 3𝑥4𝑥6 = ξ 72 = 4,16
3 3 3𝑥12
𝑀ℎ = = = =4
1 1 1 4+3+2 9
+ +
3 4 6 12
Se nota que la media armónica es la más representativa para estos tres valores.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 2.
Obtenga la media armónica de los datos que corresponden al siguiente cuadro de puntajes
de 100 alumnos.
Puntaje Xi fi
40 – 50 45 6
50 – 60 55 25
60 – 70 65 24
70 – 80 75 20
80 – 90 85 15
90 - 100 95 10
Total -- 100
Solución:
100 100
𝑀ℎ= = = 66,42𝑝𝑡𝑠.
6 25 24 20 15 10 1,50550997
+ + + + +
45 55 65 75 85 95
MEDIDAS DESCIPTIVAS
Ejemplo Nº 3.
Suponga que ha gastado seis soles por tres docenas de tornillos en una ferretería, otros 6
soles en 4 docenas de tornillos en otra ferretería y otros 6 soles por 5 docenas de tornillos
en otra ferretería. Determine el precio promedio por docena de tornillos.
Solución:
Se obtendrá en primer lugar el precio por docena de tornillo en cada ferretería.
X1 = 6/3 = 2 soles por docena, en la primera ferretería.
X2 = 6/4 = 1,5 soles por docena en la segunda ferretería.
X3 = 6/5 = 1,2 soles por docena en la tercera ferretería.
3 3 18
𝑀ℎ = = = = 1,5𝑠𝑜𝑙𝑒𝑠
1 1 1 3 + 4 + 5 12
+ +
2 1,5 1,2 6
Comprobación: Se gastó 18 soles y se compró 12 docenas, por lo tanto, el precio por
docena es igual a 18/12 = 1,5 soles por docena de tornillo.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 4.
Un automovilista recorre 600 km de una autopista, de la siguiente manera: los primeros
200 km a 90 km por hora, los segundos 200 km a 120 km por hora y los últimos 200 km
a 180 km por hora, calcule la velocidad promedio del automovilista.
Solución:
Como las velocidades y el tiempo son inversamente proporcionales se usa la media
armónica para obtener el promedio.
3 3 3𝑥360
𝑀ℎ = = = = 120𝑘𝑚/ℎ𝑟.
1 1 1 4+3+2 9
+ +
90 120 180 360
200𝑘𝑚 200𝑘𝑚 200𝑘𝑚
Comprobación: Se recorrió 600 km y se usó 90𝑘𝑚 /ℎ𝑟 + 120𝑘𝑚 /ℎ𝑟 + 180𝑘𝑚 /ℎ𝑟 =
5 hrs. por lo tanto, la velocidad promedio por hora es igual a 600/5 = 120 km/hr.
1.5.3. Propiedad.
La media armónica para datos positivos, es siempre menor o igual que la media
geométrica. Por consiguiente, se presenta la siguiente desigualdad:
Mh Mg M(X)
1.5.4. Desventaja.
Cuando por lo menos un valor del conjunto de datos en estudio es cero, la media
armónica para ese conjunto no está definida.
MEDIDAS DESCIPTIVAS
1.6. MEDIA CUADRÁTICA: Mc(X)
Es una medida poco usada y viene a ser la raíz cuadrada de la media aritmética de los
cuadrados de los valores de los datos en estudio. Se puede presentar de dos formas, a
saber:
1.6.3. Propiedad.
La media cuadrática es siempre mayor o igual a la media aritmética.
M(X) Mc(X)
Mh Mg M(X) Mc(X)
MEDIDAS DESCIPTIVAS
Ejemplo Nº 1.
Hallar la media cuadrática de los siguientes valores: 2, 3, 4, 5, 6
Solución:
22 + 32 + 42 + 52 + 62 90
𝑀𝑐(𝑋) = ඨ =ඨ = ξ 18 = 4,24264 ≈ 4,24
5 5
Ejemplo Nº 2.
Hallar la media cuadrática de los datos que se presentan en el siguiente cuadro de puntajes
de 100 alumnos.
Solución:
500300
𝑀𝑐(𝑋) = ඨ = ξ 5003 = 70,73𝑝𝑡𝑠.
100
M(X) = 69,3 pts., Mg = 67,855 pts., Mh = 66,42 pts. En este caso también se comprueba
la siguiente desigualdad.
Mh Mg M(X) Mc(X)
Nota. La igualdad se presenta cuando todos los datos son iguales
MEDIAS MATEMÁTICAS
• 1. los siguientes datos corresponden al número de accidentes ocurridos en los 5
días anteriores en una avenida de una ciudad: 12,16, 14, 10, 8; hallar las medias
matemáticas correspondientes.
• Solución.
• = = 12 accidentes por día
• Mg = = = 11.655 accidentes por día
• Mh = = = 11.3055 accidentes por día
• Mc(X) = = = 12.33 accidentes por día
• 12.33 > 12 > 11.655 > 11.3055
MEDIAS MATEMÁTICAS
• 2. El siguiente cuadro corresponde a las edades de 50 alumnos, hallar las medias matemáticas
[Edades
- años) Xi fi Xifi Xi^fi fi/Xi
Puntaje Xi fi Fi
40 – 50 45 6 6
50 – 60 55 25 31
60 – 70 65 24 55
70 – 80 75 20 75
80 – 90 85 15 90
90 - 100 95 10 100
Total -- 100
Solución:
50−31 190
𝑀𝑒 = 60 + 10 ቂ ቃ= 60 + = 67,92𝑝𝑡𝑠.
24 24
Esto indica que el 67.92 es el máximo puntaje del 50% de los alumnos con menor
puntaje y a su vez es el mínimo puntaje obtenido por el otro 50% de los alumnos con
mayor puntaje.
El cálculo de la mediana cuando los datos están agrupados, es como sigue:
- Primer paso.- Dividir el número de datos entre dos. En nuestro ejemplo es 100/2 =
50
- Segundo paso.- Ubicar la clase de la mediana. Es el primer intervalo de clase que
contiene a n/2, o a la mitad del total de datos. En nuestro caso es el de 60 – 70,
pues tiene F3 = 55 datos (puntajes). El tercer intervalo.
-Tercer paso.- Reemplazar los datos de la fórmula.
Y2 = 60 pts., F2 = 31, f3 = 24, n/2 = 100/2 = 50
MEDIDAS DESCIPTIVAS
Ejemplo Nº 2.
El siguiente cuadro muestra la distribución de los obreros según el número de faltas
a su centro laboral durante un mes determinado. Obtenga la mediana.
Nº de Nº de
Fi
faltas obreros
0 17 17
1 13 30
2 8 38
3 6 44
4 3 47
5 2 49
6 1 50
Total 50
Me = 1 falta
No es necesario usar la fórmula, a pesar de ser un conjunto de datos agrupados, pues
si se ordenan los datos en forma ascendente o descendente, como n es par, la
mediana sería la semisuma de los valores de los datos 25 y 26 y ellos son unos y por
lo tanto la mediana sería uno. Este es una variable discreta; por lo tanto, basta con
ubicar el intervalo de la clase de la mediana y con ello el valor de la marca de clase
y este valor es la mediana.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 3.
De una distribución de frecuencias simétrica de igual amplitud, de las edades de 80
empleados de una empresa, se sabe sólo algunos datos como son: f4 – f5 = 5, f3 - f4
– f5 = 5; Y1' 17,5 ; Y3' f 3 825 . Calcule la mediana y la media aritmética.
Solución:
80 = f1 + f2 + f3 + f4 + f5 = 2f5 + 2f4 + f3 = 2(f5 + f4) + f3….. (1)
f3 - f4 – f5 = 5 f3 – 5 = f4 + f5….. (2)
Reemplazando en (1)
80 = 2(f3 – 5) + f3 = 2f3 – 10 + f3
90 = 3f3 f3 = 30
De (2) se tiene: 30 – 5 = 25 = f4 + f5……(3)
Además se tiene por enunciado que f4 – f5 = 5….(4)
De (3) y (4) se obtiene f4 = 15 y f5 = 10
Por otro lado se tiene: Y3' f 3 825 Y3' (30) 825 Y3' 27,5
C ( 27,5 17,5) / 2 5
Y Yi '
'
i 1
Yi fi Fi Yi fi
12,5 – 17,5 15 10 10 150
17,5 – 22,5 20 15 25 300
22,5 – 27,5 25 30 55 750
27,5 – 32,5 30 15 70 450
32,5 – 37,5 35 10 80 350
Total 80 2000
40 25
Me 22,5 5 25 años. M(X) = 25 años
30
MEDIDAS DESCIPTIVAS
• Ejemplo 4. El siguiente cuadro corresponde a las pesos en kg de 75 bultos en un camión determinado, siendo
el ancho de clase constante, además se sabe que el 10,67 % de los bultos pesaron menos de 30 kg.
• a. ¿Qué porcentaje de los bultos tuvieron un peso de 60 o más kg?
• b. obtenga el promedio aritmético y la mediana de los pesos.
hi
[Notas) Xi fi Fi hi Hi Xifi
[Notas) Xi ni Fi
- 7.5 0.04 00 - 15 7.5 3 3 0.04 0.04 22.5
- a 15 - 30 22.5 5 8 0.0667 0.1067 112.5
- 0.12
30 - 45 37.5 9 17 0.12 0.2267 337.5
- 4a
- 67.5 5a 45 - 60 52.5 20 37 0.2667 0.4934 1050.0
- 60 - 75 67.5 25 62 0.3333 0.8267 1687.5
- 6 75 - 90 82.5 7 69 0.0933 0.92 577.5
--- 75 1.00
90 - 105 97.5 6 75 0.08 1.00 585.0
Total 75 1.00 4372.5
• a. P = [(25+7+6)/75]x100 = 50.67%
• b. M(X) = 4372.5/75 = 58.3 kg. Me = 60 + 15[(37.5 – 37)/25] = 60.3 kg
MEDIDAS DESCIPTIVAS
Ejemplo Nº 5.
Obtenga la media aritmética y la mediana del siguiente cuadro de distribución de
frecuencias, que corresponde a los ingresos mensuales en miles de soles de un
conjunto de empleados.
2-4 k
4-6 3k
6-8 7k
8 - 10 10k
10 - 12 12k
Solución:
hi Hi hi Hi
2–4 3 k k 1/12 1/12
4–6 5 2k 3k 2/12 3/12
6–8 7 4k 7k 4/12 7/12
8 – 10 9 3k 10k 3/12 10/12
10 - 12 11 2k 12k 2/12 1,0
Total 1,0 1,0
Me = 6 + 2[
MEDIDAS DESCIPTIVAS
• 1.7.1. Propiedades.
• La suma de las desviaciones absolutas de los valores de los datos con respecto a la mediana es mínima. Es decir, es
menor que la suma de las desviaciones absolutas con relación a cualquier otro valor de la distribución.
Ejemplo Nº 1.
Los siguientes datos corresponden al número de hijos de 6 personas: 2, 4, 3, 0, 1, 5.
Determine la moda.
Solución:
Como se puede apreciar en este conjunto de datos no existe ninguno que se repita más
veces que los demás, por lo tanto, en este conjunto no existe la moda.
MEDIDAS DESCIPTIVAS
• Ejemplo Nº 2.
• Los siguientes datos corresponden al número de faltas a clases en un determinado mes, de 7 alumnos: 2, 3,
2, 4, 5, 2, 1.
• Solución:
• En este conjunto existe un valor que se repite más veces que los demás y este valor es el dos, por lo tanto,
la moda es dos faltas, o la mayoría tiene dos faltas. La distribución es unimodal.
• Ejemplo Nº 3.
• Los siguientes datos corresponden al número de sanciones recibidas por dos grupos de 10 obreros durante
un año de trabajo:
• Grupo A: 4, 2, 1, 4, 2, 0, 2, 4, 1, 3.
• Grupo B: 3, 2, 4, 2, 3, 1, 0, 4, 5, 6.
• Solución:
• En el grupo A, hay dos valores que se repiten más veces que los demás, estos son el 2 y el 4, por lo tanto,
estos valores son las modas, la distribución es bimodal.
• En el grupo B existen tres valores que se repiten más veces que los demás, y estos valores son: 2, 3 y 4,
MEDIDAS DESCIPTIVAS
• 1.8.2. Moda Para datos agrupados.
• En este caso la moda se obtiene usando una fórmula, que resulta de la interpolación
de las frecuencias adyacentes a la frecuencia simple de mayor valor. La fórmula es el
siguiente:
• Donde:
•
• = Límite inferior de la clase modal.
Puntaje Xi fi
40 – 50 45 6
50 – 60 55 25
60 – 70 65 24
70 – 80 75 20
80 – 90 85 15
90 - 100 95 10
Total -- 100
Solución:
La clase modal es el segundo intervalo, por ser 25 la frecuencia absoluta simple de mayor
valor, la distribución tiene una sola moda.
(25 − 6) 19 190
𝑀𝑜 = 50 + 10 ൨= 50 + 10 ൨= 50 + = 59,5𝑝𝑡𝑠.
(25 − 6) + (25 − 24) 19 + 1 20
La mayoría de los empleados obtuvieron alrededor de 59,5 pts.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 2.
Obtenga la moda del siguiente cuadro, que corresponde al número de inasistencias de por
día, durante la semana que duró el curso.
Nº de
Días
Inasistencias
Lunes 2
Martes 0
Miércoles 6
Jueves 7
Viernes 5
Sábado 4
Total 24
Solución:
En este caso, estamos frente a una variable cualitativa, pero la moda se obtiene de acuerdo
a la mayor incidencia de los valores de la variable, por consiguiente, el día jueves es el
que presenta la mayor frecuencia, por lo tanto, la moda es el jueves.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 3.
Obtenga la moda del siguiente cuadro, que corresponde también al número de faltas de
un conjunto de obreros.
Nº de Nº de
faltas obreros
0 17
1 13
2 8
3 6
4 3
5 2
6 1
Total 50
Solución:
En este caso la variable es discreta y el tratamiento es similar a la de una variable
cualitativa, sólo se observa en que valor de la variable se presenta la mayor frecuencia
absoluta simple, en consecuencia la moda en este caso es cero faltas, es decir la mayoría
de los obreros no tiene faltas.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 4.
Obtenga la moda del siguiente cuadro de distribución de frecuencias, que corresponde a
los pesos en kg de 80 personas.
Nº de
Peso en Kg.
personas
55 – 60 5
60 – 65 15
65 – 70 20
70 – 75 20
75 – 80 15
80 – 85 5
Total 80
Solución: M(X) = 70 kg. y la Me = 70 kg
En este caso se observa que hay dos frecuencias absolutas que son los de mayor valor
(20), por consiguiente, se pensaría que estamos frente a una distribución bimodal, pero
no es así, pues hay una sola moda que es 70 kg.
Si usamos el tercer intervalo como la clase modal, la moda sería el siguiente:
( 20 15) 5
Mo 65 5 65 5 65 5 70kg .
( 20 15) ( 20 20) 5 0
Si usamos el cuarto intervalo como la clase modal, la moda sería el siguiente:
(20 − 20) 0
𝑀𝑜 = 70 + 5 ൨= 70 + 5 ൨= 70 + 0 = 70𝑘𝑔.
(20 − 20) + (20 − 15) 0+5
MEDIDAS DESCIPTIVAS
Ejemplo Nº 5.
Obtenga la moda del siguiente cuadro de distribución de frecuencias, que corresponde a
los cocientes de inteligencia de 160 alumnos.
Cociente de Nº de
inteligencia alumnos
65 – 70 10
70 – 75 15
75 – 80 20
80 – 85 30
85 – 90 25
90 - 95 20
95 - 100 30
100- 105 10
Total 160
Solución:
En esta distribución se nota que existen dos frecuencias absolutas simples separadas que
más veces se repiten (30), por consiguiente, hay dos modas y son los siguientes:
(30 − 20) 10 50
𝑀𝑜 = 80 + 5 ൨= 80 + 5 ൨= 80 + = 83,33𝑝𝑡𝑠.
(30 − 20) + (30 − 25) 10 + 5 15
(30 − 20) 10 50
𝑀𝑜 = 95 + 5 ൨= 95 + 5 ൨= 95 + = 96,67𝑝𝑡𝑠.
(30 − 20) + (30 − 10) 10 + 20 30
La distribución es bimodal.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 6
Obtenga las modas, si el cuadro anterior tuviera la siguiente configuración.
Cociente de Nº de
inteligencia alumnos
65 – 70 30
70 – 75 15
75 – 80 20
80 – 85 10
85 – 90 25
90 - 95 20
95 - 100 10
100- 105 30
Total 160
f
i 1
i 5; X
i 1
i
fi
233280; X i f i 60; f1 1 ,
i 1
• Solución
• f1 + f2 + f3 = 5, f1 = 1, f2 + f3 = 4, → f2 = 3 y f3 = 1, asimismo X2 = 12, pues = 60/5 = 12
• X1 +[Notas)
X f Xf F
12x3 + X3 = 60 → X1 + X3 = 24, (X1)(123)(X3) = 233280 → (X1)(X3) = 135 → (135/X3) +
i i 1 i i
7.5 – 10.5 9 1 9 1
X3 = 24
10.5 – 13.5 12 3 36 4
• - 24X
13.53 –+16.5 0 →1X315
135 = 15 = 15 5y X1 = 9; Me = 10.5 + 3[2.5 – 1]/3 = 12; Mo = 10.5 +
3[2/(2+2)]
Total = 12 5 60
MEDIDAS DESCIPTIVAS
• Problemas propuesto.
• 1. Si la suma de los cubos de 3 notas es igual a 6156, la mediana es igual a 11, el promedio aritmético
igual a 12, obtenga el valor de las notas y obtenga la moda, la media armónica y la media geométrica de
dichas notas.
• 2. La fábrica A produce n artículos, la fábrica B produce el doble de A y la fábrica C produce el 20% más
que B. si los costos unitarios son 108, 135 y 162 soles respectivamente, calcular el precio promedio
unitario de venta decuadro
El siguiente todos los artículos,
muestra si a cada precio
la distribución unitario
de las notassede
le un
agrega un 30%
conjunto decomo parte de las
estudiantes,
cuyo promedio aritmético es de 8,9. Con los cuales obtenga la mediana y la moda
utilidades de las notas.
• 3. %º de
Notas
alumnos
0,5 – 2,5 4
2,5 – 4,5 8
4,5 – 6,5
6,5 – 8,5 16
8,5 – 10,5
10,5 – 12,5 30
12,5 – 14,5 10
Total 100
PRÁCTICA DIRIGIDA
1.9. FRACTILES
Son estadígrafos de posición, se les conoce también como cuantiles. Son medidas que
dividen a la distribución en tantas partes como se requiera para la descripción de los
mismos. Entre ellos los más conocidos son: los Cuartiles, los Deciles y los Percentiles o
Centiles.
1.9.1. CUARTILES: QJ
Son los que dividen a la distribución en cuatro partes iguales, de tal manera que, cada
parte contiene un 25% de los datos debidamente ordenados en forma ascendente.
a) Primer Cuartil: Q1 Es el valor que supera a no más de un cuarto de las
observaciones y es superado por no más de las tres cuartas partes de ellas; es decir,
es el valor que separa el 25% de las observaciones menores o iguales a él y al 75% de
las observaciones superiores a él.
b) Segundo Cuartil: Q2 = Me Es lo mismo que la mediana.
MEDIDAS DESCIPTIVAS
c) Tercer Cuartil: Q3 Es el valor que supera a no más de las tres cuartas partes de las
observaciones y es superado por no más de una cuarta parte de ellas; es decir es el
valor que separa al 75% de las observaciones menores que él y al 25% de las
observaciones mayores que él.
d) Cuarto Cuartil Q4 = LS Abarca el 100% de los datos.
Q1 Me Q3 Q4
LI¡----------------¡---------------------¡-------------------¡-------------------¡LS
25% 25% 25% 25%
Q1 para datos no agrupados.
Cuando los datos no están en un cuadro de distribución de frecuencias, en primer lugar
se ordenan los datos en forma ascendente, luego se obtiene (n+1)/4 que es el punto de
posición donde debe estar ubicado Q1. Si este valor es entero, entonces el Q1 es el valor
del dato que se encuentra en ese lugar. Si el valor de (n+1)/4 no es un entero, entonces
hacemos una interpolación lineal entre los dos valores correspondientes a las dos
observaciones entre las cuales se encuentra la fracción.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 1.
Al examinar una muestra de 11 facturas de una empresa, se nota que se ha pagado montos
diferentes en miles de soles para un solo bien a diferentes proveedores, los mismos son
los siguientes: 8, 5, 6, 7, 9, 12, 15, 7, 13, 14, 12. Determine Q 1
Solución:
Se ordenan los datos.
5, 6, 7, 7, 8, 9, 12, 12, 13, 14, 15
Como n = 11, entonces (n+1)/4 = (11+1)/4 = 3, en consecuencia Q 1 es el tercer valor; es
decir, 7.
Ejemplo Nº 2.
Si los siguientes valores son salarios por día de 12 trabajadores seleccionados de una
empresa: 30, 29, 32, 23, 25, 27, 35, 32, 28, 31, 33, 35. Determine Q1.
Solución:
Se ordenan los datos.
23, 25, 27, 28, 29, 30, 31, 32, 32, 33, 35, 35
Como n=12, entonces (n+1)/4 = (12+1)/4 = 3,25. Esto significa que el Q1 es el tercer dato
más el 25% de la diferencia entre los valores de las observaciones tercero y cuarto, luego:
Q1 = 27 + (28 – 27)(0,25) = 27 + 0,25 = 27,25 soles.
MEDIDAS DESCIPTIVAS
• Q3 para datos no agrupados.
• Cuando los datos no están en un cuadro de distribución de frecuencias, en primer lugar se ordenan los
datos en forma ascendente, luego se obtiene 3(n+1)/4 que es el punto de posición donde debe estar
ubicado Q3. Si este valor es entero, entonces el Q 3 es el valor del dato que se encuentra en esa posición. Si
el valor de 3(n+1)/4 no es un entero, entonces hacemos una interpolación lineal entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentra la fracción.
•
• Ejemplo Nº 1.
• b) 23, 25, 27, 28, 29, 30, 31, 32, 32, 33, 35, 35
• Como n=12, entonces 3(n+1)/4 = 3(12+1)/4 = 9,75. Esto significa que el Q 3 es el noveno dato más
el 75% de la diferencia entre los valores de las observaciones noveno y décimo luego: Q3 = 32 +
MEDIDAS DESCIPTIVAS
Cuartiles para datos agrupados.
En este caso se usará la siguiente fórmula:
𝑗𝑛
−𝐹𝑖 −1
𝑄𝑗 = 𝑌𝑖'−1 + 𝐶𝑖 ቈ 4
Cuando se usa las frecuencias absolutas.
𝑓𝑖
𝑗
−𝐻 𝑖 −1
𝑄𝑗 = 𝑌𝑖'−1 + 𝐶𝑖 ቈ 4
Cuando se usa las frecuencias relativas.
ℎ𝑖
j = 1, 2, 3, 4
Ejemplo Nº 1.
Obtenga los cuartiles del siguiente cuadro de distribución de frecuencias e interprételo.
Puntaje Empleados Fi
40 – 50 6 6
50 – 60 25 31
60 – 70 24 55
70 – 80 20 75
80 – 90 15 90
90 - 100 10 100
Total 100 --
Para el tercer cuartil se obtiene 3n/4 = 300/4 = 75 y el primer intervalo que contiene a 75
es el intervalo del tercer cuartil, en este caso es el cuarto intervalo.
Q4 = 100 pts.
Como quiera que hay en total 100 empleados, cada rango intercuartil contiene 25
empleados. Esto indica que el puntaje mínimo del 25% de los empleados con más bajo
puntaje es igual a 40 pts. y el puntaje máximo es igual a 57,6 pts., de igual manera el
puntaje mínimo del 25% de los empleados con mayor puntaje es igual a 80 pts. y su
puntaje máximo es igual a 100 pts. Hay un 50 % de empleados que tienen como puntaje
mínimo 57,6 pts. y como máximo a 80 pts.
MEDIDAS DESCIPTIVAS
• Ejemplo 2.
La siguiente información corresponde al tiempo en horas en que permanecieron
almacenados, un grupo de artículos antes de ser comercializados. Y5' 90 hrs. , H6 = 1,0;
H5 = 0,9; H2 = 0,3; h3 = 0,3; h2 = 0,2; X 68 hrs. ; Me ( 200 / 3) hrs. Calcule la la moda
y el cuartil tres.
Solución:
H1 = h1= H2 – h2 = 0,3 – 0,2 = 0,1
H6 – H5 = 1,0 – 0,9 = 0,1 = h6
0,1 + 0,2 + 0,3 + h4 + h5 + 0,1 = 1,0 h4 + h5 = 0,3
0,5 0,3
Me = 200/3 = (90 – 3C) + C
0,3 200/3 – 90 = - 3C + (2/3)C -70/3 = -(7/3)C
C = 10
M(X) = 68 = 45(0,1) + 55(0,2) + 65(0,3) + 75h4 + 85 h5 + 95(0,1)
68 = 44,5 + 75h4 + 85 h5
23,5 = 75h4 + 85 h5
4,7 = 15h4 + 17 h5
0,3 = h4 + h5
De las dos ecuaciones anteriores se despeja que h4 = 0,2; h5 = 0,1; el cuadro de
distribución es como sigue:
Horas Xi hi Hi Xihi
40 - 50 45 0,1 0,1 4,5
50 - 60 55 0,2 0,3 11,0
60 - 70 65 0,3 0,6 19,5
70 - 80 75 0,2 0,8 15,0
80 – 90 85 0,1 0,9 8,5
90 - 100 95 0,1 1,0 9,5
Total 1,0 68,0
0,1
Mo 60 10 65 hrs. Q1 = 57.5 hrs., Me = Q2 = 66.67 hrs.
0,1 0,1
0,75 0,60
Q3 70 10 77,5 hrs.
0, 2
MEDIDAS DESCIPTIVAS
DECILES: DJ
Son las medidas que dividen a la distribución en 10 partes iguales, de tal manera que
cada parte contiene el 10% de las observaciones o datos.
El cálculo de los deciles para datos no agrupados, es similar a la de los cuartiles; es decir,
en primer lugar, se ordenan los datos en forma ascendente, pero son muy poco usados,
por lo que no se ahondará como en el caso de los cuartiles. En cambio, para el cálculo de
los deciles cuando los datos están agrupados se usa la siguiente fórmula.
𝑗𝑛
' −𝐹𝑖−1
10
𝐷𝑗 = 𝑌𝑖−1 + 𝐶𝑖 ቈ Cuando se usan las frecuencias absolutas.
𝑓𝑖
𝑗
' −𝐻𝑖−1
10
𝐷𝑗 = 𝑌𝑖−1 + 𝐶𝑖 ቈ Cuando se usan las frecuencias relativas.
ℎ𝑖
MEDIDAS DESCIPTIVAS
Ejemplo Nº 1.
Obtenga los deciles uno y ocho del siguiente cuadro de distribución de frecuencias.
Puntaje Empleados Fi
40 – 50 6 6
50 – 60 25 31
60 – 70 24 55
70 – 80 20 75
80 – 90 15 90
90 - 100 10 100
Total 100 --
Solución:
El 10% de los empleados con más bajo puntaje tienen como puntaje máximo a 51,6 pts.
El 20% de los empleados con mayor puntaje tienen como puntaje mínimo a 83,33 pts.
MEDIDAS DESCIPTIVAS
PERCENTILES: PJ
Se les llama también centiles. Son las medidas que dividen a la distribución en 100
partes iguales, de tal manera que cada parte contiene el uno por ciento de los datos. Estas
medidas incluyen a los cuartiles y a los deciles, e incluso a los quintiles. Los percentiles
para datos no agrupados son calculados de igual manera que para los cuartiles, pero como
no son muy usados no se les analizará por ahora. En cambio para datos agrupados, los
valores se calculan usando la siguiente fórmula, que es similar a los ya usados para la
mediana, los cuartiles y los deciles.
Pj indica que el j% de los datos están incluidos hasta este punto; en otras palabras Pj es el
valor máximo del j% de los datos.
𝑗𝑛
−𝐹𝑖−1
𝑃𝑗 = 𝑌𝑖'−1 + 𝐶𝑖 ቈ 100
Cuando se usa las frecuencias absolutas.
𝑓𝑖
𝑗
−𝐻 𝑖−1
𝑃𝑗 = 𝑌𝑖'−1 + 𝐶𝑖 ቈ 100
Cuando se usa las frecuencias relativas.
ℎ𝑖
P00 = LI
P10 = D1 P60 = D6
P20 = D2 P70 = D7
P25 = Q1 P75 = Q3
P30 = D3 P80 = D8
P40 = D4 P90 = D9
P50 = D5 = Q2 = Me P100 = D10 = Q4 = LS
MEDIDAS DESCIPTIVAS
Ejemplo Nº 1.
Obtener el percentil 5 y el 95 del siguiente cuadro de distribución de frecuencias.
Puntaje Empleados Fi
40 – 50 6 6
50 – 60 25 31
60 – 70 24 55
70 – 80 20 75
80 – 90 15 90
90 - 100 10 100
Total 100 --
Solución:
El puntaje máximo del 5% de los empleados con más bajo rendimiento es de 48,33 pts. y
el puntaje mínimo del 5% de los empleados con mayor rendimiento es de 95 pts.
MEDIDAS DESCIPTIVAS
Ejemplo Nº 4.
El siguiente cuadro muestra los gastos efectuados por 80 empresas, en remodelar sus
oficinas, los datos están dados en miles de soles. Obtenga:
a) Los cuartiles e interprételos.
b) La media, mediana y la moda.
Gasto (m. de s.) Nº de Empresas Xi Fi Xifi
0,5 – 1,5 10 1,0 10 10,0
1,5 – 2,5 15 2,0 25 30,0
2,5 – 5,5 20 4,0 45 80,0
5,5 – 10,5 15 8,0 60 120,0
10,5 – 19,5 10 15,0 70 150,0
19,5 – 30,5 6 25,0 76 150,0
30,5 – 39,5 4 35,0 80 140,0
Total 80 680,0
a)
El 25% de las empresas han gastado menos de mil ochocientos treinta soles, pero mas
de quinientos soles, en la refacción de sus oficinas. Hay otros 25% de empresas que han
gastado por lo menos diez mil quinientos soles en dicha refacción, pero menos de treinta
y nueve mil quinientos soles, y hay un 50% de empresas que han gastado de mil
ochocientos treinta soles y diez mil quinientos soles.
b)
Solución:
f1 = f8 = 10, f2 = f7, f3 = f6, f4 = f5
F7 = 200 – 10 = 190
F7 = 190 = F6 + f7 = 175 + f7 f7 = 190 – 175 = 15 = f2, F2 = 25
f1 + f2 + f3 + f4 = 100 f3 + f4 = 100 – 25 = 75
Por otro lado, se tiene que Mo = 26, es unimodal y de distribución simétrica entonces
Y4' 26
50 25
Además Q1 22 18 4 f 3 25, f 4 50
f3
MEDIDAS DESCIPTIVAS
140 100
a) P70 26 4 29,2 soles
50
b) Hay 25 + 15 + 10 = 50 obreros con este salario, por lo tanto hay (50/200)100 = 25%
de obreros.
5200
c) X 26 soles de ingreso promedio.
200
100 50
Me 22 4 26 soles de ingreso mediano.
50
25
Mo 22 4 26 soles de ingreso modal.
25 00
Las tres son iguales por ser la distribución simétrica y unimodal.
MEDIDAS DESCIPTIVAS: EJEMPLO 6
Se tiene la distribución de las edades de un grupo de alumnos, el cual tiene 5 intervalos
de clase con amplitud constante y de ella se conoce también: h1 = 0,1; h2 = 0,1; H3 = 0,4;
h4 = 0,4; Mo = 30 años; Me = 28,75 años. Determine el cuartil uno y el cuartil tres.
Solución:
h3 = H3 – h2 – h1 = 0,4 -0,1 -0,1 = 0,2; H4 = 0,1 + 0,1 + 0,2 + 0,4 = 0,8
h5 = 1 – H4 = 1,0 – 0,8 = 0,2
0,2 C
Mo = Y3' C 30 Y3' Y3' 30 C / 2
0,2 0,2 2
0,5 0,4
Me Y3' C 28,75 Y3' C / 4 Y3' 28,75 C / 4
0,4
De las dos ecuaciones anteriores se obtiene C = 5, entonces la distribución es como sigue:
Años Xi hi Hi
12,5 – 17,5 15 0,1 0,1
17,5 – 22,5 20 0,1 0,2
22,5 – 27,5 25 0,2 0,4
27,5 – 32,5 30 0,4 0,8
32,5 – 37,5 35 0,2 1,0
Total 1,0
0,25 0,20
Q1 22,5 5 23,75 años
0, 20
0,75 0,40
Q3 27,5 5 31,875 años
0,40
MEDIDAS DESCIPTIVAS: EJEMPLO 7
• El siguiente cuadro corresponde a la distribución de un grupo de docentes según
su cociente de inteligencia. a) obtenga la media, mediana y la moda. b) Obtenga
los[ cuartiles
IQ ) N°
e de [ IQ
interprételo. c) )
Obtenga Xi IQ mínimo
el fi yFi máximo
Xifi del 35% de los
Docentes
docentes con mayor IQ. 70 - 75 72.5 4 4 290
70 - 75 4
75 - 80 77.5 6 10 465
• 75 - 80 6
80 - 85 82.5 10 20 825
80 - 85 10
85 - 90 87.5 12 32 1050
85 - 90 12
90 - 95 92.5 16 48 1480
90 - 95 16
95 - 100 20 95 - 100 97.5 20 68 1950
• 2.1.1. Absolutas.
• Son las que vienen expresadas en las mismas unidades de medida de la variable en estudio, por lo tanto, son
afectados por estas unidades y los valores extremos; dentro de ellas tenemos:
• - Rango de Variación: R.
• - Desviación Media: DM(X)
• - Recorrido Intercuartílico: RIQ(X)
• - Varianza: V(X)
• - Desviación Estándar o Típica: Sx
• 2.1.2. Relativas.
• Son las que vienen expresadas en términos porcentuales. Por lo tanto, no son distorsionados por las unidades de
medida.
MEDIDAS DE DISPERSIÓN
• 2.2. Rango: R
• R = Xmáx.- Xmín
• Cuando los datos están agrupados, el rango se obtiene restando el límite superior
del último intervalo de clase menos el límite inferior del primer intervalo de clase; es
decir:
• R = LS – LI
• Cuando el último intervalo de clase no tiene límite superior o cuando el primer
intervalo de clase no tiene límite inferior, entonces es casi imposible obtener el rango.
• Se nota que, aunque en promedio las notas son iguales; sin embargo, la dispersión de las
notas no son iguales. Las notas de estadística son más variables que las notas de matemática.
• El rango, si bien brinda una primera idea acerca de la homogeneidad de los datos, tiene el
inconveniente de que es distorsionado por lo valores extremos, a veces único; en estos casos
el recorrido indica una variación exagerada, para corregir este inconveniente se usa el rango
intercuartílico, que viene a ser la diferencia entre el tercer cuartil y el primer cuartil: RIQ = Q3 –
Q1; o el recorrido interdecílico: RID = D9 – D1. En estas medidas no se usan los datos extremos.
MEDIDAS DE DISPERSIÓN
2.3. DESVIACIÓN MEDIA: DM(X)
Por los inconvenientes mencionados al describir el rango, se ha pensado en un promedio
de desviaciones de los datos respecto a un punto central, pero si se usa el promedio
aritmético como punto central, este promedio de desviaciones es igual a cero,
por una de las propiedades de la media aritmética. Por lo que se le ha reemplazado por
las desviaciones absolutas , en consecuencia, la desviación media es el promedio
de las desviaciones absolutas de cada uno de los datos respecto a su media aritmética. El
valor se obtiene usando las siguientes fórmulas.
Ejemplo Nº 1.
Obtenga las desviaciones medias de las notas dadas en el ejemplo anterior.
Solución:
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 1.
Obtenga las desviaciones medias de las notas dadas en el ejemplo anterior.
Solución:
Matemática: Estadística:
Xi Xi X Yi Yi Y
8 2 18 8
15 5 09 1
07 3 10 0
10 0 12 2
12 2 13 3
14 4 06 4
05 5 04 6
09 1 08 2
Total: 80 22 80 26
R = 4,0 – 0,5 = 3,5 mil soles; M(X) = 103.5/60 = 1.725 mil soles
36,6
DM ( X ) 0,61 mil soles 610 soles
60
MEDIDAS DE DISPERSIÓN
• Ejemplo 4
MEDIDAS DE DISPERSIÓN
• Solución
• G.1. [miles de
soles) Xi fi Fi Xi fi fi
• Q1 = 48 + 4[10 -8]/8 = 49 m.s.
• Im = 40 mil soles 40 - 44 42 3 3 126 34.5
• IM = 49 mil soles 44 - 48 46 5 8 230 37.5
• G.2. 48 - 52 50 8 16 400 28.0
• Q2 = Me = 52 + 4[20-16]/10 = 52 - 56 54 10 26 540 5.0
• 53.6 miles de soles
56 - 60 58 8 34 464 36.0
• Im = 49 mil soles 60 - 64 62 4 38 248 34.0
• IM = 53.6 miles de soles
64 - 68 66 2 40 132 25.0
• G.3
Total 40 2140 200.0
• Q3 = 56 + 4[30 - 26]/8 = 58
• mil soles
• Im = 53.6 mil soles
• IM = 58 mil soles
• G.4.
• Im = 58 mil soles
• IM = 68 mil soles
• = 2140/40 = 53.5 miles de soles, Me = 53.6 miles de soles. , Mo = 52 + 4[2/(2+2)] = 54 Mil de soles
MEDIDAS DE DISPERSIÓN
2.4. VARIANZA: V(X)
En vista de que la desviación media no tiene en cuenta los signos de las desviaciones
y que el simple promedio de las desviaciones es igual cero, se ha ideado otra medida, que
es el promedio del cuadrado de las desviaciones de los datos respecto a la media
aritmética, que es mucho más manuable que las desviaciones absolutas. Esta medida es
muy usada en la Estadística Inferencial como el análisis de varianza, por las propiedades
que posee. Su valor se obtiene usando las siguientes fórmulas:
………………….Varianza poblacional
………………….Varianza muestral
Con fines prácticos, se puede usar las siguientes fórmulas:
V(X) = 120,50/50 = 2,41 hijos2 M(X) = 75/50 = 1.5 hijos; DM(X) = 1.28 hijos
V(X) = (233/50) – (1,5)2 = 4,66 – 2,25 = 2,41 hijos2
Se nota que la segunda fórmula es más fácil que la primera.
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 4.
Obtenga la varianza para los datos del siguiente cuadro de distribución de frecuencias,
que corresponden a los ingresos en miles de soles de 60 familias de una ciudad.
Miles de soles Nº de familias
0,5 – 1,0 10
1,0 – 1,5 18
1,5 – 2,0 14
2,0 – 2,5 8
2,5 – 3,0 5
3,0 – 3,5 3
3,5 – 4,0 2
Total 60
Solución:
Xi fi Xifi (Xi X ) ( X i X )2 ( X i X )2 fi X i2 f i
0,75 10 7,50 -0,975 0,950625 9,50625 5,625
1,25 18 22,50 -0,475 0,225625 4,06125 28,125
1,75 14 24,50 0,025 0,000625 0,00875 42,875
2,25 8 18,00 0,525 0,275625 2,20500 40,500
2,75 5 13,75 1,025 1,050625 5,253125 37,8125
3,25 3 9,75 1,525 2,325625 6,976875 31,6875
3,75 2 7,50 2,025 4,100625 8,201250 28,125
Total 60 103,5 36,2125 214,75
(X i X )(Yi Y ) X Y i i
Donde: Cov( X , Y ) i 1
i 1
X Y ..Covarianza
n n
Si las variables son independientes, entonces Cov(x, y) = 0
f) Si un conjunto de datos tiene distribución normal, entonces el área comprendida entre:
f.1. abarca el 38,3% de la distribución; es decir, incluye el 38,3% de
los datos.
f.2. abarca el 68,26% de la distribución; es decir, incluye el 68,26% de
los datos.
f.3. abarca el 86,64% de la distribución; es decir, incluye el 86,64% de
los datos.
f.4. abarca el 95,44% de la distribución; es decir, incluye el 95,44% de
los datos.
MEDIDAS DE DISPERSIÓN
f.5. abarca el 98,76% de la distribución; es decir, incluye el 98,76% de
los datos.
f.6. abarca el 99,74% de la distribución; es decir, incluye el 99,74% de
los datos.
f.7. ± (3.5) abarca el 99.95% de la distribución; es decir, incluye el 99.95% de
los datos
Nota.- Las propiedades del a) a la e) son demostrables por lo que se deja al lector
demostrarlos como ejercicio.
g) Si se tienen k submuestras, niveles o estratos de tamaños ni, tales que , con
medias y varianzas, entonces la varianza de la muestra de tamaño n está dado
por la siguiente expresión:
h) si se tiene k grupos de datos con la misma media, entonces la varianza del total de los
datos es igual a
=
Si los grupos tienen diferentes cantidades de datos, pero de tal manera que
=
PROPIEDADES DE LA VARIANZA
Ejemplo Nº 1.
Los siguientes son notas de química y física de un grupo de 8 alumnos.
Química: 14, 13, 10, 09, 12, 07, 11, 12
Física: 11, 15, 12, 13, 11, 05, 06, 15
Obtenga la varianza:
a) Para cada grupo.
b) Si se le agrega a cada nota 3 puntos.
c) Si se multiplica cada nota por dos.
d) Si se multiplica por 3 y además se le agrega dos a cada nota.
e) Si se suma la nota de química y física.
Solución: a)
Química Física
Xi (Xi X ) ( X i X )2 Yi (Yi Y ) (Yi Y ) 2
14 3 9 11 0 0
13 2 4 15 4 16
10 -1 1 12 1 1
09 -2 4 13 2 4
12 1 1 11 0 0
07 -4 16 05 -6 36
11 0 0 06 -5 25
12 1 1 15 4 16
88 36 88 98
M(X) = 88/8 = 11; DM(X) = 14/8 = 1.75; M(Y) = 88/8 = 11; DM(Y) = 22/8 = 2.75
PROPIEDADES DE LA VARIANZA
b) Ahora cada nota es más 3 puntos.
Química Física
Xi ( X i X ) ( X i X )2 Yi (Yi Y ) (Yi Y ) 2
17 3 9 14 0 0
16 2 4 18 4 16
13 -1 1 15 1 1
12 -2 4 16 2 4
15 1 1 14 0 0
10 -4 16 08 -6 36
14 0 0 09 -5 25
15 1 1 18 4 16
112 14 36 112 22 98
M(X) = 112/8 = 14; DM(X) = 14/8 = 1.75; M(Y) = 112/8 = 14; DM(Y) = 22/8 = 2.75
V(X) = 36/8 = 4,5 V(Y) = 98/8 = 12,25
Las varianzas no han cambiado de valor
PROPIEDADES DE LA VARIANZA
c) Ahora cada nota es el doble del anterior.
Química Física
Xi ( X i X ) ( X i X )2 Yi (Yi Y ) (Yi Y ) 2
28 6 36 22 0 0
26 4 16 30 8 64
20 -2 4 24 2 4
18 -4 16 26 4 16
24 2 4 22 0 0
14 -8 64 10 -12 144
22 0 0 12 -10 100
24 2 4 30 8 64
176 28 144 176 44 392
M(X) = 176/8 = 22; DM(X) = 28/8 = 3.5 = 2x1.75; M(Y) = 176/8 = 22 = 2x11,
DM(Y) = 44/8 = 5.5 = 2x2.75
V(X) = 144/8 = 18 = 22 x 4,5 V(Y) = 392/8 = 49 = 22 x 12,25
PROPIEDADES DE LA VARIANZA
d) Ahora las notas son tres veces la nota anterior más dos.
Química Física
Xi ( X i X ) ( X i X )2 Yi (Yi Y ) (Yi Y ) 2
44 9 81 35 0 0
41 6 36 47 12 144
32 -3 9 38 3 9
29 -6 36 41 6 36
38 3 9 35 0 0
23 -12 144 17 -18 324
35 0 0 20 -15 225
38 3 9 47 12 144
280 42 324 280 66 882
Ejemplo Nº 1.
Obtenga los coeficientes de variación para los ejemplos dados en el acápite de las
desviaciones estándar.
Solución:
1.1.A.
1.1.B.
1.2.
COEFICIENTE DE VARIACIÓN
Ejemplo Nº 2.
n
De un conjunto de datos se sabe lo siguiente: X
i 1
i 1000 ; σ 𝑛𝑖=1 𝑋𝑖2 = 25000;
Y = 1,25 X + 120
MEDIDAS DE DISPERSIÓN
Ejemplo Nº 4.
El coeficiente de variación de los sueldos de 200 empleados de una CIA fue del 7,2%,
después de reajustar los sueldos con un aumento de 150 soles este coeficiente bajó al 6%;
sin embargo, la gerencia fija un sueldo mínimo de 850 soles, lo que beneficia a 35
empleados que antes del reajuste ganaban menos de 700 soles, con un sueldo promedio
de 600 soles mensuales. Determine el dinero necesario para pagar los nuevos sueldos.
Solución:
X = sueldo antes del reajuste.
Y = sueldo reajustado.
Y = X + 150 Y X 150
Sx
CV ( X ) x100 7,2% S x 0,072 X …(1)
X
Sy
CV (Y ) x100 6% S y 0,06Y
Y
MEDIDAS DE DISPERSIÓN
Sx Sy
• 26 = ( a + 26 + 28 + 28)/4 a = 22 años
• V(X) = (22 – 26)2 + (26 – 26)2 + (28 – 26)2 + (28 – 26)2/4 = 24/4 = 6
• Sx = 2,4495
MEDIDAS DE DISPERSIÓN
• Observación:
• Las medidas de dispersión son bastante importantes para la determinación del tipo de distribución que
se tiene, especialmente cuando se trata de la medida del rendimiento de los alumnos, de las inversiones
realizadas, de los resultados- de una investigación científica, etc., en ese sentido es preciso dar algunas
consideraciones que son de importancia para su mejor comprensión e interpretación, estos son los
siguientes:
• - Las medidas de dispersión tienen un valor mínimo que es cero, en este caso todos los datos tienen el
mismo valor; es decir, no existe variabilidad entre los datos, a medida que el valor de la medida de
dispersión crece, los datos se irán siendo más variables.
• - Si la medida de dispersión es grande, significa que los datos son bastante desiguales o dispersos, esto
significa que los datos están mezclados entre los que tienen menor magnitud y los que tienen mayor
magnitud, si estos datos fueran notas entonces tendríamos alumnos de diferente rendimiento.
• - Si la medida de dispersión es pequeña significa que los datos son homogéneos, este tipo de datos son
descritos con bastante certeza, si los datos fueran notas, entonces estaríamos frente a un conjunto
de alumnos con rendimientos parejos.
• - Si se quiere comparar la variabilidad entre dos o más grupos, es necesario que la medida de dispersión
absoluta tenga la misma unidad de medida, de lo contrario es preferible usar una medida de dispersión
relativa como el coeficiente de variación.
PRÁCTICA DIRIGIDA
• Ejercicios:
• Teoría.
• 1. Determine la veracidad o falsedad de las siguientes afirmaciones:
• a) Si la desviación estándar de una variable es 40 y a los valores de la variable se aumentan en un 40%, entonces la nueva
varianza es 3136.
• b) Tanto la desviación media como la desviación típica son afectados por los valores extremos o atípicos.
• c) La varianza indica la distancia promedio que tienen los datos con respecto a la media aritmética.
• d) El rango intercuartílico es más representativo que el rango interdecílico.
• e) El coeficiente de variación es una medida de dispersión absoluta.
• f) El cuartil cuatro es siempre superior al límite superior de la distribución.
• Práctica
• 2.- De cuatro amigos: A, B, C y D cuyas edades tienen como moda 22 años, como mediana 23
años y como promedio aritmético 24 años, se desea saber la edad de cada uno de ellos.
• 3.- Una empresa A produce artículos con un peso medio de 50 kg y una desviación estándar de
5 kg, una segunda empresa B produce los mismos artículos con un peso medio de 60 kg y una
desviación estándar de 4 kg, un comerciante compra los artículos en la proporción de 6 a 4 de
la empresa A con respecto a la empresa B. determine el peso medio y la desviación típica de
los artículos comprados por el comerciante.
PRÁCTICA DIRIGIDA
• 4.- El siguiente cuadro muestra la distribución del número de accidentes ocurridos en un año a lo largo de una autopista.
• a) obtenga la media, mediana y moda e indique la forma de la distribución.
• b) obtenga el número mínimo y máximo del 20% de accidentes ubicado en quinto superior.
• c) Obtenga los rangos e interprételos.
• d) Obtenga el coeficiente de variación e interprételo.
[ N° de N° de [ ] Xi fi Fi Xifi (Xi- (Xi-2fi
Accidentes ] Vehículos
0-2 1 20 20 20 20 -6.1 744.2
0-2 20
3-5 4 55 75 220 880 -3.1 528.55
3-5 55
6-8 25 6-8 7 25 100 175 1225 -0.1 0.25
9 - 11 20 9 - 11 10 20 120 200 2000 2.9 168.2
12 - 14 15 12 - 14 13 15 135 195 2535 5.9 522.15
15 - 17 10 15 - 17 16 10 145 160 2560 8.9 792.1
18 - 20 5 18 - 20 19 5 150 95 1805 11.9 708.05
Total 150
Total 150 1065 11025 3463.5
• A este tipo de distribución se les conoce con el nombre de sesgados hacia la izquierda, porque la
cola más larga de la distribución se extiende hacia la izquierda o datos con menor valor.
• Si se quiere una visión gráfica de los tres casos, el siguiente es un indicador, aun cuando, la
separación de las medidas no es tanto como se aprecia.
MEDIDAS DE FORMA - SESGO
MEDIDAS DE FORMA - SESGO
Coeficiente de Asimetría. CS(X)
Las fórmulas para obtener el coeficiente de asimetría son los siguientes:
a) Fórmula de Pearson:
X Mo 3( X Me )
a.1. CS ( X ) , a.2. CS ( X )
SX SX
b) Fórmula de Bowley
𝑄3 −2𝑄2 +𝑄1 P90 2 P50 P10
b.1. 𝐶𝑆(𝑋) = b.2. CS ( X )
𝑄3 −𝑄1 P90 P10
c) Fórmula de momentos o de Fisher:
M3
CS ( X ) 3
SX
Donde M3 = Es el momento de orden 3 respecto a la media.
n
(X i X )3
M3 i 1
…….. para datos no agrupados.
n
m
(X i X )3 fi
M3 i 1
……para datos agrupados.
n
3
SX = Es el cubo de la desviación estándar de la variable.
Es última fórmula proporciona una cuantificación más precisa del coeficiente de sesgo
que las demás fórmulas. La interpretación de los valores proporcionados por estas
fórmulas es como sigue:
- Si el CS(X) = 0, entonces la distribución es simétrica.
- Si el CS(X) > 0, entonces la distribución es sesgada hacia la derecha, o tiene sesgo
positivo.
- Si el CS(X) < 0, entonces la distribución es sesgada hacia la izquierda, o tiene sesgo
negativo.
MEDIDAS DE FORMA - SESGO
Ejemplo Nº 1.
El siguiente cuadro de distribución de frecuencias, corresponde a las notas obtenidas por
80 alumnos en el curso de Estadística. Determine el coeficiente de sesgo de la
distribución.
Nº de
Notas
alumnos
4-6 5
6-8 10
8 - 10 15
10 - 12 20
12 - 14 15
14 - 16 10
16 – 18 5
Total 80
Solución:
Notas Xi fi Fi Xifi X i2 f i X i3 f i
4-6 5 5 5 25 125 625 180 -1080
6-8 7 10 15 70 490 3430 160 -640
8 - 10 9 15 30 135 1215 10935 60 -120
10 - 12 11 20 50 220 2420 26620 0.0 0.0
12 - 14 13 15 65 195 2535 32955 60 120
14 - 16 15 10 75 150 2250 33750 160 640
16 – 18 17 5 80 85 1445 24565 180 1080
Total 80 880 10480 132880 800 0.0
MEDIDAS DE FORMA - SESGO
5
X 880 / 80 11 ; Mo 10 2( ) 11
55
20 15
Q1 8 2( ) 8,67
15
40 30
Q2 P50 Me 10 2( ) 11
20
60 50
Q3 12 2( ) 13,33
15
85
P10 6 2( ) 6,6
10
72 65
P90 14 2( ) 15,4
10
10480
V (X ) (11) 2 131 121 10 = 800/80
80
Sx = 3,1623
a) Pearson:
X Mo
a.1. CS ( X ) = (11 – 11)/(3,1623) = 0,0
SX
3( X Me )
a.2. CS ( X ) = 3(11 – 11)/(3,1623) = 0,0
SX
MEDIDAS DE FORMA - SESGO
b) Bowley
c) Momentos:
m m m
(X i X ) fi
3
X i
3
fi X i
2
fi
3
M3 i 1
i 1
3X i 1
2X
n n n
S X3 (3,1623)(10) 31,623
Todos los coeficientes nos indican que la distribución es simétrica, en efecto incluso
se presenta: X Me Mo = 11
MEDIDAS DE FORMA - SESGO
Ejemplo Nº 2.
El siguiente cuadro de distribución de frecuencias, corresponde también a las notas
obtenidas por 80 alumnos en el curso de Matemática. Determine el coeficiente de sesgo
de la distribución.
Nº de
Notas
alumnos
4-6 5
6-8 15
8 - 10 25
10 - 12 15
12 - 14 10
14 - 16 5
16 – 18 5
Total 80
Solución:
Notas Xi fi Fi Xifi X i2 f i X i3 f i
4-6 5 5 5 25 125 625 131.328125 -673.05664
6-8 7 15 20 105 735 5145 146.484375 -457.76367
8 - 10 9 25 45 225 2025 18225 31.640625 -35.59570
10 - 12 11 15 60 165 1815 19965 11.484375 10.04883
12 - 14 13 10 70 130 1690 21970 82.65625 237.63672
14 - 16 15 5 75 75 1125 16875 118.828125 579.28711
16 – 18 17 5 80 85 1445 24565 236.328125 1624.75586
Total 80 810 8960 107370 758.75 1285.31251
MEDIDAS DE FORMA - SESGO
10
X 810 / 80 10,125 ; Mo 8 2( ) 9
10 10
20 5
Q1 6 2( ) 8,0
15
40 20
Q2 P50 Me 8 2( ) 9,6
25
60 45
Q3 10 2( ) 12
15
85
P10 6 2( ) 6,4
15
72 70
P90 14 2( ) 14,8
5
8960
V (X ) (10,125) 2 112 102,5156 9,484375 = 758.75/80
80
Sx = 3,08
a) Pearson:
X Mo
a.1. CS ( X ) = (10,125 – 9)/(3,08) = 0,365
SX
3( X Me)
a.2. CS ( X ) = 3(10,125 – 9,6)/(3,08) = 0,511
SX
MEDIDAS DE FORMA - SESGO
b) Bowley
c) Momentos:
m m m
(X i X ) fi
3
X i
3
fi X i
2
fi
3
M3 i 1
i 1
3X i 1
2X
n n n
S X3 (3,08)(9,484375) 29,212
Todos los coeficientes nos indican que la distribución es asimétrica, con sesgo a la
derecha, es decir con sesgo positivo, en efecto incluso se presenta: X Me Mo =
10,125 > 9,6 > 9,0.
MEDIDAS DE FORMA - SESGO
Ejemplo Nº 3.
El siguiente cuadro de distribución de frecuencias, corresponde también a las notas
obtenidas por 80 alumnos en el curso de Sociología. Determine el coeficiente de sesgo de
la distribución.
Nº de
Notas
alumnos
4-6 5
6-8 5
8 - 10 10
10 - 12 15
12 - 14 25
14 - 16 15
16 – 18 5
Total 80
Solución:
Notas Xi fi Fi Xifi X i2 f i X i3 f i
4-6 5 5 5 25 125 625 -1624.7559
6-8 7 5 10 35 245 1715 -579.2871
8 - 10 9 10 20 90 810 7290 -237.6367
10 - 12 11 15 35 165 1815 19965 -10.0488
12 - 14 13 25 60 325 4225 54925 35.5957
14 - 16 15 15 75 225 3375 50625 457.7637
16 – 18 17 5 80 85 1445 24565 673.0566
Total 80 950 12040 159710 -1285.3125
MEDIDAS DE FORMA - SESGO
10
X 950 / 80 11,875 ; Mo 12 2( ) 13
10 10
20 10
Q1 8 2( ) 10
10
40 35
Q2 P50 Me 12 2( ) 12,4
25
60 35
Q3 12 2( ) 14
25
85
P10 6 2( ) 7,2
5
72 60
P90 14 2( ) 15,6
15
12040
V (X ) (11,875) 2 150,5 141,015625 9,484375
80
Sx = 3,08
a) Pearson:
X Mo
a.1. CS ( X ) = (11,875 – 13)/(3,08) = -0,365
SX
3( X Me)
a.2. CS ( X ) = 3(11,875 – 12,4)/(3,08) = -0,511
SX
MEDIDAS DE FORMA - SESGO
b) Bowley
c) Momentos:
m m m
(X i X ) fi
3
X i
3
fi X i
2
fi
3
M3 i 1
i 1
3X i 1
2X
n n n
M3 = -1285.3125/80 = - 16.0664
S X3 (3,08)(9,484375) 29,212
Todos los coeficientes nos indican que la distribución es asimétrica, con sesgo a la
izquierda, es decir con sesgo negativo, en efecto incluso se presenta: X Me Mo =
11,875 < 12,4 < 13.
MEDIDAS DE APUNTAMIENTO - CURTOSIS
• 4. MEDIDAS DE APUNTAMIENTO.
• Otra característica importante de una distribución de frecuencias es su curtosis, o sea el grado de
apuntamiento vertical o achatamiento que exhibe un polígono de frecuencias, este grado de apuntamiento, es
consecuencia de la concentración de los datos alrededor de un punto de referencia, mientras más se
concentren los datos, mayor será su apuntamiento y mientras mayor sea la dispersión de los datos respecto a
ese punto, más achatado será su polígono de frecuencias.
• a) Platicúrtica: Es cuando la forma de la distribución es achatada; esto es, cuando la distribución de los
datos es bastante dispersa alrededor del punto de referencia o valores centrales. Es menos apuntada que la
curva normal y tiene la forma de un plato o aplanada. (Plati plano)
• c) Leptocúrtica: Es cuando la concentración de los datos es bastante pronunciada alrededor del punto de
referencia o valores centrales, en consecuencia, la forma de la distribución es apuntada o levantada; es decir,
MEDIDAS DE APUNTAMIENTO - CURTOSIS
MEDIDAS DE APUNTAMIENTO - CURTOSIS
El coeficiente de la curtosis K se obtiene con las siguientes fórmulas:
a) Fórmula en función de los cuantiles:
(Q3 Q1 )
K
2( P90 P10 )
- Si K = 0,263, la distribución es mesocúrtica; e incluso se puede considerar como
mesocúrtica a una distribución si (0,125 <K< 0,375)
- Si K > 0,263, la distribución es leptocúrtica; más precisamente cuando (0,375 K
0,5)
- Si K < 0,263, la distribución es Platicúrtica; más precisamente cuando (0,125 > K
0,0)
b) Fórmula de momentos de Fisher
M4
K 4
SX
n
(X i X )4
Donde: M 4 i 1
…….. Para datos no agrupados.
n
m
(X i X )4 fi
M4 i 1
……Para datos agrupados.
n
(Momento cuatro respecto a la media)
V ( X ) ……… (Momento dos respecto a la media al cuadrado)
4 2
SX
Varianza al cuadrado
Si K = 3, entonces la distribución es Mesocúrtica. (Incluso 30,5)
Si K > 3, entonces la distribución es Leptocúrtica.
Si K < 3, entonces la distribución es Platicúrtica.
Nota. - Esta fórmula, es más precisa que la fórmula de los frectiles.
MEDIDAS DE APUNTAMIENTO - CURTOSIS
Ejemplo Nº 1.
El siguiente cuadro de distribución de frecuencias, corresponde a las notas obtenidas por
80 alumnos en el curso de Estadística, determine el tipo de apuntamiento de la
distribución.
Nº de
Notas
alumnos
4-6 5
6-8 10
8 - 10 15
10 - 12 20
12 - 14 15
14 - 16 10
16 – 18 5
Total 80
Solución:
Notas Xi fi Fi Xifi X i X ൫
𝟐
𝑋𝑖 − 𝑋൯ 𝑓𝑖 X i X fi
4
Notas Xi fi Fi Xifi X i X ൫
𝟐
𝑋𝑖 − 𝑋൯ 𝑓𝑖 X X fi
i
4
V(X) = 640/80 = 8
a) > 0,263
Tiempo en Nº de
minutos trabajadores
05 – 15 10
15 - 25 15
25 - 35 20
35 - 45 30
45 - 55 20
55 - 65 15
65 - 75 10
Total 120
a) Obtenga la medida, mediana y moda e indique la forma de la distribución.
b) Obtenga el coeficiente de variación e interprételo.
c) Obtenga el coeficiente de sesgo usando la fórmula de momentos e interprételo.
d) Obtenga el coeficiente de curtosis usando la fórmula de los momentos e
interprételo.