Está en la página 1de 83

Instituto Profesional Diego Portales

AUTÓNOMO

Asignatura

ESTADÍSTICA
GENERAL

AUTOR: LUIS FIERRO REYES

1
Instituto Profesional Diego Portales
AUTÓNOMO

AUTOR

Luís Fierro Reyes:

Profesor De Matemáticas, titulado en la Pontificia Universidad Católica de Chile. Posee


una amplia y rica experiencia pedagógica en diversas disciplinas matemáticas como por
ejemplo: Álgebra, Estadística, matemáticas Financiera, programación lineal y otras.

Inicia su carrera impartiendo docencia y especializándose en Educ. de Adultos.


Posteriormente asume como profesor en la enseñanza media formal y paralelamente se
desarrolla en ámbitos como Capacitación, Centro de Formación Técnica y actualmente
ejerce como profesor en el Instituto Profesional Diego Portales casa central Concepción,
dictando Asignaturas de su especialidad en carreras del área de la Ingeniería, Ciencias
Empresariales, Trabajo Social y Tutorías del área de la Educación a Distancia.

Dentro de su desarrollo curricular encontramos también un constante perfeccionamiento


docente, donde destacan cursos y Post títulos en metodología, Evaluación y Administración
Educacional como también un Diplomado en Estadística Educacional.

2
Instituto Profesional Diego Portales
AUTÓNOMO

INVITACIÓN AL MÓDULO

Estimado alumno

El propósito principal de este apunte es el iniciar al estudiante en la comprensión


de los aspectos elementales de la Estadística Descriptiva con el fin de otorgarle las
competencias necesarias para la organización, presentación y análisis de información
pertinentes a tu labor técnica . Es por esto que te invito a enfrentar con mucha tranquilidad
y perseverancia las unidades seleccionadas para enriquecer tu destreza matemática y para
que ello te permita desarrollar tus conductas de razonamiento lógico con un trabajo
responsable, sistemático y de una rigurosidad relativa y racional.

Este módulo de Estadística Básica ha sido creado siguiendo de muy cerca el


programa de la asignatura de las carreras profesionales del I .P. Diego Portales, en su
elaboración se han priorizado objetivos y contenidos fundamentales, para acceder al
dominio de habilidades iniciales que te permitan un eficiente comportamiento posterior en
las etapas consecutivas en la dimensión inferencial de estudios estadísticos de nivel
superior insertas en la continuación del desarrollo de tu especialidad.

También, vale la pena señalar que en el desarrollo del presente texto, se ha


considerado una instrucción programada, simple de interpretar por el alumno, que
generalmente dispone de un tiempo limitado de estudio personal; se sugiere enfrentar
perseverantemente todas las actividades de auto evaluación, propuestas al final de cada
unidad temática, para ir accediendo a capítulos progresivos en forma directa, considerando
también las instancias de consultoría establecidas por el Programa a Distancia a cargo de
tus profesores tutores.

Esperando para ti todo el éxito posible, te invito a iniciar la tarea del aprendizaje
sistemático, que te conducirá a la obtención de tus objetivos personales y profesionales.

¡¡Mucha suerte y hasta pronto!! Luis Fierro R.

3
Instituto Profesional Diego Portales
AUTÓNOMO

UNIDAD I

ANÁLISIS DE DATOS

INTRODUCCIÓN

Esta primera unidad, está diseñada para introducir al estudiante en la contextualización de


la estadística, entendida ésta, como una ciencia capaz de recolectar y analizar datos, de tal
modo que pueda transformarlos en una información que permita tomar decisiones.

Se señalaran los tipos de estadísticas que pueden aplicarse para describir las variables que
intervienen en los procesos de análisis de crecimiento y/o decrecimiento de población y
Muestra.

Se hará referencia a los conceptos de población y muestra, asociados a la estadística


Descriptiva e inferencia!, cuyas conclusiones, serán obtenidas por el estudiante, a partir de
los ejercicios de aplicación contenidos en la unidad.

OBJETIVOS

1. Señalar los tipos de estadísticas.


2. Describirlas variables estadísticas.

4
Instituto Profesional Diego Portales
AUTÓNOMO

5
Instituto Profesional Diego Portales
AUTÓNOMO

1.1 LA ESTADÍSTICA.

Es una ciencia que se encarga de recolectar y analizar datos, para transformarlos en


información que ayude a la toma de decisiones.

La estadística está ligada con el método científico y apoya la investigación en las diversas
disciplinas, principalmente en lo referente a la recopilación de datos, organización de los
mismos, presentación y análisis de ellos.

El análisis de datos recopilados a través de métodos y técnicas estadísticas, permite


describir el comportamiento de ciertos fenómenos, pronosticar situaciones relacionadas con
ellos, sobre los resultados obtenidos.

Las aplicaciones estadísticas se encuentran en diferentes disciplinas, a saber: biología,


medicina, economía, educación, psicología, ingeniería, salud, administración, negocios, co-
mercio, etcétera.

Gracias a la estadística, se pueden hacer pronósticos del tiempo y tomar precauciones


para: evitar congestiones del tránsito, prevenir accidentes, establecerla demanda de un
producto, conocer las necesidades de vivienda y además, evaluar la situación de los
negocios de una empresa, para determinar sus perspectivas en el corto, mediano y largo
plazo.

6
Instituto Profesional Diego Portales
AUTÓNOMO

1.1.1. ESTADÍSTICA DESCRIPTIVA E INFERENCIAL. POBLACIÓN Y MUESTRA.

Como se ha señalado anteriormente, la estadística tiene como función principal, transfor-


Mar los datos en información. En este proceso se distinguen dos formas estadísticas:
descriptiva e inferencial.

La estadística descriptiva es aquella que, una vez recolectados, organizados y


analizados los datos sobre una situación de interés, se preocupa de describir
las características proporcionando información asociada a dicha situación.

Por ejemplo, si se requiere información sobre la frecuencia de las licencias médicas del
personal del departamento de contabilidad de una empresa, se recogen los datos, se
ordenan, se aplican técnicas estadísticas, para el análisis correspondiente y luego se
describe la situación de ese grupo de personas.

La estadística inferencia! es aquella que a partir del análisis de datos de una muestra de la
Población en estudio, extiende las conclusiones obtenidas a toda la población de la que es
parte.

Paro comprender lo disciplina que estamos estudiando, se hace necesario conocer los
conceptos fundamentales inscritos en ella: población y muestra.

Población, es el conjunto de elementos de los cuales se requiere información y el número de


elementos que esta tiene, determina el tamaño de la población.

7
Instituto Profesional Diego Portales
AUTÓNOMO

Debemos tener en cuento que uno población puede ser finita o infinita.

Por ejemplo, la población consistente en todos las camisas producidas por una fábrica en
un día determinado, es finita, mientras que, la población formada por todos los posibles
sucesos (Caras, sellos) en tiradas sucesivas de una moneda, es infinita.

Vamos a designar con la letra N al tamaño de la población

Supongamos que se necesita información sobre las edades y el estado civil de cada uno
de los habitantes chilenos; la población en estudio, son todos los habitantes de Chile. En
estecaso la actividad se denomina censo.

La realización de un censo es una actividad compleja, de alto costo económico, lento en el


procesamiento de datos y además, permite medir sólo aspectos de tipo general. Por estas
dificultades que nos plantea el censo, es que la mayoría de las veces resulta necesario
trabajar con algunos elementos de la población que nos interesa. En tal caso estamos
trabajando con loque se denomina muestra.

Una muestra es un subconjunto (parte) de una población en estudio y el número de


elementos que ella tiene se denomina tamaño de la muestra

Designaremos con la letra n, al tamaño de la muestra

Ciertamente, al trabajar con una muestra se corre el riesgo de que los valores observados
difieran con los obtenidos en la población completa, en cuyo caso, estaremos frente a un
problema que en estadística se denomina sesgo estadístico.

Con el fin de reducir al máximo el sesgo estadístico, se debe seleccionar una muestra
Representativa, la cual se obtiene utilizando el método de muestreo aleatorio simple, en el
que cada integrante de la población tiene igual posibilidad de ser seleccionados, para formar
parte de la muestra.

Para hacer la selección de los elementos que constituirán la muestra, se puede usar
e método del sorteo, es decir, a cada integrante de la población se le asigna un
número, luego se ponen en una bolsa o en una urna, fichas o bolitas o papeles con los
números y se van sacando de a una, hasta completar la cantidad correspondiente.

8
Instituto Profesional Diego Portales
AUTÓNOMO

Otra forma de hacerlo, es usando una tabla de números aleatorios que fue
construida especialmente para este efecto. Ella consiste en una serie de dígitos
aleatoriamente (al azar) generados y enumerados en el orden que se generaron.

Puesto que en nuestro sistema numérico usa diez dígitos (0, 1, 2, 3... 9), la
probabilidad de generar aleatoriamente cualquier dígito en particular es igual a la
probabilidad de generar cualquier otro dígito. Esta probabilidad es una entre diez.
Portante si se generara una secuencia de 500 dígitos esperaríamos que
aproximadamente 50 de ellos fueran el dígito 0,50 el dígito 1,
etc.

Para usar una tabla de estas en lugar de una pecera para seleccionar la muestra, primero
es necesario asignar números de código a los miembros individuales de la población. Después
obtenemos nuestra muestra aleatoria leyendo la tabla de números aleatorios y
seleccionando aquellos individuos del marco de población cuyos números de código asignados
concuerden con los dígitos encontrados en la tabla.

¡Lo tabla de números aleatorios puedes encontrarla en cualquiera de los libros


sugeridos en la bibliografía de este curso!

En el caso que la población en estudio se encuentre separada en grupos o diferenciada


por alguna característica, se puede aplicar el muestreo aleatorio simple al interior de cada
grupo, en cuyo caso estaremos utilizando lo que se denomina muestreo aleatorio
estratificado.

En cualquier caso, mientras más grande sea el tamaño de la muestra seleccionada, me-
nores el sesgo estadístico que se produce.

9
Instituto Profesional Diego Portales
AUTÓNOMO

¿Apliquemos lo aprendido?

Se quiere obtener información sobre el promedio de sueldos que ganan los jóvenes chile-
nos recién egresados de la educación media y que ingresan por primera vez a un empleo.
Para este ejemplo, vamos a suponer que el tamaño de la población es de 32.000 personas.

Si se selecciona una muestra del 2% de la población, la muestra queda con un tamaño


igual a 640 personas y existirá mayor sesgo que si se procede a seleccionar una muestra con
el 10% del tamaño de la población; es decir, constituida por 3.200 personas. Para este caso
en particular, se ha decidido trabajar con una muestra de 640 personas.

Una vez decidido el tamaño de la muestra, existen dos alternativas de selección de la


muestra. Una, es el muestreo aleatorio simple y la otra, es el aleatorio estratificado en el
que, para este caso particular, los estratos pueden ser separados en hombres y mujeres.

Si se opta por la primera alternativa, de toda la población definida (32.000 personas), se


seleccionarán a través de la técnica del muestreo aleatorio simple las 640 primeras que
resulten del sorteo correspondiente.

Si se opta por la alternativa del muestreo aleatorio estratificado, de los 32.000 personas
que constituyen la población total, se separan en dos estratos: hombres y mujeres; luego, en

cada grupo se aplica la selección por muestreo aleatorio simple, seleccionando uno de cada
grupo alternadamente, hasta completar las 640 personas.

Si una muestra es representativa de una población, se pueden deducir importantes con-


clusiones acerca de ésta, a partir del análisis de la misma.

¡Recuerde que:

La parte de la estadística que trata de las condiciones en que las inferencias son válidas,
se llama estadística inferencia!. Aquella parte que trata, solamente, de describir y analizar
un grupo dado, sin sacar conclusiones o inferencias de un grupo mayor, se llama estadística
descriptiva.

Al no poder estar absolutamente ciertos de la veracidad de tales inferencias, se ha de


utilizar con frecuencia en estas conclusiones, el termino: probabilidad.

10
Instituto Profesional Diego Portales
AUTÓNOMO

1.1.2. VARIABLES: DISCRETAS Y CONTINUAS.

Variable se denomina a la característica que nos interesa medir o determinar, en cada


uno de los elementos, de la población en estudio.

Una variable se puede representar por un símbolo o una letra mayúscula como X, Y, H y
puede tomar un valor cualquiera dentro de un conjunto determinado. Si la variable asume
siempre un mismo valor, se denomina constante.

¡Aprendamos a través de un ejemplo¡

En un sector poblacional cualquiera, se está realizando un estudio respecto del número de


hijos que tiene cada familia que allí habita. Luego de aplicar una encuesta, se sabe que el
número de hijos de las familias del sector en estudio, fluctúa entre cero y diez hijos. En
este caso, la variable es el número de hijos.

La variable puede asumir cualquier valor del conjunto D:

D = {0,1,2,3,4,5,6,7,8,9,10}

Si nos fijamos en el ejemplo precedente, el número de hijos de una familia puede tomar
cualquiera de los valores del conjunto D, sin embargo, nunca podrá asumir valores
intermedios, como por ejemplo 3,8 hijos, ya que resultaría absurdo y fuera de lógica.

En casos como éste, en que la variable sólo puede tomar valores enteros y positivos,
diremos que se trata de una variable discreta y se expresa sólo con números enteros
positivos.

Existen casos en que la variable tiene siempre la posibilidad de asumir algún valor inter-
medio, como por ejemplo, en el caso de un estudio relacionado con estaturas, con el peso e
incluso con edades; puesto que, si bien la edad se expresa en años, podemos también
precisar los meses, los días y hasta las horas. En este caso, diremos que se trata de una
variable continua y puede tomar siempre algún valor intermedio entre dos valores
cualquiera de la variable, es decir, valores decimales o fraccionarios.

11
Instituto Profesional Diego Portales
AUTÓNOMO

¡Vamos aplicando los nuevos aprendizajes!

Un número N de hijos de una familia, puede tomar cualquiera de los valores


0 , 1 , 2 , 3 , 4,..... pero no puede ser 0.1 , 0.25 , 1.4......... ; entonces, es una variable discreta.

La altura H de un individuo puede ser 62 pulgadas, 63,8 pulgadas ó 65,8341 pulgadas,


dependiendo de la exactitud de medida y es una variable continua.

Los datos que vienen definidos por una variable discreta o continua se llaman datos
discretos o datos continuos, respectivamente.

El número de hijos en cada una de 1000 familias es un ejemplo de datos discretos, mien-
tras que las estaturas de 100 universitarios, es un ejemplo de datos continuos.

En general, las medidas dan origen a datos continuos, mientras que las enumeraciones o
conteos, originan datos discretos

TEST AUTOEVALUATIVO 1

1. De las variables siguientes, señale cuáles representan datos discretos y cuáles


datos continuos.

a) Número de acciones vendidas cada día en un mercado de valores.

b) Temperaturas registradas cada media hora en un observatorio.

c) Periodo de duración de los tubos de televisión producidos por una compañía.

d) Censos anuales del colegio de profesores.

e) Longitud de 1000 cerrojos producidos en una fábrica.

2. Determine los valores que asume la variable, en cada uno de los siguientes ejemplos y
señale si es continua o discreta.

a) Número G de litros de agua en una máquina de lavar.

b) Numero B de libros en un estante de librería.

12
Instituto Profesional Diego Portales
AUTÓNOMO

c) Suma S de puntos obtenidos en el lanzamiento de un par de dados.

d) Diámetro D de una esfera.

e) Países C de Europa.

2) Responda con sus palabras a las siguientes inquietudes:

a) ¿Puede usted decir, qué fue lo que aprendió respecto del concepto estadística?

b) ¿Para qué le sirve en su trabajo, la estadística descriptiva? Ejemplifique.

c) Al comprender los conceptos de muestra y población, ¿Podría usted señalar, a! menos,


tres situaciones, que usted identifique como posibilidad de aplicar estos conceptos?

d) ¿Qué utilidad le presta el manejo de los conceptos; variable, variable discreta y variable
continua?

e) ¿Cómo cree usted que logró aclarar los conceptos de estadísticos en la unidad?

SOLUCIÓNARIO DEL TEST AUTOEVALUATIVO 1

1. a) Discreta;

13
Instituto Profesional Diego Portales
AUTÓNOMO

b) Continua;

c) Continua;

d) Discreta;

e) Continua.

2. a) Cualquier valor, entre cero litros y hasta la capacidad máxima de la máquina. Variable
continua.

b) Desde cero hasta el mayor número de libros que puedan entrar en el estante. Variable
discreta.

c) Los puntos obtenidos en un sólo dado pueden ser 1,2,3,4,5 ó 6. Entonces la suma de
puntos del par de dados podrá ser: 2,3,4,5,6,7,8,9,10,11,12, que son los valores que
puede asumirla variable discreta.

d) Si consideramos un punto como una esfera de diámetro cero, el dominio de D son


todos los valores de cero a más infinito. Se trata de una variable continua.

e) Dominio: Inglaterra, Francia, Alemania, etc., que pueden representarse numéricamen-


te por 1, 2, 3,etc. Variable discreta.

3. a) Aprendí de qué se trata, para qué sirve, en qué se aplica, cuándo se aplica.

b) Una respuesta podría ser: "para conocer el comportamiento general del personal en sus
diferentes acciones, como por ejemplo: el uso de licencias médicas, los atrasos producidos,
etc".

c) Se relaciona con la respuesta anterior, por lo que se puede estudiar la población o una
muestra, en cada caso.

d) Posible respuesta: para ampliar mi vocabulario, para comprender mejor lo expresado por
otras personas en una conversación, para aplicarlo en situaciones de trabajo, etc.

e) Las respuestas aquí, pueden variar mucho, puesto que se refiere a reconocer las formas
de aprender que cada persona tiene.

14
Instituto Profesional Diego Portales
AUTÓNOMO

UNIDAD II

PRESENTACIONES ESTADISTICAS

15
Instituto Profesional Diego Portales
AUTÓNOMO

UNIDAD II (Presentaciones estadísticas)


INTRODUCCIÓN

Cuando hablamos de presentaciones estadísticas, nos referimos a las distribuciones de


frecuencias, intervalos y marcas de clase, que nos ayudarán a presentar gráficamente los
datos que debemos operar.

La idea es agrupar datos que están dispersos y a partir de ese ordenamiento, reconocer
dónde se producen las mayores concentraciones y la dispersión de los mismos. Con esos
elementos se pueden realizar inferencias, conclusiones que son aplicables a la población.

Las distribuciones de frecuencia, siguen sus propias reglas, de tal modo que al seguirlas, el
alumno podrá expresarlas en un cuadro que ordena y orienta la operación de los datos
agrupados. La representación gráfica de los datos, permiten mayor claridad y posibilita un
importante apoyo a la interpretación de la información procesada.

16
Instituto Profesional Diego Portales
AUTÓNOMO

OBJETIVOS

1. Calcular distribuciones de frecuencias, intervalos y marcas de clase.

2. Representar gráficamente los datos de presentaciones estadísticas.

17
Instituto Profesional Diego Portales
AUTÓNOMO

2.1. DISTRIBUCIÓN DE FRECUENCIAS.

Vamos a conocer acerca de las frecuencias, cómo se distribuyen, pero antes vamos al
Punto siguiente:

2.1.1. CÁLCULO DE DISTRIBUCIONES. FRECUENCIAS, INTERVALOS Y MARCA


DE CLASE.

Cuando se dispone de gran número de datos, es útil distribuirlos en clases o categorías y


determinar el número de casos pertenecientes a cada clase, lo que se denomina frecuencia
de clase. Esto es, dicho de otra forma, concentrar el número de veces que se repite el caso
o la característica estudiada.

La ordenación tabular (en una tabla), de los datos ordenados con sus correspondientes
frecuencias, se conoce como una distribución de frecuencias o tabla de frecuencias.

Una técnica para construir una distribución de frecuencias si solo se conoce la nube de
datos a presentar es la siguiente:

Los datos siguientes representan unidades de cierto producto vendidos en una tienda
durante 7 semanas y han sido ordenados de menos a mayor:

63 68 71 74 76 78 81 84 85 89

66 70 73 75 76 79 82 84 85 90

67 71 73 75 76 79 82 85 86 92

68 71 74 75 77 79 84 85 86 94

• Se determina el Rango o recorrido de la variable, que está dado por:

R = x max − x min = 94 − 63 = 31

18
Instituto Profesional Diego Portales
AUTÓNOMO

• Se decide el número de clases o intervalos a considerar. Se sugiere emplear el


siguiente criterio:

k = 1 + 3.3 log n
k = 1 + 3.3 log 40
k ≈7

• Se obtiene al amplitud o tamaño del intervalo de la siguiente forma:

R
A=
k
31
A=
6
A = 5.2 ≈ 5

• Se seleccionan los límites de clase que definen los intervalos, de manera que las
clases sean del mismo tamaño.

• Se cuenta el número de observaciones en cada clase , es decir las frecuencias


absolutas respectivas.

La distribución queda así:

Clase xi fi hi (%) Fi (−) H i (−) Fronteras


60 - 64 62 1 2,5 1 2.5 59.5 - 64.5
65 - 69 67 4 10 5 12.5 64.5 - 69.5
70 - 74 72 8 20 13 32.5 69.5 - 74.5
75 - 79 77 11 27.5 24 60 74.5 - 79.5
80 - 84 82 6 15 30 75 79.5 - 84.5
85 - 89 87 7 17.5 37 92.5 84.5 - 89.5
90 - 94 92 3 7.5 40 100 89.5 - 94.5
n = 40 100

Observación: Los límites 60 - 64 - 65 - 69 - ……………….. Son Aparentes, mientras que


(como se trata de variable cuantitativa continua), se llama limites Reales o Fronteras a los
presentados en la última columna.

19
Instituto Profesional Diego Portales
AUTÓNOMO

2.1.2. INTERVALOS DE CLASE.

• Un símbolo que define una clase, tal como 60 - 64 de la tabla anterior, se conoce
como Intervalo de clase. Los números extremos, 60 y 64, son los límites aparentes
(como ya hemos dicho) de la clase

2.1.3. MARCA DE CLASE.

La marca de clase se designa por xi , es el punto medio de cada intervalo de clase y se


obtiene sumando los límites inferior y superior de cada clase y dividiendo dicha suma en 2

60 + 64
Así, la marca de clase del intervalo 60 - 64 es = 62 . La marca de clase se llama
2
También punto medio de la clase.

2.2. PRESENTACIONES ESTADÍSTICAS. REPRESENTACIÓN GRÁFICA


DE LOS DATOS.

2.2.1. HISTOGRAMA.

La histograma consiste en una serie de rectángulos que tienen:

a) Sus bases sobre un eje horizontal (el eje X) con centros en las marcas de clase y longitud
igual al tamaño de los intervalos de clase.

b) Superficies proporcionales a las frecuencias de clase.

Si los intervalos de clase tienen igual tamaño, las alturas de los rectángulos son proporcio-
nales a las frecuencias de clase y se acostumbra en tal caso, a tomarlas alturas
numéricamente iguales a las frecuencias de clase. Si los intervalos de clase no son de igual
tamaño, esas alturas deben ser calculadas.

20
Instituto Profesional Diego Portales
AUTÓNOMO

2.2.2. POLÍGONO DE FRECUENCIAS.

Un polígono de frecuencias es un gráfico de línea trazado sobre las marcas de clase.


Puede obtenerse uniendo los puntos medios de los techos de los rectángulos en el
Histograma.

El histograma y el polígono de frecuencias, correspondiente a la distribución de frecuen-


cias de las alturas de los estudiantes, se muestran en el mismo sistema de ejes en la
siguiente figura. Se acostumbra a prolongar el polígono con PQ y RS hasta las marcas de
clase inferior y superior inmediatas, que corresponderían a la clase de frecuencia cero. En
tal caso, la suma de las áreas de los rectángulos del histograma es igual al área tota!
limitada por el polígono de frecuencias y el eje X.

Ejemplo: La tabla siguiente muestra los Salarios semanales de 100 trabajadores no


calificados

Salario – semanal xi (marca de fi


(dólares) clase)
240 - 259 249.5 7
260 - 279 269.5 20
280 - 299 289.5 33
300 - 319 309.5 25
320 - 339 329.5 11
340 - 359 349.5 4
Total=100

21
Instituto Profesional Diego Portales
AUTÓNOMO

Ejemplos: En la figura anterior se muestra un histograma y un polígono de frecuencias de la


distribución de frecuencias de los salarios semanales de la tabla asociada.

2.2.3. CURVAS DE FRECUENCIA.

Observación: Una curva de frecuencias es un polígono de frecuencias suavizado.

El conjunto de datos puede considerarse normalmente como perteneciente a una muestra


extraída de una población grande. A causa de las muchas observaciones que podemos
realizar en la población, es posible teóricamente (para datos continuos) elegir los intervalos
de clase muy pequeños y todavía, tener un número adecuado de observaciones dentro de
cada clase.
Así, se tiene que el polígono de frecuencias o el de frecuencias relativas, para una
población grande, puede estar formado por muchos pequeños segmentos rectos que

22
Instituto Profesional Diego Portales
AUTÓNOMO

aproximan el conjunto a una curva, las curvas de este tipo pueden llamarse curvas de
frecuencias o curvas de frecuencias relativas, respectivamente.

EJEMPLO La figura siguiente es una curva de frecuencias de la distribución de salarios


semanales de la tabla asociada (salario de los 100 trabajadores)

2.2.4. TIPOS DE CURVAS DE FRECUENCIA.

En términos de asimetría, una curva de frecuencias puede ser:

1) asimétrica negativa: no simétrica con la “cola" a la izquierda

2) asimétrica positiva: no simétrica con la “cola" a la derecha

23
Instituto Profesional Diego Portales
AUTÓNOMO

3) simétrica.

Además, en términos de curtosis, una curva de frecuencias puede ser:

1) platicúrtica: plana, con las observaciones distribuidas en forma relativamente pareja


entre las clases

2) leptocúrtica: afilada, con las observaciones concentradas en un estrecho rango de


valores

3) mesocúrtica: ni plana ni afilada en términos de la distribución de los valores observados.

24
Instituto Profesional Diego Portales
AUTÓNOMO

2.2.5. DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAS.

Una distribución de frecuencias acumuladas identifica el número acumulado de


observaciones incluidas bajo el límite exacto superior de cada clase de la distribución. Las
frecuencias acumuladas de una clase pueden determinarse sumando las frecuencias
observadas de esa clase a las frecuencias acumuladas de la clase anterior.

Reconoceremos 2 tipos de Frecuencia acumulada:

• Del tipo “ y menos que” ( Fi (−) )


• Del tipo “ y más que” ( Fi (+ ) )

Volvamos a nuestra tabla de trabajo y agreguemos la Frecuencia acumulada correspondiente

Salario – semanal xi (marca de fi Fi (−) Fi (+ )


(dólares) clase)
240 - 259 249.5 7 7 100

25
Instituto Profesional Diego Portales
AUTÓNOMO

260 - 279 269.5 20 27 80


280 - 299 289.5 33 60 47
300 - 319 309.5 25 85 22
320 - 339 329.5 11 96 11
340 - 359 349.5 4 100 7
Total=100

• La lectura de la frecuencia F3 (−) = 60 es: “ 60 trabajadores ganan 299 o menos


dólares (hasta 299)

• La lectura de la frecuencia F3 (+) = 47 es: “ 47 trabajadores ganan 280 o más


dólares (a lo menos 280)

La gráfica de una distribución de frecuencias acumuladas se llama ojiva. En el caso de


distribuciones acumuladas del tipo "y menor que" ( Fi (−) ) , esta gráfica indica las
frecuencias acumuladas bajo cada límite exacto de clase de la distribución de frecuencias.
Si esa gráfica de líneas se suaviza, se obtiene la curva llamada ojiva.

2.2.6. DISTRIBUCIÓN DE FRECUENCIA RELATIVA. ( hi )

La frecuencia relativa de una clase o de un intervalo, es la frecuencia de la clase dividida


por el total de casos (N) y se expresa generalmente en forma porcentual

26
Instituto Profesional Diego Portales
AUTÓNOMO

Por ejemplo, la frecuencia relativa de la clase 280 - 299 de la tabla anterior es h3


33
= = 0.33 , lo que al expresarse en porcentaje queda como 33%.
100

La suma de las frecuencias relativas de todas las clases es evidentemente 1 ó 100%,


según se exprese.

Si completamos con frecuencias relativas la tabla anterior, tendríamos:

Salario – semanal xi (marca de fi hi


(dólares) clase)
240 - 259 249.5 7 0.07
260 - 279 269.5 20 0.20
280 - 299 289.5 33 0.33
300 - 319 309.5 25 0.25
320 - 339 329.5 11 0.11
340 - 359 349.5 4 0.04
Total=100 Total=1

Ya hemos dicho que una buena lectura de la frecuencia relativa es la porcentual, o sea
nuestra tabla quedaría:

Salario – semanal xi (marca de fi hi h%


(dólares) clase)
240 - 259 249.5 7 0.07 7
260 - 279 269.5 20 0.20 20
280 - 299 289.5 33 0.33 33
300 - 319 309.5 25 0.25 25
320 - 339 329.5 11 0.11 11
340 - 359 349.5 4 0.04 4
Total=100 Total=1 Total=100

Para no caer en confusiones, elaboremos otra distribución:

Puntajes de una prueba de Mat. de un curso del C.F.T. :

27
Instituto Profesional Diego Portales
AUTÓNOMO

Puntajes xi (marca de clase) fi hi h%


9 - 20 14.5 2 0.04 4
21 - 32 26.5 5 0.10 10
33 - 44 38.5 9 0.18 18
45 - 56 50.5 12 0.24 24
57 - 68 62.5 11 0.22 22
69 - 80 74.5 11 0.22 22
Total = 50 Total = 1 Total = 100

Agreguemos ahora las respectivas frecuencias acumuladas:

Puntajes xi fi hi h% Fi (−) Fi (+ ) H i (−) H i (+ )


9 - 20 14.5 2 0.04 4 2 50 4 100
21 - 32 26.5 5 0.10 10 7 45 14 96
33 - 38.5 9 0.18 18 16 36 32 86
44
45 - 50.5 12 0.24 24 28 24 56 68
56
57 - 62.5 11 0.22 22 39 13 78 44
68
69 - 74.5 11 0.22 22 50 2 100 22
80
Totales 50 1 100

Interpretemos los valores del 4º renglón:

Valores Interpretación

28
Instituto Profesional Diego Portales
AUTÓNOMO

45 - 56 Intervalo de puntajes en estudio

xi = 50.5 La marca de clase o valor central del intervalo en estudio es 50.5

fi = 12 Hay 12 alumnos que obtienen puntajes del intervalo

hi = 0.24 La frecuencia relativa es 0.24 (razón entre fi y el total de alumnos)

h% = 24 Un 24 % de alumnos obtuvo puntajes del intervalo en estudio

Fi (−) = 28 28 alumnos obtienen 56 o menos puntos

Fi (+ ) = 24 24 alumnos obtienen 45 o más puntos

H i (−) = 56 Un 56 % de alumnos obtiene 56 o menos puntos

H i (+ ) = 68 Un 68 % obtiene 45 o m

Las representaciones gráficas de distribuciones de frecuencia relativa pueden obtenerse


del histograma o del polígono de frecuencias, cambiando sólo la escala vertical de
frecuencia, a frecuencia relativa, conservándose exactamente el mismo diagrama que se
muestra en el 2.5 de este capítulo.

29
Instituto Profesional Diego Portales
AUTÓNOMO

TEST AUTOEVALUATIVO 2

1. La tabla muestra una distribución de frecuencias de los salarios semanales en dólares de


65 empleados de una empresa privada imaginaria.

Salarios (dólares) f i (Número de


empleados)
50 – 59.99 8
60 – 69.99 10
70 – 79.99 16
80 – 80.99 14
90 – 90.99 10
100 - 109.99 5
100 - 109.99 2

Total 65

30
Instituto Profesional Diego Portales
AUTÓNOMO

Con referencia a esta tabla determinar:

a) El límite inferior de la sexta clase.

b) El límite superior de la cuarta clase.

c) La marca de clase (o punto medio) de la tercera clase.

d) Los límites reales de la quinta clase.

e) Tamaño del quinto intervalo de clase.

f) Frecuencia de la tercera clase.

g) Frecuencia relativa de la tercera clase.

h) Intervalo de clase que tiene mayor frecuencia.

i) Porcentaje de empleados con salarios menores a $80 por semana.

j) Porcentaje de empleados con menos de $100 pero con $60 semanales al menos.

2. Si las marcas de clase en una distribución de frecuencias de pesos de estudiantes


son
128 , 137, 146 , 155 , 164 , 173 y 182 libras, hallar:

a) El tamaño de intervalo de clase.

b) Los límites reales de clase.

c) Los límites de clase, suponiendo los pesos medidos con aproximación de unidad de libra.

3. Construir una distribución de frecuencias acumuladas del tipo “menos que “y “mas
que “, a partir de la distribución de Frecuencias del problema 1 e interprete la
tercera clase.

31
Instituto Profesional Diego Portales
AUTÓNOMO

SOLUCIÓN TEST AUTOEVALUATIVO 2

1.
a) 100;

b) 89,99

99 . 99 + 100
c) Marca de clase de la tercera clase: = 89 . 995 . En la práctica se redondea a
2
75.

90 + 89.99
d) Límite real inferior de la quinta clase: = 89.995 . Límite real superior de la
2
99.99 + 100
quinta clase : = 99.995
2

32
Instituto Profesional Diego Portales
AUTÓNOMO

e) Tamaño del quinto intervalo de clase = límite real de la quinta clase - límite real inferior
de la quinta clase = 99,995 - 89,995= 10. En este caso todos los intervalos de clase tienen
el mismo tamaño, 10.

f) 16;

16
g) = 0.246 = 24.6%
65

h) 70 - 79,99. Este se conoce también como intervalo de clase modal. Su frecuencia se


llama entonces frecuencia de clase modal

i) Número total de empleados con menos de 80 por semana = 16+10+8= 34. Porcentaje
34
pedido = 52.3%
65

j) Número de empleados con menos de 100 pero con 60 al menos = 10+14+16+10= 50.
50
Porcentaje pedido = 76.9%
65

2.
a) Tamaño de intervalo de clase = diferencia común entre las sucesivas marcas de clase
=137 – 128 = 146 - 137= ...... = 9

b) Puesto que todos los intervalos de clase tienen igual tamaño, los límites reales de clase
están en los puntos medios entre las marcas de clase, y así tenemos los valores:
128 + 137 137 + 146 173 + 182
, ............. , es decir: 132.5, 141.5, 150.5,….., 177.5
2 2 2
El límite real inferior de la primera clase es 132.5 - 9 = 123.5 y el límite real superior de
la última clases es 177.5 + 9 = 186.5, puesto que el tamaño común para todos los Intervalos
de clase es 9 libras. Entonces todos los límites reales de clase vienen dados por

33
Instituto Profesional Diego Portales
AUTÓNOMO

123.5 ; 132.5 ; 141.5 ; 150.5 ; 159.5 ; 168.5 ; 177.5 ; 186.5;

c) Puesto que los límites de clase son números enteros, elegimos los más próximos a los
limites reales de clases, o sea : 123 , 124 , 132, 133 , 141 , 142 , ……. Entonces la primera
clase tiene de límites: 124 – 132; la segunda 133 – 141, etc.

3.

Salarios (dólares) fi Fi (−) Fi (+ )


50 – 59.99 8 8 65
60 – 69.99 10 18 55
70 – 79.99 16 34 39
80 – 80.99 14 48 25
90 – 90.99 10 58 15
100 - 109.99 5 63 10
100 - 109.99 2 65 8
Total 65

Tercera clase:

Valores Interpretación

70 - 79.99 Salarios desde 70 dólares hasta 79.99 dólares

f i = 16 16 operarios ganan desde 70 a 79.99 dólares

Fi (−) =34 Hay 34 operarios que reciben 79.99 o menos dólares

Fi (+ ) =39 Hay 39 operarios que reciben 70 más dólares

34
Instituto Profesional Diego Portales
AUTÓNOMO

35
Instituto Profesional Diego Portales
AUTÓNOMO

UNIDAD III

MEDIDAS DE TENDENCIA CENTRAL

UNIDAD III
INTRODUCCIÓN

En esta unidad aprenderemos a calcular las medidas de tendencia central para datos
agrupados y no agrupados, entre las cuales encontraremos la media aritmética, mediana,
cuarteles deciles y percentiles.

36
Instituto Profesional Diego Portales
AUTÓNOMO

A través de las fórmulas que se presentan, el alumno estará capacitado para obtener un
Sin número de porcentajes de acuerdo a la variable, como por ejemplo, edad, cantidad,
capacidad, valores, etc.

El comportamiento típico de un conjunto de puntajes y su descripción, se realiza median-


te los indicadores estadísticos y que se exponen, para que el alumno aplique y compruebe si
su aprendizaje se profundiza a medida que avanza en el estudio. Los valores de las variables
posibilitan la aplicación y el cálculo de cómo se divide la distribución.

OBJETIVOS

Calcular medidas de tendencia central para datos agrupados y no agrupados

37
Instituto Profesional Diego Portales
AUTÓNOMO

3.1. MEDIDAS DE TENDENCIA CENTRAL.

En esta unidad aprenderemos a calcular las medidas de tendencia central para datos no
agrupados y agrupados, entre las cuales encontraremos la media aritmética, moda, mediana,
cuartiles, deciles y percentiles.

Las medidas de tendencia central, son indicadores estadísticos que permiten describir el
com-
portamiento típico de un conjunto de puntajes.

38
Instituto Profesional Diego Portales
AUTÓNOMO

3.1.1. MEDIA ARITMÉTICA PARA DATOS NO AGRUPADOS.

La media aritmética, llamada también Media, es el promedio de los valores que asume la
Variable.

La media aritmética de un conjunto cualquiera con N elementos, se representa por x
y se define como la sumatoria (se anota con la letra sigma, se escribe ) de todos los ∑
xi Dividida por el total de datos, N . Es decir:


x=
∑x i

Calcular la media aritmética de los números 8 , 3 ,5 ,12 y 10, Para ello aplicamos nuestra
fórmula:

− 8 + 3 + 5 + 12 + 10
x= =
5

38
=
5

7.6

Esto quiere decir que la media aritmética buscada es igual a 7,6.

Ahora bien, si los números x1 , x 2 , x3 , .......x k se presentan con frecuencias


f1 , f 2 , f 3 ,..............., f k Veces, respectivamente, la media aritmética es:


x=
∑x i ⋅ fi
N

Donde N = ∑f i , N es la suma total de las frecuencias, es decir, indica el número total de


casos.

¡Aclaremos con un ejemplo!

En un grupo de 10 niños, sus edades se distribuyen de la siguiente forma:

39
Instituto Profesional Diego Portales
AUTÓNOMO

Tres niños tienen 5 años, dos tienen 8 años, cuatro tienen 6 años y uno tiene 2 años.
Se quiere conocerla edad promedio de los niños, es decir, estadísticamente se requiere
calcular la media aritmética, por lo tanto ordenaremos los datos en una tabla:

xi fi
5 3
8 2
6 4
2 1
N =10

Con estos datos, calculamos la media aritmética:

− 5 ⋅ 3 + 8 ⋅ 2 + 6 ⋅ 4 + 2 ⋅1
x= =
10

15 + 16 + 24 + 2
=
10

5.7

Por lo tanto, la edad promedio del grupo de niños, es 5,7 años.


Como se puede apreciar en los datos del ejemplo, ningún niño tiene la edad promedio.
Esto suele ocurrir en diferentes aplicaciones; entonces resulta conveniente señalar que la
media es un valor representativo de la variable que no necesariamente es asumido por
alguna de las personas que integran el grupo en estudio.

3.1.2. MEDIA ARITMÉTICA CALCULADA A PARTIR DE DATOS AGRUPADOS.

En los datos agrupados, el valor de la variable se presenta en intervalos, por lo que para
calcular la media aritmética, será necesario usar la marca de clase y se asignará por xi .
Entonces para calcularla, usaremos la siguiente fórmula:


x=
∑x i ⋅ fi
N

40
Instituto Profesional Diego Portales
AUTÓNOMO

Donde xi es la marca de clase de cada intervalo.

Cada marca de clase se multiplica por la correspondiente frecuencia, luego se suman


los productos obtenidos y se divide por N o sea por el total de casos.

¡Apliquemos esto!

En una pequeña empresa, los sueldos de 50 trabajadores se distribuyen entre 100 mil y
599 mil pesos, como lo indica la siguiente tabla. Se requiere conocer el sueldo promedio de
los Trabajadores.

Sueldos (en miles de fi xi xi ⋅ f i


pesos)
100 - 199 6 149.5 897
200 - 299 8 249.5 1996
300 - 399 15 349.5 5242.5
400 - 499 12 449.5 5394
500 - 599 9 549.5 4945.5
N = 50 ∑ = 18475

Asi:


x=
∑x i ⋅ fi
N

− 18475
x= = 369.5
50

Por lo tanto, el sueldo promedio de los trabajadores de la empresa es $369.500.

¡Resulto fácil!

3.1.3. MODA.

41
Instituto Profesional Diego Portales
AUTÓNOMO

La moda en una distribución de frecuencias se define como el valor de la variable que


registra la mayor frecuencia absoluta

En una serie de números, la Moda es aquel valor que se presenta con la mayor frecuencia,
es decir, es el valor más común. Puede presentarse el caso de que exista más de una Moda y
también puede ocurrir que la Moda no exista.

Para comprenderlo mejor, aplicaremos esto a un ejemplo;

En la serie de números 2 , 2 ,5 , 7, 9 , 9, 9 , 10 , 10 , 11 ,12 , 18 la moda es 9 ya que el valor


9 es el único que se repite tres veces (presenta la más alta frecuencia); en cambio, en la
serie
3 , 5 , 8 , 10 , 12 , 15 , 16 no se presenta moda, pues todos los números se presentan sólo
una vez y finalmente, en la serie 2, 3 , 4 , 4 , 4 , 5, 5 , 7 , 7 , 7 , 9 se presentan dos modas, 4
y 7, ambas con frecuencia tres, en cuyo caso diremos que la serie es bimodal .Asi:

• Una distribución con una sola moda, se denomina unimodal


• Si la distribución tiene más de dos modas la llamaremos multimodal

En una distribución de frecuencias con datos agrupados, la moda se encuentra en el


intervalo donde se registra la mayor frecuencia y para calcular su valor exacto, usaremos la
siguiente fórmula:

⎡ d1 ⎤
Mo = L1 + ⎢ ⎥ ⋅C
⎣ d1 + d 2 ⎦
Donde:

42
Instituto Profesional Diego Portales
AUTÓNOMO

L1 = Limite real inferior del intervalo en que se encuentra la moda.

d 1 = Diferencia entre la frecuencia en que se ubica la moda y la frecuencia del intervalo


anterior a ella.

d 2 = Diferencia entre la frecuencia en que se ubica la moda y la frecuencia del intervalo


siguiente a ella.

C = tamaño o amplitud de intervalo (limite real superior- límite real inferior)

¡Apliquemos esto!
Calcularemos la moda en la siguiente distribución de frecuencias que muestra los puntajes
Obtenidos por un grupo de 400 deportistas, en un test de resistencia:

Puntajes fi

100 - 199 14
200 - 299 46
300 - 399 58
400 - 499 76
500 - 599 68
600 - 699 62
700 - 799 48
800 - 899 22
900 - 1000 6
N = 400

Sabemos que en una distribución de datos agrupados, la moda se encuentra en el interva-


lo de mayor frecuencia. La mayor frecuencia es 76, por lo que la moda se encuentra entre
los 400 y 499 puntos. Ahora apliquemos la fórmula:
⎡ d1 ⎤
Mo = L1 + ⎢ ⎥ ⋅C
⎣ d1 + d 2 ⎦

Los datos son los siguientes:

43
Instituto Profesional Diego Portales
AUTÓNOMO

L1 =399,5

d 1 =76-58=18

d 2 = 76 - 68 = 8

C =100

Por lo tanto tenemos:

⎡ d1 ⎤
Mo = L1 + ⎢ ⎥ ⋅C
⎣ d1 + d 2 ⎦

⎡ 18 ⎤
= 399.5 + ⎢ ⋅ 100
⎣18 + 8 ⎥⎦

= 468.73

Finalmente, como la moda es 468,5; implica que el puntaje que más se repitió entre los
deportistas, en el test aplicado, es 468,5 puntos.

3.1.4. MEDIANA.

La mediana es el valor de la variable que divide la distribución en dos partes iguales, es


decir, deja sobre y bajo sí al 50% de los casos.

En los datos no agrupados, si el estudio considera un número de elementos impar, la


Mediana es el valor central de ellos, pero si el número de datos es par, corresponde al
promedio de los dos valores centrales.

Tomemos los siguientes casos como ejemplos para aplicar lo expresado.

En el conjunto de datos M = { 3 , 4 , 4 , 5 , 6 , 7 , 7, 9,10 } la mediana es 6, porque el


conjunto tiene nueve elementos, tiene número impar de elementos y el valor central es 6

44
Instituto Profesional Diego Portales
AUTÓNOMO

En el conjunto de datos T = {5 , 5 , 6 , 9 , 11 , 13 , 16 , 20 } , la mediana es 9+11 12 = 20/2 =


10, porque el conjunto tiene número par de elementos, entonces se calculó el promedio de
los dos valores centrales y se obtuvo la mediana igual a 10.

Al igual que la media suele ocurrir que nadie obtiene el valor que asume mediana , lo cual es
totalmente válido.

Para calcular la mediana en datos agrupados aplicaremos la siguiente fórmula:

⎡ N − Fi −1 ⎤
Me = L1 + ⎢ 2 ⎥ ⋅C
⎣ fi ⎦

Donde:

Me = mediana

L1 = límite real inferior del intervalo en que se ubica la mediana.

N = número total de datos de la distribución.

Fi −1 = frecuencia absoluta acumulada del intervalo anterior al que contiene a la mediana.

f i = frecuencia (no acumulada), correspondiente al intervalo que contiene a la mediana

C = tamaño o amplitud del intervalo.

Poro comprender mejor el cálculo de la mediana,


¡Apliquémoslo!

45
Instituto Profesional Diego Portales
AUTÓNOMO

El valor de la hora de trabajo de 100 personas, se distribuye según indica la siguiente

tabla:

fi Fi(−)
Fronteras
2400 - 2600 7 7
2600 - 2800 20 27
2800 - 3000 33 60
3000 - 3200 25 85
3200 - 3400 11 96
3400 - 3600 4 100

N = 100

• Lo primero es ubicar el intervalo que contiene a la mediana.

Para ello, en la columna de las frecuencias acumuladas se busca el valor igual o mayor al
50% del total de casos; como son 100 casos, deberá ser igual o superior a 50. En la tabla, la
frecuencia acumulada que marca 60, indica el intervalo en que se encuentra la mediana.

Esto quiere decir que el valor de la mediana estará ubicado entre 2.800 y 3.000.

• Ahora, para calcularía aplicamos la fórmula, para lo cual ordenaremos los datos:

L1 = 2.800

N
N = 100 → = 50
2

Fi = 27

f i = 33

C = 200
Así:

46
Instituto Profesional Diego Portales
AUTÓNOMO

⎡ N − Fi −1 ⎤
Me = L1 + ⎢ 2 ⎥ ⋅C
⎣ fi ⎦

⎡ 50 − 27 ⎤
= 288 + ⎢ ⋅ 200
⎣ 33 ⎥⎦

= 2938

Finalmente encontramos que la mediana es 2.938, esto implica que en la distribución,


ese valor es el que la divide en dos partes ¡guales.

Las conclusiones pueden expresarse de cualquiera de las siguientes formas:

• El 50% de los casos, obtiene por hora de trabajo, menos de $2.938 y el otro 50% obtiene
más que esa cantidad.

• De los 100 trabajadores considerados en este caso, 50 de ellos reciben, por hora de
trabajo, entre $2.400 y $ 2.938 y 50 de ellos reciben más que $2.938 con un máximo de
$3.600.

3.1.5. CUARTILES DECILES Y PERCENT1LES.

Sabemos que en un conjunto de datos, el valor medio que divide al conjunto en dos partes
iguales, es la mediana. Aprovechando la misma idea, se pueden calcular aquellos valores de la
variable que dividen la distribución en cuatro partes iguales. Estos valores, son los llamados
cuartiles.

Loa cuartiles son los valores que dividen la distribución en cuatro partes iguales

47
Instituto Profesional Diego Portales
AUTÓNOMO

Los cuartiles se designan con la letra Q y cada uno de ellos separa la distribución en 25%.
Así tenemos que:

• Cuartil uno, denominado Q1 es el valor de la variable que marca el límite del primer cuarto
(1/4) de la distribución o lo que es lo mismo, el primer 25% de ella, en consecuencia deja
sobre ella, el 75% restante.

• Cuartil dos, denominado Q2 , es el valor de la variable que divide la distribución en dos


parte iguales y por lo tanto coincide con la mediana (2/4 = ½) entonces diremos que:

Q2 = Me

• Cuartil tres, denominado Q3 es el valor de la variable que marca el limite de los tres
cuartos (3/4) de la distribución, es decir, es el valor hasta donde se ubica el 75% de la
distribución, en consecuencia deja sobre sí, al 25% restante.

Para calcularlos usaremos la misma fórmula de la mediana, pero con el ajuste correspon-
diente, quedando lo siguiente:

⎡ N − Fi −1 ⎤
Q1 = L1 + ⎢ 4 ⎥ ⋅C
⎣ fi ⎦

⎡ N − Fi −1 ⎤
Q2 = Me = L1 + ⎢ 2 ⎥ ⋅C
⎣ f i ⎦

⎡ 34N − Fi −1 ⎤
Q3 = L1 + ⎢ ⎥ ⋅C
⎣ fi ⎦

Usando el mismo ejemplo que tomamos para calcular la mediana, calcularemos los
Quartiles.

48
Instituto Profesional Diego Portales
AUTÓNOMO

Puntajes fi Fi (−)
(fronteras)
2400 - 2600 7 7
2600 - 2800 20 27
2800 - 3000 33 60
3000 - 3200 25 85
3200 - 3400 11 96
3400 - 3600 4 100
N = 100

Asi:

Q1 → 25% De la distribución (25) → Fi = 27 → 2600 − 2800

Q2 → 50% De la distribución (50) → Fi = 60 → 2800 − 3000

Q3 → 75% De la distribución (75) → Fi = 85 → 3000 − 3200

Luego :

⎡ N − Fi −1 ⎤
Q1 = L1 + ⎢ 4 ⎥ ⋅C
⎣ fi ⎦

⎡ 25 − 7 ⎤
= 2600 + ⎢ ⋅ 200
⎣ 20 ⎥⎦

= 2780

Q1 = 2.780

Como el cuartil uno es 2.780, este valor marca el primer 25% de la distribución, dejando
sobre ella al 75% restante. Esto nos permite dar las siguientes conclusiones:

49
Instituto Profesional Diego Portales
AUTÓNOMO

• El 25 % de las personas contempladas en este estudio, recibe por hora de trabajo,


entre $2.400 y $2.780, en tanto que el 75% de ellas recibe más de $2.780 y hasta
$3.600.

• El 25% de las personas recibe por hora de trabajo, menos de $2.780 y el 75% de
ellas recibe más de $2.780.

• El estudio revela que un cuarto de las personas consideradas, obtiene por hora de
trabajo entre $2.400 y $2.780, mientras que tos tres cuarto de ellos, reciben más
de $2.780 y hasta $3.600 por hora trabajada.

Como la mediana la calculamos antes, y sabemos que e! cuartil dos es igual a la mediana
entonces, Q2 = 2.938.

Ahora calcularemos Q3, que se ubica en el intervalo donde la frecuencia absoluta acumu-
lada marca 85, ya que ésta debe ser igual o mayor ai 75% del total de casos.
Esto implica que Q3 tomará un valor entre 3.000 y 3.200.

De este modo:
⎡ 3 N − Fi −1 ⎤
Q3 = L1 + ⎢ 4 ⎥ ⋅C
⎣ fi ⎦

⎡ 75 − 60 ⎤
= 3000 + ⎢ ⎥ ⋅ 200
⎣ 25 ⎦

= 3120

Q1 = 2.780

Las conclusiones de esto:

• El 75% de las personas consideradas en el estudio, obtiene entre $2.400 y $3.120, por
hora de trabajo, en tanto que sólo un 25% obtiene más de esa cantidad, pero con tope de
$3.600 por hora.

50
Instituto Profesional Diego Portales
AUTÓNOMO

• El estudio realizado sobre el valor hora de trabajo que perciben 100 personas, revela que
75 de ellas reciben entre $2.400 y $3.120 y 25 restantes reciben más de esa cantidad pero
menos que $3.600.

Resulta muy importante señalar que entre el cuartil uno y el cuartil tres, se encuentra el
50% central de los casos en estudio. Por cierto, si el cuartil uno indica el valor de la variable
que marca el primer 25% de los casos y el cuartil tres es el valor de la variable que señala el
75% de los casos, entonces entre Q1 y Q3 se encuentra el 50% central.

En el ejemplo desarrollado anteriormente, Q1 = 2.780 y Q 3 = 3.120, entonces podemos


decir, que:

• En el estudio realizado sobre el valor de la hora de trabajo, reveló que los valores más
bajos fluctúan entre $2.400 y $2.780 los cuates son percibidos por el 25% de ellas, en
tanto el 50% de las personas perciben entre $2.780 y $3.120 por la hora de trabajo y sólo
el 25% supera esa cantidad, llegando hasta un valor de $ 3.600.

Análogamente, los valores de la variable que dividen la distribución en diez partes ¡gua-
les se denominan Deciles y se representan por D1 , D2 ……. hasta D9 , mientras que los
valores de la variable que dividen la distribución en cien partes iguales, se denominan
percentiles y se representan por P1 , P2 , ,.........hasta P999 .

o El decil uno, D1 , es el valor de la variable correspondiente al 10% de la distribución.


o El decil dos, D2 , es el valor de la variable correspondiente al 20% de ella ,
o D3 , al 30% y así sucesivamente. Entonces ocurre que:

D5 = Q2 = Me

¡Fantástico! ¡Ya sabemos calcularlo!

El percentil uno, P1 , corresponde al uno por ciento de la distribución; el percentil dos, P2 ,


al 2% de ella; el percentil tres, P3 , al tres por ciento; y así sucesivamente. Por lo que el
percentil Veinticinco, P25 = Q1 , el percentil setenta y cinco, P75 = Q3 y claro está :

51
Instituto Profesional Diego Portales
AUTÓNOMO

P50 = D5 = Q2 = Me

Recordemos que en la fórmula de trabajo lo único que varía es el factor de N , el cuál


corresponde al porcentaje que señala el decil o percentil a calcular. Si se trata de deciles
se divide por 10 y si son percentiles por 100

Es como pensar así :

• Si calculamos un decil cualquiera (x) , tenemos:

⎡ x⋅ N − Fi −1 ⎤
D x = L1 + ⎢ 10 ⎥ ⋅C
⎣ fi ⎦

• Si calculamos percentiles:

⎡ x⋅ N − Fi −1 ⎤
Px = L1 + ⎢ 100 ⎥ ⋅C
⎣ fi ⎦

Ejemplifiquemos usando la tabla de datos anteriores:

Fronteras fi Fi (−)

2400 - 2600 7 7
2600 - 2800 20 27
2800 - 3000 33 60
3000 - 3200 25 85

52
Instituto Profesional Diego Portales
AUTÓNOMO

3200 - 3400 11 96
3400 - 3600 4 100
N = 100

i) Para D3 tenemos que el 30% de 100 es 30, por lo tanto, D3 se ubica en el intervalo cuya
frecuencia acumulada marca 60, por lo tanto, D3 se encuentra entre los valores 2.800 y
3.000;

los datos son:

L1 = 2.800

3N
= 30
10

Fi =60

Fi −1 = 27

f i= 33

C = 200

Asi:

⎡ 3 N − Fi −1 ⎤
D3 = L1 + ⎢ 10 ⎥ ⋅C
⎣ fi ⎦

⎡ 30 − 27 ⎤
= 2800 + ⎢ ⎥ ⋅ 200
⎣ 33 ⎦

= 2818

53
Instituto Profesional Diego Portales
AUTÓNOMO

D3 = 2818

i) Para P42 tenemos que el 42% de 100 es 42, por lo tanto, P42 se ubica en el intervalo cuya
frecuencia acumulada marca 60, por lo tanto, P42 se encuentra entre los valores 2.800 y
3.000;

los datos son:

L1 = 2.800

42 N
= 42
100

Fi =60

Fi −1 = 27

f i= 33

C = 200

Asi:

⎡ 42 N − Fi −1 ⎤
P42 = L1 + ⎢ 100 ⎥ ⋅C
⎣ fi ⎦

⎡ 42 − 27 ⎤
= 2800 + ⎢ ⋅ 200
⎣ 33 ⎥⎦

= 2890

54
Instituto Profesional Diego Portales
AUTÓNOMO

P42 = 2.890

Ejercicio interesante:

Sea la distribución siguiente:

212 puntajes de un test de habilidades:

Puntajes fi Fi (−)

350 – 399 4 4
400 – 449 6 10
450 – 499 9 19
500 – 549 20 39
550 - 599 31 70
600 – 649 80 150
650 – 699 42 192
700 – 749 10 202
750 – 799 8 210
800 - 849 2 212
212

Interesa determinar que % de alumnos obtuvieron resultados entre 620 y 680 puntos:

Sol:

• Sea Px = 620 puntos, donde x es un porcentaje desconocido. Así:

55
Instituto Profesional Diego Portales
AUTÓNOMO

⎡ 212 ⎤
⎢ x ⋅ 100 − 70 ⎥
Px = 599.5 + ⎢ ⎥ ⋅ 50
⎢ 80 ⎥
⎢⎣ ⎥⎦

⎡ 2.12 x − 70 ⎤
620 = 599.5 + ⎢ ⎥ ⋅ 50
⎣ 80 ⎦

Donde :

x = 48.49 %

• De igual modo: Sea Py = 680 puntos, donde y es un porcentaje desconocido. Así:

⎡ 212 ⎤
⎢ y ⋅ 100 − 150 ⎥
Py = 649.5 + ⎢ ⎥ ⋅ 50
⎢ 42 ⎥
⎢⎣ ⎥⎦

⎡ 2.12 y − 150 ⎤
680 = 649.5 + ⎢ ⎥⎦ ⋅ 50
⎣ 42

Donde :

y = 82.84 %

y por lo tanto: El porcentaje buscado es : 82.84 % - 48.49 % = 34.4 % de alumnos

56
Instituto Profesional Diego Portales
AUTÓNOMO

TEST AUTOEVALUATIVO 3

1. Las calificaciones de un estudiante en seis pruebas fueron 84, 91, 72,68, 87 y 78.
Encuen-
tre la media aritmética de las calificaciones.

2. Los salarios anuales de cuatro hombres fueron $5.000, $6.000, $6.500 y $30.000.
Encuentre la media aritmética de sus salarios.

3. De un total de 100 números, 20 eran 4, 40 eran 5, 30 eran 6 y el resto eran 7. Encuentre


la media aritmética de los números.

4. Cuatro grupos de estudiantes, formados por 15, 20,10 y 18 individuos registran los
siguientes pesos: 162,148, 153 y 140 libras, respectivamente. Encuentre el peso medio de
todos los estudiantes.

5. Los puntajes un deportista en seis pruebas fueron 84, 91, 72,68, 87 y 78. Calcule la
mediana de los puntajes.

6. Los honorarios de cinco empleados de una oficina son $2,52; $3,96; $3,28; $9,20 y
$3,75. Encontrar:

(a) la mediana del salario honorario,

(b) la media del salario honorario.

7. Calcule la media, mediana y moda en las colecciones de números:

(a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6;

(b) 51,6; 48,7; 50, 3; 49,5:48,9.

8. Calcule los cuartiles Q1 , Q2 y Q3 y los deciles D1 , D2 , D9 de los salarios de los 65


Empleados de una Empresa presentados en la tabla siguiente:

Salarios (dólares) f i (Número de


empleados)
50 – 59.99 8
60 – 69.99 10

57
Instituto Profesional Diego Portales
AUTÓNOMO

70 – 79.99 16
80 – 80.99 14
90 – 90.99 10
100 - 109.99 5
100 - 109.99 2
Total 65

9. Determinar: el percentil 35, el percentil 60, para la distribución del problema anterior.

10. En la distribución:

212 puntajes de un test de habilidades:

Puntajes fi Fi (−)

350 – 399 4 4
400 – 449 6 10
450 – 499 9 19
500 – 549 20 39
550 - 599 31 70
600 – 649 80 150
650 – 699 42 192
700 – 749 10 202
750 – 799 8 210
800 - 849 2 212
212

a) Calcula P5 y P95
b) Determina el percentil al que corresponde el valor 582.4 puntos
c) Que % de alumnos obtuvo entre 400 y 600 puntos

58
Instituto Profesional Diego Portales
AUTÓNOMO

SOLUCIONARIO TEST AUTOEVALUATIVO 3

1.

X =
∑X i
=
84 + 91 + 72 + 68 + 87 + 78 480
= = 80
N 6 6

2. X =

∑X i
=
5000 + 6000 + 6500 + 30000 47500
= = 11875
N 4 4

3.

X =
∑f X i i
=
20 ⋅ 4 + 40 ⋅ 5 + 30 ⋅ 6 + 10 ⋅ 7 530
= = 5.30
N 100 100

4.

X =
∑fX i i
=
15 ⋅ 162 + 20 ⋅ 148 + 10 ⋅ 153 + 18 ⋅ 140
= 150
∑f i 15 + 20 + 10 + 18

5. Puestos en orden, los puntajes son 68, 72 , 78 , 84 , 87 , 91 . Al haber un número par


78 + 84
de términos hay dos valores centrales, 78 y 84, cuya media aritmética es
2
la mediana pedida.

6. a) Puestos en orden los honorarios son 2,52; 3,28; 3,75; 3,96; 9,20. Puesto que hay un
número impar de términos, hay solamente un valor medio 3,75 que será la mediana
pedida.

b) La media aritmética es (2,52+3,96+3,28+9,20+3,75)/5= 4,54.

Nótese que la mediana no viene afectada por el valor extremo 9,20, mientras que la media
sí lo está. En este caso la mediana da una mejor información que la media sobre el salario
horario.

7. a) Puestos en orden de magnitud, los números son 2 , 2 , 3 , 5 , 5 , 5 , 6 , 6 , 8 , 9 .

59
Instituto Profesional Diego Portales
AUTÓNOMO

2+ 2+3+5+5+5+ 6+ 6+8+9
Media = = 4.54
10
5+5
Mediana = media aritmética de los valores centrales = =5
2

Moda = número que se presenta con mayor frecuencia = 5.

b) Puestos en orden de magnitud, los números son 48,7; 48,9; 49,5; 50,3; 51,6.

48.7 + 48.9 + 49.5 + 50.3 + 51.6


Media = = 49.8
5

Mediana = número central = 49,5.

Moda = número que se presenta con mayor frecuencia; aquí no existe.

8)

Q1 = 68.25

Q2 = 79.06

Q3 = 90.75

D1 = 58.12

D2 = 59.995

D9 = 101.00
9)
P35 = 72.97

P60 = 83.57

10)

60
Instituto Profesional Diego Portales
AUTÓNOMO

a) P5 = 452.8 , P95 = 746.5


b) P28
c) 31.5 %

Interesante:

Una técnica de recuento y ordenación de datos la constituye los diagramas de Tallos y


Hojas.

Supongamos la siguiente distribución de frecuencias

36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40

que representan la edad de un colectivo de N = 20 personas y que vamos a reprensar


mediante un diagrama de Tallos y Hojas.

Comenzamos seleccionando los tallos que en nuestro caso son las cifras de decenas, es decir
3, 2, 4, que reordenadas son 2, 3 y 4.

A continuación efectuamos un recuento y añadimos a cada hoja a su tallo

Así , tenemos

Por último reordenamos las hojas y hemos terminado el diagrama

61
Instituto Profesional Diego Portales
AUTÓNOMO

Los expertos dirán que dicha representación es un histograma.

Los diagramas de Tallos y Hojas además de ser fáciles de elaborar, presentan más
información que los histogramas, como veremos más adelante.

Podemos comparar, mediante estos diagramas, dos distribuciones. Supongamos una segunda
distribución

35 38 32 28 30 29 27 19 48 40

39 24 24 34 26 41 29 48 28 22

De ella podemos elaborar sus diagrama de Tallos y Hojas y compararla con la anterior.

Teniendo en cuenta que con las representaciones anteriores los datos están ordenados,
podemos aprovechar estas disposiciones para representar los diagramas de Cajas y Bigotes
(boxplots ) .

Estos diagramas se basan en los siguientes parámetros de la distribución: valor mínimo, los
cuartiles Q 1, Q 2 y Q 3 y el valor máximo.

62
Instituto Profesional Diego Portales
AUTÓNOMO

Para la primera distribución

Su diagrama de Cajas y Bigotes es

Cuartiles
Cuartil Primero (Q1). Es el valor mayor que el 25% de los valores de la distribución. Para la
misma, como N = 20 resulta que N/4 = 5; la media aritmética de dicho valor y el siguientes
es
(24 + 25) / 2 = 24,5

Análogamente se calculan los restantes cuartiles.

El Segundo Cuartil Q2 es, evidentemente, la mediana de la distribución

El Tercer Cuartil es el valor que sobrepasa al 75% de los valores de la distribución.


En nuestro caso, como 3N / 4 = 15, resulta:

(39 + 39) / 2 = 39

Podemos obtener abundante información de una distribución a partir de dichas


representaciones. Veamos alguna.

63
Instituto Profesional Diego Portales
AUTÓNOMO

o
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las
edades comprendidas entre el 25% y el 50% de la población está más dispersa que
entre el 50% y el 75%.
o
El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el
25% de los más jóvenes están más concentrados que el 25% de los mayores.
o
El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está está
comprendido en 14,5 años.

o
Seguro que tú podrás obtener más información (¡Utiliza la mediana!).

Por último, comparamos, mediante los diagramas de Cajas y Bigotes, las dos distribuciones
tratadas.

A partir de dicha comparación puede obtenerse bastante información de ambas


distribuciones.

TE LO DEJO COMO DESAFIO…

64
Instituto Profesional Diego Portales
AUTÓNOMO

UNIDAD IV

MEDIDAS DE DISPERSION

65
Instituto Profesional Diego Portales
AUTÓNOMO

UNIDAD IV

INTRODUCCIÓN

En esta unidad se utilizarán fórmulas para calcular las medidas de dispersión de datos
Agrupados, que permiten establecer la desviación media y que darán a conocer un valor
absoluto, a través del conjunto de datos definido como la sumatoria de los cuadrados de las
desviaciones, dividido por el total de casos.

Se dará a conocer, la desviación estándar o típica, donde se obtiene un promedio diferen-


te a la media aritmética.

Los ejercicios de aplicación, pondrán al alumno en contacto con su aprendizaje, los que
podrá contrastaren el anexo con las respuestas correctas.

66
Instituto Profesional Diego Portales
AUTÓNOMO

OBJETIVOS

1. Calcular medidas de dispersión para datos agrupados.

67
Instituto Profesional Diego Portales
AUTÓNOMO

4.1. CÁLCULO DE MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS.

4.1.1. RANGO.

El rango (R) de un conjunto de datos es la diferencia entre el mayor y menor de todos ellos

Ejemplo:

El rango de los números 2, 3, 3 , 5 , 5 , 8 , 10 , 12 es R = 12 – 2 = 10.

4.1.2. DESVIACIÓN PROMEDIO O DESVIACIÓN MEDIA.

Se entiende por el promedio de las desviaciones (alejamientos) de cada uno de los valores
respecto de un valor referencial (generalmente la media aritmética)

Su fórmula de trabajo es:

68
Instituto Profesional Diego Portales
AUTÓNOMO


∑ xi − x
DM =
N


En donde xi − x es el valor absoluto de las desviaciones de las diferentes xi respecto de

x . (El
valor absoluto de un número, es el mismo número sin asociarle signo alguno y se indica por
dos barras verticales a ambos lados del número.

Ejemplo:

Hallar la desviación media de los números 2 , 3 , 6 , 8 , 11.

− 2 + 3 + 6 + 8 + 11
• Calculemos la madia aritmética: x= =6
5

• Ordenemos la información:

xi −
xi − x

2 4
3 3
6 0
8 2
11 5
∑ 14

Así :

69
Instituto Profesional Diego Portales
AUTÓNOMO


∑ xi − x
DM =
N

14
= = 2.8
5

Si se presentan frecuencias, la desviación media queda:


∑ f i xi − x
DM =
N

Donde: N = ∑f i

4.1.3. VARIANZA.

La varianza ( s 2 ) de un conjunto de datos se define como la sumatoria de los cuadrados de


las desviaciones dividido por el total de casos en estudio.

Asi:

2
⎛ −

∑ ⎜

x i − x ⎟

s =
2

Si el estudio se refiere a una varianza muestral, se representa por s 2 y se divide por n-1 y
si se refiere a la varianza poblacional, se designa por σ 2 y se divide por N.

Al sacar la raíz cuadrada de la varianza resulta lo que se denomina desviación estándar,


llamada también desviación típica, por lo tanto desviación estándar es:

Raíz cuadrada de la varianza:

70
Instituto Profesional Diego Portales
AUTÓNOMO

2
⎛ −

∑ ⎝ i ⎟⎠
⎜ x − x
s=
N

Cuando los datos vienen dados por una distribución de frecuencias s queda dado por la
Siguiente fórmula:

2
⎛ −

∑ f i ⎜ xi − x ⎟
⎝ ⎠
s=
N

Al igual que en la varianza, cuando se trata de la desviación estándar de una población, se


divide por N, en cambio si el estudio se trata de calcular la desviación estándar de una
muestra se divide por n- 1.

4.1.4. PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR.

∑ (x − a)
2

1. La desviación típica puede definirse como s = Donde a es un promedio que


i

N
puede ser distinto de la media aritmética. De todas las desviaciones típicas, la mínima es

aquella para la que a = x , a causa de una propiedad que, suministra una razón de peso para
definir la desviación típica, como se ha definido anteriormente.

2. Para distribuciones normales, resulta que:

− −
a) El 68,27% de los casos están comprendidos entre x − s y x + s . (es decir, el valor de
la desviación típica a ambos lados de la media).

− −
b) El 95,45% de los casos están comprendidos entre x − 2 s y x + 2 s . (es decir, el doble
del valor de la desviación típica a ambos lados de la media).

− −
c) El 99,73% de los casos están comprendidos entre x − 3s y x + 3 s . (es decir, el triple del

71
Instituto Profesional Diego Portales
AUTÓNOMO

valor de la desviación típica a ambos lados de la media).

3. Supóngase dos series de datos de N 1 y N 2 números (o dos distribuciones de


frecuencia con frecuencias totales N 1 y N 2 ) cuyas variaciones vienen dadas por

s12 y s 22 , respectivamente,y que tienen la misma media x . Entonces, la varianza
combinada para ambas series (o ambas distribuciones de frecuencia), está dada por:

N 1 s12 + N 2 s 22
s2 =
N1 + N 2

Esta es una media aritmética ponderada de las varianzas. Este resultado puede genera-
lizarse a 3 ó más series de datos.

Realicemos un ejercicio para calcular Medidas de Dispersión de datos agrupados. Para esto
consideremos nuestra distribución del capítulo anterior:

− − −
− 2
xi − x f i ⋅ xi − x xi − x f i ⋅ xi − x
Salario xi fi xi ⋅ f i
240 - 249.5 7 1746.5 45 315 2025 14175
259
260 - 269.5 20 5390 25 500 625 12500
279
280 - 289.5 33 9553.5 5 165 25 825
299
300 - 309.5 25 7737.5 15 375 225 5625
319
320 - 329.5 11 3624.5 35 385 1225 13475

72
Instituto Profesional Diego Portales
AUTÓNOMO

339
340 - 349.5 4 1398 55 220 3025 12100
359
Totales: 100 29450 1960 58700

• Calculemos la media aritmética:


x=
∑x i ⋅ fi
n

− 29450
x= = 294.5
100


• Con el valor anterior, construimos la columna de las desviaciones xi − x


• Como se trata de datos agrupados, construimos la columna f i ⋅ xi − x

• De esta forma podemos calcular la desviación media de la distribución:


∑f i xi − x
DM =
N

1960
DM =
100

DM = 19.6

Lo que se interpreta : El promedio de los alejamientos de la muestra en estudio respecto



del valor referencial x es 19.6 puntos

− 2
• Construyamos ahora la columna: xi − x

73
Instituto Profesional Diego Portales
AUTÓNOMO

− 2
• Como es una distribución de datos agrupados , fabriquemos la columna f i ⋅ xi − x

• Calculemos entonces la desviación típica o estándar:

2
⎛ −

∑ f i ⎜ xi − x ⎟
⎝ ⎠
s=
N

58700
s=
100

s = 587

s = 24.228 ≈ 24.23

• Además. La varianza es : s 2 = 587

• Como un complemento interesante, si calculamos los Cuarteles inferior ( Q1 ) y


superior
( Q3 ) . Es decir:

Salario – semanal xi (marca de fi Fi (−)


(dólares) clase)
240 - 259 249.5 7 7
Q1 260 - 279 269.5 20 27
280 - 299 289.5 33 60
Q3 300 - 319 309.5 25 85
320 - 339 329.5 11 96
340 - 359 349.5 4 100
Total =100

74
Instituto Profesional Diego Portales
AUTÓNOMO

⎡ N − Fi −1 ⎤
Q1 = L1 + ⎢ 4 ⎥ ⋅C
⎣ fi ⎦

⎡ 25 − 7 ⎤
Q1 = 259.5 + ⎢ ⋅ 20
⎣ 20 ⎥⎦

Q1 = 277.5

⎡ 3 N − Fi −1 ⎤
Q3 = L1 + ⎢ 4 ⎥ ⋅C
⎣ fi ⎦

⎡ 75 − 60 ⎤
Q3 = 299.5 + ⎢ ⋅ 20
⎣ 25 ⎥⎦

Q3 = 311.5

Luego, se tiene la medida de desviación : Rango semi-intercuartil o Desviación cuartil:

Q3 − Q1
DQ =
2

311.5 − 277.5
DQ =
2

DQ = 17

• Además, nótese que el 50 % de los casos cae entre Q1 y Q 3 , es decir 50 operarios


ganan entre 277.5 y 311.5 dólares, así que podemos considerar a la expresión:
Q3 + Q1
Q= como una medida de centralización, de esta forma:
2

75
Instituto Profesional Diego Portales
AUTÓNOMO

Q3 + Q1
Q=
2

311.5 + 277.5
Q=
2

Q = 294.5


Nota: este valor coincide incluso con x

4.1.5 PUNTAJES TIPIFICADOS

Conocido un puntaje cualquiera x de una distribución, lo podemos expresar en términos de


la desviación típica o estándar.


En un conjunto de datos, si la media aritmética es x y la desviación típica s , entonces el
valor tipificado o estandarizado z de un dato x es:


x−x
z=
s


Es claro que el puntaje z correspondiente a x es 0. Ya que:

76
Instituto Profesional Diego Portales
AUTÓNOMO

− −
x− x 0
z= = =0
s s

Ejemplo:

Suponga las notas de Juan:

2 - 3.9 - 5 - 5.9 - 6.2

• Calculemos la media aritmética:


x=
∑ x = 2 + 3.9 + 5 + 5.9 + 6.2 = 4.6
N 5

• Obtengamos la desviación típica:

∑ ⎛⎜⎝ xi − x ⎞⎟⎠

s=
N

(2 − 4.6) 2 + (3.9 − 4.6) 2 + (5 − 4.6) 2 + (5.9 − 4.6) 2 + (6.2 − 4.6) 2


s=
5

s = 1.53
Así:

2 − 4.6 −
Para la nota 2 : z= = −1.7 ; la nota 2 se encuentra a 1.7 s (por debajo de x )
1.53

3.9 − 4.6
Para la nota 3.9 : z= = −0.5 ; la nota 3.9 se encuentra a 0.5 s (por debajo de
1.53

x )

77
Instituto Profesional Diego Portales
AUTÓNOMO

5 − 4.6 −
Para la nota 5 : z= = 0.3 ; la nota 5 se encuentra a 0.3 s (por encima de x )
1.53

5.9 − 4.6 −
Para la nota 5.9 : z= = 0.8 ; la nota 5.9 se encuentra a 0.8 s (por encima de x
1.53
)

6.2 − 4.6 −
Para la nota 6.2 : z= = 1 ; la nota 6.2 se encuentra a 1 s (por encima de x )
1.53

Es claro que las notas quedan ordenadas en referencia a la cantidad de desviaciones



estándar o típicas respecto de x

Ejemplo: Un alumno obtuvo un 5.4 en Estadística y un 5.7 en Álgebra. Si los promedios


generales en las asignaturas fueron respectivamente 4.8 y 5.0 mientras que las desviaciones
típicas 0.6 y 0.8. Se pide concluir en que asignatura se logró un lugar relativo mejor.

Solución:

5.4 − 4.8 5.7 − 5.0


Estadística: z = =1 Álgebra: z = = 0.875
0.6 0.8

Conclusión: Mejor en Estadística que en Álgebra, aún teniendo nota mas alta en Álgebra.

4.1.6 COEFICIENTE DE VARIACIÓN (CV)

78
Instituto Profesional Diego Portales
AUTÓNOMO

El coeficiente de variación, C.V., es el cociente entre la desviación típica y la media de la


distribución:

s
CV = −
x

Este parámetro sirve para relativizar el valor de la desviación típica y así poder comparar la
dispersión de dos poblaciones estadísticas con gamas de valores muy discretas. Por ejemplo,

si en una compañía mexicana los salarios de los empleados tienen una media x1 = 7.000
pesos y una desviación típica s1 = 500 pesos y en otra empresa española la media de los

salarios es x 2 200.000 pesetas y la desviación típica s 2 = 40.000 pesetas, para comparar la
dispersión de salarios se recurre al coeficiente de variación:

C.V.1 = 500/7.000 = 0,07

C.V.2 = 40.000/200.000 = 0,2

Se aprecia así que en la primera compañía los salarios tienen menor dispersión que en la
segunda.

79
Instituto Profesional Diego Portales
AUTÓNOMO

TEST AUTOEVALUATIVO 4

1. Hallar el rango de cada una de las series de números:

a) 12, 6, 7, 3, 15, 10, 18, 5

b) 9, 3, 8, 8, 9, 8, 9, 18.

2. Encuentre la desviación media de las series de números del problema 1.

3. Encuentre la desviación estándar, de cada una de las dos series de números, del problema
Anterior.

4. Encuentre la varianza de las series de números del problema 1.

5. Dadas las series de números2, 5, 8, 11, 14 y 2, 8, 14, hallar la:

80
Instituto Profesional Diego Portales
AUTÓNOMO

a) Media de cada serie,

b) Varianza de cada serie,

c) Media de las dos series combinadas,

d) Varianza de las dos series combinadas.

6) Sea la distribución:
212 puntajes de un test de habilidades:

Puntajes fi Fi (−)

350 – 399 4 4
400 – 449 6 10
450 – 499 9 19
500 – 549 20 39
550 - 599 31 70
600 – 649 80 150
650 – 699 42 192
700 – 749 10 202
750 – 799 8 210
800 - 849 2 212
212
a) Determine la desviación típica
b) Determine la varianza

SOLUCIONARIO TEST AUTOEVALUATIVO 4

1)
a) 15
b) 15

2)
a) DM = 4.25
b) DM = 2.25

3)
a) s = 4.87
b) s = 3.87

81
Instituto Profesional Diego Portales
AUTÓNOMO

4)
a) s2 = 23.75
b) s2 = 15

5)
− −
a) x = 8 , x=8
b) s2 = 18 , s2 = 24
c) Media combinada = 8
d) Varianza combinada = 20.25

6)
a) s = 81.49 Pts.
b) s2 = 6640.6

82
Instituto Profesional Diego Portales
AUTÓNOMO

Bibliografía:

Canavos, George : Probabilidad y Estadística. Mc Graw Hill. España 1993.


651pp

Chao, Lincon : Estadística para las ciencias administrativa. Mc Graw


Hill. Co-
Lombia Bogotá. 1993

83

También podría gustarte