Está en la página 1de 38

FACULTAD DE CIENCIAS

DEPARTAMENTO DE ESTADÍSTICA
CARRERA: INGENIERÍA ESTADÍSTICA

INTRODUCCIÓN A LA INGENIERÍA ESTADÍSTICA


CÓDIGO 220227
Primer semestre 2021

PROFESORA: NELLY M. GÓMEZ F.


2

UNIDAD I: ESTADÍSTICA DESCRIPTIVA

1.1 INTRODUCCIÓN

El término estadística se deriva de la palabra latina status (que significa “estado”). Los primeros usos de la
estadística implicaron la recolección de datos y la elaboración de gráficas para describir diversos aspectos de un
estado o de un país. En 1662, John Graunt publicó información estadística acerca de los nacimientos y los
decesos. Al trabajo de Graunt siguieron estudios de tasas de mortalidad y de enfermedad, tamaños de
poblaciones, ingresos y tasas de desempleo. Los hogares, gobiernos y negocios se apoyan bastante en datos
estadísticos para orientar sus acciones. Por ejemplo, se recopilan datos cuidadosamente y con regularidad para
establecer las tasas de desempleo, las tasas de inflación, los índices del consumidor y las tasas de nacimiento y
muerte, y los líderes empresariales utilizan los datos resultantes para tomar decisiones relacionadas con futuras
contrataciones, niveles de producción y la expansión hacia nuevos mercados (Fuente: Probabilidad y
Estadística. Novena edición, Mario F. Triola. Addison Wesley)

Una meta común e importante de la estadística es aprender acerca de un grupo examinado los datos de alguno de
sus componentes. En dicho contexto los términos muestra y población adquieren importancia. Las definiciones
formales de éstos y otros términos se presentan a continuación:

Definición 1: La estadística es la ciencia de los datos; implica la colección, clasificación, síntesis,


organización, análisis e interpretación de los datos.

La ciencia de la estadística suele aplicarse a dos tipos de problemas:


• Resumir, describir y explorar datos.
• Utilizar datos de muestra para inferir la naturaleza del conjunto de datos del que se escogió la muestra.

Definición 2: La rama de la estadística que se dedica a la organización, síntesis y descripción de conjuntos de


datos es la estadística descriptiva.

Hay ocasiones en que el fenómeno de interés se caracteriza por un conjunto de datos cuya obtención es o bien
físicamente imposible o requeriría un gasto excesivo en dinero o en tiempo. En tales situaciones se muestrea el
conjunto de datos y se utiliza la información de la muestra para inferir la naturaleza del conjunto. Como
ilustración, supongamos que el fenómeno de interés es el tiempo de espera para que un trabajo de procesamiento
de datos termine su ejecución. Podríamos esperar que el tiempo de espera dependerá de factores tales como el
tamaño del trabajo, el factor de utilización de la computadora, etc. De hecho, si ejecutáramos el mismo trabajo
una y otra vez en el computador los tiempos de espera variarían, incluso si el factor de utilización de la máquina
es el mismo. Por tanto, el fenómeno “tiempo de espera para el procesamiento de trabajo” se caracteriza por un
conjunto de datos de gran tamaño que sólo existe en lo conceptual (en nuestra mente). Para determinar la
naturaleza de este conjunto de datos, lo muestreamos; es decir, procesamos el trabajo varias veces, registramos
el tiempo de espera en cada ejecución y luego utilizamos esta muestra de n tiempos de espera para inferir la
naturaleza del conjunto grande de datos conceptuales que nos interesa. La rama de la estadística que utilizamos
para resolver este problema es la estadística inferencial.

Definición 3: La rama de la estadística que se ocupa de utilizar datos de muestra para inferir algo acerca de una
población se denomina estadística inferencial.

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
3

Población: es la totalidad de los elementos en discusión y acerca de los cuales se desea información.

Muestra: es una porción o parte representativa de una población de interés.


(La palabra “representativo” es la clave de esta idea. Una buena muestra es aquella que refleja las
características esenciales de la población de la cual se obtuvo)

Variable: es una característica de interés de una población o muestra.

Parámetro: es una característica numérica de una población.

Dato: se le llama al valor de la variable asociado a un elemento de una población o muestra (son las
observaciones recolectadas)

Muestreo: es la actividad realizada según un plan definido, cuyos resultados producen un conjunto de datos.

Estadígrafo: es una característica numérica de la muestra.

En estadística, el objetivo de las técnicas de muestreo es asegurar que cada observación en la población tenga
una oportunidad igual e independiente de ser incluida en la muestra. Tales procesos de muestreo conducen a
una muestra aleatoria.

Las observaciones de la muestra aleatoria se usan para calcular ciertas características de la muestra
denominadas “Estadísticas” o “Estadígrafos”. Estos estadígrafos se usan como base para hacer inferencias
acerca de ciertas características de la población, que reciben el nombre de “Parámetros”.

En estadística, la inferencia es inductiva, porque se proyecta de lo específico (muestra) hacia lo general


(población). En un procedimiento de esta naturaleza siempre existe la posibilidad de error. Nunca podrá
tenerse el 100% de seguridad sobre una proposición que se base en la inferencia estadística. Sin embargo, lo
que hace que la estadística sea una ciencia es que, unida a cualquier proposición, existe una medida de
confiabilidad de ésta. En estadística la confiabilidad se mide en términos de probabilidad. En otras palabras,
para cada inferencia estadística se identifica la probabilidad de que la inferencia sea correcta.

Los problemas estadísticos se caracterizan por los siguientes cuatro elementos :


1. La población de interés y el procedimiento científico que se empleó para muestrear la población.
2. La muestra y el análisis matemático de su información. Las inferencias estadísticas que resulten del análisis
de la muestra.
3. La probabilidad de que las inferencias sean correctas.

1.2 TIPOS DE DATOS

Los datos pueden ser de dos tipos: cuantitativos o cualitativos. Los datos cuantitativos son los que representan
la cantidad de algo, medida en una escala numérica. Por ejemplo, la frecuencia de potencia (medida en
megahertz) de un semi conductor es una variable cuantitativa, lo mismo que el tiempo de espera (medido en
segundos) antes de que un trabajo de cómputo inicie su proceso. En contraste, los datos cualitativos (o
categóricos) no tienen una interpretación cuantitativa; sólo pueden clasificarse. El conjunto de n ocupaciones
correspondientes a un grupo de n graduados de ingeniería es un conjunto de datos cualitativos. Una lista de los
fabricantes de n minicomputadores propiedad de n empresas pequeñas es un conjunto de datos cualitativos.

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
4

Es posible un desglose más fino de los tipos de datos en nominales, ordinales, de intervalo y de razón. Los datos
nominales son datos cualitativos con categorías que no pueden ordenarse de forma significativa. Los datos
ordinales también son cualitativos, pero existe un claro ordenamiento de los grupos del más alto al más bajo.
Los datos de intervalo y de razón son dos tipos distintos de datos cuantitativos (ver apunte EL PROCESO DE
MEDICION). En la mayor parte de las aplicaciones estadísticas basta con clasificar los datos como cuantitativos
o cualitativos.

Definición 4: Datos cualitativos son los que describen cualidades, no tienen una interpretación cuantitativa y
sólo pueden clasificarse en categorías.

Definición 5: Datos cuantitativos son los que representan la cantidad o el número de algo. Se subdividen en
DISCRETOS y CONTINUOS.

Definición 6: Datos cuantitativos discretos son los que toman únicamente valores enteros, corresponden en
general a contar el número de veces que ocurre un evento.

Definición 7: Datos cuantitativos continuos son los que toman valores en un intervalo y corresponden a medir
magnitudes continuas.

La elección de la herramienta estadística correcta que se utilice para describir y analizar datos dependerá del
tipo de los datos. Es por ello que la diferencia entre datos cuantitativos y cualitativos es importante.

1.3 DISTRIBUCIÓN DE FRECUENCIAS


Una distribución de frecuencias o tabla de frecuencias es el agrupamiento u ordenación de los datos en clases o
categorías con las frecuencias correspondientes a cada una.
La presentación de datos cualitativos suele hacerse indicando las clases o atributos considerados y sus
frecuencias de aparición como se indica en la tabla 1 del ejemplo 1 siguiente :

Ejemplo 1 (Variable Cualitativa o Atributo)


Los resultados obtenidos en un estudio acerca del estamento al que pertenecen 48 funcionarios de una
municipalidad, dio origen a los siguientes datos:
A T Ad A P A….................D A T

y a la siguiente distribución de frecuencias :

Clases Frecuencia Frecuencia


ESTAMENTO absoluta (n2) relativa (fi)
Directivo (D) 4 0,0833
Administrativo (Ad) 4 0,0833
Profesional (P) 12 0,2500
Técnico (T) 13 0,2708
Auxiliar (A) 15 0,3125
Total n = 48 1.0000

La siguiente es la salida obtenida con spss:

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
5

Estamento o Estratificación
Porcentaje
Frecuencia Porcentaje acumulado
Administrativo 4 8,3 8,3
Directivo 4 8,3 16,7
Profesional 12 25,0 41,7
Técnico 13 27,1 68,8
Auxiliar 15 31,3 100,0
Total 48 100,0

Esta misma idea se aplica para presentar datos cuantitativos cuando el número de valores posibles de
la variable X es pequeño (menor que 10).

Ejemplo 2 (Variable Cuantitativa Discreta)


En un estudio acerca de “compromiso organizacional” se les consultó a 48 funcionarios de una municipalidad
por el número de capacitaciones realizadas durante el año 2006. Los datos se indican a continuación:

1 0 2 3 0 0 2 1 2 1 0 6
2 0 0 3 0 0 0 1 1 0 4 1
1 1 5 0 1 6 3 0 2 2 0 0
0 1 1 0 1 1 0 3 0 0 1 0

La distribución de frecuencias correspondiente es:

Clases
xi ni fi Ni Fi
0 20 0,417 20 0,417
1 14 0,292 34 0,708
2 6 0,125 40 0,833
3 4 0,083 44 0,917
4 1 0,021 45 0,083
5 1 0,021 46 0,958
6 2 0,042 48 1,000
Total n = 48 1,000

ni
Nota f = Se llama la frecuencia relativa de la i-ésima clase y se acostumbra expresarla en porcentajes.
n
Así, por ejemplo f3 = 0,125 indica que al 12,5% de los funcionarios encuestados declaran haber realizado dos
f3 = 0.125

capacitaciones el año 2006.


Además de las frecuencias relativas es conveniente indicar las frecuencias acumuladas Ni y las frecuencias
Ni
relativas acumuladas Fi donde: Fi = , ver tabla de ejemplo 2.
n

Cuando el número de valores posibles de una variable discreta o continua sea grande, conviene agrupar en
Intervalos de clase.
Los intervalos pueden ser de amplitud variable o constante.

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
6

La selección del número de intervalos (K), depende de cada caso particular, es aconsejable que haya menos de
20 clases (para un fácil manejo y con el fin de asegurar una compactación suficiente de información) y por lo
menos 5 (para evitar la pérdida de información que se producirá al reunir en un grupo datos muy diferentes).
Por lo general las clases se eligen de modo que la amplitud de cada una de ellas sea igual para todas las
categorías o intervalos de clase.

Para ilustrar la construcción de una distribución de frecuencias, consideraremos el siguiente ejemplo:

Ejemplo 3: (Variable cuantitativa continua)


Las siguientes datos, representan las duraciones, en años, de 40 baterías de autos similares. Las baterías estaban
garantizadas para durar tres años.

2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6


3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7
2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1
3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4
4.7 3.8 3.2 2.6 3.9 3.0 4.2 3.5

Los datos ordenados son:

1.6 1.9 2.2 2.5 2.6 2.6 2.9 3.0


3.0 3.1 3.1 3.1 3.1 3.2 3.2 3.2
3.3 3.3 3.3 3.4 3.4 3.4 3.5 3.5
3.6 3.7 3.7 3.7 3.8 3.8 3.9 3.9
4.1 4.1 4.2 4.3 4.4 4.5 4.7 4.7

Para resumir estos datos, se han establecido algunas normas que se dan a continuación en términos de los datos
del ejemplo 3.
1. Se determina el Rango o recorrido de la variable, que está dado por: Rango = X max − X min
En el ejemplo: Rango = 4,7 - 1,6 = 3,1

2. Se decide el número de k de clases (o intervalos de clase) a considerar.

El número de intervalos, k, a utilizar no está determinado de forma fija y por tanto se debe tomar un k que
permita trabajar cómodamente y ver bien la estructura de los datos. Como referencia nosotros tomaremos
uno de los siguientes valores aproximados:

 n si n no es muy grande

N  de intervalos  k   1+3,3log(n)
es el menor entero tal que 2k  n

Por ejemplo si el número de observaciones que tenemos es n = 100, un buen criterio es agrupar las
observaciones en k = 100 = 10 intervalos. Sin embargo si tenemos n = 1.000.000, será más razonable
elegir k = 1 + 3,3 log(1000000)  20 o 21 intervalos, que elegir k = 1000000 = 1000 !!!

En nuestro ejemplo:

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
7

k = 1 + 3.3 log(40) = 6.2868


Podríamos entonces, considerar 6 ó 7 intervalos de clase. Tomemos K = 7 .

3. Se obtiene la amplitud o tamaño del intervalo, dividiendo el rango por el número de intervalos
Rango 3.1
A= = = 0.4429  0.5
K 7

4. Se seleccionan los límites de clase que definen los intervalos, de manera que las clases sean de la misma
longitud y cada observación se clasifique sin ambigüedad en una sola clase. (Ver tabla)

Intervalos de clase ni
1.5 - 1.9 2
2.0 - 2.4 1
2.5 - 2.9 4
3.0 - 3.4 15
3.5 - 3.9 10
4.0 - 4.4 5
4.5 - 4.9 3

Observaciones:
1. El punto medio de cada clase representará los valores asignados a ella. Esto es importante porque los
puntos medios, llamados marcas de clase (mi), se utilizarán para el cálculo de medidas que resumen la
información como representantes de todos los valores que pertenecen a sus respectivas clases.
2. A los extremos de cada una de las clases se les llama límite superior y límite inferior de clase. En nuestro
ejemplo, los límites inferiores son 1.5, 2.0, 2.5, 3.0, 3.5, 4.0 y 4.5, mientras que los límites superiores son
1.9, 2.4, 2.9, 3.4, 3.9, 4.4 y 4.9.
Luego, si consideramos el primer intervalo sus límites son 1.5 - 1.9. Estos límites también se conocen con
el nombre de Límites Aparentes de clase, ya que al tratarse de una variable cuantitativa continua estos son
realmente 1.45 - 1.95, que constituyen lo que se llaman límites reales o fronteras.

Ejercicio 1: Completar la tabla, e interpretar n3 , f3 , N3 y F3.

Ejercicio 2: Moore Travel, una agencia de viajes, ofrece precios especiales en ciertas travesías por el Caribe.
Planea ofrecer varios de estos paseos durante la próxima temporada invernal y desea enviar folletos a posibles
clientes. A fin de obtener el mayor provecho por cada dólar gastado en publicidad, necesita la distribución de las
edades de los pasajeros de las travesías anteriores. Se consideró que si participaban pocas personas de un grupo
de edad en los paseos no sería económico enviar un gran número de folletos a personas de ese grupo de edad. La
agencia seleccionó una muestra de 40 clientes anteriores de sus archivos y registró sus edades, las que se
muestran a continuación:

77 54 58 63 45 18 56 58 62 66 63 36 53 62 83 84 26 51 65 71
71 38 50 62 61 63 54 34 43 52 58 50 44 52 60 61 59 41 53 60

a) Defina y clasifique la variable de interés.


b) Organice la información en una distribución de frecuencias con 6 intervalos y tal que 15 sea el límite
inferior de la primera clase.
c) Indique cuatro conclusiones útiles que permitan a la agencia planear una campaña de publicidad para la
próxima temporada.

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
8

1.4 REPRESENTACIONES GRÁFICAS


Si bien es útil clasificar los datos en categorías (o en intervalos de clase) y determinar las frecuencias absolutas
y relativas (como en las tablas anteriores), muchos analistas prefieren una representación gráfica. La gráfica
más común es aquella en que las clases se representan en el eje horizontal y las frecuencias en el vertical.

Los diagramas más adecuados para una variable cualitativa o atributo son los Diagramas de Barras y los
Gráficos Circulares.

Las figuras siguientes muestran respectivamente, un diagrama de barras y un gráfico circular correspondiente a

la distribución de frecuencias del ejemplo 1 utilizando spss.

15

12
Frecuencia

9
15
13
6 12

3
4 4

0
Administ Directiv Profesio Técnico Auxiliar

Estamento o Estratificación

Diagrama Circular para los datos del ejemplo 1

Estamento o
8,33%
Estratificación
8,33% Directivo

31,25% Administrativo
Profesionales
Técnico
Auxiliar

25,0%

27,08%

La representación gráfica más adecuada para una distribución de frecuencias como la del ejemplo 2 es el
diagrama de líneas (o varas) que grafica los valores posibles de la variable y sus frecuencias de aparición
(absolutas y/o relativas).

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
9

La figura siguiente presenta el diagrama de líneas asociado a la distribución de frecuencias del ejemplo 2.

20
Frecuencia

15

10

0
0 1 2 3 4 5 6
Nº de capacitaciones año 2006

Haciendo referencia a los datos de Ejemplo 3 que muestra 40 valores, se puede construir una representación
gráfica simple, en que cada uno de los 40 valores se indica como una vara sobre el valor correspondiente en el
eje X. (Ejercicio).

Si hay más de 25 mediciones en la muestra, la construcción de un diagrama de líneas o varas como el anterior,
involucra mayor detalle del que se necesita para efectos prácticos. La representación gráfica más frecuente para
datos agrupados en intervalos es el Histograma.

Un histograma es un conjunto de rectángulos, cada uno de los cuales representa un intervalo de agrupación o
clase. Sus bases son iguales a la amplitud del intervalo, y las alturas se determinan de manera que su Área sea
proporcional a la frecuencia de cada clase. Si los intervalos de clase tienen todos la misma amplitud, las alturas
(hi) de los rectángulos son iguales a las frecuencias de clases absolutas o relativas. Si los intervalos tienen
ni
distintas amplitudes, Ai , entonces las alturas de los rectángulos son iguales a hi = .
Ai
La figura siguiente corresponde al histograma asociado a los datos del ejemplo 3.

HISTOGRAMA PARA LOS DATOS DEL EJEMPLO 3

15.75
ni

11.81

7.88

3.94

0.00
1.7 2.2 2.7 3.2 3.7 4.2 4.7

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
10

Otro gráfico útil agregado al histograma es el polígono de frecuencias, que se construye uniendo con segmentos
de recta los puntos medios (Marcas de Clase) de los intervalos adyacentes.

Polígono de frecuencias para los datos del


Ejemplo 3
15.75

11.81

7.88

3.94

0 1.2 1.7 2.2 2.7 3.2 3.7 4.2 4.7 5.2

Así como la gráfica de las frecuencias de un conjunto de valores proporciona una descripción visual de los datos
originales, también una gráfica de frecuencias acumuladas, o de frecuencias relativas acumuladas, proporciona
información visual acerca de los valores acumulados.

Un gráfico que muestre las frecuencias acumuladas menores que cualquier frontera superior de clase trazado
sobre los límites reales superiores (o fronteras superiores) de clase se llama polígono de frecuencias
acumuladas u ojiva
Ejercicio: Dibujar la ojiva para los datos del ejemplo 3.

ESTADÍGRAFOS DE POSICION CENTRAL, DE VARIABILIDAD Y DE FORMA


Estadígrafos
Los fenómenos, en general, no suelen ser constantes, por lo que será necesario que junto a una medida que
indique el valor alrededor del cual se agrupan los datos, se asocie una medida que haga referencia a la
variabilidad que refleje dicha fluctuación.
En este sentido pueden examinarse varias características, siendo las más comunes:
• La tendencia central de los datos;

• La dispersión o variación con respecto a este centro;

• Los datos que ocupan ciertas posiciones

• La simetría de los datos.

• La forma en la que los datos se agrupan.

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
11

Figura 1: Medidas representativas de un conjunto de datos estadísticos

Posición

Centro

Asimetría
Dispersión
etríaDispersi
ón

A lo largo de esta unidad, y siguiendo este orden, iremos estudiando los estadísticos que nos van a orientar
sobre cada uno de estos niveles de información: valores alrededor de los cuales se agrupa la muestra, la
mayor o menor fluctuación alrededor de esos valores, nos interesaremos en ciertos valores que marcan
posiciones características de una distribución de frecuencias, así como su simetría y su forma.

1.5 MEDIDAS DE POSICIÓN CENTRAL


Las tres medidas más usuales de tendencia central son: la media, la mediana, la moda.

En ciertas ocasiones estos tres estadísticos suelen coincidir, aunque generalmente no es así. Cada uno de
ellos presenta ventajas e inconvenientes.

La media ( x )
La media aritmética de una variable estadística es la suma de todos sus posibles valores, ponderada por las
frecuencias de los mismos. Es decir, si la distribución de frecuencias de una variable X es

X ni fi
x1 n1 f1
... ... ...
xk nk fk

la media es el valor que podemos escribir de las siguientes formas equivalentes:

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
12

1 1 k
x = x1 f1 + x2 f 2 + ... + xk f k = ( x1n1 + ... + xk nk ) =  xi ni
n n i =1
n

x + x2 + ...xn x i
Si los datos no están ordenados en una tabla, entonces x = 1 = i =1

n n
Observación:
Hemos supuesto implícitamente en la definición de media que tratábamos con una variable X discreta. Si la
variable es continua tendremos que cambiar los valores de xi por las marcas de clase correspondientes. En
general, la media aritmética obtenida a partir de las marcas de clase mi , diferirá de la media obtenida con los
valores reales, xi . Es decir, habrá una perdida de precisión que será tanto mayor cuanto mayor sea la
diferencia entre los valores reales y las marcas de clase, o sea, cuanto mayores sean las amplitudes A i, de los
intervalos.

Algunas propiedades de la media aritmética.

 ( x − x) = 0
n
• La suma de las diferencias de la variable con respecto a la media es nula, es decir, i
i =1
Demostración
Basta desarrollar la sumatoria para obtener:

 ( x − x ) = ( x − x ) + ... + ( x )
n

i 1 n − x = ( x1 + ... + xn ) − nx = nx − nx = 0
i =1

Este resultado nos indica que el error cometido al aproximar un valor cualquiera de la variable, por ejemplo
x1, mediante el valor central , es compensado por los demás errores:

( xi − x )
n
Error aproximado de x1  x1 − x = 
i =2

Si los errores se consideran con signo positivo, en este caso no pueden compensarse. Esto ocurre si tomamos
como medida de error alguna de las siguientes:
2

( )
n
• 
i =1
xi − x 0 Error cuadrático

n
• 
i =1
x −x i  0 Error absoluto

• max xi − x  0 Error máximo


i =1,..., n

Note que estas cantidades son estrictamente positivas si algún xi  x

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
13

Ejemplo

Obtener las desviaciones con respecto a la media en la siguiente distribución y comprobar que su suma es
cero. Límites de Clase ni
0 - 10 1
10 - 20 2
20 - 30 3
30 - 40 4
Solución:

Límites de Clase ni mi mi n i mi − x ( mi − x ) n i
0 - 10 1 5 5 -19 -19
10 - 20 2 15 30 -9 -18
20 - 30 4 25 100 +1 +4
30 - 40 3 35 105 +11 +33
n = 10 4

 m n =240 i i
 =0
i =1

m n i i
240
La media aritmética es: x = i =1
= = 24
n 10
4
Como se puede comprobar sumando los elementos de la última columna,  (m
i =1
i − x)n i = 0

Proposición 1. (König)
Para cualquier posible valor k que consideremos como candidato a medida central, x lo mejora en el sentido
de los mínimos cuadrados, es decir :
2 2

( xi − x ) < 
n n

i =1 i =1
( xi − k ) si k  x

Demostración:
Sea k  x . Veamos que el error cuadrático cometido por k es mayor que el de x .
2 2

( )
n n


i =1
( xi − k ) =   xi − k − x + x 
i =1
sumando y restando x

( ) ( )
n
= 
i =1
 xi − x − k − x 
 
y desarrollando el cuadrado del binomio

 ( x − x ) ( )( ) ( )
n
− 2 k − x xi − x + k − x  aplicando 
2 2
=
i =1
i


Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
14

( ) ( )( ) ( )
n n n
xi − x +  k − x
2 2
= xi − x − 2 k − x
i =1 i =1 i =1

( )
0 2
n k − x 0

 ( x − x)
n 2
> i
i =1

• Si cada valor de la variable x se aumenta en “a” unidades entonces la media aritmética de la nueva variable
es igual a la media aritmética original multiplicada por la constante “a”, es decir:
x + a = x + a , a: constante

• Si cada valor de la variable x se multiplica por “a”, entonces la media de la nueva variable es igual a la media
aritmética original multiplicada por la constante “a”, es decir:
ax = a  x , a: constante

En Resumen:
ax + b = a  x + b
Observaciones:
1. A veces los valores x1 , x 2 ,  , x n de una variable, se les asocia ciertos factores o “pesos” w1 , w2 ,  , wn ,
que dependen de la importancia de cada uno de los valores. En este caso la media aritmética se llama Media

Aritmética Ponderada y se determina de la siguiente manera: x =


xi wi 
wi 
2. La observación número dos, la hacemos mediante el siguiente ejemplo:
Un grupo de 20 dueñas de casa gasta en promedio $90.000.- mensuales en supermercado. Otro grupo de 50
dueñas de casa gasta un promedio de $60.000.- mensuales en supermercado. Entonces el gasto promedio en
supermercado de las 70 dueñas de casa es:
(90.000)( 20) + ( 60.000)(50)
x= = $68.571, 43
70
y no $75.000.-, que es lo que se obtiene al promediar $90.000.- con $60.000.-

IMPORTANTE
A pesar de las buenas propiedades que ofrece la media, ésta posee algunos inconvenientes:
• Uno de ellos es que es muy sensible a los valores extremos de la variable, ya que todas las
observaciones intervienen en el cálculo de la media, la aparición de una observación extrema, hará que
la media se desplace en esa dirección. En consecuencia,

• no es recomendable usar la media como medida central en las distribuciones muy asimétricas;

• Depende de la división en intervalos en el caso de variables continuas.

• Si consideramos una variable discreta, por ejemplo, el número de hijos en las familias de Concepción el
valor de la media puede no pertenecer al conjunto de valores de la variable; Por ejemplo x = 2,5 hijos.

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
15

Medias generalizadas

En función del tipo de problema varias generalizaciones de la media pueden ser consideradas. He aquí
algunas de ellas aplicadas a unas observaciones x1, ..., xn:
La media geométrica x g = G
Es la media de los logaritmos de los valores de la variable:
log x1 + log x2 + ... + log xn
log x g =
n

Luego: x g = n x1 x2 ...xn

Si los datos están agrupados en una tabla, entonces se tiene:


n n
x g = n x1 1 x 2 2 ...x n k

La media armónica x a = H
Se define como el recíproco de la media aritmética de los recíprocos, es decir:

1 1 1
+ + ... +
1 x x2 xn n
= 1 , de donde : x a =
xa n 1 1 1
+ + ... +
x1 x 2 xn

La media cuadrática xc
x12 + x22 + ... + x n2
Es la raíz cuadrada de la media aritmética de los cuadrados: x c =
n

La Mediana (Me):
Otra medida de la tendencia central de un conjunto de datos es la Mediana, definida como el valor central
de un conjunto de números ordenados en forma ascendente o descendente.
Cuando desea dividir los datos en dos grupos, de modo que cada uno de ellos contenga el mismo número de
valores, la mediana resulta ser el punto de división apropiado.

Si el número de valores en el conjunto de datos (n) es impar, hay un término central y la mediana es el
Me = T n +1
valor que se ubica en el lugar Tn +1 , es decir:
2
2

si el valor del número es par, hay dos términos centrales, y la mediana es el promedio entre los valores que
Tn + Tn
Tn Tn +1
se ubican en los lugares y +1 es decir : Me = 2 2
2 2
2

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
16

Ejemplos:

1. La mediana del conjunto de valores: 4, 5, 5, 7, 9, 10, 10 es Me = 7

7+9
2. La mediana del conjunto de valores: 4, 5, 5, 7, 9, 10, 10, 11 es Me = =8
2
n
3. Para calcular la mediana de una distribución de frecuencias como la del ejemplo 2 se debe calcular , luego
2
n
la mediana es aquel valor de la variable, cuya frecuencia acumulada es N i 
2
n 25
Así, = = 12.5 y por lo tanto la mediana es 8.
2 2

1. Si los datos están agrupados en intervalos de clase como en el ejemplo 3, para calcular la mediana se debe
n 
 − N i −1 
Me = FI i +  A
utilizar la fórmula: 2
i
ni
donde i: intervalo al cual pertenece la mediana.
n
FI i : Frontera inferior del intervalo en el cual N i  .
2
n: nº total de datos.
ni: Frecuencia absoluta del intervalo de la mediana.
Ni –1: Frecuencia acumulada del intervalo anterior al de la mediana.
Ai: Amplitud

Ejercicio: Calcular la mediana para el ejemplo 3.

Observación: Entre las propiedades de la mediana, se destacan las siguientes:

• Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones extremas, ya que no
depende de los valores que toma la variable, sino del orden de las mismas. Por ello es adecuado su uso en
distribuciones asimétricas.

• Es de cálculo rápido y de interpretación sencilla.

• Si una población está formada por 2 subpoblaciones de medianas M e1 y M e 2 , sólo se puede afirmar que
la mediana, Med, de la población está comprendida entre M e1 y M e 2
M e1  M e  M e 2

• La principal desventaja de la mediana es que tiene unas propiedades matemáticas complicadas, lo que
hace que sea muy difícil de utilizar en inferencia estadística.
• Es función de los intervalos escogidos.

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
17

• La suma de las diferencias de los valores absolutos de n puntuaciones respecto a su mediana es menor o
igual que cualquier otro valor. Este es el equivalente al teorema de König (proposición 1) con respecto a
n
la media, pero donde se considera como medida de dispersión a: x
i =1
i − Me

Ejercicio.
Considere los siguientes valores X: 2, 5, 7, 9, 12 correspondientes a una muestra de una variable discreta
X, y complete las siguientes tablas:

xi xi − x ( xi − x) 2 xi − M e ( xi − M e ) 2
2
5
7
9
12
Suma

xi xi − x ( xi − x) 2 xi − M e ( xi − M e ) 2
2
5
7
9
125
Suma
Escriba conclusiones acerca de sus resultados

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
18

La Moda (Mo):

Si los datos no están agrupados en intervalos de clase, se define la Moda como aquel valor que aparece el
mayor número de veces.

Si los datos están agrupados en una distribución de frecuencias con intervalos de clase se define el intervalo
modal como aquel que tiene la mayor frecuencia absoluta y la Moda se elige como la marca de clase
correspondiente a ese intervalo.

Ejemplo: Para los datos del ejemplo 2 la moda es Mo = 8 (frecuencia absoluta = 6)


Para los datos del ejemplo 3 el intervalo modal es el cuarto 3.0 – 3.4 y la moda es la marca de clase
correspondiente, es decir: Mo = 3.2.

Observar que si obtenemos la moda a partir de los datos no agrupados, ésta resulta ser Mo = 3.1.
Notar que la moda puede ser una inadecuada medida de posición central, porque el valor que se presenta con
mayor frecuencia, no siempre está cerca del centro de los datos. Además puede ocurrir que la moda no sea
única.

frec. frec. Moda


Moda

En los ejemplos gráficos anteriores, la moda de la primera distribución está situada en la clase más baja y,
ciertamente, no puede considerarse que represente la posición central. La segunda distribución tiene dos
modas, que tampoco pueden representar la posición central de los datos. Por estas razones, la moda tiene uso
limitado como medida de posición central para la toma de decisiones. Sin embargo, es útil en el análisis
descriptivo, porque representa el valor que ocurre con mayor frecuencia.

Observación:
De la moda destacamos las siguientes propiedades:
• Es muy fácil de calcular.

• Puede no ser única.

• Es función de los intervalos elegidos a través de su amplitud, número y límites de los mismos.
• Aunque el primero o el último de los intervalos no posean extremos inferior o superior respectivamente,
la moda puede ser calculada

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
19

El Rango Medio
El Rango Medio es una medida de tendencia central que constituye el valor que está a medio camino, entre
el puntaje más alto y el más bajo, en el conjunto original de datos. Se calcula sumando el valor máximo con
el mínimo y luego dividiendo dicha suma entre 2, como se muestra a continuación:

valor máximo + valor mínimo


Rango Medio =
2
Observación: El rango medio se utiliza en pocas ocasiones.

• Puesto que sólo utiliza los valores máximo y mínimo es demasiado sensible a dichos extremos.

• Es fácil de calcular

• Ayuda a reforzar el hecho importante de que existen diferentes formas para definir el centro de un
conjunto de datos.

Ejemplo:
Para comparar las medidas de tendencia central revisadas (media, mediana, moda y rango medio),
consideremos la tabla 1 siguiente, donde los valores de los datos corresponden a los niveles medidos de
cotinina sérica (en ng/ml) en personas seleccionadas como sujetos de estudio (los datos se redondearon hacia
el entero más cercano, de tal forma que un valor cero no necesariamente implica la ausencia total de cotinina.
De hecho, todos los valores originales fueron mayores que cero). La cotinina es un metabolito de la nicotina,
es decir, es una sustancia que se produce cuando el cuerpo absorbe la nicotina. Porque se sabe que la nicotina
se absorbe cuando se consumen cigarrillos, hay una forma indirecta de medir la presencia efectiva del humo
del tabaco; esto es por medio de la cotinina. (Tomado del texto: Probabilidad y Estadística. Novena edición.
M. F. Triola. Addison Wesley)

Tabla 1: Niveles medidos de cotinina en tres grupos de individuos.


Fumador: Los sujetos informan su consumo de tabaco
HTA (Humo de Tabaco Ambiental) : Sujetos que no fuman, pero que están expuestos a humo de tabaco
ambiental (fumadores pasivos), en su casa o trabajo.
SHTA (Sin Humo de Tabaco Ambiental): Sujetos que no fuman y que no se exponen a humo de tabaco
ambiental en su casa o trabajo. Esto es, no fuman ni son fumadores pasivos.
Fumador 1 0 131 173 265 210 44 277 32 3
35 112 477 289 227 103 222 149 313 491
130 234 164 1 98 17 253 87 121 266 290
123 167 250 245 48 86 284 1 208 173
HTA 384 0 69 19 1 0 178 2 13 1
4 0 543 17 1 0 51 0 197 3
0 3 1 45 13 3 1 1 1 0
0 551 2 1 1 1 0 74 1 241
SHTA 0 0 0 0 0 0 0 0 0 0
0 9 0 0 0 0 0 0 244 0
1 0 0 0 90 1 0 309 0 0
0 0 0 0 0 0 0 0 0 0

Haciendo los cálculos para la media, mediana, moda y rango medio, se obtiene las medidas que se resumen
en la tabla 2 dada a continuación:

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
20

Tabla 2: Comparación de los niveles de cotinina de fumadores,


de no fumadores expuestos al humo ambiental del
tabaco (HAT) y de no fumadores no expuestos al humo
ambiental del tabaco (SHAT).

Fumadores HAT SHAT


Media 172.5 60.6 16.4
Mediana 170.0 1.5 0.0
Moda 1 y 173 1.0 0.0
Rango Medio 245.5 275.5 154.5

Se observa que los niveles de cotinina son más altos en los fumadores. Además, los niveles de cotinina de los
individuos que no fuman, pero están expuestos al humo del tabaco, son más altos que los de personas que
tampoco fuman y no están expuestas al humo. Lo anterior sugiere que “los fumadores pasivos” sí se ven
afectados (existen métodos para determinar si estas aparentes diferencias son estadísticamente significativas.
CURSO: Inferencia Estadística).

LA MEJOR MEDIDA DE TENDENCIA CENTRAL


De las medidas estudiadas media, mediana, moda y rango medio, ¿cuál de ellas es la mejor?
Desafortunadamente, no existe una respuesta única a esta pregunta, porque no hay criterios objetivos para
determinar la medida más representativa para todos los conjuntos de datos. Las diferentes medidas de
tendencia central presentan diversas ventajes y desventajas. Algunas de las cuales se resumen en la tabla 3
siguiente:

Tabla 3: Comparación de la media, mediana, moda y rango medio


¿Toma en ¿Se ve
Medida de
¿Qué tan cuenta todos afectada por Ventajas y
Tendencia Definición Existencia
común es? los valores valores desventajas
central
involucrados? extremos?
n Funciona
x
i =1
i
Es uno de
los más Siempre
bien con
Media x = Sí Sí muchos
n conocidos y existe
métodos
utilizados
estadísticos
Suele ser una
buena
De uso Siempre opción si hay
Mediana Término central No No
común existe algunos
valores
extremos
Podría no
Apropiada
Valor que presenta existir.
Se usa en para datos en
Moda la mayor Podría No No
ocasiones nivel
frecuencia haber más
nominal
de una
X máx + X mín Muy
Rango 2 Siempre sensible a
Poco usada No Sí
Medio existe valores
extremos.

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
21

Observaciones:
• En el caso de conjuntos de datos de distribución aproximadamente simétrica y unimodal, la media,
mediana, moda y rango medio tienden a ser iguales.
• En el caso de distribuciones claramente asimétricas, se sugiere informar tanto la media como la mediana.
• La media es relativamente confiable. Es decir, cuando las muestras se extraen de la misma población, las
medidas muestrales tienden a ser más consistentes que las demás medidas de tendencia central
(consistentes en el sentido de que las medias muestrales, extraídas de la misma población, no varían tanto
como las otras medidas de tendencia central.

1.6 MEDIDAS DE VARIABILIDAD O DISPERSIÓN


Los estadísticos de tendencia central o posición nos indican donde se sitúa un grupo de puntuaciones. Los de
variabilidad o dispersión nos indican si esas puntuaciones o valores están próximas entre sí o si por el
contrario están muy dispersas.

Rango

Una medida razonable de la variabilidad podría ser la amplitud o rango, que se obtiene restando el valor
más bajo de un conjunto de observaciones del valor más alto. Es fácil de calcular y sus unidades son las
mismas que las de la variable, aunque posee varios inconvenientes:
• No utiliza todas las observaciones (sólo dos de ellas);
• Se puede ver muy afectada por alguna observación extrema;
• El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso nunca
disminuye.
En el transcurso de esta sección, veremos medidas de dispersión mejores que la anterior. Estas se determinan
en función de la distancia entre las observaciones y algún estadístico de tendencia central.

Desviación media, Dm
Se define la desviación media como la media de las diferencias en valor absoluto de los valores de la
variable a la media, es decir, si tenemos un conjunto de n observaciones, x1, ..., xn, entonces:
n

x
1
Dm = i −x
n i =1

Si los datos están agrupados en una distribución de frecuencias, es más sencillo usar la relación:

x
1
Dm = i − x ni
n i =1

Como se observa, la desviación media guarda las mismas dimensiones que las observaciones. La suma de
valores absolutos es relativamente sencilla de calcular, pero esta simplicidad tiene un inconveniente: Desde
el punto de vista geométrico, la distancia que induce la desviación media en el espacio de observaciones no
es la natural (no permite definir ángulos entre dos conjuntos de observaciones). Esto hace que sea muy
engorroso trabajar con ella a la hora de hacer inferencia a la población.

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
22

Varianza y desviación típica


Como forma de medir la dispersión de los datos hemos descartado:

 ( x − x ) = 0 , pues sabemos que esa suma vale 0, ya que las desviaciones con respecto a la media se
n
• i
i =1
compensan al haber términos en esa suma que son de signos distintos.

• Para tener el mismo signo al sumar las desviaciones con respecto a la media podemos realizar la suma con
valores absolutos. Esto nos lleva a la Dm, pero como hemos mencionado, tiene poco interés por las
dificultades que presenta.

( )
2
Si las desviaciones con respecto a la media las consideramos al cuadrado, xi − x , de nuevo obtenemos que
todos los sumandos tienen el mismo signo (positivo). Esta es además la forma de medir la dispersión de los
datos de forma que sus propiedades matemáticas son más fáciles de utilizar. Vamos a definir entonces dos
estadísticos que serán fundamentales en el resto del curso: La varianza y la desviación típica.
La Varianza y la Desviación Estándar:
Estas dos medidas de dispersión son las más importantes y las de mayor utilidad práctica y teórica.

La varianza, S 2 , se define como la media de las diferencias cuadráticas de n puntuaciones y se denota por
n

2
S o por V(X). Es decir:
 (x i − x) 2
s =
2

n
Para describir la Variabilidad de los datos, en vez de (o conjuntamente con) la Varianza se usa con mucha
frecuencia la raíz cuadrada positiva de la Varianza, denotada por S y llamada Desviación Estándar o típica.

La desviación estándar es, por lo general, más conveniente que la Varianza para interpretar la Variabilidad de
un conjunto de datos, ya que s 2 está expresada en unidades al cuadrado, en tanto que s tiene las mismas
unidades que los datos originales. La desviación estándar se define de la siguiente manera:
1/2
 n 2
  (x i − x) 
S =  i =1 
 n 
 

Para ilustrar el cálculo de una varianza y una desviación estándar, supondremos que los valores de X en la
tabla siguiente representan el número de grabadoras ensambladas por 10 trabajadores diferentes en una
fábrica el pasado mes.
Esto es, el primer trabajador ensambló 115 grabadoras, el segundo 122, etc.
1200
El número medio de grabadoras ensambladas es: x = = 120 (grabadoras)
10

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
23

Tabla:
xi (x i −x ) (x i −x )
2

115 –5 25
122 +2 4
129 +9 81
113 –7 49
119 –1 1
124 +4 16
132 +12 144
120 0 0
110 –10 100
116 –4 26
1200 0 436
En la segunda columna se observan las desviaciones respecto a la media. Note que la suma de estas
desviaciones es igual a cero. En la tercera columna están los cuadrados de las desviaciones respecto a la
media, cuya suma es 436. Entonces, el promedio de los cuadrados de las desviaciones (la Varianza) es:
436
s2 = = 43.6 (grabadoras)2
10
Para los datos de la tabla anterior, la desviación estándar es: S = ( 43.6 ) = 6.6 (grabadoras)

 (m )
k
2
i − x ni
Si los datos están agrupados en tablas de frecuencias, la varianza está dada por:
s =
2

n
k

Donde: mi : es la marca de clase del intervalo i , x =


m n i i
, y ni : es la frecuencia absoluta del
n
intervalo i .

 (x )  (m )
n k
2 2
i −x i − x ni
Nota: las fórmulas para datos no agrupados, y para datos
S = S =
2 2

n n
agrupados en intervalos de clase se pueden transformar en expresiones más simples mediante un desarrollo
algebraico sencillo como se muestra a continuación: (tarea)

Ejemplo
Calcular la varianza y desviación típica (o estándar) de las siguientes cantidades medidas en metros:
3, 3, 4, 4, 5

Solución: Para calcular dichas medidas de dispersión es necesario calcular previamente el valor con respecto
al cual vamos a medir las diferencias. Éste es la media:
La varianza es:

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
24

Siendo la desviación típica su raíz cuadrada:

Ejemplo: Para la distribución de frecuencias del ejemplo 3 se tiene:

ni mi m i2 n i
2 1.7 5.78
1 2.2 4.84
4 2.7 29.16
15 3.2 153.60
10 3.7 136.90
5 4.2 88.20
3 4.7 66.27
484.75

y S 2
=
n m i i
2
2
−x =
484.75
− (3.4125 ) = 12.11875 − 11.64516 = 0.47359 (años)2
2

n 40

s = 0.688 (años)

Si calculamos la Varianza a partir de los datos no agrupados, se tiene:


n

x 2
i
485.07
− ( 3.4125 ) = 12.12675 − 11.645 = 0.4816 (años)2
2
S2 = −x =
2

n 40

s = 0.694 (años)

Observaciones:

1º En general, es difícil hacer una interpretación precisa de los valores de s2 y s en razón que la variabilidad
depende mucho de la unidad de medida. Por ejemplo, la variabilidad de los ingresos en Chile es ciertamente
mayor cuando se mide en pesos que cuando se mide en miles de pesos. En todos los casos, cuando crece la
dispersión de una población, también crece el valor de s2 (y el de s). Por otra parte, si s2 = s = 0, significa
que no existe ninguna variabilidad entre los datos (todos los valores de X son iguales entre sí, es decir, X es
una constante).

2º Una regla práctica que a menudo proporciona una buena aproximación al grado de dispersión de un conjunto
de observaciones establece que:

“Alrededor del 68% de todos los valores caerán dentro de una desviación estándar a ambos lados de la media
y más o menos el 95% de todos los valores caerán dentro de dos desviaciones estándar a ambos lados de la
media”

Esta regla práctica se basa en la suposición de que la población tiene una distribución simétrica o casi
simétrica de forma acampanada que se llama Distribución normal.

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
25

Como ejemplo del proceso de interpretación de la varianza y de la desviación estándar, consideramos los
datos de la tabla indicada en página 23. Anteriormente calculamos la media y la varianza y obtuvimos
x = 120 , s 2 = 43.6 y s = 6.6 .
Si se cumpliera la regla práctica, entonces el intervalo x  s debería contener aproximadamente el 68% de
los datos; y x  2 s alrededor del 95% de todos estos valores.

Verificando estos intervalos contra los valores del ejemplo, se obtienen los siguientes resultados:
x  S = 113.4 a 126.6 60% de valores

x  2S = 106.8 a 133.2 100% de valores

lo que indica una descripción aceptable de la variabilidad de los datos y de su posición central.

3º Si la mayor parte de los valores están a la derecha (izquierda) de la moda, se dice que la distribución es
sesgada a la derecha (izquierda) o que tiene sesgo positivo (negativo), y en tal caso M o  M e  x
(x  Me  Mo )

En este caso, un interesante y útil teorema desarrollado por el matemático ruso Tchebyshef resulta adecuado
para describir la distribución de los datos.

Teorema de Tchebyshef: Dados un número k (k  1) y un conjunto de observaciones x1 , x 2 ,  , x n , al


 1 
menos el 1 − 2 100% de las observaciones caen dentro de k desviaciones estándar alrededor de la media.
 k 
Las siguientes propiedades de la varianza (respectivamente, desviación típica) son importantes a la hora de
hacer un cambio de origen y escala a una variable. En primer lugar, la varianza (resp. desviación típica) no se
ve afectada si al conjunto de valores de la variable se le añade una constante. Si además cada observación es
multiplicada por otra constante, en este caso la varianza cambia en relación al cuadrado de la constante
(respectivamente, la desviación típica cambia en relación al valor absoluto de la constante).

Propiedades de la Varianza.

⚫ La varianza de una constante es cero, es decir la varianza de X es cero si x1 = x 2 =  x n = c y se


escribe V (c ) = 0 .
⚫ Si cada valor de la variable X se aumenta en “a” unidades, entonces la varianza de la nueva variable
obtenida es igual a la varianza de la variable original X, y se escribe: V(X + a) = V(X)

⚫ Si cada valor de la variable X se multiplica por “a”, entonces la varianza de la nueva variable que se
obtiene es igual a la varianza de X multiplicada por la constante a al cuadrado, es decir: V(aX) = a 2 V(X)

Observación
Además de las propiedades que hemos demostrado sobre la varianza (y por tanto sobre la desviación típica),
será conveniente tener siempre en mente otras que enunciamos a continuación:

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
26

• Ambas son sensibles a la variación de cada una de las puntuaciones, es decir, si una puntuación cambia,
cambia con ella la varianza. La razón es que si miramos su definición, la varianza es función de cada una de
las puntuaciones.

• Si se calculan a través de los datos agrupados en una tabla, dependen de los intervalos elegidos. Es decir,
cometemos cierto error en el cálculo de la varianza cuando los datos han sido resumidos en una tabla
estadística mediante intervalos, en lugar de haber sido calculados directamente como datos no agrupados.
Este error no será importante si la elección del número de intervalos, amplitud y límites de los mismos ha
sido adecuada.

• No es recomendable el uso de ellas, cuando tampoco lo sea el de la media como medida de tendencia central.

Coeficiente de variación
Hemos visto que las medidas de centralización y dispersión nos dan información sobre una muestra. Nos
podemos preguntar si tiene sentido usar estas magnitudes para comparar dos poblaciones. Por ejemplo, si nos
piden comparar la dispersión de los pesos de las poblaciones de elefantes de dos circos diferentes, S nos dará
información útil.

¿Pero qué ocurre si lo que comparamos es la altura de unos elefantes con respecto a su peso? Tanto la media
como la desviación típica, X y S, se expresan en las mismas unidades que la variable. Por ejemplo, en la
variable altura podemos usar como unidad de longitud el metro y en la variable peso, el kilogramo. Comparar
una desviación (con respecto a la media) medida en metros con otra en kilogramos no tiene ningún sentido.

El problema no deriva sólo de que una de las medidas sea de longitud y la otra sea de masa. El mismo problema
se plantea si medimos cierta cantidad, por ejemplo, la masa de dos poblaciones, pero con distintas unidades.
Este es el caso en que comparamos el peso en toneladas de una población de 100 elefantes con el
correspondiente en miligramos de una población de 50 insectos (por ejemplo, arañas).

El problema no se resuelve tomando las mismas escalas para ambas poblaciones. Por ejemplo, se nos puede
ocurrir medir el peso de un insecto con la misma unidad de medida que se usaría para medir el peso de los
elefantes (toneladas). Lo lógico es que la dispersión de la variable peso de los insectos sea prácticamente nula
(Aunque haya algunos que sean 1000 veces mayores que otros)

En los dos primeros casos mencionados anteriormente, el problema viene de la dimensionalidad de las
variables, y en el tercero de la diferencia enorme entre las medias de ambas poblaciones. El coeficiente de
variación es lo que nos permite evitar estos problemas, pues elimina la dimensionalidad de las variables y tiene
en cuenta la proporción existente entre medias y desviación típica. Se define del siguiente modo:

SX
CV(X) =
X
Basta dar una rápida mirada a la definición del coeficiente de variación, para ver que las siguientes
consideraciones deben ser tenidas en cuenta:

• No es invariante ante cambios de origen. Es decir, si a los resultados de una medida le sumamos una cantidad
positiva, b > 0, para tener Y = X + b, entonces CV(Y) < CV(X) , ya que la desviación típica no es sensible
ante cambios de origen, pero si la media. Lo contrario ocurre si restamos (b < 0).

Sy SX S
CV(Y) = = < X = CV(X)
Y X +b X
Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
27

• Es invariante a cambios de escala. Si multiplicamos X por una constante a, para obtener Y = aX, entonces

Sy SaX aS X
CV(Y) = = < = CV(X)
Y aX aX
Observación.
Es importante destacar que los coeficientes de variación sirven para comparar las variabilidades de dos
conjuntos de valores (muestras o poblaciones), mientras que, si deseamos comparar a dos individuos de cada
uno de esos conjuntos, es necesario usar los valores tipificados.

Ejemplo.
Dada la distribución de las horas trabajadas en un grupo de 100 personas, obtener:
a) La variable tipificada Z.
b) Valores de la media y varianza de Z.
c) Coeficiente de variación de Z.

Horas trabajadas Número de empleados


0 - 4 47
4 - 10 32
10 - 20 17
20 - 40 4
100
Solución:

X −X
Para calcular la variable tipificada Z =
SX
Partimos de los datos del enunciado. Será necesario calcular en primer lugar la media y desviación típica de la
variable original (X: horas trabajadas).
li-1 -- li mi ni mi ni mi2 ni
0 -- 4 2 47 94 188
4 -- 10 7 32 224 1.568
10 -- 20 15 17 255 3.825
20 -- 40 30 4 120 3.600
n = 100 693 9.181

 ( x − x)
n 2
i
693
X= = 6.93 horas, S X2 = i =1
= 43,78 horas al cuadrado, S X = 6,6 horas
100 n

A partir de estos valores podremos calcular los valores tipificados para las marcas de clase de cada intervalo y
construir su distribución de frecuencias:

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
28

2 − 6,93 7 − 6,93 15 − 6,93 30 − 6,93


Z1 = = −0, 745 , Z2 = = 0, 011 , Z 3 = = 1, 22 , Z 4 = = 3, 486
6, 6 6, 6 6, 6 6, 6

Zi ni zi ni zi2 ni
-0,745 47 -35,015 26,086
0,011 32 0,352 0,004
1,220 17 20,720 25,303
3,486 4 13,944 48,609
n = 100 0,021 100,002

0, 021 z n 2
i i
2 100, 002 2
X= = 0, 00021  0 , S Z2 = i =1
−z = − 0 1, SZ = 1
100 n 100

SZ 1
CV(Z) = = =  . Es decir, el coeficiente de variación no debe usarse nunca con variables tipificadas.
Z 0
Tipificación

Se conoce por tipificación al proceso de restar la media y dividir por su desviación típica a una variable X. De
X −X
este modo se obtiene una nueva variable : Z =
S

de media Z = 0 y desviación típica o estándar S Z = 1 , que denominamos variable tipificada.

Esta nueva variable carece de unidades y permite hacer comparables dos medidas que en un principio no lo son,
por aludir a conceptos diferentes. Así por ejemplo nos podemos preguntar si un elefante es más grueso que una
hormiga determinada, cada uno en relación a su población. También es aplicable al caso en que se quieran
comparar individuos semejantes de poblaciones diferentes. Por ejemplo, si deseamos comparar el nivel
académico de dos estudiantes de diferentes Universidades para la concesión de una beca de estudios, en
principio sería injusto concederla directamente al que posea una nota media más elevada, ya que la dificultad
para conseguir una buena calificación puede ser mucho mayor en un centro que en el otro, lo que limita las
posibilidades de uno de los estudiante y favorece al otro. En este caso, lo más correcto es comparar las
calificaciones de ambos estudiantes, pero tipificadas cada una de ellas por las medias y desviaciones típicas
respectivas de las notas de los alumnos de cada Universidad.

1.7 OTRAS MEDIDAS DESCRIPTIVAS: CUANTILES

El Percentil de orden k es aquel valor tal que el k% de las observaciones son menores o iguales a él, y el
porcentaje restante es superior a este valor.

Para datos no agrupados, se siguen los siguientes pasos para el cálculo de percentiles:

• Las n observaciones deben estar ordenadas (orden ascendente)

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
29

(n + 1) k
• Identificar la posición del Percentil de orden k (Pos) Pos = = k % de (n+1)
100
• Identificar la parte entera de Pos [Pos]

• Identificar la parte decimal de Pos deci(Pos)

• Calcular Pk = (deci ( Pos))  X  Pos+1 + 1 − deci (Pos)  X  Pos

Ejercicio: Calcular el primer cuartil, tercer cuartil, mediana, percentil al 5% y percentil al 56% de los siguientes
datos correspondientes a la estatura de 31 estudiantes

1,48 1,56 1,56 1,59 1,60 1,61 1,63 1,64 1,64 1,67

1,68 1,68 1,68 1,68 1,69 1,70 1,71 1,72 1,72 1,75

1,76 1,76 1,77 1,77 1,79 1,81 1,81 1,84 1,84 1,88

1,94

En el caso de datos agrupados en intervalos de clases, los pasos son los siguientes:
nk
• Calcular el valor de (k% de n)
100
nk
• Identificar la primera frecuencia acumulada N i tal que Ni 
100
nk
• El intervalo mediano es aquel donde Ni 
100
 nk 
100 − Ni −1 
• Calcular Pk = FRI i + Ai
ni

Por su propia naturaleza, el percentil puede estar situado en cualquier lugar de la distribución, por lo que no
puede considerársele como una medida de tendencia central.
Los cuartiles, ql , son un caso particular de
los percentiles. Hay 3, y se definen como: q1 = P25

q2 = P50 = Me
q3 = P75
De forma análoga se definen los deciles como
los valores de la variable que dividen a las observaciones en 10 grupos de igual tamaño. Más precisamente,
definimos d1, d2, ..., d9 como:

d i = P10i i = 1, 2,…,9

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
30

Los percentiles (que incluyen a la mediana, cuartiles y deciles) también son denominados estadísticos de
posición.

Grados de libertad

Los grados de libertad de un estadístico calculado sobre n datos se refieren al número de cantidades
independientes que se necesitan en su cálculo, menos el número de restricciones que ligan a las observaciones y
el estadístico. Es decir, normalmente n - 1.

Veamos un ejemplo. Consideramos una serie de valores de una variable X: 2, 5, 7, 9, 12 que han sido tomados
de forma independiente.

Su media es x = 7 y se ha calculado a partir de las n = 5 observaciones independientes xi, que están ligadas a la
n

x i
media por la relación: x = i =1
. Luego el número de grados de libertad de la media es n - 1 = 4.
n

( x − x)
2
i
Si calculamos a continuación la varianza, se han de sumar n cantidades
n
Sin embargo esas cantidades no son totalmente independientes, pues están ligadas por una restricción:

n   n  
 x −  x  / n = 0
 i   i  
i =1  i =1  

El número de grados de libertad del estadístico es el número de observaciones de la variable menos el


número de restricciones que verifican, así que en este caso, los grados de libertad de la varianza sobre los n = 5
datos son también n - 1 = 4.
Un principio general de la teoría matemática nos dice que si pretendemos calcular de modo aproximado la
varianza de una población a partir de la varianza de una muestra suya, se tiene que el error cometido es
generalmente más pequeño, si en vez de considerar como estimación de la varianza de la población, a la

 (x )
n
2
i −x
i =1
varianza muestral: S 2 = , consideramos lo que se denomina cuasivarianza muestral, Ŝ 2 que se
n
calcula como la anterior, pero cambiando el denominador por el número de grados de libertad, n-1:

 ( x − x)
n 2
i
nS 2
Sˆ 2 = i =1
=
n −1 n −1

1.8 ASIMETRÍA Y APUNTAMIENTO


Sabemos cómo calcular valores alrededor de los cuales se distribuyen las observaciones de una variable sobre
una muestra y sabemos cómo calcular la dispersión que ofrecen los mismos con respecto al valor central. Nos
proponemos dar un paso más allá en el análisis de la variable. En primer lugar, nos vamos a plantear el saber si

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
31

los datos se distribuyen de forma simétrica con respecto a un valor central, o si bien la gráfica que representa la
distribución de frecuencias es de una forma diferente del lado derecho que del lado izquierdo.

Si la simetría ha sido determinada, podemos preguntarnos si la curva es más o menos apuntada (larga y
estrecha). Este apuntamiento habrá que medirlo comparado a cierta distribución de frecuencias que
consideramos normal (no por casualidad es éste el nombre que recibe la distribución de referencia).

Estas ideas son las que veremos a continuación.

Estadísticos de asimetría
Para saber si una distribución de frecuencias es simétrica, hay que precisar con respecto a qué. Un buen
candidato es la mediana, ya que, para variables continuas, divide al histograma de frecuencias en dos partes de
igual área. Podemos basarnos en ella para, de forma natural, decir que una distribución de frecuencias es
simétrica si el lado derecho de la gráfica (a partir de la mediana) es la imagen por un espejo del lado izquierdo
(Figura 2).
Figura 2: Distribuciones de frecuencias simétricas y asimétricas

Cuando la variable es discreta, decimos que es simétrica, si lo es con respecto a la media.


Observación
• Se podría pensar que definir la simetría con usando la mediana para variables continuas y usando la media
para variables discretas es una elección arbitraria. En realidad, esto no es así, pues si una variable es
continua, coinciden los ambos criterios de simetría (con respecto a la media y a la mediana). Es más, se tiene
que media y mediana coinciden para distribuciones continuas simétricas. Por otro lado,
• en el caso de variables discretas, la distribución es simétrica si el lado derecho del diagrama se obtiene por
imagen especular desde la media. En este caso coincide la media con la mediana si el número de
observaciones es impar.

• Si la variable es continua simétrica y unimodal, coinciden la media, la mediana y la moda.

Dentro de los tipos de asimetría posible, vamos a destacar los dos fundamentales (Figura 3):

Asimetría positiva:
Si las frecuencias más altas se encuentran en el lado izquierdo de la mediana, mientras que en el derecho hay
frecuencias más pequeñas (cola).

Asimetría negativa:
Cuando la cola está en el lado izquierdo.

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
32

Figura 3: Asimetría positiva y asimetría negativa

Cuando realizamos un estudio descriptivo es poco probable que la distribución de frecuencias sea totalmente
simétrica. En la práctica diremos que la distribución de frecuencias es simétrica si lo es de un modo
aproximado. Por otro lado, aún observando cuidadosamente la gráfica, podemos no ver claro de qué lado están
las frecuencias más altas. Conviene definir entonces unos estadísticos que ayuden a interpretar la asimetría, a
los que llamaremos índices de asimetría, y que denotaremos mediante AS . Vamos a definir a continuación
algunos de los índices de asimetría más usuales como son el índice basado en los tres cuartiles, el momento de
tercer orden y la distancia entre la moda y la media o la media y la mediana.

Índice basado en los tres cuartiles (Yule-Bowley)

Si una distribución es simétrica, es claro que deben haber tantas observaciones entre la que deja por debajo de sí
las tres cuartas partes de la distribución y la mediana, como entre la mediana y la que deja por debajo de sí un
cuarto de todas las observaciones.

De forma abreviada esto es, q3 − q2 = q2 − q1

Una pista para saber si una distribución de frecuencias es asimétrica positiva la descubrimos observando la
figura 3: q3 − q2  q2 − q1

Por analogía, si es asimétrica negativa, se tendrá q3 − q2  q2 − q1

Para quitar dimensionalidad al problema, utilizamos como índice de asimetría la cantidad:

AS =
( q3 − q2 ) − ( q2 − q1 )
q3 − q1

Es claro que -1  AS =
( q3 − q2 ) − ( q2 − q1 )  1...........................*
(q3 − q2 ) + (q2 − q1 )

El número obtenido, AS , es invariante ante cambios de origen de referencia y de escala.

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
33

Figura 4: Uso de los cuartiles para medir la asimetría

Índice basado en el momento central de tercer orden

1 n p
n
Sea X una variable cuantitativa y p . Llamamos momento de orden p a: p = Xi
i =1

1 n
Se denomina momento central de orden p a la cantidad: m p = 
n i =1
(Xi − X )p

1 k
Si los datos están agrupados en una tabla, mp admite otra expresión equivalente: m p = 
n i =1
ni ( X i − X ) p

Ejemplo
Por propiedad de la media se tiene que m1 = 0.

El momento de orden 2 es la varianza muestral: m2 = S 2

Es sencillo comprobar que los momentos de orden p impar, son siempre nulos en el caso de variables simétricas,
( )
ya que para cada i que esté a un lado de la media, con xi − x  0 , le corresponde una observación j del otro

lado de la media tal que (x j )


− x = −( xi − x) . Elevando cada una de esas cantidades a p impar, y sumando se
tiene que m p = 0 si la distribución es simétrica.

( )
p
Si la distribución fuese asimétrica positiva, las cantidades xi − x , con p  3 impar positivas estarían muy
aumentadas al elevarse a p. Esta propiedad nos indica que un índice de asimetría posible consiste en tomar p =
1 n
n
( xi − x)3
m3
3 y definir AS = a3 = = i =1 3 . . . **
m2 m2 S

1 n
n
ni ( xi − x)3
que para datos organizados en una tabla sería a3 = i =1
S3

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
34

Apoyándonos en este índice, diremos que hay asimetría positiva si a3 > 0, y que la asimetría es negativa si

a3 < 0.

Observación
Hemos dividido m3 por el cubo de S para que a3 sea un número abstracto sin dimensiones, independiente de la
variabilidad de la variable. Por otro lado, la cantidad AS definida por la relación (*) no es la misma que la
definida en (**). Simplemente las denotamos AS para simbolizar que es un índice de asimetría.
Otros índices de asimetría
n

n  ( x − x)
i
3

AS = i =1
Diremos que hay asimetría positiva si AS > 0 y negativa si AS < 0.
(n − 1)(n − 2) S3

Basándonos en que si una distribución de frecuencias es simétrica y unimodal, entonces la media, la mediana y
la moda coinciden, podemos definir otras medidas de asimetría, como son:

X − Moda 3( X − Me)
AS = o bien, AS =
S S

Diremos que hay asimetría positiva si AS > 0 y negativa si AS < 0.

Ejemplo
Las edades de un grupo de personas se reflejan en la tabla siguiente:
Intervalos ni
7 - 9 4
9 - 11 18
11 - 12 14
12 - 13 27
13 - 14 42
14 - 15 31
15 - 16 20
16 - 17 1
157
Determinar la variabilidad de la edad mediante los estadísticos varianza, desviación típica, coeficiente de
variación y rango intercuartílico. Estudie la simetría de la variable.

Solución:

En primer lugar realizamos los cálculos necesarios a partir de la tabla de frecuencias:


Intervalos ni mi Ni mi ni mi2 ni
7 - 9 4 8 4 32 256
9 - 11 18 10 22 180 1.800
11 - 12 14 11,5 36 161 1.851,5
12 - 13 27 12,5 63 337,5 4.218,75
13 - 14 42 13,5 105 567 7.654,5

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
35

14 - 15 31 14,5 136 449,5 6.517,75


15 - 16 20 16 156 320 5.120
16 - 17 1 18 157 18 324
157 2065 27742,25

Estadísticos de apuntamiento
m4
Se define el coeficiente de aplastamiento de Fisher como:  2 = −3
S4
donde m4 es el momento empírico de cuarto orden. Es éste un coeficiente adimensional, invariante ante cambios
de escala y de origen. Sirve para medir si una distribución de frecuencias es muy apuntada o no. Para decir si la
distribución es larga y estrecha, hay que tener un patrón de referencia. El patrón de referencia es la distribución
m4
normal o gaussiana para la que se tiene: = 3  2 = 0
S4

De este modo, atendiendo a  2 , se clasifican las distribuciones de frecuencias en (Figura 5):

Leptocúrtica: Cuando  2 > 0, o sea, si la distribución de frecuencias es más apuntada que la normal;

Mesocúrtica: Cuando  2 = 0, es decir, cuando la distribución de frecuencias es tan apuntada como la normal;

Platicúrtica: Cuando  2 < 0 , o sea, si la distribución de frecuencias es menos apuntada que la normal;

Figura 5: Apuntamiento de distribuciones de frecuencias

1.9 ANÁLISIS EXPLORATORIO DE DATOS

Definición
Análisis exploratorio de datos: proceso para utilizar herramientas estadísticas (como gráficas, medidas de
tendencia central y medidas de variación), con la finalidad de investigar conjuntos de datos para
comprender sus características importantes.

Datos distantes

Dato distante: valor que está muy alejado de la mayoría de los demás valores. Un dato distante es un valor
extremo en relación con los otros datos. Cuando se explora un conjunto de datos, se deben considerar los datos
distantes, ya que pueden revelar información importante y afectar, en gran medida, el valor de la media y de la

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
36

desviación estándar, así como distorsionar gravemente un histograma. El siguiente ejemplo utiliza un valor
incorrecto para un dato distante; aunque no todos los datos distantes son errores, algunos de ellos son valores
correctos.

Ejemplo: Cuando se introducen datos a una planilla electrónica o a una calculadora, es fácil cometer errores. A
modo de ejemplo retomemos el de los niveles de cotinina de la página 18 de este apunte y supongamos que por
error, el primer dato (que es 1) se introduce como 11111. Este dato es un dato distante o atípico (outlier) ya que
se localiza muy lejos de los demás valores. ¿De qué manera afecta ese dato distante a la media, a la desviación
estándar y al histograma?

Cuando el dato 1 se reemplaza con el valor distante de 11111, la media cambia de 172.5 a 450.2, de modo que el
efecto del dato distante es muy grande. El dato incorrecto de 11111 causa que la desviación estándar cambie de
119.5 a 1732.7, por lo que el efecto del dato distante también es muy grande. Por otra parte, la figura 6 siguiente
muestra el histograma con los valores correctos de los niveles de cotinina de fumadores y la figura 7 muestra el
histograma que resulta del uso de los mismos datos con el valor 1, reemplazado por el valor incorrecto de
11111. Si comparamos, fácilmente vemos que la presencia del dato distante afecta de manera drástica la forma
de la distribución.

Figura 6: Histograma de niveles de cotinina en fumadores Figura 7: Histograma de niveles de cotinina en fumadores

14 40

12
30
10
Frecuencias

Frecuencias

8
20
6

4
10

0 0
-0,5 99,5 199,5 299,5 399,5 499,5 -5000 0 5000 10000 15000
niveles de cotinina niveles de cotinina

El ejemplo anterior ilustra estos principios importantes:

1. Un dato distante puede tener un efecto importante sobre la media.


2. Un datos distante puede tener un efecto importante sobre la desviación estándar.
3. Un dato distante puede tener un efecto importante sobre la escala del histograma, de modo que la
verdadera naturaleza de la distribución se oculta totalmente.
Un procedimiento sencillo para encontrar datos distantes es el examen de una lista ordenada de los datos. En
particular, se debe observar los valores mínimos y máximo muestrales; luego, determinar si se alejan mucho de
los demás valores. Algunos datos distantes son valores correctos y algunos son errores, como en el ejemplo
anterior. Si estamos seguros de que un dato distante es un error, debemos corregirlo o eliminarlo. Si incluimos
un dato distante, porque sabemos que es correcto, se debería estudiar sus efectos por medio de la construcción
de gráficas y el cálculo de estadísticos que incluyan y que no incluyan los datos distantes.

Además de las representaciones gráficas ya estudiadas, un diagrama de “caja y bigotes” es otro tipo de gráfica
que se utiliza a menudo. Los diagramas de caja y bigotes son útiles para revelar la tendencia central de los datos,
su dispersión, su distribución y la presencia de datos distantes.

La construcción de un diagrama de caja y bigotes requiere que primero se obtenga el valor mínimo, el valor
máximo y los cuartiles, tal como se define en el resumen de los cinco números.
Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
37

PROCEDIMIENTO PARA CONSTRUIR UN DIAGRAMA DE CAJA Y BIGOTES (gráfica de cuadro)

1. Elabore el resumen de los cinco números, consistente en el valor mínimo, primer cuartil, mediana,
tercer cuartil y el valor máximo.
X mín q1 mediana q3 X máx
2. Construya una escala sobre el eje X con valores que incluyan el valor mínimo y máximo.

3. Construya un cuadro (rectángulo) que se extienda desde q1 hasta q3 y dibuje una línea en la caja,
correspondiente al valor de la mediana. Observe que el ancho de la base de la caja es q3 - q1 , este
número se conoce como rango o recorrido intercuartílico y se denota por RI = q3 - q1 .

4. Establezca dos conjuntos de límites en la gráfica de cuadro: Las cotas interiores y las cotas exteriores.
• Las cotas interiores se localizan a una distancia de 1.5(RI) por debajo de q1 y por arriba de
q3 . Es decir, CII = Cota Interior Inferior = q1 - 1.5(RI) y
CIS = Cota Interior Superior = q3 + 1.5(RI)

• Las cotas exteriores se encuentran a una distancia de 3(RI) por debajo de q1 y por arriba de
q3 . Es decir, CEI = Cota Exterior Inferior = q1 - 3(RI) y
CES = Cota Exterior Superior = q3 + 3(RI)

Las observaciones que caen entre las cotas interiores y exteriores se denominan posibles valores fuera
del intervalo. Se utilizan asteriscos para marcar los posibles valores fuera del intervalo.

Las observaciones que caen fuera de las cotas exteriores se denominan valores fuera del intervalo muy
probables. Se utilizan círculos pequeños para marcar valores fuera del intervalo muy probables.

5. A fin de destacar aún más los valores extremos, se añaden “bigotes” a la gráfica de cuadro de la
siguiente forma: Marque el valor de la observación dentro de la región entre CII y q1 que esté más
cercano a CII con una X y únala al cuadro con una línea punteada (un “bigote”). De igual forma utilice
una X y su “bigote” para ubicar el valor más extremo entre q3 y CIS.

Ejemplo: Para los niveles de cotinina en fumadores, considere toda la información dada y construya un
diagrama de caja y bigotes.

X mín = 0.0, q1 = 86.3, mediana = 170.0, q3 = 252.3, X máx = 491.0

RI = 252.3 - 86.3 = 166.0

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.
38

CII = q1 - 1.5(RI) = 86.3 – 1.5(166) = 86.3 – 249 = - 162.7 COTAS INTERIORES


CIS = q3 + 1.5(RI) = 252.3 + 1.5(166) = 252.3 + 249 = 501.3

CEI = q1 - 3(RI) = 86.3 – 3(166) = - 411.7 COTAS EXTERIORES


CES = q3 + 3(RI) = 252.3 + 3(166) = 750.3

Ejercicio:
El resumen estadístico que se da a continuación se refiere a los tiempos de CPU (en segundos) que 25
trabajos estuvieron en control de la unidad central de procesos (CPU) de una computadora mainframe
grande. Representan una muestra seleccionada de una población de 1000 tiempos de CPU.

Descriptive Statistics: CPU

Total
Variable Count Minimum Q1 Median Q3 Maximum RI
CPU 25 0,020 0,785 1,380 2,285 4,750 1,500

Utilice esta información para construir un diagrama de caja y bigotes ¿hay puntos atípicos?

Apuntes preparados para el curso (220227) Primer semestre 2021 - Profesora: Nelly M. Gómez F.

También podría gustarte