Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Autor
Profesional en Matemáticas y Estadística
Todos los derechos reservados. Ninguna parte de esta publicación puede ser reproducida, almacenada
en sistema alguno de tarjetas perforadas o trasmitida por otro medio – electrónico, mecánico,
fotocopiador, registrador, etcétera sin permiso previo por escrito del autor.
All rights reserved. No part of this publication may be reproduced, stored in a retrieval system, or
transmitted in any form by any means, electronic, mechanical, photocopying, recording or otherwise,
without the prior writing permission from author.
Tabla de contenido
ESTADÍSTICA.......................................................................................................................................4
POBLACIÓN Y MUESTRA......................................................................................................................5
VARIABLE Y TIPO DE VARIABLE...........................................................................................................5
Según la medición..........................................................................................................................5
Variables cualitativas..................................................................................................................5
Variables cuantitativas.................................................................................................................5
Según la influencia..........................................................................................................................6
Variables independientes............................................................................................................6
Variables dependientes...............................................................................................................6
ESCALAS DE MEDIDAS.........................................................................................................................6
DISTRIBUCIONES DE FRECUENCIAS.....................................................................................................7
Tablas y gráficas de frecuencias para variables cuantitativas..........................................................7
Variables discretas..........................................................................................................................7
Distribución de frecuencias agrupadas........................................................................................8
Variable continua...........................................................................................................................9
Graficas para variables cuantitativas.............................................................................................10
Gráfico de barras de frecuencias.................................................................................................11
Histograma de frecuencias........................................................................................................12
Polígono de frecuencias............................................................................................................13
Ojiva de frecuencias....................................................................................................................13
Tablas y gráficas de frecuencias para variables cualitativas................................................................14
GUÍA DE CLASE N° 1............................................................................................................................17
MEDIDAS DE TENDENCIA CENTRAL.....................................................................................................19
La Media Aritmética (o simplemente Media)...................................................................................19
Media geométrica...........................................................................................................................21
Media armónica.............................................................................................................................22
Mediana.........................................................................................................................................22
Moda............................................................................................................................................24
Relación entre las medidas de tendencia central..................................................................................26
OTRAS MEDIDAS DE POSICIÓN...........................................................................................................27
Cuartiles.........................................................................................................................................27
La estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos, la
cual ayuda en la toma de decisiones o para explicar condiciones o sucesos de algún fenómeno o
estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, estadística es más
que eso, en otras palabras, es el vehículo que permite llevar a cabo un proceso relacionado con
una investigación científica.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en
áreas de negocios, investigaciones científicas, educación, entre otras.
Al reseñar las dos áreas de la estadística, se puede resumir como sigue el significado de
estadística:
“La estadística es la ciencia pura y aplicada, que crea, desarrolla y aplica técnicas o modelos de
modo que pueda evaluarse los dilemas derivados de las inferencias inductivas que nos permite
llegar a la generalización y contrastación de resultados”
POBLACIÓN Y MUESTRA
Una Población es el conjunto de todos los elementos que estamos estudiando, acerca de los
cuales intentamos sacar conclusiones y se denota: N. Levin & Rubin (1996). Una población finita
es aquella que está formada por un limitado número de elementos o individuos y una población es
infinita cuando no se conoce el número de elementos o individuos, o también se puede considerar
población infinita cuando una población finita es muy grande.
Una variable es una característica que al ser medida en diferentes individuos es susceptible de
adoptar diferentes valores. Las variables se denotan generalmente con letras mayúsculas X, Y, Z,
por ejemplo, X: Estaturas de las personas.
Según la medición
Variables cualitativas
Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad
que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de
dichos atributos. Las variables cualitativas no pueden ser medida por ningún instrumento de
medición, por ejemplo: Color de los ojos. Dentro de ellas podemos distinguir:
Variable cualitativa nominal o categórica: En esta variable los valores no pueden ser
sometidos a un criterio de orden, es decir, no sigue ningún orden, como ejemplo: los colores,
género, estado civil.
Variable cualitativa ordinal o variable cuasi cuantitativa: La variable puede tomar distintos
valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo
entre mediciones sea uniforme, por ejemplo: los grados o rangos de los oficiales del ejército:
General, Coronel, Mayor, Capitán, Teniente.
Variables cuantitativas
Son las variables que se expresan mediante cantidades numéricas, por ejemplo: Estatura de las
personas. Las variables cuantitativas pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de
valores que puede tomar. Es decir, los valores que se toma son de números enteros. Ejemplo:
El número de hijos {1, 2, 3 hijos…}.
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo
especificado de valores, o sea, puede tomar cualquier valor real. Ejemplo: La estatura {1.65m,
1.68m, 1.70m…}. Solamente se está limitado por la precisión del instrumento de medición, en
teoría permiten que siempre exista un valor entre dos variables.
Según la influencia
Según la influencia que asignemos a unas variables sobre otras, podrán ser:
Variables independientes
Una variable independiente también conocida como la variable manipulada, es
aquella cuyo valor no depende de otra variable. Es aquella característica o propiedad
que se supone la causa del fenómeno estudiado. En investigación experimental se llama así a la
variable que el investigador manipula. Ejemplo: Genero.
Variables dependientes
Son las variables de respuesta que se observan en el estudio y que podría estar influenciadas por
los valores de las variables independientes. Ejemplo: Preferencia de los colores.
La variable dependiente es el factor que es observado y medido para determinar el efecto de la
variable independiente.
ESCALAS DE MEDIDAS
Escalas de medición son una sucesión de medidas que permiten organizar datos en orden
jerárquico. Las escalas de medición pueden ser clasificadas de acuerdo a una degradación de las
características de las variables. Estas escalas son: nominales, ordinales, intervalares o racionales.
Según pasa de una escala de otra el atributo o la cualidad aumenta. Las escalas de medición
ofrecen información sobre la clasificación de variables discretas o continuas, también más
conocidas como escalas grandes o pequeñas. Toda vez que dicha clasificación determina la
selección de la gráfica adecuada.
Escala nominal: Es aquella en que los números sólo se emplean para diferenciar un lugar, objeto
o persona. Esta escala de medición es exclusivamente cualitativa y sus variables son por lo tanto
cualitativas. Ejemplos de números con esta característica son los que se usan en las camisetas de
los jugadores de fútbol, los que aparecen en el código de barras de un producto, etc. La escala
nominal es la escala de medición más débil.
Escala ordinal: Es aquella en que los números se utilizan para diferenciar en orden de supremacía
de acuerdo con cierto criterio jerárquico. En esta escala las variables no sólo se asignan a grupos,
sino que además pueden establecerse relaciones de mayor que, menor que o igual que, entre los
elementos. Ejemplo: Los estratos socioeconómicos.
Escala de intervalos: Es una escala más especializada que la nominal y la ordinal en sentido de
que es posible ordenar las mediciones y decir también en cuánto difiere una situación de otra. Esta
escala está caracterizada porque tiene una unidad de medida y un origen (cero) arbitrario y así la
distancia entre dos mediciones tiene un significado preciso. Las variables medidas al nivel de
intervalo se llaman variables de intervalo o variables de escala. Ejemplos de este tipo de variables
son la fecha, la temperatura.
Escala de razón: La escala de razón tiene una unidad de medida y un punto de origen no
arbitrario (un cero verdadero). La mayoría de las cantidades físicas, tales como la masa, longitud,
energía, se miden en la escala de razón. Ejemplos: La edad, estatura, peso corporal, etc.
DISTRIBUCIONES DE FRECUENCIAS
La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En principio, en la tabla
de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el
número de veces que aparece, es decir, su frecuencia. Se puede complementar la frecuencia
absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el
total de datos. La tabla de frecuencias puede representarse gráficamente.
Variables discretas
Ejemplo 1. Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31,
34, 33, 33, 29, 29.
Para la construcción de la tabla de frecuencias la ordenaremos de la siguiente manera:
La primera columna de la tabla colocamos la variable de estudio ordenada de menor a mayor.
La segunda columna la llamaremos frecuencia absoluta (𝒇𝒊 ) y es el recuento de los datos.
La suma de las frecuencias es el número total de observaciones (n).
La tercera columna la llamaremos frecuencia porcentual o porcentaje (%) y es cada frecuencia
absoluta (𝒇𝒊 ), dividido en el número total de observaciones (n) multiplicado por cien.
La cuarta columna la llamaremos frecuencia absoluta acumulada (𝑭𝒊 ) y es la suma de
las frecuencias absolutas.
La quinta columna la llamaremos frecuencia porcentual acumulada o porcentaje acumulado
(% acum.) y es cada frecuencia absoluta acumulada (𝑭𝒊 ), dividido en el número total
de observaciones (n) multiplicado por cien.
Tabla 1. Tabla de frecuencias de las temperaturas máximas registradas durante el mes de julio.
Temperaturas 𝒇𝒊 % 𝑭𝒊 % acum.
27 1 3.22 1 3.22
28 2 6.45 3 9.68
29 6 19.35 9 29.03
30 7 22.58 16 51.61
31 8 25.81 24 77.42
32 3 9.68 27 87.10
33 3 9.68 30 96.77
34 1 3.22 31 100
Total 31 100
Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables
toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos
que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia
correspondiente. Cada clase está delimitada por el límite inferior de la clase y el límite superior de
la clase. La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
Para la construcción de una tabla de frecuencias con datos agrupados, se aconseja utilizar la
Fórmula de Sturges, para encontrar el número de intervalos y la longitud del intervalo. El número
de intervalos se halla por la siguiente fórmula:
𝐾 = 1 + 3.322 log(𝑛 )
El valor de 𝑲 se aproxima normalmente a un número entero y donde n es el número de
datos.
𝑥 𝑖 𝑚á𝑥 − 𝑥 𝑖 𝑚í𝑛
𝐶= 𝑘
donde, 𝑥 𝑖 𝑚á𝑥: es el dato mayor, 𝑥 𝑖 𝑚í𝑛: el dato menor y K: el número de intervalos.
El valor de C se toma con un grado de aproximación (por encima) no mayor a aquel con el
que se registran los datos.
El primer intervalo, tomamos como límite inferior al dato menor y se hace el conteo del valor que
arrojó la longitud, teniendo en cuenta que el número del límite inferior también se cuenta y así,
obtendremos el límite superior del primer intervalo. Para el siguiente intervalo, se toma el límite
superior anterior más una unidad y nuevamente se hace el conteo de la longitud y así
sucesivamente, hasta completar el número K de intervalos, o cuando en un intervalo contenga al
mayor de los datos.
Ejemplo 2. Suponga que los siguientes datos corresponden a las puntuaciones del examen de
admisión de los aspirantes a una carrera profesional de una universidad. Se toma una muestra de
50 aspirantes y estos son los resultados:
65, 63, 65, 63, 69, 67, 53, 58, 60, 61, 64, 65, 64, 72, 68, 66, 55, 57, 60, 62, 64, 65, 64, 71, 68, 66,
56, 59, 61, 62, 63, 65, 63, 70, 67, 66, 57, 59, 61, 62, 64, 64, 63, 69, 67, 66, 58, 60, 61, 62.
Solución
Fórmula de Sturges:
Número de intervalos:
𝐾 = 1 + 3.322 log(50) = 6.6
𝐾 = 7 intervalos
Longitud de intervalo:
72 − 53
𝐶= = 2.7
7
𝐶=3
Una vez determinados los intervalos y la longitud, procedemos a precisar el número de datos (la
frecuencia) que caen dentro de cada intervalo. Para ello existe varios métodos de conteo, uno de
ellos es hacer una marca, ejemplo / por cada dato que encontremos que cae dentro del intervalo,
para otro intervalo se procede de manera similar realizando una marca por cada dato
contabilizado.
Otra alternativa para determinar la frecuencia de cada intervalo es construyendo un arreglo de
tronco y hoja, que consiste en arreglar los números en columnas, y colocar en la primera el primer
dígito y a continuación el segundo dígito como se ilustra enseguida:
5385769798
653539701454860245486123537612443976012
7210
A partir de este arreglo se puede realizar de manera sencilla el conteo de los datos que quedan en
cada intervalo.
Ahora podremos hacer la tabla de frecuencias completa (todas las columnas):
Tabla 2. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
La clase es la escala nominal de los intervalos y la marca de clase (𝒙𝒊) es el punto medio de cada
intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.
Variable continua
Para hacer una tabla de frecuencias con variables continua, se procede de manera similar al de las
variables discretas, pero difiere en la construcción de los intervalos. Al primer intervalo se toma el
dato menor (límite inferior) y se suma el valor que arrojó la longitud y así, obtendremos el límite
superior del primer intervalo. Para el siguiente intervalo, se toma el límite superior anterior y se
suma la longitud y así sucesivamente, hasta completar el número de intervalos obtenidos en la
fórmula K, o cuando en un intervalo contenga al mayor de los datos. Hay que tener en cuenta que
el límite inferior de una clase pertenece al intervalo (intervalo cerrado), pero el límite superior no
pertenece al intervalo (intervalo abierto), se cuenta en el siguiente intervalo. Ejemplo [3.1, 3.4) los
números que pertenecen a este intervalo son {3.1, 3.2, 3.3}.
Ejemplo 3. Los siguientes datos corresponden al tiempo que han necesitado 30 clientes de un
banco para llevar a cabo una transacción bancaria:
4.1, 3.1, 0.1, 6.5, 5.0, 2.5, 7.4, 10.0, 3.3, 8.0, 2.0, 0.4, 6.4, 1.1, 9.5, 2.8, 1.2, 1.3, 4.1, 9.5, 4.6, 4.3,
3.6, 5.5, 1.4, 2.8, 1.5, 1.6, 7.3, 7.0.
Fórmula de Sturges:
Número de intervalos:
𝐾 = 1 + 3.322 log(30) = 5.9
𝐾 = 6 intervalos
Longitud de intervalo:
10.0 − 0.1
𝐶 = 1.65
= 6
𝐶 = 1.7
La longitud de 1.65 se aproxima a 1.7, debido a que los datos provienen de una variable continua y
con un solo decimal.
Tabla 3. Tiempo que han necesitado 30 clientes de un banco para llevar a cabo una transacción
bancaria.
Algunas tablas de frecuencias, los intervalos que se han tomado están separados entre sí por una
unidad esto es debido a que los datos son de una variable discreta. A estas tablas, es conveniente
darle una condición de continuidad, para efectos del cálculo de algunos parámetros o para realizar
algunas gráficas. A cada intervalo, al límite inferior se le resta 0.5 y al límite superior se le suma la
misma cantidad 0.5. Haciendo estas operaciones a la tabla 2, toma la forma:
Tabla 4. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊
1 52.5 – 55.5 2
2 55.5 – 58.5 5
3 58.5 – 61.5 9
4 61.5 – 64.5 15
5 64.5 – 67.5 12
6 67.5 – 70.5 5
7 70.5 – 73.5 2
Total 50
En la guía hemos visto cómo organizar una tabla de frecuencias, de un conjunto de datos que
contiene la información sobre alguna variable. Esas tablas permiten una lectura más rápida que el
listado completo. Ahora veremos cómo presentar esos conjuntos de datos gráficamente. Las
gráficas nos permiten visualizar globalmente cómo se distribuyen las frecuencias entre los distintos
datos. Hay gráficas de distinto tipo; nosotros podemos ver algunas de ellas en tv, revistas,
periódicos, etc. En esta guía aprenderemos a construir y a leer algunas gráficas.
Las gráficas de una variable discreta, son las mismas realizadas con la variable continua (véase
figuras 4 y 5), excepto que en una variable discreta se realiza un gráfico de barras de frecuencias
(figura 1) y en una variable continua se realiza un histograma de frecuencias (figura 2 y 3).
Para ilustrar los diferentes tipos de gráficas tomaremos la tabla de frecuencias (Tabla 2) con la
marca de clase y la frecuencia absoluta y absoluta acumulada.
Para construir una gráfica de barras con estos valores tomamos dos ejes perpendiculares; en el eje
horizontal señalamos los valores de la variable (puntuaciones) y en el eje vertical señalamos los
valores de la frecuencia (número de aspirantes). Como en ambos casos trabajamos con números,
para ubicar los valores en cada eje tenemos que considerar una unidad, aunque las unidades del
eje horizontal pueden ser distintas a las del eje vertical, como se ilustra a continuación:
El gráfico de barras se usa cuando los intervalos están separados entre sí (no existe continuidad
entre los intervalos), como lo ilustra la gráfica anterior.
Histograma de frecuencias
El histograma de frecuencias es una representación visual de los datos continuos (intervalos sin
interrupción). Los histogramas pueden estar referidos a las frecuencias absolutas, relativas
(porcentajes) y las frecuencias acumuladas.
Polígono de frecuencias
El polígono de frecuencia se construye sobre el sistema de coordenadas cartesianas, al colocar
sobre cada marca de clase un punto a una altura igual a la frecuencia asociada a esa clase; luego
se unen dichos puntos por segmento de recta. La figura 4, es el polígono de frecuencias de los
datos de la tabla 2.
Figura 4. Polígono de frecuencia absoluta.
Ojiva de frecuencias
La ojiva es el polígono que se obtiene al unir por segmentos de rectas los puntos situados a una
altura igual a la frecuencia acumulada a partir de la marca de clase como se hizo con el polígono
de frecuencia (véase figura 2). La figura 5 es la ojiva de frecuencia de los datos de la tabla 2.
Ejemplo 5. En la tabla que sigue se da el número y sexo de los empleados de una empresa en los
años comprendidos entre 2009 y 2012.
Año
Sexo 2009 2010 2011 2012
Masculino 150 180 200 300
Femenino 50 70 100 100
Total 200 250 300 400
Figura 7. Histograma doble.
En otros casos lo que nos interesa no es mostrar el número de veces que se da una característica
o atributo, sino más bien resaltar la proporción (porcentaje) en que aparece una característica
respecto del total. Así, por ejemplo, para ilustrar de manera gráfica una situación como la que se
presenta en seguida.
Para construir el diagrama circular partimos del hecho de que un círculo tiene un total de 360°.
Luego, mediante una regla de tres simple, repartiremos los 360° en distintos sectores circulares, de
acuerdo con cada porcentaje; tenemos así que para determinar el sector circular correspondiente
al 20% realizamos la conversión:
20 × 360°
20% = = 72°
100
Esto es, el 20% corresponde a un sector circular de 72° de medida. A continuación, con ayuda de
un transportador, señalaremos el sector circular correspondiente. Igualmente, para 50° se tienen
180°, 15% se tienen 54°, 10% se tienen 36° y finalmente para 5% se tienen 18°. La figura 7,
muestra la representación gráfica.
Grafica 8. Diagrama circular.
2. Determine el número de intervalos "K" (Fórmula de Sturges) para las siguientes cantidades
de datos:
a. 42 b. 55 c. 70 d. 103 e. 200
3. Teniendo en cuenta el dato menor (𝑥𝑖 𝑚í𝑛 ) y el dato mayor ( 𝑥 𝑖 𝑚á𝑥 ), encuentre la
longitud de intervalo "C", para K= 5, 6 y 7 intervalos.
a. (15, 63)
b. (17.2, 78.9)
c. (9.18, 20.76)
d. (0.123, 6.054)
8. Considérense los siguientes datos, los cuales representan a la distancia recorrida de cierto
animal de su morada en la búsqueda de alimento:
5.26 6.90 8.64 5.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96 7.44 8.82 5.88 7.62 5.67 9.00
5.60 7.64 8.82 5.64 10.08 3.81 6.81 7.49 4.56 7.16 8.61 3.86 6.78 9.02 8.65 6.72 8.26
7.90 6.65 7.25 6.26 6.43 7.71 7.52 6.68 7.98 10.27 7.64 7.17 8.06 6.66 8.26 6.67 6.25
7.63 6.73 7.60 8.14 6.91 7.82 6.76 7.75 4.00
Actividad Porcentaje
Profesional 8%
Técnico 10%
Operario 70%
Ayudante 10%
Aseo 2%
10. Los siguientes son los colores de los automóviles de 36 profesores de la universidad. Construya
un gráfico de barras para ilustrar esta situación.
Negro, azul, rojo, rojo, blanco, amarillo, crema, rojo, azul, oro, negro, plateado, verde, verde,
blanco, negro, oro, azul, rojo, gris, gris, verde, blanco, negro, azul, café, naranja, crema, rojo,
negro, plateado, oro, amarillo, blanco, rojo, café.
MEDIDAS DE TENDENCIA CENTRAL
Media .
Media geométrica.
Media armónica.
Mediana.
Moda.
La media aritmética también llamada promedio de los datos, es el valor obtenido por la suma de
todos sus valores dividida entre el número de sumandos.
Definición formal
Dado un conjunto numérico de datos, 𝑥1, 𝑥2,… , 𝑥𝑛 , se define su media aritmética para datos no
agrupados como:
𝒙 𝒙𝟏 + 𝒙𝟐 + ⋯ + ∑𝒏 𝒙
̅𝒏
𝒊=𝟏 𝒊
𝑿= =
𝒏 𝒏
Esta definición varía, aunque no sustancialmente, cuando se trata de variables continuas, esto es,
también puede calcularse para variables agrupadas en intervalos.
PROPIEDADES
Las principales propiedades de la media aritmética son:
Su cálculo es muy sencillo y en él intervienen todos los datos.
Su valor es único para una serie de datos dado.
Se usa con frecuencia para comparar poblaciones, aunque es más apropiado acompañarla de
una medida de dispersión.
Inconvenientes de su uso
Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en situaciones muy
diversas, tiene también algunos inconvenientes, como son:
Ejemplo 1. Los siguientes datos corresponden a las notas de 5 estudiantes en una prueba:
6.0, 5.4, 3.1, 7.0, 6.1
𝒙 𝒇𝟏 . 𝒙𝟏 + 𝒇𝟐 . 𝒙𝟐 + ⋯ + 𝒇𝒏 .
̅𝒏 ∑𝒏 𝒇 𝒙
𝒊=𝟏 𝒊 𝒊
𝑿= =
𝒏 𝒏
donde, 𝑓𝑖 : es la frecuencia absoluta, 𝑥 𝑖: la marca de clase y n el número de observaciones.
Tabla 1. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒙𝒊 𝒇𝒊
1 53 – 55 54 2
2 56 – 58 57 5
3 59 – 61 60 9
4 62 – 64 63 15
5 65 – 67 66 12
6 68 – 70 69 5
7 71 – 73 72 2
Total 50
Podemos concluir, que el puntaje promedio de los 50 aspirantes a una carrera profesional en una
universidad fue de 63.2.
Media geométrica
En matemáticas y estadística, la media geométrica de una cantidad arbitraria de números (por
decir n números) es la raíz n-ésima del producto de todos los números, es recomendada para
datos de progresión geométrica, para promediar razones, interés compuesto y números índices. La
media geométrica se denota y se define como sigue:
𝒏
𝒏
𝑮 = 𝒏√𝒙𝟏. 𝒙𝟐. 𝒙𝟑 … 𝒙𝒏 =
√∏𝒙𝒊
𝒊=𝟏
𝐺 = 3√1 ∗ 3 ∗ 9 = 3√27 = 3
Media armónica
Mediana
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez
que éstos están ordenados de menor a mayor. Es decir, es el dato central.
Definición formal
Dado un conjunto numérico de datos ordenados, 𝑥 1 , 𝑥 2 , … , 𝑥 𝑛, se define su mediana para datos
no agrupados como:
𝒏+𝟏
𝒙( ) , 𝒔𝒊 𝒏 𝒆𝒔 𝒖𝒏 𝒏ú𝒎𝒆𝒓𝒐 𝒊𝒎𝒑𝒂𝒓
𝟐
𝑿̃=
𝒙 (𝟐𝒏) + 𝒙 ( 𝒏
+ 𝟏)
𝟐
, 𝒔𝒊 𝒏 𝒆𝒔 𝒖𝒏 𝒏ú𝒎𝒆𝒓𝒐 𝒑𝒂𝒓
{ 𝟐
Ejemplo 5. Encuentre la mediana del número de hijos de un conjunto de trece familias, cuyos
respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1.
Como el valor central es 2, entonces concluimos que el 50% de las trece familias tiene 2 hijos.
En caso de un número par de datos, puede ser que la mediana no corresponda a ningún valor de
la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos
valores centrales. Por ejemplo, tomando ahora a doce de hijos la mediana es:
1, 1, 1, 1, 1,
1, 2 , 2, 2, 3, 3, 4, como 𝑛 =12 (un número par), entonces tenemos:
𝒙 (𝟏𝟐) + 𝒙 (𝟏𝟐 + 𝟏)
𝟐 𝟐
𝑿̃= 𝟐
𝒙𝟔 + 𝒙𝟕
𝑿̃=𝟐
Lo que indica, que se debe tomar el sexto dato (𝒙𝟔) y el séptimo (𝒙𝟕 ) dato, sumarlo y dividirlo en
dos (2), siendo así:
𝟏+𝟐
𝑿̃= = 𝟏. 𝟓
𝟐
Entonces concluimos que el 50% de las doce familias tienen entre 1 y 2 hijos.
Tabla 2. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊 𝑭𝒊
1 53 – 55 2 2
2 56 – 58 5 7
3 59 – 61 9 16
4 62 – 64
Clase mediana 15 31
5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50
Para determinar la clase mediana, se toma aquella clase que sea igual a (𝑛) o se aproxime por
2
encima en la frecuencia absoluta acumulada (𝑭 𝒊). Calculando la clase mediana, tenemos: 𝑛
= 5 0
=
2 2
25, entonces la clase mediana es la cuarta. A partir de esta clase se tiene: 𝐿𝑚 = 61.5, 𝐹𝑚 −1 = 16,
𝑓𝑚 = 15 y 𝑐 = 3.
Calculando en la fórmula de la mediana se tiene
25 − 16
̃
𝑿 = 61.5 + ]×3
15
𝑿̃= 61.5 + 1.8
𝑿̃= 63.3
El 50% de los 50 aspirantes a una carrera profesional en una universidad tiene un puntaje de 63.3.
Propiedades e inconvenientes
Moda
La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta. En cierto
sentido la definición matemática corresponde con la locución "estar de moda", esto es, ser lo que
más se lleva y se denota 𝑿̂
.
Ejemplo 6. El número de personas en distintos vehículos en una autopista son: 5, 7, 4, 6, 9, 5, 6, 1, 5, 3
y 7. El número que más se repite es 5, entonces la moda es 5 y se denota: 𝑿̂ = 5. Podemos
concluir, que el número más frecuente de personas es los vehículos en una autopista es de 5.
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir,
dos datos que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos
se encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen
la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados (tablas de frecuencias) está dada por la siguiente fórmula:
𝒅𝟏
𝑿̂= 𝑳𝒎 + [ ]. 𝒄
𝒅 𝟏 + 𝒅𝟐
Donde, 𝐿𝑚 : Límite (real) inferior de la clase modal.
𝑑1: Diferencia entre la frecuencia de la clase modal y de la clase que la antecede.
𝑑 2: Diferencia entre la frecuencia de la clase modal y de la clase que le sigue.
c: Longitud de intervalo de la clase modal.
Clase modal, es la clase con la mayor frecuencia absoluta (𝒇𝒊 ).
Tabla 3. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊
1 53 – 55 2
2 56 – 58 5
3 59 – 61 9
Clase modal 4 62 – 64 15
5 65 – 67 12
6 68 – 70 5
7 71 – 73 2
Total 50
En la clase en donde hay la mayor frecuencia absoluta es la clase 4, por ende, es la clase modal.
Por tanto,
𝐿𝑚 = 61.5, 𝑑 1 = 15 − 9 = 6, 𝑑 2 = 15 − 12 = 3 y 𝑐 = 3.
Calculando en la fórmula de la moda se tiene
6
̂ 𝑿 = 61.5 + ] ×3
6+3
̂
𝑿 = 61.5 + 2
𝑿̂= 63.5
El puntaje más frecuente de los 50 aspirantes a una carrera profesional en una universidad fue de
63.5
Propiedades:
Cálculo sencillo.
Interpretación muy clara.
Al depender sólo de las frecuencias, puede calcularse también para variables cualitativas. Es
por ello el parámetro más utilizado cuando al resumir una población no es posible realizar otros
cálculos, por ejemplo, cuando se enumeran en medios periodísticos las características más
frecuentes de determinado sector social. Esto se conoce informalmente como "retrato robot".
Inconvenientes:
Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a
variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende
excesivamente del número de intervalos y de su amplitud.
Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la
moda, no afectan en modo alguno a su valor.
No siempre se sitúa hacia el centro de la distribución.
Puede haber más de una moda en el caso en que dos o más valores de la variable presenten la
misma frecuencia (distribuciones bimodales o multimodales).
Relación entre las medidas de tendencia central
La media, mediana y moda se consideran las medidas de posición más importantes por su
sencillez y utilidad. No obstante, no son aplicables a todos los casos.
Ejemplo 7. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad, y tomando las medidas exactas tenemos que: 𝑿̅= 63.2, 𝑿̃ = 63.3 y 𝑿̂ = 63.5,
como la mediana es mayor que la media, entonces los puntajes están sesgados a la izquierda. Lo
que nos indica que hay algunos puntajes están dispersos a la izquierda (aspirantes con puntajes
bajos) que nos hace dar el sesgo.
OTRAS MEDIDAS DE POSICIÓN
Los cuartiles, deciles y percentiles son medidas que se utilizan para determinar los intervalos
dentro de los cuales quedan proporcionalmente repartidos los términos de la distribución.
Cuartiles
Los cua rtile s son los t res valores de la variable que divide n a un conjunto de datos
ordenados en c uat ro part es porc ent ualment e iguales . 𝑄 1 , 𝑄 2 𝑦, 𝑄 3 det erminan los
valores correspondientes al 25%, 50% y 75% de los datos. 𝑄2 coincide con la mediana.
Para calcular estas tres medidas se procede de manera semejante al cálculo de la mediana.
Donde,
𝐿𝑘 : Límite (real) inferior de la clase cuartil.
𝑘 (𝑛): Clase cuartil.
4
𝐹𝑘 −1: Frecuencia absoluta acumulada de la clase que le antecede a la de la clase cuartil.
𝑓𝑘 : Frecuencia absoluta de la clase cuartil.
c: Longitud del intervalo.
Tabla 4. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊 𝑭𝒊
1 53 – 55 2 2
2 56 – 58 5 7
𝑄1 3 59 – 61 9 16
4 62 – 64 15 31
5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50
Si calculamos el primer cuartil 𝑄1, tenemos:
Clase cuartil: 𝑘 (𝑛) = 1 (50) = 12.5, cuyo valor aproximado en la frecuencia absoluta acumulada
4 4
(𝑭 𝒊) está en la case 3. A partir de esta clase se tiene:
𝐿𝑘 = 58.5, 𝐹𝑘 −1 = 7, 𝑓𝑘 = 9 y 𝑐 = 3.
𝑄1 12.5 − 7
= 58.5 + [ ]×3
9
𝑄1 = 58.5 + 1.8
𝑄1 = 60.3
El 25% de los 50 aspirantes a una carrera profesional en una universidad tiene un puntaje de 60.3.
Deciles
Los de cile s son los valores de la variable que dividen a un conjunto de datos ordenados en diez
partes porcentualmente iguales. 𝐷1, 𝐷2, 𝐷3 , … , 𝐷9, determinan los valores correspondientes al
10%, 20%, 30%, … y 90% de los datos. 𝐷5 coincide con la mediana.
Para calcular estas nueve medidas se procede de manera semejante al cálculo de la mediana.
Los deciles para datos agrupados (tablas de frecuencias) se denota y define de la siguiente
manera:
𝒌(𝒏)−𝑭
𝒌−𝟏
𝟏
𝑫𝒌 = 𝑳𝒌 + [ 𝟎 ] . 𝒄 ; 𝒌 = 𝟏, 𝟐, 𝟑, … , 𝟗.
𝒇𝒌
Donde,
𝐿𝑘 : Límite (real) inferior de la clase decil.
𝑘 ( 𝑛 ): Clase decil.
10
𝐹𝑘 −1: Frecuencia absoluta acumulada de la clase que le antecede a la de la clase decil.
𝑓𝑘 : Frecuencia absoluta de la clase decil.
c: Longitud del intervalo.
Tabla 5. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊 𝑭𝒊
1 53 – 55 2 2
2 56 – 58 5 7
3 59 – 61 9 16
4 62 – 64 15 31
𝐷7 5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50
𝐷7 35 − 31
= 64.5 + [ ]×3
12
𝐷7 = 64.5 + 1
𝐷7 = 65.5
El 70% de los 50 aspirantes a una carrera profesional en una universidad tiene un puntaje de 65.5.
Percentiles
Los pe rce ntile s son los valores de la variable que dividen a un conjunto de datos
ordenados en cien partes porcentualmente iguales. 𝑃1 , 𝑃2 , 𝑃3 , … , 𝑃17 , … 𝑃50 , … , 𝑃98 𝑦
𝑃99 , determinan los valores correspondientes al 1%, 2%, 3%, …, 17%, …, 50%, …, 98%
y 99% de los datos. 𝑃50 coincide con la mediana.
Para calcular estas cien medidas se procede de manera semejante al cálculo de la mediana.
Donde,
𝐿𝑘 : Límite (real) inferior de la clase percentil.
𝑘 ( 𝑛 ): Clase percentil.
100
𝐹𝑘 −1: Frecuencia absoluta acumulada de la clase que le antecede a la de la clase percentil.
𝑓𝑘 : Frecuencia absoluta de la clase percentil.
c: Longitud del intervalo.
Tabla 6. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊 𝑭𝒊
1 53 – 55 2 2
𝑃5 2 56 – 58 5
7
3 59 – 61 9 16
4 62 – 64 15 31
5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50
𝑃5 = 55.5 +
0.3
𝑃5 = 55.8
El 5% de los 50 aspirantes a una carrera profesional en una universidad tiene un puntaje de 55.8.
Los cuartiles, deciles y percentiles para datos no agrupados, se define respectivamente como:
𝒙 (𝒌 (𝒏+𝟏 )) , 𝒔𝒊 𝒏 𝒆𝒔 𝒖𝒏 𝒏ú𝒎𝒆𝒓𝒐
𝒊𝒎𝒑𝒂𝒓
𝟏𝟎
𝑫𝒌 = { 𝒏 𝒏 ; 𝒌 = 𝟏, 𝟐, … , 𝟗
𝒙(𝒌( ))+𝒙(𝒌( )+𝟏)
𝟏𝟎 𝟏𝟎
, 𝒔𝒊 𝒏 𝒆𝒔 𝒖𝒏 𝒏ú𝒎𝒆𝒓𝒐
𝒑𝒂𝒓
𝟐
Ejemplo 8. Encuentre 𝑄3, 𝐷2 y 𝑃40, de la siguiente sucesión de datos: 13, 24, 22, 45, 52, 11, 10,
42, 32, 43, 31, 21, 42, 41 y 61.
Para: 𝑄3
Ordenados los datos tenemos:
10, 11, 13, 21, 22, 24, 31, 32, 41, 42, 42, 43, 45, 52, 61; 𝑛 =15 (un número impar)
Para: 𝐷2
Para: 𝑃40
(
𝒏+𝟏 )) ( 𝟏 𝟓 +))
𝟏
𝑷𝟒𝟎 = 𝒙 𝒌 ( = 𝒙 𝟒𝟎 = 𝒙 𝟔 .𝟒 ≅ 𝒙 𝟔 = 𝟐𝟒
𝟏𝟎𝟎 ( 𝟏𝟎𝟎
Como la posición del 𝑃40 es 𝑥6.4, entonces lo aproximamos a la posición 𝑥6, que corresponde al
número 24.
GUÍA DE TRABAJO Nº 2
Clase Intervalo fi
1 76 – 80 4
2 81 – 85 7
3 86 – 90 10
4 91 – 95 13
5 96 – 100 25
6 101 – 105 29
7 106 – 110 12
8 111 – 115 11
9 116 - 120 9
6. Considérense los siguientes datos, los cuales representan la razón de precio - ganancia de una
emisión de acciones, de certificados de valores vendidos muy por arriba del precio promedio del
mercado:
5.26 6.90 8.64 5.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96 7.44 8.82 5.88 7.62 5.67 9.00 5.60 7.64
8.82 5.64 10.08 3.81 6.81 7.49 4.56 7.16 8.61 3.86 6.78 9.02 8.65 6.72 8.26 7.90 6.65 7.25 6.26
6.43 7.71 7.52 6.68 7.98 10.27 7.64 7.17 8.06 6.66 8.26 6.67 6.25 7.63 6.73 7.60 8.14 6.91 7.82
6.76 7.75 7.36 8.52 7.23 7.63 6.95 7.78 10.34 6.65 6.86 7.74 6.67 7.12 7.10 4.00
∑𝒏 (𝒙 − ̅
𝒙)𝟐
𝒊
𝑺= 𝒊= 𝟏
√ 𝒏−𝟏
Es decir, 𝑺 =
√𝑺𝟐.
Ejemplo 1. Las siguientes son las estaturas de un equipo de jugadores de basquetbol: 2.20 m,
2.15 m, 1.95 m, 1.75 m y 1.70 m.
La media,
Y la desviación estándar.
𝑆 = √0.05125 𝑚2
𝑆 = 0.226 𝑚.
La desviación estándar es una medida de variación de todos los valores con respecto a la
media.
El valor de la desviación estándar siempre es positivo y sólo es igual a cero cuando los valores
de los datos son iguales.
Si el valor de la desviación estándar es muy grande, este indica mayor variación en el grupo de
datos.
El valor de la desviación estándar puede incrementarse drásticamente cuando se incluye uno o
más datos distantes.
Las unidades de la desviación estándar son las mismas de los datos originales (pulgadas,
centímetros, etc.)
∑𝒏
𝒊=𝟏 𝒇𝒊
(𝒙𝒊 − ̅
𝒙 )𝟐
𝑺=√
𝒏−𝟏
Donde, 𝑓𝑖 : frecuencia absoluta y 𝑥 𝑖: marca de clase.
Tabla 1. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒙𝒊 𝒇𝒊
1 53 – 55 54 2
2 56 – 58 57 5
3 59 – 61 60 9
4 62 – 64 63 15
5 65 – 67 66 12
6 68 – 70 69 5
7 71 – 73 72 2
Total 50
Media,
La varianza,
Desviación estándar,
𝑆 = √17.78
𝑆 = 4.21
Los puntajes de los 50 aspirantes a una carrera profesional en una universidad están relativamente
dispersos con referente a la media.
Coeficiente de variación
𝑆
𝐶. 𝑉 = × 100%
𝑋̅
Ejemplo 2. Los siguientes datos corresponden a los resultados finales de dos grupos que cursaron
estadística el semestre pasado con dos docentes distintos.
Si sólo atendemos al valor de la desviación estándar de los dos grupos debemos aceptar que la
variabilidad de éstos en cuanto a las calificaciones obtenidas es la misma. Sin embargo, al obtener
promedios diferentes y si admitimos que tal diferencia distingue a los grupos, nuestra primera
apreciación debe ser revisada y hacer que esa diferencia quede manifiesta de alguna manera. Una
manera de hacerlo es mediante el cálculo del coeficiente de variación. Así, tenemos:
Grupo 1
0.5
𝐶.𝑉 = × 100% = 13.15%
3.8
Grupo 2
0.5
𝐶.𝑉 = × 100% = 11.11%
4.5
Como sucede con cualquier medida de variabilidad, a mayor valor más variabilidad, en este caso el
grupo 1 presenta una variabilidad relativa mayor que la del grupo 2. Siendo así, el grupo 2 fue
relativamente más homogéneo que el grupo 1 en cuanto su rendimiento en estadística.
Valores estandarizados
Los distintos conjuntos de datos están asociados por lo general a diferentes medias, ya sea porque
son de naturaleza diferente o porque al ser la misma característica medida, sus centros no son los
mismos.
Con el propósito de reducir los datos a un mismo punto de referencia y a una escala común, se
realiza entre ellos una trasformación llamada estandarización, que consiste en lo siguiente:
A cada dato 𝒙 𝒊 se le resta la madia 𝑿̅ , se divide entre la desviación estándar 𝑺 y se obtiene
un
número 𝒁𝒊 que se llama el valor estandarizado de 𝒙 𝒊 . Esto es,
𝒁𝒊 =
𝒙𝒊 − 𝑺
𝑿̅
Estadística:
3.8 − 4.0
𝑍= = −0.4
0.5
Contabilidad:
4.3 − 4.5
𝑍= = −0.25
0.8
Como la nota estandarizada de contabilidad es superior a la de estadística (un valor más cercano al
cero), el estudiante obtuvo un puesto relativamente mejor en contabilidad que en estadística, debido
a que al estar las dos notas por debajo del promedio, en contabilidad está más cercano al promedio
del curso que en el de estadística. Cuando los puntajes se encuentren por encima del promedio, la
posición mejor es aquella que arroje un valor estandarizado más lejano del promedio, o sea, al
estandarizar los valores, el que ocupa una posición mejor es el que se aleja más del cero.
GUÍA DE TRABAJO Nº 3
1. Si las puntuaciones de 20 trabajadores nuevos de un test de aptitud son: 31, 39, 40, 43, 45, 50,
52, 58, 59, 60, 70, 71, 72, 78, 80, 85, 87, 90, 9 1 y 99. Halle la varianza y la desviación estándar
para datos no agrupados.
2. A partir de los datos del ejercicio anterior, construya una tabla de frecuencia y con base en ella
obtenga la varianza y la desviación estándar. ¿Hay diferencia entre el valor de la desviación
estándar para datos no agrupados con los datos agrupados? Si hay diferencia explique el
porqué de ésta.
3. ¿Cuándo es igual la varianza a la desviación estándar? ¿Puede ser la varianza menor que la
desviación estándar? ¿En qué caso será igual a 0 la varianza de determinados datos? Explique
por qué.
4. Halle la varianza y la desviación estándar para los datos del problema 6, de la guía de trabajo
N° 2.
6. Dos vendedores que mercadean el mismo producto tienen los siguientes registros durante un
periodo:
Vendedor 1 Vendedor 2
Volumen de ventas por mes 30 000 000 35 000 000
Desviación estándar 2 500 000 3 600 000
¿Cuál de los vendedores parece más constante en el volumen de ventas?
8. Una persona tiene una estatura de 175 cm; la estatura promedio de la población es170 cm con
una desviación estándar de 5 cm. Esta misma persona pesa 70 Kg: el peso promedio de la
población es de 68 Kg con una desviación estándar de 5 Kg. ¿En qué caso esta persona ocupa
un puesto relativamente mayor?
FUENTES DE INFORMACION
Lincoln L., C. (1984). Estadística para las ciencias Administrativas. (Vol. Tercera edición).
Colombia: Editorial McGraw Hill.
Martínez, C., Levin, R., & David, R. (2011). Estadística Aplicada (Primera ed.). México: Pearson
Educación.
Ritchey, F. J. (2008). Estadística para las ciencias sociales. México, D.F.: Mc Graw Hill