Está en la página 1de 39

ESTADÍSTICA BÁSICA PARA SECUNDARIA

Amaury Camargo Benítez

Prólogo
Justificación

Índice

1. ESTADÍSTICA DESCRIPTIVA 1
1.1. Variable estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.1. Tipos de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.2. Variable cuantitativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Distribución de Frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1. Tabla o distribución de frecuencias de una variable . . . . . . . . . . . 5
1.3. Reglas generales para distribuciones de frecuencia . . . . . . . . . . . . . . . . 5
1.4. Gráficos estadísticos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.1. Histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.2. Diagrama circular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.3. Diagramas de árbol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4.4. Polígono . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2. MEDIDAS DE TENDENCIA CENTRAL 17


2.1. Media aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1.1. Media aritmética simple . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.2. Media aritmética ponderada . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.1. Mediana para datos no agrupados . . . . . . . . . . . . . . . . . . . . . 21
2.2.2. Mediana para datos agrupados . . . . . . . . . . . . . . . . . . . . . . . 23
2.3. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

i
ÍNDICE ÍNDICE

2.3.1. Moda para datos sin agrupar u originales . . . . . . . . . . . . . . . . . 25


2.3.2. Moda para datos agrupados . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.3. Otras medidas de tendencia central. . . . . . . . . . . . . . . . . . . . 26
2.3.4. Cuartiles, deciles y percentiles. . . . . . . . . . . . . . . . . . . . . . . . 26
2.4. Medidas de dispersión o de variabilidad . . . . . . . . . . . . . . . . . . . . . . 28
2.4.1. Rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4.2. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4.3. Desviación típica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4.4. Coeficiente de variación de Pearson: (CV ) . . . . . . . . . . . . . . . . 30

3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS 31


3.1. Análisis Combinatorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1.1. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1.2. Arreglos (variaciones) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.1.3. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2.1. Experimentos y espacios muestrales . . . . . . . . . . . . . . . . . . . . 35

Referencias 37

guata26.03@gmail.com ii Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

1. ESTADÍSTICA DESCRIPTIVA
CONCEPTOS PRELIMINARES

? La Estadística es la rama de las matemáticas que se ocupa de los métodos y procedi-


mientos para recoger, clasificar, representar y resumir datos (Estadística descriptiva), así
como de obtener consecuencias científicas a partir de estos datos (Inferencia Estadística).

? Una definición que describe la estadística de manera utilitaria es la que dice que es:
“un conjunto de técnicas para describir grupos de datos y para tomar decisiones en
ausencia de una información completa”.

La estadística, está dividida en dos grandes ramas:

? Estadística descriptiva. Describe, analiza y representa un grupo de datos utilizando


métodos numéricos y gráficos que resumen y presentan la información contenida en
ellos.

? Estadística Inferencial. Apoyándose en el cálculo de probabilidades y a partir de datos


de muestras, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre
un conjunto mayor de datos.

Observación En el estudio de la estadística es importante estar familiarizado con algunos


conceptos o elementos que son de uso cotidiano, tales como

? POBLACIÓN. Conjunto de individuos o elementos observados al realizar un experimento


que poseen alguna característica o propiedades comunes. El estudio de toda la población
constituye un CENSO.

Por ejemplo: animales, árboles, carros, altura de una planta, tiempo de vida, etc.

? Una población puede ser finita o infinita.

En relación al tamaño de la población, ésta puede ser:

? Finita, como es el caso del número de personas que llegan al servicio de urgencia de un
hospital en un día; y se conoce el tamaño N de la población.

? Infinita, si por ejemplo estudiamos el mecanismo aleatorio que describe la secuencia de


caras y sellos obtenida en el lanzamiento repetido de una moneda normal al aire.

guata26.03@gmail.com 1 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

En algunos casos, también se considera infinita, cuando siendo pequeña no se puede saber con
exactitud el tamaño de la población.

? Individuo. Un individuo o unidad estadística es cada uno de los elementos que componen
la población.

? Muestra. Una muestra es un subconjunto representativo de la población de referencia, el


número de individuos de una muestra es menor que el de la población.

? Tamaño muestral. Es el número de observaciones en la muestra.

? Valor. Un valor es cada uno de los distintos resultados que se pueden obtener en un
estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara
y sello.

? Dato. Un dato es cada uno de los valores que se ha obtenido al realizar un estudio
estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos que pueden ser:
cara, cara, sello, cara, sello.

? Variable. Característica que estamos midiendo

1.1. Variable estadística


Definición de variable Una variable estadística es cada una de las características o cuali-
dades que poseen los individuos de una población.

1.1.1. Tipos de variables


Según el tipo de valores que toman las variables, distinguimos diferentes tipos de variables.
El tipo de variable es importante: afecta a lo que podemos hacer con ella, al tipo de análisis
que podemos hacer; los métodos estadísticos que usamos dependen del tipo de variable

? Variable cualitativa

Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas
con números, es decir:

1. La escala de valores es nominal

2. Los valores son “categorías”

guata26.03@gmail.com 2 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

3. Las categorías son valores diferentes por una cualidad, no por una cantidad

4. Ningún “valor” se puede decir que sea mayor o menor que otro

Ejemplos: partido político al que votó; región en que vive; sexo; estado civil; marca de coche
que conduce... 3.
Podemos distinguir dos tipos:

1.1.2. Variable cuantitativa


Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar
operaciones aritméticas con ella. (OJO: hay “números” que son “etiquetas”; por ejemplo: el código
postal; el número de teléfono; el código de una asignatura ).

1. Cada valor posible es menor o mayor que otro valor; por tanto se pueden realizar
operaciones aritméticas con ella.

2. El conjunto de valores forman una escala de intervalo

3. “Intervalo”: distancia entre valores

4. En las variables cuantitativas podemos calcular la distancia o intervalo entre cualquier


par de valores de la variable

Podemos distinguir dos tipos de variables: discretas y continuas.

? Las variables discretas son aquellas que admiten solamente valores enteros, es decir, no
tienen valores intermedios. Ejemplo: el numero de hijos por familia sera discreta, ya que
no se podrá decir que una familia tiene dos hijos y medio; el numero de estudiantes por
curso en una I.E, etc.

? Las variables continuas son aquellas que admiten valores fraccionarios, pudiéndose
establecer intervalos. Ejemplo: la estatura de una persona que mide un metro con setenta
centímetros; que pesa sesenta kilos, una libra y cuatro onza, etc.

1.2. Distribución de Frecuencias


La distribución de frecuencias, es un método para organizar y resumir información. Bajo este
método, los datos recolectados se ordenan y clasifican, indicándonos la frecuencia o sea el
número de veces que se repiten.

guata26.03@gmail.com 3 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

Se podrá decir también, que nos permite manejar grandes cantidades de información en espacios
reducidos, en formas de cuadros o tablas, complementadas con gráficas.

? Frecuencia absoluta La frecuencia absoluta es el número de veces que aparece un deter-


minado valor en un estudio estadístico. Se representa por fi .

? La suma de las frecuencias absolutas es igual al número total de datos, que se representa
por N, es decir, f1 + f2 + f3 + . . . fn = N. Para indicar resumidamente estas sumas se
utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.

f1 + f2 + f3 + . . . fn = ∑ni=1 fi =N

? Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de un


determinado valor y el número total de datos. Se puede expresar en tantos por ciento y
se representa por ni , es decir, ni = Nfi

• La suma de las frecuencias relativas es igual a uno.

? Frecuencia acumulada La frecuencia acumulada es la suma de las frecuencias absolutas


de todos los valores inferiores o iguales al valor considerado. Se representa por Fi .

? Frecuencia relativa acumulada La frecuencia relativa acumulada es el cociente entre la


frecuencia acumulada de un determinado valor y el número total de datos. Se puede
expresar en tantos por ciento, y se representa por Ni , es decir, Ni = FNi

? Frecuencia porcentual La frecuencia porcentual es la frecuencia relativa (ni ) expresada en


forma porcentual. En otras palabras, es la frecuencia relativa (ni ) multiplicada por 100,
se representa por pi = ni × 100 % .

? Frecuencia porcentual acumulada La frecuencia porcentual acumulada está dada por


Pi = Ni × 100 % .

Observación. Otras notaciones de interés son las siguientes:

1. n, tamaño de la muestra

2. N, tamaño de la población

3. xi , valor observado

guata26.03@gmail.com 4 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

1.2.1. Tabla o distribución de frecuencias de una variable


1. Una distribución de frecuencias o tabla de frecuencias es una ordenación en forma de
tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

2. Una distribución de frecuencias corresponde a la agrupación de una sola variable a través


de categorías o intervalos, de tal forma que se presentan las frecuencias o repeticiones en
cada una de ellas. En el caso de una variable discreta, los datos se agrupan en categorías,
mientras que para una variable continua se agrupan en intervalos.

? Las distribuciones o tablas de frecuencias permiten resumir los datos en una tabla que
recoge entre otros:

• valores de la variable o modalidades del atributo,

• frecuencia absoluta o número de veces que aparece cada valor en la muestra,


• porcentaje de veces que aparece cada valor de la variable sobre el total de observaciones,

1.3. Reglas generales para distribuciones de frecuencia


? Caso Discreto

Para generar la distribución de frecuencias en una variable discreta se deben seguir los pasos
que se describen a continuación, los cuales permiten organizar la distribución de los datos en
una tabla de cinco columnas básicamente:
Paso 1: Identificar los valores diferentes que toma la variable y escribirlos en la primera columna
de la tabla, en orden ascendente. Se denotará por k el número de valores diferentes que se
encuentran en el conjunto de datos y se denotarán por X1 , X2 X3 , . . . , Xk . En esta columna no
deben haber valores repetidos.
Paso 2: La segunda columna consiste en calcular la frecuencia absoluta, fi que es el número de
veces que se repite el valor xi en el conjunto de datos. La suma de los fi es igual al número
total de datos en análisis. Por ejemplo, el valor de f3 es el número de veces que se repite la
observación x3 en el conjunto de datos.
Paso 3: El cálculo de la frecuencia absoluta acumulada, Fi consiste en diligenciar la tercera
columna y es equivalente a sumar los valores menores o iguales de las frecuencias absolutas, fi
de cada valor xi .

guata26.03@gmail.com 5 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

Paso 4: La cuarta columna consiste en calcular la frecuencia relativa, ni , la cual es el valor


relativo o porcentual, que representa el valor de cada xi .
Paso 5: La quinta columna se refiere a la frecuencia porcentual, que no es más que la frecuencia
relativa multiplicada por 100 %, se representa con pi .
A continuación se desarrolla un ejercicio para tener mayor claridad al respecto.

Ejemplo 1.1.

Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo los siguientes
resultados:
negro, azul, amarillo, rojo, azul, azul, rojo, negro, amarillo, rojo, rojo, amarillo, amarillo, azul,
rojo, negro, azul, rojo, negro, amarillo.

1. Con los resultados obtenidos, elaborar una tabla de frecuencias.

Solución:

En la primera columna, colocamos los valo- Tabla de frecuencias


res de nuestra variable (color), en la segun- Color fi Fi ni Ni
da la frecuencia absoluta, luego la frecuencia Negro 4 4 0,20 0,20
acumulada, seguida por la frecuencia relati- Azul 5 9 0,25 0,45
va, y finalmente la frecuencia relativa acu- Amarillo 5 14 0,25 0,70
mulada. Ro jo 6 20 0,3 1
∗. Por ser el primer problema, no haremos Total 20 1
uso de las frecuencias porcentuales.

Ejemplo 1.2.

Un sondeo realizado en una Institución Educativa sobre 30 docentes, pretende mostrar que edad
es la más representativa del grupo.
Las edades de los docentes fueron:
17 17 15 15 16 17 18 17 15 17 16 15 15 16 16 18 18 16 17 15 16 15 18 17 15 19 19 16 17 19
Elabore una tabla de frecuencia que resuma los resultados.
Solución:
En la primera columna, colocamos los valores de nuestra variable xi , en la segunda la frecuencia
absoluta fi , luego la frecuencia acumulada Fi , seguida por la frecuencia relativa ni , y finalmente

guata26.03@gmail.com 6 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

la frecuencia relativa acumulada Ni . Ahora vamos a agregar la columna de frecuencia porcentual,


y frecuencia porcentual acumulada.
Tabla de frecuencias
xi fi Fi ni Ni pi Pi
15 8 8 0,26 0,26 26 % 26 %
16 7 15 0,23 0,5 23 % 50 %
17 8 23 0,26 0,76 26 % 76 %
18 4 27 0,13 0,9 13 % 90 %
19 3 30 0,1 1 10 % 100 %
Total 30 1 100 %

Ejemplo 1.3.

Los siguientes datos corresponden al número de hermanos en una clase de 20 alumnos:


3, 1, 1, 2, 3, 4, 3, 2, 5, 2, 2, 3, 4, 2, 1, 4, 2, 3, 1, 2

1. Con los resultados obtenidos, elaborar una tabla de frecuencias.

Solución:

En la primera columna, colocamos los va- Tabla de frecuencias


lores de nuestra variable xi , en la segunda xi fi Fi ni Ni pi Pi
la frecuencia absoluta fi , luego la frecuencia 1 4 4 0,2 0,2 20 % 20 %
acumulada Fi , seguida por la frecuencia re- 2 7 11 0,35 0,55 35 % 55 %
lativa ni , y finalmente la frecuencia relativa 3 5 16 0,25 0,8 25 % 80 %
acumulada Ni . Ahora vamos a agregar la co- 4 3 19 0,15 0,95 15 % 95 %
lumna de frecuencia porcentual, y frecuencia 5 1 20 0,05 1 5% 100 %
porcentual acumulada. Total 20 1 100 %

Ejemplo 1.4.

En una tienda de autos, se registra la cantidad de autos Toyota vendidos en cada día del mes
de Diciembre.
0; 1; 2; 1; 2; 0; 3; 2; 4; 0; 4; 2; 1; 0; 3; 0; 0; 3; 4; 2; 0; 1; 1; 3; 0; 1; 2; 1; 2; 3.

guata26.03@gmail.com 7 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

1. Con los datos obtenidos, elabora una tabla de frecuencias.

Solución:

En la primera columna, colocamos los va- Tabla de frecuencias


lores de nuestra variable xi , en la segunda xi fi Fi ni Ni pi Pi
la frecuencia absoluta fi , luego la frecuencia 0 8 8 0,267 0,267 26,7 % 26,7 %
acumulada Fi , seguida por la frecuencia re- 1 7 15 0,233 0,500 23,3 % 50 %
lativa ni , y finalmente la frecuencia relativa 2 7 22 0,233 0,733 23,3 % 73,3 %
acumulada Ni . Ahora vamos a agregar la co- 3 5 27 0,167 0,900 16,7 % 90 %
lumna de frecuencia porcentual, y frecuencia 4 3 30 0,100 1 10 % 100 %
porcentual acumulada. Total 30 1 100 %

guata26.03@gmail.com 8 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

1.4. Gráficos estadísticos.


Los gráficos estadísticos nos permiten presentar la información que dan los datos de manera
resumida y fácil de entender, es decir, las representaciones gráficas tienen que estar hechas para
que el simple impacto visual nos dé información de la distribución; los gráficos dependen del
número de variables involucradas.
En distribuciones cuantitativas si los datos no están agrupados, se emplea el diagrama de
barras, si están agrupados el histograma., si la distribución es cualitativa se suele emplear el
diagrama de sectores.

1.4.1. Histogramas
En estadística, un histograma es una representación gráfica de una variable en forma de barras,
donde la superficie de cada barra es proporcional a la frecuencia de los valores representados.
En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables,
normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están
agrupados los datos, siempre que se trate de datos agrupados (otro tema).
Los histogramas no se pueden elaborar con atributos (color, religión, etc.), sino con variables
medibles tales como peso, temperatura, tiempo, etc.

1.4.2. Diagrama circular

El diagrama circular (también llamado diagra-a cada valor que toma la variable.
ma de sectores o diagrama de pastel) sirve
para representar variables cualitativas o discre-
tas. Se utiliza para representar la proporción de
elementos de cada uno de los valores de la va-
riable. Se utiliza para representar la proporción
de elementos de cada uno de los valores de la
variable.
Consiste en partir el círculo en porciones pro-
porcionales a la frecuencia relativa. Entiéndase
como porción la parte del círculo que representa

Cálculo de los sectores: Un círculo completo son 360◦ (o 2π radianes). El ángulo de cada

guata26.03@gmail.com 9 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

porción debe ser proporcional a la frecuencia de cada valor. Por ejemplo, si un valor representa
un 50 % del total de elementos, su sector del círculo tendrá un ángulo de 180◦ (o π radianes).
Sea (x1 , x2 , . . . , xn ) un conjunto de elementos. La fórmula para calcular el ángulo de cada sector
es la siguiente:

360◦
α = · fi = 360◦ · ni
N

siendo N el total de elementos, ni el número de sujetos iguales y fi la frecuencia relativa.


El ángulo de cada sector se calcula como 360◦ dividido por el total de sujetos (N) y multiplicado
por la frecuencia absoluta ( fi ), o bien el producto de la frecuencia relativa por 360◦ . También
podemos calcular el ángulo en radianes:


α = · fi = 2π · ni
N

Ejemplo 1.5.

1.4.3. Diagramas de árbol


Para la construcción de un diagrama en árbol se partirá poniendo una rama para cada una de
las posibilidades, acompañada de su probabilidad.
En el final de cada rama parcial se constituye a su vez, un nudo del cual parten nuevas ramas,
según las posibilidades del siguiente paso, salvo si el nudo representa un posible final del
experimento (nudo final).

guata26.03@gmail.com 10 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

Hay que tener en cuenta: que la suma de probabilidades de las ramas de cada nudo ha de dar
1.

1.4.4. Polígono
Otro recurso gráfico para ilustrar el comportamiento de los datos es el polígono de frecuencias.
Este se construye sobre el sistema de coordenadas cartesianas, al colocar sobre cada marca de
clase un punto a una altura igual a la frecuencia asociada a esa clase; luego se unen dichos
puntos por segmentos de recta.
Otra forma de polígono es la Ojiva, la cual es el polígono que se obtiene de unir por segmentos
de recta los puntos situados a una altura igual a la frecuencia acumulada a partir de la marca
de clase como se hace con el polígono de frecuencia.

Ejemplo 1.6.

Las calificaciones de 50 alumnos de grado 8º en Matemáticas han sido las siguientes:


5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3,
5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.

a. Construir la tabla de distribución de frecuencias y dibuja el diagrama de barras.

Solución:

Tabla de frecuencias
xi fi Fi ni Ni
0 1 1 0,02 0,02
1 1 2 0,02 0,04
2 2 4 0,04 0,08
3 3 7 0,06 0,14
4 6 13 0,12 0,26
5 11 24 0,22 0,48
6 12 36 0,24 0,72
7 7 43 0,14 0,86
8 4 47 0,08 0,94
9 2 49 0,04 0,98
10 1 50 0,02 1
50 1

guata26.03@gmail.com 11 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

Ejemplo 1.7.

Los datos que se muestran a continuación representan el costo de la energía eléctrica


durante el mes de Julio del 2010 para una muestra aleatoria de 50 departamentos con dos
recamaras en una ciudad grande.

Costo de energía eléctrica en pesos.


96 171 202 178 147 102 153 197 127 82
157 185 90 116 172 111 148 213 130 165
141 149 206 175 123 128 144 168 109 167
95 163 206 175 130 143 187 166 139 149
108 119 150 154 114 135 191 137 129 158

a. Realice una tabla de distribución de frecuencias con 7 intervalos.

b. Represente la distribución mediante un diagrama de barras.

Solución:

Intervalos
K fi Xi Fi hi Hi
Ls Li
1 81 100 4 90,5 4 0,08 0,08
2 101 120 8 110,5 12 0,32 0,32
3 121 140 12 130,5 24 0,8 0,8
a.
4 141 160 8 150,5 32 1,44 1,44
5 161 180 10 170,5 42 2,28 2,28
6 181 200 4 190,5 46 3,2 3,2
7 201 220 4 210,5 50 4,2 4,2
∑ f = 50

guata26.03@gmail.com 12 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

b.

Ejemplo 1.8.

En una maternidad se han tomado los pesos (en kilogramos) de 50 recién nacidos:
2, 8 3, 2 3, 8 2, 5 2, 7 3, 7 1, 9 2, 6 3, 5 2, 3
3, 0 2, 6 1, 8 3, 3 2, 9 2, 1 3, 4 2, 8 3, 1 3, 9
2, 9 3, 5 3, 0 3, 1 2, 2 3, 4 2, 5 1, 9 3, 0 2, 9
2, 4 3, 4 2, 0 2, 6 3, 1 2, 3 3, 5 2, 9 3, 0 2, 7
2, 9 2, 8 2, 7 3, 1 3, 0 3, 1 2, 8 2, 6 2, 9 3, 3

a. ¿Cuál es la variable y de qué tipo es?

b. Construye una tabla con los datos agrupados en 6 intervalos de 1, 65 a 4, 05.

c. Representa gráficamente esta distribución.

Solución:

a.

? Variable: peso de los recién nacidos.

? Tipo: cuantitativa continua.

b. Localizamos los valores extremos: Li = 1, 8 y Ls = 3, 9, recorrido 3, 9 − 1, 8 = 2, 1 = xi .

guata26.03@gmail.com 13 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

INTERVALOS MARCA DE CLASE (Xi ) fi


1, 65 − 2, 05 1, 85 4
2, 05 − 2, 45 2, 25 5
2, 45 − 2, 85 2, 65 13
2, 85 − 3, 25 3, 05 17
3, 25 − 3, 65 3, 45 8
3, 65 − 4, 05 3, 85 3
50

c. Representamos los datos en un histograma; al ser los intervalos de la misma amplitud, la


altura de cada barra corresponde a la frecuencia ( fi ) de cada intervalo.

Ejemplo 1.9.

Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el


número de empleados que hay en cada una de ellas para un estudio posterior. Las observaciones
obtenidas han sido:
12 10 9 11 15 16 9 10 10 11 12 13 14 15 11 11 12
16 17 17 16 16 15 14 12 11 11 11 12 12 12 15 13 14
16 15 18 19 18 10 11 12 12 11 13 13 15 13 11 12

a. Calcular la distribución de frecuencias de la variable obteniendo las frecuencias absolutas,


relativas y sus correspondientes acumuladas.

b. ¿Qué proporción de sucursales tiene más de 15 empleados?

guata26.03@gmail.com 14 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

c. Diagrama de barras y diagrama acumulativo de frecuencias correspondientes.

d. Agrupar en intervalos de amplitud 3 los valores de la variable, calcular su distribución de


frecuencias y representar el histograma y su polígono de frecuencias acumuladas.

Solución:
ni Ni
Xi ni Ni fi = N Fi = N
9 2 2 0, 04 0, 04
10 4 6 0, 08 0, 12
11 10 16 0, 20 0, 32
12 10 26 0, 20 0, 52
13 5 31 0, 10 0, 62
a. 14 3 34 0, 06 0, 68
15 6 40 0, 12 0, 8
16 5 45 0, 1 0, 9
17 2 47 0, 04 0, 94
18 2 49 0, 04 0, 98
19 1 50 0, 02 1
50 1

b. Las sucursales con más de 15 empleados: n8 + n9 + n10 + n11 = 5 + 2 + 2 + 1 = 10

% sucursales con más de 15 empleados = 10


50  100 = 20 %

c.

guata26.03@gmail.com 15 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

d. Los datos agrupados en intervalos amplitud 3:

ni Ni ni
[Li − Li+1 ) Xi ni Ni fi = N Fi = N ci di = ci
8 − 11 9, 5 6 6 0, 12 0, 12 3 2
11 − 14 12, 5 25 31 0, 50 0, 62 3 8, 33
14 − 17 15, 5 14 45 0, 3 0, 90 3 4, 67
17 − 20 18, 5 5 50 0, 10 1 3 1, 67
50 1 12

guata26.03@gmail.com 16 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

2. MEDIDAS DE TENDENCIA CENTRAL


En el capítulo anterior, se dijo que la estadística cumplía una función descriptiva haciéndolo
mediante cuadros y gráficas, ahora lo complementamos con la aplicación de una serie de
medidas de posición y de dispersión, que nos permiten la descripción de un hecho o de un
conjunto de observaciones.
Las medidas de posición o de tendencia central, denominadas también como promedios,
nos permiten determinar la posición de un valor respecto a un conjunto de datos, el cual lo
consideramos como representativo o típico, para el total de las observaciones.
Estas medidas aplicadas a las características de las unidades en una muestra, se les denominad
estimadores o estadígrafos. En cambio, aplicadas a las características de los elementos de una
población, se les conoce como parámetros o valores estadísticos de la población.
Si con el resultado obtenido, en una encuesta aplicada en una zona o barrio de la ciudad,
afirmamos que el consumo promedio de leche por familia es de dos litros por semana, estamos
representando una gama o variedad de consumos, que van desde familias que no consumen,
hasta un consumo superior a dos litros. Con esta información hacemos referencia al compor-
tamiento del consumo de leche en una zona de la ciudad; también, el resultado puede ser
comparado con los consumos promedios de otros barrios, o el consumo promedio por persona,
o establecer la relación que puede haber entre el consumo y los niveles de ingresos.
Dependiendo de la naturaleza de los datos, la misma necesidad que se tiene y/o las caracte-
rísticas que ellos representan, requieren de la aplicación de un promedio especial dentro de
los diferentes tipos que se expondrán a continuación, pero para ello deberán tenerse en cuenta
algunas reglas que serán básicas en la selección de estas herramientas de descripción.

Características, uso, ventajas y desventajas de las medidas de tendencia central y de


posición Un promedio es un valor en la escala de las X correspondiente a una distribución
de frecuencias, cuyo valor se calcula para representarla en calidad de medida típica del grupo.
Algunas condiciones esenciales para que este valor pueda cumplir su cometido:

? Debe estar representada por una sola cifra.

? Debe ser objetiva y definida por una fórmula algebraica, de tal manera que cualquiera
que sea la persona que trabaje con la distribución, se obtenga siempre el mismo valor.

? Debe ser descriptiva de los datos, de manera que su significado sea fácil de entender.

guata26.03@gmail.com 17 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

? No debe ser una abstracción matemática, que únicamente pueda ser entendida por per-
sonas muy versadas en esta ciencia, ya que una de las condiciones de la estadística, es
simplificar los datos y no hacerlos más complejos.

? Debe ser fácil de calcular, pero esta condición no debe preferirse en prejuicio de otras
ventajas.

? Debe depender de cada uno de los elementos del grupo, de tal manera que si se altera
alguno de éstos, consecuentemente se altera el valor del promedio ya que por definición,
ésta es representante típica de todos los miembros del grupo y no solamente del alguno
de ellos.

? A pesar de que cada uno de los valores de los elementos del grupo debe tener influencia
en el valor de la medida, ésta debe ser de tal calidad que no se deje afectar demasiado
por alguno o algunos pocos valores.

? Debe tener lo que los estadísticos llaman estabilidad en el muestreo.

? Debe ser de uso fácil para cálculos matemáticos posteriores.

2.1. Media aritmética


El promedio es un término muy utilizado por todos, aunque indeterminado. Se dice general-
mente que un valor promedio, intenta representar o resumir las características de un conjunto
de valores. La expresión corriente de promedio, suele en la mayoría a referirse a la media
aritmética X = µ.
Es la medida de posición o promedio más conocida, la más utilizada y entendida por todos,
por su gran estabilidad es la preferida en el muestreo, sus fórmulas admiten tratamiento alge-
braico. Su desventaja principal, es ser muy sensible a cambios en sus valores u observaciones,
también, cuando alguno de sus valores extremos es demasiado grande o pequeño.

Ventajas.

? El promedio aritmético es, en sí, la medida más entendida y la más utilizada. Es un


valor tal. que si se calculara para un grupo en el cual todos los elementos fueran iguales,
cada uno de ellos sería a su promedio aritmético, por lo cual podemos deducir que el
promedio de n elementos, es un nuevo elemento formado, correspondientemente a una
parte igual n1 de cada uno de los elementos originales.

guata26.03@gmail.com 18 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

? Esta medida se define mediante una ecuación matemática muy fácil de entender y al-
gunas veces se puede obtener cuando no es posible calcular otros tipos de medidas de
tendencia central o de posición y, aún en el casos de no conocerse los valores indivi-
duales de la serie, por ejemplo: si 10 familias consumen 20 litros de leche, el promedio
aritmético será de 2 litros por familia.

? El promedio aritmético es extraordinariamente estable en el muestreo.

? Es altamente sensible a cualquier cambio en los datos de la distribución.

? Como ventaja final, se podrá anotar que es excepcionalmente adaptable cuando se trata
de hacer cálculos matemáticos posteriores con él.

Desventajas.

? Es muy sensible a valores muy pequeños o grandes, especialmente cuando estos últimos
se encuentren incluidos en la distribución que se está estudiando, puede resultar en un
promedio que no represente lo típico para el total del grupo.

? Cuando la distribución es marcadamente asimétrica, de tal forma que el promedio arit-


mético, la mediana y el modo difieran en forma apreciable, debe considerarse siempre
la posibilidad de que el promedio aritmético pueda no ser el valor único representativo
de la serie.

? Otro inconveniente o desventaja, es cuando la distribución tiene la forma de U, es decir,


parabólica; éste corresponde a los valores menos comunes en la serie y por tanto, puede
darnos una idea irreal de la distribución.

Esta medida, por lo general, se representa mediante una equis con una raya o trazo colocado
en su parte superior, sin embargo se utilizan otros símbolos como se pueden observar a
continuación: a, ay , ax , M[x] , M[y] , x, y, M[x] , µ.

2.1.1. Media aritmética simple


Suponga que las observaciones en una muestra son x1 , x2 , ..., xn . La media de la muestra, que
se denota con x, y se define como:
n
xi x1 + x2 + x3 . . . . . . xn
x=∑ =
i=1 n n

guata26.03@gmail.com 19 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

Ejemplo 2.1.

Calcular la media aritmética de los números 10, 12, 36, 25, y 58


Solución.
10+12+36+25+58 121
x= 5 = 5 = 24, 2

Ejemplo 2.2.

Durante los últimos 32 días el valor de las compras en periódicos fue:

5.2 10.2 6.5 6.8 8.5 8.2 5.3 7.0


10.2 8.3 7.1 7.2 5.7 9.0 6.2 7.7
7.0 9.4 6.6 8.4 6.4 7.8 9.1 8.3
7.1 9.2 7.8 9.6 10.1 8.2 8.6 7.5

El promedio aritmético del valor de las compras de periódicos es:

n
xi 250,2
x=∑ = = 7,82
i=1 n 32

2.1.2. Media aritmética ponderada


Se aplica en datos agrupados, es decir, aquellos que se encuentran organizados en una tabla
de frecuencias, siendo las frecuencias absolutas sus ponderaciones...

Ejemplo 2.3.

Supongamos que dispone de información para 10 observaciones: 8, 2, 8, 6, 2, 2, 8, 2, 4. La


media aritmética será:
8+2+8+......+4 48
x= 10 = 10 = 4, 8
Ahora, si calculamos la media aritmética de las mismas 10 observaciones, pero además organi-
zamos los datos, el resultado obtenido será el mismo.
10 = 4, 8 ; resultado que sería exactamente igual a:
2+2+2+2+4+6+6+8+8+8
x= 10 = 48
2(4)+4(1)+6(2)+8(3) 8+4+12+24
x= 10 = 10 = 4, 8
¿Qué se ha hecho? Simplemente se han organizado los datos en una tabla de frecuencias.

guata26.03@gmail.com 20 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

yi ni yi ni
2 4 8
∑ yi ni Xi fi
4 1 4 y= n oX= N
6 2 12
y1 n1 +y2 n2 +...... 2(4)+4(1) 48
8 3 24 y= n1 +n2 +...... = 10 = 10 = 4, 8
∑ 10 48
Xi fi Xi fi

2.2. Mediana
La mediana, es considerada también, al igual que la Media, como una medida de tendencia
central. Su importancia es menor, sus fórmulas son rígidas ya que no admiten tratamiento
algebraico, es por eso que tendremos que aplicar seis procedimientos de cálculo diferente, que
lo hace un poco dispendioso y poco atractivo, como veremos más adelante;
Se define como «aquel valor de la variable que supera a no más de la mitad de las obser-
vaciones, al mismo tiempo, es superado por no más de la mitad de las observaciones»
en otras palabras, se puede definir como el «valor central». Se simboliza por Me , y su fórmula
de aplicación es:

2.2.1. Mediana para datos no agrupados


La mediana de un conjunto finito de valores es aquel valor que divide al conjunto en dos
partes iguales, de forma que el número de valores mayor o igual a la mediana es igual al
número de valores menores o igual a estos. Su aplicación se ve limitada ya que solo considera
el orden jerárquico de los datos y no alguna propiedad propia de los datos, como en el caso de
la media.

Ventajas.

? Esta medida tiene una definición bastante rígida y el concepto de ella es tan claro, que
cualquier persona lo entiende, aún sin ser familiar su término.

? Los datos deben estar ordenados, pero los valores extremos no tienen ninguna incidencia
en su cálculo.

? Tiene menor estabilidad en el muestreo que el promedio aritmético, pero mayor estabi-
lidad que otras medidas.

guata26.03@gmail.com 21 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

? Hay situaciones en que la única medida de tendencia central que puede utilizarse es
la mediana, especialmente cuando los valores extremos de una distribución de variable
continua no están definidos.

Desventajas.

? No es tan conocida como la media aritmética.

? Se hace necesario ordenar los datos para poderla calcular.

? Esta medida no se adapta a cálculos posteriores aritméticos, por cuanto que si obtenemos
las medianas de diferentes grupos, no se podrá calcular una mediana para el conjunto.

? Tampoco es sensible a cambios en los valores de los elementos, manteniéndose el valor


central y los valores ordenados.

t A continuación se muestran los criterios para construir la mediana. Se puede construir los
siguientes criterios:
Cálculo en datos sin agrupar u originales

a. Número impar de observaciones. Cuando esta medida la aplicamos en los datos originales
o sin agrupar, lo primero que se debe hacer, es ordenarlos de menor a mayor o de mayor
a menor.

Ejemplo 2.4.

Supongamos se tienen los siguientes datos: y x1 = 2 x2 = 18 x3 = 4 x4 = 12. Observamos que


la serie es impar, ya que n = 5 por lo tanto ordenamos los datos, por ejemplo, de menor a
mayor: 2 4 6 12 8 La mediana será igual al valor central Me = 6.

b. Número par de observaciones. Ahora calcularemos la mediana, cuando se tenga un número


par de observaciones. En estos casos, encontramos dos valores en el centro de la serie,
por tal razón la mediana deberá ser el promedio de ellos.

Ejemplo 2.5.

Supongamos que en vez de 5 datos se tengan 8 datos así: x1 = 8 x2 = 16 x3 = 4 x4 = 2


x5 = 20 x6 = 3 x7 = 12 x8 = 20.

guata26.03@gmail.com 22 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

x +x
Ordenamos los datos de menor a mayor o viceversa; 2 3 4 8 12 16 20 20 ⇒ Me = j−12 j =
8+12
2 = 10.
En los dos casos anteriores, correspondiente al cálculo de la mediana para datos sin agrupar,
la localización de ella, luego de ser ordenados, se facilita aplicando el siguiente procedimiento:
2 = 2 = 3ª posición, la mediana en el primer caso o ejemplo 1, será Me = x j = 6 y
n+1 5+1

en el ejemplo 2 será: n+1 2 = 2 = 4, 5ª posición, es decir, se encuentra entre la 4ª y la 5ª


8+1

observación y la mediana será igual a Me = x j = 10, el valor promedio de los dos valores
centrales.

2.2.2. Mediana para datos agrupados


Cuando los datos se encuentran agrupados en una distribución de frecuencia, no conocemos
los datos originales. Por lo tanto es necesario estimar la mediana mediante los siguientes pasos:

1. Calcular el valor n
2

2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo mediano). Esto se


hace encontrando el primer intervalo de clase donde la frecuencia acumulada es igual o
mayor que 2n .

3. Aplicando la siguiente fórmula con los valores del intervalo mediano:


!
N
2 − Fi−1
Me = Li + ai
fi

Donde:

? Me = Mediana

? Li = Límite inferior del intervalo que contiene a la mediana

? fi = Frecuencia absoluta del intervalo de la clase mediana

? N = Total de datos o frecuencias

? Fi−1 = Frecuencia acumulada anterior a la clase mediana

? ai = Amplitud del intervalo de la clase mediana

Ejemplo 2.6.

guata26.03@gmail.com 23 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

2.3. Moda
Se define como «el valor de la variable que más se repite» o «aquel valor que presenta
la máxima frecuencia». Puede suceder que una distribución tengas dos Modas, en este caso
se dice que la distribución es Binomial, en el caso que haya más de dos modas, se dice que
es plurimodal o multimodal. Es la única medida de posición que puede ser utilizada en
atributos, es decir, cuando la característica es cualitativa. Modo, Moda o valor Modal, medida
originalmente concebida, como aquel valor de la variable, que presenta el mayor número de
observaciones, es decir, el valor de la variable que más veces se repite. Se empleó formalmente
en 1,984 por Karl Pearson, ya que no era utilizado anteriormente.

Desventajas.

? El hecho que la moda nos indique el punto de mayor concentración, lo hacer tal vez,
la mejor medida de tendencia central. Cuando una distribución es muy asimétrica,
claramente se ve que la moda es el más representativo del grupo, y en algunos casos, si
la moda y el promedio aritmético son significativamente diferentes al valor, es preferible
usar la moda.

? En series plurimodales, la moda permite dividir la distribución con fines de estratifica-


ción.

? Se considera de uso riguroso en variables continuas, aunque puede extenderse a casos


discontinuos.

Ventajas.

? Se le considera con cierto grado de dificultad de cálculo en datos agrupados, siendo su


resultado de poca confianza, especialmente cuando la amplitud no es constante, en este
caso, si se hace necesario se debe seguir un determinado proceso.

? Es muy inestable en el muestreo.

? No puede ser utilizado en procesos algebraicos posteriores.

? No es sensible, especialmente cuando hay cambios en los valores de la variable, salvo que
no afecten a su propio valor.

guata26.03@gmail.com 24 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

2.3.1. Moda para datos sin agrupar u originales

Ejemplo 2.7.

Consideremos los siguientes datos: 5, 10, 8, 5, 10, 18, 5, 12, 5, 12 calculemos la media, la
mediada y la moda. n = 10.
∑ xi 90
Media → x = n = 10 =9
Mediana →Ordenamos los datos de mayor a menor o de menor a mayor
5 5 5 5 8 10 10 12 12 18
Me
Posición: 2 = 2 = 5, 5ª La mediana se encuentra entre la 5ª y la 6ª observación
n+1 10+1
x j−1 +x j
Siendo: Me = 8+10
2 =9 Me = 2
Moda →Corresponderá a 5, siendo el valor de la variable que más se repite → Md = x j = 5
Al forjarnos una imagen mental de la distribución de frecuencias de un conjunto de mediciones,
una de las primeras apreciaciones descriptivas de interés es una medida de tendencia central,
es decir, una que localiza el centro de la distribución. Una de las medidas de tendencia central
más común y útil es la media común o “media aritmética”, pero también son de importancia,
según las circunstancias y el tipo de variables la “moda” y la “mediana”.

Ejemplo 2.8.

2.3.2. Moda para datos agrupados


En tablas de frecuencias con datos agrupados, hablaremos de intervalo modal.
La moda se representa por Mo.
 
fi − fi−1
Mo = Li + ai
( fi − fi−1 ) + ( fi + fi−1 )

Donde:

? Mo = Moda

? Li = Límite inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta).

? fi = Frecuencia absoluta del intervalo modal.

? fi−1 = Frecuencia absoluta del intervalo anterior al modal.

guata26.03@gmail.com 25 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

? fi+1 = Frecuencia absoluta del intervalo posterior al modal.

? ai = Amplitud del intervalo.

Ejemplo 2.9.

2.3.3. Otras medidas de tendencia central.


? La Media Geométrica.

? La Media Cuadrática.

2.3.4. Cuartiles, deciles y percentiles.


Cuartiles: si a un conjunto de datos se ordena de mayor a menor, el valor central es la
mediana, este valor divide el grupo, en dos subgrupos cada uno con el 50 % de los datos. Si
a cada subgrupo ordenado se le marca el valor central, tenemos así tres valores seleccionados
que llamaremos Cuartiles,Q1, Q2 y Q3. Estos valores dividen al conjunto de datos en cuatro
grupos con igual número de términos, cada cuartil contiene el 25 % de los datos. La mediana
es el cuartil dos, Q2. Con los Cuartiles se construye un gráfico especial, “el diagrama de caja”,
este permite visualizar la variabilidad de los datos por Cuartil.
Deciles, si el conjunto de valores, ordenados de de mayor a menor, se dividen en diez partes
iguales, los valores que dividen los datos se llaman deciles y son nueve, D1, D2,...,D9.
Percentiles, si se tiene un conjunto de datos muy numerosos y a este se lo divide en 100 partes
iguales, cada valor que divide los datos se llama percentil, P1, P2, P3. . . P99.

Ejemplo 2.10.

Consideremos los datos que muestra la siguiente tabla, resultado de gastos diarios en periódicos
de una determinada empresa.

guata26.03@gmail.com 26 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

[Li − Li+1 ) Xi fi hi Fi Hi
5,2 − 6,1 5,65 3 0,094 3 0,094
6,1 − 7,0 6,55 5 0,156 8 0,250
7,0 − 7,9 7,45 9 0,281 17 0,531
7,9 − 8,8 8,35 7 0,219 24 0,750
8,8 − 9,7 9,25 3 0,156 29 0,906
9,7 − 10,6 10,15 2 0,094 32 1,000
T OTAL 32 1,000
....................................................................................
Hallemos el 80º percentil:
Son 99 valores que dividen a un conjunto de datos en 100 partes iguales, los percentiles se
calculan con la fórmula:
kn

c 100 − Fi−1
Pk = Li +
fi

donde;
Li =límite inferior del intervalo que contiene al percentil
Fi−1 =frecuencia acumulada en la clase anterior k-ésima
fi =frecuencia en la clase que contiene al percentiles
c =tamaño del intervalo de clase
k =1º, 2º, 3º,...,99º percentiles
De este modo, el percentil 80º de acuerdo a la tabla, estará en el intervalo 5, es decir,
c( 80n −F )
P80º = Li + 100 fi i−1 = 8,8 + 0,9(25,6−24)
5 = 9,088
El 80 % de los datos serán menores a 9,088 y el 20 % restante serán mayores.
....................................................................................
Hallemos el 3er cuartil.
El cuartil 3 (percentil 75º) se ubicara en el cuarto intervalo, así:
c( 75n −F )
P75º = Li + 100 fi i−1 = 7,9 + 0,9(24−17)
7 = 8,8
El 75 % de los datos serán menores a 8,8 y el 25 % restante serán mayores.
....................................................................................
Hallemos ahora el 7º decil.
El decil 7 (percentil 70º) se ubicara en el cuarto intervalo, así:
c( 70n −F )
P70º = Li + 100 fi i−1 = 7,9 + 0,9(22,4−17)
7 = 8,594
El 70 % de los datos serán menores a 8,594 y el 30 % restante serán mayores a 8,594.

guata26.03@gmail.com 27 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

2.4. Medidas de dispersión o de variabilidad


Hasta el momento hemos estudiado los valores centrales de la distribución, pero también es
importante conocer si los valores en general están cerca o alejados de estos valores centrales,
es por lo que surge la necesidad de estudiar medidas de dispersión.
Las medidas de dispersión muestran la variabilidad de una distribución, indicando por medio
de un número si las diferentes puntuaciones de una variable están muy alejadas de la media.
Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será
a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos; dicho de
otro modo, las medidas de dispersión, son herramientas estadísticas para determinar que tan
compactos son una serie de datos, o si se quiere, que tan homogéneos son.
Los tipos de medidas de dispersión más comunes son: “el rango” “la desviación Estándar o
típica” y la “Varianza” y el coeficiente de variación.

2.4.1. Rango
Se define como la diferencia que existe entre el valor mayor y el valor menor de una distribución,
Se indica como R. Se calcula de la siguiente forma: R= Valor Mayor – Valor Menor

2.4.2. Varianza
Es una medida cuya importancia radica especialmente en que da origen a otra medida de
dispersión más significativa, denominada desviación estándar o desviación típica. Es la media
de los cuadrados de las desviaciones, y la denotaremos por Sx2 o también por σ 2 . Las fórmulas
para la varianza poblacional y la varianza muestral son un poco diferente:

? Varianza muestral:

n 2
∑i=1 xi − X
Sx2 = para datos no agrupados
n−1

n 2
∑i=1 fi xi − X
Sx2 = para datos agrupados
n−1

? Varianza poblacional:

guata26.03@gmail.com 28 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

n 2
∑i=1 xi − X
σx2 = para datos no agrupados
N

n 2
∑i=1 fi xi − X
σx2 = para datos agrupados
N

donde:

? S = designa la desviación estándar o desviación típica.

? xi = para datos no agrupados es el valor de las observaciones en la muestra o de la


población. Para datos agrupados, representa el punto media de una clase o marca de
clase.

? X = media aritmética.

? fi = es la frecuencia absoluta de los intervalos de clase.

? N = es el número de observaciones en la población.

? n = es el número de observaciones en la muestra.

Ejemplo 2.11.

Con los siguientes datos 5, 3, 1, 6, 10 calcule la varianza.


x = ∑nxi = 5+3+1+6+10
5 =5
22 2 2 2 2 2
s2 = ∑(xi −x)
n = (5−5) +(5−3) +(5−1)
5
+(5−6) +(5−10)
= 9, 2
Datos agrupados: al trabajar con datos agrupados utilizamos:

2
∑ (xi − x) ni
s 2
= para la muestra y,
n
2
∑ Xi − X ni
σ2 = para la población.
N

2.4.3. Desviación típica


La desviación típica es la raíz cuadrada de la varianza, considerada siempre positiva.

s = s2 para la muestra y,

σ = σ 2 para la población.

guata26.03@gmail.com 29 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

La desviación típica, es la medida de dispersión más utilizada y de mayor utilidad, dado que
las unidades son expresadas en la misma variable; mientras que, la varianza se expresan en las
mismas unidades pero al cuadrado.

2.4.4. Coeficiente de variación de Pearson: (CV )


Mide la variación de los datos respecto a la media, sin tener en cuenta las unidades en la que
están.

Sx
CV = , x 6= 0
|x|

donde Sx es la desviación típica y x es la media del conjunto de observaciones.


El coeficiente de variación toma valores entre 0 y 1. Si el coeficiente es próximo al 0, significa
que existe poca variabilidad en los datos y es una muestra muy compacta. En cambio, si tienden
a 1 es una muestra muy dispersa.
Para interpretar fácilmente el coeficiente, podemos multiplicarlo por cien para tenerlo en tanto
por cien.

Ejemplo 2.12.

Para la media y la varianza de un conjunto se han hallado, respectivamente los valores 4 y 25


¿qué opinión merece la media aritmética?

s 5
CV = × 100 = × 100 = 125 %
x 4

Esta media aritmética no lo es suficientemente representativa de la distribución, debido a


variabilidad tan alta.

guata26.03@gmail.com 30 Amaury J. Camargo Benítez


ÍNDICE 3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS

3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS

3.1. Análisis Combinatorio


Cuando estamos en presencia de un conjunto ordenado de una determinada manera, nos
pueden venir las preguntas, ¿porque está ordenado de esa forma?, ¿existen más posibilidades
para ordenar éste conjunto?, ¿cuántas?, etc. . . , el estudio de las permutaciones, de los arreglos
y de las combinaciones nos permitirá responder a éstas y otras preguntas.

3.1.1. Permutaciones
Las permutaciones consisten en cambiar el orden de un conjunto, y poder determinar cuántas
posibilidades de ver de distinta forma ordenado el conjunto existen, por ejemplo; sea M =
m1 , m2 , m3 , m4 , ..., mn un conjunto de n elementos, entonces las posibilidades que tengo para
poner en cada casillero será: en la primera posición puedo colocar cualquiera de los n elementos,
en la segunda puedo colocar cualquiera de los que me quedan, que son (n − 1), en la tercera
posición puedo colocar solo (n − 2) elementos y así voy quedándome con un elemento menos
a medida que avanzo en los casilleros, hasta que me quedo solo con un elemento en la última
posición, es decir:
M = | {z } , | {z } , | {z } , | {z } , ..., |{z} , |{z} , |{z}
n opciones n−1 opciones n−2 opciones n−3 opciones 3 opciones 2 opciones 1 opción

De manera que cuando tengo un conjunto de n elementos la cantidad de permutaciones que


puedo hacer sobre éste será:
Pn elementos = n · (n − 1) · (n − 2) · (n − 3) · ... · 2 · 1

A éste número lo conocemos como factorial de n, lo simbolizamos como n!, por lo tanto las
permutaciones que puedo hacer sobre un conjunto de n elementos será:
Pn elementos = n!

Ejemplo 3.1.

Determinemos la cantidad de ordenamientos distintos del conjunto de las vocales V = a, e, i, o, u:


SOLUCIÓN:
P5 vocales = 5! = 5 · 4 · 3 · 2 · 1 = 120 posibilidades distintas.

guata26.03@gmail.com 31 Amaury J. Camargo Benítez


3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS ÍNDICE

3.1.2. Arreglos (variaciones)


Los arreglos son todas las posibles ordenaciones de n elementos sacados de un grupo más
grande de m elementos (m > n), importando el orden de los conjuntos resultantes, de manera
que α, β , γ 6= γ, β , α. El número de arreglos de a n elementos que puedo hacer en un grupo
de m elementos será:
m!
Amn =
(m−n)!

Ejemplo 3.2.

Determinemos la cantidad de arreglos de 2 vocales que podemos hacer en el conjunto de las


vocales V = a, e, i, o, u:
Solución: m será la cantidad de vocales, y n la cantidad que habrá en los arreglos:

m!
Am
n =
(m−n)!
5!
A52 =
(5 − 2)!
5 · 4 · 3!
A52 =
3!
A52 = 20 Arreglos distintos

Ejemplo 3.3.

¿De cuántas maneras pueden sentarse 10 personas en un banco si hay 4 sitios disponibles?
Respuesta:
Nótese que importa el orden en que se sientan las personas, ya que los cuatro sitios son
diferentes, y que una persona no puede ocupar más de un sitio a la vez. Por lo tanto, hay

m!
Am
n =
(m−n)!
10!
A10
4 =
(10 − 4)!
10!
A10
4 =
6!
10 · 9 · 8 · 7 · 6!
A10
4 = = 10,9,8,7 = 5040 maneras
6!

guata26.03@gmail.com 32 Amaury J. Camargo Benítez


ÍNDICE 3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS

Ejemplo 3.4.

En una clase de 10 alumnos van a distribuirse 3 premios. Averiguar de cuántos modos puede
hacerse si:

a. Los premios son diferentes.

b. Los premios son iguales.

Hay dos supuestos posibles: Si una misma persona no puede recibir más de un premio:

? Suponemos que NO puede recibir más de un premio, luego los alumnos NO se pueden
repetir:

Caso 1. Los premios son diferentes (no es lo mismo ganar el primer premio que el segundo)
importa el orden, hay:

m!
Am
n =
(m−n)!
10!
A10
3 =
(10 − 3)!
10!
A10
3 =
7! · 3!
10 · 9 · 8 · 7!
A10
3 = = 10,9,8 = 720 manera de distribuir los premios si estos son diferentes;
7!

3.1.3. Combinaciones
Las combinaciones son muy parecidas a los arreglos, con la diferencia en que en los con-
juntos que se forman no importa el orden de manera que α, β , γ = γ, β , α. El número de
combinaciones de a n elementos que puedo hacer de un total de m elementos será:
m!
Cnm =
n!·(m−n)!

Ejemplo 3.5.

Javier, Gonzalo, Manuel, Pamela y Paola se han postulado a la directiva de su curso, pero solo 3
de ellos pueden quedar, ¿cuántas directivas posibles hay?.
Respuesta :
En éste caso se trata de formar combinaciones entre los postulantes, pues si por ejemplo se elije
a Javier, Gonzalo y Paola es lo mismo que se elija a Paola, Gonzalo y a Javier, lo que corresponde
a una combinación de 3 elementos de un total de 5, por lo tanto:

guata26.03@gmail.com 33 Amaury J. Camargo Benítez


3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS ÍNDICE

m!
Cnm =
n!·(m−n)!
5!
C35 =
3!. (5 − 3)!
5,4,3!
C35 =
3!,2!
20
C35 = = 10 posibles directivas distintas
2

Ejemplo 3.6. (Se refiere a la parte b) del último ejemplo de los arreglos)

son iguales, no importa el orden, son indistinguibles, pueden distribuirse de;

m!
Cnm =
n! · (m−n)!
10!
C310 =
(10 − 3)! · 3!
10!
C310 =
7! · 3!
10 · 9 · 8
C310 = = 120 maneras de distribuir los premios si estos son iguales.
3·2·1

3.2. Probabilidad
Las Probabilidades pertenecen a la rama de la matemática que estudia ciertos experimentos
llamados aleatorios; o sea, regidos por el azar, en que se conocen todos los resultados posibles,
pero no es posible tener certeza de cuál será en particular el resultado del experimento.
Ejemplo, experimentos aleatorios cotidianos son el lanzamiento de una moneda, el lanzamiento
de un dado, extracción de una carta de un mazo de naipes. Más adelante se verá que debemos
distinguir entre los conceptos de probabilidades matemáticas o clásicas de las probabilidades
experimentales o estadísticas.
LA PROBABILIDAD es el estudio de los fenómenos de los que no estamos seguros de su
ocurrencia.
FENÓMENO: un fenómeno es la ocurrencia de un hecho o suceso. Los que nos interesan son
aquellos fenómenos los cuales podemos observar.
Ejemplos de experimentos; Lanzamiento de un dado, lanzamiento de una moneda, un mazo de
cartas, esferas en una urna, etcétera.
EXPERIMENTO: es un fenómeno observable perfectamente definido.

guata26.03@gmail.com 34 Amaury J. Camargo Benítez


ÍNDICE 3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS

3.2.1. Experimentos y espacios muestrales


La teoría de la probabilidad ha sido motivada por diversas situaciones de la vida real en las
que se realiza un experimento y el investigador observa un resultado. Además, el resultado no
puede predecirse con certeza. A estos experimentos se les llama experimentos aleatorios. El
concepto de un experimento aleatorio se considera desde el punto de vista matemático como
una noción primitiva y por ello no se define de otra manera; sin embargo, podemos notar que
los experimentos aleatorios tienen algunas características comunes. Primero, en tanto que no
podemos predecir un resultado con certeza, sí es posible describir el conjunto de resultados
posibles. Segundo, desde un punto de vista conceptual, el experimento es tal que podría
repetirse en condiciones que permanezcan invariables, ocurriendo los resultados de una manera
fortuita; no obstante, a medida que el número de repeticiones aumenta, surgen ciertos patrones
en la frecuencia de ocurrencia de los resultados.
A menudo consideraremos experimentos idealizados. Por ejemplo, cuando se arroja una moneda,
podemos descartar la posibilidad de que caiga de canto. Esto es más por conveniencia que por
necesidad. El conjunto de resultados posibles se llama espacio muestral y estos resultados
definen al experimento idealizado en particular. Los símbolos E y S se utilizan para representar
el experimento aleatorio y el espacio muestral asociado.
De acuerdo con la terminología empleada en el repaso de conjuntos y sus operaciones, clasi-
ficaremos espacios muestrales (y con ello a los experimentos aleatorios). Un espacio muestral
discreto es aquel en el que hay un número finito de resultados o un número finito contable
(numerable) de resultados. Del mismo modo, un espacio muestral continuo tienen resultados
incontables. Éstos podrían ser números reales en un intervalo o pares reales contenidos en
el producto de intervalos, donde las mediciones se realizan respecto a dos variables en un
experimento.
Para ilustrar experimentos aleatorios con un espacio muestral asociado consideremos los ejem-
plos siguientes:

Ejemplo 3.7.

E1 : Lanzar una moneda genuina y observar el lado que cae hacia arriba.
S1 : {C, S}

Ejemplo 3.8.

E2 : Lanzar tres veces una moneda genuina y observar la secuencia «caras» y «sellos».
S2 : {CCC,CCS,CSC,CSS, SCC, SCS, SSC, SSS}

guata26.03@gmail.com 35 Amaury J. Camargo Benítez


3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS ÍNDICE

Ejemplo 3.9.

E3 : Lanzar tres veces una moneda genuina y observar el número total de «caras».
S3 : {0, 1, 2, 3}

Ejemplo 3.10.

E4 : Lanzar un dado y observar el número que resulta en la cara superior.


S4 : {1, 2, 3, 4, 5, 6}

Ejemplo 3.11.

Lanzar un par de dados y observar los números


E5 :   que resultan.


 (1, 1) , (1, 2) , (1, 3) , (1, 4) , (1, 5) , (1, 6) , 


 



 (2, 1) , (2, 2) , (2, 3) , (2, 4) , (2, 5) , (2, 6) , 



 (3, 1) , (3, 2) , (3, 3) , (3, 4) , (3, 5) , (3, 6) , 
 
S5 :
 (4, 1) , (4, 2) , (4, 3) , (4, 4) , (4, 5) , (4, 6) , 

 

 



 (5, 1) , (5, 2) , (5, 3) , (5, 4) , (5, 5) , (5, 6) , 




 (6, 1) , (6, 2) , (6, 3) , (6, 4) , (6, 5) , (6, 6) . 

guata26.03@gmail.com 36 Amaury J. Camargo Benítez


REFERENCIAS REFERENCIAS

Referencias
[1]

[200] Matemà ticas discretas.

[Cir12] Martinez Bencardino Ciro. EstadÃstica y Muestreo. 2012.

[Lea01] Leandra. La yuca y plátanos. 2001.

[Lea03] Leandra. el platano. 2003.

[Wal12] Myers Walpole, Myers. Probabilidad y EstadÃstica para IngenierÃa y Ciencias. 9º Ed.
2012.

guata26.03@gmail.com 37 Amaury J. Camargo Benítez

También podría gustarte