Está en la página 1de 84

Centro de Bachillerato Tecnológico Hábitat

Estadística Apuntes y Cuaderno de Ejercicios

Ing. Jaime Guerrero Acosta

C.B.T. Hábitat. Quinto Semestre


Unidad I
Conceptos Básicos

-2-
ANTECEDENTES

La Estadística, es una ciencia tan antigua como la


misma escritura, los imperios de la antigüedad la
utilizaban para llevar los registros de sus
pertenencias. Los primeros antecedentes que se
conocen son las tablillas de arcilla utilizadas por los
babilonios en el 3000 A. C., más tarde las culturas
posteriores a ellos, realizaban registros de bienes,
soldados, esclavos, etc. Más adelante en la historia
se implementaron los censos de de población.

A mediados del siglo XVII la estadística tomó un papel importante, tuvo un gran desarrollo cuantitativo,
ya que en esa época, los imperios del viejo continente tenían la necesidad de llevar un buen control
administrativo de sus actividades comerciales y bélicas entre otras, donde sus registros y operaciones
consistían en números.

Como toda ciencia la Estadística ha estado en constante evolución a lo largo de la vida del ser humano.
Hasta nuestros días que es parte de la vida cotidiana de forma directa o indirecta. Pero si la Estadística
surgió desde que el hombre tuvo la necesidad de llevar un registro de sus bienes, entonces…

¿Quién es el padre de la estadística moderna?

Actividad

Investiga quien es el padre de la Estadística moderna y que pasó después del siglo XVII con esta
ciencia (hasta llegar a nuestros días), donde y quienes la aplican. Realiza un resumen de 250
palabras como mínimo.

-3-
CONCEPTO DE ESTADISTICA
Describe en una palabra lo que para ti y tus compañeros significa
Estadística.

Con todas esas palabras y con ayuda de tu profesor formen su propio concepto de estadística.

Investiga de tarea tres conceptos más y compáralos con el concepto creado en clase.

En resumen la estadística se puede ver como…

-4-
Clasificación y Campos de la Estadística.
La estadística para su estudio, se divide en dos ramas:

Descriptiva

Estadística

Inferencial

Estadística Descriptiva. Es la que se ocupa de la recolección, clasificación y descripción de un


conjunto de datos.

Los resultados que se obtienen en la Estadística Descriptiva se presentan


por lo general en forma Tabular, en Gráficas o en Medidas estadísticas.

Estadística Inferencial. Se ocupa de interpretar los resultados obtenidos con las técnicas
descriptivas, para tomar decisiones en base a ellos. Aquí es donde entra
la parte de la experiencia del tomador de decisiones.

Aplicaciones de la Estadística
En la actualidad la estadística se ocupa en todas las áreas que imaginemos, de manera formal o
informal se lleva un registro de acciones, dinero, actividades, etc. Por esto, la estadística es una de las
ciencias más utilizadas y la podemos ver en:

§ Mercadotecnia § Economía § Inventarios


§ Política § Ventas § Salud
§ Ámbitos militares § Compras § Etc

-5-
Dato estadístico
Un dato estadístico es la característica medible o descrita mediante un valor o atributo de un elemento
en estudio.

No se debe confundir Dato


con Información, ya que la
información el el conjunto de
datos ordenados, clasificados
y tratados que nos sirven
como referencia para la toma
de decisiones; normalmente
la información viene
presentada en tablas graficas,
esquemas, reportes, etc.

Variables Estadísticas
Para representar los datos estadísticos se usan las variables estadísticas.

Una variable es la representación general de un conjunto de datos que tienen una misma
característica; dicho de otra manera, a una variable se le asigna una valor o atributo de un objeto en
estudio, un elemento de la población puede tener una o muchas variables que se desean manejar.

Las variables se asignan mediante letras y subíndices, las letras representan cada dato del elemento en
estudio y el subíndice representa al numero de elemento que se tiene como referencia.

Un ejemplo del uso de variables:

Tengo a un individuo de un conjunto de personas y


deseamos estudiar diferentes cosas de él, por
ejemplo su edad, peso y genero. Persona

Edad Peso Genero

E P G

Variables

6
Clasificación de las Variables Estadísticas
Para el estudio de un proceso estadístico, las variables se clasifican en:

Cualitativas

Variables Discretas

Cuantitativas

Continuas

Variables Cualitativas Son aquellas que describen cualidades o atributos, es decir no se les
asigna un valor numérico.

Variables Cuantitativas Son las que se representan mediante valores numéricos, existen dos
tipos; las discretas y las continuas

Las variables discretas son las que están Las variables continuas están asociadas a un
asociadas a un proceso de conteo de números o proceso de medición, es decir acepta valores
elementos enteros, es decir no pueden tomar intermedios o decimales. Por ejemplo el peso, la
valores intermedios o decimales. Por ejemplo el estatura, alguna calificación, etc.
numero de hermanos, numero de hijos,
elementos vendidos, etc.

Actividad

1. Selecciona un elemento de estudio (una persona, un auto, una fruta, un libro, etc.)
2. Piensa en 6 atributos, características o valores que deseas conocer o medir de este elemento.
3. De esos atributos o valores debes tener 2 variables cualitativas, 4 variables cuantitativas,
dentro de estas dos discretas y dos continuas.
4. Plantea el diagrama como el mostrado por tu profesor en clase.

7
Población y Muestra
Población
Cuando realizamos un estudio estadístico de algún
fenómeno, dependiendo del número de datos que se
pretenden analizar, resulta en ocasiones imposible o
Muestra incosteable recolectar los datos de todos los elementos
del grupo en estudio; en estos caso es importante
seccionar esa población en grupos mas pequeños que
cumplan con la condición de ser representativos del
grupo general.

Población Es el conjunto formado por el total de los elementos en estudio.

Muestra Es una parte representativa de la población y nos sirve para generalizar el estudio.

Dependiendo de las características de la población se puede clasificar de la siguiente manera:

Finita Esta formada por un número determinado


y conocido de elementos.
Población
Esta formada por un número
Infinita
indeterminado o infinito de elementos.

Selección de la muestra de una población


Hemos mencionado que cuando se desea realizar un estudio estadístico, en ocasiones, resulta
imposible o muy costoso realizarlo en toda la población, para ello necesitamos segmentar en
subconjuntos representativos de dicha población y para ello existen diferentes métodos y no uno
general.

En este texto se presentan sólo algunas formas que existen para seleccionar una muestra, corresponde
al tipo de estudio o a la persona que lo realice su selección.

8
Selección del tamaño de la muestra

Es importante conocer el tamaño de la muestra, para ello


podemos usar formulas que dependen del tamaño de la
población y del error esperado. A continuación se presenta una
de las más usadas.

𝑵
𝒏=
𝟏 + 𝑵𝒆𝟐
Donde:

n Es el tamaño de la muestra
N Es el número de elementos de lea población
e Es el error máximo esperado.

Por ejemplo, si se desea realizar un estudio, para estimar la proporción de familias aficionadas a ver el
futbol por televisión, en una comunidad formada por aproximadamente 3000 familias y se desea tener
un error de ± 5%. El tamaño de la muestra será de:

Datos Fórmula

n= Es el tamaño de la 𝑵
𝒏=
muestra que se obtendrá 𝟏 + 𝑵𝒆𝟐
N= 3000
e= ± 5% , lo que equivale a .05

Desarrollo

𝟑𝟎𝟎𝟎 𝟑𝟎𝟎𝟎 𝟑𝟎𝟎𝟎 𝟑𝟎𝟎𝟎


𝒏= 𝟐
= = = = 𝟑𝟓𝟐. 𝟗𝟒
𝟏 + 𝟑𝟎𝟎𝟎(. 𝟎𝟓) 𝟏 + 𝟑𝟎𝟎𝟎 (𝟎𝟎𝟐𝟓) 𝟏 + 𝟕. 𝟓 𝟖. 𝟓

Es decir, se debe considerar una muestra formada por 353 familias.

9
Ejemplo

Considera una población de 23000 elementos, de que tamaño deberá ser la muestra para que al
realizar un estudio estadístico tenga un 97% de credibilidad.

Datos Fórmula

n= Es el tamaño de la 𝑵
muestra que se obtendrá 𝒏=
𝟏 + 𝑵𝒆𝟐
N= 23000
e= ± 3% , lo que equivale a .03

Desarrollo

𝟐𝟑𝟎𝟎𝟎 𝟐𝟑𝟎𝟎𝟎 𝟐𝟑𝟎𝟎𝟎 𝟐𝟑𝟎𝟎𝟎


𝒏= = = = = 𝟏𝟎𝟗𝟏. 𝟓𝟗
𝟏 + 𝟐𝟑𝟎𝟎𝟎(. 𝟎𝟑)𝟐 𝟏 + 𝟐𝟑𝟎𝟎𝟎 (. 𝟎𝟎𝟎𝟗) 𝟏 + 𝟐𝟎. 𝟎𝟕 𝟐𝟏. 𝟎𝟕

Es decir, se debe considerar una muestra formada por 1092 elementos.

Ejercicios.
Resuelve los siguientes problemas mostrando datos fórmula y desarrollo.

Considera una población de 5000 elementos, de que tamaño deberá ser la muestra si se espera un
error del 7%.

Considera una población de 7525 elementos, de que tamaño deberá ser la muestra para que al realizar
un estudio estadístico tenga un 95% de credibilidad.

Considera una población de 999999 elementos, de que tamaño deberá ser la muestra si se espera un
error del 10% , del 9%, del 7%, del 5%, del 3% del 1% y sin error.

10
Selección de una muestra
mediante números aleatorios
simples

Se lleva a cabo asignando números a


los elementos de la población y
después de conocer el tamaño de la
muestra se realiza un sorteo de los
elementos de la población, en este
criterio todos los elementos tienen la
misma probabilidad de ser elegidos
para formar la muestra.

Selección de una muestra


mediante números aleatorios
sistemáticos

Se lleva a cabo asignando números a los elementos de la población y después de conocer el tamaño de
la muestra se realiza un sorteo de los elementos de la población, agregando algún sistema para el
sorteo.

Selección de una muestra mediante estratos

Consiste en dividir a la población en estratos o subconjuntos con características similares y


posteriormente seleccionar una muestra representativa de cada subconjunto de la población

Existen mas criterios para la selección de una muestra y en la vida cotidiana no sólo se ocupa uno u
otro, normalmente se utilizan dos o tres métodos para garantizar que la muestra sea representativa
de la población y minimizar la manipulación de la misma.

Fuentes de adquisición de datos


Este proceso es empleado para recopilar los datos que serán tratados para convertirlos en información.

Existen diferentes formas para obtener estos datos, las mas utilizadas son:

Observación Encuesta

Experimento Investigación

11
Actividad de cierre de unidad
Observa en tu comunidad o localidad un problema
estadístico que puedas plantear (descríbelo brevemente)

¿Cuales serian tus elementos de estudio? (define la población, sus características y su tamaño)

Calcula el tamaño de la muestra y el tipo de criterio para su selección, considerando que se busca tener
un grado de certeza del 95%

¿Qué variable o variables tomarás en cuenta para tu estudio y de que tipo serán?

Concluye escribiendo un resumen del tipo de información que podrías obtener con este estudio y para
que podría servir o donde se podría utilizar.

12
Unidad II Representación de Datos

• Representación tabular de datos Estadísticos


§ Datos NO agrupados
§ Datos agrupados
• Tabla de frecuencias
§ Frecuencia
§ Intervalos de clase
§ Marca de clase
• Distribución de Frecuencias
§ Frecuencia acumulada
§ Frecuencia Relativa
§ Frecuencia relativa acumulada
• Representación gráfica de una distribución
§ Gráfica de barras
§ Histograma de frecuencias
§ Polígono de frecuencias
§ Circulográma

13
Representación de
datos
Al efectuar un estudio estadístico los
datos por lo general no vienen ordenados
ni agrupados, por este motivo, la primera
parte del estudio consiste en ordenar y
clasificar los datos para su tratamiento.

Representación tabular de datos


estadísticos
El método mas utilizado para ordenar y clasificar los datos es la tabla de frecuencias simple que consiste
en un concentrado que por medio de intervalos organiza y clasifica los datos. Para ello es importante
saber que es la tabulación y la diferencia entre datos agrupados y no agrupados.

Datos agrupados Son el conjunto de datos que se han organizado en varias clase o intervalos

Datos NO agrupados Son los Datos brutos, no organizados y obtenidos en la recopilación.

Tabulación Proceso de conteo de datos que, mediante el uso de líneas, se utiliza para
comenzar el proceso de ordenación y clasificación de Datos.

Tabla de Frecuencias
Para agrupar u organizar un conjunto de datos se construye una tabla llamada tabla de frecuencias o
distribución de frecuencias simples.

El primer paso para organizar los datos consiste en identificar el tipo de datos que se tienen, los cuales
pueden ser cualitativos o cuantitativos.

Cuando los datos corresponden a valores cualitativos, se clasifican en varias clases o intervalos, que
corresponden a las cualidades, valores o atributos obtenidos en cada elemento, después se efectúa
una tabulación, es decir, se realiza un conteo de los elementos que pertenecen a cada clase o
categoría.

14
Frecuencia
Una vez terminada la tabulación, se cuentan los elementos que contiene cada clase o bueno intervalo
y se anota el valor en otra columna que se denomina Frecuencia.

La frecuencia es el número de elementos que contiene cada clase o intervalo en un conjunto de datos.

Ejemplo

Construir una tabla de frecuencias simple con los siguientes datos que corresponden al color de
automóviles que se encuentran en el estacionamiento de una escuela.

Verde Azul Verde Rojo Gris Café Gris Rojo Negro Negro Azul Azul
Rojo Verde Blanco Blanco Verde Beige Azul Gris Verde Negro Verde Verde
Blanco Rojo Vino Azul Verde Vino Café Verde Naranja Rojo Rojo Rojo
Beige Azul Azul Blanco Negro Negro Azul Negro Blanco Rojo Blanco
Beige Azul Gris Naranja Gris Beige Blanco Beige Azul Gris Rojo
Blanco Naranja Negro Rojo Rojo Verde Azul Café Verde Rojo Rojo
Café Gris Beige Café Gris Negro Naranja Negro Café negro Blanco

Con cada uno de COLOR A continuación se COLOR TABULACION


estos atributos, se Verde realiza la tabulación, Verde IIIII IIIII I
construye una clase, Azul asignando cada uno de Azul IIIII IIIII I
colocándolos en una Rojo los colores a su clase Rojo IIIII IIIII III
columna con el Gris correspondiente. Gris IIIII III
nombre color Café Café IIIII I
Negro Negro IIIII IIIII
Blanco Blanco IIIII IIII
Beige Beige IIIII I
Vino Vino II
Naranja Naranja IIII

Se obtiene la frecuencia de cada clase, contando los elementos que contiene cada una de ellas, lo cual
se muestra en la siguiente tabla de frecuencias simple.

COLOR TABULACION FRECUENCIA


Verde IIIII IIIII I 11
Azul IIIII IIIII I 11
Rojo IIIII IIIII III 13
Gris IIIII III 8
Café IIIII I 6
Negro IIIII IIIII 10
Blanco IIIII IIII 9
Beige IIIII I 6
Vino II 2
Naranja IIII 4
15
Intervalos de Clase
Cuando los datos que se tiene corresponden a valores
cuantitativos se deben agrupar de la misma forma en varias
clases o grupos, llamados intervalos, también llamados
intervalos de clase, se tabula y se obtiene la frecuencia de
cada intervalo.

Cada intervalo contiene todos los elementos comprendidos


entre sus extremos, incluyendo los mismos extremos. A los
extremos del intervalo se les llama límites de clase o
simplemente límites del intervalo.

Cada intervalo tiene dos límites de clase llamados límite


inferior y límite superior, los cuales corresponden al extremo
inicial y final de cada intervalo respectivamente.

Pasos para construir una tabla de frecuencias


1. Calcular el rango

𝐑𝐚𝐧𝐠𝐨 = 𝐃𝐚𝐭𝐨 𝐦𝐚𝐲𝐨𝐫 − 𝐃𝐚𝐭𝐨 𝐦𝐞𝐧𝐨𝐫

2. Obtener la variación

3. Si nos dan el número de intervalos, se obtiene el tamaño del intervalo

𝐑𝐚𝐧𝐠𝐨 + 𝐯𝐚𝐫𝐢𝐚𝐜𝐢ó𝐧
𝐓𝐚𝐦𝐚ñ𝐨 𝐝𝐞𝐥 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨 =
𝐍ú𝐦𝐞𝐫𝐨 𝐝𝐞 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨𝐬
4. Si nos dan el tamaño del intervalo, Se obtiene el número de intervalos que tendrá la tabla

𝐑𝐚𝐧𝐠𝐨 + 𝐯𝐚𝐫𝐢𝐚𝐜𝐢ó𝐧
𝐍ú𝐦𝐞𝐫𝐨 𝐝𝐞 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨𝐬 =
𝐓𝐚𝐦𝐚ñ𝐨 𝐝𝐞𝐥 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨

5. Se construyen los intervalos con su respectivo tamaño

6. Se lleva acabo el conteo de los datos, este proceso es conocido como tabulación

7. Por último, se obtiene la frecuencia de cada intervalo

16
Ejemplo

Para el siguiente conjunto de datos, construye la tabla de frecuencias, considerando 10 intervalos

65 39 32 92 76 54 87 43 54 23 56 34
45 78 65 23 65 34 56 87 54 68 87 56
42 48 54 87 65 51 40 46 65 60 28 55
50 30 75 75 72 35 52 50 40 53 40 30
45 60 40 92 91 41 75 38 42 56 38 54
45 52 65 47 50 50 50 48 51 60 61 58
40 60 46 70 30 60 23 85 85 84 53 80
52 48 75 86 85 82 45 57 65 53 26 58
65 70 60 70 30 25 75 65 60 66 63 60
60 92 38 45 60 78 73 57 70 55 53 60

Paso 1. Calcular el rango

Para calcular el rango se deben buscar el dato mayor y el dato menor en el conjunto y sustituir en la
siguiente fórmula.
𝐑𝐚𝐧𝐠𝐨 = 𝐃𝐚𝐭𝐨 𝐦𝐚𝐲𝐨𝐫 − 𝐃𝐚𝐭𝐨 𝐦𝐞𝐧𝐨𝐫

Paso 2. Obtener la variación

Para obtener la variación debemos buscar dentro del conjunto de datos una secuencia de números,
por ejemplo 89 – 90, 4 – 5 o dos datos que tengan una secuencia de separación entre ellos.

Paso 3 o 4. ¿Número de intervalos? o ¿Tamaño del intervalo?

En este ejemplo nos dan el número de intervalos por lo tanto nos vamos al paso
número 3

𝐑𝐚𝐧𝐠𝐨 + 𝐯𝐚𝐫𝐢𝐚𝐜𝐢ó𝐧
𝐓𝐚𝐦𝐚ñ𝐨 𝐝𝐞𝐥 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨 =
𝐍ú𝐦𝐞𝐫𝐨 𝐝𝐞 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨𝐬

Por lo tanto concluimos que el número de intervalos que tendrá la


tabla (renglones) será de 10 y el tamaño de estos intervalos
será de

17
Paso 5, 6 y 7.

Se procede a construir los intervalos, normalmente se comienza por el dato menor y se cuenta
incluyendo a este el tamaño del intervalo. Tomar en cuenta la variación para los saltos entre el limite
superior y el limite inferior del siguiente intervalo.

Posteriormente se cuentan los datos que encajan en cada intervalo y se establece la frecuencia de cada
intervalo.

NO. INTERVALO Fi
TABULACIÓN
INTERVALO INFERIOR - SUPERIOR FRECUENCIA
-
-
-
-
-
-
-
-
-
-

Ejemplo

Para el siguiente conjunto de datos, construye la tabla de frecuencias, considerando intervalos de


tamaño 11

5 14 52 86 59 74 71 42 45 43 56 42
47 77 52 56 69 91 14 45 57 78 86 62
4 12 7 9 25 13 81 24 37 45 53 11
8 91 95 86 34 43 45 51 22 27 30 15
14 25 18 35 69 92 85 84 41 52 56 53
14 45 32 38 38 40 57 36 52 53 23 6
94 8 10 60 67 66 65 63 72 51 46 20

Paso 1. Calcular el rango

Para calcular el rango se deben buscar el dato mayor y el dato menor en el conjunto y sustituir en la
siguiente fórmula.
𝐑𝐚𝐧𝐠𝐨 = 𝐃𝐚𝐭𝐨 𝐦𝐚𝐲𝐨𝐫 − 𝐃𝐚𝐭𝐨 𝐦𝐞𝐧𝐨𝐫

18
Paso 2. Obtener la variación

Para obtener la variación debemos buscar dentro del conjunto de datos una secuencia de números,
por ejemplo 89 – 90, 4 – 5 o dos datos que tengan una secuencia de separación entre ellos.

Paso 3 o 4. ¿Número de intervalos? o ¿Tamaño del intervalo?

En este ejemplo nos dan el tamaño de los intervalos por lo tanto nos vamos al paso número 4

𝐑𝐚𝐧𝐠𝐨 + 𝐯𝐚𝐫𝐢𝐚𝐜𝐢ó𝐧
𝐍ú𝐦𝐞𝐫𝐨 𝐝𝐞 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨𝐬 =
𝐓𝐚𝐦𝐚ñ𝐨 𝐝𝐞𝐥 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨

Por lo tanto concluimos que el número de intervalos que tendrá la tabla (renglones) será de y el
tamaño de dichos intervalos es de 11 unidades.

Paso 5, 6 y 7.

Se procede a construir los intervalos, normalmente se comienza por el dato menor y se cuenta
incluyendo a este el tamaño del intervalo. Tomar en cuenta la variación para los saltos entre el limite
superior y el limite inferior del siguiente intervalo.

NOTA. En este ejercicio si comenzamos por el dato menor en el primer intervalo existe mucho
desperdicio en el último intervalo por lo que debemos ajustar los intervalos.

Posteriormente se cuentan los datos que encajan en cada intervalo y se establece la frecuencia de cada
intervalo.

NO. INTERVALO Fi
TABULACIÓN
INTERVALO INFERIOR - SUPERIOR FRECUENCIA
-
-
-
-
-
-
-
-
-
-

19
Intervalos reales de clase
Estos intervalos están formados por los limites reales de clase, que son los valores que evitan huecos
entre un intervalo y el siguiente. Sus valores se obtienen como el punto medio del limite superior y el
limite inferior del siguiente intervalo, resultando que el limite real superior de un intervalo sea igual al
limite real inferior del siguiente intervalo.

Cuando exista controversia de donde colocar un valor, se resuelve colocándolo en el primer intervalo
que aparezca el valor en cuestión, por ejemplo, si debo colocar el valor 33.5 en la tabla y esta esta
formada de la siguiente manera.

No. De INTERVALO Fi LIMITE REAL DE CLASE


INTERVALO INFERIOR - SUPERIOR FRECUENCIA INFERIOR - SUPERIOR
Debe colocarse en este
1 12 - 22 10 11.5 - 22.5 intervalo porque es en el
2 23 - 33 7 22.5 - 33.5 primero que aparece el
33.5
3 34 - 44 12 33.5 - 44.5

Ejemplo

Obtener los limites reales de clase de siguiente tabla.

NO. INTERVALO Fi INTERVALO REAL DE CLASE


INTERVALO INFERIOR - SUPERIOR FRECUENCIA INFERIOR - SUPERIOR

1 23 - 29 6
2 30 - 36 8
3 37 - 43 13
4 44 - 50 16
5 51 - 57 22
6 58 - 64 15
7 65 - 71 15
8 72 - 78 10
9 79 - 85 6
10 86 - 92 9

Observa que los limites superiores e inferiores


siguientes son los mismos

Se calcularon mediante la siguiente expresión

𝐥𝐢𝐦𝐢𝐭𝐞 𝐬𝐮𝐩𝐞𝐫𝐢𝐨𝐫 + 𝐥𝐢𝐦𝐢𝐭𝐞 𝐢𝐧𝐟𝐞𝐫𝐢𝐨𝐫 𝐬𝐢𝐠𝐮𝐢𝐞𝐧𝐭𝐞


𝟐

20
Ejemplo

Obtener los limites reales de clase de siguiente tabla.

NO. INTERVALO Fi INTERVALO REAL DE CLASE


INTERVALO INFERIOR - SUPERIOR FRECUENCIA INFERIOR - SUPERIOR

1 1 - 11 9
2 12 - 22 10
3 23 - 33 7
4 34 - 44 12
5 45 - 55 16
6 56 - 66 11
7 67 - 77 7
8 78 - 88 7
9 89 - 99 5

Marca de Clase
La marca de clase es el punto medio de cada intervalo, se representa por Mi y se obtiene con la
expresión:

𝐥𝐢𝐦𝐢𝐭𝐞 𝐬𝐮𝐩𝐞𝐫𝐢𝐨𝐫 + 𝐥𝐢𝐦𝐢𝐭𝐞 𝐢𝐧𝐟𝐞𝐫𝐢𝐨𝐫 𝐬𝐢𝐠𝐮𝐢𝐞𝐧𝐭𝐞


𝐌𝐚𝐫𝐜𝐚 𝐝𝐞 𝐂𝐥𝐚𝐬𝐞 ( 𝐌𝐢 ) =
𝟐

Para calcular la marca de clase, se debe agregar una nueva columna a la tabla de frecuencias simple,
esta nueva columna llevará como encabezado Mi y en ella se colocarán los valores obtenidos una
fórmula anterior para cada intervalo.

21
Ejemplo

Calcular la marca de clase para cada una de las siguientes tablas de frecuencias simples.

NO. INTERVALO Fi Mi
INTERVALO INFERIOR - SUPERIOR FRECUENCIA MARCA DE CLASE

1 23 - 29 6
2 30 - 36 8
3 37 - 43 13
4 44 - 50 16
5 51 - 57 22
6 58 - 64 15
7 65 - 71 15
8 72 - 78 10
9 79 - 85 6
10 86 - 92 9

NO. INTERVALO Fi Mi
INTERVALO INFERIOR - SUPERIOR FRECUENCIA MARCA DE CLASE

1 1 - 11 9
2 12 - 22 10
3 23 - 33 7
4 34 - 44 12
5 45 - 55 16
6 56 - 66 11
7 67 - 77 7
8 78 - 88 7
9 89 - 99 5

22
Ejercicios
Construye la tabla de distribución de frecuencias para cada ejercicio mostrado.

En la siguiente tabla se muestran las lecturas de la presión sanguínea sistólica, efectuada a los adultos
que presentaron un examen físico antes de obtener un empleo. Con intervalos de tamaño 4, determina
la tabla de distribución de frecuencias (intervalos de clase, tabulación opcional, frecuencia, limites
reales de clase y marca de clase).

122 109 117 129 118 132 130 112 106 107 128
125 103 125 104 104 129 126 126 115 118 111
110 124 105 121 105 103 128 125 127 114 119
112 111 123 110 123 107 101 130 127 126 104
120 113 112 122 115 127 127 108 109 121 129
128 103 121 114 109 121 122 123 130 127 125
110 102 112 115 120 114 129 105 121 121 114

NO. INTERVALO Fi Mi
TABULACION
INTERVALO INFERIOR - SUPERIOR FRECUENCIA MARCA DE CLASE

-
-
-
-
-
-
-
-
-

23
Los siguientes datos corresponden a las calificaciones obtenidas por alumnos en su examen de
admisión a la facultad de economía.

60 75 92 73 98 65 55 78 45 85 70
79 67 62 54 69 65 87 48 92 73 83
59 55 83 88 72 94 75 73 68 60 77
84 62 56 81 83 72 86 75 68 89 95

Construya la tabla de frecuencias con 9 intervalos (renglones), mediante los limites de clase y responda
las preguntas indicadas. (intervalos de clase, tabulación opcional, frecuencia, limites reales de clase y
marca de clase).

NO. INTERVALO Fi Mi
TABULACION
INTERVALO INFERIOR - SUPERIOR FRECUENCIA MARCA DE CLASE

-
-
-
-
-
-
-
-
-

24
Distribución de Frecuencias
No sólo se presentan las distribuciones simples en las tablas, existen algunas otras que se ocupan en
los estudios estadísticos, entre las mas comunes o utilizadas tenemos:

• Frecuencia Acumulada
• Frecuencia Relativa
• Frecuencia Relativa Acumulada

Frecuencia Acumulada (Fa)


Se obtiene sumando la frecuencia del NO. INTERVALO Fi Fa
intervalo que se esta trabajando con las
INTERVALO INFERIOR - SUPERIOR FRECUENCIA FRECUENCIA
frecuencias de los intervalos anteriores. La ACUMULADA
frecuencia acumulada del último intervalo 1 1000 - 2000 6 6
corresponde al número total de elementos. 2 2000 - 3000 15 21
3 3000 - 4000 29 50
Si se desea obtener la frecuencia de todos
4 4000 - 5000 21 71
los intervalos, se debe sumar la frecuencia
5 5000 - 6000 22 93
de cada intervalo con la frecuencia de su
intervalo anterior, pasando la frecuencia del 6 6000 - 7000 12 105
primer intervalo. 7 7000 - 8000 10 115

Frecuencia Relativa (Fr)


NO. INTERVALO Fi Fa Fr Es la proporción de datos
INTERVALO INFERIOR - SUPERIOR FRECUENCIA FRECUENCIA FRECUENCIA de cada intervalo (el
ACUMULADA RELATIVA
6 / 115 = 0.0521
porcentaje que representa
1 1000 - 2000 6 6
cada intervalo con
2 2000 - 3000 15 21 15 / 115 = 0.1304
respecto al total), se
3 3000 - 4000 29 50 29 / 115 = 0.2521 obtiene dividiendo la
4 4000 - 5000 21 71 21 / 115 = 0.1826 frecuencia de cada
5 5000 - 6000 22 93 22 / 115 = 0.1913 intervalo entre el número
6 6000 - 7000 12 105 12 / 115 = 0.1043 total de datos.
7 7000 - 8000 10 115 10 / 115 = 0.0869 La suma de todas las
SUMAS 115 1
Frecuencias Relativas es
igual a uno.

25
Frecuencia Relativa Acumulada (Fra)
Se obtiene de la misma manera que la Frecuencia Acumulada (Fa) pero ahora tomamos la columna de
la Frecuencia Relativa (Fr) para ir acumulándola en cada intervalo.

NO. INTERVALO Fi Fa Fr Fra


INTERVALO INFERIOR - SUPERIOR FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA RELATIVA
ACUMULADA RELATIVA ACUMULADA
1 1000 - 2000 6 6 0.0521 0.0521
2 2000 - 3000 15 21 0.1304 0.1835
3 3000 - 4000 29 50 0.2521 0.4356
4 4000 - 5000 21 71 0.1826 0.6182
5 5000 - 6000 22 93 0.1913 0.8095
6 6000 - 7000 12 105 0.1043 0.9138
7 7000 - 8000 10 115 0.0869 1
SUMAS 115 1

Ejercicios

Construye la tabla de distribución de frecuencias, obtén la Mi, Fa, Fr y Fra.

NO. INTERVALO Fi Mi Fa Fr Fra


INTERVALO INFERIOR - SUPERIOR FRECUENCIA MARCA DE FRECUENCIA FRECUENCIA FRECUENCIA RELATIVA
CLASE ACUMULADA RELATIVA ACUMULADA
1 10 - 17 14
2 18 - 25 42
3 26 - 33 65
4 34 - 41 39
5 42 - 49 27
6 50 - 57 18
7 58 - 65 15
SUMAS

26
Construye la tabla de distribución de frecuencias, obtén la Mi, Fa, Fr y Fra.

NO. INTERVALO Fi Mi Fa Fr Fra


INTERVALO INFERIOR - SUPERIOR FRECUENCIA MARCA DE FRECUENCIA FRECUENCIA FRECUENCIA RELATIVA
CLASE ACUMULADA RELATIVA ACUMULADA
1 100 - 150 7
2 150 - 200 22
3 200 - 250 17
4 250 - 300 41
5 300 - 350 25
6 350 - 400 33
7 400 - 450 16
8 450 - 500 22
9 500 - 550 17
SUMAS

Construye la tabla de distribución de frecuencias, obtén la Mi, Fa, Fr y Fra.

NO. INTERVALO Fi Mi Fa Fr Fra


INTERVALO INFERIOR - SUPERIOR FRECUENCIA MARCA DE FRECUENCIA FRECUENCIA FRECUENCIA RELATIVA
CLASE ACUMULADA RELATIVA ACUMULADA
1 0 - 4 3
2 5 - 9 6
3 10 - 14 11
4 15 - 19 22
5 20 - 24 25
6 25 - 29 33
7 30 - 34 26
8 35 - 39 20
9 40 44 16
10 45 - 49 9
SUMAS

27
Representación Gráfica de una distribución
Una vez que los datos obtenidos en un estudio estadístico se han agrupado, se pueden obtener algunas
conclusiones directamente de la tabla de distribución de frecuencias, representándolas mediante
gráficas, tomando en cuenta que estas, muestran el comportamiento de los datos.

Existen varias formas de representar las distribuciones de frecuencias, en este curso solo se abarcarán
algunas de las siguientes:

• Histograma de frecuencias
• Polígono de frecuencias
• Gráfica de barras
• Gráfica de líneas
• Curvas
• Cartograma
• Pictograma
• Circulograma
• Ojivas
• Etc.

Gráfica de barras

Consiste en una serie de rectángulos cuyas bases se encuentran sobre un eje horizontal, que
corresponden a cada uno de los intervalos de la tabla de distribución de frecuencias y su altura está
marcada en un eje vertical y corresponde a la frecuencia de cada intervalo.

Para construir una gráfica de barras se llevan acabo los siguientes pasos:
NO. INTERVALO Fi
Considera como ejemplo la siguiente tabla de
INTERVALO INFERIOR - SUPERIOR FRECUENCIA
frecuencias.
1 1 - 5 15
2 6 - 10 12
3 11 - 15 13
4 16 - 20 8
5 21 - 25 11
6 26 - 30 7
7 31 - 35 6
8 36 - 40 10

28
En el primer cuadrante del plano cartesiano se coloca la escala de medición para el intervalo y la
frecuencia.

Gráfica de Barras
16
14
12
FRECUENCIA 10
8
6
4
2
0
1 2 3 4 5 6 7 8

FRECUENCIA
INTERVALO

Se traza un rectángulo vertical para cada uno de los intervalos con su respectiva frecuencia.

Gráfica de Barras
16

14

12

10

0
1 2 3 4 5 6 7 8

INTERVALO

29
Histograma de Frecuencias
Se emplea para representar mediante una gráfica similar a la de barras, una distribución de
frecuencias. La diferencia que tiene con la gráfica de barras, es que en el histograma se localizan los
limites reales de clase en el eje horizontal.

Para construir un histograma de frecuencias se llevan acabo los siguientes pasos:

Considera como ejemplo la siguiente tabla de frecuencias. Se deben obtener los intervalos reales de
clase.
NO. INTERVALO Fi INTERVALO REAL DE
CLASE
INTERVALO INFERIOR - SUPERIOR FRECUENCIA INFERIOR - SUPERIOR

1 1 - 5 15 .5 - 5.5
2 6 - 10 12 5.5 - 10.5
3 11 - 15 13 10.5 - 15.5
4 16 - 20 8 15.5 - 20.5
5 21 - 25 11 20.5 - 25.5
6 26 - 30 7 25.5 - 30.5
7 31 - 35 6 30.5 - 35.5
8 36 - 40 10 35.5 - 40.5

En el primer cuadrante del plano cartesiano se coloca la escala de medición para los intervalos reales
de clase y la frecuencia.

Gráfica de Barras
16
14
12
FRECUENCIA 10
8
6
4
2
0
1 2 3 4 5 6 7 8
.5 5.5 10.5 15.5 20.5
25.5 30.5 35.5 40.5
INTERVALOFRECUENCIA
REAL DE CLASE

30
Se traza un rectángulo vertical para cada uno de los intervalos con su respectiva frecuencia.

Gráfica de Barras
16
14
12
10
8
6
4
2
0
1 2 3 4 5 6 7 8
.5 5.5 10.5 15.5 20.5 25.5 30.5 35.5 40.5
FRECUENCIA
INTERVALO REAL DE CLASE

Polígono de Frecuencias
Es una gráfica de líneas que generalmente se traza sobre el histograma de frecuencias, representa la
distribución de un conjunto de datos construida sobre sus marcas de clase.

Para construir un polígono de frecuencias se llevan acabo los siguientes pasos:

Considera como ejemplo la siguiente tabla de frecuencias.

Se debe construir el Histograma de frecuencias, para lo cual se obtienen los intervalos reales de clase.

NO. INTERVALO Fi INTERVALO REAL DE


CLASE
INTERVALO INFERIOR - SUPERIOR FRECUENCIA INFERIOR - SUPERIOR

1 1 - 5 15 .5 - 5.5
2 6 - 10 12 5.5 - 10.5
3 11 - 15 13 10.5 - 15.5
4 16 - 20 8 15.5 - 20.5
5 21 - 25 11 20.5 - 25.5
6 26 - 30 7 25.5 - 30.5
7 31 - 35 6 30.5 - 35.5
8 36 - 40 10 35.5 - 40.5

31
Una vez construido el Histograma se ubica la marca de clase, que es el punto medio de cada intervalo.
Y se trazan rectas que unan esas marcas de clase. Este conjunto de rectas conforman el polígono de
frecuencias.

Gráfica de Barras
16
14
12
10
8
6
4
2
0
1 2 3 4 5 6 7 8
.5 5.5 10.5 15.5 20.5 25.5 30.5 35.5 40.5
FRECUENCIA

Circulograma
También es llamada gráfica circular o de pastel, es una gráfica que consiste en dividir un circulo en
proporciones dadas por los intervalos.

Para construir un circulagrama, se determina el porcentaje que representa cada intervalo (Fr) y se
obtiene la equivalencia en grados del sector circular equivalente a cada intervalo, mediante la siguiente
expresión:
𝑮𝒓𝒂𝒅𝒐𝒔 = 𝑭𝒓 𝒙 𝟑𝟔𝟎

Se agregan las columnas a la tabla para realizar el procedimiento explicado en el párrafo anterior, como
se muestra en el siguiente ejemplo.

Ejemplo NO. INTERVALO Fi


INTERVALO INFERIOR - SUPERIOR FRECUENCIA
Considera la siguiente distribución de Frecuencias 1 1 - 5 15
para realizar el circulograma correspondiente.
2 6 - 10 12
3 11 - 15 13
Se agregan las columnas ( PORCENTAJE DEL 4 16 - 20 8
INTERVALO) y (GRADOS DEL SECTOR CIRCULAR) 5 21 - 25 11
respectivamente y se realizan los cálculos 6 26 - 30 7
correspondientes para obtener los valores de cada 7 31 - 35 6
intervalo. 8 36 - 40 10

32
NO. INTERVALO Fi Fr PROCENTAJE GRADOS

INTERVALO INFERIOR - SUPERIOR FRECUENCIA RECUENCIA DEL SECTOR DEL SECTOR


RELATIVA CIRCULAR CIRCULAR
1 1 - 5 15 0.1829 18.29 % 65.8537
2 6 - 10 12 0.1463 14.63 % 52.6829
3 11 - 15 13 0.1585 15.85 % 57.0732
4 16 - 20 8 0.0975 9.76 % 35.1220
5 21 - 25 11 0.1341 13.41 % 48.2927
6 26 - 30 7 0.0853 8.54 % 30.7317
7 31 - 35 6 0.0731 7.32 % 26.3415
8 36 - 40 10 0.1219 12.20 % 43.9024
SUMAS 82 100 % 360

Se procede a medir los grados en el circulo y crear el gráfico correspondiente.

Circulograma

12% 18%
7%
9% 15%
13%
16%
10%

33
Ejercicios

Construye la tabla de distribución de frecuencias, obtén la Mi, Fa, Fr y Fra. Representa los datos
mediante un polígono de frecuencias

NO. INTERVALO INTERVALO REAL DE


CLASE
FI Mi Fa Fr Fra
INT INF - SUP INF - SUP

1 10 - 17 14 -
2 18 - 25 42 -
3 26 - 33 65 -
4 34 - 41 39 -
5 42 - 49 27 -
6 50 - 57 18 -
7 58 - 65 15 -
SUMAS

34
Construye la tabla de distribución de frecuencias, obtén la Mi, Fa, Fr y Fra. Representa los datos
mediante un circulograma.

NO. INTERVALO GRADOS


PORCENTAJE
DEL
INT INF SUP
Fi Mi Fa Fr Fra DEL SECTOR
SECTOR
- CIRCULAR
CIRCULAR
1 100 - 150 7
2 150 - 200 22
3 200 - 250 17
4 250 - 300 41
5 300 - 350 25
6 350 - 400 33
7 400 - 450 16
8 450 - 500 22
9 500 - 550 17
SUMAS

35
Actividad de cierre de unidad
En la siguiente tabla se muestran 66
valores de la resistencia a la ruptura
bajo cargas de tensión (en lb / in2) de
cilindros de concreto (con diámetro de
15.24 cm y longitud de 30.48 cm).
Obtén la distribución de frecuencias
simple (intervalos de clase, tabulación
opcional, frecuencia, limites reales de
clase, marca de clase, frecuencia
acumulada, frecuencia relativa y frecuencia relativa acumulada). Considera intervalos de tamaño 6.

438 422 416 440 408 410 435 448 453 451 413
443 426 449 428 422 434 400 457 415 440 425
418 403 426 437 439 436 449 435 446 436 447
433 410 448 459 411 437 418 414 419 437 428
438 431 420 402 431 442 423 434 419 451 420
441 447 452 430 445 433 426 441 443 407 419

No. INTERVALO INTERVALO REAL DE


CLASE TABULACION Fi MI Fa Fr Fra
INT INF - SUP INF - SUP

36
Construye la tabla de distribución de frecuencias, obtén la Mi, Fa, Fr y Fra. Construye la Gráfica de
barra, el polígono de frecuencias y el circulograma.

No. INTERVALO INTERVALO REAL DE


CLASE Fi Mi Fa Fr Fra % GRADOS
INT INF - SUP INF - SUP
1 100 - 108 34
2 109 - 117 45
3 118 - 126 78
4 127 - 135 112
5 136 - 144 89
6 145 - 153 63
7 154 - 162 29
SUMAS

37
Unidad III Medidas de Tendencia Central

• Medidas de Tendencia central


§ Media
§ Moda
§ Mediana

38
Medidas de tendencia central
Como hemos visto hasta el momento, en una
distribución de frecuencias, se muestra información
del conjunto de datos que se esta estudiando.

Hasta este punto solo hemos organizado los datos y


mostrado las gráficas que generan los mismos;
también debemos saber que no podemos tener
alguna conclusión o valor que sea representativo de
los datos, o bien, que al compararlos con algunos
otros estudios similares, no se puedan establecer
semejanzas o diferencias precisas, por lo que es
necesario tener una medida aritmética, cuyo valor
represente algo, estadísticamente hablando.

Para el estudio de las medidas estadísticas, es


necesario recurrir y dominar perfectamente algunas
operaciones aritméticas. La operación aritmética
más utilizada en estadística es la suma.

En estadística las sumas se representan mediante la letra griega sigma ( Σ ), la cual se utiliza para
representar la suma de columnas o de un conjunto de datos.

Las Medidas de tendencia central, también llamadas medidas de centralización, indican mediante un
valor o atributo la localización central de la distribución de frecuencias.

Debido a que se pueden dar varias interpretaciones de lo que significa valor central de una distribución,
se estudian tres medidas de tendencia central que son la media, la moda y la mediana. Cabe aclarar
que estas medidas de posición, no son las únicas que existen.

Las medidas de tendencia central se pueden estudiar para datos agrupados y no agrupados.

Recordando lo visto en la unidad anterior.

Datos agrupados Son el conjunto de datos que se han organizado en varias clase o intervalos,
las tablas de distribución de frecuencia son un ejemplo de ellos.

Datos NO agrupados Son los Datos brutos, no organizados y obtenidos en la recopilación, los
datos que contamos antes de crear las tablas son un ejemplo de ellos.

39
Media Aritmética
Es llamada también media o promedio, es una de las medidas más
utilizadas dentro de las estadística y se denota por

Media para datos no agrupados


Si tenemos n datos no agrupados X1, X2, X3, …, Xn, la media aritmética se
define como la suma de todos los datos dividida entre el numero total
de los datos dados, esto es:

𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ + 𝒙𝒏
=
𝒏
Ejemplo

Juan pescó 4 peces con longitudes de 20, 23, 36 y 19 cm ¿Cuál es la longitud media de los peces?

Como se observa el conjunto de datos esta formado por 4 elementos, por lo que la media resulta:

𝟐𝟎 + 𝟐𝟑 + 𝟑𝟔 + 𝟏𝟗 𝟗𝟖
= = = 𝟐𝟒. 𝟓 𝒄𝒎
𝟒 𝟒
Lo que representa que el promedio de la longitud de los peces que capturó es de 24.5 cm

Ejercicios

Lucero una alumna de quinto semestre obtuvo las siguientes calificaciones en el semestre anterior:

MATERIA CALIFICACION
Cálculo Diferencial 6.0
Química II 7.3
inglés 8.5
Derecho 9.2
Economía 7.8
Biología 9.0
Creatividad 10.0

¿Cuál fue el promedio de Lucero?


40
Obtener el valor de la media para el siguiente conjunto de datos.

4 13 28 15 23 12 6 7 14 25 31 6 8 34

Media para datos agrupados


Cuando se tiene un conjunto agrupado de n datos, la media
se puede aproximar mediante la siguiente expresión:

𝒇𝒊 𝑴𝒊
=
𝒏

Donde:

Es el valor de la media

fi Es la frecuencia del i-ésimo intervalo

Mi Es la marca de clase del i-ésimo intervalo

n Es el número total de datos

∑ Suma de toda la columna

Se dice que el valor de la media aplicando esta expresión es aproximado debido a que se considera
que el valor de todos los datos de un intervalo es igual a la marca de clase y esto casi nunca se
cumple.

41
Ejemplo

Determinar el valor de la media para el siguiente conjunto de datos.

INTERVALO Fi
0 – 10 5
10 – 20 12
20 – 30 21
30 – 40 27
40 – 50 31
50 – 60 35
60 – 70 21
70 – 80 14
80 – 90 9
90 – 100 5

El valor de la media se obtiene con la fórmula

𝒇𝒊 𝑴𝒊
=
𝒏
por lo que es necesario agregar una nueva columna a nuestra tabla con el encabezado Mi ( Marca de
Clase)

INTERVALO Fi Mi
0 – 10 5 5
10 – 20 12 15
20 – 30 21 25
30 – 40 27 35
40 – 50 31 45
50 – 60 35 55
60 – 70 21 65
70 – 80 14 75
80 – 90 9 85
90 – 100 5 95
SUMAS 180

42
El siguiente paso consiste en agregar una nueva columna con encabezado Fi Mi ( la cual consiste en
multiplicar la frecuencia de cada intervalo por la Marca de clase del mismo intervalo o renglón)

INTERVALO Fi Mi Fi MI
0 – 10 5 5 25
10 – 20 12 15 180
20 – 30 21 25 525
30 – 40 27 35 945
40 – 50 31 45 1395
50 – 60 35 55 1925
60 – 70 21 65 1365
70 – 80 14 75 1050
80 – 90 9 85 765
90 – 100 5 95 475
SUMAS 180 8650

Se procede a realizar la sima de la columna Fi Mi la cual da como resultado 8650

Se sustituyen los valores en la formula

𝒇𝒊 𝑴𝒊
=
𝒏
𝟖𝟔𝟓𝟎
=
𝟏𝟖𝟎

= 48.05
Ejercicios

Determinar el valor de la media para el siguiente conjunto de datos.

INTERVALO Fi Mi Fi MI
40 – 42 5
42 – 44 12
44 – 46 21
46 – 48 27
48 – 50 31
50 – 52 35
52 – 54 21
54 – 56 14
SUMAS

43
Determinar el valor de la media para el siguiente conjunto de datos.

INTERVALO Fi Mi Fi MI
100 – 110 4
110 – 120 7
120 – 130 11
130 – 140 17
140 – 150 25
150 – 160 33
160 – 170 30
170 – 180 21
180 – 190 16
190 – 200 7
SUMAS

44
Moda
Es el valor que aparece con mayor frecuencia en un conjunto de datos. Se

representa por el símbolo 𝑥

Moda para datos no agrupados


Si tenemos n datos no agrupados X1, X2, X3, …, Xn, y se desea obtener la moda,
basta con buscar el dato que aparece más veces y ese valor corresponde a la moda del conjunto.

Ejemplos

Obtener la moda del siguiente conjunto de datos

4 3 7 2 5 6 3 2 5 7 3 6 4 3
El número que más veces se repite es el 3, por lo cual la moda es 3.

Obtener la moda del siguiente conjunto de datos

10 15 13 14 10 8 13 10 21 13 7 6 1 0 3
Este caso se repite con la misma frecuencia el 10 y el 13, por lo tanto se dice que el conjunto es bimodal.

Obtener la moda del siguiente conjunto de datos

0.5 0.2 0.7 0.9 0.1 0.6 0.8 0.3 0.4


Este caso no se repite ningún valor, por lo tanto se dice que el conjunto es amodal.

45
Moda para datos agrupados
Si el conjunto de datos se presenta en forma agrupada, mediante una
distribución o tabla de frecuencias, una forma de aproximar el valor
de la moda es utilizando la siguiente fórmula.

∆𝟏
=𝑳+ 𝒄
∆𝟏 + ∆𝟐

Donde:

Es el valor de la moda

L Es el limite inferior del intervalo que contiene la moda

∆1 Es el resultado de la restar la frecuencia del intervalo que contiene a la moda menos el


intervalo anterior

∆2 Es el resultado de restar la frecuencia del intervalo que contiene a la moda menos el


intervalo siguiente

c Tamaño del intervalo

En este caso se considera que el valor de la moda se encuentran el intervalo con mayor frecuencia, ya
que al ser el intervalo que contiene más datos, existe una mayor probabilidad de que aquí se repitan
más valores.

46
Ejemplo

Obtener la moda del siguiente conjunto de datos.

No. de INTERVALO Fi
Intervalo
1 0 – 10 12
2 10 – 20 37
3 20 – 30 72
4 30 – 40 47
5 40 – 50 65
6 50 – 60 55
7 60 – 70 96
8 70 – 80 80
9 80 – 90 54
10 90 – 100 41

Para comenzar el proceso, se debe de ubicar el intervalo con mayor frecuencia; en este caso la moda
se encuentra en el intervalo número 7, puesto que en éste se encuentra la frecuencia más alta que es
96.

Para obtener la moda se buscan los valores.

L = 60
∆1 = ( 96 – 55 ) = 41
∆2 = ( 96 – 80 ) = 16
c = 10

Se sustituyen esos valores en la formula dada

cd
= 60 + 10
cdedf

= 60 + 0.7192 10

= 60 + 7.1929

= 67.1929

Por lo tanto el valor de la moda es 67.1929

47
Ejercicios

Determinar el valor de la moda para el siguiente conjunto de datos.

No. de INTERVALO Fi
Intervalo
1 40 – 42 5
2 42 – 44 12
3 44 – 46 21
4 46 – 48 27
5 48 – 50 31
6 50 – 52 35
7 52 – 54 21
8 54 – 56 14

Determinar el valor de la moda para el siguiente conjunto de datos.

No. de INTERVALO FI
Intervalo
1 10 – 19 13
2 20 – 29 43
3 30 – 39 28
4 40 – 49 24
5 50 – 59 12
6 60 – 69 6
7 70 – 79 5
8 80 – 89 2

48
Mediana
Es el valor central de los datos agrupados en forma ascendente o

descendente. Se representa por el símbolo 𝑥


Mediana para datos no agrupados
Si tenemos n datos no agrupados X1, X2, X3, …, Xn, y se desea obtener la
mediana, basta con ordenarlos y buscar el dato central, bajo los siguientes
parámetros.

Si el número de datos es impar, la Si el número de datos es par, la


mediana es igual al valor que se mediana es igual al promedio de los
encuentra en el centro de la dos datos que se encuentran en el
distribución. centro de la distribución.

Ejemplos

Obtener la mediana del siguiente conjunto de datos

14 23 22 27 17 14 18 17 27 29 23 24 35 18 33

Se tienen 15 datos (número impar de datos), al ordenarlos en forma ascendente quedan de la siguiente
manera.

14 14 17 17 18 18 22 23 23 24 27 27 29 33 35

Como es un número impar de datos y el dato que se encuentra al centro es el 23 se concluye que la
mediana es 23.

Obtener la mediana del siguiente conjunto de datos

150 28 330 42 12 50 63 30 3 60 150 128 201 103 37 85 35 26 43 75 50 78

Se tienen 22 datos (número par de datos), al ordenarlos en forma ascendente quedan de la siguiente
manera.

3 12 26 28 30 35 37 42 43 50 50 60 63 75 78 85 103 128 150 150 201 330

Como es un número par de datos y los datos que se encuentran al centro son 50 y 60 por lo que la
mediana se obtiene de la siguiente manera:
50 + 60 110
= = = 55
2 2
Por lo que se concluye que la media es 55.
49
Mediana para datos agrupados
Si el conjunto de datos se presenta en forma agrupada,
mediante una distribución o tabla de frecuencias, una
forma de aproximar el valor de la mediana es utilizando la
siguiente fórmula.

𝒏
− 𝑭𝒂
=𝑳+ 𝟐 𝒄
𝑭𝒊
Donde:

Es el valor de la mediana

L Es el limite inferior del intervalo que contiene la mediana

𝒏
Es el número total de datos dividido entre dos
𝟐

Fa Es la frecuencia acumulada del intervalo anterior al que contiene la mediana

Fi Es la frecuencia del intervalo que contiene a la mediana

c Tamaño del intervalo

NOTA:

Lo primero que se debe hacer para ubicar el intervalo que contiene a la mediana, es obtener el valor
de n/2. Posteriormente buscar el primer renglón o intervalo donde Fa se pase del valor obtenido (n/2).

50
Ejemplo

Obtener la mediana del siguiente conjunto de datos.

No. de INTERVALO Fi
Intervalo
1 100 – 110 4
2 110 – 120 7
3 120 – 130 11
4 130 – 140 17
5 140 – 150 25
6 150 – 160 33
7 160 – 170 30
8 170 – 180 21
9 180 – 190 16
10 190 – 200 7

Para comenzar el proceso, como lo indica la nota, se debe ubicar el intervalo que contiene a la
mediana, para lo cual se agrega una nueva columna con el encabezado Fa ( frecuencia acumulada).

No. de INTERVALO Fi Fa
Intervalo
1 100 – 110 4 4
2 110 – 120 7 11
3 120 – 130 11 22
4 130 – 140 17 39
5 140 – 150 25 64
6 150 – 160 33 97
7 160 – 170 30 127
8 170 – 180 21 148
9 180 – 190 16 164
10 190 – 200 7 171
SUMAS 171

Se tienen 171 datos en total, por lo tanto n = 171. Precedemos a realizar n/2 para obtener el renglón o
intervalo donde se encuentra la mediana.

𝒏 𝟏𝟕𝟏
= = 𝟖𝟓. 𝟓
𝟐 𝟐

Por lo tanto se debe buscar el primer renglón o intervalo donde Fa pase de 85.5, tomando esto en
cuenta, tenemos que el intervalo que contiene a la mediana es el número 6.

51
Del intervalo 6 se obtienen los siguientes valores

L= 150
𝒏
= 85.5
𝟐
Fa = 64
Fi = 33
c= 10

Sustituyendo estos valores en la fórmula, obtenemos:

𝒏
− 𝑭𝒂
=𝑳+ 𝟐 𝒄
𝑭𝒊

85.5 − 64
= 150 + 10
33

= 150 + 0.6515 10

= 150 + 6.515

= 156.515

Por lo tanto el valor de la mediana es 156.615

52
Ejercicios

Determinar el valor de la mediana para el siguiente conjunto de datos.

No. de INTERVALO Fi Fa
Intervalo
1 40 – 42 5
2 42 – 44 12
3 44 – 46 21
4 46 – 48 27
5 48 – 50 31
6 50 – 52 35
7 52 – 54 21
8 54 – 56 14

Determinar el valor de la mediana para el siguiente conjunto de datos.

No. de INTERVALO Fi Fa
Intervalo
1 10 – 19 13
2 20 – 29 43
3 30 – 39 28
4 40 – 49 24
5 50 – 59 12
6 60 – 69 6
7 70 – 79 5
8 80 – 89 2

53
Actividad de cierre de unidad

Determinar el valor de la media, moda


y mediana para el siguiente conjunto
de datos.

No. de INTERVALO Fi Fa Mi Fi Mi
Intervalo
1 39 – 39 2
2 40 – 49 1
3 50 – 59 7
4 60 – 69 9
5 70 – 79 17
6 80 – 89 19
7 90 – 99 6

Determinar el valor de la media, moda y mediana para el siguiente conjunto de datos.

No. de INTERVALO Fi Fa Mi Fi Mi
Intervalo
1 0–4 5
2 5–9 40
3 10 – 14 80
4 15 – 19 124
5 20 – 24 234
6 25 – 29 82
7 30 – 34 25
8 35 – 39 10

54
Unidad IV Medidas de Dispersión

• Rango
• Desviación Media
• Varianza
• Desviación Estándar o típica
• Coeficiente de Variación
• Medidas de Sesgo

55
Medidas de Dispersión
No basta con tener las medidas de tendencia
central para un conjunto de datos, es necesario
contar con otra medida estadística, la cual indica el
comportamiento adicional para dicho conjunto; ya
que la media, mediana y moda solo indican valores
centrales de la distribución.

Las medidas mencionadas en el párrafo anterior y


que se estudiaran ahora son llamadas medidas de
dispersión o de variación, las cuales indican que tan
alejados se encuentran los datos con respecto a si
mismos o con respecto a la media.

Para comprender la importancia que tienen las


medidas de dispersión, manejaremos el ejemplo de
la fiesta (explicado por el profesor)

Rango
Es la medida de dispersión mas simple y se obtiene como la diferencia del dato mayor menso el dato
menor.
Dato Mayor
Rango =
Menor
Ejemplo

Obtener el rango del siguiente conjunto de datos.

123 125 156 189 187 145 136 124 112 106 109 147
114 145 146 158 196 192 137 158 145 81 109 152
115 147 145 146 136 125 108 136 105 136 158 200

Aplicando la formula tenemos

200
Rango =
105
95 RANGO
Este resultado nos indica que existen 95 datos de separación entre el mayor y el menor de los datos.

56
Desviación Media
Es el promedio de los valores absolutos de las desviaciones de los datos con respecto a la media. Indica
en promedio el número de unidades en que cada dato se encuentra alejado de la media.

Desviación Media para datos no agrupados


Cuando se tiene un conjunto de datos no agrupados, la desviación media se obtiene mediante la
formula.

𝒙𝒊 −
𝑫𝑴 =
𝒏

Donde:

DM Desviación Media

Xi Es el valor de i-ésimo dato

Es la media del conjunto de datos

n Es el número total de datos

Ejemplo

Determina el valor de la desviación media para el siguiente conjunto de datos.

4 14 12 8 12 6 16 8

Determinamos la media.

𝑿𝒊
=
𝒏
= 4 + 14 + 12 + 8 +12 + 6 + 16 + 8
8

= 10

57
la desviación media es:

𝑿𝒊 −
𝑫𝑴 =
𝒏
𝟒 − 𝟏𝟎 + 𝟏𝟒 − 𝟏𝟎 + 𝟏𝟐 − 𝟏𝟎 + 𝟖 − 𝟏𝟎 + 𝟏𝟐 − 𝟏𝟎 + 𝟔 − 𝟏𝟎 + 𝟏𝟔 − 𝟏𝟎 + 𝟖 − 𝟏𝟎
𝑫𝑴 =
𝟖

−𝟔 + 𝟒 + 𝟐 + −𝟐 + 𝟐 + −𝟒 + 𝟔 + −𝟐
𝑫𝑴 =
𝟖

𝟔+ 𝟒+𝟐+𝟐+𝟐+𝟒+𝟔+𝟐
𝑫𝑴 =
𝟖

𝑫𝑴 = 𝟑. 𝟓

Este valor nos indica que en promedio cada dato se encuentra 3.5 unidades alejado de la media.

Desviación Media para datos agrupados


Cuando el conjunto de datos está agrupado en una tabla de distribución de frecuencias, la desviación
media se obtiene mediante la formula.

𝑭𝒊 𝑴 𝑰 −
𝑫𝑴 =
𝒏
Donde:

DM Es la desviación media

Fi Es el valor de la frecuencia del i-ésimo intervalo

Mi Es el valor de la marca de clase del i-ésimo intervalo

Es la media del conjunto de datos

n Es el número total de datos

58
Ejemplo

Obtener la desviación media del siguiente conjunto de datos.

INTERVALO Fi
10 – 20 5
20 – 30 12
30 – 40 22
40 – 50 27
50 – 60 36
60 – 70 30
70 – 80 33
80 – 90 22
90 – 100 13

Para comenzar el proceso, se debe obtener el valor de la media como se realizó en la unidad anterior.

INTERVALO Fi Mi Fi MI
10 – 20 5 15 75
20 – 30 12 25 300
30 – 40 22 35 770
40 – 50 27 45 1215
50 – 60 36 55 1980
60 – 70 30 65 1950
70 – 80 33 75 2475
80 – 90 22 85 1870
90 – 100 13 95 1235
SUMAS 200 11870

El valor de la media es:

11870
=
200

= 59.35

59
Ahora se agregan dos columnas con encabezado Mi - y | Mi - |

INTERVALO Fi Mi Fi MI Mi - |Mi - |
10 – 20 5 15 75 -44.35 44.35
20 – 30 12 25 300 -34.35 34.35
30 – 40 22 35 770 -24.35 24.35
40 – 50 27 45 1215 -14.35 14.35
50 – 60 36 55 1980 -4.35 4.35
60 – 70 30 65 1950 5.65 5.65
70 – 80 33 75 2475 15.65 15.65
80 – 90 22 85 1870 25.65 25.65
90 – 100 13 95 1235 35.65 35.65
SUMAS 200 11870

Por último se agrega una nueva columna con encabezado Fi | Mi - | y se obtiene la suma de dicha
columna.

INTERVALO Fi Mi Fi MI Mi - |Mi - | Fi|Mi - |


10 – 20 5 15 75 -44.35 44.35 221.75
20 – 30 12 25 300 -34.35 34.35 412.2
30 – 40 22 35 770 -24.35 24.35 535.7
40 – 50 27 45 1215 -14.35 14.35 387.45
50 – 60 36 55 1980 -4.35 4.35 156.6
60 – 70 30 65 1950 5.65 5.65 169.5
70 – 80 33 75 2475 15.65 15.65 516.45
80 – 90 22 85 1870 25.65 25.65 564.3
90 – 100 13 95 1235 35.65 35.65 463.45
SUMAS 200 11870 3427.4

Se obtiene el valor de la desviación media.

𝑭𝒊 𝑴 𝑰 −
𝑫𝑴 =
𝒏
𝟑𝟒𝟐𝟕. 𝟒
𝑫𝑴 =
𝟐𝟎𝟎

𝑫𝑴 = 𝟏𝟕. 𝟏𝟑𝟕

60
Ejercicios

Determinar el valor de la desviación media para el siguiente conjunto de datos.

INTERVALO Fi Mi Fi MI Mi - |Mi - | Fi|Mi - |


0–4 5
5–9 40
10 – 14 80
15 – 19 124
20 – 24 234
25 – 29 82
30 – 34 25
35 – 39 10
SUMAS

Determinar el valor de la desviación media para el siguiente conjunto de datos.

INTERVALO Fi Mi Fi MI Mi - |Mi - | Fi|Mi - |


10 – 19 6
20 – 29 14
30 – 39 20
40 – 49 32
50 – 59 24
60 – 69 15
70 – 79 9
SUMAS

61
Varianza
Es el promedio de los cuadrados de las desviaciones de los
datos con respecto a la media. Su valor indica la forma en que
están distribuidos los datos con respecto a la media.

Varianza para datos no agrupados


Cuando se tiene un conjunto de datos no agrupados, la varianza se obtiene mediante la formula.

𝟐
𝟐
𝒙𝒊 −
𝝈 =
𝒏

Donde:

𝝈𝟐 Es la varianza

Xi Es el valor de i-ésimo dato

Es la media del conjunto de datos

n Es el número total de datos

62
Ejemplo

Determina el valor de la varianza para el siguiente conjunto de datos.

12 25 8 15 5 18 26 14 9 10

Determinamos la media.

𝑿𝒊
=
𝒏

= 12 + 25 + 8 +15 + 5 + 18 + 26 + 14 + 9 + 10
10

= 14.2

la varianza es:

𝟐
𝒙𝒊 −
𝝈𝟐 =
𝒏
𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐
𝟏𝟐 − 𝟏𝟒. 𝟐 + 𝟐𝟓 − 𝟏𝟒. 𝟐 + 𝟖 − 𝟏𝟒. 𝟐 + 𝟏𝟓 − 𝟏𝟒. 𝟐 + 𝟓 − 𝟏𝟒. 𝟐 + 𝟏𝟖 − 𝟏𝟒. 𝟐 + 𝟐𝟔 − 𝟏𝟒. 𝟐 + 𝟏𝟒 − 𝟏𝟒. 𝟐 + 𝟗 − 𝟏𝟒. 𝟐 + 𝟏𝟎 − 𝟏𝟒. 𝟐
𝝈𝟐 =
𝟏𝟎

𝟒𝟒𝟑. 𝟔
𝝈𝟐 =
𝟏𝟎 𝝈𝟐 = 𝟒𝟒. 𝟑𝟔

Varianza para datos agrupados


Cuando se tiene un conjunto de datos agrupados, la varianza se obtiene mediante la formula.

𝟐
𝟐
𝑭𝒊 𝑴𝒊 −
𝝈 =
𝒏
Donde:

𝝈𝟐 Es la varianza

Fi Es la frecuencia del i-ésimo intervalo

Mi Es la marca de clase del i-ésimo intervalo

Es la media del conjunto de datos

n Es el número total de datos

63
Ejemplo

Determina el valor de la varianza para el siguiente conjunto de datos.

INTERVALO Fi
0–5 5
5 – 10 12
10 – 15 23
15 – 20 32
20 – 25 37
25 – 30 23
30 – 35 28
35 – 40 26
40 – 45 14

Para comenzar el proceso, se debe obtener el valor de la media como se realizó en la unidad anterior.

INTERVALO Fi Mi Fi MI
0–5 5 2.5 12.5
5 – 10 12 7.5 90
10 – 15 23 12.5 287.5
15 – 20 32 17.5 560
20 – 25 37 22.5 832.5
25 – 30 23 27.5 632.5
30 – 35 28 32.5 910
35 – 40 26 37.5 975
40 – 45 14 42.5 595
SUMAS 200 4895

El valor de la media es:

4895
=
200

= 24.475

Ahora se agregan dos columnas con encabezado Mi - y ( Mi - )2

64
INTERVALO Fi Mi Fi MI Mi - ( Mi - )2
0–5 5 2.5 12.5 -21.97 4829.006
5 – 10 12 7.5 90 -16.97 2881.506
10 – 15 23 12.5 287.5 -11.97 1434.006
15 – 20 32 17.5 560 -6.97 486.506
20 – 25 37 22.5 832.5 -1.97 39.006
25 – 30 23 27.5 632.5 3.025 91.506
30 – 35 28 32.5 910 8.025 644.006
35 – 40 26 37.5 975 13.025 1696.506
40 – 45 14 42.5 595 18.025 3249.006
SUMAS 200 4895

Por último se agrega una nueva columna con encabezado Fi ( Mi - )2 y se obtiene la suma de dicha
columna.

INTERVALO Fi Mi Fi MI Mi - (Mi - )2 Fi (Mi - )2


0–5 5 2.5 12.5 -21.97 4829.006 24145.031
5 – 10 12 7.5 90 -16.97 2881.506 34578.075
10 – 15 23 12.5 287.5 -11.97 1434.006 32982.143
15 – 20 32 17.5 560 -6.97 486.506 15568.200
20 – 25 37 22.5 832.5 -1.97 39.006 1443.231
25 – 30 23 27.5 632.5 3.025 91.506 2104.643
30 – 35 28 32.5 910 8.025 644.006 18032.175
35 – 40 26 37.5 975 13.025 1696.506 44109.162
40 – 45 14 42.5 595 18.025 3249.006 45486.087
SUMAS 200 4895 218448.750

Se obtiene el valor de la varianza.

𝟐
𝑭𝒊 𝑴 𝑰 −
𝝈=
𝒏
𝟐𝟏𝟖𝟒𝟒𝟖. 𝟕𝟓𝟎
𝝈=
𝟐𝟎𝟎

𝝈 = 𝟏𝟎𝟗𝟐. 𝟐4

65
Ejercicios

Determinar el valor de la varianza para el siguiente conjunto de datos.

INTERVALO Fi Mi Fi MI Mi - (Mi - )2 Fi (Mi - )2


0–9 12
10 – 19 35
20 – 29 43
30 – 39 31
40 – 49 22
50 – 59 17
60 – 69 11
70 – 79 4
SUMAS

Determinar el valor de la varianza para el siguiente conjunto de datos.

INTERVALO Fi Mi Fi MI Mi - (Mi - )2 Fi (Mi - )2


0–4 6
5–9 12
10 – 14 23
15 – 19 35
20 – 24 22
25 – 29 14
30 – 34 10
35 – 39 6
SUMAS

66
Desviación Estándar o Típica
Se define como la raíz cuadrada de la varianza, se denota por 𝝈. Tiene las mismas unidades que los
datos originales.

El valor de la desviación estándar se obtiene

Para datos no agrupados:

𝒙𝒊 − 𝟐
𝟐
𝝈 =
𝒏

Para datos agrupados:

𝑭𝒊 𝑴𝒊 − 𝟐
𝝈𝟐 =
𝒏

Es decir en ambos casos sólo se obtiene la raíz cuadrada de la varianza y ese es el valor de la
Desviación estándar.

Ejemplo

En estos ejemplos tomaremos los dos vistos en varianza, ya que la Desviación Estándar, es sólo sacar
la raíz cuadrada a la varianza.

DATOS NO AGRUPADOS

Determina el valor de la Desviación Estándar para cada el siguiente conjunto de datos.

12 25 8 15 5 18 26 14 9 10

Determinamos la media.

𝑿𝒊
=
𝒏
= 12 + 25 + 8 +15 + 5 + 18 + 26 + 14 + 9 + 10
10

= 14.2

67
la varianza es:

𝟐
𝟐
𝒙𝒊 −
𝝈 =
𝒏
𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐
𝟏𝟐 − 𝟏𝟒. 𝟐 + 𝟐𝟓 − 𝟏𝟒. 𝟐 + 𝟖 − 𝟏𝟒. 𝟐 + 𝟏𝟓 − 𝟏𝟒. 𝟐 + 𝟓 − 𝟏𝟒. 𝟐 + 𝟏𝟖 − 𝟏𝟒. 𝟐 + 𝟐𝟔 − 𝟏𝟒. 𝟐 + 𝟏𝟒 − 𝟏𝟒. 𝟐 + 𝟗 − 𝟏𝟒. 𝟐 + 𝟏𝟎 − 𝟏𝟒. 𝟐
𝝈𝟐 =
𝟏𝟎

𝟒𝟒𝟑. 𝟔
𝝈𝟐 =
𝟏𝟎

𝝈𝟐 = 𝟒𝟒. 𝟑𝟔

Por último obtenemos la Desviación Estándar calculando la raíz cuadrada de la varianza.

𝝈= 𝟒𝟒. 𝟑𝟔

𝝈 = 𝟔. 𝟔𝟔

DATOS AGRUPADOS

Determina la Desviación Estándar para el siguiente conjunto de datos.

INTERVALO Fi
0–5 5
5 – 10 12
10 – 15 23
15 – 20 32
20 – 25 37
25 – 30 23
30 – 35 28
35 – 40 26
40 – 45 14

68
Para comenzar el proceso, se debe obtener el valor de la media como se realizó en la unidad anterior.

INTERVALO Fi Mi Fi MI
0–5 5 2.5 12.5
5 – 10 12 7.5 90
10 – 15 23 12.5 287.5
15 – 20 32 17.5 560
20 – 25 37 22.5 832.5
25 – 30 23 27.5 632.5
30 – 35 28 32.5 910
35 – 40 26 37.5 975
40 – 45 14 42.5 595
SUMAS 200 4895

El valor de la media es:

4895
=
200

= 24.475

Ahora se agregan dos columnas con encabezado Mi - y ( Mi - )2

INTERVALO Fi Mi Fi MI Mi - ( Mi - )2
0–5 5 2.5 12.5 -21.97 4829.006
5 – 10 12 7.5 90 -16.97 2881.506
10 – 15 23 12.5 287.5 -11.97 1434.006
15 – 20 32 17.5 560 -6.97 486.506
20 – 25 37 22.5 832.5 -1.97 39.006
25 – 30 23 27.5 632.5 3.025 91.506
30 – 35 28 32.5 910 8.025 644.006
35 – 40 26 37.5 975 13.025 1696.506
40 – 45 14 42.5 595 18.025 3249.006
SUMAS 200 4895

Por último se agrega una nueva columna con encabezado Fi ( Mi - )2 y se obtiene la suma de dicha
columna.

69
INTERVALO Fi Mi Fi MI Mi - (Mi - )2 Fi (Mi - )2
0–5 5 2.5 12.5 -21.97 4829.006 24145.031
5 – 10 12 7.5 90 -16.97 2881.506 34578.075
10 – 15 23 12.5 287.5 -11.97 1434.006 32982.143
15 – 20 32 17.5 560 -6.97 486.506 15568.200
20 – 25 37 22.5 832.5 -1.97 39.006 1443.231
25 – 30 23 27.5 632.5 3.025 91.506 2104.643
30 – 35 28 32.5 910 8.025 644.006 18032.175
35 – 40 26 37.5 975 13.025 1696.506 44109.162
40 – 45 14 42.5 595 18.025 3249.006 45486.087
SUMAS 200 4895 218448.750

Se obtiene el valor de la varianza.

𝟐
𝑭𝒊 𝑴 𝑰 −
𝝈=
𝒏
𝟐𝟏𝟖𝟒𝟒𝟖. 𝟕𝟓𝟎
𝝈=
𝟐𝟎𝟎

𝝈 = 𝟏𝟎𝟗𝟐. 𝟐4

Por último obtenemos la Desviación Estándar calculando la raíz cuadrada de la varianza.

𝝈= 𝟏𝟎𝟗𝟐. 𝟐𝟒

𝝈 = 𝟑𝟒. 𝟎𝟒

70
Ejercicios

Determinar el valor de la Desviación Estándar para el siguiente conjunto de datos.

INTERVALO Fi Mi Fi MI Mi - (Mi - )2 Fi (Mi - )2


0 – 99 5
100 – 199 12
200 – 299 23
300 – 399 32
400 – 499 37
500 – 599 23
600 – 699 26
700 – 799 14
SUMAS

Determinar el valor de la Desviación Estándar para el siguiente conjunto de datos.

INTERVALO Fi Mi Fi MI Mi - (Mi - )2 Fi (Mi - )2


1–8 3
9 – 16 12
17 – 24 19
25 – 32 22
33 – 40 27
41 – 48 34
49 – 56 43
57 – 64 37
65 – 72 21
73 – 80 18
SUMAS

71
Coeficiente de variación
Es también llamado coeficiente dispersión, es una medida de variación relativa, se presenta en forma
de porcentaje Y su valor se obtiene mediante:

𝝈
𝑽=
Donde:

V Es el coeficiente de variación.

𝝈 Es la desviación estándar del conjunto de datos

Es la media del conjunto de datos

Su valor es útil y se emplea para comparar la variación que existe entre diferentes distribuciones de
frecuencia

Ejemplo

Y una fiesta de Halloween, en el antro A, el promedio de edades fue de 19 años y la desviación estándar
de 2.5 años, mientras que en el antro B, el promedio de edades fue de 25 años Y la desviación estándar
de cuatro años. ¿En cuál fiesta hubo menor variación de edades?

El coeficiente de variación para los asistentes al antro A es:

𝟐. 𝟓
𝑽=
𝟏𝟗

𝑽 = 𝟎. 𝟏𝟑𝟏𝟓 = 𝟏𝟑. 𝟏𝟓%

El coeficiente de variación para los asistentes al antro B es:

𝟒
𝑽=
𝟐𝟓

𝑽 = 𝟎. 𝟏𝟔 = 𝟏𝟔%

Comparando los dos valores obtenidos para el coeficiente de variación se concluye que se presentó
una menor variación de edades entre los asistentes al antro A.

72
Actividad de cierre de unidad

Determinar el valor de la Desviación


Media, Varianza, Desviación Estándar
y el Coeficiente de variación para el
siguiente conjunto de datos.

No. int Fi Mi Fi Mi Mi - |Mi - | Fi|Mi - | (Mi - )2 Fi (Mi - )2


int
1 39 – 39 2
2 40 – 49 1
3 50 – 59 7
4 60 – 69 9
5 70 – 79 17
6 80 – 89 19
7 90 – 99 6

73
Determinar el valor de la Desviación Media, Varianza, Desviación Estándar y el Coeficiente de
variación para el siguiente conjunto de datos.

No. int Fi Mi Fi Mi Mi - |Mi - | Fi|Mi - | (Mi - )2 Fi (Mi - )2


int
1 0–9 15
2 10 – 19 23
3 20 – 29 12
4 30 – 39 22
5 40 – 49 10
6 50 – 59 8
7 60 – 69 14
8 70 – 79 43
9 80 – 89 25
10 90 – 99 13

74
Actividad de Repaso

Determinar el valor de la Fa, Fr, Fra,


Media, Mediana, Moda, Desviación
Media, Varianza, Desviación Estándar
y el Coeficiente de variación para el
siguiente conjunto de datos. Elije una
grafica para representar los datos y
escribe un pequeño análisis de los
mismos.

2 2
No. int Fi Fa Fr Fra Mi Fi Mi Mi - |Mi - | Fi|Mi - | (Mi - ) Fi (Mi - )
int
1 50 – 54 19
2 55 – 59 14
3 60 – 64 17
4 65 – 69 35
5 70 – 74 17
6 75 – 79 19
7 80 – 84 16
8 85 – 89 9

75
Determinar el valor de la Fa, Fr, Fra, Media, Mediana, Moda, Desviación Media, Varianza, Desviación
Estándar y el Coeficiente de variación para el siguiente conjunto de datos. Elije una grafica para
representar los datos y escribe un pequeño análisis de los mismos.

2 2
No. int Fi Fa Fr Fra Mi Fi Mi Mi - |Mi - | Fi|Mi - | (Mi - ) Fi (Mi - )
int
1 0–5 1
2 5–9 7
3 10 – 14 13
4 15 – 19 20
5 20 – 24 21
6 25 – 29 43
7 30 – 34 33
8 35 – 39 12
9 40 – 44 9
10 45 – 49 10

76
Determinar el valor de la Fa, Fr, Fra, Media, Mediana, Moda, Desviación Media, Varianza, Desviación
Estándar y el Coeficiente de variación para el siguiente conjunto de datos. Elije una grafica para
representar los datos y escribe un pequeño análisis de los mismos.

2 2
No. int Fi Fa Fr Fra Mi Fi Mi Mi - |Mi - | Fi|Mi - | (Mi - ) Fi (Mi - )
int
1 30 – 34 7
2 35 – 39 13
3 40 – 44 21
4 45 – 49 43
5 50 – 54 59
6 55 – 59 63
7 60 – 64 42
8 65 – 69 31
9 70 – 74 17

77
Determinar el valor de la Fa, Fr, Fra, Media, Mediana, Moda, Desviación Media, Varianza, Desviación
Estándar y el Coeficiente de variación para el siguiente conjunto de datos. Elije una grafica para
representar los datos y escribe un pequeño análisis de los mismos.

2 2
No. int Fi Fa Fr Fra Mi Fi Mi Mi - |Mi - | Fi|Mi - | (Mi - ) Fi (Mi - )
int
1 0–5 11
2 5–9 17
3 10 – 14 23
4 15 – 19 30
5 20 – 24 31
6 25 – 29 53
7 30 – 34 43
8 35 – 39 22
9 40 – 44 19
10 45 – 49 20

78
Unidad V Covarianza y Correlación lineal

• Datos Bivariados
• Diagrama de dispersión
• Centro de Gravedad

79
Datos Bivariados
Hasta el momento hemos estudiado algunas técnicas estadísticas aplicables a una característica de un
grupo de elementos que constituye una muestra o población, por ejemplo, el promedio de edades de
los habitantes de una región, el ingreso familiar, nivel de escolaridad, etc. Sin embargo, se puede
presentar el caso en el cual no sólo se estudia una sola característica de los elementos de la población,
sino dos o más.

En estos casos, se busca encontrar la relación que existe entre estas variables, para ello es importante
conocer el significado de datos bivariados.

Datos Bivariados Son el conjunto de valores asignados a dos variables distintas obtenidas del
mismo elemento de una población o muestra.

Estos valores se representan en pares ordenados de la forma:

(x1,y1), (x2,y2), (x3,y3) … (xn,yn)

Estos pares ordenados sirven para establecer la relación existente entre las
variables.

A continuación se muestran algunos ejemplos de datos de variados, es decir, el estudio de dos


características del mismo elemento de una población o muestra.

1. La relación entre la edad y la presión sanguínea de las personas.


2. Peso y estatura de las personas.
3. Frecuencia de fumar tabaco y afecciones pulmonares.
4. Modelos de automóviles y su precio.
5. Coeficiente intelectual y aprovechamiento escolar en estudiantes de preparatoria.
6. Publicidad y ventas algunos artículos.
7. Escolaridad e ingreso mensual de los jefes de familia.
8. Número de cilindros del motor y su consumo de gasolina.
9. Edad y agudeza visual de las personas.
10. Número de revoluciones por minuto y potencia de motores diésel.
Etc.

Como se explicó anteriormente estos datos vi variados se presentan en forma de coordenadas, Donde
a la primera variable se la sin el valor de x y a la segunda variable el valor de y. Estos datos normalmente
se presentan en tablas, estas pueden presentarse de manera horizontal o vertical.

80
Ejemplo

En la siguiente tabla se muestra el número de faltas y la calificación obtenida por 15 estudiantes de un


plantel de la escuela preparatoria.

Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
No. De Faltas
5 11 5 9 8 10 6 1 3 0 4 7 7 9 1
x
Calificación
8 6 7.5 8 8.5 5 8 10 9 9.5 8 6.5 7.5 6 9
y

Diagrama de Dispersión
Una forma de representar a los datos bivariados es mediante este diagrama, el cual es la
representación gráfica de todos los pares ordenados en un sistema coordenado rectangular.

Ejemplo

En la siguiente tabla se muestra el número de faltas y la calificación obtenida por 15 estudiantes de un


plantel de la escuela preparatoria. Obtén el diagrama dispersión.

Estudiante Faltas Calificación


x y
1 5 8
2 11 6 Diagrama de dispersión
3 5 7.5
11
4 9 8 10
5 8 8.5 9
8
6 10 5
Calificación

7
7 6 8 6
5
8 1 10 4
9 3 9 3
2
10 0 9.5 1
11 4 8 0
12 7 6.5 0 1 2 3 4 5 6 7 8 9 10 11 12
13 7 7.5 No. De Faltas
14 9 6
15 1 9

81
Ejercicio

Obtén el Diagrama de Dispersión para el siguiente conjunto de datos bivariados.

No. De x y
Dato
1 12 5
2 13 6
3 5 13
4 3 12
5 6 7
6 7 10
7 12 12
8 6 10
9 8 9
10 6 9
11 9 8
12 10 6
13 13 12

Centro de Gravedad o Centroide


El centro de gravedad nos entregue, es el punto de equilibrio de un conjunto de datos en un
diagrama de dispersión, sus coordenadas son:

(𝑥, 𝑦)
Donde:

𝒙 Es la Media de x

𝒚 Es la Media de y

82
Ejemplo

Determinar y localizar el centro de gravedad del siguiente conjunto de datos.

Estudiante Faltas Calificación


x y
1 5 8
2 11 6
Diagrama de dispersión
3 5 7.5
4 9 8 11
10
5 8 8.5 9

Calificación
6 10 5 8
7
7 6 8 6
8 1 10 5
4
9 3 9 3
10 0 9.5 2
1
11 4 8 0
12 7 6.5 0 1 2 3 4 5 6 7 8 9 10 11 12
13 7 7.5 No. De Faltas
14 9 6
15 1 9

Se obtiene la media de x. Se obtiene la media de y.

𝑥x 𝑦x
𝑥= 𝑥=
𝑛 𝑛

86 116.5
𝑥= 𝑥=
15 15

𝑥 = 5.733 𝑥 = 7.766

Se obtienen la coordenada del centroide. 𝑥 , 𝑦 = (5.7, 7.7)

Se ubica esta coordenada en el diagrama de dispersión ( en este ejemplo se utilizó la marca para
ubicar el centroide en el diagrama de dispersión.

83
Ejercicios

Obtén el Diagrama de Dispersión y el centroide para el siguiente conjunto de datos bivariados.

No. De x y
Dato
1 5 5
2 4 -2
3 3 4
4 9 6
5 6 2.1
6 7 4.3
7 2 -6
8 1 1.5
9 4 3.2
10 6 7.8
11 8 4.6
12 3 -1.5
13 4 2.3

Obtén el Diagrama de Dispersión y el centroide para el siguiente conjunto de datos bivariados.

No. De x y
Dato
1 3 5.1
2 5 4.5
3 2 8.1
4 1 6.0
5 0 8.5
6 2 7.0
7 5 3.0
8 5 4.0
9 1 9.0
10 6 7.8

84

También podría gustarte