Documentos de Académico
Documentos de Profesional
Documentos de Cultura
-2-
ANTECEDENTES
A mediados del siglo XVII la estadística tomó un papel importante, tuvo un gran desarrollo cuantitativo,
ya que en esa época, los imperios del viejo continente tenían la necesidad de llevar un buen control
administrativo de sus actividades comerciales y bélicas entre otras, donde sus registros y operaciones
consistían en números.
Como toda ciencia la Estadística ha estado en constante evolución a lo largo de la vida del ser humano.
Hasta nuestros días que es parte de la vida cotidiana de forma directa o indirecta. Pero si la Estadística
surgió desde que el hombre tuvo la necesidad de llevar un registro de sus bienes, entonces…
Actividad
Investiga quien es el padre de la Estadística moderna y que pasó después del siglo XVII con esta
ciencia (hasta llegar a nuestros días), donde y quienes la aplican. Realiza un resumen de 250
palabras como mínimo.
-3-
CONCEPTO DE ESTADISTICA
Describe en una palabra lo que para ti y tus compañeros significa
Estadística.
Con todas esas palabras y con ayuda de tu profesor formen su propio concepto de estadística.
Investiga de tarea tres conceptos más y compáralos con el concepto creado en clase.
-4-
Clasificación y Campos de la Estadística.
La estadística para su estudio, se divide en dos ramas:
Descriptiva
Estadística
Inferencial
Estadística Inferencial. Se ocupa de interpretar los resultados obtenidos con las técnicas
descriptivas, para tomar decisiones en base a ellos. Aquí es donde entra
la parte de la experiencia del tomador de decisiones.
Aplicaciones de la Estadística
En la actualidad la estadística se ocupa en todas las áreas que imaginemos, de manera formal o
informal se lleva un registro de acciones, dinero, actividades, etc. Por esto, la estadística es una de las
ciencias más utilizadas y la podemos ver en:
-5-
Dato estadístico
Un dato estadístico es la característica medible o descrita mediante un valor o atributo de un elemento
en estudio.
Variables Estadísticas
Para representar los datos estadísticos se usan las variables estadísticas.
Una variable es la representación general de un conjunto de datos que tienen una misma
característica; dicho de otra manera, a una variable se le asigna una valor o atributo de un objeto en
estudio, un elemento de la población puede tener una o muchas variables que se desean manejar.
Las variables se asignan mediante letras y subíndices, las letras representan cada dato del elemento en
estudio y el subíndice representa al numero de elemento que se tiene como referencia.
E P G
Variables
6
Clasificación de las Variables Estadísticas
Para el estudio de un proceso estadístico, las variables se clasifican en:
Cualitativas
Variables Discretas
Cuantitativas
Continuas
Variables Cualitativas Son aquellas que describen cualidades o atributos, es decir no se les
asigna un valor numérico.
Variables Cuantitativas Son las que se representan mediante valores numéricos, existen dos
tipos; las discretas y las continuas
Las variables discretas son las que están Las variables continuas están asociadas a un
asociadas a un proceso de conteo de números o proceso de medición, es decir acepta valores
elementos enteros, es decir no pueden tomar intermedios o decimales. Por ejemplo el peso, la
valores intermedios o decimales. Por ejemplo el estatura, alguna calificación, etc.
numero de hermanos, numero de hijos,
elementos vendidos, etc.
Actividad
1. Selecciona un elemento de estudio (una persona, un auto, una fruta, un libro, etc.)
2. Piensa en 6 atributos, características o valores que deseas conocer o medir de este elemento.
3. De esos atributos o valores debes tener 2 variables cualitativas, 4 variables cuantitativas,
dentro de estas dos discretas y dos continuas.
4. Plantea el diagrama como el mostrado por tu profesor en clase.
7
Población y Muestra
Población
Cuando realizamos un estudio estadístico de algún
fenómeno, dependiendo del número de datos que se
pretenden analizar, resulta en ocasiones imposible o
Muestra incosteable recolectar los datos de todos los elementos
del grupo en estudio; en estos caso es importante
seccionar esa población en grupos mas pequeños que
cumplan con la condición de ser representativos del
grupo general.
Muestra Es una parte representativa de la población y nos sirve para generalizar el estudio.
En este texto se presentan sólo algunas formas que existen para seleccionar una muestra, corresponde
al tipo de estudio o a la persona que lo realice su selección.
8
Selección del tamaño de la muestra
𝑵
𝒏=
𝟏 + 𝑵𝒆𝟐
Donde:
n Es el tamaño de la muestra
N Es el número de elementos de lea población
e Es el error máximo esperado.
Por ejemplo, si se desea realizar un estudio, para estimar la proporción de familias aficionadas a ver el
futbol por televisión, en una comunidad formada por aproximadamente 3000 familias y se desea tener
un error de ± 5%. El tamaño de la muestra será de:
Datos Fórmula
n= Es el tamaño de la 𝑵
𝒏=
muestra que se obtendrá 𝟏 + 𝑵𝒆𝟐
N= 3000
e= ± 5% , lo que equivale a .05
Desarrollo
9
Ejemplo
Considera una población de 23000 elementos, de que tamaño deberá ser la muestra para que al
realizar un estudio estadístico tenga un 97% de credibilidad.
Datos Fórmula
n= Es el tamaño de la 𝑵
muestra que se obtendrá 𝒏=
𝟏 + 𝑵𝒆𝟐
N= 23000
e= ± 3% , lo que equivale a .03
Desarrollo
Ejercicios.
Resuelve los siguientes problemas mostrando datos fórmula y desarrollo.
Considera una población de 5000 elementos, de que tamaño deberá ser la muestra si se espera un
error del 7%.
Considera una población de 7525 elementos, de que tamaño deberá ser la muestra para que al realizar
un estudio estadístico tenga un 95% de credibilidad.
Considera una población de 999999 elementos, de que tamaño deberá ser la muestra si se espera un
error del 10% , del 9%, del 7%, del 5%, del 3% del 1% y sin error.
10
Selección de una muestra
mediante números aleatorios
simples
Se lleva a cabo asignando números a los elementos de la población y después de conocer el tamaño de
la muestra se realiza un sorteo de los elementos de la población, agregando algún sistema para el
sorteo.
Existen mas criterios para la selección de una muestra y en la vida cotidiana no sólo se ocupa uno u
otro, normalmente se utilizan dos o tres métodos para garantizar que la muestra sea representativa
de la población y minimizar la manipulación de la misma.
Existen diferentes formas para obtener estos datos, las mas utilizadas son:
Observación Encuesta
Experimento Investigación
11
Actividad de cierre de unidad
Observa en tu comunidad o localidad un problema
estadístico que puedas plantear (descríbelo brevemente)
¿Cuales serian tus elementos de estudio? (define la población, sus características y su tamaño)
Calcula el tamaño de la muestra y el tipo de criterio para su selección, considerando que se busca tener
un grado de certeza del 95%
¿Qué variable o variables tomarás en cuenta para tu estudio y de que tipo serán?
Concluye escribiendo un resumen del tipo de información que podrías obtener con este estudio y para
que podría servir o donde se podría utilizar.
12
Unidad II Representación de Datos
13
Representación de
datos
Al efectuar un estudio estadístico los
datos por lo general no vienen ordenados
ni agrupados, por este motivo, la primera
parte del estudio consiste en ordenar y
clasificar los datos para su tratamiento.
Datos agrupados Son el conjunto de datos que se han organizado en varias clase o intervalos
Tabulación Proceso de conteo de datos que, mediante el uso de líneas, se utiliza para
comenzar el proceso de ordenación y clasificación de Datos.
Tabla de Frecuencias
Para agrupar u organizar un conjunto de datos se construye una tabla llamada tabla de frecuencias o
distribución de frecuencias simples.
El primer paso para organizar los datos consiste en identificar el tipo de datos que se tienen, los cuales
pueden ser cualitativos o cuantitativos.
Cuando los datos corresponden a valores cualitativos, se clasifican en varias clases o intervalos, que
corresponden a las cualidades, valores o atributos obtenidos en cada elemento, después se efectúa
una tabulación, es decir, se realiza un conteo de los elementos que pertenecen a cada clase o
categoría.
14
Frecuencia
Una vez terminada la tabulación, se cuentan los elementos que contiene cada clase o bueno intervalo
y se anota el valor en otra columna que se denomina Frecuencia.
La frecuencia es el número de elementos que contiene cada clase o intervalo en un conjunto de datos.
Ejemplo
Construir una tabla de frecuencias simple con los siguientes datos que corresponden al color de
automóviles que se encuentran en el estacionamiento de una escuela.
Verde Azul Verde Rojo Gris Café Gris Rojo Negro Negro Azul Azul
Rojo Verde Blanco Blanco Verde Beige Azul Gris Verde Negro Verde Verde
Blanco Rojo Vino Azul Verde Vino Café Verde Naranja Rojo Rojo Rojo
Beige Azul Azul Blanco Negro Negro Azul Negro Blanco Rojo Blanco
Beige Azul Gris Naranja Gris Beige Blanco Beige Azul Gris Rojo
Blanco Naranja Negro Rojo Rojo Verde Azul Café Verde Rojo Rojo
Café Gris Beige Café Gris Negro Naranja Negro Café negro Blanco
Se obtiene la frecuencia de cada clase, contando los elementos que contiene cada una de ellas, lo cual
se muestra en la siguiente tabla de frecuencias simple.
2. Obtener la variación
𝐑𝐚𝐧𝐠𝐨 + 𝐯𝐚𝐫𝐢𝐚𝐜𝐢ó𝐧
𝐓𝐚𝐦𝐚ñ𝐨 𝐝𝐞𝐥 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨 =
𝐍ú𝐦𝐞𝐫𝐨 𝐝𝐞 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨𝐬
4. Si nos dan el tamaño del intervalo, Se obtiene el número de intervalos que tendrá la tabla
𝐑𝐚𝐧𝐠𝐨 + 𝐯𝐚𝐫𝐢𝐚𝐜𝐢ó𝐧
𝐍ú𝐦𝐞𝐫𝐨 𝐝𝐞 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨𝐬 =
𝐓𝐚𝐦𝐚ñ𝐨 𝐝𝐞𝐥 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨
6. Se lleva acabo el conteo de los datos, este proceso es conocido como tabulación
16
Ejemplo
65 39 32 92 76 54 87 43 54 23 56 34
45 78 65 23 65 34 56 87 54 68 87 56
42 48 54 87 65 51 40 46 65 60 28 55
50 30 75 75 72 35 52 50 40 53 40 30
45 60 40 92 91 41 75 38 42 56 38 54
45 52 65 47 50 50 50 48 51 60 61 58
40 60 46 70 30 60 23 85 85 84 53 80
52 48 75 86 85 82 45 57 65 53 26 58
65 70 60 70 30 25 75 65 60 66 63 60
60 92 38 45 60 78 73 57 70 55 53 60
Para calcular el rango se deben buscar el dato mayor y el dato menor en el conjunto y sustituir en la
siguiente fórmula.
𝐑𝐚𝐧𝐠𝐨 = 𝐃𝐚𝐭𝐨 𝐦𝐚𝐲𝐨𝐫 − 𝐃𝐚𝐭𝐨 𝐦𝐞𝐧𝐨𝐫
Para obtener la variación debemos buscar dentro del conjunto de datos una secuencia de números,
por ejemplo 89 – 90, 4 – 5 o dos datos que tengan una secuencia de separación entre ellos.
En este ejemplo nos dan el número de intervalos por lo tanto nos vamos al paso
número 3
𝐑𝐚𝐧𝐠𝐨 + 𝐯𝐚𝐫𝐢𝐚𝐜𝐢ó𝐧
𝐓𝐚𝐦𝐚ñ𝐨 𝐝𝐞𝐥 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨 =
𝐍ú𝐦𝐞𝐫𝐨 𝐝𝐞 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨𝐬
17
Paso 5, 6 y 7.
Se procede a construir los intervalos, normalmente se comienza por el dato menor y se cuenta
incluyendo a este el tamaño del intervalo. Tomar en cuenta la variación para los saltos entre el limite
superior y el limite inferior del siguiente intervalo.
Posteriormente se cuentan los datos que encajan en cada intervalo y se establece la frecuencia de cada
intervalo.
NO. INTERVALO Fi
TABULACIÓN
INTERVALO INFERIOR - SUPERIOR FRECUENCIA
-
-
-
-
-
-
-
-
-
-
Ejemplo
5 14 52 86 59 74 71 42 45 43 56 42
47 77 52 56 69 91 14 45 57 78 86 62
4 12 7 9 25 13 81 24 37 45 53 11
8 91 95 86 34 43 45 51 22 27 30 15
14 25 18 35 69 92 85 84 41 52 56 53
14 45 32 38 38 40 57 36 52 53 23 6
94 8 10 60 67 66 65 63 72 51 46 20
Para calcular el rango se deben buscar el dato mayor y el dato menor en el conjunto y sustituir en la
siguiente fórmula.
𝐑𝐚𝐧𝐠𝐨 = 𝐃𝐚𝐭𝐨 𝐦𝐚𝐲𝐨𝐫 − 𝐃𝐚𝐭𝐨 𝐦𝐞𝐧𝐨𝐫
18
Paso 2. Obtener la variación
Para obtener la variación debemos buscar dentro del conjunto de datos una secuencia de números,
por ejemplo 89 – 90, 4 – 5 o dos datos que tengan una secuencia de separación entre ellos.
En este ejemplo nos dan el tamaño de los intervalos por lo tanto nos vamos al paso número 4
𝐑𝐚𝐧𝐠𝐨 + 𝐯𝐚𝐫𝐢𝐚𝐜𝐢ó𝐧
𝐍ú𝐦𝐞𝐫𝐨 𝐝𝐞 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨𝐬 =
𝐓𝐚𝐦𝐚ñ𝐨 𝐝𝐞𝐥 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨
Por lo tanto concluimos que el número de intervalos que tendrá la tabla (renglones) será de y el
tamaño de dichos intervalos es de 11 unidades.
Paso 5, 6 y 7.
Se procede a construir los intervalos, normalmente se comienza por el dato menor y se cuenta
incluyendo a este el tamaño del intervalo. Tomar en cuenta la variación para los saltos entre el limite
superior y el limite inferior del siguiente intervalo.
NOTA. En este ejercicio si comenzamos por el dato menor en el primer intervalo existe mucho
desperdicio en el último intervalo por lo que debemos ajustar los intervalos.
Posteriormente se cuentan los datos que encajan en cada intervalo y se establece la frecuencia de cada
intervalo.
NO. INTERVALO Fi
TABULACIÓN
INTERVALO INFERIOR - SUPERIOR FRECUENCIA
-
-
-
-
-
-
-
-
-
-
19
Intervalos reales de clase
Estos intervalos están formados por los limites reales de clase, que son los valores que evitan huecos
entre un intervalo y el siguiente. Sus valores se obtienen como el punto medio del limite superior y el
limite inferior del siguiente intervalo, resultando que el limite real superior de un intervalo sea igual al
limite real inferior del siguiente intervalo.
Cuando exista controversia de donde colocar un valor, se resuelve colocándolo en el primer intervalo
que aparezca el valor en cuestión, por ejemplo, si debo colocar el valor 33.5 en la tabla y esta esta
formada de la siguiente manera.
Ejemplo
1 23 - 29 6
2 30 - 36 8
3 37 - 43 13
4 44 - 50 16
5 51 - 57 22
6 58 - 64 15
7 65 - 71 15
8 72 - 78 10
9 79 - 85 6
10 86 - 92 9
20
Ejemplo
1 1 - 11 9
2 12 - 22 10
3 23 - 33 7
4 34 - 44 12
5 45 - 55 16
6 56 - 66 11
7 67 - 77 7
8 78 - 88 7
9 89 - 99 5
Marca de Clase
La marca de clase es el punto medio de cada intervalo, se representa por Mi y se obtiene con la
expresión:
Para calcular la marca de clase, se debe agregar una nueva columna a la tabla de frecuencias simple,
esta nueva columna llevará como encabezado Mi y en ella se colocarán los valores obtenidos una
fórmula anterior para cada intervalo.
21
Ejemplo
Calcular la marca de clase para cada una de las siguientes tablas de frecuencias simples.
NO. INTERVALO Fi Mi
INTERVALO INFERIOR - SUPERIOR FRECUENCIA MARCA DE CLASE
1 23 - 29 6
2 30 - 36 8
3 37 - 43 13
4 44 - 50 16
5 51 - 57 22
6 58 - 64 15
7 65 - 71 15
8 72 - 78 10
9 79 - 85 6
10 86 - 92 9
NO. INTERVALO Fi Mi
INTERVALO INFERIOR - SUPERIOR FRECUENCIA MARCA DE CLASE
1 1 - 11 9
2 12 - 22 10
3 23 - 33 7
4 34 - 44 12
5 45 - 55 16
6 56 - 66 11
7 67 - 77 7
8 78 - 88 7
9 89 - 99 5
22
Ejercicios
Construye la tabla de distribución de frecuencias para cada ejercicio mostrado.
En la siguiente tabla se muestran las lecturas de la presión sanguínea sistólica, efectuada a los adultos
que presentaron un examen físico antes de obtener un empleo. Con intervalos de tamaño 4, determina
la tabla de distribución de frecuencias (intervalos de clase, tabulación opcional, frecuencia, limites
reales de clase y marca de clase).
122 109 117 129 118 132 130 112 106 107 128
125 103 125 104 104 129 126 126 115 118 111
110 124 105 121 105 103 128 125 127 114 119
112 111 123 110 123 107 101 130 127 126 104
120 113 112 122 115 127 127 108 109 121 129
128 103 121 114 109 121 122 123 130 127 125
110 102 112 115 120 114 129 105 121 121 114
NO. INTERVALO Fi Mi
TABULACION
INTERVALO INFERIOR - SUPERIOR FRECUENCIA MARCA DE CLASE
-
-
-
-
-
-
-
-
-
23
Los siguientes datos corresponden a las calificaciones obtenidas por alumnos en su examen de
admisión a la facultad de economía.
60 75 92 73 98 65 55 78 45 85 70
79 67 62 54 69 65 87 48 92 73 83
59 55 83 88 72 94 75 73 68 60 77
84 62 56 81 83 72 86 75 68 89 95
Construya la tabla de frecuencias con 9 intervalos (renglones), mediante los limites de clase y responda
las preguntas indicadas. (intervalos de clase, tabulación opcional, frecuencia, limites reales de clase y
marca de clase).
NO. INTERVALO Fi Mi
TABULACION
INTERVALO INFERIOR - SUPERIOR FRECUENCIA MARCA DE CLASE
-
-
-
-
-
-
-
-
-
24
Distribución de Frecuencias
No sólo se presentan las distribuciones simples en las tablas, existen algunas otras que se ocupan en
los estudios estadísticos, entre las mas comunes o utilizadas tenemos:
• Frecuencia Acumulada
• Frecuencia Relativa
• Frecuencia Relativa Acumulada
25
Frecuencia Relativa Acumulada (Fra)
Se obtiene de la misma manera que la Frecuencia Acumulada (Fa) pero ahora tomamos la columna de
la Frecuencia Relativa (Fr) para ir acumulándola en cada intervalo.
Ejercicios
26
Construye la tabla de distribución de frecuencias, obtén la Mi, Fa, Fr y Fra.
27
Representación Gráfica de una distribución
Una vez que los datos obtenidos en un estudio estadístico se han agrupado, se pueden obtener algunas
conclusiones directamente de la tabla de distribución de frecuencias, representándolas mediante
gráficas, tomando en cuenta que estas, muestran el comportamiento de los datos.
Existen varias formas de representar las distribuciones de frecuencias, en este curso solo se abarcarán
algunas de las siguientes:
• Histograma de frecuencias
• Polígono de frecuencias
• Gráfica de barras
• Gráfica de líneas
• Curvas
• Cartograma
• Pictograma
• Circulograma
• Ojivas
• Etc.
Gráfica de barras
Consiste en una serie de rectángulos cuyas bases se encuentran sobre un eje horizontal, que
corresponden a cada uno de los intervalos de la tabla de distribución de frecuencias y su altura está
marcada en un eje vertical y corresponde a la frecuencia de cada intervalo.
Para construir una gráfica de barras se llevan acabo los siguientes pasos:
NO. INTERVALO Fi
Considera como ejemplo la siguiente tabla de
INTERVALO INFERIOR - SUPERIOR FRECUENCIA
frecuencias.
1 1 - 5 15
2 6 - 10 12
3 11 - 15 13
4 16 - 20 8
5 21 - 25 11
6 26 - 30 7
7 31 - 35 6
8 36 - 40 10
28
En el primer cuadrante del plano cartesiano se coloca la escala de medición para el intervalo y la
frecuencia.
Gráfica de Barras
16
14
12
FRECUENCIA 10
8
6
4
2
0
1 2 3 4 5 6 7 8
FRECUENCIA
INTERVALO
Se traza un rectángulo vertical para cada uno de los intervalos con su respectiva frecuencia.
Gráfica de Barras
16
14
12
10
0
1 2 3 4 5 6 7 8
INTERVALO
29
Histograma de Frecuencias
Se emplea para representar mediante una gráfica similar a la de barras, una distribución de
frecuencias. La diferencia que tiene con la gráfica de barras, es que en el histograma se localizan los
limites reales de clase en el eje horizontal.
Considera como ejemplo la siguiente tabla de frecuencias. Se deben obtener los intervalos reales de
clase.
NO. INTERVALO Fi INTERVALO REAL DE
CLASE
INTERVALO INFERIOR - SUPERIOR FRECUENCIA INFERIOR - SUPERIOR
1 1 - 5 15 .5 - 5.5
2 6 - 10 12 5.5 - 10.5
3 11 - 15 13 10.5 - 15.5
4 16 - 20 8 15.5 - 20.5
5 21 - 25 11 20.5 - 25.5
6 26 - 30 7 25.5 - 30.5
7 31 - 35 6 30.5 - 35.5
8 36 - 40 10 35.5 - 40.5
En el primer cuadrante del plano cartesiano se coloca la escala de medición para los intervalos reales
de clase y la frecuencia.
Gráfica de Barras
16
14
12
FRECUENCIA 10
8
6
4
2
0
1 2 3 4 5 6 7 8
.5 5.5 10.5 15.5 20.5
25.5 30.5 35.5 40.5
INTERVALOFRECUENCIA
REAL DE CLASE
30
Se traza un rectángulo vertical para cada uno de los intervalos con su respectiva frecuencia.
Gráfica de Barras
16
14
12
10
8
6
4
2
0
1 2 3 4 5 6 7 8
.5 5.5 10.5 15.5 20.5 25.5 30.5 35.5 40.5
FRECUENCIA
INTERVALO REAL DE CLASE
Polígono de Frecuencias
Es una gráfica de líneas que generalmente se traza sobre el histograma de frecuencias, representa la
distribución de un conjunto de datos construida sobre sus marcas de clase.
Se debe construir el Histograma de frecuencias, para lo cual se obtienen los intervalos reales de clase.
1 1 - 5 15 .5 - 5.5
2 6 - 10 12 5.5 - 10.5
3 11 - 15 13 10.5 - 15.5
4 16 - 20 8 15.5 - 20.5
5 21 - 25 11 20.5 - 25.5
6 26 - 30 7 25.5 - 30.5
7 31 - 35 6 30.5 - 35.5
8 36 - 40 10 35.5 - 40.5
31
Una vez construido el Histograma se ubica la marca de clase, que es el punto medio de cada intervalo.
Y se trazan rectas que unan esas marcas de clase. Este conjunto de rectas conforman el polígono de
frecuencias.
Gráfica de Barras
16
14
12
10
8
6
4
2
0
1 2 3 4 5 6 7 8
.5 5.5 10.5 15.5 20.5 25.5 30.5 35.5 40.5
FRECUENCIA
Circulograma
También es llamada gráfica circular o de pastel, es una gráfica que consiste en dividir un circulo en
proporciones dadas por los intervalos.
Para construir un circulagrama, se determina el porcentaje que representa cada intervalo (Fr) y se
obtiene la equivalencia en grados del sector circular equivalente a cada intervalo, mediante la siguiente
expresión:
𝑮𝒓𝒂𝒅𝒐𝒔 = 𝑭𝒓 𝒙 𝟑𝟔𝟎
Se agregan las columnas a la tabla para realizar el procedimiento explicado en el párrafo anterior, como
se muestra en el siguiente ejemplo.
32
NO. INTERVALO Fi Fr PROCENTAJE GRADOS
Circulograma
12% 18%
7%
9% 15%
13%
16%
10%
33
Ejercicios
Construye la tabla de distribución de frecuencias, obtén la Mi, Fa, Fr y Fra. Representa los datos
mediante un polígono de frecuencias
1 10 - 17 14 -
2 18 - 25 42 -
3 26 - 33 65 -
4 34 - 41 39 -
5 42 - 49 27 -
6 50 - 57 18 -
7 58 - 65 15 -
SUMAS
34
Construye la tabla de distribución de frecuencias, obtén la Mi, Fa, Fr y Fra. Representa los datos
mediante un circulograma.
35
Actividad de cierre de unidad
En la siguiente tabla se muestran 66
valores de la resistencia a la ruptura
bajo cargas de tensión (en lb / in2) de
cilindros de concreto (con diámetro de
15.24 cm y longitud de 30.48 cm).
Obtén la distribución de frecuencias
simple (intervalos de clase, tabulación
opcional, frecuencia, limites reales de
clase, marca de clase, frecuencia
acumulada, frecuencia relativa y frecuencia relativa acumulada). Considera intervalos de tamaño 6.
438 422 416 440 408 410 435 448 453 451 413
443 426 449 428 422 434 400 457 415 440 425
418 403 426 437 439 436 449 435 446 436 447
433 410 448 459 411 437 418 414 419 437 428
438 431 420 402 431 442 423 434 419 451 420
441 447 452 430 445 433 426 441 443 407 419
36
Construye la tabla de distribución de frecuencias, obtén la Mi, Fa, Fr y Fra. Construye la Gráfica de
barra, el polígono de frecuencias y el circulograma.
37
Unidad III Medidas de Tendencia Central
38
Medidas de tendencia central
Como hemos visto hasta el momento, en una
distribución de frecuencias, se muestra información
del conjunto de datos que se esta estudiando.
En estadística las sumas se representan mediante la letra griega sigma ( Σ ), la cual se utiliza para
representar la suma de columnas o de un conjunto de datos.
Las Medidas de tendencia central, también llamadas medidas de centralización, indican mediante un
valor o atributo la localización central de la distribución de frecuencias.
Debido a que se pueden dar varias interpretaciones de lo que significa valor central de una distribución,
se estudian tres medidas de tendencia central que son la media, la moda y la mediana. Cabe aclarar
que estas medidas de posición, no son las únicas que existen.
Las medidas de tendencia central se pueden estudiar para datos agrupados y no agrupados.
Datos agrupados Son el conjunto de datos que se han organizado en varias clase o intervalos,
las tablas de distribución de frecuencia son un ejemplo de ellos.
Datos NO agrupados Son los Datos brutos, no organizados y obtenidos en la recopilación, los
datos que contamos antes de crear las tablas son un ejemplo de ellos.
39
Media Aritmética
Es llamada también media o promedio, es una de las medidas más
utilizadas dentro de las estadística y se denota por
𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ + 𝒙𝒏
=
𝒏
Ejemplo
Juan pescó 4 peces con longitudes de 20, 23, 36 y 19 cm ¿Cuál es la longitud media de los peces?
Como se observa el conjunto de datos esta formado por 4 elementos, por lo que la media resulta:
𝟐𝟎 + 𝟐𝟑 + 𝟑𝟔 + 𝟏𝟗 𝟗𝟖
= = = 𝟐𝟒. 𝟓 𝒄𝒎
𝟒 𝟒
Lo que representa que el promedio de la longitud de los peces que capturó es de 24.5 cm
Ejercicios
Lucero una alumna de quinto semestre obtuvo las siguientes calificaciones en el semestre anterior:
MATERIA CALIFICACION
Cálculo Diferencial 6.0
Química II 7.3
inglés 8.5
Derecho 9.2
Economía 7.8
Biología 9.0
Creatividad 10.0
4 13 28 15 23 12 6 7 14 25 31 6 8 34
𝒇𝒊 𝑴𝒊
=
𝒏
Donde:
Es el valor de la media
Se dice que el valor de la media aplicando esta expresión es aproximado debido a que se considera
que el valor de todos los datos de un intervalo es igual a la marca de clase y esto casi nunca se
cumple.
41
Ejemplo
INTERVALO Fi
0 – 10 5
10 – 20 12
20 – 30 21
30 – 40 27
40 – 50 31
50 – 60 35
60 – 70 21
70 – 80 14
80 – 90 9
90 – 100 5
𝒇𝒊 𝑴𝒊
=
𝒏
por lo que es necesario agregar una nueva columna a nuestra tabla con el encabezado Mi ( Marca de
Clase)
INTERVALO Fi Mi
0 – 10 5 5
10 – 20 12 15
20 – 30 21 25
30 – 40 27 35
40 – 50 31 45
50 – 60 35 55
60 – 70 21 65
70 – 80 14 75
80 – 90 9 85
90 – 100 5 95
SUMAS 180
42
El siguiente paso consiste en agregar una nueva columna con encabezado Fi Mi ( la cual consiste en
multiplicar la frecuencia de cada intervalo por la Marca de clase del mismo intervalo o renglón)
INTERVALO Fi Mi Fi MI
0 – 10 5 5 25
10 – 20 12 15 180
20 – 30 21 25 525
30 – 40 27 35 945
40 – 50 31 45 1395
50 – 60 35 55 1925
60 – 70 21 65 1365
70 – 80 14 75 1050
80 – 90 9 85 765
90 – 100 5 95 475
SUMAS 180 8650
𝒇𝒊 𝑴𝒊
=
𝒏
𝟖𝟔𝟓𝟎
=
𝟏𝟖𝟎
= 48.05
Ejercicios
INTERVALO Fi Mi Fi MI
40 – 42 5
42 – 44 12
44 – 46 21
46 – 48 27
48 – 50 31
50 – 52 35
52 – 54 21
54 – 56 14
SUMAS
43
Determinar el valor de la media para el siguiente conjunto de datos.
INTERVALO Fi Mi Fi MI
100 – 110 4
110 – 120 7
120 – 130 11
130 – 140 17
140 – 150 25
150 – 160 33
160 – 170 30
170 – 180 21
180 – 190 16
190 – 200 7
SUMAS
44
Moda
Es el valor que aparece con mayor frecuencia en un conjunto de datos. Se
Ejemplos
4 3 7 2 5 6 3 2 5 7 3 6 4 3
El número que más veces se repite es el 3, por lo cual la moda es 3.
10 15 13 14 10 8 13 10 21 13 7 6 1 0 3
Este caso se repite con la misma frecuencia el 10 y el 13, por lo tanto se dice que el conjunto es bimodal.
45
Moda para datos agrupados
Si el conjunto de datos se presenta en forma agrupada, mediante una
distribución o tabla de frecuencias, una forma de aproximar el valor
de la moda es utilizando la siguiente fórmula.
∆𝟏
=𝑳+ 𝒄
∆𝟏 + ∆𝟐
Donde:
Es el valor de la moda
En este caso se considera que el valor de la moda se encuentran el intervalo con mayor frecuencia, ya
que al ser el intervalo que contiene más datos, existe una mayor probabilidad de que aquí se repitan
más valores.
46
Ejemplo
No. de INTERVALO Fi
Intervalo
1 0 – 10 12
2 10 – 20 37
3 20 – 30 72
4 30 – 40 47
5 40 – 50 65
6 50 – 60 55
7 60 – 70 96
8 70 – 80 80
9 80 – 90 54
10 90 – 100 41
Para comenzar el proceso, se debe de ubicar el intervalo con mayor frecuencia; en este caso la moda
se encuentra en el intervalo número 7, puesto que en éste se encuentra la frecuencia más alta que es
96.
L = 60
∆1 = ( 96 – 55 ) = 41
∆2 = ( 96 – 80 ) = 16
c = 10
cd
= 60 + 10
cdedf
= 60 + 0.7192 10
= 60 + 7.1929
= 67.1929
47
Ejercicios
No. de INTERVALO Fi
Intervalo
1 40 – 42 5
2 42 – 44 12
3 44 – 46 21
4 46 – 48 27
5 48 – 50 31
6 50 – 52 35
7 52 – 54 21
8 54 – 56 14
No. de INTERVALO FI
Intervalo
1 10 – 19 13
2 20 – 29 43
3 30 – 39 28
4 40 – 49 24
5 50 – 59 12
6 60 – 69 6
7 70 – 79 5
8 80 – 89 2
48
Mediana
Es el valor central de los datos agrupados en forma ascendente o
Ejemplos
14 23 22 27 17 14 18 17 27 29 23 24 35 18 33
Se tienen 15 datos (número impar de datos), al ordenarlos en forma ascendente quedan de la siguiente
manera.
14 14 17 17 18 18 22 23 23 24 27 27 29 33 35
Como es un número impar de datos y el dato que se encuentra al centro es el 23 se concluye que la
mediana es 23.
Se tienen 22 datos (número par de datos), al ordenarlos en forma ascendente quedan de la siguiente
manera.
Como es un número par de datos y los datos que se encuentran al centro son 50 y 60 por lo que la
mediana se obtiene de la siguiente manera:
50 + 60 110
= = = 55
2 2
Por lo que se concluye que la media es 55.
49
Mediana para datos agrupados
Si el conjunto de datos se presenta en forma agrupada,
mediante una distribución o tabla de frecuencias, una
forma de aproximar el valor de la mediana es utilizando la
siguiente fórmula.
𝒏
− 𝑭𝒂
=𝑳+ 𝟐 𝒄
𝑭𝒊
Donde:
Es el valor de la mediana
𝒏
Es el número total de datos dividido entre dos
𝟐
NOTA:
Lo primero que se debe hacer para ubicar el intervalo que contiene a la mediana, es obtener el valor
de n/2. Posteriormente buscar el primer renglón o intervalo donde Fa se pase del valor obtenido (n/2).
50
Ejemplo
No. de INTERVALO Fi
Intervalo
1 100 – 110 4
2 110 – 120 7
3 120 – 130 11
4 130 – 140 17
5 140 – 150 25
6 150 – 160 33
7 160 – 170 30
8 170 – 180 21
9 180 – 190 16
10 190 – 200 7
Para comenzar el proceso, como lo indica la nota, se debe ubicar el intervalo que contiene a la
mediana, para lo cual se agrega una nueva columna con el encabezado Fa ( frecuencia acumulada).
No. de INTERVALO Fi Fa
Intervalo
1 100 – 110 4 4
2 110 – 120 7 11
3 120 – 130 11 22
4 130 – 140 17 39
5 140 – 150 25 64
6 150 – 160 33 97
7 160 – 170 30 127
8 170 – 180 21 148
9 180 – 190 16 164
10 190 – 200 7 171
SUMAS 171
Se tienen 171 datos en total, por lo tanto n = 171. Precedemos a realizar n/2 para obtener el renglón o
intervalo donde se encuentra la mediana.
𝒏 𝟏𝟕𝟏
= = 𝟖𝟓. 𝟓
𝟐 𝟐
Por lo tanto se debe buscar el primer renglón o intervalo donde Fa pase de 85.5, tomando esto en
cuenta, tenemos que el intervalo que contiene a la mediana es el número 6.
51
Del intervalo 6 se obtienen los siguientes valores
L= 150
𝒏
= 85.5
𝟐
Fa = 64
Fi = 33
c= 10
𝒏
− 𝑭𝒂
=𝑳+ 𝟐 𝒄
𝑭𝒊
85.5 − 64
= 150 + 10
33
= 150 + 0.6515 10
= 150 + 6.515
= 156.515
52
Ejercicios
No. de INTERVALO Fi Fa
Intervalo
1 40 – 42 5
2 42 – 44 12
3 44 – 46 21
4 46 – 48 27
5 48 – 50 31
6 50 – 52 35
7 52 – 54 21
8 54 – 56 14
No. de INTERVALO Fi Fa
Intervalo
1 10 – 19 13
2 20 – 29 43
3 30 – 39 28
4 40 – 49 24
5 50 – 59 12
6 60 – 69 6
7 70 – 79 5
8 80 – 89 2
53
Actividad de cierre de unidad
No. de INTERVALO Fi Fa Mi Fi Mi
Intervalo
1 39 – 39 2
2 40 – 49 1
3 50 – 59 7
4 60 – 69 9
5 70 – 79 17
6 80 – 89 19
7 90 – 99 6
No. de INTERVALO Fi Fa Mi Fi Mi
Intervalo
1 0–4 5
2 5–9 40
3 10 – 14 80
4 15 – 19 124
5 20 – 24 234
6 25 – 29 82
7 30 – 34 25
8 35 – 39 10
54
Unidad IV Medidas de Dispersión
• Rango
• Desviación Media
• Varianza
• Desviación Estándar o típica
• Coeficiente de Variación
• Medidas de Sesgo
55
Medidas de Dispersión
No basta con tener las medidas de tendencia
central para un conjunto de datos, es necesario
contar con otra medida estadística, la cual indica el
comportamiento adicional para dicho conjunto; ya
que la media, mediana y moda solo indican valores
centrales de la distribución.
Rango
Es la medida de dispersión mas simple y se obtiene como la diferencia del dato mayor menso el dato
menor.
Dato Mayor
Rango =
Menor
Ejemplo
123 125 156 189 187 145 136 124 112 106 109 147
114 145 146 158 196 192 137 158 145 81 109 152
115 147 145 146 136 125 108 136 105 136 158 200
200
Rango =
105
95 RANGO
Este resultado nos indica que existen 95 datos de separación entre el mayor y el menor de los datos.
56
Desviación Media
Es el promedio de los valores absolutos de las desviaciones de los datos con respecto a la media. Indica
en promedio el número de unidades en que cada dato se encuentra alejado de la media.
𝒙𝒊 −
𝑫𝑴 =
𝒏
Donde:
DM Desviación Media
Ejemplo
4 14 12 8 12 6 16 8
Determinamos la media.
𝑿𝒊
=
𝒏
= 4 + 14 + 12 + 8 +12 + 6 + 16 + 8
8
= 10
57
la desviación media es:
𝑿𝒊 −
𝑫𝑴 =
𝒏
𝟒 − 𝟏𝟎 + 𝟏𝟒 − 𝟏𝟎 + 𝟏𝟐 − 𝟏𝟎 + 𝟖 − 𝟏𝟎 + 𝟏𝟐 − 𝟏𝟎 + 𝟔 − 𝟏𝟎 + 𝟏𝟔 − 𝟏𝟎 + 𝟖 − 𝟏𝟎
𝑫𝑴 =
𝟖
−𝟔 + 𝟒 + 𝟐 + −𝟐 + 𝟐 + −𝟒 + 𝟔 + −𝟐
𝑫𝑴 =
𝟖
𝟔+ 𝟒+𝟐+𝟐+𝟐+𝟒+𝟔+𝟐
𝑫𝑴 =
𝟖
𝑫𝑴 = 𝟑. 𝟓
Este valor nos indica que en promedio cada dato se encuentra 3.5 unidades alejado de la media.
𝑭𝒊 𝑴 𝑰 −
𝑫𝑴 =
𝒏
Donde:
DM Es la desviación media
58
Ejemplo
INTERVALO Fi
10 – 20 5
20 – 30 12
30 – 40 22
40 – 50 27
50 – 60 36
60 – 70 30
70 – 80 33
80 – 90 22
90 – 100 13
Para comenzar el proceso, se debe obtener el valor de la media como se realizó en la unidad anterior.
INTERVALO Fi Mi Fi MI
10 – 20 5 15 75
20 – 30 12 25 300
30 – 40 22 35 770
40 – 50 27 45 1215
50 – 60 36 55 1980
60 – 70 30 65 1950
70 – 80 33 75 2475
80 – 90 22 85 1870
90 – 100 13 95 1235
SUMAS 200 11870
11870
=
200
= 59.35
59
Ahora se agregan dos columnas con encabezado Mi - y | Mi - |
INTERVALO Fi Mi Fi MI Mi - |Mi - |
10 – 20 5 15 75 -44.35 44.35
20 – 30 12 25 300 -34.35 34.35
30 – 40 22 35 770 -24.35 24.35
40 – 50 27 45 1215 -14.35 14.35
50 – 60 36 55 1980 -4.35 4.35
60 – 70 30 65 1950 5.65 5.65
70 – 80 33 75 2475 15.65 15.65
80 – 90 22 85 1870 25.65 25.65
90 – 100 13 95 1235 35.65 35.65
SUMAS 200 11870
Por último se agrega una nueva columna con encabezado Fi | Mi - | y se obtiene la suma de dicha
columna.
𝑭𝒊 𝑴 𝑰 −
𝑫𝑴 =
𝒏
𝟑𝟒𝟐𝟕. 𝟒
𝑫𝑴 =
𝟐𝟎𝟎
𝑫𝑴 = 𝟏𝟕. 𝟏𝟑𝟕
60
Ejercicios
61
Varianza
Es el promedio de los cuadrados de las desviaciones de los
datos con respecto a la media. Su valor indica la forma en que
están distribuidos los datos con respecto a la media.
𝟐
𝟐
𝒙𝒊 −
𝝈 =
𝒏
Donde:
𝝈𝟐 Es la varianza
62
Ejemplo
12 25 8 15 5 18 26 14 9 10
Determinamos la media.
𝑿𝒊
=
𝒏
= 12 + 25 + 8 +15 + 5 + 18 + 26 + 14 + 9 + 10
10
= 14.2
la varianza es:
𝟐
𝒙𝒊 −
𝝈𝟐 =
𝒏
𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐
𝟏𝟐 − 𝟏𝟒. 𝟐 + 𝟐𝟓 − 𝟏𝟒. 𝟐 + 𝟖 − 𝟏𝟒. 𝟐 + 𝟏𝟓 − 𝟏𝟒. 𝟐 + 𝟓 − 𝟏𝟒. 𝟐 + 𝟏𝟖 − 𝟏𝟒. 𝟐 + 𝟐𝟔 − 𝟏𝟒. 𝟐 + 𝟏𝟒 − 𝟏𝟒. 𝟐 + 𝟗 − 𝟏𝟒. 𝟐 + 𝟏𝟎 − 𝟏𝟒. 𝟐
𝝈𝟐 =
𝟏𝟎
𝟒𝟒𝟑. 𝟔
𝝈𝟐 =
𝟏𝟎 𝝈𝟐 = 𝟒𝟒. 𝟑𝟔
𝟐
𝟐
𝑭𝒊 𝑴𝒊 −
𝝈 =
𝒏
Donde:
𝝈𝟐 Es la varianza
63
Ejemplo
INTERVALO Fi
0–5 5
5 – 10 12
10 – 15 23
15 – 20 32
20 – 25 37
25 – 30 23
30 – 35 28
35 – 40 26
40 – 45 14
Para comenzar el proceso, se debe obtener el valor de la media como se realizó en la unidad anterior.
INTERVALO Fi Mi Fi MI
0–5 5 2.5 12.5
5 – 10 12 7.5 90
10 – 15 23 12.5 287.5
15 – 20 32 17.5 560
20 – 25 37 22.5 832.5
25 – 30 23 27.5 632.5
30 – 35 28 32.5 910
35 – 40 26 37.5 975
40 – 45 14 42.5 595
SUMAS 200 4895
4895
=
200
= 24.475
64
INTERVALO Fi Mi Fi MI Mi - ( Mi - )2
0–5 5 2.5 12.5 -21.97 4829.006
5 – 10 12 7.5 90 -16.97 2881.506
10 – 15 23 12.5 287.5 -11.97 1434.006
15 – 20 32 17.5 560 -6.97 486.506
20 – 25 37 22.5 832.5 -1.97 39.006
25 – 30 23 27.5 632.5 3.025 91.506
30 – 35 28 32.5 910 8.025 644.006
35 – 40 26 37.5 975 13.025 1696.506
40 – 45 14 42.5 595 18.025 3249.006
SUMAS 200 4895
Por último se agrega una nueva columna con encabezado Fi ( Mi - )2 y se obtiene la suma de dicha
columna.
𝟐
𝑭𝒊 𝑴 𝑰 −
𝝈=
𝒏
𝟐𝟏𝟖𝟒𝟒𝟖. 𝟕𝟓𝟎
𝝈=
𝟐𝟎𝟎
𝝈 = 𝟏𝟎𝟗𝟐. 𝟐4
65
Ejercicios
66
Desviación Estándar o Típica
Se define como la raíz cuadrada de la varianza, se denota por 𝝈. Tiene las mismas unidades que los
datos originales.
𝒙𝒊 − 𝟐
𝟐
𝝈 =
𝒏
𝑭𝒊 𝑴𝒊 − 𝟐
𝝈𝟐 =
𝒏
Es decir en ambos casos sólo se obtiene la raíz cuadrada de la varianza y ese es el valor de la
Desviación estándar.
Ejemplo
En estos ejemplos tomaremos los dos vistos en varianza, ya que la Desviación Estándar, es sólo sacar
la raíz cuadrada a la varianza.
DATOS NO AGRUPADOS
12 25 8 15 5 18 26 14 9 10
Determinamos la media.
𝑿𝒊
=
𝒏
= 12 + 25 + 8 +15 + 5 + 18 + 26 + 14 + 9 + 10
10
= 14.2
67
la varianza es:
𝟐
𝟐
𝒙𝒊 −
𝝈 =
𝒏
𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐 𝟐
𝟏𝟐 − 𝟏𝟒. 𝟐 + 𝟐𝟓 − 𝟏𝟒. 𝟐 + 𝟖 − 𝟏𝟒. 𝟐 + 𝟏𝟓 − 𝟏𝟒. 𝟐 + 𝟓 − 𝟏𝟒. 𝟐 + 𝟏𝟖 − 𝟏𝟒. 𝟐 + 𝟐𝟔 − 𝟏𝟒. 𝟐 + 𝟏𝟒 − 𝟏𝟒. 𝟐 + 𝟗 − 𝟏𝟒. 𝟐 + 𝟏𝟎 − 𝟏𝟒. 𝟐
𝝈𝟐 =
𝟏𝟎
𝟒𝟒𝟑. 𝟔
𝝈𝟐 =
𝟏𝟎
𝝈𝟐 = 𝟒𝟒. 𝟑𝟔
𝝈= 𝟒𝟒. 𝟑𝟔
𝝈 = 𝟔. 𝟔𝟔
DATOS AGRUPADOS
INTERVALO Fi
0–5 5
5 – 10 12
10 – 15 23
15 – 20 32
20 – 25 37
25 – 30 23
30 – 35 28
35 – 40 26
40 – 45 14
68
Para comenzar el proceso, se debe obtener el valor de la media como se realizó en la unidad anterior.
INTERVALO Fi Mi Fi MI
0–5 5 2.5 12.5
5 – 10 12 7.5 90
10 – 15 23 12.5 287.5
15 – 20 32 17.5 560
20 – 25 37 22.5 832.5
25 – 30 23 27.5 632.5
30 – 35 28 32.5 910
35 – 40 26 37.5 975
40 – 45 14 42.5 595
SUMAS 200 4895
4895
=
200
= 24.475
INTERVALO Fi Mi Fi MI Mi - ( Mi - )2
0–5 5 2.5 12.5 -21.97 4829.006
5 – 10 12 7.5 90 -16.97 2881.506
10 – 15 23 12.5 287.5 -11.97 1434.006
15 – 20 32 17.5 560 -6.97 486.506
20 – 25 37 22.5 832.5 -1.97 39.006
25 – 30 23 27.5 632.5 3.025 91.506
30 – 35 28 32.5 910 8.025 644.006
35 – 40 26 37.5 975 13.025 1696.506
40 – 45 14 42.5 595 18.025 3249.006
SUMAS 200 4895
Por último se agrega una nueva columna con encabezado Fi ( Mi - )2 y se obtiene la suma de dicha
columna.
69
INTERVALO Fi Mi Fi MI Mi - (Mi - )2 Fi (Mi - )2
0–5 5 2.5 12.5 -21.97 4829.006 24145.031
5 – 10 12 7.5 90 -16.97 2881.506 34578.075
10 – 15 23 12.5 287.5 -11.97 1434.006 32982.143
15 – 20 32 17.5 560 -6.97 486.506 15568.200
20 – 25 37 22.5 832.5 -1.97 39.006 1443.231
25 – 30 23 27.5 632.5 3.025 91.506 2104.643
30 – 35 28 32.5 910 8.025 644.006 18032.175
35 – 40 26 37.5 975 13.025 1696.506 44109.162
40 – 45 14 42.5 595 18.025 3249.006 45486.087
SUMAS 200 4895 218448.750
𝟐
𝑭𝒊 𝑴 𝑰 −
𝝈=
𝒏
𝟐𝟏𝟖𝟒𝟒𝟖. 𝟕𝟓𝟎
𝝈=
𝟐𝟎𝟎
𝝈 = 𝟏𝟎𝟗𝟐. 𝟐4
𝝈= 𝟏𝟎𝟗𝟐. 𝟐𝟒
𝝈 = 𝟑𝟒. 𝟎𝟒
70
Ejercicios
71
Coeficiente de variación
Es también llamado coeficiente dispersión, es una medida de variación relativa, se presenta en forma
de porcentaje Y su valor se obtiene mediante:
𝝈
𝑽=
Donde:
V Es el coeficiente de variación.
Su valor es útil y se emplea para comparar la variación que existe entre diferentes distribuciones de
frecuencia
Ejemplo
Y una fiesta de Halloween, en el antro A, el promedio de edades fue de 19 años y la desviación estándar
de 2.5 años, mientras que en el antro B, el promedio de edades fue de 25 años Y la desviación estándar
de cuatro años. ¿En cuál fiesta hubo menor variación de edades?
𝟐. 𝟓
𝑽=
𝟏𝟗
𝟒
𝑽=
𝟐𝟓
𝑽 = 𝟎. 𝟏𝟔 = 𝟏𝟔%
Comparando los dos valores obtenidos para el coeficiente de variación se concluye que se presentó
una menor variación de edades entre los asistentes al antro A.
72
Actividad de cierre de unidad
73
Determinar el valor de la Desviación Media, Varianza, Desviación Estándar y el Coeficiente de
variación para el siguiente conjunto de datos.
74
Actividad de Repaso
2 2
No. int Fi Fa Fr Fra Mi Fi Mi Mi - |Mi - | Fi|Mi - | (Mi - ) Fi (Mi - )
int
1 50 – 54 19
2 55 – 59 14
3 60 – 64 17
4 65 – 69 35
5 70 – 74 17
6 75 – 79 19
7 80 – 84 16
8 85 – 89 9
75
Determinar el valor de la Fa, Fr, Fra, Media, Mediana, Moda, Desviación Media, Varianza, Desviación
Estándar y el Coeficiente de variación para el siguiente conjunto de datos. Elije una grafica para
representar los datos y escribe un pequeño análisis de los mismos.
2 2
No. int Fi Fa Fr Fra Mi Fi Mi Mi - |Mi - | Fi|Mi - | (Mi - ) Fi (Mi - )
int
1 0–5 1
2 5–9 7
3 10 – 14 13
4 15 – 19 20
5 20 – 24 21
6 25 – 29 43
7 30 – 34 33
8 35 – 39 12
9 40 – 44 9
10 45 – 49 10
76
Determinar el valor de la Fa, Fr, Fra, Media, Mediana, Moda, Desviación Media, Varianza, Desviación
Estándar y el Coeficiente de variación para el siguiente conjunto de datos. Elije una grafica para
representar los datos y escribe un pequeño análisis de los mismos.
2 2
No. int Fi Fa Fr Fra Mi Fi Mi Mi - |Mi - | Fi|Mi - | (Mi - ) Fi (Mi - )
int
1 30 – 34 7
2 35 – 39 13
3 40 – 44 21
4 45 – 49 43
5 50 – 54 59
6 55 – 59 63
7 60 – 64 42
8 65 – 69 31
9 70 – 74 17
77
Determinar el valor de la Fa, Fr, Fra, Media, Mediana, Moda, Desviación Media, Varianza, Desviación
Estándar y el Coeficiente de variación para el siguiente conjunto de datos. Elije una grafica para
representar los datos y escribe un pequeño análisis de los mismos.
2 2
No. int Fi Fa Fr Fra Mi Fi Mi Mi - |Mi - | Fi|Mi - | (Mi - ) Fi (Mi - )
int
1 0–5 11
2 5–9 17
3 10 – 14 23
4 15 – 19 30
5 20 – 24 31
6 25 – 29 53
7 30 – 34 43
8 35 – 39 22
9 40 – 44 19
10 45 – 49 20
78
Unidad V Covarianza y Correlación lineal
• Datos Bivariados
• Diagrama de dispersión
• Centro de Gravedad
79
Datos Bivariados
Hasta el momento hemos estudiado algunas técnicas estadísticas aplicables a una característica de un
grupo de elementos que constituye una muestra o población, por ejemplo, el promedio de edades de
los habitantes de una región, el ingreso familiar, nivel de escolaridad, etc. Sin embargo, se puede
presentar el caso en el cual no sólo se estudia una sola característica de los elementos de la población,
sino dos o más.
En estos casos, se busca encontrar la relación que existe entre estas variables, para ello es importante
conocer el significado de datos bivariados.
Datos Bivariados Son el conjunto de valores asignados a dos variables distintas obtenidas del
mismo elemento de una población o muestra.
Estos pares ordenados sirven para establecer la relación existente entre las
variables.
Como se explicó anteriormente estos datos vi variados se presentan en forma de coordenadas, Donde
a la primera variable se la sin el valor de x y a la segunda variable el valor de y. Estos datos normalmente
se presentan en tablas, estas pueden presentarse de manera horizontal o vertical.
80
Ejemplo
Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
No. De Faltas
5 11 5 9 8 10 6 1 3 0 4 7 7 9 1
x
Calificación
8 6 7.5 8 8.5 5 8 10 9 9.5 8 6.5 7.5 6 9
y
Diagrama de Dispersión
Una forma de representar a los datos bivariados es mediante este diagrama, el cual es la
representación gráfica de todos los pares ordenados en un sistema coordenado rectangular.
Ejemplo
7
7 6 8 6
5
8 1 10 4
9 3 9 3
2
10 0 9.5 1
11 4 8 0
12 7 6.5 0 1 2 3 4 5 6 7 8 9 10 11 12
13 7 7.5 No. De Faltas
14 9 6
15 1 9
81
Ejercicio
No. De x y
Dato
1 12 5
2 13 6
3 5 13
4 3 12
5 6 7
6 7 10
7 12 12
8 6 10
9 8 9
10 6 9
11 9 8
12 10 6
13 13 12
(𝑥, 𝑦)
Donde:
𝒙 Es la Media de x
𝒚 Es la Media de y
82
Ejemplo
Calificación
6 10 5 8
7
7 6 8 6
8 1 10 5
4
9 3 9 3
10 0 9.5 2
1
11 4 8 0
12 7 6.5 0 1 2 3 4 5 6 7 8 9 10 11 12
13 7 7.5 No. De Faltas
14 9 6
15 1 9
𝑥x 𝑦x
𝑥= 𝑥=
𝑛 𝑛
86 116.5
𝑥= 𝑥=
15 15
𝑥 = 5.733 𝑥 = 7.766
Se ubica esta coordenada en el diagrama de dispersión ( en este ejemplo se utilizó la marca para
ubicar el centroide en el diagrama de dispersión.
83
Ejercicios
No. De x y
Dato
1 5 5
2 4 -2
3 3 4
4 9 6
5 6 2.1
6 7 4.3
7 2 -6
8 1 1.5
9 4 3.2
10 6 7.8
11 8 4.6
12 3 -1.5
13 4 2.3
No. De x y
Dato
1 3 5.1
2 5 4.5
3 2 8.1
4 1 6.0
5 0 8.5
6 2 7.0
7 5 3.0
8 5 4.0
9 1 9.0
10 6 7.8
84