Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CAP 1-Fundamentos de Estadística Descriptiva e Inferencial Paraingenieria y Ciencias PDF
CAP 1-Fundamentos de Estadística Descriptiva e Inferencial Paraingenieria y Ciencias PDF
Objetivos
1
2. Capítulo 1
Introducción
D
esde tiempos muy remotos el ser humano ha tenido que enfrentar al análisis de una gran
cantidad de datos o información referentes a los problemas o actividades de sus
comunidades. Por ejemplo, desde los comienzos de la civilización ya se utilizaban
representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de
cuevas para contar el número de personas, animales o cosas. Hacia el año 3000 a.C. los babilonios
usaban pequeñas tablillas de arcilla para recopilar datos sobre la producción agrícola y los géneros
vendidos o cambiados mediante el trueque. Mucho antes de construir las pirámides, los egipcios
analizaban los datos de la población y la renta del país.
Otro ejemplo muy claro de la recopilación y análisis de datos lo llevo a cabo el Imperio Romano,
quien fue el primer gobierno que al verse en la necesidad de mantener un control sobre sus esclavos y
riquezas recopiló una gran cantidad de datos sobre la población, superficie y renta de todos los
territorios bajo su control.
Siguiendo con la historia de la recopilación de datos encontramos que a mediados del primer
milenio, debido al gran crecimiento de las poblaciones y, para poder tener un control sobre éstas,
comenzaron a efectuarse diferentes censos poblacionales, como los llevados a cabo en la edad media
en Europa. Por ejemplo, los reyes caloringios1 Pipino el Breve y Carlomagno ordenaron hacer
estudios minuciosos de las propiedades de la Iglesia en los años 758 y 762, respectivamente.
Conforme pasaba el tiempo la recopilación y análisis de datos comenzaban a tener otro fin a
parte de los censos y conocimiento de propiedades. Por ejemplo, en Inglaterra a principios del siglo
XVI se realizó el registro de nacimientos y defunciones con el cual en 1662 apareció el primer estudio
de datos poblacionales, titulado Observations on the London Bills of Mortality (Comentarios sobre las
partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de
Breslau, en Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como
base para la primera tabla de mortalidad. Finalmente en el siglo XIX, con la generalización del Método
Científico para estudiar todos los fenómenos de las ciencias naturales y sociales, los investigadores
aceptaron la necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las
descripciones verbales.
Así, tomando en cuenta los problemas que se tienen en el manejo de datos para obtener
información sobre una población o muestra en estudio, el Capítulo da inicio con las definiciones de
Estadística y Estadística descriptiva, después se habla sobre las poblaciones, muestras y técnicas de
muestreo. Posteriormente, se define y ejemplifica que es un parámetro y un estadístico. Se habla sobre
las medidas centrales y de desviación más comunes en la estadística descriptiva (sin agrupamiento de
datos), en esta parte también se habla sobre los cuantiles. Finalmente, se estudia el coeficiente de
variación para comparación de datos.
1.1 ESTADÍSTICA
La palabra statistik proviene de la palabra italiana statista (que significa “estadista”). Fue utilizada por
primera vez por Gottfriend Achenwall (1719-1772), un profesor de Marborough y de Göttingen. El
Dr. W. Zimmerman introdujo el término statistics (estadística) a Inglaterra. Su uso fue popularizado
1
Carolingia, Dinastía, también llamada Carlovingia, dinastía de reyes francos que gobernaron un vasto territorio en Europa
occidental desde el siglo VII hasta el siglo X d.C.; la dinastía toma su nombre de su más renombrado miembro, Carlomagno
2
Estadística Descriptiva para datos no agrupados. 3
por sir John Sinclair en su obra Statistical Account of Scotland 1791-1799 (informe estadístico sobre
Escocia 1791-1799). Sin embargo, mucho antes del siglo XVIII la gente ya utilizaba y registraba
datos.
Después de revisar la introducción del Capítulo, estaremos de acuerdo que el ser humano se ha
visto en la necesidad de crear una ciencia que reduzca la información a valores numéricos para la
mejor y fácil interpretación de los fenómenos que lo rodean, dando a ésta el nombre de Estadística.
¿Qué entenderemos por Estadística?
Definición 1.1 Estadística
Estadística, rama de las matemáticas que proporciona métodos para reunir, organizar y analizar
información y usar ésta para obtener diversas conclusiones que pueden ayudar a resolver
problemas en la toma de decisiones y el diseño de experimentos.
¿Qué describe actualmente la Estadística?
En nuestros días, la estadística se ha convertido en un método efectivo para describir con
exactitud los valores de datos económicos, políticos, sociales, psicológicos, químicos, biológicos,
físicos, etc. y sirve como herramienta para relacionar y analizar dichos datos. Por tales razones, la
Estadística se divide en diferentes campos entre los más aplicados y que tienen una importancia
relevante en nuestros días tenemos:
• Estadística Descriptiva.
• Estadística Inferencial.
• Regresión lineal.
• Diseños de experimentos.
• Análisis multivariado.
• Estadística no paramétrica.
• Estadística espacial.
En el presente texto estudiaremos:
• Estadística Descriptiva.
• Estadística Inferencial.
• Regresión lineal simple.
La primera de ellas se ha dividido en dos partes: datos no agrupados y datos agrupados.
La estadística descriptiva para datos no agrupados se estudia en el presente Capítulo, mientras
que en el caso de datos agrupados la veremos en el siguiente. Con respecto a la Estadística Inferencial
la revisaremos en los capítulos del 3 al 9. Finalmente, en el Capítulo 10 veremos la Regresión simple.
1.2 POBLACIÓN Y MUESTRA
La materia prima de la estadística consiste en conjuntos de números obtenidos al contar o medir
elementos. Por lo tanto, al recopilar datos estadísticos debemos tener especial cuidado, para garantizar
que la información sea completa y correcta, por consiguiente, el primer problema para los estadísticos
reside en determinar qué información y en qué cantidad se deberá reunir. Por ejemplo, en la practica la
dificultad al llevar a cabo un censo reside en obtener el número de habitantes de forma completa y
exacta; de la misma manera cuando un físico quiere contar el número de colisiones por segundo entre
3
4. Capítulo 1
las moléculas de un gas, debe empezar determinando con precisión la naturaleza de los objetos a
contar.
¿Cómo se obtienen los conjuntos de datos en la Estadística?
Debido a que la naturaleza de los fenómenos que podemos analizar varía mucho, es necesario
dar una serie de definiciones sobre los conjuntos de datos que vamos a revisar.
Definición 1.2
Se llama Población al conjunto de todos los elementos de un tipo particular cuyo conocimiento
es de nuestro interés.
Cada uno de los elementos que intervienen en la definición de población es un individuo u
objeto. Los elementos de la población se denominan así, debido a que originalmente el campo de
actuación de la estadística fue la demografía.
La información disponible para un estudio, con frecuencia, consta de una porción o subconjunto
de la población. Por tal razón, introducimos un segundo concepto, “Muestra” de una Población.
Definición 1.3
Se llama Muestra a cualquier subconjunto de la población.
EJEMPLOS 1
1).- Si el conjunto de datos en interés está constituido por todos los estudiantes de licenciatura en la
UPIICSA. En este caso, cada uno de los estudiantes será un individuo estadístico mientras que el
conjunto de todos estos estudiantes será la población y una muestra podría ser el conjunto de todos
los estudiantes del cuarto semestre de la licenciatura en administración.
2).- Si el conjunto de datos en interés está constituido por todos los promedios de los grupos de
licenciatura de la Universidad Autónoma de Chapingo. En este caso, cada uno de los grupos será
un individuo estadístico, mientras que el conjunto de todos estos grupos será la población y una
muestra podría ser el conjunto de todos los grupos del quinto semestre de la licenciatura en
economía.
3).- El estudio de ciertos experimentos químicos. En este caso, cada uno de los experimentos será
un individuo estadístico y el conjunto de todos los posibles experimentos en esas condiciones será
la población, mientras que una muestra podría ser, un conjunto de resultados experimentales bajo
ciertas condiciones.
4).- El conjunto de valores del coeficiente intelectual de los alumnos de nivel medio superior en la
UNAM. En este caso, los individuos son los estudiantes de nivel medio superior en la UNAM.
5).- El conjunto de mediciones, en toneladas, de la carga máxima soportada por los cables de acero
producidos por la compañía CM. En este caso, los individuos se refieren a los cables producidos
por la compañía durante un período determinado.
1.2.1 CARACTERES Y VARIABLES ESTADÍSTICAS
Al definir una población se habló sobre sus elementos a los que se llamamos individuos, además en los
ejemplos 1 se nota que éstos pueden ser descritos por una o varias de sus propiedades o
características.
4
Estadística Descriptiva para datos no agrupados. 5
Definición 1.4
Se llama carácter de un individuo u objeto a cualquier característica o propiedad por medio de
la cual se puede clasificar y estudiar.
EJEMPLOS 2
1).- Si los individuos son personas, entonces el sexo, el estado civil, el número de hermanos o su
estatura son caracteres.
2).- Si el individuo es una reacción química, entonces el tiempo de la reacción, la cantidad de
producto obtenido o si éste es ácido o básico son posibles caracteres.
Un carácter puede ser:
Cualitativo o no métrico, si no admite medición numérica.
Cuantitativo o métrico, si es contable o medible numéricamente.
¿Qué es un carácter cualitativo y un carácter cuantitativo?
Los datos no métricos o caracteres cualitativos son atributos, características o propiedades
categóricas que identifican o describen a un sujeto. Describen diferencias en tipo o clase indicando la
presencia o ausencia de una característica propia. Por ejemplo, si una persona es mujer, se excluye que
sea hombre. Es decir, no hay cantidad de “género”, sólo la condición de ser mujer u hombre. Por otro
lado, los datos métricos o caracteres cuantitativos están constituidos de tal forma que los sujetos
pueden estar identificados por diferencias entre sus cantidades. Es decir, las variables medidas
métricamente reflejan cantidades relativas. Por tal razón, las medidas métricas son las más apropiadas
para casos que involucren cantidad o magnitud, tales como la demanda de trabajo, el nivel de ozono en
la atmósfera, etc.
¿Qué es una variable estadística?
Los distintos valores que puede tomar un carácter cuantitativo configuran una variable
estadística. Las variables estadísticas existen de dos tipos: Discretas y continuas.
Definición 1.5
Una variable estadística es discreta cuando sólo permite valores aislados, como pueden ser
números enteros.
Por ejemplo, en cierta población la variable que representa al número de hermanos puede tomar
los valores: 0, 1, 2, 3, 4 y 5. Este tipo de variables se caracterizan por obtenerse mediante un proceso
de conteo (ver semejanza con las variables aleatorias discretas de la Teoría de las Probabilidades).
Definición 1.6
Una variable estadística es continua cuando admite todos los valores de un intervalo.
Por ejemplo, en cierta población la variable que representa la estatura de una persona adulta que
se mide, puede toma cualquier valor en el intervalo 135–215 cm. Otro ejemplo es la variable
temperatura de una persona, la cual puede tomar cualquier valor en el intervalo 20-41 o C . Este tipo
de variables se caracterizan por obtenerse mediante mediciones (ver semejanzas con las variables
aleatorias continuas de la Teoría de las Probabilidades).
5
6. Capítulo 1
6
Estadística Descriptiva para datos no agrupados. 7
NOTA
El uso adecuado de las diferentes escalas de medición es muy importante para que el
estudiante o el investigador identifiquen la escala de medición de cada variable empleada,
de tal manera que no estén utilizando datos no métricos como si fueran métricos.
7
8. Capítulo 1
El proceso que sigue la Estadística Descriptiva para el estudio de una población o muestra consta
de los siguientes pasos:
EJERCICIOS 1.1
En cada caso indique la sujeto estadístico, observación, población, discuta sobre una posible muestra,
indique el carácter de interés y el tipo del carácter.
1).- El director de una escuela primaria lleva un control de la edad en años de los alumnos de la escuela.
2).- El director de una escuela primaria mide las estaturas de los alumnos de la escuela.
3).- El supervisor de una línea de producción de botes de cerveza lleva el control sobre la cantidad de
líquido envasada, con la finalidad de detectar la cantidad de líquido envasada por bote al día.
4).- El supervisor de una línea de producción de botes de cerveza lleva el control sobre la cantidad de
botes envasados en la línea de producción que estén en alguno de los tres rangos (llenado alto, medio y
bajo) establecidos por el departamento de control de calidad de la envasadora.
5).- El gerente de mercadotecnia de una compañía recibe los informes sobre el volumen de ventas diarias
de la compañía durante un año y le interesa conocer su utilidad diaria.
6).- El gerente de mercadotecnia de una compañía recibe los informes sobre el volumen de ventas diarias
de la compañía durante un año.
En cada uno de los ejercicios indique el tipo de escala que se utilizaría para llevar a cabo un estudio
estadístico.
7).- En el caso de los promedios de los estudiantes de licenciatura en la Universidad, el carácter se refería
a la calificación promedio del estudiante y se trata de un carácter de tipo métrico continuo.
8).- En el caso de los promedios de los grupos de licenciatura en la Universidad, el carácter se refería a la
calificación promedio de los grupos de licenciatura de la Universidad y se trata de un carácter de tipo
métrico continuo.
9).- En el caso del gerente de mercadotecnia de una compañía sobre el volumen de ventas diarias de la
compañía durante un año, el carácter se refería al volumen de ventas al día y se trata de un carácter de
tipo métrico discreto.
10).- En el caso del gerente de mercadotecnia de una compañía sobre el volumen de ventas diarias de la
compañía durante un año, en donde interesaba la utilidad diaria, el carácter se refería a la utilidad y se
trata de un carácter de tipo métrico discreto.
8
Estadística Descriptiva para datos no agrupados. 9
11).- Cuando los individuos son personas, entonces el sexo, el estado civil son caracteres de tipo
cualitativo.
12).- Si el individuo es una reacción química, entonces si éste es ácido o básico se trata de un carácter de
tipo no métrico.
1.3 TÉCNICAS DE MUESTREO
Los estadísticos enfrentan un problema complejo cuando, por ejemplo, toman una muestra para un
sondeo de opinión o una encuesta electoral, puesto que seleccionar una muestra capaz de representar
con exactitud las preferencias del total de la población no es tarea fácil. Más aún un buen muestreo
debe proporcionar resultados más oportunos que permitan la obtención rápida de información de toda
una población o sobre un proceso variable.
Además de lo anterior, veremos que el buen muestreo es indispensable para los problemas
estadísticos, en donde el estudio de toda la población resulta ser muy caro, o en los casos en que la
información se destruye, el estudio de toda la población no sería factible. Por ejemplo, en el control de
calidad sobre la vida media de las bombillas, se llevan a cabo pruebas de tipo destructivo puesto que la
muestra se analiza hasta que las bombillas dejen de funcionar.
En muchas situaciones el muestreo produce resultados más exactos que en un censo (un censo se
lleva a cabo cuando es indispensable analizar todos los casos de una población), dado que la pesada
carga de trabajo de procesar la información de un censo produce una gran fatiga, que a su vez, puede
ser la responsable de prácticas poco adecuadas por parte de los investigadores. Asimismo, la población
puede ser muy dinámica y no mantenerse en un estado el tiempo necesario para medir sus
características.
Por otro lado, existen infinidad de casos de laboratorio o experimentos, que no tienen todos los
datos de la población, ya que éstos ocurren sólo con las repeticiones de los experimentos que pueden
ser infinitas.
¿Qué entenderemos por muestreo?
Definición 1.8
El muestreo es simplemente un conjunto de métodos para obtener muestras.
¿Qué buscamos con el muestreo?
Con el muestreo buscamos con el mínimo costo obtener la máxima información sobre las
medidas de la población (parámetros). En otras palabras buscamos con una muestra pequeña obtener
la mayor información posible de los parámetros.
Al usar un muestreo se deben tomar las precauciones necesarias para asegurar la aleatoriedad de
las muestras. Por consiguiente, existen diferentes técnicas para llevar a cabo un buen muestreo.
Generalmente, los investigadores y estudiantes de otras áreas aplicadas requieren conocer el
tamaño de una muestra ideal en su problema, por tal razón cabe aclarar que en estos resúmenes sólo se
menciona en que consisten los métodos. Para determinar los tamaños de muestra que se recomienda
usar en cada método, sugerimos consultar alguna de las literaturas mencionadas al final del libro sobre
el tema de muestreo, ya que éstos requieren de otros conceptos que quedan fuera de las posibilidades
del texto. Pero en forma general podemos decir, que si las poblaciones son homogéneas (la
característica de interés es poco variable) no existe problema para realizar o diseñar un muestreo, ya
que basta con un muestreo pequeño. Sin embargo, si la población es heterogénea, entonces se tendrán
9
10. Capítulo 1
ciertas dificultades para decidir sobre que tipo de muestreo debe emplearse. De acuerdo a esto último
podemos decir que es necesario preparar gente que sea capaz de muestrear en poblaciones
heterogéneas.
A continuación revisaremos un breve resumen de las técnicas más comunes en los muestreos
probabilísticos.
1.3.1 MUESTREO ALEATORIO SIMPLE
Cuando hablamos de un muestreo aleatorio simple debe entenderse un muestreo sin reemplazo. El
muestreo aleatorio simple se recomienda cuando las características de interés presentan gran
homogeneidad, pues en caso contrario su uso requeriría muestras “grandes”, para lograr una precisión
aceptable. Además, cuando se presenta cierta heterogeneidad en los datos podrían seleccionarse
“muestras indeseables”.
El muestreo aleatorio simple es aquel método que asigna una probabilidad igual de selección a
todas y cada una de las muestras posibles y distintas. Siendo esta probabilidad 1 C nN , donde N
representa al tamaño de la población y n tamaño de la muestra.
Una forma equivalente de seleccionar la muestra es elegir las unidades de una en una y en forma
consecutiva, dando o asignando una probabilidad de selección a las unidades en cada caso.
EJEMPLO 7
De la población estudiantil de la facultad de Ciencias de la UNAM seleccionamos aleatoriamente una
muestra de 50 estudiantes para encuestar y obtener cierta información. En estos casos para respetar la
aleatoriedad podemos llevar a cabo la obtención de la muestra de diferentes formas, la más común
consiste en asignar un número diferente a cada estudiante y posteriormente con la ayuda de una tabla
de números aleatorios elegir un bloque de tamaño 50 de dicha tabla y, proceder a realizar las
entrevistas a los alumnos seleccionados.
1.3.2 MUESTREO ESTRATIFICADO
El muestreo estratificado consiste en lo siguiente:
1) La población se divide en subpoblaciones denominadas “Estratos”.
2) Se selecciona una muestra en forma independiente de cada estrato. Si las muestras por estrato
se eligen con el muestreo aleatorio simple, entonces el muestreo se denomina Muestreo
Aleatorio Estratificado.
3) Los estimadores para los parámetros de la población completa se proponen como una
combinación de los estimadores correspondientes a los parámetros de los estratos.
Este método de muestreo es flexible en cuanto a la selección de la muestra en cada estrato. Aquí
es válido señalar que los estratos se construyen sin importar que sean geográficamente contiguos o no.
Además el tamaño de la población completa debe ser conocido, así como el tamaño de cada estrato.
El muestreo estratificado es ampliamente usado por varias razones:
• Puede proporcionar estimadores (ver Capítulo 5) para la población que sean más precisos (esto
se logra construyendo estratos que sean lo más homogéneos posibles dentro de ellos).
• Proporciona información sobre los estratos.
• Permite una mejor organización del muestreo.
10
Estadística Descriptiva para datos no agrupados. 11
11
12. Capítulo 1
por ejemplo, estaciones del metro. Posteriormente, elegimos una muestra de las estaciones (podría ser
con el muestreo anterior sistemático) y, procedemos a realizar la encuesta a los usuarios en las
estaciones seleccionadas. Esta forma de muestreo disminuye considerablemente el costo de la muestra
ya que no se requiere numerar con anterioridad las unidades poblacionales.
NOTA
El ejemplo anterior del muestreo por conglomerados es de una etapa, pero en general
existen conglomerados de varias etapas. Para un estudio más detallado del tema el
estudiante puede consultar alguno de los textos: “Elementos de Muestreo” de Richard L.
Scheaffer y William Mendenhall, del Grupo Editorial Iberoamérica, o el de Muestreo
Diseño y análisis, de Sharon L. Lohr, de la editorial Thomson.
A continuación ilustramos el uso de las tablas de números aleatorios, para facilitar el muestreo.
1.3.5 USO DE TABLAS DE NÚMEROS ALEATORIOS
Hemos visto que las muestras aleatorias se pueden obtener a partir de una tabla de números aleatorios.
Supóngase que tenemos una población de 1000 individuos y queremos hacer un muestreo de 10 de
éstos. En dicho caso, primero asignamos un número del 000 al 999 a cada miembro de la población y,
posteriormente elegimos de la tabla de números aleatorios un bloque de 10 de ellos. Debido a que la
población es de tamaño 1000 de los números que aparecen en la tabla se consideran sólo sus tres
últimas cifras. Por ejemplo, sean los siguientes números aleatorios elegidos de una tabla.
9173061
0746897
7392108
0015542
4757975
0195093
8122135
7996818
1321499
0559605
De tal forma que eligiendo sus tres últimas cifras obtenemos los números que conformarán la
muestra: 061, 897, 108, 542, 975, 093, 135, 818, 499 y 605. Posteriormente, procedemos a seleccionar
de la población a los individuos que les corresponden estos números.
¿Qué haría para realizar un muestreo aleatorio de 10 personas con una población de 650 individuos?
De forma similar que en el caso de las mil personas, primero se asignaría un número a cada
elemento de la población desde 000 hasta 649 y posteriormente elegiríamos un bloque de números
aleatorios, donde las tres primeras cifras sean menores o iguales a 649. En caso de que el número
seleccionado sea mayor a 649, se desecha y se elige otro de la tabla de números aleatorios.
¿Cómo saber en qué forma elegir el bloque de números aleatorios?
La manera de seleccionar el bloque de números aleatorios es indiferente, siempre y cuando se
elijan los números con un criterio aleatorio. Algunas formas de elegir el bloque de números aleatorios
son: Bloques verticales continuos, o con saltos fijos y Bloques horizontales continuos o con saltos fijos.
12
Estadística Descriptiva para datos no agrupados. 13
2
Para un estudio más detallado de los parámetros y estadísticos, ver el Capítulo 3, sobre las distribuciones muestrales.
3
En el Capítulo 3 veremos una definición más precisa de Estadístico media.
13
14. Capítulo 1
De forma similar se simbolizará por la letra griega miu (µ4 ) al Parámetro media para las
poblaciones finitas, x1 , x 2 , K , x N y, lo llamaremos Media poblacional o Parámetro media del
conjunto a:
x + x2 + L + x N 1 N
µ= 1
N
=
N i =1
xi . ∑
EJEMPLO 10
Un fabricante de Pistones toma una muestra aleatoria de 20 de éstos, para medir su diámetro interno
promedio. Los diámetros, en centímetros, que el fabricante obtuvo están dados a continuación.
Calcule el diámetro medio de dichos pistones.
10.1 10.1 9.8 9.7 10.3 9.9 10.0 9.9 10.2 10.1
9.9 9.9 10.1 10.3 9.8 9.7 9.9 10.0 10.0 9.8
Solución
Como se trata de una muestra utilizamos la fórmula de la definición 1.9.
x=
1
[10.1 + 10.1 + 9.8 + 9.7 + 10.3 + 9.9 + 10 + 9.9 + 10.2 + 10.1 +
20
+ 9.9 + 9.9 + 10.1 + 10.3 + 9.8 + 9.7 + 9.9 + 10 + 10 + 9.8] = 9.975
La media representa un valor promedio de todas las observaciones y por consiguiente cada uno
de los datos influye de igual forma en el resultado de ésta. Por tal razón, en cuando se tienen datos que
se alejan considerablemente del resto, el valor promedio encontrado no refleja la realidad del caso. Ver
el ejemplo siguiente.
EJEMPLO 11
Supóngase que se quiere estimar el sueldo promedio de los trabajadores de una fábrica eligiendo
aleatoriamente a 10 de éstos y obteniendo los siguientes resultados:
Dato x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
Sueldo 2,000 2,200 2,500 2,200 1,800 25,000 2,400 2,300 2,800 2,400
x=
1
[2000 + 2200 + 2500 + 2200 + 1800 + 25000 + 2400 + 2300 + 2800 + 2400] = 4,560
10
donde, obviamente el estadístico no refleja una realidad de los datos, puesto que el sueldo de 25,000 es
mucho mayor a los demás, influyendo considerablemente en el valor promedio.
En situaciones como la anterior el uso del valor promedio no es tan acertado de tal forma que se
suele recurrir a otra medida de tipo central como las siguientes dos.
1.5.2 LA MEDIANA
De lo expuesto al final de la subsección anterior comprendemos la necesidad de introducir otro tipo de
medida central con la cual los valores muy extremosos, con respecto al resto, no tengan una influencia
En la Teoría de las probabilidades se ha dado una definición más general para µ, la cual se puede aplicar, tanto a,
4
poblaciones finitas como infinitas. La definición que aquí se está tratando sólo se refiere a las poblaciones finitas.
14
Estadística Descriptiva para datos no agrupados. 15
tan marcada como en la media. Debido a su naturaleza a dicha medida se le conoce con el nombre de
Mediana y la definiremos a continuación.
Definición 1.10
La mediana de un conjunto de datos es el valor central de los datos cuando éstos se han
ordenado en forma no decreciente en cuanto a su magnitud.
Cálculo de la mediana
Sea el conjunto de datos muestrales x1 , x 2 , K , x n , la Mediana muestral o Estadístico mediana del
conjunto la simbolizamos por ~ x (x tilde) y se obtiene ordenando primeramente en forma no
decreciente los n datos, renombrando según su posición por medio de tildes de la siguiente forma:
~
x ≤~ x ≤K≤ ~ x .
1 2 n
Posteriormente, localizamos el punto medio de los datos ordenados, pudiendo ocurrir alguno de los
siguientes dos casos:
• Cuando la cantidad de observaciones es impar: el punto medio del ordenamiento es el dato
n +1
que se encuentra en la posición .
2
• Cuando la cantidad de datos es par: en este caso resultan dos datos medios localizados en las
n n
posiciones y + 1 , por lo que la mediana se considera el promedio de estos datos medios.
2 2
Finalmente se resume el cálculo de la mediana con la siguiente fórmula:
~
x n +1 , cuando la cantidad de datos es impar.
2
~
x = ~ xn + ~ xn
+1
2 2
, cuando la cantidad de datos es par.
2
De forma similar definimos el parámetro mediana, sea el conjunto de datos poblacionales
x1 , x 2 , K , x N , se llama Mediana poblacional o parámetro mediana del conjunto al parámetro que se
simboliza por la letra griega miu con una tilde, µ~ , y se calcula:
15
16. Capítulo 1
Dato x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
Sueldo 2,000 2,200 2,500 2,200 1,800 25,000 2,400 2,300 2,800 2,400
Sueldos 1,800 2,000 2,200 2,200 2,300 2,400 2,400 2,500 2,800 25,000
Datos ~ ~ ~ ~ ~ ~ ~ ~ ~ ~
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
ordenados
La cantidad de datos es 10 , éste es un número par. Luego, la mediana muestral se calcula con
n 10 n 10
el promedio de los datos ordenados en las posiciones = = 5 y +1= + 1 = 6 . Es decir,
2 2 2 2
~
x5 + ~
x 6 2300 + 2400
~
x= = = 2350 .
2 2
Podemos observar que el valor $25,000 que sobresalía con respecto a todos los demás sueldos no
influye en la mediana. Puesto que si en lugar de $25,000, elegimos $5,000 o $100,000, el sueldo
medio de los 10 trabajadores seguirá siendo $2,350. Por tal razón, decimos que la mediana es una
medida central insensible de los datos.
1.5.3 LA MODA
En algunos estudios es necesario encontrar el valor central de un conjunto de datos, en donde la medida
de interés está basada en la repetición de éstos. Por esta razón, ninguna de las dos medidas vistas es
conveniente emplear. Debido a su naturaleza a la medida sobre la que hacemos referencia se le da el
nombre de Moda y la definimos a continuación.
Definición 1.11
La moda de un conjunto de datos es el valor de éstos que se presenta en su distribución con
mayor frecuencia.
Con respecta a la notación de la moda, a diferencia de las dos medidas centrales anteriores, no
existe notación estándar. Aquí emplearemos la letra M para las muestras y M P para las poblaciones.
EJEMPLO 13
En la siguiente lista se muestran las calificaciones de 20 exámenes de Lingüística. Encuentre la
calificación que más se repite, es decir, la moda de la distribución de las calificaciones.
5 8 9 9 8 10 9 5 10 5
6 5 10 10 8 9 7 9 5 9
Solución
Realizando un conteo de los datos podemos verificar que resultan:
Cinco datos con valor 5.
Un dato con valor 6 y otro con valor 7.
16
Estadística Descriptiva para datos no agrupados. 17
MG = n x1 ⋅ x2 ⋅ L xn .
EJEMPLO 14
Calcule la media geométrica de las 20 calificaciones de los exámenes Psicológicos anteriores.
5 8 9 9 8 10 9 5 10 5
6 5 10 10 8 9 7 9 5 9
17
18. Capítulo 1
Solución
MG = 20 5 × 8 × 9 × 9 × 8 × 10 × 9 × 5 × 10 × 5 × 6 × 5 × 10 × 10 × 8 × 9 × 7 × 9 × 5 × 9 = 7.5446868
NOTA
De la definición de media geométrica fácilmente se deduce que ésta no se puede aplicar
cuando algún dato vale cero o cuando la cantidad de datos es par y existen algunos de
ellos negativos, más sin embargo tiene cierta aplicación en la Psicofísica.
18
Estadística Descriptiva para datos no agrupados. 19
Luego, el monto a pagar por el banco con este promedio sería 1000 × 3.11787 4 = 94,500 , que
corresponde al valor real del pago del banco.
2.- Valor medio armónico o media armónica: La media armónica de los datos x1 , x 2 , K , x n se
simbolizará por MA y está definida como el recíproco de la media aritmética de los recíprocos.
1 1 n
MA = = = .
11 1
n
1 1 1
∑
1 1 1 + +L+
+ +L+
x1 x 2 xn
n i =1
xi n x1 x 2 xn
Las principales aplicaciones de esta media se basan en promediar variaciones respecto del
tiempo, es decir cuando la misma distancia se recorre a diferentes tiempos. Por su definición esta
medida central tiene su mayor uso en Física y en Ingeniería cuando se trabaja con engranes o poleas,
para determinar velocidades promedio de recorridos.
EJEMPLO 15
Supóngase que si usted viaja de una ciudad a otra recorriendo los primeros 100 km. a 80 km/h, los
siguientes 100 km. a una velocidad de 100 km/h y finalmente los otros 100 km. a una velocidad de 120
km/h. Ahora calcule la velocidad media realizada con la media armónica y compárela con las medias
aritmética y geométrica.
Solución
1
[80 + 100 + 120] = 300 = 100
x=
3 3
MG = 80 × 100 × 120 = 98.6485
3
1
MA = = 97.2973
1 1 1 1
+ +
3 80 100 120
Observación
Para tomar una decisión de qué media parece ser la más correcta, calculamos la velocidad promedio
Distancia total recorrida
Velocidad promedio = .
Tiempo total
Distancia total recorrida es igual a 100 + 100 + 100 = 300 kilómetros.
100 100 100
Tiempo total de recorrido + + = 3.0833 horas.
80 100 120
Ahora comparamos con la distancia total real recorrida. Es decir, se comparan las distancias que
presumiblemente recorrería el automóvil con cada una de las velocidades promedio calculadas:
Media aritmética: 3.0833 × 100 = 308.33 km.
Media geométrica: 3.0833 × 98.6485 = 304.166 km.
Media armónica: 3.0833 × 97.2973 = 300 km.
Note que el mejor resultado se obtiene con la media armónica.
19
20. Capítulo 1
3.- Valor medio ponderado o media ponderada: En los casos en que cada dato tiene una
importancia relativa llamada “peso”5, la media más apropiada se obtiene sumando los productos
de cada dato por su peso, llamando a dicha medida “Media Ponderada”.
Definición 1.12
Dado un conjunto de datos x1 , x 2 , K , x n se llama Pesos o ponderaciones, respectivamente, a las
cantidades w1 , w2 , K , wn que cumplen:
a) wi ∈ [0,1] para todo valor de i.
b) w1 + w2 + L + wn = 1 .
EJEMPLO 16
Calcule la calificación promedio de un estudiante de la ESCOM en la materia de Física, si la
calificación está ponderada de la siguiente forma: 10% tareas, 40% laboratorio y 50% de teoría.
Suponga que las calificaciones del estudiante fueron, 8, 9 y 4, respectivamente.
Solución
La calificación está ponderada por lo tanto:
MP = 0.1 × 8 + 0.4 × 9 + 0.5 × 4 = 6.4 .
NOTA
Para el caso de poblaciones los parámetros correspondientes se calculan con las mismas
fórmulas cambiando n por N.
Al realizar un estudio del conjunto de datos cabe preguntarse si el conocimiento de sus medidas
centrales es suficiente para reconocer la distribución de dichos datos. Respuesta que se puede dar sólo
después de estudiar la siguiente sección.
EJERCICIOS 1.2
1).- Obtenga la media, mediana, moda del siguiente conjunto de datos.
145 150 165 155 155 145 150 140 145 150 160 175 150 160
2).- Calcule la media y mediana de los tiempos entre llegadas de 6 aviones al aeropuerto Benito
Juárez, de la ciudad de México, cuyos tiempos, en minutos, son:
3.5 4.2 2.9 3.8 4.0 2.8
3).- Calcule la media armónica del viaje redondo que realiza un chofer de la línea ADO al ir de
México - Acapulco (460 km.). Si de ida lo recorrió por la autopista del Sol a una velocidad de 90
km/h. y de regreso por la otra carretera a una velocidad promedio de 60 km/h.
4).- Calcule la media geométrica del conjunto de datos del ejercicio 2.
5
Ver definición siguiente.
20
Estadística Descriptiva para datos no agrupados. 21
5).- En una muestra de 100 pistones se encontró que 55 tenían un diámetro interno de 10.5cm., 25 de
10.0cm y el restante de 10.75cm. Utilice las frecuencias relativas de los diámetros internos de los
pistones, para determinar la media ponderada del diámetro interno de éstos.
6).- En los envases de leche, la cantidad de líquido no es siempre un litro, se toma una muestra de 10
paquetes, obteniéndose las mediciones siguientes, en litros:
0.95 1.01 0.97 0.95 1.0 0.97 0.95 1.01 0.95 0.98
Calcule la cantidad promedio de leche en los envases de la muestra.
7).- Sean las calificaciones de 30 estudiantes en la materia de probabilidad
27 72 83 15 96 30 8 98 86 5 39 86 87 100 56
88 31 3 30 57 22 7 20 62 95 35 73 66 56 57
Calcule su media, mediana y moda de las calificaciones.
8).- La Bolsa Mexicana de valores ha tenido las diferentes alzas y bajas en puntos porcentuales
durante la primera quincena de Junio del 2003
3.4% 1.7% − 0.5 % 0.7% − 2.4 % − 1.8 % − 0.9 % 2.5% 0.3% 0.8%
Considerando sólo los porcentajes, calcule el porcentaje medio obtenido en dicha quincena para
la bolsa de valores.
9).- Sean x1 , x 2 , K , x n los valores muestrales y x su media, pruebe que el siguiente promedio
n
1
siempre vale cero
n ∑ (x
i =1
i − x) .
10).- Pruebe que cualquier medida central siempre es un valor que se encuentra entre el menor y
mayor de los valores de los datos.
1.6 CUANTILES
En muchas aplicaciones al tener un conjunto de datos requerimos conocer los datos que están por
debajo de cierto valor. Por ejemplo, al realizar un examen a un grupo de 30 personas quisiéramos
conocer la calificación debajo de la cual se encuentra el 40% de los alumnos.
Definición 1.13
Dado un conjunto de datos, se llama C cuantil a la cantidad C P , que representa el número para
el cual el C de los valores son menores que éste.
En muchas literaturas se introducen algunos conceptos más para ciertos valores de los cuantiles.
Por ejemplo,
• cuando C está dado en porciento se suele nombrar C percentil o percentila o C centil.
• cuando se trata de los 0, 0.25, 0.50 y 0.75 cuantiles (o percentil 0%, 25%, 50% y 75%) se les
suele llamar el 0 cuartil, primer cuartil, segundo cuartil y el tercer cuartil, respectivamente.
• Cuando se trata de los 0.10, 0.20, etc. cuantiles se les suele llamar el primer decil, segundo decil,
etc., respectivamente.
21
22. Capítulo 1
Los cuartiles se usan con frecuencia en los datos de ventas y encuestas para dividir las
poblaciones en grupos. Por ejemplo, para determinar el 25 por ciento de ingresos más altos en una
población.
Para calcular el C cuantil de un conjunto de datos x1 , x 2 , K , x n (n datos no agrupados), lo
podemos hacer de la siguiente forma.
1.- Primeramente ordenamos los datos en forma no decreciente, ~ x ≤~ x ≤K≤ ~ x . 1 2 n
EJEMPLO 17
Sean las calificaciones de 20 estudiantes 45, 69, 79, 83, 38, 27, 98, 100, 84, 79, 67, 84, 92, 35, 56, 69,
47, 95, 100, 86.
a).- Calcule el cuantil 0.65 de la distribución de las calificaciones.
b).- Calcule el cuantil 0.42 de la distribución de las calificaciones.
Solución
a). Los datos originales son:
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13
45 69 79 83 38 27 98 100 84 79 67 84 92
x14 x15 x16 x17 x18 x19 x20
35 56 69 47 95 100 86
• Primeramente se ordena los datos en forma no decreciente, resultando:
27, 35, 38, 45, 47, 56, 67, 69, 69, 79, 79, 83, 84, 84, 86, 92, 95, 98, 100, 100
~
x ~
x ~
x x ~
x ~
x x ~
x ~
x ~
x ~
x ~
x ~
x
1 2 3 4 5 6 7 8 9 10 11 12 13
27 35 38 45 47 56 67 69 69 79 79 83 84
~
x ~
x ~
x ~
x ~
x ~
x ~
x
14 15 16 17 18 19 20
84 86 92 95 98 100 100
• Ahora se calcula ~c = nC = 20 × 0.65 = 13 .
• Del inciso anterior ~
c resultó entero, luego
~
x c~ + ~
x c~ +1 ~
x13 + ~
x13+1 ~
x13 + ~
x14 84 + 84
C 0.65 = = = = = 84 .
2 2 2 2
22
Estadística Descriptiva para datos no agrupados. 23
Esto significa que el 65% de las calificaciones de los 20 estudiantes están por debajo de 84.
b).- De los resultados anteriores, falta calcular c~ = nC = 20 × 0.42 = 8.4 .
• Del inciso anterior ~ c no es entero, luego C = ~
0.42 x~ =~ x =~
[c ]+1 x = 69 .
8 +1 9
Esto significa que el 42% de las calificaciones de los 20 estudiantes están por debajo de 69.
Con frecuencia de un conjunto datos el investigador desea conocer de forma aproximada algunas
probabilidades. Por ejemplo, supóngase que los datos anteriores provienen de una variable aleatoria X,
que representa las calificaciones de los estudiantes y, se desea conocer cuál es la probabilidad de que la
calificación de los estudiantes sea mayor a 80.
En este caso una forma simple de aproximar la probabilidad deseada, consiste en contar la
cantidad de calificaciones mayores a 80:
83, 84, 84, 86, 92, 95, 98, 100 y 100.
Es decir, tenemos 9 datos que cumplen con ser mayores a 80, luego la probabilidad pedida será:
9
P ( X > 80) ≅ = 0.45 .
20
EJERCICIOS 1.3
1. Sean las calificaciones de 30 estudiantes en la materia de probabilidad: 27, 72, 83, 15, 96, 30, 8,
98, 86, 5, 39, 86, 87, 100, 56, 88, 31, 3, 30, 57, 22, 7, 20, 62, 95, 35, 73, 66, 56 y 57
a).- Calcule el cuantil 0.60 de la distribución de las calificaciones.
b).- Calcule el tercer cuartil de la distribución de las calificaciones.
c).- Supóngase que los datos provienen de una variable aleatoria X, que representa las calificaciones de
los estudiantes y se desea conocer cuál es la probabilidad de que la calificación de los estudiantes
sea reprobatoria (menor a 60).
2. Considérense los siguientes datos que corresponden al porciento de algodón en el material usado en
la fabricación de playeras.
34.2 33.6 33.8 34.7 37.8 32.6 35.8 34.6
33.1 34.7 34.2 33.6 36.6 33.1 37.6 33.6
34.5 35.0 33.4 32.5 35.4 34.6 37.3 34.1
35.6 35.4 34.7 34.1 34.6 35.9 34.6 34.7
34.3 36.2 34.6 35.1 33.8 34.7 35.5 35.7
35.1 36.8 35.2 36.8 37.1 33.6 32.8 36.8
34.7 36.1 35.0 37.9 34.0 32.9 32.1 34.3
33.6 35.3 34.9 36.4 34.1 33.5 34.5 32.7
a).- Calcule el primer cuartil de los porcentajes de algodón en el material usado para la fabricación de
playeras.
b).- Calcule el cuantil 0.60 de los porcentajes de algodón en el material usado para la fabricación de
playeras.
23
24. Capítulo 1
c).- Supóngase que los datos provienen de una variable aleatoria X, que representa los porcentajes de
algodón usado en la fabricación de playeras y se desea conocer cuál es la probabilidad de que
dicho porcentaje sea mayor a 35.
1.7 MEDIDAS DE DISPERSIÓN
Para un análisis de la distribución de los datos el estudio de sus medidas centrales no es suficiente,
puesto que en diferentes conjuntos de datos puede dar medidas centrales iguales, y por lo tanto no se
tendría el conocimiento de la forma de su distribución.
Por ejemplo, si un conjunto de datos contiene los valores: 20, 12, 15, 16, 13 y 14, y un
segundo conjunto los valores: 5, 0, 50, 17, 8 y 10. Fácilmente, podemos comprobar que en ambos
casos se obtiene un promedio de 15 (¡verifíquelo!). Pero si representamos en una recta los datos no es
difícil comprobar que las observaciones del segundo conjunto tienen una dispersión mucho mayor.
Distribución de los datos del primer conjunto
• •• • •
Distribución de los datos del segundo conjunto
• • • • • •
0 5 10 15 20 25 30 35 40 45 50 55
Luego, es necesario realizar un estudio de la distribución de los datos con respecto a su valor
central, es decir, necesitamos un valor que indique una medida para comparar las dispersiones de los
datos entre diferentes conjuntos. A éstas últimas medidas les llamaremos valores de dispersión o
variabilidad del conjunto de datos.
En síntesis, una medida de dispersión indica qué tan cercanos o separados están los valores con
respecto a la media u otra medida de tendencia central. En pocas palabras, una medida de dispersión
indica cuán confiable es el promedio.
1.7.1 RANGO
El primer valor que muestra como están dispersos los datos es muy sencillo y, se llama rango de las
observaciones, lo denotáremos por r.
Definición 1.14
El rango es una medida variacional de los datos que lo único que indica es el tamaño o longitud
del intervalo en el que éstos se encuentran distribuidos y se calcula por:
Rango = El valor mayor menos el valor menor de los datos.
Por ejemplo, para los datos muestrales de los dos conjuntos anteriores, se tiene:
• En los datos anteriores en el primer conjunto su rango vale r1 = 20 − 12 = 8 . Es decir, los datos de
este conjunto están distribuidos a lo largo de un intervalo de longitud 8.
• En el segundo conjunto su rango vale r2 = 50 − 0 = 50 . Es decir, los datos de este conjunto están
distribuidos a lo largo de un intervalo de longitud 50.
Obviamente de los dos resultados anteriores es fácil concluir que los elementos del segundo
conjunto tienen una separación mayor entre ellos. Pero el resultado anterior no muestra como es el
comportamiento de los datos con respecto a su media.
24
Estadística Descriptiva para datos no agrupados. 25
n
1
variancia (varianza) insesgada o muestral a: s n2−1 =
n −1 ∑ (x
i =1
i − x)2 .
Tal vez surge la pregunta ¿por qué dos definiciones diferentes en lugar de una sola?. La
respuesta es sencilla, la variancia sesgada refleja perfectamente el significado de una medida de
dispersión y, por consiguiente, tiene una gran aplicación en el estudio de las probabilidades. Mientras
que la variancia insesgada es más propicia en los cálculos estadísticos y se usa en las muestras (ver
capítulo 5). Precisamente de aquí surge su nombre de variancia muestral.
De forma similar para poblaciones finitas se define el parámetro variancia poblacional, la cual
estará representada por la letra griega minúscula sigma σ al cuadrado, es decir, σ 2 .
Sea el conjunto de datos poblacionales x1 , x 2 , K , x N , con valor medio µ, se define a la
variancia poblacional.
1 N
Variancia poblacional6 σ 2 =
N i =1
( xi − µ ) 2 . ∑
En la definición de variancia se puede notar que ésta se calcula con los cuadrados de las
desviaciones, y por lo tanto, ella no estará en las mismas unidades que los datos. Por consiguiente, se
introduce una nueva medida de dispersión a la que se nombra de la siguiente forma.
Definición 1.16
Se llama desviación estándar de un conjunto de datos a la raíz cuadrada positiva de la
variancia, y ésta dependerá del tipo de variancia que se esté empleando.
EJEMPLO 18
Calcule la varianza insesgada y su desviación estándar correspondiente de cada uno de los dos
conjuntos dados que se dieron al inicio de la sección. Conjunto uno 20, 12, 15, 16, 13 y 14 y el
segundo conjunto 5, 0, 50, 17, 8 y 10.
6
En el estudio de las probabilidades se dio una definición más general para σ2 la cual se puede aplicar, tanto, a poblaciones
finitas como infinitas.
25
26. Capítulo 1
Solución
Conjunto de 20, 12, 15, 16, 13 y 14. Calculamos x = 15 .
[ ]
n
1 1
s 2
n −1 =
n −1 ∑ (x
i =1
i − x)2 =
6 −1
(20 − 15) 2 + (12 − 15) 2 + (15 − 15) 2 + (16 − 15) 2 + (13 − 15) 2 + (14 − 15) 2
=
1
[25 + 9 + 0 + 1 + 4 + 1] = 8
5
La desviación estándar será, s n −1 = 8 ≈ 2.8284 .
[ ]
n
1 1
s n2−1 =
n −1 ∑ (x
i =1
i − x)2 =
6 −1
(5 − 15) 2 + (0 − 15) 2 + (50 − 15) 2 + (17 − 15) 2 + (8 − 15) 2 + (10 − 15) 2
=
1
[100 + 225 + 1225 + 4 + 49 + 25] = 325.6
5
Similarmente al conjunto de datos anterior la desviación estándar será s n −1 = 325.6 ≈ 18.0444 .
OTRA EXPRESIÓN PARA CÁLCULOS DE LAS VARIANCIAS
En los cálculos de la variancia se acostumbra emplear otra representación equivalente a la de la
definición 1.15 la cual está, dada por las siguientes fórmulas:
1 n
n −1 2
Variancia sesgada : s n2 =
n ∑x
i =1
2
i − x2 =
n
s n −1 .
n
1 n n 2
Variancia insesgada : s n2−1 =
n −1 ∑x
i =1
2
i −
n −1
x2 =
n −1
sn .
DEMOSTRACIÓN
1 n 2
∑ (x ) ∑( )
n n n n
1 1
s n2 =
n ∑i =1
( xi − x ) 2 =
n i =1
2
i − 2 xi x + x 2 =
n i =1
xi − 2 x ∑ i =1
xi + ∑
i =1
x2
1 1 1
∑( ) ∑( ) ∑ (x ) − x
n n n
= xi2 − 2 x nx + nx 2 = xi2 − nx 2 = 2
i
2
n i =1 n i =1 n i =1
EJEMPLO 19
Calcule la varianza insesgada para los conjuntos de datos del ejemplo 18, empleando las últimas
fórmulas para la variancia y, compruebe que coinciden los resultados.
Solución
Conjunto de 20, 12, 15, 16, 13 y 14.
s n2−1 =
1 n 2
n − 1 i =1
xi −
n
n −1
x2 =
1
∑
6 −1
20 2 + 12 2 + 15 2 + 16 2 + 13 2 + 14 2 −
6
6 −1
[
(15) 2 ]
=
1
[400 + 144 + 225 + 256 + 169 + 196] − 6 × 225 = 278 − 270 = 8
5 5
26
Estadística Descriptiva para datos no agrupados. 27
[ ]
n
1 n 1 6
s n2−1 =
n −1 ∑x
i =1
2
i −
n −1
x2 =
6 −1
5 2 + 0 2 + 50 2 + 17 2 + 8 2 + 10 2 −
6 −1
(15) 2
=
1
[25 + 0 + 2500 + 289 + 64 + 100] − 6 × 225 = 595.6 − 270 = 325.6
5 5
De los cálculos anteriores podemos observar que en ambos casos coinciden los resultados con
los del Ejemplo 18.
1.7.3 DESVIACIÓN MEDIA
Otra medida de dispersión de los datos que está relacionada directamente con la media de éstos es la
siguiente.
Definición 1.17
Sean x1 , x 2 , K , x n los datos en estudio, llamaremos desviación media (DM) o desviación media
absoluta (DMA) del conjunto de datos, al promedio de los valores absolutos de las desviaciones
1 n
de cada uno de los datos con respecto a la media. Es decir, DM =
n i =1
| xi − x | . ∑
Tal vez para algunos lectores esta medida de variación debería ser la más adecuada para medir la
dispersión de los datos, en efecto la desviación media tiene buenas propiedades para medir la
dispersión, pero en muchos cálculos no es recomendable trabajar con el valor absoluto ya que éste no
es una función diferenciable.
EJEMPLO 20
Calcule la desviación media para los conjuntos de datos del ejemplo 18, y compare los resultados
con la desviación estándar de la varianza insesgada.
Solución
Conjunto de datos 20, 12, 15, 16, 13 y 14 cuya media fue 15. Luego,
1 n
| x i − x | = {| 20 − 15 | + | 12 − 15 | + | 15 − 15 | + | 16 − 15 | + | 13 − 15 | + | 14 − 15 |}
1
DM =
n i =1
∑ 6
=
1
{| 5 | + | −3 | + | 0 | + | 1 | + | −2 | + | −1 |} = 1 {5 + 3 + 0 + 1 + 2 + 1} = 2
6 6
En este caso, la desviación estándar fue 8 = 2.828 > DM .
Para el conjunto de 5, 0, 50, 17, 8 y 10. Su media también resultó ser igual a 15.
n
1 1
DM = ∑| x i − x|= {| 5 − 15 | + | 0 − 15 | + | 50 − 15 | + | 17 − 15 | + | 8 − 15 | + | 10 − 15 |}
n i =1 6
27
28. Capítulo 1
RIC1−α = ~
x1−α 2 xα 2 , con α ∈ [0, 1] y ~
−~ x1−α 2 y ~
cuantiles 1 − α 2 y α 2 , respectivamente.
xα 2
Que representa el (1 − α ) × 100% de los datos centrales. Por ejemplo, RIC1− 0.20 = ~ x0.90 − ~
x0.10
rango interdecílico o rango intercuantil 0.8. Donde el 80% de los datos están centrados.
EJEMPLO 21
En el ejemplo de las calificaciones de 20 estudiantes 45, 69, 79, 83, 38, 27, 98, 100, 84, 79, 67, 84, 92,
35, 56, 69, 47, 95, 100, 86.
a).- Calcule el rango intercuantílico 0.60 de la distribución de las calificaciones.
b).- Calcule el rango intercuantílico 0.25 de la distribución de las calificaciones.
Solución
a). Los datos originales en forma no decreciente, resultando:
~
x1 ~
x2 ~
x3 ~
x4 ~
x5 ~
x6 ~
x7 ~x8 ~
x9 ~
x10 ~
x11 ~
x12 ~
x13
27 35 38 45 47 56 67 69 69 79 79 83 84
~
x14 ~ x15 ~
x16 ~ x17 ~ x18 ~ x19 ~ x 20
84 86 92 95 98 100 100
Deseamos el rango intercuantílico 0.60, esto implica que 1 − α = 0.60 , luego α = 0.40 . Así, que
requerimos calcular los cuantiles ~
x1−α 2 = ~
x1− 0.20 = ~
x 0.80 y ~
xα 2 = ~
x 0.20 .
• Para el cuantil 0.20 se calculac~ = nC = 20 × 0.20 = 4 .
~x~ + ~x c~ +1 ~
+~
x x 4+1 ~
x +~ x5 45 + 47
• Luego, C 0.20 = c = 4 = 4 = = 46 .
2 2 2 2
• Similarmente, para el cuantil 0.80 se calcula c~ = nC = 20 × 0.80 = 16 .
~
x ~c + ~
x ~c +1 ~
x16 + ~
x16+1 ~
x16 + ~
x17 92 + 95
• Luego, C 0.80 = = = = = 93.5 .
2 2 2 2
Esto significa que el 60% de las calificaciones están centradas entre 16 y 93.5.
b).- De forma similar al inciso anterior, el rango intercuantílico 25%, implica que 1 − α = 0.25 , luego
α = 0.75 . Así, que requerimos calcular los cuantiles ~x1−α 2 = ~x1−0.375 = ~x 0.625 y ~xα 2 = ~x 0.375 .
• Para el cuantil 37.5% se calcula ~ c = nC = 20 × 0.375 = 7.5 .
• ~ ~ ~
Luego, C 0.375 = x [c~ ]+1 = x 7 +1 = x8 = 69 .
• Similarmente, para el cuantil 62.5% se calcula c~ = nC = 20 × 0.625 = 12.5 .
• Luego, C =~x~ =~
0.625 x
[c ]+1 =~x = 84 .
12+1 13
Esto significa que el 25% de las calificaciones están centradas entre 69 y 84.
28
Estadística Descriptiva para datos no agrupados. 29
7
Karl Pearson (1857-1936), matemático y filósofo de las ciencias británico, se le conoce por haber desarrollado algunas de las
técnicas centrales de la Estadística moderna, y por aplicar éstas a los problemas de la herencia biológica. Pearson nació en
Londres y se graduó en la Universidad de Cambridge en 1879. Estudió derecho poco después de su graduación, pero ocupó la
mayor parte de su vida laboral en enseñar matemáticas aplicadas, mecánica y genética en el University College de Londres. A
principios de 1900, Pearson se interesó por el trabajo de Francis Galton, que intentaba encontrar relaciones estadísticas para
explicar como las características biológicas iban pasando a través de generaciones sucesivas. La investigación de Pearson
colocó en gran medida las bases de la estadística del siglo XX, definiendo los significados de correlación, análisis de la
regresión y desviación típica. En 1911 Pearson alcanzó el cargo de profesor de eugenesia en la University College,
examinando la recopilación y análisis de la información en el sentido que las características, como inteligencia, criminalidad,
pobreza y creatividad se transmiten a través de generaciones. Pearson confiaba en aplicar estas intuiciones con el fin de
mejorar la raza humana. Fue un autor muy prolífico sobre gran cantidad de temas científicos y matemáticos y, escribió un
libro muy influyente sobre los métodos de la ciencia, llamado La gramática de las ciencias (1892).
29
30. Capítulo 1
Definición 1.20
Una variación relativa se llama Coeficiente de variación de un conjunto de datos, si
consideramos como medida de variación a la desviación estándar, luego
s σ
Coeficient e de variación muestral = cv = ; Coeficient e de variación poblacional =
x µ
s n −1 ( x) 52.5899 s ( y) 4.9444
cv( x) = = = 0.4982 y cv( y ) = n −1 = = 0.1205 .
x 13.81 y 17.5
Conclusión: La dispersión es mayor en los ingresos que en los años de estudio.
Finalmente, las medidas que representan la dependencia entre dos muestras o poblacionales
están definidas de la siguiente forma.
30
Estadística Descriptiva para datos no agrupados. 31
Definición 1.21
Sean los datos de dos muestras del mismo tamaño, x1 , x 2 , K , x n y y1 , y 2 , K , y n , referentes a
diferentes características, llamaremos covarianza a la medida que refleja el grado de
dependencia entre los datos de las dos muestras, la denotaremos por s xy y calcularemos por:
n n
1 1
s xy = cov( x, y ) =
n ∑
i =1
( x i − x )( y i − y ) =
n ∑x yi =1
i i − x y.
EJEMPLO 24
En el ejemplo anterior referente al grupo de 10 personas con características ingresos y años de estudio.
Calcule la covarianza entre las dos características.
Solución
En el ejemplo anterior calculamos sus medias, encontrando x = 13.81 y y = 17.5 . Ahora sus
productos
Persona i 1 2 3 4 5 6 7 8 9 10
Ingreso en miles (x) 10.5 6.8 20.7 18.2 8.6 25.8 22.2 5.9 7.6 11.8
Años de estudio (y) 17 18 21 16 16 21 16 14 18 18
xi y i 178.5 122.4 434.7 291.2 137.6 541.8 355.2 82.6 136.8 212.4
De tal forma que la covarianza entre ingresos y años de estudio estará dada por
n
1 2493.2
s xy = cov( x, y ) =
n ∑x y
i =1
i i −xy=
10
− 13.81(17.5) = 7.645 .
En estos momentos surge la pregunta sobre la interpretación del valor obtenido, 7.645, para la
covarianza de las dos características,
¿Qué significa 7.645, la dependencia entre las características es elevada o pequeña?
La respuesta a la pregunta, con los datos dados, no resulta tan obvia porqué en realidad depende
del tamaño de las unidades en la que están los datos. Para evitar este problema, se introduce un
coeficiente que representa una medida relativa de dependencia entre los caracteres en estudio.
Definición 1.22
Sean los datos de dos muestras del mismo tamaño, x1 , x 2 , K , x n y y1 , y 2 , K , y n , referentes a
características diferentes, llamaremos coeficiente de correlación muestral a la medida que
refleja el grado de dependencia entre las dos muestras y lo denotaremos por rxy , se calcula
n
cov( x, y )
∑x yi =1
i i − nx y
rxy = = .
s n2 ( x) s n2 ( y ) n n
∑x
i =1
2
i − nx 2 ∑y
i =1
2
i − ny 2
31
32. Capítulo 1
EJEMPLO 25
En el ejemplo anterior referente al grupo de 10 personas con características ingresos y años de estudio.
Calcule su coeficiente de correlación para las características.
Solución
En el ejemplo anterior calculamos sus covarianza encontrando cov( x, y ) = 7.645 , mientras que en el
ejemplo 23 calculamos sus varianzas insesgadas, luego las varianzas sesgadas estarán dadas por:
n −1 2 9 n −1 2 9
s n2 ( x) = s n −1 ( x) = (52.5899) = 47.3309 y s n2 ( y ) = s n −1 ( y ) = (4.9444) = 4.4496
n 10 n 10
De tal forma que el coeficiente de correlación entre ingresos y años de estudio estará dado por
cov( x, y ) 7.645
rxy = = = 0.5268 .
2 2
s ( x) s ( y )
n n
47.3309 4.4496
En forma numérica, si rxy ≈ 1 , se dice que los caracteres en estudio tienen un alto grado de
dependencia, ya sea directa o indirecta según sea el signo de rxy . Por otro lado, si rxy ≈ 0 se dice que
los caracteres en estudio tienen un grado muy pequeño de dependencia, ya sea directa o indirecta según
sea el signo de rxy . Para valores intermedios la interpretación, en general, depende del investigador, a
partir de que valores de rxy se considera que las muestras sean dependientes. Así, para algunos
investigadores el valor 0.5268 puede ser considerado como una alta dependencia entre las muestras y
para otros puede considerarse una dependencia moderada.
EJERCICIOS 1.4
1).- Del siguiente conjunto de datos, calcule rango, varianza insesgada, desviación media, rango
intercuantílico del 60% y su coeficiente de variación.
145 150 165 155 155 145 150 140 145 150 160 175 150 160
2).- Calcule la desviación estándar muestral de los tiempos entre llegadas referentes a 6 aviones
que llegan al aeropuerto Benito Juárez, de la ciudad de México, cuyos tiempos (en minutos) son:
3.5, 4.2, 2.9, 3.8, 4.0 y 2.8
32
Estadística Descriptiva para datos no agrupados. 33
3).- En los envases de leche, la cantidad de líquido no es siempre un litro, se toma una muestra de
10 paquetes, obteniéndose las mediciones de abajo, en litros. Calcule el rango, la varianza
insesgada, la desviación media y su coeficiente de variación de los contenidos de leche.
0.95 1.01 0.97 0.95 1.0 0.97 0.95 1.01 0.95 0.98
4).- Sean las calificaciones de 30 estudiantes en la materia de probabilidad
27 72 83 15 96 30 8 98 86 5 39 86 87 100 56
88 31 3 30 57 22 7 20 62 95 35 73 66 56 57
Calcule el rango, la varianza insesgada, la desviación media, rango intercuantílico del 80% y su
coeficiente de variación de las calificaciones.
5).- La Bolsa Mexicana de valores ha tenido las diferentes alzas y bajas en puntos porcentuales
durante la primera quincena de Junio del 2003. Calcule varianza muestral y su coeficiente de
variación de los puntos porcentuales de la bolsa Mexicana de valores.
3.4% 1.7% − 0.5 % 0.7% − 2.4 % − 1.8 % − 0.9 % 2.5% 0.3% 0.8%
6).- En la siguiente lista se muestra las calificaciones de 30 alumnos correspondientes a las
materias de Cálculo y Álgebra.
80 70 43 55 23 98 42 73 20 35
Álgebra 75 95 70 75 57 32 32 82 50 96
46 83 45 75 60 65 100 86 30 10
90 100 38 30 10 70 30 65 10 45
Cálculo 80 50 52 80 40 40 10 65 40 90
30 43 30 90 35 40 90 60 25 10
Calcule las medidas de variabilidad por grupo:
a) Rango y varianza insesgada.
b) Coeficientes de variación de las calificaciones por materia. ¿En qué materia se tiene la mayor
dispersión en las calificaciones?
c) Los rangos intercuantílicos del 80% por materia.
d) Covarianza y el coeficiente de correlación entre las dos materias.
25
7).- Se llevo a cabo un experimento y se anotaron sus valores x = 53.48 , con ∑x
i =1
2
i = 86463 ,
33
34. Capítulo 1
30 30 30
10).- Se conoce que ∑ i =1
xi = 331.3 , ∑ i =1
y i = 1,673.5 y ∑x y
i =1
i i = 22,414 , calcule la covarianza de los
insesgada. Podemos apreciar que las dos fórmulas casi coinciden, cuando n es grande, y están
(n − 1)(n − 2)
relacionadas por CA2 = CA1 .
n2
El coeficiente de asimetría caracteriza el grado de alejamiento de los datos con respecto a su
media y generalmente se encuentra entre − 4 y 4. Cuando el coeficiente de asimetría vale cero, esto
indica que su distribución es simétrica. El paquete Excel utiliza la fórmula CA1 para la asimetría. Por
otro lado, para calcular el coeficiente de asimetría se requieren mínimo de 3 datos.
mediana mediana
media media
a b
Figura 1 Muestra los dos tipos de asimetría. En (a) se observa una asimetría hacia la derecha, datos
sesgados a la derecha, mientras que en (b) a la izquierda, datos sesgados a la izquierda.
34
Estadística Descriptiva para datos no agrupados. 35
3
x − 172.124
Se calcula cada uno de los 50 sumandos, i , obteniendo:
9.84284
0.003 0.000 0.235 -0.278 0.512 0.016 0.061 -0.050 0.532 -0.253
-0.032 0.037 0.088 -0.562 -0.104 -2.711 -0.074 0.000 0.000 0.001
-0.004 0.616 -168.12 1.893 0.272 0.000 0.014 0.001 0.076 3.051
-0.104 -0.278 -0.379 0.213 0.163 0.733 0.421 0.016 0.001 0.000
-0.004 0.810 -1.605 -0.050 -0.010 -0.001 0.088 0.326 0.512 -0.032
Posteriormente, se suman resultando − 163.956 , de tal forma que:
3
n n
xi − x 50
CA1 =
(n − 1)(n − 2) ∑
s
i =1 n −1
=
49 × 48
(−163.956) = −3.4855 .
(n − 1)(n − 2) 49 × 48
Similarmente, podemos obtener que CA2 = CA1 = ( −3.4855) = −3.2791 .
n 2
50 × 50
Kart Pearson, desarrolló una fórmula un poco más burda que la anterior para calcular el
3( x − ~ x)
coeficiente de asimetría. La fórmula es .
s n −1
35
36. Capítulo 1
En donde, x es la media, ~
x la mediana y s n −1 la desviación estándar muestral de las observaciones.
Calculando la mediana, 176.3, tenemos que el coeficiente de variación por Pearson, sería:
3( x − ~ x ) 3(172.124 − 176.3)
= = −1.273 .
s n −1 9.8428
Otra característica de la gráfica de los datos se refiere a la elevación o el achatamiento relativo
de la distribución de los datos comparada con la distribución normal. De forma similar al coeficiente
de asimetría, la curtosis también se puede calcular analíticamente.
Definición 1.24 Curtosis
Sean x1 , x 2 , K , x n , n datos con media x y desviación estándar muestral s n −1 , entonces se llama
curtosis a la medida que representa el achatamiento relativo de la distribución de los datos al
compararse con la distribución normal, en la literatura encontramos diferentes fórmulas para su
cálculo, las cuales coinciden cuando n es grande
4
n(n + 1) n
xi − x 3(n − 1) 2
CU 1 =
(n − 1)(n − 2)(n − 3) ∑
i =1
s
n −1
−
( n − 2)(n − 3)
4
n(n + 1) n
xi − x
CU 2 =
(n − 1)(n − 2)(n − 3) ∑
i =1
s
n −1
4
m4 1 n
xi − x
CU 3 =
( s n −1 ) 4
−3=
n ∑
i =1
s
n −1
−3
4
m4 1 n
xi − x
CU 4 =
( s n −1 ) 4
=
n ∑
i =1
s
n −1
36
Estadística Descriptiva para datos no agrupados. 37
37
38. Capítulo 1
38
Estadística Descriptiva para datos no agrupados. 39
c) Riesgos.
d) Determine los coeficientes de variación de cada título durante el periodo de 15 días e indique
cuál título es más disperso.
Día Wal-Mart Telmex
1 34.79 17.80
2 34.85 17.57
3 34.74 17.59
4 34.48 17.85
5 34.71 17.87
6 35.12 18.17
7 34.83 18.17
8 34.86 18.30
9 35.29 18.36
10 35.91 18.40
11 35.92 18.40
12 35.68 18.48
13 35.87 18.51
14 35.98 18.45
15 36.17 18.49
Solución
Primeramente, calculamos sus rendimientos, ver tabla siguiente.
Día Wal-Mart Rendimientos Wal-Mart Telmex Rendimientos Telmex
1 34.79 17.8
2 34.85 0.00172 17.57 -0.01292
3 34.74 -0.00316 17.59 0.00114
4 34.48 -0.00748 17.85 0.01478
5 34.71 0.00667 17.87 0.00112
6 35.12 0.01181 18.17 0.01679
7 34.83 -0.00826 18.17 0.00000
8 34.86 0.00086 18.3 0.00715
9 35.29 0.01234 18.36 0.00328
10 35.91 0.01757 18.4 0.00218
11 35.92 0.00028 18.4 0.00000
12 35.68 -0.00668 18.48 0.00435
13 35.87 0.00533 18.51 0.00162
14 35.98 0.00307 18.45 -0.00324
15 36.17 0.00528 18.49 0.00217
Rendimiento promedio 0.00281 0.00274
Riesgo 0.00776 0.00717
Coeficiente de variación 2.76074 2.66031
39
40. Capítulo 1
En resumen resulta ser un poco más dispersos los valores del título de Walt-Mart que los de Telmex.
¿Qué pasa cuando se invierte en diferentes títulos al mismo tiempo?
En el caso de analizar varios títulos para un mismo inversionista estamos hablando de
portafolios. En esta situación el inversionista destina proporciones de su capital a cada título, de tal
manera que requiere conocer el rendimiento promedio del portafolio.
Supóngase que el inversionista tiene n títulos en los cuales invierte su capital de acuerdo a las
siguientes proporciones, p1 , p 2 , K , p n . De tal manera que
p1 + p 2 + L + p n = 1 .
El rendimiento promedio del portafolio, no es otra cosa que la media ponderada de los
rendimientos promedios de cada uno de los n títulos del inversionista. Luego, el rendimiento promedio
del portafolio
n
RP = ∑p R
i =1
i i .
EJEMPLO 29
Considere un portafolio con los dos títulos del ejemplo anterior, Wal-Mart y Telmex en 15 días
sucesivos y calcule
a) Rendimiento promedio del portafolio para una inversión del 30% en Wal-Mart y 70% en Telmex.
b) En la inversión del inciso (a) calcule el riesgo del portafolio.
Solución
El rendimiento promedio del portafolio.
2
RP = ∑p R
i =1
i i = 0.30(0.00281) + 0.70(0.00274) = 0.00276
Para el riesgo del portafolio primeramente necesitamos calcular la covarianza entre los
rendimientos. Así, encontramos que cov( R1 , R2 ) = 0.0000019498 . Ahora el riesgo del portafolio
2 2 −1 2
s RP = ∑p s
i =1
2 2
i Ri +2 ∑∑p p
i =1 j = i +1
i j cov( Ri , R j ) = p12 s R21 + p 22 s R22 + 2 p1 p 2 cov( R1 , R2 )
40
Estadística Descriptiva para datos no agrupados. 41
41
42. Capítulo 1
42
Estadística Descriptiva para datos no agrupados. 43
EJERCICIOS PROPUESTOS
1).- Dado el siguiente conjunto de datos, analícelos calculando las medidas que se piden y explique
el tipo de datos que se trata.
34 23 45 43 11 10 23 27 31 21 17 25 25 24 31
31 26 33 37 18 11 16 20 18 19 18 16 28 19 16
a).- Media, mediana, moda.
b).- Rango y varianza insesgada.
c).- Primer cuartil, rango intercuantílico del 60%.
d).- Coeficiente de variación y coeficiente de asimetría
2).- Los siguientes datos muestran los diámetros internos en centímetros de 20 pistones. Calcule
12.01 11.92 12.02 11.75 11.90 12.04 12.01 11.84 12.01 11.95 12.05 12.01 12.0 11.76 11.92
12.09 12.08 11.87 12.04 12.03 11.99 12.02 11.93 11.95 11.98 11.92 12.03 11.93 12.01 12.02
a).- Diámetro interno medio
b).- Rango y varianza insesgada de los diámetros
c).- Rango intercuantílico del 60% para los diámetros
d).- Coeficiente de variación y coeficiente de asimetría y curtosis, ¿tendrán un comportamiento
posiblemente normal los datos?
3).- En la siguiente lista se muestra las calificaciones de la materia de Historia para dos muestras de
30 alumnos elegidos aleatoriamente de dos escuelas.
8 8 3 5 10 9 4 7 1 3
Muestra 1 8 9 7 7 7 2 3 8 8 9
7 8 4 5 6 6 10 6 3 8
10 10 8 0 0 2 8 4 1 4
Muestra 2 8 5 2 10 10 10 9 8 9 2
3 3 1 1 2 4 8 6 3 8
Calcule las siguientes medidas muestra.
a).- Media, mediana, moda.
b).- Rango y varianza insesgada.
c).- Tercer cuartil, rango intercuantílico del 80%.
d).- Coeficiente de variación y coeficiente de asimetría y curtosis.
¿Qué muestra resultó ser más homogénea en sus calificaciones? y qué se puede decir de sus
posibles comportamientos de las poblaciones de procedencia de los datos.
4).- El precio por barril de Petróleo crudo exportado por México en 15 días en el mes marzo del 2006
fue:
61.5 61.0 64.0 62.5 62.5 65.2 66.5 64.5
62.0 61.5 64.0 63.9 66.8 70.6 72.0
Calcule las siguientes medidas de los datos de la muestra.
a).- Media, mediana, moda.
43
44. Capítulo 1
44
Estadística Descriptiva para datos no agrupados. 45
b).- Calcule las medidas sugeridas para la vida de los focos y redacte un reporte dirigido al
gerente de mercadotecnia de la empresa para la duración de los focos.
9).- Se realiza un experimento para medir el porcentaje de encogimiento al secar los especimenes
de prueba de arcilla plástica los cuales produjeron los siguientes resultados:
17.2 17.7 16.1 19.9 15.6 19.7 16.4 15.5 17.2 16.4
17.3 15.2 18.5 19.2 17.7 16.5 18.8 17.8 18.3 17.4
Con los datos obtenidos el investigador pretende hacer un reporte que indique al comprador el
porcentaje de encogimiento al secar los especimenes de arcilla plástica.
a).- ¿Qué medidas, de las revisadas en el Capítulo, le recomendaría al investigador calcular e
incluir en su reporte?
b).- Calcule las medidas sugeridas para el porcentaje de encogimiento al secar los especimenes
de arcilla plástica y redacte un reporte dirigido a los compradores.
10).- Considere los siguientes datos que corresponden al porciento de algodón en el material usado
para fabricar playeras de caballero.
34.2 33.6 33.8 34.7 37.8 32.6 35.8 34.6
33.1 34.7 34.2 33.6 36.6 33.1 37.6 33.6
34.5 35.0 33.4 32.5 35.4 34.6 37.3 34.1
35.6 35.4 34.7 34.1 34.6 35.9 34.6 34.7
34.3 36.2 34.6 35.1 33.8 34.7 35.5 35.7
35.1 36.8 35.2 36.8 37.1 33.6 32.8 36.8
34.7 36.1 35.0 37.9 34.0 32.9 32.1 34.3
33.6 35.3 34.9 36.4 34.1 33.5 34.5 32.7
Con los datos obtenidos el investigador pretende hacer un reporte que indique al distribuidor el
porcentaje de algodón usado para fabricar playeras de caballero.
a).- ¿Qué medidas, de las revisadas en el Capítulo, le recomendaría al investigador calcular e
incluir en su reporte?
b).- Calcule las medidas sugeridas para el porcentaje de algodón usado para fabricar playeras de
caballero y redacte un reporte dirigido a los distribuidores.
11).- Calcule la media geométrica de las calificaciones de un examen Psicológico aplicado a 8
personas cuyos resultados fueron, 7, 8, 7, 9, 6, 8, 9 y 7.
12).- Calcule la media armónica del viaje redondo que realizó el señor Alberto de México a
Querétaro (210 km.). Si de ida lo recorrió a una velocidad de 130 km/h. y de regreso a 110 km/h.
13).- Si el señor López viajo 400 km. en 4 tramos de 100 cada uno, con velocidades de 100 km/h.,
130 km/h., 90 km/h. y 110 km/h., respectivamente. Calcule con base en la media armónica la
velocidad media con la que el señor López realizó el viaje.
14).- El chofer de nombre Javier Hernández de la línea AU viajo 1000 km. en 4 tramos de 250 cada
uno, con velocidades de 92 km/h., 85 km/h., 95 km/h. y 80 km/h., respectivamente. Calcule con en
base en la media armónica la velocidad media con la que el señor Javier Hernández realizó el viaje.
45
46. Capítulo 1
70 70
15).- Se llevo a cabo un experimento y se anotaron sus valores ∑i =1
x i = 1406 , con ∑x
i =1
2
i = 29042 ,
50
y ∑x y
i =1
i i = 206171 .
50 50 50
18).- Se conoce que ∑
i =1
x i = 993 , ∑
i =1
y i = 3592 y ∑x y
i =1
i i = 76417 , calcule la covarianza de los
46