Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Media Aritmética
X = X1+X2+X3+...Xn / N
donde N es el número de datos.
X = 8+3+5+12+10 / 5 = 38 / 5 = 7.6
X = Xo + W*[SUMA DE (U*F)] / N
Donde:
X: Media de la muestra.
Xo: Marca de clase a la cual se le asigna el código 0.
w : Amplitud del intervalo de clase.
u : Código asignado a cada clase.
f : Frecuencia de cada clase.
n :Total de datos.
Este método se caracteriza por colocar códigos enteros positivos y negativos a todos los
intervalos. Los negativos se colocan arriba de la marca de clase asignada por el código cero
(Xo) El código 0 se puede colocar en cualquier intervalo pero por lo regular se asigna en la
clase que esté mas al centro. Para este caso se colocará en el intervalo 66-68. Todo lo
anterior se muestra como sigue:
La mediana
La mediana será el valor promedio de los dos valores centrales, que en este caso
son 43 y 35:
Me = 43+35/2 = 39 pacientes
Me = {W[(n+1)/2 - (F + 1)]/Fm} + Lm
Me = Mediana de la muestra.
Me = {W[(n+1)/2 - (F + 1)]/Fm} + Lm
Efectuando la división:
Efectuando la sustracción:
Me = {50[98.5]/187} + 100
Me = {4925/187} + 100
Me = 26.33 + 100
Me = $126.33
La moda
La moda es una medida de tendencia central que difiere de la media, pero que se parece un
poco a ella porque realmente no se calcula por medio de los procesos ordinarios de la
aritmética. La moda es el valor que mas se repite dentro del conjunto de datos. Como en
cualquier otro aspecto de la vida, el azar interviene de manera importante en la ordenación
de los datos. Algunas veces hace que algún elemento no representativo se repita bastante a
menudo y sea el valor mas frecuente del conjunto de datos. Por tal razón, rara vez
utilizamos como una medida de tendencia central la moda de datos agrupados. Por ejemplo,
la tabla siguiente muestra el número de viajes de reparto que diariamente hizo una planta de
concreto. El valor modal es 15 por ocurrir mas a menudo que los demás (3 veces). Una
moda de 15 implica que la actividad de la planta es mayor a 6.7 (esta es la respuesta que
obtendríamos si calculáramos la media). La moda nos indica que 15 es el número mas
frecuente de viajes, pero no nos permite conocer que la mayor parte de los valores son
menores que 10.
Cálculo de la Moda a partir de datos agrupados. Cuando los datos ya están agrupados
en una distribución de frecuencia, debemos suponer que la moda se halla en la clase que
tenga mas elementos, es decir, que posea la frecuencia mas elevada. ¿Pero como podemos
determinar un solo valor de la moda con esta clase modal? El método de calcular la moda
cuando contamos con datos agrupados consiste en aplicar la siguiente ecuación:
Donde:
Mo = 100 + [3200]/(169)
Efectuando la división:
Mo = $119
2
=
∑
f( X - µ )2 / N
Donde:
2 = Varianza de la población.
Desviación estándar de la población = raíz cuadrada de la varianza.
f = Frecuencia de cada una de las clases.
X = Marcas de clase.
μ = Media de la población.
N = Tamaño de la población
El vicepresidente de mercadotecnia de una cadena de locales de comida de preparación rápida está estudiando las ventas
de 100 locales situados en el Distrito Federal y ha preparado la siguiente distribución de frecuencia de las ventas anuales.
1,000,000
1,120,000
90,000 720,000
1000-1099 1050 10 10500 1250 -200
40,000 400,000
10,000 120,000
0 0
10,000 130,000
40,000 400,000
90,000 810,000
1,120,000
250,000 500,000
360,000 360,000
2
= 6,680,000
Resolución. Las clases y las frecuencias son los datos que deben conocerse
de la tabla. Los cálculos son todos los datos en azul marino.
Para calcular la varianza y la desviación estándar primeramente debemos
calcular la media poblacional. Analizando se observa que: ∑fx = 125,000.
Por lo que el valor de la media aritmética es:
µ =∑( f x ) / n = 125,000 / 100 = $1250 US.
En la última columna de la tabla, se observa que: ∑f ( X-µ )2 = 6,680,000
Por lo que los valores buscados son:
2 =
Σ f ( X - µ )2 / N = 6,680,000/100 = $66,800 dólares al cuadrado
( Varianza ).
y:
= raíz cuadrada de $66,800 = $258.5 (Desviación estándar).
Tipos de variables
A) ALEATORIAS. Una variable aleatoria es una regla bien definida para asignar
valores numéricos a todos los resultados posibles de un experimento. Esto
significa que los símbolos utilizados por ejemplo como en una moneda, “cara” o
“cruz”, “defectuosos”, etc., serán sustituídos aquí por números. Los resultados de
algunos experimentos satisfacen fácilmente esta definición de variable aleatoria,
ya que originalmente son números bien definidos. Por ejemplo, la duración de una
lámpara (en horas), el número de piezas defectuosas en un lote de transistores y
la ganancia que se espera obtener con una inversión de $1000 son números bien
definidos. En otros casos, los resultados pueden ser de naturaleza cualitativa. Por
ejemplo, e resultado del lanzamiento de una moneda puede ser cara o cruz, y la
calificación obtenida en un curso podría ser A, B, C, D ó F. Esto es lo que se hace
con los registros de muchas universidades, cuando se asigan valores numéricos a
las calificaciones, de modo que A=4, B=3, C=2, D=1 y F=0. Cuando se lanza una
moneda, una forma común de definir una variable aleatoria es la de hacer cara=1
y cruz=0.
C) DISCRETAS. Son aquellas que se expresan por medio de valores enteros
(sin parte decimal).
E) CUALITATIVAS. Todas las cualitativas (región, ciudad, partido al que vota,
sentimiento religioso, ve o no ve la tele...) Las de escala ordinal cuando no las
“transformamos” en cuantitativas: opinión sobre algo (muy buena, buena, regular, mala,
muy mala) Algunas variables cuantitativas: las que tienen pocos valores (número de
personas en el hogar, número de partidos políticos en el ayuntamiento...).
9. Gráficas
Una gráfica es una relación pictórica de la relación entre dos variables. En estadística se
emplean muchos tipos de gráficas, de acuerdo a la naturaleza de los datos y el propósito
que se tenga. Entre ellas están las gráficas de barras, las gráficas de pastel, etc.
Fuente: National Center for Health Statics, Vital and Health Statics
Ejemplo 2
Los Grandes Lagos
La siguiente tabla muestra el área de los cinco grandes lagos bajo jurisdicción
de los Estados Unidos. Graficar los datos utilizando un diagrama de pastel.
A la figura
mostrada se le
llama gráfica
de pastel,
gráfica circular
ó diagrama
circular. Para
construirla, se
hace
corresponder
el área total,
60178 millas
cuadradas,
equivalente a los 360o del círculo. De este modo, una milla cuadrada corresponde
a 360o/60178. Se deduce que el Lago Superior, con 20557 millas cuadradas,
ocupa un arco de 20557(360o/ 60178 = 123o), mientras que los lagos Michigan,
Hurón, Erie y Ontario ocupan arcos de 134o, 53o, 30o y 20o respectivamente. Las
líneas divisorias se pueden trazar usando un transportador o bien graficando en
papel polar. Este se último se puede bajar desde la página:
www.printfreegraphpaper.com
Ejemplo
3
Aviación
La siguiente tabla se basa en los valores proporcionados por el Annual Report de la Boeing
Company en 1974. Construir un diagrama de pastel para la acumulación de pedidos
pendientes, de acuerdo con la categoría del pedido.
Categoría Cantidad($)
Aviación Comercial 2732
Misiles y naves espaciales 408
Aviación Militar 639
Otros 45
Ejemplo
4
VIH