Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Fio - Bio
Fio - Bio
ÁREA: BIOESTADISTICA
ALUMNO:
IQUITOS – PERÚ
2015.
Los fenómenos que se observan sometidos al azar no suelen ser constantes, por lo
que será necesario que junto a una medida que indique el valor alrededor del cual se
agrupan los datos, se disponga de una medida que haga referencia a la variabilidad
que refleje dicha fluctuación. En este sentido pueden examinarse varias
características, siendo las más comunes: la tendencia central de los datos, la
dispersión o variación con respecto a este centro, los datos que ocupan ciertas
posiciones, la simetría de los datos y la forma en la que los datos se agrupan. A
continuación se detalla un trabajo muy minucioso y prolijo en su expresión , dejando
con placer al lector.
La estadística ha estado presente desde hace siglos atrás con las antiguas
civilizaciones, su uso ha sido necesario en primeras instancias para resolver casos
de la vida diaria por llamarlo de alguna manera, luego sería empleada con fines a
mayor escala como trabajos investigativos o estudios, y ha adquirido relevancia, ya
que por medio de ella se puede procesar una extensa información, lo cual se puede
llevar a cabo de forma más sencilla sin pasar a ser algo tedioso.
Tanto así es su importancia que ha dejado de ser solo una parte de las matemáticas
y se ha convertido en una ciencia empleada en diferentes campos, pues han tomado
sus métodos para aplicarlos a sus aéreas independientemente de la que sea, como
por ejemplo: la psicología, la medicina, la contaduría, administración, entre otras.
Media Aritmética
x1 n1 f1
... ... ...
x n f
k k k
Demostración:
Basta desarrollar el sumatorio para obtener:
Xn
(xi − x) = (x1 − x) + · · · + (xn − x) = (x1 + · · · + xn) − nx = nx − nx = 0
i=1
Ejemplo
Obtener las desviaciones con respecto a la media en la siguiente
distribución y comprobar que su suma es cero.
l −l
i−1 i ni
0 - 10 1
10 - 20 2
20 - 30 4
30 - 40 3
Solución:
l −l
i−1 i ni xi xini xi − x (xi − x ) ni
0 - 10 1 5 5 -19 -19
10 - 20 2 15 30 -9 -18
20 - 30 4 25 100 +1 +4
30 - 40 3 35 105 +11 +33
k k
Linealidad de la media:
Si Y = a + bX entonces la correspondiente media de Y es
y = a + bx,
Observaciones:
Es muy sensible a los valores extremos de la variable: todas las observaciones inter-
vienen en el cálculo de la media, así, la aparición de una observación extrema hará
que la media se desplace en esa dirección.
Cálculo abreviado
Se puede utilizar la propiedad de la linealidad de la media para simplificar las
operaciones necesarias para su cálculo mediante un cambio de origen y de unidad
de medida, en el caso de tener datos con muchos dígitos.
Media geométrica
√
xG = n x1x2 . . . xn,
1 1
x + · · · +xn
à 1
!
x A = n −1 =
n
= 1 1 .
x
+ · · · +xn1
Media cuadrática
Es la raíz cuadrada de la media aritmética de los cuadrados de las
observaciones:
r
2 2 1 n
x + · · · + x xC = .
n
Mediana
Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones
extremas, ya que no depende de los valores que toma la variable, sino del orden de las
mismas. Por ello es adecuado su uso en distribuciones asimétricas.
CC0 BB0
AC = AB =⇒
n
ni 2 − Ni−1
a = Me l =⇒
i − ni−1
2− Ni−1
Me = li−1 + ni · ai
X ∼ 2, 5, 7, 9, 125
x = x1+···+xn = 2+5+7+9+125= 29,6 y Me = 7.
n 5
En este caso la media no es un posible valor de la variable (discreta), y se ha
visto muy afectada por la observación extrema. Este no ha sido el caso para
la mediana.
Moda
Llamaremos moda a cualquier máximo relativo de la distribución de frecuencias, es
decir, cualquier valor de la variable que posea una frecuencia mayor que su anterior
y su posterior.
De la moda se puede destacar las siguientes propiedades:
Estadísticos de posición
Para una variable discreta, se define el percentil de orden k, como la observación,
Pk, que deja por debajo de sí el k % de la muestra. Esta definición es semejante a la
de la mediana, pues como consecuencia de la definición, es evidente que Me = P 50.
Por su propia naturaleza, el percentil puede estar situado en cualquier lugar de la
distribución, por lo que no se puede considerar como una medida de tendencia
central, sino más bien de posición.
De forma análoga se pueden definir los deciles como los valores de la variable que
dividen a las observaciones en 10 grupos de igual tamaño. Más precisamente,
definimos
D1, D2, . . . , D9 como:
Di = P10i,
donde i = 1, . . . , 9.
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
n = 100
Solución:
1. Primer cuartil: n4 = 25; Es el primer valor tal que Ni > n/4 = 39; luego Q1 = 2.
2. Segundo cuartil: 24n = 50; Es el primer valor tal que Ni > n/2 = 65; luego Q2 = 3.
3. Tercer cuartil: 34n = 75; Es el primer valor tal que Ni > 3n/4 = 85; luego Q3 = 4.
Desviación media
Como se observa, la desviación media guarda las mismas dimensiones que las
observaciones. La suma de valores absolutos es relativamente sencilla de calcular,
pero esta simplicidad tiene un inconveniente: desde el punto de vista geométrico, la
distancia que induce la desviación media en el espacio de observaciones no es la
natural (no permite definir ángulos entre dos conjuntos de observaciones). Esto hace
que no sea muy conve-niente trabajar con ella cuando se considera inferencia
estadística.
Nota: Como forma de medir la dispersión de los datos se tiene que descartar
1n
nPi=1
(xi − x), pues esa suma vale 0, ya que las desviaciones con respecto a la me-
dia se pueden compensan unas con otras al haber términos en esa suma que son
de signos distintos.
IQR = Q3 − Q1
Es preferible usarlo cuando aparecen observaciones anómalas (outliers).
1 Xn (xi − x)2 .
σ2 = n
i=1
La varianza es:
Xi
2 2 2 2 2
1 n 3 +3 +4 +4 +5
σ2 = 2
n xi − x2 = 5 − 3,82 = 0,56 metros2,
=1
√ 2
√
y la desviación estándar es σ = + σ = 0,56 = 0, 748 metros.
1 n 1 n
σy2 = n =1 (yi − y )2 = n i=1
[(axi + b) − (ax + b)]2 =
Xi X
1 n
= n =1 a2 (xi − x )2 = a2σx2.
Xi
Las consecuencias del anterior resultado eran de esperar: Si los resultados de una
medida son trasladados una cantidad b, la dispersión de los mismos no aumenta. Si
estos mismos datos se multiplican por una cantidad a < 1, el resultado tenderá a
concentrarse alrededor de su media (menor varianza). Si por el contrario a > 1 habrá
mayor dispersión.
1 n nσ2
2
s =n 1 =1
(xi − x )2 = n 1 .
− Xi −
Tipificación
La tipificación al proceso de restar la media y dividir entre su desviación típica a una
variable X. De este modo se obtiene una nueva variable
z = X − x,
σ
de media 0 y desviación estándar σz = 1, que se denomina variable tipificada.
Esta nueva variable carece de unidades y permite hacer comparables dos medidas
que en un principio no lo son, por aludir a conceptos diferentes. Así, por ejemplo,
nos podemos preguntar si un elefante es más grueso que una hormiga determinada,
cada uno en relación con su población. También es aplicable al caso en que se
quieran comparar individuos semejantes de poblaciones diferentes. Por ejemplo si
deseamos comparar el nivel académico de dos estudiantes de diferentes
Universidades para la concesión de una beca de estudios, en principio sería injusto
concederla directamente al que posea una nota
Coeficiente de Variación:
σ
CV = x · 100.
Observaciones:
Sólo se debe calcular para variables con todos los valores positivos. Todo índice de
variabilidad es esencialmente no negativo. Las observaciones pueden ser positivas o
nulas, pero su variabilidad debe ser siempre positiva. De ahí que sólo se deba
trabajar con variables positivas, de modo que x > 0.
σ σ aσ
CVY = yY = axax = axx = CVX
Nota: Es importante destacar que el coeficiente de variación sirve para comparar las
variabilidades de dos conjuntos de valores (muestras o poblaciones), mientras que si
deseamos comparar a dos elementos de cada uno de esos conjuntos, es necesario
usar los valores tipificados.
xi ni
2 47
7 32
15 17
30 4
n = 100
Solución:
Se construye la siguiente tabla auxiliar para realizar los cálculos
xi ni xini xi2ni
2 47 94 188
7 32 224 1568
15 17 255 3825
30 4 120 3600
n = 100 693 9181
Para calcular la variable tipificada
Z = X − x, σx
Partimos de los datos del enunciado. Será necesario calcular en primer lugar
la media y desviación típica de la variable original (X = años).
693
x =100 = 6,93 años
9181
σx2 2
= 100 − 6,93 = 43,78 años
2
σ
x =p 43,78= 6,6 años
A su vez los valores tipificados son
z = 2 − 6,93 = 0,745
1 6,6 −
z2 = 7 − 6,93 = 0,011
6,6
z3 = 15 − 6,93 = 1,22
6,6
z4 = 30 − 6,93 = 3,486
6,6
0,021
z = 100 ≈ 0
100,002
σz2 = √ 100 − 0 ≈ 1
σz = 1=1
CONCLUSION
Se les sugiere a todos los estudiantes académicos de todos los niveles, que
para ejecutar estas clases de trabajo se debe ser minucioso, incisivo, prolijo, y
exhaustivo para la extracción y recopilación de información en cualquier
trabajo escrito.
Bibliografía
[Ham 90] L.C. Hamilton, Modern Data Analysis. Brooks/Cole Publis-hing Company, Pacific
Grove, 1990.
[Mar 94] A. Mart´ın Andres,´ J.D. Luna del Castillo, Bioestad´ıstica para las Ciencias de la
salud. Norma, Granada, 1994.
[MS 88] L.A. Marascuilo, R.C. Serlin, Statistical Methods for the Social and Behavioral
Sciences. W.H. Freeman and Company, Nueva
York, 1988.
[Pe˜n 94] D. Pena˜ Sanchez´ de Rivera, Estad´ıstica: Modelos y M´etodos,
1. Alianza Universidad Textos, Madrid, 1994.
[RMR 91] T. Rivas Moya, M.A. Mateo, F. R´ıus D´ıaz, M. Ruiz, Es-tad´ıstica Aplicada a las
Ciencias Sociales: Teor´ıa y Ejercicios (EAC). Secretariado de Publicaciones de la
Universidad de M´alaga, M´alaga, 1991.
[SR 90] E. Sanchez´ Font, F. R´ıus D´ıaz, Gu´ıa para la Asignatura de Bioestad´ıstica (EAC).
Secretariado de Publicaciones de la Universi-dad de M´alaga, M´alaga, 1990.
[ST 85] Steel, Torrie, Bioestad´ıstica (Principios y Procedimientos).
Mac Graw–Hill, Bogot´a, 1985.