Análisis de medidas de tendencia central y dispersión en datos biométricos

INTRODUCCION
La mayor parte de las serie de datos muestran una clara tendencia a agruparse alrededor de un
cierto punto central. Así pues, dada cualquier serie de datos particular, por lo general es posible
seleccionar algún valor o promedio típico para describir toda la serie de datos. Este valor descriptivo
típico es una medición de tendencia central o de ubicación
En ocasiones ciertas investigaciones nos arrojan datos numéricos que tienen tendencia a
agruparse alrededor de un punto central, así que por lo general es posible seleccionar algún
valor o promedio típico para describir toda la serie de datos, y lo hacemos por medio de las medidas
dentro de las que se encuentra la media, mediana, moda entre otras.
A veces en nuestros trabajos requerimos de realizar experimentos que permitan descifrar el

comportamiento de cierto de ciertas variables, para lo cual nos es de gran ayuda el análisis de
correlación que quiere determinar el grado o fuerza de relación que hay entre las
variables, es expresado por un único valor llamado coeficiente de correlación (r); Y el
análisis de regresión tiene como propósito, por medio de una ecuación de estimación o
fórmula matemática relacionar las variables conocidas con las desconocida; así como
también nos es de utilidad y complemento a lo anterior el modelo de regresión lineal
simple, Cuando se quiere explicar el comportamiento de una variable dependiente (Y);
pero cuando se quiere explicar una variable dependiente (y), a partir de una variable
dependiente (x), se hace uso de los modelos de regresión lineal múltiple.
Este tipo de correlación lineal se puede demostrar por medio de un diagrama de
dispersión, que a su vez nos puede proporcionar la fórmula de la pendiente que nos sirve
en posteriores estudios de regresión lineal.
Por lo que en este trabajo se trabajaran los anteriores conceptos y sus diferentes
aplicaciones, por medio de fórmulas que permitirán en algunos casos hallar su
probabilidad de relación entre variables y aprobar o no hipótesis de experimentos; así
como hacer uso de las medidas de tendencia central para sacar diferentes conclusiones.
1. Los siguientes son los pesos (Kg) y estatura (cm) de los 14 individuos de una muestra estudiada por
Roberts et al. Para saber si las recomendaciones vigentes de los requerimientos dietéticos de energía
probablemente subestiman el total de energía necesaria en varones adultos jóvenes.
a) Para cada variable, calcule media, mediana, varianza, desviación estándar y coeficiente de variación.
Variable peso
Mediana peso:
56,4 59,7 63,8 64,6 65,3 66,2 69,2 70,3 71,3 78,8 79,6 83,9 88,7 99
n+1 14 +1 15
posicion central= = = =7,5
2 2 2
Med=69,2+ 70,3/2=69.75 kg
Media peso:
Me=56,4+ 59,7+63,8+64.6 … … …+ 88,7+99=23.75/23
1016 ,8
Me ( μ )= =72,6 kg
14
La moda: no tiene moda.
La varianza muestral:
N
2
S =∑ ¿ ¿¿ ¿
i =1
´ ¿2∗1 ) + ( 59,7− 72¿

´ 2∗1 ) +… ..+ ( 99−72¿
´ 2∗1 ) /14−1
S2=( 56,4−72
¿
Tabla de peso
Xi-X
Xi X(media) (media) (Xi-X)2
56,4 72 -15,6 243,36
59,7 72 -12,3 151,29
63,8 72 -8,2 67,24
64,6 72 -7,4 54,76
65,3 72 -6,7 44,89
66,2 72 -5,8 33,64
69,2 72 -2,8 7,84
70,3 72 -1,7 2,89
71,3 72 -0,7 0,49
78,8 72 6,8 46,24
79,6 72 7,6 57,76
83,9 72 11,9 141,61
88,7 72 16,7 278,89
99 72 27 729
1859,9
1860 1860
S2 = = 143
14−1 13
La desviación estándar:
S= √ S2
S= √ 1 43=11,95
El coeficiente de variación:
S (desviacion estandar)
CV =
x́ (media muestral)
11,95
CV = =0,16=16 %
72
Variable estatura
Mediana estatura:
161 164 168 169 173 174 174 175 177 180 183 184 185 205
2
n+1 14 +1 15 174+ 175

posicion central= = = =7,5Med = =174,5 cm
2 2 2 2
Media estatura:
Me=56,4+ 59,7+63,8+64.6 … … …+ 88,7+99=23.75/23
2472
Me ( μ )= =176 cm
14
La moda: Mo=174 cm
La varianza muestral:
N
2
S =∑ ¿ ¿¿ ¿
i =1
´ ¿2∗1 ) + ( 164− 176
´ ¿2∗1 ) +… ..+ ( 205−176
´ ¿2∗1 ) /14−1
S2=( 161−176
¿
Altura
X(media Xi-X
Xi ) (media) (Xi-X)2
161 176 -15 225
164 176 -12 144
168 176 -8 64
169 176 -7 49
173 176 -3 9
174 176 -2 4
174 176 -2 4
175 176 -1 1
177 176 1 1
180 176 4 16
183 176 7 49
184 176 8 64
185 176 9 81
205 176 29 841
sumatori
a 1552
1860 1552
S2 = = =119
14−1 13
La desviación estándar:
S= √ S2
S= √119=10,9 cm
El coeficiente de variación:
CV =
10,9
CV = =0,061=6 %
176
b) Para cada variable elabore un despliegue de tallo y hojas y una gráfica de valores extremos
Tallo y hojas de altura
Tallo Hojas
16 1 4 8 9
17 3 4 4 5 7
18 0 3 4 5
19
20 5
Tallo y hojas de peso
Tallo Hojas
56 4
59 7
63 8
64 6
65 3
66 2
69 2
70 3
71 3
78 8
79 6
83 9
88 7
99 0
Gráfica de valores extremos de estatura
Diagrama de minimos y maximos de estatura

210 205
200
190 184 185
177 180 183
180 173 174 174 175
168 169
170 161 164
Estatura (cm)
160
150
140
130
120
110
100
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Hombres adultos
Gráfica de valores extremos de Peso

Diagrama de minimos y maximas de peso
105
100
95
90
85
Peso Kg
80
75
70
65
60
55
1 2 3 4 5 6 7 8 9 10 11 12 13
Hombres
peso minimo maximo
c) ¿Qué conjunto de mediciones tiene mayor variabilidad, peso o estatura? ¿Qué bases tiene su
respuesta?
El mayor coeficiente de variación del peso 16% con respecto a la estatura 6%, expresa que los valores de
peso son más heterogéneos.
La varianza que representa la variabilidad de una serie de datos respecto a su media Y la

mayor varianza de la variable peso (143) con respecto a la variable estatura (119); expresa que es
mayor la dispersión de la variable peso, que la variable estatura con respecto a la media.
3. En un estudio genético aplicado en moscas, se colocó en 20 frascos una alimentación regular y se

contó el número de moscas de un determinado genotipo en cada frasco. En otros 20 frascos que
contenía zumo de uva se contó el número de moscas. El número de moscas contadas fueron:
a) Calcular la media de la muestra, la varianza de la muestra, la desviación estándar de la muestra y el

coeficiente de variación de cada conjunto de datos utilizando los recursos de Excel. Haga los respectivos
comentarios.
Primeramente organice los datos de menor a mayor con la función “filtrar”, luego para hallar la media
utilice la función “promedio”; luego halle los valores X i −x́, y ¿ ¿, para obtener la sumatoria ¿ ¿,
que se utilizara en la fórmula de la varianza, la cual es la siguiente:
N
S2=∑ ¿ ¿¿ ¿
i =1
889,8 889,8
S2 = = =46,8
20−1 19
Después se calcula la desviación estándar:
S= √ S2
S= √ 46,8=6,84
Y por último se calculó el coeficiente de variación:
CV =
6,48
CV = =0,27=27 %
25,1
Sus resultados de la comida regular se presentan a continuación en la tabla:
Comida regular
Xi X(media) Xi-X (media) (Xi-X)2
15 25,1 -10,1 102,01
16 25,1 -9,1 82,81
19 25,1 -6,1 37,21
20 25,1 -5,1 26,01
20 25,1 -5,1 26,01
20 25,1 -5,1 26,01
21 25,1 -4,1 16,81
22 25,1 -3,1 9,61
22 25,1 -3,1 9,61
23 25,1 -2,1 4,41
23 25,1 -2,1 4,41
25 25,1 -0,1 0,01
26 25,1 0,9 0,81
28 25,1 2,9 8,41
29 25,1 3,9 15,21
31 25,1 5,9 34,81
31 25,1 5,9 34,81
33 25,1 7,9 62,41
38 25,1 12,9 166,41
40 25,1 14,9 222,01
sumatoria 889,8
Varianza 46,8315789
Desviacion estandar 6,84336021
coeficiente de variacion 0,27264383
El mismo proceso y los mismos cálculos se utilizaron para hallar la media, varianza,
desviación estándar y coeficiente de variación del zumo de uva y se presentan en la
siguiente tabla.
Zumo de uva
Xi X(media) Xi-X (media) (Xi-X)2
0 11,05 -11,05 122,1025
2 11,05 -9,05 81,9025
2 11,05 -9,05 81,9025
5 11,05 -6,05 36,6025
6 11,05 -5,05 25,5025
7 11,05 -4,05 16,4025
9 11,05 -2,05 4,2025
9 11,05 -2,05 4,2025
9 11,05 -2,05 4,2025
11 11,05 -0,05 0,0025
12 11,05 0,95 0,9025
12 11,05 0,95 0,9025
13 11,05 1,95 3,8025
13 11,05 1,95 3,8025
16 11,05 4,95 24,5025
18 11,05 6,95 48,3025
19 11,05 7,95 63,2025
19 11,05 7,95 63,2025
19 11,05 7,95 63,2025
20 11,05 8,95 80,1025
sumatoria 728,95
Varianza 38,3657895
Desviacion estandar 6,19401239
coeficiente de variacion 0,56054411
b) ¿Cuál de estos dos conjuntos de datos tienen una mayor variabilidad?
La mayor variabilidad la presenta la comida corriente con un valor 46,8 vs 38,3 del zumo de vino; lo que
deja ver su mayor dispersión con respecto a la media.
c) Para cada conjunto de datos crear gráficos de histograma

Histograma de comida corriente
9
8
7
Frecuencia 6
5
4
3
2
1
0
17.5 22.5 27.5 32.5 37.5
Marca de clase
Histograma de frecuencias C. corriente poligono de frecuencia
Histograma de zumo de uva

7
6
5
Frecuencia
4
3
2
1
0
2 6 10 14 18
Marca clase
Histograma de frecuencias C. corriente poligono de frecuencia
7. La siguiente tabla muestra los valores del consumo de metilmercurio y la concentración total de
mercurio en la sangre de 12 individuos expuestos al metilmercurio por consumir peces contaminados.
a) Realizar el análisis de regresión lineal con las herramientas para análisis de datos de Excel y con
fórmulas (relacionando operaciones) en Excel, presentar la ecuación y coeficiente de
determinación.
Primeramente ordene la variable dependiente x, correspondiente al consumo de Hg, y por

consiguiente se ordenaron los valores de la variable y dependiente (Hg en la sangre); después
aplique un diagrama de dispersión que presento a continuación, donde inserte línea de
tendencia, ecuación de la gráfica y coeficiente de determinación (R2).
Diagrama de dispersion
600
500
Hg en la sangre
400
f(x) = 0.64 x − 20.58
300 R² = 0.88
200
100
0
0 100 200 300 400 500 600 700
Consumo Hg
Después reemplace la formula R2, para obtener la (y) calculada, después, calcule el error y el
denominador de la fórmula de regresión lineal simple; para a obtener el resultado.
Formula R^2 y calculada = 0,6407x - 20,579
x1 y error e cadrada Denominador

Consumo hg Hg en sangre y calculada e (y- y calculada) error*error (y - Prom y)
105 70 46,6945 23,3055 543,14633 22250,6944
180 90 94,747 -4,747 22,534009 16684,0278
200 120 107,561 12,439 154,728721 9834,02778
230 125 126,782 -1,782 3,175524 8867,36111
250 105 139,596 -34,596 1196,88322 13034,0278
275 170 155,6135 14,3865 206,971382 2417,36111
410 290 242,108 47,892 2293,64366 5017,36111
460 205 274,143 -69,143 4780,75445 200,694444
550 290 331,806 -41,806 1747,74164 5017,36111
580 375 351,027 23,973 574,704729 24284,0278
600 310 363,841 -53,841 2898,85328 8250,69444
650 480 395,876 84,124 7076,84738 68034,0278
Promedio y 219,166667 ෍ ݁ʹ 21499,9843 183891,667
CD = R^2 0,88308342
Y por ultimo aplique el análisis de regresión en Excel, donde pude corroborar que todos los R2
están iguales y se encuentran señalados en color naranja.
Resumen
Estadísticas de la regresión
Coeficiente de correlación
0,9397252 múltiple
Coeficiente de0,88308345
determinación R^2
R^2 ajustado 0,87139179
Error típico 46,3680709
Observaciones 12
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 162391,687 162391,687 75,5310874 5,6597E-06
Residuos 10 21499,98 2149,998
Total 11 183891,667
Coeficientes Error típico Estadístico t ProbabilidadInferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepción -20,5790583 30,6618875 -0,67116084 0,51732029 -88,898001 47,7398845 -88,898001 47,7398845
Variable X 1 0,64074581 0,07372638 8,69086229 5,6597E-06 0,4764732 0,80501842 0,4764732 0,80501842
b) Encuentre la ecuación de regresión lineal entre las dos variables.
Ecuación de regresión lineal múltiple con el método de los mínimos cuadrados:

y=b1 x−b0
C) Plantear las hipótesis respectivas.
H 0 : β 0=β 1=0
H A : β0≠ 0
H A : β1≠ 0
d) Calcule r 2 y compruebe hipótesis con las estadísticas de prueba t y F. Siendo =0.05.
e) ¿Para un consumo de 170, se puede estimar el mercurio en la sangre?
Respuesta: Sí.
x=170(variable independiente )
y=? variable dependiente
y=b1 x−b0
y=(0,6407∗170)−20,579
y=88,34
4. Azoulay-Dupuis et al. Estudiaron la eficacia de cuatro medicamentos para erradicar el Streptococcus
pneumoniae de los pulmones de ratones de laboratorio hembras en varias ocasiones antes de la
infección. Las siguientes mediciones corresponden a la existencia de bacterias en los pulmones 24 horas
de aplicar las inyecciones del tratamiento.
a) ¿Qué tipo de diseño experimental es? Justifique su respuesta
Es un diseño de bloques al azar, ya que solo evalúa un factor, t niveles y varias repeticiones.
b) ¿Cuál es el modelo matemático? Para cada ítem en el ejercicio planteado indique a que
corresponde cada término del modelo.
Y ij =μ+t i+ e i j
Y ij =es el valor observado en la unidad experimental que recibe eltratamiento i; Repeticion j .
μ=efecto general de la media

t i=efecto deltratamiento i.
e ij =error aleatorio(residuo)
c) ¿Estipule claramente las hipótesis que interesa contrastar con el análisis de varianza de este
experimento?
d) Realice el análisis de varianza en Excel, con las fórmulas, la tabla de varianza debe recoger los valores
de SC, CM, GL, F y probabilidad realizados con fórmula debidamente evidenciable y relacionando las
operaciones. No se admitirán resultados que no sean del producto de las fórmulas elaboradas en el
archivo Excel.
Análisis de varianza de un factor
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 3 25,5 8,5 0,13
Columna 2 3 7,8 2,6 0
Columna 3 3 7,8 2,6 0
Columna 4 3 20,08 6,69333333 1,46413333
Columna 5 3 18,91 6,30333333 2,67303333
Origen de las variaciones
Suma de cuadrados
Grados de
Promedio
libertad de los cuadradosF Probabilidad
Valor crítico para F
Entre grupos 83,28096 4 20,82024 24,3958599 3,8407E-05 3,47804969
Dentro de los grupos
8,53433333 10 0,85343333
Total 91,8152933 14
CONCLUSIONES
Las medidas de tendencia central nos permiten medir los datos que tienden a agruparse
hacia un punto central.
El propósito del análisis de correlación es determinar el grado o fuerza de relación que
hay entre las variables, es expresado por un único valor llamado coeficiente de
correlación (r); Y el análisis de regresión tiene como propósito, por medio de una
ecuación de estimación o fórmula matemática relacionar las variables conocidas con las
desconocidas, y que a su vez permita estimar el valor desconocido de una variable a
partir del valor conocido de una o más variables.
Un análisis de varianza (ANOVA) prueba la hipótesis de que las medias de dos o más
poblaciones son iguales. Los ANOVA evalúan la importancia de uno o más factores al comparar
las medias de la variable de respuesta en los diferentes niveles de los factores; y las podemos
utilizar como forma de probar el resultado de nuestros cálculos manuales.
Al desarrollar todos estos conceptos de estadística descriptiva, podremos facilitar el entendimiento y

desarrollo de hipótesis de investigación y estadísticas que puedan ser aplicadas al análisis de resultados
experimentales en nuestra profesión agropecuaria.
MMMMMM
https://es.slideshare.net/rbarriosm/6-diseos-completamente-aleatorizado-y-bloques-al-azar
a)
https://drive.google.com/file/d/1tfpmQidOIWLNPDS7vYLx0yAP-kjBTVMl/view
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN Cuenta Suma Promedio Varianza

Fila 1 5 29,16 5,832 8,99212
Fila 2 5 23,7 4,74 6,098
Fila 3 5 27,23 5,446 7,09708
Columna 1 3 25,5 8,5 0,13

Columna 2 3 7,8 2,6 0
Columna 3 3 7,8 2,6 0
Columna 4 3 20,08 6,69333333 1,46413333
Columna 5 3 18,91 6,30333333 2,67303333
Origen de las variaciones
Suma de cuadrados
Grados de
Promedio
libertad de los cuadradosF Probabilidad
Valor crítico para F
Filas 3,06649333 2 1,53324667 2,24329412 0,16849413 4,45897011
Columnas 83,28096 4 20,82024 30,4621057 6,8491E-05 3,83785335
Error 5,46784 8 0,68348
Total 91,8152933 14
Hhhhhhhhhhhhhhhhhhhh
La línea recta que mejor explica la relación entre la variable dependiente y la independiente es
con la ecuación:
Dónde:
Y= 1363, 3 + 5,7177X
^y =β 0 + β 1 X 1+ β2 X 2 + ε i
Como paso siguiente Reemplazamos lo datos obtenidos con el comando análisis de datos
de Excel tenemos:
^y =56.251+1.7898 X 1 +0.0867 X 2+ ε i
El R2 sirve para saber qué tan bueno es un modelo. Cuando se acerca a uno sera un modelo mejor.

Análisis de medidas de tendencia central y dispersión en datos biométricos

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Análisis de medidas de tendencia central y dispersión en datos biométricos

Cargado por

Copyright:

Formatos disponibles

INTRODUCCION

A veces en nuestros trabajos requerimos de realizar experimentos que permitan descifrar el

´ ¿2∗1 ) + ( 59,7− 72¿

n+1 14 +1 15 174+ 175

Tallo y hojas de altura

Tallo y hojas de peso

Gráfica de valores extremos de estatura

Diagrama de minimos y maximos de estatura

Gráfica de valores extremos de Peso

peso minimo maximo

La varianza que representa la variabilidad de una serie de datos respecto a su media Y la

3. En un estudio genético aplicado en moscas, se colocó en 20 frascos una alimentación regular y se

a) Calcular la media de la muestra, la varianza de la muestra, la desviación estándar de la muestra y el

b) ¿Cuál de estos dos conjuntos de datos tienen una mayor variabilidad?

c) Para cada conjunto de datos crear gráficos de histograma

Histograma de frecuencias C. corriente poligono de frecuencia

Histograma de zumo de uva

Histograma de frecuencias C. corriente poligono de frecuencia

Primeramente ordene la variable dependiente x, correspondiente al consumo de Hg, y por

x1 y error e cadrada Denominador

b) Encuentre la ecuación de regresión lineal entre las dos variables.

Ecuación de regresión lineal múltiple con el método de los mínimos cuadrados:

C) Plantear las hipótesis respectivas.

d) Calcule r 2 y compruebe hipótesis con las estadísticas de prueba t y F. Siendo =0.05.

e) ¿Para un consumo de 170, se puede estimar el mercurio en la sangre?

a) ¿Qué tipo de diseño experimental es? Justifique su respuesta

Y ij =es el valor observado en la unidad experimental que recibe eltratamiento i; Repeticion j .

μ=efecto general de la media

Al desarrollar todos estos conceptos de estadística descriptiva, podremos facilitar el entendimiento y

RESUMEN Cuenta Suma Promedio Varianza

Columna 1 3 25,5 8,5 0,13

También podría gustarte