Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La mayor parte de las serie de datos muestran una clara tendencia a agruparse alrededor de un
cierto punto central. Así pues, dada cualquier serie de datos particular, por lo general es posible
seleccionar algún valor o promedio típico para describir toda la serie de datos. Este valor descriptivo
típico es una medición de tendencia central o de ubicación
En ocasiones ciertas investigaciones nos arrojan datos numéricos que tienen tendencia a
agruparse alrededor de un punto central, así que por lo general es posible seleccionar algún
valor o promedio típico para describir toda la serie de datos, y lo hacemos por medio de las medidas
dentro de las que se encuentra la media, mediana, moda entre otras.
1. Los siguientes son los pesos (Kg) y estatura (cm) de los 14 individuos de una muestra estudiada por
Roberts et al. Para saber si las recomendaciones vigentes de los requerimientos dietéticos de energía
probablemente subestiman el total de energía necesaria en varones adultos jóvenes.
a) Para cada variable, calcule media, mediana, varianza, desviación estándar y coeficiente de variación.
Variable peso
Mediana peso:
56,4 59,7 63,8 64,6 65,3 66,2 69,2 70,3 71,3 78,8 79,6 83,9 88,7 99
n+1 14 +1 15
posicion central= = = =7,5
2 2 2
Med=69,2+ 70,3/2=69.75 kg
Media peso:
Me=56,4+ 59,7+63,8+64.6 … … …+ 88,7+99=23.75/23
1016 ,8
Me ( μ )= =72,6 kg
14
La moda: no tiene moda.
La varianza muestral:
N
2
S =∑ ¿ ¿¿ ¿
i =1
Variable estatura
Mediana estatura:
161 164 168 169 173 174 174 175 177 180 183 184 185 205
2
Media estatura:
Me=56,4+ 59,7+63,8+64.6 … … …+ 88,7+99=23.75/23
2472
Me ( μ )= =176 cm
14
La moda: Mo=174 cm
La varianza muestral:
N
2
S =∑ ¿ ¿¿ ¿
i =1
´ ¿2∗1 ) + ( 164− 176
´ ¿2∗1 ) +… ..+ ( 205−176
´ ¿2∗1 ) /14−1
S2=( 161−176
¿
Altura
X(media Xi-X
Xi ) (media) (Xi-X)2
161 176 -15 225
164 176 -12 144
168 176 -8 64
169 176 -7 49
173 176 -3 9
174 176 -2 4
174 176 -2 4
175 176 -1 1
177 176 1 1
180 176 4 16
183 176 7 49
184 176 8 64
185 176 9 81
205 176 29 841
sumatori
a 1552
1860 1552
S2 = = =119
14−1 13
La desviación estándar:
S= √ S2
S= √119=10,9 cm
El coeficiente de variación:
S (desviacion estandar)
CV =
x́ (media muestral)
10,9
CV = =0,061=6 %
176
b) Para cada variable elabore un despliegue de tallo y hojas y una gráfica de valores extremos
Tallo Hojas
16 1 4 8 9
17 3 4 4 5 7
18 0 3 4 5
19
20 5
Tallo Hojas
56 4
59 7
63 8
64 6
65 3
66 2
69 2
70 3
71 3
78 8
79 6
83 9
88 7
99 0
160
150
140
130
120
110
100
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Hombres adultos
80
75
70
65
60
55
1 2 3 4 5 6 7 8 9 10 11 12 13
Hombres
c) ¿Qué conjunto de mediciones tiene mayor variabilidad, peso o estatura? ¿Qué bases tiene su
respuesta?
El mayor coeficiente de variación del peso 16% con respecto a la estatura 6%, expresa que los valores de
peso son más heterogéneos.
Primeramente organice los datos de menor a mayor con la función “filtrar”, luego para hallar la media
utilice la función “promedio”; luego halle los valores X i −x́, y ¿ ¿, para obtener la sumatoria ¿ ¿,
que se utilizara en la fórmula de la varianza, la cual es la siguiente:
N
S2=∑ ¿ ¿¿ ¿
i =1
889,8 889,8
S2 = = =46,8
20−1 19
Después se calcula la desviación estándar:
S= √ S2
S= √ 46,8=6,84
Y por último se calculó el coeficiente de variación:
S (desviacion estandar)
CV =
x́ (media muestral)
6,48
CV = =0,27=27 %
25,1
Sus resultados de la comida regular se presentan a continuación en la tabla:
Comida regular
Xi X(media) Xi-X (media) (Xi-X)2
15 25,1 -10,1 102,01
16 25,1 -9,1 82,81
19 25,1 -6,1 37,21
20 25,1 -5,1 26,01
20 25,1 -5,1 26,01
20 25,1 -5,1 26,01
21 25,1 -4,1 16,81
22 25,1 -3,1 9,61
22 25,1 -3,1 9,61
23 25,1 -2,1 4,41
23 25,1 -2,1 4,41
25 25,1 -0,1 0,01
26 25,1 0,9 0,81
28 25,1 2,9 8,41
29 25,1 3,9 15,21
31 25,1 5,9 34,81
31 25,1 5,9 34,81
33 25,1 7,9 62,41
38 25,1 12,9 166,41
40 25,1 14,9 222,01
sumatoria 889,8
Varianza 46,8315789
Desviacion estandar 6,84336021
coeficiente de variacion 0,27264383
El mismo proceso y los mismos cálculos se utilizaron para hallar la media, varianza,
desviación estándar y coeficiente de variación del zumo de uva y se presentan en la
siguiente tabla.
Zumo de uva
Xi X(media) Xi-X (media) (Xi-X)2
0 11,05 -11,05 122,1025
2 11,05 -9,05 81,9025
2 11,05 -9,05 81,9025
5 11,05 -6,05 36,6025
6 11,05 -5,05 25,5025
7 11,05 -4,05 16,4025
9 11,05 -2,05 4,2025
9 11,05 -2,05 4,2025
9 11,05 -2,05 4,2025
11 11,05 -0,05 0,0025
12 11,05 0,95 0,9025
12 11,05 0,95 0,9025
13 11,05 1,95 3,8025
13 11,05 1,95 3,8025
16 11,05 4,95 24,5025
18 11,05 6,95 48,3025
19 11,05 7,95 63,2025
19 11,05 7,95 63,2025
19 11,05 7,95 63,2025
20 11,05 8,95 80,1025
sumatoria 728,95
Varianza 38,3657895
Desviacion estandar 6,19401239
coeficiente de variacion 0,56054411
La mayor variabilidad la presenta la comida corriente con un valor 46,8 vs 38,3 del zumo de vino; lo que
deja ver su mayor dispersión con respecto a la media.
4
3
2
1
0
2 6 10 14 18
Marca clase
7. La siguiente tabla muestra los valores del consumo de metilmercurio y la concentración total de
mercurio en la sangre de 12 individuos expuestos al metilmercurio por consumir peces contaminados.
a) Realizar el análisis de regresión lineal con las herramientas para análisis de datos de Excel y con
fórmulas (relacionando operaciones) en Excel, presentar la ecuación y coeficiente de
determinación.
Diagrama de dispersion
600
500
Hg en la sangre
400
f(x) = 0.64 x − 20.58
300 R² = 0.88
200
100
0
0 100 200 300 400 500 600 700
Consumo Hg
Después reemplace la formula R2, para obtener la (y) calculada, después, calcule el error y el
denominador de la fórmula de regresión lineal simple; para a obtener el resultado.
Formula R^2 y calculada = 0,6407x - 20,579
CD = R^2 0,88308342
Y por ultimo aplique el análisis de regresión en Excel, donde pude corroborar que todos los R2
están iguales y se encuentran señalados en color naranja.
Resumen
Estadísticas de la regresión
Coeficiente de correlación
0,9397252 múltiple
Coeficiente de0,88308345
determinación R^2
R^2 ajustado 0,87139179
Error típico 46,3680709
Observaciones 12
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 162391,687 162391,687 75,5310874 5,6597E-06
Residuos 10 21499,98 2149,998
Total 11 183891,667
Coeficientes Error típico Estadístico t ProbabilidadInferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepción -20,5790583 30,6618875 -0,67116084 0,51732029 -88,898001 47,7398845 -88,898001 47,7398845
Variable X 1 0,64074581 0,07372638 8,69086229 5,6597E-06 0,4764732 0,80501842 0,4764732 0,80501842
H 0 : β 0=β 1=0
H A : β0≠ 0
H A : β1≠ 0
Respuesta: Sí.
x=170(variable independiente )
y=? variable dependiente
y=b1 x−b0
y=(0,6407∗170)−20,579
y=88,34
4. Azoulay-Dupuis et al. Estudiaron la eficacia de cuatro medicamentos para erradicar el Streptococcus
pneumoniae de los pulmones de ratones de laboratorio hembras en varias ocasiones antes de la
infección. Las siguientes mediciones corresponden a la existencia de bacterias en los pulmones 24 horas
de aplicar las inyecciones del tratamiento.
Es un diseño de bloques al azar, ya que solo evalúa un factor, t niveles y varias repeticiones.
b) ¿Cuál es el modelo matemático? Para cada ítem en el ejercicio planteado indique a que
corresponde cada término del modelo.
Y ij =μ+t i+ e i j
e ij =error aleatorio(residuo)
c) ¿Estipule claramente las hipótesis que interesa contrastar con el análisis de varianza de este
experimento?
d) Realice el análisis de varianza en Excel, con las fórmulas, la tabla de varianza debe recoger los valores
de SC, CM, GL, F y probabilidad realizados con fórmula debidamente evidenciable y relacionando las
operaciones. No se admitirán resultados que no sean del producto de las fórmulas elaboradas en el
archivo Excel.
Análisis de varianza de un factor
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 3 25,5 8,5 0,13
Columna 2 3 7,8 2,6 0
Columna 3 3 7,8 2,6 0
Columna 4 3 20,08 6,69333333 1,46413333
Columna 5 3 18,91 6,30333333 2,67303333
ANÁLISIS DE VARIANZA
Origen de las variaciones
Suma de cuadrados
Grados de
Promedio
libertad de los cuadradosF Probabilidad
Valor crítico para F
Entre grupos 83,28096 4 20,82024 24,3958599 3,8407E-05 3,47804969
Dentro de los grupos
8,53433333 10 0,85343333
Total 91,8152933 14
CONCLUSIONES
Las medidas de tendencia central nos permiten medir los datos que tienden a agruparse
hacia un punto central.
El propósito del análisis de correlación es determinar el grado o fuerza de relación que
hay entre las variables, es expresado por un único valor llamado coeficiente de
correlación (r); Y el análisis de regresión tiene como propósito, por medio de una
ecuación de estimación o fórmula matemática relacionar las variables conocidas con las
desconocidas, y que a su vez permita estimar el valor desconocido de una variable a
partir del valor conocido de una o más variables.
Un análisis de varianza (ANOVA) prueba la hipótesis de que las medias de dos o más
poblaciones son iguales. Los ANOVA evalúan la importancia de uno o más factores al comparar
las medias de la variable de respuesta en los diferentes niveles de los factores; y las podemos
utilizar como forma de probar el resultado de nuestros cálculos manuales.
MMMMMM
https://es.slideshare.net/rbarriosm/6-diseos-completamente-aleatorizado-y-bloques-al-azar
a)
https://drive.google.com/file/d/1tfpmQidOIWLNPDS7vYLx0yAP-kjBTVMl/view
Análisis de varianza de dos factores con una sola muestra por grupo
ANÁLISIS DE VARIANZA
Origen de las variaciones
Suma de cuadrados
Grados de
Promedio
libertad de los cuadradosF Probabilidad
Valor crítico para F
Filas 3,06649333 2 1,53324667 2,24329412 0,16849413 4,45897011
Columnas 83,28096 4 20,82024 30,4621057 6,8491E-05 3,83785335
Error 5,46784 8 0,68348
Total 91,8152933 14
Hhhhhhhhhhhhhhhhhhhh
La línea recta que mejor explica la relación entre la variable dependiente y la independiente es
con la ecuación:
Dónde:
Y= 1363, 3 + 5,7177X
^y =β 0 + β 1 X 1+ β2 X 2 + ε i
Como paso siguiente Reemplazamos lo datos obtenidos con el comando análisis de datos
de Excel tenemos:
^y =56.251+1.7898 X 1 +0.0867 X 2+ ε i
El R2 sirve para saber qué tan bueno es un modelo. Cuando se acerca a uno sera un modelo mejor.