Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PARA LA VIALIDAD
Estadística
Ruta de la Investigación
Estadístico Médico
Definiciones Básicas
X1
X2
X3
.
. x1
Z1 x2
Z2 z1
Z3 z2 Muestra
. Parámetros
. y1
Sujeto ¿? y2
Y1
Y2
Y3 Estadísticos
.
Universo . Obtengo información
“población”
Población Estadística
Definiciones Básicas
Parámetros Estadísticos
𝑛
∑ 𝑥𝑖
𝜇: 𝑀𝑒𝑑𝑖𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑋= 𝑖=1
Media Muestral
𝑛
2
𝜎 :𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 2 ( 𝑥𝑖− 𝑥)2
𝑆 = 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝑛− 1
𝜋 : 𝑃𝑟𝑜𝑝𝑜𝑟𝑐𝑖 ó 𝑛 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
m a n ¿ 𝐸𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑒𝑠
E st i 𝑝= 𝑃𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó 𝑛 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝑛
Escala de Medidas
Nominal
Variable Cualitativa
Ordinal
Absoluta Discreta
Continua
Razón
MEDIDAS DESCRIPTIVAS
Tablas de Frecuencias
Presentación de Datos
Gráficos
Media Aritmética
Medidas de Tendencia Central Mediana
Moda
Cuartiles
Estadística descriptiva Medidas de Posición Deciles
Percentiles
2 3 2 3 4 1 3 2 3 5
1 1 3 4 2 3 6 5 4 2
2 2 3 1 2 2 2 1 1 1
1 2 2 3 3 3 3 3 1 1
1 2 2 3 5 6 4 4 3 3
2 3 2 3 4 1 3 2 3 5
1 1 3 4 2 3 6 5 4 2
2 2 3 1 2 2 2 1 1 1
1 2 2 3 3 3 3 3 1 1
1 2 2 3 5 6 4 4 3 3
Los siguientes datos es el desgaste del pavimento en unidades de distancia
27,93 30,94 29,12 29,60 28,99 31,43 30,06 27,16 31,00 29,31
32,56 30,51 32,95 30,70 28,81 29,12 28,73 30,38 27,27 31,93
29,87 29,10 33,37 29,45 30,23 30,97 28,99 32,07 26,17 30,50
27,93 30,94 29,12 29,60 28,99 31,43 30,06 27,16 31,00 29,31
32,56 30,51 32,95 30,70 28,81 29,12 28,73 30,38 27,27 31,93
29,87 29,10 33,37 29,45 30,23 30,97 28,99 32,07 26,17 30,50
Con el interés de aprovechar los vientos de cierta región para producir energía eólica.
Midieron la velocidades del viento (en millas por hora) para 45 Regiones previamente
seleccionadas:
𝑋=
∑ 𝑥𝑖
𝑛
Y1
Y2
0 6 12 18 24 30 36
Datos
MEDIDAS DESCRIPTIVAS
Gráfica de valores individuales de Y1; Y2
30
Mediana: Es el valor que separa en dos partes
iguales al conjunto de datos, por encima de la
Datos
20
mediana se encuentra el 50% de los datos
10
0
Y1 Y2
Q1 Q2 Q3
√
𝑛
∑ ( 𝑥𝑖 − 𝑋 ) 2
𝑖 =1
𝑆=
𝑛 −1
Coeficiente de Variación: Es una medida relativa de dispersión.
𝑆 Sirve para comparar la dispersión de
𝐶𝑉 = ∙100 Distintos grupos de datos; con escala
𝑋 De medida distinta
MEDIDAS DESCRIPTIVAS
Medidas de Forma
Coeficiente de asimetría: Mide el grado de simetría de un
conjunto de datos
Ap > 0 Asimetría Positiva
𝑋 − 𝑀𝑜 Ap = 0 Simétrica
𝐴𝑝 =
𝑆 Ap < 0 Asimetría Negativa
𝑛 Kt > 0 Leptocúrtica
∑ ( 𝑥 𝑖 − 𝑋 )4
𝐾𝑡 = 𝑖=1
−3 Kt = 0 Mesocúrtica
𝑛 ∙ 𝑆4
Kt < 0 Platocúrtica
Con el propósito de probar un nueva mezcla para buscar resistencia en el pavimento se probaron dos
mezclas en vías de similares característica, las cuales fueron sometidas a condiciones extremas. Luego se
registro la distancia entre fallas (baches huecos) a lo largo del pavimento
9,10 8,31 7,82 4,68 6,50 5,87 8,14 10,43 9,75 7,30 13,89 14,06 12,11 12,41 17,42 9,46 4,39 11,58 10,71 13,95
7,40 8,25 8,98 6,77 6,66 6,74 4,57 5,14 7,56 10,93 8,61 9,62 7,36 12,55 10,87 8,26 12,91 6,21 10,46 11,30
7,69 6,48 5,18 4,79 8,78 0,66 10,14 8,35 5,58 4,83 4,09 3,60 12,63 8,55 11,13 6,20 13,08 9,12 11,21 3,30
7,14 7,24 7,65 10,16 6,45 5,08 7,02 6,76 7,91 5,76 8,00 2,55 5,74 8,38 14,46 12,33 6,63 14,31 12,49 15,39
7,62 6,77 7,22 6,07 7,35 6,80 8,38 6,30 8,28 5,44 7,95 11,17 13,59 15,12 15,34 10,43 9,26 7,55 8,28 10,83
9,58 6,31 4,55 4,70 4,52 7,08 6,80 6,22 6,34 9,10 4,68 12,70 4,11 11,95 7,89 14,03 12,86 8,15 6,47 4,24
10,56 6,05 4,44 4,39 8,83 7,96 6,10 6,00 4,58 7,74 8,00 11,38 11,44 7,38 9,56 9,90 2,87 10,59 14,70 8,57
8,38 7,95 4,69 4,69 3,95 9,34 7,55 7,25 7,23 3,97 4,56 7,54 8,55 11,87 7,88 15,82 11,43 5,30 5,95 11,69
9,28 7,72 7,56 6,25 6,21 4,19 4,39 10,10 10,25 6,52 10,58 3,32 5,82 15,86 5,01 13,64 4,01 14,16 9,38 12,39
9,37 6,84 7,11 10,32 9,62 11,14 6,04 8,23 8,22 6,13 8,69 12,38 9,30 9,96 0,43 13,27 11,66 9,02 12,87 10,37
MEDIDAS DESCRIPTIVAS
Estudio de desgaste
Desgaste 1 Desgaste 2
7,49 6,46 5,31 6,80 6,52 6,57 4,73 7,52 5,80 5,45 2,61 2,68 4,98 3,13 0,37 4,98 0,96 0,00 0,67 1,41
5,30 7,13 6,12 7,18 6,08 5,79 7,60 7,69 5,78 5,76 0,04 0,07 0,44 8,26 1,84 1,87 2,96 0,32 0,00 0,03
5,50 5,05 4,55 4,93 6,57 6,09 5,04 4,26 6,19 7,80 1,14 0,29 0,00 0,07 0,25 0,06 0,91 0,04 0,80 1,02
4,76 5,81 7,35 6,88 7,00 6,26 6,03 5,54 5,82 5,77 4,38 0,26 3,19 1,93 0,06 0,00 0,19 0,01 0,59 0,38
4,89 6,24 6,09 4,13 6,66 7,09 5,12 4,79 8,05 5,33 3,31 0,59 0,79 0,11 2,32 0,14 0,57 5,13 0,23 0,08
7,02 6,29 5,93 6,81 4,99 6,32 4,56 6,44 8,61 4,60 1,67 0,01 1,23 4,30 3,00 0,04 1,74 0,72 0,17 1,13
5,33 4,58 6,78 6,01 5,60 6,08 5,94 4,86 5,30 5,40 0,24 0,03 0,28 0,31 0,60 3,22 0,13 1,56 2,11 0,01
6,42 7,60 6,71 5,18 7,67 5,54 6,13 5,99 6,60 7,26 0,14 0,54 0,50 0,01 0,04 0,25 1,04 4,32 0,01 0,45
5,39 6,78 5,89 8,33 5,71 6,64 5,37 6,25 7,90 5,45 0,23 0,44 0,25 2,01 4,69 1,06 0,08 0,02 0,25 0,18
6,39 5,09 6,47 5,17 7,19 6,58 4,36 7,70 5,58 6,75 2,19 1,59 4,24 0,00 0,00 0,33 0,02 0,09 0,03 0,18
Modelo Binomial
Modelo Poisson
Probabilidad bajo Distribución Normal
Sea una variable X con distribución de probabilidad Normal, con media y varianza , es decir, ; )
2
𝜎
P(X < e) = ?
P(X > a)= ?
e d c 𝜇 a
27,93 30,94 29,12 29,60 28,99 31,43 30,06 27,16 31,00 29,31
32,56 30,51 32,95 30,70 28,81 29,12 28,73 30,38 27,27 31,93
29,87 29,10 33,37 29,45 30,23 30,97 28,99 32,07 26,17 30,50
Supongamos que se desea analizar el tiempo en horas de secado de columnas de concreto.
Para lo cual se realiza 30 vaciados; y se registra el tiempo de duración secado
27,93 30,94 29,12 29,60 28,99 31,43 30,06 27,16 31,00 29,31
32,56 30,51 32,95 30,70 28,81 29,12 28,73 30,38 27,27 31,93
29,87 29,10 33,37 29,45 30,23 30,97 28,99 32,07 26,17 30,50
27,93 30,94 29,12 29,60 28,99 31,43 30,06 27,16 31,00 29,31
32,56 30,51 32,95 30,70 28,81 29,12 28,73 30,38 27,27 31,93
29,87 29,10 33,37 29,45 30,23 30,97 28,99 32,07 26,17 30,50
= 29,97
Inferencia Estadística
Se desea estudiar la media de porosidad de concreto, (en %), para
ello se toma una muestra de 53 especímenes de concreto. Y se
obtiene una media de 21,6%. Se sabe por experiencia que la
desviación estándar es de 4,5% de porosidad.
32,56 30,51 32,95 30,70 28,81 29,12 28,73 30,38 27,27 31,93
29,87 29,10 33,37 29,45 30,23 30,97 28,99 32,07 26,17 30,50
= 29,97
27,93 30,94 29,12 29,60 28,99 31,43 30,06 27,16 31,00 29,31
32,56 30,51 32,95 30,70 28,81 29,12 28,73 30,38 27,27 31,93
29,87 29,10 33,37 29,45 30,23 30,97 28,99 32,07 26,17 30,50
= 29,97
Estimación Por Intervalo de Confianza de la Varianza
( 𝑛− 1 ) 𝑆2 2 (𝑛 −1) 𝑆2
2
<𝜎 < 2
𝜒𝛼/2 𝜒 1 −𝛼 / 2
Estadísticos descriptivos: diametro
Estadísticas
^ ± 𝑧 1 −𝛼 /2
𝑝
√
2 𝑝^ (1 − 𝑝^ )
𝑛
Estimación Por Intervalo de diferencia de medias
𝑥1 − 𝑥 2 ± 𝑧 1− 𝛼/ 2
√ 𝜎 21 𝜎 22
+
𝑛1 𝑛2
𝑥1 − 𝑥 2 ± 𝑡 𝑛 1+𝑛2 − 2 ;𝛼/ 2 ∙ 𝑆𝑝
√ 1 1
+
𝑛 1 𝑛2
(Se asumen varianzas iguales)
𝑥1 − 𝑥 2 ± 𝑡 𝑣 ;𝛼 /2
√ 𝑆21 𝑆22
+
𝑛1 𝑛2
(Se asumen varianzas diferentes)
Estadísticas
Variable Media Varianza
barra1 980,1 5439,6
barra2 979,1 4891,8
Variable Media Varianza
barra1 980,1 5439,6
barra2 979,1 4891,8
Variable Media Desv.Est. Varianza
modificado 16,764 0,316 0,100
S_modificar 17,922 0,248 0,0615
Variable Media Desv.Est. Varianza
modificado 16,764 0,316 0,100
S_modificar 17,922 0,248 0,0615
Estimación Por Intervalo de diferencia de proporciones
^ 1− 𝑝
𝑝 ^ 2 ± 𝑧 1 − 𝛼/ 2
√
2 ^ 1(1− 𝑝
𝑝
𝑛1
^ 1 ) 𝑝^ 2 (1 − 𝑝^ 2 )
+
𝑛2
^ 1− 𝑝
𝑝 ^ 2 ± 𝑧 1 − 𝛼/ 2
√
2 ^ 1(1− 𝑝
𝑝
𝑛1
^ 1 ) 𝑝^ 2 (1 − 𝑝^ 2 )
+
𝑛2
DISEÑO DE EXPERIMENTO
Fundamentos Básicos:
• Repetición
• Aleatorización
• Bloques
LA ESTADÍSTICA EN LA INVESTIGACION
Diseño de Experimento Protocolo 1
Aleatorio
Protocolo 2
Repeticiones
Protocolo 3
Protocolo 1
Aleatorio
Protocolo 2 Repeticiones
Protocolo 3
Bloques Protocolo 1
Aleatorio
Repeticiones
Protocolo 2
H0: 1=2=...=k=0
H1 : j 0 para al menos un j
Planteamiento de Hipótesis Tabla de Análisis de Varianza
Diseño Completamente Aleatorizado
𝐻 𝑜 : 𝜇 1=𝜇 2=…=𝜇 𝑘
F Comparación múltiple
vs Fuente de Variación g.l. Sumas de Cuadrados Medios
(solo si se rechazó la Ho)
𝐻 𝑎 :𝜇𝑖 ≠ 𝜇 𝑗 Entre Tratamientos k-1
Cuadrados
SCTr CMTr CMTr
F0
CME
Cálculos para llenar tabla Dentro de Tratamientos N-k SCE CME
ANOVA
Variación Total N-1 SCT
𝑆 𝑡𝑜𝑡 =𝑆𝑡𝑟𝑎𝑡 +𝑆 𝑒𝑟𝑟𝑜𝑟
𝑘 2 2 Existe diferencias
𝑦 . 𝑗 𝑦 ..
𝑆 𝑡𝑟 =∑ − Zona de rechazo Entre los tratamientos
𝑗=1 𝑛 𝑁 ij
𝑘 𝑛 2
𝑦 ..
𝑆 𝑡𝑜𝑡 =∑ ∑ 𝑦 𝑖𝑗 −
2
𝑗=1 𝑖=1 𝑁
𝑆 𝑒𝑟𝑟𝑜𝑟 =𝑆 𝑡𝑜𝑡 − 𝑆𝑡𝑟𝑎𝑡
𝑆 𝑡𝑟𝑎𝑡
𝐶𝑀 𝑡𝑟𝑎𝑡 =
𝑘 −1
𝑆 𝑒𝑟𝑟𝑜𝑟
𝐶𝑀 𝑒𝑟𝑟𝑜𝑟 = 𝐹 𝛼 ,𝑘 −1 , 𝑁 −𝑘
𝑁 −𝑘
DISEÑO COMPLETAMENTE
ALEATORIZADO
Un ingeniero tiene interés en investigar la calidad del asfalto; medido en una escala del 1-
50. El ingeniero sabe por experiencia previa que la calidad depende del porcentaje de
aplicación de cierto material especial. Además, sospecha que al aumentar el contenido del
material se incrementará la calidad, al menos en un principio. También sabe, que el
contenido del material deberá variar entre 10 y 40 por ciento. El ingeniero decide probar
ejemplares en cinco niveles de peso porcentual de material : 15, 20, 25, 30 y 35 por
ciento. También decide probar cinco ejemplares en cada nivel del contenido de material.
El Modelo Matemático
Yij i j ij
DISEÑO DE BLOQUES
ALEATORIZADOS
Tratamientos
1 2 3 ... j ... k Tot Bl.
1 Y11 Y12 Y13 ... Y1j ... Y1k Y1.
2 Y21 Y22 Y23 ... Y2j ... Y2k Y2.
. . . . ... . ... .
Bloques . . . . ... . ... .
. . . . ... . ... .
b Yb1 Yb2 Yb3 ... Ybj ... Ybk Yb.
Tot. Tr. Y.1 Y.2 Y.3 ... Y.,j ... Y.k Y..
DISEÑO DE BLOQUES
ALEATORIZADOS
Tabla de Análisis de Varianza para el
Diseño de Bloques Completamente Aleatorizado
Fuente de g.l. Sumas de Cuadrados Medios Fc
Variación Cuadrados
Tratamientos (k-1) SCTr CMTr=SCTr/(k-1) CMTr/CME
Bloques (b-1) SCBl CMBlr=SCBl/(b-1) CMBl/CME
Error (b-1)(k-1) SCE CME=SCE/(b-1)(k-1)
Total kb-1 SCT
DISEÑO DE BLOQUES
ALEATORIZADOS
Se desea determinar si cuatro marcas de cemento diferentes producen o no lecturas diferentes de dureza..
El experimentador ha decidido obtener cuatro observaciones para cada marca de cemento. Hay un solo factor (el tipo de
cemento). Por lo tanto si se toman cuatro marcas de cemento de prueba el diseño sería un completamente aleatorizado
con 16 unidades experimentales
Pero existe un problema, si los ejemplares de prueba difieren ligeramente en sus durezas, por ejemplo las probetas
se usaron con tipo de arenas diferentes
Diseño de Bloques Aleatorizados
Tipo de Arena
Tipo de 1 2 3 4
cemento
1 9,3 9,4 9,6 10,0
2 9,4 9,3 9,8 9,9
3 9,2 9,4 9,5 9,7
4 9,7 9,6 10,0 10,2
DISEÑO
FACTORIAL
DISEÑO FACTORIAL.
DISEÑO
DEFINICIÓN FACTORIAL
MODELO DE 2 FACTORES
Sean A y B, dos factores con a y b niveles
respectivamente.
Factor B
1 2 ........ b
1 Y111,.......,Y11n Y121,.......,Y12n Y1b1,.......,Y1bn
Factor A 2 Y211,.......,Y21n Y221,.......,Y22n Y2b1,.......,Y2bn
:
a Ya11,.......,Ya1n Ya21,.......,Ya2n Yab1,.......,Yabn
MODELO DE 2 FACTORES
H 0 : i 0 ; i vs. H1 : al menos un i 0
H 0 : j 0 ; j vs. H1 : al menos un j 0
H 0 : ij 0 ; i, j vs. H1 : al menos un ij 0
MODELO DE 2 FACTORES.
EFECTOS FIJOS
CMB
Fb Fb 1; abn 1
CME
CMA
FA Fa 1; abn 1
CME
H 0 : i 0 ; i vs. H1 : al menos un i 0
H 0 : j 0 ; j vs. H1 : al menos un j 0 CMAB
H 0 : ij 0 ; i, j vs. H1 : al menos un ij 0 FAB Fa 1b 1; abn 1
CME
MODELO DE 2 FACTORES.
EFECTOS FIJOS
Presión
Temperatura 200 215 230
Baja 90,4 90,7 90,2
90,2 90,6 90,4 • Analice los datos y obtenga conclusiones
Intermedia 90,1 90,5 89,9 • ¿En qué condiciones debe operarse este tipo de concreto?
90,3 90,6 90,1
Alta 90,5 90,8 90,4
90,7 90,9 90,1
Las copiadoras electrónicas funcionan adhiriendo tinta negra al
papel mediante electricidad estática. La etapa final del proceso de
copiado comprende el calentamiento y adhesión de la tinta sobre el
papel. La potencia de la adhesión durante este proceso final
determina la calidad de la copia. Se plantea que la temperatura, el
estado superficial de la adhesión en el rodillo y la dureza del
rodillo de la prensa influyen en la potencia de adhesión de la
copiadora. Se hizo un experimento con tratamientos, que consistían
en una combinación de estos 3 factores en cada uno de 3 niveles.
Los datos siguientes muestran la potencia de la adhesión para cada
combinación de tratamientos. Lleve a cabo un análisis de varianza
con α = 0.05 para probar si hay efectos principales y de interacción
significativos.
ANÁLISIS DE COVARIANZA
X Y i
independiente dependiente
explicativa explicada
31
29
modelo de regresión
27
Y 25 𝑌 = 𝛽𝑜 + 𝛽1 𝑋 + 𝜀
23
21
19
0 2 4 6 8 10 12
Recta de Regresión estimada
X ^= ^
𝑌 𝛽𝑜 + ^
𝛽1 𝑋
DIAGRAMA DE
DISPERSIÓN
40 10
35
30 5
25
0
20
15 -5
10
-10
5
0 -15
0 5 10 15 20
300
250 30
200 25
150 20
100
15
50
10
0
5
0 5 10 15 20
0
COEFICIENTE DE
CORRELACIÓN
rxy = 0
9 12
rxy = 0.88
25
8
10
20 7
6 8
15 5 6
4
10
rxy = 1
4
3
5 2 2
1
0 0
0 0 2 4 6 8 10 12
0 2 4 6 8 10 12 0 2 4 6 8 10
0
0 2 4 6 8 10 12
-5
-10
rxy = -1
-15 rxy = -0.88
rxy = 0
-20
COEFICIENTE DE
CORRELACIÓN
X Y1 Y2 Y3 Y4
1 2 4 2 8
2 1 4 1 7
3 3 5 3 6
4 4 8 5 5
5 2 4 3 4
6 3 9 4 3
7 5 10 5 5
8 4 4 6 3
9 6 3 7 1
10 8 10 8 2
Recta de Regresión estimada
RECTA DE
REGRESION
X Y1
^= ^
𝑌 𝛽𝑜 + ^
𝛽1 𝑋 1 2
2 1
^
𝛽 1=
∑ 𝑋𝑌 −𝑛 ∙ 𝑋 𝑌
3
4
3
∑ 𝑋
2
− 𝑛 ∙ 𝑋
2 5
6
2
=-
7 5
8 4
9 6
10 8
Intervalos de confianzas
^𝛽 ±𝑡 𝑠
∙ √∑ 𝑋 2
𝑠𝑥𝑥=∑ 𝑋 −𝑛∙ 𝑋
𝑜 𝑛− 2; 𝛼/ 2 ∙
2 2
√ 𝑛∙ 𝑠 𝑥𝑥
𝑠 𝑦𝑦 =∑ 𝑌 − 𝑛
2
Intervalo de confianza para
𝑠 𝑥 𝑦 =∑ 𝑋𝑌 −𝑛∙ 𝑋 𝑌
√
2
1 ( 𝑥𝑜 − 𝑥 )
𝑌 𝑜 ±𝑡 𝑛−2 ; 𝛼/ 2 ∙ 𝑠 ∙ +
𝑛 𝑠 𝑥𝑥
𝑠=
√
𝑠 𝑦𝑦 − ^𝛽 1 ∙ 𝑠 𝑥𝑦
𝑛 −2
Con las finalidad de estudiar el impacto del agua en materiales que seran usados para
construirr un Puente sobre un rio muy caudaloso. Se estudia el siguiente artículo “Effect of
Temperature on the Marine Immersion Corrosion of Carbon Steels” (R. Melchers, en
Corrosion, 2002:768-781) presenta mediciones de pérdida por corrosión (en mm) que
soportan elementos de acero y de cobre sumergidos en agua de mar en 14 ubicaciones
diferentes. Para cada ubicación se registró la media de la pérdida por corrosión (en mm),
junto con la media de la temperatura del agua (en °C). Los resultados, después de un año de
inmersión, se presentan en la tabla siguiente.