Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Gustavo E Ramirez-Caballero
1
Estadística
• Recolección, presentación, análisis y uso de datos para
tomar decisiones, solucionar problemas y diseñar
productos y procesos.
2
Cemento Portland
Caliza Arcilla Carbón
Yeso
3
Las propiedades del cemento dependen de:
1.Finura de las materias primas molidas.
Mortero
Mortero
Cemento
Cemento
+
+
Arena (agregado fino)
Arena (agregado fino) Mortero
Mortero +
+ Curado
Curado Polímero
Agua
+
Agua
El tiempo de curado se reduce adicionando el Polímero, que pasa con la 5
resistencia a la tensión? video
Diagrama de puntos: útil para ilustrar número reducido de datos (20
observaciones), permite ver: localización y dispersión.
6
Variabilidad:
7
Ejercicio: hacer diagrama de puntos para los siguientes
datos, hallar el promedio y la desviación estándar:
Exp1 Exp2
12.6 12.9
12.9 13.7
13.4 12.8
12.3 13.9
13.6 14.2
13.5 13.2
12.6 13.5
13.1 13.1
8
Otras formas de presentar datos:
Cada número se divide en dos partes: un tallo, compuesto por uno o más dígitos, y una hoja, compuesta por los dígitos restantes
105 199 180 153 149 167 181 150 172 158 143 158
97 160 178 174 200 171 160 181 171 156 141 135
245 196 157 154 186 163 194 168 237 229 110 149
163 221 151 190 174 87 184 158 170 158 133
207 154 175 76 199 176 165 208 180 148 123
134 228 201 101 115 121 145 133 167 150 146
218 131 183 142 193 120 160 135 176 118 169
10
• Histogramas: es una distribución de frecuencia. Para construir
una distribución de frecuencia, el rango de los datos debe
dividirse en intervalos. Elegir un número de intervalos
aproximadamente igual a la raíz cuadrada del número de
observaciones.
Ver video
12
Conclusión
La representación de tallo y hoja y el histograma proporcionan
impresiontes visuales generales acerca de un conjunto de datos.
Promedio y desviación estandar proporcionan información
acerca de caracteristicas particulares.
13
Probabilidad
“Para que los hombres no malicien que tu relato es falso, mantén la probabilidad a la
vista”
Que es probabilidad?
14
Porque?... Podría ser por simetría
cara
CC
cara
sello CS
cara SC
sello
sello SS
Primer intento Segundo intento
árbol de probabilidad, funciona en casos en los que hay no hay muchos números 15
cara
cara
sello
cara
sello
sello
16
SSSSH
SSSHS
SSHSS
SHSSS
HSSSS
17
Dado 1 Dado 2
Dado 1
1 2 3 4 5 6
1
2
Dado 2 3
4
5
6
18
10 Monedas
9 tiene cara y sello
1 solo tiene cara
19
Distribución Binomial
Ejemplo: Se lanza una mondea 5 veces, cual es la probabilidad de que caigan
X caras?
X= # de canastas convertidas
20
Valor esperado de una variable
aleatoria
Frecuencia = Probabilidad
21
Valor esperado de una distribución
binomial
22
23
1
24
Distribución de Poisson
Cuál es el número de carros que pasa por un cierta calle en cierto tiempo?
Cuál es la probabilidad de que 5 carros pasen o 100 carros pasan por ejemplo
en una hora?
Número de intentos
25
Probabilidad de que pase un carro
en un minuto
En el ejemplo:
Qué hacer? 26
Hacer intervalos de medida mas pequeños
Por ejemplo hacer en vez de una medida por minuto, hacer una por segundo
27
Número de intentos
28
1 1
29
Distribución normal
Distribución más importante y usada en estadística, tambien llamada: distribución
de Gauss o Gaussiana, o campana de Gauss.
Dato curioso: fue deducida por De Moivre en 1733, pero su trabajo estuvo
perdido y fue deducida 100 años despues por Gauss.
Notación:
30
Características de la distribución normal
31
68%
95%
99.7%
32
Cualquier valor de una distribución
normal puede ser transformado a su
correspondiente valor en una
distribución normal estándar por medio
de la ecuación:
Promedio en la
Valor en la distribución normal distribucion normal
33
Inferencia estadística
Cuanto miden las mujeres de Bucaramanga?
Población Muestra
Totalidad de las observaciones que son Subconjunto de observaciones que se
motivo de interés seleccionan de una población
Ejemplo:
Población:
36
Distribución de
frecuencia relativa:
Promedio Frecuencia Frecuencia relativa
Para recordar:
• La distribución de la muestra revela cuanto la estadística de la
muestra varia de los parámetros de la población.
39
Simulación 1
40
Simulación 2
41
Simulación 3
42
Distribución de muestreo del
promedio
Promedio: el promedio de la distribución de muestra del promedio es el
promedio de la población:
43
44
Resumen
N=2
N=5
N=10
N=25
46
Supongamos que conocemos todos los datos de la población:
Se sabe que todas las niñas de 10 años en promedio pesan 90 libras con
una desviación estándar de 36. Cómo es la distribución del muestreo del
promedio con un tamaño de muestra igual a 9?
=36 =12=
90 90
Error estándar del promedio
66 114
El 95% de los promedios están a 24 unidades del promedio de la población
Intervalo de confianza 48
Intervalo de confianza:
49
Si no se conoce la desviación estandar de la población (que es lo más seguro) se
debe estimar.
Distribución normal
50
Los valores de la distribución t que deben ser usados en el cálculo del intervalo de
confianza son diferentes a los de una distribución normal.
Intervalo de confianza
51
Diferencia entre promedios
Considera Ud. Bueno o malo que se utilicen animales comol objetos de investigación?
Hombres Mujeres
52
Género Tamaño de la Promedio varianza
muestra
Mujeres 5
Hombres 5
Hay diferencia entre lo que opinan las mujeres y lo que opinan los hombres?
Sin embargo, lo que nos interesa es saber la diferencia entre los promedios de las
poblaciones
Los promedios de las muestras son usados para estimar la diferencia entre los
promedios de las poblaciones. La precisión de la estimación esta dada por un
intervalo de confianza.
53
Para construir el intervalo de confianza es necesario hacer 3
suposiciones:
54
55
56
Mortero Mortero
Cemento Cemento
+ +
Arena (agregado fino) Arena (agregado fino)
Mortero Mortero
+ +
Curado Curado
Agua Polímero
+
Agua
El tiempo de curado se reduce adicionando el Polímero?, que pasa con la
resistencia a la tensión?
57
Pruebas de hipótesis
La prueba de hipótesis es un procedimiento estadistico para determinar si el azar es
una explicación plausible en los resultados experimentales
H 0 : 1 2
H1 : 1 2
Hipótesis Nula
Hipótesis Alternativa
58
Hipótesis Nula: H 0 : 1 2
Hipótesis Alternativa: H1 : 1 2
No se rechaza
se rechaza
59
Región crítica Región crítica
Nivel de significación
Error tipo II: se define como la aceptación de la hipótesis nula cuando ésta es
falsa 60
Prueba t
Recordando: Deforma análoga:
61
62
63
Resumen de la estadística
Mortero modificado Mortero sin modificar
y1 16.76 y2 17.04
S 0.100
1
2
S22 0.061
S1 0.316 S2 0.248
n1 10 n2 10 64
65
66