Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
Mediciones
Datos
Estadística
Ramas de la Estadística
3
¿qué es un dato?
4
En estadística
Información Datos
5
Problemática
6
Problema 1 Problema 2 …
Instrumento de medición
…
Datos
Los datos son mediciones correspondientes a una
variable de observación vinculada a un problema.
Problemática
Inseguridad en las carreteras
Problema 1 Problema 2
Exceso de velocidad Daño al pavimento
Un dato Un dato
Dato de X1: 120 km/h Dato de X2: 7 baches en el 1er km
Dato de Y1: 22 años Dato de Y1: 1.24 m2 en el 1er km
7
Actividad de la clase
Problemática
X Y Z
Población estadística
9
Población Población estadística X
Datos de X
x1
x5
x3
Variable de x11
observación X Muestra
Muestra estadística
x20
x7
x9
xN
10
Problemática
Problema 1
Población
Es el conjunto de todos los objetos de
estudio (reales o posibles) de interés al
investigador para resolver un problema.
Variable de observación X
Población estadística X
Es el conjunto de todos los
datos referidos a la variable de
observación X.
Variable de observación Y
Población estadística Y
Es el conjunto de todos los
datos referidos a la variable de
observación Y.
11
Población Todos los autos en la zona metropolitana de N. L.
en 2013
Variables de
observación
datos
12
Muestra
La muestra es
un subconjunto
De la población
13
Población estadística X
x1 Parámetro:
Característica numérica
x5
de una población
estadística. Por ejemplo
en promedio total µ
x3
Estadístico:
x11
Característica numérica
Muestra
estadística de una muestra
x20 estadística. Por
ejemplo, el promedio de
x7 la muestra x
x9
xN
14
Población
16
Toma de
Conocer
decisiones
Problema
Conclusiones
Toma de
Conocer
decisiones
Problema
Modelos
teóricos Análisis de datos
Estadística Descriptiva
Inferencia estadística
Probabilidad
Estimación
Modelos probabilísticos de
Conclusiones estadísticas
una variable
Modelos probabilísticos de
estadísticos
Conclusiones
Toma de
Conocer
decisiones
Problema
Modelos
teóricos Análisis de datos
Interpretación en el contexto
Recomendaciones sobre el
problema
Limitación del estudio
Conclusiones Nuevas preguntas
Términos importantes en
estadística
MUESTREO PROBABILÍSTICO. Los elementos de la
muestra se selecciona utilizando métodos aleatorios
en los que se utilizan las probabilidades
matemáticas.
MUESTREO NO PROBABILÍSTICO. Los elementos de
la muestra se seleccionan sin tener en cuenta la
aleatoriedad. Por ejemplo, si deseo estudiar la
calidad educativa en el Tecnológico de Monterrey a
nivel Sistema, y tomo datos en la muestra sólo del
Campus Monterrey.
20
Muestreos Probabilísticos
Muestreo aleatorio simple. Se seleccionan los miembros
de la población de manera que cada uno tenga la
misma probabilidad de ser escogido.
Muestreo estratificado. Se subdivide la población en
subpoblaciones (estratos), y de cada uno de ellos, se
obtiene una muestra aleatoria simple.
Muestro sistemático. Se selecciona un punto inicial al
azar y luego se selecciona un elemento cada que ha
pasado cierto tiempo ó cada que se cuentan k-
elementos de la población.
Muestreo por cúmulos. Se divide el área de la
poblaciones en secciones ó cúmulos, éstos se
seleccionan aleatoriamente, se recaba información de
todos los individuos que forman parte de los cúmulos
elegidos aleatoriamente.
21
Problema. Un grupo de
empresarios de automóviles quiere
saber cuál será el valor $$
promedio de un auto en la zona
metropolitana de Monterrey.
Diagrama Diagrama
de pastel de barras
Discretas
cuantitativas
continuas
24
Sí No Masc Fem Tall grande venti Trenta
Escala Nominal
(No hay orden,
Escala Ordinal
utiliza una (los atributos
etiqueta o llevan un orden)
nombre para cualitativa
representar un
atributo)
variable
Cuantitativa
0m
Variable cualitativa
Los datos describen alguna característica
(rojo, gusto, opinión)
Variable cuantitativa
Los datos son contables o medibles
Variable discreta
Los datos se pueden contar (núm. hijos, núm. de
accidentes, núm. de cursos por semestre, …)
Variable continua Los datos toman valores de
mediciones (admite decimales)
(estatura, peso, tiempo frente
a la TV, duración de un anuncio)
26
PROBLEMA
27
ejemplo de la depresión, unas variables de
observación podrían ser:
• Nivel de depresión (leve, moderada, severa)
• Horas de sueño aproximado por día
• Peso en kg
• Edad
• Genero
• Estatura en mtrs
• Horas de ejercicio a la semana
¿Cuál sería el objetivo de recolectar la información de estas variables?
¿Por qué es importante definir la población que se quiere estudiar?
Si no es posible obtener la información de toda la población, se recolecta una
muestra. ¿Cómo se deben recolectar los datos de la muestra para que sean
representativos de la población?
¿Cuáles de estas variables son cuantitativas y cuáles cualitativas?
Si ya tenemos el registro de los datos de la
muestra
• ¿Cómo resumir la información ?
Por ejemplo si la muestra hubiera sido de 500 pacientes de los cuales
300 fueron mujeres y 200 hombres, 100 tuvieron nivel severo de
depresión, 250 moderado y 150 nivel leve de depresión.
Gráfica de Pie
Agrupados
Agrupados
Datos
Fuente: Datos
Fuente:
30
25
20
15
10
5
0
14
12
10
Frecuencia
8
6
4
2
0
14 22 30 38 46
tiem po en m inutos
Pastel
Escala Nominal Barras
DATOS Pareto
CATEGORICOS
Escala Ordinal Barras
GRAFICOS
Opiniones sobre las Inscripiciones
16
14
frecuencia de los
DATOS
12
estudiantes
10
NUMERICOS
8
6
(para ambas
4
escalas)
2
0
Excelente Bueno Regular Malo Pésimo
opinión
Opiniones sobre las Inscripiciones
16
14
frecuencia de los
12
estudiantes
10
8
6
4
2
0
Bueno Pésimo Malo Excelente Regular
opinión
Primaria o
menos
12 0.12 12 0.12
Secundaria
26 0.26 38 0.38
Preparatori
a
45 0.45 83 0.83
Profesional
o postgrado
17 0.17 100 1.00
Total 100 1.00
35
Introducción a la teoría de decisiones
36
Es semejante a un juicio . . .
Juez
Regla de
decisión
Ho
H1 vs.
Acusado
Fiscal
(el que acusa de
falsa a Ho)
Testigo (la muestra aleatoria
obtenida) 37
HIPÓTESIS NULA
Ejemplos
Ho : Un laboratorio afirma que su nueva medicina cura el
80% de los pacientes.
39
Por ejemplo, si usted es cliente
Ho : Un fabricante de lámparas de
alumbrado público afirma que duran
en promedio 70,000 horas.
H1 : No es cierto, es menos de
70,000 horas.
40
¿Cuáles serían las correspondientes hipótesis alternativas de:
H1:
H1:
41
En toda decisión profesional el
ingeniero puede …
ACERTAR EQUIVOCARSE
42
¿Cuándo acierta?
43
¿Cuándo falla?
44
Si usted fuera juez, ¿qué error le gustaría
comer menos?
Condenar a alguien
que en realidad es
inocente.
Liberar a alguien
que en realidad es
culpable.
45
Si tuviera que decidir entrar agua a la ciudad,
¿qué error le gustaría cometer menos?
Retener el agua no
dejándola pasar a
la ciudad cuando en
realidad está limpia
(es potable).
46
Un inspector de comida toma una muestra de
cierto producto para determinar si son saludables.
La hipótesis nula es que el producto es saludable
para la población. Identifica cuál de los siguientes
enunciados representa al error tipo 1 y cuál al
error tipo2
47
Una vez realizado decidido por una de las dos hipótesis, la hipótesis
nula o base Ho, o la hipótesis alternativa H1, se pueden dar los
cuatro casos que se exponen en el siguiente cuadro:
es cierta es cierta
48
Marcapasos S.A.
El proveedor afirma, en un contrato, que exactamente el 1% de las pilas producidas (población)
duran menos de 7 años, esta afirmación es la hipótesis nula. Carlos y Helena sospechan que el % de
las pilas producidas que dura menos de 5 años es mayor al 1% (hipótesis alternativa). Ellos
dicidieron tomar una muestra aleatoria de la población de pilas producidas por el proveedor, para
ver si esta muestra soportaba su sospecha o no. La variable que observaron fue el tiempo de vida
de las pilas (en años) de una muestra de 25 pilas:
7.9 9.4 4.5 5.6 7.9 10.3 8.6 2.3 7.8 9.0
7.7 14.5 7.8 9.2 9.9 5.s 9.6 7.9 6.0 8.5
7.8 3.8 9.1 8.8
Identificar:
1. En los datos observados en la muestra indica cuáles son: errores de captura y cuáles son valores
faltantes.
2. La variable tiempo de vida es cuantitativa, ¿qué escala tiene: de razón o de intervalo?
3. Identificar en esta situación, cuál es la población estadística.
4. ¿Qué % de las pilas en la muestra dura menos de 7 años?¿Esta muestra a cuál de las dos
hipótesis favorece y porque?, da argumentos y evidencia estadística (cálculos estadísticos
que avalen su decisión)
49
Pastel
Escala Nominal Barras
DATOS Pareto
CATEGORICOS
Escala Ordinal Barras
Importante: Un
Tallo: decenas 3|2337 diagrama de Tallo y
Hojas: unidades
2|001112223889 Hoja siempre debe
1|2244456888899
especificar qué
representan el tallo y
0|69 las hojas.
53
Pastel
Escala Nominal Barras
DATOS Pareto
CATEGORICOS
Escala Ordinal Barras
GRAFICOS
Diagrama de Caja
Datos no Tallo y hoja
Escalas agrupados
de De puntos
DATOS intervalo
NUMERICOS y
Escala
de razón
DATOS
21
21
22 Diagrama de puntos
22
22
23
23
23
23
23
24
25
25
20 21 22 23 24 25 26 27 28 29 30 31
25
26
26
26
27
27
27
27
28
30
Pastel
Escala Nominal Barras
DATOS Pareto
CATEGORICOS
Barras
Escala Ordinal
GRAFICOS
Diagrama de Caja
No agrupados Tallo y hoja
De puntos
DATOS
NUMERICOS
(para ambas De dispersión
escalas) Agrupados
Datos
Clase Frecuencia
21 2 (21, 2)
22 3
(22,3)
23 5
(23,5)
(24,1)
24 1
(25,3)
25 3
(26,3)
26 3
(27,4)
27 4
(28,1)
28 1
(30,1)
30 1
Diagrama de 3
dispersión 2
0
20 21 22 23 24 25 26 27 28 29 30 31
Pastel
Escala Nominal Barras
DATOS Pareto
CATEGORICOS
Escala Ordinal
GRAFICOS
Diagrama de Caja
No agrupados Tallo y hoja
De puntos
DATOS
NUMERICOS
De dispersión
(para ambas
escalas) Agrupados Histograma
Histograma
El objetivo de un
histograma es resumir la
información de una Histograma Focos Claire
variable cuantitativa.
140
Pasos: 120
Se secciona la 100
información en clases ó
Frecuencia
80
intervalos
Se cuenta el número de
60
datos en cada clase. Esta 40
se llama frecuencia 20
Se puede calcular la
frecuencia relativa
0
y mayor...
0
103
206
309
412
515
618
721
824
927
1030
1133
1236
1339
1442
1545
1648
1751
1854
1957
2060
2163
2266
2369
2472
2575
2678
2781
2884
2987
Se grafica un
histograma, teniendo Tiempo de Vida
relativa.
Sesgo a la derecha
Tiempos de llegada de los estudiantes
14
12
10
Frecuencia
8
6
4
2
0
14 22 30 38 46
tiem po en m inutos
Sesgo a la izquierda
Tiempos de llegada de los estudiantes
14
12
10
Frecuencia
8
6
4
2
0
14 22 30 38 46
tiem po en m inutos