Está en la página 1de 61

Empezando …

1
Mediciones

Datos

¿Qué hacer con


ellos?

Estadística
Ramas de la Estadística

La estadística es la rama de la Estadística


investigación científica que proporciona descriptiva
métodos para organizar y resumir
información
y usar ésta para obtener diversas
conclusiones
Estadística
inferencial
(se apoya en la
probabilidad)

3
¿qué es un dato?

4
En estadística

Información Datos

Todo dato es información, pero no toda información


es dato.

5
Problemática
6

Problema 1 Problema 2 …

Variable de obs 1 variable de obs 2 Varible de obs 3…

Instrumento de medición

Datos
Los datos son mediciones correspondientes a una
variable de observación vinculada a un problema.
Problemática
Inseguridad en las carreteras

Problema 1 Problema 2
Exceso de velocidad Daño al pavimento

Variables de observación Variables de observación


X1: Velocidad de los automóviles X2: núm. de baches por km
Y1: edad del conductor Y2: área dañada del pavimento
por km
Instrumento de medición Instrumento de medición
Radar velocímetro Conteo manual
Licencia de manejo del conductor Fotografía

Un dato Un dato
Dato de X1: 120 km/h Dato de X2: 7 baches en el 1er km
Dato de Y1: 22 años Dato de Y1: 1.24 m2 en el 1er km

7
Actividad de la clase

Problemática

Problema 1 Problema 2 Problema 3

Variable de Variable de Variable de


observación 1 observación 2 observación 3

Instrumento Instrumento Instrumento


de medición de medición de medición

Ejemplo de Ejemplo de Ejemplo de


posible dato posible dato posible dato

Describa cuál es la población:


Dé un ejemplo de población estadística de su problema
8
Población

X Y Z

Población estadística
9
Población Población estadística X
Datos de X

x1

x5

x3

Variable de x11
observación X Muestra
Muestra estadística
x20

x7
x9

xN

10
Problemática
Problema 1
Población
Es el conjunto de todos los objetos de
estudio (reales o posibles) de interés al
investigador para resolver un problema.

Variable de observación X
Población estadística X
Es el conjunto de todos los
datos referidos a la variable de
observación X.
Variable de observación Y
Población estadística Y
Es el conjunto de todos los
datos referidos a la variable de
observación Y.
11
Población Todos los autos en la zona metropolitana de N. L.
en 2013

Auto 1 Auto 2 Auto 3 … Auto N

Pobl X 2008 2010 2002 1999


Poblaciones
Pobl Y Ford Nissan Chevrolet WV estadísticas
Pobl Z 23mKm 150mKm 60mKm 160mKm

Variables de
observación
datos

Pobl estadística X = {2008, 2010, 2002, …, 1999}

12
Muestra

La muestra es
un subconjunto
De la población

13
Población estadística X

x1 Parámetro:
Característica numérica
x5
de una población
estadística. Por ejemplo
en promedio total µ
x3
Estadístico:
x11
Característica numérica
Muestra
estadística de una muestra
x20 estadística. Por
ejemplo, el promedio de
x7 la muestra x
x9

xN

14
Población

We enjoy beautiful moments in our


lifes with friend, of course that we
differ sometimes with them but we
are sure that they appreciate us
sincerely

Se realiza un censo para saber,


¿Cuántas t hay en esta población?
Soló tienes 5 segundos.
15
Ciclo de investigación PPDAC

16
Toma de
Conocer
decisiones
Problema

Delimitación del variables


problema medibles
Plan
Toma de Incertidumbre
 Delimitar el problema datos y variabilidad
 Definir población de
estudio
 Variables de
observación
 Origen de los datos
Modelos

(censo o muestreo)
teóricos
Hipótesis de estudio
Análisis de datos

Conclusiones
Toma de
Conocer
decisiones
Problema

Delimitación del variables


problema medibles
Plan
Toma de Incertidumbre
datos y variabilidad

Modelos
teóricos Análisis de datos
 Estadística Descriptiva
 Inferencia estadística
 Probabilidad
 Estimación
 Modelos probabilísticos de
 Conclusiones estadísticas
una variable
 Modelos probabilísticos de
estadísticos
Conclusiones
Toma de
Conocer
decisiones
Problema

Delimitación del variables


problema medibles
Plan
Toma de Incertidumbre
datos y variabilidad

Modelos
teóricos Análisis de datos

 Interpretación en el contexto
 Recomendaciones sobre el
problema
 Limitación del estudio
Conclusiones  Nuevas preguntas
Términos importantes en
estadística
 MUESTREO PROBABILÍSTICO. Los elementos de la
muestra se selecciona utilizando métodos aleatorios
en los que se utilizan las probabilidades
matemáticas.
 MUESTREO NO PROBABILÍSTICO. Los elementos de
la muestra se seleccionan sin tener en cuenta la
aleatoriedad. Por ejemplo, si deseo estudiar la
calidad educativa en el Tecnológico de Monterrey a
nivel Sistema, y tomo datos en la muestra sólo del
Campus Monterrey.

20
Muestreos Probabilísticos
 Muestreo aleatorio simple. Se seleccionan los miembros
de la población de manera que cada uno tenga la
misma probabilidad de ser escogido.
 Muestreo estratificado. Se subdivide la población en
subpoblaciones (estratos), y de cada uno de ellos, se
obtiene una muestra aleatoria simple.
 Muestro sistemático. Se selecciona un punto inicial al
azar y luego se selecciona un elemento cada que ha
pasado cierto tiempo ó cada que se cuentan k-
elementos de la población.
 Muestreo por cúmulos. Se divide el área de la
poblaciones en secciones ó cúmulos, éstos se
seleccionan aleatoriamente, se recaba información de
todos los individuos que forman parte de los cúmulos
elegidos aleatoriamente.
21
Problema. Un grupo de
empresarios de automóviles quiere
saber cuál será el valor $$
promedio de un auto en la zona
metropolitana de Monterrey.

¿Población? Todos los automóviles de la zona


metropolitana de Monterrey
¿Muestra? Los automóviles del municipio de Guadalupe
¿Variable de El valor de todos los automóviles de la zona
observación X? metropolitana de Monterrey
¿Población El conjunto de todos los valores de los
automóviles de la zona metropolitana de
estadística X?
Monterrey
¿Muestra El conjunto de los valores de los automóviles
estadística de X? del municipio de Guadalupe

¿parámetro? El promedio del valor de todos los autos de la


zona metropolitana de Monterrey
¿estadístico? El promedio de los valores de los automóviles
22
del municipio de Guadalupe
Estadística Descriptiva
Estadística
Descriptiva

Distribuciones Representacione Medidas


de frecuencias s gráficas descriptivas

Diagrama Tendencia central


Histograma tallo y hojas
Tabulación
de datos Dispersión

Diagrama Diagrama
de pastel de barras

La estadística Descriptiva es útil en las etapas de la tabulación de la información,


En la representación gráfica de la información, y también en la descripción de la
Información. Si se desean hacer inferencias, se tiene que aplicar después de la
Estadística Descriptiva, métodos de estadística Inferencial. 23
Tipos de variables
cualitativas

Discretas

cuantitativas

continuas

24
Sí No Masc Fem Tall grande venti Trenta

Escala Nominal
(No hay orden,
Escala Ordinal
utiliza una (los atributos
etiqueta o llevan un orden)
nombre para cualitativa
representar un
atributo)
variable
Cuantitativa
0m

-40°F -20°F 0°F 20°F 40°F


0 Km

-40°C -20°C 0°C 20°C Escala de razón


El 0 es absoluto, no
Escala intervalo depende de la unidad
El 0 es relativo
DATOS

Variable cualitativa
Los datos describen alguna característica
(rojo, gusto, opinión)

Variable cuantitativa
Los datos son contables o medibles
Variable discreta
Los datos se pueden contar (núm. hijos, núm. de
accidentes, núm. de cursos por semestre, …)
Variable continua Los datos toman valores de
mediciones (admite decimales)
(estatura, peso, tiempo frente
a la TV, duración de un anuncio)
26
PROBLEMA

La cantidad de personas con depresión ha ido en aumento en los


últimos años, es por ello es de interés estudiarla. Uno de los síntomas
de esta enfermedad es la alteración del peso porque por lo general se
pierde el apetito, otro de los síntomas es la alteración del sueño de la
persona, problemas concentración, perdida del ánimo. Algunos
investigadores del área de la salud tienen la hipótesis de que hacer
ejercicio regularmente puede ayudar a la persona con depresión a
sentirse mejor.

27
ejemplo de la depresión, unas variables de
observación podrían ser:
• Nivel de depresión (leve, moderada, severa)
• Horas de sueño aproximado por día
• Peso en kg
• Edad
• Genero
• Estatura en mtrs
• Horas de ejercicio a la semana
¿Cuál sería el objetivo de recolectar la información de estas variables?
¿Por qué es importante definir la población que se quiere estudiar?
Si no es posible obtener la información de toda la población, se recolecta una
muestra. ¿Cómo se deben recolectar los datos de la muestra para que sean
representativos de la población?
¿Cuáles de estas variables son cuantitativas y cuáles cualitativas?
Si ya tenemos el registro de los datos de la
muestra
• ¿Cómo resumir la información ?
Por ejemplo si la muestra hubiera sido de 500 pacientes de los cuales
300 fueron mujeres y 200 hombres, 100 tuvieron nivel severo de
depresión, 250 moderado y 150 nivel leve de depresión.

¿Qué grafico ayudaría a resumir la información para cada una de estas


variables? ¿Identificas de qué tipo de variable son?
¿Cuál es la finalidad de un
gráfico?
(Univariado)
(Univariado)
Métodos (Univariado) Métodos
Gráficos VAR. CUANTITATIVA Gráficos VAR. CUALITATIVA
Histograma (Rectángulos) Gráfica de Pie
Distribución del ingreso

Gráfica de Pie

Agrupados
Agrupados

Datos
Fuente: Datos

Polígonos de Frecuencia (Marcas de clase)


Histograma de Barras Horizontales
Distribución del ingreso
35

Fuente:
30
25
20
15
10
5
0

Por medio de un gráfico se puede visualizar el comportamiento de un conjunto


de datos. Un gráfico habla más que mil palabras.
Dependiendo si la variable es cualitativa ó cuantitativa, se selecciona el tipo de
gráfico. 30
Tiempos de llegada de los estudiantes

14
12
10

Frecuencia
8
6
4
2
0
14 22 30 38 46
tiem po en m inutos
Pastel
Escala Nominal Barras
DATOS Pareto
CATEGORICOS
Escala Ordinal Barras
GRAFICOS
Opiniones sobre las Inscripiciones

16
14
frecuencia de los

DATOS
12
estudiantes

10
NUMERICOS
8
6
(para ambas
4
escalas)
2
0
Excelente Bueno Regular Malo Pésimo
opinión
Opiniones sobre las Inscripiciones

16
14
frecuencia de los

12
estudiantes

10
8
6
4
2
0
Bueno Pésimo Malo Excelente Regular
opinión

¿Cómo se llama un diagrama de barras de una variable cualitativa que


ordenamos de frecuencia mayor a la menor?
Antes de hacer un gráfico para una variable cualitativa o cuantitativa (histograma)
Es necesario hacer una tabla de frecuencia
¿Qué información brinda una tabla de frecuencias?
¿Qué es frecuencia absoluta?, ¿Qué es frecuencia relativa? ¿Qué es frecuencia
Acumulada?
Para la siguiente tabla, distingue qué tipo de variable es el nivel educativo.
¿Qué proporción de individuos tiene al menos estudios de preparatoria?

Nivel Educativo Número de casos Frecuencia Número Frecuencia


(frecuencia Relativa ACUMULADO de Relativa
absoluta) casos (frecuencia ACUMULADA
ACUMULADA)

Primaria o
menos
12 0.12 12 0.12
Secundaria
26 0.26 38 0.38
Preparatori
a
45 0.45 83 0.83
Profesional
o postgrado
17 0.17 100 1.00
Total 100 1.00
35
Introducción a la teoría de decisiones

36
Es semejante a un juicio . . .
Juez

Regla de
decisión

Ho
H1 vs.
Acusado
Fiscal
(el que acusa de
falsa a Ho)
Testigo (la muestra aleatoria
obtenida) 37
HIPÓTESIS NULA

Es la afirmación acerca de una característica numérica de


una población estadística que se supone a cierta y que es
puesta a prueba.

Ejemplos
Ho : Un laboratorio afirma que su nueva medicina cura el
80% de los pacientes.

Ho : Un fabricante de lámparas de alumbrado público


afirma que duran en promedio 70000 horas.

Ho : el nuevo procedimiento consigue eliminar del agua


por lo menos un 25% más de contaminantes que los otros
métodos.
38
HIPÓTESIS ALTERNATIVA

La Hipótesis alternativa es la postura que suele tomar el


investigador y que quiere probar cuando cree que Ho es
falsa.

Se niega de tres maneras posibles:


H1: “Ho no es cierta, es
Mayor
Menor
diferente
Dependiendo del interés del investigador

39
Por ejemplo, si usted es cliente

Ho : Un fabricante de lámparas de
alumbrado público afirma que duran
en promedio 70,000 horas.

Entonces la H1 de su interés es:

H1 : No es cierto, es menos de
70,000 horas.

Pero si usted es fabricante, la H1 de su interés es:


H1 : No es cierto, es diferente de 70,000 horas.

40
¿Cuáles serían las correspondientes hipótesis alternativas de:

Ho : Un laboratorio afirma que su nueva medicina cura el


80% de los pacientes.

Para un inspector de salud pública:

H1:

Ho : el nuevo procedimiento consigue eliminar del agua


por lo menos un 25% más de contaminantes que los otros
métodos.

Para un cliente que pretende comprar el procedimiento:

H1:

41
En toda decisión profesional el
ingeniero puede …

ACERTAR EQUIVOCARSE

42
¿Cuándo acierta?

Cuando acepta algo que en realidad es cierto

Cuando rechaza algo que en realidad en falso

43
¿Cuándo falla?

Cuando rechaza algo que en realidad es cierto

Cuando acepta algo que en realidad es falso

44
Si usted fuera juez, ¿qué error le gustaría
comer menos?

Condenar a alguien
que en realidad es
inocente.

Liberar a alguien
que en realidad es
culpable.

45
Si tuviera que decidir entrar agua a la ciudad,
¿qué error le gustaría cometer menos?

Dejar pasar agua a


la ciudad cuando en
realidad está
contaminada

Retener el agua no
dejándola pasar a
la ciudad cuando en
realidad está limpia
(es potable).

46
Un inspector de comida toma una muestra de
cierto producto para determinar si son saludables.
La hipótesis nula es que el producto es saludable
para la población. Identifica cuál de los siguientes
enunciados representa al error tipo 1 y cuál al
error tipo2

1. El inspector concluye que el producto es saludable


cuando en realidad era nocivo para la población
2. El inspector concluye que el producto NO es saludable
cuando en realidad sí era saludable para la población

47
Una vez realizado decidido por una de las dos hipótesis, la hipótesis
nula o base Ho, o la hipótesis alternativa H1, se pueden dar los
cuatro casos que se exponen en el siguiente cuadro:

es cierta es cierta

No hay error (verdadero


Se escogió Error de tipo II (β o falso negativo)
positivo)

Error de tipo I (α o falso


Se escogió No hay error (verdadero negativo)
positivo)

48
Marcapasos S.A.
El proveedor afirma, en un contrato, que exactamente el 1% de las pilas producidas (población)
duran menos de 7 años, esta afirmación es la hipótesis nula. Carlos y Helena sospechan que el % de
las pilas producidas que dura menos de 5 años es mayor al 1% (hipótesis alternativa). Ellos
dicidieron tomar una muestra aleatoria de la población de pilas producidas por el proveedor, para
ver si esta muestra soportaba su sospecha o no. La variable que observaron fue el tiempo de vida
de las pilas (en años) de una muestra de 25 pilas:
7.9 9.4 4.5 5.6 7.9 10.3 8.6 2.3 7.8 9.0
7.7 14.5 7.8 9.2 9.9 5.s 9.6 7.9 6.0 8.5
7.8 3.8 9.1 8.8
Identificar:
1. En los datos observados en la muestra indica cuáles son: errores de captura y cuáles son valores
faltantes.
2. La variable tiempo de vida es cuantitativa, ¿qué escala tiene: de razón o de intervalo?
3. Identificar en esta situación, cuál es la población estadística.
4. ¿Qué % de las pilas en la muestra dura menos de 7 años?¿Esta muestra a cuál de las dos
hipótesis favorece y porque?, da argumentos y evidencia estadística (cálculos estadísticos
que avalen su decisión)

49
Pastel
Escala Nominal Barras
DATOS Pareto
CATEGORICOS
Escala Ordinal Barras

GRAFICOS Diagrama de Caja


Datos no Tallo y hoja
Escalas agrupados
de
DATOS intervalo
NUMERICOS y
Escala
de razón
DATOS Diagrama de Tallo y Hojas
21
21 (variables cuantitativa con datos
22
22
de mínimo dos dígitos)
22
23
23
2 1122233333455566677778
23
23
3 0
23
24
25
25
25 Tallo: decenas
26 Hoja: unidades
26
26
27
27
27
27
28
30
Diagrama de tallo y hojas
 Para variables cuantitativas, es útil cuando cada dato esta
conformado por lo menos de dos dígitos.
 Ejemplos: 45.5, 50.3, 45.6, 53.8, 56.7, 50.9
Pasos:
a) Seleccionar parte del número
tallo hoja cómo tallo (se deja fijo), y la otra
parte restante como hoja.
45 56
50 39 b) Hacer una lista de valores de tallo
53 8 en una columna de lado izquierdo
56 7
c) Regristar la hoja para cada dato
Tallo: decenas y unidades junto al valor correspondiente de
Hoja: decimales tallo.
d) Indicar las unidades para tallos y
hojas por un lado del diagrama52
Gráfico de Tallo y Hoja (steam and leaf)

The number of touchdown (TD) passes 1 thrown by each of the 31 teams


in the National Football League in the 2000 season

Importante: Un
Tallo: decenas 3|2337 diagrama de Tallo y
Hojas: unidades
2|001112223889 Hoja siempre debe
1|2244456888899
especificar qué
representan el tallo y
0|69 las hojas.
53
Pastel
Escala Nominal Barras
DATOS Pareto
CATEGORICOS
Escala Ordinal Barras

GRAFICOS
Diagrama de Caja
Datos no Tallo y hoja
Escalas agrupados
de De puntos
DATOS intervalo
NUMERICOS y
Escala
de razón
DATOS
21
21
22 Diagrama de puntos
22
22
23
23
23
23
23
24
25
25
20 21 22 23 24 25 26 27 28 29 30 31
25
26
26
26
27
27
27
27
28
30
Pastel
Escala Nominal Barras
DATOS Pareto
CATEGORICOS
Barras
Escala Ordinal

GRAFICOS

Diagrama de Caja
No agrupados Tallo y hoja
De puntos
DATOS
NUMERICOS
(para ambas De dispersión
escalas) Agrupados
Datos
Clase Frecuencia
21 2 (21, 2)
22 3
(22,3)
23 5
(23,5)
(24,1)
24 1
(25,3)
25 3
(26,3)
26 3
(27,4)
27 4
(28,1)
28 1
(30,1)
30 1

Diagrama de 3

dispersión 2

0
20 21 22 23 24 25 26 27 28 29 30 31
Pastel
Escala Nominal Barras
DATOS Pareto
CATEGORICOS
Escala Ordinal

GRAFICOS
Diagrama de Caja
No agrupados Tallo y hoja
De puntos
DATOS
NUMERICOS
De dispersión
(para ambas
escalas) Agrupados Histograma
Histograma
 El objetivo de un
histograma es resumir la
información de una Histograma Focos Claire

variable cuantitativa.
140

 Pasos: 120

 Se secciona la 100

información en clases ó

Frecuencia
80
intervalos
Se cuenta el número de
60

datos en cada clase. Esta 40

se llama frecuencia 20

 Se puede calcular la
frecuencia relativa
0

y mayor...
0
103
206
309
412
515
618
721
824
927
1030
1133
1236
1339
1442
1545
1648
1751
1854
1957
2060
2163
2266
2369
2472
2575
2678
2781
2884
2987
 Se grafica un
histograma, teniendo Tiempo de Vida

como eje “x” las clases,


como eje “y” las
frecuencias ó frecuencias
relativas. En cada clase
se dibuja un rectángulo
que tiene como altura su
frecuencia ó frecuencia 59

relativa.
Sesgo a la derecha
Tiempos de llegada de los estudiantes

14
12
10
Frecuencia

8
6
4
2
0
14 22 30 38 46
tiem po en m inutos

Sesgo a la izquierda
Tiempos de llegada de los estudiantes

14
12
10
Frecuencia

8
6
4
2
0
14 22 30 38 46
tiem po en m inutos

También podría gustarte