Está en la página 1de 72

ESTADÌSTICA I & II

Ing. Daniel Aviles Cruz


Contenido
• Estadística
• Estadística descriptiva
• Análisis combinatorio
• Teoría de la probabilidad
• Variables aleatorias y teoría de la probabilidad
• Distribución de la probabilidad
• Distribución de la probabilidad bidimensional
• Números índice
ITEM EQV.

Asistencia 20%

Tareas 50%

Evaluación Tiempo de entrega 20%

Particiòn 10%

Total 100%
U1. Estadística
• Definición y tipos de estadística
• Usos y abusos de la estadística
• Poblaciones y muestras
• Datos, problemas de variación y muestra
1.1 Definición
• Rama de las matemáticas que estudia la variabilidad, así como el proceso
aleatorio que la genera siguiendo las leyes de la probabilidad.
• Ciencia que utiliza conjuntos de datos numéricos para obtener, a partir de
ellos, inferencias basadas en el calculo de las probabilidades.
• Estudio que reúne, clasifica y recuenta todos los hechos que tienen una
determinada característica en común, para poder llegar a conclusiones a
partir de los datos numéricos extraídos.
1.2 Tipos de estadística
• Estadística descriptiva
• Estadística inferencial
• Probabilidad y estadística
• Estadística matemática
• Estadística de calidad
Aplicaciones cotidianas de la estadística
• Pequeños y medianos negocios
• La medicina
• Las ciencias naturales
• La investigación
• La ingeniería
• La biotecnología
• Medio ambiente
Fuentes de información estadística
Directas
• Peajes
• Nacimientos
• Defunciones
• Matrimonios
• Balances comerciales
• Industria
Fuentes de información estadística
Indirectas
• Nominas de salarios
• Carros vendidos en una zona
• Tv por cable
Indicadores nacionales
• Tipos de interés
• PIB
• Índice de precio al consumidor
• Tasa de empleo (población nacional activa)
• Ventas a minoristas
Indicadores internacionales
• Índice de progreso real
• Índice de competitividad mundial
• Índice de desarrollo humano
• Índice de corrupción
• Índice de calidad de vida
1.3 Población y muestras
Conceptos
• Dato: Conjunto de información recolectada
• Universo: Totalidad de individuos o elementos en los cuales puede
presentarse determinada característica susceptible a ser estudiada.
• Población: Conjunto completo de todos los elementos que se someterán al
estudio.
• Muestra: Es un subconjunto de miembros seleccionados de una población
Población VS Muestra
Tipos de muestreos
Probabilístico No probabilístico
Aleatorio simple Por cuotas
Aleatorio sistemático Casual
Aleatorio estratificado Bola de nieve
Aleatorio por conglomerados
Muestreo aleatorio simple
• El muestreo aleatorio simple es una técnica de muestreo en la que todos los
elementos que forman el universo - y que por lo tanto están incluidos en el
marco muestral - tienen idéntica probabilidad de ser seleccionados para la
muestra.
Pasos para seleccionar una muestra aleatoria
simple.
1. Define la población objetivo
2. Identifica un marco de muestreo actual de la población objetivo
3. Evalúa el marco de muestreo para la falta de cobertura.
4. Asigna un numero único a cada elemento de la trama
5. Determine el tamaño de la muestra
6. Selecciona al azar el numero especifico de elementos de la población.
Tamaño de la muestra
• Una muestra es una selección de los encuestados elegidos y que representan a
la población total. El tamaño de la muestra es una porción significativa de la
población que cumple con las características de la investigación reduciendo
los costos y el tiempo.
Consideraciones
1. Metas y Objetivos
2. ¿Qué tan preciso necesitas o deseas ser?
3. ¿Cuánta confianza o seguridad deseas tener en tus resultados?
4. ¿Qué tipo de variabilidad estas buscando?
5. Calcula tu tasa de respuesta
Formula del tamaño de muestra

2
𝑘 𝑞𝑝𝑁
𝑛=
𝑒 2 𝑁 − 1 + 𝑘 2 𝑝𝑞
Donde:
Ejemplo:
• Nos piden calcular el tamaño para una población de 543,098 consumidores
de una marca de bebidas energéticas, donde el investigador asigna un nivel de
confianza de 95% y un margen de error de 3%. Donde se desconoce la
probabilidad “p” del evento.
Resolviendo al 95% de confianza:

Datos Sustitución
• N=543,098 𝑘 2 𝑞𝑝𝑁
𝑛= 2
• k=1,96 𝑒 𝑁 − 1 + 𝑘 2 𝑝𝑞
• e=3%
• p=50% 1,96 2 (0,5)(0,5)(543,098)
𝑛=
(0,03)2 543,098 − 1 + 1,96 2 (0,5)(0,5)
• q=50%
Resolviendo:

521591,3192
1,96 2 (0,5)(0,5)(543,098) 𝑛=
(0,0009) 543,097 + (3,8416)(0,5)(0,5)
𝑛=
(0,03)2 543,098 − 1 + 1,96 2 (0,5)(0,5) 521591,3192
𝑛=
488,7873 + 0,9604
(3,8416)(0,5)(0,5)(543,098) 521591,3192
𝑛= 𝑛=
(0,0009) 543,098 − 1 + (3,8416)(0,5)(0,5) 489,7477
𝑛 = 1065,02
90% y 99% de confianza

90% de confianza 99% de confianza


• Para k=1,65 • Para k=2,58

1,65 2 (0,5)(0,5)(543,098) 2,58 2 (0,5)(0,5)(543,098)


𝑛= 𝑛=
(0,03)2 543,098 − 1 + 1,65 2 (0,5)(0,5) (0,03)2 543,098 − 1 + 2,58 2 (0,5)(0,5)

𝑛 = 755,19 𝑛 = 1842,72
Analizando

90% de 95% de 99% de


confianza confianza confianza
• 𝑘 = 1,65 • 𝑘 = 1,96 • 𝑘 = 2,58
• 𝑛 = 755,19 • 𝑛 = 1065,02 • 𝑛 = 1842,72
Analizar ejemplo de
Cleankids
Distribución de frecuencias
• Con frecuencia organizamos y resumimos los datos de forma numérica en
tablas o de forma visual en gráficas.
• El objetivo principal no es simplemente obtener una tabla o grafica, sino
analizar los datos y entender que indica.
Tipos de datos

Datos no agrupados Datos agrupados


• Los datos no agrupados son el • Información clasificada para su
conjunto de datos que no se ha estudio, mediante tablas de
clasificado y se es presentada en su frecuencia
forma de aparición en una tabla de
datos donde cada valor se
representa de forma individual.
Tabla de frecuencias
• Indica cómo un conjunto de datos se divide en varias categorías (o clases) al
listar todas las categorías junto con el número de valores de los datos que hay
en cada una.
Ejemplo
• Considera las medidas del pulso (latidos por minuto) obtenidas de una
muestra aleatoria simple de 40 hombres y de otra muestra aleatoria simple de
40 mujeres, con los siguientes resultados.
Mujeres
76 72 88 60 72 68 80 64 68 68 80 76 68 72 96 72 68 72 64 80
64 80 76 76 76 80 104 88 60 76 72 72 88 80 60 72 88 88 124 64
Hombres
68 64 88 72 64 72 60 88 76 60 96 72 56 64 60 64 84 76 84 88
72 56 68 64 60 68 60 60 56 84 72 84 88 56 64 56 56 60 64 72
Tabla de frecuencia para los pulso de mujeres

No. Ítem. Clases (Pulso) Frecuencias


1 60 – 69 12
2 70 – 79 14
3 80 – 89 11
4 90 – 99 1
5 100 – 109 1
6 110 – 119 0
7 120 - 129 1
Definiciones
• Los límites inferiores de clase: Son la cifra más pequeñas que pueden
pertenecer a las diferentes clases.
• Los Límites superiores de clase: Son las cifras más grandes que pueden
pertenecer a las diferentes clases
• Las marcas de clase: Son los puntos medios de las clases
Para que se construyen las tablas de frecuencia

• Permiten resumir conjuntos grandes de datos


• Identifica cierta comprensión sobre la naturaleza de los datos
• Brinda una base para construir graficas
Como se construye una tabla de
distribución de frecuencias
Ejercicio a resolver
• Realizar la tabla de frecuencia para el pulso de las mujeres
1. Determina el número de clases que desea

• Se recomienda que sea de 5 a 20

• Para el ejercicio del puso de las mujeres seleccionaremos 7 clases


• Debido a que las muestras van de 60 a 120
2. Calcule la anchura de la clase

𝑣𝑎𝑙𝑜𝑟 𝑚𝑎𝑠 𝑎𝑙𝑡𝑜 − (𝑣𝑎𝑙𝑜𝑟 𝑚𝑎𝑠 𝑏𝑎𝑗𝑜)


𝐴𝑛𝑐ℎ𝑢𝑟𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 ≈
𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠
… Para el ejercicio
• Valor mas alto = 124
• Valor mas bajo = 60
124 − 60
𝑎𝑛𝑐ℎ𝑢𝑟𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 ≈
7
64
𝑎𝑛𝑐ℎ𝑢𝑟𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 ≈
7
𝑎𝑛𝑐ℎ𝑢𝑟𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 ≈ 9,1418 ≈ 10
3. Elije un numero para el límite inferior de la
primera clase
• Se elije 60 como primer límite inferior de clase, ya que es el valor más bajo de
la lista y un número conveniente.
4. Enlista los demás límites inferiores de clase

• Suma la anchura de clase 10 al primer limite inferior de la primera clase 60


para determinar el segundo limite inferior y así sucesivamente para obtener
los demás limites inferiores.
5. Enlista los límites de clase en forma vertical

LIC LSC
60 69
70 79
80 89
90 99
100 109
110 119
120 129
6. Anota la frecuencia de cada clase
Clases
No. Ítem Frecuencias
LIC - LSC
1 60 - 69 12
2 70 - 79 14
3 80 - 89 11
4 90 - 99 1
5 100 - 109 1
6 110 - 119 0
7 120 - 129 1
Frecuencia acumulada
Clases
No. Ítem Frecuencias Frecuencias acumuladas
LIC - LSC
1 60 - 69 12 12
2 70 - 79 14 26
3 80 - 89 11 37
4 90 - 99 1 38
5 100 - 109 1 39
6 110 - 119 0 39
7 120 - 129 1 40
Porcentajes
Clases Frecuencias
No. Ítem Frecuencias %
LIC - LSC acumuladas
1 60 - 69 12 12 30%
2 70 - 79 14 26 35%
3 80 - 89 11 37 27,5%
4 90 - 99 1 38 2,5%
5 100 - 109 1 39 2,5%
6 110 - 119 0 39 0%
7 120 - 129 1 40 2,5%
Clases Frecuencia
No. Frecuencias Frecuencia
LI LS Frecuencias relativa
Ítem - acumuladas relativa (%)
C C acumulada
1 60 - 69 12 12 30% 30%
2 70 - 79 14 26 35% 65%
3 80 - 89 11 37 27,5% 92,5%
4 90 - 99 1 38 2,5% 95%
5 100 - 109 1 39 2,5% 97.5%
6 110 - 119 0 39 0% 97,5%
7 120 - 129 1 40 2,5% 100%
Marca de clase
Clases Frecuencia
No. Frecuencias Frecuencias Frecuencia Marca de
relativa
Ítem LIC - LSC Absoluta acumuladas relativa (%) clase
acumulada
1 60 - 69 12 12 30% 30% 64.5
2 70 - 79 14 26 35% 65% 74.5
3 80 - 89 11 37 27,5% 92,5% 84.5
4 90 - 99 1 38 2,5% 95% 94.4
5 100 - 109 1 39 2,5% 97.5% 104.5

6 110 - 119 0 39 0% 97,5% 114.5

7 120 - 129 1 40 2,5% 100% 124.5


GRAFICAS
Histograma
• Es la representación de
información en forma de barras,
donde la superficie de cada barra es
proporcional a la frecuencia de los
valores representados.
• Suelen usarse para datos
cuantitativos
Grafica de barras
• Es la representación de
información en forma de barras,
donde la superficie de cada barra es
proporcional a la frecuencia de los
valores representados.
• Suelen usarse para datos
cualitativos
Polígono de frecuencias
• Representación lineal de las marcas
de clase y las frecuencias absolutas
Ojiva
• Representación lineal de las
frecuencias acumuladas y los limites
superiores de la clase
Medidas de tendencia
central
MEDIA,MEDIANA Y MODA
¿Qué son las medidas de tendencia central?
• Numero centrado hacia la distribución de los valores de una serie de
observaciones en la que se encuentra ubicado un conjunto de datos.
Medidas de tendencia central

Media o Promedio Mediana Moda

• Es la suma de • Es el valor que • Es el datos que mas


dividir la suma de divide a la mitad la se repite en una
todos los valores, serie de datos que serie da datos
entre el numero tienen. Es decir es
total de los datos la que queda en
medio de todos los
datos
Formula para datos no agrupados

Media o
Mediana Moda
Promedio
• Valor que • Valor que
queda en mas se repite
medio
• 1.56,1.57,1.67,1.57,1.68
• 1.56,1.57,1.57,1.67,1.68
• n=5
• 8.05
• X=1.61
• Me=1.57
• Mo=1.57
Formula de medidas de tendencia
central para datos agrupados
Media
• 4793
• 100
• =43.93
Mediana
Pasos
1 4
Ubicar la clase de la mediana, para ello se Ubicar la frecuencia de la clase de la mediana
debe buscar en que clase se encuentra N/2 que es igual a 12

2 5

Ubicar la frecuencia acumulada del dato 20 Ubicar la frecuencia acumulada anterior a la


clase de la media es igual a 14

3 6
Ubicar el limite inferior de la clase de la
mediana que es igual a 6.63 Ubicar la amplitud de la case que es igual a 21
40
• Fa=26 −14
Me=6.63+ 2
∙ 0.21
• LI=6.63 12
20−14
• Fi=12 Me=6.63+ ∙ 0.21
12
6
• Fa-1=14 Me=6.63+ ∙ 0.21
12
• A=0.21 Me=6.63+0.5 ∙ 0.21
• N=40 Me=6.63+0.105
Me=6.735
Moda
Pasos para encontrar la moda

También podría gustarte