Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Curso de Introduccion A Estadistica y Probabilidad Con Trazos E59f799e Ffc6 4f55 8ba3 Abdaa187cd04
Curso de Introduccion A Estadistica y Probabilidad Con Trazos E59f799e Ffc6 4f55 8ba3 Abdaa187cd04
Fundamentos a
Estadística y
Probabilidad
Ilse Beatriz Zubieta Martínez
@werlix
¿Quién es Ilse?
● 🧮 Matemática aplicada.
● Mexicana.
● 🎙 Cantante de clóset.
● ➕ Aritmética básica.
● ✖ Álgebra básica.
Requisitos ● 💻 Microsoft Excel o
previos Google Sheets.
● Muchas ganas de
terminar este curso. :)
Estadística:
¿Qué es y por qué
aprenderla?
La estadística es la ciencia de
la interpretación de los datos.
¿Qué es estadística?
¿Qué
interpretas
aquí?
Concepto 1
Límite 7 palabras
Cuéntame, ¿por qué te
uniste a este curso?
Samsonite 30 Negro Sí
Samsung 45 Gris No
OE 28 Marrón No
Chloe 31 Negro No
Gorett 17 Negro Sí
Barbie 9 Rosa No
1 Cuantitativa
Samsonite 30 Negro Sí
Samsung 45 Gris No
OE 28 Marrón No
6
Individuos
Chloe 31 Negro No
Gorett 17 Negro Sí
Barbie 9 Rosa No
2 Cualitativas
● Categóricas
○ Ordinal
Variables ○ Nominal
● Numéricas
○ Discretas
○ Continuas
Nominal
Niveles Ordinal
de medida
De intervalo
De proporción
19 Variables
Precio en
2 Tamaño en Precio Año Pago Cantidad Material de Llave Cuarto de Servicios
miles de Baños Habitaciones Bodega Rooftop Predial Dirección Piso Altura m Tipo de gas
Individuos m² por m² construido mensual de dueños Piso automática lavado incluídos
dólares
Orquídea 300000 110 2728 3 3 Sí Propio 1972 5% 1500 Calle 1, esq. Calle 34 1 300% 2.3 Madera Sí Sí Natural No
Tamaño en m² 110 75
Baños 3 1
Habitaciones 3 2
Bodega Sí No
Predial 5% 2%
Cantidad de dueños 1 7
Piso 3 PB
Llave automática Sí Sí
Servicios incluidos No No
Tipo de Variable Variables Orquídea Geranio
Cuantitativa Baños 3 1
Cuantitativa Habitaciones 3 2
Cualitativa Bodega Sí No
Cuantitativa Predial 5% 2%
Cualitativa Piso 3 PB
Recopila información de
una población a partir de
una muestra y por medio
de la inducción determina
las propiedades de la
misma.
Muestra
Software
estadístico
¿Qué es la estadística
y con qué se come?
Hojas de cálculo
Industria
open source
Herramientas de
BI y análisis
Industria
paga
Academia
Otras
herramientas
Cuéntame cuál de estas
herramientas te parece
Reto más afín a tu objetivo y
cuál te gustaría
aprender después.
Tablas
unidimensionales
y bidimensionales
Una imagen vale más
que mil datos
Tablas
unidimensionales
Mes Ganancias
enero $28,361.00
febrero $14,744.00
marzo $19,407.00
abril $15,891.00
mayo $21,277.00
junio $21,530.00
julio $17,990.00
agosto $21,838.00
septiembre $20,174.00
octubre $20,025.00
noviembre $48,055.00
diciembre $24,318.00
Tablas
bidimensionales
Mes 2018 2019 2020 2021
mayo $21,277.00
mayo $ 820.00 $ 2,708.00 $ 2,326.00 $ 15,423.00
junio $21,530.00
junio $ 1,138.00 $ 3,014.00 $ 2,982.00 $ 14,396.00
julio $17,990.00
octubre $20,025.00
septiembre $ 538.00 $ 3,109.00 $ 6,614.00 $ 9,913.00
noviembre $48,055.00
octubre $ 448.00 $ 3,695.00 $ 5,153.00 $ 10,729.00
diciembre $24,318.00
noviembre $ 2,387.00 $ 6,495.00 $ 13,128.00 $ 26,045.00
Asia 2
Europa 11
Norteamérica 4
Sudamérica 5
Total general 23
Type Cuenta
Movie 6131
TV Show 2676
1930-1945 2 1 3
1946-1961 2 1 3
1962-1977 2 1 1 4
1978-1993 2 1 1 4
1994-2009 1 2 1 4
2010-2026 1 1 1 1 1 5
Total general 1 2 11 4 5 23
Frecuencia
relativa
Continente # Sede % Sede
Norteamérica 4 17%
TV Show 2676 31%
Sudamérica 5 22%
Total general 8807 100%
Total general 23 100%
Cuenta de Sede Continente
Años mundial África Asia Europa Norteamérica Sudamérica Total periodo
69 60
67 63
66 66
0,0,2,2,3,4,4,5,6,6,6,6,7,7,
75 75 6
68 64 8,8,9
62 64
66 67
7 0,2,4,5,5
74 60
62 68
66 72
Gráfico de puntos
Gráfico de
puntos
Gráfico de
barras
31 $5,500.00 $11,000.00
32 $5,500.00 $16,500.00
33 $5,500.00 $22,000.00
34 $5,500.00 $27,500.00
35 $5,500.00 $33,000.00
36 $5,500.00 $38,500.00
37 $5,500.00 $44,000.00
38 $5,500.00 $49,500.00
39 $5,500.00 $55,000.00
40 $5,500.00 $60,500.00
41 $5,500.00 $66,000.00
Preferencia en mascotas
Ninguna
Perros
2 7
Diagramas
de venn 3 5
6
1 4 3
Gatos Otras
Histograma
Distribuciones
conjuntas
Estadística descriptiva
Frecuencia
relativa a filas
Cuenta mundiales Continente sede
0-3 4% 2% 2% 1%
3-6 8% 6% 5% 0%
Horas
durmiendo 6-9 1% 17% 10% 4%
9 - 12 3% 3% 12% 9%
12 + 2% 3% 4% 4%
Distribución
marginal
Kilos perdidos
100 personas
entrevistadas 0-2 2-4 4-6 6+ Total
0-3 4% 2% 2% 1% 9%
3-6 8% 6% 5% 0% 19%
Horas
6-9 1% 17% 10% 4% 32%
durmiendo
9 - 12 3% 3% 12% 9% 27%
12 + 2% 3% 4% 4% 13%
Total 18% 31% 33% 18% 100%
Marginal columnar
Distribución por kilos perdidos
Kilos perdidos
Total
0-3 9%
3-6 19%
Horas
6-9 32%
durmiendo
9 - 12 27%
12 + 13%
Total 100%
Distribución
condicional
Kilos perdidos
100 personas
entrevistadas 0-2 2-4 4-6 6+ Total
0-3 44% 22% 22% 11% 100%
3-6 42% 32% 26% 0% 100%
Horas
6-9 3% 53% 31% 13% 100%
durmiendo
9 - 12 11% 11% 44% 33% 100%
12 + 15% 23% 31% 31% 100%
Kilos perdidos
100 personas
entrevistadas 0-2 2-4 4-6 6+ Total
0-3 44% 22% 22% 11% 100%
3-6 42% 32% 26% 0% 100%
Horas
6-9 3% 53% 31% 13% 100%
durmiendo
9 - 12 11% 11% 44% 33% 100%
12 + 15% 23% 31% 31% 100%
Kilos perdidos
100 personas
entrevistadas 0-2 2-4 4-6 6+
0-3 22% 6% 6% 6%
0-3 22% 6% 6% 6%
50% 50%
Mediana
7, 9, 5, 2, 2, 4, 1
2, 3, 5, 7, 3, 4, 9, 1
Moda
Dato o valor que más se repite.
Moda
Bimodal o sin moda
Moda Moda
7, 6, 6, 3, 4, 4, 4, 5, 2, 2, 2, 2, 3, 3,
4, 5, 5, 9, 2, 8, 8 3, 3, 5, 5, 7, 9, 9
xi # xi #
2 2
3 3
4 5
5 7
6 9
7 9
8
9
Medidas de dispersión:
rango e IQR
Estadística Descriptiva
Rango
Diagrama
de caja
Mínimo Máximo
6 0 0 4 5 5 5 6 6 6 7 7 7 8 9
7 2 2 3 3 4 5 6
Mínimo: 60
Máximo: 76
Rango intercuartílico
(RIQ o IQR)
Mediana
Q1 Q3
Diagrama
Mínimo Máximo de caja
Rango
21 puntuaciones en un examen
60 60 64 65 65 66 66 66 67 67 67 68 69 72 72 73 73 74 75 76 77
Desplazamiento y
escala de valores
Estadística Descriptiva
60 60 64 65 65 66 66 66 67 67 67 68 69 72 72 73 73 74 75 76 77
60 60 64 65 65 66 66 66 67 67 67 68 69 72 72 73 73 74 75 76 77
Media 68.6
Mediana 67
Moda 66
Rango 17
IQR 7
60 60 64 65 65 66 66 66 67 67 67 68 69 72 72 73 73 74 75 76 77
Media 68.6
Mediana 67
Moda 66
Rango 17
IQR 7
Desplazamiento
(suma y resta)
60 60 64 65 65 66 66 66 67 67 67 68 69 72 72 73 73 74 75 76 77
Media 68.6
Mediana 67
Moda 66
Rango 17
IQR 7
Desplazamiento
(suma y resta)
60 60 64 65 65 66 66 66 67 67 67 68 69 72 72 73 73 74 75 76 77
64 64 68 69 69 70 70 70 71 71 71 72 73 76 76 77 77 78 79 80 81
Media 68.6
Mediana 67
Moda 66
Rango 17
IQR 7
Desplazamiento
(suma y resta)
60 60 64 65 65 66 66 66 67 67 67 68 69 72 72 73 73 74 75 76 77
64 64 68 69 69 70 70 70 71 71 71 72 73 76 76 77 77 78 79 80 81
Media 68.6
Mediana 67
Moda 66
Rango 17
IQR 7
Escalar
(multiplicación y división)
60 60 64 65 65 66 66 66 67 67 67 68 69 72 72 73 73 74 75 76 77
120 120 128 130 130 132 132 132 134 134 134 136 138 144 144 146 146 148 150 152 154
Media 68.6
Mediana 67
Moda 66
Rango 17
IQR 7
Escalar
(multiplicación y división)
60 60 64 65 65 66 66 66 67 67 67 68 69 72 72 73 73 74 75 76 77
120 120 128 130 130 132 132 132 134 134 134 136 138 144 144 146 146 148 150 152 154
120 120 128 130 130 132 132 132 134 134 134 136 138 144 144 146 146 148 150 152 154
Media 68.6
Mediana 67
Moda 66
Rango 17
IQR 7
Box plots
y el resumen
de 5 números
Estadística Descriptiva
Box plot
Mediana
Q1 Q3
Mínimo Máximo
IQR
Rango
Resumen de 5 números
Mediana
Mínimo
Q1 Q3
Q1
Mediana
Q3 Mínimo Máximo
Máximo
IQR
Rango
Resumen de 5 números
60 60 64 65 65 66 66 66 67 67 67 68 69 72 72 73 73 74 75 76 77
Mínimo
Q1
Mediana
Q3
Máximo
Media, varianza y
desviación estándar
Representación de datos
Media
Media
Poblacional Muestral
Varianza
Varianza
Poblacional
Muestral
Varianza no sesgada
Muestral
Desviación
estándar
Poblacional y muestral
Poblacional
Muestral
Calcula la media,
varianza y desviación
Reto estándar poblacional y
muestral de años de
estreno.
Histogramas,
polígonos de frecuencia
y curvas de densidad
Representación de datos
Histograma de
frecuencia relativa
Polígono de
frecuencia
Curva de densidad
Distribuciones
simétricas y
asimétricas
Representación de datos
Distribuciones
simétricas
● Notas en un examen.
● Errores de medida.
Ejemplos ● Presión sanguínea.
Distribuciones ● Tamaño de las piezas
simétricas producidas por una
máquina.
Distribución normal
2010 -
Minimo 1925
Q1 2013 1990 -
Mediana 2017
Q3 2019 1970 -
Máximo 2021
Moda 2018 1950 -
1930 -
1930 -
1950 -
1970 -
1990 -
2010 -
2030 -
Métodos de
recopilación
de datos
Muestra y sesgo
Estudio
observacional
● Tablas
Recopilación unidimensionales
de datos ● Tablas
bidimensionales
Estudio
experimental
● Aleatorización
● Grupo de control y
Estudio grupo de estudio
experimental ● Replicación
● Bloqueo (matched
pairs)
Muestreo y sesgo
Muestra y sesgo
Mediciones Población
• Parámetro
• Estadístico
Muestra
Sesgo en la toma
de muestras
● Medición incorrecta.
● Deseabilidad social.
Sesgo de
● Preguntas inductivas
respuesta o capciosas.
● Selección.
¿Qué es la probabilidad?
Probabilidad simple
Probabilidad simple
Probabilidad experimental
Regla de la suma,
unión e intersección
¿Y la probabilidad?
1 2 3 4 5 6
1 (1,1)(1,2)(1,3)(1,4)(1,5)(1,6)
2 (2,1)(2,2)(2,3)(2,4)(2,5)(2,6)
3 (3,1)(3,2)(3,3)(3,4)(3,5)(3,6)
4 (4,1)(4,2)(4,3)(4,4)(4,5)(4,6)
5 (5,1)(5,2)(5,3)(5,4)(5,5)(5,6)
6 (6,1)(6,2)(6,3)(6,4)(6,5)(6,6)
1 2 3 4 5 6
1 (1,1)(1,2)(1,3)(1,4)(1,5)(1,6)
2 (2,1)(2,2)(2,3)(2,4)(2,5)(2,6)
3 (3,1)(3,2)(3,3)(3,4)(3,5)(3,6)
4 (4,1)(4,2)(4,3)(4,4)(4,5)(4,6)
5 (5,1)(5,2)(5,3)(5,4)(5,5)(5,6)
6 (6,1)(6,2)(6,3)(6,4)(6,5)(6,6)
1 2 3 4 5 6
1 (1,1)(1,2)(1,3)(1,4)(1,5)(1,6)
2 (2,1)(2,2)(2,3)(2,4)(2,5)(2,6)
3 (3,1)(3,2)(3,3)(3,4)(3,5)(3,6)
4 (4,1)(4,2)(4,3)(4,4)(4,5)(4,6)
5 (5,1)(5,2)(5,3)(5,4)(5,5)(5,6)
6 (6,1)(6,2)(6,3)(6,4)(6,5)(6,6)
1 2 3 4 5 6
1 (1,1)(1,2)(1,3)(1,4)(1,5)(1,6)
2 (2,1)(2,2)(2,3)(2,4)(2,5)(2,6)
3 (3,1)(3,2)(3,3)(3,4)(3,5)(3,6)
4 (4,1)(4,2)(4,3)(4,4)(4,5)(4,6)
5 (5,1)(5,2)(5,3)(5,4)(5,5)(5,6)
6 (6,1)(6,2)(6,3)(6,4)(6,5)(6,6)
Deporte LATAM EEUU Total
Futbol 22 16 38
Básquetbol 13 8 21
Otra 25 16 41
Total 60 40 100
1. ¿Cuál es la probabilidad de que un
participante sea de LATAM?
Deporte LATAM EEUU Total
Futbol 22 16 38
Básquetbol 13 8 21
Otra 25 16 41
Total 60 40 100
2. ¿Cuál es la probabilidad de que el
deporte favorito de un participante sea el
básquetbol?
Deporte LATAM EEUU Total
Futbol 22 16 38
Básquetbol 13 8 21
Otra 25 16 41
Total 60 40 100
3. ¿Cuál es la probabilidad de que un
participante sea de EEUU o prefiera un
deporte diferente al fútbol o al básquetbol?
Probabilidad
condicional
¿Y la probabilidad?
La regla de la multiplicación
Eventos
independientes
¿La probabilidad sube?
¿La probabilidad sube?
¿La probabilidad sube?
Eventos
dependientes
Probabilidad condicional
● El experimento cuenta el
número de ocurrencias de
un evento sobre alguna
otra medida (de longitud,
de tiempo, etc.).
● La media es la misma
para cada intervalo.
● El conteo de eventos en
cada intervalo es
independiente del
siguiente intervalo.
Poisson
● Los intervalos no se superponen.
● La probabilidad de que ocurra el evento
es proporcional al periodo.
Bernoulli
● Categoría especial de variables aleatorias
binomiales.
Geométrica "fracaso".
● La probabilidad de éxito en
cada ensayo es constante.
● Valores atípicos.
Forma
Correlación lineal
Correlación parabólica
Sin correlación
Dirección
Lineal
positiva
Lineal
negativa
Fuerza y valores
atípicos
Relación lineal
fuerte
Relación lineal
moderada
Gráfica la dispersión de los
datos y su línea de regresión:
- Profundizar en estadística
- Análisis de datos
- Finanzas
- Marketing y publicidad digital
- Negocios y emprendimientos
- Ciencias
¡Felicitaciones!