Está en la página 1de 21

Módulo 1:Estadística para DS

1. Introducción y estadística descriptiva


Objetivos

Comprender la diferencia entre una muestra y una población y la


importancia de las muestras aleatorias

Encontrar e interpretar las medidas de centralidad y de dispersión


de la data

Comprender los principios de la probabilidad y realizar cálculos de


probabilidad mediante conteos

Educación Ejecutiva
UTEC
Muestra y población

¿Qué podemos concluir sobre


la población a partir de la
muestra?

Tomado de https://medium.com/analytics-vidhya/statistics-population-and-sample-993a488572ac

Educación Ejecutiva
UTEC
Ejemplos de muestras y poblaciones

Si queremos estudiar la emisión de gases contaminantes de los


autos. ¿Cuáles serían ejemplos de poblaciones y muestras?

Educación Ejecutiva
UTEC
Muestra aleatoria simple

Obtenemos una muestra aleatoria simple de tamaño n si la forma de


elegir la muestra garantiza que todos los conjuntos de tamaño n
pueden ser elegidos con la misma probabilidad.

Educación Ejecutiva
UTEC
Tipos de data

Tipos de data

Categórica Cuantitativa

Nominal Ordinal Discreta Continua

Educación Ejecutiva
UTEC
Resumen de la data

Centralidad Dispersión Distribución

Educación Ejecutiva
UTEC
Medidas de centralidad

Media de una Media de una


muestra población
(Estadística) (Parámetro)

Educación Ejecutiva
UTEC
Otras medidas de centralidad

Mediana: es el elemento que ocupa la posición central.

Moda: es el elemento que más se repite

Educación Ejecutiva
UTEC
Medidas de dispersión

Desviación Desviación
estándar de una estándar de una
muestra población
(Estadística) (Parámetro)

Educación Ejecutiva
UTEC
Varianza

La varianza es el cuadrado de la desviación estándar


Varianza de la muestra:
Varianza de la población:

Educación Ejecutiva
UTEC
Coeficiente de variación
Nos permite saber qué tan grande es la desviación estándar con respecto a la
media. Nos puede servir para comparar dos conjuntos de datos distintos.

Coeficiente de variación de una muestra

Educación Ejecutiva
UTEC
Z-scores
Los Z-scores son los valores de los datos estandarizados. Nos
sirven para calcular la posición relativa de una observación en la
data.

Z-score de una observación en una


muestra.

Educación Ejecutiva
UTEC
Percentiles

Pk: es un valor tal que k% de la data es menor o igual a dicho valor.

Ejemplo: Halle el percentil 30 de la siguiente data

Educación Ejecutiva
UTEC
Boxplots

Educación Ejecutiva
UTEC
Probabilidad

Educación Ejecutiva
UTEC
Probabilidad clásica

𝛀: espacio muestral
A: evento
P(A)= #(A)/#(𝛀)

Ejemplo: Encuentre la probabilidad de que una pareja con tres hijos


tenga dos hijos y una hija.

Educación Ejecutiva
UTEC
Leyes de la probabilidad

Educación Ejecutiva
UTEC
Eventos independientes

Dos eventos, A y B, son independientes si la ocurrencia de uno de


ellos no influye en la ocurrencia del otro. En ese caso tenemos:

Ejercicio: Si elegimos dos personas al azar


● Encuentra la probabilidad de que ambas personas hayan nacido un lunes.
● Encuentre la probabilidad de que ambas personas hayan nacido el mismo dia.

Educación Ejecutiva
UTEC
Probabilidad Condicional

La probabilidad condicional de B dado A es la probabilidad de que


ocurra el evento B bajo la condición de que ha ocurrido el evento A

Educación Ejecutiva
UTEC
Probabilidad Condicional
Dados los siguientes resultados de una prueba del polígrafo

Sujeto Sujeto dijo


mintió la verdad
Resultado 42 15
positivo
Resultado 9 32
negativo

¿Cuál es la probabilidad de obtener un resultado positivo dado que el


sujeto mintió?

Educación Ejecutiva
UTEC

También podría gustarte