Está en la página 1de 36

Clase 4 Estadística descriptiva e

inferencial.
Bioestadística 2024.
Amaru Agüero J. MSc DDS
aaguero@miuandes.cl
+569 56399905
Temario:
1. Recordatorio.
2. Estadística descriptiva.
3. Estadística inferencial.
1. Variables.
Todo dato tiene una estructura
compuesta por tres elementos:
unidades de análisis (o unidad Variables
muestral), variables y valores.

Una variable es una característica, Tipo Cualitativas Cuantitativas


(Categóricas) (Numéricas)
cualidad o propiedad observada
que puede adquirir diferentes
valores y es susceptible de ser
cuantificada o medida en una Escala Nominales Ordinales Discretas Continuas
(Clasificar) (Jerarquizar) (Contar) (Medir)
investigación.
1. Variables y muestreo.
1. Población y Muestra. 1. ¿Por qué y
para qué
muestrear?

2. ¿Qué
tamaño de la
muestra
ocupar?
1. Población y muestra
2. Estadística descriptiva

La estadística descriptiva, como su nombre lo indica, sólo pretende describir o


caracterizar este conjunto de datos.
De los datos obtener una información resumida de las variables que se
midieron.
Determinar en primera instancia si estas variables pueden o no ser una
variable aleatoria con una distribución de probabilidad conocida.
El resumen de información tiene dos propósitos:
• Obtener una expresión numérica de las características más importantes de una distribución de
datos, para facilitar la comprensión de esas características entre diversas distribuciones.
• Posibilitar que se puedan reproducir las características gráficas de una distribución a partir de la
interpolación de las estadísticas de resumen calculadas.
2. Estadística descriptiva.
Variables Categóricas.

Las variables categóricas se


describen principalmente
mediante dos medidas
resumen:

El número o frecuencia de El porcentaje o proporción o


casos en cada nivel de la frecuencia relativa de casos en
variable o en cada categoría cada nivel de la variable o en
de la variable cada categoría de la variable.
2. Estadística descriptiva.
Variables Categóricas: tablas.
Estadística descriptiva.
Variables Categóricas: Gráficos.
2. Estadística descriptiva: Variables Numéricas
2. M. de Posición. M. T. Central: Media Aritmética
2. M. de Posición. M. T. de Posición. M. T. Central:
Mediana
2. M. de Posición. M.T. Central: Mediana vs Media.
2. Medidas de posición: Percentiles.
2. Medidas de posición: Percentiles.
2. Medidas de posición: Percentiles.
Un percentil p es un porcentaje que se ubica entre (0 < p < 100) y
es un valor que se obtiene en la muestra ordenada.
El p% de los datos muestrales es menor o igual al valor del
percentil y el (100 − p) % restante queda sobre el percentil.
Dado que los percentiles se calculan en la muestra
ordenada, también se les denomina estadísticos de orden. Los más
conocidos son los deciles y cuartiles
2. Medidas de dispersión.

Las medidas de dispersión son aquellas que miden la variabilidad de


un conjunto de datos.
Al analizar un conjunto de datos, no basta con calcular una medida de
tendencia central, ya que esta no nos indica que tan concentrados o
dispersos se encuentran los datos en torno a este valor.
Para obtener esta última información, es necesario calcular una
medida de dispersión.
2. Medidas de dispersión.

=
2. Presentación gráfica de variables numéricas.
2. Presentación gráfica de variables numéricas.
2. COVID-19

Analysis of factors associated with disease outcomes in hospitalized


2. COVID-19

Analysis of factors associated with disease outcomes in hospitalized


patients with 2019 novel coronavirus disease. Wei Liu et al, 2020
4. Estadística inferencial

Inferir: Generalizar los resultados


obtenidos a partir de una muestra, a
la población de la cual procede y
representa.
3. Estadística inferencial

Se deducirá que el
porcentaje de
El 38% de los
fumadores poblacional individuos en
debiera ser
aproximadamente la muestra es
38%. fumador.
3. Inferencia estadística.

Inferencia
estadística.

Estimación por intervalos de


Estimación puntual. confianza.
MEDIA (Numéricas) MEDIA (Numéricas)
PROPORCIÓN (Categóricas) PROPORCIÓN (Categóricas)
3. Estadística Inferencial.
Estimación Puntual.

> Los estimadores puntuales reciben este nombre, ya que su cálculo obtenido
de la muestra entrega único valor numérico (MEDIA, PROPORCIÓN,
TOTAL, VARIANZA, etc.) que estima al parámetro poblacional (valor fijo y
desconocido.).

> Se espera que estos estimadores tengan algunas características deseables,


como insesgamiento y eficiencia.
3. Estimador puntual.
INSESGAMIENTO.

Es insesgado cuando, al En la práctica se Están producidos, por


repetir el experimento un relaciona con el ERROR ejemplo, por un defecto del
elevado número de veces, SISTEMÁTICO instrumento de medición
se encuentra el verdadero entendemos la falta de o por una tendencia errónea
parámetro poblacional. validez en la medición. del observador
3. Estimador puntual.
EFICIENCIA.

La única forma de incrementar El error aleatorio se relaciona con la


Se dice que un la eficiencia de un estimador es precisión del resultado. Una medida
estimador es eficiente mediante el aumento del tamaño será tanto más precisa
cuanto menor sea el componente
de la muestra o aumentando
cuando tiene poca la precisión según lo que se mida y
aleatorio (el estimador más eficiente
será el que tenga mayor
varianza. con qué instrumento se haga. precisión estadística).
3. ERROR ALEATORIO Y ERROR SISTEMÁTICO.

Error
Error Aleatorio. Sistemático.

Error Sistemático
IDEAL y Aleatorio.
3. Estimador por intervalo de confianza.
● Un intervalo de confianza es una alternativa a la estimación puntual, al proveer un rango
de valores (calculado en una muestra) en el cual se encuentra el verdadero
valor de un parámetro.

● La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo


construido se denomina nivel de confianza, y de que este fuera del intervalo,
nivel de significancia.

● El nivel de confianza (que se denota 1 − α) y la significancia (que se


denota α) son probabilidades de sucesos complementarios, por lo que la suma de ambas
es 1.

● Se construyen intervalos con nivel de confianza 1 − α = 0,95 (o α = 0,05) o 95%.


3. Estimador por intervalo de confianza de la media
poblacional con varianza poblacional conocida.
3. Estimador por intervalo de confianza de la media
poblacional con varianza poblacional conocida.
3. Estimador por intervalo de confianza de la media
poblacional con varianza poblacional desconocida.
3. Estimador por intervalo de confianza de la media
poblacional con varianza poblacional desconocida.
3. Estimador por intervalo de confianza de una
proporción poblacional.

También podría gustarte