Está en la página 1de 16

16/9/2020 Estadística Descriptiva (1)

Estadística Descriptiva
Septiembre 2020

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 1/16


16/9/2020 Estadística Descriptiva (1)

Objetivos de la Clase
Tipos de variables
Presentación de Resultados
Descriptores
Descriptores Numéricos
Medidas de tendencia central
Medidas de Posición

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 2/16


16/9/2020 Estadística Descriptiva (1)

Primera aproximación a un
problema estadístico
Experimento: Evaluar la efectividad de los stents en el
tratamiento de pacientes con riesgo cerebrovascular. Los
stents son dispositivos que se colocan dentro de los vasos
sanguíneos y que ayudan en la recuperación del paciente después
de eventos cardíacos. Además reducen el riesgo de un ataque
cardíaco adicional o muerte. Muchos médicos tienen la esperanza
de que habría beneficios similares para los pacientes de riesgo de
accidente cerebrovascular.

La pregunta clave que los investigadores se hacen es ¿puede el


uso de los stents reducir el riego de un accidente
cerebrovascular?

Los investigadores que hicieron esta pregunta recopilaron datos


de 451 pacientes en situación de riesgo. Cada paciente voluntario
fue asignado al azar a uno de dos grupos:

Grupo de tratamiento. Los pacientes en el grupo de tratamiento recibieron


un stent y atención médica. La atención médica incluye medicamentos, manejo
de los factores de riesgo y ayuda en la adquisición de nuevos hábitos saludables.
Grupo de control. Los pacientes en el grupo de control recibieron el mismo
manejo médico que el grupo de tratado, sin recibir los stents.

Resultados del estudio:

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 3/16


16/9/2020 Estadística Descriptiva (1)

De los 224 pacientes del grupo de tratamiento, 45 tuvieron un


accidente cerebrovascular durante el primer año. Con estos
números, calcular la proporción de pacientes en el grupo de
tratamiento que tuvo un derrame cerebral durante el primer año.
¿Y en el grupo control?

Estas proporciones muestran en forma clara y contundente la


información de las tablas anteriores.

Sorpresa: un 8% más de pacientes en el grupo de tratamiento


tuvieron un accidente cerebrovascular (grupo control:12%; grupo
de tratamiento: 20%)

Es contrario a lo que los médicos esperaban


Esta diferencia que muestran los datos entre grupos es “real” o
“estadísticamente significativa”?

Esta última pregunta es donde la estadística como ciencia hace su


aporte.

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 4/16


16/9/2020 Estadística Descriptiva (1)

Supongamos que tenemos una moneda, y la arrojamos 100 veces.


La probabilidad de obtener una cara en un lanzamiento cualquiera
es de 50%. Pero eso no quiere decir que vamos a observar
exactamente 50 caras. Este tipo de fluctuación es parte de casi
cualquier proceso generador de datos.

¿Es posible que el 8% de diferencia en el estudio del stent sea


atribuible a la variación natural de casi cualquier proceso?

Claramente cuanto mayor sea la diferencia que se observa (para


un tamaño de muestra dado) menos creíble resulta que la
diferencia se deba al azar.

Luego la pregunta es: ¿es la diferencia lo suficientemente grande


como para rechazar la idea de que fue el azar el culpable de la
diferencia?

Aún no contamos con las herramientas estadísticas para abordar


esta pregunta pero la conclusión del estudio fue: “la evidencia fue
convincente del daño de los stents en este estudio de pacientes
con riesgo de accidente cerebrovascular.”

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 5/16


16/9/2020 Estadística Descriptiva (1)

Introducción
La descripción de los datos es el primer paso en cualquier estudio
estadístico.

Se desea “sacar” información de los datos.

¿Qué tipo de información?

Cantidad de observaciones.

Tipos de variables.

Observar si se tienen datos faltantes u observaciones


incompletas.

Conocer dónde se encuentran ubicados los datos (medidas de


tendencia central y de posición - descriptores numéricos).

Conocer si los datos están dispersos o concentrados (medidas de


dispersión - descripores numéricos).

Visualización de los datos (descriptores gráficos)

Relación entre las variables.

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 6/16


16/9/2020 Estadística Descriptiva (1)

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 7/16


16/9/2020 Estadística Descriptiva (1)

Tipos de Variables

______________

Variables Categóricas
Una variable es categórica si los valores que toma no son numéricos y
si son numéricos, el operar sobre ellos (sumar, restar o tomar
promedios) no tiene un significado claro.

Una variable categórica es ordinal, si sus valores tienen un orden


natural.

Calidad de un producto: muy malo, malo, regular, bueno, muy bueno,


excelente.
Nivel de estudios: No tiene estudios, primaria, secundaria,
universitaria (tercer nivel), universitaria (postgrado).

Una variable categórica es nominal, si sus valores no tienen un


ordenamiento especial.

Color de ojos
Sexo.

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 8/16


16/9/2020 Estadística Descriptiva (1)

Variables Numéricas
Una variable es numérica si puede tomar una amplia gama de valores
numéricos, una cantidad innumerable de valores, y es sensato operar
(sumar, restar o tomar promedios) con esos valores.

Una variable numérica es discreta, si toma un número finito o


numerable de valores, en este caso se considera que solo puede tomar
valores numéricos con saltos.

Número de hijos que tiene una familia.


Número de días a la semana que los estudiantes se quedan a comer en
la cafetería de la universidad.

Una variable numérica es continua, si toma un número infinito no


numerable de valores:

Peso (en Kg) de los estudiantes de la UTEC.


Salario anual de los trabajadores de Lima.

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 9/16


16/9/2020 Estadística Descriptiva (1)

Parámetro y Estadístico
Un parámetro es una medida que resume una característica
específica de una población (fija).

Un estadístico es una medida que resume una característica


específica de una muestra (puede variar entre diferentes
muestras).

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 10/16


16/9/2020 Estadística Descriptiva (1)

Presentación de resultados
El primer análisis de un conjuntos de datos se puede realizar:

A través de un grupo de medidas resumen: métodos numéricos.

A través del análisis exploratorio: métodos gráficos y tabulares.

Los descriptores numéricos ayudan a explicar cómo son las variables,


mientras que los descriptores gráficos sirven para explicar el
comportamiento de las variables.
________________

Descriptores Numéricos
Para resumir la información de un conjunto de datos, la estadística
descriptiva dispone de pocas medidas que concentran la máxima
información y que ofrecen un idea clara del comportamiento general de
los datos. Ellas están clasificadas en tres grupos.

Medidas de Tendencia Central

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 11/16


16/9/2020 Estadística Descriptiva (1)

Cuando se dispone de un conjunto de observaciones, es de


interés encontrar el valor en torno al cual se agrupan la mayoría
de ellas o el centro de las mismas.

Las medidas descriptivas que permiten especificar estos valores


se denominan medidas de localización o medidas de tendencia
central.

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 12/16


16/9/2020 Estadística Descriptiva (1)

Media

La media (o promedio aritmético o promedio) es la


medida de tendencia central más popular ya que es fácil de
entender y calcular.

Para una población:

Observación: ¿Qué ocurre si queremos obtener un promedio de dos


medias, x̄ y x̄ , con n y n observaciones respectivamente?
1 2 1 2

n1 x̄ 1 + n2 x̄ 2 n1 x̄ 1 + n2 x̄ 2
x̄ = =
n1 + n2 n

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 13/16


16/9/2020 Estadística Descriptiva (1)

Media

__________________

Mediana

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 14/16


16/9/2020 Estadística Descriptiva (1)

Moda

Es importante
resaltar que hay diferentes definiciones de moda dependiendo del texto
o autor. En la UTEC

Medidas de Posición

Es conveniente referirnos a varios términos que son de uso


común en el mundo de la estadística: los cuartiles, los deciles y
los percentiles.

Estas medidas estadísticas corresponden a lo que se denomina


medidas de posición no central.

A un conjunto de datos ordenados se lo puede dividir en un


número fijo de partes iguales.

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 15/16


16/9/2020 Estadística Descriptiva (1)

* Los cuartiles
dividen los datos clasificados en 4 segmentos con el mismo número de
datos por segmento.

El primer cuartil, Q , es el valor para el cual el 25% de las


1

observaciones son más pequeñas y el 75% son más grandes.

Q2 es igual que la mediana (50% son más pequeños, 50% son más
grandes).

Solo el 25% de las observaciones superan el tercer cuartil Q . 3

Observación:

Los cuartiles Q , Q y Q se pueden expresar como P , P


1 2 3 25 50
y
P , respectivamente.
75

Los deciles D , D , D … y D se pueden expresar como P ,


1 2 3 9 10

P , P … y P , respectivamente.
20 30 90

Recordemos que la mediana (me) es el valor que deja 50% de los


datos a izquierda y 50% a derecha, por lo tanto, se puede
expresar también como Q , D y P . 2 5 50

file:///C:/Users/Usuario/Desktop/Brigida/UTEC/EyP/2020-II/Semana 3/Clase02.html#(1) 16/16

También podría gustarte