Está en la página 1de 6

ANALISIS DE PROBLEMATICAS CON RSTUDIO

PROBABILIDAD Y ESTADISTICA

GRUPO 6

PRESENTADO A

ANA MARIA GOMEZ LAMUS

PRESENTADO POR

JUAN SEBASTIAN RIVEROS ROA

JULIAN CAMILO PACHON NIÑO


¿Qué son las medidas de sesgo y curtosis de una variable? ¿Cómo se relacionan estas
medidas con las medidas de tendencia central y las de dispersión?

Las medidas de sesgo y curtosis de una variable pertenecen a la rama de la estadistica descriptivas
y determinan numericamente algunas características de la forma en que estan distribuidos los
datos.

Medidas de sesgo:
Con frecuencia una distribución no es simétrica alrededor de ningún valor, pero en lugar de ello
se tiene que los datos estan más aglomerados o distribuidos hacia los extremos. Si hay pocos
datos distribuidos hacia el extremo derecho se dice que la distribución es sesgada a la derecha,
mientras que si hay pocos datos distribuidos hacia la izquierda , se dice que la distribución es
sesgada hacia la izquierda. Las medidas que describen esta asimetría se denominan coeficiente de
sesgo, o simplemento sesgo.
Medida de curtosis:
En algunos caso unos datos pueden estar concentrados alrededor de la media, de manera que la
distribución tiene un pico grande . En otro casos, la distribución puede ser relativamente plana.
Las medidas que determinan que tan empinada se encuentra una distribución se denominn
coeficientes de curtosis, o simplemente curtosis.
¿Cómo se determina el sesgo y la curtosis de una variable?

Medidas de sesgo:
Una de dichas medidas es
1
𝜇3 ∑(𝑥𝑖 − 𝜇𝑥)3
𝛼3 = 3 = 𝜋
𝜎 2
∑(𝑥𝑖 − 𝜇𝑥)3
(√ 𝑁 )
Esto para:
𝑥𝑖 es un valor de la variable de estudio, 𝜇𝑥 es el valor de la medida poblacional de la variable de
estudio y N es el total de datos en la poblacion. La medida será positiva o negativa si la
distribución es sesgada a la derecha o a la izquierda, repectivamente. Para una distribución
simétrica, 𝛼3 = 0.

Medida de curtosis:
Una medida que se usa con frecuencia está dada por
1
𝜇4 ∑(𝑥𝑖 − 𝜇𝑥)4
𝛼4 = 4 = 𝜋
𝜎 4
∑(𝑥𝑖 − 𝜇𝑥)2
(√ 𝑁 )

Cuando el valor de 𝛼4 = 3 se dice que los datos se distribuyen forma normal, o de campana o
mesocúrtica. Si 𝛼4 > 3 entonces la distribución es más empinada que la curva normal y se dice
que es leptocúrtica. Si 𝛼4 < 3 entonces la distribución es más aplanada que la curva normal y se
llama platicúrtica.
Cómo se interpretan las medidas anteriores en este conjunto de datos: Se tiene una
muestra con 30 observaciones del logaritmo de la concentración de material particulado
PM10 para el estudio de la contaminación del aire de Oslo, Noruega. Los datos fueron
obtenidos en octubre del 2001.
3.66, 3.04, 3.71, 2.94, 4.06, 3.69, 3.33, 3.36, 2.08, 1.94, 3.33, 3.21, 1.10, 5.38, 3.93, 3.37, 2.83,
3.04, 3.00, 4.21, 3.04, 3.76, 3.58, 2.48, 2.48, 3.33, 3.13, 2.08, 3.69, 3.00
La siguiente tabla contiene información publicada en el artículo “Mortalidad por enfermedades
cardiovascularesy su impacto económico en Colombia, 2000-2010” de Leidy Cortés Fuentes y
otros.

Link del artículo: http://www.scielo.org.co/pdf/sun/v32n2/v32n2a04.pdfA.

Indique cuál la problemática fundamental que hace necesario que se deban analizar los
datos anteriores.
Las enfermedades cardiovasculares corresponden a los trastornos del sistema circulatorio, que
incluyen el corazón, los vasos sanguíneos y la sangre. El desconocimiento del impacto
económico que genera este tipo de enfermedades desvía la importancia del control y la
prevención de las enfermedades crónicas no transmisibles.
Describa claramente la variable Sexo que se observa en la tabla anterior y realice un
gráfico que permita comparar las enfermedades cardiovasculares en el periodo de
estudio.
………………………………………………………………………………………………..
Explique con sus palabras qué es el índice APVP. Determiné las medidas de tendencia
central y dispersión para el Índice APVP según las enfermedades registradas en la tabla
anterior.

Los APVP son un indicador de mortalidad prematura. Son los años que una persona deja de
vivir si fallece a una edad más temprana de la esperada para su entorno social. Para su cálculo se
ha utilizado la metodología propuesta por Romeder y McWhinnie, que computa como
prematuros los
fallecimientos ocurridos antes de los 70años y no incluye los fallecidos menores de 1 año por
considerar que corresponden a otro tipo de causas muchas de ellas de difícil prevención. Esta
metodología da más peso a las defunciones más tempranas y habitualmente se utiliza para evaluar
la carga delas defunciones prematuras en una población y la distribución de causas de defunción
responsables de mayor mortalidad prematura.

Cuál es la relación entre la columna Total de personas con enfermedades


cardiovasculares y la columna Sexo. Exprese esto matemáticamente.
……………………………………………………………………………………………….
Realice un diagrama que permita visualizar la información de la Variable Total de
personas con enfermedades cardiovasculares

………………………………………………………………………………………………

También podría gustarte