Está en la página 1de 10

TALLER 1 PARTE 2

ANGELY LOPEZ
DIEGO MELO
DANIELA ROSERO
SARA UNIGARRO

ESTADÍSTICA II
UNIVERSIDAD DE NARIÑO
SAN JUAN DE PASTO
2020
ESTADÍSTICA II-GRUPO 4
TALLER MODULO I-2
PARTE III. MEDIDAS NUMÉRICAS

1. El conjunto de datos 93 cars.sgd contiene información de una muestra aleatoria de


93 modelos de automóviles con diferentes características de cada modelo, con las
variables MPG City (Millas por galón en ciudad) y MPG highway (Millas por galón en
carretera) :

Resumen estadístico

Medidas MPG CITY MPG


HIGHWAY

Recuento 93 93

Promedio 22,3656 29,086

Mediana 21,0 28,0

Moda 18,0 26,0

Varianza 31,5823 28,4273

Desviación Estándar 5,61981 5,33173

Coeficiente de Variación 25,127% 18,3309%

Mínimo 15,0 20,0

Máximo 46,0 50,0

Rango 31,0 30,0

Cuartil Inferior 18,0 26,0

Cuartil Superior 25,0 31,0

Rango Intercuartílico 7,0 5,0

Sesgo 1,70443 1,2299

Sesgo Estandarizado 6,71035 4,84211

Curtosis 4,00431 2,6142

Curtosis Estandarizada 7,88248 5,14606

El StatAdvisor
Esta tabla muestra los estadísticos de resumen para las variables MPG city, MPG Highway.
Incluye medidas de tendencia central, medidas de variabilidad y medidas de forma. De
particular interés aquí son el sesgo estandarizado y la curtosis estandarizada, las cuales
pueden utilizarse para determinar si la muestra proviene de una distribución normal.

A. Calcule la media y la desviación estándar para cada variable, que puede interpretar
acerca de las diferencias entre ellas.
Medidas MPG City MPG HIGHWAY

Media 22,3656 29,086

Desviación Estándar 5,61981 5,33173

La desviación estándar de alguna variable nos permite determinar que tan dispersa es esta
con respecto a su media, es así que podemos notar que si este se encuentra más alejado
de la media su desviación es mayor, de acuerdo a esto podemos observar según el ejercicio
que para el caso de MPG City tiene datos muchos más dispersos en contraste con MPG
Highway, ya que en la primera su desviación está mucho más lejos.

B. Determine la mediana de cada una , intérprete. ¿Qué diferencias observa?


Mediana MPG city Mediada MPG highway

21,0 28,0

Las diferencias que se pueden hallar entre la mediana de cada una de estas es que dado
que la mediana es el punto medio en un conjunto, para MPG City su mediana es menor a la
del otro conjunto, también se puede observar que para el segundo conjunto que es MPG
Highway su media y su mediana se encuentran en puntos cercanos, lo que nos permite ver
que se trata de un conjunto más simétrico, y que también para esta su punto medio es más
alto.

C. ¿Qué conjunto de mediciones presenta mayor variabilidad? ¿qué medida de dispersión


permite hacer esta comparación?
Coeficiente de Variación MPG city Coeficiente de Variación MPG highway

25,127% 18,3309%

El conjunto que presenta mayor variabilidad es el de MPG City dado que para este su
coeficiente de variación es más alto y por tanto presenta una dispersión mucho valor ya que
estos dos términos se relacionan entre sí. De este sabemos que la medida de dispersión
que permite esa esta comparación es el coeficiente de variación.

D. ¿Cuál es la forma que contiene cada conjunto de datos? ¿Qué diferencias y semejanzas
obversa entre ambos? Justifique.

MPG city
MPG highway

Medidas MPG city MPG highway

Sesgo Estandarizado 6,71035 4,84211

Curtosis 4,00431 2,6142

Curtosis Estandarizada 7,88248 5,14606

SEMEJANZAS: Las gráficas nos permiten observar que para ambos conjuntos hay un
sesgo estandarizado alto que presenta una dirección hacia la derecha de los datos, esto
posiblemente se deba a que en los datos hay algunos que no se presentan de forma normal
con respecto a la media, también gracias a la curtosis estandarizada se puede observar que
estos datos superan el rango normal que se ubica entre -2 y +2.

DIFERENCIAS: En cuanto a diferencias podemos notar que para el conjunto de MPG City,
tanto su sesgo como su curtosis estandarizadas son mayores que el conjunto MPG
Highway, haciendo de esta manera que el primer conjunto presente más simetría.
E. Trace un diagrama de cajas y bigotes para cada MPG. Al comparar los diagramas de
caja, ¿Qué conclusiones puede presentar de ellos ? En la interpretación tener en cuenta el
análisis de los cuartiles

MEDIDAS MPG city MPG Highway


Mediana 21,0 28,0

Cuartil Inferior 18,0 26,0

Cuartil superior 25,0 31,0

Rango intercuartílico 7,0 5,0

Podemos concluir que en cuanto a gráficos los dos conjuntos presentan bastante similitud,
con una mediana superior para el segundo conjunto, los cuartiles para los dos conjuntos
presentan medidas entre el inferior y el superior similares, ya que para los dos sus cuartiles
tiene una diferencia de 6,0. Y también se puede observar que se presentan datos atípicos.

2. Para la variable MPG City realice:


A. Realice un análisis descriptivo en donde se identifiquen datos atípicos mediante la
técnica de análisis de datos atípicos que contiene el paquete Statgraphics

Identificación de Valores Atípicos - MPG City

Datos/Variable: MPG City (miles per gallon in city driving)


93 valores con rango desde 15,0 a 46,0
Número de valores actualmente excluidos: 0

Prueba de Grubbs' (asume normalidad)


Estadístico de prueba = 4,20555
Valor-P = 0,000926817

Este análisis identifica y trata posibles valores aberrantes en muestras de poblaciones


normales. La parte superior de la página muestra los estimados comunes de la media y la
desviación estándar, junto con estimados diseñados para ser resistentes a observaciones
aberrantes. Por ejemplo, para los 93 valores de MPG City, la media y sigma son 22,3656 y
5,61981, respectivamente. Los correspondientes estimados Winsorizados, en los cuales se
ha reemplazado el 15,0% de los valores más grandes y más pequeños con valores del
interior de la muestra, son 22,0215 y 5,42612. Note el impacto de los estimados
Winsorizados sobre el intervalo de confianza para la media.

La tabla en la mitad de la salida muestra los valores más pequeños y los más grandes de
MPG City. Los valores Estudentizados miden a cuántas desviaciones estándar se
encuentra cada valor de la media muestral de 22,3656. El valor más extremo se encuentra
en la fila 39, el cual es 4,20555 desviaciones estándar de la media. Puesto que el valor-P
para la prueba de Grubb es menor que 0,05, ese valor es un aberrante significativo con un
nivel de significancia del 5,0%, asumiendo que todos los demás valores siguen una
distribución normal. Se muestran calificaciones similares al calcular las estadísticas
muestrales después de eliminar cada punto, uno a la vez, al igual que cuando la media y la
desviación estándar están basadas en la desviación absoluta de la mediana (DAM).
Valores de las calificaciones modificadas mayores que 3,5 en valor absoluto, de las cuales
hay 3, bien podrían ser observaciones aberrantes.
B. Realice supresión de los datos atípicos y realice un nuevo análisis de la variable, que
diferencia observa respecto al análisis de ítem a.
Resumen estadístico para MPG City

Recuento 90

Promedio 21,7

Mediana 21

Desviación estándar 430%

Coef. De variación 20%

Mínimo 15

Máximo 33

Rango 18

Sesgo Estandarizado 289,58

La diferencia y un análisis claro que podemos observar respecto al ítem A y B según las
gráficas sería que en el A los valores tienen una mayor dispersión y esto hace que los
resultados no sean tan precisos como lo notamos en las gráficas del punto B los cuales
están más cercanos.

C. Con qué conjunto de datos Ud. considera que podría tener mejores resultados, los
obtenidos en el ítem a o en el ítem b
Se considera que con el conjunto de de datos del ítem B se podría tener mejores
resultados, dado que según los valores que se puede observar en las gráficas del ítem A los
valores se encuentran dispersos y esto podría ocasionar así mismo una dispersión de
información dentro de los resultados ya que merma su nivel de exactitud, por otra parte en
las gráficas del ítem B se puede observar que no existe tanta dispersión en los datos por lo
que se puede deducir que los resultados pueden llegar a ser más confiables.

También podría gustarte