Documentos de Académico
Documentos de Profesional
Documentos de Cultura
normalmente. Para hacer esto pueden calcular e interpretar cada una de las
Como primera medida se define una distribución normal o distribución gaussiana como aquella
cuya función de densidad de datos tiene forma acampana y es simétrica con respecto a medidas
Para encontrar o verificar si una distribución es normal o no, emergen dos caminos posibles el
análisis dato a dato con medidas de dispersión para datos no agrupados, ó la agrupación en una
tabla de frecuencia a través de intervalos, debido a que no se busca un valor estadístico puntual,
sino que es una distribución continua, cada uno de los métodos proveerá una conclusión acertada
medidas.
PRICE
Rango=Dato mayor−Dato
menor
Rango=70755−8639=62116
¿ Intervalos=1+3.322∗log n
3( Media−mediana)
Sesgo= desviación estandar
3(21426,1393−18915.3568)
Sesgo= 9915,055925 =0,75 96
Analizando el sesgo, podemos ver la desviación hacia la derecha de los datos comparándolos
con la campana estándar de una distribución normal
B.LA CURTOSIS: Es una característica de forma, relativa a la distribución, usando el método
del Fisher para datos agrupados, se presentan y analizan los siguientes casos:
∑ )fi ( mix
−media
α=
=5,9241
n (desviación)4
Analizando la curtosis, podemos ver un pico mucho más agudo, es decir que la mayoría de los
datos están ubicados cerca al z=0, tomado como eje de referencia
C. Gráfica de la curva normal (q-q plot)
Para llevar nuestros datos a la media y referencia de un sistema normal se siguió el procedimiento
•
Ordenamiento y numeración de todos los datos
•
Cambio al sistema normal mediante la función de distribución normal estándar inversa aplicada
a argumentos de la forma (i-0.5/n) siendo i la posición numérica del dato
curva normal de dispersión generada, otro argumento más para concluir que no es una
distribución normal
D. La regla empírica: esta regla se basa en la conclusión experimental, que expone que en una
puede ser estimado bajo las siguientes premisas. Al no cumplirse una de ellas la distribución
• ´x+ 2 s≥ 95 % ≥ ´x−2 s
• ´x+ 3 s≥ 97 % ≥ ´x−3 s
Comprobación
E. ¿Es correcto proponer intervalos de confianza o pruebas de hipótesis con la variable price?
de estos datos puede dejar un gran margen de error probabilístico en la variable a analizar en
Millaje
Rango=Dato mayor−Dato
menor
Rango=50387−266=50121
¿ Intervalos=1+3.322∗log n
Siendo n el número de datos; 804
¿ Intervalos=1+3.322∗log 804 ≈ 10
rango
Amplitud =
¿ intervalos
50121
Amplitud = ≈5013
10
• Media: ∑
Xmi∗fi = 19837,89925
n
• Mediana: lim inf + Amplitud∗( −F(i −1))=¿ 20737.59031
2
• Desviación 2
−x´ ) ∗fi n
estándar
∑( x
√
mi
= 8295,477995
Las anteriores sirven como medidas de tendencia que nos ayudan a entender el comportamiento de la
distribución en este punto, es posible afirmar que la distribución presentada es una distribución normal
debido a la posición de la mediana y la media, las cuales se encuentras cerca la una de la otra y del punto
de referencia, sin embargo, un análisis a profundidad de las siguientes medidas es fundamental para el
entendimiento de esta.
3( Media−mediana)
Sesgo= desviación estandar
3(19837,89925−20737.5)
Sesgo= 8295,477995 =−0,3253
Analizando el sesgo, podemos ver la desviación ligera hacia la izquierda de los datos
comparándolos con la campana estándar de una distribución normal, entraría en la tolerancia
estimada para considerar a esta distribución como normal
B.LA CURTOSIS: Es una característica de forma, relativa a la distribución, usando el método
del Fisher para datos agrupados, se presentan y analizan los siguientes casos:
∑ )fi ( mix
−media
α=
=2,96
n (desviación)4
Analizando la curtosis, podemos ver un pico cercano a la distribución normal, es decir que la
mayoría de los datos están ubicados cerca al z=0, manteniendo su simetría al eje de referencia
distribución normal
normal de dispersión generada, otro argumento más para concluir que es una distribución
normal
C.La regla empírica: esta regla se basa en la conclusión experimental, que expone que en una
puede ser estimado bajo las siguientes premisas. Al no cumplirse una de ellas la distribución no
•
´x+ s ≥ 68 % ≥ ´x−s
•
´x+ 2 s≥ 95 % ≥ ´x−2 s
•
´x+ 3 s≥ 97 % ≥ ´x−3 s
Comprobación
Estos valores estarían ubicados en promedio desde parcialmente el intervalo 4 hasta parcialmente el
intervalo 7, al hacer la frecuencia relativa acumulada fue de un 68.7% pero reconociendo que con las
aproximaciones puede dar mucho menor, se concluye que tiene una tendencia de distribución normal
F. ¿Es correcto proponer intervalos de confianza o pruebas de hipótesis con la variable price?
Sería correcto ya que daría datos acertados, debido a que esta distribución puede
hacerse usando los datos de la primera distribución para este se plantea un porcentaje de error del
10% y una confiabilidad del 95% seguido a esto seleccionar a la muestra de forma aleatoria
805× s 2 × 1,962
n=
2
850 × ( 0.1×19837.89 ) + × 2
(1.96)
(s 2
N=86,22
se usa una selección aleatoria de 87 datos los cuales se obtienen al multiplicar la cantidad de
datos totales por la varianza por el valor tabular de nuestro nivel de confiabilidad y dividirlo
entre los datos totales multiplicados por nuestro porcentaje error por la media obtenida,
sumándole la varianza multiplicada por nuestro valor tabular del porcentaje de error .
¿ Intervalos=1+3.322∗log 804 ≈ 10
rango
Amplitud =
¿ intervalos
62116
Amplitud = ≈ 6212
10
• Media: ∑
Xmi∗fi = 21426,1393
n
• Mediana: lim inf + Amplitud∗( −F(i −1))=¿ 18915.3568
2
• Desviación −x´
estándar
= 9915,055925
∑( 2
√
x ) ∗fi n
mi
Las anteriores sirven como medidas de tendencia que nos ayudan a entender el comportamiento de la
distribución en este punto, es posible afirmar que la distribución presentada NO es una distribución
normal debido a la posición de la mediana y la media, sin embargo, un análisis a profundidad de las
siguientes medidas es fundamental para el entendimiento de esta.