Está en la página 1de 45

ORGANIZACIÓN Y PRESENTACIÓN DE DATOS

ORGANIZACIÓN DE DATOS NUMÉRICOS:


cuando se recolecta una serie de datos, generalmente, las observaciones numéricas no se disponen en ningún orden o secuencia en
particular.
los métodos más comúnmente utilizados para organizar las observaciones son: la clasificación ordenada y el diagrama de tallo y
hojas.
CLASIFICACIÓN ORDENADA:
consiste en ordenar los datos sin procesar desde el valor mas pequeño hasta el mas grande y así facilitar la evaluación de sus
principales características.
DIAGRAMA DE TALLO Y HOJAS:
un diagrama de tallos y hojas es una forma de organización y presentación de medidas en un formato de gráficas de barras
jerárquicamente ordenado. se trata de una técnica común en el análisis exploratorio de datos.
cada reglón es una posición de tallo y cada dígito de la derecha es una hoja.
El procedimiento para realizar es primero empezar con los tallos, es decir la columna de la izquierda, y después, dato por dato, ir
llenando las hojas a la derecha de la línea vertical, en el otro tronco correspondiente.
• EJEMPLO. EN UN EXAMEN DE MATEMÁTICAS FUERON OBTENIDAS DE LA
SIGUIENTE CALIFICACIONES (0 A 100):
• 78 93 61 100 70 83 88 74 97 72
• 66 73 76 81 83 64 91 70 77 86
• ELABORE UN DIAGRAMA DE TALLO Y HOJAS.
• en cada uno de los datos se separan las decenas de las unidades. es decir el número 78 se verá
como 7|8. de esta manera las decenas se podrán en una columna, en forma vertical, y las
unidades a su derecha:
• 6 146
• 7 00234678
• 8 13368
• 9 137
• 10 0
• TABLAS
  DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS DISCRETAS.
• 1. En la primera columna, se muestran los diferentes valores que toma la variable cuantitativa
discreta(
• 2. En la segunda columna se muestran las frecuencias absolutas ( que representan el número de
veces que se repite cada uno de los valores en el conjunto de datos.
• 3. en la tercera columna, se muestran las frecuencias relativas () que representan la proporción de
cada uno de los valores en el conjunto de datos.
• 4. En la cuarta columna, se muestran las frecuencias absolutas acumuladas ( que se obtienen así:
=++…….+ a partir de la definición
5. En la quinta columna, se muestran las frecuencias relativas acumuladas( que se obtienen así
=++…….+ a partir de la definición
• TABLA N°: 01
• TITULO: DISTRIBUCIÓN DE FRECUENCIAS PARA LA VARIABLE CUANTITATIVA DISCRETA.

VALORES FRECUENCIAS FRECUENCIAS FRECUENCIAS FRECUENCIAS


OBSERVADOS ABSOLUTAS RELATIVAS ABSOLUTAS RELATIVAS
ACUMULADAS ACUMULADAS

. . . . .

. . . . .

n 1

TOTAL n 1

FUENTE:
GRÁFICO DE LÍNEAS O BASTONES
• UN ESTUDIANTE DEL CURSO DE ESTADÍSTICA, DE LA UNIVERSIDAD NACIONAL
PEDRO RUIZ GALLO, APLICO RECIENTEMENTE UNA ENCUESTA EN 34 HOGARES
DE UNA URBANIZACIÓN CERCANA A SU DOMICILIO. UNA DE LAS PREGUNTAS FUE
CERCA DEL NÚMERO DE PERSONAS QUE CONFORMAN EL HOGAR DEL
ENTREVISTADO, LAS RESPUESTAS FUERON LAS SIGUIENTES.
5 1 6 3 1 4 3 6 3 6 5 1 2 1 4 2 5

2 1 5 3 1 1 4 4 4 4 6 4 6 1 3 3 5

CONSTRUYA UNA TABLA DE FRECUENCIAS


QUÉ PROPORCIÓN DE HOGARES ESTA CONFORMADO POR TRES O MAS PERSONAS
QUÉ PORCENTAJE DE HOGARES ESTÁ CONFORMADO POR CINCO O MÁS PERSONAS
Tabla n°: 01
Titulo: DISTRIBUCIÓN DE FRECUENCIAS SEGÚN EL NUMERO DE PERSONAS QUE CONFORMAN EL
HOGAR EN LA URB. LA PRIMAVERA- CHICLAYO 2020.
NÚMERO DE FRECUENCIAS FRECUENCIAS FRECUENCIAS FRECUENCIAS
PERONAS ABSOLUTAS RELATIVAS ABSOLUTAS RELATIVAS
ACUMULADAS ACUMULADAS
1 8 0.23529 8 0.23529

2 3 0.08824 11 0.32353

3 6 0.17647 17 0.50000

4 7 0.20588 24 0.70588

5 5 0.14706 29 0.85294

6 5 0.14706 34 1

TOTAL 34 1

Fuente: ELABORACIÓN PROPIA- VTAS


Gráfico de líneas o bastones
• TABLAS
  DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS CONTINUAS. (INTERVALOS)
• Se emplean para presentar la distribución de un conjunto de datos cuando la variable de estudio es
cuantitativa continua o cuando la variable de estudio es cuantitativa discreta con muchos datos y la mayoría
diferentes.
• En la primera columna, se muestran los datos agrupados en K intervalos de clase
• En la segunda columna, se muestran los puntos medios de los intervalos (que son conocidos como marcas de
clase y se calculan de la siguiente manera:

En la tercera columna, se muestran las frecuencias absolutas que representan el número de observaciones que
caen dentro del intervalo en el conjunto de datos.
En la cuarta columna, se muestran las frecuencias relativas () que representan la proporción de observaciones
que caen dentro del intervalo en el conjunto de datos.
En la quinta columna, se muestran las frecuencias absolutas acumuladas ( que se obtienen así:
=++…….+ a partir de la definición
En la sexta columna, se muestran las frecuencias relativas acumuladas( que se obtienen así
=++…….+ a partir de la definición
A continuación, se presenta una tabla de frecuencias por intervalos:
Tabla N°
TITULO:
INTERVALOS VALORES FRECUENCI FRECUENCI FRECUENCI FRECUENCI
DE CLASES OBSERVADO AS AS AS AS
S ABSOLUTAS RELATIVAS ABSOLUTAS RELATIVAS
ACUMULAD ACUMULAD
AS AS
>
>
. . . . . .
. . . . . .
.. .. .. .. .. ..
nn 11
TOTAL n 1

FUENTE:
•  PASO 1. CALCULAR EL RANGO (R)

PASO 2. CALCULAR EL NÚMERO DE CLASES O INTERVALOS (K)


K= 1+3.3*log(n); DONDE: n= tamaño de la muestra.
log n= logaritmo en base 10 de n
PASO 3. CALCULAR LA AMPLITUD DEL INTERVALO DE CLASE (C)

si la amplitud del intervalo es un número entero, entonces se trabaja con el número calculado; si no se redondea
por exceso de acuerdo con el número de decimales del conjunto de datos.
Para el redondeo, tener en cuenta lo siguiente:
Si los datos son números enteros, entonces la amplitud del intervalo tiene que ser un número entero si los datos
tienen un decimal, entonces la amplitud del intervalo tiene que tener un decimal, y así sucesivamente.
Por ejemplo, suponga que el valor de C es 6.2603 y los datos tienen dos decimales, entonces C también tendrá
dos decimales y su valor redondeado por exceso será igual a 6.27.
•  PASO 4. CALCULAR LOS LIMITES DE LOS INTERVALOS

.
.
.

PASO 5. CONSTRUIR LAS COLUMNAS DE LAS FRECUENCIAS CORRESPONDIENTES.


EJEMPLO 4.1
UN GRUPO DE ESTUDIANTES DE ECONOMÍA DE LA UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO
OBTUVO INFORMACIÓN SOBRE LA INVERSIÓN ANUAL ( EN MILES DE SOLES) DE 50 PYMES. LOS
RESULTADOS OBTENIDOS SE MUESTRAN A CONTINUACIÓN:
4.128 4.128 10.472 12.375 15.330 17.863 18.036 18.036 18.868 19.004

20.342 21.901 21.901 22.929 23.277 23.594 24.654 24.654 24.727 24.727

25.065 25.779 26.573 26.904 27.495 27.620 27.727 28.040 28.205 28.342

28.956 29.546 29.625 30.573 31.300 31.437 31.913 31.913 33.071 33.071

33.563 34.254 34.254 35.202 36.055 37.345 39.297 39.297 41.137 46.607

a) Construya una tabla de frecuencias.


b) Grafique un histograma y un polígono de frecuencias.
c) Calcule el porcentaje de empresas que tienen una inversión menor de 28404 soles.
d) Calcule el porcentaje de empresas que tienen una inversión por lo menos 34473 soles.
SOLUCIÓN

a)   sea:
X= inversión anual (en miles de soles)
Paso 1. cálculo del rango

Paso 2. cálculo del número de clases o intervalos.

Paso 3. cálculo de la amplitud de los intervalos.

El valor de la amplitud se redondea por exceso con tres decimales porque los datos tienen tres decimales.
Paso 4. cálculo de los limites de los intervalos

.
.
[
• PASO 5. CONSTRUCCIÓN DE LAS COLUMNAS CORRESPONDIENTES
• TABLA N°02
• TITULO:

INVERSIÓN
ANUAL Xi fi hi Fi Hi hi% Hi%
[4.128, 10.197> 771.625 2 0.04 2 0.04 4% 4%
[10.197, 16.266> 13.2315 3 0.06 5 0.10 6% 10%
[16.266, 22.335> 19.3005 8 0.16 13 0.26 16% 26%
[22.335, 28.404> 25.3695 17 0.34 30 0.60 34% 60%
[28.404,34.473> 31.4385 13 0.26 43 0.86 26% 86%
[34.473, 40.542> 37.5075 5 0.10 48 0.96 10% 96%
[40.542,46.611> 43.5765 2 0.04 50 1 4% 100%
TOTAL 50 1 100%

• FUENTE:
HISTOGRAMA
CUADRO N°
18
TITULO
17

16

14
13

12

10

8
8

6
5

4
3

2 2
2

0
4.13 10.2 16.27 22.34 28.4 34.47 40.54 46.61

FUENTE:
POLIGONO
CUADRO N°
TITULO
18
17
16

14
13
12

10

8 8

6
5
4
3
2 2 2

0
4.13 10.2 16.27 22.34 28.4 34.47 40.54 46.61
¿CALCULE EL PORCENTAJE DE EMPRESAS QUE TIENEN UNA INVERSIÓN MENOR DE
28.404 SOLES?
• el porcentaje de empresas que tienen una inversión menor de 28.404 soles es 60%
¿ CALCULE EL PORCENTAJE DE EMPRESAS QUE TIENEN UNA INVERSIÓN POR LO
MENOS DE 34.473 SOLES?
• el porcentaje de empresas que tienen una inversión de por menos 34. 473soles es 14%.

EJEMPLO:
EN EL AULA DE ESTADISTICA, EN EL HORARIO DE 7:00 A.M A 9:00 A.M, SE REGISTRÓ
EL TIEMPO (EN MINUTOS) QUE TARDARON LOS ESTUDIANTES EN LLEGAR A
CLASES. LOS RESULTADOS OBTENIDOS SE MUESTRAN EN EL SIGUIENTE
HISTOGRAMA:
HISTOGRAMA DE LOS TIEMPOS QUE TARDARON LOS
ESTUDIANTES EN LLEGAR A CLASES.
14
13

12

10
10

6
6

4
3
2
2
1

0
0;5 5 ; 10 10 ; 15 15 ; 20 20 ; 25 25 ; 30

a) Construya la tabla de frecuencias


b) Calcule el porcentaje de estudiantes que llegan a los más con 12 minutos de tardanza.
c) Calcule el porcentaje de estudiantes que tienen entre 7 y 18 minutos de tardanza.
d) Si el docente del curso empezó la clase con el 45% de los estudiantes presentes, ¿cuál es el tiempo máximo
que esperó para empezar la clase?
CUADRO N°……
TITULO: Distribución de frecuencias de los tiempos que tardaron los estudiantes en
llegar a clases.
Tiempo (en minutos) fi hi Fi Hi
0;5 13 0.371 13 0.371
5 ; 10 10 0.286 23 0.657
10 ; 15 6 0.171 29 0.828
15 ; 20 3 0.086 32 0.914
20 ; 25 2 0.057 34 0.971
25 ; 30 1 0.029 35 1
Total 35 1

b) Como no se conoce el porcentaje en el intervalo [10 ; 12], entonces se interpola en el intervalo [10 ; 15 >

X%

0 5 10 12 15

2
5
•  DE DONDE:

• LUEGO.

POR LO TANTO, EL PORCENTAJE DE ESTUDIANTES QUE LLEGAN A LO MÁS CON 12


MINUTOS DE TARDANZA ES 72.54%
28.6% 17.1% 8.6%
X% Y%
5 7 10 15 18 20
3 2

5 5
•  CÁLCULO DE X:

• LUEGO:

CÁLCULO DE Y:

LUEGO:

POR LO TANTO, EL TIEMPO MÁXIMO QUE EL DOCENTE ESPERÓ PARA EMPEZAR LA


CLASE ES DE 6.38 MINUTOS.
• EL
  TIEMPO MÁXIMO PARA PERTENECER AL 45% DE LOS ESTUDIANTES QUE
ESPERÓ EL DOCENTE PARA EMPEZAR LA CLASE SE ENCUEN5TRA EN EL SEGUNDO
INTERVALO [5, 10 >, ENTONCES SE INTERPOLA EN ESTE INTERVALO.
45%
37.1% 28.6% 17.1%
X% 7.9%

0 5 X 10 15
X-5

5
DE DONDE:

LUEGO: X=6.38
POR LO TANTO, EL TIEMPO MÁXIMO QUE EL DOCENTE ESPERÓ PARA EMPEZAR LA CLASE ES
MEDIDAS DE TENDENCIA CENTRAL
Medidas de
Resumen

Medidas de Medidas de Medidas de la Medidas de


posición dispersión forma Concentración

Desviación
Medidas de Coeficiente de
Medidas de estándar, varianza Coeficiente de
tendencia no asimetría de
tendencia central y coeficiente de curtosis
central Pearson
variación

Media, mediana,
moda, media Cuartiles, deciles
ponderada, y y percentiles
media total
•  MEDIA ARITMÉTICA (
también llamada promedio aritmético. es la medida mas utilizada. conocida y fácil de interpretar.
Cálculo de la media aritmética para dato no agrupados.
Se realiza dividiendo la suma de todos los valores que toma la variable entre el número total de
valores.

Ejemplo: si una pequeña empresa tienen un total de cinco empleados a su cargo y sus remuneraciones
son: 800, 890, 950, 970 y 990 soles, calcule la remuneración promedio de los trabajadores.
X= remuneración de los empleados
=990

La remuneración promedio de todos los empleados de la pequeña empresa es 920 soles.


• Cálculo
  de la media aritmética para dato no agrupados.
suponga que se tiene la siguiente tabla de frecuencias:

Intervalos Xi fi
[67 , 74> 70.5 6
[74 , 81> 77.5 5
[81 , 88> 84.5 10
[88 , 95> 91.5 8
[95 , 102> 98.5 16
[102 , 109> 105.5 3
[109 , 116> 112.5 2
Total 50

también se puede calcular de la siguiente manera:


• MEDIANA
  (me):
La mediana es el valor que se encuentran en el centro del conjunto de datos, cuyos valores se hallan ordenados
en forma ascendente(descendente). El 50% de los datos se encuentra a la izquierda de la mediana y el otro 50%
se encuentra a la derecha.
Cálculo de la mediana para datos no agrupados:
cuando el numero de datos es impar, la mediana se calcula de la siguiente manera:

Ejemplo. La empresa tienen 5 operadores cuyos ingresos son 800,890,950,970 y 990 soles. Calcule la
mediana.
Sea la variable:
X= ingreso de los operadores
=990
Como n=5 (impar)

Esto quiere decir la mediana ocupa la tercera posición en el conjunto de datos. Luego:
=950
•cuando
  el numero de datos (n) es par, la mediana se calcula de la siguiente manera:
La mediana es la semisuma de los dos valores centrales, es decir.

Donde:

• Cálculo de la mediana para datos agrupados:

Donde:
=limite inferior del intervalo donde se encuentra la mediana
C= amplitud del intervalo
= frecuencias absoluta acumulada del intervalo anterior donde se encuentra la mediana.
=frecuencia absoluta simple del intervalo donde se encuentra la mediana
=posición que ocupa la mediana en el conjunto de datos
•  EJEMPLO:
Ahorro (soles)
[430 ; 500> 2 2
[500 ; 570> 12 14
[570 ; 640> 16 30
[640 ; 710> 10 40
[710 ; 780> 5 45
Total 45

EL 50% DE LOS CLIENTES TIENE UN AHORRO MENSUAL DE A LO MÁS


607.1875 SOLES.
VENTAJAS: fácil de calcular e interpretar, la mediana no se ve afectada por valores
extremos.
DESVENTAJAS: para su cálculo no se utilizan todas las observaciones del conjunto
de datos.
•• MODA
  (mo):
• LA MODA ES EL VALOR MÁS QUE MÁS SE REPITE EN EL CONJUNTO DE DATOS.
• cálculo de la moda para datos no agrupados:
Ejemplo: ventas de latas de espárragos vendidas dentro de la semana.
91 92 94 95 95 95 95 95 95 96
la moda es 95.
cálculo de la moda para datos agrupados:

Donde:
Donde:
=limite inferior del intervalo donde se encuentra la moda
C= amplitud del intervalo
=frecuencia absoluta simple del intervalo donde se encuentra la moda.
= frecuencia absoluta del intervalo anterior donde se encuentra la moda
= frecuencia absoluta del intervalo posterior donde se encuentra la moda
Observación:
La mayor frecuencia absoluta corresponde al intervalo donde se encuentra la moda.
Ejemplo:

Ahorro (soles)
[430 ; 500> 2
[500
[500 ;; 570>
570> 12
12
[570
[570 ;; 640>
640> 16
16
[640
[640 ;; 710>
710> 10
10
[710 ; 780> 5
[710 ; 780> 5
Total 45
Total 45

  , =10

  =598

  =
Interpretación
  ==16 – 10=6 El ahorro mensual más frecuente de los clientes es 598 soles.
• RELACIÓN
  ENTRE LA MEDIA ARITMÉTICA, MEDIANA Y MODA.
si la distribución se extiende más hacia la izquierda, se cumple que:

La distribución presenta asimetría negativa.


si la distribución se extiende más hacia la derecha, se cumple que:

La distribución presenta asimetría positiva.


La distribución presenta es simétrica.

MEDIA PONDERADA Y MEDIA TOTAL


Media ponderada
La media ponderada constituye un caso especial de la media aritmética y se calcula cuando la variable toma
valores que se repiten varias veces. Para un conjunto de datos: con pesos o ponderaciones: , la media ponderada
se define de la siguiente manera:

donde :
•EJEMPLO
 
• A CONTINUACIÓN SE MUESTRAN LAS CALIFICACIONES, CON SUS RESPECTIVOS CRÉDITOS, QUE OBTUVO
UN ESTUDIANTE DE LA ESPECIALIDAD DE ADMINISTRACIÓN EN EL QUINTO CICLO DE ESTUDIOS:

Curso Calificación Créditos


Marketing 16 4
Estadística 13 3
Realidad Nacional 15 2
Economía 14 5
Contabilidad 12 5

Calcule la calificación promedio ponderada.

la calificación promedio ponderada obtenida por el estudiante es 13.84.


Media
•   total (
La media total es útil cuando se conocen las medias y los tamaños de varias muestras, y es de interés calcular la media de
todas las muestras juntas. La formula es la siguiente:

Donde:

EJEMPLO:
el gerente de una entidad bancaria sabe que, en el último mes, el ahorro promedio mensual de 45 clientes en la sucursal 1
fue 611.22 soles y el ahorro promedio mensual de 55 clientes en la sucursal 2 fue de 652.67 soles. Calcule el ahorro
promedio mensual en ambas sucursales.
Sucursal 1
Sucursal 2 El ahorro promedio mensual de los clientes es 634.02 soles
MEDIDAS DE TENDENCIA NO CENTRAL
•  CUARTILES ():
los cuartiles son tres valores (que divide al conjunto de datos en cuatro partes iguales. Estos son:
25% 25% 25% 25%

DECILES ():
los deciles son nueve valores (que dividen al conjunto de datos en 10 partes iguales.
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%

D1 D2 D3 D4 D5 D6 D7 D8 D9
PERCENTILES ():
los deciles son noventa y nueve valores (que dividen al conjunto de datos en 100 partes iguales. 1% 1%
1%
PERCENTIL DECIL CUARTIL
•  CÁLCULO DE PERCENTILES PARA DATOS AGRUPADOS

CÁLCULO DE CUARTILES PARA DATOS AGRUPADOS

CÁLCULO DE LOS DECILES PARA DATOS AGRUPADOS


• LA
  SIGUIENTE TABLA MUESTRA LA DISTRIBUCIÓN DE SALARIOS ANUALES DE 65 EMPLEADOS
DE CIERTA EMPRESA TRANSNACIONAL. Marca de clase (en Número de
Intervalos (miles miles de nuevos empleados fi
de soles) soles) xi
50 ; 60 55 8
60 ; 70 65 10
70 ; 80 75 16
80 ; 90 85 14
90 ; 100 95 10
100 ; 110 105 5
110 ; 120 115 2
65

• HALLAR EL CUARTIL 1:
• REEMPLAZANDO
  EN LA FORMULA :

EL 25% DE LOS EMPLEADOS GANAN SALARIOS INFERIORES O IGUALES A 68.250 NUEVOS


SOLES ANUALES Y EL 75% GANAN SALARIOS SUPERIORES A 68.250 NUEVOS SOLES
ANUALES.
• PERCENTIL 60:

REEMPLAZANDO EN LA FORMULA:

EL 60% DE LOS EMPLEADOS GANAN SALARIOS INFERIORES O IGUALES A 83.57 NUEVOS


SOLES ANUALES Y EL 40% GANAN SALARIOS SUPERIORES A 83.57 NUEVOS SOLES ANUALES.
•  DECIL 9:

REEMPLAZANDO EN LA FORMULA:

EL 90% DE LOS EMPLEADOS GANAN SALARIOS INFERIORES O IGUALES A 83.57


NUEVOS SOLES ANUALES Y EL 10% GANAN SALARIOS SUPERIORES A 101 NUEVOS
SOLES ANUALES.
MEDIDAS DE VARIABILIDAD, ASIMETRÍA Y CURTOSIS
• MEDIDAS
  DE VARIABILIDAD O DISPERSIÓN
RANGO INTERCUARTILICO (RI):
EL RANGO INTERCUARTILICO es el resultado de la diferencia entre los cuartiles, tres es el rango en el que se encuentra
el 50% central de los datos.

EJEMPLO: tenemos el

VARIANZA MUESTRAL
Cálculo de la varianza muestral se realiza de la misma manera que la varianza poblacional, pero en vez de dividir la suma de
los cuadrados de las desviaciones entre el tamaño de la muestra n, se divide entre n-1.
Cálculo de la varianza muestral para datos no agrupados.
•  
cálculo de la varianza muestral para datos agrupados.

Desviación estándar muestral (S)

Coeficiente de varición (cv)


Este coeficiente se utiliza cuando desea comparar la variabilidad entre dos o más conjuntos de datos, incluso
cuando las unidades de medidas son diferentes. El coeficiente de variación se puede expresar en porcentaje para
una mejor interpretación.
•  se realizo un estudio sobre dos marcas de zapatillas A Y B con el objeto de determinar cuál de ellas tiene un
mejor programa de control de calidad sobre el desgaste de su producto. Para esto, se tomó dos muestras por
cada marca y se controló el número de horas de uso hasta que se detectara un desgaste significativo. Los
Marca
resultados se presentan a91continuación.
90 83 92 78 93 91
A
(horas)
Marca B 87 60 101 83 105 77
(horas)

¿cuál de las dos marcas de zapatillas tiene un mejor programa de control de calidad sobre el desgaste?

Se puede observar que la marca A tiene un tiempo promedio de duración mayor que la marca B
=88.29,
=30.36 5
•Se  puede observar que la marca B tiene un tiempo promedio de duración mayor que la marca B

=88.29,
=270.3

como se puede observar, el es menor que el lo que quiere decir que los tiempos de degastes de las
zapatillas de la marca A son más homogéneos (se registran degastes similares ) en comparación con los
tiempos de degastes de las zapatillas de la marca B, lo cual indica que esta marca tienen el mejor programa
de control de calidad sobre el desgaste de sus zapatillas.
• ASIMETRÍA:
  para describir la forma solo necesitamos comparar la media y la mediana. Si estas dos mediciones
son iguales, por lo general podemos considerar que los datos son simétricos. Si la media excede a la mediana los
datos pueden describirse de sesgo positivo o sesgo a la derecha. Si la media es menor que la mediana, estos datos
pueden llamarse de sesgo negativos o sesgo a la izquierda.
El coeficiente de asimetría muestral:

Si es igual a cero, indica que los datos se distribuyen en forma simétrica (media igual a la mediana)
Si es mayor que cero, se dice los datos se distribuyen en forma asimétrica positiva o sesgada ala derecha (media
mayor a la mediana).
Si es menor que cero, se dice que los datos se distribuyen en forma asimétrica negativa o sesgada a la izquierda
(media menor a la mediana).
• CURTOSIS
El coeficiente de curtosis.
Analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución.
Se define tres tipos de distribuciones.
Distr. Mesocúrtica. presentan un grado de concentración medio alrededor de los valores centrales de la variable
(distribución normal).
Distr. Leptocúrtica. Presentan grado de concentración alrededor de los valores centrales de la variable.
Distr. Platicúrtica. Presentan un reducido grado de concentración alrededor de los valores centrales de la variable.
•COEFICIENTE
  DE CURTOSIS:

Además:
Si < 0.263, entonces la distribución es leptocúrtica.
Si = 0.263, entonces la distribución es mesocúrtica.
Si , entonces la distribución es platicúrtica.
Ejemplo:

Por lo tanto, el coeficiente de curtosis es:

Como se dice que la distribución es leptocurtica.

También podría gustarte