Está en la página 1de 30

ESTADÍSTICA DESCRIPTIVA

CON UNA VARIABLE

Capitulo 2

Estadística Descriptiva con una Variable


2.1 ANTECEDENTES
Al analizar un conjunto de datos a nivel Univariado, debemos determinar primero
si tenemos una muestra o una población como fuente de la información y que tipo
de variable es, eso determinara los métodos estadísticos que usemos como las
conclusiones que saquemos. Utilizamos métodos de la estadística descriptiva para
resumir o describir las características importantes de un conjunto conocido de
datos.
Entre los métodos que veremos están, las Tablas de Frecuencias o una distribución
de frecuencias, Medidas de Tendencia Central, Medidas de Dispersión y la
fluctuación alrededor de valores medios que comprende las medidas de asimetria.
Tanto para un conjunto de datos agrupado o no agrupado.

1
Estadística Descriptiva con una Variable

2.2 TABLAS DE FRECUENCIA (Cualitativas y Cuantitativas)


Una Distribución de Frecuencias es una tabla (cualitativa o cuantitativa),
donde se registra él número de veces que son observados sus valores
correspondiente a cada clase, además de una ponderación porcentual que
nos permitirá hacer comparaciones entre muestras o poblaciones
parecidas.
Dependiendo del tipo de variable, la estructura de estas tablas cambia o
aumenta en la información que debe ser descrita.

Estadística Descriptiva con una Variable


Caso para variables cualitativas Nominales,
En la tabla se detallan las respuestas posibles de la variable, en orden
ascendente o descendente en función de su ocurrencia. Para describir las
mediciones será necesario precisar:
- El número de niveles posibles en la variable, Atributos de la variable A(i).
- La frecuencia absoluta en cada atributo n(i), que es el numero de veces
que el nivel “i” es observado o que aparece en la serie. Dando como
resultado el efectivo total de observaciones.
- Las frecuencias relativas por cada atributo, h(i) que es igual a n(i)/N,
eficacia del nivel dividido por el efectivo total. Es una cifra entre 0 y 100
que se expresa en %.

2
Estadística Descriptiva con una Variable
Tabla de frecuencias de la Variable Nominal:
Atributos de la Frecuencia Frecuencia
Variable (Ai) Absoluta (ni) Para describir la tabla de frecuencias
Relativa (hi%)
A1 n1 h1 de tipo Nominal, es necesario en un
A2 n2 h2 primer paso ordenar los atributos en
A3 n3 h3 función de las frecuencias absolutas,
…,, …,, …,,
de forma ascendente o descendente,
…,, …,, …,,
de manera que el atributo con la
Ai ni hi
mayor frecuencia estará al inicio o final
Total: Σ (ni)=N Σ (hi)=100%
de la tabla de frecuencias, lo que nos
permite a simple vista entender cual es el atributo con mayor cantidad de
casos y cual el que presenta la menor cantidad de casos.
5

Estadística Descriptiva con una Variable


En un segundo paso se hace referencia en la interpretación el atributo
con la mayor y menor frecuencia, con sus valores de frecuencia
absoluta y relativa correspondiente.

Después se procede con el grafico, que se denomina: Diagrama


Circular, que es una figura en forma de pastel cuyas piezas
representan las divisiones de una cantidad total (en función de las
frecuencias absolutas y/o frecuencias relativas) para facilitar su
comparación.

3
Estadística Descriptiva con una Variable
Ejercicios de Aplicación:
Al momento de realizar una construcción estos Ladrilladores / canteros 152
son los datos recogidos de proyectos anteriores Carpinteros 113
según la ocupación o participación que tuvieron Construcción 1057
los obreros. El objetivo es crear un grupo de Electricistas 548
trabajo del cual usted es el Jefe, pero solo Vidrieros 100
puede contratar 21 personas, ¿Cuál seria la Pintores y acabado 453
forma de conformar este grupo en base a estos
Plomeros 379
datos?, analice los datos.

Estadística Descriptiva con una Variable


Solución:
Frecuencia Frecuencia
La tabla de frecuencias queda Ocupación (Ai)
Absoluta (ni) Relativa (hi)
de la siguiente manera: Construcción 1057 37,7%
Electricistas 548 19,6%
Pintores y acabado 453 16,2%
Donde la variable nominal es
Plomeros 379 13,5%
la actividad que realizan los
Ladrilladores/canteros 152 5,4%
obreros dentro del proyecto.
Carpinteros 113 4,0%
Vidrieros 100 3,6%
“h1=(n1/N)=(1057/2802)*100%= 37,7%”
Total: 2802 100%

4
Estadística Descriptiva con una Variable
Diagrama Circular: Interpretación:
De acuerdo con los resultados,
para conformar un grupo de 21
obreros en las diferentes
actividades, se deben considerar:
8 obreros para construcción, 4
obreros como electricistas; 3
obreros como pintores, 3 obreros
como plomeros, 1 obrero para
ladrilleros, 1 carpintero y 1
vidriero.

Estadística Descriptiva con una Variable


Ejercicio propuesto:
El Departamento de Transporte publico datos que mencionan el numero
de quejas de pasajeros en las líneas aéreas que operan en cierto país.
Tipo de queja Número Tipo de queja Número
Publicidad 68 Problemas de vuelo 2031
Equipaje 1421 Sobreventa 454
Servicio al Cliente 1715 Devoluciones 1106
Discapacidad 477 Reservaciones 1159
Tarifas 523 Otros 322
Estadística Elemental, Johnson & Kuby, 11raEd. 2012

Realice la Tabla de Frecuencias, su interpretación y grafica.


Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 10

5
8/3/2021

Estadística Descriptiva con una Variable


Caso para variables Ordinales,
Para describir las mediciones de una variable cualitativa ordinal será
necesario precisar:
- Los niveles en la variable o sus Atributos A(i).
- La frecuencia absoluta en cada atributo, n(i).
- La frecuencia absoluta acumulada a cada nivel de la variable, N(i)= Σ n(i).
- Las frecuencias relativas por cada atributo, h(i).
- La frecuencia relativa acumulada a cada nivel de la variable, H(i) = Σ h(i).

11

Estadística Descriptiva con una Variable


Tabla de frecuencias de la Variable Ordinal:

Atributos de la Frecuencia Frec. Acum. Frecuencia Frec. Acum.


Variable (Ai) Absoluta (ni) Absoluta (Ni) Relativa (hi%) Relativa (Hi%)
A1 n1 N1 = n1 h1 H1 = h1
A2 n2 N2 = N1+ n2 h2 H2 = H1 + h2
A3 n3 N3 = N2+ n3 h3 H3 = H2 + h3
…,, …,, …,, …,, …,,
…,, …,, …,, …,, …,,
Ai ni Σ (ni) = N hi Σ (hi) = 100%
Total: Σ (ni) = N Σ (hi) = 100%

12

6
Estadística Descriptiva con una Variable
Para describir la tabla de frecuencias Ordinal, debido a que la tabla ya
presenta un orden en la variable se debe hacer mención al atributo con la
mayor y menor frecuencia simple absoluta o relativa.

En el caso de las frecuencias acumuladas se debe considerar aquel atributo


que contenga más del 50% de las observaciones, especificando que a lo
más el atributo alcanza esta categoría (si la tabla es ascendente), y al
menos si el atributo alcanzara en su categoría como mínimo ese valor (si la
tabla es descendente).

Gráficamente se expresa con un, Diagrama de Barras, que es una figura de


dos ejes que representa en las abscisas a los atributos ordenados de la
variable, y en las ordenadas a las frecuencias absolutas o relativas simples.

13 13

Estadística Descriptiva con una Variable

Ejercicios de Aplicación:
Investigadores han realizado una encuesta a los compradores sobre si los
comerciantes hacen o no emisión de las facturas. Los resultados de esta
encuesta se presenta el siguiente cuadro resumen:
Si lo hacen 16
Probablemente si 15
No esta seguro 30
Probablemente no 40
No lo hacen 60

14

7
Estadística Descriptiva con una Variable
Solución:
La tabla de frecuencias queda de la siguiente manera:
Donde la variable ordinal es el grado de cumplimiento en la emisión de
facturas,
Emisión de Facturas Frecuencia Frec. Acum. Frecuencia Frec. Acum.
(Ai) Absoluta (ni) Absoluta (Ni) Relativa (hi) Relativa (Hi)
No lo hacen 60 60 37,3% 37,3%
h1= n1 / N * 100%
Probablemente no 40 100 24,8% 62,1%
h1= 60/161*100% No esta seguro 30 130 18,6% 80,7%
h1= 37,3% Probablemente si 15 145 9,3% 90,1%
Si lo hacen 16 161 9,9% 100,0%
Total: 161 100%

15

Estadística Descriptiva con una Variable


Diagrama de Barras: Interpretación:
De acuerdo con los resultados:
- La mayor parte de los
comerciantes no hacen emisión de
las facturas, en un 37,27% de los
casos.
- La menor parte de los
comerciantes probablemente si
hacen emisión de las facturas, en el
9,3% de los casos.
- La mayoría de los comerciantes no
hacen emisión de facturas, a lo más
en un 62,1% de los casos.
16

8
Estadística Descriptiva con una Variable
Ejercicio propuesto:
Un restaurante utiliza un cuestionario para preguntar a sus clientes cómo
califican el servicio, la calidad de los alimentos, los precios y el ambiente.
Cada característica se califica en una escala de excepcional (O), muy bueno
(V), bueno (G), promedio (A) y malo (P). Use la estadística descriptiva para
resumir los datos siguientes. ¿Qué piensa sobre las calificaciones de la
calidad en el restaurante? G O V G A O V O V G O V A
V O P V O G A O O O G O V
V A G O V P V O O G O O V
O G A O V O O G V A G
Realice la Tabla de Frecuencias, su interpretación y grafica.

17

Estadística Descriptiva con una Variable


Caso para una Variable Cuantitativa Discreta o Continua,
En el caso anterior con variables cualitativas existía lo que eran los
atributos de la variable, ahora con las variables cuantitativas veremos los
Intervalos de Clase, que son rangos de valores incluidos dentro de una
clase, que representan a los datos observados, con un limite inferior
cerrado y un limite superior abierto.

Para representar a los datos pueden ser necesarios varios intervalos o


rangos (menos de 20), todo dependerá de la cantidad de datos que se
observen.

18

9
Estadística Descriptiva con una Variable
Para efectos de cálculo, para lograr intervalos de clase de igual distancia,
aunque no es una condición ya que estos intervalos puedes construirlos con
diferentes rangos, se tiene a continuación las siguientes formulas iniciales se
emplean para construir la tabla de frecuencias con intervalos constantes:

- Numero de Intervalos de Clases:


NI= 1 + 3,3 Log(N), numero de intervalos agrupados (Regla de Sturges).
- Amplitud del Intervalo de Clase:
A= (Valor Max. Observado–Valor Min. Observado)/(NI) , NI valor entero.
NOTA: El valor de la amplitud depende de la cantidad de decimales que
presenten los datos para ser utilizada.

19

Estadística Descriptiva con una Variable


En el caso de datos distribuidos en forma notoriamente no uniforme,
como los datos del sueldo anual para una amplia variedad de ocupaciones,
pueden ser requeridos intervalos desiguales de clase. En este caso, los
intervalos de clase mayores se utilizan para los rangos de valores con
relativamente escasas observaciones.

Como en el caso de una variable cualitativa ordinal se tiene la siguiente


tabla, más una nueva columna que expresa el valor medio de cada
intervalo, denominado Marca de Clase, de acuerdo con la siguiente
descripción:

20

10
Estadística Descriptiva con una Variable

Intervalo de Marca de Clase Frecuencia Frec. Acum. Frecuencia Frec. Acum.


Clase (Ci) (Mi) Absoluta (ni) Absoluta (Ni) Relativa (hi) Relativa (Hi)

[V Inicial – L1[ M1=Prom(C1) n1 N1=n1 h1 H1=h1


[L1 – L2[ M2=Prom(C2) n2 N2=N1+n2 h2 H2=H1+h2
[L2 – L3[ M3=Prom(C3) n3 N3=N2+n3 h3 H3=H2+h3
…,, …,, …,, …,, …,, …,,
…,, …,, …,, …,, …,, …,,
[Li-1 – V Final] Mi ni Σ (ni)=N hi Σ (hi)=100%
Total: Σ (ni) Σ (hi)=100%

21

Estadística Descriptiva con una Variable


La frecuencia absoluta serán el numero de observaciones que estén
dentro del intervalo, en un sentido exclusivo (todos las observaciones
corresponden a un único intervalo) y exhaustivo (todos tienen un intervalo
de clase). Las frecuencias relativas son aquellas cuyo numero de
observaciones asociadas con cada clase se ha divido entre el numero total
de observaciones de toda la distribución.
De este modo, cada frecuencia relativa es una proporción, la cual puede
convertirse en un porcentaje multiplicándola por 100. En la interpretación
se debe hacer mención aquel intervalo que presenta la mayor y menor
frecuencia absoluta o relativa.

22 22

11
Estadística Descriptiva con una Variable
En cambio, la distribución de frecuencias absolutas y relativas acumuladas,
identifica el número acumulado de observaciones incluidas bajo el límite exacto de
cada intervalo de clase de la distribución.
En la interpretación se debe hacer mención aquel intervalo que contenga más del
50% de las observaciones en su frecuencia relativa acumulada, explicando que A
LO MÁS en la mayoría de las observaciones se pueden observar valores que están
por debajo del limite superior de dicho intervalo.
Para representar gráficamente a la tabla se tiene el Histograma, que es una figura
de dos ejes que representa en el eje "X" a los intervalos de clase, y el eje "Y" a las
frecuencias simples absolutas o relativas. Las barras deben dibujarse juntas ya que
la variable es continua y no existen vacios entre los intervalos.

23 23

Estadística Descriptiva con una Variable

Ejercicio de Aplicación: 8 38 15 46 35
Crear la tabla de frecuencias para los 24 19 13 38 15
datos que señalan el tiempo que tarda 35 41 31 30 40
la pizzería en entregar un pedido, 15 16 31 42 21
donde la regla es de no sobrepasar los 32 48 36 50 32
30 minutos, y por cada minuto de 22 44 22 34 23
retraso 10% de descuento, ¿Como está
26 28 28 27 24
el servicio de entrega?
33 32 16 26 13
12 12 9 37 47
50 25 34 46 49

24

12
Estadística Descriptiva con una Variable
Solución: La tabla de frecuencias debe ser construida a partir de:
- Numero de Intervalos = NI = 1 + 3,3*log (50) = 6,61 = 7 [intervalos]
- Amplitud del Intervalo = (50 – 8) / 7 = 6 [minutos]
Intervalo de Marca de Frecuencia Frec. Acum. Frecuencia Frec. Acum.
Clase (Ci) Clase (Mi) Absoluta (ni) Absoluta (Ni) Relativa (hi) Relativa (Hi)
[ 8 – 14 ( 11 6 6 12% 12%
[ 14 – 20 ( 17 6 12 12% 24%
[ 20 – 26 ( 23 7 19 14% 38%
[ 26 – 32 ( 29 8 27 16% 54%
[ 32 – 38 ( 35 10 37 20% 74%
[ 38 – 44 ( 41 5 42 10% 84%
[ 44 – 50 ] 47 8 50 16% 100%
Total: Σ (ni) = 50 Σ (hi)=100%

25

Estadística Descriptiva con una Variable

Interpretación:
- La mayor parte de los pedidos, se los entrega entre 32 a 37 minutos, ellos
son 10 casos que presentan el 20%.
- La menor parte de los pedidos, presentan un tiempo de entrega de 38 a
43 minutos, son 5 casos o el 10%.
- De acuerdo con la tabla de frecuencias, mayores a 30 minutos son 23
casos, de hasta 50 minutos, que representan aquellas ordenes con
descuento, estos son el 46% del total. El servicio es deficiente.

26

13
Estadística Descriptiva con una Variable

El Histograma:

Se observa en la grafica que no existe una simetría en los datos, por lo


que el tiempo de entrega tiene una tendencia a ser mayor (ascendente)

27

Estadística Descriptiva con una Variable

2.3 MEDIDAS DE TENDENCIA CENTRAL


El objetivo es, resumir en una cifra la tendencia central o posición de una
serie estadística para una variable cuantitativa.

Utilizamos las herramientas de la estadística descriptiva para entender


mejor a un conjunto de datos por medio de sus características.

28

14
Estadística Descriptiva con una Variable
Media Aritmética, es la suma de los valores del grupo de datos entre el
número de observaciones.

Media de la población:

Media de la muestra:

La diferencia entre las dos expresiones pasa por la terminología respecto a la


muestra y a la población como grupo de estudio, luego son similares.

29

Estadística Descriptiva con una Variable


Propiedades de la Media:
1. Si todos los valores observados son iguales, entonces la media es igual a
esa constante. M(X) = M(ctte) = ctte
2. Si a cada valor de las observaciones se le suma o resta una constante, la
media del nuevo conjunto de valores es igual a la media original
aumentada o disminuida por dicha constante.
M(y) = M(X ± ctte) = ctte ± M(x)
3. Si a cada valor de las observaciones se le multiplica una constante, la
media del nuevo conjunto de valores es igual a la media original
multiplicada por dicha constante. M(y) = M(X * ctte) = ctte * M(x)
4. La suma de las diferencias entre cada valor observado y la media aritmética
es igual a cero. ∑ ( X – M(x) ) = 0

30

15
Estadística Descriptiva con una Variable

Mediana, La mediana de un grupo de elementos es el valor intermedio


cuando todos los elementos del grupo siguen, en términos de valor, un
orden ascendente o descendente:

Moda, La moda es el valor que ocurre más frecuentemente en un


conjunto de valores, este tipo distribución se conoce como unimodal.
Cuando dos valores son los mas frecuentes se llama bimodal.

31

Estadística Descriptiva con una Variable

Ejercicio de Aplicación: Según estudios realizados por una compañía para


determinar si un nuevo proceso de fabricación de vigas es superior a un
proceso antiguo, se instalaron dispositivos de prueba en base a un valor
referencial, si las longitudes no sobrepasa el valor de 9,5 [cm] entonces se
considera un proceso bueno. Analice los datos a través de la media,
mediana y moda. Proceso Antiguo [cm]: Proceso Nuevo [cm]:
9,98 10,12 9,84 10,55 9,70 9,19 10,05 8,82 10,05 9,48
10,26 10,05 10,15 10,26 8,72 9,63 8,82 8,65 10,12 9,64
10,05 9,80 10,02 9,97 9,98 10,10 9,43 8,51 9,49 9,35
10,26 10,15 9,80 9,87 8,72 9,70 10,05 9,14 9,37 9,54
10,03 10,00 9,73 9,55 8,80 10,09 9,85 9,75 8,83 9,36
8,05 9,87 10,01 9,95 9,84 9,60 9,27 8,78 9,39 8,68

32

16
Estadística Descriptiva con una Variable
Solución: Respecto a la Media aritmética,

𝑋𝑖 294,08
𝑋= = = 9,803 𝑃𝑟𝑜𝑐𝑒𝑠𝑜 𝐴𝑛𝑡𝑖𝑔𝑢𝑜
𝑛 30

𝑋𝑖 282,73
𝑋= = = 9,424 𝑃𝑟𝑜𝑐𝑒𝑠𝑜 𝑁𝑢𝑒𝑣𝑜
𝑛 30

Interpretación: De acuerdo con los resultados de las medias aritméticas en


cada uno de los proceso, podemos concluir que el Nuevo presenta
mejores resultados, ya que su media es mucho menor a 9,5 [cm] que el
proceso antiguo.

33

Estadística Descriptiva con una Variable


Respecto de la Mediana y la Moda:
Proceso Antiguo;
8,05 9,73 9,87 10,01 10,15 𝑋15 + 𝑋16 9,97 + 9,98
𝑀𝑒𝑑𝑎𝑛𝑡𝑖𝑔𝑢𝑜 = 𝑋( 30 +1 ) = 𝑋15,5 = = = 9,975
8,72 9,8 9,95 10,02 10,15 2 2 2 2
8,72 9,8 9,97 10,03 10,26
8,8 9,84 9,98 10,05 10,26
9,55 9,84 9,98 10,05 10,26 𝑀𝑜𝑑𝑎 = 10,26 𝑠𝑒 𝑟𝑒𝑝𝑖𝑡𝑒 3 𝑣𝑒𝑐𝑒𝑠
9,7 9,87 10 10,12 10,55

Proceso Nuevo; 𝑋15 + 𝑋16 9,43 + 9,48


8,51 8,83 9,37 9,6 10,05 𝑀𝑒𝑑𝑛𝑢𝑒𝑣𝑜 = 𝑋( 30 +1 ) = 𝑋15,5 = = = 9,455
2 2 2 2
8,65 9,14 9,39 9,63 10,05
8,68 9,19 9,43 9,64 10,05
8,78 9,27 9,48 9,7 10,09
𝑀𝑜𝑑𝑎 = 10,05 (𝑠𝑒 𝑟𝑒𝑝𝑖𝑡𝑒 3 𝑣𝑒𝑐𝑒𝑠)
8,82 9,35 9,49 9,75 10,10
8,82 9,36 9,54 9,85 10,12

34

17
Estadística Descriptiva con una Variable
Interpretación:
De acuerdo con los resultados de la mediana, podemos concluir que el
valor que presenta el proceso antiguo con el 50% de los datos es 9,98[cm],
en cambio para el proceso nuevo es de 9,46 [cm].
Confirmando de esta manera que el proceso nuevo presenta valores
menores a 9,5 [cm].

Para el caso de la moda el que más se aproxima a 9,5 [cm] es el proceso


nuevo, con una moda igual a 10,05 [cm].

35

Estadística Descriptiva con una Variable

En el caso de las tablas de frecuencia, o datos agrupados, el calculo de la


media, mediana y moda se realiza con las siguientes formulas:
MCi (ni ) MCi (hi )
Media Ponderada  Xp   
N 100%

N 
  Ni1 
Mediana  Med  L i1  A. 2 
 Ni  Ni1 
 
para el intervalo que contiene el 50% de los datos en Hi.

Moda  MCi , presente con la mayor frecuencia ni

36

18
Estadística Descriptiva con una Variable
Ejercicio de Aplicación: Para la tabla de frecuencias el tiempo que tarda la
pizzería en entregar, calcular la media, mediana y moda:

Me
Mo

37

Estadística Descriptiva con una Variable


Solución:
1. Con las Marcas de clase y las Frecuencias relativas calculamos:
MCi (hi ) 11 * 12% 17 * 12% 47 * 16%
MediaTabla  Xp      ....   29,84  30min
100% 100% 100% 100%

2. La mediana se calcula como:

 25  19 
Mediana  Med  26  6.   30,5  31min
 27  19 
3. La moda:
Moda  35[min], la mayor frecuencia es : n5  10

38

19
Estadística Descriptiva con una Variable
Interpretación:
De acuerdo con la tabla de frecuencias, el tiempo medio de entrega es de
30 [min], con una mediana de 31 [min] y la moda igual 35 [min], lo cual
demuestra una asimetría negativa, es decir la mayor parte de los datos
son valores por encima de la media, concluyendo que el tiempo de
entrega es muy alto, o por encima de lo esperado.

39

Estadística Descriptiva con una Variable


2.4 RELACIÓN ENTRE MEDIA, MEDIANA Y MODA
En toda distribución simétrica, la media, mediana y moda coinciden en
valor. En una distribución asimétrica positiva, la media siempre es mayor
que la mediana, y en una distribución asimétrica negativa, la media
siempre es menor que la mediana. Estas dos últimas relaciones son
siempre verdaderas, si la distribución es unímodal.

40

20
Estadística Descriptiva con una Variable

Moda < Mediana < Media Media = Mediana = Moda Media < Mediana < Moda
Asimetría Positiva Simetría Asimetría Negativa
(La mayoría de los datos ( La mayoría de los datos (La mayoría de los datos
están por debajo de la media) están alrededor de la media) están por encima de la media)

41

Estadística Descriptiva con una Variable


Para nuestro ejemplo tenemos en el proceso antiguo:
Media=9,803 < Mediana=9,975 < Moda = 10,26

En el proceso nuevo tenemos:


Media=9,424 < Mediana=9,455 < Moda = 10,05

Ambos procesos tienen una asimetría negativa por lo que la mayoría de


sus datos presentan valores por encima de la media.

42

21
Estadística Descriptiva con una Variable
2.5 MEDIDAS DE DISPERSIÓN
Son complementarias de las de posición en el sentido que señalan la
dispersión en conjunto de todos los datos de la distribución respecto de la
medida o medidas de localización adoptadas.

Las medidas de tendencia central descritas anteriormente son útiles para


la identificación del valor “representativo” de un grupo de valores, ahora
las medidas de variabilidad o dispersión, se ocupan de la descripción de la
variabilidad alrededor de estos valores.

43

Estadística Descriptiva con una Variable


Rango, El rango mide la dispersión en función de la diferencia del valor
más alto de la distribución y el más bajo, con lo que el valor que resulte de
tal diferencia medirá el recorrido de los datos: Rango  Valormax  Valor
min

Rango Inter-cuartil, para el calculo de este rango solo se considera el 50%


de los datos que están al alrededor de la mediana. Primero se deben
calcular los cuartiles: Q1 (primer cuartil)  X n 1 Q3 ( tercer cuartil)  X  3n 1 
 
44  4 4
   

Una vez determinado estos valores se procede con el calculo, como se


observa en la expresión siguiente: RIQ  Q3  Q1

44

22
Estadística Descriptiva con una Variable
Varianza, Se asemeja a la desviación media absoluta en que se basa en la
diferencia entre cada valor del conjunto de datos y la media del grupo.
Pero con un aspecto importante: cada diferencia se eleva al cuadrado
antes de sumarse. En el caso de la población, la varianza se representa
con:
 
2  ( X  )2 ó
 
2  X 2  N 2 , varianza de la población
N N

El denominador de la formula de la varianza muestral es un tanto distinto.


En esencia, a fin de lograr que la varianza muestral sea un estimador in
sesgado de la varianza de la población se toman (n-1) observaciones:

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 45

Estadística Descriptiva con una Variable

S 2

(X  X ) 2
ó S 2

X 2
 nX 2 , varianza de la muestra
n 1 n 1
Para el caso de la Desviación Estándar se tiene las siguientes expresiones:

A nivel poblacional:   X 2
 N 2
N
A nivel muestral:
S 
X 2
 nX 2
n 1

46

23
Estadística Descriptiva con una Variable
Propiedades de la Varianza:
1. La varianza de un conjunto de observaciones, es un numero no negativo.
( V(x) >= 0 )
2. La varianza de una constante es cero. Es decir, cuando las observaciones
no varían. ( V(ctte) = 0 )
3. Si a cada observación se suma o resta una constante, la varianza del
nuevo conjunto de valores es igual a la varianza original.
V(y) = V(x ± ctte) = V(x)
4. Si a cada observación se multiplica una constante, la varianza del nuevo
conjunto de valores es igual a la varianza original multiplicada por el
cuadrado de la constante. V(y) = V(x * ctte) = (ctte)^2 V(x)

47

Estadística Descriptiva con una Variable

Coeficiente de Variación, El coeficiente de variación (CV) indica la magnitud


relativa de la desviación estándar en comparación con la media de la
distribución de las medias, expresada como porcentaje. Así tenemos:

48

24
Estadística Descriptiva con una Variable
Ejercicio de Aplicación:
De acuerdo con los datos de las vigas, se pide calcular la variación presente
en las observaciones y de esta forma medir el grado de ajuste en la
producción (menor a 9,5 [cm]):

8,05 9,73 9,87 10,01 10,15 8,51 8,83 9,37 9,6 10,05
8,72 9,8 9,95 10,02 10,15 8,65 9,14 9,39 9,63 10,05
8,72 9,8 9,97 10,03 10,26 8,68 9,19 9,43 9,64 10,05
8,8 9,84 9,98 10,05 10,26 8,78 9,27 9,48 9,7 10,09
9,55 9,84 9,98 10,05 10,26 8,82 9,35 9,49 9,75 10,10
9,7 9,87 10 10,12 10,55 8,82 9,36 9,54 9,85 10,12

49

Estadística Descriptiva con una Variable


Las estadísticas de la dispersión en el proceso Antiguo son:
Rango  10 ,55  8,05  2 ,5
Q1  9 ,8 Q3  10 ,05
RIQ  10 ,05  9.8  0 ,25
Varianza  0 ,292
Desviación  0 ,54

En la calculadora utilizar la opción:


MODE -> STAT -> 1-VAR -> \x\ -> SHIFT 1 (VAR) o OPTN (3)

50

25
Estadística Descriptiva con una Variable

Interpretación:
De acuerdo con los resultados, los datos de las vigas en el proceso antiguo,
respecto de sus longitudes, pueden variar de una a la otra en un máximo
de 2,5 cm (Rango). Siendo la desviación promedio entre las vigas de
0,54cm (Desviación estándar). Finalmente la variación de estas vigas es:
X ± S = 9,80 ± 0,54 (cm)

De acuerdo con este rango, la mayoría de las longitudes en las vigas


tendrán valores que se espera estén entre: 9,26 a 10,34 cm.

51

Estadística Descriptiva con una Variable


Las estadísticas de la dispersión en el proceso Nuevo son:
Rango  10 ,12  8,51  1,61
Q1  9 ,14 Q3  9 ,75
RIQ  9 ,75  9.14  0 ,61
Varianza  0 ,231
Desviación  0 ,48

En la calculadora utilizar la opción:


MODE -> STAT -> 1-VAR -> \x\ -> SHIFT 1 (VAR) o OPTN (3)

52

26
Estadística Descriptiva con una Variable

Interpretación:
De acuerdo con los resultados, los datos de las vigas en el proceso nuevo,
respecto de sus longitudes, pueden variar de una a la otra en un máximo
de 1,6 cm (Rango). Siendo la desviación promedio entre las vigas de
0,48cm (Desviación estándar). Finalmente la variación de estas vigas es:
X ± S = 9,42 ± 0,48 (cm)

De acuerdo con este rango, la mayoría (68%) de las longitudes en las vigas
tendrán valores que se espera estén entre: 8,94 a 9,9 cm.

53

Estadística Descriptiva con una Variable

En el caso de las tablas de frecuencia, o datos agrupados, el calculo de los


cuartiles se realiza con las siguientes formulas:

 n  N i 1 
Q1  Li 1  A 4 , al 25% de los casos
 N i  N i 1 
 n  N i 1 
Q2  Li 1  A 2 , al 50% de los casos
 N i  N i 1 
 3n  N i 1 
Q3  Li 1  A 4 , al 75% de los casos
 N i  N i 1 

54

27
Estadística Descriptiva con una Variable

En el caso de las tablas de frecuencia, o datos agrupados, el calculo de la


varianza y desviación estándar se realiza con las siguientes formulas:

 2

 ( MC i   ) 2 . ni
  (MC i   ) 2 . ni
CV 

.100%
N N 

S2 
 ( MCi  X ) 2 . ni S
 (MC i  X ) 2 . ni CV 
S
.100%
N 1 N 1 X

55

Estadística Descriptiva con una Variable


Ejercicio de Aplicación: Para la tabla de frecuencias el tiempo que tarda la
pizzería en entregar, calcular la varianza y rango intercuartil:

Q1

Q3

56

28
Estadística Descriptiva con una Variable
Solución:  n4  N i 1   504  12 
Q
1. Los cuartiles son: 1  Li 1  A    20  6.19  12   20,43  20min 
 N i  N i 1   
 3n  N i 1   3( 50 )
 37 
Q3  Li 1  A 4     38,6  39min 
4
 38 6.
 N i  N i 1   42  37 
RIQ  Q3  Q1  39  20  19min 
2. La varianza y desviación estándar son:

S 2

 (MC
i   ) 2 . ni

 (11  30) .6  (17  30) .6  .....  (47  30) .8  136,7min 
2 2 2
2

N 50  1
S  11,7  12min 
57

Estadística Descriptiva con una Variable

2.6 MEDIDAS DE ASIMETRIA


Análisis de la Asimetría en la distribución, coeficiente Skewness:
- Asimetría negativa, La mayor parte de los datos están agrupados por
encima del promedio.
- Asimetría positiva, La mayor parte de los datos están agrupados por
debajo del promedio.
- Simetría en la distribución, La mayor parte de los datos están agrupados
al rededor promedio.
 (  ) 
3
N 
3

3  i
 
N. S 3  N 1 
 

58

29
Estadística Descriptiva con una Variable
La medida del aplastamiento con relación a la curva de Gauss (normal) mide
el alejamiento de los datos, coeficiente de Kurtosis:
- Platicúrtica, con las observaciones distribuidas en forma relativamente
pareja entre las clases,
- Leptocúrtica, afilada, con las observaciones concentradas en un estrecho
rango de valores,
- Mesocúrtica, ni plana ni afilada en términos de la distribución de los
valores observados,
 N  ( i   ) 4 
4   3
2 4 
 N  1 .S 

59

Estadística Descriptiva con una Variable


Informe de resumen de Antiguo
Prueba de normalidad de Anderson-Darling
A-cuadrado 2,82
Valor p <0,005
Media 9,8027
Desv.Est. 0,5400
Varianza 0,2916
Asimetría -1,88605
Curtosis 3,49686
N 30
Mínimo 8,0500
1er cuartil 9,7825
Mediana 9,9750
3er cuartil 10,0675
Máximo 10,5500
Intervalo de confianza de 95% para la media
8,0 8,4 8,8 9,2 9,6 10,0 10,4
9,6010 10,0043
Intervalo de confianza de 95% para la mediana
9,8400 10,0277
Intervalo de confianza de 95% para la desviación estándar
0,4301 0,7259

Intervalos de confianza de 95%

Media

Mediana

9,6 9,7 9,8 9,9 10,0

60

30

También podría gustarte