Está en la página 1de 23

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN

Julián Chura Chuquija

Huancavelica Mayo 2017

CONCEPTOS BÁSICOS

En la aplicación de los diversos procesos estadísticos es necesario tener presente cierta terminología asociada a esta ciencia para una mejor comprensión de los resultados que se obtengan con su aplicación. Ejemplo, cuando los estadísticos hacen referencia a Población, Individuo, Observación, etc., el concepto asociado a estos términos tiene un significado particular que es conveniente precisar.

Muestra

Es cualquier subconjunto de unidades elementales, elegidas de una población. Por ejemplo:

• 200 familias elegidas de una ciudad.

• 30 empresas elegidas de una región.

• 80 bombillas eléctricas elegidas de las producidas en un día.

Dependiendo de la forma como se eligen dichas unidades elementales, las muestras pueden ser:

Muestras aleatorias :

Son aquellas cuyos elementos son elegidos usando algún criterio probabilístico.

ESTADISTICA

La estadística es un término que es usado con mucha frecuencia para hacer referencia a cualquier información o datos; sin embargo, la estadística es mucho más que la simple colección de información ya que involucra todo un conjunto de procesos que tienen como objetivo alcanzar un mayor conocimiento de una realidad que es desconocida y sobre la cual se desea tomar decisiones.

Población

Es el conjunto de todas las unidades que tienen una característica común, la cual se desea estudiar. Dependiendo del número de elementos que la conforman, una población puede ser finita o infinita. Cuando se estudian uno o varios caracteres de todos los elementos de la población, se dice que se realiza un censo. Por ejemplo:

• Conjunto de familias de una ciudad.

• Conjunto de empresas de una región.

• Conjunto de bombillas eléctricas producidas en un día.

Muestras no aleatorias:

Son aquellas cuyos elementos son elegidos mediante criterios no probabilísticos.

Las ventaja de las muestras aleatorias sobre las no aleatorias es que brindan una mayor confianza que los datos recopilados no estén afectados por sesgos o factores extraños a la investigación, y por que permiten aplicar los métodos de inferencia estadística, siendo posible generalizar sus resultados a la población de donde se eligieron sus elementos. Esto último no es posible mediante la muestras no aleatorias. En lo sucesivo, al hacer referencia a una muestra, implícitamente se tendrá presente que se trata de una muestra aleatoria.

Individuo o unidad elemental

Es todo elemento que está afectado por la característica o factor que se desea estudiar. Constituye la unidad más pequeña de las poblaciones y de las muestras. Por ejemplo:

Al estudiar el ingreso familiar de una ciudad, la característica en estudio será el ingreso familiar, y cada familia de la ciudad será un individuo o unidad elemental. Al estudiar el grado de tecnificación de los empleados de una empresa, una característica en estudio podría ser el grado de instrucción, y cada empleado de la empresa será una unidad elemental o individuo.

Variable

Es todo factor o característica que puede tomar valores diferentes cuando se observa a los individuos de una muestra o población. Las variables pueden ser:

A Variables cualitativas (VC)

Son aquellas cuyos resultados no pueden ser expresadas en forma numérica. Por ejemplo:

La calidad de los artículos producidos por una empresa.

• El color de preferencia de !as personas.

• El grado de instrucción de los empleados de una empresa.

B Variables cuantitativas

Son aquellas cuyos resultados pueden ser expresados en forma numérica. Las variables cuantitativas pueden ser:

B.l Variables cuantitativas discretas. (VCD)

Son aquellas que tienen un número finito de valores posibles. Usualmente se las asocia a procesos de conteo, donde el resultado es expresado mediante un número entero. Por ejemplo:

El número de accidentes semanales en una empresa.

• El número de hijos por familia.

Observación

Es el dato o registro realizado, producto de la apreciación de una característica en un individuo o unidad elemental. Una observación puede ser cualitativa o cuantitativa. Por ejemplo:

12 milímetros, como la observación del diámetro de un perno.

900 soles, como la observación del precio de un artículo.

Bueno, como la observación de la calidad de un artículo.

Nominales: Si sus valores no se pueden ordenar.

Nacionalidad,

Fumar (Sí/No) Ordinales: Si sus valores se pueden ordenar. Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor.

Sexo,

Grupo

Sanguíneo,

Religión,

B.2 Variables cuantitativas continuas (VCC)

Son aquellas que tienen un número infinito de valores posibles y son expresados mediante números de un intervalo real. Por ejemplo:

• El peso neto de un artículo.

• El volumen de contenedor

Parámetro

Es una función de todas las observaciones de una población. Un parámetro resume la información contenida en las observaciones que comprenden a una población, por lo cual su valor es único y constituye usualmente la incógnita que todo investigador desea conocer. Los parámetros se definen también como valores constantes que caracterizan a una población. Algunos de los parámetros a los cuales se hará referencia son:

- Media poblacional, cuya notación es : u,

- Variancia poblacional, cuya notación es : 2

- Moda poblacional. cuya notación es : Mo

Promedio o media muestral, cuya notación es :

• Variancia muestral, cuya notación es : S 2

• Moda muestral, cuya notación es : mo.

X

Los valores que se obtienen al aplicar los estimadores o valores estadísticos a una muestra particular son llamados estimaciones de los valores de los parámetros. Es decir, si para una muestra se obtiene:

X = 38.12 , S 2 = 8.45 , mo

= 37.25 ,

luego, estos son las estimaciones de los parámetros definidos como: media poblacional (), variancia poblacional (2 ), y moda poblacional (Mo), respectivamente.

1.2 Estadística

Estadística es la ciencia que se ocupa de la creación, desarrollo y aplicación de técnicas, que permitan hacer una análisis confiable de una población. En términos generales, se ocupa de la colección, resumen y presentación de información, del análisis e interpretación de datos y resultados, de modo tal que pueda evaluarse la confiabilidad y riesgos asociados a las conclusiones que se puedan derivar a partir de la información captada

Valor estadístico o estimador

Es una función de las observaciones muéstrales y que no depende de parámetro alguno. Un valor estadístico o estimador define un procedimiento para resumir la información contenida en las observaciones que comprenden a una muestra. Se caracterizan por que pueden tomar valores diferentes de muestra a muestra, debido a que las observaciones captadas en muestras diferentes no son necesariamente iguales. Los valores estadísticos o estimadores son útiles por que permiten obtener estimaciones del valor de los parámetros. Algunos de los estimadores son:

Ejemplos:

1. Considere la población de todas las

computadoras laptop propiedad de los alumnos de la UNALM. Usted quiere saber el peso de la laptop.

a) Especifique la unidad de población

b) Especifique la variable de interés

Solución:

a) Laptop

b) peso

A) Estadística descriptiva

Es la rama de la estadística que se ocupa del resumen y descripción de los datos colectados; es decir, se ocupa de: la colección y clasificación de información, de su resumen en tabulaciones y de su presentación mediante cuadros y gráficos que describan en forma apropiada el comportamiento de la información captada.

Por ejemplo, cuando se hace una encuesta para estudiar la opinión del público sobre la calidad y el precio posible de un nuevo producto, con la aplicación de la estadística descriptiva seria posible entre otras cosas: clasificar las respuestas de modo tal que sea posible tener una idea general de la opinión del público; con las respuestas sobre el precio evaluar su promedio y la variabilidad de las respuestas; construir cuadros, tablas y gráficos que permitan evaluar visualmente el comportamiento de la información.

Debe tenerse presente que la estadística descriptiva es el paso inicial en un análisis estadístico, el cual concluye con el proceso de generalización o inferencia sobre la población de donde fueron tomados los datos.

B) Inferencia estadística

Es la rama de la estadística que se ocupa de los procesos de estimación, análisis y pruebas de hipótesis, con el propósito de llegar a conclusiones que brinden una adecuada base científica para la toma de decisiones, tomando como base la información muestral captada.

1.3 Etapas de un trabajo estadístico

La estadística como ciencia tiene como objetivo desarrollar procedimientos que permitan obtener conclusiones acerca de los parámetros de una población, a partir de los datos muéstrales captados. Para la aplicación objetiva y pragmática de los procedimientos y técnicas estadísticas es recomendable tener presente las siguientes etapas:

a) Definición del problema

En esta etapa debe determinarse con claridad cuales son los problemas que se presentan y cuales son los objetivos de la investigación.

d) Clasificación, análisis e interpretación

En esta etapa se clasifica a la información según sus características y se la resume mediante la aplicación de estimadores o valores estadísticos para su posterior análisis e interpretación.

e) Generalización e inferencia.

Mediante la aplicación de los métodos de inferencia estadística, las conclusiones de la investigación son generalizadas a la población de donde se obtuvo la información.

Población (toda la producción del mes)

Aleatoriamente Muestra (representativa de la producción del mes) PARAMETROS (siempre desconocidos) µ =?  =?
Aleatoriamente
Muestra (representativa de
la producción del mes)
PARAMETROS
(siempre desconocidos)
µ =?
 =?
S
ESTADISTICOS
(conocidos)
Inferencia

b) Formulación del plan de recopilación de datos.

En esta etapa debe definirse qué información se debe recopilar y cómo se debe recopilar dicha información (muestra o censo ?). El objetivo es obtener un conjunto adecuado de datos que permitan alcanzar los objetivos de la investigación.

c) Recopilación de datos

En esta etapa se recogen los datos de acuerdo a los planes establecidos en la etapa anterior, teniendo cuidado de controlar la calidad de la información que se recopila. El éxito de una investigación depende en gran parte en la calidad de los datos captados.

ORGANIZACION Y REPRESENTACION DE DATOS

Organización de datos cualitativos

Para la organización de datos cualitativos es necesario determinar el tipo de datos a procesar, según el orden en que pueden ser presentadas las respuestas en cuadros y gráficos. A los datos cualitativos que pueden ser presentados en ordenes diferentes se les llama datos cualitativos nominales, por ejemplo los colores de preferencia de las personas. A los datos cualitativos a los cuales se puede asociar algún orden en su presentación se les llama datos cualitativos jerárquicos, por ejemplo las opiniones sobre la calidad de un producto.

Ejemplo: Supongamos que la empresa DIETA S.A. Tiene interés en conocer la preferencia del publico sobre diferentes tipos de mermelada para lo cual toma una muestra aleatoria de 50 personas. Luego de clasificar las respuestas observadas, se ha obtenido por un proceso de conteo los resultados siguientes:

Preferencia sobre tipos de mermelada

Mermelada de

Frecuencia

Frecuencia

Frecuencia

preferencia

absoluta

relativa

porcentual

Durazno

11

0.22

22.0

Fresa

17

0.34

34.0

Piña

12

0.24

24.0

Manzana

10

0.20

20.0

Total

50

1.00

100.0

De manera similar las frecuencias porcentuales se obtienen dividiendo cada frecuencia absoluta entre 50 y multiplicando luego por 100; también se pueden obtener multiplicando cada frecuencia relativa por 100. Por ejemplo, para el caso de durazno, p 1 = (f 1 /50)(100) = (11/50X100)=22, o p 1 = 100 fr 1 = (100)(0.22) = 22; la frecuencia porcentual para fresa será: p 2 = (f 2 /50X100) = (17/50)(100) = 34, o p 2 = 100 fr 2 = (100)(0.34) = 34.

Preferencia sobre tipos de mermelada

40 35 30 25 20 15 10 5 0
40
35
30
25
20
15
10
5
0

Dur a z no

Fr e sa

P i ña

TIP O DE M ERM ELADA

M a nz a na

Para este caso, las frecuencias absolutas son el resultado de un proceso de conteo de las respuestas obtenidas de las 50 personas consultadas. Así por ejemplo. 11 personas respondieron que la mermelada de durazno era de su preferencia, 17 personas respondieron que preferían la mermelada de fresa, etc.

Considerando que el número total de personas consultadas es 50, las frecuencias relativas se obtienen dividiendo cada frecuencia absoluta entre 50. Por ejemplo, para el caso de durazno, su frecuencia relativa se obtiene del siguiente modo:

fr 1 = f 1 /50 = 11/50 = 0.22; para fresa, fr 2 = f 2 /50 = 17/50 = 0.34; etc.

Las frecuencias relativas y porcentuales tienen una similar interpretación, y se usan indistintamente. Por ejemplo, para el caso de durazno, la frecuencia relativa o porcentual indica que el 11% de las personas consultadas prefieren la mermelada de durazno. De manera similar se interpreta las otras frecuencias. Como puede apreciarse, la ventaja del uso de este tipo de frecuencias es que su valor brinda información sobre la incidencia de una respuesta, sin requerir del total de personas consultadas. Para un análisis más sencillo de la información es conveniente representarla mediante gráficos. Existe una gran diversidad de representaciones gráficas, siendo los más sencillos y frecuentes los gráficos de barras (verticales u horizontales) y los gráficos circulares.

Preferencia sobre tipos de mermelada

M an zan a D ur azn o 20% 22% P iñ a 24% Fr
M
an zan a
D
ur azn o
20%
22%
P
iñ a
24%
Fr
esa
34%

Preferencia sobre tipos de mermelada

M anzana Durazno 20% 22% P iña 24% Fresa
M anzana
Durazno
20%
22%
P iña
24%
Fresa

34%

Organización de datos cuantitativos discretos

Ejemplo: Supongamos que la empresa VENDE S.A. Tiene interés en conocer el comportamiento de la frecuencia de ventas de un articulo WW, para lo cual toma una muestra aleatoria de 40 días y observa el número de unidades que vende por día, considerando los siguientes resultados:

2836374856 4757465375 6458656753 7256365847
2836374856
4757465375
6458656753
7256365847

Con lo cual se tiene el siguiente cuadro de distribución de frecuencias.

Distribución del número de artículos vendidos por día

 

Frecuencia

Frecuencia

Frecuencia

Número de artículos vendidos por día

absoluta

relativa

porcentual

f i

fr i

P i

2

2

0.050

5.0

3

5

0.125

12.5

4

5

0.125

12.5

5

9

0.225

22.5

6

8

0.200

20.0

7

7

0.175

17.5

8

4

0.100

10.0

Total

40

1.000

100.0

Organización de datos cuantitativos discretos

Cuando se tiene datos cuantitativos discretos cuyo número de resultados posibles no es grande (no es mayor de 12 o 15), la información puede ser clasificada y presentada directamente sin pérdida de la identidad de la misma.

En estos casos primero se ordena la información según su magnitud, a continuación se obtiene las frecuencias absolutas asociadas a cada valor observado. Las frecuencias relativas y porcentuales se obtienen de manera similar.

Al ordenar ascendentemente los datos observados se tiene:

2233333444 4455555655 5666666667 7777778888
2233333444
4455555655
5666666667
7777778888

Distribucion del numero de articulos vendidos por dia

25 20 15 10 5 0 Porcentaje
25
20
15
10
5
0
Porcentaje

2345678

Numero de articulos vendidos por dia

Organización de datos cuantitativos continuos

Cuando se tiene información para una variable cuantitativa continua las observaciones son usualmente diferentes entre si . En estos casos los datos son clasificados de acuerdo a ciertos rangos o intervalos mutuamente excluyentes llamados intervalos de clase, para lo cual es necesario tener en cuenta: la amplitud o rango de cada intervalo y el número de intervalos que se deben generar. El objetivo es clasificar la información para una evaluación más sencilla de la misma.

2. Determinar el rango o amplitud de los datos; es decir, determinar: A = X max – X min , donde X max , es el valor de la observación de mayor magnitud y X min es el valor de la observación de menor magnitud . Determinar el tamaño de cada intervalo de clase: TIC= A/k

3. Cuando el cociente A/k no es exacto, el valor del TIC debe ser redondeado al valor superior más cercano, según las cifras decimales de los datos.

4. Generar los límites de los intervalos. Para el primer intervalo se considera como límite inferior al valor de la observación de menor magnitud; es decir, LI 1 = X min

Una vez que se ha definido los intervalos de clase, el paso siguiente consiste en clasificar cada observación en uno de dichos intervalos y determinar las frecuencias absolutas; es decir, el número de observaciones que están dentro de cada intervalo. A partir de estas frecuencias se obtienen, las frecuencias relativas y porcentuales correspondientes a cada intervalo.

Adicionalmente, cuando se dispone de datos cuantitativos continuos es conveniente obtener las frecuencias acumuladas, para lo cual se procede de la siguiente manera:

Cuando

se

utiliza

intervalos

de

igual

amplitud,

el

proceso

de

generación

de

tales

intervalos

es

el

siguiente:

 

1.

En primer lugar debe establecerse el número de intervalos que se van a utilizar. Dicho número es recomendable que esté entre 5 y 15. No existe una regla fija para determinar el número óptimo de intervalos. El criterio del investigador juega un papel importante en la determinación del mismo. Como forma de referencia se puede utilizar la regla de Sturges, la cual indica que el número de

intervalos es dado por : k= 1 + 3.322 log 10 (n), donde

es el número de observaciones disponibles. El valor de k debe ser redondeado al entero más cercano.

n

 

Los límites inferiores de los otros intervalos se obtienen hallando: LI i = LI (i-1) + TIC, para

 

i=2,3,

Los límites superiores de los intervalos se

 

obtienen hallando: LS i = LI (i+1) , para ,i=1,2, ,k-1;

o

también de la siguiente manera: LS i = LS (i-1)

+TIC , para i=2,3, ,k

 

5.

Cada uno de los intervalos (LI i , LS i ) se considera cerrado a la izquierda y abierto a la derecha; es decir, se considera desde LI i a menos de LS i . Esta regla no se aplica al último intervalo, el cual se considera cerrado a la derecha; es decir, se considera: desde LI k hasta LS k .

 
Frecuencias acumuladas absolutas: i F  f  f  f    f
Frecuencias acumuladas absolutas:
i
F  f  f  f 
 f  F  f
i
i
1
2
i
i 
1
i
i  1
Frecuencias acumuladas relativas:
i
Fr 
fr  fr  fr 
 fr  Fr
 fr
i
i
1
2
i
i 
1
i
i  1
Frecuencias acumuladas porcentuales:
i
P 
p  p  p 
 p  P  p
i
i
1
2
i
i 
1
i
i  1

Es necesario tener presente que las frecuencias están asociadas a los intervalos y no a las observaciones, como se consideró anteriormente para información cualitativa y cuantitativa discreta.

Para representar gráficamente la información se puede usar cualquier tipo de frecuencia. En especial se recomienda utilizar las frecuencias relativas o porcentuales puesto que permiten analizar la información independientemente del número de observaciones captadas, siendo además posible comparar los resultados con los obtenidos en estudios similares, siempre que los intervalos de clase sean iguales, o al menos similares.

Organización de datos cuantitativos continuos

Suponga que los datos que se presentan a continuación representan los precios del articulo WW (nuevos soles) en 40 establecimientos elegidos al azar.

5.2

10.2

7.0

7.1

10.2

8.3

9.4

9.2

5.4

8.1

6.5

7.1

6.6

7.8

6.8

7.2

8.4

9.6

8.7

7.3

8.5

5.7

6.4

10.1

8.2

9.0

7.8

8.2

7.8

6.6

5.3

6.2

9.1

8.6

7.0

7.7

8.3

7.5

9.8

7.5

De manera similar se obtienen los otros límites de clase y sus marcas de clase. Las marcas de clase son los valores representativos de la información contenida en un intervalo. Numéricamente se obtiene promediando los límites inferior y superior de cada intervalo y viene a ser una aproximación al valor promedio de las observaciones clasificadas en cada intervalo. Este valor es de importancia pues permite calcular en forma aproximada algunas medidas estadísticas.

Una vez que se han construido los intervalos de clase, se clasifican las observaciones para obtener las frecuencias absolutas y relativas.

El procedimiento descrito puede ser aplicado también cuando se tiene datos cuantitativos discretos cuyo número de resultados posibles es grande (es mayor de 20) y su representación gráfica mediante los procedimientos descritos anteriormente no resulte apropiada.

Para obtener la tabla de distribución de frecuencias se procede de la siguiente manera:

n = 40,

A = Xmax - Xmin = 10.2 - 5.2 = 5.0 ,

TIC = A/k = 5.0/6 = 0.8333 = 0.9 (redondeo por exceso, a un decimal a la misma precisión de los datos)

k= 1 + 3.322 log(40) = 6.322= 6

LI 1 = Xmin = 5.2 LI 2 = LI 1 + TIC =5.2 +0.9 = 6.1

LI 3 = LI 2 + TIC = 6.1 +0.9 = 7.0

LS 1 = LI 2 = 6.1 LS 2 = LI 3 =7.0

M 1 = (LI 1 + LS 1 )/2 = 5.65 M 2 = (LI 2 + LS 2 )/2 = 6.55

Para obtener las frecuencias acumuladas se procede de la siguiente manera:

F

1 = f 1 =

4

Fr 1 = fr 1 =

0.10

P 1 =p 1 =10.0

F

2 = F 1 + f 1 = 4 + 6 =10

 

Fr 2 = Fr 1 + fr 1 = 0.10 + 0.15 = 0.25

P 2 = P 1 + p 1 = 10.0 + 15.0 = 25

De manera similar se procede con los otros

intervalos. Con los resultados anteriores se obtiene

el siguiente cuadro de distribución de frecuencias:

Distribución de los precios de artículo WW.

Marca Frec. Frec. Frec. Frec. Precio del artículo de Clase (M i ) absoluta relativa
Marca
Frec.
Frec.
Frec.
Frec.
Precio del artículo
de
Clase
(M i )
absoluta relativa
acum.
acum.
absoluta relativa
(Intervalos de clase)
De 5.2 a menos de 6.1
De 6.1 a menos de 7.0
(f i )
(fr i )
(F i )
(Fr i )
Frec.
porcen-
tual
(P i )
Frec.
acum.
porcentual
(P i )
5.65
4
0.100
4
0.100
10.0
10.0
6.55
6
0.150
10
0.250
15.0
25.0
De 7.0 a menos de 7.9
De 7.9 a menos de 8.8
De 8.8 a menos de 9.7
7.45
12
0.300
22
0.550
30.0
55.0
8.35
9
0.225
31
0.775
22.5
77.5
9.25
5
0.125
36
0.900
12.5
90.0
De 9.7
hasta
10.6
10.15
4
0.100
40
1.000
10.0
100.0
Total
40
1.000
100.0

Donde: k=6 y n=40

Polígono de Frecuencias

Distribución de los precios del artículo WW % 35 30 25 20 15 10 5
Distribución de los precios del artículo WW
% 35
30
25
20
15
10
5
0
4.75
5.65
6.55
7.45
8.35
9.25
10.15
11.05

PRECIO DEL ARTICULO WW

MEDIDAS DE TENDENCIA CENTRAL

Cuando se dispone de un conjunto de datos una de las inquietudes de mayor interés es como resumir la información recolectada en indicadores que reflejen la forma en que los datos se agrupan o concentran alrededor de ciertos valores de una variable en estudio. El objetivo es determinar los valores que pueden ser considerados como representativos de un conjunto de datos.

Histograma de Frecuencias

Distribución de los precios del artículo WW

% 3 5 3 0 2 5 2 0 1 5 1 0 5 0
%
3
5
3
0
2
5
2
0
1
5
1
0
5
0
5.65
6.55
7.45
8.35
9.25
1 0.1 5
P R E C I O
D E L
A R T I C U LO
W W

Polígono de Frecuencias Acumuladas (curva OJIVA)

Distribución acumulativa de los precios del artículo WW

Fri 1.1 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 5.2 6.1
Fri
1.1
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
5.2
6.1
7.0
7.9
8.8
9.7

PRECIO DEL ARTICULO WW

Los valores numéricos que se toman como referencia para señalar el comportamiento de un conjunto de datos se llaman medidas de tendencia o medidas de posición, las medidas de tendencia que se usan con mayor frecuencia, son tales como el promedio aritmético, la media aritmética ponderada, la mediana, la moda, etc.

Media aritmética La media o promedio aritmético de un conjunto de datos se define como
Media aritmética
La media o promedio aritmético de un conjunto de
datos se define como la suma de todas las
observaciones dividida entre el número de
observaciones. Dependiendo de la información
disponible (poblacional o muestral) se puede tener:
N
1
Media o promedio poblacional
 
X
i
N
i  1
n
Media o promedio muestral
1
X 
X
i
n
i  1
donde:
X i = Valor de la i-ésima observación de la variable
en estudio
N = Tamaño de la población
n = Tamaño de la muestra

3.

La suma de las desviaciones de las observaciones con respecto al promedio aritmético es igual a cero.

 

n

X

i

X

n

X

i

n

X

n

X

i

n X

n

X

i

n   1

n

X

i



n

X

i

n

X

i

0

i

1

i

1

i

1

i

1

i

1

n

i

1

 

i

1

i

1

4.

La suma de los cuadrados de las desviaciones de las observaciones con respecto al promedio aritmético es menor o igual que la suma de los cuadrados de las desviaciones de las observaciones con respecto a cualquier otro valor.

 

n

n

2

donde k R

 

X

i

X

X

i

k

i

1

i

1

8.

El promedio de la suma o diferencia de dos o más variables es igual a la suma o diferencia de los promedios de las variables. Por ejemplo: Yi = Xi +

Wi - Zi; entonces,

 

Y

X W Z

 

9.

Si Yi = a + bXi; entonces,

 

Y

a b X

 

Este promedio presenta la desventaja de estar influenciado por los valores extremos; es decir, si en un conjunto de observaciones existen valores muy pequeños o muy elevados, el valor del promedio aritmético quedara influenciado por dichos valores y en

estos casos ya no será un indicador representativo de la

tendencia central de las observaciones.

Propiedades:

1. La media aritmética es un valor representativo debido a que es el centro de gravedad o punto de equilibrio de un conjunto de observaciones. 2. Si se sustituye el valor de cada observación por el valor del promedio aritmético no varia la suma de todas las observaciones.

Debido a esta propiedad, esta suma de cuadrados sirve para definir medidas de dispersión o variabilidad.

5. La media de una muestra de tamaño n es igual a la

media ponderada de dos o más submuestras, que

unidas formen la muestra original, tomando como pesos o ponderaciones a los tamaños de las submuestras

6. Si a cada observación de una muestra se le suma una constante, el promedio de las nuevas observaciones será igual al promedio de la muestra original más la constante.

7. Si a cada observación de una muestra se le multiplica por una constante, el promedio de las nuevas observaciones será igual al promedio de la muestra original multiplicado por la constante.

Cuando se tienen datos agrupados en tablas de frecuencia, el promedio aritmético puede ser calculado
Cuando se tienen datos agrupados en tablas de
frecuencia, el promedio aritmético puede ser calculado
de la siguiente manera:
k k
1
 
M
Media o promedio poblacional
fr M
f i
i
i
i
N
i
1
i 
1
k
1
Media o promedio muestral
X 
f M
i
i
n
i  1
donde:
M i = Marca de clase del i-ésimo intervalo
= Frecuencia absoluta del intervalo i.
f i
k
= Número de intervalos de clase.
N
= Tamaño de la población
n
= Tamaño de la muestra

Para el caso de datos discretos organizados en cuadros de frecuencia se debe considerar:

Media o promedio poblacional

Media o promedio muestral

k k 1    N i  1 i  1 k 1
k k
1
 
N
i
1
i 
1
k
1
X 
f X
i
i
n
i  1

f X

i

i

fr X

i

Donde:

X i = Valor observado "i" de la variable en estudio. = Frecuencia absoluta del valor observado "i"

f i

k = Número de valores diferentes observados.

i

a) Hallar el valor del precio promedio

n 1 X   X i n i  1 5.2  10.2 
n
1
X 
X
i
n
i  1
5.2 
10.2
7.0
7.5 
X 

40

311.4

40

7.785 nuevos soles

Luego, se puede expresar que el precio estimado del artículo WW es aproximadamente 7.785 soles

b) Obtener el cuadro de distribución de frecuencias hallar el valor del precio promedio.

k 1 X   f M i i n i  1
k
1
X 
f M
i
i
n
i  1

40 40

nuevos soles

X

 

4 5.65

 

6 6.55

 

4 10.15

313.3

7.8325

Ejemplo 3.1

Suponga que los datos que se presentan a

continuación representan los precios del articulo

WW (nuevos soles) en 40 establecimientos elegidos al azar.

5.2

10.2

7.0

7.1

10.2

8.3

9.4

9.2

5.4

8.1

6.5

7.1

6.6

7.8

6.8

7.2

8.4

9.6

8.7

7.3

8.5

5.7

6.4

10.1

8.2

9.0

7.8

8.2

7.8

6.6

5.3

6.2

9.1

8.6

7.0

7.7

8.3

7.5

9.8

7.5

Distribución de los precios de artículo WW.

Marca Frec. Frec. Frec. Frec. Precio del artículo de Clase (M i ) absoluta relativa
Marca
Frec.
Frec.
Frec.
Frec.
Precio del artículo
de
Clase
(M i )
absoluta relativa
acum.
acum.
absoluta relativa
(Intervalos de clase)
(f i )
(fr i )
(F i )
(Fr i )
Frec.
porcen-
tual
(P i )
Frec.
acum.
porcentual
(P i )
De 5.2 a menos de 6.1
5.65
4
0.100
4
0.100
10.0
10.0
De 6.1 a menos de 7.0
6.55
6
0.150
10
0.250
15.0
25.0
De 7.0 a menos de 7.9
7.45
12
0.300
22
0.550
30.0
55.0
De 7.9 a menos de 8.8
De 8.8 a menos de 9.7
8.35
9
0.225
31
0.775
22.5
77.5
9.25
5
0.125
36
0.900
12.5
90.0
De 9.7
hasta
10.6
10.15
4
0.100
40
1.000
10.0
100.0
Total
40
1.000
100.0

Donde: k=6 y n=40

Como puede apreciarse ambos resultados anteriores no son iguales. Esto se debe a que se esta utilizando las marcas de clase como valores representativos de las observaciones clasificadas en cada intervalo; es decir, cuando se tiene datos agrupados, el promedio aritmético se calcula asumiendo que la marca de clase es igual al promedio de las observaciones clasificadas en cada intervalo. Obviamente, en la práctica esto ocurre raras veces y por tanto el valor obtenido es una aproximación al valor del promedio aritmético que se obtiene con la suma de cada una de las observaciones.

Los

expresiones para datos sin agrupar y para datos agrupados serán iguales solamente si el promedio de las observaciones en cada intervalo es numéricamente igual a la marca de clase del respectivo intervalo.

las

valores

que

se

obtienen

al

aplicar

Este promedio es usado para el cálculo de números índices, porcentaje promedio, costo promedio, etc.; es decir, en todos aquellos casos donde las observaciones no tienen la misma importancia dentro de una población o muestra.

Ejemplo 3.2.

Suponga que los costos de producción y las cantidades producidas por tres sucursales A, B y C de una empresa son:

Este valor indica que el costo de producción promedio por artículo, para la empresa es de 1.165625 soles por cada unidad producida. Si se hubiese usado el promedio aritmético se tendría:

1.20  1.60  1.05  3.85 X  3 3
1.20
1.60
1.05 
3.85
X 
3
3

1.28333 soles

Este valor indicaría que el costo de producción promedio por artículo, de las sucursales es 1.2833 soles, bajo el supuesto que las tres sucursales producen el mismo número de artículos. Para el ejemplo este promedio no es correcto, pues no se cumple que el producto del promedio por el número de observaciones es igual al total; es decir, que el producto del promedio por la cantidad de artículos producidos sea igual al costo total de producción, el cual es 1865 soles para el ejemplo.

Media aritmética ponderada La media o promedio ponderado de un conjunto de observaciones X 2
Media aritmética ponderada
La media o promedio ponderado de un conjunto de
observaciones
X 2 ,
X
con pesos o
X 1 ,
ponderaciones W 1 , W 2 ,
,
n ,
W n se define como:
n
W X
i
i
i  1
X
P
n
W
W
W
W
1
2
n
i
i  1
donde:
X i
W i
= Valor de la i-ésima observación
= Ponderación o importancia relativa de la i-ésima
observación.

W X

1

1

W X

2

2

W X

n

n

Sucursal Costo de producción (Xi) (soles) Cantidad producida (Wi) (número de unidades) A 1.20 500
Sucursal
Costo de producción
(Xi) (soles)
Cantidad producida (Wi)
(número de unidades)
A 1.20
500
B 1.60
200
C 1.05
900
Luego, el costo de producción promedio por unidad
producida, para la empresa en su conjunto, será:
n
W X
i
i
500 1.20

200 1.60

900 1.05

1865
i 
1
n
soles
X
P 
  1.165625
n 500
200
900
1600
 W
i
i  1

n X 16001.283332053.328 soles 1865 soles

pero,

n X P 16001.1656251865

soles

Media geométrica

La

media

geométrica

de

un

conjunto

de

n

observaciones positivas X 1 , X 2 ,

X

n se define como:

X P  n X X . X 1 2 n
X P 
n X X
.
X
1
2
n
n n X i i  1
n
n
X
i
i  1

 

Este promedio es usado en la elaboración de números índices y para el cálculo de tasas promedio de variación.

Media armónica

La media armónica de un conjunto de n observaciones

X n se define

como el recíproco de la media aritmética de los

no nulas (diferentes de cero) X 1 , X 2 ,

,

recíprocos de las observaciones; es decir:

1 n X A   n n 1 1 1
1
n
X
A 
n
n
1
1
1

1

n

1

1

n

 

 

 

 

X

X

i X

 

X

 

X

 

i

1

1 i

1

1

2

n

Este promedio tiene la particularidad que los valores extremos de las observaciones (valores muy pequeños o muy elevados) afectan al promedio armónico con menor intensidad que al promedio geométrico y al promedio aritmético.

Ejemplo 3.4

Suponga que las velocidades de producción de tres obreros son 0.5, 0.625 y 0.4 horas por artículo. Hallar el tiempo promedio por artículo producido después de una jornada de 6 horas de trabajo.

Puesto que cada obrero trabaja 6 horas; luego, en la razón artículos/hora la unidad constante es el tiempo de trabajo (6 horas) por lo cual se debe usar el promedio armónico.

3 X A  1 1 1    0.5 0.625 0.4
3
X A 
1
1
1
0.5
0.625 0.4

3

6.1

0.491803

horas/articulo

esto quiere decir que en promedio se necesita 0.491803 horas por artículo producido.

Ejemplo 3.3

Suponga que una fábrica ha experimentado un incremento

de su producción del: 15% en el año 1989, 10% en 1990 y 16% en 1991. Hallar el promedio de crecimiento anual.

X P  3
X P 
3

1.151.101.161.136361

Este

resultado

indica

que

la

producción

se

ha

incrementado anualmente a un 13.6461 %.

ritmo

promedio

del

Por otro lado, la media armónica es útil para promediar razones que tienen dimensiones físicas tales como kilómetros por galón, costo por kilómetro, kilómetros por hora, etc. Con frecuencia resulta dificultoso distinguir que promedio debe utilizarse, por lo cual, como una referencia debe tenerse en

cuenta que cuando la unidad del valor constante o

unidad de evaluación es igual a la unidad del

numerador de una razón, se usa el promedio

armónico, y si es igual a la unidad del denominador se usa el promedio aritmético.

Mediana

La mediana de un conjunto de observaciones ordenadas de acuerdo a su magnitud, es el valor de la observación que ocupa la posición central de dicho conjunto. La mediana para la población se simboliza como Me y la mediana para la muestra se simboliza como me.

Características

1. La mediana divide a un conjunto de observaciones en dos partes iguales. El 50% con valores mayores a la mediana y el otro 50% con valores menores a la mediana. 2. Como medida de posición, la mediana es influenciada por el número de observaciones y no por los valores de las observaciones. 3. La suma de las desviaciones absolutas de las observaciones, con respecto a la mediana, es menor o igual a la suma de las desviaciones absolutas de las observaciones, con respecto a cualquier otro valor.

n n

 

X

i

M

e



X

i

K

, donde

K

R

i

1

i

1

Ejemplo: Si se tiene las observaciones: 5, 8, 7, 9, 6, 5, 4 En este
Ejemplo: Si se tiene las observaciones: 5, 8, 7, 9, 6, 5, 4
En este caso los datos ordenados son: 4, 5, 5, 6, 7, 8, 9
y con n =7 se tiene
m
 X
X
X
 6
1 
e
n 
7
1
4
2
2
Ejemplo: Si se tiene las observaciones: 5, 8, 7, 9, 6, 5, 4, 3
En este caso los datos ordenados son: 3, 4, 5, 5, 6, 7, 8, 9 y
con n
= 8 se tiene:
X
X
X  X
n
n
8
8
1
 1
X
 X
5
6
2
2
2
2
4
5
2
2
2
2

m

e

5.5

donde:

k = intervalo que contiene a la mediana (primer intervalo donde Fr k . 0.5). F k-1 , Fr k-1 = frecuencia acumulada (absoluta o relativa) del intervalo de clase k -1 f k , fr k = frecuencia (absoluta o relativa) del intervalo de clase k

Cálculo de la mediana 1. Para datos no agrupados. La mediana de un conjunto de
Cálculo de la mediana
1. Para datos no agrupados. La mediana de un
conjunto de n observaciones se obtiene de la
siguiente manera:
m  X
, si n es impar
e
n 1
2
 X
X n
n
1
, si n es par
2 2 
m 
e
2
2. Para datos agrupados. La mediana para datos agrupados en tablas de frecuencia se puede
2. Para datos agrupados. La mediana para datos
agrupados en tablas de frecuencia se puede
obtener utilizando las frecuencias absolutas o las
frecuencias relativas de la siguiente manera:
 n
 F
k 1
m
LI
 2
TIC
e
k
f k
 
 0.5
 Fr
k 1
m
LI
TIC
e
k
fr
k

Ejemplo Con los datos de la tabla de frecuencia del ejemplo 3.1 se tiene que el intervalo que contiene a la mediana es k=3 puesto su frecuencia acumulada relativa es mayor de 0.5 y por tanto:

m

0.5 Fr

LI

3

 

2

TIC

7.0

0.97.75

e

fr

3


 

0.3

0.5

0.25

es decir, en el 50% de establecimientos observados se encontró un precio menor a 7.75 soles y en el otro 50% observados se encontró un precio superior a 7.75 soles, aproximadamente.

MODA

La moda de un conjunto de observaciones se define como el valor, clase o categoría que ocurre con mayor frecuencia. La moda para la población se simboliza como M 0 y la moda para la muestra se simboliza como m o

Características

1.

La moda puede no existir, ó puede existir más de una moda.

2.

No se ve afectada por los valores extremos.

3.

Se aplica tanto a información cuantitativa como a información cualitativa.

4.

La moda es una medida de tendencia inestable y es difícil de estimar.

2. Para datos agrupados La moda para datos agrupados en tablas de frecuencia se obtiene
2. Para datos agrupados La moda para datos
agrupados en tablas de frecuencia se obtiene
de la siguiente manera:
d 1 
m
LI
 TIC
o
k
 d
  d
1
2
donde:
k = intervalo o clase modal
d 2 = f k – f k +1 o
o
d 2 = fr k
d 1 = fr k –fr k-1
d 1 =
f k – f k – 1
- fr k+1

Usos de la media, mediana y moda

La media se utiliza:

1.Cuando no existen valores extremos que afecten a la media. 2.Cuando se tenga que calcular otros valores estadísticos, como la variancia por ejemplo.

La mediana se utiliza:

1. Cuando se desea conocer el valor de posición central.

2. Cuando se tiene valores extremos que afectan a la media.

1. Para datos no agrupados. La moda de un conjunto de n observaciones se obtiene de la siguiente manera:

Ejemplo

Ordenando los datos se tiene: 4, 5, 5, 6, 7, 8, 9 , con lo cual la moda es m 0 = 5 pues es el valor observado que se repite

con mayor frecuencia.

Si se tiene la observaciones: 5, 8, 5, 9, 6, 5, 4, 9

Ordenando los datos se tiene: 4, 5, 5, 5, 6, 8, 9, 9 , con lo

cual se deduce que existen las modas m 01 = 5 y m 02 = 9 , siendo la primera la moda de mayor importancia puesto que es el valor de la observación de mayor frecuencia.

Ejemplo:

Si se tiene la observaciones: 5, 8, 7, 9, 6, 5, 4

Ejemplo Con los datos de la tabla de frecuencia del ejemplo 3.1 se tiene que el intervalo que contiene a la moda es k=3 puesto que es el intervalo de mayor frecuencia y por tanto:

k=3,

d,= f 3 -f 2 = 12-6 = 6.

d 2 = f 3 - f 4 = 12-9 = 3

 

LI

d

1

TIC

7.0

6

0.97.6

soles

m

o

k


d 1

d

2


  

6

3

  

Este valor indica que el precio que se ha observado con mayor frecuencia se ubica alrededor de 7.6 soles

La moda se utiliza:

1.Cuando se desea conocer el valor de la observación más frecuente. 2.Cuando se analiza variables cualitativas. 3.Cuando se desea tener una estimación rápida y aproximada.

Una relación aproximada entre la media, la mediana y la moda es la siguiente:

m X 3 X m

o

 m  X  3 X  m o e 

e

Medias Recortadas

Consiste en calcular la media aritmética sobre un subconjunto central del conjunto de datos, no considerándose una determinada proporción p por cada extremo. (p se expresa normalmente como porcentaje).

Por ejemplo, una media recortada al 40% en una secuencia de 10 datos implica no tener en cuenta ni los 4 valores menores ni los 4 valores mayores.

La media recortada al 0% es la media aritmética.

A la media recortada al 25% se la denomina centrimedia.

Otras medidas de tendencia A) Percentiles Un percentil P p es un valor que divide
Otras medidas de tendencia
A) Percentiles
Un percentil P p es un valor que divide a un conjunto
de datos en dos partes, el 100p % de ellos con
valores inferiores a P p , y el 100(1-p) % con valores
superiores a P p . Para datos agrupados en tablas de
frecuencia se obtiene de la siguiente manera:
 np F
k 1
P
LI
TIC
p
k
f k
 p Fr
k 1
P
LI
TIC
p
k
fr
k

Ejemplo Con los datos de la tabla de frecuencia del ejemplo 3.1, el valor del percentil P 0.8 o P 80 se ubica en el intervalo k = 5 puesto su frecuencia acumulada relativa es mayor de "p=0.8" y por tanto:

P

LI

0.8 Fr

4

TIC

8.8

0.8

0.775

0.98.98

soles

0.8

5


fr

5


 

0.125

es decir, en el 80% de establecimientos se observó un precio menor a 8.98 soles y en el 20% restante se observó un precio superior a 8.98 soles.

Ejemplo

Calcula la media recortada al 5% de los siguientes datos:

3, 4, 4, 5, 5, 6, 7, 8, 9, 11

El valor debe ser 6.11

Calcula la media recortada al 10% de los datos anteriores (da 6)

Calcula la centrimedia (da 5.8)

donde:

k = intervalo que contiene a la mediana (primer intervalo

donde Fr k .: > p). F k-1 , Fr k-1 = frecuencia acumulada (absoluta o relativa) del intervalo de clase k-1

f k

,

fr k

= frecuencia (absoluta o relativa) del intervalo de clase k

 

p

= 0.01, 0.02, 0.03,

,

0.99

(0<p<l)

B) Deciles y cuartiles

Son medidas de tendencia que se definen en forma similar a los percentiles. Es decir: un decil D k es un valor que divide a un conjunto de datos en dos partes, el (100)(k/10) % de ellos con valores

inferiores a Dk y el resto con valores superiores a

D k ; mientras que un cuartil Q k es un valor que divide a un conjunto de datos en dos partes, el (100)(k/4) % de ellos con valores inferiores a Q k y el restó con valores superiores a Q k . Numéricamente se tiene que:

Un decil es equivalente a:

Un cuartil es equivalente a:

D i = P i/10 , para

Qi = P i/4 , para i =1,2,3

i

=1,2,3,

,9

De lo anterior puede deducirse que

M e

= P 0.5 = Q 2 = D 5 .

Ejemplo Con los datos de la tabla de frecuencia del ejemplo 3.1, el valor del tercer cuartil ( Q 3 ) se ubica en el intervalo k = 4 puesto su frecuencia acumulada relativa es mayor de "p = 0.75 = 3/4" y por tanto:

MEDIDAS DE VARIABILIDAD

Cuando se dispone de información sobre una variable es necesario conocer si los datos recopilados muestran una variabilidad significativa. Si los datos son semejantes entre si, se observará que no se encuentran muy dispersos con respecto a la media aritmética y en estos casos se expresa que los datos no son muy variables; sin embargo, cuando los datos presentan diferencias importantes entre si se apreciará que tienden a dispersarse y en estos casos se expresa que la información es variable o heterogénea. El grado de variabilidad de la información disponible es muy importante en todo análisis estadístico pues de esto depende el grado de confiabilidad de las estimaciones que se puedan establecer, de acuerdo a esto, para un tamaño de muestra determinado, un análisis en una población con datos homogéneos será más confiable que el realizado en una población con datos heterogéneos.

Rango

El rango o amplitud de un conjunto de datos es la diferencia entre la observación de mayor valor y la observación de menor valor. Es decir,

R = X max -X min

Ejemplo: El rango para los datos siguientes 32. 54, 21, 33, 45, 49. 61 es R = X max - X min = 61 - 21 = 40 Como puede apreciarse, el rango es una medida muy simple que muestra la diferencia entre las observaciones de mayor y menor valor, pero que no evalúa el grado de variabilidad de la observaciones intermedias

Q

 

P

LI

0.75 Fr

3

TIC

7.9

0.75

0.55

0.98.7

soles.

3

0.75

4


fr

4

 

 

0.225  

es decir, en el 75% de establecimientos se observó un precio menor a 8.7 soles y en el 25% restante se observó un precio superior a 8.7 soles.

Los indicadores que se utilizan para analizar el grado de heterogeneidad o de variabilidad de un conjunto de observaciones son llamados en general medidas de variabilidad o medidas de dispersión. Las medidas de mayor uso son tales como: el rango, la variancia, la desviación estándar y el coeficiente de variabilidad.

Variancia

La variancia de un conjunto de observaciones se define de la siguiente manera:

 

N

2

Variancia poblacional

2

1

N

i 1

X

i

Variancia muestral

 

1

n 2

2

S

i 1

X i X

 

n 1

De estas expresiones se deduce que la variancia de un conjunto de observaciones esta expresada en unidades cuadráticas: por ejemplo, si las unidades de las observaciones es metros, la variancia será expresada en metros 2 . Este hecho dificulta la interpretación de la variancia.

Desviación estándar

La desviación estándar de un conjunto de observaciones se define como la raíz cuadrada de la variancia. Es decir:

Poblacional :

2
2

Muestral :

2
2

S S

Como puede apreciarse la desviación estándar de un conjunto de observaciones esta expresada en las mismas unidades de la variable en estudio, por ejemplo, si las unidades de las observaciones es metros, la desviación estándar será expresada en metros. Este hecho brinda una clara ventaja con respecto a la variancia. en cuanto a su interpretación.

Para comparar la variabilidad de dos conjuntos de observaciones se debe tener en cuenta lo siguiente: Si las unidades de medida de las observaciones de dos o más conjuntos de datos es la misma y sus promedios son iguales o semejantes, se debe utilizar la variancia o la desviación estándar: Si las unidades de medida de las observaciones de dos o mas conjuntos de datos es diferente o si sus promedios son diferentes, se debe utilizar el coeficiente de variabilidad. Para la evaluación del valor del coeficiente de variabilidad, cuando se trabaja con datos económicos se puede utilizar la siguiente escala.

Cálculo de las medidas de variabilidad a) Con datos no agrupados Cuando se dispone de
Cálculo de las medidas de variabilidad
a) Con datos no agrupados
Cuando se dispone de un conjunto de
observaciones no agrupadas se debe tener en
cuenta las siguientes expresiones para el cálculo
de la variancia.
N
N
2 1
2 1 
X
2
2
X
N
Variancia poblacional:
i 
i
N
N 
 
i  1
i  1

Coeficiente de variabilidad

Es una medida de dispersión relativa que se define como el cociente entre la desviación estándar y la media aritmética de un conjunto de observaciones.

Coeficiente de variabilidad poblacional

Coeficiente de variabilidad muestral:

S

CV 100

X

De .estas expresiones se deduce que el coeficiente de variabilidad no se puede definir si el promedio es igual a cero. Si el promedio es un valor negativo, debe considerarse su valor absoluto para evaluar el coeficiente de variabilidad.

CV

100

 

CV

Grado de variabilidad

0

< cv < 10

Datos muy homogéneos

10

cv < 15

Datos regularmente homogéneos

15

cv < 20

Datos regularmente variables

20

. cv < 25

Datos variables

cv

25

Datos muy variables

Si bien esta escala no es rígida, se puede utilizar como referencia. Para definir otra escala se debe tener en cuenta cuánto de control se tiene sobre otros factores que pueden influenciar en un conjunto de datos.

Variancia muestral 2  n     1    X 
Variancia muestral
2
n
1 
X 
m
n i
1
2 1
2
2
2
i  1
S 
n 
X
 X 
X
n X
2
 
 X 
i
i
i
n  1
n  1
 
n  1
n
i  1
i  1
i  1
 
Ejemplo 4.1
Suponga que los datos que
se
presentan
a
continuación corresponden a los precios
observados del artículo XX (en soles) en 32
establecimientos elegidos al azar del Distrito de Ate.

5.2

10.2

7.0

7.1

1'0.2-

8.3

'9.4

9.2

6.5

7.1

6.6

7.8

6.8

7.2

8.4

9.6

8.5

5.7

6.4

10.1

8.2

9.0

7.8

8.2

5.3

6.2

9.1

8.6

7.0

7.7

8.3

7.5

a) El rango es: R = X max - X min = 10.2 - 5.2 = 5.0

b) La variancia muestral. Primero se obtiene la suma de las observaciones y la suma de los cuadrados de las observaciones.

n

X i = 5.2 + 10.2 + 7.0 +

i 1

+ 7.5 = 250.2 soles

n

2 = (5.2) 2 + (10.2) 2 + (7.0) 2 +

X

i

+ (7.5) 2 = 2015.04

i 1

soles 2

Lo cual indica que los precios del producto XX, en el distrito de Ate, son regularmente variables.

NOTA Cuando se tiene datos discretos organizados en tablas de frecuencia considerar también estas expresiones, pero tomando M i =X i .

Ejemplo 4.2

Intervalo de clase

 

Mi

fi

fri

Fi

Fri

Pi

Pi

De 5.2 a menos de 6.1

5.65

3

0.094

3

0.094

9.4

9.4

De 6.1 a menos de 7.0

6.55

5

0.156

8

0.250

15.6

25.0

De 7.0 a menos de 7.9

7.45

9

0.281

17

0.531

28.1

53.1

De 7.9 a menos de 8.8

8.35

7

0.219

24

0.750

21.9

75.0

De 8.8 a menos de 9.7

9.25

5

0.156

29

0.906

15.6

90.6

De 9.7

a

10.6

10.15

3

0.094

32

1.000

9.4

100.0

30

 

 

 

2

 

n

2

S

1


n

i 1

2

X

 


i 1

X

1

2015.04

250.2

2



1.896411

soles

n 1

i

n


32.

1

32

 


 

c) La desviación estándar es:

= 1.377102 soles

d) El coeficiente de variabilidad. se tiene:

CV

S

100

1.377102

 

100

17.612882

%

X

7.81875


X

250.2 7.81875

soles

b) Con datos agrupados

Cuando se dispone de un conjunto de observaciones agrupados en tablas de frecuencias se debe tener en cuenta las siguientes expresiones para el cálculo de la variancia:

Variancia poblacional:

2 1

f M

k

2 1

N  

N

i

i

k


1

2

2

f M

i

i

N

k

fr M

i

2

i

2

i

1

i

i 1

Variancia muestral:

S 2

k

1

n 1

i 1

 

X X

i

2 1

n 1

k

M

2

n X

2

1

 

 

  

2

n

k

2

i

1

i

i

f M

f i

 

i 1

f i

i

 

n 1


i 1

f M

i

i

n

 

Para obtener indicadores de variabilidad se debe obtener primero: k  f M i i
Para obtener indicadores de variabilidad se debe
obtener primero:
k
f M
i
i
= (3)(5.65) + (5)(6.55) +
+ (3)(10.15)
i  1
= 251.9 soles
 f M
k
(3)(5.65) 2 + (5)(6.55) 2 +
= 2034.74 soles 2
2
=
+ (3)(10.15) 2
i
i
i  1
251.9
soles
X 
 7.871875
32

a) Variancia muestral. Se tiene:

 

n

i 1

 

2

 

 

2

S

</