Está en la página 1de 35

Universidad Inca Garcilaso de la Vega

Facultad de Ciencias de la Comunicacin


Turismo y Hotelera

Anlisis Estadstico Descriptivo

1.
2.
3.
4.
5.

Conceptos bsicos
Construccin de tablas de frecuencias
Los grficos Estadsticos
El anlisis de tendencia Central
El anlisis de dispersim

Luis Flores Cebrin

Versin inicial : Agosto 2009

1.

CONCEPTOS BASICOS
Antes de iniciar el anlisis estadstico de un conjunto de datos es necesario establecer
algunas precisiones conceptuales:

1.1

Estadstica descriptiva y estadstica inferencial


El nivel descriptivo est referido al estudio y anlisis de los datos obtenidos en una
muestra (n) y como su nombre lo indica describen y resumen las observaciones
obtenidas sobre un fenmeno un suceso o un hecho.
Ejemplos :

El porcentaje de aprobados en el curso de economa ascendi a un 68%


El 35% de los visitantes del museo era de gnero femenino
La edad promedio de una muestra de compradores en el centro comercial es
de 38 aos

En cambio la estadstica inferencial esta referida al procedimiento mediante el cual los


resultados de la muestra se trata de hacerlos extensivos a toda la poblacin o universo
(N). Procura mostrar relaciones de causa efecto o pruebas de hiptesis.
Ejemplos :
Los ingresos de los turistas que vienen al pas son de $ 35,000 en promedio
Si las elecciones fueran hoy da el candidato del partido X obtendra un
45% de los votos
n

* *

* *
*
** * *
*
*
** * *
*
*
*

*
*

Muestra
Poblacin

1.2

Poblacin y muestra
Poblacin es el conjunto completo de individuos, objetos que posee una o ms
caractersticas observables en un mbito geogrfico determinado y en un lapso de
tiempo .
Muestra : es un subconjunto representativo de la poblacin, cuando hablamos de
representatividad nos referimos a que debe ser lo ms parecido a posible a la poblacin
desde el punto de vista cuantitativo y cualitativo.
El muestreo puede ser :

Luis Flores Cebrin

Muestreo al azar simple, cuando el azar es el criterio bsico de eleccin de


las unidades de muestreo
Muestreo estatificado basado en la subdivisin de la poblacin en
subconjuntos o estratos mutuamente excluyentes

Muestreo por reas, cuando se trabaja en funcin de unidades geogrficas o


conglomerados
Muestreo sistemtico, cuando se sigue un patrn de eleccin basado en
nmeros aleatorios elegidos al azar o un factor de eleccin, ejemplo se elige
aplicar la encuesta a cada quince visitantes al museo

En todos los casos se debe aplicar el criterio de probabilidad, es decir que cada elemento
de la poblacin tenga la misma probabilidad de ser elegido en la muestra. Este es un
aspecto fundamental pues hacerlo de otra manera ( eleccin subjetiva) impedira medir
el nivel de confianza y / o de error de los resultados obtenidos.
1.3

Las variables
Las variables son las caractersticas, atributos o cualidades del objeto de investigacin
se pueden clasificar de muchas maneras. Ejemplo

CRITERIO

CLASIFICACIN

Segn el nmero de valores


que expresan

Variables dicotmicas, expresan slo dos


valores
Variables politmicas, expresan mas de
dos valores
Variables tericas o no observables de
naturaleza conceptual
Variables empricas observables se
pueden medir o cuantificar
Variables discretas asumen valores
absolutos
Variables continuas asumen valores
fraccionarios
Variables independientes
Variables dependientes
Variables intervinientes

Segn la capacidad
observacin

de

Segn la naturaleza del


valor que asumen

Segn su funcin en la
hiptesis

Variables paramtricas

Luis Flores Cebrin

EJEMPLO
Genero : masculino o femenino
Grado de instruccin
Gusto, preferencia, opinin
Peso, temperatura, ingresos
Nacionalidad,
Ingresos mensuales
Causas o antecedentes
Consecuencias o efectos
Influyen pero de manera
indirecta
Medioambientales, de entorno o
macro

1.4

La medicin
Concepto : La medicin es un proceso sistemtico de asignacin de nmeros a
individuos , objetos o fenmenos , de tal manera que representen de una manera lgica
y racional las caractersticas de los mismos
Calidad de la informacin .
Cmo podemos medir la calidad de la informacin ?

Calidad de la
informacin

CALIDAD
INTERNA

CALIDAD
EXTERNA

Validez

Confiabilidad

Representatividad

CONFIABILIDAD :
Es la consistencia de puntajes en mediciones sucesivas, es decir la menor presencia de
errores de medicin.
Se expresa a travs de la estabilidad que consiste en usar el mismo conjunto de
preguntas en dos o ms momentos y comparar as las respuestas obtenidas.

Esta a favor del TLC


Esta en contra del TLC
No sabe / no opina

Perodo 1

Perodo 2

58%
22%
20%

62%
24%
14%

VALIDEZ :
Es el grado en que las mediciones empricas representan o reflejan la dimensin
conceptual que se supone estn tratando de medir
Tiene dos maneras de comprobacin:

Luis Flores Cebrin

a) Validez predictiva es aquella que anticipa un comportamiento o una


correlacin de respuestas congruente. Ejemplo :

POSICIN POLTICA DE IZQUIERDA


IZQUIERDA
Escala de actitudes
polticas

()
()
()
()

DERECHA
(
(
(
(

)
)
)
)

Suponiendo que hubiera un proceso electoral y se presentara un


conjunto de propuestas polticas , la validez predictiva se manifestara
cuando la persona que exhibe una preferencia por posiciones polticas
de izquierda elige a candidatos de una opcin poltica similar o afn.
b) Validez concurrente, se utiliza cuando nuevos indicadores del concepto se
correlacionan altamente con indicadores ya establecidos del mismo.
Ejemplo :

ESCALA A

ESCALA B

Posicin de
izquierda
9/10 =0.90

Posicin de
izquierda
17/20 =0.85

REPRESENTATIVIDAD
Tiene que ver con el grado en que los resultados de la muestra pueden ser atribuidos a
toda la poblacin o universo . Se trabaja con los valores de Z ( niveles de confianza
utilizando las reas de la curva Normal ) y el valor de e ( mximo error permitido por el
investigador ).

Luis Flores Cebrin

1.5

Escalas de medicin de los datos


Las escalas a considerar son :

Nivel nominal
Nivel ordinal
Nivel de intervalos
Nivel de razn

Nivel Nominal

Escala cualitativa que asigna arbitrariamente un nmero a cada respuesta de modo que
slo tenga valor como un nmero de identificacin. El nmero de escala no tiene ningn
significado por s slo.
Ejemplo : Cul es la tarjeta de crdito de su preferencia ?
1.
2.
3.
4.

VISA
Mastercard
American Express
Diners

(
(
(
(

)
)
)
)

Porcentajes
Moda
Prueba binomial Ji cuadrado

Estadstica permisible :

El nmero que se asigna en esta escala no representa magnitudes absolutas. Solo sirven
para clasificarlos en determinada categora, en otras palabras 1, no es la mitad de 2 .

Nivel Ordinal

Escala cualitativa que no slo clasifica , sino establece jerarquas entre los valores.
Entre mayor sea el nmero, mayor (o menor) es la existencia del atributo , pero sin
indicar la distancia que hay entre las posiciones , es decir que el numero cuatro en
preferencia no es 300% superior al nmero 1, solo indica que es preferido respecto del
anterior
Ejemplo : Clasifique en una escala de 1 a 4 las siguientes marcas de gaseosa, en funcin
de su preferencia :
1.
2.
3.
4.

Estadstica permisible

Luis Flores Cebrin

Inca Kola
Coca Cola
Real Kola
Pepsi Cola

(
(
(
(

)
)
)
)

Percentiles - mediana
Desviacin cuartil
Correlacin rango-orden

Nivel de intervalo
Escala cuantitativa que clasifica, ordena y establece distancias o intervalos iguales entre
las unidades de medida . Asigna un punto de cero en forma arbitraria por convencin
por los expertos , pero que no implica la ausencia del atributo. Por ejemplo una prubea
de coeficiente de inteligencia va tener un punto cero , pero no hay una persona con cero
de inteligencia. Otros ejemplos son la medicin del calendario , o la medicin de la
temperatura
Ejemplo :

Resultados econmicos de empresas de un sector ($)


de
20000
-10000
0
10000

a
-10000
0
-10000
20000
Media Mediana-Moda
Desviacin estndar- Varianza
Coeficientes de Correlacin
Prueba T Prueba Z

Estadstica permisible

Nivel de Razn

Escala cuantitativa es igual que las escalas de intervalos, pero poseen un cero absoluto.
(origen natural) en el cual hay una ausencia de la propiedad o atributo, ejemplo el peso
o los ingresos monetarios de una persona
Ejemplo :

Nivel de ingresos mensuales de las familias de un distrito ( en soles)


De
0
1,000
2,000
3,999

Estadstica permisible

A
999
1,999
2,999
4,000
Media geomtrica
Media armnica
Coeficiente de variacin

La estadstica permisible va en sentido acumulativo, as en la escala de razn se pueden


estudiar todos los indicadores anteriores a las escalas de intervalos, ordinales y
nominales

Luis Flores Cebrin

2.

CONSTRUCCION DE TABLAS DE FRECUENCIA


Una primera aproximacin al anlisis descriptivo es la construccin de la tabla de
frecuencias , las cuales presentan la distribucin de un conjunto de elementos de
acuerdo a las categoras de una variable x .
En la tabla se observa la frecuencia o repeticin de cada uno de los valores en el
correspondiente intervalo de clase
Se presentan los siguientes casos :
2.1 Variable discreta , es aquella cuyo valor se expresa nicamente por nmeros
enteros, adquieren valores absolutos y por lo general son cualitativas.
Ejemplo 1 :
En una muestra de veinte bodegas del distrito X ,se desea conocer la cantidad de
marcas de crema dental que ofrecen a sus clientes.
La variable (xi) es el nmero de marcas de crema dental ofrecidas.
Hecho el estudio se obtuvieron los siguientes resultados :

Bodega
N

xi

Bodega
N

xi

1
2
3
4
5
6
7
8
9
10

6
5
4
4
3
3
4
4
5
6

11
12
13
14
15
16
17
18
19
20

4
5
6
2
4
3
4
6
5
3

N : 20 bodegas
Construyendo la tabla tendramos :
1 Clasificacin : xi mximo : 6 marcas de crema dental
xi mnimo : 2 marcas de crema dental
2 Las clases seran : 2,3,4,5,y 6
3 Tabulacin : Se determina cuantas veces de repite cada valor de xi ( frecuencia).
Se denomina frecuencia absoluta ( fi ) cuando se contabiliza en valores absolutos
(nmero de bodegas)
Se denomina frecuencia relativa ( hi ) cuando se contabiliza en valores relativos
(porcentajes )
4 El cuadro de frecuencias quedara presentado de la siguiente manera :

Luis Flores Cebrin

Cuadro N 1 :
Distribucin de 20 bodegas del distrito X en funcin al nmero de marcas
de crema dental que ofrecen a sus clientes

xi
2
3
4
5
6

tabulacin
/
////
///////
/////
////
TOTALES

fi

hi (%)

1
4
7
5
3
20

5
20
35
25
15
100

Fuente : encuesta rea de mercadeo

Grficamente tenemos :
Oferta de marcas de crema dental - Bodegas distrito X

N bodegas

6
5
4
3
2
1
0
2

N marcas crema dental

Este grfico se conoce como Histograma


2.2

Variable continua, es aquella que puede tomar cualquier valor del conjunto de
los nmeros racionales ( enteros o fraccionarios). Son variables cuantitativas
Ejemplo 2 :
Se desea conocer el ingreso mensual promedio del asentamiento Galpagos .
La variable xi : ser ingresos mensuales expresados en Soles
Para tal efecto se ha seleccionado una muestra de 50 familias y se han obtenido
los siguientes datos :

Luis Flores Cebrin

Familia
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
n : 50
1

xi

Familia
N

xi

730
750
580
430
490
650
670
750
510
970
820
650
890
590
550
700
600
700
380
600
450
750
730
650
760

26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

500
870
550
710
750
700
400
610
750
690
540
720
780
850
350
320
830
890
650
450
750
640
930
850
630

Se calcula el Rango (R)


R = mayor valor de xi menor valor de xi
R = x10 x41
R = 970 320 = 650

Se obtiene el numero de clases e intervalos para tal efecto se utiliza la


Regla de Sturges :

Si el tamao de la muestra es
Menor de 100
Mayor de 100

Regla de Sturges
m = 1 + 3.322 x Log n
m =3 + 3.322 x Log n

En este caso n < 100 entonces :


m = 1 + 3.322 x Log 50
m = 1 + 3.322 l.69897
m = 6.64 7 intervalos

Luis Flores Cebrin

10

El tamao de clase ( c ) sera : C = R / m


c = 650 / 7 = 92.8 93

Construimos la tabla de frecuencias :

Intervalo de clase

1
2
3
4
5
6
7

xi
320
413
506
599
692
785
878

xs
413
506
599
692
785
878
971
TOTALES

Marca de
clase - xi

Frecuencias absolutas

Fi
4
9
15
26
41
46
50

fi

366.5
459.5
552.5
645.5
738.5
831.5
924.5

4
5
6
11
15
5
4
50

Frecuencias relativas

hi
8
10
12
22
30
10
8
100

Hi
8
18
30
52
82
92
100

Donde :
i
xi
xs

: nmero de intervalo
: intervalo de clase inferior
: intervalo de clase superior

fi

: muestran la repeticin de los datos en determinado


intervalo de clase- invalores absolutos ( familias)
: muestran la acumulacin progresiva de las frec.absolutas
: expresan a las frec. absolutas en trminos relativos (%)
: muestran la acumulacin progresiva de las frec. Relativas

Fi
hi
Hi

Grficamente vamos a elaborar el histograma de frecuencias absolutas ( fi ) :


Galapagos : ingreso mensual
16
14
12

familias

10
8
6
4
2
0
413

506

599

320

413

506

692

785

878

971

599

692

785

878

soles

Luis Flores Cebrin

11

Es importante acotar que los grficos deben de tener las siguientes condiciones bsicas :

Ttulo : descripcin abreviada del contenido


Leyendas y cifras tanto en el eje de las abscisas como de las ordenadas
Debe ser simtrico, no muy horizontal o vertical
En el eje de las abscisas se colocan los valores de la variable x
En el eje de las ordenadas se colocan las frecuencias ( fi , hi )
De ser posible se colocan las fuentes de la informacin

En relacin al nmero apropiado de los intervalos Christensen Howard


siguiente :
Nmero de valores en el
conjunto
De 10 a 100
De 100 a 1,000
De 1,000 a 10,000

plantea lo

Nmero apropiado de intervalos


de clase
De 4 a 8
De 8 a 11
De 11 a 14

Avila Acosta 2 en cambio define los intervalos de clase en tres categoras :


a. Intervalos de igual amplitud
Alumnos por aula
20 - 29
30 - 39
40 - 49
50 - 69
70 - 69
b. Intervalos de diferente amplitud
Edad de clientes
35
6- 14
25 24
25 - 39

c. Intervalos abiertos por la izquierda y cerrados por la derecha


Sueldos mensuales
(
]
320 370
370 420
420 470
470 520
520 - 570
En este caso NO est incluido el extremo inferior, pero si el extremo superior

1
2

CHRISTENSEN Howard. Estadstica Paso a Paso


AVILA Acosta . Estadstica Elemental

Luis Flores Cebrin

12

Otra forma de presentar este cuadro es :


Alumnos por aula
320.01 370
370.01 420
420.01 470
470.01 520
520.01 - 570
Esta segunda forma de presentacin es ms prctica ,pues indica directamente
los valores comprendidos en cada intervalo.
Por lo general el nmero de intervalos de clase va depender de :
 La naturaleza de la variable
 El nmero de valores observados
 El recorrido de la variable
 Los objetivos del estudio

Luis Flores Cebrin

13

3.

LOS GRFICOS ESTADSTICOS


3.1 Concepto
Son representaciones pictricas ( figuras geomtricas o de superficie ) utilizados con el
objeto de mostrar magnitudes , cambios de una variable o comparar dos o ms variables
relacionadas.
Un grfico bien elaborado debe tener los siguientes elementos :
Numero de grafico y
ttulo

Grafico 2 : Ventas de la empresa A - primer semestre del ao 20X1


2,500

miles $

2,000

1,500

1,000

500

0
Enero

Febrero

Marzo

Abril

Mayo

Junio

meses

Fuente : rea de ventas


Diagrama
cuerpo

Luis Flores Cebrin

Escalas y
leyendas en los
ejes

14

3.2

Tipos de Grficos
3.2.1

Grfico Lineal

Grafico 2 : Agencia de Viajes " El Sol " Clientes atendidos en sucursal Cuzco
Clientes

14,000
12,000
10,000
8,000
6,000
4,000
2,000
0
Aos 2001

2002

2003

2004

2005

2006

Este grfico de evolucin es til para representar la evolucin de una sola variable en el
tiempo ( serie de tiempo)
3.2.2

Grfico circular

Restaurante "El norteo" - formas de pago por consumo


Mastercard,
2%
Diners, 7%

Efectivo 26%

American, 17%

Visa, 48%

Es utilizado para expresar una variable que esta compuesta de varios subconjuntos es
decir es un grfico de estructura ( de una sola variable)

Luis Flores Cebrin

15

3.2.3

Grfico de barras comparativas

Estructura de la oferta Hotelera en La Alborada 2005-2006

100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
2005

Hotel A

Aos

2006

Hotel B

Hotel C

Hotel D

Se recomienda para comparar estructuras con varios subconjuntos en ms de un perodo


de tiempo
3.2.4

Grfico Combinado ( valores en dos abscisas )

30

14

25

12
10

20

8
15
6
10

tasa %

ventas (miles)

Empresa W : Ventas y tasas de crecimiento 2003 -2006

0
2003

2004
Ventas

2005

2006

aos

tasa crec.

Es muy til para mostrar dos frecuencias que tienen valores diferentes (dlares y
porcentajes por ejemplo); cada una de ellas se ubica en uno de los ejes verticales y su
lectura es a travs de los valores all expresados

Luis Flores Cebrin

16

EJEMPLO PRCTICO DE ELABORACIN DE UN GRFICO


ESTADISTICO CON EXCEL
Supongamos que estamos estudiante la cantidad de turistas que visitan el valle
de Lunahuana y se tienen los siguientes datos estadsticos : (datos supuestos)
1
Ao
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007

2
Turistas ( miles)
224
271
310
325
319
308
304
365
392
415
488

3
Crecim (%)
17.28
20.98
14.39
4.84
-1.85
-3.45
-1.30
20.07
7.40
5.87
17.59

En primer lugar vamos a utilizar un grfico de barras para representar las cifras .

Grafico 1 : Lunahuana ingreso de turistas


500
450
400
350

miles

300
250
200
150
100
50
0
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
aos

Apreciamos que hay tres etapas claramente definidas:


1
2
3

Luis Flores Cebrin

De 1997 al ao 2000 se aprecia un crecimiento


De 2001 al ao 2003 vemos que se estanca el impulso inicial y cae el
nmero de turistas y visitantes
A partir de del ao 2004 se vuelva a tener un impulsote crecimiento
mucho mayor

17

Estos grficos tienen la ventaja que nos permiten ver el comportamiento de un


variable en un largo lapso de tiempo y podemos apreciar la tendencia de largo
plazo ( mas de cinco aos) que en este caso es de crecimiento.
Pero es importante acompaar el anlisis con otro tipo de grficos, en este caso
usaremos el grfico lineal para apreciar cmo es el crecimiento relativo ( en
porcentajes ) de cada ao, conforme se aprecia en la columna 3 del cuadro y
cuya expresin grfica es :
Grafico 2 : Tasa de crecimiento anual de la llegada de turistasa
Lunahuana
25

20

15

10

0
1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

2007

-5
aos

Aqu apreciamos ms claramente la situacin y se pueden graficar los valores


negativos como son los aos 2001, 2002, 2003 y 2004 , en los cuales no hubo
crecimiento sino todo lo contrario se experimento una reduccin en la cantidad
de visitantes a la localidad
El calculo del crecimiento se efectu con la frmula :

crec. = n 1 100
Vn 1

Donde :
Vn
Vn-1

: valor de la variable el ao n
: Valor de la variable el ao n-1 ( ao anterior)

Por ejemplo el valor del ao 2000 se obtuvo de la siguiente manera :

325
1 100
310

. crec. =

crec. = 4.84 %

Luis Flores Cebrin

18

Una dificultad evidente es la elaboracin de grficos con la hoja electrnica EXCEL , vamos a
presentar los pasos a continuacin con los datos del grfico 2 :

1 paso : ingresamos los datos de los aos y las tasas de crecimiento


2 paso : accionamos el icono de grficos y vamos a tener el asistente para grficos
3 paso : elegimos la opcin de grfico lineal- Lneas
4 paso : presionamos el comando de Siguiente >

Luis Flores Cebrin

19

5 paso : Ingresamos el rango de datos : C4;C14, aparece la grfica de las tasas de


crecimiento
6 paso : Se acciona el comando de series para colocar los datos de los aos

Luis Flores Cebrin

20

7 paso : Se coloca el rango de los periodos de tiempo B4; B14 y se acciona el comando
siguiente

8 paso : Se coloca :
Ttulo del grfico : tasa de variacin anual de llegada de turistas a Lunahuana
Eje de categoras : aos
Eje de valores : %
9 paso : Se presiona siguiente y se tiene concluido el grfico indicando Finalizar

Luis Flores Cebrin

21

4.

ANALISIS DE TENDENCIA CENTRAL


Las medidas de tendencia central o de resumen son indicadores que tienden a sintetizar
o describir de la manera ms representativa las caractersticas de un conjunto de datos.
Las medidas ms importantes son :

La Media aritmtica
La Mediana
La Moda

4.1 La Media Aritmtica ( )


La media aritmtica es la clase que determina el centro de gravedad de un
conjunto de datos, es decir es el valor ms representativo
a) Media aritmtica de datos no agrupados :
Formula :
n

xi
=

i =1

n
Donde :
xi : clase
n : nmero de clases
: Sumatoria ( desde i = 1 , hasta i = n)
Ejemplo 3 :
Se ha efectuado la medicin de cuanto demora la atencin a los clientes en un
Supermercado. Se ha tomado una muestra de 10 clientes y los resultados
obtenidos son :
Cliente
xi
1
2
3
4
5
6
7
8
9
10

Duracin de la
atencin
3.24
4.01
2.33
2.08
3.30
3.25
3.00
4.02
4.15
2.88
32.26

32.26
10

= 3.23 minutos , que es el promedio de duracin de la atencin a


los clientes

Luis Flores Cebrin

22

Utilizando Excel el procedimiento es el que sigue :

b) Media aritmtica de datos agrupados


n

xi fi
=

i =1

N
Donde :
xi : marca de clase
fi : frecuencia absoluta
n : total de frecuencias
Ejemplo 4 :
La gerencia de mercadeo de un Hotel ha decidido estudiar un estudio acerca de la edad
promedio de los clientes del Caf Bar El Sol . Se ha elegido una muestra de 300
clientes recogida durante todo un mes tpico . Aplicada la encuesta se han obtenido los
siguientes resultados :
Clase ( i )
1
2
3
4
5
6
7
8
9

Luis Flores Cebrin

Intervalo
19 23
23 27
27 31
31 35
35 39
39 - 43
43 47
47- 51
51- 55
TOTALES

xi
21
25
29
33
37
41
45
49
53

fi
5
9
13
48
67
58
54
29
17
300

xi fi
105
225
377
1,584
2,479
2,378
2,430
1,421
901
11,900

23

La media aritmtica es igual a :


=

11,900
300
= 39.67 aos
El promedio de edad de los clientes del Caf Bar El Sol es de 39. aos y medio

CARACTERISTICAS

VENTAJAS
DESVENTAJAS

LA MEDIA ARITMTICA : RESUMEN


En su valor influyen todos los componentes
de la distribucin
Puede ser manipulada algebraicamente
Es la medida ms fcil de calcular
Es la medida ms conocida y utilizada
Su valor puede ser distorsionado por los
valores extremos o singulares

4.2 La Mediana ( Me)


Es la medida de tendencia central que corresponde al valor de la variable que
divide a la frecuencia total en dos partes iguales .
a)

Mediana de datos no agrupados


En este caso se procede de la siguiente manera :
1 Se ordena el conjunto de valores en orden creciente
2 Se halla el valor que ocupa la posicin media
3 Si el nmero es impar, el valor central es la mediana
4 Si el nmero es par , el promedio de los dos centrales es la mediana

Ejemplo 5 :
Se tiene el siguiente conjunto de datos :
4

Se ordena
2

Me

Ejemplo 6 :
Se tiene el siguiente conjunto de datos :
6
Se ordena
6

8
3

Luis Flores Cebrin

10

9.5

11

10

15

11

15

Me = (9+10) / 2 = 9.5

24

3.2 Mediana de datos agrupados


Formula :

N / 2 Fa

Me = Li + c
fi

Donde :
Li : limite inferior del intervalo de la clase que contiene a la Me
c : Tamao del intervalo de clase
n : Total de frecuencias absolutas
Fa : Frecuencia absoluta acumulada anterior al la clase que
contiene a la Me
fi : frecuencia absoluta de la clase que contiene a la Me
Utilizando el ejercicio desarrollado en el ejemplo N 4 tenemos :
Clase ( i )
Intervalo
1
19 23
2
23 27
3
27 31
4
31 35
5
35 39
39 - 43
6
7
43 47
8
47- 51
9
51- 55
TOTALES

fi
5
9
13
48
67
58
54
29
17
300

Fi
5
14
27
75
142
200
254
283
300

El valor de N/2 es = 300/2 = 150, este valor se encuentra ubicado en el 6


intervalo

(300 / 2) 142
Me = 39 + 4

58

Me = 39 + 0.55
Me = 39.55 aos
El 50% de los asistentes al Caf Bar El Sol est en el intervalo de 19
a 39.55 aos y el 50% restante est en el intervalo de 39.55 a 55 aos.
50%

50%

19

55
39.55 aos

Luis Flores Cebrin

25

CARACTERISTICAS

VENTAJAS
DESVENTAJAS

LA MEDIANA : RESUMEN
Es un promedio de posicin
Cuando la agrupacin de datos es muy
estrecha es el mejor indicador
Calculo relativamente fcil de efectuar
No es distorsionada por los valores extremos
Su interpretacin es bastante restringida
No se manejar algebraicamente, la mediana
de varios subconjuntos no puede ser
promediada para obtener la mediana del total
No es muy conocida ni entendida

4.3 La Moda ( Mo)


Es la medida de tendencia central que corresponde al valor de la clase cuya
frecuencia es la que ms repite (fi mayor )
No se puede calcular la Moda en datos no agrupados
a.

Moda de datos agrupados


Formula :

fp

Mo = Li + c
fp + fa
Donde :
Li : limite inferior del intervalo de la clase que contiene a la
Moda
c : Tamao del intervalo de clase
n : Total de frecuencias absolutas
fp : Frecuencia absoluta posterior a la clase que contiene a la
Moda
fa : frecuencia absoluta anterior de la clase que contiene a la
Moda
Utilizando el ejercicio desarrollado en el ejemplo N 4 tenemos :
Clase ( i )
Intervalo
1
19 23
2
23 27
3
27 31
4
31 35
35 39
5
6
39 - 43
7
43 47
8
47- 51
9
51- 55
TOTALES

fi
5
9
13
48
67
58
54
29
17
300

La frecuencia mayor se encuentra ubicada en el 5 intervalo = 67 clientes

Luis Flores Cebrin

26

58
Mo = 35 + 4

58 + 48
Mo = 35 + 2.19
Mo = 37.19 aos
La edad ms frecuente de los asistentes al Caf Bar El Sol es de
37.19 aos.
LA MODA : RESUMEN
Es absolutamente independiente de valores
extremos
Es un valor tpico
Es la medida ms descriptiva
Cuando el nmero de valores es pequeo es
fcil determinarla por observacin
No es posible calcularla en caso de datos no
agrupados

CARACTERISTICAS

VENTAJAS

DESVENTAJAS

Relacin emprica entre Media, Mediana y Moda :


DISTRIBUCIONES

Relacin

SIMETRICAS

= Me = Mo

ASIMETRICAS A LA DERECHA

Mo >Me >

ASIMETRICAS A LA IZQUIERDA

Mo < Me <

Con los datos del ejercicio 4 :


: 39.67 aos
Me : 39.55 aos
Mo : 37.19 aos

Asimetra a la izquierda

La asimetra tambin se puede calcular de la siguiente ,manera :

As =

( X Mo )
s

Los resultados obtenidos se pueden clasificar de la siguiente manera :


AS > 0
Asimetra positiva
Sesgo hacia la izquierda
Cola hacia la derecha

Luis Flores Cebrin

As = 0
Simetra

As < 0
Asimetra negativa
Sesgo hacia la derecha
Cola hacia la izquierda

27

Utilizando los datos del ejemplo tenemos :

As =

(39.64 37.19)
7.12

As = 0.017 que es una asimetra positiva o a la izquierda

Clientes del Bar


80
70

clientes

60
50
40
30
20
10
0
23

27

31

37.19
Mo

Luis Flores Cebrin

35

39

39.55
Me

43
Edad

47

51

55

39.67

28

5.

ANALISIS DE DISPERSIN
Las medidas de dispersin son un conjunto de indicadores que nos expresan el grado de
concentracin o alejamiento de los datos respecto de la media aritmtica.
Ejemplo 7 :
Tenemos las siguientes distribuciones de datos :
A
3
7
46
67
81

xi
1
2
3
4
5

B
20
40
46
47
51

Hallamos la Media y la mediana :


Media
mediana

40.8
46

40.8
46

Aparentemente ambas distribuciones son iguales, pero esto es as? : veamos los
Los grficos :

edad

GRUPO A
90
80
70
60
50
40
30
20
10
0
1

elementos

GRUPO B
60

edad

50

40
30
20
10
0
1

elementos

A pesar que ambos grupos tienen los mismos indicadores de tendencia central , las
distribuciones de los datos muestran que el grupo B es ms homogneo que el grupo A,
pues los datos estn ms cerca del valor de la edad promedio ( 40.6 aos) , en cambio el
grupo A est ms disperso o menos concentrado..

Luis Flores Cebrin

29

Para poder medir el grado de concentracin o dispersin de los datos , respecto de la


media aritmtico se tienen las siguientes medidas de dispersin :
El Rango - R
La desviacin media - DM
La desviacin estndar - s
El coeficiente de variacin CV
5.1

El Rango ( R )
Es la medida de dispersin que mide la amplitud o recorrido de la distribucin
y se obtiene de la siguiente manera :

R = Mayor

Valor

Menor

Valor

Utilizando el ejemplo anterior tenemos :


Rango A = 81 3 = 78
Rango B = 51 20 = 31
La distribucin B tiene un ,menor recorrido que la distribucin A
La utilizacin del Rango es muy limitada pues slo considera los valores
extremos y no indica como se dispersan los valores intermedios.
5.2

La Desviacin Media (DM)


Es una medida de dispersin que es el promedio aritmtico de las desviaciones
de las clases respecto de la media aritmtica
a) Desviacin Media de datos no agrupados :
Formula :
n

DM =

xi x
i =1

Donde :
xi : clase
: media aritmtica
n : nmero de clases
: Sumatoria ( desde i = 1 , hasta i = n)
Utilizando los datos del ejemplo 7 tenemos :
xi
1
2
3
4
5
X

Luis Flores Cebrin

A
3
7
46
67
81
40.6

B
20
40
46
47
51
40.6

30

La desviacin media del primer grupo es :

DMA =

3 40.6 + 7 40.6 + 46 40.6 + 67 40.6 + 81 40.6


5

DMA = 28.68
La desviacin media del grupo B :

DMB =

20 40.6 + 40 40.6 + 46 40.6 + 47 40.6 + 51 40.6


5

DMB = 8.68 aos


En otras palabras la dispersin del grupo B 2.3 veces menor que la del grupo A,
por tanto este grupo es ms homogneo o ms concentrado
b) Datos agrupados
Frmula :
n

DM =

xi x

fi

i =1

Donde :
xi : clase
: media aritmtica
n : nmero de frecuencias absolutas
fi : frecuencia absoluta
| | : Valor absoluto ( la resta debe ser siempre positiva)
Utilizamos el ejemplo N 4 - edad promedio de los clientes del Caf Bar
El Sol
Clase ( i )
1
2
3
4
5
6
7
8
9

Intervalo
19 23
23 27
27 31
31 35
35 39
39 - 43
43 47
47- 51
51- 55
Totales

xi
21
25
29
33
37
41
45
49
53

fi
5
9
13
48
67
58
54
29
17
300

| xi |
18.67
14.67
10.67
6.67
2.67
1.33
5.33
9.33
13.33

| xi | fi
93.35
132.03
138.71
320.16
178.89
77.14
287.82
270.57
226.61
1,625.28

Nota : La media aritmtica es = 39.67 aos


La desviacin media sera :

Luis Flores Cebrin

31

DM =

1,625.28
300

DM = 5.42 aos
El promedio de las desviaciones de los datos respecto a la media aritmtica es
de 5.42 aos

5.3

La Desviacin Estndar (s)


Es una medida de dispersin ms utilizada y confiable es igualmente un
promedio de las desviaciones de los datos pero elevados al cuadrado.
a) Desviacin Estndar de datos no agrupados :
Formula :
n

s =

( xi x )

i =1

Donde :
xi : clase
: media aritmtica
n : nmero de clases
: Sumatoria ( desde i = 1 , hasta i = n)
Utilizando los datos del ejemplo 7 tenemos :
xi
1
2
3
4
5

A
3
7
46
67
81
40.6

B
20
40
46
47
51
40.6

La desviacin estndar del grupo A es :

sA =

(3 40.6) 2 + (7 40.6) 2 + (46 40.6) 2 + (67 40.6) 2 + (81 40.6) 2


5

sA =31.31 aos
La desviacin estndar del grupo B :

Luis Flores Cebrin

32

sB =

(20 40.6) 2 + (40 40.6) 2 + (46 40.6) 2 + (47 40.6) 2 + (51 40.6) 2
5

sB = 10.98 aos
Estos resultados ratifican los obtenidos con la desviacin media , la diferencia
es que son ms exactos
Nota : cuando se trata de una muestra (n) en la frmula se vara el
denominador por n-1

b) Desviacin estndar de Datos agrupados


Frmula :
n

DM =

( xi x)

fi

i =1

Donde :
xi : clase
: media aritmtica
n : nmero de frecuencias absolutas
fi : frecuencia absoluta
: raiz cuadrada

Utilizamos el ejemplo N 4 - edad promedio de los clientes del Caf Bar


El Sol

Luis Flores Cebrin

33

Clase ( i )
1
2
3
4
5
6
7
8
9

Intervalo
19 23
23 27
27 31
31 35
35 39
39 - 43
43 47
47- 51
51- 55

xi
21
25
29
33
37
41
45
49
53

( xi )2
384.16
243.36
134.56
57.76
12.96
0.16
19.36
70.56
153.76

fi
5
9
13
48
67
58
54
29
17
300

( xi )2fi
1920.80
2190.24
1749.28
2772.48
868.32
9.28
1045.44
2046.24
2613.92
15,216.16

Nota : La media aritmtica es = 39.67 aos. Su desviacin estndar es :

s=

15,216.16
300

s = 7.12 aos
El promedio de las desviaciones de los datos respecto a la media aritmtica es
de 7.12 aos
5.4

El Coeficiente de variacin (CV)


Es el indicador de dispersin que se expresa en valores independientes de la
naturaleza de la variable.
Se utiliza para comparar dos o mas distribuciones cuando las unidades de
medida de las variables estn expresadas en diferentes unidades o escalas de
medida .
Comparando dos o ms distribuciones de datos , es ms homognea aquella que
tiene el menor CV
Formula :

s
CV = 100
x
Con los datos del ejemplo N 7 ( edad de dos grupos de personas ) tenemos :
indicador
s

A
31.3
40.8

B
10.98
40.8

El CV seria :

CV

Luis Flores Cebrin

31.3
=
100
40.8

10.98
=
100
40.8

= 76.72%

= 26.91%

34

El grupo de personas B tiene un indicador de dispersin que es casi la tercera


parte del grupo A, lo cual significa que es un grupo ms homogneo, menos
disperso o ms concentrado , alrededor del valor representativo, que en este
caso es la media aritmtica o edad promedio.
Dicho de otro modo, la media aritmtica del grupo B es de mejor calidad y
representatividad que la media aritmtica del grupo A.

Luis Flores Cebrin

35

También podría gustarte