Está en la página 1de 50

Elementos bsicos de

Estadstica:
En el marco de la toma de decisiones

Curso electivo: Fundamentos Estadsticos

Edward Rogers P.

Instituto de Estudios Bancarios Guillermo Subercaseaux

Importancia de una buena decisin:

Alicia: Qu camino debo tomar?


Gato: Eso depende del lugar al que quieras ir
Alicia: No se hacia dnde me dirijo
Gato: Entonces no importa el camino que
tomes

Lewis Carrol (1872) Alicia en el Pas de


las Maravillas
ALICIA CARECE DE UN OBJETIVO CLARO

DEFINIR UN OBJETIVO CLARO ES IMPORTANTE A LA


HORA DE ENFRENTAR UN PROBLEMA , YA QUE EVITA:

Tomar decisiones equivocadas

Provocar frustracin de quien realiza la toma de decisin.

Hacer perder tiempo a las partes.

Debilitar la disposicin a esforzarse.

PREGUNTA: Sera necesaria una herramienta


estadstica a la hora de evaluar un crdito?
ESTADSTICA DESCRIPTIVA

1.1 CONCEPTOS GENERALES.


1.2 DISTRIBUCIN DE FRECUENCIAS.
1.3 REPRESENTACIONES GRFICAS.
1.4 MEDIDAS DE TENDENCIA CENTRAL.
1.5 MEDIDAS DE DISPERSIN.
1.6 MEDIDAS DE TENDENCIA NO CENTRAL
1.6 MEDIDAS DE ASIMETRA Y CURTOSIS.

ETAPAS DE UN PROBLEMA ESTADISTICO

TOMA DE
DECISIONES

TOMA DE
DECISIONES
HISTORIA EVOLUTIVA DE LA ESTADISTICA

Ao 3.050 A.C en el antiguo Egipto los Faraones recopilaron informacin de poblacin


y riquezas del Pas.

Ramses II hizo un Censo de las tierras con el objeto de verificar un nuevo reparto de
estas.

El Rey David, ordeno a Joab, general de ejrcito hacer un Censo de Israel con la
finalidad de conocer su poblacin.

Ao 2.000 A.C los Chinos ya tenan un registro minucioso de la poblacin, fortunas,


profesiones y cultivos.

Los Romanos cada 5 aos realizaban un Censo de la poblacin.

HISTORIA EVOLUTIVA DE LA ESTADISTICA

Durante los siglos XV, XVI y XVII hombres como Leonardo de Vinci, Nicols
Copernico, Neper, Descartes hicieron grandes aportes al mtodo estadstico.

En el ao 1.532 aparecen registros en Inglaterra de las defunciones, debido al temor del


Rey Enrique VIII por la peste.

En el ao 1.662 Publico un Estudio sobre Estadstica Demogrfica.


En el ao 1.749 aparece la primera obra que trataba en forma sistemtica la estadstica,
considerndola como ciencia. Su autor Godofredo Anchersen, es considerado el Padre
de la Estadstica.
HISTORIA EVOLUTIVA DE LA ESTADISTICA

Al Belga Jacques Qutelec del siglo XIX, es considerado el padre de la Estadstica


Social.

Entre el periodo 1.800 y 1.820 se desarrollan los conceptos fundamentales para la teora
Estadstica.

Laplace y Gauss aportaron respecto a la teora de los errores en la observacin


.
Los progresos mas recientes en el campo de la estadstica se refieren se refieren al
desarrollo del calculo de probabilidades.
1.2.1.1.1.1.1.1.1

II.- DEFINICION DE ESTADSTICA


La estadstica es una ciencia que estudia una serie de fenmenos no deterministas, a partir
de la recoleccin, organizacin, presentacin, anlisis e interpretacin de datos que tienen
lugar dentro de una colectividad.

Deterministas
Fenmenos
Aleatorios
No deterministas
No aleatorios
EJEMPLOS DE FENOMENOS DETERMINISTICOS

EJEMPLOS DE FENOMENOS NO DETERMINISTICOS

Otras acepciones de la palabra estadstica:


Coleccin de datos numricos ordenados y clasificados segn un determinado criterio; as
hablamos de estadsticas de produccin, de cotizaciones burstiles, demogrficas, etc.
Es una ciencia que, utilizando como instrumento a las matemticas, estudia las leyes de
comportamiento de aquellos fenmenos que dependen del azar. Generalizando estas leyes y
basndose en ellas predice e infiere resultados.
Significa la tcnica o el mtodo que se sigue para recoger, organizar, resumir, presentar,
analizar, generalizar y contrastar los resultados de las observaciones de los fenmenos reales.
La estadstica para su mejor estudio se ha dividido en dos grandes ramas: La Estadstica
descriptiva y la Inferencial
DESCRIPTIVA ( DEDUCTIVA)

ESTADISTICA

INFERENCIAL ( INDUCTIVA)

La estadstica descriptiva: Consiste en la presentacin de datos en forma de tablas y grficos.


Y no intenta inferir nada, que vaya ms all de los datos, como tales.

La estadstica Inferencial: La estadstica inferencial, investiga o analiza una poblacin


partiendo de una muestra, y su anlisis requiere de generalizaciones que van mas all de los
datos.

II. PASOS ELEMENTALES PARA UN ESTUDIO ESTADISTICO

1.- DEFINICIN O PLANTEAMIENTO DEL PROBLEMA


Al abordar una investigacin se debe tener bien definido qu se va a investigar y por qu se
pretende estudiar algo.

2.- FIJACION DE LOS OBJETIVOS


Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta dnde queremos
llegar; en otras palabras, debemos fijar cuales son nuestras metas y objetivos. Estos deben
plantearse de tal forma que no haya lugar a confusiones o ambigedades.

3.- FORMULACION DE HIPOTESIS


 Una hiptesis es ante todo, una explicacin provisional de los hechos objeto de estudio, y su
formulacin depende del conocimiento que el investigador posea sobre la poblacin
investigada.

 Una hiptesis estadstica debe ser susceptible de docimar, esto es, debe poderse probar para
su aceptacin o rechazo.
4.- LA POBLACIN Y MUESTRA A ESTUDIAR
4.1 POBLACIN
Poblacin es un conjunto formado por todos los elementos que poseen una serie de
caractersticas comunes a todos ellos.

4.2 MUESTRA

Muestra de una poblacin es un nmero ms o menos grande de elementos que forman parte de
dicha poblacin; es por tanto un subconjunto de la poblacin.

La muestra debe ser representativa de la poblacin, es decir, no debe pertenecer a un nico


sector de la poblacin y ser suficientemente grande, medido en relacin con el tamao de la
poblacin. La muestra nos proporciona una informacin parcial, en base a la cual se pueden
extender los resultados a toda la poblacin.
5.- DATOS QUE INTERESAN ESTUDIAR O ANALIZAR
5.1 Definicin de Dato: Se entiende por dato a Cualquier Caracterstica de una poblacin o
muestra que se pueda medir. Ej: Peso, edad, estatura, Frio, etc.
5.2 Tipos de datos:

CUALITATIVOS: Se los conoce como atributos, e indican una cualidad no medible


respecto a un fenmeno de investigacin. Ej: color del pelo, sexo,
profesin, etc.

CUANTITATIVOS: Tambin se les conoce como Variables, y son aquellos datos que
si se pueden medir numricamente. Ej: Edad, precio de un
producto, ingresos anuales, etc.

LOS DATOS CUALITATIVOS SE PUEDEN CLASIFICAR SEGN SU ESCALA DE


MEDICION EN:
CLASIFICACION DE LAS VARIABLES

DISCRETAS: Es aquella que solo puede tomar valores enteros


(-4, 2,8,..) Ej: Numero de hermanos, Numero de
VARIABLES hijos, etc.

CONTINUAS: Son aquellas que pueden tomar cualquier valor


dentro de un intervalo. Ej: altura de las personas
puede ser 1,65 mts o 1,653 mts, velocidad, etc.
CLASIFICACION DE LAS VARIABLES

TEMPORALES: Son aquellas que toman en cuenta el tiempo para


ejecutar las observaciones. Ej: Produccin de trigo
periodo 2005-2007; Defunciones ao 2007, etc.
VARIABLES

ATEMPORALES: Son aquellas en las cuales no es necesario tomar


el tiempo en que se producen las observaciones.
Ej: El numero de estudiantes en IEB en un
momento determinado.

CLASIFICACION DE LASVARIABLES

UNIDEMENSIONAL: Si en las observaciones de un estudio solo


interesa una variable Ej: Altura de los alumnos

VARIABLE BIDIMESIONAL: Si en las observaciones de un estudio interesan


dos variables Ej: Altura de los alumnos y su edad

MULTIDIMENSIONAL: Si en las observaciones de un estudio


interesan mas de dos variables.
Ej: Altura de los alumnos, edad y peso.
Preguntas:
Determine si cada una de las siguientes variables es cualitativa o cuantitativa:
a.- Ventas anuales
b.- Tamao de la bebida
c.- Ganancias por accin
d.- Mtodo de pago ( efectivo, cheque, tarjeta de crdito )
e.- El grupo sanguneo {A, B, AB, O}
f.- Su nivel de felicidad declarado
g.- El nmero de hijos
h.- La altura

Respuestas a las preguntas:


Determine si cada una de las siguientes variables es cualitativa o cuantitativa:
a.- Ventas anuales (Continua)
b.- Tamao de la bebida ( Pequeo, Mediano, Grande ) (ordinal)
c.- Ganancias por accin ( cualitativo-intervalo, Cuantitativo)
d.- Mtodo de pago ( efectivo, cheque, tarjeta de crdito ) (Nominal)
e.- El grupo sanguneo {A, B, AB, O}  Var. Cualitativa ( Nominal)
f.- Su nivel de felicidad declarado {Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal
g.- El nmero de hijos {0,1,2,3,...}  Var. cuantitativa discreta
h.- La altura {1,62 ; 1,74; ...}  Var. Cuantitativa continua
i.- Tonelada de embarque  Var. Cuantitativa continua
6.- LA RECOLECCIN DE DATOS:
DIRECTA: Cuando es el propio individuo el que facilita los datos, generalmente
mediante la observacin directa; registros o encuestas.

INDIRECTA: Cuando se recurre a un fichero, a un banco de datos, libros, revistas,


Internet, ONG, u otras oficinas estadsticas.

6.1 OBTENCION INDIRECTA DE DATOS:

FUENTES INTERNACIONALES DE INFORMACION ESTADISTICA:

1. CEPAL
2. FAO
3. FMI
4. OIT
5. OMS
6. UNICEF
7. ETC

FUENTES NACIONALES DE INFORMACION ESTADISTICA:

1. INE
2. ODEPA
3. INDAP
4. CAMARA CHILENA DE LA CONSTRUCCION
5. SERNATUR
6. SERNAC
8. ETC
6.2 OBTENCION DIRECTA DE DATOS:

 ENCUESTAS MUESTRALES: El proceso consiste en tomar solo una parte de la poblacin


y con la informacin obtenida extrapolar a la poblacin. Ej:
Muestra de sangre.

 CENSOS: Consiste en tratar de obtener todos los datos de una poblacin o Universo.

 Cuando no existe registro de lo que se desea estudiar, es necesario efectuar una encuesta:

1.- Alfabtica
2.- Geogrfica
7.-Clasificacin de los Datos 3.- Cronolgica
4.- Magnitud
5.- Convencin
6.- etc.
Clasificacin de la informacin
A.- Clasificacin alfabtica:
Corresponde a la clasificacin de los datos siguiendo el orden
alfabtico de los mismos. Ejemplo: Listado de los alumnos del
curso de estadsticas, nomina de trabajadores de una empresa,
etc.

B.- Clasificacin cronolgica:


Mtodo de clasificacin utilizado por ejemplo para llevar libros
contables. Donde los datos se registran en la medida que estos
van ocurriendo.

C.- Clasificacin numrica:


Es comn encontrar este mtodo de ordenacin de datos al
enumerar las calles, casas, o los diferentes cursos que forman
parte de una carrera de formacin profesional.

Clasificacin de la informacin
D.- Clasificacin por convencin:
Es una enumeracin descriptiva o nmina de mercancas, que son
objeto de comercio internacional. Por ejemplo la nomenclatura
arancelaria para denominar los vinos Cabernet Sauvignon
exportados con denominacin de origen se clasifican con la
nomenclatura 2204.2121.

E.- Clasificacin por magnitud:


Es una clasificacin de los datos desde el menor de estos hasta el
mayor o viceversa, es propia para representar ordenacin de las
notas de un curso, los salarios de los empleados de una empresa,
nivel socioeconmico de las personas, etc.

F.- Clasificacin por una caracterstica:


En este caso se toma una caracterstica ya definida y se procede
a agrupar los datos en funcin de esta. Ejemplo: clasificar al
deudor en una categora de crdito, Clasificar los empleados de
una empresa por profesin, etc.
Clasificacin de la informacin
G.- Clasificacin arbitraria:
Consiste en identificar una cualidad factible de ser cuantificada
y agruparlas en distintos estratos como fijemos
arbitrariamente. Ejemplo: Asignar un nmero a los pacientes de
una consulta mdica, segn el orden de llegada, Clasificar a los
trabajadores de una empresa por su desempeo (Bueno, malo y
regular), etc.

EJEMPLO
Identificacin del RUT Seccin Ingreso ( $)
trabajador
Mauricio
12.580.438-4 Crdito 550.000
Cabezas
Atencin
Freddy Veliz 12.900.490-3 670.000
clientes
Pamela
11.468.987-5 Hipotecarios 730.000
Contreras
Claudia Blades 7.934.234-8 Crdito 485.000

Christian Ibarra 6.897.273-9 Hipotecarios 750.000


Atencin
Pablo Mondaca 15.568.890-0 675.000
clientes
Javier Carrasco 7.895.567-2 Crdito 600.000

Se pide:

a) Clasificar la informacin en forma alfabtica.


b) Clasificar la informacin en forma numrica segn RUT.
c) Clasificar la informacin en cuanto a magnitud de los
sueldos.
d) Clasificar la informacin en forma arbitraria por seccin.
- Tabulacin, en tablas de frecuencia por
Valor o Marca de Clase
8.- Tabulacin de
los Datos
- Tabulacin en tablas de frecuencia por
intervalos
Tabulacin Por Valor: (Ejemplo N de Hijos)

Valor de los datos yi ni Ni

Limite
n= Superior

Tabulacin Por Intervalo: (Tiempo de viaje)

Limite [Li-1 - Li] yi ni Ni


Inferior

9.- Representacin grafica

n=

Tablas de frecuencia

Exponen la informacin recogida en la muestra de


manera inteligente:

Frecuencias absolutas: Contabilizan el nmero de


individuos de cada modalidad.

Frecuencias relativas (porcentajes unitarios): dem,


pero dividido por el total, normalizadas.

Frecuencias acumuladas absolutas y relativas:


Acumulan las frecuencias absolutas y relativas. Son
especialmente tiles para calcular cuantiles (como
veremos ms adelante).

38
Contenidos mnimos de una tabla estadstica de frecuencias

1.- Numeracin En la siguiente tabla presentada a continuacin, identifica los


siguientes: Numeracin, Ttulo, Encabezado, Cuerpo y Pie.
2.- Ttulo
TABLA N 2: Ventas de las empresas segn segmento, ao 2002
3.- Encabezamiento
Total ventas segn segmento
4.- Cuerpo Segmento Empresa Millones de UF Porcentaje
Microempresa 244 3,69%
5.- Pie
Pequea 673 10,17%

Mediana 626 9,46%

Grande 5.074 76,68%

TOTAL 6.617 100%

FUENTE: Leiva y otros (2002)

EJEMPLO
El gerente de una Empresa, preocupado por el pago de energa
consumida solicito al jefe de planta, un estudio del consumo diario
durante el mes de Julio. Los resultados obtenidos del consumo en
KW/hr (kilowatts por hora) son los siguientes:

9 6 8 10 9 5
7 12 11 9 7 8
10 9 12 11 6 11
9 7 5 8 10 7
10 8 10 9 6 8

Con esta informacin anterior, se pide ordenar los datos en una tabla
de distribucin de frecuencias por valor:
TABULACIN POR VALOR
Ejemplo clases

Numero de integrantes familiares en su hogar:

Valor ni Ni hi Hi

TABULACION POR INTERVALOS


El gerente de una compaa de ventas de diferentes tipos de
mercancas desea conocer el comportamiento de las llamadas
telefnicas a celulares durante los meses de marzo y abril del ao en
curso; por lo que le encomienda a su secretaria que realice esa
investigacin. La secretaria obtuvo los siguientes datos, en nmero de
llamadas por da:

30, 38, 36, 35, 29, 28, 30, 35, 40, 48, 50, 20, 25, 56, 30
27, 29, 46, 41, 31, 31, 31, 39, 28, 36, 37, 52, 44, 49, 52
56, 58, 40, 39, 38, 40, 27, 24, 30, 32, 35, 38, 26, 25, 24
60, 55, 48, 37, 31, 30, 22, 20, 24, 26, 23, 22, 28, 27, 48

a) Utiliza m= 5 ( Numero de intervalos)

b) Utiliza m=7
TABULACION POR INTERVALOS
ejemplo de clases

Intervalos yi ni Ni hi Hi

TABULACION POR INTERVALOS


ejemplo de clases

Intervalos yi ni Ni hi Hi

[20-28] 24 17 17 0,29 0,29

(28-36] 32 16 33 0,27 0,56

(36-44] 40 13 46 0,22 0,78

(44-52] 48 8 54 0,14 0,92

(52-60] 56 6 60 0,1 1,0

Totales 60 1,0
INSTITUTO DE ESTUDIOS BANCARIOS
GUILLERMO SUBERCASEAUX
Fundado en 1929

Profesor : Edward Rogers P

RESUMEN

En los captulos anteriores se defini:


ETAPAS DE UN PROBLEMA ESTADISTICO:

Definir el problema:

Objetivos:

Recoleccin de los datos:


1.- Muestreo Aleatorio Simple
Muestras representativas 2.- Muestreo estratificado
- DIRECTA: 3.- Muestreo por conglomerado
Poblacin 4.- Muestreo sistemtico

1.- Internet
- INDIRECTA 2.- Bibliografa
3.- Revistas de especialidad
4.- etc.
ETAPAS DE UN PROBLEMA ESTADISTICO

Formulacin de las encuestas de consulta:

1.- Alfabtica
2.- Geogrfica
3.- Cronolgica
Clasificacin de los Datos 4.- Magnitud
5.- Convencin
6.- etc.

- Tabulacin por Valor o Marca de Clase


Tabulacin de los Datos:
- Tabulacin por intervalos

MEDIDAS DE POSICIN
DE CENTRALIZACIN

Definicin:

Las medidas de posicin son utilizadas para describir y sintetizar


mediante un nmero nico, la posicin de un valor en la variable,
de tal forma, que represente al conjunto de valores observados.
MEDIDAS DE POSICIN
DE CENTRALIZACIN
Las medidas de posicin o de centralizacin pueden ser de dos tipos:

a) Medidas de posicin central: Que proporcionan informacin sobre los


valores medios de la serie de datos.

- Media Aritmtica o promedio o media ( y )


- Mediana
- Moda

b) Medidas de posicin no centrales: Que nos informan como se distribuye


el resto de los valores de la serie.

- Cuartiles
- Deciles
- Percentiles

MEDIDAS DE POSICIN
DE CENTRALIZACIN

DATOS NO AGRUPADOS
Media Aritmtica
promedio o media ( y ) Por Valor
DATOS AGRUPADOS
Por Intervalo
MEDIA ARITMETICA

I.1Media aritmtica para datos NO AGRUPADOS

Dado un conjunto de observaciones y1, y2,..., yn-1, yn, la media que se


representa mediante y , y se se obtiene dividiendo la suma de todos los
valores de la distribucin por el nmero total de datos:

y + y2 + ... + yn y i
y= 1 = i =1
,
n n

MEDIA ARITMETICA
Ejemplo:
Los datos representados a continuacin corresponden a los costos operacionales
en millones de pesos de 25 sucursales bancarias del Banco Ocano ubicado en
Lima, Per por concepto de publicidad mensual. Se pide calcular la Media y la
Mediana de los datos.

Costos operaciones por concepto de publicad


(Expresado en Millones de pesos)

3,0 4,0 3,0 2,0 2,0


4,0 2,0 4,0 5,0 7,0
5,0 1,0 6,0 7,0 3,0
3,0 2,0 8,0 6,0 1,0
5,0 4,0 0,0 4,0 6,0
Fuente: Banco Ocano
MEDIA ARITMETICA

a) Su media aritmtica es la suma de todas las variables y luego dividirla por el total de estas, es decir

x=
x i
= x=
97
=3,88, en promedio se gastan $ 3.880.000 de pesos es publicidad.
n 25

 Observacin:

El inconveniente que tiene la media, es que es muy sensible a los


valores extremos.

MEDIA ARITMETICA
I.2 Media aritmtica para datos AGRUPADOS POR VALOR

Para obtener la media aritmtica de los datos que se agrupan en tablas de


distribucin de frecuencia por Valor, lo primero es obtener las sumas
parciales de los productos entre yi x ni.

Luego se aplica la siguiente formula de calcculo:


m

y1 n1 + y2 n2 + ... + ym nm y n i i
y= = i =1
n n
MEDIDAS DE POSICIN
DE CENTRALIZACIN
COSTOS EN PUBLICIDAD DE LAS 25 SUCURSALES ( MILLONES DE PESOS)

0 1 1 2 2
2 2 3 3 3
3 4 4 4 4
4 5 5 5 6
6 6 7 7 8

yi ni yi x ni
(Costos) N de sucursales
0
1
2
3
4
5
6
7
8
Total n= 25 ? yi x ni =

MEDIA ARITMETICA
yi ni yi x ni
(Costos) N de sucursales
0 1 0
1 2 2
2 4 8
3 4 12
4 5 20
5 3 15
6 3 18
7 2 14
8 1 8
Total n= 25 yi x ni = 97
MEDIA ARITMETICA
I.3 Media aritmtica para datos AGRUPADOS POR INTERVALOS

En el caso que los datos estn tabulados por intervalos, al aplicar la frmula para
calcular la media aritmtica de datos agrupados, se deber trabajar con las marcas de
clases.

Para el caso de nuestro ejemplo, consideremos la tabulacin utilizando cuatro intervalos


(m=4).

Paso 1: Rango: Mximo- Mnimo = 8-0 = 8

Paso 2: Amplitud: c= Rango/Intervalo c=8/4 = 2

Paso 3: Se construye la tabla de distribucin por intervalos.

0 1 1 2 2
2 2 3 3 3
3 4 4 4 4
4 5 5 5 6
6 6 7 7 8

MEDIA ARITMETICA
0 1 1 2 2
2 2 3 3 3
3 4 4 4 4
4 5 5 5 6
6 6 7 7 8

Intervalo yi ni yi x ni
[0- 2.000.000]
(2.000.000 4.000.000]
(4.000.000 6.000.000]
(6.000.000 - 8.000.000]
n= 25 yi x ni =
MEDIA ARITMETICA

Intervalo yi ni yi x n i
[0- 2.000.000] 1.000.000 7 7.000.000
(2.000.000 4.000.000] 3.000.000 9 27.000.000
(4.000.000 6.000.000] 5.000.000 6 30.000.000
(6.000.000 - 8.000.000] 7.000.000 3 21.000.000
n= 25 yi x ni = $ 85.000.000.-

$85.000.000
y= = $3.400.000
25

MEDIA ARITMETICA

Utilizando la informacin obtenida anteriormente, se proponen dos alternativas para el


prximo mes, disminuir los costos en publicidad en un 20% a cada sucursal o reducirlos
en una cantidad fija de $ 800.000.- Como varia la Media Aritmtica? Cual alternativa
es ms conveniente, si la reduccin de costos es prioridad de la empresa?
PROPIEDADES DE LA MEDIA
ARITMETICA

k y n i i
ky = i =1
=ky
n

n
yk = yk = yk
n

MEDIA ARITMETICA

a) Si la media es de $ 3.400.000 veamos las alternativas:

1- Reducir los costos un 20% resultara un nuevo costo promedio de 3.400.000*0,8= 2.720.000.-

2.- Reducir los costos en $ 800.000.- resultara como promedio de costo


3.400.000 -800.000 =2.600.000.-

Por lo tanto conviene la alternativa 2, es decir reducir los costos en 800.000.-


MEDIA ARITMETICA PONDERADA

MEDIANA
DEFINICION: Es aquel valor de la variable que supera la mitad de
las observaciones y, a su vez, es superado por la otra mitad. Por tal
razn, se le considera como el valor central, ya que divide en dos
grupos parejos las observaciones.
MEDIANA
II.1Mediana para datos NO AGRUPADOS :

IMPORTANTE: Primero se ordenan los datos de menor a mayor y se analiza:

1.- Nmero de datos impar: en este caso, la mediana coincide con el


dato central, despus de ordenar los datos y ser:

Me = y n +1
( )
2

Esto significa que la Mediana corresponde al valor de la variable ubicada


n + 1
en la posicin .
2

2.- Nmero de datos par: en este caso, la mediana ser el promedio de


los dos valores centrales, despus de ordenar:

y n + y n
( ) ( +1)
Me = 2 2

MEDIANA
Determine la mediana de los datos considerando que estos NO ESTAN
AGRUPADOS

COSTOS EN PUBLICIDAD DE LAS 25 SUCURSALES ( MILLONES DE PESOS)

0 1 1 2 2
2 2 3 3 3
3 4 4 4 4
4 5 5 5 6
6 6 7 7 8
MEDIANA
En el caso de los costos por publicidad de las 25 sucursales, se tiene:

1.- Se ordenan los datos de menor a mayor.

0 1 1 2 2
2 2 3 3 3
3 4 4 4 4
4 5 5 5 6
6 6 7 7 8

2.- Al ser n = Impar (25 datos) la Mediana Ser:

Me = y 25+1 Me = y(13) = 4 = $4.000.000


( )
2

MEDIANA
II.2 Mediana para datos AGRUPADOS POR VALOR

En este caso se procede siguiendo los siguientes pasos:

Paso1: Se construye la tabla de distribucin de frecuencias por valor,


incluyendo la columna de las frecuencias acumuladas (Ni).

Paso 2: Determinamos el valor de n/2. (La mitad del n total de datos) en


la columna de las frecuencias absolutas acumuladas, se le denomina Ni al
valor inmediatamente superior a n/2 y al valor anterior a este, se le
denomina Ni-1. Lo anterior con la finalidad de definir a la fila i, la fila i-1.
MEDIANA
Paso 3: Encontrado Ni-1 pueden darse dos casos:

Si Ni-1 < n/2: la Mediana es el correspondiente valor de yi


(marca de clase)

Si encontramos una Ni-1 = n/2: la Me es la media aritmtica


y +y
de la yi y yi-1; Me = i i 1
2

MEDIANA
CASO DE NUESTRO EJEMPLO:
Paso1: El primer paso es construir la tabla de distribucin de frecuencias e
incluir la columna de las frecuencias acumuladas (Ni):

yi ni Ni
(Valor) Numero de sucursales Frecuencia Acumulada
0 1 1
Yi-1 1 2 3 Fila
i-1
2 4 7
3 4 11
yi
4 5 16
Fila i
5 3 19
6 3 22
7 2 24
8 1 25
n= 25
MEDIANA
Paso 2: Determinamos el valor de n/2. (La mitad del n total de datos)
n 25
Como en total son 50 los clientes el valor de = = 12, 5
2 2

Paso3: Se identifican las frecuencias absolutas acumuladas,


inmediatamente superior e inferior a este valor lo que resulta el valor de
16, que define a la fila i y el valor de 11 que definir a la fila i-1.

Paso 4: Como se cumple que Ni-1 < n/2; la Mediana es el correspondiente


valor que toma yi de la fila i; que es exactamente el caso, ya que 11 < 12,5,
por lo tanto Me = yi.

Es decir Me = 4 = $4.000.000

MEDIANA
II.3 Mediana para datos AGRUPADOS POR INTERVALOS

Intervalo yi ni Ni Fila i-1


[0- 2.000.000] 1.000.000 7 7
y i-1
(2.000.000 4.000.000] 3.000.000 9 16
(4.000.000 6.000.000] 5.000.000 6 22
Fila i
yi (6.000.000 - 8.000.000] 7.000.000 3 25
n= 25

En este caso; n 2 = 25 2 = 12, 5

Luego, el valor de la mediana ser:

M e = yi' 1 + ci
( n 2 N ) = 2.000.000 + 2.000.000 ( 25 / 2 7 ) = 3.222.222
i 1

ni 9
MODA

La moda se define como aquel valor de la


variable que presenta la mayor frecuencia
absoluta. La representaremos con el smbolo Mo
Md.

MODA
III.1Moda para datos NO AGRUPADOS :

Lo primero es ordenar los datos en una tabla de distribucin de frecuencia


por valor y luego se busca el mximo valor en la columna de las
frecuencias absolutas;
yi ni Ni
(Valor) Numero de sucursales Frecuencia Acumulada
0 1 1
1 2 3
2 4 7
3 4 11
4 5 16
5 3 19
6 3 22
7 2 24
8 1 25
n= 25
MODA
yi ni Ni
(Valor) Numero de sucursales Frecuencia Acumulada
0 1 1
1 2 3
2 4 7
3 4 11
4 5 16
5 3 19
6 3 22
7 2 24
8 1 25
n= 25

Por tanto la Mo = 4 = $4.000.000

MODA

 Observacin: Puede darse que varios valores alcancen


simultneamente el mximo en las frecuencias absolutas. Todos dichos
valores son moda; hablaremos de distribuciones bimodales, trimodales,
etc.
MODA
III.2 Moda para datos AGRUPADOS POR INTERVALOS Fila i-1

Intervalo yi ni Ni
[0- 2.000.000] 1.000.000 7 7
(2.000.000 4.000.000] 3.000.000 9 16
(4.000.000 6.000.000] 5.000.000 6 22
(6.000.000 - 8.000.000] 7.000.000 3 25
n= 25 Fila i+1

Para datos agrupados en intervalos de igual amplitud, la moda


corresponder a la marca de clase del intervalo con la mayor frecuencia
absoluta.
ni +1
M o = yi' 1 + c
ni +1 + ni 1
6
Mo = 2.000.000 + 2.000.000 = $2.923.077
6 + 7

INSTITUTO DE ESTUDIOS BANCARIOS


GUILLERMO SUBERCASEAUX
Fundado en 1929
INSTITUTO DE ESTUDIOS BANCARIOS
GUILLERMO SUBERCASEAUX
Fundado en 1929

Profesor : Edward Rogers P

MEDIDAS DE POSICIN NO CENTRALES

Medidas de posicin no centrales: Que nos informan como se distribuye


el resto de los valores de la serie.

- Cuartiles
- Deciles
- Percentiles
CUARTILES

Se denominan cuartiles a los tres valores que separan a la


distribucin en cuatro partes aproximadamente iguales.

CUARTILES

En general, para obtener el cuartil k se determina a travs de la


siguiente expresin:

Qk = yi' 1 + ci
( k n 4 N ) , con k = 1,2,3 .
i 1

ni
CUARTILES: Caso Q3

Intervalo yi ni Ni
[0- 2.000.000] 1.000.000 7 7
Fila i-1
y i-1 (2.000.000 4.000.000] 3.000.000 9 16
(4.000.000 6.000.000] 5.000.000 6 22
(6.000.000 - 8.000.000] 7.000.000 3 25
Fila i
yi n= 25

3 25 75
En este caso; = = 18, 75
4 4

Luego, el valor del primer cuartel (Q3) ser:

Q3 = yi' 1 + ci
( k4n Ni1 ) = 4.000.000 + 2.000.000 (18, 75 16 ) = 4.916.666
ni 6

DECILES

A
hora, en vez de dividir la distribucin
en cuatro partes iguales, la dividimos
en 10 partes. El primer decil (D1) es aquel valor de la variable
que supera al 10% de las observaciones y, a la vez, es
superado por el restante 90%. El proceso que sigue es similar
al de los cuartiles con la nica diferencia que ahora n se
divide por 10.

En general, para obtener el decil k, en datos agrupados se tiene lo


siguiente:

Dk = yi' 1 + ci
( k n10 N ) , con k = 1,L,9 .
i 1

ni
DECILES Caso D8

Intervalo yi ni Ni
[0- 2.000.000] 1.000.000 7 7
Fila i-1
y i-1 (2.000.000 4.000.000] 3.000.000 9 16
(4.000.000 6.000.000] 5.000.000 6 22
(6.000.000 - 8.000.000] 7.000.000 3 25
Fila i
yi n= 25

8 25 200
En este caso; = = 20
10 10

Luego, el valor del primer cuartel (D8) ser:

D8 = yi'1 + ci
( k10n N i1 ) = 4.000.000 + 2.000.000 ( 20 16 ) = 5.333.333.
ni 6

PERCENTILES

A
hora, la distribucin la dividimos en
100 partes. El primer percentil (P1) es
aquel valor de la variable que supera al 1% de las
observaciones y, a la vez, es superado por el restante 99%. El
proceso es similar a los anteriores, con la nica diferencia
que ahora n se divide por 100.

En general, para obtener el percentil k, en datos agrupados se tiene


lo siguiente:

Pk = yi' 1 + ci
( k n100 N ) , con k = 1,L,99 .
i 1

ni
PERCENTILES Caso P50

Intervalo yi ni Ni
Fila i-1
y i-1 [0- 2.000.000] 1.000.000 7 7
(2.000.000 4.000.000] 3.000.000 9 16
(4.000.000 6.000.000] 5.000.000 6 22
Fila i
yi (6.000.000 - 8.000.000] 7.000.000 3 25
n= 25

50 25 1.250
En este caso; = = 12,5
100 100

Luego, el valor del primer cuartel (P50) ser:

P50 = yi' 1 + ci
( 100
k n
Ni 1 )
= 2.000.000 + 2.000.000
(12,5 7 ) = 3.222.222.
ni 9

EJERCICIO
Clase Frecuencia
10 20 11
Los siguientes datos corresponden a las
20 30 14
30 40 21 edades de los principales ejecutivos
40 50 30 Bancarios de un Banco de la R.M
50 60 18
60 70 15
70 80 7
80 90 3
119

Construya una tabla y calcule la distribucin de frecuencias de la variable


obteniendo las frecuencias absolutas sus correspondientes acumuladas.

Calcular e interpretar: Media, Mediana y Moda de los datos.

Calcular e interpretar el cuartil 3 (Q3) y el percentil 75 (P75) y Decil 5 (D5)


EJERCICIO LABORATORIO
EMPRESA SETAS
Ao Ventas Costos
1999 167 59
2000 229 55
2001 209 54
2002 215 69
2003 227 45
2004 171 65
2005 205 46
2006 189 61
2007 209 53
2008 191 54
2009 191 53
2010 200 54

MEDIDAS DE DISPERSIN

Las medidas de dispersin estudian la proximidad o alejamiento de


los datos entre ellos respecto a la medida de centralizacin.

Las medidas de dispersin ms utilizadas son la varianza y la desviacin


tpica o estndar.
MEDIDAS DE DISPERSIN

VARIANZA:

Es una medida de dispersin relacionada con la media aritmtica, y


corresponde al resultado de la divisin de la sumatoria de las
distancias existentes entre cada dato y su media aritmtica
elevadas al cuadrado, y el nmero total de datos.
n

x 2
i
A) S = x
i =1 2
2
x Datos no agrupados
n

y 2
i ni
B) S y2 = y
i =1 2
Datos agrupados
n

VARIANZA
A) CALCULO VARIANZA DATOS NO AGRUPADOS

0 1 1 2 2
2 2 3 3 3
3 4 4 4 4
4 5 5 5 6
6 6 7 7 8

PASO 1: Calcular la media aritmtica.

y=
y i
=
97
= 3, 88
n 25
PASO 2: Calcular la varianza
n

x i
2
2 479
S =
2
x
i =1
x = S x2 = (3, 88) 2 = 4,1
n 25
VARIANZA
B) CALCULO VARIANZA DATOS AGRUPADOS POR VALOR

yi ni y i ni y i2 ni
0 1 0 0
1 2 2 2
2 4 8 16
3 4 12 36
4 5 20 80
5 3 15 75
6 3 18 108
7 2 14 98
8 1 8 64
n= 25 97 479

y 2
i ni
479
( 3,88 ) = 4,1
2 2
S =
2
y
i =1
y =
n 25

VARIANZA
C) CALCULO VARIANZA DATOS AGRUPADOS POR INTERVALOS

yi
Intervalo ni yi x ni yi2 x ni
(000.000)
[0- 2.000.000] 1 7 7.000.000 7
(2.000.000 4.000.000] 3 9 27.000.000 81
(4.000.000 6.000.000] 5 6 30.000.000 150
(6.000.000 - 8.000.000] 7 3 21.000.000 147
n= 25 $ 85.000.000.- 385

En este caso, el valor de la media y varianza ser:


4

y n i i
85.000.000
y= i =1
= = $3.400.000 = 3, 4
n 25
8

y i
2
ni
2 385
S = 2
y
i =1
y = 3, 42 = 3,84
n 25
DESVIACIN ESTNDAR

La desviacin estndar o tpica se define como la raz cuadrada de


la varianza, tomando siempre el signo positivo.

s = + S2

DESVIACIN ESTNDAR

La desviacin estndar es la medida de dispersin ms conocida,


permite comparar dos grupos de observaciones que estn
expresadas en las mismas unidades, para decidir cul de ellos tiene
mayor variabilidad.

A diferencia de la varianza, es una medida de dispersin que se


entrega en las mismas unidades que las observaciones.

Por lo tanto, mientras ms pequeo sea el valor de la desviacin


estndar, la muestra es ms homognea.
RELACIONES ENTRE LAS MEDIDAS DE
POSICION Y DE DISPERSIN

Coeficiente de variacin

El coeficiente de variacin se obtiene dividiendo la desviacin


estndar por su media, expresndose el resultado en trminos
porcentuales.

sy
cv y = 100%
y
Coeficiente de variacin

sy
cv y = 100%
y

- Muestra homognea : 0% cv y 25%

- Muestra regularmente homognea : 25% < cv y 75%

- Muestra heterognea : 75% < cv y 100%

También podría gustarte