Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Modulo de Estadística Aplicado A Las Organizaciones PDF
Modulo de Estadística Aplicado A Las Organizaciones PDF
Modulo de Estadística Aplicado A Las Organizaciones PDF
Pág
INTRODUCCION 6
Instrucciones para el estudiante 8
Sugerencias para el Tutor 10
Objetivos 11
Autoevaluación de entrada 12
Trabajo final 15
UNIDAD 1 16
Tema: GENERALIDADES 17
1.1. Objetivo 17
1.2. Conceptos de Estadística 17
1.3. Importancia de ubicación histórica de la estadística 18
1.4. Utilidad de la estadística para las Empresas 18
1.5. Papel de la estadística en la Investigación 19
1.6. Nivel de aplicación de la estadística 20
1.7. Estadística descriptiva e inferencial y otros conceptos 21
1.8. Autoevaluación 23
1.9. Bibliografía recomendada 23
UNIDAD 2 24
Tema: DISTRIBUCIONES UNIDIMENSIONALES 25
2.1 Objetivo 25
2.2 Recolección de la información 25
2.3 Tabulación de los datos 25
2.4 Distribución de Frecuencias 27
2.5 Autoevaluación 33
2.6 Bibliografía recomendada 34
UNIDAD 3 35
Tema: ELABORACION DE GRAFICAS 36
3.1 Objetivo 36
3.2 Gráficas 36
3.2.1 Diagrama de barras 37
3.2.2 Diagramas Circulares 38
3.2.3 Diagramas de Frecuencias 40
3.2.4 Histogramas 42
3.2.5 Polígonos 42
3.2.6 Ojivas 43
3.2.7 Otras gráficas 46
3.3 Autoevaluación 47
3.4 Bibliografía recomendada 48
UNIDAD 4 49
Tema: ESTADIGRAFOS DE POSICION 50
4.1 Objetivos 50
4.2 Estadigrafos de posición 50
4.2.1 Media Aritmética 51
4.2.2 Mediana 55
4.2.3 Moda 58
4.2.4 Media Ponderada 59
4.2.5 Media geométrica 60
4.3 Autoevaluación 61
4.4 Bibliografía recomendada 61
UNIDAD 5 62
Tema: ESTADIGRAFOS DE DISPERSION O DE VARIABILIDAD 63
5.1 Objetivos 63
5.2 Estadigrafos de dispersión 63
5.2.1 Rango 63
5.2.2 Desviación Media 64
5.2.3 Varianza 66
5.2.4 Desviación típica 67
5.2.5 Coeficiente de Variación 70
5.3 Teorema de Chebyshev 71
5.4 Autoevaluación 71
5.5 Bibliografía recomendada 72
UNIDAD 6 73
7. AUTOEVALUACION DE SALIDA 85
GLOSARIO 86
BIBLIOGRAFIA 87
INTRODUCCION
Teniendo en cuenta el desarrollo del contenido del módulo, está determinado por
unas instrucciones metodológicas que permiten lograr a través de un
procedimiento lógico, el estudio de cada de las unidades que lo conforman. Los
objetivos generales y específicos definen lo que se busca con el estudio de la
asignatura y presentan una autoevaluación de entrada y otra de salida, con el fin
de conocer el nivel de conocimientos en que se encuentran.
En cada una de las unidades del módulo, encontrarán el objetivo concreto que
deben alcanzar, que para nuestro caso se ha dividido en tres partes, que son: una
que comprende las generalidades, la segunda trata sobre las distribuciones
unidimensionales y la última sobre las series cronológicas.
En cada una de las unidades del módulo, aparece una bibliografía que se
recomienda sea consultada, pero al final se presenta una bibliografía general de la
materia de estadística, que se encuentran en las bibliotecas que funcionan en la
ciudad; un glosario de términos de uso estadístico en las seis unidades que
conforman el módulo y que le pueden ser de gran utilidad.
La separación anterior se hace con el fin metodológico, para que usted haga un
esfuerzo por resolver los problemas y las preguntas que se hacen en cada una de
las autoevaluaciones y no que consciente o inconscientemente observe en las
páginas siguientes la respuesta al cuestionario que se ha formulado, lo que indica
que si no tiene claridad para resolver una pregunta usted se ve en la necesidad de
consultar y estudiar nuevamente el tema donde se le presenta un nivel de
dificultad, que viene a redundar en su beneficio.
INSTRUCCIONES PARA EL ESTUDIANTE
4. Partiendo que el éxito del estudio, depende de gran medida del trabajo
colectivo del conocimiento, es por esta razón, que se deben fortalecer los
Círculos de Participación Académica y Social (CIPAS), con el fin de alcanzar
los objetivos propuestos.
Programe los ejercicios para cada tutoría de acuerdo con los temas, y prepárese
para resolver las dudas.
Desarrolle los ejercicios de refuerzo y solicite a los estudiantes las respuestas por
escrito para que pueda hacerles seguimiento y así determinar su progreso.
De usted depende en gran parte el éxito de este módulo y de los usuarios del
mismo.
OBJETIVOS
OBJETIVO GENERAL
OBJETIVOS ESPECIFICOS:
CUESTIONARIO
Gerente $1.555.000.oo
Subgerente 1.250.000.oo
Jefe de Producción 1.200.000.oo
Contador 1.150.000.oo
Tesorero 1.100.000.oo
Secretaria de gerencia 550.000.oo
Vendedor 450.000.oo
Conductor 400.000.oo
Mensajero 300.000.oo
Aseadora 285.000.oo
a. Elabore la tabla de distribución de frecuencias para la característica en
estudio de la empresa.
b. Cuál es el promedio de los sueldos que paga la empresa de acuerdo a los
puestos de trabajo registrados.
c. El salario que se gana el Tesorero, que proporción le corresponde frente al
total de pagos que hace la empresa.
d. Construya la gráfica correspondiente.
$2000 – 5000 – 10000 – 2000 – 20000 – 50000 –10000 – 20000 – 2000 - 10000 –
20000 – 5000 – 10000 – 20000 – 5000 – 20000 – 10000 – 2000 – 10000 – 1000 –
500 - 200 – 100 – 500 – 1000 – 2000 - $2000 – 5000 – 10000 – 2000 – 20000 –
50000 –10000 – 20000 – 2000 - 10000 – 20000 – 5000 –$2000 – 5000 – 10000 –
2000 – 20000 – 50000 –10000 – 20000 – 2000 - 10000 – 20000 – 5000 –10000 –
20000 – 5000 – 20000 – 10000 – 2000 – 10000 – 1000 – 500 - 200 – 100 – 500 –
1000 –10000 – 20000 – 5000 – 20000 – 10000 – 2000 – 10000 – 1000 – 500 - 200 –
100 – 500 – 1000 –2000 - $2000 – 5000 – 10000 – 2000 – 20000 – 50000 –10000 –
20000 – 2000 - 10000 – 20000 –2000 - $2000 – 5000 – 10000 – 2000 – 20000 –
50000 –10000 – 20000 – 2000 – 100 – 500.
1990 $ 520
1991 680
1992 760
1993 896
1994 1.125
1995 1250
1996 1285
1997 1296
1998 1298
1999 1302
GENERALIDADES
1.1 OBJETIVO
1.8 AUTOEVALUACION
GENERALIDADES
1.1 OBJETIVO:
La estadística ha sido definida por varios autores, con el fin de llegar de poder
llegar a unos criterios propios que nos de una noción de lo que es la estadística,
frente al análisis de los hechos, situaciones y fenómenos que se estudien.
Tomemos algunos de estos conceptos para adentrarnos en materia:
“Se entiende todo tratamiento de los datos destinado a resumir o describir alguna
de sus características importantes sin intentar inferir más allá de los datos”. Jhon
E. Freud y Frank Williams.
“La estadística estudia los métodos Científicos para recoger, organizar, resumir y
analizar datos, así como para sacar conclusiones válidas y tomar decisiones
razonables basadas en tal análisis” Murray R. Spiegel.
Aún más hoy en día donde la globalización ha afectado el mercado y este cada día
se hace más competitivo, por lo tanto los empresarios deben tener un buen manejo
de la información, para poder tomar decisiones adecuadas frente a la
incertidumbre que se presenta día a día.
La palabra método, tiene raíces etimológicas del griego Methodos que quiere
decir camino. Toda ciencia aplica un método adecuado para llegar a formular
teorías, principios, leyes e hipótesis, que la caracterizan como tal, siempre y
cuando sean comprobables, generales y fundamentadas, para que no se caiga en el
plano de las especulaciones y de los juicios a priori, sin ninguna base que sustente
los conceptos que sean emitidos.
Cualquier tipo de investigación conlleva a cumplir por lo general a que se den los
siguientes pasos:
La estadística como tal es una sola. Pero hay que tener en cuenta la aplicación que
se puede dar en el tratamiento de los datos, donde se pueden presentar diferentes
formas de utilizarla, de acuerdo a los objetivos que se busquen en una
investigación o estudio determinado.
Un objeto de estudio es una realidad existente en el mundo que nos rodea, siendo
la base para determinar su conformación, conocer las diferentes causas que lo
originan y los posibles efectos que pueda tener en la relación con este medio
ambiente; en estadística siempre vamos a hablar de un determinado objeto en
estudio de donde partimos para el análisis respectivo.
Una población se define como el estudio de todas las características y valores que
tenga un conjunto bien identificado de elementos que la conforman, y que viene a
ser un objeto en estudio. Es importante clarificar que el concepto de población no
se le puede dar el significado solamente al que hace referencia a las personas que
conforman una comunidad, sino que se debe entender como un todo que involucra
cosas, objetos, actividades, operaciones, áreas, personas, animales, entre otros.
Qué es una muestra?
Qué es un atributo?
Variable discreta: Es aquella que solo puede tomar valores enteros; no admite
valores fraccionarios. Como ejemplos: el número de empleados de una empresa,
el número de estudiantes en el semestre que usted actualmente cursa.
1.8.5 Identifique las características más sobresalientes del grupo que seleccionó
el CIPAS, el tipo de variables que van a analizar, el tratamiento que le
dieron a los datos y presenten los resultados obtenidos al tutor y al grupo
al que pertenecen.
DISTRIBUCIONES UNIDIMENSIONALES
2.1 OBJETIVO
2.5 AUTOEVALUACION
DISTRIBUCIONES UNIDIMENSIONALES
2.1 OBJETIVO
Existen dos clases de datos que se pueden recolectar; el primero corresponde a las
características propias del objeto observado, recibiendo el nombre de atributo y el
segundo corresponde a la expresión numérica del mismo objeto en estudio, por lo
cual se le denomina variable.
Es el conteo que se hace a cada uno de los datos que se han recolectado, para
poderlos clasificar de acuerdo a los criterios que se hayan definido previamente,
con el fin de ordenarlos en forma lógica, teniendo en cuenta las características y
variables que hacen parte del objeto en estudio, con el fin de facilitar el manejo de
los mismos.
EJEMPLO 1:
Como usted puede observar, que los datos recolectados para el estudio del
comportamiento de los clientes del banco, se presentan de dos clases para el
mismo objeto, la primera corresponde al tipo de cuenta correntista o sea a una
característica de los clientes: hombres, mujeres, sociedades anónimas, sociedades
de responsabilidad limitada, empresas individuales y sociedades colectivas; que
es la parte cualitativa del objeto observado, es decir son los atributos a analizar.
HOMBRES //////////// 12
MUJERES /////// 7
SOCIEDADES ANONIMAS /// 3
SOCIEDADES LTDA. //////// 8
EMPRESAS INDIVIDUALES ////// 6
EMPRESAS COLECTIVAS //// 4
___
TOTAL 40
EJERCICIO 1:
Se toma una muestra de ocho entidades financieras que funcionan en Bogotá, para
conocer el número de sucursales que tienen en el departamento, obteniendo el
siguiente resultado:
El nombre de las entidades financieras, son los atributos para el ejercicio que se
propone, mientras que el número de sucursales que cada entidad tiene es la
frecuencia o sea las veces que aparece una entidad en los municipios del
departamento de Cundinamarca
TABLA 1: Distribución del número de sucursales que tienen ocho entidades financieras del
Departamento de Cundinamarca..
Si interpretamos a n4, que es igual a 5, esto quiere decir que Davivienda tiene
cinco sucursales en el Departamento de Cundinamarca, también podemos decir
que las cinco sucursales que tiene Davivienda corresponden al 3% de las
sucursales existentes en el departamento de Cundinamarca, de la muestra tomada.
EJERCICIO 2:
Hay que tener en cuenta que los saldos se tomaron en miles de pesos, para poder
manejar más fácil los datos recolectados, usted va tener que trabajar con una gran
cantidad de datos, pero si los lleva a cifras que permitan un procesamiento
manual práctico, puede obtener los resultados satisfactorios. Otra cosa es que los
datos se procesen en computador, esta máquina hace las operaciones y entrega
consolidados.
Xmín = $370.000.oo
Para el caso del valor que debe tomar X1 es de $571.000.oo, o sea el promedio del
intervalo, así sucesivamente puede continuar calculando los demás valores que tiene la
variable, hasta llegar a X8, que son el número de marcas de clase definido.
6. para determinar los valores que toman los límites superiores en cada intervalo
de las marcas de clase, sumamos al valor mínimo que toma la variable, en
nuestro caso $369.000.oo, el valor que hemos calculado para la amplitud que
es de $404.000.oo y así sucesivamente seguimos con cada marca de clase
hasta llegar a la última o sea al máximo valor que toma la variable en estudio
tenemos:
Xi-1 - Xi = 369 + 404.0 = 773.0 para X1
.
.
. 3.1793.0 + 404 = 3.601.0 para X8
Así, quedan incluidos todos los valores que se ha tomado la muestra de los
saldos de los deudores del banco, quedando concluido los pasos necesarios
para poder entrar a elaborar la tabla de distribución de las frecuencias para
las variables continuas.
Xi-1 - Xi Xi ni hi Ni Hi
Como usted puede observar, a los límites inferiores de cada una de las marcas
de clase se les asignó 0.5 , con el fin de evitar ambigüedades en los datos
recolectados.
h3 = 0.10 El 10% de los saldos de los créditos otorgados por el banco, están comprendidos
entre $1.177.500 y $1.581.000.oo con un promedio de $1.379.000.oo
N4 = 38 Existen 38 créditos otorgados por el banco, que tienen un saldo igual o menor a
$1.985.000.oo, o también se puede decir, que existen 38 saldos de los créditos
otorgados que están comprendidos entre $369.500.oo y $1.985.000.oo
H6 = 0.84 El 84% de los créditos otorgados por el banco tienen saldos menores o iguales a
$2.793.000.oo. O se puede decir que el 84% de los créditos otorgados tienen
saldos comprendidos entre $369.500.oo y $2.793.000.oo.
Usted puede seguir interpretando los demás resultados que aparecen en la tabla 2, para
que se le facilite entender cualquier otra información
2.5 AUTOEVALUACION
MARTINEZ B., Ciro. Estadística comercial. Editorial norma, 1981 pp. 34 a las
48.
MARTINEZ B., Ciro. Estadística apuntes y 600 problemas resueltos. Edición 3a,
1984 pp 35 a las 43.
ELABORACION DE GRAFICAS
3.1 OBJETIVO
3.2 GRAFICAS
3.2.4 HISTOGRAMAS
3.2.5 POLIGONOS
3.2.6 OJIVAS
3.3 AUTOEVALUACION
ELABORACION DE GRAFICAS
3.1 OBJETIVO
3.2 GRAFICAS
1. Diagrama: Son las gráficas que se utilizan para representar los datos
de los atributos y de las variables discretas y se ilustran a través de
barras y circulares.
2. Histogramas: Son las gráficas que se utilizan para representar los datos
de las variables continuas, para las frecuencias absolutas y relativas
solamente; su ilustración es a través de rectángulos continuos de
acuerdo al número de intervalo que tenga la información recolectada.
3. Polígonos: Son las gráficas que se utilizan para representar los datos de
las variables continuas, para las frecuencias absolutas y relativas; su
ilustración se hace partiendo de los puntos medios definidos en los
intervalos en la tabla de distribución de frecuencias.
4. Ojivas: Son las gráficas que se utilizan para representar los datos de las
variables continuas, para las frecuencias absolutas acumuladas y
relativas acumuladas, su ilustración se hace a através de líneas que
unen los datos acumulados.
5. Otras gráficas: Las otras gráficas que se utilizan para representar los
datos de las tablas de distribución de frecuencias son: Pictogramas,
cartogramas, pirámides y gráficas de gantt, entre otras de importancia.
Los datos los tomamos de las tablas de distribución de frecuencias que es la fuente
básica para representar gráficamente las observaciones realizadas a una situación,
fenómeno o hecho registrable, teniendo en cuenta la utilización correcta del plano
cartesiano. A continuación vamos a analizar cada una de las gráficas que se usan
para representar los datos.
Mientras que el eje de las abscisas, se aprovecha para representar los valores que
toma la variable discreta, Xi. Tanto para las frecuencias como para la variable, se
debe de definir la escala correspondiente a tener en cuenta para la construcción de
la gráfica.
Hay que tener en cuenta que para representar los valores de las frecuencias, la
escala siempre inicia por cero hasta el máximo valor que tome la frecuencia para
cada caso; para el caso de los valores que toma la variable se debe tener en cuenta
que la escala varía de acuerdo de los datos que se estén tomando, y para los
atributos se tiene en cuenta las características que se van a representar,
conservando siempre homogeneidad.
Tomemos los datos del ejemplo 1, sobre el tipo de cuentas corrientes de acuerdo a
las personas clientes del banco Y, teniendo claro que el número de personas
naturales y jurídicas es la frecuencia para el atributo del tipo de cuenta corriente,
sacando esa información tenemos los siguientes datos para representarlo:
CUENTACORRENTISTA PERSONAS PORCENTAJE
HOMBRES 12 0.30
MUJERES 7 0.18
SOCIEDADES ANONIMAS 3 0.07
SOCIEDADES LTDA. 8 0.20
EMPRESAS INDIVIDUALES 6 0.15
EMPRESAS COLECTIVAS 4 0.10
___ ____
TOTAL 40 1.0
GRAFICA 1: Distribución de las cuentas corrientes que tienen los clientes en el Banco Y, de una
Muestra que se tomo para el estudio.
12
H
10 O
M
8
B S
O
6 R C
M
U I
E L N
J D
4 E T I
S D C
R V
E A I O
2 D L
S S U E
A C
L T
A
0
Para elaborar este tipo de gráfica se toma como base la circunferencia de 360º,
teniendo en cuenta que debemos de convertir los valores de la frecuencia en
grados, utilizando una regla de tres simple podemos hacer la conversión con el fin
de conocer el valor del ángulo para cada una de las frecuencias suministradas en
la tabla y así poder sacar la distribución que tendrían los datos en la ilustración.
ENTIDADES Frecuencia
FINANCIERAS Relativa ( hi )
Banco de Bogotá 0.26 ( h1 ) Si el 100% son 360º 360º * 23%
Banco Cafetero 0.20 ( h2 ) 26% X X = ---------------- = 82.8º
Concasa 0.05 ( h3 ) 100%
Davivienda 0.03 ( h4 ) Para cada uno de los valores relativos que toma el
Megabanco 0.07 ( h5 ) atributo o la variable se calcula de la misma manera.
Banco de Colombia 0.24 ( h6 )
Banco de Santander 0.07 ( h7 ) A continuación se representa la gráfica elaborada en
Banco del Estado 0.08 ( h8 ) computador, utilizando Excel.
1.00
1
2
3
4
5
6
7
8
Si analizamos la gráfica, podemos observar que los bancos que tienen más
sucursales son el de Bogotá, Colombia y Cafetero.
Usted, con sus compañeros de CIPAS, pueden ver la prensa nacional y revistas
especializadas en la parte económica, financiera y relacionada con temas de
interés de su carrera, analizar e interpretar la forma como estan presentadas
gráficamente y socializarlas en la tutoría con el tutor y los demás estudiantes.
Son las gráficas que representan los datos de las variables discretas, la ilustración
se hace a través de barras que se construyen teniendo en cuenta los valores que
tienen las frecuencias absolutas y relativas para el eje vertical del plano cartesiano
que vienen a quedar en forma paralela al mismo eje y para la variable se toma el
eje horizontal donde se registran los valores correspondientes.
50
FRECUENCIA ABSOLUTA ni
40
30
Serie1
20
10
0
1 2 3 4 5 6 7 8
ENTIDADES FINANCIERAS Xi
0.3
ni
0.25
FRECUENCIA RELATIVA
0.2
0.15 Serie1
0.1
0.05
0
1 2 3 4 5 6 7 8
ENTIDADES FINANCIERAS Xi
Como ustedes pueden observar las gráficas 3 y 4 que representan los valores que
toman las frecuencias absolutas y relativas, frente a la variable discreta en estudio,
se presenta que la figura es la misma, pero la diferencia existe en que los valores
de la escala para una y otra frecuencia, varían porque se toman en la absoluta los
datos de las veces que se registraron las observaciones, mientras que para la
relativa se toma el porcentaje para cada dato.
3.2.5 HISTOGRAMAS
Los histogramas son gráficas que se utilizan para representar los datos de las
variables continuas y su construcción se hace a partir de un conjunto continuo de
rectángulos verticales teniendo en cuenta la amplitud de los intervalos en cada una
de las marcas de clase que se han definido y las áreas proporcionales a los valores
de las frecuencias que representan en el estudio realizado.
Es necesario tener en cuenta que los histogramas se utilizan para las variables
continuas, pero solamente para las frecuencias absolutas y relativas.
3.2.6 POLIGONOS
Los polígonos son gráficas que se utilizan para representar los valores de las
frecuencias absolutas y relativas de las variables continuas, lo cual es otra
ilustración de los datos recolectados para este tipo de variable y que permite la
construcción de una figura diferente a los histogramas.
Los polígonos son diagramas de línea y que se elaboran tomando como base los
histogramas, pero cambiando la escala en eje horizontal o sea en los valores que
toma la variable, ya que se tienen que tener en cuenta los puntos medios de los
intervalos, que es el valor que toma la Xi, en cada una de las marcas de clase, y
que ustedes ya saben calcular.
Las ojivas son las gráficas que representan a las frecuencias absolutas acumuladas
y relativas acumuladas para las variables continuas, reciben este nombre porque
su forma se parece a la de una ojiva de un arco gótico; además permite conocer
cuando los datos quedan por encima o por debajo de ciertos valores
predeterminados en el objeto en estudio.
Xi-1 - Xi Ni
Para la construcción de la ojiva menor que, se puede observar que para el primer
valor de la frecuencia absoluta acumulada no existe ninguna cantidad
determinada, o sea que para el dato menor que 369 se le asigna cero ( 0 ), porque
la muestra que se recolectó no se encontró un saldo por debajo de ese valor que
tomó la variable en estudio.
60
40
30 Serie1
20
10
0
0 2000 4000
Xi-1 - Xi
60
50
40
Ni
30 Serie1
20
10
0
0 2000 4000
Xi-1 - Xi
PICTOGRAMAS
Este Tipo de gráfico representa los datos estadísticos a través de dibujos que
ilustran los objetos de la realidad, con el fin de dar una imagen a las personas que
las observen sobre la información que se está estudiando, para explicar por sí
misma los resultados obtenidos.
CARTOGRAMAS
PIRAMIDES
Las pirámides son gráficos que se utilizan figuras triangulares, que determinan
áreas proporcionales a los datos recolectados en observaciones realizadas,
definiendo las convenciones necesarias para la interpretación por parte de las
personas que los consulten, su utilización es menor que las anteriores gráficas
definidas.
LA GRAFICA DE GANNT
Ustedes encontrarán en las empresas bien organizadas este tipo de cuadros, que
les permite conocer rápidamente el cumplimiento de lo previsto en un plan
definido o por el contrario los atrasos que se han tenido en el cumplimiento de la
programación que dan la alerta correspondiente.
3.5 AUTOEVALUACION
3.5.3 Gráfique los datos que aparecen en las tablas de frecuencias resultantes
del tercer problema de la autoevaluación 2 que corresponde a las estaturas
en pulgadas de las empleadas de una empresa. Analice e interprete
3.6 BIBLIOGRAFIA RECOMENDADA
MARTINEZ B., Ciro. Estadística Comercial. Editorial Norma, 1981, Bogotá. pp.
49 a 63.
UNIDAD 4
ESTADIGRAFOS DE POSICION
4.1 OBJETIVO
4.2.2 LA MEDIANA
4.2.3 LA MODA
4.3 AUTOEVALUACION
ESTADIGRAFOS DE POSICION
4.1 OBJETIVO
Esta unidad le permite reducir los datos recolectados para un estudio determinado,
agrupándolos a través de medidas estadísticas, con el fin de dar descripciones
apropiadas y representando el conjunto de las observaciones mediante un solo
número, que viene a mostrar la concentración de los valores o sea el punto medio
de los mismos.
Los estadígrafos de posición también se les conoce con los nombres de medidas
de tendencia central, medidas de centralización, de cualquier manera como se les
llama en estadística siempre hacen referencia a los valores típicos de la
distribución de frecuencias analizadas en un estudio.
Para calcular la media aritmética se debe tener en cuenta si las observaciones que
se están trabajando corresponden a una población en estudio o a una muestra de la
población. Si la información que se tiene es de una población, se utiliza la letra
griega mu ( ) y si es una muestra, se representa por el símbolo de una barra
sobre la letra alfabeto X, o también por la letra Y.
= Media poblacional
Xi _ Xi _
= ---------- X = ----------- X = Media muestral
N n
X = Sumatoria de todas
las observaciones
Para calcular la media muestral hay que tener en cuenta que tipo de dato se está
procesando, como existen dos tipos de datos, unos que son los datos no agrupados
( un listado de valores ) y el otro que son los datos agrupados ( cuando se
acumulan los valores a través de frecuencias ), teniendo claro lo anterior tenemos
las siguientes fórmulas:
_ Xi
4.2.2.1 Media aritmética para datos no agrupados: X = --------------
_ n
X = Media muestral
Xi = Sumatoria de todos los valores de la muestra
Xi = X1 + X2 + X3 + X4 + X5 + X6
Xi = 22 + 28 + 31 + 19 + 24 + 26
Xi = 150 años; la suma de las seis observaciones son de 150 años de edad
_ Xi 150
X = ---------- = ---------- = 25 años
N 6
_
X = Promedio de edad de la muestra
Xi = Sumatoria de las edades de los estudiantes seleccionados al azar
n = Número de estudiantes de la muestra que se les tomó la información
Esto quiere decir que el promedio de edad entre los seis estudiantes del curso es
de 25 años, si tomamos más información la media puede variar por los nuevos
datos que se tomen en la muestra.
_ Xi 176
X = ---------- = ---------- = 22
n 8
_
X = Promedio de las sucursales por entidad financiera
Xi = Sumatoria del número de sucursales que tienen las entidades financieras.
n = Número de entidades financieras que se tomó como muestra para el estudio
_ Xi ni
4.2.2.2 Media aritmética para datos agrupados: X = --------------
n
_
X = Media aritmética o promedio muestral
Xi ni = Sumatoria del producto de cada una de las variables por su frecuencia en cada
una de las observaciones realizadas en el estudio.
n = Número total de observaciones realizadas en el estudio.
EJERCICIO 2
571 21 11.991
975 11 10.725
1379 5 6.895
1783 1 1.783
2187 3 6.551
2591 1 2.591
2995 4 11.980
3399 4 13.295
50 ___ ______
50 66.122
i=1
Tenemos que el producto de la variable ( Xi ) por cada una de las frecuencias (ni )
al sumarlo nos da:
50
Xi ni = 66.122 ; n = 50
i=1
_ Xi ni 66.122
X = -------------- = ----------- = 1.322,44
n 50
El promedio se puede calcular para cualquier conjunto de datos numéricos, porque intervienen
todos los valores observados, lo que indica que siempre existe para la información cuantitativa
que se recolecte.
Es relativamente fiable si se toman varias muestras de una misma población en estudio, sus
medias tienden a diferir menos entre sí, lo que es bastante estable de una muestra a otra en sus
promedios.
La suma de las desviaciones que se presentan en los valores originales que toma la variable en
las observaciones con respecto a la media aritmética de los mismos es igual a cero.
Un conjunto de datos numéricos tiene solamente una media aritmética exacta y diferentes
promedios estimados.
La a media aritmética tiene en cuenta cada uno de los valores individualmente, mostrando su
desviación respecto al promedio calculado o punto medio.
4.2.2 LA MEDIANA
Qué es la mediana?
La mediana es una medida de tendencia central, que determina el valor que cae en
el centro de los datos, cuando las observaciones están colocadas en el orden de
magnitud. Esto quiere decir que los datos estén ordenados en forma ascendente o
descendente para poder seleccionar aquel valor que ocupe el centro de las
observaciones recolectadas.
La mediana para datos no agrupados
EJERCICIO 3
Un banco aplica las siguientes tasas de interés a sus clientes para los créditos que
solicitan: 24%, 36%, 32%, 26%, 28%, 21%, 30%; lo primero que hacemos es
ordenar los datos recolectados:
21% - 24% - 26% - 28% - 30% - 32% - 36%
n + 1 7 + 1
Podemos aplicar la siguiente fórmula: Me = --------- = --------------- = 4
2 2
Esto quiere decir que el lugar que ocupa el cuarto lugar en el ordenamiento de las
observaciones recolectadas es la mediana, para el caso del ejercicio es la tasa de
interés del 28%, que es el dato que supera a las otras tres tasas de interés y a su
vez es superada por igual número de tasas de interés de un mayor valor.
EJERCICIO 4
Los siguiente datos corresponden a las notas obtenidas por un estudiante en los
exámenes finales de seis asignaturas: 3.6, 4.2, 4.6, 3.8, 3.4, 4.4,
Ordenándolos tenemos: 3.4 - 3.6 - 3.8 - 4.2 - 4.4 - 4.6
N + 1 6 + 1
Aplicando la fórmula tenemos: Me = ------------ = ------------- = 3.5
2 2
Lo que quiere decir que el valor de la mediana se encuentra ocupando el lugar
entre el tercero y cuarto dato recolectado en el estudio, pero como necesitamos
saber el valor que toma la mediana, entonces promediamos los datos cuantitativos
que tienen las observaciones que están al centro de la información así:
3.8 + 4.2
Me = ----------------- = 4.0
2
Interpretación: Decimos que 4.0 es el valor que supera a las notas de menor valor
y es superada por igual número de notas de un valor mayor.
EJERCICIO 5
Xi-1 - Xi Xi ni hi Ni Hi
53 - 55 54 2 2/50 2 2/50
56 - 58 57 5 5/50 7 7/50
59 - 61 60 9 9/50 16 16/50
62 - 64 63 15 15/50 31 31/50
65 - 67 66 12 12/50 43 43/50
68 - 70 69 5 5/50 48 48/50
71 - 73 72 2 2/50 50 1.000
4.2.3 LA MODA
Qué es la moda?
La moda es un estadígrafo de posición que representa el valor que ocurre con más
frecuencia en un conjunto de datos recolectados en un estudio determinado.
Es una distribución de frecuencias que asume que la moda está entre la marca de
clase que representa un mayor agrupamiento de los datos recolectados o el valor
de la variable que más se repite en las observaciones.
( 92 – 86 )
Mo = 600 + ------------------------------ * 100 Mo = 600 + ( 0.16 ) ( 100 ) = 616
( 92 – 86 ) + ( 92 – 60 )
EJERCICIO 7
La media ponderada es de 3.6, esto quiere decir que la nota obtenida por el
estudiante en definitiva le corresponde tres punto seis en la materia de estadística
del programa de administración de empresas.
EJERCICIO 8
El incremento de los salarios para el año 2000 fue del 10% ponderado y para 1999
fue del 16% ponderado, cuál ha sido el incremento salarial en promedio
geométrico para los dos años.?
2 _____________ 2 _____
Mg = ( 10 ) ( 16 ) Mg = 160 = 12.65%
4.3 AUTOEVALUACION
ESTADIGRAFOS DE POSICION
5.1 OBJETIVOS
5.2.1 RANGO
5.2.3 LA VARIANZA
5.4 AUTOEVALUACION
ESTADIGRAFOS DE POSICION
5.1 OBJETIVOS
Los estadígrafos de dispersión son los que miden el grado de variación de los
valores que toman los datos cuantitativos de las observaciones recolectadas y que
se conocen como variables. También se les conoce con el nombre de medidas de
variabilidad ya que podemos conocer la variación de cada uno de los valores que
toma la variable con relación a su punto medio.
5.2.1 RANGO
Qué es el rango
El rango es la diferencia que existe entre el dato de mayor valor menos el dato de
menor valor en un conjunto de información, en otros términos es la diferencia que
se presenta entre el límite superior menos el límite inferior de los valores que
toma la variable en estudio, donde tenemos:
R = Xmáx - Xmín.
Variable en estudio = Xi = saldos de los créditos que se tomaron de las tarjetas de los deudores al
banco.
Xmín = $370.000.oo
El rango o variación que presentan los sal dos es de $3.230.000.oo entre el saldo
mayor y el menor. Como se puede apreciar al tomar los límites se están
incluyendo todos los valores que toma la variable.
La desviación media es la que señala cómo los valores que toman los datos
observados se dispersan con relación a un punto central de l total de la
información recolectada, teniendo como base las medidas de tendencia central,
con el fin de poder hacer las comparaciones y así conocer la variabilidad de los
datos.
Para calcular la desviación media se tiene en cuenta los valores absolutos de la
diferencia de cada una de las observaciones menos el promedio de esos mismos
datos (media aritmética), sin tener en cuenta el signo correspondiente a cada
operación efectuada, utilizando las siguientes fórmulas:
_
Xi - X
Dm = -------------------- ; para datos no agrupados _
n Xi - X = Valores absolutos de las
diferencias.
Xi =Variable en estudio de las observaciones
Xi - X ni ni = Es la frecuencia o veces que se repite la
Dm = -------------------- ; para datos agrupados observación
n n =Número total de observaciones obtenidas.
_
X =Media aritmética de las observaciones en
en estudio.
EJERCICIO 1
Se conocen los ingresos obtenidos por una empresa financiera por el concepto de
intereses, en un período de una semana, con el siguiente comportamiento: Lunes
$1.800.500; martes $930.640; miércoles $1.110.100; jueves $1.132.870; viernes
2.212..500; cuál es el rango de los intervalos recolectados por la empresa?
5.2.3 LA VARIANZA
Qué es la varianza?
La varianza está determinada por S², para una muestra cualquiera, y para la
población “ ² ” , las unidades de los datos recolectados se dan al cuadrado como
en el caso de las tasas de interés que vendrían a ser al “cuadrado” , siendo irreal
esta interpretación; los sueldos devengados por los empleados de una empresa
están dados en pesos, su unidad de medida y su varianza sería pesos al cuadrado,
entre otros, esta situación viene a presentar dificultades para un análisis
descriptivo de la información que se tenga de los resultados, pero la varianza es
necesario calcularla para poder llegar a otra medida de dispersión como es la
desviación típica.
_
( Xi - X )² ni
S = ----------------------- ; Para datos agrupados
n - 1
La fórmula de la varianza de la población es:
2 ( Xi - )²
= ------------------------- ; Para datos no agrupados
N
Para tener una mayor claridad y poder entender mejor el cálculo de la varianza a
través de la aplicación de la fórmula es importante estudiar simultáneamente el
estadígrafo de dispersión denominado desviación típica, a través de un ejercicio
que nos permita apreciar la utilización de las fórmulas para cada medida de
dispersión.
Las fórmulas que se utilizan para poder calcular la desviación típica o estándar
para una muestra cualquiera son:
______ _________________
______ ____________________
_________ _____________________
= ² = (Xi - )²
EJERCICIO 2
Al tomar los índices del precio al consumidor durante los años de 1993 hasta el
año 1998 en Colombia, según datos oficiales del DANE, presentan el siguiente
comportamiento:
Tabla 5: Distribución de los índices de precio al consumidor durante los años de 1.993 – 1.998 en
Colombia.
_ _ _
Xi X ( Xi – X ) ( Xi – X )²
Cuál es la varianza para el índice de precios al consumidor durante estos seis años
en Colombia?
20.0772
S² = ------------ = 4.01544
6-1
La varianza es del 4.01544 por ciento al cuadrado de los índices de los precios al
consumidor durante los años de 1993 a 1998 en Colombia.
___________
S = 4.01544 = 2.0038563
La dispersión de los índices de los precios al consumidor durante los años de 1993
a 1998 en Colombia es del 2.00%.
30
25
Serie1
PORCENTAJE
20
Serie2
15
Serie3
10
Serie4
5
0
0 5 10
AÑOS
Fuente: EL TIEMPO
S
Cv = ------- * 100
_
X
Si tomamos como base el ejercicio anterior, podemos calcular el coeficiente de
variación
__
X = 20.25 Promedio de los índices al consumidor de los años de 1993 a
1998
S = 2.00 Dispersión del índice de los precios al consumidor.
2.00
Cv = ----------- * 100 = 9.8765%
20.25
La variación relativa de los precios al consumidor según los índices de los precios
al consumidor durante 1993 a 1998 en Colombia es de 9.8765%.
5.4 AUTOEVALUACION
5.5 BIBLIOGRAFIA
MARTINEZ B., Ciro. Estadística apuntes y 600 problemas resueltos. Edición 3a,
1984, pp. 147 a la 203.
SERIES CRONOLOGICAS
6.1 OBJETIVO
6.3 AUTOEVALUACION
6.4 BIBLIOGRAFIA
UNIDAD 6
SERIES CRONOLOGICAS
6.1 OBJETIVO
Las series cronológicas son importantes por el registro histórico de una empresa,
es el reflejo de las operaciones y actividades desarrolladas en un momento y
tiempo definido. Para el caso del programa, es indispensable contar con esta
herramienta para la toma de decisiones, ya que los cambios económicos
permanentes afectan directamente al mundo empresarial.
Con el análisis de los datos a través del tiempo, se busca medir la tendencia que se
puede presentar por las siguientes causas principales:
Esta método se aplica cuando la tendencia describe una línea recta y se conoce
con el nombre de tendencias lineales. Parar desarrollar el método tenemos que
aplicar la ecuación general de la línea recta:
Y* = a + bX
__ XY
a = Y; b = ---------------
X²
Qué es la conversión del tiempo?
Por cualquiera de las dos fórmulas se puede calcular el promedio de los años,
siendo 1994.5, lo que quiere decir que está comprendido entre 1994 y 1995, este
promedio se lo restamos a cada uno de los años que se tomaron para el estudio,
luego lo multiplicamos por dos debido a que cada año tiene dos semestres, para
convertir los años en semestres y así poder trabajar con números enteros.
Donde: Y = F(X)
Para poder hacer las proyecciones de los años futuros, hay que tener en cuenta que
el año a estimar, le restamos el año promedio que se tomó como base, por ejemplo
queremos conocer los posibles gastos que se generarían en la empresa en el año
2007. Procedemos así:
X = 2007 - 1995 = 12
Lo que indica que para el año 2007, la empresa tendría unos gastos aproximados
de $ 518.230.000.oo, si continua con el mismo comportamiento de crecimiento.
Es un dato significativo para la toma de decisiones en la empresa.
500
400
Yi
300 Serie1
PESOS (millones)
Serie2
200
Serie3
100 Serie4
0
-1001985 1990 1995 2000 2005
AÑOS Xi
Para localizar cada uno de los puntos originales, tomamos los valores que se
recolectaron, tanto para la variable independiente como para la variable
dependiente, que aparece en la tabla 6 donde se muestra la tendencia de los datos
de los años que se registraron, luego procedemos a gráficar el resultado obtenido
en la fórmula para la tendencia lineal de la siguiente manera:
Y* = 151.27 + 30.58 ( 2 ) = 212.43; cuando X = 2 para el año 1997
Y* = 151.27 + 30.58 (-2 ) = 90.11; cuando X = -2 para el año 1993
Y* = a + bX + cX²
Si tomamos como base los datos de la tabla 6, solamente tenemos que calcular los
valores para X² y X4, con el fin de aplicarlas las ecuaciones anteriores, así:
4
X Y X² X² Y X
-5 64 25 1600 625
-4 69 16 1104 256
-3 72 9 648 81
-2 80 4 320 16
-1 86 1 86 1
0 92 0 0 0
1 95 1 95 1
2 108 4 432 16
3 277 9 2493 81
4 325 16 5200 256
5 396 25 9900 625
____ ____ _______ ______
1664 110 21878 1958
Tenemos:
- 16.640 = - 110 a - 1.100 c
21.878 = 110 a + 1.958 c
______________________________
5.238 = 0 858 c
5.238
c = --------- = 6.10
858
Ahora ajustamos todos los puntos de la variable dependiente, para poder construir
la tendencia curvilínea, así:
Las fluctuaciones cíclicas son las variaciones de los datos en una serie de tiempo
que tiende a fluctuar por encima o por debajo de la línea de tendencia secular, en
períodos que estan comprendidos por más de un año, pero en el mismo intervalo
de tiempo que se esté analizando.
Para qué sirven las fluctuaciones cíclicas?
2. Todas las empresas planean; el llevar los registros de los ciclos de las
operaciones, permite mediciones típicas de acuerdo al comportamiento de los
datos, con el fin de hacer unos pronósticos que se aproximen a la realidad futura.
METODO RESIDUAL
Tomamos los datos del ejercicio anterior, tenemos que el método residual permite
conocer las variaciones relativas de cada uno de los puntos de la variable
dependiente, como el comportamiento curvilíneo, trabajamos con esos resultados:
AÑOS y y* PORCENTAJE
64
Tendencia relativa (1990) = --------- . 100 = 71.13
89.97
396
Tendencia relativa (2000) = ----------- . 100 = 100.08
395.67
Analizando los porcentajes (tendencia relativa), vemos que solamente los datos
puntuales ajustados en los años 1990, 1996 y 1997 son los que presentan una
fluctuación cíclica por encima de la línea de tendencia real de los datos
observados, mientras que los demás datos puntuales ajustados de los otros años,
estan por debajo de la línea de tendencia real.
Son los que miden qué tanto fluctúa una variable a través del tiempo, pero
también permite conocer los cambios que se generan en un conjunto de variables
relacionadas entre sí.
Qué tipos de números índices se conocen?
Existen principalmente tres tipos de números índices que son los más comunes y
utilizados en los análisis económicos, como son el índice de los precios, el índice
de las cantidades y el índice de valor.
Mide las fluctuaciones que se presentan en las cantidades de las operaciones de las
empresas en un determinado tiempo. El caso más común para las empresas
financieras está dado por el volúmen de clientes activos y de los posibles clientes
potenciales que puedan hacer uso de los servicios que presta la entidad.
Indice de valor
6.3 AUTOEVALUACION
6.4 BIBLIOGRAFIA
INTERVALO: Distancia que existe entre dos puntos extremos llamados límites.
MARTINEZ B., Ciro. Estadística apuntes y 600 problemas resueltos. Edición 3a,
1984.
CUN
CUN
2001