Está en la página 1de 56

Modelos de Toma de

Decisiones

Sesión: Estadística Descriptiva &


Medidas de Tendencia Central

MSc. Ing. Ricardo Girón


MBA – Sede Villa Nueva
• La modelos estadísticos tienen que ver con
la recopilación, presentación, análisis y uso
de datos para tomar decisiones y resolver
problemas.

Ing. MSc. Ricardo Girón


• Cualquier persona recibe información en
forma de datos a través de los periódicos,
la televisión u otros medios; y a menudo
es necesario obtener alguna conclusión a
partir de la información contenida en los
datos.

Ing. MSc. Ricardo Girón


• Los métodos empleados para resumir y
organizar datos se denominan estadística
descriptiva; mientras que los métodos
para tomar decisiones se denominan
inferencia estadística.

Ing. MSc. Ricardo Girón


• El término población se refiere a los
elementos del universo respecto al cual se
quieren obtener conclusiones o tomar
decisiones. A cada elemento se le puede
asociar una medición que bien puede ser
numérica o cualitativa dependiendo de la
característica que se quiera estudiar. El
término muestra se refiere al subconjunto
de observaciones seleccionadas de la
población de interés

Ing. MSc. Ricardo Girón


Ing. MSc. Ricardo Girón
Variables:
• A cada característica de los elementos de una
población se le llama variables. Nos
encontraremos con varios tipos de variables:
cualitativas y cuantitativas.
• Las variables cualitativas son aquellas que se
refieren a categorías o atributos de los
elementos (individuos) estudiados. Las variables
cuantitativas son aquellas cuyos datos son de
tipo numérico.

Ing. MSc. Ricardo Girón


TIPOS DE VARIABLES CUALITATIVAS
• Dicotómicas: Sólo hay dos categorías, que son
excluyentes una de la otra
• Ejemplo: enfermo-sano, muerto-vivo, mujer-
hombre
• Nominal: tiene mas de dos categorías y no hay
orden entre ellas.
• Ejemplo: color de los ojos, grupo sanguíneo
• Ordinal: tiene varias categorías y hay orden
entre ellas.
• Ejemplo: grados profesionales (operarios).

Ing. MSc. Ricardo Girón


TIPOS DE VARIABLES CUANTITATIVAS
• Continuas: números infinito no numerables de
elementos. Tiene asociado el concepto de
medida
• Ejemplo: Presión arterial, edad, peso.
• Discretas: números finitos o infinitos
numerables de elementos. Se asocia con el
concepto de conteo.
• Ejemplo: N° de hijos, N° de llamadas de
atención por empleado, N ° ausencias anuales.

Ing. MSc. Ricardo Girón


Ing. MSc. Ricardo Girón
• Hay ocasiones en las que las medidas
cuantitativas continuas son transformadas
en ordinales mediante la utilización de uno
o varios puntos de corte.
• Ejemplo: La variable peso es codificada
en varias categorías y se utiliza en
términos como: Bajo-peso, peso-normal,
Sobrepeso, Obesidad

Ing. MSc. Ricardo Girón


Agrupación de Datos
• Serie Ordenada de datos:
– Punteos de notas: 88, 72, 81, 70, 75, 86
– Ordenados: 70, 72, 75, 81, 86, 88
– Se pueden observar máximos, mínimos
– El uso es Limitado

Ing. MSc. Ricardo Girón


Distribución de Frecuencias
• Ordena los datos si se dividen en clases
• Por lo general las tablas van de 5 a 20
clases
• Cada clase tiene un limite inferior y un
limite superior
• Determinacion del número de clases:
• 2↑c >= n (n = numero de observaciones)

Ing. MSc. Ricardo Girón


Distribución de Frecuencias
• Punto medio de clase: limite inferior +
limite superior / 2
• Intervalo de clase: rango de valores
encontrados dentro de una clase
• Pueden existir intervalos abiertos
• IC = Valor mas grande – Valor mas
pequeño / Numero de clases deseado

Ing. MSc. Ricardo Girón


Distribución de Frecuencias

• Distribución de frecuencia relativa:


expresa la frecuencia dentro de una clase
como % del total de observaciones
• Fr = #obs en la clase / n * 100
• Fa = frecuencia acumulada, suma de
observaciones de las clases anteriores.

Ing. MSc. Ricardo Girón


Ejemplo agrupación datos

Ing. MSc. Ricardo Girón


Ing. MSc. Ricardo Girón
Ing. MSc. Ricardo Girón
Tablas de Contingencia
• Tabla de contigencia: cuando se desea
examinar o comparar dos variables.
• Ej. Tablas pivote (Edad de pasajeros de
aerolínea vrs número de vuelos por año)
Ejercicio

Ing. MSc. Ricardo Girón


Solución

Ing. MSc. Ricardo Girón


GRÁFICAS
• HISTOGRAMA: Es un gráfico que sirve para
representar una distribución de frecuencias. Está
formada por un conjunto de rectángulos que tienen
como base un eje horizontal y como centros los puntos
medios de las clases. Los anchos de los rectángulos
son iguales a los tamaños de los intervalos de las
clases y las áreas de los rectángulos son
proporcionales a las frecuencias de las clases.
HISTOGRAMA

10

9
Series1
8
Series2
7
Series3
FRECUENCIA

6 Series4
5 Series5
4 Series6

3 Series7

0
1
PESO

Ing. MSc. Ricardo Girón


GRÁFICAS
• POLÍGONO DE FRECUENCIAS: Gráfico formado
de líneas quebradas, que tienen los centros de las
clases representadas en un eje horizontal y las
frecuencias de las clases en un eje vertical. La
frecuencia correspondiente a cada centro de clase
señala mediante un punto y luego los puntos
consecutivos se unen por líneas rectas.
POLIGONO FRECUENCIAS
10

7
FRECUENCIA

5 Series1

0
1 2 3 4 5 6
PESO

Ing. MSc. Ricardo Girón


GRÁFICAS

• OJIVA: Gráfico que representa una distribución


acumulativa de frecuencias.

OJIVA
35

30

25
FRECUENCIA

20
Series1
15

10

0
1 2 3 4 5 6
PESO

Ing. MSc. Ricardo Girón


Gráficos
• Diagrama de barras: puede mostrar
cantidades o porcentajes para dos o más
valores sobre el eje vertical
• Diagrama circular o pie: puede mostrar
proporciones (%) relativas de una variable
• Gráfico de máximos, mínimos y cierre.
– Ej. Wall Street
• Diagrama Tallo y hoja: (alternativa al
histograma) proporciona una impresión
visual rápida sobre el número de
observaciones en cada clase.
Ing. MSc. Ricardo Girón
Ejemplo Grafico max-min-cierre

Ing. MSc. Ricardo Girón


Medidas de localización (posición). Son coeficientes de
tipo promedio que tratan de representar una
determinada distribución, pueden ser de dos tipos:
1.-CENTRALES:
-Medias:
Aritmética
Ponderada
Geométrica
Armónica
-Medianas
-Moda
2.-NO CENTRALES:
Cuartiles
Deciles
Centiles o percentiles Ing. MSc. Ricardo Girón
Medidas de dispersión.
Son complementarias de las de posición en el
sentido que señalan la dispersión en conjunto de
todos los datos de la distribución respecto de la
medida o medidas de localización adoptadas.

• Recorrido intercuartílico,
• Desviación media,
• Varianza,
• Desviación típica o estándar,
• Coeficiente de variación PEARSON.

Ing. MSc. Ricardo Girón


Medidas de forma

Estudian la asimetría- simetría y deformación


(apuntamiento, aplastamiento) respecto de una
distribución modelo denominada distribución
NORMAL

Coeficiente de asimetría y coeficiente de Curtosis.

Ing. MSc. Ricardo Girón


MEDIA ARITMÉTICA: Es la suma de todos los
valores de la variable dividida entre el número
total de elementos de la muestra.
n n
 xi X =  x i fi
x 1 + x 2 + x 3 + ....x n −1 + x n i =1
X= = i =1
n n

Ing. MSc. Ricardo Girón


Ejemplo: Si tenemos la siguiente distribución, se pide hallar la
media aritmética, de los siguientes datos expresados en kg.

xi fi xi fi
54 2 108
59 3 177
63 4 252
64 1 64
TOTAL 10 601

X=
 xn i i
=
601
= 60.1kg
n 10

Ing. MSc. Ricardo Girón


Quiz

Ing. MSc. Ricardo Girón


Solución

Ing. MSc. Ricardo Girón


Promedio datos agrupados
(saldo promedio 600 cuentas bancarias)

Ing. MSc. Ricardo Girón


Ing. MSc. Ricardo Girón
Ing. MSc. Ricardo Girón
MEDIA ARITMÉTICA PONDERADA: En ocasiones no todos los valores de la
variable tienen el mismo peso. Esta importancia que asignamos a cada variable, es
independiente de la frecuencia absoluta que tenga. Será como un aumento del valor
de esa variable, en tantas veces como consideremos su peso.
Es la media aritmética que se utiliza cuando a cada valor de la variable (xi) se le
otorga una ponderación o peso distinto de la frecuencia o repetición. Para poder
calcularla se tendrá que tener en cuenta las ponderaciones de cada uno de los
valores que tenga la variable

Se la suele representar como:

Siendo wi la ponderación de la variable xi y

w i
la suma de todas las ponderaciones.

Ing. MSc. Ricardo Girón


Ejemplo 1

Ing. MSc. Ricardo Girón


Solución

Ing. MSc. Ricardo Girón


Ejemplo: Un estudiante realiza 3 exámenes de complejidad
creciente, obteniendo los siguientes resultados: 5, 8 y 7.
El primer examen lo hizo en ½ hora, el segundo en 1 hora
y el tercero en hora y media, por lo que se les atribuye
una ponderación de 1, 2 y 3 respectivamente. Se pide
calcular la nota media.

Xi fi Wi xi wi
5 1 1 5
8 1 2 16
7 1 3 21
TOTAL 3 N=6 42

Ing. MSc. Ricardo Girón


Si calculamos la media aritmética tendremos que :
X=
 xn i i
=
5+8+7
= 6.67
n 3
Ahora bien, si calculamos la media ponderada, obtendremos:

xw =
(5x1) + (8x 2) + (7x 3) = 5 + 16 + 21 = 42 = 7
(1+ 2 + 3) 6 6

Ing. MSc. Ricardo Girón


Media geométrica y armónica.
a) Media geométrica: Responde a la siguiente expresión

G = n x 1n1 x 2n2 x 3n2 ......x knk


y se le puede definir, como la raíz n-ésima del producto de todos los
valores de la variable. También la podemos representar como:
1
n1 n2 n3 nk n
G = ( x 1 x 2 x 3 .......x k )
n i lg x i
sabiendo que lo podemos expresar en notación compacta: G = anti lg  n

El logaritmo de la media geométrica es la media aritmética de los logaritmos de los valores de


la variable. El problema se presenta cuando algún valor es 0 ó negativo y exponente de la
raíz par ya que no exista raíz par de un número negativo.
Suele utilizarse cuando los valores de la variable siguen una progresión geométrica. También
para promediar porcentajes, tasas, nº índices, etc. siempre que nos vengan dados en
porcentajes.
Ing. MSc. Ricardo Girón
NOTA: En muchas ocasiones, los valores de la distribución nos
impiden poder efectuar los cálculos al exceder la capacidad de la
calculadora.

Ing. MSc. Ricardo Girón


Ejemplo: Hallar la media geométrica de la siguiente
distribución:
xi fi
100 10
120 5
125 4
140 3
n = 22

lg G =
 n i lg x i
por lo tanto será conveniente ampliar la tabla con lo que nos quedará
n
xi fi lg xi fi * lg xi
100 10 lg 100 = 2 20
120 5 lg 120 = 2.079 10,396
125 4 lg 125 = 2.097 8,387
140 3 lg 140 = 2.146 6,438
TOTAL n = 22 45.221
Ing. MSc. Ricardo Girón
lg G =  n lg x
i i
=
45.221
= 2.056
n 22

G = anti lg. 2.0555 = 113.632


NOTA: En la calculadora el antilogaritmo se halla apretando la tecla
SHIFT log x

Ing. MSc. Ricardo Girón


Media armónica. La representaremos como H: Es la inversa de la media aritmética de las inversas de
n n
los valores de la variable, responde a la siguiente expresión: H= =
ni n1 n 2 n 3
 x x + x + x + ....
i 1 21 3
Se utiliza para promediar velocidades, tiempos, rendimiento, etc. (cuando influyen los
valores pequeños). Su problema: cuando algún valor de la variable es 0 o próximo a cero
no se puede calcular.

Ejemplo: calcular la media armónica de la siguiente distribución:


xi fi
100 10
120 5
125 4
140 3

Para poder hallarla, es necesario que calculemos el inverso de x y el inverso de la


frecuencia por lo que ampliaremos la tabla con 2 columnas adicionales :
Ing. MSc. Ricardo Girón
xi fi 1/xi fi/xi Xi * fi
100 10 1/100 0.1 1000
120 5 1/120 0.042 600
125 4 1/125 0.032 500
140 3 1/140 0.021 420
N= 22 0.195 2520

n 22
H= = = 112.82
ni 0.195
x  xn 2520
i X= i i
= = 114.545
n 22
Entre la media aritmética la media geométrica y media armónica se da siempre la siguiente
relación:

H G  X
Ing. MSc. Ricardo Girón
MEDIANA: Me
La mediana o valor mediano será el valor de la variable que separa en dos grupos los valores
de las variables, ordenadas de menor a mayor. Por tanto es una cantidad que nos indica orden
dentro de la ordenación.
n
El lugar que ocupa se determina dividiendo el nº de valores entre 2:
2
Cuando hay un número impar de valores de la variable, la mediana será justo el valor
de orden central, aquel cuya frecuencia absoluta acumulada coincida con n
n 2
Es decir: N i −1   N i  Me = x i
2
Por tanto la mediana coincide con un valor de la variable.
El problema está cuando haya un número par de valores de la variable.
Si al calcular n
2
resulta que es un valor menor que una frecuencia absoluta acumulada, el valor de la mediana será aquel valor de la
variable cuya frecuencia absoluta cumpla la misma condición anterior:
n
N i −1   N i  Me = x i
2
N
Por el contrario si coincide que 2 = N i para obtener la mediana realizaremos el
x i + x i +1
siguiente cálculo Me =
2
Ejemplo: Sea la distribución

xi fi Fa
1 3 3
2 4 7
5 9 16
7 10 26
10 7 33
13 2 35
n = 35

n 35
Lugar que ocupa = = 17.5
2 2
x 1 + x i +1 5 + 7
Lugar que ocupa = 32/2 = 16 ==> Me = = =6
2 2
Notar que en este caso se podría haber producido que hubiera una
frecuencia absoluta acumulada superior a 16. En este caso se calcularía
como en el ejemplo anterior.
Ing. MSc. Ricardo Girón
MODA: Mo
Será el valor de la variable que más veces se repite, es decir, el valor que tenga
mayor frecuencia absoluta.
Pueden existir distribuciones con más de una moda: bimodales, trimodales, etc.
En las distribuciones sin agrupar, la obtención de la moda es inmediata.
Ejemplo: xi fi
1 2
2 7
3 5
4 7
5 4

Moda {2, 4}, en este caso tenemos una distribución bimodal.

En los supuestos que la distribución venga dada en intervalos, es decir, sea agrupada, se pueden producir dos
casos: que tengan la misma amplitud, o que esta sea distinta.
Si tienen la misma amplitud, en primer lugar tendremos que encontrar el intervalo modal, será aquel que tendrá
mayor frecuencia absoluta [ L , L )
i −1 i
Posteriormente realizaremos el siguiente cálculo: n i +1
Mo = L i −1 + ai
n i −1 + n i +1
Ing. MSc. Ricardo Girón
Ing. MSc. Ricardo Girón
MEDIDAS DE TENDENCIA CENTRAL
• DATOS AGRUPADOS: Cuando la
cantidad de datos es grande, es
conveniente agrupar los datos en
distribuciones de frecuencias según
tema anterior.
• MEDIA O PROMEDIO: El valor del
punto medio de la clase, como valor
de las observaciones de los datos de
la tabla de frecuencias.
1880
x= = 62.67
30 Ing. MSc. Ricardo Girón
MEDIDAS DE TENDENCIA CENTRAL
• MEDIANA: Para su calculo se utiliza la siguiente
formula:
(n / 2 − fa)
Me = Li + c
f
Li= límite real inferior de la clase mediana.
N= numero de datos o sumatoria de frecuencias.
fa= Frecuencias acumulada anterior a la clase
mediana.
f= frecuencia de la clase mediana.
La clase mediana se determina por n/2 y
observando la frecuencia acumulada.

Ing. MSc. Ricardo Girón


MEDIDAS DE TENDENCIA CENTRAL
• MODA: Para su calculo se utiliza la siguiente
formula:
(d1)
Mo = Li + c
(d1 + d 2)
Li= limite real inferior de la clase modal.
d1= frecuencia de la clase modal menos
frecuencia anterior.
d2= frecuencia de la clase modal menos
frecuencia posterior.
c= amplitud de clase.
La clase modal es la que tiene la más alta
frecuencia.
Ing. MSc. Ricardo Girón
Aplicación según datos
• NO AGRUPADOS
– Media aritmética: sumatoria simple de datos.
– Media Ponderada: sumatoria pesos * (X)
– Media Geométrica: sumatoria log(X) *
frecuencias
– Media Armónica: sumatoria frecuencia / (X)
– Mediana: valor que está en la posición que divide
al conjunto de datos, justo por la mitad. (n / 2).
Verificar si muestra es PAR o IMPAR.
– Moda: valor que más se repite en el conjunto de
datos (puede ser uno o mas)
Ing. MSc. Ricardo Girón
Aplicación según datos
• AGRUPADOS
– Media: usar puntos medios de clase y
frecuencias (pm * f)
– Mediana: buscar la clase o rango que contenga
la mediana, en la columna Fa. (mayor o igual
que n/2).
– Moda: buscar la clase modal, aquella que
tenga la frecuencia mas alta.
– Otras Medias: no se pueden calcular, aunque
se pueden hacer aproximaciones con los pm.

Ing. MSc. Ricardo Girón

También podría gustarte