Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Presentación y análisis de la
información
1.1 Naturaleza y definición de la estadística
Naturaleza de la Estadística
Los datos estadísticos son números que pueden ser comparados, analizados e
interpretados.
1. Recopilación,
2. Organización,
3. Presentación,
4. Análisis e
5. Interpretación.
Cuando se realiza la comparación entre los pasos del método Científico y los
procesos o métodos estadísticos, encontramos una analogía de pasos que se han de
seguir para resolver algo, es decir, podemos considerar los tres primeros procesos del
estudio estadístico como correspondientes al primer paso del método científico y los
restantes se corresponderán uno a uno:
•Son los lugares ubicados dentro de la •Son los lugares que se encuentran
empresa u organización cuya fuera de la empresa u organización,
información es denominada datos de los que se consiguen datos
internos, por ejemplo: los sueldos de estadísticos a través de datos
los empleados de una lista de pago, publicados o por medio de encuestas
las ventas de un diario de ventas, los de datos originales.
recibos de caja de un libro de caja de
la oficina de contabilidad de la
organización.
No sucede lo mismo con los que se recopilan, por ejemplo, en una encuesta,
pues frecuentemente necesitan ser corregidos y clasificados. La corrección se debe
hacer tanto en los registros internos o datos publicados como en los resultados de las
encuestas, las cuales pueden tener respuestas incompletas o inconsistentes, escritura
no determinable o requerimiento de cálculos, etc.
Los métodos empleados para analizar datos estadísticos son variados, desde la
simple observación de los datos hasta métodos complicados.
Análisis de series de tiempo.- Sirve para medir los cambios en los negocios y las
actividades económicas.
Ejemplo 1:
Abuso de la estadística
Distribuciones de frecuencias
Una vez recolectados los datos, es necesario organizarlos, lo cual puede ser
realizado formando grupos. Los datos que se encuentran sin agrupar deben ser menos
de treinta para que no sean difíciles de trabajar e interpretar.
Una distribución de frecuencias, o una tabla de frecuencias, es el resultado de
organizar los datos en un listado o varios grupos, es decir grupos de tamaño uno o
mayor (de más de una unidad en valor).
Listado
• Los datos están enumerados en orden ascendente o descendente.
Tabla
• Muestra el número de casos de cada dato; está formada por dos
columnas, la primera incluye los datos ordenados y la segunda el valor
frecuente de ellos.
Gráfica
• Da la información sobre cómo están diseminados los datos sobre el rango
(Diagrama de frecuencia de puntos o líneas y Diagrama de frecuencia
acumulada o Escalonada).
Ejemplo 2:
26 27 26 28 27 25 26 28
27 28 27 28 25 27 25 26
Como tales calificaciones deben organizarse en una distribución de frecuencias;
¿cuál es ésta?
Xi fi
25 3
26 4
27 5
28 4
∑ fi =16
Tabla 1
K es el número de clases
N es el número de datos
rango
Número de clases (K) =
tamañodeclase
rango
Tamaño de la clase =
númerodeclases
Algunos otros elementos para indicar esta distribución de frecuencias en una
tabla están dados por lo siguiente:
Límites reales de los intervalos de clase.- Datos que están a media unidad
arriba (abajo) del límite superior (inferior). Son aquellos que forman
clases contiguas, es decir, el límite superior de una clase es el
mismo en valor que el límite inferior de la clase siguiente superior
en valor.
Existen otros tipos de frecuencias y por consiguiente, al describir los datos con
respecto a cada una de ellas en forma individual, se generan otras tablas y otras
distribuciones tanto para datos no agrupados como para datos agrupados. Los otros
tipos son los siguientes:
Con todo esto se tiene el manejo de información para contestar preguntas sobre
cantidad y porcentaje.
Ejemplo 3: las comisiones ganadas por trece miembros del equipo de ventas en una
cierta empresa, durante el primer trimestre del año pasado fueron en dólares:
donde N=13
K = 1+3.3 log 13
= 1+3.676=4.676 # 5 clases
rango 515
Tamaño de la clase = = = 103
tamañodeclase 5
Como se pedía que la primera clase fuera de 1400 a 1500, se tomará el tamaño
de 100 y por consiguiente, al disminuir el tamaño dado teóricamente, entonces
aumentará el número de clases, así queda:
I.C. fi
1400-1500 3
1500-1600 4
1600-1700 2
1700-1800 1
1800-1900 2
1900-2000 1
Tabla 2
1.3 Representación gráfica de las distribuciones de
frecuencias
Para una distribución de frecuencias simple o cuando son datos no agrupados se
nos presentan dos tipos de gráficas, si consideramos las frecuencias absolutas y
relativas las gráficas son un diagrama de puntos o un diagrama de líneas. Para las
columnas acumulativas como son frecuencia acumulada y frecuencia relativa
acumulada la representación gráfica es una función escalonada llamada gráfica de la
distribución de frecuencias acumulativas. Se obtiene a partir del acumulamiento de un
gráfico de línea con sus respectivos valores de datos o bien haciendo una
correspondencia entre los datos y sus frecuencias acumuladas respectivas
manteniéndose constante entre dato y dato.
Un histograma es una serie de rectángulos que tienen como base en el eje X las
longitudes del tamaño de los intervalos de clase y como centros, a las marcas de clase;
y unas alturas en el eje de las Y con el valor de las frecuencias respectivas al caso que
se desee.
Frecuencias
Frecuencias acumuladas
Importaciones Número de
proveedores
(millones de $)
2-5 6
5-8 13
8-11 20
11-14 10
14-17 1
Tabla 3
Gráfica 1
Ejemplo 5:
Tiempo de Frecuencia Xi
surtido
0-5 6 2.5
5-10 7 7.5
10-15 12 12.5
15-20 8 17.5
20-25 7 22.5
∑=40
Tabla 5
1
El transcurrido entre el momento en que se recibe un pedido y el momento en que se cumple con él
No. de pedidos
14
12
10
8
Tiempo de Surtido
6
0
2.5 7.5 12.5 17.5 22.5 27.5
Gráfica 2
Diagramas circulares
Administración de
empresas
Humanidades
Ciencias Biológicas
Ciencias Físico-
matemáticas
Gráfica 3
Diagrama de disco
Es una variante del diagrama circular. Los diagramas circulares y sus variantes
circulares son medios particularmente efectivos para mostrar las distribuciones de
dinero.
Ejercicio 1:
Pictogramas
Gráfica 4
Mapas estadísticos
En vez de utilizar las alturas de las barras con el mismo ancho para representar
datos en una gráfica, pueden emplearse superficies (áreas de dos dimensiones) o
volúmenes (tres dimensiones)
Ejemplo 8:
en 1955
√¼= ½
V = ½ x ½ x ½ = 1/8 2000
en 1955 2000
√1/8= ½
3
Área: 8 x ¼ = 2
en 1965
16000
√2 = 1.41
Una gráfica de volumen sería:
Volumen: 8 x 1/8 = 1
en 1965 16000
√1=1
3
Diagrama de barras
Ejercicio 2:
Tabla 6
Ejercicio 3:
Miles de
País
toneladas
Bélgica 1247
Japón 1072
Alemania 460
Canadá 367
Francia 299
Otros 405
Tabla 7
Ejercicio 4:
Unidades producidas
Departamento
(miles)
A 400
B 250
C 150
Tabla 8
1.4 Principales características de las distribuciones de
frecuencias
Media
aritmética Mediana Moda
simple
Cuartiles,
deciles y
percentiles
o simbólicamente:
∑���� 𝑥� ∑���� 𝑓� 𝑥�
𝜇= ó𝜇
𝑁 𝑁
donde:
∑ 𝑋� 2 + 3 + 9 + 7 + 10 31
𝜇= = = = 6.2
𝑁 5 5
Es el mismo procedimiento sólo que deben ser considerados como datos las
marcas de clase de los intervalos de clase, simbólicamente:
Σ𝑓� 𝑋�
𝜇=
𝑁
Ejemplo 10:
Cantidad del Nº de
Marca de
préstamo prestamos fi Xi
Clase Xi
I.C. f
$ 300 – 699 13 499.5 6493.5
700 –1099 11 899.5 9894.5
1100 - 1499 6 1299.5 7797.0
1500 - 1899 5 1699.5 8497.5
1900 - 2299 3 2099.5 6298.5
2300 - 2699 1 2499.5 2499.5
2700 - 3099 1 2899.5 2899.5
¦f = 40 44380.0
Tabla 9
Σ𝑓� 𝑋�
𝜇=
𝑁
44380
𝜇= = $1109.50
40
Mediana
Se llama medida de tendencia central porque considera a la información desde el
enfoque de posición, específicamente desde la posición central, se tenga o no dato en
ella.
𝑁+1 𝑁 1
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑀𝑒𝑑 = 𝑋� , 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟 , 𝑖= = +
�� � ��
�
2 2 2
8 + 11
𝑀𝑒𝑑 = = 9.5 𝑙𝑎𝑣𝑎𝑑𝑜𝑟𝑎𝑠
2
8+1
𝑖= = 4.5
2
Donde la parte entera y decimal de esta posición indica los datos a elegir del
listado en esa posición para promediar si es un número par, si no dará una posición
entera y el dato en ésta será el valor de la medida.
Para datos agrupados.
�𝑁�2 − 𝑓 ∗ �𝐶
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 𝑀𝑒𝑑 = 𝐿� +
𝑓���
donde:
N/2 = Posición en la cual está la medida, a la clase que contiene el dato en esa
posición se le llama clase mediana.
Ejemplo 12:
𝑁� = 40� = 20
2 2
la clase que contiene el dato en esta posición es la 2ª. Clase es decir 700 – 1099
Cantidad del Nº de
préstamo prestamos fa
I.C. f
$ 300 - 699 13 13
Mediana 700 -1099 11 24
1100 - 1499 6 30
1500 - 1899 5 35 Tabla 10
1900 - 2299 3 38
2300 - 2699 1 39
2700 - 3099 1 40
¦f = 40
(20 − 13)400
𝑀𝑒𝑑 = 699.5 +
11
2800
= 699.5 +
11
= 699.5 + 254.54
𝑀𝑒𝑑 = 954.04
Moda
Esta medida no es la más usada en las aplicaciones dado que se basa en el dato
o datos que más se presentan en la información, en la mayoría de los casos no existe
como única. Se tienen desde el ángulo gráfico distribuciones de frecuencias unimodal,
bimodal y multimodal.
Ejemplo 13:
Sí los intervalos de clase son iguales en tamaño primero se obtiene la clase que
contiene a la medida llamada clase modal, identificándola con el número mayor de
observaciones (frecuencia mayor). Algunos estadísticos designan a la moda como si
estuviera en el punto medio de la clase modal, sin embargo, por una construcción
geométrica en el histograma de la distribución de frecuencias absolutas, es decir, por
interpolación de la clase modal y clases adyacentes se tiene la siguiente fórmula:
∆�
𝑀𝑜𝑑𝑎 = 𝐿� + � �𝑡
∆� + ∆�
donde:
t = Tamaño de la clase.
Ejemplo 14:
Tabla 11
13
𝑀𝑜𝑑𝑎 = 299.5 + � � 400
13 + 2
13
= 299.5 + � � 400
15
= 299.5 + (0.87)400
= 299.5 + 346.7
𝑀𝑜𝑑𝑎 = 646.20
Media ponderada
Cuando a cada uno de los valores en un conjunto de datos le es asignada una
ponderación de acuerdo con su importancia relativa en el grupo, la media calculada
bajo estas ponderaciones es llamada media ponderada y se obtiene de la siguiente
manera:
Σ(ωx)
𝜇=
Σω
Ejemplo 15:
Los kilómetros recorridos durante cada viaje y el número de viajes realizados por
cada uno de cinco estudiantes al venir a la escuela desde sus casas en una semana,
están dados por:
Tabla 12
Ejercicio 5:
Fuerza. de
Estado % de desempleo
trabajo
Sonora 162,300 7.8
Guanajuato 3,670 13.4
Jalisco 7,360 15.1
Tabla 13
Media geométrica
La media geométrica de un conjunto de n valores es la raíz n- ésima del producto
de los valores en el conjunto. Si hay dos valores, la raíz cuadrada del producto de éstos
es la media geométrica, si son tres, la raíz cúbica es la media geométrica y así
sucesivamente.
simbólicamente
𝐺 = ��𝑥� 𝑥� 𝑥�… 𝑥�
𝑙𝑜𝑔𝑥� + … 𝑙𝑜𝑔𝑥�
log 𝐺 =
𝑁
Σ log 𝑋
log 𝐺 =
𝑁
Ejemplo 16:
Por logaritmos:
1
= (3.577492) = 0.715598
5
log 𝐺 = 0.715598
luego
Ejercicio 6:
Una empresa ha mostrado durante los últimos cinco años los siguientes
incrementos porcentuales en su capital:
Media armónica
La media armónica es el recíproco de la media aritmética de los recíprocos de N
valores:
𝑁 𝑁
𝐻= =
Σ𝑓� (1�𝑥� ) 𝑓� �1�𝑥� � + 𝑓� �1�𝑥� � + ⋯ 𝑓� (1�𝑥� )
donde N = ¦ fi
Ejemplo 18:
I.C. Fi xi
0-2 2 1
2-4 5 3
4-6 4 5
6-8 8 7
8-10 1 9
Tabla 14
20 20
𝐻= =
1 1 1 1 5 4 8 1
2(1) + 5 �3� + 4 � � + 8 �7� + 1(9) 2 + + + +
5 3 5 7 9
20
𝐻=
2 + 1.66 + .8 + 1.143 + .111
Ejercicio 7:
Recorrido Velocidad
Kmts/hr Kmts.
Xi fi
80 50
100 30
60 20
Tabla 15
Cuartiles, Deciles y Percentiles
También son medidas de tendencia central pero referentes a posiciones
específicas de la totalidad de los datos. Son análogas a la Mediana pero con un cambio
en la fracción correspondiente, es decir, ahora no interesa dividir a la totalidad en dos
partes sino en cuatro, diez o cien.
𝑁 1 𝑖𝑁 1
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑀𝑒𝑑 = + 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝐷� = +
2 2 10 2
𝑖𝑁 1 𝑖𝑁 1
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝐶� = + 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑃� = +
4 2 100 2
Con la localización del dato en esa posición como el valor de la medida, sucede
esto si es la posición un número entero, y una interpolación de los datos en la posición
del entero y la posición inmediata siguiente. A los cuartiles 1° y 3° respectivamente se
les llama cuartil inferior y superior. Hay relaciones entre las medidas, es decir:
Med = C2 = D5 = P50
C1 = P25 y C3 = P75
Ejemplo 19: ocho empleados venderán las siguientes cantidades de lavadoras: 8, 11, 5,
14, 8, 11, 16 y 8. Se desea determinar el primer cuartil.
fi Xi
5 1
8 3
11 2
14 1
16 1
Tabla 16
Cuartil inferior
8 1 1
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝐶� = + = 2 + = 2.5
4 2 2
(8 + 8)
𝐶� = = 8 𝑙𝑎𝑣𝑎𝑑𝑜𝑟𝑎𝑠
2
�𝑁�2 − 𝑓 ∗ �𝑡
𝑀𝑒𝑑 = 𝐿� +
𝐹���
�𝑖𝑁�4 − 𝑓 ∗ �𝑡
𝐶� = 𝐿� +
𝑓��
�𝑖𝑁�10 − 𝑓 ∗ �𝑡
𝐷� = 𝐿� +
𝑓��
�𝑖𝑁�100 − 𝑓 ∗ �𝑡
𝑃� = 𝐿� +
𝑓��
Ejemplo 20:
Tabla 17
Cuartil superior C3
30 − 24
𝐶� = 1099.5 + � � 400 = 1099.5 + 400 = $1499.5
6
Tercer decil D3
12 − 0
𝐷� = 299.5 + � � 400 = 299.5 + 369.23 = 668.73
13
18 − 13
𝑃�� = 699.5 + � � 400 = 699.5 + 181.818 = $881.31
11
1.5 Medidas de Dispersión
Medidas de Dispersión Absolutas
Medidas que consideran, como su nombre lo dice, que tan alejados o cercanos
se encuentran los datos de un dato fijo, el ideal es el dato central considerado por la
media (μ). Los tipos de medida de desviación o variación son:
Desviación
Rango Varianza
media
Desviación
Desviación
estándar o
cuartílica
típica
Rango o Recorrido
Ejemplo 21:
Los siguientes datos son los sueldos mensuales que recibían cinco pasantes de
contabilidad cuando fueron contratados este año en una compañía norteamericana: $
2536, 2173, 2448, 2121, 2622 dólares. Se busca calcular el rango o recorrido.
Σ𝑓� |𝑥� − 𝜇|
𝐷. 𝑀. =
𝑁
Ejemplo 22:
Σ𝑓� |𝑥� − 𝜇|
𝐷. 𝑀. =
𝑁
|1.03 − 2.77| + |2.26 − 2.77| + |2.68 − 2.77| + |3.58 − 2.77| + |4.30 − 2.77|
=
5
Varianza o Variancia
Luego se origina una nueva medida que es la raíz cuadrada de esta varianza llamada
desviación estándar o típica. Simbólicamente es:
Σf� X� � −µ�
𝜎=�
N
Desviación Cuartílica
Al igual que el recorrido, esta medida está basada solamente en dos valores: el
primer y el tercer cuartil del grupo.
𝐶� − 𝐶�
𝐷. 𝐶. =
2
Medida de Coeficientes de
dispersión dispersión
relativa general relativa
Coeficiente de
variación
Medida de Dispersión Relativa General
𝐷𝑖𝑠𝑝𝑒𝑟𝑠𝑖ó𝑛 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎
𝐷. 𝑅. =
𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜
𝑅𝑒𝑐𝑜𝑟𝑟𝑖𝑑𝑜
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒𝑙 𝑟𝑒𝑐𝑜𝑟𝑟𝑖𝑑𝑜 =
(𝑣𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟 + 𝑣𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟)⁄2
𝐷. 𝑀.
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑚𝑒𝑑𝑖𝑎 (𝐷. 𝑀. ) =
𝜇(𝑀𝑒𝑑)
𝐷. 𝐶.
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑐𝑢𝑎𝑟𝑡í𝑙𝑖𝑐𝑎 =
(𝐶1 + 𝐶3)⁄2
Coeficiente de Variación
𝜎� 3
𝜈� = = = .021 = 2.1%
𝜇� 140
𝜎� 5
𝜈� = = = .062 = 6.2%
𝜇� 80
Por tanto, en relación con el nivel de precio promedio para cada emisión de
acciones, podemos concluir que el precio de las acciones Y ha sido casi tres veces más
variable que el precio de las acciones X. Así pues, la compra más conveniente es la de
las acciones X aunque su precio promedio es el más alto de los dos tipos de acciones.
Ejercicio 8:
Ejercicio 9:
¿Qué tubo tiene la mayor dispersión absoluta y cuál la menor dispersión relativa?
Elaborado por: