Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Derivada 4.0 Internacional de Creative Commons. Para ver una copia de esta licencia, visite
http://creativecommons.org/licenses/by-nc-nd/4.0/.
2|P á gin a
Curso: Estadística para la Administración
Facultad de Ciencia, Tecnología e Industria
Universidad Galileo
Unidad 1
Conceptos Básicos y Estadística Descriptiva
Introducción
En esta unidad presentaremos conceptos básicos de Estadística, pues por experiencia hemos
comprobado que hay conceptos que no están claros para el profesional y por ello cuando debe
aplicar herramientas estadísticas no sabe a cuál recurrir, muchas de las veces se tiene inseguridad
si el dato es una variable o un atributo por Ej. y ello dificulta la escogencia de las herramientas
adecuadas.
Objetivos
• Comprender los conceptos básicos de Estadística con el propósito de que el estudiante cuando
avance en el conocimiento estadístico pueda escoger las herramientas adecuadas: Estadística,
Población, Característica, variable, atributo, Serie.
• Repasar los conceptos básicos de Estadística Descriptiva haciendo aplicaciones prácticas.
Temario
Unidad 1
Conceptos Básicos y Estadística Descriptiva
1. Conceptos Básicos
2. Estadística Descriptiva
2.1. Medidas de Posición
2.2. Medidas de Dispersión
2.3. Medidas de Forma
2.4. Estadística Descriptiva usando Excel
3|P á gin a
Es la ciencia que da normas que permiten reducir a unas medidas características un conjunto de
información numérica, convirtiéndolo en valores susceptibles de análisis.
ESTADÍSTICAS. Son observaciones numéricas o datos de una población, que dan a conocer las
características de la misma.
4|P á gin a
SERIE. Es un ordenamiento de datos numéricos, en orden creciente o decreciente, (sin considerar
que existan repeticiones o no).
DISTRIBUCIÓN DE FRECUENCIAS. Es un ordenamiento tabular de datos numéricos, según una
agrupación en clases y las correspondientes frecuencias en las mismas.
PASOS PARA FORMAR LAS DISTRIBUCIONES DE FRECUENCIAS.
a) Ordenamiento de los datos.
b) Determinar la amplitud de la distribución o amplitud de la variable = R. (también conocida
como Rango, Oscilación o Recorrido de la variable); lo cual se logra haciendo la diferencia
entre los límites superior e inferior de la variable, más uno.
c) Determinar la amplitud del intervalo de clase constante: c. Puede usarse la fórmula de
Sturgess para obtener esta amplitud, si no es satisfactoria entonces puede usarse otra
cantidad que se adapte mejor a nuestras exigencias o a los principios estadísticos.
5|P á gin a
LIMITE DE CLASE. La escritura 21 – 29 se denomina Clase o intervalo de clase. Los números 21 y
29 se conocen como límites discretos de clase, así 21 será el límite discreto inferior de la clase y
29 será el límite discreto superior de la clase. Para la aproximación de los intervalos, se utilizan
los denominados límites reales de clase, que se indican con un decimal 0.5 de menos y 0.5 de más
en el límite discreto superior de la respectiva clase, en el ejemplo 21 – 29, el límite real inferior
es: 20.5 y el límite real superior es 29.5.
AMPLITUD DEL INTERVALO DE UNA CLASE. Es la diferencia entre los límites reales superior e
inferior de la misma. También se puede obtener tal amplitud, haciendo la diferencia entre los
límites discretos superior e inferior de la clase, más uno.
VALOR CENTRAL O PUNTO MEDIO DE UNA CLASE. Se obtiene sumando los límites inferior y
superior (reales o discretos) de la clase y dividiendo entre dos. Por razones del análisis estadístico-
matemático posterior a la agrupación de los datos, todas las observaciones que pertenecen a una
determinada clase, se hacen coincidir con el valor central o punto medio de esa clase. Así en la
clase 21 – 29 todos los datos que pertenecen a esa, se consideran que son de valor 25 que es su
punto medio.
GRÁFICAS PARA LAS DISTRIBUCIONES DE FRECUENCIAS.
25
20
15
TRABAJADORES
10
5
0
21-29 30-38 39-37 48-56 57-65 66-74 75-83 84-92
PIEZAS ACEPTABLES
6|P á gin a
• Polígono de frecuencias. Gráfico formado de líneas quebradas, que tienen los centros de
las clases representadas en un eje horizontal (eje de las X) y las frecuencias de las clases
en un eje vertical (eje de las Y). La frecuencia correspondiente a cada centro de clase se
señala mediante un punto y luego los puntos consecutivos se unen por líneas rectas.
25
TRABAJADORES
20
15
10
5
0
21-29 30-38 39-37 48-56 57-65 66-74 75-83 84-92
PIEZAS ACEPTABLES
• Circular.
21-29
30-38
39-37
48-56
57-65
66-74
75-83
84-92
7|P á gin a
• Ojiva. Gráfico que representa una distribución acumulativa de frecuencias.
TRABAJADORES 120
100
80
60 Serie1
40
20
0
21-29 30-38 39-37 48-56 57-65 66-74 75-83 84-92
PIEZAS ACEPTABLES
Es el valor equidistante entre el grupo de mayor valor y el punto de menor valor de una serie de
datos, la forma de calcularla es la siguiente:
n
xi
x= i =1
n
Propiedades de la media aritmética.
8|P á gin a
−
( xi − x) = 0
• Si en una serie de datos estos aparecen multiplicados por un valor K, la media nueva será
la media anterior multiplicada por la constante.
• Si en una serie de datos estos aparecen sumados por un valor h constante, la media nueva
será la media anterior más h.
Suponga que en una tienda se venden 3 marcas de jugo de naranja a Q. 4.10, 4.20, y 4.30 y que
en un día cualquiera se vendieron latas de los tres precios. El precio medio de venta por lata sería:
4.20. A primera vista parecería que el valor es bastante representativo, pero si además se sabe
que se vendieron 23 latas de 4.20, 72 latas de 4.10 y 5 latas de 4.30 el precio medio de lata vendida
en ese día sería:
(23 x 4.20) + (72 x 4.10) + (5 x 4.30)
23 + 72 +5
Media ponderada = 4.13
9|P á gin a
Es el valor que divide en dos partes iguales a una serie de datos finitos. Para encontrar la mediana
es necesario ordenar los datos, y pueden ocurrir dos casos:
• Que el número de datos sea impar: la mediana será el valor central de la serie.
• Que el número de datos sea par: Entonces la mediana será la media aritmética de los
valores centrales.
Ejemplo: 2, 4, 7, 25, 39, 47 La mediana es 16 o sea la media de 7 y 25.
Es el valor que ocurre con más frecuencia en una serie de datos. Ej: 1, 5, 6, 6, 7, 8, 9 La moda es
igual a 6. En algunas series como 1, 2, 3, 4, 5, 7, 8 no existe moda y la distribución se denomina:
amodal, hay algunas otras series donde existen más de una moda y la distribución entonces toma
el nombre de Bimodal, Trimodal, etc. Según sea el caso.
DATOS AGRUPADOS. Cuando la cantidad de datos es grande, es conveniente agrupar los datos
en distribuciones de frecuencias.
Tabla 3.
Hoja de Cálculo para Medidas de Posición.
Productividad 100 Trabajadores, Piezas Aceptables
10 | P á g i n a
Dónde:
f = Frecuencia simple.
F = Frecuencia acumulada
Al presentarse los datos en una tabla de frecuencia, no es posible conocer los valores de cada una
de las observaciones, pero sí las categorías en las cuales se hallan. Para poder calcular la media,
se supondrá que, dentro de cada categoría, las observaciones se distribuyen uniformemente
alrededor del punto medio de la clase.
El cálculo de la media se realiza mediante la siguiente fórmula:
n
fxi n
−
x= i =1
− fxi
n
x= i =1
fi
i =1
n
− 5515
x= = 55.15
100
11 | P á g i n a
Para su cálculo se utiliza la siguiente fórmula:
(n / 2 − fa)
Me = Li + c
f
(100 / 2 − 32)
Me = 47.5 + 9
23
Mediana = 54.54
Dónde:
Li= límite real inferior de la clase modal.
12 | P á g i n a
d1= 23-16 = 7
d2= 23-18 = 5
(7)
Mo = 47.5 + 9
(7 + 5)
Moda = 52.75
− −
x − Mo = 3( x − Md )
− −
Mo = x − 3( x − Md )
Son medidas de posición que sitúan valores a diferentes puntos de la distribución, los más
utilizados son los quartiles, los deciles y los percentiles.
(nj / 4 − fa)
Qj = Li + c
f
Qj; j = 1, 2, 3
Ejemplo:
Q1= 43.5625
D1,D2,D3,D4,D5,D6,D7,D8,D9
13 | P á g i n a
Dj; j= 1, 2, 3, 4, 5, 6, 7, 8, y 9
(nj / 10 − fa)
Dj = Li + c
f
Ejemplo:
((100 * 8) / 10) − 73
D8 = 65.5 + 9 = 69.7
15
Pj: j= 1, 2, 3..........99
P85 = 72.7
El conocimiento de la forma de distribución y de las medidas de posición puede servir para tener
una idea bastante clara de su conformación, pero no de la homogeneidad de cada uno de los
valores con respecto a la medida de tendencia central aplicada. Las medidas de dispersión
permiten apreciar el grado de variabilidad o propagación de los datos.
14 | P á g i n a
Usando los datos del ejemplo 1. (Página 4): 2, 4, 5, 6, 7, 9, 10, 12
El Rango sería: R= 12- 2 = 10
Dado un conjunto de datos tales como X1, X2,....XN, la desviación media se define como el
promedio aritmético de las respectivas desviaciones absolutas con respecto a la media.
n −
/ Xi − x /
DM = i =1
n
DM = /2-6.875/ + /4-6.875/ + /5-6.875/ + /6-6.875/ + /7-6.875/ + /9-6.875/ + /10-6.875/ + /12-6.875/
8
DM = 2.625
Es el cuadrado medio de las desviaciones de una serie de datos, con respecto a su media
aritmética y se calcula de la siguiente manera:
( xi )
2
(x
− 2
− x) x 2
i −
n
s2 = =
i
n n
55 2
455 −
s2 = 8 = 9.6093
8
15 | P á g i n a
El cálculo de la varianza, se hace utilizando datos cuadráticos con el objetivo de que las
desviaciones no se cancelen entre sí, por esta razón, es necesario trabajar con valores originales
(no elevados al cuadrado) y esto se logra con la desviación standard. El cálculo de la desviación
standard a partir de la varianza, es simplemente obtener la raíz cuadrada de esta última.
s 2 = 9.6093 = 3.10
Es una medida de dispersión relativa que se obtiene dividiendo la desviación estándar de la serie
de datos entre su media aritmética y se multiplica por 100 para expresarlo en porcentaje. Es un
dato adimensional puesto que los datos con se calcula están expresadas en sus dimensionales
originales. Es útil cuando se quiere comparar series de datos con dos variables diferentes,
ejemplo: altura y peso.
s
C.V . = −
*100
x
3.10
C.V . = * 100 = 45.09
6.875
16 | P á g i n a
El rango es la diferencia entre el límite real superior de la clase más alta y el inferior de la clase
más baja.
(limite discreto superior clase más alta - limite discreto inferior de la clase más baja + uno)
Datos Tabla 2. R= 88-21+ 1 = 68
D.M . =
F / x − x/
n
Siguiendo el ejemplo de la tabla 2 tenemos:
DM= 1183.95
100
DM= 11.8395
− 2
s2 =
f ( x − x)
n
23874.75
s2 = = 238.7475
100
s = 238.7475 = 15.45146
17 | P á g i n a
Su cálculo es similar que en el caso de datos no agrupados.
15.45146
C.V . = * 100 = 28.01715
55.15
Si X1, X2,..........XN son los valores que toma la variable X, se define la cantidad:
n
x + x + .......+ x
r r r x
j =1
r
j
x r
x =
r 1 2
= n
=
n n n
(1)
Como el momento de orden r. El momento de primer orden r=1 es la media aritmética.
n −
(x
j =1
j − x) r
( x − x) r
−
−
mr = = = ( x − x) r
n n
(2)
Si r=1, m1=0
Si r=2, m2=s^2 (varianza)
El momento de orden r con respecto a un punto cualquiera A se define como:
(x
j =1
j − A) r
( x − A) r
d r
mr = = = = ( X − A) r
n n n
(3)
Donde d= X-A “Son las desviaciones de A, si A=0, (3) se reduce a (1). Se llama también momento
orden r respecto al origen.
18 | P á g i n a
Es el grado de asimetría o falta de simetría de una distribución. Si la curva de frecuencia tiene una
“cola” más larga a la derecha del máximo central que a la izquierda, se dice que la distribución
está sesgada a la derecha o que tiene “sesgo positivo”, si es a la izquierda se dice que tiene “sesgo
negativo”.
En distribuciones sesgadas, la media tiende a situarse con respecto a la moda al mismo lado que
la cola más larga. Así una medida de la asimetría nos dada por la diferencia (Media-Moda) y se
adimensiona dividiéndola por una medida de dispersión.
−
55.15 − 52.75
x− Mo sesgo = = 0.15533
sesgo = 15.4515
s
Para evitar el empleo de la moda, se puede usar la fórmula empírica (página 8) así:
−
3( x − Me) 3(55.15 − 54.54)
sesgo = sesgo = = 0.1177
s 15.4515
19 | P á g i n a
28595.025
m 100
coeficiente sesgo = a3 = 33 = = 0.0775
s 15.45 3
m4
curtosis = a4 =
s4
13213480.8
a4 = 100 = 2.318
15.45 4
Al coeficiente a4 se le denomina como b2. Para una distribución normal, b2= 3. Muchas veces la
curtosis se designa como (b2-3), la cual es positiva para una distribución leptocúrtica, negativa
para una platicúrtica y 0 para una mesocúrtica.
A4 = 2.318 – 3 = -0.6818
20 | P á g i n a
Bibliografía
• ANDERSON, D. et al. Estadística para Administración y Economía. 8. Ed. Thomson Editores.
México
• LEVIN Y RUBIN DAVI S. Estadística para Administradores. Editorial Prentice Hall. Sexta
Edición. México.
• MILLER, I. Et. Al. Probabilidad y Estadística para ingenieros Editorial Prentice may, México.
• MONTIEL, A.M. et. Al. Elementos Básicos de Estadística Económica y Empresarial. Ed.
Prentice Hall, México.
21 | P á g i n a
Actividades
Instrucciones:
Valor: 5 puntos
Descargar Caso
Valor: 5 puntos
Formato de entrega: Subir documento a la sección "Tareas / Notas" en la asignación "Actividad
1.2"
Fecha máxima de entrega: Domingo 15 de marzo, a las 11:55 pm
22 | P á g i n a
Nombre de la Actividad: Foro Unidad 1
Instrucciones:
Ingrese al foro habilitado para esta unidad "Foro Unidad 1" y participe contestando lo que se le
solicita.
Valor: 3.33 puntos
Fecha máxima de participación: Domingo 15 de marzo, a las 11:55 pm
23 | P á g i n a
24 | P á g i n a