Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCION
La Estadística en su acepción más general, puede considerarse como la ciencia que estudia las
“regularidades” que se observan en una serie de fenómenos que pueden expresarse a través de
la información numérica.
1
ORGANIZACIÓN DE DATOS
CONCEPTOS FUNDAMENTALES :
Vamos a exponer de forma sencilla una serie de definiciones que constantemente las estaremos
empleando en estadística.
1. Población : Se entiende por población, universo o colectivo a un conjunto de elementos que
tienen una característica común.
Las poblaciones deben estar definidas con absoluta precisión de forma que se pueda definir
si un elemento pertenece o no pertenece a la misma.
Se clasifican en infinitos y finitos según el número de elementos que tengan. En el mundo
económico y social estaremos casi siempre ante poblaciones finitas : habitantes de una
región, empresas de un sector, demandantes potenciales o reales de un producto, etc. A
toda característica de la población se la conoce como parámetro.
2. Muestra : Es todo subconjunto representativo de la población, de forma que las
conclusiones
sacadas en ella se generalizan a la población. A toda característica de la muestra se conoce
como estadígrafo.
EJERCICIO 1:
1 0 2 4 1 3 2 0 1 1
1 1 1 0 0 1 1 1 2 2
3
A partir de esta información construir la tabla de la distribución de frecuencias.
Xi fi fì ’ ( F )' ( F )'
Fi i Fi i
SUMATORIA 20 1.00
.fi : frecuencia absoluta : nos indica el número de veces que el valor de una variable se repite
en la serie numérica. La suma de las frecuencias absolutas es igual al número de datos ( n )
f n
fi
f'
i
n
fi ' 1.00
4
F :
i Frecuencia acumulada ascendente : Nos determina el número de datos que se han
acumulado hasta un determinado valor de la variable, se la determina mediante la suma
progresiva de las frecuencias absolutas.
Fi f 1
FF f
2 1 2
F F f
3 2 3
FF f
i i1 i
F i n
F:
i Frecuencia acumulada descendente: Nos determina el número de datos que restan, luego
de quitar la frecuencia absoluta correspondiente a la variable, se la obtiene restando al
número de datos el valor de la frecuencia acumulada de la variable.
n n f
1 1
n n f
2 1 2
n n f
3 2 3
ni n fi
=0
Las frecuencias relativas acumuladas tanto ascendentes como descendentes se las obtiene
dividiendo las frecuencias acumuladas respectivas para el número de datos.
5
EJERCICIO 2 :
Xi fi f ' x100
fi' i
El gráfico de rectángulos es aquel que tiene todos sus rectángulos con la misma base,
pero su área está determina por la frecuencia absoluta.
6
Gráfico de rectángulos para el ejercicio Nº 2
60
50
40
30
20
10
0
GRAFICO DE SECTORES:
DIVOR
CIADO
10%
SOLTE CASAD
RO O
25% 50%
VIUD
O
15% 7
GRÁFICOS EN EXCEL
HISTOGRAMA
60
50
40
30
20
10
0
Casado Viudo Soltero Divorciado
POLÍGONO DE FRECUENCIAS
60
50
40
30
20
10
0
Casado Viudo Soltero Divorciado
SECTORES
8
REPRESENTACIONES GRAFICAS PARA DISTRIBUCIONES DE FRECUENCIAS DE DATOS
CUANTITATIVOS.
Se establece que una distribución de frecuencias debe tener como mínimo cinco
intervalos de clase y como máximo 20. Tener menos de cinco significa que los datos están muy
agrupados y eso desfigura la distribución, en cambio sí tiene más de veinte significa que los
datos están muy repartidos, pudiendo inclusive existir intervalos que carezcan de elementos.
Existen diferentes maneras para calcular el número de intervalos de clase que debe
tener una distribución de frecuencias, nosotros consideraremos una de las siguientes:
9
Nº de Intervalos de Clase ( I de C) = n o también
Ls Li
kNºI
deC en donde : Ls = Límite superior de los datos
Li = Límite inferior de los datos
Luego se debe determinar el límite inferior del primer intervalo de clase y límite
superior del último, lo cual se obtiene de la siguiente forma:
Nº I de C x k = R1
Ls - Li = R2
R1 – R2 = D
La diferencia obtenida dividimos para dos, por cuanto tenemos dos límites, superior e inferior
en los datos, este cociente lo restamos al límite inferior de los datos y a la vez lo sumamos al
límite superior, obteniendo de esta manera los límites inicial y final de la distribución de
frecuencias.
D/2 = K
Li(calculado) = Li(real) – K
10
Ls(calculado) = Ls(real) + K
11
A efectos operativos, es necesario también conocer la marca de clase o punto medio del
EJERCICIO 3 :
El almacén La Moda ha abierto sus puertas al público durante 45 días y han obtenido
las siguientes recaudaciones:
Nº I de C = 45 Nº I de C = 26> 45
= 6.71 = 64 > 45
= 7.00 =6
clase:
Ls Li 31550
kNºI k
7 k 37
deC
12
3.- Determinamos el límite inferior del primer intervalo de clase y el límite superior del último
intervalo de clase:
7 x 37 = 259
315 – 50 = 265
259 - 265 = - 6 como R1< R2 incrementamos en una unidad la amplitud del intervalo de
clase.
7 x 38 = 266
315 – 50 = 265
1 / 2 = 0,5 este valor sumamos al límite inferior y sumamos al superior de los datos.
REPRESENTACIONES GRÁFICAS:
Cuando los datos se encuentran agrupados en distribuciones de frecuencias, se los puede
representar gráficamente empleando los gráficos conocidos como: Histograma o gráfico de
columna, Polígono de frecuencias absolutas, polígono de frecuencias acumuladas u Ojiva y el
grafico de sectores entre los más importantes.
13
HISTOGRAMA:
POLIGONO DE FRECUENCIAS
POLIGONO DE FRECUENCIAS
12
10
0
RECAUDACIONES
14
POLIGONO DE FRECUENCIAS ACUMULADAS - OJIVA
OJIVA
50
45
40
35
TOTAL DE DI
30
25
20
15
10
5
0
RECAUDACIONES
GRAFICO DE SECTORES:
GRAFICO DE SECTORES
4% 13%
13%
18%
16%
13%
23%
15
MEDIDAS DE TENDENCIA CENTRAL
Se conoce con este nombre a ciertos valores o medidas que tienden a indicarnos los
valores promedios o representativos de un conjunto de datos. Entre estas medidas tenemos:
1. La media aritmética
2. La media ponderada
MEDIA ARITMETICA
Es una medida que nos indica el valor promedio de un conjunto de datos, se la conoce
generalmente con el nombre de media y se la puede calcular para datos no agrupados como
para datos agrupados.
define como la sumatoria de los datos dividida para el número de datos y se representa por X .
X1 X 2 X3 ................ X n
X n
Entonces:
X
X i
EJERCICIO:
Calcular el promedio de las edades de 10 personas, cuyos valores en años son:
20 21 19 19 19 20 21 20 18 23
16
MEDIA ARITMETICA PARA DATOS AGRUPADOS: Se dice que los datos están agrupados
cuando se ha resumido la información mediante una tabla de distribución de frecuencias, y, en
ese caso, el valor promedio o media aritmética se define como la suma de las marcas de clase
por su frecuencia absoluta divida para el número de datos. Matemáticamente se expresa como:
En
donde:
Xi fi
X n Xi : marca de clase o punto medio del I. de Clase
fi : frecuencia absoluta del Intervalo de Clase
n : número de datos
EJERCICIOS:
Calcular la media aritmética de las ventas realizadas durante 45 días del almacén La Moda
Nº I de C Xi f Xi*fi
49.5 < Xi < 87.5 68.5 6 411
87.5 < Xi < 125.5 106.5 8 852
125.5 < Xi < 163.5 144.5 6 867
163.5 < Xi < 201.5 182.5 10 1825
201.5 < Xi < 239.5 220.5 7 1543.5
239.5 < Xi < 277.5 258.5 6 1551
277.5 < Xi < 315.5 296.5 2 593
45 7642.5
X i fi
X n
X 169.83
17
LA MEDIA PONDERADA
Es una medida que nos determina el valor promedio de una serie numérica cuando los valores
se repiten distintos números de veces, a estas repeticiones o variaciones se las conoce con el
nombre de ponderaciones, pesos o grados de importancia.
X i Wi
X w Wi
EJERCICIOS
Un laboratorio de control de calidad de una empresa quiere lanzar al mercado un nuevo
ambientador spray; selecciona 50 apartamentos de una urbanización para determinar el
tiempo de permanencia del aroma; los resultados fueron observados cada hora, habiéndose
obtenido los siguientes resultados: 10 horas, 5 apartamentos; 3 horas, 3 apartamentos; 5
horas, 10 apartamentos; 4 horas, 7 apartamentos; 6 horas, 16 apartamentos y 8 horas, 9
apartamentos.
a) Cuál es la población?
b) Cuál es la muestra?
c) Cuál es la variable?
d) De que tipo es la variable?
e) Cuál es el promedio de permanencia del aroma?
La media aritmética de los salarios pagados en un mes a los empleados de una empresa
ascendió a 36.000,00 USD. La media aritmética de los salarios pagados a los hombres y a las
mujeres fue respectivamente de 38.000,00 y 35.000,00 USD. Determinar los porcentajes de
hombres y mujeres empleados en dicha compañía.
18
MEDIDAS DE DISPERSIÓN
Si bien es cierto las medidas de tendencia central son importantes características estadísticas de
una muestra, pero también es importante conocer cómo se reparten o se dispersan los datos a
uno u otro lado del centro, ésta última característica de una distribución se conoce como
dispersión o variación.
Puede acontecer que varias distribuciones tengan iguales promedios, pero diferencias de
variabilidad sustanciales. Por ej. Supongamos que en una empresa se trabaja en dos turnos de
trabajadores. La relación obrero – producción por hora de cada uno de los turnos la
presentamos a continuación
PRIMER TURNO SEGUNDO TURNO
Nº de trabajad. Art. prod./ hora Nº de trabajad. Art. prod./ hora
1 7 1 3
2 9 1 4
4 11 1 5
2 10 1 6
1 8 2 9
1 12
1 13
1 14
1 15
45 81
X 5 X9
X 9
X 9
19
En el ejemplo anterior al observar que los promedios de producción por hora
son iguales, podemos caer en el error de manifestar que las distribuciones
también son iguales, más podemos observar que existe una marcada
diferencia en el grado de dispersión de sus datos.
1.- Los trabajadores del primer turno muestran relativamente poca variación
en sus producciones por hora.
2.- Los trabajadores del segundo turno tienen mucha mayor variación en sus
producciones por hora.
Se utilizan para encontrar un valor que represente a todos los datos. Las más
importantes son: la media aritmética, la moda y la mediana.
20