Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA
1. DEFINICION
Estadística Inferencial.- comprende técnicas que con base únicamente en una muestra o
subconjunto de la población sometida a observación o experimentación, se toma decisiones
sobre toda la población. La inferencia puede contener conclusiones que pueden no ser
ciertas en forma absoluta, por lo que es necesario que estas sean dadas con una medida
de confiabilidad que es la probabilidad.
2. POBLACION Y MUESTRA
3. VARIABLES ESTADISTICAS
Al estudiar una población o muestra nos concentramos en una característica de los individuos
u objetos que le conforman; si esta característica tiene variabilidad o variación se denomina
variable estadística y el resultado de las observaciones o mediciones de la característica se
llama dato estadístico.
CICLO PRE-UNIVERSITARIO 1
CEPRE-UNI ARITMÉTICA
a. discretas: Aquellas a las que se les puede asociar un número entero, es decir, aquellas que
por su naturaleza no admiten fraccionamiento de la unidad, por ejemplo número de hijos,
número de empleados de una empresa, número de ruedas de un vehículo, etc.
b. continuas, Aquellas que por su naturaleza admiten que entre dos valores cualesquiera la
variable pueda tomar cualquier valor intermedio, por ejemplo pesos, tiempo de duración de
en proceso y estaturas de personas, etc.).
Variables
Cualitativas Cuantitativas
Discretas Continuas
I. DATOS NO AGRUPADOS.
La información que se ha recopilado pero que aún no se organiza se debe ordenar. Si los
datos incluyen valores repetidos se puede organizar una distribución de frecuencias que es
una tabla o lista de los distintos valores de la variable (x). Sean x1,x2, x3,…., xk los distintos
valores que puede tomar la variable x.
La Frecuencia relativa (hi) de cada valor, indica la frecuencia expresada como fracción o
porcentaje del total. Si n es el número de datos, la frecuencia relativa del valor xi está dado
por:
fi
hi , i=1,2,....,k
n
La Frecuencia Absoluta Acumulada (Fi) es la suma de todas las frecuencias absolutas f1,
f2,…, fi :
Fi f1 f2 ... fi
CICLO PRE-UNIVERSITARIO 2
CEPRE-UNI ARITMÉTICA
Ejemplo 1: Se realizó una encuesta entre los 50 empleados de una empresa, consultando sobre
el número de hijos en edad escolar que tenía cada empleado, a fin de estimar el pago
de una bonificación por gastos escolares que proyecta hacer la empresa. Estos fueron
los resultados:
0 2 1 0 3 2 0 1 1 0
0 1 1 2 4 1 0 1 1 0
2 1 0 0 3 0 0 1 2 1
0 0 2 4 1 1 0 1 2 0
1 1 0 3 5 1 2 1 3 2
Organizar los datos en una distribución de frecuencias, enlistando cada valor diferente (x)
en una columna, luego empleamos marcas para contar el número de veces que aparece
cada valor de x y al acabar, anotamos la frecuencia absoluta (f) y luego calculamos la
frecuencia relativa (h).
El total de frecuencias absolutas debe ser el total de datos y el total de frecuencias relativas
debe ser el 100%. Ambos totales permiten verificar los cálculos realizados.
CICLO PRE-UNIVERSITARIO 3
CEPRE-UNI ARITMÉTICA
Cuando los datos consisten en solo unos cuantos valores distintos (es el caso de los datos
del ejemplo anterior que tomaba solo los valores 0, 1, 2, 3, 4 y 5), podemos organizarlos
fácilmente y determinar cualquier tendencia, sin embargo cuando los datos consisten en
muchos valores en su mayoría no repetidos es conveniente agrupar los datos y determinar
las frecuencias absolutas y relativas de cada grupo que llamaremos clase.
Necesitamos estas definiciones:
R = xmax – xmin
b) Intervalo de Clase a i , b i
Son cada una de las categorías excluyentes (o clases) en los que se pueden clasificar los
datos. Los extremos de un intervalo [ai, bi son ai y bi, donde
R
A
k
CICLO PRE-UNIVERSITARIO 4
CEPRE-UNI ARITMÉTICA
Fi f1 f2 ... fi
fi
hi
n
Fi
Hi
n
Ejemplo
Se pesaron a 40 estudiantes y sus pesos en kilogramos fueron:
60 69 50 79 65 71 48 60
86 42 86 64 90 81 78 73
69 64 72 80 65 52 70 47
54 74 53 77 45 66 75 60
63 55 62 72 59 61 67 55
Rango = 90 - 42 = 48 Kg.
2. Número de intervalos : k 40 6
CICLO PRE-UNIVERSITARIO 5
CEPRE-UNI ARITMÉTICA
48
3. Ancho de clase 8
6
Tabla 2
Ii xi fi Fi hi Hi
42 - 50 46 4 4 0.10 0.100
50 - 58 54 6 10 0.15 0.250
58 - 66 62 11 21 0.275 0.525
F
50
40
30
20
10
0 X
42 50 58 66 74 82 90
CICLO PRE-UNIVERSITARIO 6
CEPRE-UNI ARITMÉTICA
OBSERVACIÓN
Si “f” es la frecuencia en el intervalo de clase [a, b> y se considera que los datos se
distribuyen de manera “uniforme” en ese intervalo, entonces podemos considerar por
ejemplo que en el intervalo [a, c] contenido en [a, b> existen aproximadamente:
ca
f / ( ). f por semejanza:
ba
f
Ejemplo: En el intervalo [50; 58> la frecuencia es 6, luego en el intervalo [52; 55] habrá
55 52 2, 25
f’ = . 6 2, 25 , en porcentaje 100% = 5,625%
58 50 40
Histogramas
Son gráficos específicos para datos agrupados por intervalos. Los histogramas asocian a
cada intervalo un rectángulo de superficie proporcional a la frecuencia. Los límites de clase
se marcan en el eje horizontal y determinan las bases de los rectángulos y las frecuencias
se anotan en el eje vertical y determinan sus alturas.
Polígono de frecuencias
Es la línea que une los puntos correspondientes a las frecuencias de cada elemento. Si los
datos están agrupados por intervalos, se construye de modo similar al histograma, pero los
puntos que se unen son los correspondientes a las marcas de clase.
Ojivas
CICLO PRE-UNIVERSITARIO 7
CEPRE-UNI ARITMÉTICA
MEDIDAS DE CENTRALIZACIÓN
Los números que describen de manera concisa el comportamiento y las características generales
de un conjunto de datos son los parámetros estadísticos. Los parámetros que miden la tendencia
central de los datos se llaman medidas de centralización y son datos que representan de forma
global a toda la población y los más representativos son la media, la mediana y la moda.
MEDIA ARITMÉTICA
Se calcula dividiendo la suma de los valores de todos los datos entre el número de datos.
Se aplica cuando no todos los datos tienen la misma importancia o peso. Su fórmula es
similar a la de los datos agrupados, cambiando f i por los pesos pi y el denominador N por la
suma de todos los pesos; en este caso xi sería el valor de cada dato.
xp
x ipi x1p1 x 2p 2 ... x k pk
pi p1 p 2 ... pk
MEDIANA
Para datos no agrupados: Es el valor del dato que ocupa la posición central cuando éstos
se ordenan de menor a mayor (o viceversa). Divide a la lista de datos en dos grupos de igual
número de elementos.
Si el número de datos es par la mediana es la media de los dos que ocupan las
posiciones centrales.
Si el número de datos es impar la mediana es el dato central.
Ejemplo:
Sean los datos: 9, 7, 8, 10, 8, 11; al ordenar se tiene: 7, 8, 8, 9, 10, 11.
89
La mediana es: 8,5
2
Para datos agrupados: debe encontrarse primero el intervalo mediano, (que es el intervalo
donde se sobrepasa por primera vez la mitad de los datos) y luego ubicar en dicho intervalo
la mediana (Me) con la fórmula:
n
Fi1
Me ai 2 .A
fi
CICLO PRE-UNIVERSITARIO 8
CEPRE-UNI ARITMÉTICA
MODA
d1
Mo a i .A
d1 d 2
MEDIA GEOMÉTRICA
CICLO PRE-UNIVERSITARIO 9
CEPRE-UNI ARITMÉTICA
MG n x 1 x 2 x 3 .......... ..... x n
MG n x11 x2 2 ...... xk k
f f f
MEDIA ARMÓNICA
n 1
MH
1 1 1 1
x1 x2
...
xn
x
i
n
MH
1
f i
xi
53
La media aritmética es 8,833
6
La media geométrica es: 6
7.8.8.9.10.11 8,73
6
La media armónica es: 8,63
1 1 1 1 1 1
7 8 8 9 10 11
Propiedad: MH MG MA
MEDIDAS DE DISPERSIÓN
CICLO PRE-UNIVERSITARIO 10
CEPRE-UNI ARITMÉTICA
Las medidas de tendencia central determinan el centro de los datos estadísticos, pero no nos
indican nada acerca de la posición respecto al centro. Por lo tanto se necesita una medida que
nos indique el grado de dispersión o variación respecto a un valor central que por lo general es la
media aritmética, con la finalidad de tener una comparación y ampliar la descripción de los datos.
Las principales medidas de dispersión son:
El rango,
El rango intercuartil,
La varianza,
La desviación estándar y
El coeficiente de variación
Desde el punto de vista matemático la varianza es la media aritmética de los cuadrados de las
diferencias de los datos respecto a su media aritmética, sus unidades están elevadas al cuadrado.
(xi x)2
i1
i1
x i
2
s2 Lo cual es equivalente a s2 x2
n n
Entonces diremos: s 2 x2 x 2
CICLO PRE-UNIVERSITARIO 11
CEPRE-UNI ARITMÉTICA
2114
i1
x i
2
2
Luego la varianza es: s2 18,62 6,373 años2 x
n 8
La desviación estándar es: S = S 6,373 2,52 años.
2
Si x1’, x2’,... xk’, son las marcas de clase de k intervalos, f 1, f2,..., fk, son las frecuencias absolutas
de una variable x y x es la media, entonces la varianza s2 es:
fi (x 'i x)2
k
i1
i 1
f x'
i i
2
x
2
s2 = aplicando propiedades s2 =
n n
Ejemplo:
fi
Ii x’i x’i fi fi . x’i2
[ 400,500> 450 15 6750 3 037500
[ 500,600> 550 12 6600 3 630000
[ 600,700> 650 6 3900 2 535000
[ 700,800> 750 4 3000 2 250000
[ 800,900> 850 2 1700 1 445000
[ 900,1000> 950 1 950 902500
40 22900 13 800000
n = 40, k = 6,
k k
22900
i 1
f i xí| 22900 , fx
i 1
i
|2
í 1380000 X
40
572.5 soles
i 1
f x'
i
2
13800000 2
832
x = 3,55 (572
2
Luego la varianza es: s2 = .5) 2 = 17243.75
8,1975
n 40 40
CICLO PRE-UNIVERSITARIO 12