Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Términos Básicos
Población
Es la colección o conjunto de todos los individuos,
personas, animales u objetos que aportan información
sobre el fenómeno que se estudia, por lo cual,
presentan características comunes.
Ejemplo:
Un almacén de cadena que dispone de 50 sucursales
en el territorio nacional y ha observado la cantidad de
empleados con que cuenta en cada una de ellas para
adelantar un estudio posterior
Muestra
Corresponde a un subconjunto de casos o individuos
de la población estadística.
Ejemplo:
La Secretaría de Educación del municipio de Bello
requiere hacer un estudio sobre el consumo de licor en
menores de edad en la ciudad. Dado que la población
sería demasiado grande, debe escoger una muestra
aleatoria representativa eligiendo jóvenes de ambos
sexos, de todos los sectores y estratos para adelantar
el estudio.
Variable estadística
Es cada una de las características o cualidades que
poseen los individuos de una población en estudio.
ejemplo:
Peso, estatura, edad, sexo, etc.
Tipos de variables estadísticas
1. Variable cualitativa
Son características o cualidades que no pueden ser
expresadas mediante números.
Ejemplo:
Color de los ojos, la piel, el cabello; sexo, nacionalidad,
idioma, raza, etc.
2. Variable cuantitativa
Es aquella que se puede expresar mediante números.
Ejemplo:
Edad, estatura, peso, número de hijos, etc.
2.1. Variable cuantitativa discreta
Es aquella variable que sólo permite usar valores
enteros y no admite valores intermedios o decimales.
Ejemplo:
Número de hermanos, cantidad de empleados,
cantidad de profesores o de estudiantes en un colegio.
2.2. Variable cuantitativa continua
Este tipo de variable puede tomar valores decimales.
Ejemplo:
Peso, estatura, temperatura, etc.
Dato
Corresponde a cada uno de los valores que toma la
variable.
Tabla de Frecuencias
La tabla de frecuencias o de distribución de
frecuencias permite mostrar la distribución de los datos
mediante sus frecuencias. Esta herramienta permite
representar numéricamente la distribución de
frecuencias de los datos para facilitar su análisis.
Construcción de la Tabla de Frecuencias
Para construir la tabla de frecuencias es necesario
tomar en cuenta lo siguiente:
1. Frecuencia Absoluta
Se representa como fi o ni, y corresponde al número de veces que se repite
la variable estadística.
2. Frecuencia Acumulada
Se representa como fa o Ni, es la suma de todas las frecuencias absolutas
anteriores.
3. Frecuencia Relativa
f
Se representa como r, y es el cociente entre cada frecuencia absoluta y el número de datos.
Conclusiones
Para este tipo de análisis estadísticos que incluyen
variables cualitativas, el único dato que se puede
obtener es la moda, que corresponde al dato que más
se repite.
La moda o Mo, corresponde al color blanco que es el
color que tiene la mayor frecuencia absoluta.
Algunas afirmaciones que se pueden hacer son las
siguientes:
- El 10% de los estudiantes, que equivale a 3, prefieren
el color amarillo.
- El 13% de los estudiantes, que equivale a 4, prefiere
el color rojo.
- El 20% de los estudiantes, que equivale a 6, prefiere
el color blanco.
Notas importantes
1. Es importante tener en cuenta que la suma de las
frecuencias relativas debe ser 1.
2. De igual forma se debe tener en cuenta el principio
de redondeo.
Primer caso
Se presenta cuando se pide redondear un número a x
cantidad de decimales y la cifra decimal siguiente es
mayor que 5, entonces se procede a redondear al
siguiente decimal.
Ejemplos:
Redondear las siguientes cantidades:
Segundo caso
Se da cuando el siguiente decimal al que ocupa la posición a la cual se pide redondear es
menor que 5. En ese caso de redondea el decimal sin hacer cambios.
Ejemplos:
Redondear las siguientes cantidades:
a) 0.00457684525 a 9 decimales
Como el decimal que ocupa la posición 10, que es (2) es menor que 5, entonces, se escribe el
números hasta la posición pedida sin hacerle cambios. y queda: 0.004576845
b) 0.36836241 a 6 decimales
Observamos que el séptimo decimal es 4, y 4<5, por lo tanto, queda: 0.368362
Tercer caso
Sucede cuando el siguiente decimal al que ocupa la posición a la cual se pide redondear, es 5.
En este caso, se toma como referencia el decimal que ocupa la posición anterior a la cual se
pide redondear, si este es impar, se incrementa al siguiente decimal; si es par, se deja como
está.
Ejemplos:
Redondear las siguientes cantidades:
a) 27.86743685023 a 7 decimales
Dado que el decimal de la octava posición es 5,
entonces, miramos el decimal que ocupa la sexta
posición, este es 8 que es un número par, por lo que el
decimal no sufriría cambios, quedando: 27.8674368
b) 93.84732916582584 a 8 decimales
El decimal que ocupa la novena posición es 5, por lo tanto, miramos el decimal que ocupa la
séptima posición y este es 1, dado que es impar, se aumenta al siguiente decimal de la
siguiente forma: 93.84732917
Datos No Agrupados
Como se ha dicho anteriormente, cuando la muestra
es menor a 20 datos (n<20), es aconsejable utilizar el
procedimiento de datos no agrupados.
1.1. Moda
Es el dato que más se repite en un estudio estadístico.
Se representa como Mo.
1.2. Mediana
Una vez ordenados los datos de menor a mayor, la
mediana es el dato que se encuentra en el centro. Se
representa como Me, Md o según el texto.
Para n par
Cuando el número de datos (n) es par, el cálculo se
hace de la siguiente forma:
Ejemplo:
Se dispone de la estatura en metros, de 7 estudiantes.
1.70, 1.68, 1.74, 1.72, 1.69, 1.71, 1.69
Ordenando los datos:
1.68, 1.69, 1.69, 1.70, 1.71, 1.72, 1.74
Para hallar la posición del dato que corresponde a la
mediana, dividimos:
(n + 1)/2,
(7 + 1)/2 = 8/2 = 4
La posición 4 está ocupada por el dato que
corresponde a 1.70 metros y esta es la Mediana.
1.3. Media Aritmética o Promedio
Equivale a la sumatoria de todos los datos (Xi),
multiplicados por sus frecuencias absolutas fi.
2. Medidas de localización o de
posición
Para referirse a las medidas de localización, es
necesario hablar de cuantiles, que son medidas de
posición que se definen mediante un método que
determina la ubicación de los valores que se
encuentran en las divisiones de partes iguales en un
estudio estadístico. Los principales cuantiles son los
siguientes:
2.1. Cuartiles
Los cuartiles corresponden a 3 valores que dividen en
4 partes iguales al conjunto de datos ordenados. Se
denotan como Q1, Q2 y Q3, cada una de las 4 partes
que forman equivale al 25% de los datos, siendo el
segundo cuartil coincidente con la mediana.
Para su cálculo se procede de la siguiente forma:
1. Para número de datos (n) par
Q(x)= (#Q * n) /4
2. Para número de datos (n) impar
Q(x) = [#Q * (n+1)] / 4
2.2. Deciles
Corresponden a 9 valores que dividen en 10 partes
iguales el conjunto de datos ordenados. Se
representan como D1, D2, D3, D4........D9.
1. Para número de datos (n) par
D(x) = (#D * n) /10
2. Para número de datos (n) impar
D(x) = [#D * (n+1)] / 10
2.3. Percentiles
Corresponden a 99 valores que dividen en 100 partes
iguales el conjunto de datos ordenados. Se
representan como P1, P2, P3, P4........P99.
1. Para número de datos (n) par
P(x) = (#P * n) /100
2. Para número de datos (n) impar
P(x) = [#P * (n+1)] /100
3. Medidas de Dispersión o
Variabilidad
Las medidas de dispersión o de variabilidad incluyen la
desviación media, la varianza y la desviación estándar.
Estos valores numéricos describen la dispersión o
variabilidad que se encuentra entre los datos: datos
bastante agrupados poseen valores relativamente
pequeños y datos mayormente dispersos tienen
valores más grandes. Se dice que cuando los datos
carecen de dispersión, su agrupamiento es más
estrecho. La finalidad primordial de estas medidas es
informar sobre cuanto se alejan del centro los valores
de la distribución.
3.1. Desviación Media
Corresponde a la sumatoria del valor absoluto de la
diferencia entre cada valor de la variable estadística y
la media aritmética, multiplicada esta diferencia por la
frecuencia absoluta de cada dato y todo esto dividido
entre el número de datos (n ó N).
3.2. Varianza
Es la media aritmética del cuadrado de las
distribuciones respecto a la media de una distribución
estadística. Su finalidad es la de medir la distancia
entre los valores de la serie y la media.
Nuevo rango
Su función es la de garantizar que todos los datos
queden cubiertos por el estudio estadístico. Para este
propósito, se debe cubrir un poco más por debajo del
valor mínimo y un poco poco más por encima del valor
máximo. Lo representaremos como Nr.
Una vez se ha calculado la amplitud y el número de
intervalos, usamos estos valores para calcular el
nuevo rango.
A = Ran / I, A * I = Nr
Marca de Clase
Es el punto medio de la clase. Se representa como Mi.
Mi = (Ls + Li) / 2
Límites de la clase
Cada intervalo está delimitado por un límite superior
(Ls) y por un límite inferior (Li).
Medidas de centralización
Media Aritmética
Mediana
Moda
Deciles
Percentiles
Varianza
Rango
Ran = Dm - dm
Ran = 97.8 - 37.05 = 60.75 Kg
Intervalos de Clase
I = 1 + 3.3 log (n)
I = 1 + 3.3. log (60) = 6.87, Aproximadamente 7
I=7
Cuando el número de datos es impar, se redondea al
entero por la parte baja, si n es par, se redondea a la
alta, es decir, al siguiente entero.
Amplitud
A = Ran / I
A = 60.75 / 7 = 8.68
Se aproxima al siguiente decimal, si hubiese sido un
entero, se aproximaría al siguiente:
A = 8.69
Nuevo Rango
De la fórmula
A = Ran / I, nos queda
R = A * I, donde, Nr = A * I
Nr = 8.69 * 7 = 60.83
Nr = 60.83 - 60.75 = 0.08
Al Nr se le resta el primer rango obtenido
Ahora, se divide 0.08 entre 2, que son los extremos
superior en inferior para saber cuanto le vamos a
restar al dato menor y cuanto le vamos a sumar al dato
mayor
0.08 / 2 = 0.04
Es decir 0.04 por debajo y por encima de los datos
menor y mayor respectivamente.
Así, Para construir la tabla de frecuencias, al dato
menor que es 37.05, le restamos 0.04
37.05 - 0.04 = 37.01
Aquí iniciará la primera clase y sucesivamente le
iremos adicionando el valor de la amplitud.
Importante...
Recuerda el concepto de intervalos cerrados y
abiertos, en los primeros, los límites hacen parte del
conjunto y en los segundos, no.
Marca de Clase
La marca de clase se obtiene promediando el límite
superior con el límite inferior:
Mi = (Ls + Li) / 2
Así, obtenemos la siguiente tabla de distribución de
frecuencias:
Tabla de Frecuencias
Medidas de Centralización
Media Aritmética o Promedio
Mediana
Moda
Para hallar la moda, se debe tener en cuenta el
intervalo con la frecuencia absoluta mayor, que para el
caso es [45.70-54.39), que tiene una fi = 15.