Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Estadística descriptiva: expone y analiza algunos caracteres de algunos individuos de una población sin extraer
conclusiones para un grupo mayor.
2. Estadística inferencial: trabaja con muestras y a partir de ellas pretende inferir características de una toda la población.
2.TABLAS DE FRECUENCIAS
Las tablas de frecuencia son muy útiles en los estudios estadísticos ya que nos permiten clasificar
y organizar los datos. Cuando la variable toma pocos valores es muy sencillo realizar la tabla de
frecuencias, solo habrá que realizar dos columnas principales x i y f i aunque se pueden añadir
columnas para facilitar el cálculo de los parámetros estadísticos y de posición, así como la
representación de cierto tipo de graficas. La columna x i son todos los valores que toma la
variable mientras que f i es la cantidad de veces que se repite cada valor es decir su frecuencia.
Existen dos tipos de graficas para representar el valor y la frecuencia de una variable, son los
siguientes:
1. Diagrama de barras: se usan para variable cuantitativas discretas es decir para valores
que no estén agrupados en intervalos, se realizan en unos ejes de coordenadas donde el
eje OX corresponde a los valores de la variable x i y el eje OY corresponde a la
frecuencia con la que se repiten los valores f i.
Se realizan dibujando unas barras sobre cada valor de x i que van hasta su valor
correspondiente de f i, las barras no se deben chocar porque no son valores agrupados y
deben estar coloreados.
2. Histograma: se usan para variable cuantitativas continuas, añadiremos una columna más a nuestra tabla que será la
marca de clase que es el valor medio del intervalo que actuará como nuestro x i para calcular parámetros estadísticos, esto
nos permitirá tener una buena aproximación de la realidad, aunque no será tan exacta como con las variables discretas,
los ejes OX y OY representan lo mismo que en los diagramas de barras, a la hora de realizarlo habrá que seguir los
siguientes pasos:
1. Se localizan los extremos a y b que son los valores de la variable más pequeño y más grande respectivamente, y
se halla su diferencia también llamada recorrido de la siguiente forma:
r =b−a
2. Se decide el número de intervalos que se quiere formar teniendo en cuenta los datos que tenemos, el número de
intervalos n no debe ser inferior a 6 ni superior a 15.
3. Escogemos un múltiplo de n que se aproxime a r y dividiremos ese número entre n para obtener la longitud de
cada uno de nuestros intervalos y que esta sea entera.
4. Se forman los intervalos de modo que el extremo inferior del primer intervalo sea algo inferior que a y el
extremo superior del último intervalo sea algo mayor que b. Es deseable que ninguno de los extremos de los
intervalos coincida con los datos, para esto conviene que los extremos de los intervalos tengan una cifra decimal
más.
En un histograma a diferencia de en un diagrama de barras las barras se encuentran totalmente juntas, pero deben de estar
coloreadas igualmente.
3.PARÁMETROS ESTADÍSTICOS
Los parámetros estadísticos nos permiten sintetizar la información a partir de los datos de las tablas de frecuencias, ya sea con
datos aislados o datos agrupados en intervalos, en este último caso usaremos la marca de clase (el valor medio del intervalo), son
los siguientes:
1. Media ( x ): representa un valor representativo del conjunto de datos, se calcula de la siguiente forma:
x=
∑ f i xi
∑ fi
Esta fórmula representa la división entre la suma de todos datos y el número total de individuos.
2. Varianza (Var ): nos indica el grado de dispersión de los valores alrededor de la media, se calcula de la siguiente forma:
∑ f i ( x i− x )
2
∑ f i x 2i
Var=
N
ó Var=
N
2
−x , N= ∑ fi
3. Desviación típica (σ ): nos indica que tan separados se encuentran todos los datos, se calcula de la siguiente forma:
σ =√ var
4. Coeficiente de variación (C.V.): nos sirve para comparar las dispersiones de las poblaciones heterogéneas ya que indica
la variación relativa:
σ
C . V .=
x
Es importante aclarar que la media y la desviación típica poseen la misma unidad que los datos mientras que la varianza posee esa
unidad al cuadrado y el coeficiente de variación no posee unidad y se expresa en porcentaje.
1. Frecuencia acumulada ( F i): se le llama frecuencia acumulada a la suma de todas las frecuencias anteriores, se calcula
de la siguiente forma:
i
F i=f 1+ f 2 +f 3+ … f i ó F i=∑ f n
n=1
2. Porcentaje acumulado (%ACUM.): nos permitirá hallar de forma sencilla los parámetros de posición, se calcula de la
siguiente forma:
Fi
%ACUM.= ∙ 100 %
N
Los parámetros de posición son los siguientes:
Cuartiles: son los puntos de corte que se obtienen si ordenamos la población de forma creciente y la dividimos en cuatro
trozos iguales, que un individuo pertenezca a un cuartil Q k nos indica dentro de que porcentaje de la población se
encuentra:
Primer cuartil (Q 1): es el valor de la variable que supera al 25% de la población y por lo tanto queda por
debajo del otro 75%, se halla en la tabla de frecuencias como el primer x i cuyo porcentaje acumulado supere el
25%.
Segundo cuartil (Q 2) o mediana ( Me ): es el valor de la variable que supera al 50% de la población y por lo
tanto queda por debajo del otro 50%, se halla en la tabla de frecuencias como el primer x i cuyo porcentaje
acumulado supere el 50%.
Tercer cuartil (Q 3): es el valor de la variable que supera al 75% de la población y por lo tanto queda por debajo
del otro 25%, se halla en la tabla de frecuencias como el primer x i cuyo porcentaje acumulado supere el 75%.
El cuarto cuartil no existe ya que tendría que ser el primer valor de x i que supere el 100% del porcentaje acumulado cosa
que es imposible. El porcentaje que debe superar la variable para pertenecer al cuartil Q k será igual a k 25 % . Si el
xi + x i+1
porcentaje acumulado es igual a k 25 % , el primer valor de la variable que supere a k 25 % será .
2
Percentiles: son los puntos de corte que se obtienen al ordenar la población de forma creciente y dividirla en cien trozos
iguales, de igual forma que con los cuartiles, que un individuo pertenezca al percentil Pk indica que supera a un cierto
porcentaje de la población que será igual a k % , para hallarlo en la tabla de frecuencias solo habrá que observar el primer
valor de la variable que supere a k % . Al igual que con los cuartiles si el porcentaje acumulado es igual a k % , el primer
xi + x i+1
valor de la variable que supere a k % será . El percentil P25 coincide con el cuartil Q 1, de igual forma los
2
percentiles P 50 y P75 corresponden a los cuartiles Q 2 / Me y Q 3 respectivamente ya que dejan el mismo porcentaje de
la población por debajo.
Polígono de frecuencias acumuladas: es la representación gráfica del flujo continuo con una rapidez que varía en cada
intervalo dependiendo del número de individuos f i, se realiza colocando los puntos en un eje de coordenadas donde el eje
X corresponde al extremo superior del intervalo y el eje Y corresponde a las frecuencias acumuladas, posteriormente
unimos todos los puntos y ya habremos finalizado el polígono de frecuencias acumuladas.
Polígono de porcentajes acumulados: representan los mismo y se realizan de igual forma que el polígono de frecuencias acumula
porcentajes acumulados, esto nos
permitirá hallar fácilmente los
percentiles. Para hallar un
percentil Pk con el polígono de
porcentajes acumulados solo habrá
que tener en cuenta que Pk al ser un valor de la variable se encuentra en el eje de los extremos superiores y que k se
encontrará en el eje de los porcentajes acumulados, entonces para hallar Pk simplemente habrá que relacionar el
porcentaje k con un valor del eje de abscisas mediante la gráfica. Gracias a esto podremos aproximar los percentiles al
ojo y hallarlos exactamente
mediante semejanza de triángulos.