Está en la página 1de 5

ESTADÍSTICA

1.LA ESTADÍSTICA Y SUS MÉTODOS


La estadística tiene por objetivo el desarrollo de técnicas para el conocimiento numérico de un conjunto de datos empíricos
(recogidos mediante experimentos o encuestas).

Los elementos básicos de la estadística son los siguientes:

 Población: es el conjunto de todos los elementos cuyo conocimiento nos interesa.


 Individuo: es cada uno de los elementos que forma la población.
 Muestra: es el subconjunto extraído de la población que estudiaremos para inferir características de toda la población.
 Caracteres: son los aspectos que nos interesan de los individuos de una población.
 Variable estadística: es aquella que recorre todos los valores de un cierto carácter, esta puede ser:
 Cuantitativa: es una variable que toma valores numéricos, pueden ser:
 Discretas: es una variable cuantitativa que toma valores aislados.
 Continuas: es una variable cuantitativa que toma valores de un intervalo.
 Cualitativa: es una variable que toma valores no numéricos.

Existen dos ramas básicas de la estadística que son:

1. Estadística descriptiva: expone y analiza algunos caracteres de algunos individuos de una población sin extraer
conclusiones para un grupo mayor.
2. Estadística inferencial: trabaja con muestras y a partir de ellas pretende inferir características de una toda la población.

Un estudio estadístico está formado por cinco fases:

1. Selección de los caracteres a estudiar.


2. Análisis de cada carácter mediante el diseño y realización de una encuesta o experimento para posteriormente recoger los
datos.
3. Clasificación y organización de los resultados en tablas de frecuencia.
4. Elaboración de gráficos para visualizar los resultados más importantes.
5. Obtención de los parámetros estadísticos para resumir la información.

2.TABLAS DE FRECUENCIAS
Las tablas de frecuencia son muy útiles en los estudios estadísticos ya que nos permiten clasificar
y organizar los datos. Cuando la variable toma pocos valores es muy sencillo realizar la tabla de
frecuencias, solo habrá que realizar dos columnas principales x i y f i aunque se pueden añadir
columnas para facilitar el cálculo de los parámetros estadísticos y de posición, así como la
representación de cierto tipo de graficas. La columna x i son todos los valores que toma la
variable mientras que f i es la cantidad de veces que se repite cada valor es decir su frecuencia.
Existen dos tipos de graficas para representar el valor y la frecuencia de una variable, son los
siguientes:

1. Diagrama de barras: se usan para variable cuantitativas discretas es decir para valores
que no estén agrupados en intervalos, se realizan en unos ejes de coordenadas donde el
eje OX corresponde a los valores de la variable x i y el eje OY corresponde a la
frecuencia con la que se repiten los valores f i.
Se realizan dibujando unas barras sobre cada valor de x i que van hasta su valor
correspondiente de f i, las barras no se deben chocar porque no son valores agrupados y
deben estar coloreados.
2. Histograma: se usan para variable cuantitativas continuas, añadiremos una columna más a nuestra tabla que será la
marca de clase que es el valor medio del intervalo que actuará como nuestro x i para calcular parámetros estadísticos, esto
nos permitirá tener una buena aproximación de la realidad, aunque no será tan exacta como con las variables discretas,
los ejes OX y OY representan lo mismo que en los diagramas de barras, a la hora de realizarlo habrá que seguir los
siguientes pasos:
1. Se localizan los extremos a y b que son los valores de la variable más pequeño y más grande respectivamente, y
se halla su diferencia también llamada recorrido de la siguiente forma:
r =b−a
2. Se decide el número de intervalos que se quiere formar teniendo en cuenta los datos que tenemos, el número de
intervalos n no debe ser inferior a 6 ni superior a 15.
3. Escogemos un múltiplo de n que se aproxime a r y dividiremos ese número entre n para obtener la longitud de
cada uno de nuestros intervalos y que esta sea entera.
4. Se forman los intervalos de modo que el extremo inferior del primer intervalo sea algo inferior que a y el
extremo superior del último intervalo sea algo mayor que b. Es deseable que ninguno de los extremos de los
intervalos coincida con los datos, para esto conviene que los extremos de los intervalos tengan una cifra decimal
más.
En un histograma a diferencia de en un diagrama de barras las barras se encuentran totalmente juntas, pero deben de estar
coloreadas igualmente.

3.PARÁMETROS ESTADÍSTICOS
Los parámetros estadísticos nos permiten sintetizar la información a partir de los datos de las tablas de frecuencias, ya sea con
datos aislados o datos agrupados en intervalos, en este último caso usaremos la marca de clase (el valor medio del intervalo), son
los siguientes:

1. Media ( x ): representa un valor representativo del conjunto de datos, se calcula de la siguiente forma:
x=
∑ f i xi
∑ fi
Esta fórmula representa la división entre la suma de todos datos y el número total de individuos.
2. Varianza (Var ): nos indica el grado de dispersión de los valores alrededor de la media, se calcula de la siguiente forma:
∑ f i ( x i− x )
2
∑ f i x 2i
Var=
N
ó Var=
N
2
−x , N= ∑ fi
3. Desviación típica (σ ): nos indica que tan separados se encuentran todos los datos, se calcula de la siguiente forma:
σ =√ var
4. Coeficiente de variación (C.V.): nos sirve para comparar las dispersiones de las poblaciones heterogéneas ya que indica
la variación relativa:
σ
C . V .=
x
Es importante aclarar que la media y la desviación típica poseen la misma unidad que los datos mientras que la varianza posee esa
unidad al cuadrado y el coeficiente de variación no posee unidad y se expresa en porcentaje.

4.PARÁMETROS DE POSICIÓN PARA DATOS AISLADOS


Los parámetros de posición son otra forma de sintetizar la información, tienen la ventaja de que son muy vaciles de interpretar.
Antes de calcular los parámetros de posición tenemos que conocer dos nuevos elementos para las tablas de frecuencias que son los
siguientes:

1. Frecuencia acumulada ( F i): se le llama frecuencia acumulada a la suma de todas las frecuencias anteriores, se calcula
de la siguiente forma:
i
F i=f 1+ f 2 +f 3+ … f i ó F i=∑ f n
n=1
2. Porcentaje acumulado (%ACUM.): nos permitirá hallar de forma sencilla los parámetros de posición, se calcula de la
siguiente forma:
Fi
%ACUM.= ∙ 100 %
N
Los parámetros de posición son los siguientes:

 Cuartiles: son los puntos de corte que se obtienen si ordenamos la población de forma creciente y la dividimos en cuatro
trozos iguales, que un individuo pertenezca a un cuartil Q k nos indica dentro de que porcentaje de la población se
encuentra:
 Primer cuartil (Q 1): es el valor de la variable que supera al 25% de la población y por lo tanto queda por
debajo del otro 75%, se halla en la tabla de frecuencias como el primer x i cuyo porcentaje acumulado supere el
25%.
 Segundo cuartil (Q 2) o mediana ( Me ): es el valor de la variable que supera al 50% de la población y por lo
tanto queda por debajo del otro 50%, se halla en la tabla de frecuencias como el primer x i cuyo porcentaje
acumulado supere el 50%.
 Tercer cuartil (Q 3): es el valor de la variable que supera al 75% de la población y por lo tanto queda por debajo
del otro 25%, se halla en la tabla de frecuencias como el primer x i cuyo porcentaje acumulado supere el 75%.
El cuarto cuartil no existe ya que tendría que ser el primer valor de x i que supere el 100% del porcentaje acumulado cosa
que es imposible. El porcentaje que debe superar la variable para pertenecer al cuartil Q k será igual a k 25 % . Si el
xi + x i+1
porcentaje acumulado es igual a k 25 % , el primer valor de la variable que supere a k 25 % será .
2
 Percentiles: son los puntos de corte que se obtienen al ordenar la población de forma creciente y dividirla en cien trozos
iguales, de igual forma que con los cuartiles, que un individuo pertenezca al percentil Pk indica que supera a un cierto
porcentaje de la población que será igual a k % , para hallarlo en la tabla de frecuencias solo habrá que observar el primer
valor de la variable que supere a k % . Al igual que con los cuartiles si el porcentaje acumulado es igual a k % , el primer
xi + x i+1
valor de la variable que supere a k % será . El percentil P25 coincide con el cuartil Q 1, de igual forma los
2
percentiles P 50 y P75 corresponden a los cuartiles Q 2 / Me y Q 3 respectivamente ya que dejan el mismo porcentaje de
la población por debajo.

5.PARÁMETROS DE POSICIÓN PARA DATOS AGRUPADOS


En las tablas de frecuencias con datos agrupados en intervalos se ha perdido el valor concreto de cada individuo, para saber dónde
se encuentran los cuartiles y percentiles no basamos en el siguiente convenio: “En una tabla de frecuencias con datos agrupados en
intervalos, suponemos que los datos de cada intervalo se reparten uniformemente en él”. Según esto las frecuencias acumuladas
deben asignarse a los extremos los intervalos, es decir habrá que coger el primer extremo inferior y luego todos los extremos
superiores debido a esto para las frecuencias y porcentajes acumulados usaremos los extremos como x i, esto es así porque al final
de cada intervalo se han contabilizado todos los individuos. Podemos visualizar de forma fácil los parámetros de posición de datos
agrupados en intervalos mediante los siguientes tipos de grafico:

 Polígono de frecuencias acumuladas: es la representación gráfica del flujo continuo con una rapidez que varía en cada
intervalo dependiendo del número de individuos f i, se realiza colocando los puntos en un eje de coordenadas donde el eje
X corresponde al extremo superior del intervalo y el eje Y corresponde a las frecuencias acumuladas, posteriormente
unimos todos los puntos y ya habremos finalizado el polígono de frecuencias acumuladas.

 Polígono de porcentajes acumulados: representan los mismo y se realizan de igual forma que el polígono de frecuencias acumula
porcentajes acumulados, esto nos
permitirá hallar fácilmente los
percentiles. Para hallar un
percentil Pk con el polígono de
porcentajes acumulados solo habrá
que tener en cuenta que Pk al ser un valor de la variable se encuentra en el eje de los extremos superiores y que k se
encontrará en el eje de los porcentajes acumulados, entonces para hallar Pk simplemente habrá que relacionar el
porcentaje k con un valor del eje de abscisas mediante la gráfica. Gracias a esto podremos aproximar los percentiles al
ojo y hallarlos exactamente
mediante semejanza de triángulos.

También podría gustarte