Está en la página 1de 9

La estadística

Estadística descriptiva: Se dedica a la descripción, visualización y resumen de datos


originados a partir de los fenómenos de estudio. Los datos pueden ser
resumidos numérica o gráficamente. Su objetivo es organizar y describir las características
sobre un conjunto de datos con el propósito de facilitar su aplicación, generalmente con el
apoyo de gráficas, tablas o medidas numéricas.

 Ejemplos básicos de parámetros estadísticos son: la media y la desviación


estándar.
 Ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre
otros.

Estadística inferencial: Se dedica a la generación de los modelos, inferencias y predicciones


asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las
observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de
la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas
sí/no (prueba de hipótesis), estimaciones de unas características numéricas
(estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación)
o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas
de modelamiento incluyen análisis de varianza, series de tiempo y minería de datos. Su
objetivo es obtener conclusiones útiles para lograr hacer deducciones acerca de la totalidad
de todas las observaciones hechas, basándose en la información numérica.

Tipos de representaciones gráficas: Cuando se muestran los datos estadísticos a través de


representaciones gráficas, se ha de adaptar el contenido a la información visual que se
pretende transmitir. Para ello, se barajan múltiples formas de representación:
 Diagramas de barras: muestran los valores de las frecuencias absolutas sobre un
sistema de ejes cartesianos, cuando la variable es discreta o cualitativa.
 Histogramas: formas especiales de diagramas de barras para distribuciones
cuantitativas continuas.
 Polígonos de frecuencias: formados por líneas poligonales abiertas sobre un
sistema de ejes cartesianos.
 Gráficos de sectores: circulares o de tarta, dividen un círculo en porciones
proporcionales según el valor de las frecuencias relativas.
 Pictogramas: o representaciones visuales figurativas. En realidad son diagramas
de barras en los que las barras se sustituyen con dibujos alusivos a la variable.
 Cartogramas: expresiones gráficas a modo de mapa.
 Pirámides de población: para clasificaciones de grupos de población por sexo y
edad.
Población estadística: Una población estadística es un conjunto de sujetos o elementos que
presentan características comunes. Sobre esta población se realiza el estudio estadístico con
el fin de sacar conclusiones. El tamaño poblacional es el número de individuos que
constituyen la población.
Individuo: Cada uno de los elementos de la población.

Muestra: Cualquier subconjunto de la población. Este subconjunto es muy importante que


sea representativo de la población.

Muestreo: de población es un proceso que consiste en tomar un subgrupo de sujetos que sea
representativo de toda la población. La muestra debe tener un tamaño suficiente como para
garantizar un análisis estadístico.
Carácter: Cada una de las propiedades que poseen los individuos de la población y que
pueden ser objeto de estudio.

La moda: es el dato más repetido, el valor de la variable con mayor frecuencia absoluta. En
cierto sentido se corresponde su definición matemática con la locución "estar de moda", esto
es, ser lo que más se lleva.

La mediana: La mediana es un valor de la variable que deja por debajo de sí a la mitad de los
datos, una vez que estos están ordenados de menor a mayor.

La media: Es una medida de dispersión que tiene, por su propia definición, las mismas
propiedades que la mediana. Por ejemplo, no se ve afectada por valores extremos o atípicos.

La tasa: es un coeficiente que expresa la relación entre la cantidad y la frecuencia de un


fenómeno o un grupo de fenómenos. Se utiliza para indicar la presencia de una situación que
no puede ser medida en forma directa.

Dato: Son números que pueden ser comparados, analizados e interpretados. El campo del
cual son tomados los datos estadísticos se identifica como población o universo. Los internos
son los registros obtenidos dentro de la organización que hace un estudio estadístico, Los
externos se obtienen de datos publicados y encuestas.

Valor: es cada uno de los distintos resultados que se pueden obtener en un


estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y
cruz. Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico.
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los
datos estadísticos, asignando a cada d ato su frecuencia correspondiente.

Tipos de frecuencias

· Frecuencia absoluta
·

La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio


estadístico. Se representa por f i . La suma de las frecuencias absolutas es igual al número total
de datos, que se representa por N .
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que
se lee suma o sumatoria.

· Frecuencia relativa

La frecuencia relativa es el coci en te entre la frecuencia absoluta de un determinado


valor y el número total de datos. Se puede expresar en tantos por ciento y se representa
por n i . La suma de las frecuencias relativas es igual a 1.

· Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los
valores inferiores o igual es al valor considerado. Se representa por F i .

Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30,
31, 30, 31, 34, 33, 33, 29, 29.

xi Recuento fi Fi ni Ni
27 I 1 1 0.032 0.032

28 II 2 3 0.065 0.097

29 6 9 0.194 0.290

30 7 16 0.226 0.0516

31 8 24 0.258 0.774

32 III 3 27 0.097 0.871

33 III 3 30 0.097 0.968

34 I 1 31 0.032 1

31 1
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en
la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta. Este
tipo de tablas de frecuencias se utiliza con variables discretas.

Representación gráfica de los datos estadísticos

Diagrama de barras

Un diagrama de barras se utiliza para de presentar datos cualitativos o datos


cuantitativos de tipo discreto .

Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los


valores de la variable , y sobre el eje de ordenadas las frecuencias absolutas o
relativas o acumuladas .

Los datos se representan mediante barras de una altura proporcional a la frecuencia .

Ejemplo

Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo
sanguíneo ha dado el siguiente resultado:

Grupo
f

A 6

B 4

AB 1

0 9

20
Polígonos de frecuencia
Un polígono de frecuencias se forma uniendo los extremos de las barras mediante
segmentos .
También se puede realizar trazando los p u n tos que representan las frecuencias y
uniéndolos mediante segmentos.

Ejemplo

Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes
variaciones:

Hora Temperatura
6 7º
9 12°
12 14°
15 11°
18 12°
21 10°
24 8°

Diagrama de Sectores

Un diagrama de sectores se puede utilizar para todo tipo de variables , pero se usa
frecuentemente para las variables cualitativas .

Los datos se representan en un círculo , de modo que el ángulo de cada sector es


proporcional a la frecuencia absoluta correspondiente.

El diagrama circular se construye con la ayuda de un transportador de ángulos


Ejemplo

En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 4 juegan al


fútbol y el resto no practica ningún deporte.

Alumnos Ángulo
Baloncesto 12 124°
Natación 3 36°
Fútbol 9 108°
Sin deporte 6 72°
Total 30 360°

Parámetros estadísticos

Tipos de parámetros estadísticos


Hay tres tipos parámetros estadísticos:
- De centralización.
- De posición
- De dispersión.

Medidas de centralización

Nos indican en torno a qué valor (centro) se distribuyen los datos. La medidas de
centralización son:

· Media aritmética
La media es el valor promedio de la distribución. La media aritmética es el valor
obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.

es el símbolo de la media aritmética.


Medidas de dispersión

Las med i d as d e d i sp ersi ón nos informan sobre cuánto se alejan del centro los
valores de la distribución. Las med i d as d e d i sp ersi ón son:

· Rango o recorrido

El ran go es la d i f er en ci a entre el mayo r y el men or de los d atos de una


distribución estadística.

 Varianza
La va ri an za es la med i a ari t mé ti ca del cu ad rad o d e l as d esvi aci on es
respecto a la med i a . La varianza se representa por .
Para simplificar el cá l cu l o d e l a vari anza vamos o utilizar las siguientes
expresiones que son equivalentes a las anteriores.

· Desviación típica

La d esvi aci ón tí p i c a es la raí z cu ad rad a de la vari an za . Es decir, la raíz


cuadrada de la media de los cuadrados de las puntuaciones de desviación. La d esvi aci
ón tí p i ca se representa por σ. Para simplificar el cálculo vamos o utilizar las siguientes
expresiones que son equivalentes a las anteriores.

Cuanta más pequeña sea lad esvi aci ón tí pi ca mayor será lacon ce n traci ón d e d
atos alrededor de la med i a .

· Coeficiente de variación

El coef i ci en te d e va ri aci ón es la relación entre la d esvi aci ón tí p i ca de una


muestra y su med i a .
El coef i ci en te d e va ri aci ón se suele expresar en p orc en tajes :

El coef i ci en te d e vari aci ón permite comparar las d i sp ersi on es de dos


distribuciones distintas, siempre que sus med i as sean p osi ti vas . Se calcula para
cada una de las distribuciones y los valores que se obtienen se comparan entre sí.

La mayor d i sp ersi ó n corresponderá al valor del coef i ci en te d e vari aci ón


mayo r .

Ejercicio

Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos
presenta mayor dispersión?

La primera distribución presenta mayor dispersión.

También podría gustarte