Está en la página 1de 9

“Análisis Estadístico

de Datos”

Profesor: Hans Claudio González González


Estadígrafo descriptivo:
Los métodos gráficos son útiles para lograr una descripción cómoda de un
conjunto de datos. Sin embargo, tanto las gráficas como las tablas tienen
limitaciones para la descripción y el análisis de conjuntos de datos, especialmente,
en lo que respecta a la inferencia estadística. Esta limitación de los métodos
gráficos y tablas puede superarse con el uso de medidas descriptivas numéricas,
que pueden utilizar de forma independiente a las gráficas y tablas. A su vez, estos
nuevos procedimientos son de mayor facilidad en obtención, elaboración y
comprensión, ya que poseen un menor grado de criterio entregando información
intersubjetivamente contrastable de forma sencilla y clara.
Un Estadígrafo es una medida, calculada en función de los datos observados de
un conjunto en particular, que describe o caracteriza algo esencial de ese conjunto
de datos, poseyendo de forma intrínseca una serie de propiedades deseables que
permiten la descripción de cualquier conjunto entregando información
representativa.

Medidas de Posición (o tendencia central):


Con el fin de conocer y analizar un conjunto de datos, es necesario conocer de
alguna forma un dato que sea capaz de representar del mejor modo posible a
todo el conjunto de observaciones. Cuando es preciso dar alguna información
sobre un solo dato, es sumamente sencillo, Basta medirlo y con ello entendemos
exactamente cuál es o ha sido su comportamiento.
Sin embargo, cómo se puede lograr lo mismo que con un dato, cuando se trata de
un conjunto de ellos, los cuales tienen distintos valores para la misma variable.
El fin es encontrar un dato que se encuentre al centro del conjunto de datos y que
tenga la capacidad de representarlos a todos, con el menor esfuerzo posible. Una
de las primeras medidas de interés para el análisis de los datos es una medida de
tendencia central o de posición, o sea una medida del centro de la distribución
estudiada. Se revisarán algunas de estas medidas:
MODA: (MO)
Con el fin de encontrar a ese dato que se encuentra en el centro o bien que
represente de buena manera a un conjunto, una primera aproximación de carácter
intuitivo puede ser aquel que tiene mayor ocurrencia dentro de un conjunto de
datos.
La moda es el valor de la o las observaciones que más se repite (que tiene mayor
frecuencia) dentro del conjunto de datos. Si el conjunto de datos tiene una sola
moda, se le denomina “mono modal”. De la misma forma, puede ser “bimodal” o
“multimodal” según se aprecien dos o más valores modales.

Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.

Ejemplo:

Hallar la moda de la distribución:

2, 3, 3, 4, 4, 4, 5, 5 Mo = 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa


frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene
varias modas.

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay


moda.

2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el


promedio de las dos puntuaciones adyacentes.

0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
MEDIANA: (Me)
La mediana de un conjunto de datos es el valor de aquella observación que se
ubica en el centro del conjunto de datos cuando este ha sido previamente
ordenado en forma ascendente o descendente. Esto indica que la observación que
corresponde a la mediana supera, en magnitud, a la mitad de las observaciones y
es superado por la otra mitad. En palabras familiares es el valor del dato del centro
del conjunto.

La mediana se representa por Me.

La mediana se puede hallar sólo para variables cuantitativas.

Cálculo de la mediana

1. Ordenamos los datos de menor a mayor.

2. Si la serie tiene un número impar de medidas la mediana es la puntuación


central de la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6 Me = 5

3. Si la serie tiene un número par de puntuaciones la mediana es la media entre


las dos puntuaciones centrales.

7, 8, 9, 10, 11, 12 Me = 9.5

PROMEDIO:
La media aritmética, también conocida como el promedio aritmético de un conjunto
de N observaciones (sean correspondientes a la población o a la muestra), es
igual a la suma de esas observaciones dividida entre N (número total de
observaciones).

La media aritmética es el valor obtenido al sumar todos los datos y dividir el


resultado entre el número total de datos.

Es el símbolo de la media aritmética.


Ejemplo:

Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

Observaciones:

La media se puede hallar sólo para variables cuantitativas.

La media es muy sensible a las puntuaciones extremas. Si tenemos una


distribución con los siguientes pesos:

65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.

La media es igual a 74 kg, que es una medida de centralización poco


representativa de la distribución.

Media aritmética para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la


media es:
Nota: el “Xi” es la marca de clase para el caso de tablas con variables continuas.

Medidas de Dispersión:

Varianza
Es el promedio del cuadrado de la desviación de cada observación respecto a la
media aritmética del conjunto de datos.

La varianza se representa por .

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes


expresiones que son equivalentes a las anteriores.

Ejemplo 1:
Calcular la varianza de la distribución:

9, 3, 8, 8, 9, 8, 9, 18

Ejemplo 2

xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050

Nota: si se quiere calcular la varianza proveniente de la muestra en la formula se


divide por n-1 y se representa como S 2

Propiedades de la varianza

1. La varianza será siempre un valor positivo o cero, en el caso de que las


puntuaciones sean iguales.
2. Si a todos los valores de la variable se les suma un número la varianza
no varía.
3. Si todos los valores de la variable se multiplican por un número la
varianza queda multiplicada por el cuadrado de dicho número.
4. Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas varianzas se puede calcular la varianza total.

Desviación estándar
La desviación estándar o desviación típica es la raíz cuadrada positiva de la
varianza. Notemos que la varianza queda medida en términos del cuadrado de las
unidades originales y por lo tanto, la desviación estándar queda en las mismas
medidas originales, siendo la primera medida de dispersión representativa del
conjunto de datos y con ello se ha encontrado la diferencia media que existe entre
las observaciones y el promedio.

Rango: es la diferencia entre el mayor y el menor de los datos de una


distribución estadística, esto nos permite obtener una idea de la dispersión de los
datos, cuanto mayor es el rango, más dispersos están los datos de un conjunto.
Rango= max-min

Coeficiente de variación

El coeficiente de variación entrega una medida relativa de la desviación estándar


de un conjunto de datos, con el fin de poder comparar entre conjuntos de
observaciones.
Esta es la única forma en la cual es posible comparar la dispersión que tienen los
datos de un conjunto de observaciones de forma directa.
Formula:
El coeficiente de variación se suele expresar en porcentajes:

El coeficiente de variación permite comparar las dispersiones de dos


distribuciones distintas, siempre que sus medias sean positivas.

Se calcula para cada una de las distribuciones y los valores que se obtienen se
comparan entre sí.

La mayor dispersión corresponderá al valor del coeficiente de variación mayor.

Ejemplo:
Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 24. ¿Cuál de las
dos presenta mayor dispersión?

La primera distribución presenta mayor dispersión.

También podría gustarte