Está en la página 1de 31

STATA BÁSICO

NUESTRAS MODALIDADES
MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMETICA(PROMEDIO)
Es el promedio y es la medida de tendencia central que se utiliza con
mayor frecuencia. Se calcula con la suma de todas las observaciones
en un conjunto de datos, dividida entre el número de elementos
involucrados.

Si estamos trabajando con Si estamos trabajando con la


una muestra aleatoria de la población y nos piden la
población en estudio estamos media, calculamos un
calculando un ESTADISTICO, PARAMETRO, que será:
que será:
∑ xi
μ=
N
MEDIANA

Se la simboliza con Me .
La mediana me divide mis observaciones en dos partes
iguales.
La mediana es aquel valor de la variable que un 50% de
los datos es igual a ella o menor.
Lo primero que debemos hacer es ordenar los datos en
forma crecientes.-
Nº IMPAR DE DATOS.-
Supongamos tener los tiempos que un empleado durante 15 días tiene
que esperar el ómnibus para llegar al trabajo.- Estos son:
8 8 9 9 9 10 10 10 11 12 13 15 17 18
20
Me = (n + 1) / 2 = 16 / 2 = 8ª posición
Me = 10 minutos
Nº PAR DE DATOS.
En el ejemplo anterior supongamos tener datos durante 14 días.-
8 9 9 10 10 11 12 13 13 15 17 18 18 20
Me = (n + 1) / 2 = 15 / 2 = 7,5 ª posición

12 + 13
Me = = 12,5 minutos
2
MODA
• Se lo simboliza con Mo.
• Es el valor de la variable que más veces se repite.
• Es la única medida descriptiva que podemos calcular en una
variable nominal.
Ejemplo.
Si tenemos los montos de ingresos quincenales de un grupo de
empleados de una empresa
850 – 875 – 856 – 882 – 875 – 880 – 896 – 810 – 875 – 942 -
975
Observamos el valor de variable que más veces se da:
M o = 875 $
MEDIDAS DE DISPERSION
RANGO O RECORRIDO DE LA
VARIABLE
• Se simboliza Rx .
• Se la calcula haciendo la diferencia entre el máximo
valor de la variable y el mínimo que toma.
• Como medida de dispersión se la toma poco en cuenta
ya que nada me dice de los valores intermedio de la
variable.
• Un uso importante del Rango lo encontramos cuando
vemos la Estadística Descriptiva en el Control de
Calidad de Procesos.
RANGO INTERCUARTÍLICO.
• Se simboliza con RI
RI = Q3 - Q1
• Esta medida considera la dispersión de la mitad (parte
central) de los datos; por lo tanto, los valores extremos
no influyen en ella. Es una buena medida de dispersión
cuando los datos están mejor representados por la
mediana.-
VARIANZA
• Aunque el rango es una medida de la dispersión total y el rango
intercuartílico es una medida de la dispersión media, ninguna
de estas medidas de variación toman en cuenta como se
distribuyen o agrupan las observaciones. Por lo tanto se pensó
en una medida estadística que me tuviera en cuenta todos los
datos y esa medida es la VARIANZA.
Simbolizamos a la variancia:
S² si trabajamos con la muestra
σ² si trabajamos con la población
VARIANZA DE LA MUESTRA
La varianza de la muestra es la suma de los cuadrados de las diferencias con
relación a la media aritmética dividida entre el tamaño de la muestra menos uno.-
∑ ( xi - x )²
S² =
n - 1
Si el denominador fuera n en lugar de (n – 1), se obtendría el promedio de los
cuadrados de las diferencias con respecto a la media.- Si embargo, se utiliza (n –
1) debido a ciertas propiedades matemáticas deseadas que tiene el estadístico
S², lo cual lo hacen muy apropiadas para hacer inferencias estadísticas.- A
medida que se aumenta el tamaño de la muestra, la diferencia entre n y (n – 1)
disminuye cada vez más.-
VARIANCIA DE LA
POBLACION
La varianza de la POBLACION es la suma de los cuadrados de las
diferencias con relación a la media aritmética poblacional dividida entre el
tamaño de la población.-
∑ ( xi - μ)²
σ² =
N

Esta varianza poblacional, muy pocas veces la


calculamos porque sostenemos que las poblaciones
son muy grandes, es un parámetro.
DESVIACIÓN ESTÁNDAR
La simbolizamos con sx en la muestra y con σx en la población.
La desviación estándar mide la dispersión promedio alrededor de la media:
como fluctúan las observaciones mayores arriba de ella y las
observaciones menores debajo de ella.
El desvío estándar es la verdadera medida de dispersión ya que se
expresa en las mismas unidades de medida que los datos originales.-
Calculamos la desviación estándar como:

sx = variancia

Observamos que la media y el desvío estándar ayudan a definir en donde


se agrupan la mayor parte de los datos.
COEFICIENTE DE VARIACIÓN

• Se simboliza por CV, es una medida de variabilidad relativa:


• Se usa para comparar la variabilidad entre dos o mas muestras
medidas en las mismas unidades o no.

< 10% Poca Dispersion


𝑠
cv= 10 – 33% Aceptable
𝑥 34 – 50% Alta Dispersión
> 50% Muy Alta

Se dice q una muestra es homogenea cuando el


coeficiente de variacion está por debajo de 0.15 o 15%
MEDIDAS DE FORMA
COEFICIENTE DE ASIMETRÍA:
SIMETRÍA
Esta medida nos permite identificar si los datos se distribuyen de forma
uniforme alrededor del punto central (Media aritmética)
Existen mas de un coeficiente de Asimetría, el q nos
calcula Stata es el de Fisher

0,09 0,45 0,09

0,08 0,40 0,08

0,07 0,35 0,07

0,06 0,30 0,06

0,05 0,25 0,05

0,04 0,20 0,04

0,03 0,15 0,03

0,02 0,10 0,02

0,01 0,05 0,01

0,00
0 2,5 5 7,5 10 12,5 15 17,5 20 -4 -3 -2 -1 0 1 2 3 4 0 2,5 5 7,5 10 12,5 15 17,5 20
0

g1 < 0 g1 = 0 g1 > 0
Distribución, tiende a Distribución, es simétrica Distribución, tiende a concentrarse
concentrarse en Valores Altos de respecto a la Media en Valores Bajos de la Variable
la Variable
Mo = MA = Me Mo < MA < Me
Mo > MA > Me
• Los resultados de esta ecuación se interpretan:
• (g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe
aproximadamente la misma cantidad de valores a los dos lados de
la media. Este valor es difícil de conseguir por lo que se tiende a
tomar los valores que son cercanos ya sean positivos o negativos (±
0.5).
• (g1 > 0): La curva es asimétricamente positiva por lo que los valores
se tienden a reunir más en la parte izquierda que en la derecha de
la media.
• (g1 < 0): La curva es asimétricamente negativa por lo que los
valores se tienden a reunir más en la parte derecha de la media.
• Desde luego entre mayor sea el número (Positivo o Negativo),
mayor será la distancia que separa la aglomeración de los valores
con respecto a la media.
COEFICIENTE DE CURTOSIS:
ACHATAMIENTO
Esta medida determina el grado de concentración que presentan los valores en la región
central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si
existe una gran concentración de valores (Leptocúrtica), una concentración normal
(Mesocúrtica) ó una baja concentración (Platicúrtica).

0,45 0,45
0,45
0,40 0,40
0,40
0,35 0,35
0,35
0,30 0,30
0,30
0,25 0,25
0,25
0,20 0,20
0,20
0,15 0,15
0,15
0,10 0,10
0,10
0,05 0,05
0,05
0,00 0,00
0,00 -4 -3 -2 -1 0 1 2 3 4
0 -5 -4 -3 -2 -1 0 1 2 3 4 5
-2 -1
g2 > 0
0 1 2

g2 = 0 g2 < 0
Distribución tiende a concentrarse Distribución
alrededor de la Media. Distribución
“Normal” tiende a
Variancia Pequeña dispersarse
Aguzada Variancia grande
Achatada.
• El coeficiente de curtosis que calcula Stata es el de
Fisher.
• Los resultados de esta fórmula se interpretan:

• (g2 = 0) la distribución es Mesocúrtica: Al igual que en la


asimetría es bastante difícil encontrar un coeficiente de
Curtosis de cero (0), por lo que se suelen aceptar los
valores cercanos (± 0.5 aprox.).
• (g2 > 0) la distribución es Leptocúrtica
• (g2 < 0) la distribución es Platicúrtica
• Cuando la distribución de los datos cuenta con un coeficiente de asimetría
(g1 = ±0.5) y un coeficiente de Curtosis de (g2 = ±0.5), se le denomina Curva
Normal. Este criterio es de suma importancia ya que para la mayoría de los
procedimientos de la estadística de inferencia se requiere que los datos se
distribuyan normalmente.
• La principal ventaja de la distribución normal radica en el supuesto que el
95% de los valores se encuentra dentro de una distancia de dos
desviaciones estándar de la media aritmética (Fig.5-3); es decir, si tomamos
la media y le sumamos dos veces la desviación y después le restamos a la
media dos desviaciones, el 95% de los casos se encontraría dentro del rango
que compongan estos valores.
MEDIAS DE ORDEN O TENDENCIA NO
CENTRAL
CUARTILES
Se lo simboliza con Qr., donde con “r” indicamos el orden del cuartil que
queremos calcular. Los cuartiles dividen mi distribución de datos u
observaciones en cuatro partes iguales o sea que tenemos tres cuartiles el
cuartil de orden 1, de orden 2 y el de orden 3, y en cada uno se encuentra el 25
% del total de casos observados.

El cuartil de orden 1 es aquel que me deja un 25 % de datos a izquierda y un


75 % a derecha, de su valor.

El cuartil de orden 2 es aquel que me deja un 50 % de datos a izquierda y un


50 % a la derecha, de su valor. Coincide con la mediana.

El cuartil de orden 3 es aquel que me deja un 75 % de datos a izquierda y


un 25 % a derecha, de su valor.
CUARTILES
Lo primero que debemos hacer es agrupar los datos en forma creciente.-
Realizado esto, calculamos el orden del valor de variable que será el
Cuartil buscado. Puede darse:
Si me da un valor entero, el cuartil
buscado será el valor de variable
que ocupe ese lugar.
Si me da un valor decimal en 5, el
(n + 1) r cuartil buscado será el promedio
entre el dato posición del entero y
Qºr = = el siguiente.
4
Si me da un valor ni entero, ni
decimal en 5, el cuartil buscado
será el dato que ocupe la posición
siguiente al valor entero.
PERCENTILES
Se simbolizan P r , dividen las observaciones en cien partes iguales.-

Para los tres casos que vimos cuartiles, los percentiles se aplica el
mismo criterio solo que recordemos que dividen las observaciones en
100 partes iguales.- Es decir que en todos los casos que usamos 4
debemos usar 100.- Vamos a ver esto mediante ejemplos.-

Supongamos tener una muestra de 15 alumnos a los cuales se les


pregunto la cantidad de materias aprobadas.- Los datos fueron ya
ordenados:
3 5 5 5 6 7 7 7 7 8 8 8 10 13 15

Pº62% = 9,92 P62% = 8 materias


El 62% de los alumnos tienen 8 materias aprobadas o menos.-
Descarga el certificado Digital del curso

Al terminar todo curso en la


Escuela del INEI recibirás
un correo con los datos de
acceso para poder
descargar tu certificado
Digital a nombre del INEI.

https://sistemas.inei.gob.pe/WebCerEnei/

También podría gustarte