Está en la página 1de 39

DR.

EDGAR ROLDAN PEREDA


Estadistica

Descriptiva Analítica

Variables Variables Paramétrica No-paramétrica


numéricas categóricas

Centralización Dispersión Proporciones


Tasa

Media varianza
mediana Desviación estándar
Moda Máx.-mín
Grupo de técnicas estadísticas Nº 1 Grupo de técnicas estadísticas Nº 2

 Distribución de frecuencias  Coeficientes de rango


 Coeficiente de contingencia  Mediana
 Prueba de chi cuadrado  Gamma
 Moda

Nominales Ordinales

VARIABLES

Razón Intervalo

 Mediana
Admiten todas las técnicas  Media Aritmética

 Desviación estándar

 Correlación múltiple

Coeficiente de correlación de
Pearson

Grupo de técnicas estadísticas Nº 3 Grupos de técnicas estadísticas Nº4


Estadística descriptiva
Es la que nos permite presentar los
datos sistemáticamente en cuadro
o tablas y gráficos, así como el
cálculo de resúmenes numéricos o
estadígrafos tales como
frecuencias, promedios, varianza,
porcentajes, etc.
Nos permite presentar datos de
manera sistémica.

Tablas

Cuadros

Resúmenes
numéricos
Gráficos
LAS VARIABLES ESTADÍSTICAS

Escalas de medida
NOMINAL O DE DE ORDEN INTERVALOS
CLASIFICACIÓN JERÁRQUICO RAZÓN
IGUALES
Clase social, nivel Fecha del Nº de hijos,
Sexo, ciudad,
educativo, escalas de calendario, ingresos,
situación laboral,
actitud, etc. factoriales, antigüedad,
religión, etc. edad, etc.
test, etc.
Representaciones Gráficas

Existen múltiples tipos de gráficos, pero


aquí trataremos solamente de los usados
más frecuentemente, que son:

 gráfico de barras
 gráfico de sectores o circular (pastel)
 Histograma
 polígono de frecuencias
 la ojiva
 pictograma.
Gráficos estadísticos
Diagrama de barras:

Se utilizan rectángulos separados, que tienen como base a cada


uno de los datos y como altura la frecuencia absoluta o relativa de
ese dato.

LPHOGD85
LPHOGD85
20000000

1 31
fi
10000000

2 69
LPHOGD85
Frecuencia

0
1 2 0 20 40 60 80

LPHOGD85 Porcentaje fr
Casos ponderados por PONDIH Casos ponderados por PONDIH
Se usa fundamentalmente para representar distribuciones de
frecuencias de una variable cualitativa o cuantitativa discreta
y, ocasionalmente, en la representación de series
cronológicas o históricas. Uno de los ejes sirve para inscribir
las frecuencias, ya sean absolutas o relativas (%), y el otro
para la escala de clasificación utilizada.
Histograma
Está formado por rectángulos, cuyas bases
corresponden con los intervalos de clase y sus
Áreas son iguales o proporcionales a sus frecuencias.
Este gráfico se usa para representar una distribución
de frecuencias de una variable cuantitativa continua.
Habitualmente se representa la frecuencia observada
en el eje Y, y en el eje X la variable
Polígono de frecuencias
Es una línea poligonal que une los vértices superiores de las
barras de un diagrama de barras, o los puntos medios de las
bases superiores de los rectángulos de un histograma. Se utiliza,
al igual que el histograma, para representar distribuciones de
frecuencias de variables cuantitativas continuas, pero como no
se utilizan barras en su confección sino segmentos de recta, de
ahí el nombre de polígono. Habitualmente se usa cuando se
quiere mostrar en el mismo gráfico más de una distribución.
Diagrama de sectores o gráfico
circular

Gráfica de Sectores: LPHOGD85

Se forma al dividir un círculo en 1

sectores de manera que:


a) cada sector equivale al
porcentaje correspondiente al dato
o grupo que representa; y
b) la unión de los sectores forma el 2

círculo y la suma de sus


porcentajes es 100.
Casos pond erados por PONDIH
Se usa, fundamentalmente, para representar
distribuciones de frecuencias relativas (%) de una
variable cualitativa o cuantitativa discreta. En este gráfico
se hace corresponder la medida del ángulo de cada sector
con la frecuencia correspondiente a la clase en cuestión. Si
los 360º del círculo representan el 100 % de los datos
clasificados, a cada 1% le corresponderán 3,6º. Luego,
para obtener el tamaño del ángulo para un sector dado
bastaría con multiplicar el por ciento correspondiente por
3,6º (por simple regla de tres).
Pictogramas
Los pictogramas son gráficos similares a los gráficos
de barras, pero empleando un dibujo en una
determinada escala para expresar la unidad de medida
de los datos. Se utiliza un dibujo relacionado con el
tema, para representar cierta cantidad de frecuencias.
Este tipo de gráfica atrae la atención por los dibujos,
pero la desventaja es que se lee en forma aproximada.
Gráfico de líneas u ojiva
Una gráfica de distribución de frecuencias absolutas o relativas
acumuladas es llamada una ojiva. Se trazan los límites reales
superiores contra las frecuencias acumuladas.
 En este tipo de gráfico, al igual que el histograma y el
polígono de frecuencias el objetivo es representar
distribuciones de frecuencias de variables cuantitativas
continuas, pero sólo para frecuencias acumuladas.
 se representan los valores de los datos en dos ejes
cartesianos ortogonales entre sí.
 Se pueden usar para representar: una serie o más series
Probabilidad
 La probabilidad de ocurrencia de un
evento es igual a la proporción veces
que el evento ocurriría en un número
suficientemente grande de ensayos
repetidos.
 Valores: entre 0 y 1 (0% y 100%)
Probabilidad
 Laprobabilidad de ocurrencia del
evento A y el evento B: ley
multiplicativa

 Laprobabilidad de ocurrencia del


evento A o el evento B: ley aditiva
MEDIDAS DE TENDENCIA CENTRAL

 Llamadas también medidas de


localización, porque se localizan en el
centro de una distribución de datos.
– Media
– Mediana
– Moda
Distribución normal

0,2

0,18

0,16

0,14

0,12

0,1

0,08

0,06

0,04

0,02

0
-3,0 2,2 3,5 4,5 5,5 7,0 9,5 11,0 12,0 13,0 14,5 17,0 18,5 19,5 20,5 21,8 27,0
Asimetría es
positiva cuando la
mayoría de los datos se
encuentran por encima
del valor de la media
aritmética.

La curva es
Simétrica cuando se
distribuyen
aproximadamente la
misma cantidad de
valores en ambos lados
de la media.

Asimetría
negativa cuando la mayor
cantidad de datos se
aglomeran en los valores
menores que la media.
Media Aritmética
Llamada también promedio
o media y se obtiene de
sumar todos los valores que
forma una variable y dividir
entre el total de ellos.
Ejemplo:
Hallar el promedio de los pesos en kg de 10 alumnos.
X: 45,1; 67,7; 73,7; 42,5; 64,4; 66,7; 50,5; 62,7; 60,7;
63,6.

= 45,1  67,7  73,7  42,5  64,4  66,7  50,5  62,7  60,7  63,6
x 10

597,6
x =
10
= 59,76
Mediana
La mediana es el valor que ocupa la
posición central, es decir a uno y
otro lado de este valor mediano se
encuentra el 50% del total de las
observaciones.

50% Me 50% x1
La edad de 5 alumnos: 19, 17, 20, 18, 18
· Primero se ordena: 17, 18, 18, 19, 20
· Número central: 18
La edad de 4 alumnos: 15, 16, 16, 14
· Primero se ordena: 14, 15, 16, 16
· Número central: 15, 16

15  16
 15,5
2
Se saca la medida = 15,5
Entonces, el número central es 15,5
Moda
Es el valor más frecuente de una variable, el
valor más frecuente de una distribución de
datos.
Ejemplo:
El conjunto: 2, 2, 5, 7, 9, 9, 9
La moda: Mo = 9
MEDIDAS DE DISPERSION
O DE VARIABILIDAD
MEDIDAS DE VARIABILIDAD
(DISPERSIÓN)
Indican el grado de concentración o
dispersión de los datos alrededor de un
punto central (media, mediana o moda)
Son:
Rango
Desviación estándar
Varianza
Varianza y desviación estándar
 Varianza:
Sumatoria de todos las observaciones
menos la media, dividido entre n - 1

s2 = S (x - media) / n -1

 Desviación estándar:
s = √ s2

Distribución normal
Distribución normal de las
medias de un n de muestras
0,2

0,18

0,16

0,14

0,12

0,1

0,08 + 1.96 EE
-1.96 EE
0,06

0,04

0,02

0
-3,0 2,2 3,5 4,5 5,5 7,0 9,5 11,0 12,0 13,0 14,5 17,0 18,5 19,5 20,5 21,8 27,0
La relación crítica: “z”
 ¿Acuántos EE está mi valor X de
la media de las medias
muestrales?

Si está dentro del rango -1.96 EE


hasta +1.96 EE no seremos
capaces de afirmar que el valor X
difiere de la población comparativa
(con 95% de confianza)
Asimetría y Curtosis
Cuando un extremo o cola es mayor que el otro,
decimos que la distribución de esta figura está
sesgada o son asimétricas.
Ejemplo:
CURVA A CURVA B
Cuando las curvas son más planas que otras
es una característica conocida como curtosis.

La curva A: a esta curva se le conoce con el


término de mesocúrtica.

Curva A
La curva B es más picuda y nos referimos a
esta distribución como leptocurtica.

Curva B
La curva C es más plana que la normal y se
le llama platocúrtica.

Curva C
curtosis > 0
LEPTOCÚRTICA

curtosis = 0
MESOCÚRTICA

PLATICÚRTICA
curtosis < 0

Cuando la distribución de los datos


cuenta con un coeficiente de
asimetría (g1 = ±0.5) y un coeficiente
de Curtosis de (g2 = ±0.5), se le
denomina Curva Normal. Este criterio
es de suma importancia ya que para la
mayoría de los procedimientos de la
estadística de inferencia se requiere
que los datos se distribuyan
normalmente.
Recorrido o rango

Es la medida entre el mayor y menor de los valores de una


distribución de datos.

El rango como estadígrafo de dispersión es muy limitado,


pues solamente considera los valores extremos de la
distribución y no dice nada de cómo se dispersan los
valores intermedios. Es decir, no expresa la dispersión de
n-2 valores de la variable.
Cuartiles
Son estadígrafos de posición que dividen al total
de observaciones, debidamente ordenados o
tabulados en 4 partes iguales.

25% 25% 25% 25%

O1 O2 O3 O4

También podría gustarte