Está en la página 1de 165

ESTADSTICA

Mg.C.D. ARMANDO CARRILLO FERNNDEZ

3/3/15

AMCF

3/3/15

AMCF

3/3/15

AMCF

3/3/15

AMCF

3/3/15

AMCF

SEMANA
PRIMERA

INTRODUCCION A
LA ESTADSTICA

DEFINICIONES
DATOS
ESTADISTICA: # estadistico: muestra
POBLACIN
CENSO
MUESTRA
PARAMETRO. Medicin numrica que describe
algunas caractersticas de una poblacin
3/3/15

AMCF

PARAMETRO De los
1324
semforos
de
Huancayo Distrito estn
funcionando a la fecha
890.

Estadstico Una muestra de


300 trabajadores , se
encontr que el 80 % est
satisfecho con su salario.
3/3/15

AMCF

Los datos muestrales deben


reunirse de forma adecuada:

3/3/15

AMCF

3/3/15

AMCF

3/3/15

AMCF

TIPOS DE DATOS
Los datos muestrales sirven para hacer
INFERENCIAS sobre una POBLACION COMPLETA.
DATOS CUANTITATIVOS : peso,talla,etc
DATOS CUALITATIVOS :gnero
Conocer y diferenciar la naturaleza de los datos
muestrales, ya que su mal aplicacin afectan de
manera importante los mtodos y resultados
3/3/15

AMCF

MarsOrbiterClimate
3/3/15

AMCF

Datos cuantitativos
Datos discretos cuando es un NMERO
FINITO
Datos continuos (numricos) resultan de
un infinito de posibles valores.

3/3/15

AMCF

OTRA CLASIFICACION DE LOS DATOS

NOMINAL
ORDINAL
INTERVALO
RAZN

3/3/15

AMCF

NOMINAL: Son exclusivamente en


nombre,etiquetas o categoras. No se
pueden ordenar.
EJEMPLO:
Si-no-indeciso
Colores

3/3/15

AMCF

ORDINAL: Cuando se pueden colocar


en algn orden, para obtener
comparaciones relativas, aunque no
es posible determinar diferencias de
magnitud.
EJEMPLO:
Calificaciones del curso: ABCDE
Rango
3/3/15

AMCF

INTERVALO: Parecido al ordinal, pero


la diferencia entre los datos tiene un
significado. No tienen un punto de
partida cero natural inherente.
EJEMPLO:
Temperatura
Aos
3/3/15

AMCF

RAZON: Parecido al intervalo, la


diferencia entre los datos tiene un
significado. Tienen un punto de partida
cero natural inherente.
EJEMPLO:
Peso
Precio
3/3/15

AMCF

Qu es lo que hemos visto?


DATOS

CUANTITATIVOS

CUALITATIVOS

DATOS

NOMINAL

ORDINAL

INTERVALO

DE RAZN

ACTIVIDADES PAGINAS 11 Y 12
Entrega prxima clase de teora
3/3/15

AMCF

3/3/15

AMCF

SEMANA
SEGUNDA

VARIABLES

CONCEPTO
Es cualquier caracterstica, cualidad o
propiedad de un fenmeno o hecho
que tiende a variar y que es
susceptible de ser modificado o
evaluado

3/3/15

AMCF

Tambin se puede definir como una


propiedad
que
adquiere
varios
valores.
Por ejemplo, la edad,sexo,religin,etc.

3/3/15

AMCF

Forman la estructura del problema de


investigacin ya que la relacin que
vamos a investigar es la relacin entre
variables

3/3/15

AMCF

CLASIFICACION DE LAS VARIABLES


A) NATURALEZA:
1.- CUALITATIVAS.

Son aquellas cuyos


elementos de variacin tienen un carcter
cualitativo. No se pueden medir mediante
nmeros,sin utilizar la frecuencia en que
aparecen,es decir se expresan verbalmente
con un cdigo prestablecido,no llevan
clasificacin numrica y se expresan en
atributos o categoras de clasificacin.

Ejemplo: Sexo,estado civil,caractersticas de la


personalidad
3/3/15

AMCF

CLASIFICACION DE LAS VARIABLES


A) NATURALEZA:
1.- CUALITATIVAS.
a) NOMINALES. Cuando la
categora de clasificacin o atributo
no tiene ningn orden.
Ejemplo. Sexo, estado civil,
color cabello

3/3/15

AMCF

CLASIFICACION DE LAS VARIABLES


A) NATURALEZA:
1.- CUALITATIVAS.
a) ORDINALES. Cuando la
categora de clasificacin o atributo
poseen una ordenacin natural.
Ejemplo. Estatus socioeconmico,
medidas de las camisas, niveles de
estudio.
3/3/15

AMCF

CLASIFICACION DE LAS VARIABLES


A) NATURALEZA:
2.- CUANTITATIVAS. Son aquellas
cuyos elementos de variacin tienen
un carcter cuantitativo o numrico.
Ejemplo. Rendimiento escolar,nivel
de ingreso econmico,edad.

3/3/15

AMCF

CLASIFICACION DE LAS VARIABLES


A) NATURALEZA:
2.- CUANTITATIVAS.
a) Discretas. Cuando estn
restringidas a determinado valor.Son
tambin llamadas categricas.
Ejemplo. N de hijos, ctdad de
trabajadores que reciben un sueldo
por encima de X soles

3/3/15

AMCF

CLASIFICACION DE LAS VARIABLES


A) NATURALEZA:
2.- CUANTITATIVAS.
b) Continuas.Son aquellas que
pueden tomar cualquier valor
numrico
Ejemplo. Rendimiento intelectual,
temperatura ambiental , etc.

3/3/15

AMCF

CLASIFICACION DE LAS VARIABLES


B)

DE ACUERDO AL LUGAR O IMPORTANCIA


DENTRO DE UNA RELACIN DE VARIABLES

Se clasifican en variables
independientes,dependientes y
extraa o intermitente
Ejemplo: Estudio sobre el efecto de un programa de
aprestamiento perceptivo-motor en el
aprendizaje de la lecto escritura

3/3/15

AMCF

INDICADORES
Son los instrumentos para medir a la
variable, es necesario tomarlos en
cuenta para construir los
instrumentos de recoleccin de
datos.

3/3/15

AMCF

3/3/15

AMCF

Variables estadsticas. Modalidades


Variable estadstica (v.e.): Caracterstica propia del individuo

objeto del estudio estadstico


Ejemplos: - Estatura
- Salario
- Color del pelo
- Nivel de colesterol
- N de hijos de una familia
Modalidad: Cada una de las posibilidades o estados

diferentes de una variable estadstica


Exhaustivas e incompatibles
Ejemplo:
color del pelo:
- castao
- rubio
- negro

Tipos de variables estadsticas


Cualitativas: Las caractersticas no son cuantificables

Ejemplos:
Grupo sanguineo
Profesin
Color del pelo
Cuantitativas: Caractersticas cuantificables o numricas
Discretas: Numricas numerables

Ejemplos:
N de hijos de una familia
N de nidos de procesionarias por rbol
N de virus en un cultivo
Continuas: Numricas no numerables
Ejemplos:
Estatura
Salario
36

3/3/15

AMCF

SEMANA
TERCERA

RESUMEN DE
DATOS

ORGANIZAR
RESUMIR
GRAFICAR DATOS
SABER ENTENDER E
INTERPRETAR LOS DATOS

3/3/15

AMCF

CARACTERISTICAS IMPORTANTES DELOS DATOS


1.- CENTRO.
2.-VARIACIN.
3.- DISTRIBUCIN: ( campana,uniforme,sesgada)
4.- VALORES EXTREMOS
5.- TIEMPO: caractersticas cambiantes de los datos

3/3/15

AMCF

DISTRIBUCIONES DE FRECUENCIA
La empleamos cuando trabajamos con grandes
conjuntos de datos, con el fin de organizarlos y
resumirlos y entenderlos lo que nos dicen.(su
naturaleza)

3/3/15

AMCF

DEFINICIN
Son las listas de valores (individuales o intervalos),
junto a sus frecuencias (conteos) respectivos.
Distribucin de frecuencia: Edades de las mejores
actrices

3/3/15

Edad de las actrices

FRECUENCIAS

21-30

28

31-40

30

41-50

12

51-60

61-70

71-80

2
AMCF

DEFINICIONES
1.- LIMITE CLASE INFERIOR
2.-LIMITE DE CLASE SUPERIOR
3.- FRONTERAS DE CLASE til para elaborar histogramas
4.- MARCAS DE CLASE (Ci + Cs) / 2
5.- ANCHURA DE CLASE Diferencia entre Ci
consecutivas

3/3/15

AMCF

Procedimientos para construir una distribucin de


frecuencias

1. Seleccionar las clases


2.- Anchura de clase= valor ms alto valor ms bajo
-----------------------------------------nmero de clases
= 9,833 = 10
3.- Partida 21
4.- Ci 31,41,51,61,71.
5.- Cs 30,40,50,60,70,80
3/3/15

AMCF

Procedimientos para construir una distribucin de


frecuencias relativas

1. Dividir cada frecuencia de clase entre el total de


frecuencias, se expresan en porcentajes
2.- Frecuencia relativa= frecuencia de la clase
-----------------------------------------suma de todas las frecuencias

3/3/15

AMCF

Distribucin de frecuencia relativas de las edades de las


mejores actrices
Edad de las actrices

FRECUENCIAS

21-30

37%

31-40

39%

41-50

16%

51-60

3%

61-70

3%

71-80

3%

La suma de las frecuencias relativas debe sumar 1 o


100%,con discrepancias por el redondeo
3/3/15

AMCF

Distribucin de frecuencias acumulativas


Es la suma de las frecuencias para es clase y todas
las clases anteriores
1. 28+30 = 58
2.- 28+30+12=70
3.- 28+30+12+2=72
4.- 28+30+12+2+2= 74
5.- 28+30+12+2+2+2= 76

3/3/15

AMCF

Distribucin de frecuencia acumuladas de las edades de las


mejores actrices
Edad de las actrices

FRECUENCIAS

Menor de 31

28

Menor de 41

58

Menor de 51

70

Menor de 61

72

Menor de 71

74

Menor de 81

76

Los lmites de clase son reemplazados por la


expresin menor que
3/3/15

AMCF

Qu es lo que hemos visto?


DATOS

AGRUPADOS

NO
AGRUPADOS

DATOS

LIM.
SUPERIO

LIM.
INFERIOR

FRONTERAS

MARCAS

ANCHURAS

DISTRIBUCIN NORMAL
Al graficarlas tienen forma de CAMPANA
Al inicio las frecuencias son bajas, despus se
incrementan hasta un punto mximo, luego
descienden
Deben ser simtricas y las frecuencias se distribuyen
de manera uniforme a ambos lados de la frecuencia
mxima

3/3/15

AMCF

EJERCICIO PRACTICO
LAS NOTAS DEL CURSO DE ESTADSTICA DEL
CICLO PASADO HAN SIDO LAS SIGUIENTES:
3,4,1,2,8,9,8,7,6,6,7,9,8,7,7,1,0,1,5,9,9,8,0,8,8,8,9,5,7,
5,

3/3/15

AMCF

notas

3/3/15

frecuencia
absoluta

frecuencia
absoluta
acumulada

AMCF

porcentaje

Porcentaje
acumulado

Interpretacin de los datos

3/3/15

AMCF

FRECUENCIA DE DATOS AGRUPADOS EN


INTERVALOS DE CLASE
Recorrido o rango. Se usa para variables
cuantitativas, es la diferencia entre el mayor y menor
valor de los datos

3/3/15

AMCF

Determinacin del nmero de intervalos de clase (k)

Consiste en dividir el rango en un nmero conveniente


de intervalos.
Si n menor igual que 100 k= raz cuadrada de n
Si n mayor que 100 k= 1+ 3,32193 * log 10 n

3/3/15

AMCF

FRECUENCIA DE DATOS AGRUPADOS EN


INTERVALOS DE CLASE
8.3

6.6

7.5

7.9

8.2

7.8

8.5

7.9

7.9

8.5

7.2

6.6

8.8

6.6

8.3

7.7

7.9

7.8

8.4

9.3

6.6

7.6

7.5

8.6

7.9

7.4

7.9

7.8

7.9

7.4

7.5

7.

7.1

7.7

7.3

8.5

8.2

6.6

7.5

6.7

7.7

6.7

6.6

8.4

6.8

7.9

7.8

8.7

8.7

8.2

6.7

8.3

7.3

7.9

6.7

8.5

9.1

9.3

8.4

6.6

7.2

6.6

7.2

7.5

7.9

9.8

10

8.7

7.2

9.6

7.4

8.5

7.9

7.8

8.5

8.5

3/3/15

AMCF

K= 80 = 8.9= 9 son los intervalos a trabajar


Rango = 10- 6,6 = 3,4

Amplitud de clase 3,4/ 9 = 0,4

3/3/15

AMCF

ACTIVIDADES completar el cuadro


de la presentacin (diapositiva) 28
Entrega prxima clase de teora
3/3/15

AMCF

3/3/15

AMCF

SEMANA
CUARTA

GRFICOS DE
DATOS

HISTOGRAMAS
Grficas que describen la naturaleza de la distribucin
Qu es? Es una grfica de barras donde la escala
horizontal representa clases de valores de datos y la
escala vertical representa frecuencias.
La altura corresponde a las frecuencias

3/3/15

AMCF

HISTOGRAMAS DE FRECUENCIAS RELATIVAS


La escala vertical representa frecuencias RELATIVAS
EN LUGAR DE LAS FRECUENCIAS REALES
40%

37%

39%

35%
30%
25%
20%
16%

15%
10%
5%

3%

0%
21-30

3/3/15

31-40

41-50

51-60

AMCF

3%

61-70

3%

71-80

90

80

70

60

50

40

30

20

10

0
1

3/3/15

AMCF

GRFICAS ESTADSTICAS
1.- Polgonos de frecuencia utiliza segmentos lineales
conectados a puntos que se localizan directamente
por encima de los valores de marcas de clase
45%
40%
35%
30%
25%
20%
15%
10%
5%
0%
21-30
3/3/15

31-40

41-50

51-60
AMCF

61-70

71-80

GRFICAS ESTADSTICAS
2.- Ojivas grfica lineal que representa frecuencias
acumulativas
45%
40%
35%
30%
25%
20%
15%
10%
5%
0%
21-30
3/3/15

31-40

41-50

51-60
AMCF

61-70

71-80

GRFICAS ESTADSTICAS
3.- Puntos es aquella donde se marca cada valor de
un dato como un punto a lo largo de una escala de
valores
Chart Title
45
40

39

37

35
30
25
20

16

15
10
5

0
0

3/3/15

AMCF

GRFICAS ESTADSTICAS
4.- Grficas de Pareto es para datos cualitativos
cargos no autorizados

cierres

servicio de operadora

cargos por accesoo

llamas internacionales

marketing

tarifas y servicios

3/3/15

2000

4000

6000
AMCF

8000

10000

12000

14000

GRFICAS ESTADSTICAS
5.- Grficas circulares Tambin datos cualitativos

tarifas y servicios
marketing
llamas internacionales
cargos por accesoo
servicio de operadora
cierres
cargos no autorizados

3/3/15

AMCF

GRFICAS ESTADSTICAS
6.- Dispersin datos apareados (x,y)
Chart Title

39

37

16

3
0

3/3/15

AMCF

3
5

3
6

Qu es lo que hemos visto?


DATOS

CUANTITATIVOS

CUALITATIVOS

DATOS

NOMINAL

ORDINAL

INTERVALO

DE RAZN

Variables continuas: Intervalos


Intervalo I i

xi

ni

Ni

fi

Fi

e0 e1
...
e i-1 ei
...
e k -1 ek

x1
...
xi
...
xk

n1
...
ni
...
nk

N1
...
Ni
...
Nk

f1
...
fi
...
fk

F1
...
Fi
...
Fk

Marca de clase x (punto medio de cada intervalo)


i

Amplitud ai (distancia entre los extremos)


Intervalos cerrados por un extremo y abiertos por otro
69

Grficos estadsticos
V. E. Cualitativas: Grfico rectangular
Color Plumaje

N de Aves ( n i )

Negro

10

Gris

14

Blanco

20

Rojo

Violeta

4
54

20

10

Negro

Gris

Blanco

Rojo

Violeta
70

V. E. Cualitativas: Grfico de sectores

Grados de un sector = 360 0 x fi


Color Plumaje

N de Aves
ni

fi

Grados

Negro

10

0,185

66,6

Gris

14

0,259

93,24

Blanco

20

0,37

133,2

Rojo

0,111

39,96

Violeta

0,074

26,64

54

violeta
rojo

blanco

negro

gris

71

V. E. Discretas: Grfico de barras


N de cras

N animales: n i

fi

Fi

20

0.20

0.20

30

0.30

0.50

25

0.25

0.75

15

0.15

0.90

10

0.10

n = 100

72

V. E. Continuas: Histograma
Estatura

ni

hi = ni / ai

140 160

30

1.5

160 170

22

2.2

170 180

20

180 190

18

1.8

190 200

10

100

hi

2.2
2
1,8
1,5

El rea de cada
rectngulo
es
proporcional a la
frecuencia

140

160

170

180

190 200
73

ACTIVIDADES pgina 25-26 de la


pregunta1 a la 3
Entrega prxima clase de teora
3/3/15

AMCF

3/3/15

AMCF

SEMANA
QUINTA

ESTADSTICA PARA
DESCRIBIR,EXPLORAR
Y COMPARAR DATOS

MEDIDAS DE TENDENCIA CENTRAL


Caracteristicas del CENTRO, buscamos obtener un
nmero que represente el valor central de un conjunto
de datos.
Existen formas de encontrarlo, entre ellas tenemos LA
MEDIA, MEDIANA,MODA Y MITAD DE RANGO

3/3/15

AMCF

MEDIA
Es la ms importante que se emplea para describir
datos, comnmente se le conoce como el promedio.
Se obtiene al sumar los valores y dividirlos entre el
nmero de valores.
Su desventaja es su sensibilidad a cada valor, cuando
son puntuaciones excepcionales

3/3/15

AMCF

MEDIANA
Resuelve en gran forma la desventaja de la MEDIA.
Es un valor intermedio, ya que la mitad de los valores
de los valores estn por debajo de ella y la otra mitad
por arriba.
Se denota X.
Se emplea para conjuntos de datos relativamente
pequeos

3/3/15

AMCF

MEDIANA
Para obetnerla:
1.- ordenar los valores:
a) Si son datos impares, la mediana es el nmero
que se localiza exactamente a la mitad de la lista.
b) Si son datos pares, se obtiene calculando la
media de los dos nmeros que estan a la mitad.

3/3/15

AMCF

MEDIANA
Ejemplo
3,50 3,57 9,0 1,3 5,6 8,3, 0,3
3,50 3,57 1,3 5,6 8,3, 0,3

3/3/15

AMCF

MODA
Es el valor que se presenta con mayor frecuencia.
Cuando dos valores se presentan con la misma
frecuencia y sta es la ms alta , ambos son MODAS,
por lo que el conjunto es BIMODAL.
Cuando ms de dos valores se presentan con la
misma frecuencia y sta es la ms alta , ambos son
MODAS, por lo que el conjunto es MULTIMODAL
Cuando NINGN VALOR SE REPITE ,no hay moda
3/3/15

AMCF

MODA
Es la nica que puede usarse con datos de medicin
NOMINAL

3/3/15

AMCF

MITAD DEL RANGO


Es el valor que esta a la mitad ,entre la puntuacin
ms alta y la ms baja.
Se obtiene sumando la puntuacin ms alta con la
puntuacin ms baja y el resultado se divide entre dos

3/3/15

AMCF

MEDIA DE DISTRIBUCIN DE FRECUENCIAS


Se obtiene multiplicando la frecuencia por la marca
clase de cada dato.
Luego sumamos todos los resultados y los dividimos
entre el nmero de datos de la frecuencia
Distribucin de frecuencia: Edades de las mejores
actrices

3/3/15

Edad de las actrices

FRECUENCIAS

21-30

28

31-40

30

41-50

12

51-60

61-70

71-80

2
AMCF

CLCULO DE LA MEDIA DE UNA DISTRIBUCIN DE FRECUENCIAS


Edad de las
actrices

FRECUENCIAS

Marca de la clase

F*X

21-30

28

25.5

714

31-40

30

35.5

1065

41-50

12

45.5

546

51-60

55.5

111

61-70

65.5

131

71-80

2
76

75.5

151
2748

2748 / 76 = 35.8

Produce una aproximacin a X ,ya que no se emplea


la lista original
3/3/15

AMCF

MEDIA PONDERADA
Cuando los valores varan de acuerdo a su
importancia.
control de lectura 30% nota 16
Tarea acadmica 50% nota 10
Examen
20% nota 13
(30*16) + (50*10) + (20*13) /

3/3/15

AMCF

(30+20+50)

SESGO
Es una comparacin entre la media,mediana y la
moda.
Una distribucin es sesgada si no es simtrica:
a) sesgada a la izquierda. Media y mediana estn a
la izquierda de la moda
b) sesgada a la derecha. Media y mediana estn a la
derecha de la moda.
Una distribucin es simtrica si la moda,mediana y
media son iguales

3/3/15

AMCF

Recordar
Distribucin de Frecuencias

2.1.1.- Medida Aritmtica


Definicin

En un conjunto de datos agrupados: {(xi , ni); i=1,...,k}


N = n1 + n2 + ... + nk: el nmero de datos observados
Se define la Media Aritmtica por
k
1 k
x
xi ni xi f i
N i 1
i 1

2.1.1.- Medida Aritmtica


Clculo
k
1 k
x xi ni xi f i
N i 1
i 1

Variables
cuantitativas
continuas o
agrupadas
xi sern marcas de
clase

Variables cualitativas no
tiene sentido

Variables cuantitativas discretas o no agrupadas

2.1.1. Media Aritmtica


Ejemplo: Estaturas de 50 nios. Fuente: Pea y Romo 1997.

2.1.1.- Medida Aritmtica


Ejemplo: Estaturas de 50 nios. Fuente: Pea y Romo 1997.

Los nios tienen una


estatura media de
1,569 m

2.1.1.- Medida Aritmtica


Ejercicio:

2.1.1.- Medida Aritmtica


Ejercicio:

2.1.2.- Medida Aritmtica Ponderada


Media aritmtica en la que se tiene en cuenta la importancia especfica
de cada uno de sus datos, a travs de unos pesos, dando as a stos
mayor o menor relevancia o aportacin al clculo de la media.
Ejemplo: Las notas obtenidas por un estudiante en cada parte de una
determinada materia, as como los pesos de importancia de las distintas
unidades, son los que se presentan en la tabla.

2.1.2.- Medida Aritmtica Ponderada


Definicin
En un conjunto de datos agrupados: {(xi , ni); i=1,...,k}
N = n1 + n2 + ... + nk: el nmero de datos observados
Sean {wi; i=1,...,k} un conjunto de pesos que ponderan la
importancia de cada uno de los datos observados, verificando que:
wi 0 para i =1,..., k
k

Se define la Media Aritmtica Ponderada por

xw

w x
i 1
k

i i

w
i 1

2.1.2.- Medida Aritmtica Ponderada


Ejemplo
Calcular la nota media del ejemplo anterior

2.1.3.- Medida Geomtrica


Definicin: Sea X una variable cuantitativa medida en una escala
de razn y que slo toma valores positivos. En la distribucin de
frecuencias:
{(xi , ni); i=1,...,k}
Se define la Media Geomtrica la denotamos G - como:
Es til para promediar tasas, porcentajes, tipos de inters y, en
general, en todas aquellas situaciones en las que la variable
analizada presente variaciones acumulativas

G x x ...x
N

n1
1

n2
2

nk
k

2.1.4 Mediana
Definicin
La Mediana (Me) es aqul valor o dato de la distribucin, que divide
a sta en dos partes iguales dejando al 50% de las frecuencias por
debajo y al 50% por encima.

Ejemplo: valores observados de una variable : 2, 3, 3, 3, 5, 6, 6, 7 y 9


La mediana es 5, pues es el valor que deja el mismo nmero de datos (4)
por debajo que por encima de l.

Para su clculo distinguiremos segn tengamos distribuciones:


Discretas
Continuas o agrupadas

2.1.4 Mediana
Distribuciones discretas
Pasos a seguir en su clculo:
Ordenamos de forma creciente los datos:

x1 x2 ...... xN

Sim<N/2m+1con m enteroMe=x(m+1)
Ejercicio: 2, 3, 3, 3, 5, 6, 6, 7 y 9 N / 2 = 4,5 4 < 4,5 < 5 Me = x(m+1) = x5 =5

2.1.4.- Mediana
Ejercicio: Distribuciones continuas o con variables agrupadas

Obtener la distribucin de frecuencias


acumuladas
Identificar el Intervalo de Clase Mediano
(Lm-1,Lm]
Es el que verifica que:
Nm-1 < N/2 Nm

Fm-1 < 0,50 Fm

y/o tomar la marca de clase

2.1.4.- Mediana

Identificar el Intervalo de Clase


Mediano
(Lm-1,Lm]
Es el que verifica que:
102 = Nm-1 < 105,2 = N/2
Nm = 150

0,484 = Fm-1 < 0,50 Fm =


0,711
(100 120] o marca de clase =
110

2.1.5 Moda
Definicin
La Moda (Mo) de una distribucin de frecuencias es el valor ms
frecuente de la misma.
Dependiendo del nmero de modas, las distribuciones se clasifican
en Unimodales, Bimodales o Multimodales.
Ejemplo: valores observados de una variable : 2, 3, 3, 3, 5, 6, 6, 7 y 9
La moda es 3, pues es el valor ms frecuente.

Para su clculo distinguiremos segn tengamos distribuciones:


Discretas
Continuas o agrupadas

2.1.5 Moda
Distribuciones discretas

Se identifica el valor Mo=xm cuya frecuencia absoluta nm sea mxima

2.1.5 Moda
Distribuciones continuas o agrupadas
Como los valores de la variable estn incluidos en intervalos de clase no es
posible identificar directamente el valor o valores centrales.

Pasos a seguir en su clculo:


1.

Obtener la densidad de frecuencia (dm=nm/am)

2.

Identificar el Intervalo de Clase Modal (Lm-1,Lm]


Es el que maximiza dm y/o tomar la marca de clase

2.1.5.- Moda
Ejercicio:

Obtener la distribucin de densidades de


frecuencias
Identificar el Intervalo de Clase Modal
(Lm-1,Lm]
Es el que maximiza la densidad de
frecuencias
Tomar la marca de clase

2.1.5.- Moda

Identificar el Intervalo de Clase


Modal
(Lm-1,Lm]
Es el que verifica que maximiza
di = 2,4
(100 120] o marca de clase
=110

1.3. Caractersticas de variables

estadsticas unidimensionales
1.3.1

Caractersticas de Posicin
Media aritmtica
k

ni xi

i 1

Estatura

fi x i i 1

N Personas

M. Clase

ni

xi

ni xi

140 150

20

145

2900

150 160

100

155

15500

160 180

80

170

13600

180 200

10

190

1900

n = 210

33900

ni x i

Media :

x i 1

33900
210

161.42
108

Moda
Valor de la variable ms frecuente
Puede haber ms de una moda Plurimodal
Variables discretas
Datos en serie
2, 2, 3, 3, 3, 3, 5, 6, 7

Mo = 3

Datos en tabla
Ejemplo

xi
1
2
3
4

ni
34
36
45
22

17

Mo = 3

109

Variables continuas
Mo e i 1

h i h i 1

hi h i 1

ai

xi

ni

hi = ni / ai

140 160
160 170
170 180
180 190
190 200

30
22
20
18
10
100

1.5
2,2
2
1,8
1

Ejemplo

Mo 160

h i h i 1

2.2 1.5
2.2 1.5 2.2 2

10

167.777

Observaciones:

1. Puede utilizarse la frecuencia relativa


2. Si las amplitudes son iguales, la moda se puede obtener
directamente con las frecuencias

110

Mediana
Valor de la variable que ocupa el lugar central en una serie de datos
ordenados.
El 50% de los elementos de la poblacin tienen un valor de la variable
menor o igual que la mediana. El 50% de los elementos de la poblacin
tienen un valor de la variable mayor o igual que la mediana.
Variables discretas

Datos en serie
N impar de observaciones:
2, 2, 2, 3, 5, 6, 7, 7, 8 Me = 5
N par de observaciones: 3, 4, 6, 6, 6, 7, 8, 8, 9, 9
67
Indeterminada entre 6 y 7

Me =

xi

ni

Ni

fi

Fi

xi

ni

Ni

fi

Fi

0,333

0,333

0,1

0,1

0,111

0,444

0,1

0,2

0,111

0,555

0,3

0,5

0,111

0,666

0,1

0,6

0,222

0,888

0,2

0,8

0,111

0,999

10

0,2

111

Variables discretas

Datos en tabla
Ejemplo

xi
0
1
2
3
4

ni
4
6
10
5
3
28

Ni
4
10
20
25
28

fi
0.142
0.214
0.357
0.178
0.107
1

Fi
0.142
0.357
0.714
0.892
1

n /2 = 14
Fi = 0,5

Me = 2

Observacin: Si n / 2 coincide con un N


i

la mediana est indeterminada entre x i y x i+1


112

Variables continuas
Me ei 1

0, 5 Fi 1
fi

50
n N i 1
100
a i e i 1
ai
ni

Ejemplo

Estatura
140 150
150 160
160 170
170 180
180 200

ni

15
30
25
20
10
100

Me 160

Ni

15
45
70
90
100

0.5 0.45
0.25

fi

0.15
0.30
0.25
0.20
0.10
10

Fi

0.15
0.45
0.70
0.90
1

n/2 = 50
Fi = 0,5

160 2 162

Observacin: Si n/2 coincide con un N


i

la mediana es el extremo superior del intervalo que le

113

3/3/15

AMCF

SEMANA
SEXTA

ESTADSTICA PARA
DESCRIBIR,EXPLORAR
Y COMPARAR DATOS

MEDIAS DE DISPERSIN
O VARIABILIDAD

Algunas consideraciones
1. Variacin, se refiere a la cantidad en
que los datos u observaciones varan
entre si, esta variacin puede medirse.
2. Los datos que estn relativamente
cercanos entre si, tienen bajas
medidas de variabilidad, mientras que
los que estn mas alejados entre si
tienen medidas de variacin mas
grandes,

Trminos equivalentes
Menor dispersin = ms homogneo
Mayor dispersin = menos homogneo
Menor dispersin = menos heterogneo
Mayor dispersin = ms heterogneo

MEDIDAS DE
DISPERSION
Definicin 1
Una medida de dispersin de un
conjunto de datos, mide cuan
esparcidos se encuentran estos o
que tan heterogneos son.
Hay varias medidas de dispersin,
siendo las ms comunes las
siguientes:

Principales medidas de dispersin

El rango
Rango Intercuartil
La varianza
La desviacin estndar
El coeficiente de variacin

RANGO

R = X mx X min

Ejemplo 1
Ante la pregunta sobre nmero de hijos
por familia, una muestra de 12 hogares,
marc las siguientes respuestas:
2 1 2 4 1 3
2 3 2 0 5 1
Calcule el rango de la variable
Solucin
El Rango es R =5 0 = 5

La varianza
n

s2

2
(
x

x
)
i
i 1

n 1

Muestral

Poblacional

2
(
x

)
i x
i 1

Ejemplo 2
Calcule la varianza para los datos del ejemplo 1
2 1 2 4 1
3 2 3 2 0 51
Solucin:

s 1,9697
2

Desviacin estndar
n

(x
i 1

Muestral

x )2

n 1

Poblacional

2
(
x

)
i x
i 1

Ejemplo 3
Calcule la desviacin estndar para los datos
del ejemplo 1
Solucin:

s 1, 4035

Calcula la desviacin
estndar para los datos del
ejemplo 1
1. Ingresa a modo STAT.
2. Ingresa los datos.
3. Solicita xn-1.

Calcula la desviacin
estndar para los datos del
ejemplo 1
1. Ingresa a modo SD.
2. Ingresa los datos.
3. Solicita xn-1.

Coeficiente de variacin
Compara la variabilidad de series de datos que
tengan unidades diferentes.
No tiene unidades de medida.
Se calcula para variables medidas en escala de
razn

Muestral

Poblacional

S
CV 100%
x

CV 100%

Ejemplo 4
Calcule el coeficiente de variabilidad para
los datos del ejemplo 1
Solucin:

1,4035
cv
x100 64,7759%
2,1667

Medidas de dispersin en tablas


de frecuencias (caso discreto)

Muestral
Poblacional

s2

i 1

f i ( xi x ) 2
n 1
k

2 i 1

i 1

fi ( xi ) 2
N

f i xi2

x f
i 1

n 1
k

i 1

fi xi2
N

Ejemplo 5
Se han registrado
durante 20 das, el
nmero de viajeros
que hacen
reservaciones a una
agencia de viajes
pero que no las
hacen efectivas:

Nmero de
viajeros:
xi

fi

12

13

14

15

16

Total

70

20

Calcule las medidas de dispersin de la variable


en estudio. Interprete

Solucin
i

xi

fi

xifi

xi2

xi2fi

12

36

144

432

13

39

169

507

14

84

196

1176

15

45

225

675

16

80

256

1280

Total

70

20

284

990

4070

284 2
4070
20 1,9579 s 1,3992
s2
19

Una variable cuantitativa continua


Varianza muestral

s
2

i 1

f i ( xi x ) 2
n 1

i 1

f i xi 2

i 1

f i xi

n 1

Varianza poblacional
k

i 1

f i ( xi )
N

i 1

f i xi 2
N

Propiedades de la
varianza
Es un nmero real no negativo.
Si yi=axi+b entonces S2Y = a2S2X .
Depende de todos los datos y es sensible a
la variacin de cada dato.
Se puede calcular en variables medidas en
escala de intervalo y de razn.

Estadsticos apropiados
por escalas
Nominal
Moda, nmero de casos
Ordinal
Mediana, percentil
Intervalo
Media, rango, rango intercuartil,
varianza, desviacin estndar
Razn
Todos

Ejemplo 6
En un grifo se form la siguiente distribucin de
frecuencias de galones de gasolina vendidos por
automvil, en una muestra de 300 vehculos:
Galones de
gasolina
0 6

frecuencia
50

6 - 12

95

12 - 18

65

18 - 24

50

24 -30

25

30 - 36

15

total

300

Calcule e interprete las


medidas de Dispersin

Solucin
xi

fi

Fi

hi

Hi

0 6

50

50

16,67

16,67

6 - 12

95

145

31,67

48,33

12 - 18

15

65

210

21,67

70,00

18 - 24

21

50

260

16,67

86,67

24 -30

27

25

285

8,33

95,00

30 - 36

33

15

300

5,00

100,00

Galones

total

300

1.3.2.

Caractersticas de Dispersin

Miden la Homogeneidad de las observaciones


Rango o recorrido
Valor mximo menos valor mnimo de la variable

Recorrido intercuartlico
Q 3 Q1

Varianza
k

ni

i 1

xi x

ni x i 2

i 1

Desviacin tpica

Coeficiente de variacin
C. V .

Ejemplo
xi

ni

nixi

nixi2

4
6
8
10
12

20
40
44
36
22
162

80
240
352
360
264
1296

320
1440
2816
3600
3168
11344

2 Var X

ni x i 2

i 1

11344
1296

162
162

6.02 2.4535

6.02

Momentos centrales (Respecto a la media)


k

ni

i 1

xi

ni

i 1

xi x

r 2

r 1

ni

i 1

xi x
n

3/3/15

AMCF

SEMANA
SEPTIMA

CUATILES,DECILES,
PERCENTILES

Objetivos

De las diferentes medidas descriptivas de una distribucin de frecuencias,


que se presentan a lo largo del tema, el alumno deber comprender el
inters y el objetivo de cada una de ellas; as mismo sabr aplicar su
definicin y manejar sus principales propiedades

Todas ellas comparten el propsito comn de servir de indicadores de la


Posicin (Central y No Central) que ocupan un conjunto de datos. De esta
forma, con su uso se aprender a sintetizar o resumir la informacin
contenida en un conjunto de datos indicando su POSICIN global

Interpretar correctamente los valores obtenidos para estas medidas

Diferenciar y elegir aquella medida - de entre las alternativas presentadas


- que resulte ms conveniente para describir los aspectos que se pretenden
poner de manifiesto.

Medidas de Posicin
Medidas de tendencia central
Media aritmtica, geomtrica y ponderada, Mediana y Moda

Medidas no centrales
Cuantiles: Cuartiles, deciles, percentiles

Introduccin

Un objeto pequeo se pesa con un mismo instrumento por


ocho estudiantes de una clase, obtenindose los
siguientes valores en gramos:
62, 60, 60, 63, 61, 623, 615, 62
Cul sera la mejor estimacin del peso real?
Cmo determinar, a partir de un conjunto de medidas x1, x2 , ...,
xn la mejor estimacin posible del verdadero valor X desconocido?

1 Introduccin

Cul sera la mejor estimacin del peso real?


No tenemos ninguna razn para pensar que el verdadero valor est
ms cercano a uno u otro de los datos obtenidos.
61475? (62 + 60 + 60 + 63 + 61 + 623 + 615 + 6
2) / 8
60

,62? Valores que ms se repiten


615 62? 60, 60, 61, 615, 62, 62, 623, 63

1 Introduccin
Las Medidas de Posicin van a desvelar aquellos valores
con respecto de los cuales, los datos suelen disponerse.
Son magnitudes que pueden considerarse como representativas
del grueso de los datos, sirviendo de referencia a los mismos
Se clasifican en:
Medidas de centralizacin
Medidas de posicin no centrales

Unidad 2: Medidas de Posicin

1 Introduccin
M E D ID A S D E P O S IC IO N
M e d id a s d e t e n d e n c ia c e n t r a l
M e d ia a r it m t ic a

M e d ia p o n d e r a d a

M e d ia n a

M oda

M e d ia n o p o n d e r a d a

M e d id a s d e p o s ic io n n o c e n t r a le s
C u a n t ile s
C u a r t ile s

D e c ile s

P e r c e n t ile s

M e d ia G e o m t r ic a

2.2.Cuantiles
Son aquellos valores de la variable, que ordenados de menor a
mayor, dividen a la distribucin en partes, de tal manera que cada
una de ellas contiene el mismo nmero de frecuencias.
Los tipos ms importantes de cuantiles son:
Los cuartiles, que dividen a la distribucin en cuatro partes
Los deciles, que dividen a la distribucin en diez partes
Los percentiles, que dividen a la distribucin en cien partes

2.2.Cuantiles
Definicin
Para 0 (p) 1 se define el Cuantil de orden (p) como el
valor de la variable o dato tal que el x 100 de los datos son
inferiores. Lo denotamos Q (Qp)

Q70
Casos particulares notables son los: Percentiles, Cuartiles y Deciles

2.2.Cuantiles
Distribuciones discretas
Si m < Np m+1 con m entero entonces Qp = x(m+1)
Distribuciones Continuas o Agrupadas
Su aproximacin se basa en un argumento idntico al utilizado en el
clculo de la Mediana para datos agrupados

2.2.- Cuantiles
Cuartiles: {Ci = Qi/4 i = 1, 2, 3}
Primer Cuartil C1 Cuantil 0.25 (Q0.25)
Segundo Cuartil C2 Cuantil 0.5 (Q0.5)
Tercer Cuartil C3 Cuantil 0.75 (Q0.75)
Deciles: {Di = Qi/10 i = 1, ..., 9}
Percentiles: {Pi = Qi/100 i = 1, ...,99}

Ejemplo: En cualquier conjunto de datos: El percentil P95 es superado


nicamente por el 5% de los datos.

2.2.- Cuantiles
Ejemplo 1: El 15% de los espaoles viven por debajo del umbral de pobreza.
Qu renta se considera demasiado baja? Percentil 15
20
15
10
0

fre c u e n c ia

25

Percentil 5 del peso

Peso al nacer (Kg) de 100 nios

Ejemplo 2: El colesterol se distribuye en la poblacin simtricamente.


Supongamos que se consideran patolgicos los valores extremos, de forma
que el 90% de los individuos son normales Entre qu valores se encuentran
los individuos normales? Percentiles 5 y 95
1155
1100
55
00

frfreec cuueennc ci ai a

2200

Percentiles
Percentiles55yy95
95

180
180

200
200

220
220
Colesterol en 100 personas
Colesterol en 100 personas

240
240

260
260

2.2.- Cuantiles
Ejemplo 1: Calcular el cuartil 2 y el percentil 95

Cuartil 2 = Percentil
50 = Mediana

2.2.- Cuantiles
Ejemplo 1: Calcular el cuartil 2 y el percentil 95

Percentil 95

Qu es lo que hemos visto?


M E D ID A S D E P O S IC IO N
M e d id a s d e t e n d e n c ia c e n t r a l
M e d ia a r it m t ic a

M e d ia p o n d e r a d a

M e d ia n a

M oda

M e d ia n o p o n d e r a d a

M e d id a s d e p o s ic io n n o c e n t r a le s
C u a n t ile s
C u a r t ile s

D e c ile s

P e r c e n t ile s

M e d ia G e o m t r ic a

Percentiles
Definicin: Pk , k: 1,2,...,99, percentil k, valor de la variable que
deja por debajo, el k% de los valores de la variable
Q1 = P25 Cuartil 1
Q2 = P50 Cuartil 2 = Me
Decil
Cuartil
DQ13==PP1075
13
D2 = P20 Decil 2
.

Clculo para v.e. discretas:

D9 = P90 Decil 9
Igual que la mediana, cambiando:
50
n
100

por

k
n
100

Clculo para v.e. continuas:


Pk e i 1

k
k
Fi 1
n N i 1
100
100

a i e i 1
ai
fi
ni
158

Ejemplos percentiles v.e. discreta


xi

ni

Ni

2
3
4
5
6

20
30
44
20
10
124

20
50
94
114
124

Percentil 40, P40 = 3


n k /100 =
124x25/100 = 31
n k /100 =
124x50/100 = 62
n k /100 =
124x75/100 = 93

k
40
n
124 49, 6
100
100
k
95
n
124 117, 8
100
100

Percentil 95, P95 = 6


Percentil 25, P25 = 3 = Q1
Percentil 50, P50 = 4 = Me = Q2
Percentil 75, P75 = 4 = Q3

159

Ejemplos percentiles v.e. continua


Tallas

ni

Ni

fi

Fi

140-150

15

15

0.15

0.15

150-160

30

45

0.30

0.45

160-170

25

70

0.25

0.70

170-180

20

90

0.20

0.90

180-200

10

100

0.10

P40
P75

100

k
nk
Fi 1
N i 1
100
100
Pk ei 1
a i ei 1
ai
fi
ni

P40

150

0.4 0.15
40 15
10 150
10 158.33
0.30
30

P75 170

0.75 0.70
75 70
10 170
10 172.5 Q 3
0.20
20

160

3/3/15

AMCF

SEMANA
OCTAVA

MEDIDAS DE
ASIMETRA Y CURTOSIS

1.3.3

Caractersticas de forma

Coeficiente de Sesgo (Asimetra)

3
3

Si

Distribucin simtrica

Si

Distribucin sesgada a la derecha

Si

Distribucin sesgada a la izquierda

162

Coeficiente de Curtosis (Aplastamiento)

Si

2 0

Si

2 0

Si

2 0

Distribucin igual de aplastada que la


distribucin Normal
Distribucin menos aplastada que la
distribucin Normal
Distribucin ms aplastada que la
distribucin Normal

163

3/3/15

AMCF

3/3/15

AMCF

También podría gustarte