Está en la página 1de 87

UNIDAD II

BASES ESTADISTICAS
PARA EL CONTROL

Ing. Mario Enrique Elas Ayala


e-mail: melias@ufg.edu.sv

CONTENIDO

2.1 Estadstica descriptiva


2.2 Tcnicas de conteo
2.3 Introduccin a la probabilidad
2.4 Distribuciones de probabilidad

OBJETIVOS

Reconstruir sus conocimientos estadsticos.


Aplicar las medidas de tendencia central as
como las medidas de dispersin.
Aplicar los conceptos de probabilidad.
Identificar
y
aplicar
las
diferentes
distribuciones de probabilidad.

La estadstica tiene que ver con la


recopilacin, presentacin, anlisis y uso de
datos para tomar decisiones y resolver
problemas.

Cualquier persona recibe informacin en


forma de datos a travs de los peridicos, la
televisin u otros medios; y a menudo es
necesario obtener alguna conclusin a partir
de la informacin contenida en los datos.

2.1 Estadstica
Descriptiva
OBJETIVO: Conocer y calcular las medidas
de tendencia central

Ing. Melba de Miranda

e-mail: mmiranda@ufg.edu.sv

CONTENIDO

Conceptos bsicos.
Tipos de datos.
Aleatorizacin y otras estrategias de muestreo.
Organizacin de datos.
Representacin de datos.
Medidas de tendencia central.
Datos no agrupados
Datos agrupados
Visualizacin de datos.
Medidas de dispersin

GENERALIDADES

Los mtodos empleados para


resumir y organizar datos se
denominan
estadstica
descriptiva; mientras que los
mtodos para tomar decisiones
se
denominan
inferencia
estadstica.

ESTADSTICA DESCRIPTIVA

Estadstica Descriptiva (Deductiva): Es la


encargada
de
la
organizacin,
condensacin, presentacin de los datos
en tablas y grficos y del clculo de
medidas numricas que permitan estudiar
los aspectos ms importantes de los datos.

DESCRIBIR

Esto se debe a la creciente facilidad


con la cual se pueden manejar
grandes
cantidades
de
datos
numricos, debido al uso de

CONCEPTOS BSICOS
ESTADISTICA: Es una coleccin de mtodos
para planear experimentos, obtener datos, y
despus organizar, resumir, presentar,
analizar, interpretar y llegar a conclusiones
basadas en los datos.

Poblacin: es la coleccin de todas


las
posibles
mediciones
u
observaciones a estudiar. Se dice que
la coleccin es completa, pues incluye
a todos los sujetos que se estudian o
que pueden hacerse de una variable
bajo estudio.

Se clasifica en dos categoras:

POBLACIN FINITA: Es aquella que incluye


una
cantidad
limitada
contable
de
observaciones, individuos o medidas. Siempre
que sea posible alcanzar (contar) el nmero
total de todas las posibles mediciones, se
considera como finita la poblacin.

POBLACIN INFINITA: Es aquella que incluye


un gran conjunto de observaciones o mediciones
que no pueden alcanzarse por conteo. Al menos,
hipotticamente, no existe lmite en cuanto al
nmero de observaciones que el experimento
puede generar.

CENSO: Es la coleccin de
datos de cada uno de los
miembros de la poblacin.

Muestra:
Es un conjunto de mediciones u observaciones
tomadas o seleccionados a partir de una
poblacin.
Es un subconjunto de la poblacin.

TIPOS DE DATOS

Variables:
Son

las caractersticas o lo que se estudia de


cada individuo de la muestra. Ej: sexo, edad,
peso, estatura, color de ojos, estado civil,
temperatura, cantidad de nacimientos, presin,
grosor, dimetro, ...

Datos:
Son

los valores que toma la variable en cada


caso.
Son
las observaciones recolectadas (como
mediciones, gneros, respuestas de encuestas).

PARAMETRO: Es una medicin numrica que describe


algunas caractersticas de una poblacin.
EJEMPLO:
Cuando Lincoln fue elegido presidente por primera vez,
recibi el 39.82% de 1, 865,908 votos. Si suponemos que el
conjunto de todos esos votos es la poblacin a considerar,
entonces el 39.82% es un parmetro, no un estadstico.

ESTADISTICO: Es una medicin numrica que describe


algunas caractersticas de una muestra.
EJEMPLO:
Con base en una muestra de 877 ejecutivos encuestados,
se encontr que el 45% de ellos no contara a alguien con
un error ortogrfico en su solicitud de empleo. Esta cifra de
45% es un estadstico, ya que est basado en una muestra,
no en la poblacin completa de todos los ejecutivos.

DATOS CUALITATIVOS (categricos o de


atributos): Son datos que solo toman valores
asociados a las cualidades o atributos,
clasificndolos en una de varias categoras, es
decir, no son valores numricos.
Ejemplo:

Sexo: f/m.
Hbito de fumar: Fumador/No fumador
Color de ojos: negro, azul, marrn,
Religin: catlica, evanglica,
Estado civil: soltero, casado, divorciado,

DATOS CUANTITATIVOS: provienen de variables


que pueden medirse, cuantificarse o expresarse
numricamente.
Ejemplos:

Peso
Edad
Estatura
Presin
Humedad
Intensidad de un sismo
Cantidad de hermanos

DATOS DISCRETOS: Resultan cuando el nmero


de posibles valores es un nmero finito, o bien, un
nmero que puede contarse. (Es decir, el nmero
de posibles valores es 0, 1, 2, etc.).

DATOS CONTINUOS (NUMERICOS): Resultan de


un infinito de posibles valores que pueden asociarse
a puntos de alguna escala continua, cubriendo un
rango de valores sin huecos ni interrupciones.

Abusos que se pueden cometer con la Estadstica

Conclusiones errneas debido a que los


datos son numricamente insuficientes.
Representaciones
grficas
engaosas
(escalas).
Datos mustrales no representativos:
Muestra que no incluye a elementos de toda la
poblacin.
Ciertas categoras de personas no responden
correctamente.
Respuestas voluntarias (sesgadas).

ALEATORIZACIN Y OTRAS
ESTRATEGIAS DE MUESTREO

CLASIFICACION
DEL TIPO DE
MUESTREO

PROBALISTICO O
ALEATORIOS

NO
PROBALISTICOS
(Determinstico)

Azar simple
Azar
sistemtico
Estratificado
Conglomerados

Casual o accidental
Intencional
Por cuotas

TIPOS DE MUESTREO
Los mtodos de muestreo ms comunes son:
a) Aleatorio,
b) Aleatorio simple,
c) Sistemtico,
d) Por conveniencia,
e) Estratificado,
f) Por conglomerados o racimos.

Muestra aleatoria: se considera aleatoria


siempre y cuando cada observacin,
medicin o miembro de la poblacin tenga
la misma probabilidad de ser seleccionado.

A menudo se usan computadoras para


generar nmeros telefnicos aleatorios.

MUESTREO ALEATORIO SIMPLE


Se

selecciona una muestra de tamao de n sujetos de


manera que cada posible muestra del mismo tamao n
tenga la misma posibilidad de ser elegida.

Todos

los elementos de la poblacin tienen la misma


probabilidad de ser elegidos para formar parte de la
muestra.

Ejemplo:

Imagine un saln de clase con 60


estudiantes acomodados en seis filas de 10
estudiantes cada una. Suponga que el
profesor selecciona una muestra de 10
estudiantes tirando un dado y seleccionando la
fila correspondiente al resultado. El resultado
es una muestra aleatoria? o Es una muestra
aleatoria simple?

MUESTREO ALEATORIO SISTEMATICO


Se selecciona al azar un elemento de la
poblacin y a partir de l se seleccionan cada
k-esimo los elementos siguientes (por
ejemplo, cada n elemento en la poblacin).
Ejemplo: sea n=3

MUESTREO DE CONVENIENCIA

Se

utiliza
n
resultados fciles
de obtener.

MUESTREO ESTRATIFICADO
La poblacin se divide en
grupos
homogneos,
llamamos
estratos.
La
proporcin de cada estrato
en la poblacin se mantiene
en la muestra. Cada uno de
los estrato de la muestra se
obtiene
por
muestreo
aleatorio simple sobre el
estrato correspondiente de la
poblacin.

Estrato 1

Estrato 2

Poblacin

Muestra

Los estratos ms grandes tienen


probabilidad de ser representados.

mayor

Se

subdivide a la poblacin en al menos dos diferentes


subgrupos (o estratos) que comparten las mismas
caractersticas (por ejemplo, el genero o categora de
edad) y despus se extrae una muestra de cada
subgrupo.

Homogneos

en su interior; diferentes entre s en


propiedades y tamao.

MUESTREO POR
CONGLOMERADOS O RACIMOS
Se

Para dividir la poblacin en


secciones podemos usar las
provincias.

divide el rea de la
poblacin en secciones
(conglomerados
o
racimos ). Se eligen al
azar unas pocas de estas
secciones y luego se
toman
todos
los
elementos o miembros de
las secciones elegidas
para formar la muestra.

Heterogneos en su interior; diferentes entre s


en propiedades y tamao.
Grupo 1A
Grupo 5C

Grupo 2A
Grupo 3B

ORGANIZACIN DE DATOS NO AGRUPADOS

Una vez que se ha


realizado la
recoleccin de los
datos, se obtienen
datos en bruto, los
cuales rara vez
son significativos
sin una
organizacin y
tabulacin.

Formas de organizar los datos:


Un arreglo: es la forma ms sencilla de
organizar los datos en bruto, consiste en colocar
las observaciones en orden segn su magnitud:
ascendente o descendente.
Poco prctica cuando se tiene una gran cantidad
de datos.

Si

los datos mustrales


no se renen de forma
adecuada, resultaran
tan intiles que ninguna
cantidad
estadstica
podr salvarlos.

Ejemplo:
En un rea de servicios dentro de una empresa de
manufactura se hace una encuesta para evaluar la calidad
del servicio proporcionada y el nivel de satisfaccin de los
clientes internos. La encuesta consiste de 10 preguntas,
donde cada una de ellas evala diferentes aspectos del
servicio proporcionado. Las respuestas para cada pregunta
es un nmero entre 0 y 10. Para hacer un primer anlisis de
los resultados obtenidos, se suman los puntos obtenidos de
las 10 preguntas para cada cuestionario. A continuacin se
muestran los puntos obtenidos en 50 cuestionarios.
78

78

82

85

81

86

80

73

84

78

68

84

75

78

76

76

82

85

91

80

70

87

77

82

84

48

49

39

39

43

35

42

34

44

49

34

30

43

31

34

41

42

45

42

35

38

39

42

43

29

Solucin:
1. Ordenar datos de menor a mayor:
29
39
44
76
82

30
39
45
77
82

31
41
48
78
84

2. Determinar el :

34
42
49
78
84

Valor mnimo (Vmin) = 29

34
42
49
78
84

34
42
68
78
85

35
42
70
80
85

35
43
73
80
86

38
43
75
81
87

39
43
76
82
91

Valor mximo (Vmax) = 91

3. Calcular el Rango (R) = Vmax Vmin


Rango (R) = 91 - 29= 62
Rango (R) = 62

MEDIDAS DE LOCALIZACIN

Las medidas de localizacin dividen la


distribucin en partes iguales, sirven para
clasificar a un individuo o elemento dentro de
una determinada poblacin o muestra.
Clasificacin de las medidas de localizacin:

Centralizacin o de tendencia central


Indican valores con respecto a los que los
datos parecen agruparse.
Media,
Mediana y
Moda

Dispersin
Indican la mayor o menor concentracin de
los datos con respecto
a las medidas de centralizacin.
Desviacin tpica,
Rango, Varianza

coeficiente

de

Posicin

Dividen un conjunto ordenado de datos en grupos


con la misma cantidad de individuos.

Percentiles, Cuartiles, Deciles y mediana.


Forma
Asimetra
Apuntamiento o curtosis

variacin,

36

MEDIDAS DE TENDENCIA CENTRAL

Corresponden a valores que generalmente se


ubican en la parte central de un conjunto de
datos.

Forma como los datos pueden condensarse en


un solo valor central alrededor del cual todos
los datos mustrales se distribuyen.

MEDIDAS DE TENDENCIA CENTRAL


PARA DATOS NO AGRUPADOS

Las medidas de tendencia central ms


importantes son:
Media.
Mediana.
Moda.
Son valores que se encuentran en el centro o a la
mitad de los datos, o representa el valor al que tienden
a concentrarse los datos de una muestra o de un
proceso.

MEDIA ARITMTICA

La media aritmtica o simplemente promedio


(tambin llamada media muestral).

Es la suma de todas las observaciones dividida entre


el nmero total de observaciones.

Se calcula de la siguiente forma: si las


observaciones de una muestra de tamao n
son x1, x2,,xn entonces:
n

x 1 x 2 ... x n i 1
X

n
n

Ejemplo: datos no agrupados

En un rea de servicios dentro de una empresa de


manufactura se hace una encuesta para evaluar la calidad
del servicio proporcionada y el nivel de satisfaccin de los
clientes internos. La encuesta consiste de 10 preguntas,
donde cada una de ellas evala diferentes aspectos del
servicio proporcionado. Las respuestas para cada pregunta
es un nmero entre 0 y 10. Para hacer un primer anlisis de
los resultados obtenidos, se suman los puntos obtenidos de
las 10 preguntas para cada cuestionario. A continuacin se
muestran los puntos obtenidos en 50 cuestionarios.
Encontrar la media en la distribucin
78

78

82

85

81

86

80

73

84

78

68

84

75

78

76

76

82

85

91

80

70

87

77

82

84

48

49

39

39

43

35

42

34

44

49

34

30

43

31

34

41

42

45

42

35

38

39

42

43

29

Solucin..

Encontrar la media en la distribucin:


29
39
44
76
82

30
39
45
77
82

31
41
48
78
84

34
42
49
78
84

x
i 1

34
42
49
78
84

34
42
68
78
85

35
42
70
80
85

35
43
73
80
86

38
43
75
81
87

= 2990 =59.80
50

39
43
76
82
91

MEDIANA PERCENTIL 50

Es el valor que ocupa la posicin central de un


conjunto de observaciones o datos, una vez que han
sido ordenados en forma ascendente o descendente.

La mediana se suele definir como el valor ms


intermedio una vez que los datos han sido ordenados
en forma creciente. Se suele denotar por Me.

Divide al conjunto de datos en dos partes iguales.


Si el nmero de valores es impar, la mediana es el
nmero que se localiza exactamente a la mitad de
los datos.
Si

el nmero de valores es par, la mediana es el


nmero que se obtiene calculando la media entre
los dos valores centrales.

Clculo de la mediana
Para datos no agrupados:
Si n es impar: posicin donde se ubica la mediana es
igual a (n+1)/2.
Si n es par: (n+1)/2 no es entero, por lo tanto la
mediana ser igual al promedio de las dos
posiciones centrales.
La forma ms general de calcular la mediana es
la siguiente:

x n 1 2

Md x
n 2 x ( n 2) 1

si n es impar
si n es par

Ejemplo: datos no agrupados


En un rea de servicios dentro de una empresa de manufactura se
hace una encuesta para evaluar la calidad del servicio
proporcionada y el nivel de satisfaccin de los clientes internos. La
encuesta consiste de 10 preguntas, donde cada una de ellas
evala diferentes aspectos del servicio proporcionado. Las
respuestas para cada pregunta es un nmero entre 0 y 10. Para
hacer un primer anlisis de los resultados obtenidos, se suman los
puntos obtenidos de las 10 preguntas para cada cuestionario. A
continuacin se muestran los puntos obtenidos en 50
cuestionarios.
a) Ordenar los datos de menor a mayor.
b) Calcular mediana de los datos.
78

78

82

85

81

86

80

73

84

78

68

84

75

78

76

76

82

85

91

80

70

87

77

82

84

48

49

39

39

43

35

42

34

44

49

34

30

43

31

34

41

42

45

42

35

38

39

42

43

29

Solucin:
Ordenar datos de menor a mayor:
29
39
44
76
82

30
39
45
77
82

31
41
48
78
84

34
42
49
78
84

34
42
49
78
84

34
42
68
78
85

35
42
70
80
85

35
43
73
80
86

Calcular mediana de los datos


n es par utilizamos la formula:
Md = (X(n/2) + X((n/2) +1) )/2
Md = (49 + 68)/2 = 58.5

38
43
75
81
87

39
43
76
82
91

MODA

Es una medida de tendencia central que se puede


utilizar sea cual sea el tipo de variable a estudiar.

La moda de un conjunto de observaciones es el valor


que ms se repite, aquel cuya frecuencia absoluta es
mxima.

Puede ser nica (unimodal), que haya ms de una


(bimodal o multimodal), o que no exista.

Es la nica medida de tendencia central que se puede


determinar para datos de tipo cualitativo.

Para datos no agrupados: es simplemente la


observacin que ms se repite.

Ejemplo: datos no agrupados


En un rea de servicios dentro de una empresa de manufactura se
hace una encuesta para evaluar la calidad del servicio
proporcionada y el nivel de satisfaccin de los clientes internos. La
encuesta consiste de 10 preguntas, donde cada una de ellas
evala diferentes aspectos del servicio proporcionado. Las
respuestas para cada pregunta es un nmero entre 0 y 10. Para
hacer un primer anlisis de los resultados obtenidos, se suman los
puntos obtenidos de las 10 preguntas para cada cuestionario. A
continuacin se muestran los puntos obtenidos en 50
cuestionarios.

Clasificar el tipo de moda que presentan los datos e


identificar el valor de ella.
78

78

82

85

81

86

80

73

84

78

68

84

75

78

76

76

82

85

91

80

70

87

77

82

84

48

49

39

39

43

35

42

34

44

49

34

30

43

31

34

41

42

45

42

35

38

39

42

43

29

Solucin:
Ordenar datos de menor a mayor:
29
39
44
76
82

30
39
45
77
82

31
41
48
78
84

34
42
49
78
84

34
42
49
78
84

34
42
68
78
85

35
42
70
80
85

35
43
73
80
86

38
43
75
81
87

39
43
76
82
91

El valor que mas se repite es Mo = 42 y 78


por lo tanto es BIMODAL

Ejemplo:
Construir para el ejemplo anterior el grafico
que corresponda, considerando el tipo de
datos.
78

78

82

85

81

86

80

73

84

78

68

84

75

78

76

76

82

85

91

80

70

87

77

82

84

48

49

39

39

43

35

42

34

44

49

34

30

43

31

34

41

42

45

42

35

38

39

42

43

29

Datos no estan ordenados


100
90
80
70
60

NOTAS

50
40
30
20
10
0

ENCUESTA

REPRESENTACIN DE DATOS
CURVAS

EJERCICIO:
A continuacin se presentan las calificaciones de 60
estudiantes en el ao 2009:
23
80
52
41
60
34

60
77
10
71
78
67

79
81
64
83
89
17

32
95
75
54
76
82

57
41
78
64
84
69

74
65
25
72
48
74

52
92
80
88
84
63

70
85
98
62
90
80

82
55
81
74
15
85

36
76
67
43
79
61

a) Ordenar los datos.


b) Determine el valor mnimo y mximo de los datos.
c) Encuentre el rango de los datos.
d) Calcule la media, mediana y moda de la distribucin.
e) Construir el grafico que corresponda para la serie de
datos.

ORGANIZACIN DE DATOS AGRUPADOS


Una

distribucin de frecuencias: es un
arreglo de los datos que permite expresar
la frecuencia de ocurrencias de las
observaciones en cada una de las
clases, mostrando el patrn de la
distribucin de manera ms significativa.
Clase

Pto.
Medio

fi

Fi

fri

FRi

La Distribucin de Frecuencias:
Se

recomienda su uso cuando se tienen


grandes cantidades de datos (n).

Su

construccin requiere, en primer lugar,


la seleccin de los lmites de los intervalos
de clase.

Para

definir la cantidad de intervalos de


clase (k), se puede usar:
La

regla de Sturges: k = 1 + 3.3log(n)


k = n

La cantidad de clases no puede ser tan pequeo


(menos de 5) o tan grande (ms de 20), que la
verdadera naturaleza de la distribucin sea
imposible de visualizar.

La amplitud de todas las clases deber ser la


misma. Se recomienda que los puntos medios
tengan la misma cantidad de cifras significativas
que los datos en bruto.

Los lmites de las clases deben tener una cifras


significativas ms que los datos en bruto cuando
sean reales.

Determinar:
Punto

medio = (Li+Ls)/2.
Li: limite inferior
Ls: limite superior
Frecuencia absoluta de la clase (f ).
i
Frecuencia

(Fi).

acumulada de la clase

Frecuencia

relativa de la clase
(fri)= fi/n

Frecuencia

clase (FRi).

relativa acumulada de la

Ejemplo:
En un rea de servicios dentro de una empresa de
manufactura se hace una encuesta para evaluar la calidad
del servicio proporcionada y el nivel de satisfaccin de los
clientes internos. La encuesta consiste de 10 preguntas,
donde cada una de ellas evala diferentes aspectos del
servicio proporcionado. Las respuestas para cada pregunta
es un nmero entre 0 y 10. Para hacer un primer anlisis de
los resultados obtenidos, se suman los puntos obtenidos de
las 10 preguntas para cada cuestionario. A continuacin se
muestran los puntos obtenidos en 50 cuestionarios.
78

78

82

85

81

86

80

73

84

78

68

84

75

78

76

76

82

85

91

80

70

87

77

82

84

48

49

39

39

43

35

42

34

44

49

34

30

43

31

34

41

42

45

42

35

38

39

42

43

29

Solucin:
1. Ordenar datos de menor a mayor:
29
39
44
76
82

30
39
45
77
82

31
41
48
78
84

2. Determinar el :

34
42
49
78
84

Valor mnimo (Vmin) = 29

34
42
49
78
84

34
42
68
78
85

35
42
70
80
85

35
43
73
80
86

38
43
75
81
87

39
43
76
82
91

Valor mximo (Vmax) = 91

3. Calcular el Rango (R) = Vmax Vmin


Rango (R) = 91 - 29= 62
Rango (R) = 62

4. Determinar el Nmero de clase (K) en las que se


van a agrupar los datos.

Clase: subgrupo en los que se agrupan los datos.


Como se determina:

La regla de Sturges: k = 1 + 3.3log(n)


k = 1 + 3.3log(50) = 6.607 7
Nmero de clase (K) = 7
Si utilizamos la formula es:
K= n
K=50 = 7.077
5.Determinar la Amplitud (A) de las clases.
A= Rango/Clase = R/K
Amplitud ( A) = 62/7 = 8.857
Amplitud ( A) 8.86 9
59

6. Determinar las fronteras o lmites naturales


de cada clase.
Li: Limite inferior --- Li = Vm = 29
Ls: Limite superior Ls = Li + (A-1)
Ls =29+ (9-1) =37
INTERVAL
OS DE
CLASE
(I)

FRONTERAS
LIMITE
INFERIOR
(Li)

LIMITE
SUPERIOR (Ls)

X+(A-1)

X+(A-1)

X+2(A-1)

X+2(A-1)

X+3(A-1)

FRONTERAS

Li
29

Ls
37

38

46

47

55

56

64

65

73

74

82

83

91

6. Determinar las fronteras o lmites reales de cada


clase.
Li: Limite inferior --- Li = Vm u
Ls: Limite superior Ls = Li + A
u: unidad, si es entero es 1, decimal es 0.1,
centesimal 0.01, ect.

Limite inferior --- Li = Vmin u


Li = 29 (1/2) (1) = 28.5
Limite superior --- Ls = Li + A
Ls = 28.5 + 9 = 37.5

INTERVALOS
DE CLASE
(I)

Li
28.5

Ls
<37.5

37.5

<46.5

LIMITE
SUPERIO
R (Ls)

46.5

<55.5

55.5

<64.5

X+A

64.5

<73.5

FRONTERAS
LIMITE
INFERIOR
(Li)

FRONTERAS

X+A

X+2A

73.5

<82.5

X+2A

X+3A

82.5

<91.5

7. Contar los datos que pertenecen a cada clase.


8. Elaborar la tabla de frecuencias absolutas (fi).
29
39
44
76
82

30
39
45
77
82

31
41
48
78
84

34
42
49
78
84

34
42
49
78
84

34
42
68
78
85

LIMITES NATURALES
I
1
2
3
4
5
6
7

FRONTERAS
Li

Ls

29
38
47
56
65
74
83

37
46
55
64
73
82
91

35
42
70
80
85

35
43
73
80
86

38
43
75
81
87

39
43
76
82
91

LIMITES REALES

fi

8
14
3
0
3
14
8

1
2
3
4
5
6
7

FRONTERAS
Li

Ls

28.5
37.5
46.5
55.5
64.5
73.5
82.5

<37.5
<46.5
<55.5
<64.5
<73.5
<82.5
<91.5

fi
8
14
3
0
3
14
8

Clculo de la media

Para datos agrupados:


k

x
i 1
k

fi

fi

i 1

Donde:
xi : punto medio de la clase i (marca de clase) = (Li + Ls)/2
fi : frecuencia absoluta de la clase i
n : nmero de datos

Ejercicio: datos agrupados

Calcule la media de la distribucin:

FRONTERAS

1
2
3
4
5
6
7

Li

Ls

29

37

38

46

47

55

56

64

65

73

74

82

83

91

TOTAL

FRECUENCI
A

MARCA
CLASE

fi

Xi

8
14
3
0
3
14
8

33
42
51
60
69
78
87

50

Xi*fi

X
264
588
153
0
207
1092
696
3,000

x f
i 1
k

i i

fi
i 1

= 3000/50
= 60
Xi= (Li+Ls)/2

Clculo de la mediana

Datos agrupados:
La clase mediana es la que contiene a la observacin
que ocupa la posicin N/2.

N
Faa
Md Li ( 2
) * Ic
fm

Donde:
Li: lmite inferior de la clase mediana.
Faa: frecuencia acumulada de la clase anterior a la clase mediana.
fm: frecuencia absoluta de la clase mediana.
Ic :amplitud de la clase mediana

Cabe destacar que es preferible el uso de la mediana como medida


descriptiva del centro cuando se quiere reducir o eliminar el efecto de
valores extremos en un conjunto de datos (muy grandes o muy
pequeos).

Ejercicio: datos agrupados

Calcule la mediana de la distribucin:

FRONTERAS

1
2
3
4
5
6
7

Li

Ls

FRECUENCIA
ABSOLUTA

fi
28.5 <37.5

82.5 <91.5

8
14
3
0
3
14
8

TOTAL

50

37.5 <46.5
46.5 <55.5
55.5 <64.5
64.5 <73.5
73.5 <82.5

FRECUENCIA
ABSOLUTA
ACUMULADA

Faa
8

N
Faa
Md Li ( 2
) * Ic
fm

22
25
25
28
42
50

= 55.5

Solucin:
1.
2.

Calcular el factor N/2 = 50/2 = 25 datos.


Observar en la tabla la columna de Frecuencia
absoluta acumulada e identificar la clase en que se
encuentran 25.
Faa3 = Faa4 = 25 datos
Fi3= 3 y Fi4 = 0

Por lo tanto esta en el intervalo de clase I3, con Fi3=3.


FRONTERAS

2
3
4

Li

Ls

FRECUENCIA
ABSOLUTA

fi
37.5 <46.5
46.5 <55.5
55.5 <64.5

14
3
0

FRECUENCIA
ABSOLUTA
ACUMULADA

Faa
22
25
25

N
Faa
Md Li ( 2
) * Ic
fm

Limite real inferior de la clase mediana o frontera de


clase es:
Li = 47 - 0.5 = 46.5
Factor es: N/2 = nmero de datos/2 = N/2 = 50/2 = 25
Frecuencia acumulada de la clase anterior es: Faa = 22
Frecuencia de la clase de la mediana o frecuencia
absoluta es: fm = fi = 3
Ancho o amplitud de clase es: Ic = 9
Sustituyendo valores en la ecuacion se tiene que la
mediana es:
Md = 46.5 + ( 50/2 22 ) * 9 = 55.5
3

Clculo de la moda

Para datos agrupados:

1
Mo Li
Ic
1 2
Donde:
Li: lmite inferior de la clase modal.
1: diferencia entre fi de la clase modal y la anterior.
2: diferencia entre fi de la clase modal y la posterior.
Ic: amplitud de la clase modal (clase de mayor frecuencia).

Ejemplo: datos agrupados

Calcular la moda de las distribuciones


anteriores.
FRONTERAS

1
2
3
4
5
6
7

Li

Ls

FRECUENCIA
ABSOLUTA

Fi
28.5 <37.5
37.5 <46.5
46.5 <55.5
55.5 <64.5
64.5 <73.5
73.5 <82.5
82.5 <91.5
TOTAL

8
14
3
0
3
14
8
50

1
Mo Li
Ic
1 2
Mo2 = 40.741
Mo6 = 79.3 79

1
Mo Li
Ic
1 2

El intervalo de clase donde mas se repiten los datos es en:


Fi2 = Fi6=14

Limite real inferior de la clase modal es:


Li2 = 38 - 0.5=37.5 Li6 = 74 0.5 =73.5

Diferencia entre la frecuencia de la clase modal y la clase


pre modal es:
21 =14 - 8 = 6
61 =14 - 3 = 11

Diferencia entre la frecuencia de la clase modal y la clase


post modal es:
22 =14 - 3 = 11
62 =14 - 8 = 6

Ancho o amplitud de clase es: Ic = 9


Mo2= 37.5 + ( 6
)*9
Mo6= 73.5 + (

6 + 11
Mo2= 40.741

11

11 + 6
Mo6= 79.379

)*9

REPRESENTACIN GRFICA DE LOS DATOS

Los grficos permiten visualizar en forma


global y rpida el comportamiento de los
datos.

Para datos cuantitativos agrupados en clases,


comnmente se utilizan tres grficos:
Histogramas.
Polgono de frecuencias.
Ojiva o Polgono de frecuencias acumuladas.

REPRESENTACIN DE DATOS CUANTITATIVOS

Histograma

OJIVA

POLIGONO DE FRECUENCIAS

Histograma y Polgono de Frecuencias

REPRESENTACIN DE DATOS CUALITATIVOS

Para datos cualitativos se usan:


Curvas
Barras

CURVAS

Sectores

BARRAS
PASTEL O CIRCULAR

Continuacin.
Construir para el ejercicio anterior, el grafico que
corresponda, considerando el tipo de datos.
Solucin:
El grafico que representa esos datos es el HISTOGRAMA

I
1
2
3
4
5
6
7

FRONTERAS
Li

Ls

29
38
47
56
65
74
83

37
46
55
64
73
82
91

14

fi
8
14
3
0
3
14
8

14

14
12
10

8
FRECUENCIA
6
3

2
0

29

38

47

0
56

65

INTERVALOS DE CLASE

74

83

92

RELACIN ENTRE LA MEDIA,


LA MEDIANA Y LA MODA
Permiten estudiar la forma de la curva,
dependiendo de cmo se agrupan los datos.

Cuando los datos son sesgados es mejor emplear la Md

ASIMETRA O SESGO

Una distribucin es simtrica si


la mitad izquierda de su
distribucin es la imagen
especular de su mitad derecha.
o En
las
distribuciones
simtricas
media
y
mediana coinciden. Si slo
hay una moda tambin
coincide.
o La asimetra es positiva o
negativa en funcin de a
qu lado se encuentra la
cola de la distribucin.

78

La media tiende a desplazarse


hacia las valores extremos
(colas).

Las discrepancias entre las


medidas de centralizacin son
indicacin de asimetra.

79

Relacin entre Tendencia Central y la


Simetra de la distribucin
Simetra

Relacin

Simtrica o insesgada Moda = Mediana = Media


sesgo positivo o a la Moda < Mediana < Media
derecha
sesgo negativo o a la Moda > Mediana > Media
izquierda

La forma depende de la distribucin de las


frecuencias absolutas de los datos. Algunas de
las formas ms comunes que puede adoptar
son las siguientes:
SIMETRICA Campana
de Gauss-Normal

Asimtrica

Forma bimodal

Con anomalas

Sesgada a la derecha

Forma en U

Sesgada a la izquierda

La localizacin o tendencia central de un conjunto


de datos no necesariamente proporciona
informacin
suficiente
para
describirlos
adecuadamente. Debido a que no todos los
valores son semejantes, la variacin entre ellos
se considera importante.

Se puede decir que un conjunto de datos tiene


una dispersin reducida si los mismos se
aglomeran estrechamente en torno a alguna
medida de localizacin de inters y se dice que
tiene una dispersin grande si se esparcen
ampliamente alrededor de alguna medida de
localizacin de inters.

Md = 55.5

14

14

14

12

10
8

8
FRECUENCIA
6

29

38

47

56

65

Mo = 41
INTERVALOS DE CLASE

CONCLUSIN:

74

Mo = 79

X 60

83

92

Comparacin de los resultados obtenidos en


las medidas de tendencia central
MEDIDAS DE TENDENCIA
CENTRAL

DATOS NO
AGRUPADOS

DATOS
AGRUPADOS

Media Aritmtica()
X

59.8

60.0

Mediana (Md)

58.5

55.5

42 y 78

41 y 79

Moda (Mo)

Conclusin:

EJERCICIO:
A continuacin se presentan las calificaciones de 60
estudiantes en el ao 2009:
23
80
52
41
60
34
a)
b)
c)
d)
e)

60
77
10
71
78
67

79
81
64
83
89
17

32
95
75
54
76
82

57
41
78
64
84
69

74
65
25
72
48
74

52
92
80
88
84
63

70
85
98
62
90
80

82
55
81
74
15
85

36
76
67
43
79
61

Determine el valor mnimo y mximo de los datos.


Encuentre el rango de los datos.
Construir el grafico que corresponda para la serie de datos.
Calcule la media, mediana y moda de la distribucin.
Compare los resultados obtenidos. Qu puede concluir de estos
datos?

Comparacin de los resultados obtenidos en


las medidas de tendencia central
MEDIDAS DE TENDENCIA
CENTRAL

Media Aritmtica()
X
Mediana (Md)
Moda (Mo)

Conclusin:

DATOS NO
AGRUPADOS

DATOS
AGRUPADOS

También podría gustarte