Está en la página 1de 88

BASES ESTADISTICAS PARA EL CONTROL

UNIDAD II

Ing. Mario Enrique Elías Ayala


e-mail: melias@ufg.edu.sv
CONTENIDO
2.1 Estadística descriptiva 2.2 Técnicas de conteo 2.3 Introducción a la
probabilidad 2.4 Distribuciones de probabilidad

OBJETIVOS
¡ ¡

¡ ¡

Reconstruir sus conocimientos estadísticos. Aplicar las medidas de tendencia


central así como las medidas de dispersión. Aplicar los conceptos de probabilidad.
Identificar y aplicar las diferentes distribuciones de probabilidad.
¡

La estadística tiene que ver con la recopilación, presentación, análisis y uso de


datos para tomar decisiones y resolver problemas. Cualquier persona recibe
información en forma de datos a través de los periódicos, la televisión u otros
medios; y a menudo es necesario obtener alguna conclusión a partir de la
información contenida en los datos.

¡
2.1 Estadística Descriptiva
OBJETIVO: Conocer y calcular las medidas de tendencia central

Ing. Melba de Miranda

e-mail: mmiranda@ufg.edu.sv
CONTENIDO
Conceptos básicos. Tipos de datos. Aleatorización y otras estrategias de muestreo.
Organización de datos. Representación de datos. Medidas de tendencia central. Ø
Datos no agrupados Ø Datos agrupados  Visualización de datos.  Medidas de
dispersión      
GENERALIDADES
Los métodos empleados para resumir y organizar datos se denominan estadística
descriptiva; mientras que los métodos para tomar decisiones se denominan inferencia
estadística.

¡
ESTADÍSTICA DESCRIPTIVA
¡

Estadística Descriptiva (Deductiva): Es la encargada de la organización,


condensación, presentación de los datos en tablas y gráficos y del cálculo de
medidas numéricas que permitan estudiar los aspectos más importantes de los datos.
DESCRIBIR
¡

Esto se debe a la creciente facilidad con la cual se pueden manejar grandes


cantidades de datos numéricos, debido al uso de …
CONCEPTOS BÁSICOS
ESTADISTICA: Es una colección de métodos para planear experimentos, obtener datos,
y después organizar, resumir, presentar, analizar, interpretar y llegar a
conclusiones basadas en los datos.
¡

Población: es la colección de todas las posibles mediciones u observaciones a


estudiar. Se dice que la colección es completa, pues incluye a todos los sujetos
que se estudian o que pueden hacerse de una variable bajo estudio.
¡

Se clasifica en dos categorías:


POBLACIÓN FINITA: Es aquella que incluye una cantidad limitada contable de
observaciones, individuos o medidas. Siempre que sea posible alcanzar (contar) el
número total de todas las posibles mediciones, se considera como finita la
población. POBLACIÓN INFINITA: Es aquella que incluye un gran conjunto de
observaciones o mediciones que no pueden alcanzarse por conteo. Al menos,
hipotéticamente, no existe límite en cuanto al número de observaciones que el
experimento puede generar.
l
CENSO: Es la colección de datos de cada uno de los miembros de la población.
¡

Muestra: l Es un conjunto de mediciones u observaciones tomadas o seleccionados a


partir de una población. l Es un subconjunto de la población.
TIPOS DE DATOS
¡

Variables:
l Son

las características o lo que se estudia de cada individuo de la muestra. Ej: sexo,


edad, peso, estatura, color de ojos, estado civil, temperatura, cantidad de
nacimientos, presión, grosor, diámetro, ...

Datos:
l Son

los valores que toma la variable en cada caso. l Son las observaciones recolectadas
(como mediciones, géneros, respuestas de encuestas).
l
 PARAMETRO: Es una medición numérica que describe algunas características de una
población. EJEMPLO:  Cuando Lincoln fue elegido presidente por primera vez,
recibió el 39.82% de 1, 865,908 votos. Si suponemos que el conjunto de todos esos
votos es la población a considerar, entonces el 39.82% es un parámetro, no un
estadístico.   ESTADISTICO: Es una medición numérica que describe algunas
características de una muestra. EJEMPLO:  Con base en una muestra de 877
ejecutivos encuestados, se encontró que el 45% de ellos no contaría a alguien con
un error ortográfico en su solicitud de empleo. Esta cifra de 45% es un
estadístico, ya que está basado en una muestra, no en la población completa de
todos los ejecutivos.
¡

DATOS CUALITATIVOS (categóricos o de atributos): Son datos que solo toman valores
asociados a las cualidades o atributos, clasificándolos en una de varias
categorías, es decir, no son valores numéricos. Ejemplo:
l l l l l

Sexo: f/m. Hábito de fumar: Fumador/No fumador Color de ojos: negro, azul, marrón,
… Religión: católica, evangélica, … Estado civil: soltero, casado, divorciado,…
¡

DATOS CUANTITATIVOS: provienen de variables que pueden medirse, cuantificarse o


expresarse numéricamente. Ejemplos:
l l l l l l l

Peso Edad Estatura Presión Humedad Intensidad de un sismo Cantidad de hermanos


DATOS DISCRETOS: Resultan cuando el número de posibles valores es un número finito,
o bien, un número que puede contarse. (Es decir, el número de posibles valores es
0, 1, 2, etc.).   DATOS CONTINUOS (NUMERICOS): Resultan de un infinito de
posibles valores que pueden asociarse a puntos de alguna escala continua, cubriendo
un rango de valores sin huecos ni interrupciones.

Abusos que se pueden cometer con la Estadística
¡

Conclusiones erróneas debido a que los datos son numéricamente insuficientes.


Representaciones gráficas engañosas (escalas). Datos muéstrales no representativos:
Muestra que no incluye a elementos de toda la población. l Ciertas categorías de
personas no responden correctamente. l Respuestas voluntarias (sesgadas).
l
ALEATORIZACIÓN Y OTRAS ESTRATEGIAS DE MUESTREO
Azar simple Azar sistemático Estratificado Conglomerados

CLASIFICACION DEL TIPO DE MUESTREO

PROBALISTICO O ALEATORIOS

NO PROBALISTICOS (Determinístico)

Casual o accidental Intencional Por cuotas


TIPOS DE MUESTREO

     

Los métodos de muestreo más comunes son: a) Aleatorio, b) Aleatorio simple, c)


Sistemático, d) Por conveniencia, e) Estratificado, f) Por conglomerados o racimos.
¡

Muestra aleatoria: se considera aleatoria siempre y cuando cada observación,


medición o miembro de la población tenga la misma probabilidad de ser seleccionado.
A menudo se usan computadoras para generar números telefónicos aleatorios.

¡
MUESTREO ALEATORIO SIMPLE
 Se selecciona una muestra de tamaño de n sujetos de manera que cada posible
muestra del mismo tamaño n tenga la misma posibilidad de ser elegida.

 Todos los elementos de la población tienen la misma probabilidad de ser elegidos


para formar parte de la muestra.
Ejemplo: Imagine un salón de clase con 60 estudiantes acomodados en seis filas de
10 estudiantes cada una. Suponga que el profesor selecciona una muestra de 10
estudiantes tirando un dado y seleccionando la fila correspondiente al resultado.
¿El resultado es una muestra aleatoria? o ¿Es una muestra aleatoria simple? 
MUESTREO ALEATORIO SISTEMATICO
Se selecciona al azar un elemento de la población y a partir de él se seleccionan
cada k-esimo los elementos siguientes (por ejemplo, cada n elemento en la
población). Ejemplo: sea n=3
MUESTREO DE CONVENIENCIA

Se utiliza resultados fáciles obtener. 

n de
MUESTREO ESTRATIFICADO
La población se divide en grupos homogéneos, llamamos estratos. La proporción de
cada estrato en la población se mantiene en la muestra. Cada uno de los estrato de
la muestra se obtiene por muestreo aleatorio simple sobre el estrato
correspondiente de la población.
Estrato 1 Estrato 2

Población

Muestra
Los estratos más grandes tienen probabilidad de ser representados.

mayor

 Se subdivide a la población en al menos dos diferentes subgrupos (o estratos) que


comparten las mismas características (por ejemplo, el genero o categoría de edad) y
después se extrae una muestra de cada subgrupo.

 Homogéneos en su interior; diferentes entre sí en propiedades y tamaño.


MUESTREO POR CONGLOMERADOS O RACIMOS
 Se divide el área de la población en secciones (conglomerados o racimos ). Se
eligen al azar unas pocas de estas secciones y luego se toman todos los elementos o
miembros de las secciones elegidas para formar la muestra.

Para dividir la población en secciones podemos usar las provincias.


Heterogéneos en su interior; diferentes entre sí en propiedades y tamaño.
Grupo 1A Grupo 5C

Grupo 2A Grupo 3B
ORGANIZACIÓN DE DATOS NO AGRUPADOS

Una vez que se ha realizado la recolección de los datos, se obtienen datos en


bruto, los cuales rara vez son significativos sin una organización y tabulación.
¡

Formas de organizar los datos:


Un arreglo: es la forma más sencilla de organizar los datos en bruto, consiste en
colocar las observaciones en orden según su magnitud: ascendente o descendente. l
Poco práctica cuando se tiene una gran cantidad de datos.
l

Si

los datos muéstrales no se reúnen de forma adecuada, resultarían tan inútiles que
ninguna cantidad estadística podrá salvarlos.
Ejemplo:

En un área de servicios dentro de una empresa de manufactura se hace una encuesta


para evaluar la calidad del servicio proporcionada y el nivel de satisfacción de
los clientes internos. La encuesta consiste de 10 preguntas, donde cada una de
ellas evalúa diferentes aspectos del servicio proporcionado. Las respuestas para
cada pregunta es un número entre 0 y 10. Para hacer un primer análisis de los
resultados obtenidos, se suman los puntos obtenidos de las 10 preguntas para cada
cuestionario. A continuación se muestran los puntos obtenidos en 50 cuestionarios.

78 68 70 35 41

78 84 87 42 42

82 75 77 34 45

85 78 82 44 42

81 76 84 49 35

86 76 48 34 38

80 82 49 30 39

73 85 39 43 42

84 91 39 31 43

78 80 43 34 29
Solución:  1. Ordenar datos de menor a mayor:

29 39 44 76 82

30 39 45 77 82

31 41 48 78 84

34 42 49 78 84

34 42 49 78 84

34 42 68 78 85

35 42 70 80 85

35 43 73 80 86

38 43 75 81 87

39 43 76 82 91

2. Determinar el :
Valor mínimo (Vmin) = 29 Valor máximo (Vmax) = 91

3. Calcular el Rango (R) = Vmax – Vmin Rango (R) = 91 - 29= 62 Rango (R) = 62
MEDIDAS DE LOCALIZACIÓN
¡

Las medidas de localización dividen la distribución en partes iguales, sirven para


clasificar a un individuo o elemento dentro de una determinada población o muestra.
Clasificación de las medidas de localización:

Centralización o de tendencia central Indican valores con respecto a los que los
datos parecen agruparse. Media, Mediana y Moda

Dispersión  Indican la mayor o menor concentración de los datos con respecto  a


las medidas de centralización.
 Desviación típica, coeficiente variación, Rango, Varianza de

Posición

Dividen un conjunto ordenado de datos en grupos con la misma cantidad de


individuos.

 Percentiles, mediana.

Cuartiles,

Decilesy

Forma  Asimetría  Apuntamiento o curtosis


36
MEDIDAS DE TENDENCIA CENTRAL
¡

Corresponden a valores que generalmente se ubican en la parte central de un


conjunto de datos. Forma como los datos pueden condensarse en un solo valor central
alrededor del cual todos los datos muéstrales se distribuyen.

¡
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS
¡

Las medidas de importantes son:


l Media. l Mediana. l Moda.

tendencia

central

más

Son valores que se encuentran en el centro o a la mitad de los datos, o representa


el valor al que tienden a concentrarse los datos de una muestra o de un proceso.

¡
MEDIA ARITMÉTICA
¡La

media aritmética o simplemente promedio (también llamada media muestral). la suma


de todas las observaciones dividida entre el número total de observaciones. calcula
de la siguiente forma: si las observaciones de una muestra de tamaño n son x1, x2,
…,xn entonces:

¡Es ¡

¡Se

¡ ¡

x 1 + x 2 + ... + x n i = 1 µ=X= = n n

∑x

i
Ejemplo: datos no agrupados

En un área de servicios dentro de una empresa de manufactura se hace una encuesta


para evaluar la calidad del servicio proporcionada y el nivel de satisfacción de
los clientes internos. La encuesta consiste de 10 preguntas, donde cada una de
ellas evalúa diferentes aspectos del servicio proporcionado. Las respuestas para
cada pregunta es un número entre 0 y 10. Para hacer un primer análisis de los
resultados obtenidos, se suman los puntos obtenidos de las 10 preguntas para cada
cuestionario. A continuación se muestran los puntos obtenidos en 50 cuestionarios.
Encontrar la media en la distribución

78 68 70 35 41

78 84 87 42 42

82 75 77 34 45

85 78 82 44 42

81 76 84 49 35

86 76 48 34 38

80 82 49 30 39

73 85 39 43 42

84 91 39 31 43

78 80 43 34 29
Solución..
¡

Encontrar la media en la distribución:


30 39 45 77 82 31 41 48 78 84
n

¡29

39 44 76 82

34 42 49 78 84

34 42 49 78 84

34 42 68 78 85

35 42 70 80 85

35 43 73 80 86

38 43 75 81 87

39 43 76 82 91

X =

∑x
i =1

= 2990 =59.80 50
MEDIANA –PERCENTIL 50
¡

Es el valor que ocupa la posición central de un conjunto de observaciones o datos,


una vez que han sido ordenados en forma ascendente o descendente. La mediana se
suele definir como el valor “más intermedio” una vez que los datos han sido
ordenados en forma creciente. Se suele denotar por Me. Divide al conjunto de datos
en dos partes iguales. Si el número de valores es impar, la mediana es el número
que se localiza exactamente a la mitad de los datos. Si el número de valores es
par, la mediana es el número que se obtiene calculando la media entre los dos
valores centrales.


Cálculo de la mediana ØPara datos no agrupados: Si n es impar: posición donde se
ubica la mediana es igual a (n+1)/2. Si n es par: (n+1)/2 no es entero, por lo
tanto la mediana será igual al promedio de las dos posiciones centrales. La forma
más general de calcular la mediana es la siguiente:

x ( ( n + 1) 2 ) si n es impar   Md =  x x ( n 2 ) + ((n 2) 1+ ) si n es par 


 2
Ejemplo: datos no agrupados

 

En un área de servicios dentro de una empresa de manufactura se hace una encuesta


para evaluar la calidad del servicio proporcionada y el nivel de satisfacción de
los clientes internos. La encuesta consiste de 10 preguntas, donde cada una de
ellas evalúa diferentes aspectos del servicio proporcionado. Las respuestas para
cada pregunta es un número entre 0 y 10. Para hacer un primer análisis de los
resultados obtenidos, se suman los puntos obtenidos de las 10 preguntas para cada
cuestionario. A continuación se muestran los puntos obtenidos en 50 cuestionarios.
a) Ordenar los datos de menor a mayor. b) Calcular mediana de los datos.

78 68 70 35 41

78 84 87 42 42

82 75 77 34 45

85 78 82 44 42

81 76 84 49 35

86 76 48 34 38

80 82 49 30 39

73 85 39 43 42

84 91 39 31 43

78 80 43 34 29
Solución: Ø Ordenar datos de menor a mayor:

29 39 44 76 82

30 39 45 77 82

31 41 48 78 84

34 42 49 78 84

34 42 49 78 84

34 42 68 78 85

35 42 70 80 85

35 43 73 80 86

38 43 75 81 87

39 43 76 82 91

ØCalcular mediana de los datos n es par utilizamos la formula: Md = (X(n/2) +


X((n/2) +1) )/2

Md = (49 + 68)/2 = 58.5


MODA
¡

Es una medida de tendencia central que se puede utilizar sea cual sea el tipo de
variable a estudiar. La moda de un conjunto de observaciones es el valor que más se
repite, aquel cuya frecuencia absoluta es máxima. Puede ser única (unimodal), que
haya más de una (bimodal o multimodal), o que no exista. Es la única medida de
tendencia central que se puede determinar para datos de tipo cualitativo. Para
datos no agrupados: es simplemente la observación que más se repite.

¡

¡

¡
Ejemplo: datos no agrupados

En un área de servicios dentro de una empresa de manufactura se hace una encuesta


para evaluar la calidad del servicio proporcionada y el nivel de satisfacción de
los clientes internos. La encuesta consiste de 10 preguntas, donde cada una de
ellas evalúa diferentes aspectos del servicio proporcionado. Las respuestas para
cada pregunta es un número entre 0 y 10. Para hacer un primer análisis de los
resultados obtenidos, se suman los puntos obtenidos de las 10 preguntas para cada
cuestionario. A continuación se muestran los puntos obtenidos en 50 cuestionarios.
Ø Clasificar el tipo de moda que presentan los datos e identificar el valor de
ella.

78 68 70 35 41

78 84 87 42 42

82 75 77 34 45

85 78 82 44 42

81 76 84 49 35

86 76 48 34 38

80 82 49 30 39

73 85 39 43 42

84 91 39 31 43

78 80 43 34 29
Solución: Ø Ordenar datos de menor a mayor:

29 39 44 76 82

30 39 45 77 82

31 41 48 78 84

34 42 49 78 84

34 42 49 78 84

34 42 68 78 85

35 42 70 80 85

35 43 73 80 86

38 43 75 81 87

39 43 76 82 91

ØEl valor que mas se repite es Mo = 42 y 78 por lo tanto es BIMODAL


Ejemplo:  Construir para el ejemplo anterior el grafico que corresponda,
considerando el tipo de datos.

78 68 70 35 41

78 84 87 42 42

82 75 77 34 45

85 78 82 44 42

81 76 84 49 35

86 76 48 34 38

80 82 49 30 39

73 85 39 43 42

84 91 39 31 43

78 80 43 34 29
Datos no estan ordenados
REPRESENTACIÓN DE DATOS
CURVAS
EJERCICIO:  A continuación se presentan las calificaciones de 60 estudiantes en el
año 2009:

23 80 52 41 60 34

60 77 10 71 78 67

79 81 64 83 89 17

32 95 75 54 76 82

57 41 78 64 84 69

74 65 25 72 48 74

52 92 80 88 84 63

70 85 98 62 90 80

82 55 81 74 15 85

36 76 67 43 79 61

a)Ordenar los datos. b)Determine el valor mínimo y máximo de los datos. c)Encuentre
el rango de los datos. d)Calcule la media, mediana y moda de la distribución.
e)Construir el grafico que corresponda para la serie de datos.
ORGANIZACIÓN DE DATOS AGRUPADOS
l Una

distribución de frecuencias: es un arreglo de los datos que permite expresar la


frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando
el patrón de la distribución de manera más significativa.
Pto. Medio

Clase

fi

Fi

fri

FRi
¡

La Distribución de Frecuencias:
l Se

recomienda su uso cuando se tienen grandes cantidades de datos (n). construcción


requiere, en primer lugar, la selección de los límites de los intervalos de clase.
definir la cantidad de intervalos de clase (k), se puede usar:
¡ La

l Su

l Para

regla de Sturges: k = 1 + 3.3log(n) ¡ k = n


¡

La cantidad de clases no puede ser tan pequeño (menos de 5) o tan grande (más de
20), que la verdadera naturaleza de la distribución sea imposible de visualizar. La
amplitud de todas las clases deberá ser la misma. Se recomienda que los puntos
medios tengan la misma cantidad de cifras significativas que los datos en bruto.
Los límites de las clases deben tener una cifras significativas más que los datos
en bruto cuando sean reales.

¡
¡

Determinar:
l Punto
 

medio = (Li+Ls)/2. Li: limite inferior Ls: limite superior l Frecuencia absoluta de
la clase (fi).
l Frecuencia

(Fi).

acumulada de la clase

l Frecuencia

relativa de la clase (fri)= fi/n relativa acumulada de

l Frecuencia
Ejemplo:

En un área de servicios dentro de una empresa de manufactura se hace una encuesta


para evaluar la calidad del servicio proporcionada y el nivel de satisfacción de
los clientes internos. La encuesta consiste de 10 preguntas, donde cada una de
ellas evalúa diferentes aspectos del servicio proporcionado. Las respuestas para
cada pregunta es un número entre 0 y 10. Para hacer un primer análisis de los
resultados obtenidos, se suman los puntos obtenidos de las 10 preguntas para cada
cuestionario. A continuación se muestran los puntos obtenidos en 50 cuestionarios.

78 68 70 35 41

78 84 87 42 42

82 75 77 34 45

85 78 82 44 42

81 76 84 49 35

86 76 48 34 38

80 82 49 30 39

73 85 39 43 42

84 91 39 31 43

78 80 43 34 29
Solución:  1. Ordenar datos de menor a mayor:

29 39 44 76 82

30 39 45 77 82

31 41 48 78 84

34 42 49 78 84

34 42 49 78 84

34 42 68 78 85

35 42 70 80 85

35 43 73 80 86

38 43 75 81 87

39 43 76 82 91

2. Determinar el :
Valor mínimo (Vmin) = 29 Valor máximo (Vmax) = 91

3. Calcular el Rango (R) = Vmax – Vmin Rango (R) = 91 - 29= 62 Rango (R) = 62

4. Determinar el Número de clase (K) en las que se van a agrupar los datos.
l l

Clase: subgrupo en los que se agrupan los datos. Como se determina:

    

ØLa regla de Sturges: k = 1 + 3.3log(n) k = 1 + 3.3log(50) = 6.607 ≈ 7 Número de


clase (K) = 7

ØSi utilizamos la formula es: K= √n  K=√50 = 7.07≈7  5.Determinar la Amplitud (A)


de las clases.  A= Rango/Clase = R/K  Amplitud ( A) = 62/7 = 8.857  Amplitud
( A) ≈ 8.86 ≈ 9

59
6. Determinar las fronteras o límites naturales de cada clase.  Li: Limite
inferior --- Li = Vm = 29  Ls: Limite superior – Ls = Li + (A-1)  Ls =29+ (9-1)
=37
   INTERVALOS FRONTERAS DE CLASE LIMITE LIMITE SUPERIOR (I) INFERIOR (Li) (Ls)

I 1 2 3 4 5 6 7

FRONTERAS Li Ls
29 38 47 56 65 74 83 37 46 55 64 73 82 91

1 2 3

X X+(A-1) X+(A-1) X+2(A-1) X+2(A-1) X+3(A-1)


6. Determinar las fronteras o límites reales de cada clase.  Li: Limite inferior
--- Li = Vm – ½ u  Ls: Limite superior – Ls = Li + A  u: unidad, si es entero es
1, decimal es 0.1, centesimal 0.01, ect.

Ø Limite inferior --- Li = Vmin – ½ u Li = 29 – (1/2) (1) = 28.5 Ø Limite superior


--- Ls = Li + A Ls = 28.5 + 9 = 37.5
INTERVALOS DE FRONTERAS CLASE LIMITE LIMITE (I) INFERIOR (Li) SUPERIOR (Ls)

I 1 2 3 4 5 6 7

FRONTERAS Li Ls
28.5 37.5 46.5 55.5 64.5 73.5 82.5 <37.5 <46.5 <55.5 <64.5 <73.5 <82.5 <91.5

1 2 3

X X+A X+2A

X+A X+2A X+3A


7. Contar los datos que pertenecen a cada clase.  8. Elaborar la tabla de
frecuencias absolutas (fi).

29 39 44 76 82
I 1 2 3 4 5 6 7

30 39 45 77 82

31 41 48 78 84
fi

34 42 49 78 84

34 42 49 78 84

34 42 68 78 85
I 1 2 3 4 5 6 7

35 42 70 80 85

35 43 73 80 86

38 43 75 81 87
fi

39 43 76 82 91

LIMITES NATURALES
FRONTERAS Li Ls

LIMITES REALES
FRONTERAS Li Ls

29 38 47 56 65 74 83

37 46 55 64 73 82 91

8 14 3 0 3 14 8

28.5 37.5 46.5 55.5 64.5 73.5 82.5

<37.5 <46.5 <55.5 <64.5 <73.5 <82.5 <91.5

8 14 3 0 3 14 8
Cálculo de la media
¡Para

datos agrupados:
xf ∑
i= 1 k i i

1 X =i = k

f i ∑

Donde: xi : punto medio de la clase i (marca de clase) = (Li + Ls)/2 fi :


frecuencia absoluta de la clase i n : número de datos
Ejercicio: datos agrupados
¡

Calcule la media de la distribución:


FRECUENCIA

I
1 2 3 4 5 6 7

FRONTERAS

Li
29 38 47 56 65 74 83

Ls
37 46 55 64 73 82 91

fi
8 14 3 0 3 14 8

MARCA CLASE

Xi*fi
264 588 153 0 207 1092 696

Xi
33 42 51 60 69 78 87

X=

∑x f
i =1 k i

∑ fi
i =1

= 3000/50 = 60
Xi= (Li+Ls)/2

TOTAL

50

3,000
Cálculo de la mediana
Ø Datos agrupados: l La clase mediana es la que contiene a la observación que ocupa
la posición N/2.
¡

Donde: Li: límite inferior de la clase mediana. Faa: frecuencia acumulada de la


clase anterior a la clase mediana. fm: frecuencia absoluta de la clase mediana.
Ic :amplitud de la clase mediana
¡Cabe

N − Faa Md = Li + ( 2 ) * Ic fm

destacar que es preferible el uso de la mediana como medida descriptiva del centro
cuando se quiere reducir o eliminar el efecto de valores extremos en un conjunto de
datos (muy grandes o muy pequeños).
Ejercicio: datos agrupados
¡

Calcule la mediana de la distribución:


FRECUENCIA ABSOLUTA

I
1 2 3 4 5 6 7

FRONTERAS

Li
28.5 37.5 46.5 55.5 64.5 73.5 82.5

Ls

<37.5 8 <55.5 3 <64.5 0 <73.5 3

fi

FRECUENCIA ABSOLUTA ACUMULADA

<46.5 14

<82.5 14 <91.5 8

Faa 8 22 25 25 28 42 50

N − Faa Md = Li + ( 2 ) * Ic fm

= 55.5

TOTAL

50
Solución:
1. Calcular el factor N/2 = 50/2 = 25 datos. 2. Observar en la tabla la columna de
Frecuencia absoluta acumulada e identificar la clase en que se encuentran 25. 
Faa3 = Faa4 = 25 datos

Fi3= 3 y Fi4 = 0 I
2 3 4
FRONTERAS
FRECUENCIA ABSOLUTA FRECUENCIA ABSOLUTA ACUMULADA

 

Por lo tanto esta en el intervalo de clase I3, con Fi3=3. Li


37.5 46.5 55.5

1. 2.

Ls

<46.5 14 <55.5 3 <64.5 0

fi

Faa 22 25 25
N − Faa M = + ( 2 d Li Ic )* fm
Ø Limite real inferior de la clase mediana o frontera de clase es: Li = 47 - 0.5 =
46.5 Ø Factor es: N/2 = número de datos/2 = N/2 = 50/2 = 25 Ø Frecuencia acumulada
de la clase anterior es: Faa = 22 Ø Frecuencia de la clase de la mediana o
frecuencia absoluta es: fm = fi = 3 Ø Ancho o amplitud de clase es: Ic = 9 Ø
Sustituyendo valores en la ecuacion se tiene que la mediana es:  Md = 46.5 +
( 50/2 – 22 ) * 9 = 55.5  3 Ø
Cálculo de la moda
¡

Para datos agrupados:

∆1 Mo = Li + Ic ∆1 + ∆ 2
Donde: Li: límite inferior de la clase modal. ∆ 1: diferencia entre fi de la clase
modal y la anterior. ∆ 2: diferencia entre fi de la clase modal y la posterior. Ic:
amplitud de la clase modal (clase de mayor frecuencia).
Ejemplo: datos agrupados
¡

Calcular la moda de las distribuciones anteriores.


FRONTERAS
FRECUENCIA ABSOLUTA

I
1 2 3 4 5 6 7

Li
28.5 37.5 46.5 55.5 64.5 73.5 82.5

Ls

<37.5 8 <55.5 3 <64.5 0 <73.5 3

Fi

∆1 Mo = Li + Ic ∆1 + ∆ 2
Mo2 = 40.7≈41 Mo6 = 79.3 ≈79

<46.5 14

<82.5 14 <91.5 8

TOTAL

50
∆1 Mo = Li + Ic ∆1 + ∆ 2
Ø El intervalo de clase donde mas se repiten los datos es en: Fi2 = Fi6=14 Ø Limite
real inferior de la clase modal es:  Li2 = 38 - 0.5=37.5 Li6 = 74 – 0.5 =73.5 Ø
Diferencia entre la frecuencia de la clase modal y la clase pre modal es:  Δ21 =14
- 8 = 6 Δ61 =14 - 3 = 11 Ø Diferencia entre la frecuencia de la clase modal y la
clase post modal es:  Δ22 =14 - 3 = 11 Δ62 =14 - 8 = 6 Ø Ancho o amplitud de clase
es: Ic = 9 Ø Mo2= 37.5 + ( 6 )* 9 Mo6= 73.5 + (
 

11

)*9

6 + 11 Mo2= 40.7≈41

11 + 6 Mo6= 79.3≈79
REPRESENTACIÓN GRÁFICA DE LOS DATOS
¡

Los gráficos permiten visualizar en forma global y rápida el comportamiento de los


datos. Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres
gráficos:
Histogramas. l Polígono de frecuencias. l Ojiva o Polígono de frecuencias
acumuladas.
l

¡
REPRESENTACIÓN DE DATOS CUANTITATIVOS

Histograma

OJIVA
POLIGONO DE FRECUENCIAS

Histograma y Polígono de Frecuencias


REPRESENTACIÓN DE DATOS CUALITATIVOS
¡

Para datos cualitativos se usan:


l Curvas l Barras l Sectores
BARRAS
PASTEL O CIRCULAR

CURVAS
Continuación….  Construir para el ejercicio anterior, el grafico que corresponda,
considerando el tipo de datos.

Solución: El grafico que representa esos datos es el HISTOGRAMA


I 1 2 3 4 5 6 7 FRONTERAS Li Ls fi 8 14 3 0 3 14 8

29 38 47 56 65 74 83

37 46 55 64 73 82 91

29

38

47

56

65

74

83

92
RELACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA
Permiten estudiar la forma de la curva, dependiendo de cómo se agrupan los datos.

Cuando los datos son sesgados es mejor emplear la Md


ASIMETRÍA O SESGO
¡

Una distribución es simétrica si la mitad izquierda de su distribución es la imagen


especular de su mitad derecha. oEn las distribuciones simétricas media y mediana
coinciden. Si sólo hay una moda también coincide. oLa asimetría es positiva o
negativa en función de a qué lado se encuentra la cola de la distribución.
78
¡

La media tiende a desplazarse hacia las valores extremos (colas). Las discrepancias
entre las medidas de centralización son indicación de asimetría.

¡
¡

79
Relación entre Tendencia Central y la Simetría de la distribución
Simetría Relación Simétrica o insesgada Moda = Mediana = Media sesgo positivo o a
la derecha sesgo negativo o a la izquierda Moda < Mediana < Media Moda > Mediana >
Media
La forma depende de la distribución de las frecuencias absolutas de los datos.
Algunas de las formas más comunes que puede adoptar son las siguientes:
SIMETRICA ó Campana de Gauss-Normal Asimétrica

Forma bimodal
Con anomalías

Forma en U

Sesgada a la derecha

Sesgada a la izquierda
¡

La localización o tendencia central de un conjunto de datos no necesariamente


proporciona información suficiente para describirlos adecuadamente. Debido a que no
todos los valores son semejantes, la variación entre ellos se considera importante.
Se puede decir que un conjunto de datos tiene una dispersión reducida si los mismos
se aglomeran estrechamente en torno a alguna medida de localización de interés y se
dice que tiene una dispersión grande si se esparcen ampliamente alrededor de alguna
medida de localización de interés.

¡
Md = 55.5

29

38

47

56

65

74

83

92

Mo = 41

Mo = 79

X = 60

CONCLUSIÓN:
Comparación de los resultados obtenidos en las medidas de tendencia central
MEDIDAS DE TENDENCIA CENTRAL Media Aritmética(¯) Mediana (Md) Moda (Mo)
X

DATOS NO DATOS AGRUPADOS AGRUPADOS 59.8 58.5 42 y 78 60.0 55.5 41 y 79

Conclusión:
EJERCICIO:  A continuación se presentan las calificaciones de 60 estudiantes en el
año 2009:

23 80 52 41 60 34

60 77 10 71 78 67

79 81 64 83 89 17

32 95 75 54 76 82

57 41 78 64 84 69

74 65 25 72 48 74

52 92 80 88 84 63

70 85 98 62 90 80

82 55 81 74 15 85

36 76 67 43 79 61

a)Determine el valor mínimo y máximo de los datos. b)Encuentre el rango de los


datos. c)Construir el grafico que corresponda para la serie de datos. d)Calcule la
media, mediana y moda de la distribución. e)Compare los resultados obtenidos. ¿Qué
puede concluir de estos datos?
Comparación de los resultados obtenidos en las medidas de tendencia central
MEDIDAS DE TENDENCIA CENTRAL Media Aritmética(¯) Mediana (Md) Moda (Mo)
X

DATOS NO DATOS AGRUPADOS AGRUPADOS

Conclusión:

También podría gustarte