Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PROBABILIDA Y ESTADISTICA
UNIDAD I
DEFINICION DE ESTADISTICA
La función principal de la estadística es elaborar principios y métodos que nos ayuden a tomar decisiones
frente a la incertidumbre. En realidad muchos autores definen la estadística actualmente como un método de
toma de decisiones frente a la incertidumbre. La estadística se a convertido en un invalioso instrumento para
tomar decisiones cuando no se esta seguro de sobre el estado de la naturaleza. El punto central del análisis
estadístico moderno es la toma de decisiones en condiciones de incertidumbre para resolver problemas.
A diario nos enfrentamos a fenómenos económicos, físicos, sociales, industriales, psíquicos, etc. Que nos
obligan a generalizar o actuar frente a la incertidumbre tal como son las cosas.
,
La estadística desde el punto de vista tradicional se define como los métodos científicos por medio de los
cuales se puede recolectar, organizar, tabular, procesar, analizar procesar e interpretar los datos relativos a un
conjunto de elementos (como ser personas, animales, cosas, materiales equipos , plantas, etc.) que poseen una
característica determinada. Toda persona recibe información a través de:
Revistas
Periódicos A menudo es necesario obtener conclusiones sobre la
Televisión información contenida en los datos.
Otros
Los ingenieros y científicos obtienen y analizan datos de manera rutinaria, por ello el conocimiento de la
estadística es importante, porque es una herramienta poderosa para científicos e ingenieros para el diseño de
nuevos productos y sistemas, perfeccionar los ya existentes a diseñar y mejorar los procesos de producción.
El papel de la estadística es importante en las diferentes actividades del ser humano, así se puede
encontrar una variedad de aplicaciones:
Aumento de la calidad; La calidad ayuda a eliminar el desperdicio, eliminar la cantidad de desecho, mejora la
satisfacción del cliente, permite que la empresa se convierta en un productor de alta calidad y bajo costo en
el mercado.
La estadística es un elemento decisivo en el incremento de la calidad ya que las técnicas estadísticas
pueden emplearse para describir y comprender la variabilidad.
La variabilidad puede presentarse cuando:
Cambios en las condiciones en la cual se realiza el trabajo.
Cambio en las propiedades de los materiales.
Forma en que trabajan los obreros.
Variables de proceso (Temperatura, Presión, Tiempo) o (Humedad Relativa).
-1-
ESTADÍSTICA PEGGI MONTOYA 2
CAMPOS DE LA ESTADISTICA
Población
( General )
Muestra Muestra
(particular) (General)
Muestra
(particular)
(particular)
2. Inferencia Estadística: La estadística inferencial es aquella parte de la estadística que nos proporciona la
teoría, métodos y conjunto de técnicas necesaria para poder obtener conclusiones que sobrepasan los
límites del conocimiento que proporcionan los datos; en otra palabras, nos permite inferir o estimar las leyes
de la población a partir de los resultados o conclusiones de una muestra. Dicho de otra forma nos permite
información sobre el colectivo, total o global mediante un metódico procedimiento de datos de una nuestra
tomada de él; es decir, esta constituido por métodos que permiten generalizar información obtenida de una
muestra.
Muestra Población
( particular ) (general)
3. Toma de Decisiones: Los métodos y técnicas de la inferencia estadística también pueden ser utilizados en
una rama de esta disciplina denominada teoría de decisiones. El conocimiento de la teoría es de gran utilidad
para los gerentes porque les permite tomar decisiones en condiciones de incertidumbre.
POBLACION Y MUESTRA
Población:
Se entiende por población o universo de estudio la totalidad de individuos o elementos en las cuales
puede presentarse cualquier característica susceptible de ser enumerada. Generalmente este conjunto viene
definido por compresión, es decir citando las propiedades que caracterizan a sus elementos. Los datos
individuales de la población se llaman unidades elementales u observaciones.
-2-
ESTADÍSTICA PEGGI MONTOYA 3
Infinita: Aquella que tiene un número tan grande de elementos que no es posible al investigador
someter a medida cada uno los elementos.
Ejemplos:
Los libros de la biblioteca municipal.
Los alumnos del colegio Nacional Florida.
La arena de la orilla del río Piraí
Muestra:
Es un subconjunto de la población o una fracción o segmento de la población con el propósito de obtener
información acerca de ella.
Se suelen tomar muestras cuando resulta difícil o costosa, el levantamiento de información de todos los
elementos de la población estadística o cuando esta actividad demandaría demasiado tiempo.
El número de elementos de una muestra se llama tamaño de muestra (n). La muestra se extrae de la
población.
La muestra debe ser representativa y para ello debe contener las características relevantes de la
población en las mismas proporciones que están incluidas en la población.
Censo: Es un procedimiento que permite la recolección de la información que abarca a la totalidad de las
unidades poblacionales
Muestreo: Es un procedimiento para recopilar datos que abarca sólo a una parte de la población llamada
muestra.
Dato Estadístico: Es un número o medida que se ha recopilado como resultado de observaciones que pueden
ser comparados, analizados e interpretados.
Variables Estadísticas:
Una variable estadística es una característica de una población que interesa al investigador y que puede
tomar diferentes valores. Las variables se pueden clasificar en:
1. Variable Cualitativa
Son variables cuyos valores consisten en categorías de clasificación, o sea se refiere a la cualidad que
representa la población, no lleva clasificación numérica.
1.1. Variable Cualitativa Nominal: Son aquellas que surgen cuando se definen categorías y se
cuenta el número de observaciones pertenecientes a cada categoría. No lleva ordenación.
Ejemplo:
Orientación en el tiempo (presente, pasado y futuro)
Color de Ojos
Partidos Políticos
Sexo
1.2. Variable Cualitativa Ordinal: Son aquellas variables que se buscan ordenar en términos que el
grado que posee una determinada característica.
Ejemplo:
Nivel de estudios (1er Grado, 2do Grado…)
Estatura (bajo, medio, alto)
2. Variable Cuantitativa
Son aquellas que se obtienen como resultado de mediciones o conteos. Estas variables se clasifican
en:
2.1. Discreta: Son aquellas que toman valores numéricos aislados y no pueden tomar ningún valor
entre dos consecutivos.
-3-
ESTADÍSTICA PEGGI MONTOYA 4
Ejemplo:
Número de monedas.
Número de muertes por día terminado.
Número de hermanos.
Número de accidentes automovilísticos en un mes determinado.
2.2. Continua: Son aquellas que pueden tomar infinitos valores entre dos números, por muy
próximos que estos sean.
Ejemplo:
La estatura de los estudiantes de la UAGRM.
La temperatura.
Densidad.
Humedad.
Numero de Reynolds.
Promedio de muertes por año
Parámetro: Es una medida para describir las características de la población y para determinar su valor es
necesario utilizar la información de la población completa y por lo tanto, las decisiones se tomarán con
certidumbre total; ejemplo:
Media poblacional.
Desviación Poblacional.
Proporción Poblacional.
Estadígrafo: Es una medida usada para describir algunas características de la muestra y la toma de decisiones
contienen un grado de incertidumbre; ejemplo:
Media muestral.
Proporción Muestral.
Varianza Muestral.
1. Formulación o definición del problema: El análisis estadístico al igual que un proceso industrial comienza
con la materia prima, osea con los datos numéricos, y a través de este proceso fluyen los productos
terminados, que consisten en cualquier información útil o conclusiones valederas que se encuentran
escondidas en los datos no elaborados.
Al industrializar un bien el productor debe primero decidir lo que se va a producir, y luego fijar las
especificaciones precisas de la calidad del bien, de lo contrario no puede saber ¿qué clase de material voy a
utilizar?, Ni ¿cuánto va a consumir?
En estadística lo primero que se debe hacer es definir ¿qué se va a investigar?, formular la pregunta tan
precisa como sea posible. Solo así el investigador puede decidir cuales son los datos relevantes del
problema. Si no se procede así, los datos recolectados pueden ser totalmente irrelevantes o pueden tender a
oscurecer en lugar de aclarar el problema.
Dependen de la
formulación del
problema
-4-
ESTADÍSTICA PEGGI MONTOYA 5
2. Diseño del Experimento. Una vez que el problema ha sido claramente definido o formulado el investigador
debe decidir entre estudiar la población en su totalidad u observar sólo una parte de ella. El primer
procedimiento se llama enumeración completa o censo, el segundo es llamado muestreo. En la práctica
realizar censo es demasiado costoso, largo y a veces físicamente imposible, por ello debemos recurrir al
muestreo como único método práctico de realizar el estudio.
Muestreo Probabilístico:
Aleatorio simple
Porcentual
Estratificado
Sistemático
Conglomerados
Por etapas
No Probabilístico
Por cuotas
Basado en criterios de expertos
3. Recolección de Datos. Una vez definido el diseño muestral o diseño del experimento se procede a la
recolección de datos. Esta etapa es la que consume mayor tiempo y es un componente costoso del proceso
estadístico total.
Se recopila información por observación, por encuestas o simplemente es obtenida de publicaciones y/o
fuentes confiables.
Para la recolección de la información se utiliza por lo general cuestionarios cerrados o preguntas
claras o precisas.
4. Procesamiento, Clasificación y Organización de Datos. Una vez reunidos los datos, estos deben ser
ordenados en forma legible. Pueden ser clasificados según algún criterio y presentados en tablas o cuadros o
bien en gráficas o diagramas. Seguido de esto se calculan medidas descriptivas como la varianza, la media,
etc. Una medida derivada de los datos muestrales se llama estadigrafo, mientras que una medida derivada a
partir de la población se llama parámetro.
5. Análisis y Generalización de los Resultados. Luego se concluye con el análisis y generalización de los
resultados, que consiste en realizar un análisis de los datos muestrales y establecer conclusiones
generalizadas para toda la población. Cuando la muestra incluye toda la población, es decir, cuando se ha
hecho un censo, la última etapa del análisis es la etapa descriptiva, con esto las características de la
población habrán sido descritas y se podrá tomar decisiones de uno u otro tipo acerca de ella.
Pero si se realizó un muestreo, el estudio no se detendrá con las medidas descriptivas, pues se necesita
de metodologías y del razonamiento para llegar a conclusiones; a esto se llama Estadística Inductiva, esta es
parte más valiosa de la estadística.
TRATAMIENTO DE DATOS
Una vez obtenidos los datos de encuestas experimentos o cualquier serie de medidas, los datos estadísticos
son con frecuencia tan numerosos que se hace necesario ordenarlos y organizarlos de tal manera que sea más
fácil manejarlos y además con una simple mirada podamos identificar algunas características como ser:
Su valor mínimo
Su valor máximo
El valor que más se repite
Podemos definir fácilmente los datos en secciones
Podemos observar la distancia entre los valores consecutivos
Podemos apreciar ¿qué otros valores se repiten más?
-5-
ESTADÍSTICA PEGGI MONTOYA 6
Cuando se estudia la característica X de una población, el mayor interés del investigador es conocer la
distribución de esta característica a través de los posibles valores del mismo:
Una distribución de frecuencia es un arreglo de datos observados x1, x2, x3,….xn de la variable X,
donde Y1 , Y2 , Y3 , Y4 ,…… Ym es el conjunto de valores diferentes que toma la variable X , y ni representa sus
respectivas frecuencias, donde:
Frecuencia Absoluta (ni): La frecuencia absoluta de la variable Yi, es el número de veces que aparece repetido
dicho valor en el conjunto de las observaciones realizadas.
Frecuencia Acumulada Menor que (Ni): La frecuencia acumulada menor que correspondiente al valor Yi, viene
a ser el número de las observaciones cuyos valores son menores o iguales a Yi.
Frecuencia Acumulada Mayor que (Ni * ): La frecuencia acumulada mayor que correspondiente al valor Yi,
viene a ser el número de las observaciones cuyos valores son mayores o iguales a Yi.
Frecuencia Relativa (hi): La frecuencia relativa correspondiente al valor Yi, viene a ser el cociente entre la
frecuencia absoluta y el número total de observaciones.
hi= ni/n
Frecuencia Relativa Acumulada menor que (Hi): La frecuencia relativa acumulada menor que de Yi , viene a
ser el cociente entre su frecuencia absoluta acumulada menor que y el número total de observaciones.
N i n1 n2 n3 ........ ni
( j 1 n j ) / n
i
Hi
n n
n1 n2 n3 n
.... i h1 h2 h3 ... hi j 1 h j
i
n n n n
Frecuencia Relativa mayor que (Hi *).- La frecuencia relativa acumulada mayor que del valor de Yi , viene a
ser a frecuencia total de las observaciones mayores o iguales a yi
Algunas propiedades:
m m
hj 1
j 1
n
j i
j Ni *
-6-
ESTADÍSTICA PEGGI MONTOYA 7
n
j 1
j n n = N1 *
m
Hi* hj
j i
i
Ni n
j 1
i
ni N1 N 2 N 3 N 4 .... N m n
N i N i 1 ni
n N1* N 2 * N 3 * N 4 * .... N m * nm
N i * ni N *i 1
H i H i 1 hi H i * hi H *i 1
Ejemplo:
Variable * *
Frecuencia ni Ni hi Hi
X Ni Hi
0 3 3 3/25 3/25 25 1
1 4 7 4/25 7/25 22 22/25
2 6 13 6/25 13/25 18 18/25
3 6 19 6/25 19/25 12 12/25
4 6 25 6/25 25/25 6 6/25
A continuación anotamos algunas razones por las cuales es necesario agrupar los datos en clases:
1. Es antieconómico trabajar con muchos datos.
2. Poco práctico
3. Algunos valores tienen a veces frecuencias tan bajas que no se justifica mantenerlos como entidades
individuales o aisladas.
Rango o recorrido de la variable Es la longitud del recorrido del conjunto de datos y se simboliza
por la letra R.
-7-
ESTADÍSTICA PEGGI MONTOYA 8
Clase Se llama clase a cada uno de los grupos en que se dividen los datos, o a cada uno de los
grupos que describe una característica. El número de clases se simboliza por la letra m. El número de
clases no debe ser grande porque no se simplificaría el trabajo, pero tampoco debe ser pequeño
porque perderíamos información. Algunos autores aconsejan que el número de clases debe estar
comprendido entre 5 y 20 ; otros entre 8 y 15. Para determinar el número de clases se dispone dos
puntos de vista que plantean que :
* m ≥ n siempre que n sea mayor que 25
* m = 1+3.22 log(n) ; conocido como la regla de Sturges
Intervalos de Clase: Esta formado por los valores contenidos entre el limite superior e inferior de cada clase.
Amplitud de Clase: Es la diferencia que hay entre el limite superior e inferior de cada clase. Los intervalos de
clase pueden ser de:
Amplitud constante (se usa más)
Amplitud variable
La amplitud de clase se simboliza con la letra C= R/m
Se sugiere que los intervalos de clase contengan solamente datos más o menos homogéneos. Estos intervalos
pueden ser:
Intervalos Semiabiertos [ > , < ]
TABLA - 1
Valores que caen dentro del
Intervalos Frecuencia
intervalo
[ 21 , 24 > 21, 23, 23, 22, 21 5
[ 24 , 27 > 24, 25, 25 , 26, 24, 25 6
[ 27 , 30 > 27, 27, 27, 28, 28, 29, 30 7
TABLA - 2
Peso en Kg. Numero de personas
50 -- 54 4
55 -- 59 8
60 -- 64 12
65 -- 69 4
Los limites reales de los intervalos de clase se obtendrá restando y sumando 0.5 (mitad de la unidad de medida)
al limite inferior y superior, respectivamente.
Ejemplo:
-8-
ESTADÍSTICA PEGGI MONTOYA 9
Marca de Clase
Es el valor promedio de los límites reales (o aparentes ) de cada intervalo de clase punto medio del intervalo de
clase y se obtiene sumando el límite inferior más el límite superior de una clase todo dividido entre 2.
1. Determinar el rango
Esto depende de la experiencia del investigador, de la naturaleza del tema, etc. Para determinar el número
de clase se sugiere el uso de las siguientes reglas:
Regla de Sturges m 1 3.22 * log n
Regla m n ; Cuando n>25
La práctica aconseja que el número de clases no sea pequeña, debido a que la condensación de la
información se vería afectada; pero tampoco, debe ser grande porque no se simplificaría el trabajo
El número de clases siempre debe ser un valor entero
4. Este último cálculo se adiciona el valor Xmin y así obtenemos el límite superior de primera clase, el límite
inferior de la primera clase es igual a Xmin.
El límite inferior de la 2da. Clase será igual al limite superior de la anterior y el límite superior de la segunda
clase se obtendrá sumándole a este último el valor de la amplitud de la clase y asi sucesivamente.
5. Luego se determina la marca de clase, la frecuencia absoluta, la frecuencia relativa, las frecuencias
acumuladas mayores y menores que, las frecuencias relativas acumuladas mayores y menores que.
Ejemplo:
Los siguientes datos son mediciones de intensidad solar en (watt/m 2) realizadas en distintos días en una
localidad del sur de Santa Cruz.
562 869 708 775 775 704 809 856 655 806 878 870 909 918 558 768
918 940 946 898 661 820 935 952 957 693 835 905 939 955 960 498
653 730 753
-9-
ESTADÍSTICA PEGGI MONTOYA 10
Intervalos de Clase *
ni Ni hi Hi yi
Reales Ni
498 591 3 3 3/35 3/35 35 544
591 684 3 6 3/35 6/35 32 637
684 777 8 14 8/35 14/35 29 730
777 870 6 20 6/35 20/35 21 823
870 963 15 35 15/35 35/35 6 916
NOTA:
En toda tabla o cuadro estadístico debe considerarse:
1. Titulo
2. Indicaciones complementarias
3. El cuadro propiamente dicho.
REPRESENTACIONES GRÁFICAS
Las representaciones gráficas sean de distribuciones de frecuencias absolutas o relativas son útiles porque
ponen de relieve, aclaran las tendencias de los datos que no se captan fácilmente.
Los gráficos:
1. Histogramas
2. Diagrama de barras
3. Polígono de frecuencias
4. Polígono de frecuencias acumuladas “Ojivas”
5. Pictografos
6. Gráfico de sectores o de Pastel
1. Diagrama de frecuencias.
Se usa para representar gráficamente diferentes tipos de distribución de datos discretos. Con este tipo
de representación grafica se puede representar tanto datos absolutos como relativos, así mismo frecuencias
acumuladas. Así:
Diagrama de frecuencias absolutas
Diagrama de frecuencias absolutas acumulada menor que
Diagrama de frecuencias absolutas acumulada mayor que
Diagrama de frecuencias absolutas relativas
- 10 -
ESTADÍSTICA PEGGI MONTOYA 11
Número de hijos
yi ni Ni hi
0 3 3 3/20
1 4 7 4/20
2 7 14 7/20
3 5 19 5/20
4 1 20 1/20
2. Diagrama de Barras.
Consiste en representar el fenómeno que se estudia a través de barras verticales u horizontales. Este
tipo de grafico se usa para representar variables cualitativas y discretas. Así podemos tener:
Diagrama de barras simples
- 11 -
ESTADÍSTICA PEGGI MONTOYA 12
30
25
20
15
10
5
0
Atención Atención Vacunación Partos Hospitalización Quemados
Médica Odontológica
- 12 -
ESTADÍSTICA PEGGI MONTOYA 13
35
30
25 Año1
20 Año2
15
10
5
0
Atención Médica Atención Vacunación Partos Hospitalización Quemados
Odontológica
1400
1200
Cantidad de
Estudiantes
1000 Sistemas
Electrónica
800
Civil
600 Industrial
400
200
0
1 2 3 4 5
Años
- 13 -
ESTADÍSTICA PEGGI MONTOYA 14
Otros
Internet 7%
6%
Periódicos Periódicos
34% Revistas
Correo
18% Televisión
Radio
Correo
Radio Internet
8% Otros
Revistas
Televisión 7%
20%
4. Histograma de frecuencias.
Se usa para representar gráficamente las frecuencias absolutas y frecuencias relativas de datos
cuantitativos continuos agrupados en intervalos de clase. El histograma esta constituido por una serie de
rectángulos todos de anchura proporcional a la amplitud de clase y de altura proporcional al número de
elementos que cae dentro de cada clase. Así tenemos:
Histograma de frecuencias absolutas
Histograma de frecuencias absolutas relativas
Histograma de frecuencias absolutas acumulada mayor que
Histograma de frecuencias absolutas acumulada menor que
Histograma de frecuencias absolutas relativas acumulada mayor que
Histograma de frecuencias absolutas relativas acumulada menor que
Histogramas
25
frecuencia
20
absoluta
15
10
0
100 - 150 150 - 200 200 - 250 250 - 300 300 - 350 350 - 400 400 - 450
5. Polígono de frecuencias
- 14 -
ESTADÍSTICA PEGGI MONTOYA 15
Los polígonos de frecuencia pueden ser absolutas o relativas, mayor que o menor que. Estos se
obtienen uniendo los puntos medios de las bases superiores de los rectángulos.
Los polígonos de frecuencias acumuladas se denominan también Ojivas
Gráfico de Polígonos
25
20
Frecuencias
15
10
0
125 175 225 275 325 375 425
Promedio
7.- Pictografos.-
Es la representación de datos mediante símbolos que por su forma sugieren la naturaleza del dato. Los expertos
ponen en juego gran creatividad e ingenio en la presentación de datos buscando siempre atraer la atención del
auditorio con una vistosa y llamativa presentación de la información
Medidas Descriptivas
Medidas De Tendencia Central
Igual que los promedios las medidas de tendencia central nos indican el punto medio o valor típico de datos que
cabe esperar. Entre las medidas de tendencia central más usadas tenemos: la media o promedio, la moda, la
mediana. Sin embargo existen otras medidas de relativa importancia que estiman el valor medio de las
observaciones así: media ponderada, media armónica y media geométrica.
1. Media Aritmética. Es una medida de valor central que dá información más precisa porque para su cálculo
usa todos los datos. Alrededor de este valor se distribuyen las observaciones individuales. Su valor numérico
se obtiene sumando el valor de todos los datos dividido entre el número de datos obtenidos en el estudio.
= media de la población
x = media de la muestra
nX
n
1 i i
X
n
X 1 i
Para datos no tabulados
n
- 15 -
ESTADÍSTICA PEGGI MONTOYA 16
nY
n
X 1 i i
Para datos tabulados
n
2. Media Ponderada. Se aplica para calcular promedio de cantidades donde cada valor tiene asociado
un numero o peso que la pondera.
Ejemplo
Un comerciante compra tres partidas de maíz a Bs.18.30, Bs.17.40 y Bs.18.60 el kg. Para calcular el precio
promedio es necesario conocer el peso de cada partida, si estos pesos son 360, 1800 y 240 kg
respectivamente. Calcular el precio promedio por kilogramo.
m x i i
X i 1
n
mi = peso o ponderación de la varible
m
i 1
i
Xi = valor de la variable
m i x 1 m 2 x 2 ..... mx
X
m1 m 2 ..... m n
Desventajas
1. Aunque es confiable porque refleja todos los valores de un conjunto de datos, pueden ser afectados por
valores extremos que no sean representativos del resto.
Propiedades de la Media
x
n
1 x 0
i 1
- 16 -
ESTADÍSTICA PEGGI MONTOYA 17
f. La suma de los cuadrados de las desviaciones de cada una de las observaciones x1 , x2 ,..., xn con
respecto a su media es mínima.
x
n n 2
x xi a
2
1
i 1 i 1
m = # de clases
g. Si una muestra de tamaño n se particiona en k submuestras y x1 , x 2 ,..., xk son las medias de las k
submuestras de tamaños respectivamente, entonces:
19 24 27 37 39 43 51
M e X 7 1 X 4
2
2
Ejemplo:
19 24 27 37 39 43 51
37 39
Me 38
2
2.2 Para Datos Tabulados
- 17 -
ESTADÍSTICA PEGGI MONTOYA 18
Yi ni Ni
Y1 n1 N1
Y2 n2 N2
. . .
. . .
Y j 1 n j 1 N j 1
Yj nj Nj
. . .
. . .
Ym nm Nm
Ejemplo:
Yi ni Ni
20 12 12
30 10 22
50 20 42
60 18 60
70 15 75 n/2=46
80 10 85
90 7 92
92
92
46 La menor frecuencia acumulada que supere a 46 es N 4 60
2
M e Yi 60
- 18 -
ESTADÍSTICA PEGGI MONTOYA 19
Yi ni Ni
30 4 4
31 2 6
32 2 8
33 1 9
34 1 10
35 3 13 Nj-1
36 2 15
37 2 17 Nj
38 6 23
39 4 27
40 3 30
30
n 30
15 La menor frecuencia acumulada que supere a 15 es N 8 17
2 2
36 37
M e Yi 36.5
2
b. Para Variable Continua
n
- Determinar la menor de las frecuencias absolutas acumuladas Nj tal que: Nj puede ser
2
n
N j. El intervalo de clase correspondiente a Nj es la clase que contiene a la mediana.
2
Una vez determinada la clase que contiene a la mediana se calcula la mediana con la siguiente fórmula:
n n
2 N j1 2 N j1
M e Y' j1 C j Y' j1 C J
N j N j1 nj
Donde:
C j amplitud de la clase mediana.
n número de observaciones.
N j Frecuencia absoluta acumulada de la clase mediana.
N j 1 Frecuencia absoluta acumulada que precede a la clase
mediana.
n j número de observaciones que contiene la clase mediana.
“OJO” si la amplitud es constante Cj C
1 H j 1
M e Y ' j 1 C j 2
H j H j 1
Donde H j frecuencia acumulada relativa de la clase mediana.
Ejemplo:
- 19 -
ESTADÍSTICA PEGGI MONTOYA 20
Es decir que el peso mediano de los lingotes de acero (50) producidos por SIDERMUTUN es de 93.95
kg/lingote de acero, lo que significa que no más del 50% de ellos tienen un peso mayor que 94.95
kg/lingote.
2) Las notas de 50 alumnos se clasificaron en una tabla de frecuencias con 4 intervalos de clase de
igual magnitud. Se pide calcular la mediana sabiendo además que:
Propiedades de la Mediana
Ventajas de la Mediana
Desventajas
1. Se trata de un proceso lento para cualquier conjunto de datos que tenga un basto número de
elementos.
4. Moda. La moda es un concepto muy simple, con el mismo sentido que se da en el lenguaje común
La moda de una muestra, es aquel valor variable que se presenta con mayor frecuencia; es decir es el valor que
más se repite y se simboliza así Mo.
Para un conjunto de observaciones la moda puede no existir si es que no se repiten valores medidos entonces la
distribución es uniforme.
Si el conjunto de datos tiene una sola moda se llama unimodal, si tiene dos modas se llama bimodal y si tuviera
más de dos se llamará multimodal.
Cuando en una distribución de frecuencias hay más de una moda, este estadígrafo como medida de tendencia
central no tiene sentido.
Ejemplo
Cuando los datos están tabulados: La clase que contiene la mayor frecuencia será la que contiene a la moda, y
se llama clase modal.
Ejemplo:
En la siguiente tabla se muestra la distribución de frcuencias del número de hijos de 20 familias
yi ni Ni hi
0 3 3 3/20
1 4 7 4/20
2 7 14 7/20
3 5 19 5/20
4 1 20 1/20
La mayor frecuencia es 7
Lo que significa que la variable que toma el valor es la moda por ser el valor que más se repite.
- 20 -
ESTADÍSTICA PEGGI MONTOYA 21
I. Cuando es constante.- Primero se debe determinar la clase modal que es la clase que tienen mayor
frecuencia , y luego la moda se la calcula a través de la siguiente fórmula:
d1
Mo Y ` j1 Cj ´
d1 d 2
donde:
Y j1 Es el límite inferior de la clase que contiene a la moda
Cj= Es la amplitud de la clase modal
d1= Es la diferencia entre la frecuencia de la clase modal y la post modal
d2= Es la diferencia entre la frecuencia de la clase modal y la post modal
Ejemplo
Los siguientes datos son mediciones de intensidad solar en (watt/m 2) realizadas en distintos días en una
localidad del sur de Santa Cruz, los mismos que están organizados en una tabla de distribución de frecuencias
con 5 intervalos de clase .
Intervalos de Clase *
ni Ni hi Hi yi
Reales Ni
498 591 3 3 3/35 3/35 35 544
591 684 3 6 3/35 6/35 32 637
684 777 8 14 8/35 14/35 29 730
777 870 6 20 6/35 20/35 21 823
870 963 15 35 15/35 35/35 6 916
II. Cuando la amplitud del intervalo es variable.- Antes de calcular la moda se debe estandarizar la
distribución de frecuencias.
Ventajas de la Moda
1. Puede usarse como una medida central para datos cualitativos y cuantitativos.
2. A semejanza de la mediana a la moda no le afectan los valores extremos.
3. Podemos emplearla cuando una o más clases sean abiertas.
Desventajas de la Moda
MODA
MEDIA
MEDIANA En una distribución simétrica la
media, mediana y moda coinciden
con el punto más alto de la gráfica.
- 21 -
ESTADÍSTICA PEGGI MONTOYA 22
MODA
MEDIANA La moda esta en el punto más alto de
la gráfica, pero la mediana esta a la
MEDIA
derecha de este punto y la media a la
derecha de la mediana
MODA
MEDIANA La moda sigue situado en el punto
MEDIA
más alto de la gráfica, hacia la
izquierda esta la mediana y la
izquierda de la mediana esta la
media
5. MEDIA GEOMETRICA. Se usa para medir la tasa promedio de cambio o crecimiento de alguna
cantidad y se calcula tomando la enésima raíz del producto de n valores que representan el cambio.
La media geométrica se aplica cuando estamos usando cantidades que cambian a lo largo de un periodo y
entonces necesitamos saber una tasa promedio de cambio.
n
MG anti log(1 / n ) log X i
i 1
- 22 -
ESTADÍSTICA PEGGI MONTOYA 23
MG n Y1 Y2 .. Yn
m
MG n Y
i 1
i
ni
1
Log MG Log Y1n1 * Y2n2 * Y3n3 * ... * Ymnm n
n log Y i i
MG antiLog i 1
n
DESVENTAJAS DE LA MEDIA GEOMETRICA
Se aplica en especial a las series cronológicas que siguen una tendencia exponencial, se hace indispensable su
uso si se desea calcular valores intermedios
Ejemplo 1:
X1 = 3 X2 = 4 X3 = 5 X4 = 8 X5 = 3 X6 = 2
MG 3 * 4 * 5 * 8 * 3 * 2 3.77
6
Ejemplo 2:
Marca de Clase 92 93 94 95 96
Frecuencia 4 11 21 10 4
Supóngase que durante 5 años de una economía altamente inflacionaria, los bancos pagan tasas anuales de
interés de 50, 100, 150, 250, 300. ¿Hallar la tasa de interés promedio anual de un deposito de 100?
- 23 -
ESTADÍSTICA PEGGI MONTOYA 24
50
Factor de crecimiento es 1 1.5
100
Si sacamos una media aritmética tenemos:
13.5
1.5 2 2.5 3.5 1 2.7 Media Aritmética del factor de crecimiento
5
1 2.7
100
2.7 1 * 100 170%anual
Entonces el deposito crecerá como se muestra:
Ejemplo 4:
En una empresa, la producción ha experimentado un crecimiento del 25% del primer al segundo año del 30% del
segundo al tercero y del 40% del tercero al cuarto.
a) Determine la tasa de crecimiento del primero al cuarto.
b) Estime la producción del 5 año.
3
Media Geométrica = 1.25 x1.3 x1.4
Ejemplo 4:
- 24 -
ESTADÍSTICA PEGGI MONTOYA 25
En una empresa, la produccion ha experimentado un crecimiento del 25% del primer al segundo año del 60% del
segundo al tercero y del 100% del tercero al cuarto.
c) Determine la tasa de crecimiento del primero al cuarto.
d) Estime la produccion del 5 año.
3
Media Geométrica = 1.25 x1.6 x 2 =1.5874
6.- CUANTILES
Como una consecuencia de la mediana es fácil aplicar este concepto a otros estadígrafos que dividen a los datos
en otras proporciones. Así como: los cuartiles, los deciles y los percentiles.
6.1 Cuartiles
Los cuartiles son valores que dividen a un conjunto de datos ordenados en forma ascendente o descendente en
cuatro partes iguales y se denota por: Qi; i=1, 2, 3.
25% Q1 Q2 Q3
50%
75%
Q1 = es el valor supera a no más de un cuarto de las observaciones y es superado por no más tres cuartos de
ella.
Para Datos No Tabulados
Si (n + 1) / 4 no es un entero entonces para calcular Qi hacemos la interpolación inicial entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentra la fracción.
Ejemplo:
32 38 42 49 54 65 81
36 40 45 50 55 70 90
37 41 48 52 58 80
- 25 -
ESTADÍSTICA PEGGI MONTOYA 26
Q1 = X5.25 = 40 - 41
Ejemplo 2:
Estaturas en centímetros
120 128.5 137
121 129.2 138.1
122.5 130 139.5
125 135 139.8
128 136 140
n 1 15 1 16
4
4 4 4
X 4 125 Q1 125
1.- Se construye la tabla de frecuencia absolutas acumuladas “menor que” o la de las frecuencias relativas
“menor que”.
2.- Se identifica la clase que contiene a Q1, determinando la menor de las frecuencias absolutas acumuladas Nj
ni ai
que supere a (o la menor Hj que supere )
4 4
ni 1
N j 1 Nj H j 1 i H j
4 4
ni 1
i) N j 1 H j 1
4 4
Entonces Qi = al límite inferior de la clase que contiene a Nj = Y’j-1
- 26 -