Está en la página 1de 22

U.C.V. Mtodos Estadsticos 1 Ing.

Norman Vsquez Quispe

CAPITULO I

1.1. Definicin de estadstica


1.2. Caractersticas y limitaciones de la estadstica
1.3. Aplicaciones de las tcnicas estadsticas
1.4. Definiciones auxiliares:
1.4.1. Poblacin
1.4.2. Muestra
1.4.3. Variable
Cualitativa o de atributo
Cuantitativa o numrica
Discreta
Continua.
1.4.4. Dato
1.4.5. Experimento
1.4.6. Parmetro
1.4.7. Estadstica

1.5. Recoleccin de datos

1.1. Definicin de estadstica


El trmino estadstica tiene dos significados.
En su sentido restringido, se denomina estadstica a un conjunto de datos en si o a algn nmero derivado de
tales datos o cifras tales como los promedios. En este sentido se habla de estadstica de accidentes, de
desempleo, de suicidios, abortos no deseados, de madres solteras, de hijos abandonados, de desercin escolar, de
ingreso per. Cpita de las familias; etc.
En su sentido amplio la estadstica abarca la coleccin, organizacin, presentacin y anlisis de datos, as como
tambin la obtencin de conclusiones vlidas y el hacer decisiones razonables basadas en el anlisis.
De este modo la estadstica es una ciencia que abarca el estudio de:
a) Coleccin de datos
b) Clasificacin y condensacin de datos.
c) Presentacin de datos:
1. En forma de texto
2. En forma de tablas
3. En forma de graficas

1.2. Caractersticas y limitaciones de la estadstica

Las principales caractersticas y limitaciones de la estadstica son:


a. Es el nico medio matemtico que permite manejar gran cantidad de datos
b. Su mejor aplicacin es a datos que sean reducibles a formas cuantitativas.
c. Se puede usar para la interpretacin de datos que son netamente subjetivos
d. La tcnica estadstica es la misma para ciencias sociales y ciencias fsicas.

1.3. Aplicaciones de las tcnicas estadsticas

a. Resumir una gran cantidad de datos en un sumario conciso y comprensible


b. Determinar el nmero de observaciones que deben hacerse para obtener conclusiones con una precisin
fijada de antemano.
c. Extraer el mximo de informacin til de los datos y observaciones disponibles.
d. Determinar los lmites de precisin para las conclusiones obtenidas de un muestreo.
e. Planear estudios y coleccin de datos para sacar conclusiones que no estn afectadas por prejuicios.
f. Apreciar en trminos especficos las incertidumbres o variaciones inherentes a la mayor parte de
procedimientos, situaciones o actividades.
g. Computar la probabilidad de que un hecho ocurra.
U.C.V. Mtodos Estadsticos 2 Ing. Norman Vsquez Quispe

1.4. Definiciones auxiliares:

1.4.1. Poblacin
Es la coleccin, o conjunto, de individuos, objetos o eventos cuyas propiedades sern analizadas. por
interesan a un determinado estudio.
1.4.2. Muestra
Es un subconjunto de la poblacin en lo posible el mas representativo del mismo.
1.4.3. Variable
Caractersticas de inters sobre cada elemento individual de una poblacin o muestra. Una variable en
estadstica suele representarse por medio de un smbolo tal como: x , y , x, A , , , ; etc. Que puede
tomar o asumir cualquier valor dentro de un conjunto de valores llamado dominio o universo de la
variable. Estas pueden ser:
Cualitativa o de atributo. Variable que clasifica o describe un elemento de una poblacin. Las
operaciones aritmticas, como sumar y obtener promedios, no son significativas para datos que
resultan de una variable cualitativa.
Cuantitativa o numrica. Variable que cuantifica un elemento de una poblacin. Las operaciones
aritmticas como sumar y obtener promedios, si son significativas para datos que resultan de una
variable cuantitativa.
Cuando la variable toma un solo valor se le denomina constante. Las variables numricas pueden a su
vez ser:
Variable discreta o discontinua si solo puede asumir valores enteros o mejor dicho que varan de uno
en uno.
Ejemplo. El nmero de miembros de una familia, el nmero de personas que habitan en una casa, la
suma de los puntos de las caras mostradas en las caras superiores de dos dados; etc.
Variable continua Su valor es un nmero real, por lo que puede tomar valores diferentes para
diferentes analistas, dependiendo de la precisin con la que se trabaje.
Ejemplo La talla de los alumnos de una clase expresada en metros y registrada por cada alumno, la
longitud de un lote de varillas de acero, producidas en determinado instante; etc.

1.4.4. Dato
Valor de la variable asociada a un elemento de la poblacin o muestra. Este valor puede ser un
nmero, un smbolo o una palabra
1.4.5. Experimento
Actividad planeada cuyos resultados producen un conjunto de datos.
1.4.6. Parmetro
Valor numrico que resume todos los datos de una poblacin completa.
1.4.7. Estadstica
Valor numrico que resume los datos de una muestra.

Ejemplo: 1
Un estudiante de estadstica esta interesado en calcular el promedio del valor en dlares de las motocicletas
que pertenecen a los alumnos de la Universidad Csar vallejo Filial Tarapoto.

1. La Poblacin es el conjunto de todas las motos que pertenecen a los alumnos de las diferentes facultades
de la Universidad Csar Vallejo Filial Tarapoto.
2. Una Muestra es cualquier subconjunto de esta poblacin, por ejemplo las motos que pertenecen a los
alumnos de sexo femenino.
3. La variable es valor en dlares de cada moto individual (es una variable cuantitativa o numrica)
4. Un dato es el valor en dlares de una motocicleta en particular. La mota del estudiante Carlos Tuanama
Saavedra, por ejemplo; valuada en $. 3500.
5. El experimento son los mtodos aplicados para seleccionar las motos que integren la muestra y la forma
como determinar el valor de cada elemento de la muestra (podra ser preguntando directamente a cada
dueo o de otra forma mas confiable)
6. El parmetro sobre el que se esta buscando informacin es el valor promedio de todas la motocicletas de
la poblacin.
7. La estadstica que se encuentre es el valor promedio de todos las motocicletas de la muestra.

1.5. Recoleccin de datos


U.C.V. Mtodos Estadsticos 3 Ing. Norman Vsquez Quispe

Unos de los primeros problemas que se enfrentan quienes se dedican a la estadstica es la obtencin de datos; los
datos no ocurren simplemente; es necesario recolectarlos. Es necesario obtener buenos datos por que en ltima
instancia las inferencias efectuadas se basan en las estadsticas obtenidas a partir de los datos.
La recoleccin de para el anlisis estadstico es un proceso complicado e incluye los siguientes subprocesos:

1. Definir los objetivos de la investigacin o del experimento. Permite discriminar el tipo de datos a recolectar
Ejemplo: Estimar el ingreso familiar medio de un municipio, Estimar la eficacia de un nuevo medicamento,
comparado con su par existente en el mercado.

2. Definir la variable y la poblacin de inters


Ejemplo: duracin del tiempo de recuperacin de los pacientes que sufren alguna enfermedad en particular,
estimar el promedio de familias que cuentan con servicio telefnico en casa.

3. Definir los esquemas y procedimientos para recolectar los datos: esto incluye los procedimientos de
muestreo, tamao de la muestra y el instrumento de medicin de la muestra (cuestionario, por telfono; etc.)

4. Determinar las tcnicas idneas para realizar el anlisis de datos. Que pueden ser descriptivas o
inferenciales.

En ocasiones ocurre que un analista se encuentra con datos ya recolectados, tal vez, incluso, recolectados
para otros fines, frente a los que deber tomar una decisin si lo utiliza o no dependiendo de la confiabilidad
de los mismos.
Es mucho mejor y como quiera que los resultados son de responsabilidad exclusiva del analista es mejor que el
mismo realice la recoleccin de sus datos.

Mtodos utilizados en la recoleccin de datos:

Los mtodos que se utilizan para recolectar datos son los experimentos y las encuestas.

Experimento. Un experimento es repetir un hecho o fenmeno tantas veces, bajo diferentes circunstancias
con el propsito de anlisis el mismo. El investigador controla o modifica el entorno y observa el efecto sobre
la variable bajo estudio. En medicina generalmente se utilizan ratas a quienes se les suministra el
medicamento y se lee su efecto.

Encuesta o inspeccin En una encuesta o inspeccin los datos se obtienen de la poblacin o muestra pero sin
modificar el entorno. Se hace necesario listar o enumerar o enumerar y observar cada elemento de la
poblacin. Un censo es una encuesta a 100%

Marco muestral Es una lista de elementos que pertenecen a la poblacin la cual constituye la muestra. De
manera ideal el marco muestral debe ser idntico a la poblacin. El marco muestral debe ser representativo
de la poblacin.

Diseo muestral. Una vez que se ha establecido un marco muestral representativo, a partir de este se procede
a la seleccin de los elementos de la muestra o diseo de la muestra. Hay muchos tipos de diseos de una
muestra: muestreo de juicio y muestreo probabilstica.

Muestreo de juicio (o de seleccin intencional) En este caso la persona que selecciona la muestra haciendo
uso de su experiencia, criterio y buen juicio, elige las unidades que considera son representativas de la
poblacin. Es lgico pensar que la validez de los resultados de la muestra refleja la solides del juicio del
experto recolector de datos.

Muestreo probabilstico son muestras cuyos elementos han sido seleccionadas con base en la probabilidad.
En la que cada elemento de la poblacin tiene cierta probabilidad de ser elegida como parte de la muestra.
Uno de los mtodos mas comunes es el muestreo aleatorio.

Muestreo aleatorio La muestra es seleccionada de modo que todos los elementos de la poblacin tienen la
misma probabilidad de ser elegidas. De igual manera, todas las muestras de tamao n tienen la posibilidad de
ser elegidas. Las muestras aleatorias de obtienen por muestreo con reemplazamiento en una poblacin
infinita o muestreo sin reemplazo en una poblacin finita.
U.C.V. Mtodos Estadsticos 4 Ing. Norman Vsquez Quispe

Ejercicios

1. Se desea elegir al estudiante ms carismtico de la Universidad Csar Vallejo Filial Tarapoto. Los datos
manejados en este estudio es de naturaleza:
a. Cualitativo o de atributo
b. Numrico.

2. Juan Rodrguez candidato a alcalde de la municipalidad de Morales, realiza una encuesta y obtiene
como resultado que 35000 de 150000 electores indican que votaran por su candidatura, 100000
lectores indican que votaran por sus oponentes y 15000 estn indecisos.
a. Tipo de variables intervinientes en este estudio
b. Parmetro de inters
c. Los resultados son confiables?

3. Un estudio hecho sobre 2000 hombres jvenes que no asisten a la Universidad y que emplean su tiempo
trabajando en restaurantes de comida rpida, se encontr lo siguiente: uno de cada dos alcanzo un
nivel superior de trabajador manual y uno de cada cuatro alcanzo una posicin gerencial.
a. Cul es la poblacin?
b. Cul es la muestra?
c. El muestreo es de juicio o probabilstico?

CAPITULO II

ANLISIS DESCRIPTIVO Y PRESENTACIN DE DATOS DE UNA SOLA VARIABLE

A menudo una imagen vale ms que mil palabras

Una vez recolectada los datos de la poblacin o muestra, es necesario elegir una presentacin visual de los mismos,
uno de los propsitos es obtener visualmente patrones de comportamiento de los mismos, que facilitara su
manipulacin y estudio. Hay muchas formas grficas (visuales) para la presentacin de los datos. El juicio del analista y
las caractersticas propias del problema desempean un papel primordial en la seleccin de la grafica a emplear en la
representacin de los datos.

DIAGRAMA DE BARRAS
Muestra la cantidad de datos que pertenecen a cada categora como reas rectangulares de tamao proporcional.

Ejemplo

En la tabla se muestra el nmero de casos de cada tipo de operacin realizada en el Hospital Regional Docente de la
Ciudad de Trujillo el ao pasado.

CDIGO TIPO DE OPERACIN N DE CASOS

IQT01 Torcica 20
IQH01 Huesos y articulaciones 45
IQO03 Ojos, odos, nariz y garganta 58
IQG02 General 98
IQA01 Abdominal 115
IQU02 Urologa 74
IQP02 Proctolgica 65
IQN02 Neurociruga 23
U.C.V. Mtodos Estadsticos 5 Ing. Norman Vsquez Quispe

Verticales

Horizontales:

Barras en tres dimensiones


U.C.V. Mtodos Estadsticos 6 Ing. Norman Vsquez Quispe

DIAGRAMA CIRCULAR (PASTEL)

Muestra la cantidad de datos que pertenecen a cada categora como una parte proporcional de un crculo.
Generalmente en forma porcentual

Para el ejemplo anterior

Circular en tres dimensiones

Ejercicio
En la tabla adjunta se presenta el rea de los continentes en millones de kilmetros cuadrados, informacin que
deber ser presentada en graficas de barras y circular.
CONTINENTE REA EN 106 KM
frica 30.05
Asia 26.90
U.C.V. Mtodos Estadsticos 7 Ing. Norman Vsquez Quispe

Europa 4.90
Norte Amrica 24.20
Oceana 8.50
Sur Amrica 17.80
URSS 20.05

DISTRIBUCIONES DE FRECUENCIAS E HISTOGRAMAS


Los listados de grandes conjuntos de datos no presentan una imagen valiosa. Algunas veces se desea condensar los
datos en una forma mas manejable. Esto puede lograrse con la ayuda de una distribucin de frecuencias.
Distribucin de frecuencias no agrupadas es un listado, a menudo expresado en forma de diagrama, que se asocia
cada valor con una variable con su frecuencia.
Ejemplo:
Forme una distribucin de frecuencias no agrupadas de los datos resultantes:
3 2 2 3 2 4 3 2 0 2
4 4 1 2 2 2 1 3 3 1

Solucin

X f
0 1
1 3
2 8
3 5
4 3

Si x representa una variable, f representa la incidencia con la x se presenta en el conjunto de datos. As por ejemplo:
O se presenta una sola vez
1 se presenta tres veces
2 se presenta ocho veces: y as sucesivamente.

Distribucin de frecuencias agrupadas. En este caso la variable x tiene como universo un intervalo constituido por un
conjunto de valores contenidos entre dos lmites: inferior (Li) y superior (Ls) la diferencia entre estos dos limites
constituye la amplitud o longitud del intervalo y la media aritmtica de estos dos valores (Ls + Li) / 2 constituye el la
marca de clase.
Para ilustrar este procedimiento para agrupar o clasificar, se considerara una muestra de 50 puntajes del examen final
del curso de estadstica. La tabla presenta los cincuenta puntajes.

60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 68 97 70 64 70 70
58 78 89 44 55 85 82 83 72 77
72 86 50 94 92 80 91 75 76 78

Los lineamientos bsicos a seguir en la elaboracin de una distribucin de frecuencias son:


1. Cada clase debe ser del mismo ancho
2. Las clases deben estar dispuestas de modo que no se superpongan y que cada porcin de informacin pertenezca
exactamente a una clase.
3. el nmero de intervalos o clase est dado por m calculado de la siguiente manera:
2m > n 2m > 50 m = 6 por que 26 > 64 > 50
4. utilizar un sistema que aproveche un patrn numrico para garantizar precisin
5. Cuando sea conveniente, un ancho de clase par suele ser ventajoso.

Procedimiento
1. Identifique los puntajes mximo y mnimo (Max = 98 , Min = 39) y determine el rango
Rango = Max - Min Rango = 98 39 Rango = 59
2. El nmero de intervalos de clase es ( m = 6 )
La longitud de clase C = ( Max Min ) / m C = 59 / 6 C = 10
3.
U.C.V. Mtodos Estadsticos 8 Ing. Norman Vsquez Quispe

MEDIDAS DE TENDENCIA CENTRAL


1. Media Aritmtica
2. Media ponderada
3. Mediana
4. Moda
5. Media Geomtrica
6. Media Cuadrtica
7. Media Armnica

Medidas de tendencia central


Las medidas de tendencia central son valores numricos que localizan, de alguna manera, el centro de un conjunto de
datos. Fsicamente representa el centro de gravedad de una barra suspendida.

DISTRIBUCION DE FRECUENCIA

Los listados de grandes conjuntos de datos no presentan una imagen valiosa. Algunas veces se desea condensar los
datos en una forma ms manejable. Esto puede lograrse mediante una distribucin de frecuencias.
Distribucin de frecuencias Listado, a menudo expresado en forma de diagrama, que asocia cada valor de una
variable con su frecuencia o incidencia.

Ejemplo: Forme una distribucin de frecuencias no agrupadas de los datos resultantes:

3 2 2 3 2 4 3 2 0 2
4 4 1 2 2 2 1 3 3 1

Solucin

X F
0 1
1 3
2 8
3 5
4 3

Si x representa una variable, f representa la incidencia con la x se presenta en el conjunto de datos. As por ejemplo:
O se presenta una sola vez
1 se presenta tres veces
2 se presenta ocho veces: y as sucesivamente.

Distribucin de frecuencias agrupadas. En este caso la variable x tiene como universo un intervalo constituido por un
conjunto de valores contenidos entre dos lmites: inferior (Li) y superior (Ls) la diferencia entre estos dos limites
constituye la amplitud o longitud del intervalo y la media aritmtica de estos dos valores (Ls + Li) / 2 constituye el la
marca de clase.
Para ilustrar este procedimiento para agrupar o clasificar, se considerara una muestra de 50 puntajes del examen final
del curso de estadstica. La tabla presenta los cincuenta puntajes.

60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 68 97 70 64 70 70
58 78 89 44 55 85 82 83 72 77
72 86 50 94 92 80 91 75 76 78

Los lineamientos bsicos a seguir en la elaboracin de una distribucin de frecuencias son:


1. Cada clase debe ser del mismo ancho
2. Las clases deben estar dispuestas de modo que no se superpongan y que cada porcin de informacin
pertenezca exactamente a una clase.
3. El numero de intervalos o clase esta dado por m calculado de la siguiente manera:
2m > n 2m > 50 m = 6 por que 26 > 64 > 50
U.C.V. Mtodos Estadsticos 9 Ing. Norman Vsquez Quispe

4. Utilizar un sistema que aproveche un patrn numrico para garantizar precisin


5. Cuando sea conveniente, un ancho de clase par suele ser ventajoso.

Procedimiento.

1. Identifique los puntajes mximo y mnimo (Mx = 98 , Min = 39) y determine el Rango
Rango = Mx Min Rango = 98 39 Rango = 59

2. Clculo del nmero de clases: ( m )


m = 1 + 3.3 Log (n) m = 6.60661014 m = 7
Clculo de la amplitud o ancho de clase ( c )
Mx Min 98 39 59
c c c c = 8.428571429 c = 10
m 7 7
Clculo de la marca de clase

M Li Ls X f xf
1 35 45 40 2 80
2 45 55 50 2 100
3 55 65 60 7 420
4 65 75 70 13 910
5 75 85 80 11 880
6 85 95 90 11 990
7 95 105 100 4 400
50 3780

3. Media Aritmtica para datos no agrupados ( x )


A la media aritmtica se le conoce mas como promedio, se representa por. x (Que se lee como x barra o media
de la muestra). La media aritmtica se encuentra sumando todos los valores de la variable x y dividiendo entre el
nmero de valores intervinientes.
Para datos no agrupados

+ + +. . . +
= = 1 2 3 = =1

Ejemplo: para el conjunto de cinco datos, de valores: 6, 3, 8, 6, y 4 encuentre su media aritmtica.

Solucin Aplicando la frmula se tiene que:

x
x 6 3 8 6 4 5.4
n 5
La media aritmtica de esta muestra es 5.4

Media Aritmtica para datos agrupados ( x )

x
fMi i
Dnde: Mi : Marca de clase
n
fi : frecuencia
n : nmero total de datos ( n fi )
Ejemplo para los datos agrupados:

M Li Ls X f xf
1 35 45 40 2 80
U.C.V. Mtodos Estadsticos 10 Ing. Norman Vsquez Quispe

2 45 55 50 2 100
3 55 65 60 7 420
4 65 75 70 13 910
5 75 85 80 11 880
6 85 95 90 11 990
7 95 105 100 4 400
50 3780

x
fMi i
x
3780
x 75.6
n 50

Media Aritmtica (Mtodo abreviado)

xz
f .t Donde z Media elegida arbitrariamente
n
Mi : Marca de clase
t Mi z

Mi f Z t ft
40 2 60 -20 -40
50 2 60 -10 -20
60 7 60 0 0
70 13 60 10 130
80 11 60 20 220
90 11 60 30 330
100 4 60 40 160
50 780

z 60
f .t 780
n = 50
780
x 60 x 75.6
50

De igual manera:

z 80
f .t 220
n = 50

X f Z t ft
40 2 80 -40 -80
50 2 80 -30 -60
60 7 80 -20 -140
70 13 80 -10 -130
80 11 80 0 0
90 11 80 10 110
100 4 80 20 80
50 -220

220
x 80 x 75.6
50
U.C.V. Mtodos Estadsticos 11 Ing. Norman Vsquez Quispe

Media ponderada
En muchas ocasiones los datos no agrupados, se presenta el caso de que cada elemento no es considerado
equivalente en valor a otro. El caso tpico es la de los datos que corresponden a las notas de una determinada
asignatura, que corresponden a su vez a las diferentes evaluaciones aplicadas mismas que no tienen el mismo
nivel de dificultad y trascendencia en el conocimiento de la asignatura; por lo que se les da pesos diferentes ( n )
el mismo que en el momento de los clculos funciona como la frecuencia ( f ) por lo que la suma de los pesos
equivale a la suma de los pesos.

x
x n i i
Dnde: ni : Peso ponderado
n i
xi : Dato
N ni
Ejemplo: Calcule la media ponderada para la siguiente informacin

Prom Peso
Asignaturas xi ni xi . ni
Mecnica 18 3 54
Qumica 16 3 48
Fsica 11 4 44
Matemtica 17 5 85
Idiomas 15 2 30
Humanidades 14 3 42
20 303

x n 303
i i

n 20
i

x
x n i i

303
x 15.15
n i 20

4. Mediana para datos no agrupados


Valor de los datos que ocupa la posicin central cuando los mismos se ordenan segn su tamao. Se representa
por x (se lee como x tilde o media de la muestra)

Procedimiento para encontrar la mediana de una muestra

1. Ordenar los datos en forma creciente o decreciente


2. Determinar la profundidad o posicin de la mediana mediante la formula
nmero 1 n 1
Posicion
2 2
3. Determinar el valor de la mediana. Que es el nmero que ocupa la posicin establecida anteriormente.

Ejemplo: Encuentre la mediana del conjunto de datos (6, 3, 8, 5, 3)

Solucin Datos ordenados. 3, 3, 5, 6, 8


n 1 5 1
Posicin de la mediana Posicion Posicion 3
2 2
Mediana x5 Valor que corresponde a la posicin 3
U.C.V. Mtodos Estadsticos 12 Ing. Norman Vsquez Quispe

Nota: Cuando n: nmero de elementos del conjunto de datos es par, la posicin de la mediana es un nmero
decimal, en este caso la mediana es la semisuma de los datos de dicha vecindad.

Mediana para datos agrupados


Considrese los datos correspondientes a los resultados del lanzamiento de seis monedas, doscientas veces. Se
cont nicamente las caras obtenindose la siguiente informacin.

Clase Frecuencia Freccuencia


Nro. De caras Frecuencia xi fi Acumulada
2 46 0 2 2
5 20 1 19 21
0 2 2 46 67
4 47 3 62 129 Mediana
1 19 4 47 176
6 4 5 20 196
3 62 6 4 200
200 200

El criterio se aplica en las frecuencias acumuladas ( Mediana = 3 )

Ejemplo: Encuentre la mediana de la muestra (9, 6, 7, 9, 10, 8)

Solucin Datos ordenados. 6, 7, 8, 9, 9, 10


n 1 6 1
Posicin de la mediana Posicion Posicion 3.5
2 2
89
Mediana x 8.5 Valor que corresponde a la posicin 3.5
2

5. Moda Para datos no agrupados


Es el valor de x que ocurre con ms frecuencia
As por ejemplo en los ejemplos anteriores (6, 3, 8, 5, 3); la moda es 3 por ser el nmero que ms se repite (dos
veces), de igual manera para el conjunto: (9, 6, 7, 9, 10, 8); la moda es 9 por ser el nmero que se mas repite (dos
veces)

Nota: Cuando dos o mas datos estn empatados en su nmero de ocurrencia, entonces la muestra no tiene
moda, de igual manera, si en una muestra todos los datos no se repiten no existe muestra.
Moda para datos agrupados
Esta dada por la marca de clase que tiene la mas alta frecuencia

Clculo de la Moda en funcin de la Media y la Mediana


Una forma emprica de calcular la moda es mediante la siguiente frmula

Moda = Media - 3 ( Media - Mediana ) x x 3( x x)

4 Media Geomtrica para datos no agrupados

= 1 . 2 . 3 . . . 1 . =
= =1 = [ =1 ]1/

En ocasiones cuando el nmero de elementos de la muestra es demasiado elevado o son datos grandes, establecer
el producto desborda la capacidad de la calculadora y/o computadora, es decir la frmula es inmanejable por lo
que hay la necesidad de logaritmar el proceso de la siguiente manera.
U.C.V. Mtodos Estadsticos 13 Ing. Norman Vsquez Quispe

= 1 . 2 . 3 . . . 1 .
= (1 . 2 . 3 . . . 1 . )1/
( ) = (1 . 2 . 3 . . . 1 . )1/
1
( ) =
(1 . 2 . 3 . . . 1 . )

=1
( ) =
1

= 10 =1

1

=1
= Donde e = 2.718281828459

Media Geomtrica para datos agrupados

M g n f1 .M 1 . f 2 .M 2 . f 3 .M 3 ..... f n1 .M n1 . f n .M n

n
Mg n f .M
i 1
i i

n
Como de haba visto que en ocasiones el producto fMi 1
i i es inmanejable, se hace necesario loga ritmar (base

10 o e)

f1 .Log.M 1 f 2 .Log.M 2 f 3 .Log.M 3 ... f n .Log.M n


Log..M g
n
n

f .Log.M
i i
Log.M g i 1

n
f i .Log .M1 f i . Ln .M i
Mg 10 n
Mg e n

Caractersticas, ventajas y desventajas de Media Geomtrica

Caractersticas
Es un valor calculado que depende del valor de los grupos o clase.
Es menos afectada por los valores extremos (Max y Min) que la Media Aritmtica
Para una misma distribucin es siempre menos que la media aritmtica.

Ventajas
Es un promedio ms tpico que la media aritmtica debido a que es menos afectada por los extremos
Puede ser manipulado algebraicamente
Es til para calcular nmeros ndices

Desventajas
No es muy conocida.
Su clculo es relativamente difcil
Es imposible determinarlo cuando uno de sus valores es cero o negativo.

5 Media Cuadrtica para datos no agrupados


U.C.V. Mtodos Estadsticos 14 Ing. Norman Vsquez Quispe

x 2
i
MC i 1

Media Cuadrtica para datos agrupados

f .M i i
2

MC i 1

8. Media Armnica para datos no agrupados

n n
Ma Ma n
1 1 1 1 1 1
...
x1 x2 x3

xn1 xn x
i 1 i

Media Armnica para datos agrupados

n n
Ma Ma n
f1 f f f f fi
2 3 ... n1 n
M1 M 2 M 3 M n1 M n
M
i 1 i

Ejemplo:
Con la informacin hipottica presentada a continuacin ( 75 datos )

58 94 97 85 81 101 101 112


81 145 134 55 96 84 50 71
64 80 97 151 153 119 120 121
55 102 39 48 127 150 82 113
111 93 40 109 79 78 146 93
145 67 88 140 92 80 137
121 81 131 67 100 64 154
112 88 50 133 75 126 152
124 109 131 53 65 101 59
53 131 56 94 45 155 78

Para datos agrupados y no agrupados, y por los diferentes mtodos estudiados, calcule:
a) Media b) Mediana c) Moda d) Media geomtrica
e) Media cuadrtica f) Media armnica.

Solucin:

1. Para datos no agrupados:

Datos calculados
n = 75
Max = 155
Min = 39
75

x
i 1
i 7272

75

x
i 1
2
1 783602
U.C.V. Mtodos Estadsticos 15 Ing. Norman Vsquez Quispe

75

Log ( x )
i 1
i 146.9971

75
1
x
i 1
0.88039
i

a) Media aritmtica
75

x i
7272
x i 1
x x 96.96
N 75

Media Aritmtica (Mtodo abreviado)

Sea z 107
t = xi - z

n Li Ls xi Fi Z t ft
1 35 51 43 6 107 -64 -384
2 51 67 59 10 107 -48 -480
3 67 83 75 13 107 -32 -416
4 83 99 91 12 107 -16 -192
5 99 115 107 11 107 0 0
6 115 131 123 7 107 16 112
7 131 147 139 10 107 32 320
8 147 163 155 6 107 48 288
75 -752

f .t = - 752
i i

x z
f .t i i
x 107
752
x 96.9733
N 75

b) Mediana
n 1 75 1
Posicion Posicion Posicin = 38
2 2
Luego: x 94 Dato que corresponde al dato 38

c) Moda

d) Rango Medio

R = ( Max + Min ) / 2 R = ( 155 + 75 ) / 2 R = 115

e) Media geomtrica ( Mg )

Log ( Mg )
Log ( x ) i

N
f i . Log . x1

Mg 10 N

Mg 101.068802 Mg 91.19289
U.C.V. Mtodos Estadsticos 16 Ing. Norman Vsquez Quispe

f) Media cuadrtica ( Mc )
n

x 2
i
783602
MC i 1
Mc Mc 102.2156
n 75

g) Media armnica ( Ma )
n 75
Ma n
Ma Ma 81.18954
1

0.88039
i 1 x i

2. Para datos agrupados:

Presentacin de los datos agrupados

Clculo de m:

m = 1 + 3.3 Log (n)

m = 1 + 3.3 Log ( 75 ) m = 8

Calculo de c

c = ( Max - Min ) / 2 c = ( 155 + 39 ) / 8 c = 14.2 = 16

N Li Ls xi fi fixi xi fi / xi fi.Log(xi)
1 35 51 43 6 258 1849 0.139535 9.8008107
2 51 67 59 10 590 3481 0.169492 17.70852
3 67 83 75 13 975 5625 0.173333 24.375796
4 83 99 91 12 1092 8281 0.131868 23.508497
5 99 115 107 11 1177 11449 0.102804 22.323222
6 115 131 123 7 861 15129 0.056911 14.629336
7 131 147 139 10 1390 19321 0.071942 21.430148
8 147 163 155 6 930 24025 0.03871 13.14199
75 7273 89160 0.884594 146.91832

a) Media aritmtica

x
f .x i i
x
7273
x 96.9733
N 75

b) Mediana
91 107 x
x 99
2
Corresponde a la 4.5 posicin

c) Moda
x = Media - 3 ( Media Mediana )
x = 96.9733 - 3 ( 96.9733 99) x = 103.053
U.C.V. Mtodos Estadsticos 17 Ing. Norman Vsquez Quispe

Practica calificada

El siguiente conjunto de datos corresponden a las ventas mensuales de igual nmero de tiendas comerciales. Calcule:

365 740 850 765 915 650 905 140 165 525 314 310 127 125 862
35 305 380 445 400 825 690 570 35 815 465 465 749 745 438
685 275 645 685 485 660 890 740 890 125 469 465 459 455 177
325 425 920 510 665 510 120 645 375 820 211 210 399 395 937
225 50 695 210 110 230 90 575 775 160 253 250 585 585 223
935 735 95 385 470 190 225 140 185 785 936 935 502 500
850 840 850 400 290 645 295 805 435 455 385 385 105 105
635 265 635 240 550 530 915 495 865 780 541 540 129 125
265 550 430 85 765 745 660 295 335 575 804 800 782 780
880 870 515 935 350 555 570 925 670 370 383 380 101 100

a) Media b) Mediana c) Moda d) Rango medio (Para datos no agrupados)


e) Media (para datos agrupados)

Barra de frecuancias

25

20
20 18 18
17
16
14 14 14 14
Frecuencia

15

10

0
1
Intervalos

35 137 137 239 239 341 341 443 443 545 545 647 647 749 749 851 851 953

S = 72291 X = 498.6 Max = 937 m = 8.133 c = 100.2


n = 145 X = 498.6 Min = 35 m = 9 c = 102

N Li Ls xi fxi Fx
1 35 137 86 17 1462
2 137 239 188 14 2632
3 239 341 290 14 4060
4 341 443 392 18 7056
5 443 545 494 20 9880
6 545 647 596 14 8344
7 647 749 698 14 9772
8 749 851 800 18 14400
9 851 953 902 16 14432
145 72038

X = 496.8
U.C.V. Mtodos Estadsticos 18 Ing. Norman Vsquez Quispe

n xi Pi Log ( xi ) n = 50
1 39 39 1.59106461 Max = 98
2 44 1716 1.64345268 Min = 39
3 47 80652 1.67209786
4 50 4032600 1.69897 S = 3746 Sumatoria
5 55 221793000 1.74036269 P = 1.997E+93 Productos
6 58 1.286E+10 1.76342799 S(Log(xi) = 93.30037
7 58 7.461E+11 1.76342799
8 60 4.477E+13 1.77815125
9 63 2.82E+15 1.79934055 Media
10 64 1.805E+17 1.80617997 X = 74.92
11 64 1.155E+19 1.80617997
12 66 7.624E+20 1.81954394 Mediana
13 67 5.108E+22 1.8260748 x = 75.5 25.5
14 68 3.474E+24 1.83250891
15 68 2.362E+26 1.83250891 Moda
16 70 1.653E+28 1.84509804 X =
17 70 1.157E+30 1.84509804
18 70 8.102E+31 1.84509804 Mg = 73.4526383
19 72 5.833E+33 1.8573325 73.4526383
20 72 4.2E+35 1.8573325
21 72 3.024E+37 1.8573325
22 72 2.177E+39 1.8573325
23 74 1.611E+41 1.86923172
24 74 1.192E+43 1.86923172
25 75 8.942E+44 1.87506126
26 76 6.796E+46 1.88081359
27 77 5.233E+48 1.88649073
28 77 4.029E+50 1.88649073
29 77 3.103E+52 1.88649073
30 78 2.42E+54 1.8920946
31 78 1.888E+56 1.8920946
32 80 1.51E+58 1.90308999
33 82 1.238E+60 1.91381385
34 82 1.015E+62 1.91381385
35 83 8.428E+63 1.91907809
36 85 7.164E+65 1.92941893
37 86 6.161E+67 1.93449845
38 86 5.298E+69 1.93449845
39 88 4.662E+71 1.94448267
40 88 4.103E+73 1.94448267
41 89 3.652E+75 1.94939001
42 90 3.286E+77 1.95424251
43 90 2.958E+79 1.95424251
44 91 2.692E+81 1.95904139
45 92 2.476E+83 1.96378783
46 94 2.328E+85 1.97312785
47 95 2.211E+87 1.97772361
48 95 2.101E+89 1.97772361
U.C.V. Mtodos Estadsticos 19 Ing. Norman Vsquez Quispe

49 97 2.038E+91 1.98677173
50 98 1.997E+93 1.99122608

Media Aritmtica o Promedio ( X )
Desviacin con respecto a la media ( DM )
a) Para datos no agrupados: b) Para datos
agrupados a) Para datos no agrupados b) Para datos
agrupados
n

x
n

i M .f i i
n

x x
X i 1
X i 1 i
n n
DM i 1

f
i 1
i n
n

Media o promedio ponderado:


x .f i i x
DM i 1
n
n f
xi .ni
i
I 1
Varianza de una muestra ( )
X i 1
n

n
i 1
i a) Para datos no agrupados
2
b) Para datos agrupados
n
xi
xi2 i 1
n
Distribucin de frecuencias
n
2 i 1
Clculo del Rango ( R ) Clculo de numero de n 1
intervalos ( m ) 2
n
M i fi
M i2 f i i 1 n
n

R
VMax VMin
m
VMax VMin
1 3.3.Log (n) m
i 1
fi
2 n
i 1

Clculo de la Marca de Clase ( Mi ) f


i 1
i 1

Ls Li
Mi Desviacin Estndar
2

2
n
M i fi
M i2 f i i 1 n
n


i 1
fi
n
i 1

f
i 1
i 1

n xy x. y
r
n x x n y y
2 2

Varianza de una muestra ( )

b) Para datos no agrupados b) Para datos agrupados


U.C.V. Mtodos Estadsticos 20 Ing. Norman Vsquez Quispe

2

2 n
M i fi
n
xi
M i2 f i i 1 n
n

xi2 i 1
n

n
i 1
fi
2 i 1 2 i 1
n 1 n

f
i 1
i 1

Desviacin Estndar

2
n
M i fi
M i2 f i i 1 n
n


i 1
fi
n
i 1

f
i 1
i 1

Cuartiles

Los cuartiles dividen al conjunto de datos en cuatro partes iguales: el primer cuartil Q1 separa al 25%, que abarca los
valores ms pequeos, del 75% restante, constituidos por los que son mayores. El segundo cuartil Q2 es la mediana:
50% de sus valores son menores que la mediana y 50% son mayores. El tercer cuartil Q3 separa al 25%, que abarca a
los valores ms grandes, del 75% restante constituido por los que son menores.

Primer cuartil Q1
El 25% de los valores son menores que el primer cuartil Q1, y el 75% son mayores que el primer cuartil Q1.

+1
1 = Valor clasificado
4

Tercer Cuartil Q3
El 75% de los valores son menores que el tercer cuartil Q3 y el 25% so mayores que el tercer cuartil Q3

3(+1)
3 = Valor clasificado
4

Para calcular los cuartiles se observa las siguientes reglas

Regla 1 si el resultado es un nmero entero, entonces el cuartil es igual el valor clasificado.


Por ejemplo si el tamao de la muestra es n = 7, el primer cuartil es igual a (7 + 1) / 4 = segundo valor clasificado.

Regla 2. Si el resultado es una fraccin de mitad (2.5, 7.5 etctera), entonces el cuartil es igual al promedio de los
valores clasificados correspondientes.
Por ejemplo, si el tamao de la muestra es n= 9 el primer cuartil Q1 es igual al valor clasificado como ( 9 + 1 ) / 4 =
2.5, la mitad entre los valores clasificados como segundo y tercero
.
Regla 3. Si el resultado no es un nmero entero ni una fraccin de mitad, se redondea al entero ms cercano y se
selecciona ese valor clasificado.
Por ejemplo, si el tamao de la muestra es n = 10, el primer cuartil es igual a ( 10 + 1 ) / 4 = 2.75 se redondea el
2.75 a 3 y se utiliza el valor clasificado como tercero.

SEMINARIO DE PROBLEMAS RESUELTOS


U.C.V. Mtodos Estadsticos 21 Ing. Norman Vsquez Quispe

P1. Mediante el Ms Excel, genere una poblacin y/o muestra de 240 trminos xi entre los limites [ 117 , 973 ],
luego:
a. Ordena la informacin siguiendo el algoritmo correspondiente, y luego calcula las Medidas de tendencia
Central para datos no agrupados y agrupados:
b. Media o promedio
c. Media geomtrica
d. Mediana
e. Moda
f. Media cuadrtica
g. Media armnica

SOLUCIN
Poblacin y/o muestra generada de 294 trminos

a. Ordena la informacin siguiendo el algoritmo correspondiente


El proceso completo como ordenar los datos aparece en los importados del Excel en donde se ha trabajado

Clculo de las Medidas de tendencia Central para datos no agrupados y agrupados

b. Media aritmtica o promedio


Para datos no agrupados
+ + + . . . + 1 +
= 1 2 3



= =1

936+ 648 + 363 + . . . + 950 + 479
=
294
U.C.V. Mtodos Estadsticos 22 Ing. Norman Vsquez Quispe

164095
=
294

= 558.15
Para datos agrupados


= =1

164178
=
294

= 558.429
Observacin: Los promedios para datos no
agrupados y agrupados no son iguales, existe una
ligera diferencia. La exacta se obtiene con datos no
agrupados

c. Media geomtrica
Para datos no agrupados
1 1

=1
=1
= 10 = Donde e = 2.718281828459

Media Geomtrica para datos agrupados

M g n f1 .x1 . f 2 .x2 . f 3 .x3 ..... f n1 .xn1 . f n .xn

n
Mg n f .x
i 1
i i

n
Como de haba visto que en ocasiones el producto fx
i 1
i i es inmanejable, se hace necesario loga ritmar (base 10

o e)

f1 .Log.M 1 f 2 .Log.M 2 f 3 .Log.M 3 ... f n .Log.M n


Log..M g
n
n

f .Log.M
i i
Log.M g i 1

n
f i .Log .M1 f i . Ln .M i
Mg 10 n
Mg e n

También podría gustarte