Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CAPITULO I
1.4.1. Poblacin
Es la coleccin, o conjunto, de individuos, objetos o eventos cuyas propiedades sern analizadas. por
interesan a un determinado estudio.
1.4.2. Muestra
Es un subconjunto de la poblacin en lo posible el mas representativo del mismo.
1.4.3. Variable
Caractersticas de inters sobre cada elemento individual de una poblacin o muestra. Una variable en
estadstica suele representarse por medio de un smbolo tal como: x , y , x, A , , , ; etc. Que puede
tomar o asumir cualquier valor dentro de un conjunto de valores llamado dominio o universo de la
variable. Estas pueden ser:
Cualitativa o de atributo. Variable que clasifica o describe un elemento de una poblacin. Las
operaciones aritmticas, como sumar y obtener promedios, no son significativas para datos que
resultan de una variable cualitativa.
Cuantitativa o numrica. Variable que cuantifica un elemento de una poblacin. Las operaciones
aritmticas como sumar y obtener promedios, si son significativas para datos que resultan de una
variable cuantitativa.
Cuando la variable toma un solo valor se le denomina constante. Las variables numricas pueden a su
vez ser:
Variable discreta o discontinua si solo puede asumir valores enteros o mejor dicho que varan de uno
en uno.
Ejemplo. El nmero de miembros de una familia, el nmero de personas que habitan en una casa, la
suma de los puntos de las caras mostradas en las caras superiores de dos dados; etc.
Variable continua Su valor es un nmero real, por lo que puede tomar valores diferentes para
diferentes analistas, dependiendo de la precisin con la que se trabaje.
Ejemplo La talla de los alumnos de una clase expresada en metros y registrada por cada alumno, la
longitud de un lote de varillas de acero, producidas en determinado instante; etc.
1.4.4. Dato
Valor de la variable asociada a un elemento de la poblacin o muestra. Este valor puede ser un
nmero, un smbolo o una palabra
1.4.5. Experimento
Actividad planeada cuyos resultados producen un conjunto de datos.
1.4.6. Parmetro
Valor numrico que resume todos los datos de una poblacin completa.
1.4.7. Estadstica
Valor numrico que resume los datos de una muestra.
Ejemplo: 1
Un estudiante de estadstica esta interesado en calcular el promedio del valor en dlares de las motocicletas
que pertenecen a los alumnos de la Universidad Csar vallejo Filial Tarapoto.
1. La Poblacin es el conjunto de todas las motos que pertenecen a los alumnos de las diferentes facultades
de la Universidad Csar Vallejo Filial Tarapoto.
2. Una Muestra es cualquier subconjunto de esta poblacin, por ejemplo las motos que pertenecen a los
alumnos de sexo femenino.
3. La variable es valor en dlares de cada moto individual (es una variable cuantitativa o numrica)
4. Un dato es el valor en dlares de una motocicleta en particular. La mota del estudiante Carlos Tuanama
Saavedra, por ejemplo; valuada en $. 3500.
5. El experimento son los mtodos aplicados para seleccionar las motos que integren la muestra y la forma
como determinar el valor de cada elemento de la muestra (podra ser preguntando directamente a cada
dueo o de otra forma mas confiable)
6. El parmetro sobre el que se esta buscando informacin es el valor promedio de todas la motocicletas de
la poblacin.
7. La estadstica que se encuentre es el valor promedio de todos las motocicletas de la muestra.
Unos de los primeros problemas que se enfrentan quienes se dedican a la estadstica es la obtencin de datos; los
datos no ocurren simplemente; es necesario recolectarlos. Es necesario obtener buenos datos por que en ltima
instancia las inferencias efectuadas se basan en las estadsticas obtenidas a partir de los datos.
La recoleccin de para el anlisis estadstico es un proceso complicado e incluye los siguientes subprocesos:
1. Definir los objetivos de la investigacin o del experimento. Permite discriminar el tipo de datos a recolectar
Ejemplo: Estimar el ingreso familiar medio de un municipio, Estimar la eficacia de un nuevo medicamento,
comparado con su par existente en el mercado.
3. Definir los esquemas y procedimientos para recolectar los datos: esto incluye los procedimientos de
muestreo, tamao de la muestra y el instrumento de medicin de la muestra (cuestionario, por telfono; etc.)
4. Determinar las tcnicas idneas para realizar el anlisis de datos. Que pueden ser descriptivas o
inferenciales.
En ocasiones ocurre que un analista se encuentra con datos ya recolectados, tal vez, incluso, recolectados
para otros fines, frente a los que deber tomar una decisin si lo utiliza o no dependiendo de la confiabilidad
de los mismos.
Es mucho mejor y como quiera que los resultados son de responsabilidad exclusiva del analista es mejor que el
mismo realice la recoleccin de sus datos.
Los mtodos que se utilizan para recolectar datos son los experimentos y las encuestas.
Experimento. Un experimento es repetir un hecho o fenmeno tantas veces, bajo diferentes circunstancias
con el propsito de anlisis el mismo. El investigador controla o modifica el entorno y observa el efecto sobre
la variable bajo estudio. En medicina generalmente se utilizan ratas a quienes se les suministra el
medicamento y se lee su efecto.
Encuesta o inspeccin En una encuesta o inspeccin los datos se obtienen de la poblacin o muestra pero sin
modificar el entorno. Se hace necesario listar o enumerar o enumerar y observar cada elemento de la
poblacin. Un censo es una encuesta a 100%
Marco muestral Es una lista de elementos que pertenecen a la poblacin la cual constituye la muestra. De
manera ideal el marco muestral debe ser idntico a la poblacin. El marco muestral debe ser representativo
de la poblacin.
Diseo muestral. Una vez que se ha establecido un marco muestral representativo, a partir de este se procede
a la seleccin de los elementos de la muestra o diseo de la muestra. Hay muchos tipos de diseos de una
muestra: muestreo de juicio y muestreo probabilstica.
Muestreo de juicio (o de seleccin intencional) En este caso la persona que selecciona la muestra haciendo
uso de su experiencia, criterio y buen juicio, elige las unidades que considera son representativas de la
poblacin. Es lgico pensar que la validez de los resultados de la muestra refleja la solides del juicio del
experto recolector de datos.
Muestreo probabilstico son muestras cuyos elementos han sido seleccionadas con base en la probabilidad.
En la que cada elemento de la poblacin tiene cierta probabilidad de ser elegida como parte de la muestra.
Uno de los mtodos mas comunes es el muestreo aleatorio.
Muestreo aleatorio La muestra es seleccionada de modo que todos los elementos de la poblacin tienen la
misma probabilidad de ser elegidas. De igual manera, todas las muestras de tamao n tienen la posibilidad de
ser elegidas. Las muestras aleatorias de obtienen por muestreo con reemplazamiento en una poblacin
infinita o muestreo sin reemplazo en una poblacin finita.
U.C.V. Mtodos Estadsticos 4 Ing. Norman Vsquez Quispe
Ejercicios
1. Se desea elegir al estudiante ms carismtico de la Universidad Csar Vallejo Filial Tarapoto. Los datos
manejados en este estudio es de naturaleza:
a. Cualitativo o de atributo
b. Numrico.
2. Juan Rodrguez candidato a alcalde de la municipalidad de Morales, realiza una encuesta y obtiene
como resultado que 35000 de 150000 electores indican que votaran por su candidatura, 100000
lectores indican que votaran por sus oponentes y 15000 estn indecisos.
a. Tipo de variables intervinientes en este estudio
b. Parmetro de inters
c. Los resultados son confiables?
3. Un estudio hecho sobre 2000 hombres jvenes que no asisten a la Universidad y que emplean su tiempo
trabajando en restaurantes de comida rpida, se encontr lo siguiente: uno de cada dos alcanzo un
nivel superior de trabajador manual y uno de cada cuatro alcanzo una posicin gerencial.
a. Cul es la poblacin?
b. Cul es la muestra?
c. El muestreo es de juicio o probabilstico?
CAPITULO II
Una vez recolectada los datos de la poblacin o muestra, es necesario elegir una presentacin visual de los mismos,
uno de los propsitos es obtener visualmente patrones de comportamiento de los mismos, que facilitara su
manipulacin y estudio. Hay muchas formas grficas (visuales) para la presentacin de los datos. El juicio del analista y
las caractersticas propias del problema desempean un papel primordial en la seleccin de la grafica a emplear en la
representacin de los datos.
DIAGRAMA DE BARRAS
Muestra la cantidad de datos que pertenecen a cada categora como reas rectangulares de tamao proporcional.
Ejemplo
En la tabla se muestra el nmero de casos de cada tipo de operacin realizada en el Hospital Regional Docente de la
Ciudad de Trujillo el ao pasado.
IQT01 Torcica 20
IQH01 Huesos y articulaciones 45
IQO03 Ojos, odos, nariz y garganta 58
IQG02 General 98
IQA01 Abdominal 115
IQU02 Urologa 74
IQP02 Proctolgica 65
IQN02 Neurociruga 23
U.C.V. Mtodos Estadsticos 5 Ing. Norman Vsquez Quispe
Verticales
Horizontales:
Muestra la cantidad de datos que pertenecen a cada categora como una parte proporcional de un crculo.
Generalmente en forma porcentual
Ejercicio
En la tabla adjunta se presenta el rea de los continentes en millones de kilmetros cuadrados, informacin que
deber ser presentada en graficas de barras y circular.
CONTINENTE REA EN 106 KM
frica 30.05
Asia 26.90
U.C.V. Mtodos Estadsticos 7 Ing. Norman Vsquez Quispe
Europa 4.90
Norte Amrica 24.20
Oceana 8.50
Sur Amrica 17.80
URSS 20.05
Solucin
X f
0 1
1 3
2 8
3 5
4 3
Si x representa una variable, f representa la incidencia con la x se presenta en el conjunto de datos. As por ejemplo:
O se presenta una sola vez
1 se presenta tres veces
2 se presenta ocho veces: y as sucesivamente.
Distribucin de frecuencias agrupadas. En este caso la variable x tiene como universo un intervalo constituido por un
conjunto de valores contenidos entre dos lmites: inferior (Li) y superior (Ls) la diferencia entre estos dos limites
constituye la amplitud o longitud del intervalo y la media aritmtica de estos dos valores (Ls + Li) / 2 constituye el la
marca de clase.
Para ilustrar este procedimiento para agrupar o clasificar, se considerara una muestra de 50 puntajes del examen final
del curso de estadstica. La tabla presenta los cincuenta puntajes.
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 68 97 70 64 70 70
58 78 89 44 55 85 82 83 72 77
72 86 50 94 92 80 91 75 76 78
Procedimiento
1. Identifique los puntajes mximo y mnimo (Max = 98 , Min = 39) y determine el rango
Rango = Max - Min Rango = 98 39 Rango = 59
2. El nmero de intervalos de clase es ( m = 6 )
La longitud de clase C = ( Max Min ) / m C = 59 / 6 C = 10
3.
U.C.V. Mtodos Estadsticos 8 Ing. Norman Vsquez Quispe
DISTRIBUCION DE FRECUENCIA
Los listados de grandes conjuntos de datos no presentan una imagen valiosa. Algunas veces se desea condensar los
datos en una forma ms manejable. Esto puede lograrse mediante una distribucin de frecuencias.
Distribucin de frecuencias Listado, a menudo expresado en forma de diagrama, que asocia cada valor de una
variable con su frecuencia o incidencia.
3 2 2 3 2 4 3 2 0 2
4 4 1 2 2 2 1 3 3 1
Solucin
X F
0 1
1 3
2 8
3 5
4 3
Si x representa una variable, f representa la incidencia con la x se presenta en el conjunto de datos. As por ejemplo:
O se presenta una sola vez
1 se presenta tres veces
2 se presenta ocho veces: y as sucesivamente.
Distribucin de frecuencias agrupadas. En este caso la variable x tiene como universo un intervalo constituido por un
conjunto de valores contenidos entre dos lmites: inferior (Li) y superior (Ls) la diferencia entre estos dos limites
constituye la amplitud o longitud del intervalo y la media aritmtica de estos dos valores (Ls + Li) / 2 constituye el la
marca de clase.
Para ilustrar este procedimiento para agrupar o clasificar, se considerara una muestra de 50 puntajes del examen final
del curso de estadstica. La tabla presenta los cincuenta puntajes.
60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 68 97 70 64 70 70
58 78 89 44 55 85 82 83 72 77
72 86 50 94 92 80 91 75 76 78
Procedimiento.
1. Identifique los puntajes mximo y mnimo (Mx = 98 , Min = 39) y determine el Rango
Rango = Mx Min Rango = 98 39 Rango = 59
M Li Ls X f xf
1 35 45 40 2 80
2 45 55 50 2 100
3 55 65 60 7 420
4 65 75 70 13 910
5 75 85 80 11 880
6 85 95 90 11 990
7 95 105 100 4 400
50 3780
x
x 6 3 8 6 4 5.4
n 5
La media aritmtica de esta muestra es 5.4
x
fMi i
Dnde: Mi : Marca de clase
n
fi : frecuencia
n : nmero total de datos ( n fi )
Ejemplo para los datos agrupados:
M Li Ls X f xf
1 35 45 40 2 80
U.C.V. Mtodos Estadsticos 10 Ing. Norman Vsquez Quispe
2 45 55 50 2 100
3 55 65 60 7 420
4 65 75 70 13 910
5 75 85 80 11 880
6 85 95 90 11 990
7 95 105 100 4 400
50 3780
x
fMi i
x
3780
x 75.6
n 50
xz
f .t Donde z Media elegida arbitrariamente
n
Mi : Marca de clase
t Mi z
Mi f Z t ft
40 2 60 -20 -40
50 2 60 -10 -20
60 7 60 0 0
70 13 60 10 130
80 11 60 20 220
90 11 60 30 330
100 4 60 40 160
50 780
z 60
f .t 780
n = 50
780
x 60 x 75.6
50
De igual manera:
z 80
f .t 220
n = 50
X f Z t ft
40 2 80 -40 -80
50 2 80 -30 -60
60 7 80 -20 -140
70 13 80 -10 -130
80 11 80 0 0
90 11 80 10 110
100 4 80 20 80
50 -220
220
x 80 x 75.6
50
U.C.V. Mtodos Estadsticos 11 Ing. Norman Vsquez Quispe
Media ponderada
En muchas ocasiones los datos no agrupados, se presenta el caso de que cada elemento no es considerado
equivalente en valor a otro. El caso tpico es la de los datos que corresponden a las notas de una determinada
asignatura, que corresponden a su vez a las diferentes evaluaciones aplicadas mismas que no tienen el mismo
nivel de dificultad y trascendencia en el conocimiento de la asignatura; por lo que se les da pesos diferentes ( n )
el mismo que en el momento de los clculos funciona como la frecuencia ( f ) por lo que la suma de los pesos
equivale a la suma de los pesos.
x
x n i i
Dnde: ni : Peso ponderado
n i
xi : Dato
N ni
Ejemplo: Calcule la media ponderada para la siguiente informacin
Prom Peso
Asignaturas xi ni xi . ni
Mecnica 18 3 54
Qumica 16 3 48
Fsica 11 4 44
Matemtica 17 5 85
Idiomas 15 2 30
Humanidades 14 3 42
20 303
x n 303
i i
n 20
i
x
x n i i
303
x 15.15
n i 20
Nota: Cuando n: nmero de elementos del conjunto de datos es par, la posicin de la mediana es un nmero
decimal, en este caso la mediana es la semisuma de los datos de dicha vecindad.
Nota: Cuando dos o mas datos estn empatados en su nmero de ocurrencia, entonces la muestra no tiene
moda, de igual manera, si en una muestra todos los datos no se repiten no existe muestra.
Moda para datos agrupados
Esta dada por la marca de clase que tiene la mas alta frecuencia
= 1 . 2 . 3 . . . 1 . =
= =1 = [ =1 ]1/
En ocasiones cuando el nmero de elementos de la muestra es demasiado elevado o son datos grandes, establecer
el producto desborda la capacidad de la calculadora y/o computadora, es decir la frmula es inmanejable por lo
que hay la necesidad de logaritmar el proceso de la siguiente manera.
U.C.V. Mtodos Estadsticos 13 Ing. Norman Vsquez Quispe
= 1 . 2 . 3 . . . 1 .
= (1 . 2 . 3 . . . 1 . )1/
( ) = (1 . 2 . 3 . . . 1 . )1/
1
( ) =
(1 . 2 . 3 . . . 1 . )
=1
( ) =
1
= 10 =1
1
=1
= Donde e = 2.718281828459
M g n f1 .M 1 . f 2 .M 2 . f 3 .M 3 ..... f n1 .M n1 . f n .M n
n
Mg n f .M
i 1
i i
n
Como de haba visto que en ocasiones el producto fMi 1
i i es inmanejable, se hace necesario loga ritmar (base
10 o e)
f .Log.M
i i
Log.M g i 1
n
f i .Log .M1 f i . Ln .M i
Mg 10 n
Mg e n
Caractersticas
Es un valor calculado que depende del valor de los grupos o clase.
Es menos afectada por los valores extremos (Max y Min) que la Media Aritmtica
Para una misma distribucin es siempre menos que la media aritmtica.
Ventajas
Es un promedio ms tpico que la media aritmtica debido a que es menos afectada por los extremos
Puede ser manipulado algebraicamente
Es til para calcular nmeros ndices
Desventajas
No es muy conocida.
Su clculo es relativamente difcil
Es imposible determinarlo cuando uno de sus valores es cero o negativo.
x 2
i
MC i 1
f .M i i
2
MC i 1
n n
Ma Ma n
1 1 1 1 1 1
...
x1 x2 x3
xn1 xn x
i 1 i
n n
Ma Ma n
f1 f f f f fi
2 3 ... n1 n
M1 M 2 M 3 M n1 M n
M
i 1 i
Ejemplo:
Con la informacin hipottica presentada a continuacin ( 75 datos )
Para datos agrupados y no agrupados, y por los diferentes mtodos estudiados, calcule:
a) Media b) Mediana c) Moda d) Media geomtrica
e) Media cuadrtica f) Media armnica.
Solucin:
Datos calculados
n = 75
Max = 155
Min = 39
75
x
i 1
i 7272
75
x
i 1
2
1 783602
U.C.V. Mtodos Estadsticos 15 Ing. Norman Vsquez Quispe
75
Log ( x )
i 1
i 146.9971
75
1
x
i 1
0.88039
i
a) Media aritmtica
75
x i
7272
x i 1
x x 96.96
N 75
Sea z 107
t = xi - z
n Li Ls xi Fi Z t ft
1 35 51 43 6 107 -64 -384
2 51 67 59 10 107 -48 -480
3 67 83 75 13 107 -32 -416
4 83 99 91 12 107 -16 -192
5 99 115 107 11 107 0 0
6 115 131 123 7 107 16 112
7 131 147 139 10 107 32 320
8 147 163 155 6 107 48 288
75 -752
f .t = - 752
i i
x z
f .t i i
x 107
752
x 96.9733
N 75
b) Mediana
n 1 75 1
Posicion Posicion Posicin = 38
2 2
Luego: x 94 Dato que corresponde al dato 38
c) Moda
d) Rango Medio
e) Media geomtrica ( Mg )
Log ( Mg )
Log ( x ) i
N
f i . Log . x1
Mg 10 N
Mg 101.068802 Mg 91.19289
U.C.V. Mtodos Estadsticos 16 Ing. Norman Vsquez Quispe
f) Media cuadrtica ( Mc )
n
x 2
i
783602
MC i 1
Mc Mc 102.2156
n 75
g) Media armnica ( Ma )
n 75
Ma n
Ma Ma 81.18954
1
0.88039
i 1 x i
Clculo de m:
m = 1 + 3.3 Log ( 75 ) m = 8
Calculo de c
N Li Ls xi fi fixi xi fi / xi fi.Log(xi)
1 35 51 43 6 258 1849 0.139535 9.8008107
2 51 67 59 10 590 3481 0.169492 17.70852
3 67 83 75 13 975 5625 0.173333 24.375796
4 83 99 91 12 1092 8281 0.131868 23.508497
5 99 115 107 11 1177 11449 0.102804 22.323222
6 115 131 123 7 861 15129 0.056911 14.629336
7 131 147 139 10 1390 19321 0.071942 21.430148
8 147 163 155 6 930 24025 0.03871 13.14199
75 7273 89160 0.884594 146.91832
a) Media aritmtica
x
f .x i i
x
7273
x 96.9733
N 75
b) Mediana
91 107 x
x 99
2
Corresponde a la 4.5 posicin
c) Moda
x = Media - 3 ( Media Mediana )
x = 96.9733 - 3 ( 96.9733 99) x = 103.053
U.C.V. Mtodos Estadsticos 17 Ing. Norman Vsquez Quispe
Practica calificada
El siguiente conjunto de datos corresponden a las ventas mensuales de igual nmero de tiendas comerciales. Calcule:
365 740 850 765 915 650 905 140 165 525 314 310 127 125 862
35 305 380 445 400 825 690 570 35 815 465 465 749 745 438
685 275 645 685 485 660 890 740 890 125 469 465 459 455 177
325 425 920 510 665 510 120 645 375 820 211 210 399 395 937
225 50 695 210 110 230 90 575 775 160 253 250 585 585 223
935 735 95 385 470 190 225 140 185 785 936 935 502 500
850 840 850 400 290 645 295 805 435 455 385 385 105 105
635 265 635 240 550 530 915 495 865 780 541 540 129 125
265 550 430 85 765 745 660 295 335 575 804 800 782 780
880 870 515 935 350 555 570 925 670 370 383 380 101 100
Barra de frecuancias
25
20
20 18 18
17
16
14 14 14 14
Frecuencia
15
10
0
1
Intervalos
35 137 137 239 239 341 341 443 443 545 545 647 647 749 749 851 851 953
N Li Ls xi fxi Fx
1 35 137 86 17 1462
2 137 239 188 14 2632
3 239 341 290 14 4060
4 341 443 392 18 7056
5 443 545 494 20 9880
6 545 647 596 14 8344
7 647 749 698 14 9772
8 749 851 800 18 14400
9 851 953 902 16 14432
145 72038
X = 496.8
U.C.V. Mtodos Estadsticos 18 Ing. Norman Vsquez Quispe
n xi Pi Log ( xi ) n = 50
1 39 39 1.59106461 Max = 98
2 44 1716 1.64345268 Min = 39
3 47 80652 1.67209786
4 50 4032600 1.69897 S = 3746 Sumatoria
5 55 221793000 1.74036269 P = 1.997E+93 Productos
6 58 1.286E+10 1.76342799 S(Log(xi) = 93.30037
7 58 7.461E+11 1.76342799
8 60 4.477E+13 1.77815125
9 63 2.82E+15 1.79934055 Media
10 64 1.805E+17 1.80617997 X = 74.92
11 64 1.155E+19 1.80617997
12 66 7.624E+20 1.81954394 Mediana
13 67 5.108E+22 1.8260748 x = 75.5 25.5
14 68 3.474E+24 1.83250891
15 68 2.362E+26 1.83250891 Moda
16 70 1.653E+28 1.84509804 X =
17 70 1.157E+30 1.84509804
18 70 8.102E+31 1.84509804 Mg = 73.4526383
19 72 5.833E+33 1.8573325 73.4526383
20 72 4.2E+35 1.8573325
21 72 3.024E+37 1.8573325
22 72 2.177E+39 1.8573325
23 74 1.611E+41 1.86923172
24 74 1.192E+43 1.86923172
25 75 8.942E+44 1.87506126
26 76 6.796E+46 1.88081359
27 77 5.233E+48 1.88649073
28 77 4.029E+50 1.88649073
29 77 3.103E+52 1.88649073
30 78 2.42E+54 1.8920946
31 78 1.888E+56 1.8920946
32 80 1.51E+58 1.90308999
33 82 1.238E+60 1.91381385
34 82 1.015E+62 1.91381385
35 83 8.428E+63 1.91907809
36 85 7.164E+65 1.92941893
37 86 6.161E+67 1.93449845
38 86 5.298E+69 1.93449845
39 88 4.662E+71 1.94448267
40 88 4.103E+73 1.94448267
41 89 3.652E+75 1.94939001
42 90 3.286E+77 1.95424251
43 90 2.958E+79 1.95424251
44 91 2.692E+81 1.95904139
45 92 2.476E+83 1.96378783
46 94 2.328E+85 1.97312785
47 95 2.211E+87 1.97772361
48 95 2.101E+89 1.97772361
U.C.V. Mtodos Estadsticos 19 Ing. Norman Vsquez Quispe
49 97 2.038E+91 1.98677173
50 98 1.997E+93 1.99122608
Media Aritmtica o Promedio ( X )
Desviacin con respecto a la media ( DM )
a) Para datos no agrupados: b) Para datos
agrupados a) Para datos no agrupados b) Para datos
agrupados
n
x
n
i M .f i i
n
x x
X i 1
X i 1 i
n n
DM i 1
f
i 1
i n
n
n
i 1
i a) Para datos no agrupados
2
b) Para datos agrupados
n
xi
xi2 i 1
n
Distribucin de frecuencias
n
2 i 1
Clculo del Rango ( R ) Clculo de numero de n 1
intervalos ( m ) 2
n
M i fi
M i2 f i i 1 n
n
R
VMax VMin
m
VMax VMin
1 3.3.Log (n) m
i 1
fi
2 n
i 1
Ls Li
Mi Desviacin Estndar
2
2
n
M i fi
M i2 f i i 1 n
n
i 1
fi
n
i 1
f
i 1
i 1
n xy x. y
r
n x x n y y
2 2
2
2 n
M i fi
n
xi
M i2 f i i 1 n
n
xi2 i 1
n
n
i 1
fi
2 i 1 2 i 1
n 1 n
f
i 1
i 1
Desviacin Estndar
2
n
M i fi
M i2 f i i 1 n
n
i 1
fi
n
i 1
f
i 1
i 1
Cuartiles
Los cuartiles dividen al conjunto de datos en cuatro partes iguales: el primer cuartil Q1 separa al 25%, que abarca los
valores ms pequeos, del 75% restante, constituidos por los que son mayores. El segundo cuartil Q2 es la mediana:
50% de sus valores son menores que la mediana y 50% son mayores. El tercer cuartil Q3 separa al 25%, que abarca a
los valores ms grandes, del 75% restante constituido por los que son menores.
Primer cuartil Q1
El 25% de los valores son menores que el primer cuartil Q1, y el 75% son mayores que el primer cuartil Q1.
+1
1 = Valor clasificado
4
Tercer Cuartil Q3
El 75% de los valores son menores que el tercer cuartil Q3 y el 25% so mayores que el tercer cuartil Q3
3(+1)
3 = Valor clasificado
4
Regla 2. Si el resultado es una fraccin de mitad (2.5, 7.5 etctera), entonces el cuartil es igual al promedio de los
valores clasificados correspondientes.
Por ejemplo, si el tamao de la muestra es n= 9 el primer cuartil Q1 es igual al valor clasificado como ( 9 + 1 ) / 4 =
2.5, la mitad entre los valores clasificados como segundo y tercero
.
Regla 3. Si el resultado no es un nmero entero ni una fraccin de mitad, se redondea al entero ms cercano y se
selecciona ese valor clasificado.
Por ejemplo, si el tamao de la muestra es n = 10, el primer cuartil es igual a ( 10 + 1 ) / 4 = 2.75 se redondea el
2.75 a 3 y se utiliza el valor clasificado como tercero.
P1. Mediante el Ms Excel, genere una poblacin y/o muestra de 240 trminos xi entre los limites [ 117 , 973 ],
luego:
a. Ordena la informacin siguiendo el algoritmo correspondiente, y luego calcula las Medidas de tendencia
Central para datos no agrupados y agrupados:
b. Media o promedio
c. Media geomtrica
d. Mediana
e. Moda
f. Media cuadrtica
g. Media armnica
SOLUCIN
Poblacin y/o muestra generada de 294 trminos
164095
=
294
= 558.15
Para datos agrupados
= =1
164178
=
294
= 558.429
Observacin: Los promedios para datos no
agrupados y agrupados no son iguales, existe una
ligera diferencia. La exacta se obtiene con datos no
agrupados
c. Media geomtrica
Para datos no agrupados
1 1
=1
=1
= 10 = Donde e = 2.718281828459
n
Mg n f .x
i 1
i i
n
Como de haba visto que en ocasiones el producto fx
i 1
i i es inmanejable, se hace necesario loga ritmar (base 10
o e)
f .Log.M
i i
Log.M g i 1
n
f i .Log .M1 f i . Ln .M i
Mg 10 n
Mg e n