Documentos de Académico
Documentos de Profesional
Documentos de Cultura
APUNTES DOCENTES
ASIGNATURA: ESTADSTICA
VERSIN 12
FECHA: 2015
Pgina
VERSIN 12
FECHA: 2015
Pgina
Introduccin
La estadstica es una herramienta de mxima utilidad para todos aquellos que tienen que tomar decisiones,
en condiciones de riesgo, porque suministra un mtodo cientfico para recolectar y luego extraer informacin
de los datos relacionados con una situacin o fenmeno que sea del inters de la persona o equipo de
personas que buscan optimizar el uso de los recursos de las unidades econmicas o sociales que dirigen.
Para facilitar y agilizar el proceso de enseanza-aprendizaje de la asignatura de Estadstica, es conveniente
contar con un material de apoyo cercano al desarrollo del programa institucional de esta asignatura y
ubicado en el contexto en el cual ejercern su actividad los egresados de los programas de tecnologa
La finalidad de estos Apuntes de Estadstica es reducir la dependencia exagerada de los notas que toman
los estudiantes en clase, suministrando un material de apoyo conceptual para la asignatura de Estadstica,
que sea gil, intuitivo y veraz, que se convierta en una gua clara y amigable para adquirir las competencias
de la asignatura.
Estos apuntes, se desarrollan de manera paralela al programa de la asignatura, por lo que. lo mismo que
sta, se compone de cinco unidades: las tres primeras se refieren a la estadstica descriptiva y la cuarta y
quinta a Estadstica Inferencial.
VERSIN 12
FECHA: 2015
Pgina
VERSIN 12
FECHA: 2015
Pgina
1.6
1.7
VERSIN 12
FECHA: 2015
Pgina
EJEMPLOS RESUELTOS......................................................................................................................................... 62
REGRESIN Y CORRELACIN....................................................................................................... 79
VERSIN 12
FECHA: 2015
Pgina
4.1
4.2
4.3
4.4
4.5
4.6
BIBLIOGRAFA............................................................................................................................... 100
VERSIN 12
FECHA: 2015
Pgina
VERSIN 12
FECHA: 2015
Pgina
LOS FENMENOS
Una de las aplicaciones de la estadstica es describir el comportamiento de los fenmenos en los que se
interesan los seres humanos, por lo que es importante precisar que se entiende, en esta ciencia, por
fenmenos.
Un fenmeno es cualquier manifestacin de las actividades humanas o de la naturaleza que puede ser
percibido por los sentidos o la razn.
Algunos ejemplos de fenmenos son los siguientes:
El crecimiento de una planta
El comportamiento del clima
Las ventas por periodo de una empresa
Las personas, por da, que son afectadas por una enfermedad
Los accidentes de trnsito en diferentes lugares de una ciudad
La variacin mensual del costo de vida
Palabras sinnimas de fenmeno son: suceso, hecho o acontecimiento
1.1.2
Por muchos motivos los seres humanos desean poseer informacin sobre el comportamiento de diversos
fenmenos y para ello realizan registros sobre el estado de estos fenmenos en diferentes momentos o
espacios.
Siempre que sea viable extraer datos de un fenmeno, es posible, utilizando algn proceso, convertir estos
datos en informacin y es esta informacin la que nos permite tomar decisiones eficientes, es decir, elegir la
alternativa ms favorable dentro de una amplia gama de posibilidades.
VERSIN 12
FECHA: 2015
Pgina
Estos registros o mediciones generan diversos volmenes de datos y para que estos datos se conviertan en
informacin se deben procesar de diferentes maneras. Una de las formas como se pueden tratar los datos
para extraer la informacin que ellos contienen es utilizando las tcnicas estadsticas
1.1.3
DEFINICIN DE ESTADSTICA
Es una ciencia que estudia cmo debe emplearse informacin para facilitar la toma de decisiones en
situaciones prcticas que se manifiestan bajo incertidumbre
1.1.4
IMPORTANCIA DE LA ESTADSTICA
La actividad ms importante para las personas que trabajan en las organizaciones empresariales es la toma
de decisiones. Dado el enorme aumento de la disponibilidad de datos (gracias a los sistemas de
informacin), y dada la complejidad creciente de las operaciones empresariales, los procesos de decisin se
ven sometidos a presiones extraordinarias.
Una de las tcnicas ms valiosa que ayudan en los procesos de toma de decisiones es la Estadstica. Por lo
que es indispensable que los hombres y mujeres que dirigen organizaciones o que de alguna manera
participan en la toma de decisiones estn familiarizados con las tcnicas estadsticas para poder determinar
cundo se puede examinar un problema existente mediante la aplicacin del anlisis estadstico.
1.1.5
DIVISIN DE LA ESTADSTICA
1.1.6
ESTADSTICA DESCRIPTIVA
Son los conocimientos y mtodos que tratan de la recoleccin, organizacin y presentacin numrica y
grfica de los datos.
Los anlisis que se hacen con las herramientas de la estadstica descriptiva se limitan, nicamente, al
VERSIN 12
FECHA: 2015
Pgina
10
INFERENCIA ESTADSTICA
1.1.8
Las fases o pasos que se deben incluir en un estudio estadstico son muy variadas y dependen de diferentes
circunstancias, tales como, los objetivos que se pretenden alcanzar o el contexto en que se realiza la
investigacin. Aqu se presenta una de estas posibilidades:
1. Planeamiento
Fin de la investigacin
Definir la poblacin
Unidad de investigacin
Naturaleza o clase de los datos
Fuentes de la informacin
Procedimiento para recolectar los datos
Diseo de instrumentos
Presupuesto
2. Recoleccin de los datos
3. Crtica y codificacin
4. Tabulacin, grficas y medidas
5. Anlisis e interpretacin
La fase de planeamiento es la ms importante de todo el proceso; de la correcta elaboracin y desarrollo, de
las etapas que componen esta fase, depende la calidad de los resultados que se obtengan.
El fin de la investigacin se refiere al resultado concreto que se va a obtener del estudio estadstico.
Usualmente se formula en forma de una pregunta que se llama Pregunta de Investigacin.
Los conceptos de: Poblacin y Unidad de Investigacin se tratarn en el siguiente mdulo.
Todos los datos, que se recolectan sobre un fenmeno, se pueden clasificar bsicamente en dos categoras:
datos de naturaleza cualitativa y datos de naturaleza cuantitativa.
Los datos de naturaleza cualitativa o datos cualitativos, son los que se registran en forma de palabras, tales
como, el estado civil de las personas, las profesiones u oficios de las personas o el nivel educativo.
Las fuentes de informacin de donde se pueden obtener los datos son de dos clases:
Fuentes de informacin primarias
Fuentes de informacin secundarias
Las fuentes de informacin son primarias cuando los datos, que se procesan, los han obtenido,
directamente, los realizadores del estudio.
Las fuentes de informacin son secundarias cuando los datos, que se procesan, se han obtenido a travs de
VERSIN 12
FECHA: 2015
Pgina
11
VERSIN 12
FECHA: 2015
Pgina
12
CONCEPTOS BSICOS
Para iniciar el estudio de la estadstica, se requiere precisar el significado, que tienen en esta ciencia, ideas,
palabras y conceptos que en otros campos o en nuestras actividades cotidianas, tienen sentidos que van
desde ligeramente diferentes a diametralmente opuestos.
1.2.1
DATO
En trminos generales un dato es un registro o anotacin que se hace del estado de un fenmeno en un
momento determinado
1.2.2
ELEMENTO
VERSIN 12
FECHA: 2015
Pgina
13
EJEMPLOS DE ELEMENTOS
En una investigacin sobre el comportamiento de los salarios de trabajadores los elementos son los
trabajadores (personas), y la caracterstica que se observa a cada elemento es el valor de su salario.
En una investigacin sobre comportamiento de las ventas de una comercializadora los elementos
podran ser las facturas (un objeto), y la caracterstica observada es el valor de cada factura.
Tambin, En una investigacin sobre comportamiento de las ventas de una comercializadora los
elementos podran ser los meses (un suceso), y la caracterstica observada el valor de las ventas de
cada mes
En una investigacin sobre los accidentes de trnsito los elementos son los accidentes (un suceso), y la
caracterstica observada podra ser el nmero de personas lesionadas por accidente observado
Los fenmenos se producen cuando el estado de las caractersticas observadas vara, usualmente, de un
elemento a otro
1.2.4
POBLACIN
En estadstica el concepto de Poblacin es mucho ms amplio que el que se utiliza en el lenguaje corriente.
En esta ciencia, cuando se habla de Poblacin nos referimos a:
Todos los elementos que presentan una caracterstica comn
Es el conjunto de todos los elementos que hacen parte de una situacin que se est estudiando y sobre la
cual se intenta sacar conclusiones
Las poblaciones se deben definir con toda claridad de tal manera que no exista confusin sobre si un
determinado elemento pertenece o no a la poblacin
1.2.5
Las poblaciones se deben definir con toda claridad de tal manera que no exista confusin sobre si un
determinado elemento pertenece o no a la poblacin. Para facilitar esta definicin, en muchos casos, las
palabras que la componen se pueden ordenar de acuerdo a la siguiente sintaxis:
TODOS(AS) + DESCRIPCIN DEL ELEMENTO + CONDICIN RESTRICTIVA
Significa que una definicin de poblacin debe empezar por la palabra Todos o Todas seguida de una
descripcin del elemento que se est observando mas una restriccin al alcance de la palabra Todos(as)
EJEMPLO
En un estudio del nivel salarial de los operarios del sector de confecciones de la ciudad, una definicin de
poblacin podra ser la siguiente:
Todos los operarios del sector de confecciones de la ciudad
1.2.6
Es el nmero total de elementos que componen una poblacin. El tamao de una poblacin se suele
representar por la letra N
VERSIN 12
FECHA: 2015
Pgina
14
CLASES DE POBLACIONES
VERSIN 12
FECHA: 2015
Pgina
15
VERSIN 12
FECHA: 2015
Pgina
16
CENSO
Es cuando se observa y registra el estado de una caracterstica examinado a todos los elementos de una
poblacin
Los censos rara vez se realizan debido al tiempo que demandan y a la cantidad de recursos que necesitan
por lo que se recurre a tomar datos del estado de la variable en algunos de los elementos de la poblacin
1.2.10 MUESTRA
Es cuando se observa y registra el estado de una caracterstica variable examinado a una parte de los
elementos que pertenecen a una poblacin
Las muestras deben ser representativas y para esto se requiere que las caractersticas de la poblacin estn
representadas en la muestra, en la misma proporcin en que estn incluidas en la poblacin.
1.2.11 TAMAO DE LA MUESTRA
Es el nmero de elementos que componen la muestra. Se suele indicar con la letra n
EJEMPLO:
Para indicar que una muestra tiene 350 elementos se indica as: n = 350
1.2.12 PARMETRO
Es el resultado de una medida o clculo que se hace utilizando los datos relacionados con el valor que toma
una caracterstica variable cuando se observan todos los elementos de una poblacin, es decir, cuando se
hace un censo. Por ejemplo, la edad promedio de los nios que cursan primer grado, este ao, en todas las
VERSIN 12
FECHA: 2015
Pgina
17
VERSIN 12
FECHA: 2015
Pgina
18
Estadstico
Comportamiento variable
Un muestreo
Un estudio observacional
Segundo caso
la cooperativa de ahorro y crdito COOPERCRDITO, encuest a todos sus 750 afiliados, preguntando lo
siguiente:
Cunto tiempo hace que est afiliado a la cooperativa?
Cuntos crditos ha solicitado en el ltimo ao?
Califique de 1 a 5 el servicio que recibe de la cooperativa, donde 1 es psimo, 3 es regular y 5 es
excelente.
a) Cules son los elementos de este estudio?
b) Defina la poblacin en estudio
c) De qu tipo es esta poblacin?
d) Se realiz un censo o un muestreo?
e) Cul es el tamao de la poblacin?
f) Cul es el tipo exacto de cada una de las variables del estudio?
g) Cules son las categoras de cada una de las variables cualitativas?
h) Cmo se pueden categorizar cada una de las variables cuantitativas?
i) S como mximo los afiliados han solicitado 5 crditos en el ltimo ao Cmo se llama en estadstica a
este valor?
j) Qu comportamiento tiene el valor del punto anterior?
k) Qu tipo de estudio se realiz?
SOLUCIN
a) Los afiliados
b) Todos los afiliados a la cooperativa COOPERCRDITO
c) Finita
d) Un censo
e) N = 750
f) Tiempo de afiliacin Continua
Crditos solicitados Discreta
Calificacin del servicio Ordinal
g) Calificacin del servicio: 1, 2, 3, 4, 5
h) Tiempo de afiliacin, por ejemplo: de 0 a 2 aos
de 2 a 4 aos
de 4 a 6 aos, etc.
Crditos solicitados, por ejemplo: de 0 a 1 crditos
de 2 a 3 crditos
de 4 a 5 crditos, etc.
VERSIN 12
FECHA: 2015
Pgina
19
Parmetro
Es una constante
Un estudio observacional
VERSIN 12
FECHA: 2015
Pgina
20
1.3.1
INTRODUCCIN
Para visualizar las caractersticas de una situacin representada por un conjunto de datos o establecer el
patrn de comportamiento de esta situacin, los datos se deben organizar de alguna manera. La Estadstica
propone una metodologa que consiste en agrupar los datos recolectados en conjuntos de categoras o
clases estadsticas y con este conjunto construir una tabla que se llama Distribucin de Frecuencias
1.3.2
En general, una clase o categora es un conjunto de elementos que tienen una o varias caractersticas en
comn, por ejemplo, las personas que compiten en algn deporte pertenecen a la clase de los deportistas,
las personas mayores de 60 aos pertenecen a la clase de la tercera edad
1.3.3
En estadstica se llama clase, nicamente, a un conjunto de datos que estn dentro de un intervalo
determinado de valores. Por ejemplo, para datos correspondientes a ingresos de personas podemos crear
una clase de las personas que tienen ingresos entre $500.000 y $800.000. Toda clase estadstica tiene, por
lo tanto, un lmite inferior ( $500.000 ), y un lmite superior ( $800.000 )
1.3.4
Es la distancia o diferencia que hay entre los lmites de una clase. En el ejemplo anterior la amplitud de la
clase de ingresos es de $300.000. Es decir, que para calcular la amplitud de clase se resta del lmite
superior de la clase el lmite inferior.
Para expresar estas ideas en smbolos, llamamos A a la amplitud de la clase, LS al lmite superior de la clase
y LI al lmite inferior de la clase, expresando aritmticamente la amplitud de la clase as:
=
Para el ejemplo:
Un conjunto de clases o categoras es considerado como un conjunto de clases estadstico s todas las
clases, del conjunto, tienen, simultneamente, las siguientes tres caractersticas:
Amplitud constante
Mutuamente excluyentes
Exhaustivas
Amplitud constante se refiere a que la amplitud de todas las clases de un conjunto de clases en que se
agrupa un determinado grupo de datos debe ser la misma para todo el conjunto.
VERSIN 12
FECHA: 2015
Pgina
21
NMERO DE CLASES
Una de las primeras inquietudes que surge cuando se van a agrupar un conjunto de datos en clases
estadsticas es en cuantas clases es conveniente o adecuado agrupar estos datos. Hay dos criterios para
resolver este problema como se presenta en la siguiente grfica:
Los criterios propios se aplican cuando una circunstancia tcnica o alguna otra razn hacen deseable un
determinado nmero de clases para agrupar los datos del fenmeno en estudio. Tambin, se aplican criterios
propios cuando se desea facilitar la comparacin del estudio actual con otro realizado en alguna poca
anterior.
El criterio del volumen de datos se refiere a que el nmero de clases en que se van a agrupar los datos, de
algn fenmeno en estudio, depende exclusivamente, de la cantidad de datos que se hayan recolectado
sobre ese fenmeno.
En general, las alternativas, ms usuales, cuando se aplica el segundo criterio son:
La norma emprica de la estadstica indica que el nmero de clases en que se deben agrupar cualquier
conjunto de datos debe ser como mnimo 5 6 clases y como mximo alrededor de 20 clases
La frmula exponencial que tiene la siguiente expresin: 0 = 2
La frmula logartmica que tiene la siguiente expresin: 0 = 1 + 3,3()
En la expresin, = 0. es la abreviatura de nmero de clases y indica la cantidad de
clases en que, segn esta expresin, se deben agrupar los datos.
Por ejemplo, para un estudio que contiene 155 datos esta expresin funciona as:
VERSIN 12
FECHA: 2015
Pgina
22
S = 7 clases, entonces,
es conveniente.
0 = 27 = 128
= 8,23
Otros criterios pueden ser, por ejemplo, nmeros de clases que hacen que los lmites de las clases sean
muy fciles de establecer o que las clases automticamente queden mutuamente excluyentes.
1.3.7
EJEMPLO PRCTICO
La siguiente tabla se refiere a los galones de gasolina corriente que tanquearon la semana pasada, en un
autoservicio, una muestra de vehculos escogidos al azar
3,8
1,7
2,8
2,0
2,5
1,8
2,9
3,6
2,2
3,0
2,8
4,7
3,3
6,9
5,0
2,6
4,0
2,7
4,1
3,4
4,8
5,3
4,9
3,0
3,9
2,0
5,6
2,3
4,5
2,9
6,1
3,0
1,9
6,4
2,6
2,0
2,0
2,6
3,1
Este ejemplo es til para fines de aprendizaje, porque en situaciones reales, se suelen manejar volmenes
de datos muy superiores al del presente ejemplo
1.3.8
MTODO ESTADSTICO
Como se dijo al comienzo de este tema, para describir una situacin representada por un conjunto de datos, como el
anterior, la estadstica propone agrupar los datos en un conjunto de clases o categoras y con este conjunto construir
una tabla que se llama Tabla de Frecuencias o Distribucin de Frecuencias.
Para realizar este proceso se deben resolver, en primera instancia, las siguientes preguntas:
De qu tipo es la variable?
En cuntas clases o categoras es ms conveniente agrupar los datos?
Cul es la amplitud de clases ms conveniente?
Cules deben ser los lmites de la primera clase?
VERSIN 12
FECHA: 2015
Pgina
23
Calcular el Rango, R o distancia entre el valor ms pequeo y el valor ms grande de los datos de la
muestra con la expresin: =
Una vez realizado el cuarto paso se agregan las dems clases, faltantes, teniendo en cuenta que para,
variable continua, el lmite superior de una clase debe coincidir con el lmite inferior de la siguiente.
Cuando se haya establecido el conjunto de clases en que se van a agrupar los datos del estudio, se debe
verificar que renan las tres condiciones de todo conjunto de clases estadstico.
1.3.10 DESARROLLO DEL EJEMPLO
1. Tipo de variable en estudio: en este caso es variable continua
2. Determinar el nmero de clases
Como se indic anteriormente el nmero de clases se puede determinar de acuerdo a los siguientes
criterios.
Por criterios propis: Cuando exista alguna circunstancia que haga conveniente o deseable un
determinado nmero de clases
Norma emprica: Se puede escoger cualquier nmero de clases entre 6 y 20 dependiendo del
criterio o preferencia personal del analista y se hacen varios tanteos hasta encontrar un nmero de
clases satisfactorio
Aplicando la frmula 0 = 2
Para = 5 clases, entonces,
es conveniente.
S = 6 clases, entonces,
conveniente de clases
0 = 25 = 32 como 32 < 39
0 = 26 = 64
0 = 1 + 3,3(39) = 6,25
quiere decir
VERSIN 12
FECHA: 2015
Pgina
24
TABLA No.1
No.C =
Xmax
6,9
Xmin
1,7
Xmax - Xmin =
R / No.C
6,9 - 1,7
= 5,2 / 6
5,2
= 0,86666667
S para modificar la amplitud, utilizamos el criterio de que debe tener la misma precisin de los datos del
estudio, entonces, en este caso, la amplitud debe ser igual a 0,8, pero, como hay ms dgitos despus del
primer decimal, siempre se ajusta hacia arriba, por lo que la amplitud modificada queda as:
Amod
0,9
( Rmod ),
Xmin, es decir:
Xmin = 1,7 0,2 = 1,5 por lo que el lmite inferior de la primera clase podra ser 1,5 como se
observa en la tabla No.2
VERSIN 12
FECHA: 2015
Pgina
25
No.
1
2
3
4
5
6
CLASES
1,5
2,4
2,4
3,3
3,3
4,2
4,2
5,1
5,1
6,0
6,0
6,9
FA
9
14
6
5
2
3
39
FAA
9
23
29
34
36
39
TABLA No.3
FR
0,23
0,36
0,15
0,13
0,05
0,08
1,00
Menor
Que
1,5
2,4
3,3
4,2
5,1
6,0
6,9
FRA
0,23
0,59
0,74
0,87
0,92
1,00
FRA
0
0,23
0,59
0,74
0,87
0,92
1,00
Frecuencia Absoluta FA: Es la cantidad de datos de la muestra que corresponden a cada clase. Se
obtiene por conteo
Frecuencia Absoluta Acumulada FAA: Se obtiene, para cada clase, sumando la frecuencia absoluta
de la clase, FA, con la frecuencia absoluta de la clase anterior
Frecuencia Relativa FR: Se calcula, para cada clase, dividiendo la frecuencia absoluta de la clase, FA,
entre el total de datos de la muestra. Es prctico que los valores de la frecuencia relativa se tomen con
dos decimales y su suma se ajuste para que d exactamente uno
Frecuencia Relativa Acumulada FRA: Se calcula, para cualquier clase, sumando la frecuencia relativa
de la clase, FR, con la frecuencia relativa de la clase anterior
VERSIN 12
FECHA: 2015
Pgina
26
HISTOGRAMA
0,40
0,36
FRECUENCIA RELATIVA
0,35
0,30
0,25
0,23
0,20
0,15
0,13
0,15
0,08
0,10
0,05
0,05
0,00
1.5
2.4
3.3
4.2
5.1
6.0
6.9
GALONES
Xi =
+
2
VERSIN 12
FECHA: 2015
Pgina
27
Xi =
1,5 + 2,4
2
1,95
Las marcas de clase se utilizan, tambin, cuando se requiere representar todos los valores de una clase por
un solo nmero. Por ejemplo, 1,95 galones representa todos los valores de la muestra que se encuentran
entre 1,5 galones y 2,4 galones
Se puede construir, entonces, con las marcas de clase, una tabla auxiliar de clculos que permita elaborar
fcilmente el polgono de frecuencias, como se presenta a continuacin:
TABLA AUXILIAR DE CLCULOS
Marca de
No.
CLASES
clase
FR
0
0,6
1,5
1,05
0,00
1
1,5
2,4
1,95
0,23
2
2,4
3,3
2,85
0,36
3
3,3
4,2
3,75
0,15
4
4,2
5,1
4,65
0,13
5
5,1
6,0
5,55
0,05
6
6,0
6,9
6,45
0,08
7
6,9
7,8
7,35
0,00
Obsrvese que la tabla tiene ahora 8 clases porque se han agregado dos clases, la nmero cero y la nmero
7. A estas clases se les llama clases falsas porque no hay observaciones para ellas; su finalidad es
presentar el polgono de frecuencias como una figura cerrada
POLGONO
DE FRECUENCIAS
0,36
FRECUENCIA RELATIVA
0,40
0,30
0,23
0,20
0,15
0,10
0,13
0,05
0,08
0,00
0,00
0,00
1,05
1,95
2,85
3,75
4,65 5,55
GALONES
6,45
7,35
Tanto el histograma como el polgono de frecuencias permiten visualizar algunas de las caractersticas de la
situacin o fenmeno que se est estudiando, tales como:
El rango de los datos
Alrededor de qu valores tienden a agruparse los datos
Valores de la muestra que se presentan con ms o menos frecuencia
A qu lado de la grfica parecen agruparse ms los datos
Los dems detalles de la construccin del polgono de frecuencias sern explicados por el docente en la
exposicin que haga sobre este tema
VERSIN 12
FECHA: 2015
Pgina
28
OJIVA
FRECUENCIA RELATIVA ACUMULADA
1,2
1,00
1
0,87
0,92
0,74
0,8
0,59
0,6
0,4
0,23
0,2
0
0
1,5
2,4
3,3
4,2
5,1
6,0
6,9
GALONES
Los detalles sobre la construccin de estos grficos sern explicados por el docente en la exposicin que
haga sobre este tema
1.3.21 LA INTERPOLACIN
En general, la interpolacin, es un mtodo de clculo para establecer el valor de la ordenada de un valor de
VERSIN 12
FECHA: 2015
Pgina
29
X0 = 4,2
X1 = 4,8
X2 = 5,1
Y0 = 0,74
Y1=
?
Y2 = 0,87
Y1= Y0 +
(1 0 )
(2 0 )
(Y2 - Y0)
Y1= 0,74 +
( 4,8 4,2 )
Esto quiere decir que el 83% de los vehculos de la muestra tanquearon menos de 4,8 galones, pero, como
se quiere saber es que porcentaje tanque ms de 4,8 galones, se debe restar el resultado anterior de 1
1 - 0,83 = 0,17 = 17% que es, entonces, porcentaje de vehculos de la muestra que tanquearon mas de
4,8 galones
VERSIN 12
FECHA: 2015
Pgina
30
1.4.1
Calcular el Rango, R o distancia entre el valor ms pequeo y el valor ms grande de los datos de la
muestra con la expresin: =
EJEMPLO PRCTICO
Una muestra de 41 das del nmero de transacciones que se realizan por da en un cajero automtico se
presenta en la siguiente tabla:
73
83
87
47
80
1.4.3
68
56
91
81
84
76
79
78
54
36
71
62
49
90
67
60
64
91
77
51
41
87
72
63
45
91
66
63
52
61
67
74
68
75
57
85
VERSIN 12
FECHA: 2015
Pgina
31
Norma emprica: Se puede escoger cualquier nmero de clases entre 6 y 20 dependiendo del
criterio o preferencia personal del analista y se hacen varios tanteos hasta encontrar un nmero de
clases satisfactorio
0 = 1 + 3,3(41) = 6,3 que indica que un nmero conveniente de clases para esta cantidad de
datos es de 6 clases.
No.C =
Xmax
91
Xmin
36
Xmax - Xmin
91 - 36
55
R / No.C
55 / 6
9,16666667
Amod
En el clculo anterior se puede observar que para construir la amplitud modificada, se borra toda la parte
decimal de la amplitud, A, calculada
Cuando la amplitud modificada es un nmero impar, las marcas de clase, que se utilizan para representar a
las clases, son valores fraccionarios, como ocurre en este ejemplo; esta situacin es incmoda porque no
refleja la realidad en los casos de variable discreta, por lo que se prefiere agrupar los datos en clases que
sean de amplitud par, como se presenta a continuacin, para el mismo ejemplo, donde la amplitud se cambi
de 9 transacciones por da a 8 transacciones por da, esto hace que el nmero de clases pase de 6 a 7
Amod = 8
4. Establecer los lmites de la primera clase:
El lmite inferior de la primera clase es
1.4.4
= 36
VERSIN 12
FECHA: 2015
Pgina
32
TABLA No.4
No.
1
2
3
4
5
6
7
CLASES
36
44
45
53
54
62
63
71
72
80
81
89
90
98
FA
2
5
6
9
9
6
4
41
FR
0,05
0,12
0,14
0,22
0,22
0,15
0,10
1,00
TABLA No.5
Menor
Que
36
45
54
63
72
81
90
99
FRA
0,05
0,17
0,31
0,53
0,75
0,90
1,00
FRA
0
0,05
0,17
0,31
0,53
0,75
0,90
1,00
Se observa, tambin, que el lmite inferior de cada clase es igual al lmite inferior de la clase anterior ms
uno. Tambin se puede ver que el lmite superior de la ltima clase, (98), no coincide con el Xmax, (91), de
los datos y el lmite inferior de la primera clase es el Xmin (36), de los datos.
Las clases construidas de esta manera se llaman CLASES CERRADAS, porque en cada clase se
contabilizan todos los datos incluidos entre los dos lmites de la clase. Sin embargo, estas clases, como se
puede observar, son de amplitudes constantes, mutuamente excluyentes y exhaustivas.
Tambin se observa que la tabla MENOR QUE, se construye de manera un poco distinta a como se hizo
para el caso de variable continua, ntese que el ltimo valor de la columna Menor Que, no es igual al lmite
superior de la ltima clase, sino a se valor ms uno .
1.4.5
REPRESENTACIN GRFICA
1.4.5.1 HISTOGRAMA
Para el caso de variable discreta el histograma, recibe tambin el nombre de DIAGRAMA DE FRECUENCIAS y
en l las clases se encuentran separadas, como se ve en el siguiente grfico:
DIAGRAMA DE FRECUENCIAS
Frecuencia Relativa
0,25
0,22
0,22
0,2
0,15
0,14
0,15
0,12
0,1
0,1
0,05
0,05
0
36 44
45 53
54 62
63 71
72 80
81 89
90 98
Nmero de transacciones
VERSIN 12
FECHA: 2015
Pgina
33
Diagrama de Frecuencias
Frecuencia relativa
0,25
0,22
0,22
0,20
0,15
0,14
0,15
0,12
0,10
0,10
0,05
0,05
0,00
40
49
58
67
76
85
94
Nmero de transacciones
Ahora es mucho ms fcil leer el diagrama de frecuencias, por ejemplo, en el 14% de los das de la muestra
se realizaron 58 transacciones, el nmero de transacciones por da menos frecuente, en la muestra, fue de
40 transacciones por da
1.4.5.2 POLGONO DE FRECUENCIAS
Se construye de la misma manera, a partir del diagrama de frecuencias y las marcas de clase, como se hizo
en el caso de variable continua. Ntese que en esta grfica se presenta una distorsin debido a que las
clases no son adyacentes
Polgono de Frecuencias
Frecuencia Relativa
0,25
0,22
0,22
0,2
0,15
0,14
0,15
0,12
0,10
0,1
0,05
0,05
0
0,00
0
31
40
49
58
67
76
85
94
103
Nmero de Transacciones
VERSIN 12
FECHA: 2015
Pgina
34
1,2
1,00
1
0,9
0,75
0,8
0,53
0,6
0,4
0,31
0,17
0,2
0,05
36
45
54
63
72
81
90
99
Nmero de transacciones
Se puede observar, la ojiva para variable discreta es una funcin discontinua, por lo que no tiene sentido
interpolar para este tipo de variable.
VERSIN 12
FECHA: 2015
Pgina
35
Cuando el intervalo de valores que toma la variable es reducido y la variable es discreta, es ms prctico
agrupar los datos en clases de amplitud cero, como se muestra en el siguiente caso. Aqu X simboliza los
valores que toma la variable que son al mismo tiempo las clases estadsticas. Estas clases cumplen con las
tres caractersticas de una clase estadstica: son de amplitud constante, son mutuamente excluyentes y son
exhaustivas
EJEMPLO
Se tom una muestra de 60 facturas registrando el nmero de errores por factura. Los resultados se
presentan en la siguiente tabla:
1
2
0
4
2
0
0
1
3
1
2
0
1
1
0
1
0
3
X
0
1
2
3
4
FA
25
19
10
4
2
60
2
1
0
0
3
1
FR
0,42
0,31
0,17
0,07
0,03
1,00
0
0
1
0
3
2
FAA
25
44
54
58
60
0
1
0
0
1
2
FRA
0,42
0,73
0,90
0,97
1,00
1
4
1
1
0
0
MENOR
QUE
0
1
2
3
4
5
0
0
2
0
2
1
0
0
2
0
2
1
1
0
0
1
0
1
FRA
0
0,42
0,73
0,90
0,97
1,00
Diagrama de Frecuencias
30
25
No. de facturas
25
19
20
15
10
10
4
0
0
2
No. de errores
VERSIN 12
FECHA: 2015
Pgina
36
1.6
Cuando la variable es cualitativa, el arreglo y presentacin de datos estadstico es limitado. Slo se pueden
construir distribuciones de frecuencias con las frecuencias absolutas y relativas y diagramas de frecuencias.
Adicionalmente, se utilizan en estos casos otros tipos de grficos como se presenta en el siguiente ejemplo:
EJEMPLO
Se interrog a una muestra de clientes de una cafetera sobre el tipo de bebida gaseosa que prefieren
obtenindose los siguientes resultados:
Cocacola
Quatro
Pepsicola
Cocacola
Postobn
Link
Postobn
Postobn
Pepsicola
Seven Up
Pepsicola
Cocacola
Cocacola
Quatro
Quatro
Link
Cocacola
Postobn
Pepsicola
Sprite
Pepsicola
Sprite
Cocacola
Postobn
Cocacola
Postobn
Cocacola
Postobn
Cocacola
Quatro
Pepsicola
Link
Cocacola
Postobn
Sprite
No.
1
2
3
4
5
6
7
CLASES
Cocacola
Link
Pepsicola
Postobn
Quatro
Seven Up
Sprite
FA
10
3
6
8
4
1
3
35
FR
0,29
0,09
0,17
0,23
0,11
0,03
0,08
1,00
Diagrama de Frecuencias
Frecuencia Relativa
0,35
0,3
0,29
0,23
0,25
0,2
0,17
0,15
0,11
0,09
0,1
0,08
0,03
0,05
0
Cocacola
Link
Sprite
Tipo de bebida
VERSIN 12
FECHA: 2015
Pgina
37
Seven Up
0,03
0,08
Sprite
0,29
0,11
Coca cola
Quatro
Postobn
0,23
Link
Pepsicola
0,09
0,17
VERSIN 12
FECHA: 2015
Pgina
38
EJERCICIOS RESUELTOS
Primer caso
El peso de las cajas que despacha una fbrica a sus clientes, en una muestra de 153 cajas escogidas al
azar, dio un valor mximo de 25,34 kilogramos y un peso mnimo de 10,47 kilogramos. Disee un conjunto
de 8 clases estadsticas para agrupar estos datos
SOLUCIN
No.C =
Xmax =
Xmin =
R=
A=
Amod =
Rmod =
Rmod-R =
X'min =
153
8
(8,20948)
25,34
10,47
14,87
1,85875
1,86
14,88
0,01
10,46
Clase
No.
1
2
3
4
5
6
7
8
Peso / caja
(Kilogramos)
10,46
12,32
12,32
14,18
14,18
16,04
16,04
17,90
17,90
19,76
19,76
21,62
21,62
23,48
23,48
25,34
Segundo caso
El nmero de citas por da que recibi un centro mdico, en una muestra de 139 das, escogidos al azar, dio
un valor mximo de 210 citas por da y un mnimo de 119 citas por da. Disee un conjunto de clases
estadsticas para agrupar estos datos
SOLUCIN
n
No.C =
Xmax =
Xmin =
R=
A=
Amod =
Amod(2) =
Amod(3) =
139
8 (8,07195)
210
119
91
11,375
11
10
12
Clase
No.
1
2
3
4
5
6
7
8
9
No. de citas
por da
119
129
130
140
141
151
152
162
163
173
174
184
185
195
196
206
207
217
Tercer caso
Las compras, del ao pasado, de una muestra de los
clientes de una empresa, se presenta en la tabla de la
derecha
a) Construya la columna de la frecuencia relativa, con
dos decimales y con el menor error de redondeo
posible y agregue tambin, la frecuencia relativa
acumulada
VERSIN 12
Clase
No.
1
2
3
4
5
6
7
8
No. de citas
por da
119
131
132
144
145
157
158
170
171
183
184
196
197
209
210
222
Ventas/cliente
(Millones de pesos)
10,3
12,1
12,1
13,9
13,9
15,7
15,7
17,5
17,5
19,3
19,3
21,1
21,1
22,9
FECHA: 2015
No. de
Clientes
10
28
20
13
11
8
7
97
Pgina
39
c)
S slo el 13% o menos de los clientes de esta muestra, del tercer punto, compraron ms de $20
millones, el ao pasado, el gerente de la empresa debe cambiar toda su estrategia de mercadeo. Qu
recomienda usted al gerente? Por qu?
SOLUCIN
a)
Ventas/cliente
(Millones de pesos)
10,3
12,1
12,1
13,9
13,9
15,7
15,7
17,5
17,5
19,3
19,3
21,1
21,1
22,9
No. de
Clientes
10
28
20
13
11
8
7
97
FR
0,10
0,29
0,21
0,14
0,11
0,08
0,07
1,00
FRA
0,10
0,39
0,60
0,74
0,85
0,93
1,00
b)
MENOR
QUE
FRA
10,3
0
12,1
0,10
13,9
0,39
15,7
0,60
17,5
0,74
19,3
0,85
21,1
0,93
22,9
1,00
Respuesta: El 74% de los clientes de la muestra compraron $17,5 millones o menos
c)
X0
19,3
Y0
X1
20
Y1
X2
21,1
Y2
0,85
0,93
Y'1 =
0,8811
1 - Y'1 =
0,1189
11,89%
Respuesta: S se debe cambiar la estrategia de mercadeo porque solamente el 12% de los clientes de la
muestra estn comprando ms de $20 millones
VERSIN 12
FECHA: 2015
Pgina
40
2.1.1
Anteriormente se vio que los fenmenos o hechos se pueden describir con tablas y grficos. En esta unidad
aprenderemos que tambin se pueden describir con nmeros.
2.1.2
En estadstica se llama medida a un clculo o proceso que se realiza sobre un conjunto de datos para
extraer alguna informacin
VERSIN 12
FECHA: 2015
Pgina
41
EJEMPLOS
Calcular la estatura promedio de un grupo de personas
Hallar la diferencia entre el mayor y el menor valor de un conjunto de datos
Establecer el valor que ms se repite dentro de un conjunto de datos
2.1.3
PARMETROS Y ESTADSTICOS
En la unidad anterior se vio que los clculos o medidas que se realizan con los datos referidos a una
situacin pueden clasificarse de dos maneras:
Parmetros: Cuando el clculo se realiza con todos los datos de la poblacin. Los parmetros son valores
constantes
Estadsticos: Cuando el clculo se realiza con una parte de los datos de la poblacin, es decir, una
muestra. Los estadsticos son variables
2.1.4
Son tres valores, con cada uno de los cuales, se pretende describir, parcialmente, el comportamiento de una
muestra o de una poblacin.
Las medidas tendencia central, reciben este nombre porque al representar el resultado de un clculo en un
grfico de una distribucin de frecuencias (histograma o polgono de frecuencias), el valor calculado siempre
se sita hacia el centro de la grfica.
2.1.6
Son, tambin, valores con los que se pretende describir parcialmente el comportamiento de los datos
referidos a un fenmeno o hecho, pero, a diferencia de las medidas de tendencia central, estos valores se
suelen situar en los bordes de la distribucin de frecuencias que los representa.
2.1.7
Las medidas de dispersin son clculos o valores que indican que tan concentrados estn los datos
alrededor de un valor especial que se toma como referencia
2.1.8
Las medidas de tendencia central y de dispersin pueden clasificarse como Parmetros o Estadsticos,
segn sea que los datos utilizados correspondan a una poblacin o a una muestra.
Los clculos de las medidas de tendencia central y de dispersin para poblaciones, en algunos casos, son
diferentes de los clculos de las medidas de tendencia central y de dispersin para muestras, por lo que se
utilizan, en estos casos, smbolos diferentes para cada tipo de medida.
VERSIN 12
FECHA: 2015
Pgina
42
Para poblaciones
Para muestras
Es la letra del alfabeto griego mu, simboliza la media aritmtica calculada para una poblacin
Se lee equis trazo o equis barra, simboliza la media aritmtica calculada para una muestra
Es el nmero de valores que toma la variable, en estudio, en la poblacin
Es el nmero de valores que toma la variable, en estudio, en la muestra
Es cada uno de los valores que toma la variable en la muestra o en la poblacin
EJEMPLO
Las comisiones que un vendedor ha recibido en los 6 primeros meses del ao se presentan en la siguiente
tabla:
MES
Ingresos
(Miles de $ )
Enero
Febrero
Marzo
800
950
920
Abril
Mayo
Junio
1000
830
900
800+950+920+1000+830+900
6
= $900 miles
e
SOLUCIN:
VERSIN 12
FECHA: 2015
Pgina
43
MES
Ingresos
(Miles de $ )
Enero
Febrero
Marzo
800
950
920
Abril
Mayo
Junio
1000
830
900
Suma
= 5400
5400
= $900
5400
Para poblaciones
Para muestras
Es la letra del alfabeto griego mu, simboliza la media aritmtica calculada para una poblacin
Se lee equis trazo o equis barra, simboliza la media aritmtica calculada para una muestra
Es el tamao de la poblacin
Es el tamao de la muestra
Es la marca de clase de cada una de las clases en que se han agrupado los datos
Es la frecuencia absoluta de cada una de las clases en que se han agrupado los datos
EJEMPLO
Una muestra del valor de las facturas, en miles de pesos, que se cancelan con tarjetas de crdito en una
cadena de almacenes de modas se presenta en la siguiente tabla:
Como se debe calcular la marca de clase de cada clase y
multiplicar cada uno de esto valores por su respectiva
frecuencia absoluta, estas operaciones es ms prctico
realizarlas en forma tabular, como se muestra a
continuacin:
Ventas
No. de
(Miles de $) Facturas
30
36
25
36
42
48
54
60
42
48
54
60
66
38
49
51
32
29
224
Calcular la media aritmtica
interpretar el significado
Ventas
No. de
(Miles de $) Facturas
XiFAi
30
36
42
48
54
36
42
48
54
60
25
38
49
51
32
33
39
45
51
57
825
1.482
2.205
2.601
1.824
60
66
29
63
1.827
224
Xi
VERSIN 12
10.764
FECHA: 2015
Pgina
44
SOLUCIN:
El total de la cuarta columna es = 10.764 y el total de datos, n, es 224, por lo que la media aritmtica
buscada es:
10.764
224
= $48.054 miles
Interpretacin: El valor de promedio de cada factura pagada con tarjeta de crdito es de $48.054 miles, que
es como si cada factura fuera de este valor
2.1.11 SIGNIFICADO DE LA MEDIA ARITMTICA
La media aritmtica o promedio calculada para un conjunto de datos significa que al remplazar el valor
promedio por cada uno de los datos se obtiene el mismo resultado general
2.1.12 MEDIA ARITMTICA PONDERADA
Existen situaciones en las cuales los datos registrados sobre una situacin traen in formacin adicional que
indica que estos valores no tienen la misma importancia relativa, como se presenta en el siguiente caso:
EJEMPLO
Las notas obtenidas por un estudiante en 3 quices de un corte y las notas finales, del semestre, extradas del
polgrafo correspondiente, se presentan en la siguiente tabla:
PRUEBA
Quiz No.1
Quiz No.2
Quiz No.3
Promedio
NOTA
3.5
4.1
2.4
3.3
ASIGNATURA
A
B
C
NOTA
FINAL
4.9
3.1
3.0
CRDITOS
2
4
3
En el caso de los quices no existe ninguna informacin que permita pensar que estas tres notas tienen
diferente nivel de importancia, por lo que su promedio se puede calcular utilizando la frmula de la media
para datos no agrupados, lo que no ocurre para el caso del polgrafo donde, por ejemplo, la nota de la
asignatura B vale el doble que la nota de la asignatura A; en casos como este, para calcular el promedio, se
utiliza una variante de la media aritmtica que recibe el nombre de Media Aritmtica Ponderada o Promedio
Ponderado, cuya expresin matemtica es la siguiente:
Representa el valor relativo de cada uno de los datos, llamados Factores de Ponderacin. En el
ejemplo, los crditos de cada una de las asignaturas, es decir, los valores 2, 4 y 3
Aplicando la frmula al ejemplo se tiene:
VERSIN 12
FECHA: 2015
Pgina
45
ASIGNATURA
A
B
C
Suma
NOTA
FINAL
CRDITOS
4,9
3,1
3.0
2
4
3
9
= 31,2
9,8
12,4
9.0
31,2
= 9
31,2
9
= 3,47
S para este caso del polgrafo el promedio se calculara como media aritmtica simple, ignorando la
informacin de los crditos, este clculo dara 3.7 que es diferente del promedio ponderado que da un valor
de 3.47
2.1.13 PROPIEDADES DE LA MEDIA ARITMTICA
El clculo de la media aritmtica tiene en cuenta todos los valores de la variable en estudio registrados
A todas las variables cuantitativas se les puede calcular la media aritmtica
Un conjunto de datos slo tiene una media
La media permite hacer comparaciones entre poblaciones o muestras
La media se puede trabajar matemticamente
La media es afectada por los valores extremos
No se puede calcular la media en distribuciones de frecuencias que tienen clase de extremo abierto
= 1 +
100
Como el valor en porcentaje se llama comnmente Tasa, la expresin, ms apropiada, para el Factor de
Crecimiento es:
VERSIN 12
FECHA: 2015
Pgina
46
= 1 +
100
EJEMPLO
La rentabilidad de un ttulo valor ha estado variando en las ltimas semanas como se presenta en la
siguiente tabla:
Para aplicar la frmula, las tasas de
rentabilidad se deben convertir a factores de
Rentacrecimiento
Semana
bilidad
Renta
1
3%
Semana
bilidad
FC
2
1%
1
3%
1,03
3
-2%
2
1%
1,01
4
0,7%
3
-2%
0,98
5
1,5%
4
0,7%
1,007
6
1%
5
1,5%
1,015
A qu tasa promedio semanal ha estado
variando la rentabilidad de este ttulo?
6
1%
1,01
Con los factores de crecimiento, de la tercera columna, se calcula G
G=
(1.03)(1.01)(0.98)(1.007)(1.015)(1.01)
FC = 1 +
====>Tasa = ( FC 1 )x100
100
Por lo tanto:
Tasa promedio = (1.00856 1 ) x 100 = 0.856% 0.9%
Respuesta: El ttulo ha estado aumentado a una tasa promedio del 0.9% semanal
Cuando los datos se presentan en valores absolutos, pero, se debe calcular un porcentaje promedio, los
factores de crecimiento se determinan como se indica en el siguiente ejemplo:
EJEMPLO
Las ventas anuales de una empresa, en millones de pesos, se presentan en la tabla No.1. A qu tasa
promedio anual estn variando las ventas de esta empresa?
TABLA No.1
Obsrvese que se pide la tasa promedio de
crecimiento, que es un valor relativo y no la
Ventas
venta promedio anual, que es un valor
(Millone
absoluto.
AO
s)
Para convertir las ventas, que son valores
2001
68
absolutos, en factores de crecimiento, se
2002
75
divide el valor de un periodo cualquiera entre
el valor del periodo inmediatamente anterior.
2003
32
2004
59
Por ejemplo, el factor de crecimiento del ao
2005
73
2006
2007
92
108
VERSIN 12
FECHA: 2015
Pgina
47
AO
Ventas
(Millone
s)
FC
2001
2002
68
75
1,1029
2003
2004
2005
2006
2007
32
59
73
92
108
0,4267
1,8438
1,2373
1,2603
1,1739
Tambin se puede calcular la media geomtrica para el caso de valores que varan en funcin del tiempo y
slo se conocen los valores inciales y finales del periodo, como se puede ver en el siguiente ejemplo:
EJEMPLO
Una persona invirti $25 millones a 3 aos, recibiendo al final de este periodo la suma de $33,306 millones
A qu tasa promedio mensual creci esta inversin?
La expresin de la media geomtrica para casos como este es la siguiente:
G=
valor final
valor inicial
G=
36
33.306
25
Como la tasa que se pide es mensual el nmero de periodos es 36, por lo tanto, el ndice de la raz es 36
Para calcular la tasa promedio se aplica la expresin:
Tasa = ( FC 1 )x100
Tasa promedio = (1.008 1) x 100
Tasa promedio = 0.8%
Es decir, la inversin est creciendo, en promedio al 0.8% mensual.
2.1.16 PROPIEDADES DE LA MEDIA GEOMTRICA
La media geomtrica siempre es menor o igual a la media aritmtica, es decir: G
2.1.17 USOS DE LA MEDIA GEOMTRICA
La media geomtrica se utiliza para calcular promedios de cantidades expresadas en porcentajes o en
VERSIN 12
FECHA: 2015
Pgina
48
NOTA
4.3
1.7
3.8
4.8
3.5
ESTUDIANTE
L. Rueda
J. Zrate
G. Torres
Z. Bentez
NOTA
2.9
4.0
1.2
4.7
Ordenando estos datos de menor a mayor donde el menor est en el extremo izquierdo y el mayor en el
extremo derecho de la fila se tiene:
1.2
1.7
2.9
3.5
3.8
4.0
4.3
4.7
4.8
El nmero que ocupa la posicin central es 3.8 porque por debajo de l hay 4 datos y por encima otros 4, por
lo tanto, 3.8 es el valor mediano
2.1.19 INTERPRETACIN DE LA MEDIANA
El docente que tom la muestra podra describir el comportamiento de los estudiantes en la prueba diciendo
que la mitad de las notas de la muestra se encuentran por debajo de 3.8 o por encima de 3.8
Alternativamente, el docente podra haber utilizado el promedio o media aritmtica para describir el
comportamiento de los estudiantes en la muestra, como se vio anteriormente, pero, la mediana, entonces, es
otra manera de describir una situacin que es diferente de la media aritmtica
2.1.20 SMBOLO DE LA MEDIANA
El smbolo utilizado, en estas notas, para representar la mediana es:
una equis con una onda en la parte superior que se lee equis mediana
El clculo de la mediana para el caso de las notas se expresa as:
= 3.8
2.1.21 CLCULO DE LA MEDIANA PARA DATOS NO AGRUPADOS
2.1.21.1 Nmero impar de datos
Cuando en nmero de datos que componen la muestra es impar, como en el ejemplo de las notas, la
mediana se puede calcular por simple inspeccin como se hizo anteriormente. Pero, para situaciones que
representen un mayor nmero de datos existe una expresin matemtica que es la siguiente.
VERSIN 12
FECHA: 2015
Pgina
49
Esta expresin indica que el valor mediano ocupa la posicin (n + 1)/2 cuando los datos estn ordenados en
orden ascendente
Para aplicar esta expresin es preciso ordenar, entonces, los datos en orden ascendente e indicar la
posicin u orden de cada dato como se muestra a continuacin:
X1
1.2
X2
1.7
X3
2.9
X4
3.5
X5
3.8
X6
4.0
X7
4.3
X8
4.7
X9
4.8
Los Xi indican la posicin de cada dato, por ejemplo, X 7 indica que 4.3 ocupa la sptima posicin cuando
los datos estn ordenados de forma ascendente
Como el nmero de datos es 9, entonces (n+1)/2 es igual a 5, esto quiere decir que el valor mediano es el
valor que ocupa la quinta posicin cuando los datos estn ordenados de menor a mayor
= X5 = 3.8
tal como se haba establecido anteriormente por simple inspeccin
2.1.21.2 Nmero par de datos
Cuando el nmero de datos sin agrupar es par, la expresin para calcular la mediana es la siguiente.
=
X n / 2 X n / 21
2
Esto quiere decir que el valor mediano es el resultado de promediar los valores que ocupan las posiciones
X n / 2 y X n / 21
Para explicar esta expresin veamos el siguiente ejemplo:
EJEMPLO
Una muestra de las estaturas, en metros, de 10 estudiantes de una clase se presentan en la siguiente tabla:
ESTUDIANTE
ESTATURA
ESTUDIANTE
ESTATURA
M. Rodrguez
1.75
G. Lpez
1.69
L. Snchez
1.68
H. Nez
1.57
D. Rojas
1.81
T. Garca
1.77
J. Acevedo
1.65
R. Orduz
1.62
F. Daz
1.73
P. Pinzn
1.71
Al ordenar estos datos de forma ascendente e indicar la posicin de cada uno de ellos se llega a la siguiente
tabla:
X1
1.57
X2
1.62
X3
1.65
X4
1.68
X5
1.69
X6
1.71
X7
1.73
X8
1.75
X9
1.77
X10
1.81
Como se puede observar, en esta ocasin, no existe un valor nico que se localice en el centro del conjunto
de datos ordenado, los valores X5 y X6 ocupan el centro de este conjunto y la mediana se localiza en el
punto medio entre estos dos datos , por lo que para establecer su valor se promedian 1.69 y 1.71 as:
VERSIN 12
FECHA: 2015
Pgina
50
X5 X6
2
1.69 1.71
= 1.70
2
Este valor se interpreta como que la mitad de los estudiantes de esta muestra miden menos de 1.70 metros
se deja al lector de estas notas, que como ejercicio, verifique que la expresin de la mediana para nmero
par de datos produce el mismo resultado anterior
2.1.22 CLCULO MEDIANA PARA DATOS AGRUPADOS
Recordemos que cuando se habla de datos agrupados nos referimos a datos agrupados en clases
Se presentan dos casos para el clculo de la mediana
2.1.22.1 Primer Caso
La frecuencia absoluta acumulada, FAA, hasta alguna de las clases, de la distribucin de frecuencias,
coincide con la cantidad total de datos dividida entre 2, es decir, ( n / 2), como se puede ver en el siguiente
ejemplo:
EJEMPLO
Los ingresos en una semana, en millones de pesos, de una muestra de tabernas se presenta en la siguiente
tabla:
clase
No.
1
2
3
4
5
6
7
Ingresos
(Millones de $)
1,6
1,9
1,9
2,2
2,2
2,5
2,5
2,8
2,8
3,1
3,1
3,4
3,4
3,7
Suma
No. De
tabernas
6
11
18
25
29
20
11
120
FAA
6
17
35
60
89
109
120
Como se puede observar el nmero de datos de la muestra n es 120, por lo tanto, n/2 es 60 y este valor
coincide con la frecuencia absoluta acumulada, FAA, hasta la cuarta clase. En este caso la mediana es igual
al lmite superior de la cuarta clase, es decir:
= Lmite superior de la clase = $2.8 millones
Este valor se puede interpretar diciendo que la venta mnima de la mitad de las tabernas de la muestra fue
de $2.8 millones
2.1.22.2 Segundo caso
El clculo del total de datos de la muestra dividido entre 2, n/2, no coincide con el valor de la frecuencia
absoluta acumulada, FAA, de ninguna de las clases
Para calcular la mediana en este caso se utiliza la siguiente frmula de interpolacin:
n / 2 FAAi 1
FAi
= + A
VERSIN 12
FECHA: 2015
Pgina
51
139.5 112
= $1.096 miles
42
= 900 + 300
esto quiere decir que la mitad de los clientes de la muestra tenan un saldo, al final del mes observado,
inferior a $1.096.000
2.1.23 MEDIDAS DE TENDENCIA NO CENTRAL O DE POSICIN
2.1.23.1 LOS CUARTILES
Los cuartiles son tres valores que se determinan o calculan a partir de un conjunto de datos, con la
particularidad de que dividen el conjunto de datos en cuatro partes iguales cuando este conjunto est
ordenado en forma ascendente. Estos valores son:
Primer cuartil o Q1: Es el valor por debajo del cual se encuentran la cuarta parte de los datos o 25% de los
datos cuando estn ordenados de menor a mayor
Segundo cuartil o Q2: Es el valor por debajo del cual se encuentran la mitad de los datos o 50% de los
VERSIN 12
FECHA: 2015
Pgina
52
20
18
28
32
23
28
32
Q1
Q2
Q3
Como se puede observar los nmeros 8, 15 y 23 dividen el conjunto en cuatro partes iguales. Estos valores
reciben, respectivamente, los nombres de Primer Cuartil, Segundo Cuartil y Tercer Cuartil
2.1.23.1.1 CUARTILES PARA DATOS NO AGRUPADOS
Revise el material CUARTILES Y PERCENTILES PARA DATOS NO AGRUPADOS, de estos mismos
apuntes
2.1.23.1.2 CUARTILES PARA DATOS AGRUPADOS
Primer caso:
La frecuencia absoluta acumulada hasta alguna de las clases coincide con el valor de la operacin
Qi x n
100
Donde:
No. DE
ACCIONES
FAA
100
1300
1400
1500
1600
1700
1400
1500
1600
1700
1800
100
175
230
190
150
100
275
505
695
845
1800
1900
130
975
1900
2000
125
1100
1100
DEPARTAMENTO DE CIENCIAS BSICAS
25 x 1100
100
= 275
FECHA: 2015
Pgina
53
FAi
= + A
UTILIDAD POR
No. DE
ACCIN
ACCIONES
FAA
1300
1400
1500
1600
1700
1800
1400
1500
1600
1700
1800
1900
100
175
230
190
150
130
100
275
505
695
845
975
1900
2000
125
1100
100
75 1100
100
= 825
1100
825 695
150
Q3 = $1787
Interpretacin: El 75% de las acciones tienen una utilidad inferior a $1787
2.1.23.2 LOS PERCENTILES
Los percentiles son valores que dividen un conjunto de datos en 100 partes iguales, cuando este conjunto
est ordenado de menor a mayor
Un percentil, por lo tanto, es un valor por debajo del cual se encuentra un determinado porcentaje de los
datos. Por ejemplo:
P30 = 200 que se lee: Percentil 30 igual a 200, quiere decir que por debajo del valor 200, del conjunto
ordenado de datos, se encuentran el 30% de los datos.
2.1.23.2.1 PERCENTILES PARA DATOS NO AGRUPADOS
Revise el material CUARTILES Y PERCENTILES PARA DATOS NO AGRUPADOS, en estos mismos
apuntes
VERSIN 12
FECHA: 2015
Pgina
54
acumulada, FAA, coincide con el valor de la operacin 100 , entonces, el valor del percentil buscado es
igual al lmite superior de la clase
EJEMPLO
La siguiente tabla se refiere a una muestra, al azar, del tiempo que duraron las llamadas telefnicas
realizadas por el personal de oficina de una empresa
Duracin llamadas
en minutos
No. de
Llamadas
0,0
2,0
4,0
6,0
8,0
2,0
4,0
6,0
8,0
10,0
46
67
44
31
25
46
113
157
188
213
Mas de
10,0
17
230
230
100
20 230
100
= 46
Segundo caso:
La frecuencia absoluta acumulada, FAA, hasta cualquiera de las clases no coincide con el valor de la
operacin 100
En este caso, el clculo del percentil se hace de manera parecida al segundo caso del clculo de la
mediana. La expresin que se utiliza es la siguiente:
FAi
Pi = + A
VERSIN 12
FECHA: 2015
Pgina
55
No. de
Llamadas
FAA
0,0
2,0
2,0
4,0
46
67
46
113
4,0
6,0
8,0
Mas de
6,0
8,0
10,0
10,0
44
31
25
17
157
188
213
230
100
Clase i -
Clase i
230
Interpretacin: El 70% de las llamadas, de la
muestra, fue inferior a 6.26 minutos
70 230
= 161
100
161 157
31
2.1.25 LA MODA
La moda, de un conjunto de datos, es el valor que ms se repite dentro de ese conjunto.
2.1.26 SMBOLO DE LA MODA
El smbolo que se va a utilizar, en esta notas, para representar la moda es:
VERSIN 12
FECHA: 2015
Pgina
56
21
21
22
19
23
21
23
22
19
22
18
21
26
22
24
28
20
30
22
19
28
25
31
22
24
22
26
EJEMPLO
Los puntajes alcanzados, en una escala de 100 puntos, en las pruebas de ingreso, por los aspirantes a
trabajar en una empresa se presentan en la siguiente tabla:
71
36
57
68
68
51
85
39
70
57
50
45
55
68
49
57
57
40
68
25
Interpretacin: Cuando un conjunto de datos tiene ms de una moda, esta medida de tendencia central no
es til para describir el comportamiento de los datos
EJEMPLO
El tiempo, en horas, que gastan los buses de una empresa de transportes en realizar el viaje entre dos
ciudades determinadas, en una muestra de recorridos escogidos al azar, se presenta en la siguiente tabla:
6,8
5,7
7,0
5,5
6,3
7,4
6,1
5,6
6,6
6,4
5,1
6,0
6,2
6,9
5,4
6,5
6,7
5,8
5,9
7,5
VERSIN 12
FECHA: 2015
Pgina
57
No. de
Semanas
0
1
2
3
4
5
6
1
3
5
12
19
16
10
ms de 6
No. de
Profesionales
Sony
Motorola
L. G.
Nokia
Samsung
18
32
15
47
30
= Nokia
iPhone
Otras marcas
10
5
2.1.28.3 Datos de variable discreta o continua agrupados en clases de amplitud mayor que cero
Se aplica la frmula como se muestra en el siguiente ejemplo
EJEMPLO
Utilizando un radar de carretera los agentes de trnsito tomaron una muestra de la velocidad, en kilmetros
por hora, a la que se desplazan los vehculos al pasar por un puente. Los resultados estn en la siguiente
tabla:
VERSIN 12
FECHA: 2015
Pgina
58
Velocidad
(Kmts / hora)
No. de
Vehculos
1
2
3
Hasta
40
50
40
50
60
7
36
44
4
5
6
7
60
70
80
Ms de
70
80
90
90
61
55
19
14
En este caso, la moda se encuentra en la clase que tiene la ms alta frecuencia. Esta clase es la No.4 que
corresponde al intervalo de 60 a 70 kilmetros por hora. Para saber en qu punto de este clase se encuentra
la moda se aplica la siguiente expresin:
= LI + A
1 + 2
17
= 60 + 10
VERSIN 12
FECHA: 2015
Pgina
59
PRIMER CASO
FAA
1
13
31
54
75
94
112
= 4
2.2.2
SEGUNDO CASO
VERSIN 12
FECHA: 2015
Pgina
60
VERSIN 12
FECHA: 2015
Pgina
61
EJEMPLOS RESUELTOS
Primer caso:
Los ingresos por comisiones, en un determinado mes, de una muestra de vendedores de electrodomsticos
de la ciudad, se presentan en la siguiente distribucin de frecuencias
Ingresos / vendedor
(Millones de pesos)
0,84
1,10
1,10
1,36
1,36
1,62
1,62
1,88
1,88
2,14
2,14
2,40
2,40
2,66
No. de
vendedores
17
22
20
13
10
8
7
97
Con la informacin disponible A cunto pueden ascender los ingresos totales, por comisiones, de 20 de los
vendedores de esta muestra?
SOLUCIN
Se necesita un valor que sea equivalente a los ingresos de los 97 vendedores de la muestra. Ese valor es el
valor promedio o media aritmtica simple
Ingresos / vendedor
(Millones de pesos)
0,84
1,10
1,10
1,36
1,36
1,62
1,62
1,88
1,88
2,14
2,14
2,40
2,40
2,66
No. de
vendedores
17
22
20
13
10
8
7
97
0,97
1,23
1,49
1,75
2,01
2,27
2,53
16,490
27,060
29,800
22,750
20,100
18,160
17,710
152,07
152,07
= $1,567
97
No. de
operarios
12
29
46
87
Salario por
hora
$3.150
$2.734
$2.510
El sindicato de la empresa propone que todas las operaciones sean remuneradas con un mismo salario por
hora y propone que este valor sea $2.700 por hora. Le conviene a la empresa esta propuesta? Por qu?
SOLUCIN
Se necesita describir esta situacin con un solo valor que sea equivalente a los salarios por hora de las tres
secciones. Este valor es el salario promedio.
Pero, como el nmero de operarios de cada seccin es diferente, los valores de la variable, salario por hora,
VERSIN 12
FECHA: 2015
Pgina
62
Seccin
Corte
Armado
Terminado
No. de
operarios
Salario por
hora
12
29
46
87
$3.150
$2.734
$2.510
$37.800
$79.286
$115.460
$232.546
232.246
=
= $2.673
87
RTA: El salario promedio de todos los empleados de esta empresa es de $2.673 por hora, por lo que no le
conviene la propuesta del sindicato de $2.700 por hora porque el salario por hora aumentara
Tercer caso
Una mquina que se compr hace 15 aos en $123 millones, hoy est costando $549 millones. S no se
espera ningn cambio las condiciones que establecen el precio En cunto se puede estimar que cueste
esta mquina el prximo ao?
SOLUCIN
Se necesita establecer a qu tasa promedio anual ha estado creciendo el precio de esta mquina
15 549
=
= 1,10487
123
VERSIN 12
Tiempo/domicilio
No. de
(Minutos)
domicilios
1
4
3
4
7
6
7
10
11
10
13
13
13
16
22
16
19
18
19
22
15
Mas de
22
9
97
FECHA: 2015
Pgina
63
Tiempo/domicilio
No. de
(Minutos)
domicilios
1
4
3
4
7
6
7
10
11
10
13
13
13
16
22
16
19
18
19
22
15
Mas de
22
9
97
FAA
3
9
20
33
55
73
88
97
= 97 = 48,5
2
2
= 13 + 3 [
48,5 33
] = 15,114
22
RTA: La mediana es superior a 15 minutos, por lo que se debe redisear el proceso de despachos.
Quinto caso
Los valores de una muestra de 75 facturas escogidas al azar, de las que emite el restaurante SABROSURA,
se presentan en la siguiente distribucin de frecuencias:
Valor / factura
(Miles de pesos)
16
38
38
60
60
82
82
104
104
126
126
148
148
170
No. de
facturas
17
20
14
10
7
5
2
75
S el 80% de las facturas de esta muestra fue inferior a $95 mil, la administracin del restaurante debe
cambiar la carta que ofrecen. Cul es su recomendacin? Por qu?
b) Cul fue el valor ms comn de las facturas de la muestra?
SOLUCIN
a) Se est pidiendo que se calcule el percentil 80
a)
Valor / factura
(Miles de pesos)
16
38
60
82
104
126
148
38
60
82
104
126
148
170
No. de
facturas
17
20
14
10
7
5
2
75
VERSIN 12
FAA
17
37
51
61
68
73
75
FECHA: 2015
Pgina
64
= 60
100
80 = 82 + 22 [
60 51
] = $101,8
10
RTA: El 80% de las facturas de esta muestra fueron de valores inferiores a $101.800 por lo que no se
recomienda cambiar la carta que ofrecen.
b)
= 38 + 22 [
3
] = $45.333
3+6
VERSIN 12
FECHA: 2015
Pgina
65
2.4.1
MEDIDAS DE DISPERSIN
Antes de aprender a calcular la dispersin de una muestra o de una poblacin, es preciso aclarar por qu se
requiere, tambin, de esta otra medida para describir completamente el comportamiento de un fenmeno o
hecho.
Presentaremos estas ideas a travs de dos ejemplos que se presentan a continuacin:
Primer ejemplo.
Las notas obtenidas, en una prueba, por muestras tomadas a dos grupos de estudiantes, se presentan a
continuacin:
Notas del
grupo A
3,1
2,9
3,3
3,4
3,3
3,2
= 3,2
Notas del
grupo B
2,5
4,7
0,7
3,8
1,0
5,0
4,7
= 3,2
Como se ve la nota promedio de las muestras de los dos grupos es 3,2. S utilizamos nicamente el
promedio para comparar el desempeo de los estudiantes, de estas muestras, nos llevara a la conclusin
de que las dos muestras tuvieron idntico desempeo en la prueba. Para verificar esta conclusin vamos a
representar estos datos en la siguiente grfica:
Como se puede observar, aunque las muestras tienen igual promedio, la distribucin de los datos es muy
diferente en las dos muestras.
Se haba dicho anteriormente que el objetivo de las medias de tendencia central es describir (parcialmente),
el comportamiento de un conjunto de datos que pertenezcan a una muestra o a una poblacin. Sin embargo,
esta capacidad descriptiva de las medidas de tendencia central es parcial porque es necesario
complementarla con otra caracterstica de las muestras y poblaciones que es la dispersin.
Para introducir el concepto de dispersin se presenta el siguiente caso:
Segundo Ejemplo
Las ventas mensuales, en millones de pesos, de dos empresas se presentan en las siguientes tablas:
VERSIN 12
FECHA: 2015
Pgina
66
La venta promedio de estas dos empresas, durante los meses considerados, es igual a $19,395 millones,
por lo que, atenindonos nicamente a la descripcin del valor promedio, indicara que las dos empresas
tienen un desempeo de ventas idntico. Pero, si observamos los polgonos de frecuencias, de estas dos
muestras, como se muestra en la siguiente grfica, encontramos que esto no es as
La diferencia se encuentra, entonces, en que las dos muestras tienen diferente dispersin de sus datos
alrededor de la media
2.4.2
CONCEPTO DE DISPERSIN
El concepto de dispersin lo vamos a abordar considerando, primero, lo que se puede entender por
variabilidad
VERSIN 12
FECHA: 2015
Pgina
67
LA VARIABILIDAD
La variabilidad hace referencia, usualmente, a qu tan diferentes son entre s los datos de una muestra o
una poblacin, comparndolos con los datos de otras muestras o poblaciones, como se puede ver en los
siguientes ejemplos:
1
3,8
10
3,8
En este caso todas las notas son iguales, por lo tanto, no hay ninguna variabilidad.
1
3,8
10
3,8
Ahora hay una nota diferente a las dems, por lo tanto, existe una pequea variabilidad entre los datos de la
segunda muestra con respecto a los datos de la primera.
1
3,0
2
3,5
10
1,9
En esta tercera muestra, hay un aumento notorio en la variabilidad entre los datos, por lo que comparando
las tres muestras de notas, la ms variable es esta ltima.
Podemos concluir diciendo que, comparando estas tres muestras, la menos variable es la primera y la ms
variable es la tercera.
Es preciso resaltar, que la variabilidad y la dispersin son conceptos relativos, siempre se evalan
comparando los datos de ms de una poblacin o muestra
2.4.4
LA DISPERSIN
La dispersin se refiere a qu tan parecidos o diferentes son los datos de una muestra o poblacin con
respecto a un valor que se toma como referencia.
VERSIN 12
FECHA: 2015
Pgina
68
IMPORTANCIA DE LA DISPERSIN
Para que una medida de tendencia central sea representativa de los datos que la originaron se requiere que
su valor sea similar a los datos de esa muestra o poblacin que pretende describir, como se puede ver en el
siguiente ejemplo:
MUESTRA DE BAJA DISPERSIN
10
3,2
3,5
3,8
3,5
3,8
3,7
3,6
3,8
3,9
3,5
10
0,1 3,5 0,7 5,0 1,0 4,7 4,9 3,8 3,9 0,9
= 3,6
= 2,9
Como se puede observar, en la muestra de baja dispersin, el valor del promedio es similar o est cerca de
los valores de la muestra, en cambio, en la muestra de alta dispersin, ninguno de los valores de la muestra
es parecido al valor de la media. Por lo tanto, el promedio de la primera muestra es verdaderamente
representativo de los datos de esta muestra y el de la segunda muestra no lo es.
El concepto de dispersin, entonces, es importante porque entre mayor sea la dispersin de un conjunto de
datos, menor es la fuerza representativa que tiene la medida de tendencia central calculada con esos datos
2.4.6
Son valores que se obtienen como resultado de clculos o procesos con los datos y que indican que tan
parecidos son los datos, de una muestra o poblacin, a la medida de tendencia central con la que se
describe el comportamiento de estos datos.
2.4.7
Las medidas de dispersin que se van a estudiar en estos apuntes son las siguientes:
El Rango
El Rango Intercuartlico
La Desviacin Media
La Varianza
La desviacin Estndar
2.4.8
EL RANGO
Es la diferencia o distancia entre el mayor valor, de un conjunto de datos y el valor menor. Este concepto ya
se haba mencionado para agrupar los datos en clases estadsticas, por lo tanto se utilizar para enunciarlo
el mismo smbolo, es decir la letra R, es decir,
R = Xmax - Xmin
VERSIN 12
FECHA: 2015
Pgina
69
10
10
3,2
3,5
3,8
3,5
3,8
3,7
3,6
3,8
3,9
3,5
0,1
3,5
0,7
5,0
1,0
4,7
4,9
3,8
3,9
0,9
La dispersin de la muestra de la izquierda, medida por el rango, es menor que la dispersin de la muestra
de la derecha
El clculo anterior se realiz con muestras de datos que no estn agrupados. Cuando los datos ya estn
agrupados en clases el rango se establece restando del valor del lmite superior de la clase mas alta el valor
del lmite inferior de la clase ms baja. En smbolos:
36
25
36
42
48
54
60
42
48
54
60
66
38
49
51
32
29
224
2.4.9
RQ = Q3 - Q1
Este rango muestra la dispersin de la porcin ms central de los datos que abarca el 50% del total
VERSIN 12
FECHA: 2015
Pgina
70
MUESTRA A
Distancia
No. De
(Kilmetros) Vehculos
25
35
3
35
45
7
45
55
12
55
65
15
65
75
10
75
85
6
53
Q1 = 48,0 Kmts
Q1 = 47,7 Kmts
RQ = 16,9 Kmts
Q3 = 67,75 Kmts
Q3 = 64,9 Kmts
RQ = 20,05Kmts
Como se ve, aunque las dos muestras tienen el mismo rango, R, el rango intercuartlico es diferente, lo que
indica que la muestra B es menos dispersa que la muestra A
2.4.11 LA DESVIACIN MEDIA
Es la diferencia promedio, en valor absoluto, de los datos de la muestra o poblacin con respecto a su propia
media. La forma de la expresin de clculo vara dependiendo de que se trate de datos no agrupados o
datos agrupados
El smbolo que se utiliza en estos apuntes para la desviacin media son las iniciales DM
Desviacin media para datos no agrupados
DM =
|
|
Dnde:
DM: Smbolo de la desviacin media
n: El nmero de datos
La razn por la cual se extrae el valor absoluto es porque los nmeros tienen una propiedad que consiste en
que la suma de las diferencias de un conjunto de nmeros con respecto a su media siempre da igual a cero
EJEMPLO
Una muestra, al azar, del tiempo, en minutos, que duran las llamadas que se hacen desde un telfono, se
presenta en la siguiente tabla
3
14
24
12
VERSIN 12
FECHA: 2015
Pgina
71
3
14
24
9
7
12
= 11,5
| |
8,5
2,5
12,5
2,5
4,5
0,5
31
-8,5
2,5
12,5
-2,5
-4,5
0,5
DM =
31
= 5,2 minutos
6
Interpretacin: En promedio, la diferencia de cada llamada con respecto a la media es de 5,2 minutos
Desviacin media para datos agrupados
Dnde:
DM : smbolo de la desviacin media
DM =
| |
EJEMPLO
La siguiente tabla es una muestra, en miles de pesos, del valor del arriendo mensual de vivienda del estrato
tres.
Datos
Tabla de Clculo
Valor arriendo
No. De
Valor arriendo
(miles de pesos)
viviendas
(miles de pesos)
| |
| |
210
230
250
270
290
310
330
-61,920
-41,920
-21,920
-1,920
18,080
38,080
58,080
61,92
41,92
21,92
1,92
18,08
38,08
58,08
743,04
628,8
504,16
42,24
361,6
685,44
871,2
3836,48
200
220
12
200
220
12
220
240
15
220
240
15
240
260
23
240
260
23
260
280
22
260
280
22
280
300
20
280
300
20
300
320
18
300
320
18
320
340
15
320
340
15
125
= $271,92 miles
125
DM =
3836,48
= $30,7 miles
125
En promedio, los arriendos de la muestra, se diferencian de la media en $30,7 miles
La desviacin media tiene en cuenta, para su clculo, todos los datos de la muestra y es fcil de interpretar.
Pero, la operacin del valor absoluto para soslayar la propiedad anteriormente mencionada de los de los
nmeros, da una descripcin incompleta de la situacin. Obsrvese que no se sabe s la diferencia de $30,7
miles, del ejemplo anterior, es por encima o por debajo de la media.
Parta evitar este inconveniente existe otra medida de dispersin que aprovecha otra propiedad de los
nmeros que consiste en que todo nmero elevado al cuadrado tiene signo positivo. Esta medida de
VERSIN 12
FECHA: 2015
Pgina
72
Smbolo:
2=
Dnde :
( )2
EJEMPLO
Los siguientes datos corresponden a los puntajes obtenidos por los aspirantes a un cargo en una empresa
Tabla de clculo
PUNTAJES
60
81
77
72
91
90
= 78,5 puntos
( )2
60
-18,5
342,25
81
2,5
6,25
77
-1,5
2,25
72
-6,5
42,25
91
12,5
156,25
90
11,5
132,25
2=
681,5
6
2=
113,58 puntos al
cuadrado
681,5
( )2
2=
= La media de la poblacin
= Es la frecuencia absoluta de cada clase
N = El tamao de la poblacin
EJEMPLO
En un programa sobre riesgo cardiovascular, se registr el peso en kilogramos de todos los empleados de
una empresa
VERSIN 12
FECHA: 2015
Pgina
73
Datos
Peso en
Tabla de clculo
Peso en
No. de
Kilogramos
Kilogramos Empleados
39
49
49
59
11
59
69
50
69
79
31
79
89
27
89
99
18
99
109
( )2
( )2
39
49
44
-30,2
912,04
4560,20
49
59
11
54
-20,2
408,04
4488,44
59
69
50
64
-10,2
104,04
5202,00
69
79
31
74
-0,2
0,04
1,24
79
89
27
84
9,8
96,04
2593,08
89
99
18
94
19,8
392,04
7056,72
99
109
104
29,8
888,04
7992,36
151
151
= 74,2 kilogramos
31894,04
31894,04
=
= 211,22 Kilogramos al cuadrado
151
Ntese que si la poblacin es infinita no se puede calcular la varianza poblacional porque el valor de N sera
infinito.
2.4.12.2 VARIANZA MUESTRAL
Es la varianza que se calcula sobre los datos de una muestra. El clculo con respecto a la varianza
poblacional difiere en que, el divisor de la expresin ya no es N, el tamao de la poblacin, ahora es (n 1),
que es el tamao de la muestra, n, menos una unidad.
Smbolo:
La razn por la cual se divide entre n - 1 es porque, de esta manera, s , es un estimador insesgado de la
varianza de la poblacin de la cual se extrajo la muestra. El concepto de estimador insesgado se estudia en
el curso de Estadstica Inferencial.
EJEMPLO
Los saldos de las cuentas de ahorro, de empleados, de una muestra de las cuentas de ahorro de una
cooperativa, escogidas al azar, se presentan en la siguiente tabla:
Tabla de clculo
SALDOS DE LAS CUENTAS EN MILES DE
PESOS
157
157
-55,5
3080,25
62
-150,5
22650,25
62
234
532
200
$212,5 miles
90
( )2
234
21,5
462,25
532
319,5
102080,25
200
-12,5
156,25
90
-122,5
15006,25
2=
143.435,5
(6 1)
2 = 28.687,10 miles de
pesos al cuadrado
143.435,50
VERSIN 12
FECHA: 2015
Pgina
74
2 =
( 1)
: Es la media aritmtica de la muestra
:Es la frecuencia absoluta de cada clase
n : Es el tamao de la muestra
EJEMPLO
Una muestra del tiempo, en horas, que demora el almacn de materiales de una fbrica en surtir los pedidos
que recibe:
Datos
Tabla de clculo
Tiempo
No. de
Tiempo
(Horas)
pedidos
(Horas)
( )2
( )2
10
10
-5,3
28,09
280,90
16
16
-3,3
10,89
174,24
33
33
-1,3
1,69
55,77
45
45
0,7
0,49
22,05
10
26
2,7
7,29
189,54
12
10
11
4,7
22,09
220,90
10
26
10
12
10
10
140
140
6,3 horas
2 =
943,40
(140 1)
943,40
Como se puede observar, en los ejemplos anteriores, todas las unidades de la desviacin estndar estn
elevadas al cuadrado por lo que es difcil interpretar el significado del valor de la varianza; esta en una de las
razones por las cuales, para medir la dispersin, se prefiere otra medida que es la Desviacin Estndar
2.4.13 LA DESVIACIN ESTNDAR
Conocida tambin como Desviacin Tpica, la desviacin estndar es la raz cuadrada de la varianza. Los
smbolos que se utilizan son , para clculo de la dispersin en poblaciones y s, para el clculo de la
dispersin en muestras
2.4.13.1 DESVIACIN ESTNDAR PARA POBLACIONES
Datos no agrupados
= 2 =
Datos agrupados
( )2
= 2 =
VERSIN 12
( )2
FECHA: 2015
Pgina
75
Datos agrupados
( )2
( 1)
( )2
( 1)
s= 2 =
s= 2 =
Las tablas de clculo para la desviacin estndar son idnticas a las que se utilizan para la varianza, con un
clculo adicional: extraer la raz cuadrada de la varianza
EJEMPLO
En un ejemplo anterior se vio que los puntajes de los aspirantes a un cargo, en una empresa fueron:
y se calcul que:
2 = 113,58 puntos al cuadrado
Por lo tanto,
= 2 = 113,58 = 10,7 puntos
PUNTAJES
60
81
77
72
91
90
EJEMPLO
En otro caso se estableci que el tiempo, en horas, que demora el almacn de materiales de una fbrica en
surtir los pedidos que recibe
Tiempo
No. de
(Horas)
pedidos
10
16
33
45
10
26
10
12
10
Y se calcul que:
Por lo tanto:
140
Aunque es indispensable que se conozca, a ciencia cierta, como se obtienen la cifras de los clculos de la
media aritmtica y la desviacin estndar, en la prctica, la tecnologa disponible permite que estas
operaciones se hagan de forma ms rpida y segura utilizando las funciones estadsticas de las calculadoras
cientficas o de las hojas electrnicas de los programas de computador, por lo que se debe consultar, por lo
menos, en los manuales de las calculadoras, los detalles de la forma como se ejecutan estas funciones.
2.4.14 EL COEFICIENTE DE VARIACIN
Para introducir el concepto del coeficiente de variacin se analiza la siguiente situacin:
En la seccin de materiales livianos del almacn de materiales de una fbrica se tom una muestra del peso
de elementos de esa seccin escogidos al azar, lo mismo se hizo en la seccin de materiales pesados, de la
misma bodega y para ambas muestras se calcul su peso promedio y la desviacin estndar. Los resultados
son los que se presentan a continuacin:
VERSIN 12
FECHA: 2015
Pgina
76
= 4 Kilos
= 50 Kilos
S = 2 Kilos
S = 2 kilos
La primera impresin que se obtiene de una observacin desprevenida de estos resultados es que las dos
muestras tienen la misma dispersin porque sus desviaciones estndar son iguales. Sin embargo, si se
examina con ms atencin, se puede ver que en el caso de la seccin de materiales livianos, la desviacin
estndar equivale a la mitad del peso promedio de los materiales de la muestra. En cambio, en la seccin de
materiales pesados la desviacin estndar equivale nicamente a 1/25 del peso promedio de los paquetes.
Por lo que comparadas las dos desviaciones estndar con la magnitud de su respectivo promedio, es mucho
ms alta la dispersin de la seccin de materiales livianos.
De este anlisis se concluye que la desviacin estndar en casos como el del ejemplo, no permite comparar
la dispersin de dos muestras y se puede agregar que esta dificultad se presenta cuando las medias de las
muestras que se estn comparando son muy diferentes entre s.
Para resolver este inconveniente, la estadstica dispone de un indicador para medir la dispersin. Este
indicador es el Coeficiente de Variacin y se calcula con la siguiente expresin:
COEFICIENTE DE VARIACIN PARA POBLACIONES
SMBOLO : CV
SMBOLO : CV
CV =
CV
El coeficiente de variacin es un nmero sin dimensiones por lo que se puede expresar en fracciones
decimales o en porcentaje
EJEMPLO
Se tomaron muestras de las ventas diarias, en miles de pesos, de dos vendedores de una empresa. Cul
de las dos muestras es ms dispersa?
VENTAS DEL VENDEDOR A
500
450
390
600
290
440
80
25
23
= $438,6 miles
S = $96,5 miles
CV = 0,22
57
90
10
$47,5 miles
$33,1 miles
CV = 0,70
Como se puede notar, la desviacin estndar del vendedor A es mayor que la desviacin estndar del
vendedor B; sin embargo, las ventas de la muestra del vendedor A son menos dispersas que las ventas de la
muestra del vendedor B, porque el coeficiente de variacin de las ventas del vendedor A es menor que el
coeficiente de variacin de las ventas del vendedor B
EJEMPLO
Una muestra de las ventas por da de un almacn de ropa de moda y un gran distribuidor textil se presentan
en la siguientes tablas. Cul de los dos promedios de ventas por da es ms confiable?
VERSIN 12
FECHA: 2015
Pgina
77
DISTRIMODA
VENTAS POR DA
VENTAS POR DA
(Millones de pesos)
(Millones de pesos)
Ventas
No. de
Ventas
No. de
por da
das
por da
das
0,9
1,1
9,2
10,3
12
1,1
1,3
1,3
10,3
11,4
16
1,5
16
11,4
12,5
25
1,5
1,7
23
12,5
13,6
19
1,7
1,9
29
13,6
14,7
10
1,9
2,1
20
14,7
15,8
2,1
2,3
11
9
91
111
Solamente se necesita establecer la marca de clase de ambas tablas y el resto de los clculos se realizan
directamente aplicando las funciones estadsticas de las calculadoras cientficas
JEANS AND BREECHES
DISTRIMODA
VENTAS POR DA
VENTAS POR DA
(Millones de pesos)
(Millones de pesos)
Ventas
No. de
por da
das
Xi
Ventas
No. de
por da
das
Xi
0,9
1,1
1,0
9,2
10,3
12
9,75
1,1
1,3
1,2
10,3
11,4
16
10,85
1,3
1,5
16
1,4
11,4
12,5
25
11,95
1,5
1,7
23
1,6
12,5
13,6
19
13,05
1,7
1,9
29
1,8
13,6
14,7
10
14,15
1,9
2,1
20
2,0
14,7
15,8
15,25
2,1
2,3
11
2,2
91
111
= 1,706306306
CV = 0,17868609
S = 0,30489321
= 12,26428571
S
CV
= 0,13255294
= 1,62566714
Respuesta: Es ms confiable el promedio diario de Distrimoda porque tiene el menor coeficiente de variacin
VERSIN 12
FECHA: 2015
Pgina
78
3 REGRESIN Y CORRELACIN
3.1
3.1.1
REGRESIN
INTRODUCCIN
CONCEPTO DE REGRESIN
Es un mtodo de clculo para establecer la relacin matemtica que existe entre dos o ms situaciones o
variables, que la observacin o el sentido comn indican que tienen comportamientos que estn
relacionados
3.1.3
IMPORTANCIA DE LA REGRESIN
Este mtodo aplicado al anlisis estadstico permite predecir matemticamente el comportamiento de una
variable a partir del comportamiento conocido de otra u otras variables. Esta relacin entre las variables se
establece a travs de una ecuacin que se llama Ecuacin de Regresin
3.1.4
Al establecer la relacin entre dos variables se encuentra que el comportamiento de una variable depende
del comportamiento de otra u otras variables o que la manifestacin de una variable ocurre primero que la
manifestacin de otra u otras variables. A la variable que ocurre primero o que determina el comportamiento
de otra se le llama Variable Independiente y se suele representar por la letra X y a la otra variable se le
llama Variable Dependiente y se suele representar por la letra Y
EJEMPLOS:
Tasa de desempleo y ventas del comercio: La variable independiente o variable x es la tasa de
desempleo y la variable dependiente o variable y es las ventas del comercio
Accidentes de trnsito y ventas de licor: La variable independiente es las ventas de licor y la variable
dependiente los accidentes de trnsito
El nmero de personas que se movilizan en bus puede depender de las ventas de motocicletas y del
estado del clima, por lo que el nmero de personas que utilizan el servicio de bus es la variable
dependiente y las otras dos son las variables independientes
VERSIN 12
FECHA: 2015
Pgina
79
GRFICO DE DISPERSIN
Es la representacin grfica, en el plano cartesiano, en forma simultnea, de los valores que toman la
variable independiente (x) y la variable dependiente (y)
EJEMPLO
Se tomaron datos sobre el kilometraje recorrido por un vehculo y el consumo de gasolina, en galones, como
se presenta en la siguiente tabla:
Kilmetros
X
30
50
10
40
60
20
Galones
Y
5,95
8,55
2,35
9,25
13,85
6,75
La representacin grfica de los valores de esta tabla en el plano cartesiano, recibe el nombre de Grfico de
Dispersin como se muestra a continuacin:
Grfico de dispersin
Galones consumidos
16
14
12
10
8
6
4
2
0
0
10
20
30
40
50
60
70
Kilmetros recorridos
3.1.6
La relacin entre dos o ms variables que como dijimos anteriormente matemticamente recibe el nombre
de regresin se puede clasificar de dos formas:
VERSIN 12
FECHA: 2015
Pgina
80
3.1.7
TIPOS DE REGRESIN
Regresin Univariada
Se presenta cuando slo interviene una variable independiente
Regresin Multivariada
Se presenta cuando interviene ms de una variable independiente
Regresin lineal
Se presenta cuando la representacin grfica de la ecuacin de regresin es una lnea recta.
Regresin Curvilnea
Se presenta cuando la representacin grfica de la ecuacin de regresin es una curva
Tanto la regresin lineal como la curvilnea tienen dos formas de manifestarse: en forma directa o en forma
inversa
Regresin Lineal Directa
Ocurre cuando al aumentar el valor de la variable independiente aumenta, proporcionalmente, el valor de la
variable dependiente. Por lo tanto, una recta parece describir de manera apropiada la relacin entre estas
variables, como se puede ver en el siguiente grfico
VERSIN 12
FECHA: 2015
Pgina
81
10
Y
5
4
3
9
7
5
9
8
7
Variable Y
X
8
13
6
24
18
20
6
5
4
3
2
1
0
0
10
15
20
25
30
Variable X
10
9
8
variable Y
7
La curva de regresin
(una recta), que mejor
describe la relacin
entre estas dos
variables, se presenta
en la grfica de la
izquierda
6
5
4
3
2
1
0
0
10
15
20
25
30
Variable X
VERSIN 12
FECHA: 2015
Pgina
82
Y
9
24
11
6
14
30
25
20
Variable Y
X
19
3
16
24
8
15
10
5
0
0
10
15
20
25
30
Variable X
La curva de regresin (una recta), que mejor describe la relacin entre estas dos variables, se presenta
en la siguiente grfica:
30
25
variable Y
20
15
10
5
0
10
15
20
25
30
Variable X
VERSIN 12
FECHA: 2015
Pgina
83
Y
12
21
6
7
17
8
25
20
Variable Y
X
16
18
8
12
17
10
15
10
5
0
0
10
15
20
Variable X
La curva de regresin, que mejor describe la relacin entre estas dos variables, se presenta en la siguiente
grfica
25
Variable y
20
15
10
5
0
0
10
15
20
Variable X
VERSIN 12
FECHA: 2015
Pgina
84
Y
2
9
7
18
2
20
18
16
14
Variable Y
X
14
5
10
2
20
12
10
8
6
4
2
0
0
10
15
20
25
Variable X
La curva de regresin, que mejor describe la relacin entre estas dos variables, se presenta en la siguiente
grfica:
20
18
16
Variable Y
14
12
10
8
6
4
2
0
0
10
15
20
25
Variable X
VERSIN 12
FECHA: 2015
Pgina
85
12
10
Variable Y
X
13
2
15
5
4
7
0
0
10
12
14
16
Variable X
3.1.8
LA REGRESIN LINEAL
Cuando los puntos del grfico de dispersin se pueden relacionar con una recta que pase lo mas cerca
posible de todos ellos, a esta recta se le llama Recta de Mnimos Cuadrados, porque la suma de las
distancias al cuadrado, de los puntos del grfico a esta recta es mnima
Esta recta tiene por ecuacin Y = A + B X, donde A es el punto donde la recta corta al eje Y, y B es la
pendiente de la recta. El proceso para determinar el valor de los parmetros A y B es complejo, pero, el
estudiante interesado lo puede consultar en cualquier texto de estadstica. En el curso, se determinarn
utilizando las funciones de las calculadoras cientficas.
EJEMPLO
Se compar el tiempo total que realmente dura encendido, de forma intermitente, un celular, con la duracin
de su batera, obteniendo los valores que se presentan en la siguiente tabla:
celular
encendido
(segundos)
360
270
480
120
440
230
160
duracin
batera
(horas)
3,2
3,5
1,9
3,9
2,3
3,2
4,1
Como el tiempo de duracin de la batera depende del tiempo total, que de forma intermitente dura
encendido el celular, la variable dependiente es el tiempo de duracin de la batera y la variable
independiente el tiempo en segundos que dura encendido el celular, como se presenta a continuacin
VERSIN 12
FECHA: 2015
Pgina
86
Y
duracin
batera
(horas)
3,2
3,5
1,9
3,9
2,3
3,2
4,1
4,0
3,5
3,0
2,5
2,0
1,5
1,0
0,5
0,0
0
100
200
300
400
500
600
Duracin de la batera en
horas
Trazando una recta que pase lo ms cerca posible de todos los puntos, el grfico queda as:
4,5
4,0
3,5
3,0
2,5
2,0
1,5
1,0
0,5
0,0
0
100
200
300
400
500
600
Entre ms tiempo dure el celular encendido menos tiempo durar la batera por lo que la relacin entre las
VERSIN 12
FECHA: 2015
Pgina
87
A =
B =
4,7764201
-0,0055024
VERSIN 12
FECHA: 2015
Pgina
88
LA CORRELACIN
El inters del analista no est solamente en establecer la forma como se relacionan dos variables, sino,
tambin, en medir que tan fuerte es el grado de esta relacin.
La regresin univariada es un caso extrao, lo comn es que en comportamiento total de una variable
dependiente sea el resultado de la interaccin de varias variables dependientes, como se muestra en las
siguientes grficas:
VOLUMEN DE TRFICO
CLIMA
COSTO DE
REPARACIN
DE VAS
KILOMETRAJE RECORRIDO
TIPO DE VEHCULO
MARCA
CONSUMO DE
COMBUSTIBLE
DE UN
VEHCULO
ESTADO MECNICO
ESTILO DE CONDUCCIN
TOPOGRAFA DE LA VA
EDAD DEL VEHCULO
Como es lgico pensar, la influencia que tiene cada una de estas variables independientes en el
comportamiento total de la variable dependiente no es igual para todas las variables independientes. Habr
algunas variables independientes que determinan, en buena medida, el comportamiento de la variable
independiente y, tambin, habr algunas variables independientes cuya influencia en el costo de reparacin
de vas o en el consumo de combustible, para estos ejemplos, es muy reducida.
Para cualquier observador que analice estas situaciones, es de capital importancia determinar cules son las
variables que ejercen un efecto notable en el comportamiento de otra, es decir, establecer la fuerza o
intensidad con la que una variable independiente y otra dependiente estn relacionadas. A esta fuerza o
intensidad se le llama Correlacin
3.2.1
EL COEFICIENTE DE CORRELACIN
Es una medida del grado en que una variable independiente influye en una variable dependiente
Este grado de la relacin entre dos variables se mide con un indicador que recibe el nombre de coeficiente
de correlacin.
El coeficiente de correlacin es un nmero adimensional que se representa por la letra r y toma valores entre
-1 y +1. El significado de estos valores que toma r es el siguiente:
VERSIN 12
FECHA: 2015
Pgina
89
-94%
Que significa que la correlacin entre las dos variables es inversa y ptima
3.2.2
EL COEFICIENTE DE DETERMINACIN
r2 =
88%
Que significa que el 88% de las variaciones en la duracin de la batera del celular se deben a las
variaciones en el tiempo total que demora el celular prendido de forma intermitente
EJEMPLO
Las horas de capacitacin que han recibido, diferentes grupos de operarios aprendices y el nmero de
unidades defectuosas, que salen del proceso productivo, en el primer mes de actividad, de cada uno de
estos grupos, se presentan en la siguiente tabla:
Horas de
capacitacin
27
22
38
13
33
15
No. de
productos
defectuosos
40
51
39
50
45
58
VERSIN 12
FECHA: 2015
Pgina
90
a)
Grfico de dispersin
No. de productos defectuosos
70
60
50
40
30
20
10
0
0
10
15
20
25
30
35
40
Horas de capacitacin
S se puede utilizar el modelo de regresin lineal porque los puntos describen una lnea recta
b) r = -0,81328 = -81%
r2 = 0,6614 = 66% el 66% de las variaciones en el nmero de productos defectuosos se deben a las
variaciones en las horas de capacitacin. La correlacin entre las dos variables es moderada. Se pueden
realizar pronsticos con precaucin
c) y = 61,869 0,596x
d) Porque la relacin entre las variables es inversa
e) y estimado = 61,889 0,596(20) = 50 unidades
VERSIN 12
FECHA: 2015
Pgina
91
VERSIN 12
FECHA: 2015
Pgina
92
PRINCIPIOS DE PROBABILIDAD
Tipos de fenmenos:
Fenmenos determinsticos
Una accin produce un solo resultado posible
Se puede pronosticar con precisin lo que va a ocurrir
Qu distancia recorre un cuerpo en cada libre en un tiempo determinado?
A qu temperatura se evapora el agua al nivel del mar?
Qu le ocurre a un material ferroso en un ambiente hmedo?
Fenmenos aleatorios
Una accin produce varios resultados posibles, conocidos, de los cuales ocurre solo uno
Definiciones de probabilidad:
Medida numrica de la posibilidad de que ocurra un resultado determinado en un experimento aleatorio
Medida numrica de la incertidumbre
Necesidad de la probabilidad:
Medir la posibilidad o el riesgo de que algo ocurra o no ocurra
Cuantificar la incertidumbre
Conceptos Bsicos de Probabilidades
Espacio Muestral
Lista de TODOS los posibles resultados de un experimento aleatorio
Smbolo S
VERSIN 12
FECHA: 2015
Pgina
93
La suma de las probabilidades de todos los resultados de s debe siempre dar exactamente 1
4.2
ASIGNACIN DE PROBABILIDADES
Ejemplos :
Calcular la probabilidad de que salga cara al lanzar una moneda
Calcular la probabilidad de que salga un 4 al lanzar un dado
Calcular la probabilidad de que la suma de los puntos al lanzar un par de dados sea mayor que 7
Calcular la probabilidad de sacar una ficha verde de una caja que contiene 2 fichas verdes, una
roja y 3 blancas
VERSIN 12
FECHA: 2015
Pgina
94
No. de
muestras
10
22
15
10
7
5
3
72
FR
0,14
0,30
0,21
0,14
0,10
0,07
0,04
1,00
???
Prctica: De una caja que contiene 10 fichas numeradas del cero al nueve se extrae una ficha al azar.
Cul e s la probabilidad de que la ficha seleccionada sea un nmero mayor que 6?
Mtodo Subjetivo
Sucesos que no han ocurrido antes
Sucesos que han ocurrido muy pocas veces
Sucesos que ocurren siempre en diferentes condiciones
4.3
EL DIAGRAMA DE RBOL
Muestreo
Concepto de muestra: Se examina el estado de la variable observando parte de los elementos de una
poblacin
Muestreo: Tcnicas para seleccionar las muestras
Muestreo: experimento aleatorio
Muestreo de caja o de urna
Concepto: Se extraen de una caja, completamente al azar, uno o ms elementos y se registra el estado de la
caracterstica observada
Muestreo con remplazamiento
Muestreo sin remplazamiento
Ensayos
Concepto: Cada uno de los intentos o pruebas con los que se realiza un experimento aleatorio
Principio del muestreo : Simultneamente = En sucesin
VERSIN 12
FECHA: 2015
Pgina
95
4.4
TCNICAS DE CONTEO
Tcnicas de conteo
Permutaciones
A
A
A
A
A
A
Muestreo ordenado
Condicin: muestreo sin remplazamiento
Concepto de permutacin
Frmula para el clculo del nmero de permutaciones
Ejemplo: de una caja que tiene 4 fichas marcadas con las letras A, B, C y D se extraen 3 fichas sin
reemplazamiento
B
C
B
A
C
C
A
B
D
A
B
B
D
B
A
D
C
A
D
D
A
C
C
B
B
C
A
C
B
A
D
B
A
C
D
B
C
D
C
B
D
D
B
C
D
B
B
D
A
C
D
A
D
C
A
D
C
B
D
C
C
D
B
D
C
B
Combinaciones
Muestreo desordenado
Condicin: muestreo sin remplazamiento
Concepto de combinacin
Frmula para el clculo del nmero de combinaciones
COMBINACIONES
VERSIN 12
FECHA: 2015
Pgina
96
Ms de un ensayo:
Sucesos independientes
Sucesos dependientes
4.5
Suma de probabilidades
Complemento
Multiplicacin o Probabilidad Conjunta
Divisin o Probabilidad Condicional
Suma de Probabilidades
La probabilidad de que ocurra el suceso A el suceso B:
Sucesos compatibles:
Sucesos mutuamente excluyentes:
Complemento
S se tiene un suceso A cuya probabilidad de ocurrencia () se conoce, la probabilidad de que no ocurra
el suceso A es: () = 1 ()
Ejemplo: la probabilidad de que al lanzar un par de dados, la suma de las caras sea un nmero mayor
que 8 es:
5
A = Suma de las caras > 8 () =
18
() = 1 () = 1
=
18
13
18
Probabilidad Conjunta
Sucesos independientes
S A y B son sucesos independientes la probabilidad de que ocurran el suceso A y el suceso B
simultneamente o en sucesin:
( ) = () ()
Sucesos Dependientes
S A y B son sucesos dependientes la probabilidad de que ocurran el suceso A y el
simultneamente o en sucesin:
suceso B
( ) = () ()
Probabilidad condicional
Condicin: un solo ensayo
Significado: Para dos sucesos A y B cualquiera
VERSIN 12
FECHA: 2015
Pgina
97
( )
() ()
=
()
()
Ejemplo
Una fbrica tiene en existencia, repuestos comprados a 3 proveedores, con la calidad y cantidad que se
muestran en la siguiente tabla:
CALIDAD
Primera
Segunda
TOTAL
A
20
10
30
PROVEEDOR
B
12
8
20
C
6
4
10
TOTAL
38
22
60
S se escoge un repuesto al azar y sale de segunda Cul es la probabilidad de que sea del proveedor C?
4.6
TEOREMA DE BAYES
VERSIN 12
FECHA: 2015
Pgina
98
VERSIN 12
FECHA: 2015
Pgina
99
LEVIN, Richard, et al. Estadstica para Administracin y Economa Sptima edicin. PEARSON
EDUCATION. Mxico. 2004
MARTNEZ B, Ciro. Estadstica y Muestreo. Dcimo Tercera edicin. Editorial ECOE
LIND, Douglas; MARCHAL, William y WATHEN, Samuel. Estadstica Aplicada a los Negocios y la
Economa Dcimo Quinta edicin. Editorial McGraw Hill
ANDERSON, David; SWEENEY, Dennis y WILLIANS, Thomas. Estadstica para Administracin y
Economa. 11 edicin. Editorial CENGAGE LEARNING
VERSIN 12
FECHA: 2015
Pgina
100