Está en la página 1de 42

1

MATHUMBI
Estadstica y Probabilidad

Mathumbi

Estadistica

Estadstica y Probabilidad
Guia del Estudiante

El presente documento contiene el resumen de las


preparaciones de clase y se constituye en una gua de estudio
contiene un desarrollo terico de los temas , con ejercicios
modelo y talleres para desarrollar en clase y fuera de ella

Ing. Luis Humberto Ortega R.


2

MATHUMBI
Estadstica y Probabilidad

Contenido
Contenido ......................................................................................................................................................... 2
1 Generalidades........................................................................................................................................... 4
1.1 Un panorama general ....................................................................................................................... 4
1.2 Conceptos y definiciones .................................................................................................................. 4
1.3 Teora preliminar del muestreo ......................................................................................................... 7
2 Descripcin de los datos ......................................................................................................................... 10
2.1 Distribuciones de frecuencia ........................................................................................................... 10
2.2 Tablas de distribucin ..................................................................................................................... 10
2.3 Representaciones grficas ............................................................................................................. 13
2.4 Medidas de tendencia central ......................................................................................................... 16
2.4.1 Media o Promedio aritmtico ...................................................................................................... 16
2.4.2 Mediana y Percentiles .................................................................................................................. 17
2.4.3 Moda ........................................................................................................................................... 19
2.4.2 Otras medidas de tendencia central ........................................................................................... 19
2.5 Medidas de dispersin .................................................................................................................... 22
2.5.1 Rango o Amplitud ....................................................................................................................... 22
2.5.2 Desviacin Media ....................................................................................................................... 22
2.5.3 Varianza y Desviacin Estndar ................................................................................................. 22
2.6 Interpretacin y uso de la desviacin estndar ............................................................................... 23
2.6.1 Teorema de Chebyshev.............................................................................................................. 23
2.6.2 Regla Emprica ........................................................................................................................... 23
2.6.3 Coeficiente de Variacin ............................................................................................................. 24
2.6.4 Asimetra y Curtosis .................................................................................................................... 24
2.6.5 Diagramas de Caja ..................................................................................................................... 24
2.6 Ejercicios y Talleres ........................................................................................................................ 26
3 Probabilidad y sus leyes ......................................................................................................................... 27
3.1 Introduccin .................................................................................................................................... 28
3.2 Definiciones y conceptos ................................................................................................................ 28
3.3 Teora de conjuntos ........................................................................................................................ 30
3.3.1 Definicin: ................................................................................................................................... 30
3.3.2 Determinacin: ............................................................................................................................ 30
3.3.3 Condiciones de existencia .......................................................................................................... 30
3.3.4 Clases de conjuntos.................................................................................................................... 31

16/02/2016
3

MATHUMBI
Estadstica y Probabilidad

3.3.5 Operaciones entre conjuntos ...................................................................................................... 31


3.4 Principios de conteo ....................................................................................................................... 33
3.4.1 Principio de Multiplicacin........................................................................................................... 33
3.5 Reglas bsicas de probabilidad ...................................................................................................... 34
3.6 Teorema de Bayes ......................................................................................................................... 38
3.6.1 Introduccin ................................................................................................................................ 38
3.7 Ejercicios y Talleres ........................................................................................................................ 41
Fuentes Bibliogrficas .................................................................................................................................... 42
Bibliografa Fsica ..................................................................................................................................... 42
Fuentes virtuales ...................................................................................................................................... 42
4

MATHUMBI
Estadstica y Probabilidad

1 Generalidades
1.1 Un panorama general
La estadstica no es algo nuevo, hoy en da todo se fundamenta sobre datos o informacin estadstica, para
asombro de todos nosotros es tan antigua como la propia humanidad, es decir naci con Humbi. Ya tenamos
vestigios de su inicio antes de Cristo, como en China donde el emperador dispuso la realizacin de un censo;
en su imperio y algo similar ocurri en la poca del rey Herodes, relacionado con un empadronamiento cuando
se habl del nacimiento de Cristo.

La estadstica como disciplina tuvo su inicio en Alemania a mediados del siglo XVII, en el reinado de
Godofredo de Achenwall, utiliz la palabra estadstica y la separ de la sociologa. Hoy en da alcanza un alto
desarrollo, con la ayuda de tantos investigadores dedicados a perfeccionar aquellas tcnicas ms adecuadas
para analizar una determinada cantidad de informacin, acelerando su proceso de clculo con la ayuda de
los programas de computacin, disminuyendo las probabilidades de error.

La palabra Estadstica, para algunos proviene de la palabra status cuyo significado es estado; para otros se
deriva del vocablo griego statera que significa balanza, otra quizs la ms confiable, proviene de la palabra
Alemana stara que significa estado, el cual es el encargado de hacer estadstica.

1.2 Conceptos y definiciones

Una investigacin estadstica utiliza los mtodos cientficos deductivos, de lo general a lo particular e
inductivo-inferencial, de lo particular (muestra) a lo general (poblacin). En concordancia con lo anterior, se
sugiere seguir un proceso que requiere de seis fases1:

1. Planeacin y Preparacin
2. Recoleccin
3. Crtica y Codificacin
4. Procesamiento
5. Anlisis e interpretacin (Numrico y grfico)
6. Publicacin

En el primer paso, se tiene presente, el objeto y finalidad, las fuentes de informacin, los procedimientos y el
material a utilizar. En esta fase se definen las unidades, variables cuantitativas o cualitativas, discretas o
continuas y las limitaciones del espacio o cobertura geogrfica, se disea formulario de encuestas, el cual
debe ser sucinto, es decir, limitado a preguntas esenciales; discreto, claro, sencillo y categrico para evitar
subjetividades que afecten el resultado final y se determina quienes contestaran la encuesta aplicada.

La recoleccin consiste en el conjunto de operaciones de observacin y anotacin o registro de los hechos


en los formularios destinados para tal efecto.2

La crtica y codificacin consiste en clasificar el material primario procedente de la misma investigacin, como
bueno, corregible y material desechable que pueda afectar de alguna manera los resultados. Las siguientes
etapas contemplan el procesamiento o tabulacin, la organizacin, el resumen, presentacin en tablas,
grficos, el anlisis de la informacin y la publicacin del documento.

En la vida diaria los diversos fenmenos de orden econmico, de tecnologas, social, poltico, educacional, e
incluso biolgico, aparecen, se transforman y finalmente desaparecen. Para tan abundante y complejo
material, es preciso tener un registro ordenado y continuo a fin de conseguir en un momento dado, los datos
necesarios para el estudio de lo que ha sucedido, sucede o puede suceder.

1
Texto Ciro Martnez B. Estadstica y Muestreo
2
Ibdem
5

MATHUMBI
Estadstica y Probabilidad

Para ello se requiere contar con un mtodo, o conjunto de reglas o principios, que nos permita la observacin,
el ordenamiento, la cuantificacin y anlisis de dichos fenmenos. Ese mtodo se denomina Estadstica. La
palabra estadstica se refiere a un sistema o mtodo usado en la recoleccin, organizacin, anlisis y
descripcin numrica de la informacin. Tambin se puede decir que la estadstica estudia el comportamiento
de los fenmenos de grupo.

Hay dos fases en el campo de la Estadstica, en primer lugar est la fase que solo se limita a la descripcin
de una serie de datos sin llegar a conclusiones o a generalizar con respecto a un grupo mayor. Esta fase se
conoce como Estadstica deductiva o descriptiva, que tiene como finalidad colocar en evidencia aspectos
caractersticos del grupo en estudio, haciendo uso del mtodo cientfico deductivo, es decir, pasando de
aspectos particulares a generales. En segundo lugar est la fase de anlisis que trata de llegar a conclusiones
acerca de un grupo mayor de datos, denominado poblacin, basado en la informacin de un grupo menor
de los mismos datos, llamado muestra, cuyos elementos se seleccionan aleatoriamente; esta es la
denominada Estadstica inductiva o inferencial, la cual, como su nombre lo indica, utiliza el mtodo
inductivo, pasando de lo particular a lo general, permitiendo el clculo de estimaciones, a travs de la
informacin obtenida en una muestra. Esquemticamente lo representamos as:

ESTADISTICA INFERENCIAL
DESCRIPTIVA
Recolectar Conjunto de mtodos
Organizar Conjunto de mtodos que estiman lo que
para organizar, sucede en una
Analizar resumir y presentar
Describir poblacin basado en
DATOS de una un subconjunto
Presentar manera informativa denominado Muestra.
Interpretar

Diagrama 1.1

La descripcin de los datos se realiza a travs de la elaboracin de cuadros, grficos, clculos de promedio,
varianza, proporciones de una variable, que deben estar relacionadas. La estadstica analtica o inductiva
busca dar explicaciones al comportamiento de un conjunto de observaciones, probar la significacin o validez
de los resultados; intenta descubrir las causas que lo originan, con gran aplicacin en el campo del muestreo,
logrndose de esta manera, conclusiones que se extienden ms all de las muestras estadsticas, con miras
a tomar decisiones ptimas, con un margen de error mnimo.

La Estadstica, de acuerdo con todo lo anterior, se podra definir de diversas maneras

Como un conjunto de acciones y procesos encaminados a entender la informacin 3

Es la ciencia que se ocupa de recolectar, organizar, presentar, analizar e interpretar datos para
ayudar a una toma de decisiones ms efectiva4.

Como aquel mtodo que permite no solo describir el hecho o fenmeno, sino deducir y evaluar
conclusiones acerca de una poblacin, utilizando resultados proporcionados por una muestra.

Consiste en el mtodo que involucra la recoleccin, organizacin, anlisis, interpretacin, y


presentacin numrica de variables o datos, con el fin de describir un fenmeno o inferir su
comportamiento, con mnimo de error.

3
Texto Estadstica para Administracin de Berenson
4
Texto Mason y Lind
6

MATHUMBI
Estadstica y Probabilidad

El proceso lo podemos resumir en el siguiente esquema:

PARTICULAR MUESTRA

De lo particular a lo
De lo general (Poblacin ) a lo general, el mtodo

Inductiva
Descriptiva

particular (Muestra) completa las labores


descriptivas y estima
Recopila caractersticas de la
Organiza poblacin basados en la
Describe Muestra: Subconjunto
Presenta representativo de la
Con el fn de describir varias de poblacin seleccionada
sus carcteristicas para su anlisis.

GENERAL POBLACION

En trminos generales, se considera que la finalidad de la estadstica es suministrar informacin, y su utilidad


depender, en gran parte del fin que se proponga y de la forma como se obtengan los datos. La creciente
especializacin lograda por la empresa moderna ha obligado a la utilizacin continua de mtodos estadsticos;
es as como, en la produccin, el control de calidad, mediante las inspecciones de artculo por artculo,
resultara engorroso y prcticamente imposible de realizar. Cuando el artculo debe ser sometido a cierto
control de dureza, resistencia, duracin, que implique su destruccin, se hace indispensable la aplicacin de
las tcnicas de muestreo, con el objetivo de sacar conclusiones que puedan ser extensivas al total de los
elementos producidos (Poblacin) de donde se extrajo la muestra. En este contexto definimos:

Poblacin: es un conjunto de medidas o el recuento de todos los elementos que presentan una
caracterstica comn. El termino poblacin se usa para denotar el conjunto de elementos del cual
se extrae la muestra.

Muestra: Subconjunto representativo de la poblacin seleccionada para su anlisis.

De otra parte, generalmente se asocia la palabra estadsticas como cifras sobre algn campo particular. Se
puede asociar con cifras: el nmero de nacimientos, defunciones, transacciones comerciales, valor de las
acciones en el mercado de valores, volumen fsico y monetario de las importaciones y exportaciones, beneficio
y utilidad de las empresas, demanda presente o potencial de algn producto, consumos en servicios pblicos,
etc., obtenidas mediante encuestas.

Asimismo, Estadstico es la persona que trabaja en la elaboracin y anlisis de estadsticas, mientras que
el trmino de estadgrafo se refiere a una medida, que en Estadstica se aplica sobre una muestra. En general
se utilizan dos tipos: Medidas de tendencia central y Medidas de dispersin, como veremos ms adelante en
el desarrollo de los diferentes temas.

De igual manera, es necesario tener presente otras definiciones:

Un parmetro es una medida de resumen que describe una caracterstica de toda una poblacin.
Valor numrico que resume una cantidad de datos: promedios, medianas, modas, desviaciones etc.

Un estadstico es una medida de resumen que se calcula para describir una caracterstica a partir
del estudio de una sola muestra de la poblacin.

Por ejemplo, el promedio facturado de consumo de agua en un conjunto residencial es de 24 m3 por


mes/apartamento. En este caso la Poblacin est constituida por todos los apartamentos del conjunto
residencial, la muestra es el subconjunto elegido para encuestar. El objetivo ser describir caractersticas
diferentes como consumo, valores, cantidad de basuras recicladas, etc., (parmetro). Podemos concluir que
7

MATHUMBI
Estadstica y Probabilidad

el estadstico media corresponde a un consumo de 24 m3 obtenido en una muestra y que es aplicable a


toda una poblacin.

Mencionamos anteriormente el trmino datos, un dato es una informacin que permite un conocimiento o
deduccin de algo. Es la representacin simblica de un hecho. La Informacin es un conjunto de datos
significativos y pertinentes que describen sucesos. Por Ej. 35 aos de edad, profesin ingeniero, constituyen
una serie de datos descriptivos de una persona.

Tipos de Variables:

Los datos los podemos clasificar en:

1. Cualitativos: Los que resultan de una poblacin con caracterstica no numrica, es decir,
atributos, cualidades, propiedades, donde el ente asociado se le llama Variable Cualitativa,
ejemplos de ella son: Masculino, Femenino, lugar de nacimiento, tipo de empresa, servicios
pblicos, comerciales etc.

2. Cuantitativos: Si los datos resultan de una poblacin cuantitativa y la correspondiente Variable


Cuantitativa se expresa en forma numrica. Ejemplos: No de empresas prestadoras, capital,
valores facturados, salarios recibidos, estaturas, pesos, dimetros, junto con sus respectivas
unidades

1.3 Teora preliminar del muestreo


La aplicacin de la denominada tcnica del muestreo, toma una singular importancia en la Estadstica, en
especial en algunos aspectos entre los cuales podemos mencionar:

Conocer la realidad de una observacin o fenmeno: Al cuantificar un fenmeno estamos


conociendo su situacin actual, por ejemplo, para la produccin masiva: cantidades, tiempos,
necesidades de mano de obra, maquinaria o materia prima, se sabr si est cumpliendo con lo
programado o, por lo contrario, estamos por debajo o por encima de nuestra programacin, lo cual
afectara las existencias, las ventas, las existencias de las materias primas, etc.

Determinar lo tpico o lo normal de esa observacin: Cuando se cuantifica la caracterstica de un


fenmeno, se obtiene, ejemplo un valor denominado promedio, es esta la forma de referirnos al
grupo cuantificando as su comportamiento.

Determinar los cambios que presenta el fenmeno: cualquier fenmeno de carcter estadstico
presenta variaciones que requiere una observacin continua para poder determinar la magnitud
del cambio. La demanda, la produccin, las ventas, los precios, son fenmenos que
constantemente registran cambios que deben ser tenidos en cuenta por la administracin de una
empresa.

Relacionar dos o ms fenmenos: desde el punto de vista de correlacin, se pueden determinar si


existe una relacin vlida en dos o ms caractersticas de una observacin, por ejemplo la relacin
entre unidades producidas o vendidas y el costo o valor por unidad.

Determinar las causas de originan el fenmeno: los cambios que se observan en un fenmeno
pueden tener una o varias causas de origen. El aumento del precio de venta de un galn de
gasolina puede ser causado por alza del precio del barril en mercados internacionales o por
polticas gubernamentales relacionadas con la balanza de pagos.

Hacer estimativos acerca sobre el comportamiento futuro del fenmeno: en numerosas ocasiones
se requiere proyectar, para estimar el comportamiento futuro de un fenmeno. La proyeccin a
determinado tiempo de la poblacin de suscriptores o usuarios de un servicio pblico domiciliario,
sirve para determinar las inversiones a realizar, para que la empresa prestadora del servicio, pueda
operar en condiciones de eficiencia, estimando la demanda en los aos prximos.
8

MATHUMBI
Estadstica y Probabilidad

Obtener conclusiones de un grupo menor (muestra), para hacerlas extensivas a un grupo mayor
(poblacin). Al realizar mediciones en una muestra, como subconjunto de la poblacin, debe tener
un tamao adecuado, para que sea representativa de la poblacin en estudio, de esta manera, los
resultados obtenidos pueden ser considerados como el comportamiento que se obtendr si se
hubiera trabajado con todos los elementos constitutivos de la poblacin, de la cual se extrajo la
muestra.

Adems de lo anterior, la estadstica facilita una serie de instrumentos o tcnicas que, al ser utilizadas
correctamente, permiten determinar el grado de validez y confiabilidad, de las conclusiones obtenidas.

El objetivo de la inferencia estadstica, es determinar algn aspecto acerca de una poblacin con base
en un subconjunto representativo denominado muestra. Mediante el muestreo se realizan estimaciones
aproximadas de lo que sucede en la poblacin. En este aspecto en el captulo correspondiente al
Muestreo, se establecen mtodos tcnicos para calcular un tamao de muestra adecuado.

Una muestra es una porcin del universo en estudio que se selecciona para el anlisis, la cual nos
proporciona informacin suficiente para estimar con un margen mnimo de error y mxima confiabilidad,
las caractersticas de toda la poblacin.

En una muestra no probabilstica los individuos se eligen de forma subjetiva, por conveniencia, rapidez
y bajo costo. En el muestreo probabilstico o aleatorio todos los elementos de la poblacin tienen igual
probabilidad de ser incluidos, por lo que en lo posible se recomienda utilizar ste ltimo.

Para tomar una muestra no existe un mtodo de muestreo aleatorio o no aleatorio que podamos decir
es el mejor, todos ellos tienen un objetivo, dejar que el azar y el anlisis determinen los elementos que
van a constituirla. Sin embargo a juicio del investigador o analista se pueden incluir unidades en forma
obligatoria o forzada, por ejemplo, lo que sucede con los grandes conglomerados o ciudades capitales
que registran un gran nmero de suscriptores.

Mediante datos histricos obtenidos de forma directa o indirecta, se identifica la poblacin y muestra
objeto de estudio, se calcula el tamao definitivo partiendo de una prueba piloto y el uso de frmulas
adecuadas con promedios, desviaciones, mrgenes de error, niveles e intervalos de confianza, etc.

Lo ideal sera que el nmero de elementos o unidades de observacin que constituyen la muestra ,
denominada tambin poblacin por muestrear o poblacin muestreada, fuera igual al contenido total en
la poblacin o poblacin objetivo. Pero como no ocurre as, las conclusiones que se hacen vlidas para
la muestra pueden ser extendidas a la poblacin, garantizando estadsticamente la validez del proceso.

Ms adelante, en el desarrollo de nuestro estudio, y en el captulo correspondiente, determinaremos los


tipos de muestreo, as como el clculo del tamao de la muestra.
9

MATHUMBI
Estadstica y Probabilidad

PARTE 1. ESTADISTICA DESCRIPTIVA


10

MATHUMBI
Estadstica y Probabilidad

2 Descripcin de los datos


2.1 Distribuciones de frecuencia
Una de las funciones de la Estadstica es recolectar y organizar datos. A continuacin veremos cmo
organizar datos en forma de intervalos de clase, con resultados representativos y con un margen de error
mnimo, lo que nos permite analizar e interpretar un conjunto de datos, como si lo hiciramos con toda la
poblacin.

La presentacin de los datos suele hacerse indicando los atributos de las variables junto con sus respectivas
frecuencias y su presentacin se le denomina distribucin de frecuencias.

2.2 Tablas de distribucin

Son representaciones en intervalos de clase y columnas con la indicacin del nmero de observaciones en
cada clase o categora.

Ejemplo 1

Los siguientes datos corresponden a una prueba acelerada para medir la vida til en horas de uso, realizada
a una muestra de 60 bombillas de uso domstico de la fbrica KOMOALUX LTD.

Tabla 2.1

684 852 902 926 938 980 No DE DATOS 60


697 859 904 926 939 984 SUMA DE DATOS 54953,00
720 860 905 927 943 1005 PROMEDIO 915,88
773 868 907 927 946 1014 DESVIACION ESTANDAR 80,27
821 870 909 929 954 1015 MEDIANA 925,00
825 876 911 932 971 1016 MAXIMO 1093
831 893 915 932 972 1041 MINIMO 684
836 898 920 933 973 1052 RANGO 409
848 899 922 936 974 1080
852 900 924 937 977 1093

Los pasos a seguir para agrupar datos en intervalos de clase son:

Paso 1. La determinacin del nmero de clases, se realiza con la siguiente frmula:

= 1 + 3,3 log()

En el ejemplo

= 1 + 3,3 log(60) = 6,8681 7

Paso 2. Calcular el rango y el tamao de cada intervalo de acuerdo a ciertas consideraciones de tipo prctico,
as:

= = 1.093 684 = 409 ()

409
= = = 58,429 60 ( )
7
11

MATHUMBI
Estadstica y Probabilidad

= ( ) = 60 7 = 420 ( )

= = 420 409 = 11

De los anteriores clculos podemos concluir que un tamao de c igual a 60 sera lo adecuado. Lo
conveniente, a mi gusto, sera aproximar siempre al siguiente superior que sea par. La diferencia que se
presenta entre los rangos (11), se puede distribuir as: le sumamos 6 al dato mayor y le restamos 5 al dato
menor.

Rango Original
684 409 1093

Rango Modificado
679 420 1099

Paso 3. Proceder a construir la tabla

[ ]2
1
2
3
4
5
6
7
Totales

La Tabla 2.2 completa presenta las siguientes cifras:

[ ]2
1 679 -739 3 709 2127 3 60 0,0500 0,0500 1,0000 129.792
2 739 -799 1 769 769 4 57 0,0167 0,0667 0,9500 21.904
3 799 -859 8 829 6632 12 56 0.1333 0,2000 0,9333 61.952
4 859 -919 15 889 13335 27 48 0,2500 0,4500 0,8000 11.760
5 919 -979 23 949 21827 50 33 0,3833 0,8333 0,5500 23.552
6 979 -1039 6 1009 6054 56 10 0,1000 0,9333 0,1667 50.784
7 1039 - 1099 4 1069 4276 60 4 0,0667 1,0000 0,0667 92.416
Totales 60 55020 1,0000 392.160
12

MATHUMBI
Estadstica y Probabilidad

Donde:

Nmero de clases o intervalos

Lmites superior e inferior de cada clases

Frecuencia Absoluta. Cantidad de datos en cada clase

Marcas de clase. Punto central de cada clase , =


+
2

Columna para calcular la media de datos agrupados

Frecuencia Absoluta acumulada. Se interpreta como



menor que

Frecuencia Absoluta acumulada. Se interpreta como



mayor que


Frecuencia Relativa, = se escribe en tanto por uno


y se lee (%)

Frecuencia Relativa acumulada. Se interpreta como



menor que (%)

Frecuencia Relativa acumulada. Se interpreta como



mayor que (%)

[ ]2 Parte de la frmula para el clculo de la dispersin

La tabla 2.2 puede responder muchos interrogantes. Por ejemplo, en cul intervalo de clase est el dato que
se presenta con mayor frecuencia. Cul es el significado de las frecuencias relativas y de las acumuladas. De
igual manera suministra el material para construir representaciones grficas: Histogramas, Polgonos de
frecuencias, Ojivas, Grficos de Barras, Pastel, Tallo-Hoja, Pareto, Cajas, etc.
13

MATHUMBI
Estadstica y Probabilidad

2.3 Representaciones grficas


El grfico es una representacin de variables independientes y dependientes, generalmente dispuestas en
ejes cartesianos.

Grfico 2.1

Histograma
25 23

20
15
Frecuencias

15

10 8
6
3 4
5
1
0
679 - 739 739 - 799 799 - 859 859 - 919 9119 - 979 979 - 1039 1039 - 1099
Duracin en horas

Un Histograma, es una grfica en el que los intervalos de clase se marcan en el eje horizontal y sus
respectivas frecuencias en el eje vertical. La altura de cada barra representa la frecuencia asociada a cada
intervalo. Por ejemplo, en el grfico 2.1, el intervalo 739-799 horas, representa la clase que posee un
elemento.

El polgono de frecuencias se construye uniendo los puntos centrales de cada barra y nos indica las marcas
de clase, la tendencia lineal y su distribucin aproximada. A su vez muestra la simetra con respecto a valores
centrales.

Grfico 2.2
14

MATHUMBI
Estadstica y Probabilidad

Podemos representar variables o datos en diferentes tipos de grficos. En este aspecto, se debe considerar
que cualquiera sea el tipo, este tiene diferentes lecturas, interpretaciones y anlisis, dependiendo del
comportamiento de los datos. En todo caso, la grfica como tal, debe ser objeto de comentarios y
conclusiones.

Grfico 2.3

Un ejemplo lo constituyen las grficas pastel, que representan la distribucin porcentual de los datos.

En el caso particular, podemos leer en el grfico 2.4, que aproximadamente el 38% de las bombillas tienen
una duracin entre 919 y 979 horas y que el 13% de la muestra analizada, probablemente pueden tener una
vida til entre 799 y 859 horas.

Grfico 2.4
15

MATHUMBI
Estadstica y Probabilidad

Ojivas
Se obtienen de las columnas marcadas como frecuencias acumuladas en la tabla de distribucin de
frecuencias, resultan de singular importancia, ya que cada punto de la grfica, representa el nmero de datos
o el porcentaje de los mismos que es mayor o menor. Una mirada al grfico 2.5, y la tabla 2.3 nos puede
conducir, por ejemplo, a la siguiente lectura: 50 bombillas (83,33%) de la muestra pueden tener una duracin
de 979 horas o menos, mientras que 10 elementos pueden durar ms de 979 horas con un rendimiento
adecuado.

Tabla 2.3

OJIVAS Fi F'i
679 - 739 3 60
739 -799 4 57
799 - 859 12 56
859 - 919 27 48
919 - 979 50 33
979 - 1039 56 10
1039 - 1099 60 4
16

MATHUMBI
Estadstica y Probabilidad

OJIVA MENOR QUE OJIVA MAYOR QUE

70

60 60 60
57 56 56
FRECUENCIAS ACUMULADAS

50 50
48

40

33
30
27
20

12
10 10
3 4 4
0 0 0
679 739 799 859 919 979 1039 1099
INTERVALOS DE CLASE

2.4 Medidas de tendencia central

Una medida de tendencia central es un valor nico que resume un conjunto de datos. De una manera prctica
seala el centro de los valores.

2.4.1 Media o Promedio aritmtico

La media aritmtica es la suma de todos los valores de la poblacin o muestra dividido entre el nmero total
de dichos datos. Para este parmetro, hacemos uso de las frmulas dispuestas en la siguiente tabla:

Poblacin Muestra

Tamao


Todos los datos = =


Datos agrupados = =

Haciendo uso de los datos del ejemplo modelo que hemos venido desarrollando, calculamos las medias y
observamos las diferencias o errores que se presentan al agrupar los datos en frecuencias de clase.

Los valores obtenidos muestran un error relativo insignificante, lo que demuestra que el procedimiento
realizado, por el ilustre docente Humbi es vlido. Los mismos clculos se pueden realizar para los diferentes
estadsticos, producto del proceso.

Los resultados para la media aritmtica, se plasman en la tabla 2.4:


17

MATHUMBI
Estadstica y Probabilidad

Tabla 2.4

(Real todos los datos) (datos agrupados) Diferencias


Error Absoluto
915,88 917,00 1.12 horas
(horas)

915,88
Error Relativo (%) . = ( 1) 100 . = ( 1) 100 0.122%
917,00

A continuacin presentamos algunas propiedades de la media aritmtica:

1. Todo conjunto de datos de tipo numrico tiene un valor medio


2. Para evaluar la media se consideran todos los valores
3. La media toma un valor nico
4. Es til para comparar dos o ms poblaciones
5. La sumatoria de las desviaciones con respecto a la media es igual a 0
6. La media Aritmtica se ve afectada por valores extremos del conjunto de datos

2.4.2 Mediana y Percentiles

La mediana se define como el valor abajo del cual se encuentra la mitad de los valores y arriba del cual se
encuentra la otra mitad. Es decir, la mediana es el punto central o medio de los datos, despus de ordenarlos
de menor a mayor o viceversa, donde el 50% de las observaciones son menores a dicho valor y el 50% son
superiores.

Al igual que la media, la mediana presenta algunas propiedades importantes:

1. Es nica, solo existe una mediana para un conjunto de datos.


2. No se ve afectada por valores extremos en el sentido de ser o muy grandes o extremadamente
pequeos.
3. Se puede calcular para todo tipo de datos de nivel ordinal, de intervalo, razn o numrico.

Para determinar la mediana de todo un conjunto de datos, los ordenamos preferiblemente de menor a mayor,
su valor estar localizado en el centro de la distribucin.

Para datos no agrupados, distinguimos dos casos:

+1
a) Si n es impar, la mediana es el valor que ocupa la posicin , en smbolos es:
2

= (+1)/2

Por ejemplo, si tenemos 7 datos, que ordenados son:

1 = 4, 2 = 7, 3 = 8, 4 = 5, 5 = 6, 6 = 3, 7 = 1

El valor central es el cuarto (4 = 5). Este valor, que es la mediana de ese conjunto de datos, nos deja 3
datos por debajo y tres por encima del valor calculado.
18

MATHUMBI
Estadstica y Probabilidad

b) Si n es par, la mediana es la media aritmtica de los dos valores centrales. Por ejemplo si n=6, la mediana
es el punto central de los datos 3 , 4

1 = 4, 2 = 7, 3 = 8, 4 = 5, 5 = 6, 6 = 3

Para los anteriores datos la mediana se calcula:

+ +1 3 + 4 8 + 5
2 2
= = = = 6,5
2 2 2

Si los datos estn agrupados en una tabla de distribucin de frecuencias de clase, la mediana se puede hallar
aplicando la siguiente frmula:



= + (2 )

Donde:

Lmite inferior de clase del rengln de la mediana

Frecuencia acumulada anterior al rengln de la mediana

Frecuencia absoluta del rengln de la mediana

Tamao del intervalo donde se localiza la mediana

Ejemplo (Ver Tabla de Distribucin de Frecuencia)


30 27
= + (2 ) = 919 + ( ) 60 = 926,83
23

Se interpreta: Que el 50% de la muestra puede durar ms de 926.83 horas y el otro 50% menos de la
misma cantidad.

En consecuencia la mediana es el valor que divide los datos en dos partes, si lo hacemos en cuatro partes
(25% cada una) se denomina Cuartiles, en cinco lo denominamos Quintiles (20% en cada parte), en 10 partes
Deciles (10%/parte) y as sucesivamente obtenemos de manera ms general, los percentiles. El percentil
divide un nmero de observaciones en 100 partes iguales, por tanto se puede definir como el valor abajo del
cual se encuentra un porcentaje de los datos y un porcentaje por encima de dicho valor. Para determinar el
valor del percentil, se hace uso de una frmula similar a la de la Mediana:



= + (100 )

19

MATHUMBI
Estadstica y Probabilidad

Lmite inferior de clase del rengln de percentil

Frecuencia acumulada anterior al rengln del percentil

Frecuencia absoluta del rengln del percentil

Tamao del intervalo donde se localiza el percentil

Un ejemplo obtenido de la misma tabla para el clculo de la mediana, nos arroja el siguiente resultado:


38,4 27
= + (100 ) ; 64 = 919 + ( ) 60 = 948,74
23

Significa que el 64% de la muestra se espera que dure menos de 948,74 horas y el 36% ms de ste valor.

2.4.3 Moda

Se define como el dato que se presenta con mayor frecuencia. Se determina, para datos agrupados con la
aplicacin de la siguiente frmula:

1
= + ( )
1 + 2

Donde:

Lmite inferior de clase del rengln de la moda


Diferencias entre las frecuencias absolutas del rengln de la moda y la
1 frecuencia del inmediato anterior
Diferencias entre las frecuencias absolutas del rengln de la moda y la
2 frecuencia siguiente

Tamao del intervalo donde se localiza la moda

Continuando con nuestro ejemplo modelo tenemos que el dato que se presenta con mayor frecuencia es:

1 8
= + ( ) = 919 + ( ) 60 = 938,2
1 + 2 8 + 17

2.4.2 Otras medidas de tendencia central

2.4.2.1 Media Ponderada


Es un caso especial de la media aritmtica. Se presenta cuando no todos los elementos componentes tienen
el mismo peso o importancia o cuando hay varias observaciones con el mismo valor.
20

MATHUMBI
Estadstica y Probabilidad

Sea un conjunto de datos designados

, , , . . . .

Cada una con un peso o ponderacin

, , , . . . .

Entonces la media ponderada se calcula como sigue:

+ + + . +_{}_{})
= =
+ + + . +_{})

Ejemplo: Las calificaciones sobre 200 puntos obtenidas en un concurso de mritos se registran en la siguiente
tabla:

Tabla 2.5
Concepto Calificacin w Peso en % Nota Ponderada

Antecedentes 125 30 37,5

Prueba de
137 40 54,8
conocimientos

Prueba sicotcnica 150 20 30,0

Entrevista 100 10 10,0

Totales 512 100 132,3

De acuerdo con lo anterior, se observa que la media aritmtica toma un valor de 128 puntos, mientras que la
media ponderada es 132,3 puntos. Esta ltima cifra representa ms adecuadamente el comportamiento de
los datos del problema.

2.4.2.2 Media Geomtrica


Es la raz n-sima del producto de todos los valores, traducida en la aplicacin de la siguiente frmula:


= (1 )(2 )(3 ) . . ( )

Resulta til para promediar razones, tasas de variacin y nmeros ndice o para determinar el cambio
porcentual promedio durante cierto periodo de tiempo. La ventaja es que minimiza la importancia de los
valores extremos. La media geomtrica resulta siempre menor o igual a la media aritmtica, observndose
que todos los valores de datos deben ser positivos.

Ejemplos:

1.- Para obtener la tasa de cambio promedio de un periodo a otro, se utiliza:


21

MATHUMBI
Estadstica y Probabilidad


= ( ) 1

Suponga que las ganancias netas de una empresa en el ao 2001 eran de 2.150 millones de pesos y en el
2010 de 2.580 millones de pesos, entonces la tasa del incremento porcentual anual promedio para el periodo,
se calcula as:

10 2580
= ( ) 1 = 0,0184 = 1,84%
2150

2.- Suponga que se recibe un aumento de su salario del 5% para enero de este ao, con la promesa de recibir
otro aumento el prximo ao del 15%. El aumento porcentual promedio aritmtico es de un 10%. Este valor
no es correcto en trminos estadsticos. Procedamos a calcular la media geomtrica, recordando que una
variacin en trminos porcentuales equivale en nmeros ndice al 1.05 y al 1.15 respectivamente:

2
= (1.05)(1.15) = 1.09886

Lo anterior se puede interpretar de la siguiente manera: Suponga que su salario inicial era de $1.902.000 y
que recibi dos aumentos del 5% y 15%, entonces el promedio anual del aumento es de 9,886%. Las
diferencias presentadas son menores en contraste con las cifras de aumento y se presentan por las cifras
decimales que se asumen al extraer la raz cuadrada, como se aprecia en la siguiente tabla:

Tabla 2.6
Valor aumento
Concepto % Valor aumento Salario Final
medio
Aumento enero de
0.05 95.100 1.997.100,00
2014
Aumento enero de
0.15 299.565 2.296.665,00
2015
Aumento enero de
0.09886 188.031,72 2090.031,72
2014
Aumento enero de
0,09886 206.620,54 2.296.652,26
2015

Totales 394.665 394.652,26

3.- Las variaciones porcentuales del costo de vida de los ltimos 6 aos, segn informacin del DANE, se
enlistan de la siguiente forma. Entonces el promedio de aumento por ao se calcula de la siguiente forma:

Tabla 2.7
Ao % IPC a Diciembre Variacin %
2006 87,87
2007 5,69 92,87
2008 7,67 100,00
2009 2,00 102,00
2010 3,17 105.24
2011 3,73 109.16
22

MATHUMBI
Estadstica y Probabilidad

2012 2,44 111.82


2013 1,94 113.98 1.2971433507 29,71%

7
= (5,69)(7,67)(2,00)(3,17)(3,73)(2,44)(1,94) =3,36500199 MG 3,36500199
MEDIA ARIT 3,80571429

Como consecuencia de la informacin de la tabla 2.7, se puede establecer que el promedio de 3,365 %
corresponde al promedio de aumento por ao en el costo de vida, desde el 2007 al 2013. De otra parte la
columna del IPC representa un acumulado ao por ao el cual significa que desde diciembre del 2006 hasta
diciembre de 2007, los precios de la canasta familiar aumentaron en un 29,71%.

2.5 Medidas de dispersin

Las medidas de tendencia central solamente localizan el centro de los datos, pero un promedio no indica nada
si no se establece como estn distribuidos los datos con respecto al citado promedio. En tal sentido se hace
necesario establecer que tanto estn alejados con respecto a la media, es decir, describir la variabilidad o
dispersin de los datos considerados.

2.5.1 Rango o Amplitud

El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica. Se utiliza en
aplicaciones del control estadstico de la calidad y de los procesos de produccin.

= ( )

= 1093 684 = 409 ( )

2.5.2 Desviacin Media

Es el promedio de los valores absolutos de las desviaciones con respecto a la media.

| |
=

2.5.3 Varianza y Desviacin Estndar

La varianza se define como el promedio de las desviaciones cuadrticas de los datos con respecto a la media.
La Desviacin Estndar se define como la raz cuadrada de la varianza. Se extrae la raz con el propsito de
mantener las unidades de los datos originales.

Para la poblacin se utiliza la frmula:

( )2
=

Donde:
: Desviacin estndar de la poblacin
23

MATHUMBI
Estadstica y Probabilidad

: Valor de cada dato de la poblacin


: Promedio Aritmtico
: Tamao de la poblacin
Para la muestra se presentan cambios en cuanto a simbologa y un factor de correccin en su valor, causado
por el error de muestreo as:
( )2
( )2 2
= =
1 1

Donde:
: Desviacin estndar de la muestra
: Valor de cada dato de la muestra
: Promedio Aritmtico
: Tamao de la muestra

Si los datos se encuentran agrupados en una tabla de distribucin de frecuencias, la frmula para la desviacin
estndar se convierte entonces en:

( )2
=
1

Para nuestro ejemplo la podemos calcular, haciendo uso de la ltima columna de la tabla de frecuencias.

2.6 Interpretacin y uso de la desviacin estndar

En general la desviacin estndar es utilizada como una medida que nos indica que tanto estn los datos
agrupados alrededor de la media (dispersin). Este valor suele ser til para comparar el comportamiento de
dos o ms conjunto de observaciones.

2.6.1 Teorema de Chebyshev

Para un conjunto cualquiera de observaciones, puede ser la poblacin o la muestra, la proporcin mnima de
los valores que se encuentran dentro de k desviaciones estndar desde la media es por lo menos

1
1 , 1
2

Por ejemplo, si el consumo promedio de una familia de estrato 4 es de 12 m3, con una desviacin estndar
de 2 m3, se espera que por lo menos el 88,89% de las familias se encuentren con consumos entre menos 3
y ms 3 desviaciones estndar con respecto de la media, es decir que se encuentran en un intervalo de
consumo entre 8 y 18 m3.

2.6.2 Regla Emprica

En una distribucin de frecuencias simtrica en forma acampanada, aproximadamente el 68% de los datos
estarn entre ms o menos 1 desviacin estndar desde la media, aproximadamente el 95% entre ms o
menos dos desviaciones y el 99,7% a ms menos tres desviaciones desde la media.
24

MATHUMBI
Estadstica y Probabilidad

2.6.3 Coeficiente de Variacin

Es una medida relativa que se define como el cociente entre la desviacin estndar y la media aritmtica,
expresada como un porcentaje. Su utilidad radica en poder comparar conjuntos de datos que tienen diferentes
unidades o los datos estn en las mismas unidades pero los valores medios estn muy distantes. El resultado
se expresa en porcentaje y se calcula de la forma siguiente:


= (100)

Por ejemplo si el clculo anterior para dos conjuntos de datos nos da el 20% y el 10%, se interpreta que el
primer conjunto tiene una mayor dispersin relativa, con respecto a la media de la distribucin

2.6.4 Asimetra y Curtosis

Mide la forma en que se distribuyen los datos alrededor de la media, se describe con la observacin del
histograma y del polgono de frecuencias, en donde se puede apreciar la tendencia con sesgo hacia la
izquierda o hacia la derecha

Asimtrica Positiva Simtrica Asimtrica Negativa

Moda-Mediana-Media Media-Mediana-Moda
Moda
Mediana
Media

Para cuantificar este parmetro se puede recurrir a diferentes frmulas, entre las cuales la ms simple se
basa en la diferencia entre la media y la mediana, la cual fue desarrollada por Karl Pearson, denominado por
tal motivo como el COEFICIENTE DE ASIMETRIA (DE PEARSON)

3( )
=

Segn la anterior frmula el coeficiente puede asumir valores entre -3 y 3. Si el valor est cercano a 3 indica
una gran asimetra positiva, o sea el pico alto de la curva tiene tendencia hacia la izquierda, si es cero la
curva es simtrica o cercano a -3 es asimtrica negativa.

2.6.5 Diagramas de Caja

Un diagrama de caja es una representacin grfica basada en los cuartiles, que sirve como ayuda en la
interpretacin de un conjunto de datos.

Se puede sacar un ejemplo en Minitab, Excel o Spss y pegarlo en la pgina siguiente:


25

MATHUMBI
Estadstica y Probabilidad
26

MATHUMBI
Estadstica y Probabilidad

2.6 Ejercicios y Talleres

La empresa FRESCOS LOS MK, fabrica una lnea de refrescos marca AGUAPICHA. Por quejas
frecuentes se realiza un estudio tomando una muestra de la mquina que llena 1000 envases con
capacidad mxima de 280 CC por hora. Para establecer donde se presentan las fallas, se midi el
contenido de cada uno de los elementos de la muestra, la cual arroj los siguientes resultados en CC.

255 250 243 270 273 293 279 205 223 219 225 246 246 215 261 245 250 211 249 197 254 249 274 265 219
218 215 200 243 252 258 264 236 275 269 228 262 255 258 270 253 232 262 229 240 272 281 248 257 269
230 233 288 254 275 308 216 241 254 249 223 286 261 290 277 263 217 252 253 243 245 253 227 203 260
197 295 255 232 247 252 274 281 249 270 255 237 256 204 263 254 207 230 234 259 255 214 261 224 217
271 240 263 272 233 242 264 298 236 262 229 219 253 200 245 215 268 190 254 205 262 247 265 224 230

1.-Elaborar una tabla de distribucin de frecuencias segn los convenios establecidos.


2.-Calcular los errores porcentuales para la media al agrupar los datos.
3.-Elaborar histograma y ojivas
4.-Calcular en el histograma el porcentaje de envases con contenidos entre 250 y 280 CC
5.-Haga uso de la ojiva para calcular el contenido de un frasco que se ve superado por el 69% de la
muestra.
6.-Cuales son los limites esperados para el 90% central de los datos
7.-El gerente piensa establecer como norma que las mquinas deben ajustarse para obtener envases
que tengan una capacidad actualizada, Cul es dicho Valor?
8.-El analista financiero por el contrario sugiere un valor central. Cul es?
9.-Finalmente el Jefe de planta est de acuerdo con un valor ms representativo, dando un intervalo
segn la dispersin de los datos. Cul es la propuesta?
10.-Cul es la duracin de un frasco que supera al 69% de la muestra
27

MATHUMBI
Estadstica y Probabilidad

3 Probabilidad y sus leyes

MAPA CONCEPTUAL DE PROBABILIDAD

LEYES DE LA
MULTIPLICACION
TECNICAS DE
PERMUTACIONES CON
CONTEO PROBABILIDADES LEYES
REPETICION
PROBABILIDAD
CONDICIONAL
COMBINACIONES

-CLASICO -
A PRIORI LEYES DE LA SUMA
PERMUTACIONES

ENFOQUES CONJUNTOS

FRECUENCIA TEOREMA DE BAYES


RELATIVA (A
POSTERIORI)
MULTIPLICACION

SUBJETIVO
WEIBULL BINOMIAL NEGATIVA

DISTRIBUCIONES UNIFORME
LOGARITMICA

CHI-CUADRADO
POISSON

CONTINUAS DISCRETAS

EXPONENCIAL GEOMETRICA

DISTRIBUCIONES DE
MUESTREO
GAMMA
HIPERGEOMETRICA

BINOMIAL
NORMAL
28

MATHUMBI
Estadstica y Probabilidad

Objetivos: Al terminar este captulo el estudiante ser capaz de:


1. Definir lo que es probabilidad.

2. Describir los enfoques clsico, emprico y subjetivo de la probabilidad.

3. Entender los trminos: experimento, evento, resultado, permutaciones y combinaciones.

4. Definir los conceptos probabilidad condicional y probabilidad conjunta.

5. Calcular probabilidades aplicando las reglas de adicin y las reglas de multiplicacin.

6. Utilizar un diagrama de rbol para organizar y evaluar probabilidades.

7. Calcular una probabilidad utilizando el teorema de Bayes.

3.1 Introduccin
Gran parte de la vida del hombre se caracteriza por la incertidumbre. Muchos fenmenos del mundo parecen
estar dominados por el comportamiento aleatorio. Casi todas las decisiones se toman en un entorno
caracterizado por la ausencia de un conocimiento completo de la situacin. As, una decisin acerca de la
cantidad de unidades a fabricar se basa en las estimaciones del nmero de unidades que se espera vender.

El trmino probabilidad se refiere al estudio de la aleatoriedad y la incertidumbre. En cualquier situacin donde


se produzca uno o ms de varios resultados, la teora de la probabilidad proporciona mtodos adecuados
para cuantificar las posibilidades, oportunidades o simplemente probabilidades.

3.2 Definiciones y conceptos


La probabilidad es una medida de la posibilidad relativa de que un evento ocurra en el futuro, se relaciona
con procesos aleatorios caracterizados por el azar.

Hay tres enfoques de probabilidad: clsica, emprica y subjetiva.

A. Clsica o a-priori: Se basa en la consideracin de que los resultados de un experimento


son igualmente posibles. Los resultados son probables, el resultado se puede dar por
anticipado y se calcula de la forma siguiente

B. Emprica o a-posteriori: Se basa en las frecuencias relativas. Los resultados no se


pueden dar con anterioridad

C. Subjetiva: Probabilidad que es asignada por un experto basndose en cualquier


informacin o chisme disponible.
29

MATHUMBI
Estadstica y Probabilidad

Ejemplo 1
La probabilidad de extraer 4 cartas de una baraja de 52 y que ellas sean ases es del 7,69%, es un ejemplo
de probabilidad clsica o a-priori, que resulta de

4
() = = 0.0769 7,69%
52

Ejemplo 2
El acadmico e ilustre profesor Humbi, ha asignado un total de 60 bonificaciones para los parciales del
semestre (caritas felices). Cul es la probabilidad de que un estudiante de su curso reciba 5
bonificaciones, por participar o lamber por puntos?

Este es un ejemplo de la definicin emprica o a-posteriori de probabilidad, ya que su resultado no se


puede calcular

Su valor se calcula

5
() = = 0.0833 8,33%
60

Ejemplo 3
Un ejemplo de probabilidad subjetiva es:

Estimar la probabilidad de que el gran equipo SANTAFE participe en las finales de campeonato y
obtenga el anhelado ttulo, es de un 80%, de acuerdo a mi imparcial opinin.

Otras definiciones importantes son:

Un experimento es un proceso que conduce a que ocurra una (y solamente una) de varias
observaciones posibles.

Un resultado es un suceso particular proveniente de un experimento.

Un evento es un conjunto de uno o ms resultados de un experimento. Si es unitario ser un evento


simple, en caso contrario se denomina evento compuesto.

Ejemplo 4

Se lanza un dado no cargado una vez.


El experimento es lanzar el dado.
Los resultados posibles son los nmeros 1, 2, 3, 4, 5 y 6.
Un evento es la ocurrencia de un nmero par. Esto es, los nmeros
2, 4 y 6.

Adicionalmente consideremos otras clases de eventos:

Dos o ms eventos son mutuamente excluyentes si la ocurrencia de cualquiera de ellos, implica que
ninguno de los otros eventos pueda ocurrir al mismo tiempo, o sea, no pueden ocurrir o presentarse al
mismo tiempo. Por ejemplo es chino o es china, o es tuerca o es tornillo; pero no las dos cosas a la vez.

Dos o ms eventos son independientes si la ocurrencia de un evento no afecta la probabilidad de


ocurrencia de otros. Lo denominamos muestreo con reposicin
30

MATHUMBI
Estadstica y Probabilidad

Los eventos son dependientes si la ocurrencia de un evento afecta la ocurrencia de otro. En este caso
se realiza un muestreo sin reposicin.

Colectivamente exhaustivo: Si por lo menos uno de los eventos debe ocurrir cuando se realiza un
experimento, es decir su unin explica todos los posibles resultados de un experimento

3.3 Teora de conjuntos


3.3.1 Definicin:

Un conjunto es una reunin de elementos, se denota mediante letras maysculas A, B, C y sus elementos
con letras minsculas, por ejemplo para decir que el elemento pertenece al conjunto o en caso contrario
se puede escribir . En la Estadstica y Probabilidad, toma el nombre de evento.

3.3.2 Determinacin:

Los conjuntos los podemos determinar por:

Extensin: Si se realiza una lista de todos los elementos, separados por comas y dentro de corchetes.

= {, , , . . }

Comprensin: Si se identifica una cualidad o caracterstica de todos los elementos del conjunto.

= {| } = {| }

3.3.3 Condiciones de existencia

Para que un conjunto exista como tal, es necesario que se cumplan tres premisas:

1. Pertenencia. Se debe determinar claramente si un elemento pertenece o no pertenece a un


conjunto.

Universal o Referencial

A B

a b

En la figura , mientras que .

2. Orden. El orden en que se escriban los elementos de un conjunto no interesa. Por ejemplo:
= {| } = {, , , , , }

3. Repeticin. Los elementos de un conjunto no se deben repetir. Por ejemplo:


= {| } = {, , , , , }
31

MATHUMBI
Estadstica y Probabilidad

3.3.4 Clases de conjuntos

1. Vaco. Es aquel que no tiene elementos, se representa:


={ }=
2. Unitario. Es aquel que tiene un solo elemento, por ejemplo:

= {| , , } = { }

3. Finito. Es aquel en que el proceso de contar sus elementos tiene fin, por ejemplo:

= {| , }

4. Infinito. Es aquel en que el proceso de contar sus elementos no tiene fin, por ejemplo:
= { }

5. Conjuntos Iguales. Dos conjuntos son iguales si tienen los mismos elementos; por ejemplo:
= {| } = {, . 3, 2, 1, 0, 1, 2, 3 . . } =

6. Conjunto Universal o Referencial. Es el conjunto compuesto por todos los conjuntos y sus
elementos que se tratan en determinado momento. Su equivalencia nominal lo constituye el espacio
muestral (S), por ejemplo: Un estudio mdico trata de establecer la esperanza de vida en Colombia,
el universo est constituido por la edad de fallecimiento en forma natural de las personas en la ltima
dcada.

7. Conjuntos Disjuntos o Disyuntos. Dos conjuntos son disjuntos si no tienen elementos comunes por
ejemplo: Ser hincha del glorioso SANTAFE y al mismo tiempo de los chirosos de MILLOS.

3.3.5 Operaciones entre conjuntos

1. Unin. Es el conjunto compuesto por los elementos que estn en un conjunto o en el otro o en ambos.
En smbolos se escribe:

= { ,, }
UNIVERSAL

A B

Toda la regin sombreada


corresponde a AB

2. Interseccin. Es el conjunto compuesto por los elementos que estn simultneamente en los dos
conjuntos. En smbolos se escribe:

= { ,, }
32

MATHUMBI
Estadstica y Probabilidad

UNIVERSAL

A B

La parte verde es la

3. Diferencia. Es el conjunto compuesto por los elementos que estn en el primer conjunto pero que no
estn en el segundo. En smbolos se escribe:

= { ,, }
= { ,, }
UNIVERSAL

A B

La regin violeta corresponde a A-B,


la regin naranja a B-A

4. Complemento. Es el conjunto compuesto por los elementos que estn en el Universal o Referencial
pero que no estn en el conjunto A. En smbolos se escribe:

= { ,, }
33

MATHUMBI
Estadstica y Probabilidad

UNIVERSAL

El complemento de A corresponde a
la regin blanca

Ejemplo 5:
Se realiz una encuesta a 200 estudiantes sobre preferencia en ciertas marcas de cerveza con los
siguientes resultados:

UNIVERSAL

Marca Simbolo Cantidad A C


Aguila A 90
25 20 25
Costea C 70
Poker P 85 35 10
15
Aguila y Costea A,C 30
25
Aguila y Poker A,P 45
45
Costea y Poker C,P 25 P
Las Tres A,C,P 10

Sobre el diagrama y los datos podemos realizar un sin nmero de preguntas, como cantidades y
porcentajes de preferencias.

3.4 Principios de conteo


De acuerdo con los enfoques clsico o emprico para determinar probabilidades, el valor de probabilidad se
basa en el cociente del nmero de resultados elementales igualmente probables que son favorables, con
respecto al nmero total de resultados en el espacio muestral. Cuando los problemas son simples, es posible
contar en forma directa los resultados elementales, sin embargo en la prctica no se puede llevar a cabo tan
fcilmente esta labor. Para determinar el nmero de posibles resultados elementales, hacemos uso de ciertas
reglas o principios de conteo.

3.4.1 Principio de Multiplicacin

Si dos experimentos se realizan en orden o en sucesin y si hay n1 posibles resultados en el primero


y n2 en el segundo, entonces habr n1 n2 resultados posibles combinados. Se parte de la hiptesis
de que el resultado del primer experimento no influye en el resultado del segundo.
Si N experimentos se realizan en orden o en sucesin con , , , posibles resultados para N
experimentos, entonces habr l primero y n2 en el segundo, entonces habr posibles
resultados combinados.

Ejemplo 6:
Al lanzar un dado y a continuacin una moneda se presentan 6 resultados para el dado y 2 para la moneda,
entonces,
1 2 = (6)(2) = 12
34

MATHUMBI
Estadstica y Probabilidad

Ejemplo 7:
Si nos referimos al juego de la lotera de 4 cifras y 150 series. El nmero total de billetes emitidos para un
sorteo estar dado por
1 2 3 4 5 = (10)(10)(10)(10)(150) = 1.500.000

Ejemplo 8:
El principio tambin es aplicable a la emisin de placas de automviles, donde las tres primeras posiciones
son letras, con determinadas restricciones y las tres ltimas son dgitos. El nmero total de placas emitidas
en una ciudad estar dado por
1 2 3 4 5 6 = 170 = (5)(18)(26)(10)(10)(10) = 2.340.000

Similar procedimiento utilizan las Tarjetas Bancarias o tarjetas inteligentes.

3.5 Reglas bsicas de probabilidad


Regla 1. La probabilidad de un evento E es un nmero comprendido entre 0 y 1 ambos inclusive, en smbolos:
0 () 1

Nota. Una probabilidad en tanto por uno se debe expresar con 4 cifras decimales Ej. 0,3658. La anterior cifra
se puede escribir como 36,58%. Un valor cercano a cero significa que es poco probable que el evento suceda.
Un valor cercano a uno significa que es altamente probable que el evento suceda.

Regla 2. La probabilidad de que un evento suceda es igual a uno menos la probabilidad de que el evento no
ocurra y viceversa. Se conoce con el nombre de regla del complemento

( ) = 1 ( )

( ) = 1 ( )

Regla 3. Si dos eventos E1 y E2 son mutuamente excluyentes, la regla especial de la adicin indica que la
probabilidad de que ocurra uno u otro de los eventos, es igual a la suma de sus probabilidades simples

(1 2 ) = (1 ) + (2 )

Regla 4. Dados n eventos E1, E2, E3 En mutuamente excluyentes, la probabilidad de que ocurra uno u otro
de los eventos, es igual a la suma de sus probabilidades simples o probabilidades marginales

(1 2 3. ) = (1 ) + (2 ) + (3 ) + + ( )

Regla 5. Si dos eventos E1 y E2 son no mutuamente excluyentes, la regla especial de la adicin indica que
la probabilidad de que ocurra uno u otro de los eventos o ambos a la vez, se puede expresar mediante la
siguiente frmula:

(1 2 ) = (1 ) + (2 ) (1 2 )

Ejemplo: el experimento consiste en seleccionar aleatoriamente una carta de una baraja de 52, los eventos
que sea una Q de picas

( ) = () + () ( )

4 13 1 4
( ) = + =
52 52 52 13
Nota. Se debe tener presente que la Quca se ha contado dos veces
35

MATHUMBI
Estadstica y Probabilidad

Regla 6. Si dos eventos E1 y E2 son independientes, entonces la probabilidad conjunta de que estos se
sucedan al mismo tiempo o en sucesin es igual al producto de las probabilidades marginales, algunos
autores la nombran como regla especial de la multiplicacin, y se puede expresar mediante la siguiente
frmula:

(1 2 ) = (1 )(2 )

Regla 7. Es una generalizacin para n eventos independientes, entonces la probabilidad conjunta que los
E1, E2, E3 En eventos ocurran al mismo tiempo o en sucesin es igual al producto de las probabilidades
marginales y se puede expresar mediante la siguiente frmula:

(1 2 3. ) = (1 )(2 )(3 ) ( )

Probabilidad condicional
La probabilidad condicional es la probabilidad de que ocurra un evento determinado, dado que otro
evento ya haya ocurrido.

La probabilidad de que ocurra el evento A dado que el evento B ha ocurrido se escribe P(A/B).

Recordemos la definicin de eventos independientes: Dos o ms eventos son independientes si la


ocurrencia de un evento no afecta la probabilidad de ocurrencia de otros eventos. As mismo, dos eventos
son dependientes si la probabilidad de ocurrencia de un evento es afectada por la ocurrencia o no ocurrencia
del otro evento.

De acuerdo con lo expresado la regla general de multiplicacin es utilizada para encontrar la probabilidad
conjunta de que dos eventos ocurran y se determina para eventos independientes y dependientes de la
siguiente forma:

La regla establece que dados dos eventos A y B, la probabilidad conjunta de que ambos ocurran se encuentra
multiplicando la probabilidad de que suceda A, por la probabilidad condicional de que ocurra el evento B.

( ) = ()( |)

Si los eventos son independientes:

Regla 8. Si dos eventos E1 y E2 son independientes, entonces la probabilidad condicional de que ocurra E1
dado que ocurri E2, es equivalente a la probabilidad marginal de E1. Igualmente, la probabilidad condicional
de que ocurra E2 dado que ocurri E1, es equivalente a la probabilidad marginal de E2., en smbolos lo
expresamos:

(1 |2 ) = (1 )

(2 |1 ) = (2 )

Si los eventos son dependientes:

Regla 9. Si dos eventos E1 y E2 son dependientes, entonces la probabilidad condicional de que ocurra E1
dado que ocurri E2, es igual a la probabilidad conjunta de los eventos E1 y E2 dividida entre la probabilidad
marginal o probabilidad simple de E2. De igual manera se expresa la probabilidad condicional de que ocurra
E2 dado que ocurri E1, en smbolos lo expresamos:
(1 2 ) = (1 )(2 |1 )
36

MATHUMBI
Estadstica y Probabilidad

(1 2 )
(1 |2 ) =
(2 )

(1 2 )
(2 |1 ) =
(1 )

Ejemplo el de atentados y con diagramas de rbol

El Director Administrativo de la Sede de Bogot de la Universidad Cooperativa de Colombia, recopil la


siguiente informacin acerca de estudiantes no graduados, con culminacin de asignaturas, en los dos ltimos
semestres de estudio, seminarios o pasantas.

a) Si un estudiante es seleccionado al azar, cul es la probabilidad de que el estudiante sea una


mujer (F) pasante de contadura (C)?
Respuesta P(C y F) = 110/1000
b) Dado que el estudiante es una mujer, cul es la probabilidad de que ella sea pasante de
contadura?

( ) 0,11
( | ) = = = 0,275 = 27,5%
() 0,40

El diagrama de rbol es una representacin grfica til para organizar clculos que abarcan varias etapas.
Cada segmento en el rbol es una etapa del problema. Las probabilidades escritas cerca de las ramas son
las probabilidades condicionales del experimento.

Ejemplo 9

En una bolsa que contiene 7 chips rojos y 5 chips azules, se selecciona dos chips uno despus del otro sin
reemplazarlo. Elabore un diagrama de rbol mostrando esta informacin.
37

MATHUMBI
Estadstica y Probabilidad

I ENSAYO II ENSAYO

ROJO
2

6/11
ROJO
1

5/11
7/12 AZUL
2

INICIO

ROJO
5/12 2
7/11

AZUL
1

4/11
AZUL
1
38

MATHUMBI
Estadstica y Probabilidad

3.6 Teorema de Bayes


3.6.1 Introduccin

En el siglo XVIII el reverendo Thomas Bayes quera probar la existencia de Dios, para ello intent desarrollar
una frmula matemtica con base en evidencias terrenales disponibles. Ms adelante, Laplace puso bonito y
afin el trabajo de Bayes y le dio el nombre de Teorema de Bayes. Es conocido como frmula de la
probabilidad de causas. La probabilidad condicional tiene en cuenta informacin adicional acerca de la
ocurrencia de un evento para encontrar la probabilidad de otro. En este caso, para expresar la probabilidad
condicional de un evento aleatorio A dado que sucedi B necesitamos primero otro resultado y como se vera
afectado su valor.

Parte de una situacin en la que es posible conocer las probabilidades de que ocurran una serie de sucesos
Ai. A esta se aade un suceso B cuya ocurrencia proporciona cierta informacin, ya que las probabilidades
de ocurrencia de B son diferentes y dependen de que Ai haya ocurrido.

Conociendo que ha ocurrido el suceso B, la frmula del teorema de Bayes nos indica como modifica sta
informacin las probabilidades de los sucesos Ai.

En la seccin de las reglas bsicas de probabilidad habamos enunciado que se puede determinar una
probabilidad condicional para eventos independientes y dependientes de la siguiente forma:

La regla establece que dados dos eventos A y B, la probabilidad conjunta de que ambos ocurran se encuentra
multiplicando la probabilidad de que suceda A, por la probabilidad condicional de que ocurra el evento B.

( ) = ()( |)

Si los eventos son independientes:

Regla 8. Si dos eventos E1 y E2 son independientes, entonces la probabilidad condicional de que


ocurra E1 dado que ocurri E2, es equivalente a la probabilidad marginal de E1. Igualmente, la
probabilidad condicional de que ocurra E2 dado que ocurri E1, es equivalente a la probabilidad
marginal de E2., en smbolos lo expresamos:

(1 |2 ) = (1 )

(2 |1 ) = (2 )

Si los eventos son dependientes:

Regla 9. Si dos eventos E1 y E2 son dependientes, entonces la probabilidad condicional de que ocurra
E1 dado que ocurri E2, es igual a la probabilidad conjunta de los eventos E1 y E2 dividida entre la
probabilidad marginal o probabilidad simple de E2. De igual manera se expresa la probabilidad
condicional de que ocurra E2 dado que ocurri E1, en smbolos lo expresamos:

(1 2 )
(1 |2 ) =
(2 ) (1 2 ) = (1 )(2 |1 )
(1 2 )
(2 |1 ) =
(1 )

De igual manera para comprender el nombrado Teorema de Bayes, se hace necesario tener presente los
enfoques de clsico (a priori) y emprico (a posteriori)

A. Clsica o a-priori: Se basa en la consideracin de que los resultados de un experimento


son igualmente posibles. Los resultados son probables, el resultado se puede dar por
39

MATHUMBI
Estadstica y Probabilidad

anticipado, es la probabilidad inicial con base en el nivel actual de informacin y se calcula


de la forma siguiente:

B. Emprica o a-posteriori: Se basa en las frecuencias relativas. Los resultados no se


pueden dar con anterioridad, es una probabilidad revisada con base en una informacin
adicional, se calcula

Teniendo en cuenta lo expuesto, la probabilidad se calcula haciendo uso de la frmula generalizada del
Teorema de Bayes, en la cual se parte de la hiptesis de que los Ai eventos son mutuamente excluyentes y
colectivamente exhaustivos

P ( Ai )P (B / Ai )
P ( Ai | B )
P ( A1 )P (B / A1 ) P ( A2 )P (B / A2 ) .... P ( An )P (B / An )
Para el supuesto caso de dos eventos A1 y A2, dado que sucedi B; Ai representa cualquiera de los dos
mencionados eventos, en tal caso la frmula del teorema se expresa

( ) ( | )
( | ) =
(1 )(|1 ) + (2 )(|2 )

La interpretacin y uso de la frmula se explica con el siguiente ejemplo:

Ejemplo 10

Suponga que el 5% de la poblacin de la Amazona padece de una enfermedad llamada Triculiosis Aguda
Sea A1 el evento tener la enfermedad y el evento A2 no tener la enfermedad.

La Secretara de Salud de la Amazona dispone de equipos de diagnstico no muy confiables para detectar
la enfermedad (Chimbos), ya que da una seguridad del 90%, si en realidad el individuo padece de la
enfermedad y de una seguridad del 15% que al aplicarle la prueba, sta resulte positiva y no estaba enfermo.

Si consideramos a B como el evento la enfermedad est presente segn la prueba, es decir si est enfermo,
y B es el evento la enfermedad no est presente, pero segn la prueba si est enfermo (prueba chimba,.. Ay
hijue que susto).

Las probabilidades con base en el nivel actual y adicional de informacin las resumimos en tabla siguiente,
as:

Probabilidad a-priori Probabilidad a-posteriori Comentario


Si seleccionamos un habitante al azar la
( ) = , probabilidad de tener Triculiosis es el 5%
40

MATHUMBI
Estadstica y Probabilidad

La probabilidad de no padecer la Triculiosis


( ) = , es el 95%
La prueba indica que padece la Triculiosis
(|1 ) = 0,90 con probabilidad del 90%
La prueba indica que padece la
(|2 ) = 0,15 enfermedad, pero en realidad no la tiene

Si selecciona un habitante al azar, al que se le aplica la prueba y sta resulta positiva Cul es la probabilidad
de que la persona tenga realmente la nombrada Triculiosis? En forma simblica y en aplicacin del Teorema
de Bayes, se responde as:

(1 )(|2 ) (0,05)(0,90)
( | ) = = = 0,24 = 24,00%
(1 )(|1 ) + (2 )(|2 ) (0,05)(0,90) + (0,95)(0,15)

Si selecciona aleatoriamente otra persona, al que se le aplica la prueba y sta resulta positiva Cul es la
probabilidad de que la persona no tenga realmente la nombrada Triculiosis?

(2 )(|1 ) (0,95)(0,15)
( 2 | ) = = = 0,76 = 76,00%
(1 )(|1 ) + (2 )(|2 ) (0,05)(0,90) + (0,95)(0,15)
41

MATHUMBI
Estadstica y Probabilidad

3.7 Ejercicios y Talleres


42

MATHUMBI
Estadstica y Probabilidad

Fuentes Bibliogrficas
Bibliografa Fsica

Berenson, Levine, Krehbiel, Estadstica para Administracin, 2a Edicin, Editorial Prentice Hall, Mxico, 2001.

Lind, Marchal, Mason, Estadstica para Administracin y Economa, 11 Edicin, Alfa Omega Ediciones,
Bogot 2004.

Lind, Marchal, Mason, Estadstica para Administracin y Economa, 11 Edicin, Alfa Omega Ediciones,
Bogot 2004.

Martnez Bencardino Ciro, Estadstica y Muestreo, Dcima Edicin, Ecoe Ediciones, Bogot Agosto de 2000.

Quezada Lucio Nel, Estadstica con SPSS 16, Empresa Editora Macro EIRL, Lima, Febrero 2008., Ecoe
Ediciones, 2010.

Fuentes virtuales