Está en la página 1de 23

LUIS GABRIEL NIO DUARTE

ANYI YISLENI ORJUELA ARENAS

DOCENTE:
ANGELA PATRICIA GUERRERO

-2013-

PROYECTO ESTADISTICA II

LUIS GABRIEL NIO DUARTE


ANYI YISLENI ORJUELA ARENAS

INSTITUCION UNIVERSITARIA POLITECNICO GRANCOLOMBIANO


ADMINISTRACION DE EMPRESAS
(CURRICULO INTEGRADO) VIRTUAL
-2013-

II ENTREGA

OBJETIVOS

Calcular y analizar la informacin proporcionada por las medidas de tendencia


central, las medidas de localizacin y las medidas de dispersin.
Comprender los conceptos tericos estadsticos haciendo uso de un programa.
Utilizar el programa Microsoft Excel para poder realizar clculos de
probabilidad, utilizando las funciones de probabilidad para variables aleatorias
discretas y para V.A. continuas.
Aplicar y comprender correctamente los conceptos de Distribucin Binomial,
Distribucin Normal, Teorema del Lmite Central, Estimacin Puntual e Intervalo
de Confianza.

MARCO TERICO

Teora de Probabilidad
La probabilidad constituye un importante parmetro en la determinacin de las
diversas casualidades obtenidas tras una serie de eventos esperados dentro de un
rango estadstico.
Existen diversas formas como mtodo abstracto, como la teora Dempster-Shafer y la
teora de la relatividad numrica, esta ltima con un alto grado de aceptacin si se
toma en cuenta que disminuye considerablemente las posibilidades hasta un nivel
mnimo ya que somete a todas las antiguas reglas a una simple ley de relatividad. La
probabilidad de un evento se denota con la letra p y se expresa en trminos de una
fraccin y no en porcentajes, por lo que el valor de p cae entre 0 y 1. Por otra parte, la
probabilidad de que un evento "no ocurra" equivale a 1 menos el valor de p y se
denota con la letra q.
P(Q) = 1 - P(E)
Los tres mtodos para calcular las probabilidades son la regla de la adicin, la regla de
la multiplicacin y la distribucin binomial.

Regla de la adicin
La regla de la adicin o regla de la suma establece que la probabilidad de ocurrencia
de cualquier evento en particular es igual a la suma de las probabilidades individuales,
si es que los eventos son mutuamente excluyentes, es decir, que dos no pueden
ocurrir al mismo tiempo.
P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente. P(A o B) =
P(A) + P(B) P(A y B) si A y B son no excluyentes.
Siendo: P(A) = probabilidad de ocurrencia del evento A. P(B) = probabilidad de
ocurrencia del evento B. P(A y B) = probabilidad de ocurrencia simultnea de los
eventos A y B.

Regla de la multiplicacin
La regla de la multiplicacin establece que la probabilidad de ocurrencia de dos o ms
eventos estadsticamente independientes es igual al producto de sus probabilidades
individuales.
P(A y B) = P(A B) = P(A)P(B) si A y B son independientes. P(A y B) = P(A B) =
P(A)P(B|A) si A y B son dependientes

Regla de Laplace
La regla de Laplace establece que:
La probabilidad de ocurrencia de un suceso imposible es 0.
La probabilidad de ocurrencia de un suceso seguro es 1, es decir, P(A) = 1.
Para aplicar la regla de Laplace es necesario que los experimentos den lugar a
sucesos equiprobables, es decir, que todos tengan o posean la misma probabilidad.
La probabilidad de que ocurra un suceso se calcula as:
P(A) = N de casos favorables / N de resultados posibles
Esto significa que: la probabilidad del evento A es igual al cociente del nmero de
casos favorables (los casos dnde sucede A) sobre el total de casos posibles.

Distribuciones de probabilidad
La distribucin de probabilidades es un modelo que describe la forma en que varan
los resultados de un experimento aleatorio.

Experimento aleatorio
Es definido como un proceso o actividad que al ejecutarse puede dar uno o varios
posibles resultados. Si es al AZAR lo que define el resultado, se dice que el
experimento es aleatorio.

Variable aleatoria
La variable aleatoria est asociada con los resultados de los experimentos aleatorios.
La variable aleatoria toma diferente valores dependiendo del resultado del experimento
aleatorio.
Segn el tipo de valor que toman las variables pueden ser discretas, reales o
continuas. Las variables discretas son aquellas cuyos valores son nmeros enteros,
las variables reales son las que toman valores con decimales y las variables continuas
son las que toman los valores en un intervalo.

Distribucin Binomial

Es una distribucin de probabilidad discreta, mide el nmero de xitos en una


secuencia de n ensayos independientes, con una probabilidad fija de ocurrencia del
xito entre los ensayos.
La variable binomial es una variable aleatoria discreta que solo puede tomar los
valores,n suponiendo que se han realizado n pruebas. Como hay que considerar
todas las maneras posibles de tener X-xitos y (n-X)-fracasos, debemos calcular estas
por combinaciones (nmero combinatorio n sobre X).
Cada experimento tiene dos resultados posibles: XITO O FRACASO, donde la
probabilidad de XITO es p y la probabilidad de fracaso es q=1-p.
El resultado obtenido en cada prueba es independiente; la probabilidad de xito se
mantiene constante entre un experimento y otro.
Todo experimento que tenga esas caractersticas se le puede aplicar el modelo
binomial.
Microsoft Excel nos permite calcular la probabilidad de obtener un nmero concreto de
xitos (P(X=xi)) de una variable aleatoria discreta que sigue una distribucin binomial
B(n,p), en problemas con un nmero fijo de pruebas o ensayos (n), cuando los
resultados de un ensayo son slo xito o fracaso, cuando los ensayos son
independientes y cuando la probabilidad de xito es constante durante todo el
experimento (p).
Para ello, en insertar funcin, selecciona dentro del tipo de funciones estadsticas, el
comando DISTR.BINOM.
Los argumentos de la funcin:
* Nm_xito, es el nmero de xitos en los ensayos, que se desean estimar (xi).
* Ensayos, es el nmero de ensayos independientes o repeticiones que se realizan
(ni).
* Prob_xito, es la probabilidad de xito en cada ensayo (p).
* Acumulado, es un valor lgico que determina la forma de la funcin. Si el argumento
acumulado es VERDADERO, DISTR.BINOM devuelve la funcin de distribucin
acumulada, que es la probabilidad de que exista el mximo nmero de xitos; si es
FALSO, devuelve la probabilidad para una condicin en particular.

Distribucin Normal
Las distribuciones de probabilidad normal tambin son conocidas como la distribucin
de gauss o distribucin gaussiana. Esta distribucin de caracteriza porque los valores
se distribuyen formando una campana de Gauss, en torno a un valor central que
coincide con el valor medio de la distribucin: Un 50% de los valores estn a la
derecha de este valor central y otro 50% a la izquierda.
Cuando la media de la distribucin es 0 y la varianza es 1, se denomina "normal
tipificada", y su ventaja reside en que hay tablas donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucin.
Adems, toda distribucin normal se puede transformar en una normal tipificada.
La importancia de la distribucin normal se debe principalmente a que hay muchas
variables asociadas a fenmenos naturales que siguen el modelo de la normal.

Microsoft Excel nos permite calcular la probabilidad de una variable aleatoria continua
que sigue una distribucin normal tanto con una media y desviacin tpica de cualquier
valor, N( , ), como los valores de una normal tipificada o estandarizada, N(0,1). A su
vez, tambin nos permite conocer cmo se estandarizan o tipifican las variables.
La funcin DISTR.NORM, permite buscar la probabilidad que en una distribucin
normal de parmetros N (,) deja por debajo el valor a, (P(X a) ). Para ello, en
insertar funcin, selecciona dentro del tipo de funciones estadsticas, el comando
DISTR.NORM.
Esta funcin, devuelve la distribucin normal para la media y desviacin estndar
especificadas. Tiene un gran nmero de aplicaciones en estadstica, incluidas las
pruebas de hiptesis. Los parmetros a definir son:
* X es el valor cuya distribucin desea obtener (xi = a).
* Media es la media aritmtica de la distribucin (parmetro ).
* Desv_estndar es la desviacin estndar de la distribucin (parmetro ).
* Acum. es un valor lgico que determina la forma de la funcin. Si el argumento Acum.
es VERDADERO, la funcin DISTR.NORM devuelve la funcin de distribucin
acumulada, es decir, la frmula es el entero desde el infinito negativo a x de la frmula
dada.; si es FALSO, devuelve la funcin de masa de probabilidad.
La funcin DISTR.NORMAL.ESTANDAR nos permite calcular la probabilidad que, en
una distribucin normal de media cero y desviacin tpica uno, se encuentra por
debajo del valor a, (P(Z a) =?). Para ello, en insertar funcin, selecciona dentro del
tipo de funciones estadsticas, el comando DISTR.NORM.ESTAND(z).
Esta opcin devuelve la funcin de distribucin normal estndar acumulativa. La
distribucin tiene una media de 0 (cero) y una desviacin estndar de uno. Esta
funcin nos proporciona las mismas probabilidades que la tabla estndar de reas de
curvas normales.

Teorema del Lmite Central


El teorema del lmite central o teorema central del lmite indica que, en condiciones
muy generales, la distribucin de la suma de variables aleatorias tiende a una
distribucin normal cuando la cantidad de variables es muy grande. ste teorema,
perteneciente a la teora de la probabilidad, encuentra aplicacin en muchos campos
relacionados, tales como la inferencia estadstica o la teora de renovacin.
El enunciado del teorema es el siguiente:
Sea X1, X2,,Xn una muestra aleatoria de una poblacin cuya distribucin tiene por
media y por desviacin estndar . Entonces, si n es suficientemente grande, la
variable aleatoria

Tiene una distribucin aproximadamente normal con media x= y x=/n1/2. De esta


forma la variable

Se distribuye aproximadamente normal estndar, conforme n se hace grande.

Estimacin Puntual
La estadstica provee tcnicas que permiten obtener conclusiones generales a partir
de un conjunto limitado pero representativo de datos. Cuando inferimos no
tenemos garanta de que la conclusin que obtenemos sea exactamente correcta. Sin
embargo, la estadstica permite cuantificar el error asociado a la estimacin.
La mayora de las distribuciones de probabilidad dependen de cierto nmero de
parmetros. Salvo que estos parmetros se conozcan, deben estimarse a partir de los
datos.
El objetivo de la estimacin puntual es usar una muestra para obtener nmeros que,
en algn sentido, sean los que mejor representan a los verdaderos valores de los
parmetros de inters.
Supongamos que se selecciona una muestra de tamao n de una poblacin. Antes de
obtener la muestra no sabemos cul ser el valor de cada observacin. As, la primera
observacin puede ser considerada una v.a. X1, la segunda una v.a. X2, etc. Por lo
tanto, antes de obtener la muestra denotaremos X1, X2,...., Xn a las observaciones y,
una vez obtenida la muestra los valores observados los denotaremos x1, x2,...., xn.
Un estimador puntual de un parmetro es un valor que puede ser considerado
representativo de y se indicar . Se obtiene a partir de alguna funcin de la
muestra.
La estimacin por intervalo: es aquella que calcula un intervalo que contenga entre sus
lmites, con cierta probabilidad, el verdadero valor del parmetro poblacional. Este
intervalo se llama INTERVALO DE CONFIANZA.

PROCEDIMIENTO

Distribuciones de probabilidad. Estimacin de Parmetros.


1. La resolucin del primer punto es presentada en la hoja de clculo 1 Distribucin
Binomial. Como necesitamos simular una distribucin binomial, el primer paso a
seguir es determinar los parmetros requeridos para ser insertados en la funcin de
Excel DISTR.BINOM.N[x(nmero de xito);n(ensayos);p(probabilidad de xito);valor
lgico verdadero (1) si es acumulado]
El nmero de xito x depende de la condicin dada en la actividad, sin embargo es
necesario hallar las probabilidades particulares desde x=0 hasta x=10 con el fin de dar
respuesta a todas las preguntas planteadas en sta parte.

El nmero de ensayos n es una condicin dada, por lo tanto su valor es n=10.


La probabilidad de xito para los clientes con hobby viajar (3 en la base de datos), la
determinamos a partir de las tablas dinmicas desarrolladas en la entrega anterior, de
modo que p corresponde a la (cantidad de clientes con hobby viajar)/(total de clientes),
entonces p=335/1895.
Una vez hallados los parmetros anteriores, procedemos a calcular las respectivas
probabilidades de xito para cada caso en particular, plasmadas en la tabla que se
muestra a continuacin:
x

P[X=x]

P[X=0]

P[X=1]

2
3

P[X=2]
P[X=3]

4
5

P[X=4]
P[X=5]

P[X=6]

P[X=7]

P[X=8]

9
10

P[X=9]
P[X=10]

0,1429400
2
0,3069545
3
0,2966243
3
0,1698618
0,0638342
8
0,0164496
0,0029437
1
0,0003612
2
2,9089E05
1,3881E06
2,981E-08

La respuesta al inciso a), corresponde entonces a la suma de las probabilidades para


los nmeros de xito de 3 a 10, ya que satisfacen la condicin impuesta, obteniendo
un valor de 0.253.
De manera similar la parte b), se expresa como la suma de las probabilidades de xito
para el intervalo de X=2 y X=5; llegando al valor de 0.547 como respuesta.
Conociendo la probabilidad de xito para ste caso en particular, el tamao de toda la
poblacin y el tamao de la muestra; concluimos que se espera que 2 clientes en una
muestra de 10 tengan como hobby viajar y de la misma forma 335 clientes se ajustan
a ste criterio de la poblacin total de 1895 clientes.

2. Tanto el segundo como tercer problema son resueltos en la hoja de clculo 2 y 3


Distribucin Normal . Utilizando la funcin de Excel PROMEDIO para la columna que
contiene los INGRESOS conseguimos la media = 5342. Similarmente la funcin
DESVEST.P nos arroja la desviacin estndar para el grupo de datos a analizar
=4832,453. Lo anterior con el fin de obtener los parmetros requeridos por la funcin
DISTR.NORM.N. A continuacin desarrollamos las preguntas planteadas en ste
punto; un cliente seleccionado al azar tiene como probabilidad de tener un ingreso

inferior a $5000.000, P(X<5000.000) = 0,472, mientras que la probabilidad de tener


un ingreso entre 3000.0000 y 6500.000 corresponde a P(3'000.000<X<6'500.000) =
P(X<6500.000) - P(X<3000.000) = 0,281. Por ltimo tenemos que P(X6'000.000) =
1 - P(X<6000.000) = 0,446.

3. Para la resolucin del tercer apartado comenzamos por hallar la media y la


desviacin estndar de los GASTOS siguiendo las instrucciones descritas
anteriormente, obteniendo = 2793 y = 2485, 237, respectivamente.
El siguiente paso involucra la utilizacin del Teorema del Lmite Central, para el cual
normalizamos los datos nominales con la frmula

y
Donde n corresponde al tamao de la poblacin y es el valor promedio de referencia
a utilizar segn la pregunta que estemos respondiendo. Para todas las preguntas
tenemos el mismo x= 392,95.
Entonces para obtener la probabilidad de que la muestra aleatoria de 40 tenga una
media superior a 2400.000, tenemos un valor de Z = -0,999.
P(

>2'400.000) = P(Z > -0.999) = 1 - P(Z < -0.999) = 0.841

Cabe resaltar que


P(Z < -0,999) es calculado utilizando la
DISTR.NORM.ESTAND.N, para la cual slo necesitamos el valor estndar Z.

funcin

Con la misma lgica anterior para hallar el valor de la probabilidad de que la media de
la muestra se encuentre entre 2000.000 y 2800.000, necesitamos normalizar stos
dos valores anteriores, resultando en Zs= 0,019 y Zi= - 2,017.
P(2'000.000<

< 2'800.000) = P(Z < 0,0188) - P(Z < -2,017) = 0,485

Para la ltima pregunta de ste punto, tenemos Z = -2,017, por lo cual


P(

<2'000.000) = P(Z < -2,017) = 0,022

4. Para resolver el ltimo punto necesitamos primero tomar 20 valores aleatorios de


clientes, los cuales son mostrados en la hoja de clculo 4Estimadores e Intervalo de
C.. Posteriormente tenemos que seleccionar un criterio para realizar la estimacin
puntual para la media y la varianza del INGRESO. En nuestro caso para simplificar los
clculos seleccionamos el Mtodo de Mxima Verosimilitud, donde los estimadores
mximo verosmiles son la media y la varianza muestrales, los cuales obtenemos
como
= 5459 y
= 7236251,579, con la funciones de Excel
PROMEDIO y VAR.S respectivamente. La desviacin estndar sera entonces la raz
cuadrada del ltimo valor es decir =2690,028 y la cantidad de datos n = 20.

Posteriormente queremos inferir de los datos recin hallados un intervalo de confianza


del 95% para estimar el INGRESO promedio de todos los clientes. ste intervalo de
confianza es mostrado grficamente en la siguiente curva normal tipificada

Entonces la particin de Z para obtener un intervalo de confianza de del 95%


P[-1.96 Z 1.96] = 0.95
La expresin para determinar el intervalo de confianza es entonces

Donde Z/2 = 1,96; entonces reemplazando los


respectivos valores en la anterior expresin obtenemos un intervalo de confianza del
95% de (4280,04 , 6637,96) para estimar el INGRESO promedio de todos los clientes.

CONCLUSIONES

La distribucin de frecuencia es una tabla de resumen en la que los datos se


disponen en agrupamientos o categoras convenientemente establecidas de
clases ordenadas numricamente. La principal ventaja de usar una de estas
tablas de resumen es que las principales caractersticas de los datos se hacen
evidentes inmediatamente para el lector. La principal desventaja de tal tabla de
resumen es que no podemos saber cmo se distribuyen los valores
individuales dentro de un intervalo de clase particular sin tener acceso a los
datos originales.
La probabilidad es la posibilidad u oportunidad de que suceda un evento
particular. La probabilidad involucrada es una porcin o fraccin cuyo valor
vara entre cero y uno exclusivamente. Observamos un evento que no tiene
posibilidad de ocurrir (es decir, el evento nulo), tiene una probabilidad de cero,
mientras que un evento que seguramente ocurrir (es decir, el evento cierto),
tiene una probabilidad de uno.
La regla ms evidente para las probabilidades es que deben variar en valor de
0 a 1. Un evento imposible tiene una probabilidad cero de ocurrir, y un evento
cierto tiene una probabilidad uno de ocurrir. La probabilidad simple se refiere a
la probabilidad de ocurrencia de un evento simple.
En esta prctica hemos utilizado el Microsoft Excel para los clculos de
probabilidades, siendo ste como muchos otros programas ms accesibles, y
con funciones completas.
Se pudo realizar con ejemplos el clculo de la funcin de probabilidad y
distribucin para variables aleatorias discretas que siguen una distribucin
Binomial y, para variables aleatorias continuas que siguen una distribucin
normal, llegando a ver las diferencias entre ambos casos con respecto a la
distribucin de los datos.
Se aprendieron a utilizar mtodos de estimacin puntual y estimacin por
intervalo, como herramienta para inferir datos estadsticos a partir de una
pequea muestra aleatoria de una poblacin.

Nota: En el documento de Excel puede encontrar todas las pestaas de la


primera y segunda entrega, en este caso est en orden de la primera entrega a la
segunda.

BIBLIOGRAFA

http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad
http://es.wikipedia.org/wiki/DistribucinBinomial
http://es.wikipedia.org/wiki/DistribucinNormal
http://es.wikipedia.org/wiki/TeoremadelLmiteCentral
http://es.wikipedia.org/wiki/EstimacinPuntual
http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/
estimacion/estimacion.htm
http://es.scribd.com/doc/51233337/Algunos-conceptos-deprobabilidad-y-estadistica-inferencial-ilustrados-mediantesimulaciones-utilizando-Excel
http://www.estadistica.ucr.ac.cr/pdf/xs-0113/dprob.pdf
http://enciclopedia.us.es/index.php/Momento_de_una_variable_aleatoria
http://www.monografias.com/trabajos91/distribuciones-continuas-excel-ywinstats/distribuciones-continuas-excel-y-winstats.shtml

I ENTREGA

OBJETIVOS

Aprender a analizar datos en las tablas de doble entrada o tablas dinmicas.


Aprender a utilizar las leyes de probabilidad.
Aplicar y explorar las herramientas estadsticas de Excel.
Analizar estadsticamente los resultados

MARCO TERICO

1. Cuntiles: Son medidas de posicin que se determinan mediante un mtodo que


determina la ubicacin de los valores que dividen un conjunto de observaciones en
partes iguales. Los cantiles son los valores de la distribucin que la dividen en partes
iguales, es decir, en intervalos que comprenden el mismo nmero de valores. Cuando
la distribucin contiene un nmero alto de intervalos o de marcas y se requiere obtener
un promedio de una parte de ella, se puede dividir la distribucin en cuatro, en diez o
en cien partes. Los ms usados son los cuartiles, cuando dividen la distribucin en
cuatro partes; los deciles, cuando dividen la distribucin en diez partes y los centiles o
percentiles, cuando dividen la distribucin en cien partes. Los cuartiles, como los
deciles y los percentiles, son en cierta forma una extensin de la mediana. Para
algunos valores u , se dan nombres particulares a los cuantiles, Q (u):
Q(u)
Mediana
Cuartiles
Deciles
Centiles
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro
partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual
queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el tercer cuartil,
es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los
datos.
2. Tablas Dinmicas
Las tablas dinmicas, tambin llamadas pivot tables, son una herramienta para
anlisis de bases de datos (BD). Se encargan de resumir y ordenar la informacin
contenida en la BD.

Esta clase de tablas permiten analizar slo una porcin de la BD, es decir, con una BD
con gran cantidad de campos o columnas, ayudan a visualizar nicamente la
informacin relevante, con lo que el anlisis se torna ms sencillo.
Las pivot tables estn basadas en dos conceptos: sumarizacin y rotacin.

3. Teora de Probabilidad
La probabilidad constituye un importante parmetro en la determinacin de las
diversas casualidades obtenidas tras una serie de eventos esperados dentro de un
rango estadstico.
Existen diversas formas como mtodo abstracto, como la teora Dempster-Shafer y la
teora de la relatividad numrica, esta ltima con un alto grado de aceptacin si se
toma en cuenta que disminuye considerablemente las posibilidades hasta un nivel
mnimo ya que somete a todas las antiguas reglas a una simple ley de relatividad. La
probabilidad de un evento se denota con la letra p y se expresa en trminos de una
fraccin y no en porcentajes, por lo que el valor de p cae entre 0 y 1. Por otra parte, la
probabilidad de que un evento "no ocurra" equivale a 1 menos el valor de p y se
denota con la letra q.
P(Q) = 1 - P(E)
Los tres mtodos para calcular las probabilidades son la regla de la adicin, la regla de
la multiplicacin y la distribucin binomial.
Regla de la adicin:
La regla de la adicin o regla de la suma establece que la probabilidad de ocurrencia
de cualquier evento en particular es igual a la suma de las probabilidades individuales,
si es que los eventos son mutuamente excluyentes, es decir, que dos no pueden
ocurrir al mismo tiempo.
P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente. P(A o B) =
P(A) + P(B) P(A y B) si A y B son no excluyentes.
Siendo: P(A) = probabilidad de ocurrencia del evento A. P(B) = probabilidad de
ocurrencia del evento B. P(A y B) = probabilidad de ocurrencia simultnea de los
eventos A y B.
Regla de la multiplicacin:
La regla de la multiplicacin establece que la probabilidad de ocurrencia de dos o ms
eventos estadsticamente independientes es igual al producto de sus probabilidades
individuales.
P(A y B) = P(A B) = P(A)P(B) si A y B son independientes. P(A y B) = P(A B) =
P(A)P(B|A) si A y B son dependientes
Regla de Laplace:

La regla de Laplace establece que:


La probabilidad de ocurrencia de un suceso imposible es 0.
La probabilidad de ocurrencia de un suceso seguro es 1, es decir, P(A) = 1.
Para aplicar la regla de Laplace es necesario que los experimentos den lugar a
sucesos equiprobables, es decir, que todos tengan o posean la misma probabilidad.
La probabilidad de que ocurra un suceso se calcula as:
P(A) = N de casos favorables / N de resultados posibles
Esto significa que: la probabilidad del evento A es igual al cociente del nmero de
casos favorables (los casos dnde sucede A) sobre el total de casos posibles.

PROCEDIMIENTO

1. Ampliacin de la Base de Datos


sta se llev a cabo mediante la redefinicin de categoras mediante la conversin de
variables de tipo cuantitativo a cualitativo, explicado en detalle a continuacin.
Utilizando el criterio de los percentiles de 25 y 75 (cuartiles), se procedi a determinar
los intervalos alto, medio y bajo, para clasificar de sta manera a las variables
ingresos, crdito y gasto cualitativamente.
La funcin utilizado en Excel fue la siguiente: =PERCENTIL(matriz;k); donde matriz
corresponde al rango de valores y k al respectivo cuartil a utilizar. Estos cmputos se
pueden encontrar en la hoja de clculo Percentiles; de sta manera se llegaron a
definir los siguientes criterios:

Ingresos
Crdito
Gastos

Alto
I 6700
C 10500
G 3500

Medio
6700 I 2285
10500 C 2000
3500 G 1200

Bajo
I < 2285
C < 2000
G < 1200

A continuacin se crearon las nuevas columnas Ingresos, Crditos y Gastos.


Utilizando condiciones lgicas en Excel se realiz la clasificacin de stas variables
segn el criterio descrito en el paso anterior de la manera presentada abajo. Donde las
columnas C, M y D, corresponden a Ingresos, Crdito y Gastos
respectivamente de la hoja de clculo Datos.
Ingresos: =SI(C2>6700;"Alto";SI(C2<2285;"Bajo";"Medio"))
Crdito:

=SI(M2>10500;"Alto";SI(M2<2000;"Bajo";"Medio"))

Gastos:

=SI(D2>3500;"Alto";SI(D2<1200;"Bajo";"Medio"))

La variable Sexo tuvo que ser redefinida como Gnero, primero convirtiendo todos
los valores dados en la primera de formato de texto a nmero y posteriormente
creando la columna Gnero donde se modific el nmero 0, correspondiente a
mujeres a 2, para de sta manera hacer coincidir los datos con la descripcin del
problema, usando la funcin de Excel =SI(I2=1;"1";"2"), donde I corresponde a la
columna Sexo de la hoja de clculo Datos. Una vez ampliada la base de datos, se
procedi a aadir la hoja de clculo Reorganizacin Info, con el fin de facilitar el
siguiente paso de la actividad, la creacin de las tablas dinmicas.

2. Tablas Bidimensionales (Tablas Dinmicas)


Para la creacin de las 5 tablas dinmicas requeridas, se procedi a utilizar los
respectivos rangos de datos organizados en 5 grupos de la hoja de clculo
Reorganizacin Info. Ms especficamente, para crear una tabla dinmica
bidimensional en Excel, se selecciona el rango de datos, luego se le da click a la
opcin insertar tabla dinmica y por ltimo se determina cual variable corresponde a
las columnas y cual a las filas; todo lo anterior teniendo en cuenta que debido a que
las variables son de tipo cualitativo la configuracin de campo de valor de la tabla
dinmica debe estar en Cuenta.
De sta manera se obtuvieron las siguientes tablas dinmicas, a partir de las cuales se
pueden determinar las probabilidades marginales, condicionales y conjuntas para las
variables seleccionadas.
Tabla Dinmica Bidimensional Ingreso y Crdito
Cuenta
Agencia

de
Crdito

Ingresos
Alto
Bajo
Medio
Total general

Alto
273
8
177
458

Bajo
60
217
146
423

Medio
136
249
629
1014

Total
general
469
474
952
1895

Medio
66
53
849
968

Total
general
469
474
952
1895

Tabla Dinmica Bidimensional Ingreso y Gastos


Cuenta
Agencia
Ingresos
Alto
Bajo
Medio
Total general

de
Gastos
Alto
403
57
460

Bajo
421
46
467

Tabla Dinmica Hobby y Gnero


Cuenta
Agencia
Hobby

de
Gnero
1

Total

1
2
3
4
5
Total general

194
212
143
177
160
886

215
232
192
194
176
1009

general
409
444
335
371
336
1895

Tabla Dinmica Ingresos y Nmero de Personas


Cuenta de Agencia
Ingresos
Alto
Bajo
Medio
Total general

Personas
0
137
219
311
667

1
66
96
200
362

2
153
109
288
550

3
91
42
129
262

4
15
6
21
42

5
6
2
2
10

6
1

1
1

Total general
469
474
952
1895

Tabla Dinmica Gnero y Nivel de Educacin


Cuenta
Agencia
Gnero
1
2
Total general

de
Educacin
1
274
356
630

2
431
462
893

3
102
105
207

4
79
86
165

Total
general
886
1009
1895

3. Clculo de Probabilidades
Utilizando las tablas dinmicas creadas en el paso anterior y la teora de la
probabilidad, se respondieron las 8 preguntas planteadas y se formularon 3 ms. Las
respuestas se encuentran en la hoja de clculo Clculo de Probabilidades, pero son
mostradas de nuevo a continuacin. Los valores utilizados para responder a cada
pregunta pueden ser verificados observando la frmula utilizada en Excel para cada
casilla.
- La probabilidad de que tenga ingreso medio y crdito bajo.
0,077
- La probabilidad de que tenga ingreso alto o un gasto medio.
0,7235
- La probabilidad de que no tenga un ingreso alto.

0,7525
- La probabilidad de que no tenga ingreso bajo ni tenga crdito bajo.
0,6412
- Si tiene como hobby el cine, cul es la probabilidad de que sean un hombre?
0,4743
-Si tiene ingreso bajo, cul es la probabilidad de que tenga tres personas a cargo?
0,0886

-Cul es la probabilidad de que sea una mujer que tenga un nivel de estudios de
maestra?
0,0554
-Son independientes los eventos la persona tiene Ingreso alto y el crdito bajo?.
Justifique su respuesta.
No son eventos independientes ya que hay 60 clientes que coinciden con
ingreso alto y crdito bajo.
- Cul es la probabilidad de que tenga un nivel de estudios de doctorado?
0,0871
- Cul es la probabilidad de que sea hombre y tenga como hobby leer?
0,0934
- Cul es la probabilidad de que tenga un nivel de ingresos alto y este a cargo de 2
personas?
0,0807

CONCLUSIONES

La distribucin de frecuencia es una tabla de resumen en la que los datos se


disponen en agrupamientos o categoras convenientemente establecidas de
clases ordenadas numricamente. La principal ventaja de usar una de estas
tablas de resumen es que las principales caractersticas de los datos se hacen
evidentes inmediatamente para el lector. La principal desventaja de tal tabla de
resumen es que no podemos saber cmo se distribuyen los valores
individuales dentro de un intervalo de clase particular sin tener acceso a los
datos originales.
La probabilidad es la posibilidad u oportunidad de que suceda un evento
particular. La probabilidad involucrada es una porcin o fraccin cuyo valor
vara entre cero y uno exclusivamente. Observamos un evento que no tiene
posibilidad de ocurrir (es decir, el evento nulo), tiene una probabilidad de cero,
mientras que un evento que seguramente ocurrir (es decir, el evento cierto),
tiene una probabilidad de uno.
La regla ms evidente para las probabilidades es que deben variar en valor de
0 a 1. Un evento imposible tiene una probabilidad cero de ocurrir, y un evento
cierto tiene una probabilidad uno de ocurrir. La probabilidad simple se refiere a
la probabilidad de ocurrencia de un evento simple.
La utilizacin de pecentiles (cuartiles en nuestro caso), permiten establecer
valores representativos para convertir variables cuantitativas a cualitativas.
Las tablas dinmicas permiten expresar de manera grfica probabilidades
marginales, condicionales y conjuntas para de ste modo facilitar el clculo de
la probabilidad de ocurrencia de eventos determinados.

BIBLIOGRAFA

http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad
http://es.wikipedia.org/wiki/TablasDinmicas
http://es.wikipedia.org/wiki/TeoradeProbabilidad

También podría gustarte