Está en la página 1de 121

1

INSTITUTO TECNOLOGICO DE MERIDA







------- Ingeniera Mecnica -----------

------- Equipo numero 2 -----------

------- Bitcora del semestre -----------

------- Investigaciones y libreta-----------



------- Nombres de los integrantes -----------

Jos Enrique Rodrguez Martin
Edmar Mendoza Martin
Koyoc chan adrian Silverio




------------ 9 junio del 2010 ----------

2

ndice.-
Introduccin3
Plan de estudio4
Investigaciones13
Conceptos Bsicos de Probabilidad unidad 1
Variables aleatorias y distribuciones de
Probabilidad unidad 2
Estadstica descriptiva unidad 3
Distribuciones muestrales de la media y
La proporcin. Unidad 4
Anlisis de Regresin y Correlacin unidad 5
Conceptos y ejercicios de la libreta67
Conceptos Bsicos de Probabilidad unidad 1
Variables aleatorias y distribuciones de
Probabilidad unidad 2
Estadstica descriptiva unidad 3
Distribuciones muestrales de la media
y la proporcin. Unidad 4
Anlisis de Regresin y Correlacin unidad 5













3

Introduccin.-

En las siguientes hojas obtendr la informacin de las unidades
que corresponden al semestre en el cual se muestra en dos formas.
La primera forma es la investigacin la cual es una forma muy
extensa ya que muestra todo lo relacionado con el tema de manera
muy terica, pero a su vez de manera contundente sin errores y de
manera sencilla. La segunda forma son conceptos y ejercicios
comprendidos en clase siguiendo el mismo orden de cada unidad de
manera ms explcita, y ya resueltos.
De esta manera se trata de dar la informacin necesaria para poder
cursar y de misma forma aprobar las unidades correspondientes con
la ayuda de la licenciada landy como instructora y maestra a la
cual se deben los ejercicios planteados.

Las unidades comprenden de probabilidad y estadstica de
ingeniera mecnica del 2do semestre lo cual puede variar con
diferentes carreras debido al plan de estudie que este en curso
sin embargo el contenido del tema ser siempre el mismo ya que
ese no cambia a pesar de estar en curso otro plan de estudio












4

Plan de estudio

1.- DATOS DE LA
ASIGNATURA Nombre de la
asignatura:
Carrera:
Clave de la asignatura:
Horas teora-horas
prctica-crditos
Probabilidad y
Estadstica
Ingeniera Mecnica
MCM - 0531
3 2 8

2.- HISTORIA DEL PROGRAMA
Lugar y fecha de
elaboracin o revisin
Participantes
Observaciones
(cambios y
justificacin)
Instituto Tecnolgico
de Culiacn del 14 al
18 de Junio de 2004
Representantes
de las academias
de Ingeniera
Mecnica de los
Institutos
Tecnolgicos.
Reunin Nacional de
Evaluacin Curricular
de la Carrera de
Ingeniera Mecnica.
Instituto Tecnolgico
de Puebla
Academia de
Ingeniera
Mecnica
Anlisis y
enriquecimiento de
las propuestas de los
programas diseados
en la reunin
nacional de
evaluacin.
Instituto Tecnolgico
de Pachuca del 8 al 12
de noviembre de 2004.
Comit de
Consolidacin de
la carrera de
Ingeniera
Mecnica.
Definicin de los
programas de estudio
de la carrera








5

3.- UBICACIN DE LA ASIGNATURA
a). Relacin con otras asignaturas del plan de estudio
Anteriores Posteriores
Asignaturas Temas Asignaturas Temas
Matemticas
I
Calculo
diferencial
Calidad.
Diseo I
Herramientas de control
de calidad y mejora
contina.
Muestreo.
Ensayos de materiales.

b). Aportacin de la asignatura al perfil del egresado:
Le permite interpretar fenmenos aleatorios, organizar y
analizar datos con el fin de formular modelos y tomar
decisiones.
Conocer software relacionado con la probabilidad y estadstica
como una herramienta en problemas prcticos.

4.- OBJETIVO(S) GENERAL(ES) DEL CURSO
Aplicar los conceptos de probabilidad y estadstica en la
solucin de problemas de ingeniera. Y ser capaz de tomar
decisiones con base en anlisis estadsticos.
5.-
TEMARIO
Unidad
Temas Subtemas
1 Conceptos Bsicos de
Probabilidad

1.1 Conceptos bsicos de
Probabilidad
1.2 Principio de Adicin
1.3 Principio de
Multiplicacin
1.4 Independencia y
dependencia estadstica
1.5 Teorema de Bayes.
1.6 Aplicaciones y ejemplos

2 Variables aleatorias
y distribuciones de
Probabilidad

2.1 Concepto de Variable
discreta
2.2 Distribucin Binomial
2.3 Distribucin de Poisson

6

2.4 Distribucin
Hipergeomtrica
2.5 Concepto de variable
continua
2.6 Distribucin normal
2.7 Distribucin
Exponencial
2.8 Aplicaciones y ejemplos

3













Estadstica
descriptiva

3.1 Medidas de posicin
para datos agrupados y no
agrupados.
3.2 Medidas de dispersin
para datos agrupados y no
agrupados.
3.3Frac tiles para datos
agrupados y no



Agrupados.
3.4 Grficos representativos: histograma, polgono de
frecuencias, etc.
3.5 Aplicaciones y ejemplos.

4 Inferencia
estadstica

4.1 Distribuciones
mustrales de la media y la
proporcin.
4.2 Estimacin Puntual
4.3 Estimacin por
intervalos
4.4 Pruebas de Hiptesis
para una muestra
independiente, para
muestras pequeas y
grandes. Pruebas
relacionadas con la media,
la proporcin y la varianza
4.5 Pruebas de Hiptesis
para dos muestras
independientes, para
muestras pequeas y

7

grandes. Pruebas
relacionadas con la
diferencia de medias,
proporciones y varianzas
4.6 Aplicaciones y
ejemplos.

5 Anlisis de
Regresin y
Correlacin

5.1 Diagrama de dispersin.
5.2 Modelo de regresin
lineal por mnimos
cuadrados.
5.3 Estimacin por el
modelo de regresin lineal.
5.4 Coeficiente de
determinacin.
5.5 Coeficiente de
correlacin
5.6 Aplicaciones y
ejemplos.

6 Anlisis de Varianza
6.1 Modelo de anlisis de
varianza
6.2 Distribucin Fisher
6.3 Anova con un criterio
de clasificacin
6.4 Anova con dos criterios
de clasificacin.
6.5 Aplicaciones y ejemplos


6.- APRENDIZAJES REQUERIDOS
Calculo diferencial
Teorema del binomio

7.- SUGERENCIAS DIDCTICAS
Realizar en equipos trabajos de investigacin documental y
electrnica de los temas relacionados con la asignatura.
Solucionar problemas extra-clase.
Realizar ejercicios prcticos en el aula.
Autoevaluacin por parte del alumno.
Fomentar el uso de tcnicas grupales
8.- SUGERENCIAS DE EVALUACIN
Evaluacin diagnostica.
Autoevaluacin permanente.
Examen escrito por unidad.

8

Utilizar programas de cmputo en actividades extra-clase.
Exposicin en clases.
Diseo y planteamiento de problemas tipo.

9.- UNIDADES DE APRENDIZAJE
Unidad 1: Conceptos bsicos de probabilidad
Objetivo
Educacional
Actividades de
Aprendizaje
Fuentes de
Informacin
Conocer los
conceptos bsicos
de Probabilidad.

Explicar los
conceptos de
evento,
experimento,
evento mutuamente
excluyente, lista
colectivamente
exhaustiva.
Definir los
conceptos de
principio de
adicin y
multiplicacin.
Demostrar los
conceptos de
independencia y
dependencia
estadstica.
Demostrar el
teorema de Bayes.
Resolver
problemas
prcticos para
ejemplificar los
modelos.

1,2,3,4
Unidad 2:
Variables
aleatorias y
distribuciones de
probabilidad
Objetivo
Educacional
Actividades de
Aprendizaje
Fuentes de
Informacin

9

Conocer e
identificar los
tipos de variables
y sus
distribuciones

Explicar los
tipos de
variables,
aleatoria:
discreta y
continua.
Obtener las
ecuaciones
constitutivas de
las distribuciones
de variable
discreta:
Binomial, Poisson
e Hipergeomtrica.
Demostrar las
ecuaciones
constitutivas de
las distribuciones
de variable
continua: Normal y
exponencial.
Resolver
ejemplos de
distribuciones.

1,2,3,4
Unidad 3:
Estadstica
descriptiva
Objetivo
Educacional
Actividades de
Aprendizaje
Fuentes de
Informacin
Explicar e
identificar las
medidas de
posicin y de
dispersin tanto
para datos
agrupados como no
agrupados.

Conocer las
medidas de
posicin: Media,
Mediana, Moda,
Media Geomtrica.
etc.
Explicar las
medidas de
dispersin:
Desviacin media,
Varianza,
Desviacin
estndar, rango
intercuartil, etc.
1,2,3,4

10

Demostrar los
tipos de grficos:
Histograma,
polgono de
frecuencias,
grfico de pastel,
etc.
Resolver
problemas
prcticos.

Unidad 4:
Inferencia
estadstica
Objetivo
Educacional
Actividades de
Aprendizaje
Fuentes de
Informacin
Explicar el
fenmeno de
muestreo y sus
distribuciones
mustrales.

Explicar los
tipos de muestreo.
Ensear el
teorema del lmite
central.
Explicar las
distribuciones
mustrales de la
media y de la
proporcin.
Demostrar los
tipos de
estimacin:
puntual y por
intervalo.
Resolver las
pruebas de
hiptesis para
muestras grandes y
pequeas, por
medio de la media
o de la
proporcin.
Resolver
problemas de
estimacin y de
pruebas de
hiptesis.

1,2,3,4

11

Unidad 5: Anlisis
de regresin y
correlacin
Objetivo
Educacional
Actividades de
Aprendizaje
Fuentes de
Informacin
Explicar y
obtendr el modelo
de regresin
lineal simple y su
correlacin por el
mtodo de mnimos
cuadrados.

Explicar los
tipos de diagramas
de dispersin.
Obtener y
explicar el modelo
de regresin
lineal simple.
Obtener de los
coeficientes de
determinacin y
correlacin.
Obtener la
estimacin por
intervalo
utilizando el
modelo de
regresin lineal.
Resolver
problemas tpicos
de regresin
lineal simple y su
correlacin.

1,2,3,4
Unidad 6: Anlisis
de varianza
Objetivo
Educacional
Actividades de
Aprendizaje
Fuentes de
Informacin
Definir e
identificar el
mtodo de Anlisis
de Varianza.

Definir el
modelo de anlisis
de varianza.
Explicar la
distribucin
Fisher.
Usar la tabla
ANOVA con un
criterio de
1,2,3,4

12

clasificacin o
una factorial.
Emplear la tabla
ANOVA con dos
criterios de
clasificacin o
bifactorial.
Resolver
ejemplos
ilustrativos.


10. FUENTES DE INFORMACIN
1. Mendenhall William. Estadstica para administradores.
Editorial Iberoamrica. 2 edicin.
2. Daz Mata y Leonard Kazmier. Estadstica para administracin
y economa. Editorial Mc Graw Hill. 2 edicin.
3. Mendenhall William. Probabilidad y estadstica para ciencias
e ingeniera. Editorial Iberoamrica. 1 edicin.
4. Levin Richard. Estadstica para administracin. Editorial
Thomson. 2 edicin

11. PRCTICAS PROPUESTAS.
1. Anlisis descriptivo de datos no agrupados usando hoja
electrnica y un programa estadstico como el SPSS.
2. Anlisis descriptivo de datos agrupados usando hoja
electrnica y un programa estadstico como el SPSS.
3. Solucin de problemas de Distribucin Binomial usando hoja
electrnica y un programa estadstico como el SPSS.
4. Solucin de problemas de Distribucin Poisson usando hoja
electrnica y un programa estadstico como el SPSS.
5. Solucin de problemas de Distribucin Hipergeomtrica usando
hoja electrnica y un programa estadstico como el SPSS.
6. Solucin de problemas de Distribucin Normal usando hoja
electrnica y un programa estadstico como el SPSS.
7. Solucin de problemas de Distribucin Exponencial usando hoja
electrnica y un programa estadstico como el SPSS.
8. Solucin de problemas de Estimacin usando hoja electrnica y
un programa estadstico como el SPSS.
9. Obtencin del modelo de regresin lineal usando hoja
electrnica y un programa estadstico como el SPSS.
10. Calculo de tablas Anova por medio de hoja electrnica y un
programa estadstico como el SPSS.



13

Investigaciones
CONCEPTOS BASICOS DE PROBABILIDAD

Debido a que el proceso de obtener toda la informacin relevante
a una poblacin particular es difcil y en muchos casos imposibles
de obtener, se utiliza una muestra para estimar la informacin
necesaria para la toma de decisiones.

Tomemos por ejemplo una compaa x que desea introducir a un nuevo
producto al mercado, sera absurdo pretender que toda la poblacin
pruebe el producto. En este caso se da a probar el producto a una
muestra de consumidores y con base a los resultados de esa
muestra se decide si el producto se elabora o no.
Ahora bien como los resultados obtenidos a partir de una muestra
difieren de los resultados que se obtendra se observa una
poblacin total o universo existe un riesgo al tomar la decisin.
Es en este caso que se utiliza la probabilidad como una medida de
riesgo
DEFINICIONES BASICAS
Experimento: cualquier accin cuyo resultado se registra como un
dato
Espacio muestra (S): el conjunto de todos los posibles resultados
de un experimento
Evento: resultado de un experimento cuando cada evento es
seleccionado al azar, el experimento se denomina aleatorio al azar
Evento simple (E): cada uno de los posibles resultados de un
experimento y que no se puede descomponer.
Evento compuesto: los eventos A, B, C, etc. son eventos
compuestos si se componen de dos o ms eventos simples

14


Unin: la unin de dos conjuntos A y B es el conjuntos C que est
formado por los elementos de A, de B o de ambos.

Interseccin: la interseccin de dos conjuntos A y B es el
conjuntos C que est formado por los elementos que pertenecen a
ambos conjuntos simultneamente

Complementos: el complemento de un conjunto A que se denota por


es el evento que consta de todos los resultados del espacio
muestra que no estn contenidos en A
Principios de conteo: el anlisis de los problemas de probabilidad
se facilita a travs de mtodos sistemticos de conteo de los
grupos y arreglos de los datos
Definicin de factorial. El smbolo n! que se lee n factorial se
refiere al producto de todos los enteros de n hasta 1
N!= n (n-1) (n-2) (n-3)
Ejemplo: 5! = 5*4*3*2*1
Principio de multiplicacin:
Si un experimento puede describirse como una secuencia de k pasos
y en cada paso hay una n1 resultados en el primero paso, n2
resultados en el segundo paso, n3 resultados en el tercer paso , y
as sucesivamente, entonces el numero de eventos que pueden
ocurrir ser,

15



2) suponga que se desea formar un comit de tres miembros en el
cual se erigir un presidente, un vicepresidente y un tesorero.
Hay dos candidatos para la presidencia, 4 para la vicepresidencia
y 3 para el tesorero. De cuantas formas puede formar el comit?

Regla de multiplicacin de probabilidad
Esta regla de probabilidad se deriva de la definicin de
probabilidad condicional y utiliza el concepto de interseccin de
eventos para su aplicacin
a. Si A y B son eventos independientes , entonces
P (A_B) = P (B) * P(A/B)
P (A_B) = P (A) * P (B/A)










16

Ejercicios unidad 1

ADICCION

Si un suceso Pl ocurre de n1 maneras diferentes y un suceso P2
ocurre de n2 maneras diferentes entonces el suceso Pl Y P2 ocurren
de n1 + n2 maneras diferentes.

Ejemplo:

Un repuesto de automvil se vende en 6 tiendas en la Victoria
o en 8 tiendas de Brea. De cuntas formas se puede adquirir el
repuesto?

Solucin

- Por el principio de adicin:
Victoria Brea

6 formas + 8 formas = 14 formas
RECUERDA
1) Si se desea que se realicen los eventos A y B, entonces se
utiliza el principio de multiplicacin (x)
2) Si se desea que se realicen los eventos A B, entonces se
utiliza el principio de adicin (+)



a) Una mujer tiene tres sombreros y cuatro brazaletes. Si piensa
usar sombrero y brazalete para una fiesta, cuntas diferentes
combinaciones puede llevar? Solucin: 3 4 = 12 diferentes
combinaciones sombrero-brazalete.
b) Tenemos tres diferentes lugares para comer pizza; dos para
hamburguesa y cuatro para pollo. A cuntos diferentes lugares
podemos ir a almorzar? Solucin: 3 + 2 + 4 = 9 diferentes lugares.
MULTIPLICACION
Ejemplo
Chris posee dos inventarios independientes uno de otro.

17

La probabilidad de que el inventario A aumente su valor el prximo
ao es .5. La probabilidad de que el B aumente el suyo es .7.
Cul es la probabilidad de que ambos aumenten su valor el prximo
ao?
P(A y B) = (.5) (.7) = .35.
Cul es la probabilidad de que al menos uno aumente su valor el
prximo ao (esto implica que cualquiera de los dos o ambos
aumenten)?
As, P(al menos uno) = (.5) (.3) + (.5) (.7) + (.7) (.5) = .85.

INDEPENDENCIA ESTADISTICA
Sean A y B dos sucesos tales que P (B) > 0, intuitivamente A es
independiente de B si la probabilidad de A condicionada por B es
igual a la probabilidad de A. Es decir si:

De la propia definicin de probabilidad condicionada:

Se deduce que y dado que
deducimos trivialmente que .
Si el suceso A es independiente del suceso B, automticamente el
suceso B es independiente de A.
Dependencia estadstica

Existen caracteres que ni son independientes, ni se da entre ellos
una relacin de dependencia funcional, pero si se percibe una
cierta relacin de dependencia entre ambos; se trata de una
dependencia estadstica

18

Cuando los caracteres son de tipo cuantitativo, el estudio de la
dependencia estadstica se conoce como el problema de regresin,
y el anlisis del grado de dependencia que existe entre las
variables se conoce como el problema de correlacin
TEOREMA DE BAYES
El teorema de Bayes es vlido en todas las aplicaciones de la
teora de la probabilidad. Sin embargo, hay una controversia sobre
el tipo de probabilidades que emplea. En esencia, los seguidores
de la estadstica tradicional slo admiten probabilidades basadas
en experimentos repetibles y que tengan una confirmacin emprica
mientras que los llamados estadsticos bayesianos permiten
probabilidades subjetivas. El teorema puede servir entonces para
indicar cmo debemos modificar nuestras probabilidades subjetivas
cuando recibimos informacin adicional de un experimento. La
estadstica bayesiana est demostrando su utilidad en ciertas
estimaciones basadas en el conocimiento subjetivo a priori y el
hecho de permitir revisar esas estimaciones en funcin de la
evidencia emprica es lo que est abriendo nuevas formas de hacer
conocimiento. Una aplicacin de esto son los clasificadores
bayesianos que son frecuentemente usados en implementaciones de
filtros de correo basura o spam, que se adaptan con el uso.
Como observacin, se tiene y su demostracin resulta
trivial.
1. Tres mquinas denominadas A, B y C, producen un 43%, 26%
y 31% de la produccin total de una empresa respectivamente,
se ha detectado que un 8%, 2% y 1.6% del producto
manufacturado por estas mquinas es defectuoso, a. Se
selecciona un producto al azar y se encuentra que es
defectuoso, cul es la probabilidad de que el producto haya
sido fabricado en la mquina B?, b. Si el producto
seleccionado resulta que no es defectuoso, cul es la
probabilidad de que haya sido fabricado en la mquina C?





19


Solucin:
Para resolver este problema nos ayudaremos con un diagrama de
rbol;

8% D
43% A
92% ND

26% B 2% D
98% ND

31% C 1.6% D
98.4% ND


a. a. Definiremos los eventos;
D = evento de que el producto seleccionado sea defectuoso
(evento que condiciona)
A = evento de que el producto sea fabricado en la mquina A
B = evento de que el producto sea fabricado por la mquina B
C = evento de que el producto sea fabricado por la mquina C

P(B|D) = p(BD)/p(D) = p(B)p(D|B)/p(A)p(D|A) + p(B)p(D|B) +
p(C)p(D|C)
P (B|D) = (0.26*0.02)/ (0.43*0.08 + 0.26*0.02 + 0.31*0.016)
= 0.0052/0.04456
=0.116697


20

b. b. ND = evento de que el producto seleccionado no sea
defectuoso (evento que condiciona)
A = evento de que el producto sea fabricado en la mquina A
B = evento de que el producto sea fabricado por la mquina B
C = evento de que el producto sea fabricado por la mquina C

P(C|ND)=p(CND)/p(ND)=p(C)p(ND|C)/p(A)p(ND|A) + p(B)p(ND|B) +
p(C)p(ND|C)
= 0.31*0.984/ (0.43*0.92 + 0.26*0.98 + 0.31*0.984)
= 0.30504/0.95544
=0.31927
2. 2. Una empresa recibe visitantes en sus instalaciones y
los hospeda en cualquiera de tres hoteles de la ciudad;
Palacio del Sol, Sicomoros o Fiesta Inn, en una proporcin de
18.5%, 32% y 49.5% respectivamente, de los cuales se ha
tenido informacin de que se les ha dado un mal servicio en
un 2.8%, 1% y 4% respectivamente, a. Si se selecciona a un
visitante al azar cul es la probabilidad de que no se le
haya dado un mal servicio?, b. Si se selecciona a un
visitante al azar y se encuentra que l no se quej del
servicio prestado, cul es la probabilidad de que se haya
hospedado en el Palacio del Sol?, c. Si el visitante
seleccionado se quej del servicio prestado, cul es la
probabilidad de que se haya hospedado en el hotel Fiesta Inn?









21


3. 3. Solucin: Haciendo uso de un diagrama de rbol;
2.8% Q

18.5% PS
97.2% NQ
1.0% Q

32% S
99.0% NQ

4.0% Q
49.5% FI
96.0% NQ


a. a. NQ = evento de que un visitante no se queje del
servicio
PS = evento de que un visitante haya sido hospedado en el
hotel Palacio del Sol
S = evento de que un visitante haya sido hospedado en el
hotel Sicmoro
FI = evento de que un visitante haya sido hospedado en el
hotel Fiesta Inn

P (NQ) = p (PS) p (NQ|PS) + p(S) p (NQ|S) + p (FI) p (NQ|FI) =
= 0.185*0.972 + 0.32*0.99 + 0.495*0.96
= 0.17982 + 0.3168 + 0.4752
= 0.97182

22

b. b. NQ = evento de que un visitante no se queje del
servicio
PS = evento de que un visitante haya sido hospedado en el
hotel Palacio del Sol
S = evento de que un visitante haya sido hospedado en el
hotel Sicomoro
FI = evento de que un visitante haya sido hospedado en el
hotel Fiesta Inn

P (PS|NQ) =p (PSNQ)/p (NQ)
= (0.185*0.972)/ (0.185*0.972+0.32*0.99+0.495*0.96) =
= 0.17982/(0.17982 + 0.3168 + 0.4752)
= 0.17982/0.97182
= 0.1850342
c. c. Q = evento de que un visitante se queje del servicio
FI = evento de que un visitante haya sido hospedado en el hotel
Fiesta Inn
P (FI|Q) = p (FIQ)/p (Q)
= 0.495*0.04/(0.185*0.028
+ 0.32*0.01 + 0.495*0.04)
=0.0198/(0.00518 + 0.0032
+ 0.0198)
= 0.0198/0.02818


= 0.7026



23




Unidad 2

Variable: Es la caracterstica que estamos midiendo.
Existen dos categoras o tipo de variables:
Variable discreta: aquella que entre dos valores prximos puede
tomar a lo sumo un nmero finito de valores. Ejemplos: el nmero
de hijos de una familia, el de obreros de una fbrica, el de
alumnos de la universidad, etc.
Variable continua: la que puede tomar los infinitos valores de un
intervalo. En muchas ocasiones la diferencia es ms terica que
prctica, ya que los aparatos de medida dificultan que puedan
existir todos los valores del intervalo. Ejemplos, peso, estatura,
distancias, etc.

La variable se denota por las maysculas de letras finales del
alfabeto castellano. A su vez cada una de estas variables puede
tomar distintos valores, colocando un subndice, que indica orden:

X = (x
1
, x
2
, x
3
,...... , x
k-2
, x
k-1
,
x
k
)
Muestra: Conjunto de elementos que forman parte de poblacin. La
muestra representa a esta poblacin.

Tamao muestral: Es el nmero de elementos u observaciones que
tomamos. Se denota por n N.

Dato: Cada uno de los individuos, cosas, entes abstractos que
integran una poblacin o universo determinado. Dicho de otra
forma, cada valor observado de la variable.



24






Frecuencias de una variable contina:

x
i
n
i
N
i
f
i
F
i

x
1
n
1
N
1
f
1
F
1

x
2
n
2
N
2
f
2
F
2

x
3
n
3
N f
3
1
Sn
i
=N 1




La Distribucin Normal

La distribucin normal fue reconocida por primera vez por el
francs Abraham de Moivre (1667-1754). Posteriormente, Carl
Friedrich Gauss (1777-1855) elabor desarrollos ms profundos y
formul la ecuacin de la curva; de ah que tambin se la conozca,
ms comnmente, como la "campaa de Gauss". La distribucin de una
variable normal est completamente determinada por dos parmetros,
su media y su desviacin estndar, denotadas generalmente por O y
M.

Propiedades de la distribucin normal:

La distribucin normal posee ciertas propiedades importantes que
conviene destacar:
I. Tiene una nica moda, que coincide con su media y su mediana.
II. La curva normal es asinttica al eje de abscisas. Por ello,
cualquier valor entre -infinito y + infinito es tericamente
posible. El rea total bajo la curva es, por tanto, igual a 1.
III. Es simtrica con respecto a su media M. Segn esto, para este
tipo de variables existe una probabilidad de un 50% de observar un
dato mayor que la media, y un 50% de observar un dato menor.
IV. La distancia entre la lnea trazada en la media y el punto de
inflexin de la curva es igual a una desviacin tpica ( ). Cuanto
O mayor sea, ms aplanada ser la curva de la densidad.
V. El rea bajo la curva comprendida entre los valores situados
aproximadamente a dos desviaciones estndar de la media es igual a

25

0.95. En concreto, existe un 95% de posibilidades de observar un
valor comprendido en el intervalo.
VI. La forma de la campana de Gauss depende de los parmetros M y
O La media indica la posicin de la campana, de modo que para
diferentes valores de la grfica es desplazada a lo largo del eje
horizontal. Por otra parte, la desviacin estndar determina el
grado de apuntamiento de la curva. Cuanto mayor sea el valor de,
ms se dispersarn los datos en torno a la media y la curva ser
ms plana. Un valor pequeo de este parmetro indica, por tanto,
una gran probabilidad de obtener datos cercanos al valor medio de
la distribucin. Como se deduce de este ltimo apartado, no existe
una nica distribucin normal, sino una familia de distribuciones
con una forma comn, diferenciadas por los valores de su media y
su varianza. De entre todas ellas, la ms utilizada es la
distribucin normal estndar, que corresponde a una distribucin
de media 0 y varianza 1.

La distribucin binomial o de Bernoulli

La distribucin binomial est asociada a experimentos del
siguiente tipo:
- Realizamos n veces cierto experimento en el que consideramos
slo la posibilidad de xito o fracaso.
- La obtencin de xito o fracaso en cada ocasin es
independiente de la obtencin de xito o fracaso en las dems
ocasiones.
- La probabilidad de obtener xito o fracaso siempre es la misma
en cada ocasin.
Vemoslo con un ejemplo Tiramos un dado 7 veces y contamos el
numero de cincos que obtenemos. .Cual es la probabilidad de
obtener tres cincos? Este es un tpico ejemplo de distribucin
binomial, pues estamos repitiendo 7 veces el experimento de lanzar
un dado. .Cual es nuestro xito? Evidentemente, sacar un 5, que
es en lo que nos fijamos. El fracaso, por tanto, ser no sacar 5,
sino sacar cualquier otro nmero. Por tanto, xito = E = sacar
un 5 = p (E) = 1 6 Fracaso = F = no sacar un 5 = p (F) = 5 6
Para calcular la probabilidad que nos piden, fijmonos en que nos
dicen que sacamos 3 cincos y por lo tanto tenemos 3 xitos y 4
fracasos, .de cuantas maneras pueden darse estas posibilidades?
Podramos sacar 3 cincos en las 3 primeras tiradas y luego 4
tiradas sin sacar cinco, es decir: EEEFFFF Pero tambin podramos
sacar EFEFFFE, es decir que en realidad estamos calculando de
cuantas maneras se pueden ordenar 4 fracasos y 3 xitos.
Recordando las tcnicas combinatorias, este problema se reduce a
calcular las permutaciones con elementos repetidos:

26

P3, 4 7 = 7! 3! 4! = 7 6 5 3 2 1 = 35formas Y por
tanto, como p (E) = 1 6 y tengo 3 xitos y p (F) = 5 6 y tengo 4
fracasos: p (tener 3 xitos y 4 fracasos) = 35 1 6 1 6 1
6 5 6 5 6 5 6 5 6 = 0_0781 Formalizando lo obtenido, en
una variable binomial con 7 repeticiones y con probabilidad de
xito 1 6
, la probabilidad de obtener 3 xitos es 00781, y lo
expresramos: Bien _ 7; 1 6 _, entonces p(X = 3) = 0_0781 Como
repetir este proceso sera bastante penoso en la mayora de los
casos, lo mejor es recurrir a la siguiente frmula que expresa la
probabilidad de obtener cierto nmero de xitos en una
distribucin binomial:

Definicin de distribucin binomio:

Si realizamos n veces un experimento en el que podemos obtener
xito, E, con probabilidad p y fracaso, F, con probabilidad q (q =
1 p), diremos que estamos ante una distribucin bionoma de
parmetros n y p, y lo representaremos por Bien (n; p). En este
caso la probabilidad de obtener k xitos
Viene dada por:
p(X = k) = n/k pk q (nk)

Distribucin de Poisson


Expresa la probabilidad de que ocurra un evento un
determinado nmero de veces en una medida dada (tiempo,
distancia, piezas, etc.).
Cabe destacar que las ocurrencias son discretas.

Si el nmero esperado de ocurrencias en el intervalo es ,
entonces la probabilidad de que haya exactamente k ocurrencias es:


Es importante sealar que y k deben de estar expresadas en la
misma medida.

Ejemplo: En la inspeccin de hojalata producida por un proceso
electroltico continuo, se identifican 0.2 imperfecciones en
promedio por minuto. Determine las probabilidades de identificar
a) al menos dos imperfecciones en 5 minutos
b) cuando ms una imperfeccin en 15 minutos.

27



a)
b) Un rango determinado de xitos:


Distribucin exponencial

Esta distribucin se utiliza como modelo para la distribucin de
tiempos entre la presentacin de eventos sucesivos. Existe un tipo
de variable aleatoria que obedece a una distribucin exponencial
la cual se define como EL TIEMPO QUE OCURRE DESDE UN INSTANTE DADO
HASTA QUE OCURRE EL PRIMER SUCESO

Se dice que una variable aleatoria continua tiene una distribucin
exponencial con parmetro > 0 si:
Su funcin de densidad es:



Sea X una distribucin exponencial, entonces: P(X > a+t | X >
a)=P(X >t)
Supongamos que la duracin de cierto componente en estado slido X
es exponencial. Entonces la probabilidad de que X dure t unidades
despus de haber durado a unidades es la misma que la probabilidad
de que X dure t unidades cuando X estaba nuevo

Distribucin hipergeomtrica:

Es una distribucin discreta relacionada con muestreos aleatorios
y sin reemplazo. Supngase que se tiene una poblacin de N
elementos de los cuales, d pertenecen a la categora A y N-d a la
B. La distribucin hipergeomtrica mide la probabilidad de obtener
x ( ) elementos de la categora A en una muestra de n
elementos de la poblacin original.

Es especialmente til en todos aquellos casos en los que se
extraigan muestras o se realizan experiencias repetidas sin
devolucin del elemento extrado o sin retornar a la situacin
experimental inicial.

28

Modelista , de hecho, situaciones en las que se repite un
nmero determinado de veces una prueba dicotmica de manera que
con cada sucesivo resultado se ve alterada la probabilidad de
obtener en la siguiente prueba uno u otro resultado. Es una
distribucin .fundamental en el estudio de muestras pequeas de
poblaciones .pequeas y en el clculo de probabilidades de, juegos
de azar y tiene grandes aplicaciones en el control de calidad en
otros procesos experimentales en los que no es posible retornar a
la situacin de partida.
La distribucin hipergeomtrica puede derivarse de un proceso
experimental puro o de Bernouilli con las siguientes
caractersticas:
El proceso consta de n pruebas, separadas o separables de entre
un conjunto de N pruebas posibles.
Cada una de las pruebas puede dar nicamente dos resultados
mutuamente excluyentes: A y no A.
En la primera prueba las probabilidades son: P(A)= p y P(A)= q;
con p+q=l.
Unidad 3
ESTADSTICA DESCRIPTIVA
CONCEPTOS BSICOS
INTRODUCCIN
La investigacin cuya finalidad es: el anlisis o experimentacin
de situaciones para el descubrimiento de nuevos hechos, la
revisin o establecimiento de teoras y las aplicaciones prcticas
de las mismas, se basa en los principios de Observacin y
Razonamiento y necesita en su carcter cientfico el anlisis
tcnico de Datos para obtener de ellos informacin confiable y
oportuna. Este anlisis de Datos requiere de la Estadstica como
una de sus principales herramientas, por lo que los investigadores
de profesin y las personas que de una y otra forma la realizan
requieren adems de los conocimientos especializados en su campo
de actividades, del manejo eficiente de los conceptos, tcnicas y
procedimientos estadsticos.
ESTADSTICA

29

Es el conjunto de procedimientos y tcnicas empleadas para
recolectar, organizar y analizar datos, los cuales sirven de base
para tomar decisiones en las situaciones de incertidumbre que
plantean las ciencias sociales o naturales.
ESTADSTICA INDUCTIVA Y DEDUCTIVA
Uno de los problemas fundamentales de la Estadstica es el estudio
de la relacin existente entre una poblacin y sus muestras. Segn
la direccin de tal relacin la Estadstica puede ser:
Deductiva, cuando a partir del conocimiento de la poblacin se
trata de caracterizar cada muestra posible.
Inductiva, cuando a partir del conocimiento derivado de una
muestra se pretende caracterizar la poblacin.
ESTADSTICA DESCRIPTIVA E INFERENCIAL
Estadstica Descriptiva se refiere a la recoleccin, presentacin,
descripcin, anlisis e interpretacin de una coleccin de datos,
esencialmente consiste en resumir stos con uno o dos elementos de
informacin (medidas descriptivas) que caracterizan la totalidad
de los mismos. La estadstica Descriptiva es el mtodo de obtener
de un conjunto de datos conclusiones sobre s mismos y no
sobrepasan el conocimiento proporcionado por stos. Puede
utilizarse para resumir o describir cualquier conjunto ya sea que
se trate de una poblacin o de una muestra, cuando en la etapa
preliminar de la Inferencia Estadstica se conocen los elementos
de una muestra.
Estadstica Inferencial se refiere al proceso de lograr
generalizaciones acerca de las propiedades del todo, poblacin,
partiendo de lo especfico, muestra. Las cuales llevan implcitos
una serie de riesgos. Para que stas generalizaciones sean vlidas
la muestra deben ser representativa de la poblacin y la calidad
de la informacin debe ser controlada, adems puesto que las
conclusiones as extradas estn sujetas a errores, se tendr que
especificar el riesgo o probabilidad que con que se pueden cometer
esos errores. La estadstica inferencial es el conjunto de
tcnicas que se utiliza para obtener conclusiones que sobrepasan
los lmites del conocimiento aportado por los datos, busca obtener
informacin de un colectivo mediante un metdico procedimiento del
manejo de datos de la muestra.
En sus particularidades la Inferencia distingue la Estimacin y la
Contrastacin de Hiptesis. Es estimacin cuando se usan las

30

caractersticas de la muestra para hacer inferencias sobre las
caractersticas de la poblacin. Es contrastacin de hiptesis
cuando se usa la informacin de la muestra para responder a
interrogantes sobre la poblacin.
ANALISIS ESTADSTICO
El anlisis estadstico es todo el proceso de organizacin,
procesamiento, reduccin e interpretacin de datos para realizar
inferencias.
DATOS Y VARIABLES
Cuando se consideran los mtodos de organizacin, reduccin y
anlisis de datos estadsticos, se hace necesario aclarar los
siguientes conceptos.
Variables: es toda caracterstica que vara de un elemento a otro
de la poblacin.
Datos: son medidas o valores de las caractersticas susceptibles
de observar y contar, se originan por la observacin de una o ms
variables de un grupo de elementos o unidades
CLASIFICACIN DE VARIABLES
Las variables pueden clasificarse en: categricas o cualitativas
(atributos), no tienen ningn grado de comparacin numrica,
ejemplo: sexo, estado civil; y numricas o cuantitativas, son
caractersticas factibles de expresar por medio de nmeros, estas
pueden ser Discretas, que solo pueden tomar ciertos valores
aislados en un intervalo, y Continuas, que pueden tomar cualquier
valor en un intervalo.
REPRESENTACIN DE DATOS
Los datos son colecciones de un nmero cualquiera de observaciones
relacionadas entre s, para que sean tiles se deben organizar de
manera que faciliten su anlisis, se puedan seleccionar
tendencias, describir relaciones, determinar causas y efectos y
permitan llegar a conclusiones lgicas y tomar decisiones bien
fundamentadas; por esa razn es necesario conocer lo mtodos de
Organizacin y Representacin, la finalidad de stos mtodos es
permitir ver rpidamente todas las caractersticas posibles de los
datos que se han recolectado.
Representacin Tabular:

31

Presenta la variable y las frecuencias con que los valores de
stas se encuentran presentes en el estudio.
Representacin Grfica:
Se llaman grficas a las diferentes formas de expresar los datos
utilizando los medios de representacin que proporciona la
geometra.
METODOS DE REPRESENTACIN DE DATOS CUANTITATIVOS
Arreglo de Datos. Es una forma de presentar los datos en un
arreglo ascendente o descendente. Ofrece las ventajas siguientes:
describe los valores mnimos y mximos, en l se pueden dividir
los datos fcilmente en secciones, permite darse cuenta de los
valores que aparecen ms de una vez, se puede observar la
distancia entre valores consecutivos.
Diagrama de Puntos. Muestra la frecuencia con que aparece cada uno
de los valores
Diagrama de Tallo y Hoja. Es til para realizar una exploracin
preliminar del conjunto, genera una imagen adecuada de ellos sin
perder informacin.
Distribucin de Frecuencias. Es una forma de sintetizar los datos
y consiste en valerse de una tabla para clasificar los datos segn
su magnitud, en ella se seala el nmero de veces que aparece cada
uno de los valores. Cuando se dispone de un gran nmero de valores
discretos o cuando las variables son continuas, tiene sentido
formar una tabla que presente la distribucin de frecuencias de
los datos agrupados en intervalos o clases, de igual tamao si es
posible, sin embargo una tabla de este tipo supone una
concentracin de datos que produce prdida de informacin.
DISTRIBUCIN DE FRECUENCIAS
Organizacin de datos agrupados
Definiciones
Clases o intervalos de clase: Grupo de valores que describen una
caracterstica. Deben incluir todas las observaciones y ser
excluyentes. Los intervalos contienen los lmites de clase que son
los puntos extremos del intervalo. Se denominan intervalos
cerrados, cuando contienen ambos lmites e intervalos abiertos si
incluyen solo un lmite.

32

Limites Reales: Sirven para mantener la continuidad de las clases
Anchura o tamao del intervalo: es la diferencia entre los lmites
reales de una clase
Nmero de clases: es el nmero total de grupos en que se clasifica
la informacin, se recomienda que no sea menor que 5 ni mayor que
15
Marca de Clase: Es el punto medio del intervalo de clase, se
recomienda observar que los puntos medios coincidan con los datos
observados para minimizar el error.
Frecuencia: es el nmero de veces que aparece un valor
Frecuencia Acumulada: Indica cuantos casos hay por debajo o arriba
de un determinado valor o lmite de clase.
Frecuencia Relativa: Indica la proporcin que representa la
frecuencia de cada intervalo de clase en relacin al total, es
til para comparar varias distribuciones con parmetros de
referencia uniformes.
Frecuencia Acumulada Relativa: Indica la proporcin de datos que
se encuentra por arriba o debajo de cierto valor o lmite de
clase.
Grficos de una Distribucin de Frecuencias
Los grficos son tiles porque ponen en relieve y aclaran las
tendencias que no se captan fcilmente en la tabla, ayudan a
estimar valores con una simple ojeada y brinda una verificacin
grfica de la veracidad de las soluciones.
Histograma:
Est formado por rectngulos cuya base es la amplitud del
intervalo y tiene la caracterstica que la superficie que
corresponde a las barras es representativa de la cantidad de casos
o frecuencia de cada tramo de valores, puede construirse con
clases que tienen el mismo tamao o diferente (intervalo
variable). La utilizacin de los intervalos de amplitud variable
se recomienda cuando en alguno de los intervalos, de amplitud
constante, se presente la frecuencia cero o la frecuencia de
alguno o algunos de los intervalos sean mucho mayores que la de
los dems, logrando as que las observaciones se hallen mejor
repartidas dentro del intervalo.

33

Polgono de Frecuencias
Se puede obtener uniendo cada punto medio (marca de clase) de los
rectngulos del histograma con lneas rectas, teniendo cuidado de
agregar al inicio y al final marcas de clase adicionales, con el
objeto de asegurar la igualdad del reas.
Curvas de frecuencia
No es ms que la curva suavizada que se traza sobre el polgono y
representa la asimetra y la curtosis que tiene la distribucin,
permite visualizar un esquema ms claro del patrn de datos.
Existen varios tipos de curva de frecuencia: Curvas J, Simtricas
o Asimtricas (sesgada a la derecha o a la izquierda), Unimodales,
Bimodales y Multimodales.
Ojivas: Cuando se trata de relacionar observaciones en un mismo
aspecto para dos colectivos diferentes no es posible ejecutar
comparaciones sobre la base de la frecuencia, es necesario tener
una base estndar, la frecuencia relativa. La ojiva representa
grficamente la forma en que se acumulan los datos y permiten ver
cuntas observaciones se hallan por arriba o debajo de ciertos
valores. Es til para obtener una medida de los cuartiles,
deciles, percentiles.
MEDIDAS DESCRIPTIVAS
Con estas medidas se persigue reducir en pocas cifras
significativas el conjunto de observaciones de una variable y
describir con ellas ciertas caractersticas de los conjuntos,
logrando una comparacin ms precisa de los datos que la que se
puede conseguir con tablas y grficas.
MEDIDAS DE TENDENCIA CENTRAL: PROMEDIOS
Los promedios son una medida de posicin que dan una descripcin
compacta de cmo estn centrados los datos y una visualizacin ms
clara del nivel que alcanza la variable, pueden servir de base
para medir o evaluar valores extremos o raros y brinda mayor
facilidad para efectuar comparaciones.
Es importante poner en relieve que la notacin de promedio lleva
implcita la idea de variacin y que este nmero promedio debe
cumplir con la condicin de ser representativo de conjunto de
datos.

34

El promedio como punto tpico de los datos es el valor alrededor
del cual se agrupan los dems valores de la variable.
MEDIA ARITMTICA
Es una medida matemtica, un nmero individual que representa
razonablemente el comportamiento de todos los datos.
Para datos no agrupados X = S xi / n
Para datos agrupados X = S fi Xi / S fi
Donde Xi es la marca de clase para cada intervalo y fi es la
frecuencia de clase
Caractersticas de la Media:
1. En su clculo estn todos los valores del conjunto de datos por
lo que cada uno afecta la media.
2. La suma algebraica de las desviaciones de los valores
individuales respecto a la media es cero.
3. La suma del cuadrado de las desviaciones de una serie de datos
a cualquier nmero A es mnimo si A = X
4. Aunque es confiable porque refleja todos los valores del
conjunto de datos puede ser afectada por los valores extremos, y
de esa forma llegar a ser una medida menos representativa, por lo
que si la distribucin es asimtrica, la media aritmtica no
constituye un valor tpico.
LA MODA
Es el valor de un conjunto de datos que ocurre ms frecuentemente,
se considera como el valor ms tpico de una serie de datos.
Para datos agrupados se define como Clase Modal el intervalo que
tiene ms frecuencia.
La moda puede no existir o no ser nica, las distribuciones que
presentan dos o ms mximos relativos se designan de modo general
como bimodales o multimodales.
Caractersticas de la Moda.
1. Representa ms elementos que cualquier otro valor

35

2. No est afectada por los valores extremos pero para datos
continuos es dudoso su clculo.
3. La moda para una distribucin de frecuencias de datos agrupados
no puede ser calculada exactamente, el valor de la moda puede ser
afectado por el mtodo de agrupacin de los intervalos de clase.
4. La moda no permite conocer la mayor parte de los datos
5. Algunas veces el azar interviene de manera importante y hace
que un valor no representativo se repita frecuentemente.
6. Puede usarse para datos cuantitativos como cualitativos
7. La moda como estadstico, vara mucho de una muestra a otra
8. Cuando se tienen dos o ms modas es difcil su interpretacin
9. Tiene la ventaja de que los datos desproporcionados con
respecto al resto no la distorsionan, pero no se presta para un
tratamiento matemtico.
LA MEDIANA
Es el valor de la observacin que ocupa la posicin central de un
conjunto de datos ordenados segn su magnitud. Es el valor medio o
la media aritmtica de los valores medios. La mediana es un valor
de la variable que deja por debajo de l un nmero de casos igual
al que deja por arriba.
Geomtricamente la mediana es el valor de la variable que
corresponde a la vertical que divide al histograma en dos reas
iguales.
Cuando determinados valores de un conjunto de observaciones son
muy grandes o pequeos con respecto a los dems, entonces la media
aritmtica se puede distorsionar y perder su carcter
representativo, en esos casos es conveniente utilizar la mediana
como medida de tendencia central.
Caractersticas de la mediana
1. Es un promedio de posicin no afectado por los valores
extremos.
2. No est definida algebraicamente

36

3. Cuando la localizacin del elemento central puede ser
determinada y los lmites de clase mediana son conocidos, la
mediana para la distribucin de frecuencias puede ser calculada
por interpolacin, no importando que sta contenga intervalos
abiertos, cerrados, iguales o diferentes.
4. La suma de los valores absolutos, sin considerar el signo, de
las desviaciones individuales respecto a la mediana es mnimo.
5 La mediana en caso de una distribucin asimtrica, no resulta
desplazado del punto de tendencia central.
6. Si el universo tiene curtosis excesiva la mediana como
estadstico, vara menos que cualquier otra medida.
7. Si la mediana se calcula por interpolacin y hay lagunas en los
valores de la clase mediana o los datos son irregulares, esta
medida no es buena ya que su ubicacin puede resultar falsa.
8. Si se desea ubicar las condiciones de un elemento en una clase,
la mediana resulta ser indicada, ya que por comparacin pone en
evidencia si un elemento est en la mitad superior a ella o en la
inferior.
MEDIA ARITMETICA PONDERADA
En sta, para cada uno de los valores de xi se asigna un factor wi
de peso, que depende de la importancia que el investigador desee
darle.
Xp = S (xi WI) / S WI
MEDIA GEOMTRICA
til cuando la variable cambia a lo largo del tiempo, esto es, en
el clculo del promedio de tasas, razones, proporciones
geomtricas y relaciones de variables. Se utiliza en Matemticas
Financieras y Finanzas para promediar nmeros ndices, tasas de
cambio, etc.
La media Geomtrica de una serie de nmeros es la raz n-sima del
producto de esos nmeros
M = n e (x 1 * x 2 * x 3 *.....*x n)

37

Se ve afectada por todos los nmeros y valores extremos pero en
menor grado que la Media Aritmtica, su valor siempre es menor que
el de sta.
MEDIA ARMNICA
Se utiliza para el promedio de rendimientos y velocidades. La
Media Armnica de una serie de nmeros es el reciproco de la media
aritmtica del recproco de esos nmeros.
1 / MH = [S 1 / xi] / n
MEDIA CUADRTICA
Es la raz cuadrada de la media aritmtica de los cuadrados de los
nmeros, se usa eficientemente para promediar los errores o
desviaciones porque es ms susceptible a los mismos.
MC = 2 e S [xi 2] / n
LOS CUANTILES
Son valores que dividen a la distribucin en n partes iguales
Cuartiles, cuatro partes iguales: Q1, Q2, Q3
Deciles, diez pares iguales: D1, D2..........D9
Percentiles o centiles, cien partes iguales: P1, P2.....P99
Los cuantiles permiten hacer un anlisis minucioso de la
distribucin, se utilizan generalmente cuando se quiere ubicar un
dato dentro del conjunto. Por ejemplo. Pertenece el dato x al 50%
superior?, al 10% inferior? , Al 50 % central?, etc.
MEDIDAS DE DISPERSIN
Un rasgo principal de los datos es su dispersin o amplitud, que
se refiere a su variabilidad, a la evaluacin de cun separados o
extendidos estn estos datos o bien cuanto difieren unos de otros.
Variacin: es el grado en que los datos numricos tienden a
extenderse al rededor de un valor, generalmente el valor medio
Por qu es importante la variacin?

38

1. Al menudo una medida de posicin de un conjunto de datos se
vincula con la indicacin de cun tpico o representativo es para
la poblacin y para ello es necesario contar con la informacin
que proporcionan las mediadas de variacin. Solo el conocimiento
de un estadstico de tendencia central no aclara o define toda la
distribucin, adems que no existe un valor de tendencia central
ideal, por lo que es significativo tener una idea de la dispersin
de los valores y determinar si es mucha o poca al rededor de la
media, pues si la variacin es muy grande entonces esta medida de
tendencia central no es buena seleccin como valor tpico.
2. La medida de tendencia central no indica la relacin de un dato
con los otros, es necesario para ello las medidas de variabilidad
o dispersin.
3. Al tratar problemas con datos dispersos se requiere conocer que
problemas puede esto traer, hasta qu punto la dispersin tiene un
riesgo aceptable o inaceptable en la toma de decisiones.
4. Al comparar dos distribuciones por lo general centramos la
atencin en la posicin y en la dispersin.
RANGO
Mide la dispersin de la totalidad de los datos. Es la ms obvia
de las mediadas ya que es la distancia entre los valores mximo y
mnimo.
El rango o recorrido da alguna idea del grado de variacin que
ocurre en la poblacin, pero con frecuencia los resultados pueden
ser engaosos, pues este depende de los valores extremos e ignora
la variacin de las dems observaciones. Est afectado por
ocurrencias raras o extraordinarias.
INTERVALO INTERDECIL
Mide la dispersin del 80% de los datos centrales y se obtiene de
la diferencia entre el decil 9 y el decil 1, evitando as los
puntos extremos.
INTERVALO INTERCUARTIL:
Cuando aumenta la dispersin de una distribucin de frecuencias,
se ampla la distancia entre los cuartiles, por lo que esta
distancia puede usarse como base de una medida de variabilidad

39

El intervalo intercuartil, es el recorrido entre el cuartil 3 y el
cuartil 1. Es el intervalo en el cual est comprendido el 50% de
los datos centrales.
DESVIACIN CUARTLICA
Mide el intervalo promedio de un cuarto de los datos [Q3-Q1)/2]
Si la distribucin es perfectamente simtrica, los dos cuartiles
Q1 y Q3 equidistan de la mediana y la mitad de la distancia entre
los cuartiles representa la distancia promedio entre ellos y la
mediana.
Si en una distribucin simtrica se mide una distancia igual a la
desviacin cuartlica a ambos lados de un punto ubicado en el
centro de los cuartiles, el 50% de los valores estarn incluidos
dentro de esos lmites y el valor del punto medio coincide con la
mediana.
La ventaja de la desviacin cuantifica es que evita los valores
extremos utilizando nicamente la mitad intermedia de los datos.
DESVIACIN MEDIA
La desviacin Media o Desviacin absoluta promedio, es la media
aritmtica de las desviaciones absolutas de cada una de las
observaciones con respecto a su valor central, la media
aritmtica, o la mediana
Cuanto mayor es su valor, mayor es la dispersin de los datos
DM =[S | xi. X |] / n
DM = [S fi | xi - X |] / S fi
Las caractersticas de esta media de dispersin son:
1. Su valor depende del valor de cada observacin.
2. Se puede calcular al rededor de la media o de la mediana.
3. La desviacin promedio respecto a la mediana es un mnimo
4. Mide la desviacin de una observacin sin notar si est por
encima o por debajo del promedio.
VARIANZA

40

Otro tratamiento para evadir la suma cero de las desviaciones de
las observaciones respecto a su Media Aritmtica, consiste en
recurrir al proceso de elevar al cuadrado estas desviaciones y
sumar los cuadrados, dividiendo la suma por el nmero de casos, a
esta cantidad se le denomina varianza, y es la ms importante de
las medidas de variacin porque tiene la ventaja de no prescindir
de los signos de las desviaciones, pero al igual que la desviacin
media los valores extremos pueden distorsionarla
S 2 = S (xi - X) 2 / n
S 2 = S fi (xi-X) 2 / S fi
S 2 = S (xi-X) 2 / (n)
S 2 = S fi (xi-X) 2 / (S fi)
S 2 * = S (xi-X) 2 / (n-1)
S 2 *= S fi (xi-X) 2 / (S fi -1)
En inferencia, con una muestra tomada de una poblacin grande se
pretende descubrir cuanto varan los datos al rededor de la media
poblacional, sin embargo cuando no se conoce la media de la
poblacin se estima a partir de la media aritmtica de la muestra
y esto hace que parezca menos variable de lo que es en realidad,
al dividir por n-1 se est compensando por la variabilidad ms
pequea que se observa en la muestra, por lo que S 2 * , la suma
de cuadrados dividida por n-1 es considerado un estimador ms
eficiente para la varianza poblacional.
DESVIACION ESTANDAR
Cuando se utiliza la varianza como medida de dispersin, para
salvar el problema de trabajar con distintas dimensiones en la
media y en la medida de variabilidad es necesario definir la
Desviacin estndar como la raz cuadrada del varianza.
La Desviacin Estndar es til para describir cuanto se apartan de
la media de la distribucin los elementos individuales. Una medida
de ello se denomina puntuacin estndar nmero de desviaciones a
las que determinada observacin se encuentra con respecto a la
media.
Puntuacin estndar de xi = (xi - X) / s

41

Al comparar distribuciones tambin hacemos uso de la calificacin
estndar.
Caracterstica de la Desviacin Estndar:
1. Es afectada por el valor de cada observacin
2. Como consecuencia de considerar desviaciones cuadrticas pone
mayor nfasis en las desviaciones extremas que en las dems
desviaciones.
3. Si en el eje X de la distribucin de frecuencias normal, se
mide a ambos lados de la media una distancia igual a:
Una desviacin estndar se forma un intervalo en el cual se
encuentra el 68.27% de los valores centrales de la variable
Dos desviaciones estndar, se forma un intervalo donde se
encuentra el 95.43% de los valores centrales
Tres desviaciones estndar, se forma un intervalo que contiene el
99.73% de los valores centrales
4. Al construir la tabla de frecuencias de una variable discreta y
calcular a partir de ella la desviacin estndar no hay prdida de
informacin por lo que la desviacin para los datos observados es
igual que para los datos tabulados.
En la construccin de una tabla de una variable continua hay
prdida de informacin por el agrupamiento de los valores en
intervalos y se traduce en la discrepancia entre el valor de la
desviacin observada y tabulada.

Unidad 4
INFERENCIA ESTADISTICA
Dentro del estudio de la inferencia estadstica, se describe como
se puede tomar una muestra aleatoria y a partir de esta muestra
estimar el valor de un parmetro poblacional en la cual se puede
emplear el mtodo de muestreo y el teorema del valor central lo
que permite explicar cmo a partir de una muestra se puede inferir
algo acerca de una poblacin, lo cual nos lleva a definir y

42

elaborar una distribucin de muestreo de medias mustrales que nos
permite explicar el teorema del lmite central y utilizar este
teorema para encontrar las probabilidades de obtener las distintas
medias maestrales de una poblacin.
Pero es necesario tener conocimiento de ciertos datos de la
poblacin como la media, la desviacin estndar o la forma de la
poblacin, pero a veces no se dispone de esta informacin.
En este caso es necesario hacer una estimacin puntual que es un
valor que se usa para estimar un valor poblacional. Pero una
estimacin puntual es un solo valor y se requiere un intervalo de
valores a esto se denomina intervalo de confianza y se espera que
dentro de este intervalo se encuentre el parmetro poblacional
buscado. Tambin se utiliza una estimacin mediante un intervalo,
el cual es un rango de valores en el que se espera se encuentre el
parmetro poblacional
En nuestro caso se desarrolla un procedimiento para probar la
validez de una aseveracin acerca de un parmetro poblacional este
mtodo es denominado Prueba de hiptesis para una muestra.
Por cada tipo de prueba de hiptesis se puede calcular una prueba
estadstica apropiada. Esta prueba estadstica mide el
acercamiento del calor de la muestra (como un promedio) a la
hiptesis nula. La prueba estadstica, sigue una distribucin
estadstica bien conocida (normal, etc.) o se puede desarrollar
una distribucin para la prueba estadstica particular.

La distribucin apropiada de la prueba estadstica se divide en
dos regiones: una regin de rechazo y una de no rechazo. Si la
prueba estadstica cae en esta ltima regin no se puede rechazar
la hiptesis nula y se llega a la conclusin de que el proceso
funciona correctamente.

Al tomar la decisin con respecto a la hiptesis nula, se debe
determinar el valor crtico en la distribucin estadstica que
divide la regin del rechazo (en la cual la hiptesis nula no se
puede rechazar) de la regin de rechazo. A hora bien el valor
crtico depende del tamao de la regin de rechazo.

PASOS DE LA PRUEBA DE HIPTESIS
1. Expresar la hiptesis nula
2. expresar la hiptesis alternativa

43

3. especificar el nivel de significancia
4. determinar el tamao de la muestra
5. establecer los valores crticos que establecen las regiones
de rechazo de las de no rechazo.
6. determinar la prueba estadstica.
7. coleccionar los datos y calcular el valor de la muestra de la
prueba estadstica apropiada.
8. determinar si la prueba estadstica ha sido en la zona de
rechazo a una de no rechazo.
9. determinar la decisin estadstica.
10. expresar la decisin estadstica en
trminos del problema.



2. Tipos de error y nivel de significancia
Si rechazamos una hiptesis cuando debiera ser aceptada
diremos que se ha cometido un error de tipo I. Por otra parte si
aceptamos una hiptesis que debiera ser rechazada, diremos que se
ha cometido un error de tipo II. En ambos casos se ha producido un
juicio errneo.
Para que las reglas de decisin sean buenas, deben disearse
de modo que minimicen los errores de decisin, y no es una
cuestin sencilla, porque para cualquier tamao de la muestra, un
intento de disminuir un tipo de error suele ir acompaado de un
crecimiento del otro tipo. En la prctica un tipo de error puede
ser ms grave que el otro, y debe alcanzarse un compromiso que
disminuya el error ms grave, la nica forma de disminuir ambos a
la vez es aumentar el tamao de la muestra, que no siempre es
posible.


NIVEL DE SIGNIFICANCIA
Al contrastar una cierta hiptesis, la mxima probabilidad
con la que estamos dispuestos a correr el riesgo de cometer un
error de tipo I se llama nivel de significancia. Esta probabilidad
se denota por , se suele especificar antes de la muestra, de
manera que los resultados no influyan en nuestra eleccin.
En la prctica es frecuente un nivel de significancia de 0.05
0.01, si bien se usan otros valores. Si, por ejemplo, se escoge
un nivel de significancia del 5% 0.05 al disear una regla de
decisin entonces hay unas cinco oportunidades entre cien de
rechazar la hiptesis cuando debiera haberse aceptado; es decir,
tenemos un 95% de confianza de que hemos adoptado la decisin
correcta. En tal caso decimos que la hiptesis ha sido rechazada
al nivel de significancia 0.05 lo cual quiere decir que la
hiptesis tiene una probabilidad del 5% de ser falsa.

44




3. Curva caracterstica operativa y curva de potencia
Podemos limitar un error de tipo I eligiendo adecuadamente el
nivel de significancia. Es posible evitar el riesgo de cometer el
error tipo II simplemente no aceptando nunca la hiptesis, pero en
muchas aplicaciones prcticas esto es inviable. En tales casos, se
suele recurrir a curvas caractersticas de operacin o curvas de
potencia que son grficos que muestran las probabilidades de error
de tipo II bajo diversas hiptesis. Proporcionan indicaciones de
hasta qu punto un test dado nos permitir evitar un error de tipo
II; es decir, nos indicarn la potencia de un test a la hora de
prevenir decisiones errneas. Son tiles en el diseo de
experimentos por que sugieren entre otras cosas el tamao de
muestra a manejar.



4. Pruebas de hiptesis para la media y proporciones
Debido a la dificultad de explicar este tema se enfocar un
problema basado en un estudio en una fbrica de llantas.
En este problema la fbrica de llantas tiene dos turnos de
operarios, turno de da y turno mixto. Se selecciona una muestra
aleatoria de 100 llantas producidas por cada turno para ayudar al
gerente a sacar conclusiones de cada una de las siguientes
preguntas:

1.- Es la duracin promedio de las llantas producidas en el turno
de da igual a 25 000
Millas?

2.- Es la duracin promedio de las llantas producidas en el turno
mixto menor de 25 000 millas?

3.- Se revienta ms de un 8% de las llantas producidas por el
turno de da antes de las 10 000 millas?

PRUEBA DE HIPTESIS PARA LA MEDIA

En la fbrica de llantas las hiptesis nulas y alternativa para el
problema se plantearon como sigue:

Ho: = 25 000
H1: 25 000


45

Si se considera la desviacin estndar las llantas producidas en
el turno de da, entonces, con base en el teorema de limite
central, la distribucin en el muestreo de la media seguira la
distribucin normal, y la prueba estadstica que est basada en la
diferencia entre la media de la muestra y la media hipottica

HIPOTESIS Y PRUEBA DE HIPOTESIS
Tenemos que empezar por definir que es una hiptesis y que es
prueba de hiptesis.
Hiptesis es una aseveracin de una poblacin elaborado con el
propsito de poner a prueba, para verificar si la afirmacin es
razonable se usan datos.
En el anlisis estadstico se hace una aseveracin, es decir, se
plantea una hiptesis, despus se hacen las pruebas para verificar
la aseveracin o para determinar que no es verdadera.
Por tanto, la prueba de hiptesis es un procedimiento basado en la
evidencia muestral y la teora de probabilidad; se emplea para
determinar si la hiptesis es una afirmacin razonable.
Prueba de una hiptesis: se realiza mediante un procedimiento
sistemtico de cinco paso:

Siguiendo este procedimiento sistemtico, al llegar al paso cinco
se puede o no rechazar la hiptesis, pero debemos de tener cuidado
con esta determinacin ya que en la consideracin de estadstica
no proporciona evidencia de que algo sea verdadero. Esta prueba
aporta una clase de prueba ms all de una duda razonable.
Analizaremos cada paso en detalle
Objetivo de la prueba de hiptesis.

46

El propsito de la prueba de hiptesis no es cuestionar el valor
calculado del estadstico (maestral), sino hacer
Un juicio con respecto a la diferencia entre estadstico de
muestra y un valor planteado del parmetro.
Procedimiento sistemtico para una prueba de hiptesis de una
muestra
.Paso 1: Plantear la hiptesis nula Ho y la hiptesis alternativa
H1.
Cualquier investigacin estadstica implica la existencia de
hiptesis o afirmaciones acerca de las poblaciones que se
estudian.
La hiptesis nula (Ho) se refiere siempre a un valor especificado
del parmetro de poblacin, no a una estadstica de muestra. La
letra H significa hiptesis y el subndice cero no hay diferencia.
Por lo general hay un "no" en la hiptesis nula que indica que "no
hay cambio" Podemos rechazar o aceptar Ho.
La hiptesis nula es una afirmacin que no se rechaza a menos que
los datos maestrales proporcionen evidencia convincente de que es
falsa. El planteamiento de la hiptesis nula siempre contiene un
signo de igualdad con respecto al valor especificado del
parmetro.
La hiptesis alternativa (H1) es cualquier hiptesis que difiera
de la hiptesis nula. Es una afirmacin que se acepta si los datos
maestrales proporcionan evidencia suficiente de que la hiptesis
nula es falsa. Se le conoce tambin como la hiptesis de
investigacin. El planteamiento de la hiptesis alternativa nunca
contiene un signo de igualdad con respecto al valor especificado
del parmetro.
Pas 2: Seleccionar el nivel de significancia.
Nivel de significancia: Probabilidad de rechazar la hiptesis nula
cuando es verdadera. Se le denota mediante la letra griega ,
tambin es denominada como nivel de riesgo, este trmino es ms
adecuado ya que se corre el riesgo de rechazar la hiptesis nula,

47

cuando en realidad es verdadera. Este nivel esta bajo el control
de la persona que realiza la prueba.
Si suponemos que la hiptesis planteada es verdadera, entonces, el
nivel de significacin indicar la probabilidad de no aceptarla,
es decir, estn fuera de rea de aceptacin. El nivel de confianza
(1-), indica la probabilidad de aceptar la hiptesis planteada,
cuando es verdadera en la poblacin.

La distribucin de muestreo de la estadstica de prueba se divide
en dos regiones, una regin de rechazo (conocida como regin
crtica) y una regin de no rechazo (aceptacin). Si la
estadstica de prueba cae dentro de la regin de aceptacin, no se
puede rechazar la hiptesis nula.
La regin de rechazo puede considerarse como el conjunto de
valores de la estadstica de prueba que no tienen posibilidad de
presentarse si la hiptesis nula es verdadera. Por otro lado,
estos valores no son tan improbables de presentarse si la
hiptesis nula es falsa. El valor crtico separa la regin de no
rechazo de la de rechazo.
Tipos de errores
Cualquiera sea la decisin tomada a partir de una prueba de
hiptesis, ya sea de aceptacin del Ho o de la Ha, puede
incurrirse en error:
Un error tipo I se presenta si la hiptesis nula Ho es rechazada
cuando es verdadera y deba ser aceptada. La probabilidad de
cometer un error tipo I se denomina con la letra alfa

48

Un error tipo II, se denota con la letra griega se presenta si
la hiptesis nula es aceptada cuando de hecho es falsa y deba ser
rechazada.
En cualquiera de los dos casos se comete un error al tomar una
decisin equivocada.
En la siguiente tabla se muestran las decisiones que pueden tomar
el investigador y las consecuencias posibles.

Para que cualquier ensayo de hiptesis sea bueno, debe disearse
de forma que minimice los errores de decisin. En la prctica un
tipo de error puede tener ms importancia que el otro, y as se
tiene a conseguir poner una limitacin al error de mayor
importancia. La nica forma de reducir ambos tipos de errores es
incrementar el tamao de la muestra, lo cual puede ser o no ser
posible.
La probabilidad de cometer un error de tipo II denotada con la
letra griega beta , depende de la diferencia entre los valores
supuesto y real del parmetro de la poblacin. Como es ms fcil
encontrar diferencias grandes, si la diferencia entre la
estadstica de muestra y el correspondiente parmetro de poblacin
es grande, la probabilidad de cometer un error de tipo II,
probablemente sea pequea.

49

El estudio y las conclusiones que obtengamos para una poblacin
cualquiera, se habrn apoyado exclusivamente en el anlisis de una
parte de sta. De la probabilidad con la que estemos dispuestos a
asumir estos errores, depender, por ejemplo, el tamao de la
muestra requerida. Las contrastaciones se apoyan en que los datos
de partida siguen una distribucin normal
Existe una relacin inversa entre la magnitud de los errores y
: conforme a aumenta, disminuye. Esto obliga a establecer con
cuidado el valor de a para las pruebas estadsticas. Lo ideal
sera establecer y . En la prctica se establece el nivel y
para disminuir el Error se incrementa el nmero de observaciones
en la muestra, pues as se acortan los limites de confianza
respecto a la hiptesis planteada .meta de las pruebas
estadsticas es rechazar la hiptesis planteada. En otras
palabras, es deseable aumentar cuando sta es verdadera, o sea,
incrementar lo que se llama poder de la prueba (1- ) La
aceptacin de la hiptesis planteada debe interpretarse como que
la informacin aleatoria de la muestra disponible no permite
detectar la falsedad de esta hiptesis.
Pas 3: Clculo del valor estadstico de prueba
Valor determinado a partir de la informacin muestral, que se
utiliza para determinar si se rechaza la hiptesis nula., existen
muchos estadsticos de prueba para nuestro caso utilizaremos los
estadsticos z y t. La eleccin de uno de estos depende de la
cantidad de muestras que se toman, si las muestras son de la
prueba son iguales a 30 o ms se utiliza el estadstico z, en caso
contrario se utiliza el estadstico t.
Tipos de prueba
a) Prueba bilateral o de dos extremos: la hiptesis planteada se
formula con la igualdad
Ejemplo
H0: = 200
H1: 200

50


b) Pruebas unilateral o de un extremo: la hiptesis planteada se
formula con o
H0: 200 H0: 200
H1: < 200 H1: > 200


En las pruebas de hiptesis para la media (), cuando se conoce la
desviacin estndar () poblacional, o cuando el valor de la
muestra es grande (30 o ms), el valor estadstico de prueba es z
y se determina a partir de:

El valor estadstico z, para muestra grande y desviacin estndar
poblacional desconocida se determina por la ecuacin:

En la prueba para una media poblacional con muestra pequea y
desviacin estndar poblacional desconocida se utiliza el valor
estadstico t.

51


Pas 4: Formular la regla de decisin
SE establece las condiciones especficas en la que se rechaza la
hiptesis nula y las condiciones en que no se rechaza la hiptesis
nula. La regin de rechazo define la ubicacin de todos los
valores que son tan grandes o tan pequeos, que la probabilidad de
que se presenten bajo la suposicin de que la hiptesis nula es
verdadera, es muy remota

Distribucin muestral del valor estadstico z, con prueba de una
cola a la derecha
Valor critico: Es el punto de divisin entre la regin en la que
se rechaza la hiptesis nula y la regin en la que no se rechaza
la hiptesis nula.
Pas 5: Tomar una decisin.
En este ltimo paso de la prueba de hiptesis, se calcula el
estadstico de prueba, se compara con el valor crtico y se toma
la decisin de rechazar o no la hiptesis nula. Tenga presente que
en una prueba de hiptesis solo se puede tomar una de dos
decisiones: aceptar o rechazar la hiptesis nula. Debe subrayarse
que siempre existe la posibilidad de rechazar la hiptesis nula
cuando no debera haberse rechazado (error tipo I). Tambin existe
la posibilidad de que la hiptesis nula se acepte cuando debera
haberse rechazado (error de tipo II).

52

Ejemplo en la cual se indica el procedimiento para la prueba de
hiptesis
Ejemplo
El jefe de la Biblioteca Especializada de la Facultad de
Ingeniera Elctrica y Electrnica de la UNAC manifiesta que el
nmero promedio de lectores por da es de 350. Para confirmar o no
este supuesto se controla la cantidad de lectores que utilizaron
la biblioteca durante 30 das. Se considera el nivel de
significancia de 0.05
Datos:
Da Usuarios Da Usuarios Da Usuario
1 356 11 305 21 429
2 427 12 413 22 376
3 387 13 391 23 328
4 510 14 380 24 411
5 288 15 382 25 397
6 290 16 389 26 365
7 320 17 405 27 405
8 350 18 293 28 369
9 403 19 276 29 429
10 329 20 417 30 364

53

Solucin: Se trata de un problema con una media poblacional:
muestra grande y desviacin estndar poblacional desconocida.
Paso 01: Seleccionamos la hiptesis nula y la hiptesis
alternativa
Ho: 350
Ha: 350
Paso 02: Nivel de confianza o significancia 95%
0.05
Paso 03: Calculamos o determinamos el valor estadstico de prueba
De los datos determinamos: que el estadstico de prueba es t,
debido a que el numero de muestras es igual a 30, conocemos la
media de la poblacin, pero la desviacin estndar de la poblacin
es desconocida, en este caso determinamos la desviacin estndar
de la muestra y la utilizamos en la formula reemplazando a la
desviacin estndar de la poblacin.

Calculamos la desviacin estndar muestral y la media de la
muestra empleando Excel, lo cual se muestra en el cuadro que
sigue.
Columna1
Media 372.8
Error tpico 9.56951578
Mediana 381
Moda 405

54

Desviacin estndar 52.4143965
Varianza de la muestra 2747.26897
Curtosis 0.36687081
Coeficiente de asimetra 0.04706877
Rango 234
Mnimo 276
Mximo 510
Suma 11184
Cuenta 30
Nivel de confianza (95.0%) 19.571868
Paso 04: Formulacin de la regla de decisin.
La regla de decisin la formulamos teniendo en cuenta que esta es
una prueba de dos colas, la mitad de 0.05, es decir 0.025, est en
cada cola. El rea en la que no se rechaza Ho est entre las dos
colas, es por consiguiente 0.95. El valor critico para 0.05 da un
valor de Zc = 1.96.
Por consiguiente la regla de decisin: es rechazar la hiptesis
nula y aceptar la hiptesis alternativa, si el valor Z calculado
no queda en la regin comprendida entre -1.96 y +1.96. En caso
contrario no se rechaza la hiptesis nula si Z queda entre -1.96 y
+1.96.
Paso 05: Toma de decisin.

55

En este ltimo paso comparamos el estadstico de prueba calculado
mediante el Software Minitab que es igual a Z = 2.38 y lo
comparamos con el valor critico de Zc = 1.96. Como el estadstico
de prueba calculado cae a la derecha del valor critico de Z, se
rechaza Ho. Por tanto no se confirma el supuesto del Jefe de la
Biblioteca.




Unidad 5
Anlisis de regresin y correlacin
Cuando se trabaja con dos o ms variables, es importante conocer
la relacin entre ellas. Si una o ms variables son aleatorias, no
habr una relacin unvoca entre los valores de dos de las
variables -es decir, dado un valor de una variable (la variable
controlada), hay un posible rango de valores de la otra- y por lo
tanto se requiere una descripcin probabilstica. La relacin
probabilstica de las variables, que se describe con la media y la
varianza de una variable aleatoria en funcin de los valores de la
otra variable, se conoce como anlisis de regresin. Cuando el
anlisis se limita a funciones lineales, se trata de una regresin
lineal, pero la regresin puede ser tambin de tipo no lineal. En
algunos casos, problemas de regresin no lineal pueden convertirse
en lineales mediante una transformacin de las variables
originales.

Regresin con varianza constante
Cuando se ubican en una grfica bidimensional las parejas de datos
de dos variables X y Y, debe tenerse en cuenta que los valores de
Y por ejemplo, dependen de X, y por tanto los datos de Y han de
analizarse (para determinar la media, la varianza, etc.) con la
debida consideracin de X. En la figura 1 se observa una tendencia
general de los valores de Y, a aumentar directamente
proporcionales con X (X puede ser determinantica o aleatoria).
Entonces la media de los valores de Y aumentar con el aumento de

56

los valores de X, aunque los valores reales de Y no necesariamente
tienen que incrementarse directamente con los valores de X.
Supongamos que esta relacin es lineal, es decir,

(1)
Donde y son constantes, y la varianza de Y puede ser
independiente o ser funcin de X. Esta ecuacin se conoce como la
regresin lineal de Y sobre X. Vamos a considerar el caso con
= constante.
Muchas rectas, pueden satisfacer la funcin del valor medio de Y,
dependiendo de los valores de y . La mejor lnea ser la que
pase entre los puntos de los datos con el mejor ajuste. En la
figura 1, se muestra la diferencia entre cada valor observado y
la recta , es decir, . Entonces la mejor lnea es
aquella con la diferencia total mnima, y se obtiene minimizando
la suma de los errores (diferencias) cuadrados, o sea minimizando

(2)
Donde n es el nmero de puntos de los datos. Este es el mtodo
conocido como de los mnimos cuadrados. Para obtener los estimados
y se procede a derivar la ecuacin (2):




57




Figura 1. Anlisis de Regresin lineal de datos de dos variables

De donde se obtiene

(3)

(4)
Donde
La lnea de regresin de los mnimos cuadrados es entonces:

(5)
Esta lnea de regresin es vlida solamente en el rango de valores
de x observados. Las ecuaciones (1) a (5) se refieren a la
regresin de Y sobre X. Si X y Y son ambas variables aleatorias,
puede obtenerse tambin la regresin de X sobre Y, siguiendo el
mismo procedimiento; en este caso se obtendra la ecuacin de
regresin de . En general, esta es una ecuacin lineal

58

diferente de . Sin embargo las dos ecuaciones siempre se
interceptan en .
Ya que la tendencia general de la relacin se explica con la lnea
de regresin de la ecuacin (5), la varianza alrededor de esta
lnea es la medida de dispersin, que es la varianza condicional
. Para el caso en el cual la varianza condicional
se asume constante en el rango de inters de x, un
estimado imparcial de la varianza es

(6)

que es igual a

Y por lo tanto, la desviacin estndar condicional es .
Los coeficientes , y , son estimados de los valores reales de
, y .

Anlisis de correlacin. Estimacin del coeficiente de correlacin
El estudio del grado de relacin lineal entre variables aleatorias
se conoce como anlisis de correlacin. La exactitud de una
prediccin lineal depender de la correlacin entre las variables.
Matemticamente la correlacin entre dos variables X y Y, se mide
por el coeficiente de correlacin definido como


59

Basado en un grupo de valores observados X y Y, el coeficiente de
correlacin puede ser estimado por

(7)

Donde , , y son respectivamente las medias mustrales y las
desviaciones estndares mustrales de X y Y. El valor de est
comprendido entre 1 y 1 y es una medida de la relacin lineal
entre las variables X y Y. Si el estimado est cercano a 1 -1,
hay una fuerte relacin lineal entre X y Y, y el anlisis de
regresin lineal puede ser realizado; si , no existe una buena
relacin lineal entre las variables.
De las ecuaciones (4) y (7) puede demostrarse que

(8)
La cual es una relacin til entre el estimado de y el
coeficiente de regresin . Sustituyendo (8) en (6) se obtiene


De lo cual se tiene


60

A mayor valor de , mayor ser la reduccin en la varianza y por
tanto, mejor ser la prediccin basada en la ecuacin de
regresin.














Unidad 6
ANALISIS DE VARIANZA ESTADISTICO
El anlisis de la varianza (o Anova: Analysis of variance) es un
mtodo para comparar dos o ms medias, que es necesario porque
cuando se quiere comparar ms de dos medias es incorrecto utilizar
repetidamente el contraste basado en la t de Student. Por dos
motivos:
En primer lugar, y como se realizaran simultnea e
independientemente varios contrastes de hiptesis, la probabilidad
de encontrar alguno significativo por azar aumentara. En cada
contraste se rechaza la H0 si la t supera el nivel crtico, para

61

lo que, en la hiptesis nula, hay una probabilidado. Si se
realizan m contrastes independientes, la probabilidad de que, en
la hiptesis nula, ningn estadstico supere el valor crtico es
(1 - o) m, por lo tanto, la probabilidad de que alguno lo supere
es 1 - (1 - o) m, que para valores de o prximos a 0 es
aproximadamente igual a om. Una primera solucin, denominada
mtodo de Bonferroni, consiste en bajar el valor deo, usando en su
lugar o/m, aunque resulta un mtodo muy conservador.
Por otro lado, en cada comparacin la hiptesis nula es que las
dos muestras provienen de la misma poblacin, por lo tanto, cuando
se hayan realizado todas las comparaciones, la hiptesis nula es
que todas las muestras provienen de la misma poblacin y, sin
embargo, para cada comparacin, la estimacin de la varianza
necesaria para el contraste es distinta, pues se ha hecho en base
a muestras distintas.
El mtodo que resuelve ambos problemas es el anova, aunque es algo
ms que esto: es un mtodo que permite comparar varias medias en
diversas situaciones; muy ligado, por tanto, al diseo de
experimentos y, de alguna manera, es la base del anlisis
multivariante.
2. Bases del anlisis de la varianza
Supnganse k muestras aleatorias independientes, de tamao n,
extradas de una nica poblacin normal. A partir de ellas existen
dos maneras independientes de estimar la varianza de la poblacin
o2:
1) Una llamada varianza dentro de los grupos (ya que slo
contribuye a ella la varianza dentro de las muestras), o varianza
de error, o cuadrados medios del error, y habitualmente
representada por MSE (Mean Square Error) o MSW (Mean Square
Within) que se calcula como la media de las k varianzas mustrales
(cada varianza maestral es un estimador centrado de o2 y la media
de k estimadores centrados es tambin un estimador centrado y ms
eficiente que todos ellos). MSE es un cociente: al numerador se le
llama suma de cuadrados del error y se representa por SSE y al

62

denominador grados de libertad por ser los trminos independientes
de la suma de cuadrados.
2) Otra llamada varianza entre grupos (slo contribuye a ella la
varianza entre las distintas muestras), o varianza de los
tratamientos, o cuadrados medios de los tratamientos y
representada por MSA o MSB (Mean Square Between). Se calcula a
partir de la varianza de las medias muestrales y es tambin un
cociente; al numerador se le llama suma de cuadrados de los
tratamientos (se le representa por SSA) y al denominador (k-1)
grados de libertad.
MSA y MSE, estiman la varianza poblacional en la hiptesis de que
las k muestras provengan de la misma poblacin. La
distribucinmuestral del cociente de dos estimaciones
independientes de la varianza de una poblacin normal es una F con
los grados de libertad correspondientes al numerador y denominador
respectivamente, por lo tanto se puede contrastar dicha hiptesis
usando esa distribucin.
Si en base a este contraste se rechaza la hiptesis de que MSE y
MSA estimen la misma varianza, se puede rechazar la hiptesis de
que las k medias provengan de una misma poblacin.
Aceptando que las muestras provengan de poblaciones con la misma
varianza, este rechazo implica que las medias poblacionales son
distintas, de modo que con un nico contraste se contrasta la
igualdad de k medias.
Existe una tercera manera de estimar la varianza de la poblacin,
aunque no es independiente de las anteriores. Si se consideran las
kn observaciones como una nica muestra, su varianza muestral
tambin es un estimador centrado de s 2:
Se suele representar por MST, se le denomina varianza total o
cuadrados medios totales, es tambin un cociente y al numerador se
le llama suma de cuadrados total y se representa por SST, y el
denominador (kn -1) grados de libertad.
Los resultados de un anova se suelen representar en una tabla como
la siguiente:

63

Fuente de variacin G.L. SS MS F
Entre grupos
Tratamientos
k-1 SSA SSA/(k-1) MSA/MSE
Dentro
Error
(n-1)k SSE SSE/k(n-1)
Total kn-1 SST
Y el cociente F se usa para realizar el contraste de la hiptesis
de medias iguales. La regin crtica para dicho contraste es F >
Fo(k-1, (n-1) k)
Algunas propiedades
Es fcil ver en la tabla anterior que
GLerror+ GLtrata = (n - 1) k + k - 1 = nk - k + k - 1 = nk - 1 =
GLtotal
No es tan inmediato, pero las sumas de cuadrados cumplen la misma
propiedad, llamada identidad o propiedad aditiva de la suma de
cuadrados:
SST = SSA + SSE
El anlisis de la varianza se puede realizar con tamaos
mustrales iguales o distintos, sin embargo es recomendable
iguales tamaos por dos motivos:
La F es insensible a pequeas variaciones en la asuncin de igual
varianza, si el tamao es igual.
Igual tamao minimiza la probabilidad de error tipo II.
3. Modelos de anlisis de la varianza
El anova permite distinguir dos modelos para la hiptesis
alternativa:
Modelo I o de efectos fijos en el que la H1 supone que las k
muestras son muestras de k poblaciones distintas y fijas.

64

Modelo II o de efectos aleatorios en el que se supone que las k
muestras, se han seleccionado aleatoriamente de un conjunto de m>k
poblaciones.
Un ejemplo de modelo I de anova es que se asume que existen cinco
poblaciones (sin tratamiento, con poca sal, sin sal, etc.) fijas,
de las que se han extrado las muestras.
Un ejemplo de modelo II sera: un investigador est interesado en
determinar el contenido, y sus variaciones, de grasas en las
clulas hepticas de cobayas; toma del animalario 5 cobayas al
azar y les realiza, a cada una, 3 biopsias hepticas.
La manera ms sencilla de distinguir entre ambos modelos es pensar
que, si se repitiera el estudio un tiempo despus, en un modelo I
las muestras seran iguales (no los individuos que las forman) es
decir corresponderan a la misma situacin, mientras que en un
modelo II las muestras seran distintas.
Aunque las asunciones iniciales y los propsitos de ambos modelos
son diferentes, los clculos y las pruebas de significacin son
los mismos y slo difieren en la interpretacin y en algunas
pruebas de hiptesis suplementarias.
Anlisis de la varianza de dos factores
Es un diseo de anova que permite estudiar simultneamente los
efectos de dos fuentes de variacin.
En cualquier caso, el investigador puede estar interesado en
estudiar si hay, o no, diferencia en la evolucin segn el sexo.
En un anova de dos vas se clasifica a los individuos de acuerdo a
dos factores (o vas) para estudiar simultneamente sus efectos.
En este ejemplo se haran cinco grupos de tratamiento para los
hombres y otros cinco para las mujeres, en total diez grupos; en
general, si el primer factor tiene a niveles y el segundo tiene b,
se tendrn ab muestras o unidades experimentales, cada una con n
individuos o repeticiones.
Una observacin individual se representa como:
El primer subndice indica el nivel del primer factor, el segundo
el nivel del segundo factor y el tercero la observacin dentro de
la muestra. Los factores pueden ser ambos de efectos fijos (se
habla entonces de modelo I), de efectos aleatorios (modelo II) o

65

uno de efectos fijos y el otro de efectos aleatorios (modelo
mixto). El modelo matemtico de este anlisis es:
Modelo I
Modelo II
Modelo mixto
Donde m es la media global, a i o Ai el efecto del nivel i del 11
factor, |j o Bj el efecto del nivel j del 2 factor y cijk las
desviaciones aleatorias alrededor de las medias, que tambin se
asume que estn normalmente distribuidas, son independientes y
tienen media 0 y varianza s 2.
A las condiciones de muestreo aleatorio, normalidad e
independencia, este modelo aade la de aditivita de los efectos de
los factores.
A los trminos (a b) ij, (AB) ij, (a B) ij, se les denomina
interaccin entre ambos factores y representan el hecho de que el
efecto de un determinado nivel de un factor sea diferente para
cada nivel del otro factor.
Para entender mejor este concepto de interaccin veamos un ejemplo
sencillo sobre un anova de dos factores, cada uno con dos niveles:
supngase un estudio para analizar el efecto de un somnfero
teniendo en cuenta el sexo de los sujetos. Se eligen al azar dos
grupos de hombres y otros dos de mujeres. A un grupo de hombres y
otro de mujeres se les suministra un placebo y a los otros grupos
el somnfero. Se mide el efecto por el tiempo que los sujetos
tardan en dormirse desde el suministro de la pldora.
Se trata de un anova de dos factores (sexo y frmaco) fijos, cada
uno con dos niveles (hombre y mujer para el sexo y somnfero y
placebo para el frmaco). Los dos tipos de resultados posibles se
esquematizan en la figura

66


A B
En la figura A se observa que las mujeres tardan ms en dormirse,
tanto en el grupo tratado como en el grupo placebo (hay un efecto
del sexo) y que los tratados con placebo tardan ms en dormirse
que los tratados con somnfero en ambos sexos (hay un efecto del
tratamiento). Ambos efectos son fcilmente observables.
Sin embargo en la figura B es difcil cuantificar el efecto del
somnfero pues es distinto en ambos sexos y, simtricamente, es
difcil cuantificar el efecto del sexo pues es distinto en ambos
grupos de tratamiento. En este caso, se dice que existe
interaccin.
Podra, incluso, darse el caso de que se invirtieran los efectos
de un factor para los distintos niveles del otro, es decir, que
las mujeres se durmieran antes con el somnfero y los hombres
antes con el placebo.
La interaccin indica, por tanto, que los efectos de ambos
factores no son aditivos: cuando se dan juntos, su efecto no es la
suma de los efectos que tienen cuando estn por separado, por lo
que, si en un determinado estudio se encuentra interaccin entre
dos factores, no tiene sentido estimar los efectos de los factores
por separado. A la interaccin positiva, es decir, cuando el
efecto de los factores actuando juntos es mayor que la suma de
efectos actuando por separado, en Biologa se le denomina
sinergiao potenciacin y a la interaccin negativa inhibicin. En
el ejemplo de la figura B, se dira que el ser mujer inhibe el
efecto del somnfero, o que el ser hombre lo potencia (segn el
sexo que se tome como referencia).

67

4. Contrates de hiptesis en un anlisis de la varianza de dos
factores
Del mismo modo que se hizo en l a nova de una va, para plantear
los contrastes de hiptesis habr que calcular los valores
esperados de los distintos cuadrados medios. Los resultados son:
Modelo I
MS Valor esperado
MSA

MSB

MSAB

MSE

Por lo tanto, los estadsticos MSAB/MSE, MSA/MSE y MSB/MSE se
distribuyen como una F con los grados de libertad correspondientes
y permiten contrastar, respectivamente, las hiptesis:
No existe interaccin (MSAB/MSE)

No existe efecto del primer factor, es decir, diferencias entre
niveles del primer factor (MSA/MSE)

No existe efecto del segundo factor (MSB/MSE)

Si se rechaza la primera hiptesis de no interaccin, no tiene
sentido contrastar las siguientes. En este caso lo que est

68

indicado es realizar un anlisis de una va entre las ab
combinaciones de tratamientos para encontrar la mejor combinacin
de los mismos.

Ejercicios y conceptos de la libreta
Unidad 1
CONCEPTOS BASICOS DE PROBABILIDAD

Debido a que el proceso de obtener toda la informacin relevante
a una poblacin particular es difcil y en muchos casos imposibles
de obtener, se utiliza una muestra para estimar la informacin
necesaria para la toma de decisiones.

Tomemos por ejemplo una compaa x que desea introducir a un nuevo
producto al mercado, sera absurdo pretender que toda la poblacin
pruebe el producto. En este caso se da a probar el producto a una
muestra de consumidores y con base a los resultados de esa
muestra se decide si el producto se elabora o no.
Ahora bien como los resultados obtenidos a partir de una muestra
difieren de los resultados que se obtendra se observa una
poblacin total o universo existe un riesgo al tomar la decisin.
Es en este caso que se utiliza la probabilidad como una medida de
riesgo

DEFINICIONES BASICAS
Experimento: cualquier accin cuyo resultado se registra como un
dato
Espacio muestra (S): el conjunto de todos los posibles resultados
de un experimento

69

Evento: resultado de un experimento cuando cada evento es
seleccionado al azar, el experimento se denomina aleatorio al azar
Evento simple (E): cada uno de los posibles resultados de un
experimento y que no se puede descomponer.
Evento compuesto: los eventos A, B, C, etc. son eventos
compuestos si se componen de dos o ms eventos simples

Unin: la unin de dos conjuntos A y B es el conjuntos C que est
formado por los elementos de A, de B o de ambos.

Interseccin: la interseccin de dos conjuntos A y B es el
conjuntos C que est formado por los elementos que pertenecen a
ambos conjuntos simultneamente

Complementos: el complemento de un conjunto A que se denota por


es el evento que consta de todos los resultados del espacio
muestra que no estn contenidos en A
Principios de conteo: el anlisis de los problemas de probabilidad
se facilita a travs de mtodos sistemticos de conteo de los
grupos y arreglos de los datos
Definicin de factorial. El smbolo n! que se lee n factorial se
refiere al producto de todos los enteros de n hasta 1
N!= n (n-1) (n-2) (n-3)
Ejemplo: 5! = 5*4*3*2*1

70

Principio de multiplicacin:
Si un experimento puede describirse como una secuencia de k pasos
y en cada paso hay una n1 resultados en el primero paso, n2
resultados en el segundo paso, n3 resultados en el tercer paso , y
as sucesivamente, entonces el numero de eventos que pueden
ocurrir ser,


2) suponga que se desea formar un comit de tres miembros en el
cual se erigir un presidente, un vicepresidente y un tesorero.
Hay dos candidatos para la presidencia, 4 para la vicepresidencia
y 3 para el tesorero. De cuantas formas puede formar el comit?

Regla de multiplicacin de probabilidad
Esta regla de probabilidad se deriva de la definicin de
probabilidad condicional y utiliza el concepto de interseccin de
eventos para su aplicacin
b. Si A y B son eventos independientes , entonces
P (A_B) = P (B) * P(A/B)
P (A_B) = P (A) * P (B/A)
Ejercicio
1. Sean A y B eventos tales que : P (A) = 3/8; P(B) = y P(AB)
= 1/4
Calcular
a) P(AB); b) P(A
c
); c) P(A
c
B
c
)

71


a) P(AB) = 3/8 + 4/8 = 7/8
b) P(A
c
) = 1 3/8 = 5/8
c) P(A
c
B
c
) = 1 5/8 = 3/8
2.- Sean A y B dos eventos tales que: P(AB) = 3/4; P (A
c
)= 2/3;
P(AB)= 1/3
Calcular
a) P(A); b) P(B); c) P(A B)

a) P(A) = 1 2/3 = 1/3
b) P (B) = 3/4
c) P(AB) = 1/3 1/3 =
3.- Si las probabilidades de que un mecnico automotriz de
servicio a 3, 4, 5, 6, 7, 8 o ms autos en un da de trabajo dado
son: .12, .19, .28, .24, .10 y .07 respectivamente:
a) Cual es la probabilidad que le de servicio al menos a 5 autos
en el siguiente da de trabajo?
R = .28 +.24 + .10 + .07 = .69 = 69 %
b) Cul es la probabilidad de que no ms de 4 autos recibirn
servicio?
R = 1 - .19 - .12 = .69 = 69 %
c) Cul es la probabilidad de que el mecnico de servicio a
menos de 8 autos?
R = 1 - .07 = .93 = 93 %



4.- Al final del semestre Juan se graduar de la carrera de
ingeniera mecnica. Despus de tener entrevistas en 2 compaas
en donde quiere trabajar, el evala la probabilidad que tiene de
lograr una oferta de empleo en la compaa A de 0.8 y la

72

probabilidad en la compaa B de 0.6. Si por otro lado considera
que la probabilidad de obtener ofertas de trabajo de ambas
compaas es de 0.5. Cul es la probabilidad de que obtendr al
menos una oferta de esas compaas?
P(AB) = P(A) + P (B) P(AB)
P(AB) = 4/5 + 3/5 +1/2 = 9/10 = 90 %
5.- Si las probabilidades de que un joven compre un automvil
nuevo y elija color verde, blanco, rojo o azul son
respectivamente: 0.09, 0.15, 0.21, .0.23. Cul es la probabilidad
de que un comprador adquiera un automvil nuevo que tenga uno de
eso colores?
0.09 + 0.15 + 0.21 + 0.23 = .68 = 68 %
ESPACIOS EQUIPROBABLES
P(A) =


Forma de la probabilidad clsica
Convenio: la expresin al azar se usa solamente respecto a un
espacio equiprobable, esta es cuando digamos un elemento de un
conjunto dado, ser seleccionado al azar entenderemos que todos
los elementos del conjunto tienen igual probabilidad de ser
seleccionados
Ejemplo:
1. Se tiran dos dados convenientes, calcular la probabilidad de
que la suma de sus nmeros sea:
a) Mayor que 5 26/36 = 13/18 .72 72%
b) Mayor igual que 815/36 = .041 41%
c) Numero primo 15/36 = .41 41%
d) Mayor que 4 menor que 10 24/36 = .66 66%
e) Un mltiplo de 312/36 = .33 33%
6 7 8 9 10 11 12
5 6 7 8 9 10 11
4 5 6 7 8 9 10
3 4 5 6 7 8 9

73

2 3 4 5 6 7 8
1 2 3 4 5 6 7
1 2 3 4 5 6
Ejercicio numero 2
En un lote de 16 radios hay 5 defectuosos si tres radios son
seleccionados al azar calcular la probabilidad de que:
a) Los tres sean defectuosos
b) Ninguno sea defectuoso
{



P (A) =

=.017 x 100 = 1.7%


P (B) =

= 0.2946 x 100 = 29.46%


3.- En un club de 75 personas se tiene que:
o 30 hablan ingles
o 25 hablan francs
o 30 hablan alemn
o 11 hablan ingles y alemn
o 9 francs y alemn
o 6 los 3 idiomas
Si una persona del club es seleccionada al azar, encontrar
La probabilidad de que:
a) Las persona hable francs pero no ingles ni alemn
11/75 = .14 14%
b) La persona hable ingles o francs pero no ambos idiomas
33/75 = .44 44%
c) Las personas no hablen ningn idioma
14/75= .18 18%

PROBABILIDAD CONDICIONAL
La probabilidad condicional se denomina como la probabilidad de un
evento A bajo la condicin de que otro evento B ha ocurrido. Se
denota
P (A/B) esto es igual a la probabilidad del evento A dado que el
evento B ha ocurrido

74

Nota.- si el evento B ha ocurrido entonces B=0, es decir B no es el
evento imposible

P (A/B) =



Probabilidad Condicional

Ejercicios.-

1.- en una caja se tienen 5 radio de los cuales 2 estn
defectuosos y 6 lmparas de las cuales 3 estn defectuosas. Se
seleccin al azar un artculo de la caja resultando estar
defectuoso, calcular la probabilidad de que el articulo
seleccionado sea 1 radio.
A.- sea radio A=5
B.- Que este defectuoso B=5
AB: sea radio este defectuoso AB=22/11

P (A/B) =

11/2 = 2/5 .4 40%


La probabilidad de que el artculo seleccionado sea radio y este
defectuoso es de 40%

2.- se lanzan 2 dados corrientes y ocurre que salen caras
distintas. Calcular la probabilidad de que ambas caras sea nmero
impar
B.- salen caras distintas B=30

P (A/B) =

6/30 = .20 20%



La probabilidad de al tirar 2 dados salgan ambas caras impares y
hayan resultado distintas es del 20%
En una urna hay 8 pelotas de las cuales 3 son blancas y 5 son
negras, se extraen 2 pelotas al azar y ocurre que son de igual
color, Calcular la probabilidad de que las 2 pelotas extradas
sean blancas

C3, 2 3x2/1x2 = 3 c3, 2 + c5, 2 = 10+3 13

75

C5, 2 5x4/1x2 =20/2 10 3/13=.23 x 100 23%

3c2/3c2+5c2 = 3/13.23
8 pelotas {


inferencia: la probabilidad de que las dos
pelotas extradas sean blancas y hayan resultados de igual color
es de 23%
1.- Mtodo corto o del espacio reducido
P (AB/B)= P(AB)/P (b) =ER= Cf/Cp= 2/5 .4 = 40%
2.- P(A/B)= P(AB)/P (B) = ER = 6/30.20 20%
3.- A.- LOS 2 SEAN BLANCAS
B.- LOS 2 RESULTARARON DE IGUAL COLOR B= C3, 2 + C5, 2 = 3+10=13
(AB)= LAS 2SEAN BLANCAS Y HAYAN (AB)= C3, 2 = 3 RESULTADO SER DE
IGUAL COLOR
P(AB)=3/28
P(A/B)= (3/28)/ (13/28) = 3/13= .23 23%
EVENTOS INDEPENDIENTE
DOS EVENTOS A Y B SON INDEPENTIENSTE SI:
P(AB)= P(A)*P (B)
DE LO CONTRARIO LOS EVENTOS A Y B SE LLAMAN INDEPENDIENTES
EJEMPLO:
SE TIRA UN DADO Y SE TIENE QUE UN ESPACIO EQUIPROBABLE E= {1, 2,
3, 4, 5,6} SEAN LOS EVENTOS A
A: SALE EL NUMERO PAR A {2, 4,6} PA=1/2
B: SALE EL NUMERO PRIMOB {2, 3,5} PB=1/2
SON A Y B EVENTOS INDEPENDIENTES?
P(AB) = P(A)*P (B)

76

1/6=1/2*1/2
1/6=.25
SALE PAR UN NUMERO PRIMO: (AB) {2}=1/6
1/69=1/6
A Y B SON EVENTOS INDEPENDIENTES YA QUE LA IGUALDAD SI SE CUMPLE.
EJERCICIOS:
1.- LAS PROBABILIDADES DE QUE 3 TIRADORES PEGUEN AL NBLANCO SON
RESPECTIVAMENTE 1/6,1/3, Y 2/7. SI CADA UNO DE ELLOS DISPARA UNA
VEZ AL BLANCO, CALCULAR LA PROBABILIDAD DE QUE
A) LOS 3 PEGUEN AL BLANCO
B) QUE EL PPRIMERO NO PEGUE AL BLANCO Y LOS OTROS 2 SI
C) QUE LOS 2 PRIMEROS NO PEGUEN AL BLANCO Y EL ULTIMO SI
D) QUE EL PRIMERO SI PEGUE AL BLANCO Y LOS 2 NO PEGUEN
E) QUE LOS 2 PRIMEROS PEGUEN AL BLANCO Y EL ULTIMO NO PEGUE
F) QUE NINGUNO LE PEGUE AL BLANCO

NOTA: SEA A Y B EVENTOS INDEPENDIENTES TALE QUE SU PROBABILIDAD DE
SUS EVENTOS COMPLEMENTARIOS SON TAMBIEN INDEPENDIENTES
P(ABC)=P(A)*P (B)*P(C)
P(A)=1/6
P (B)=1/3
P(C) = 2/7
P(ABC) = 5/6*1/3*2/7=.079
2.= SEAN A Y B DOS EVENTOS INDEPENDIENTES TALES QUE LA
PROBABILIDAD DE A=1/2 Y P AB =2/3
CALCULAR A) LA PROBABILIDAD DE B. B) P(A/B). C) P (B/A)

77

P (AUB) = P (B) +P (A) P(AB)
2/3= +P (B) - *P (B)
2/3= + P (B)
P (B) =1/6+1/6=1/3
B) P(A/B) = P(AB)/P (B) = (1/6)/ (1/3) =1/2
c) P (B/A) = P(AB)/P (B) = P(A)*P (B) / P(A) = 1/3
TEOREMA DE BAYES

) (


Ai = Evento favorable
B = Evento que ya sucedi
Ejercicios
1.- En una fabrica 3 maquinas producen respectivamente: el 50 %,
el 30% y el 20 % del nmero total de artculos. Los porcentajes de
desperfectos de produccin de dichas maquinas son
respectivamente: el 3 %, el 5% y el 2%. Si un artculo es
seleccionado al azar y resulta defectuoso, calcular la
probabilidad de que haya sido producido por la maquina N
M N y R
M 50% 3% P (A1)
N 30% 5% P (A2)
R 20% 2% P (A3)

Unidad 2: Variables aleatorias, distribuciones de probabilidad
VARIABLES ALEATORIAS Y DISTRIBUCIN DE PROBABILIDAD
Variable: toda caracterstica que pueda asumir valores diferentes

78

Variable discreta: son aquellas que pueden asumir un nmero finito
o uno infinito numerable de valores distintos
Variable continua: son aquellas que pueden tomar un nmero finito
no numerable de valores
Variable aleatoria: no puede predecirse con certeza el valor que
asumir al realizar el experimento
Variable aleatoria discreta: sea X una variable aleatoria discreta
X cons distribucin de probabilidad F(x).
Si X es una variable aleatoria discreta, cuya funcin de
probabilidad es P(x) y si g(x) es cualquier funcin de x con valor
real entonces:
E {g(x)}= g(x) P(x)
Varianza: v(x) = E(x
2
) {E(x
2
)}
2
donde E(x
2
) se define como el
valor medio cuadrtico
E(x
2
) = (x
2
) P(x)
DISTRIBUCION DE BERNAULLI O BINOMIAL
Cualquier variable aleatoria que represente la presencia o
ausencia de determinada condicin de un fenmeno observado tendr
una distribucin de este tipo. Con frecuencia uno de los
resultados se llama xito y el otro fracaso
NCy =


Entonces: P (Y=y) = P (y) = n (yP
y
(1 P)
n y

Para resumir una variable aleatoria y tiene una distribucin
binomial si existen las 5 condiciones siguientes:
1. El experimento consiste en un nmero fijo de n intervalos
idnticos
2. Cada intento solo puede tener un resultado de dos posibles,
que se llaman xito o fracaso
3. La probabilidad y de xito es constante de intento a
intento
4. Los intentos son independientes
5. Se define Y como el numero de xitos en intentos

79

El valor esperado, esperanza o medias de la distribucin binomial
esta dado por la siguiente ecuacin: E (Y) = np
Varianza: S
2
(Y) = np (1 P) o (1-P) = q
DISTRIBUCION DE POISSON
Son los experimentos que resultan de valores numricos de una
variable aleatoria X misma que representa el nmero de resultados
durante un intervalo de tiempo dado o en una regin especifica. Un
experimento de poisson surge del proceso de Poisson y tiene las
siguientes propiedades:
La funcin de densidad de la distribucin de Poisson es

Donde es un parmetro positivo que representa la frecuencia
esperada del fenmeno modelado por la distribucin.
Tanto el valor esperado como la varianza de una variable aleatoria
con distribucin de Poisson son iguales a . Los momentos de orden
superior son polinomios de Touchard en cuyos coeficientes tienen
una interpretacin combinatoria. De hecho, cuando el valor
esperado de la distribucin de Poisson es 1, entonces segn la
frmula de Dobinski, el n-psimo momento iguala al nmero de
particiones de tamao n.
La moda de una variable aleatoria de distribucin de Poisson con
un no entero es igual a , el mayor de los enteros menores que
(los smbolos representan la funcin parte entera). Cuando es
un entero positivo, las modas son y 1.
La funcin generadora de momentos de la distribucin de Poisson
con valor esperado es

Las variables aleatorias de Poisson tienen la propiedad de ser
infinitamente divisibles.
La divergencia Kullback-Leibler desde una variable aleatoria de
Poisson de parmetro
0
a otra de parmetro es

80



DISTRIBUCION HIPERGEOMETRICA
Una distribucin discreta relacionada con muestreos aleatorios y
sin reemplazo. Supngase que se tiene una poblacin de N elementos
de los cuales, d pertenecen a la categora A y N-d a la B. La
distribucin hipergeomtrica mide la probabilidad de obtener x
elementos de la categora A en una muestra de n elementos de la
poblacin original.
Caractersticas:
a) a) Al realizar un experimento con este tipo de distribucin, se
esperan ms de dos tipos de resultados.
b) b) Las probabilidades asociadas a cada uno de estos resultados
no son constantes.
c) c) Los ensayos o repeticiones del experimento no son
independientes entre s.
d) d) El nmero de repeticiones del experimento n, es constante.
Entonces en este caso se tienen ms de dos tipos de objetos, por
lo que la frmula a utilizar sera:
Donde:
N = x + y + z = total de objetos
a = total de objetos del primer tipo
b = total de objetos del segundo tipo
c = N-a-b = total de objetos del tercer tipo

81

n = objetos seleccionados en la muestra
x = objetos del primer tipo en la muestra
y = objetos del segundo tipo en la muestra
z = n-x-y = objetos del tercer tipo en la muestra

VARIABLES ALEATORIAS CONTINUAS
Dado un experimento aleatorio cualquiera cuyos sucesos elementales
posibles pueden identificarse fcilmente mediante un nmero real,
se denomina Variable Aleatoria, X, al conjunto de estos nmeros.
Tambin se le llama variable de azar o variable estocstica, y
significa cantidad que puede tomar varios valores imprevistos
DISTRIBUCION NORMAL
Su grafica, recibe el nombre de curva normal. Es la curva en forma
de campana. La funcin de densidad de la variable aleatoria normal
x, con media y varianza s
2
, es:
F(x) =



Donde = 3.1416 y e = 2.71828
DISTRIBUCION EXPONENCIAL
La densidad de probabilidad exponencial est dada por:
F(x) =

X = 0
DISTRIBUCION HIPERGEOMETRICA
Una lnea de montaje operada con robots industriales se puede
instalar cajas de engranes en un minuto cada una si es que los
agujeros de los tornillos se han barrenado en forma correcta en
las cajas, y en 10 minutos si es que se debe volver a barrenar.
Hay 20 cajas de engranes, y se supone que 2 tendrn sus agujeros
barrenados en forma incorrecta. Se deben seleccionar 5 cajas de

82

engranes de las 20 disponibles para que las instalen los
siguientes 5 robots en lnea.
a) Calcular la probabilidad de que todas las cajas de engranes
se ajusten adecuadamente.
b) Calcular el valor esperado, la varianza y la desviacin
estndar del tiempo que se necesita para instalar las 5 cajas
de engranes.
Solucin:
a) N = 20 Y el numero de cajas defectuosas
K = 2
P (y=0) =

= 0.55

b) T = 10y + (5 - y) = 9y + 5
10y = (10 min. X caja defectuosa)
E (T) = 9 E (y) + 5 E (T) = 9(0.5) + 5 =
9.5 minutos

V (T) = 9
2
V (y)
V (Y) = 81 (0.355) = 28.755
As el tiempo de instalacin debe ser de 9.5 minutos en promedio
DE = = 5.4 minutos
DISTRIBUCION EXPONENCIAL
La variable aleatoria X del ejemplo de las vidas tiles, tiene
asociada una densidad de probabilidad como sigue:
F(x) =


Calcular la probabilidad de que la vida til de una batera
determinada de este tipo sea menor que 200 o mayor que 400
P(x<200) U P(x>400) = P (x<200) P (x> 400)
P (X<200) =

= -


P(x<200) + P(x>400) = 1- 0.368 + 0.135 = 0.767


83

Unidad 3
Las probabilidades de obtener un resultado A y de obtener un
resultado no A varan en las sucesivas pruebas, dependiendo de los
resultados anteriores.
clases fe mk pq mkfk |mk-x| |mk-x|fk |mk-x|2 |mk-x|2fk
frec
relativa
1 1-23 13 17 13 221
-
21.030927
-
273.40206 442.29992 5749.8990 13.402061
24-38 38 31 51 1178 -7.030927
-
267.17527 49.433946 1878.4899 39.175257
39-43 22 41 73 902 2.969072 65.319587 8.8153895 193.93856 22.680412
44-60 14 52 87 728 13.969072 195.56701 195.13497 2731.889 14.432989
61-71 10 66 97 660 27.969072 279.69072 782.26899 7822.6899 10.309278

97

321 3689 16.845360 -3.41061 1477.9532 18376.907 .9998

x 38.0309278














0
5
10
15
20
25
30
35
40
1 1-23 24-38 39-43 44-60 61-71
fk
fk
13%
39%
23%
15%
10%
0% 0%
fk
1 1-23
24-38
39-43
44-60
61-71

84





Dadas las series estadsticas:
3, 5, 2, 7, 6, 4, 9.
3, 5, 2, 7, 6, 4, 9, 1.
Calcular:
La moda, la mediana y la media.
La desviacin media, la varianza y la desviacin tpica.
Moda
No existe moda porque todas las puntuaciones tienen la misma
frecuencia.
Mediana
2, 3, 4, 5, 6, 7, 9.
Me = 5
Media

Varianza

Desviacin tpica


85

Desviacin media

Una distribucin estadstica viene dada por la siguiente tabla:

[10,
15)
[15,
20)
[20,
25)
[25,
30)
[30,
35)
f
i
3 5 7 4 2
Hallar:
La moda, mediana y media.
El rango, desviacin media y varianza.

x
i
f
i
F
i

x
i

f
i

|x x |
f
i

x
i
2

f
i

[10,
15)
12.5 3 3 37.5 27.857 468.75
[15,
20)
17.5 5 8 87.5 21.429 1537.3
[20,
25)
22.5 7 15 157.5 5 3543.8
[25,
30)
27.5 4 19 110 22.857 3025
[30,
35)
32.5 2 21 65 21.429 2112.5
21 457.5 98.571 10681.25

Moda

Mediana

86


Media

Desviacin media

Varianza

Desviacin tpica


Formulas para construir nmero de intervalos y su longitud en una
tabla de distribucin de frecuencia para datos agrupados
Rango = Dato mayor dato menor
No de intervalo =
Longitud de intervalo = rango / no. De intervalo
Ejercicios:
Escribir la presentacin para datos agrupados para las siguientes
colecciones, construyendo la tabla de distribucin de frecuencias
respectiva, obtener:
a) Rango
b) No. De intervalos
c) Plantear las clases y obtener sus frecuencias
d) Longitud de intervalos
e) Calcular medidas de dispersin (media aritmtica, mediana,
moda)
f) Calcular medidas de dispersin (D.M , Varianza, D.E)

87

g) Obtener sus graficas: Histograma, polgono de frecuencias y
diagrama de pastel.

20 19 95 67 68 46 73 41
36 58 73 83 94 93 89 36
44 73 84 94 63 70 90 23
53 64 30 46 76 61 90 20
36 50 23 73 39 58 83 80
80 48 20 86 44 66 80 27
85 79 40 47 56 73 70 30
90 93 76 39 47 49 71 60
95 40 83 70 30 60 58 73
54 35 60 70 60 68 60 80



Rango 76


No. De
intervalos
8.9442719
1


L de intervalos
8.4970583
1
















datos agrupados

19 35 44 56 63 71 80 89
20 36 46 58 64 73 80 90
20 36 46 58 66 73 80 90
20 36 47 58 67 73 80 90
23 39 47 60 68 73 83 93
23 39 48 60 68 73 83 93
27 40 49 60 70 73 83 94
30 40 50 60 70 76 84 94
30 41 53 60 70 76 85 95

88

30 44 54 61 70 79 86 95

clases fk mk mkfk |mk-x| |mk-x|fk |mk-x|2 |mk-x|2fk
frec
relativa
19 - 27 7 23 161 -38.1375 -266.9625 1454.468906 10181.28234 8.75
28 - 36 7 32 224 -29.1375 -203.9625 848.9939063 5942.957344 8.75
37 - 45 7 41 287 -20.1375 -140.9625 405.5189063 2838.632344 8.75
46 - 54 9 50 450 -11.1375 -100.2375 124.0439063 1116.395156 11.25
55 - 63 10 59 590 -2.1375 -21.375 4.56890625 45.6890625 12.5
64 - 72 11 68 748 6.8625 75.4875 47.09390625 518.0329688 13.75
73 - 81 13 77 1001 15.8625 206.2125 251.6189063 3271.045781 16.25
82 - 90 10 86 860 24.8625 248.625 618.1439063 6181.439063 12.5
91 - 99 6 95 570 33.8625 203.175 1146.668906 6880.013438 7.5
80 531 4891 36975.4875



0
10
20
30
40
50
60
53 - 55 56 - 58 59 - 61 62 - 64 65 - 67 68 - 70 71 - 73
fk
fk

89


2.- supongamos que un investigador desea determinar cmo varan
las estaturas de los obreros de una fbrica tomando muestra 50 de
ellos anotando las estaturas en pulgadas.

datos agrupados
53 60 63 64 67
55 60 63 65 67
56 61 63 65 67
57 61 63 65 68
57 61 63 65 68
58 61 64 65 69
58 62 64 66 69
59 62 64 66 70
59 62 64 66 71
60 62 64 66 72


Rango 19


No. De intervalos
7.
07
10
67
81

L de intervalos
2.
68
70
05
77

2%
5%
9%
15%
12%
5%
2%
50%
fk
53 - 55
56 - 58
59 - 61
62 - 64
65 - 67
68 - 70
71 - 73

90

clases fk mk pq
mkf
k |mk-x|
|mk-
x|fk |mk-x|2
|mk-
x|2fk
53 - 55 2 54 2 108 -9.18 -18.36 84.2724
168.544
8
56 - 58 5 57 7 285 -6.18 -30.9 38.1924 190.962
59 - 61 9 60 16 540 -3.18 -28.62 10.1124 91.0116
62 - 64 15 63 31 945 -0.18 -2.7 0.0324 0.486
65 - 67 12 66 43 792 2.82 33.84 7.9524 95.4288
68 - 70 5 69 48 345 5.82 29.1 33.8724 169.362
71 - 73 2 72 50 144 8.82 17.64 77.7924
155.584
8



0
2
4
6
8
10
12
14
16
53 - 55 56 - 58 59 - 61 62 - 64 65 - 67 68 - 70 71 - 73
fk
fk
4%
10%
18%
30%
24%
10%
4%
fk
53 - 55
56 - 58
59 - 61
62 - 64
65 - 67
68 - 70
71 - 73

91


Li clases Ld fk fa mk mk*fk
Imk-
MediaI*fk
(mk-
media)
2*fk

19.5 19 34 34.5 10 10 26.5 265 344 11833.6

34.5 35 50 50.5 18 28 42.5 765 331.2 6094.08

50.5 51 66 66.5 16 44 58.5 936 38.4 92.16

66.5 67 82 82.5 20 64 74.5 1490 272 3699.2

82.5 83 94 94.5 16 80 88.5 1416 441.6 12188.16

80 290.5 4872 1427.2 33907.2




clase Mediana 40


tamao 15




Media 60.9






Desviacin media 17.84








Mediana 59.5


Varianza

423.84






Moda

74
Desviacin
estndar 20.5873748




1.5-1.7 3 3 6% 1.6 4.8 1.45-1.75 0.72 2.16 0.5184 1.5552
1.8-2.0 12 15 24% 1.9 22.8 1.75-2.05 0.42 5.04 0.1764 2.1168
2.1-2.3 14 29 28% 2.2 30.8 2.05-2.35 0.12 1.68 0.0144 0.2016
2.4-2.6 9 38 18% 2.5 22.5 2.35-2.65 0.18 1.62 0.0324 0.2916
2.7-2.9 7 45 14% 2.8 19.6 2.65-2.95 0.48 3.36 0.2304 1.6128
3.0-3.2 5 50 10% 3.1 15.5 2.95-3.25 0.74 3.9 0.6084 3.042

92








0
10
20
30
40
50
60
1.5-1.7 1.8-2.0 2.1-2.3 2.4-2.6 2.7-2.9 3.0-3.2
1.5-1.7
6%
1.8-2.0
24%
2.1-2.3
28%
2.4-2.6
18%
2.7-2.9
14%
3.0-3.2
10%
0
10
20
30
40
50
60
1.5-1.7 1.8-2.0 2.1-2.3 2.4-2.6 2.7-2.9 3.0-3.2

93


clases Fk Mk MKFk Fa
lMk-
xl
lMk-
xlFk
lMk-
xl^2 Fk Fr Grados
5--8 8 6.5 52 8 7.36 58.88 433.35 0.16 58
9--12 12 10.5 126 20 3.36 40.32 135.47 0.24 86
13-16 15 14.5 217.5 35 0.64 9.6 6.14 0.3 108
17-20 10 18.5 185 45 4.64 46.4 215.29 0.2 72
21-24 5 22.5 112.5 50 8.64 443.2 373.24 0.1 36

50

693

1163.49 198.4

1.- media = 13.86

4.- D.M.= 3.96


2.- mediana = 13.83

5.- varianza= 23.26


3.- moda= 14

6.- desviacin estndar= 4.82




0
2
4
6
8
10
12
14
16
5--8 9--12 13-16 17-20 21-24
5--8
9--12
13-16
17-20
21-24

94

clases Fk Mk MKFk Fa lMk-xl lMk-xlFk
lMk-xl^2
Fk Fr Grados
11--23 13 17 221 13 21.03 273.39 5749.39 0.13 48
24-38 38 31 1178 51 7.03 267.14 1877.99 0.39 141
39-43 22 41 902 73 2.97 65.34 194.05 0.22 82
44-60 14 52 728 87 13.97 195.58 2732.25 0.14 52
61-71 10 66 660 97 27.97 279.7 7823.2 0.1 37

97

3689

1081.15 18376.88

360

5.-
varianza
1.- Media
3689/97=38.03

18376.88/97=
189.45
2.- mediana= 23.5+[(((97/2)-
13)/38)*15] = 37.51
6.- desviacin
estndar

189.45= 13.76
3.-moda

23.5+9.14= 32.16


4.- DM

1081.15/97= 11.14




0
10
20
30
40
11--23 24-38 39-43 44-60 61-71
Series1
11--23
24-38
39-43
44-60
61-71

95

59-61 9 60 540 16 3.18 28.62 91.01 0.18 65
62-64 15 63 945 31 0.18 2.7 0.48 0.3 108
65-67 12 66 792 43 2.82 33.84 95.42 0.24 86
68-70 5 69 345 48 5.82 29.1 169.36 0.1 36
71-73 2 72 144 50 8.82 17.64 155.58 0.04 14

50

3159

161.16 871.35
1) x=
3159/50=63.18


4) D.M= 161.16/50= 3.22
2)
Mediana=50/2=
25
Med= 61.5 +
{(25-16)/31}3=
62.37

Li=61.5

5) Varianza V^2= 871.35/50= 17.42
C=(64.5-
61.5)/2= 3


6) Desviacin estndar= 4.17
3) Moda=15

M=61.5 +
{6/(3 +
6)}3= 63.5

Li=61.15

d1=6

d2=3

Unidad 4
Ejercicios
1.- En una encuesta se les pidi a 250 alumnos de IMEC que
registrasen la cantidad de tiempo promedio diario que emplean en
estudiar. La muestra de una media de 45min. Y una desviacin
estndar de 20min. Para un nivel de confianza de 95%. Determina
los lmites.
a) Datos como n>30 se usa tabla z= 1.96
n= 250
X= 45
=20min
C=95%
b) Calcular la estimacin puntual
X= 45min.
Inferencia.- el tiempo promedio que los estudiantes del IMEC
emplean a diario para estudiar es de 45min.
c) Error estndar

96

=


=1.2649
d) Error de estimacin
e=
e=(1.96)(1.2649)
e= 2.479204
e) Limites
L.S.C.= +e L.I.C.= -e
L.S.C.= 45 + 2.479204 L.I.C.= 45
2.479204
L.S.C= 47.479204 L.I.C.= 42.520796

f) Inferencia.- el tiempo promedio que los alumnos emplean a
diario en estudiar va de 42.52% a 47.47%

2.- La oficina de capacitacin de una empresa desea hacer una
estimacin de la capacidad en la comunicacin verbal en ingles que
tiene 5,500 prestadores de servicios tursticos, una muestra de
250 de estas personas arroja el sig. Datos.
a) Datos
=65 como n>30 se usa tabla z de dos colas= 1.96
s= 15
c=95%
n=250
b) Estimacin puntual
=65min.
La capacidad de comunicacin verbal en ingles que
tiene una empresa prestadora de servicios tursticos es de
65.

c) Error estndar
=


= .948683298

d) Error de estimacin
e=
e=(1.96)(.94863298)

97

e= 1.859320641

e) Limites
L.S.C.= + e
L.S.C.= 65 + 1.859320641
L.S.C.= 66.85932064

L.I.C.= - e
L.I.C.= 65 1.859320641
L.I.C.= 63.14067936

f) Inferencia.-
El promedio de comunicacin verbal en ingles que tiene una
empresa prestadora de servicios tursticos va de 63.14% a
66.85%.


3.- El administrador de un parque desea calcular el tiempo
promedio de recorrido peatonal en dicho parque. Selecciona al azar
de 25 paseantes y encontr lo sig.
=165
s=5min.
c=99%

a) Datos
=160 como n<30 se usa la tabla T-student
=5 r=n-1
=99 r=25-1= 24
=25
b) Estimacin puntual
=160
El tiempo promedio de un recorrido en el parque es
de 160.

c) Error estndar
=


= 1

d) Error de estimacin
e=
e=(1)(2.485)
e= 2.485

e) Limites

98

L.S.C.= + e
L.S.C.= 160 + 2.485
L.S.C.= 162.485


L.I.C.= - e
L.I.C.= 160 2.485
L.I.C.= 157.515

f) Inferencia.-
El tiempo promedio de un recorrido por el parque va de 157 a
162 min.

4.- en una muestra aleatoria de 100 clientes que compran pasta de
dientes en un supermercado 43 de ellos adquieren la marca Colgate
establecer un intervalo de confianza de 95% para la proporcin
real de clientes que adquieren la pasta de dientes antes
mencionado.

Cp= 100
Cf= 43
C= 95%
A=0,1%

B, Estimacin puntual
Inferencia.- la estimacin puntual de la proporcin real de
clientes que compra pasta de dientes Colgate es de 43%

c.- error estndar de la estimacin
Op=


Op=


Op= .049507575

D.- error de la estimacin
E= z.op
E= (1.96) (.0495507575)

e.- LSC= P + e =.43+.097034847 = .527034877
LIC= p +e = .43-.049507575 =.332965153

Inferencia.- el porcentaje de clientes que compran pasta de
dientes Colgate en el supermercado va de 33.29% a 52.53%



99

5.-En una muestra aleatorio de 100 clientes que compran al medio
da en un supermercado 90 de ellos incluyen la leche en sus
compras establece un intervalo de confianza de 95% para la
proporcin real de clientes que compran leche.
N=100
Cf= 90
A= .5%
P=

= .9 = 90%
Q= 1-p = .1= 10%

B) estimacin puntual
P= .9=90%
Inferencia.- la estimacin puntual porcentual es del 90% de
clientes que compran al medio da en un supermercado incluyen
leche.

c) erro estndar de la estimacin
Op=


Op=


Op=.03

d) error de estimacin
e= z. op
e=(1.96)(.03)
e=.05888

e) lmites o intervalos
LSC= p+e= .9 + .0588=.9588
LIC=p-e= .9 - .0588= .8412


Inferencia.- la proporcin real de clientes que incluye leche
compras del medio da va de 84.12 a 95.88%


6.- el coordinador de la carrera de Ing. Mecnica del itm desea
verificar con un nivel de significacin del 5% la hiptesis de que
el promedio de calificaciones en la asignatura probabilidad y
estadstica en un determinado grupo es de 65 una muestra aleatorio
de 25 sujetos dio los sig. Resultados.
X= 67
S=12
N=25
A= 5%

100


b) hiptesis
el promedio de calificaciones es la asignatura de probabilidad y
estadstica es un determinado grupo es de 65.

c) hiptesis estadstico
Ho; N=65
Hi; N=65

D) criterios regiones de aceptacin y rechazo

Hi; N=65(tabla t para 2 colas)
T= 2.064
Error de estimacin
E=Z.Sx
E= (1.96) (.948683298)
E=1.859419264

E) limites
LSC= X+e= 65+1.859419264= 66.85941926
LIC=X-e= 65- 1.859419264=63.14058074



Unidad 5
Ejercicios:

Tiempo de
estudio x
5 6 7 8 9 10 11 12 13 14
Calificacin
y
4 6 5 5 7 6 7 8 6 8

La tabla anterior muestra el nmero de horas a la semana que
emplearon 10 universitarios en el estudio y la calificacin que
obtuvieron en una prueba. Obtener el diagrama de dispersin, la
ecuacin de la recta de prediccin, la grafica de la recta,
estimar la calificacin promedio del estudiante si dedica 10 horas
por semana al estudio. Estimar as mismo cuanto tiempo debera
dedicar al estudio si desea tener una calificacin de 8. Calcula
tambin el valor de la correlacin, la validez externa,

101

coeficiente de determinacin. Interpretar los resultados. Utiliza
=5%
Obtenemos b:



Calculamos a


Obtenemos la ecuacin de prediccin
y=a+bx
y=2.9757+0.3393x
Interpretacin: Como la pendiente es positiva significa que
existe relacin directa entre las 2 variables, a mayor tiempo
dedicado al estudio, mayor ser la calificacin obtenida.












102

Diagrama de Dispersin y grfica de la recta de la ecuacin de
prediccin.

Calculamos
P1(x, y) (5,?)
P2(x, y) (14,?)
Calculamos P1 y P2 para trazar la recta de la ecuacin de
prediccin
P1(x,y) si x=5
y=2.9757+0.3393 (5)

P2(x,y) si x=14
y=2.9757+0.3393 (14)


Estimacin.- Si se dedicara 10 hrs semanales al estudio,
y=2.9757+0.3393 (10)

0
1
2
3
4
5
6
7
8
9
0 5 10 15
Series1

103

Interpretacin: Si se dedica 10 hrs semanales al estudio
probablemente se obtenga 6.37 de calificacin

Estimacin.- Si se quiere obtener 8 de calificacin
8=2.9757+0.3393x


Interpretacin.-Si el estudio quiere obtener 8 de calificacin
deber dedicar 14.79 hrs semanales al estudio
Coeficiente de Correlacin de Pearson
r=0.7805
Interpretacin.- Por su valor numrico es una correlacin fuerte y
por su signo es una correlacin directa.
Diagrama de Correlacin
-1 0 r=0.7805 Correlacin fuerte
Coeficiente de Determinacin
CD=


Interpretacin: La relacin entre el tiempo dedicado al estudio y
la calificacin es del 60.91%
Clculo de Sy
Sy=0.8549
Clculo del error de estimacin
e=Pe*Sy
e=(0.6319)(0.8549)=0.5399
Estimacin por intervalo
LSC=
LIC=

104

Interpretacin: la calificacin promedio va de 5.83 a 6.91

2.- HIPOTESIS DE INVESTIGACIN: Existe correlacin directa entre
las 2 variables; a mayor hrs dedicadas al estudio, mayor
calificacin

3.- HIPTESIS ESTADSTICA:
Ho: r=0 No hay correlacin (Validez interna, los resultados se
generalizan a la muestra)
Hi: r0 S hay correlacin (Validez externa, los resultados se
generalizan a la poblacin)
4.- CRITERIOS Y REGIONES DE ACEPTACION Y DE RECHAZO



Hi Ho Hi
5.- REGLA.-Si el valor de r cae en la regin no sombreada se
acepta Ho y se rechaza Hi, pero si cae en la regin sombreada se
acepta Hi y se rechaza Ho.
6.- ESTADSTICO DE PRUEBA
EP: r=0.7805

7.- RESULTADO.- Como r cay en la regin sombreada se acepta Hi y
se rechaza Ho.

8.-Conclusin.- Existe relacin directa entre las 2 variables, hay
correlacin fuerte, a mayor horas de estudio, mayor calificacin,
tiene validez externa, los resultados se generalizan a la
poblacin.

Vc=-0.6319 c vc=0.6319

EPr=0.7805

105









Verificar si existe correlacin entre los puntajes de la prueba de
razonamiento abstracto y la calificacin de filosofa, estimar
para x=25, y=4, =5%
Razonamiento
Abstracto
x
15 20 30 35 25 40 35 5 12 10
Filosofa
y
1.5 2.5 3 2 3 3.5 4 1 2 2.5

Obtenemos b:


Calculamos a

Obtenemos la ecuacin de prediccin
y=a+bx
y=1.2236+0.056x
Interpretacin: Como la pendiente es positiva significa que
existe relacin directa entre las 2 variables, mientras hay mas
razonamiento abstracto, mayor ser la calificacin en filosofa.

106

Diagrama de Dispersin y grfica de la recta de la ecuacin de
prediccin.

Calculamos
P1(x,y) (5, ?)
P2(x,y) (40, ?)

Calculamos P1 y P2 para trazar la recta de la ecuacin de
prediccin
P1(x,y) si x=5
y=1.2236+0.056(5)

P2(x,y) si x=40
y=1.2236+0.056(40)

Estimacin
Si x=25
y=1.2236+0.056(25)

0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
0 10 20 30 40 50
Series1

107

Interpretacin: Si el puntaje de la prueba es 25, probablemente se
obtenga 2.629 de calificacin
Estimacin.- Si se quiere obtener 4 de calificacin
4=1.2236+0.056x


Interpretacin.-Si el estudio quiere obtener 4 de calificacin
deber tener un razonamiento abstracto de 49.3777
Coeficiente de Correlacin de Pearson
r=0.7448
Interpretacin.- Por su valor numrico es una correlacin fuerte y
por su signo es una correlacin directa.
Diagrama de Correlacin
-1 0 r=0.798 Correlacin fuerte
Coeficiente de Determinacin
CD=


Interpretacin: La relacin entre la prueba de razonamiento
abstracto y la prueba de Filosofa es del 55.477%
Clculo de Sy
Sy=0.6460
Clculo del error de estimacin
e=Pe*Sy
e= (0.6319) (0.6460)=0.40824
Estimacin por intervalo
LSC=
LIC=
Interpretacin: la calificacin de filosofa va de 2.221 a 3.0375

108

2.- HIPOTESIS DE INVESTIGACIN: Existe correlacin directa entre
las 2 variables; a mayor razonamiento abstracto mayor calificacin
3.- HIPTESIS ESTADSTICA:
Ho: r=0 No hay correlacin (Validez interna, los resultados se
generalizan a la muestra)
Hi: r0 S hay correlacin (Validez externa, los resultados se
generalizan a la poblacin)
4.- CRITERIOS Y REGIONES DE ACEPTACION Y DE RECHAZO



Hi Ho Hi
5.- REGLA.-Si el valor de r cae en la regin no sombreada se
acepta Ho y se rechaza Hi, pero si cae en la regin sombreada se
acepta Hi y se rechaza Ho.
6.- ESTADSTICO DE PRUEBA
EP: r=0.7448
7.- RESULTADO.- Como r cay en la regin sombreada se acepta Hi y
se rechaza Ho.
8.-Conclusin.- Existe relacin directa entre las 2 variables, hay
correlacin fuerte, a mayor razonamiento abstracto mayor
calificacin, tiene validez externa, los resultados se generalizan
a la poblacin.
Un fabricante de ropa desea saber la relacin que existe entre las
medidas de la cintura y las caderas de los clientes que utilizan
las prendas que elabora, para lo cual acude al anlisis
estadstico. Tomando una muestra de 7 clientes estimar para x=70,
y=100, =5%
Cintura
X
65 80 70 75 96 85 90

Vc=-0.6319 c vc=0.6319
EPr=0.7448

109

Cadera
Y
90 105 96 100 121 108 116

Obtenemos b:


Calculamos a

Obtenemos la ecuacin de prediccin
y=a+bx
y=26.0965+0.9863x
Interpretacin: Como la pendiente es positiva significa que
existe relacin directa entre las 2 variables, a mayor cintura,
mayor ser la medida de caderas.
Diagrama de Dispersin y grfica de la recta de la ecuacin de
prediccin.

Calculamos
P1(x, y) (65,?)
P2(x, y) (96,?)

0
20
40
60
80
100
120
140
0 20 40 60 80 100 120

110

Calculamos P1 y P2 para trazar la recta de la ecuacin de
prediccin
P1(x, y) si x=65
y=26.0965+0.9863 (65)

P2(x, y) si x=96
y=26.0965+0.9863 (96)

Estimacin
Si x=25
y=26.0965+0.9863 (70)

Interpretacin: Si la medida de la cintura es de 70, probablemente
se obtenga 95.138 de cadera
Estimacin.- Si se quiere obtener 100 de cadera
100=26.0965+0.9863x


Interpretacin.-Si el estudio quiere obtener una cadera de 100
debe tener de cintura 74.9286
Coeficiente de Correlacin de Pearson
r=0.9959
Interpretacin.- Por su valor numrico es una correlacin muy
fuerte y por su signo es una correlacin directa.
Diagrama de Correlacin
-1 0 r=0.9959 Correlacin muy
fuerte
Coeficiente de Determinacin

111

CD=


Interpretacin: La relacin entre las medidas de las cinturas y de
las caderas es del 99.182%

Clculo de Sy
Sy=1.082882
Clculo del error de estimacin
e=Pe*Sy
e= (0.7545) (1.0828)=0.817
Estimacin por intervalo
LSC=
LIC=
Interpretacin: Las medidas de las caderas van de 94.321 a 95.955
2.- HIPOTESIS DE INVESTIGACIN: Existe correlacin directa entre
las 2 variables; a mayor medida de cinturas, mayor cadera.
3.- HIPTESIS ESTADSTICA:
Ho: r=0 No hay correlacin (Validez interna, los resultados se
generalizan a la muestra)
Hi: r0 S hay correlacin (Validez externa, los resultados se
generalizan a la poblacin)
4.- CRITERIOS Y REGIONES DE ACEPTACION Y DE RECHAZO



Hi Ho Hi

Vc=-0.7545 c vc=0.7545
EPr=0.9959

112

5.- REGLA.-Si el valor de r cae en la regin no sombreada se
acepta Ho y se rechaza Hi, pero si cae en la regin sombreada se
acepta Hi y se rechaza Ho.
6.- ESTADSTICO DE PRUEBA
EP: r=0.9959
7.- RESULTADO.- Como r cay en la regin sombreada se acepta Hi y
se rechaza Ho.
8.-Conclusin.- Existe relacin directa entre las 2 variables, hay
correlacin fuerte, a mayor medida de las cinturas mayor medida de
las caderas, tiene validez externa, los resultados se generalizan
a la poblacin.
Los datos siguientes representan la edad de los empleados y los
das de ausentismo al ao, verificar si existe correlacin,
estimar para x=50, y=10, =5%
Edad
x
29 64 58 40 23 61 62 28 27 46 37 25
Ausentismo
y
14 5 7 8 18 6 5 13 15 9 10 15
Obtenemos b:


Calculamos a

Obtenemos la ecuacin de prediccin
y=a+bx
y=21.4642-0.2651x
Interpretacin: Como la pendiente es negativa significa que
existe relacin inversa entre las 2 variables, a mayor edad menor
ausentismo.
Diagrama de Dispersin y grfica de la recta de la ecuacin de
prediccin.

113


Calculamos
P1(x, y) (23,?)
P2(x, y) (64, ?)
Calculamos P1 y P2 para trazar la recta de la ecuacin de
prediccin
P1(x,y) si x=23
y=21.4642-0.2651 (23)

P2(x,y) si x=64
y=21.4642-0.2651 (64)

Estimacin
Si x=50
y=21.4642-0.2651 (50)

Interpretacin: Si la edad es de 50 aos, probablemente haya
ausentismo de 8 das al ao.
Estimacin.- Si se quiere tener un ausentismo de 10 das:
10=21.4642-0.2651x
0
5
10
15
20
0 10 20 30 40 50 60 70
Series1

114


Interpretacin.-Si se quiere tener un ausentismo promedio de 10
das al ao, la edad de los empleados debe ser 43.2451
Coeficiente de Correlacin de Pearson
r=-0.9499
Interpretacin.- Por su valor numrico es una correlacin muy
fuerte y por su signo es una correlacin inversa.
Diagrama de Correlacin
-1 0 1
r=-0.9499 Correlacin muy fuerte
Coeficiente de Determinacin
CD=


Interpretacin: La relacin entre la edad y el ausentismo es del
90.2482%
Clculo de Sy
Sy=1.4544

Clculo del error de estimacin
e=Pe*Sy
e= (0.576) (1.4544)=0.8377
Estimacin por intervalo
LSC=
LIC=
Interpretacin: El ausentismo va de 7.3695 das a 9.045 das
2.- HIPOTESIS DE INVESTIGACIN: Existe correlacin inversa entre
las 2 variables; a mayor edad menor ausentismo.

115

3.- HIPTESIS ESTADSTICA:
Ho: r=0 No hay correlacin (Validez interna, los resultados se
generalizan a la muestra)
Hi: r0 S hay correlacin (Validez externa, los resultados se
generalizan a la poblacin)
4.- CRITERIOS Y REGIONES DE ACEPTACION Y DE RECHAZO



Hi Ho Hi
5.- REGLA.-Si el valor de r cae en la regin no sombreada se
acepta Ho y se rechaza Hi, pero si cae en la regin sombreada se
acepta Hi y se rechaza Ho.
6.- ESTADSTICO DE PRUEBA
EP: r=0.9499
7.- RESULTADO.- Como el valor de r cay en la regin sombreada se
acepta Hi y se rechaza Ho.
8.-Conclusin.- Existe relacin inversa entre las 2 variables, hay
correlacin muy fuerte, a mayor edad menor ausentismo, tiene
validez externa, los resultados se generalizan a la poblacin.



La tabla adjunta muestra el orden en que terminaron los alumnos su
prueba de matemticas y el puntaje que obtenido en la misma. Se
puede concluir con estos datos si los primeros en terminar
obtienen puntajes ms altos? Estimar para x=3, y=70, =5%.
Orden
x
1 2 3 4 5 6 7 8 9 10

Vc=-0.576 c vc=0.576

EPr=0.9499

116

Puntaje
y
95 85 90 85 75 70 75 75 60 65

Obtenemos b:


Calculamos a

Obtenemos la ecuacin de prediccin
y= a+ b x
y=96-3.3636x
Interpretacin: Como la pendiente es negativa significa que
existe relacin inversa entre las 2 variables, quien termina
primeros tiene mayor puntaje.
Diagrama de Dispersin y grfica de la recta de la ecuacin de
prediccin.


Calculamos
P1(x, y) (1, ?)
P2(x, y) (10,?)

0
20
40
60
80
100
0 5 10 15

117

Calculamos P1 y P2 para trazar la recta de la ecuacin de
prediccin
P1(x, y) si x=1
y=96-3.3636x

P2(x, y) si x=10
y=96-3.3636 (10)

Estimacin
Si x=3
y=96-3.3636 (3)

Interpretacin: Si el orden en salir es el 3, probablemente el
puntaje sea de 85.9
Estimacin.- Si se quiere tener un puntaje de 70:
70=96-3.3636x


Interpretacin.-Si se quiere tener un promedio de 70, el orden en
salir debe ser de 7.729
Coeficiente de Correlacin de Pearson
r=-0.9159
Interpretacin.- Por su valor numrico es una correlacin muy
fuerte y por su signo es una correlacin inversa.
Diagrama de Correlacin
-1 0 1
r=-0.9159 Correlacin muy fuerte

118

Coeficiente de Determinacin
CD=


Interpretacin: La relacin entre el orden y el puntaje es del
83.9019%
Clculo de Sy
Sy=4.7314
Clculo del error de estimacin
e=Pe*Sy
e= (0. 6319) (4.7314)=2.9897
Estimacin por intervalo
LSC=
LIC=
Interpretacin: El puntaje est entre 82.9192 y 88.8987
2.- HIPOTESIS DE INVESTIGACIN: Existe correlacin inversa entre
las 2 variables; quien termina primero tiene mayor puntaje.
3.- HIPTESIS ESTADSTICA:
Ho: r=0 No hay correlacin (Validez interna, los resultados se
generalizan a la muestra)
Hi: r0 S hay correlacin (Validez externa, los resultados se
generalizan a la poblacin)
4.- CRITERIOS Y REGIONES DE ACEPTACION Y DE RECHAZO



Hi Ho Hi

Vc=-0.6319 c vc=0.6319

EPr=0.9939

119

5.- REGLA.-Si el valor de r cae en la regin no sombreada se
acepta Ho y se rechaza Hi, pero si cae en la regin sombreada se
acepta Hi y se rechaza Ho.
6.- ESTADSTICO DE PRUEBA
EP: r=0.9939
7.- RESULTADO.- Como el valor de r cay en la regin sombreada se
acepta Hi y se rechaza Ho.
8.-Conclusin.- Existe relacin inversa entre las 2 variables, hay
correlacin muy fuerte, quien termina primero tiene mayor puntaje,
tiene validez externa, los resultados se generalizan a la
poblacin.
ANLISIS DE REGRESIN Y CORRELACIN
Estadstica Correlacional
Objetivo.- El participante aplicar los procedimientos de
regresin lineal o correlacin simple a datos estadsticos para
estimar las tendencias de las variables que intervienen en las
actividades con el rea de estudio y las aplicar para la toma de
decisiones.
Regresin lineal y validez
Relacin Directa.- Si ambas variables (dependiente e
independiente) avanzan en la misma direccin)
Relacin Inversa.- Si ambas variables avanzan en diferentes
direcciones.
No Relacin.- No hay relacin entre ambas variables

m (+) m(-)


Relacin Directa Relacin Inversa

120

Cuando el sea agudo la pendiente es + Cuando el
sea obtuso, la pendiente es -.

Diagrama de correlacin

-1 -0.75 -0.5 -0.10 0 0.10 0.5 0.75
1
Si r nos da:
0: No hay correlacin
.10: Es dbil
.50: Moderada
.75: Fuerte
1: Muy fuerte

FORMULARIO
Ecuacin de la recta de prediccin
y= a+ b x
Donde:
A y b son constantes.
x= variable independiente
y= variable dependiente



Error estndar de la estimacin



121

Error de estimacin
En donde Pe es el coeficiente de Pearson
Intervalo de Prediccin
LSC=
LIC=
En donde es la variable de prediccin
Coeficiente de Correlacin de Pearson


Coeficiente de Determinacin
CD=100 r
Prueba de la Validez:
Ho: r=0 No hay correlacin (Validez interna, los resultados se
generalizan a la muestra)
Hi: r0 S hay correlacin (Validez externa, los resultados se
generalizan a la poblacin)
Valores Crticos:
Se utiliza la tabla de Pearson
v= n-2
Grfica de la Validez


Hi Ho Hi



- Pe c +Pe