Está en la página 1de 56

UNIVERSIDAD NACIONAL AUTNOMA DE MXICO

ESCUELA NACIONAL
COLEGIO DE CIENCIAS Y HUMANIDADES
PLANTEL SUR
ACADEMIA DE MATEMTICAS










GUA PARA PREPARAR EL EXAMEN EXTRAORDINARIO
DE ESTADISTICA Y PROBABILIDAD I









ELABORARON

PROFR. HELIOS BECERRIL MONTES
MTRO. JUAN DE DIOS HERNANDEZ GARZA
MTRA. MARIA DEL ROSARIO JIMENEZ HERNANDEZ
PROFRA. ALICIA LARA ALVAREZ


NOVIEMBRE DE 2005




REVISION
MTRA. MA. DEL ROSARIO JIMENEZ HERNANDEZ
MTRO. JUAN DE DIOS HERNANDEZ GARZA
MARZO DE 2010




2
CONSIDERACIONES IMPORTANTES

Los exmenes extraordinarios son oportunidades que debes aprovechar para aprobar las
asignaturas que, por diversas razones, reprobaste en el curso normal, pero, presentarse a
un examen sin la preparacin suficiente significa un fracaso seguro, es una prdida de
tiempo y un acto irresponsable que puedes evitar.

Para aumentar tu probabilidad de xito en el examen mediante la utilizacin de la gua, es
necesario que:

Sigas al pie de la letra las instrucciones de la gua.
Procura dedicar al estudio de esta gua tiempo diario suficiente y con un tiempo
mnimo de dos meses antes del examen.
Contesta toda la gua y verifica tus respuestas, cuando no hayas contestado
correctamente revisa lo que hiciste y si as no obtienes la respuesta correcta acude a
asesoras con algn profesor.


Programa de Estadstica y Probabilidad I

La Estadstica y la Probabilidad se han vuelto requisito indispensable en la vida cotidiana
para interpretar una gran variedad de informacin en diversos campos de estudio. En su
entorno una persona encuentra reportes financieros, econmicos, mdicos y otros que se
pueden entender y evaluar con una comprensin bsica de estas disciplinas.

El estudio de ambas asignaturas representa una secuencia de conocimientos que se
enriquecen conforme se avanza en su estudio. Su objetivo es el de brindarte conceptos y
procedimientos bsicos que te permitan continuar tu formacin matemtica, adems de
adquirir conocimientos de carcter introductorio y propedutico del estudio de los mtodos
probabilsticos y estadsticos, as como de sus aplicaciones en diversos campos del
conocimiento. Con ello se pretende reforzar el empleo de estrategias, tu capacidad de
solucin de problemas, desarrollo de habilidades y de diversas formas de razonamiento.

Al terminar de contestar esta gua de estudio habrs logrado:

Comprender la naturaleza de los fenmenos aleatorios que se presentan en tu entorno,
para continuar el desarrollo de tu pensamiento matemtico.
Comprender que la Probabilidad y la Estadstica constituyen disciplinas que incluyen
conceptos, tcnicas y mtodos que permiten aproximarse al estudio de los fenmenos
aleatorios a partir del tratamiento de la informacin.
Realizar predicciones e inferencias sustentadas en modelos matemticos, cuyo alcance
trasciende hacia otras reas del conocimiento.
La apropiacin de una visin de la Estadstica y de su aplicacin para describir el
comportamiento de un conjunto de datos en una y dos variables.
Adquirir los elementos, mtodos y tcnicas para estudiar los fenmenos de naturaleza
aleatoria con el fin de comprender sus caractersticas, obtener informacin sobre su
comportamiento y evaluar sus resultados.
3
LOS CONTENIDOS DEL CURSO Y DE LA GUA SON:


UNIDAD

CONTENIDO
Introduccin

1

Estadstica Descriptiva

2

Datos Bivariados

3

Probabilidad

INDICE
Pgina
INTRODUCCION
Visin inicial y utilidad de la Estadstica. 4
Errores en el uso de la Estadstica. 4
Conceptos bsicos. 5

UNIDAD 1. ESTADISTICA DESCRIPTIVA
Variables y su clasificacin 7
Escalas de medicin. 8
Recopilacin de datos. 10
Tablas de distribucin de frecuencias. 10
Descripcin grfica de los datos 12
Descripcin numrica de los datos 16
Medidas de Tendencia Central. 16
Medidas de Dispersin. 26
Medidas de Posicin. 32
Regla Emprica. 36

UNIDAD 2. DATOS BIVARIADOS
Diagrama de Dispersin 37
Correlacin entre dos variable numricas 38
Modelo de Regresin Lineal Simple 38

UNIDAD 3. PROBABILIDAD.
Fenmenos determinsticos y aleatorios 42
Definiciones de Probabilidad 43
Conceptos bsicos 43
Probabilidad de eventos simples 45
Probabilidad de eventos compuestos 46

RESPUESTAS A LOS EJERCICIOS 52
BIBLIOGRAFIA RECOMENDADA 56

4

INTRODUCCION

Propsito.
Al finalizar esta introduccin debes haberte apropiado de una visin inicial de la Estadstica y
de la Probabilidad a partir de los conceptos bsicos y el planteamiento de ejemplos para
apreciar los alcances de esta asignatura.

Visin inicial
Se presenta una visin inicial de la Estadstica y de la Probabilidad, que permite apreciar los
alcances de la materia.

La Estadstica es una ciencia que utiliza tcnicas y conceptos para elaborar principios y
mtodos para construir modelos tericos que permitan describir, analizar e interpretar los
procesos estudiados y en consecuencia tomar decisiones frente a la incertidumbre.

Actualmente la Estadstica se emplea en toda clase de estudios cientficos como un
procedimiento en la toma de decisiones, como por ejemplo:

En medicina:
Cmo prueba un mdico la eficiencia de un nuevo frmaco?
En la industria.
Cmo se determina la calidad de produccin de un artculo especfico?
En sociologa:
De qu modo pronosticar el tamao de la poblacin mundial para el ao 2025?
Cmo inferir el tipo de alimentacin que nutrir a la humanidad para ese mismo ao?
En agricultura:
Qu tipos y en qu dosis los fertilizantes insecticidas aumentan las cosechas?
En medicina social:
Aumenta realmente el tabaquismo las probabilidades del surgimiento del cncer
pulmonar?

Para su estudio, la Estadstica se divide en:

- Estadstica Descriptiva que tiene como objetivo organizar la informacin disponible para
describir el comportamiento de un suceso.
- Estadstica Inferencial que tiene como objetivo interpretar la informacin para sacar
conclusiones acerca de un conjunto grande de personas u objetos, por medio de la
informacin obtenida de slo una pequea parte o muestra del conjunto total.


Errores en el uso de la estadstica.

- Se piensa que los resultados resumidos en la estadstica descriptiva son la pura
verdad y, por ende, hay que apegarse a ellos y que cualquier interpretacin de los
mismos deforma los hechos.
- Se sostiene que las interpretaciones permitidas por los resultados de la estadstica
descriptiva son mltiples y todas igualmente objetivas, pues se basan en los hechos
detectados.
5

Estas percepciones son errneas.

La Estadstica Descriptiva s admite y exige una serie de interpretaciones intuitivas de la
informacin; sin embargo, ninguna de dichas interpretaciones posee el rigor terico y
metodolgico de la Estadstica Inferencial.


Algunos ejemplos son:

En la determinacin de la media de los salarios en una empresa, si se consideran los altos
salarios de los directivos, el promedio salarial estar muy por encima del resultado que se
obtendra si se hubiesen excluido las percepciones del cuerpo directivo.

Al medir las tasas de empleo, desempleo y subempleo, con qu criterios definir a un
empleado, a un desempleado o a un subempleado? Un posible criterio es que est haciendo
algo (obrero, ejecutivo, estilista, etc.) para ganarse la vida. Otro es que tenga X tiempo
mnimo trabajando, o, que tenga o no un ingreso o sueldo regular, etc.

Otro error muy frecuente es tomar una muestra de una poblacin de manera espontnea, sin
un mtodo de muestreo o utilizando criterios personales del investigador (como las muestras
no aleatorias).

Por ejemplo, al estudiar a los estudiantes de la UNAM se puede elegir como muestra al
conjunto de los compaeros del mismo saln, por ser los ms accesibles al investigador y se
obtendran conclusiones sin base- sobre todo el estudiantado.


Conceptos bsicos
Fenmeno.
Es cualquier suceso y se establece que es aleatorio cuando no se puede predecir su
resultado y determinstico en caso de que se pueda predecir.

Poblacin

Una poblacin es la coleccin de todos los individuos son caractersticas comunes.

Muestra
Una muestra es cualquier subconjunto de la coleccin de individuos que constituye la
poblacin. Estadsticamente una muestra es pequea cuando tiene menos de 30 datos y
grande cuando tiene 30 o ms datos.

Variable
Es cualquier caracterstica de inters que tienen todos los individuos de la muestra o de la
poblacin.

6
Algunos ejemplos de variables son:
--A un grupo de investigadores de un hospital le interesa conocer en qu proporciones o
porcentajes se distribuye el tipo de sangre de las personas que habitan en una ciudad. El tipo
de sangre es la variable y tambin lo puede ser la estatura y peso de los recin nacidos en el
hospital.

--La trabajadora social del Hospital Gustavo Baz Prada, del Estado de Mxico, lleva a cabo
un estudio socioeconmico de los pacientes. En cada familiar del paciente entrevistada
reporta entre otras el nivel socioeconmico que puede ser alto (A), medio alto (MA), medio
(M), medio bajo (MB), o bajo (B). Investiga el nmero de hijos por familia, que puede ser
desde cero hasta cualquier nmero entero positivo que corresponda a la magnitud
observada. El nivel acadmico de los integrantes de la familia. El tipo de vivienda donde se
pregunta si es propia o paga renta, el tipo de piso si es de tierra de cemento u otro; el
nmero de cuartos con que cuenta y cuantos se utilizan para dormir. Todas estas
caractersticas son variables.

Estas caractersticas de inters no presentan un solo valor determinado y predecible con
exactitud en cada medicin observada.

Se concluye que una caracterstica de inters que tienen en comn todos los elementos de
un conjunto de individuos de tal manera que al medirla se obtienen valores diferentes e
impredecibles se le llama variable.

Relaciona cada concepto con su respectiva definicin, escribiendo en el parntesis la letra
correspondiente.

( ) Rama de la Estadstica que proporciona las reglas
para obtener conclusiones de las caractersticas de una
poblacin a partir de las de una muestra.

( ) Es un conjunto de individuos con caractersticas
comunes.

( ) Rama de la Estadstica que se ocupa de la
organizacin de la informacin para describir un suceso.

( ) Muestra que contiene 30 o ms datos

( ) Es un fenmeno al cual no se le puede predecir su
estado final.

( ) Es cualquier subconjunto de la poblacin.

( ) Muestra con menos de 30 datos.


A) Poblacin

B) Muestra

C) Fenmeno determinstico

D) Fenmeno aleatorio

E) Muestra grande

F) Estadstica Descriptiva

G) Estadstica Inferencial

H) Muestra pequea


7
UNIDAD 1. ESTADISTICA DESCRIPTIVA

Propsito.
Al finalizar esta unidad debes haber comprendido y aplicado tcnicas para recopilar,
organizar y representar a un conjunto de datos proveniente del planteamiento, discusin y
resolucin de problemas para interpretar y analizar el comportamiento de una variable en
dicho conjunto.

VARIABLES
Las variables constituyen los atributos o caractersticas de inters en una muestra o en una
poblacin. Como estas caractersticas no se mantienen constantes de muestra a muestra o
de poblacin a poblacin, se les llama variables estadsticas o simplemente variables. Las
variables pueden ser numricas (cuantitativas), o categricas (cualitativas).

Clasificacin de las variables.
Las variables se clasifican de acuerdo con el tipo de los valores que pueden asumir cuando
se mide la caracterstica de inters.

Para los ejemplos de variables anteriores, se mencionan algunos valores:

Tipo de sangre posee los niveles: A, B, AB, u O.
La estatura puede ser desde 47 hasta 55 cm. El peso desde 1.5 kg hasta 6.1 kg.
En el nivel socioeconmico consiste de cinco niveles: A, MA, M, MB o B.
El nmero de hijos pueden ser: 0, 1, 2, 3, 4,
El nivel acadmico. Si es en primaria, que grado cursa 1, 2, 3, 4, 5, 6. Secundaria
el grado es 1, 2, 3.

Se observa que los valores que asume cada variable son distintos, algunos nmeros y otros
cierta cualidad.

Variable categrica, nominal o cualitativa,
Es aquella cuyos posibles valores son nicamente categoras o nombres.

Variable escalar, numrica o cuantitativa.
Es la variable cuyos valores posibles son nmeros que describen cantidad.

Variable discreta.
Proviene de un proceso de conteo y se caracteriza por la propiedad de que para dos posibles
valores de ella solamente hay un nmero finito de posibles valores intermedios, es decir, sus
valores son numerables.

Variable continua.
Proviene de un proceso de medicin y tiene la propiedad de que entre dos valores de ella,
cualquier valor intermedio es tambin un valor posible, es decir, sus valores no son
numerables.

Variable aleatoria,
Es aquella cuyo valor no se puede predecir.
8
Variable determinista,
Es aquella cuyo valor se puede predecir.

A continuacin se enuncian ejemplos donde se da la caracterstica, valores que puede
asumir y se define la variable.

Ejemplos:

a) Tipo de sangre que tendr un alumno del CCH.
Los valores posibles son: A, B, AB, u O
Es una variable cualitativa, aleatoria, nominal.

b) Peso de los nios que nacern en un da determinado en el Hospital Escandn
Algunos valores posibles son: 3.200 kg, 3.450 kg, 4 kg.
Es una variable cuantitativa, aleatoria, continua.


Ejercicios: Clasifica cada una de las siguientes variables y determina sus posibles valores o
algunos de ellos.

1. Grado que cursan los alumnos en una escuela primaria.
2. Nmero de hijos que tendr un matrimonio.
3. Nmero de puntos de la cara superior al lanzar un dado legal una vez.
4. Peso atmico de los elementos qumicos.
5. Calificacin obtenida por un estudiante al final del curso de Matemticas I
6. Gnero de los alumnos que cursarn el sexto semestre este ciclo escolar.
7. Nmero de telfono de los alumnos de 16 aos que cursan el 5to. Semestre.
8. Fecha de los prximos 10 eclipses solares visibles en Mxico.
9. Nmero de alumnos a admitir en el bachillerato de la UNAM para el prximo ao lectivo.
10. Edad de los alumnos de 3ro. de una secundaria del municipio de Naucalpan.


Escalas de medicin.

Cuando las variables son numricas, se utilizan, en su medicin, las escalas de intervalo y de
razn. En la escala de intervalo se puede cambiar el origen y la unidad de medida, por
ejemplo en el tiempo (en minutos) que hacen los alumnos de su casa al plantel, el origen
puede ser de 15 minutos y la unidad de medida puede cambiar a unidades de 10 minutos.
Si el objetivo es conocer el nmero de hermanos, se usa la escala de razn (no se puede
cambiar la unidad de medida ni el origen).

Los valores de una variable continua se suelen agrupar en intervalos llamados intervalos de
clase. El punto medio entre los extremos de cada intervalo se llama marca de clase, punto
medio de clase o punto medio del intervalo. Siempre que se agrupe una variable por
intervalos se produce una prdida de la informacin, pues lo que se tiene en cuenta es la
pertenencia o no de cada dato al intervalo y no su valor exacto.

La escala nominal se usa cuando se tienen variables categricas (nominales) como por
ejemplo el tipo de msica preferido o preferencia por algn refresco.
9
La escala ordinal se usa en situaciones donde los valores de la variable, comnmente
categrica (ordinal), se pueden jerarquizar u ordenar, asignando valores como por ejemplo
Excelente, Bueno, Regular o Psimo, pero no se pueden realizar operaciones aritmticas
entre estos valores.

Las variables son la herramienta fundamental de la Estadstica porque dependiendo del tipo
de variable es el anlisis que se realiza con cada una de ellas. Por ejemplo los datos de una
variable numrica se pueden analizar calculando las medidas de tendencia central (media
aritmtica, mediana y moda) y las medidas de dispersin (varianza y desviacin estndar). Si
la variable es categrica ordinal solo se le puede analizar calculando la mediana y la moda;
pero si la variable es nominal el nico valor que se le puede calcular es la moda.


A continuacin se presenta una tabla con las escalas de medicin y sus caractersticas para
las diferentes variables:




Escala de
medicin
Operaciones bsicas Cambios permitidos Ejemplos de
variables
Valores
Nominal Determinacin de igualdad
o pertenencia a una
categora
cambios en los
nombres de las
caregoras
Sexo

Religin
M, F

C, P, A
Ordinal Dterminacin del grado de
intensidad
Cambios que
mantengan las
relaciones de orden
Calificacin NA, S, B, MB
Intervalo Determinacin de igualdad
de intervalos o diferencias
Se puede cambiar la
unidad de medida y
el origen
Temperatura Nmeros enteros y
fraccionarios
Razn Determinacin de igualdad
de razones o proporciones
Se puede cambiar la
unidad de medida
pero no el origen
Porcentajes Numero enteros y
fraccionarios
Absoluta Determinacin del nmero
de elementos o conteo de
unidades
No se puede cambiar
la unidad de medida
ni el origen
Nmero de
hijos
Enteros







10
RECOPILACION DE DATOS

Ejercicio: Completa la siguiente tabla preguntado a 20 de tus compaeros la informacin
necesaria:

No. No de Cuenta Estatura No. de hermanos Peso Aos cumplidos
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20




TABLAS DE DISTRIBUCIN DE FRECUENCIAS

Cuando se est tratando con una gran cantidad de datos es conveniente agruparlos en
intervalos, para lo cual es necesario considerarlos ordenados dentro de ese intervalo de
acuerdo a su frecuencia que corresponde al nmero de veces que los datos considerados se
repiten.

- Los intervalos o clases deben ser del mismo tamao o amplitud.
- Los intervalos deben construirse de manera que no haya datos que pertenezcan a dos
intervalos diferentes, es decir, los intervalos deben ser ajenos y no traslaparse.
- Los lmites de clase que corresponden, el inferior al menor valor de la variable en cada
intervalo y el superior al mayor valor de la variable en el intervalo.
- Lmites reales de clase que se localizan en medio del lmite superior de un intervalo y del
lmite inferior del siguiente.

Adems es necesario determinar algunos valores que servirn para analizar y representar al
conjunto de datos agrupados en intervalos, tales como:

11
- Marca de clase o punto medio del intervalo.. Es el valor representativo de cada intervalo y
corresponde al valor de la variable situado exactamente en el centro de cada uno de ellos.
- Frecuencia relativa. Es la medida proporcional de las frecuencia para cada intervalo y que se
obtiene dividiendo cada valor de frecuencia entre la suma total de ellas.

- Frecuencia acumulada. Es para cualquier intervalo el resultado de sumar su frecuencia con
las frecuencias de los intervalos que le preceden.

- Frecuencia relativa acumulada. Es la frecuencia relativa de cada intervalo sumada con la
frecuencia relativa de los intervalos que le preceden.

- Tamao o amplitud de intervalo. Es el tamao que corresponde a cada intervalo y que se
obtiene como la diferencia del lmite real superior menos el lmite real inferior de cada
intervalo.


Ejemplo. Se tiene que el siguiente conjunto de datos corresponde a la edad (en aos) de los
habitantes de una colonia de la delegacin de Tlalpan, que asisten a la escuela (a partir de la
primaria).


Edad Nmero de Marca de Lmites reales Frecuencia Frecuencia
(aos) habitantes clase de clase relativa acumulada
Intervalo
i
f


i
x LRI LRS fr fa
7 a 10 5 8.5 6.5 10.5 0.05 5
11 a 14 11 12.5 10.5 14.5 0.11 16
15 a 18 23 16.5 14.5 18.5 0.23 39
19 a 22 31 20.5 18.5 22.5 0.31 70
23 a 26 16 24.5 22.5 26.5 0.16 86
27 a 30 10 28.5 26.5 30.5 0.1 96
31 a 34 4 32.5 30.5 34.5 0.04 100




Ejercicio. Los siguientes datos muestran el nmero de vuelos internacionales recibidos en el
aeropuerto de la ciudad de Mxico durante los ltimos meses de enero y febrero, construye una
tabla de frecuencias con intervalos de tamao 9 considerando el dato menor como el lmite
inferior del primer.


71 47 66 67 73 38 63 67 29 54 62 70
63 37 68 50 59 60 45 48 52 49 48 56
70 62 61 65 62 45 62 56 63 39 36 43
49 50 39 41 57 49 73 47 38 61 48 31
55 57 72 53 42 70 56 58 39 60 53 36


12
Intervalo Frecuencia Marca de
clase
Lmites reales
de clase
Frecuencia
relativa
Frecuencia
acumulada











DESCRIPCION GRAFICA DE LOS DATOS

Las grficas (o grficos) son muy utilizados en la prensa, en la televisin y en los libros para
presentar los datos de una forma ms vistosa. Adems, tambin se consigue que, de un solo
vistazo, podamos darnos cuenta de los detalles fundamentales.

En ocasiones, cuando se nos habla de una persona o lugar, que no conocemos, preferimos
que nos muestren una fotografa adems de las caractersticas que nos puedan platicar. As
pues, resulta conveniente, adems de tabular un conjunto de datos, proveer una imagen
grfica que sea explicativa por si sola. Cuando los datos son cualitativos resultan adecuadas
las grficas de barras o circulares. Si los datos son cuantitativos, pueden ser adecuadas el
polgono de frecuencias o los histogramas de frecuencias. Un histograma de frecuencias es
la grfica ms comn para representar datos cuantitativos. Esta grfica muestra como es la
distribucin en cuanto a la forma de los datos (simtrica, asimtrica, bimodal,
concentraciones o huecos en los datos, etc.). Cuando el histograma se basa en datos
provenientes de una muestra, la grfica solamente describe el comportamiento de los datos
en la muestra, pero podra sugerirnos que la poblacin tiene una forma similar, sin embargo
no se puede afirmar que la poblacin tenga la misma forma (no se pueden hacer inferencias).
Por lo tanto, el histograma es una tcnica solamente descriptiva.

Caractersticas de los grficos.

Las principales caractersticas que debe reunir un grfico, son:

a) Debe ajustarse a la realidad de los datos que representa.
b) Ha de ser claro y fcil de leer y entender.
c) Debe de llevar el ttulo y todas las indicaciones necesarias para una correcta
interpretacin.

Los grficos pueden ser simples, si representan directamente las frecuencias absolutas o
las frecuencias relativas.

Los grficos son acumulativos si representan los valores de las frecuencias acumuladas.

13
Existen diferentes maneras de representar grficamente a un conjunto de datos, las cuales
presentan en forma visual el patrn de comportamiento de la variable de inters, dentro de
stas, estn las grficas de barras y circulares o de pastel las cuales sirven para representar
a menudo datos cualitativos o de atributo.

a) Grfico de barras. Es la representacin cuyas caractersticas convencionales son:

De manera general, la variable independiente se acostumbra localizar sobre el eje
horizontal, aunque tambin se puede localizar en el vertical.
Las barras son rectngulos cuyo ancho se elige arbitrariamente, pero debe ser el
mismo para todas las barras.
Los rectngulos deben construirse separados y la separacin debe ser la misma.
Las bases de los rectngulos deben estar centrados sobre los valores de la
variable, aunque tambin, stos pueden escribirse dentro del rectngulo.
Para considerarse completa la grfica debe tener Ttulo, Nombre de las variables
que se representan, la escala utilizada y las unidades de las variables.


Ejercicio. Construye la grfica de barras para los siguientes datos que corresponden al
nmero de pacientes atendidos de diferentes enfermedades, en una clnica del ISSSTE
durante el mes de febrero pasado.

Enfermedad No. de pacientes

Tos 34
Gripa 112
Fractura 19
Diabetes 64
Males cardiacos 43
Alta presin 31
Dolores estomacales 74


b) Grfico circular. Es la representacin cuyas caractersticas convencionales son:
De manera general, se determina la proporcin de cada valor de la variable
independiente.
Se hace la equivalencia de la proporcin de la variable independiente a una medida
angular.
Se traza en el crculo un radio cualquiera y a partir de l se van midiendo las
respectivas aberturas angulares.
Para considerarse completa la grfica debe tener Ttulo, sobre cada sector circular el
valor de la variable independiente y en ocasiones su correspondiente valor de variable
dependiente con sus unidades.


Ejercicio. Construye la grfica circular para los siguientes datos que corresponden al
nmero de pacientes atendidos de diferentes enfermedades, en una clnica del ISSSTE
durante el mes de febrero pasado.
14
Enfermedad No. de pacientes

Tos 34
Gripa 112
Fractura 19
Diabetes 64
Males cardiacos 43
Alta presin 31
Dolores estomacales 74


Para una distribucin de frecuencias se tienen diferentes representaciones grficas, tales
como:

Histograma de frecuencias. Es la representacin grfica de un conjunto agrupado de
datos que consiste en un grfico de barras o rectgulos cuya altura corresponde a la
frecuencia de cada intervalo localizada sobre el eje vertical y cuya anchura
correspondiente a un intervalo de los valores de la variable representadas por los lmites
reales de clase. Para considerarlo completo es necesario que tenga un ttulo que
identifica a la variable de inters.


Ejercicio. Construye el histograma de frecuencias de los datos que corresponden a las
edades los habitantes de Tlalpan.


Edad Nmero de Marca de
(aos) habitantes clase
Intervalo
i
f


i
x
7 a 10 5 8.5
11 a 14 11 12.5
15 a 18 23 16.5
19 a 22 31 20.5
23 a 26 16 24.5
27 a 30 10 28.5
31 a 34 4 32.5


Polgono de frecuencias. Es la representacin grfica de un conjunto agrupado de datos
que consiste en una grfica de lineas trazado sobre un sistema de ejes y cuyos vrtices
tienen como coordenadas los valores de la variable representados por las marcas de clase
como abscisas y las frecuencias correspondientes como ordenadas y para que sea un
polgono se debe cerrar sobre el eje horizontal en dos puntos que corresponden a las marcas
de clase de dos intervalos, uno anterior y el otro posterior a primero y al ltimo intervalo, cuya
frecuencia es cero.

Para considerarlo completo es necesario que tenga un ttulo que identifica a la variable de
inters.
15

Ejercicio. Construye el polgono de frecuencias de los datos que corresponden a las
edades los habitantes de Tlalpan.

Edad Nmero de Marca de
(aos) habitantes clase
Intervalo
i
f


i
x
7 a 10 5 8.5
11 a 14 11 12.5
15 a 18 23 16.5
19 a 22 31 20.5
23 a 26 16 24.5
27 a 30 10 28.5
31 a 34 4 32.5


Ojiva. Es la representacin grfica de un conjunto de datos agrupados que consiste en un
grfico de lneas donde los vrtices tienen como abscisa los valores de la variable
representados por los lmites reales superiores y como ordenada la frecuencia relativa o
frecuencia relativa acumulada (ojiva porcentual).

La ojiva puede ser creciente o menos que o decreciente o o ms, pero generalmente a
menos que se indique lo contrario, cuando se solicita construir una ojiva, ser la menor que
solo de la cual nos ocuparemos en esta gua y que se inicia con una frecuencia acumulada
igual a cero que corresponde al lmite real inferior del primer intervalo y consecuentemente
al lmite real superior de un intervalo precedente con frecuencia 0.


Ejercicio. Construye la ojiva de los datos que corresponden a las edades los habitantes de
Tlalpan.

Edad Nmero de Lmites reales Frecuencia
(aos) habitantes de clase acumulada
Intervalo
i
f



LRS fa
6.5 0
7 a 10 5 10.5 5
11 a 14 11 14.5 16
15 a 18 23 18.5 39
19 a 22 31 22.5 70
23 a 26 16 26.5 86
27 a 30 10 30.5 96
31 a 34 4 34.5 100






16

DESCRIPCION NUMRICA DE LOS DATOS

Las medidas numricas descriptivas, resumen la informacin de un conjunto de datos.

En una poblacin, los parmetros ms importantes son los que ubican el centro de la
distribucin y los que describen la dispersin de los datos. A estos se les llama
respectivamente, Medidas de Tendencia Central y Medidas de Dispersin o Variabilidad, por
tal motivo resulta necesario, en primera instancia, calcular estos tipos de medidas a los datos
de la muestra y, en segundo lugar, cuando se pretende hacer inferencias sobre los
parmetros de la poblacin, estas medidas muestrales sern los estimadores para tal efecto.


MEDIDAS DE CENTRALIZACIN O DE TENDENCIA CENTRAL

Las medidas de centralizacin o de tendencia central ms comunes son: la media aritmtica
(o simplemente media), la mediana y la moda. Estas medidas sirven para localizar el centro
de una distribucin de datos, es decir, ubican el valor alrededor del cual se encuentra un
conjunto de datos. Aunque tienen un mismo propsito, estas medidas, de manera general,
tendrn un valor diferente (slo en algunos casos muy particulares, se da que la media, la
mediana, y la moda sean iguales, o que dos de ellas coincidan).

Si los datos que se tienen fueran de una poblacin, la medidas de centralizacin se calculan
de la misma manera que en la muestra, solamente es necesario tener presente si se habla
de un parmetro o de un estimador, segn sea el caso.


Propiedades de las medidas de centralizacin

A continuacin se proporcionan las propiedades ms importantes:.

Propiedades numricas.

1. La media de un conjunto de datos es siempre un valor perteneciente al rango de la
variable. En cualquier caso (por rara que sea la distribucin de los datos, simtrica o
asimtrica, por ejemplo), tanto la media como la mediana y la moda, se encuentran
entre los valores mximo y mnimo de los valores observados.

2. La media puede no coincidir con ninguno de los valores de los datos. Es decir, puede
ser un nmero que no tenga sentido en el contexto propuesto, por ejemplo, si el
nmero de hermanos para 5 personas es 1, 4, 3, 0 y 5, el promedio es 2.6 hermanos.

3. En el clculo de la media intervienen todos los valores de la variable.

4. La media se ve afectada por cualquier cambio extremo en los valores de los datos. Si
en el ejemplo anterior existiera una persona con 13 hermanos (en vez de 5), este valor
extremo modifica la media de 2.6 a 4.2 hermanos.


17

Propiedades algebraicas
.
1. La media conserva el cambio de origen y escala: si el promedio de calificacin de un
alumno, es por ejemplo, 8.75 en la escala de 1 a 10, en la escala de 1 a 100, el
promedio es 87.5

2. La media de la suma de dos o ms variables es la suma de las medias (en el caso de
la mediana y la moda, esta propiedad no se cumple).

3. La media no est definida para datos ordinales o nominales (la media no tiene sentido
si la variable es categrica o cualitativa).

4. La media, la mediana y la moda, consideradas como operacin, no tienen ningn
elemento neutro, ni la propiedad asociativa.


Propiedades estadsticas.

1. La media es un valor representativo de un conjunto de datos. La media es menos
resistente (se ve afectada por cualquier cambio en los datos) que la mediana y la
moda.

2. La media coincide con el centro de gravedad del conjunto de datos.

3. La suma de las desviaciones de un conjunto de datos con respecto a la media es cero.

4. En distribuciones simtricas, la media, la mediana y la moda coinciden.

5. Es respecto a la media cuando la suma de los cuadrados de las desviaciones es
mnima.

La forma de la distribucin de los datos es una caracterstica importante para elegir
una medida de tendencia central adecuada.

Si la distribucin de los valores de la variable es aproximadamente simtrica, la media,
la mediana son casi iguales.

Por ejemplo si se define la variable X: nmero de personas atendidas durante 30 das en una
oficina:



No. de
personas
10 15 20 25 30
No. de das 5 7 8 6 4
18
8
7
6
5
4
3
2
1
0
N
O
.

D
E

D
I
A
S
10 15 20 25 30
NO. DE PERSONAS
Series 1



La media y la mediana son casi iguales y cualquiera de ellas describe adecuadamente a los
datos.

Cuando la distribucin de valores de la variable es asimtrica, la mediana es
frecuentemente la medida de centralizacin ms adecuada.
A la mediana no le afecta tanto la frecuencia de ocurrencia de un slo valor como a la
moda, tampoco es afectada por los valores extremos como la media.

Si en el ejemplo anterior, la distribucin de las personas por da fuera: 3, 5, 6, 7, 9 la
frecuencia ms alta (9) asociada al valor (30) modifica a la media, sin embargo la mediana
no cambia. Por esta razn la mediana sera la medida ms adecuada.

9
8
7
6
5
4
3
2
1
0
N
O
.

D
E

D
I
A
S
10 15 20 25 30
NO. DE PERSONAS
Series 1



La media es el nico promedio que utiliza todos los datos. Esto es una desventaja si
existen valores que son muy distintos de la mayora de ellos. En tales casos resulta
conveniente calcular la mediana. En situaciones apremiantes la moda puede dar una
idea aproximada del valor central de una serie de datos.




19
Actividades de exploracin

1. Se han seleccionado 5 bolsas de pasta alimenticia, de una determinada marca, en un
supermercado. Todas ellas llevan impreso en la etiqueta Peso neto: 250 gramos,
despus de pesarlas con precisin, se obtienen los siguientes resultados (en gramos):
243, 252, 260, 230 y 249.

a) Cunto pesan en total las 5 bolsas?

b) Si se tuviera que repartir de manera equitativa, este peso entre 5 personas, cunto
les corresponde a cada una?

c) Qu peso podemos esperar que tenga una bolsa cualquiera de pasta alimenticia
de esta marca?

Medidas de centralizacin para datos no agrupados:

Se dice que los datos no agrupados son aquellos que por ser generalmente pocos no es
necesario agruparlos en intervalos de clase y que se analizan utilizando los valores brutos,
es decir los valores que se obtienen directamente de la recoleccin.
Para que tengas un mejor entendimiento del clculo de las medidas de centralizacin para
datos no agrupados, utilizaremos el siguiente:

Ejemplo: Se sabe que la estatura de 10 alumnos de quinto semestre del CCH son
respectivamente 1.53m, 1.64m, 1.76m, 1.52m, 1.70m, 1.58m, 1.78m, 1.58m, 1.57m y 1.69m

La media aritmtica es simplemente el promedio y se obtiene como la suma de todos los
datos entre el nmero total de ellos, es decir, mediante:

1
n
i
i
x
x
n
=
=


As, para el ejemplo:


1.53 1.64 1.76 1.52 1.70 1.58 1.78 1.58 1.57 1.69 16.35
1.635
10 10
x m
+ + + + + + + + +
= = =

La mediana es el valor central del conjunto ordenado de datos, se obtiene ordenando los
datos generalmente en forma ascendente o puede ser en forma descendente, luego:

a) Si el nmero de datos es impar la mediana es el valor de la variable que se encuentra en
el
1
2
avo
n + | |
|
\
lugar del conjunto ordenado de datos.

b) Si el nmero de datos es par la mediana es el promedio de los valores de la variable que
se encuentran en el
2
avo
n | |
|
\
y 1
2
avo
n | |
+
|
\
lugares del conjunto ordenado de datos.
20
As, para el ejemplo:

1) Primero se ordenan los datos, quedando:

1.52, 1.53, 1.57, 1.58, 1.58, 1.64, 1.69, 1.70,1.76 y 1.78

2) Como el nmero de datos es par (10 datos), la mediana es el promedio de los valores
que se encuentran en el
10
5
2
avo
to
| |
=
|
\
y
10
1 6
2
avo
to
| |
+ =
|
\
lugares, es decir.

1.58 1.64
1.61
2
Me m
+
= =
La moda es el valor o valores de la variable que ms veces se repiten, por lo que podemos
considerar:
a) puede existir una moda (unimodal)
b) puede existir ms de una moda (polimodal)
c) puede no existir moda
As, para el ejemplo de las estaturas de los 10 alumnos:
Existe un valor que se repite dos veces, este valor es el que corresponde a la moda, o sea:

1.58 Mo m =

Medidas de centralizacin para datos agrupados:

Se dice que los datos agrupados son aquellos que se agrupan en intervalos de clase y que
se analizan considerando a la marca de clase como el valor que corresponde a todos los
datos del intervalo, es decir, el anlisis ya no se realiza con los datos brutos.

Para que tengas un mejor entendimiento del clculo de las medidas de centralizacin para
datos agrupados, utilizaremos el siguiente:

Ejemplo. Se tiene que el siguiente conjunto de datos corresponde a la edad (en aos) de los
habitantes de una colonia de la delegacin de Tlalpan, que asisten a la escuela (a partir de la
primaria).
Edad Nmero de
(aos) habitantes

i
f
7 a 10 5
11 a 14 11
15 a 18 23
19 a 22 31
23 a 26 16
27 a 30 10
31 a 34 ___4___
100
i
n f = =




21
Inicialmente, se obtienen las columnas correspondientes a las marcas de clase (
i
x ), lmites
reales de clase ( LRI y LRS ), frecuencias acumuladas ( fa ) y las necesarias (
i i
f x ) para el
clculo de la media aritmtica.


i
x LRI LRS fa
i i
f x
8.5 6.5 10.5 5 42.5
12.5 10.5 14.5 16 137.5
16.5 14.5 18.5 39 379.5
20.5 18.5 22.5 70 635.5
24.5 22.5 26.5 86 392.0
28.5 26.5 30.5 96 285.0
32.5 30.5 34.5 100 _130.0_
2002
i i
f x =


La media aritmtica se obtiene con
1
1
n
i
i
f x
x
n
=
=


Donde:
i
f es la frecuencia i-sima.

i
x es la marca de clase i-sima.
n es el nmero total de datos.
Se tiene que:
2002
20.02
100
x aos = =

La mediana se obtiene con
2
I
i
n
fa
Me L c
f

= +
Donde:
I
L es el lmite real inferior de la clase mediana.
n es el nmero total de datos.
fa es la frecuencia acumulada anterior a la de la clase mediana.

i
f es la frecuencia absoluta de la clase mediana.
c es el tamao o amplitud de la clase mediana ( c LRS LRI = )

La clase mediana es el intervalo de clase donde se encuentra el
2
avo
n | |
|
\
dato, siendo en este
caso el intervalo de clase donde est el
100
50
2
avo
avo
| |
=
|
\
dato, es decir, el cuarto intervalo,
donde 22.5 18.5 4 c aos = = , as la mediana es:

100
39
2
18.5 4 18.5 1.4193 19.9193
31
Me aos

= + = + =

La moda se obtiene con
1
1 2
I
Mo L c

= +
+

22
Donde:
I
L es el lmite real inferior de la clase modal.

1
es la diferencia de frecuencias de la clase modal y la anterior.

2
es la diferencia de frecuencias de la clase modal y la siguiente.
c es el tamao o amplitud de la clase modal. c LRS LRI =

La clase modal es el (los) intervalo(s) de clase de mayor frecuencia, siendo en este caso el
cuarto intervalo, de donde se obtiene que
1
31 23 8 = = y
2
31 16 15 = = y como
22.5 18.5 4 c aos = = , as la moda es:

8
18.5 4 18.5 1.3913 19.8913
8 15
Mo aos = + = + =
+



Si los datos que se tienen fueran de una poblacin, la medidas de centralizacin se calculan
de la misma manera que en la muestra, solamente es necesario tener presente si se habla
de un parmetro o de un estimador, segn sea el caso.


Ejercicios

1. Calcula la media, la mediana y la moda de los nmeros 1, 2, 3, 4 y 18.

2. Elimina el dato mayor 18 y calcula la media, la mediana y la moda de los nmeros 1,
2, 3 y 4.

3. Compara las medidas obtenidas en los ejercicios anteriores, qu observas?

4. Qu le ocurre a la media de los nmeros 1,2,3,y 4, si se agregan los nmeros 20 y
24 y se calcula el promedio de estos seis nmeros?

5. Si se tienen n datos x
1
, x
2
,,,,,x
n
muy cercanos entre si, y se calcula su media,qu
ocurre cuando se agrega un dato (o datos) x
n+1
,

x
n+2
que estn muy alejados de los
anteriores y se calcula nuevamente la media?

6. En una familia se calcula el peso promedio de los nios que asisten a la escuela
primaria y se obtiene 30 = x kg. Si se incluye el peso de los padres, qu ocurre si se
calcula nuevamente el promedio?

7. Si tenemos los nmeros 3, 6, 9, 12 y 15, cuya media es 9, su mediana es tambin 9 y
no tiene moda. Si aadimos como sexto valor el cero, cules son la media, la
mediana y la moda de estos 6 nmeros?

8. Se desea encontrar un valor representativo de las edades (en aos) de 5 personas:
15, 15, 16, 17, 18, cul de los dos procedimientos siguientes es el correcto?

a)
4
18 17 16 ) 15 15 ( + + + +

b)
5
18 17 16 15 15 + + + +


23
9. En una fbrica trabajan 15 obreros, 8 especializados y 7 no especializados; el salario
medio mensual de los especialistas es de $4000 y el salario promedio por mes de
los no especialistas es de $3500. Para encontrar la media mensual de los salarios de
los 15 obreros, se proponen a continuacin dos procedimientos, cul es el correcto?

a)
8 4000 7 3500
8 7
+
+

b)
2
3500 4000 +


10. En la siguiente tabla calcula el valor de x de manera que x = 5

Valores de X 1 x 5 7
Frecuencia (f) 2 5 3 4

11. Una tienda de autoservicio vendi el mes pasado 4 marcas de T.V, como se muestra
en la siguiente tabla


a) Observa que la variable no es numrica cmo se le llama a este tipo de variables?

b) Si el gerente decide eliminar tres marcas , con cul se quedara?


12. Los datos siguientes corresponden a la altura (en cms) de 40 plantas de una
especie comn
.

a) En cul intervalo se encuentra el valor ms frecuente?

b) Cul es el valor que se encuentra a la mitad de la distribucin de las alturas de las
plantas?

13. En una maestra solamente pueden ingresar aspirantes que obtengan calificaciones
superiores a la mediana en el examen de conocimientos. Este ao se presentaron 12
Marca del T.V. Sony Toshiba LG Panasonic
Televisores vendidos 7 10 5 3
Altura
(cm)
Nmero de plantas
10,16 [ )

7
16,22 [ )

8
22,28 [ )

12
28, 34 [ )

7
34, 40 [ ]

6
24
aspirantes que obtuvieron los siguientes puntajes: 7.5, 9.5, 7.5, 9.7, 7.8, 9.2, 8,
9.2, 8.1, 9, 8.2, 8.8, cules son los puntajes de los aspirantes aceptados?

14. Las calificaciones obtenidas por un estudiante en 7 asignaturas son: S, S, MB, B, S,
B, MB.

a) Cul es el valor de la moda?

b) Cul es el valor de la mediana?

c) Cul de las dos calificaciones anteriores es ms representativa?

15. Un sindicato y una empresa sostienen un debate respecto a los salarios de los
trabajadores. El sindicato reporta que los obreros reciben en promedio $ 4000 por
mes. El gerente dice que el pago promedio es de $ 8364 mensuales. Un inspector
de impuestos afirma que es de $ 7000 por mes. Quin tiene la razn?


a) Calcula el salario medio ( x).

b) Calcula el salario mediano ( Me).

c) Calcula el salario modal (Mo).

d) Cmo interpretas cada una de las medidas anteriores?

16. Para los siguientes datos que corresponden al gasto en pasajes por semana de una
muestra de alumnos de la escuela, calcula las medidas de centralizacin.

Gasto Nmero de
(Pesos) alumnos
2.50 a 4.00 7
4.50 a 6.00 10
6.50 a 8.00 24
8.50 a 10.00 25
10.50 a 12.00 8
12.50 a 14.00 4
14.50 a 16.00 2

17. Para los siguientes datos que corresponden a la estatura en centmetros de un grupo
Salarios mensuales Nmero de empleados
$ 3000 a $ 5000 5
$ 6000 a $ 8000 1
$ 9000 a $ 11000 0
$ 12000 a $ 14000 5
25
de alumnos de secundaria de la delegacin Coyoacn, calcula las medidas de
centralizacin.

Estatura Nmero de
(centmetros) alumnos
142 - 144 5
144 - 146 9
146 - 148 14
148 - 150 25
150 - 152 28
152 - 154 17
154 - 156 12
156 - 158 10

18. Un comerciante mezcla 12 kgs. de cacahuates que valen $ 20.00 el kg, con 8 kgs. de
nueces que valen $ 80.00 el kg. A qu precio debe dar el kg. de la mezcla, para ganar
$5.00 por kg?

19. Hay 10 personas en un ascensor, 4 mujeres, 4 hombres y 2 nios. El peso medio de las
mujeres es de 60 kgs, el peso medio de los hombres es de 80 kgs. y el peso medio de
los nios es de 35 kgs, cul es el peso medio de las 10 personas en el ascensor?

20. Cada estudiante de un grupo de 20 estudiantes pesa 86 kgs. en promedio. Se sabe que
9 personas del grupo pesan en promedio 75 kgs. cada una. Del grupo de los 11
estudiantes restantes, cunto pesa en promedio cada uno?

21. De los 200 alumnos que presentaron un examen de 12 reactivos, el 10% responde
correctamente a 3 reactivos, el 50% a 7 reactivos, el 30% responde correctamente a 10
reactivos y el resto al total de reactivos del examen. Organiza los datos en una tabla de
distribucin de frecuencias y calcula el nmero promedio de reactivos resueltos
correctamente.

22. La tabla siguiente corresponde a una muestra de los dimetros (en centmetros) del tallo
de 28 plantas de una especie comn:

Dimetro(cm) 1 2 3 4 5 6 7
No. de plantas 1 4 6 8 5 3 1

Es correcto el siguiente procedimiento para calcular la media del dimetro de los
tallos?
1
28
28
1 3 5 8 6 4 1
7 6 5 4 3 2 1
= =
+ + + + + + +
+ + + + + +
= x cm.
Si el procedimiento no es correcto, cul es el valor correcto de la media?





26
MEDIDAS DE DISPERSIN O VARIABILIDAD

El anlisis descriptivo de los datos no puede restringirse exclusivamente al clculo de las
medidas de tendencia central porque, por ejemplo, dos distribuciones de frecuencias con
igual media o con igual mediana pueden tener diferentes grficas, es decir, si solamente se
consideran las medidas de tendencia central, se pueden obtener conclusiones errneas al no
tomar en cuenta la dispersin de los datos.

Por ejemplo Roberto y Esperanza forman una pareja con una estatura media de 1.70 m y
Ana y Luis tambin son pareja con una estatura promedio de 1.70 m. Si solamente
conocemos esta medida de centralizacin, nos inclinaramos a pensar que los 4 tienen una
estatura muy parecida. Sin embargo si aparte del promedio nos dicen que la desviacin
media de Roberto y Esperanza es de 0.01 m y que la desviacin media de Ana y Luis es de
0.25 m, entonces llegaramos a la conclusin de que Ana y Luis forman una pareja muy
dispareja.

Las medidas de dispersin indican, en promedio, cunto se alejan los datos de la media
aritmtica. Si los datos se alejan poco de la media entonces su dispersin es menor que si
alejan mucho de la media. Las medidas de dispersin ms comnmente utilizadas son el
rango, la varianza y la desviacin estndar o tpica y el coeficiente de variacin que mide la
dispersin relativa.

La varianza muestral se define como la suma de los cuadrados de las diferencias de los
datos con respecto a la media, dividida entre el total de datos menos uno. Esta medida tiene
el inconveniente de que transforma las unidades de medicin en cuadrados, por lo que no se
puede comparar con la media aritmtica. Por esta razn se define la desviacin estndar
como la raz cuadrada de la varianza.

El coeficiente de variacin se utiliza cuando se desea comparar dos distribuciones de
frecuencia que tienen diferente unidad de medida, se calcula dividiendo la desviacin
estndar entre la media.

El rango es la mas simple de las medidas de dispersin y se define como la diferencia entre
la medida mayor y la menor, pero no informa cuntos valores abarcan los datos.
El rango es muy utilizado en procesos industriales. En mucho, su utilidad en este campo se
debe a lo sencillo y rpido que es calcularlo. El rango provee informacin til cuando la
muestra es pequea, pero cuando la muestra es grande, no resulta una medida adecuada.

La desviacin estndar es la medida de dipersin ms utilizada para medir la variabilidad
en una muestra (o si fuera el caso en una poblacin). Para calcularla, primero se obtiene la
varianza y despus se extrae su raz cuadrada.

Medidas de dispersin para datos agrupados

Para que tengas un mejor entendimiento del clculo de las medidas de dispersin para datos
agrupados, utilizaremos el siguiente:

27
Ejemplo 1. Determinar las medidas de dispersin para el siguiente conjunto de datos que
corresponden a la edad (en aos) de la poblacin de habitantes, que asisten a la escuela, de
una colonia de la delegacin de Tlalpan.

Edad Nmero de
(aos) habitantes

i
f
i
x
i i
f x
7 a 10 5 8.5 42.5
11 a 14 11 12.5 137.5
15 a 18 23 16.5 379.5
19 a 22 31 20.5 635.5
23 a 26 16 24.5 392.0
27 a 30 10 28.5 285.0
31 a 34 ___4___ 32.5 _130.0
100
i
n f = =

2002
i i
f x =


A partir de estos clculos, se tiene que:
2002
20.02
100
= =

Considerando al conjunto de datos como una poblacin, se calcula la varianza con:


.
2
2 1
( )
n
i i
i
f x
N

Donde:
i
f es la frecuencia i-sima,
i
x es la marca de clase i-sima y n es el nmero total de datos
(en este caso debe considerarse n=N=100) .


i
x
2
( )
i
x
2
( )
i i
f x
11.52 132.7104 663.552
7.52 56.5504 622.0544
3.52 12.3904 284.9792
0.48 0.2304 7.1424
4.48 20.0704 321.1264
8.48 71.9104 719.104
12.48 155.7504 __623.0016__

2
( ) 3240.96
i i
f x =


Con estos datos se tiene que:

2
3240.96
32.4096
100
= =
Por lo tanto, la desviacin tpica o estndar, es: 32.4096 5.692943aos = =
Tambin se puede calcular la varianza y consecuentemente la desviacin tpica o estndar,
mediante:
28

2
2
2 2 2 1 1
n n
i i i i
i i
f x f x
x
n n

= =
| |
|
| = =
|
|
\


Realizando los clculos, se tiene:

i
x
i i
f x
2
i
x
2
i i
f x
8.5 42.5 72.25 361.25
12.5 137.5 156.25 1718.75
16.5 379.5 272.25 6261.75
20.5 635.5 420.25 13027.75
24.5 392.0 600.25 9604
28.5 285.0 812.25 8122.5
32.5 _130.0___ 1056.25 _4225___
2002
i i
f x =


2
43321
i i
f x =


De esto se obtiene que:
2002
20.02
100
= = y
2
43321
433.21
100
x = =

2 2 2 2
433.21 20.02 433.21 400.8004 32.4096 x = = = =

La desviacin tpica o estndar, es:
32.4096 5.692943aos = =

Como podrs observar, el valor de la desviacin tpica o estndar es el mismo, no
importando el camino que sigas para hacerlo.

Ejemplo 2. Los datos siguientes representan el contenido de azcar (en g/100 ml) y el
contenido de cafena (mg/100 ml) de 8 refrescos de cola. En la cuarta y quinta columna de la
tabla se ilustra el procedimiento para calcular la desviacin estndar para el contenido de
azcar (Profeco, 2003).

Marca Azcar
(g/100 ml)
Cafena
(mg/100 ml)
i
x x
( )
2
i
x x

Big Cola 10.9 12 10.9-10.6875 0.04515625
CM 10.3 6 10.3-10.6875 0.15015625
Coca Cola 10.6 15 10.6-10.6875 0.00765625
Great Value 10.2 5 10.2-10.6875 0.23765625
Hola Cola 10.4 13 10.4-10.6875 0.08265625
Pepsi Cola 11.1 14 11.1-10. 6875 0.17015625
Pepsi Limn 11 16 11-10.6875 0.09765625
Royal Cola 11 12 11-10.6875 0.09765625
0.88875

Como el conjunto de datos corresponde a una muestra de datos no agrupados, la varianza
se calcula con:
29

2
2 1
( )
1
n
i
i
x x
s
n
=


Con estos datos, se tiene:
La varianza es
2
0.88875
0.12696
8 1
s = =


Por lo tanto, la desviacin tpica o estndar, es: 0.12696 0.3563 /100 s g ml = =

Si la muestra es de datos agrupados, la varianza se calcula con:

2
2 1
( )
1
n
i i
i
f x x
s
n
=


Donde:
i
f es la frecuencia i-sima y
i
x es la marca de clase i-sima.
Tambin se puede calcular la varianza para datos agrupados de una muestra y
consecuentemente la desviacin tpica o estndar, mediante:


2
2 1
1
2
1
n
i i n
i
i i
i
f x
f x
n
s
n
=
=
| |
|
|
|
|
\
=



Una reflexin sobre las Medidas de Dispersin.

Es muy importante reflexionar que an cuando la desviacin estndar es la medida de
dispersin ms comunmente utilizada para comparar distribuciones de frecuencias (o para
comparar varios conjuntos de datos), en algunas situaciones no siempre responde a la
pregunta en cul distribucin de frecuencias existe mayor dispersin?.


El rango proporciona informacin til cuando la muestra es pequea, pero si la
muestra es grande, no resulta una medida de provecho.

Ejercicios.
1. Los datos siguientes proporcionan las temperaturas promedio diarias (en grados
centgrados) registradas durante 8 das del ltimo mes de enero en Otawa y en
Washington

Otawa -1 2 1 1 -2 3 0 -4
Washington 1 1 -2 -1 -3 0 -1 5

En cul ciudad se presenta mayor variacin en la temperatura?

2. Propn un conjunto 6 de datos de manera que la varianza (y/o la desviacin
estndar sea cero)

30
3. La tabla siguiente da los rendimientos, medidos en toneladas por hectrea, de dos
variedades de maz, en 10 aos consecutivos

Ao 1 2 3 4 5 6 7 8 9 10
Maz A 4.8 0.5 6 3.5 3.8 5 6 1.2 2.8 5.2
Maz B 3.5 3.8 3.7 2.8 2.5 4.2 4 3.5 4.1 3.2

a)Qu variedad de maz es mejor?

b)Cul variedad es ms consistente?

4. La media y la desviacin estndar de las calificaciones en un examen final
correspondientes a los grupos A y B, se muestran en la siguiente tabla

Grupo Media D. Estndar
A 7.7 6.2
B 6.9 11.7

a) Cul de los grupos tuvo mejor rendimiento?

b) Cul de los grupos tuvo un rendimiento ms homogneo?

c) Sin considerar ninguna otra informacin, en cul de los dos grupos se
obtuvieron los puntajes individuales ms bajos y ms altos?

5. Una compaa desea comprar una mquina de corte controlada por computadora.
El ingeniero de la compaa prueba dos mquinas de diferentes fabricantes. Los
dimetros (en centmetros) de las barras cortadas por las mquinas fueron los
siguientes:

Fabricante 1: 2.001, 2, 2.004, 1.998, 1.997

Fabricante 2: 2.002, 2.008, 1.995, 1.99, 2.005

A cul fabricante le conviene comprar?

6. Para los siguientes datos que corresponden a una muestra de las puntuaciones de
10 aspirantes en el examen de admisin de la UNAM del ao pasado 76, 68, 85,
91, 80, 72, 84, 88, 77 y 82. Calcula su desviacin estndar.


7. Para los siguientes datos que corresponden al gasto en pasajes por semana de
una poblacin de alumnos de una escuela de computacin. Calcula la varianza y la
desviacin tpica.




31
Gasto Nmero de
(Pesos) alumnos

2.50 a 4.00 7
4.50 a 6.00 10
6.50 a 8.00 24
8.50 a 10.00 25
10.50 a 12.00 8
12.50 a 14.00 4
14.50 a 16.00 2


Coeficiente de variacin

Mide la dispersin relativa y pemite comparar dos conjuntos de datos cuyas medidas
descriptivas pueden estar expresados en diferentes unidades de medida. Es equivalente a la
razn, es decir, es la comparacin por cociente entre la desviacin estndar y la media
aritmtica. Al ser un coeficiente no tiene unidades y si se desea se puede expresar en
porcentaje:

s
CV
x
= 100
s
CV
x
=

Ejemplo si deseamos comparar el contenido de azcar con la cafena, en los refrescos del
ejemplo de la tabla de Datos Profeco, 2003, necesitamos calcular el CV para cada variable.

El coeficiente de variacin para el contenido de azcar en los refrescos es

0333 . 0
100 / 6875 . 10
100 / 3563 . 0
= =
ml g
ml g
CV , o de manera equivalente CV = 3.33%

El coeficiente de variacin para el contenido de cafena en los refrescos es

3469 . 0
100 / 625 . 11
100 / 0333 . 4
= =
ml mg
ml mg
CV , o sea CV = 34.69%

A partir de la comparacin de los valores anteriores, se concluye que existe menos
dispersin o variabilidad en el contenido de azcar de los refrescos como se puede observar
comparando los coeficientes de variacin y donde se observa que el contenido de cafena es
aproximadamente 10 veces mayor que el de azcar.

Ejercicios.

1. Si se tiene que en una muestra de las temperaturas medias durante 5 das del
ltimo verano en la ciudad de Mxico fueron de 16 ,14 ,19 ,22 24 y y en una muestra
durante 5 das del invierno pasado fueron de 10 ,11 , 9 , 8 12 y , determina
en cual de las dos estaciones hubo mayor variabilidad.

32
2. Si se tienen dos muestras de estudiantes con pesos promedio de 68 kg y de 85 kg
respectivamente y con la misma desviacin estndar, entonces se puede afirmar que:

a) La muestra con estatura promedio de 68 kg tiene menor variabilidad ( )

b) La muestra con estatura promedio de 85 kg tiene menor variabilidad ( )

c) Las dos muestras tienen la misma variabilidad ( )

3. En un estudio se encontr que el gasto promedio anual para atencin mdica de dos
muestras de familias de clase media fue el mismo con una desviacin tpica de
$700.00 para la primera muestra y de $450.00 para la segunda muestra, entonces, se
puede afirmar que:

a) La muestra con desviacin tpica de $450.00 tiene mayor variabilidad ( )

b) La muestra con desviacin tpica de $700.00 tiene mayor variabilidad ( )

c) Las dos muestras tienen la misma variabilidad ( )


MEDIDAS DE POSICION

En ocasiones es necesario conocer proporciones de una poblacin que cumple ciertos
valores de la variable de inters lo cual no es posible describir fcilmente si solo se tienen las
medidas de centralizacin y dispersin, por lo que es necesario determinar algunas medidas
descriptivas mediante las cuales se pueda hacer esa descripcin, estas medidas son
llamadas de posicin las cuales permiten determinar los valores de la variable que divide al
conjunto de datos en partes iguales, tales medidas se llaman genricamente cuantiles y de
acuerdo al nmero de partes en que dividen a la poblacin, as tenemos:

Mediana. Valor de la variable que divide en dos partes al conjunto de datos, que si bien es
una medida de centralizacin tambin es de posicin y su valor corresponde al central de
una distribucin de datos y describe que a su izquierda se encuentra el 50% de la
distribucin y a su derecha el otro 50%.

Cuartiles. Valores de la variable que dividen a la distribucin en cuatro partes iguales y que
describen que alrededor de cada uno de ellos se encuentra el 50% de la distribucin, as el
cuartil primero describe que a su izquierda se encuentra el 25% de la poblacin con los
valores ms bajos de la variable y a su derecha otro 25% de los datos, el cuartil segundo que
es equivalente a la mediana, describe que alrededor de el se encuentra el 50% de los datos
con los valores centrales de la variable 25% a su izquierda y 25% a su derecha y el cuartil
tercero describe que a su izquierda se encuentra el 25% de los valores centrales de la
distribucin y a su derecha el 25% de los datos con los valores mayores de la variable.

Deciles. Son los valores de la variable que dividen al conjunto ordenado de datos en diez
partes iguales y que describe que alrededor de cada uno de ellos se tiene el 20% de la
distribucin, de acuerdo a su posicin relativa dentro de ella, as por ejemplo el decil noveno
describe que alrededor de l se encuentra el 20% de los valores de la variable ms grandes,
33
el 10% a su izquierda y el otro 10% a su derecha y el decil 5 que es equivalente a la mediana
describe que alrededor de l se encuentra el 20% de los datos con los valores centrales de la
distribucin, el 10% a su izquierda y el otro 10% a su derecha.

Porcentiles o Centiles. Son los valores de la variable que dividen al conjunto ordenado de
datos en cien partes iguales y que describe que alrededor de cada uno de ellos se tiene el
2% de la distribucin, de acuerdo a su posicin relativa dentro de ella, as por ejemplo el
percentil primero describe que alrededor de l se encuentra el 2% de los datos con los
valores de la variable ms pequeos, el 1% a su izquierda y el otro 1% a su derecha y el
percentil 50 que es equivalente a la mediana describe que alrededor de l se encuentra el
2% de los datos con los valores centrales de la distribucin, el 1% a su izquierda y el otro
1% a su derecha

Para efectuar el clculo de las medidas de posicin para datos agrupados se utiliza el mismo
procedimiento de interpolacin que para calcular la mediana, as, tenemos:


Ejemplo. Para determinar las medidas de posicin para el siguiente conjunto de datos que
corresponden a la edad (en aos) de los habitantes de una colonia de la delegacin de
Tlalpan, que asisten a la escuela.

Edad Nmero de
(aos) habitantes

i
f
7 a 10 5
11 a 14 11
15 a 18 23
19 a 22 31
23 a 26 16
27 a 30 10
31 a 34 ___4___
100
i
n f = =




Inicialmente, se obtienen las columnas correspondientes a las marcas de clase(
i
x ), lmites
reales de clase( LRI y LRS ), frecuencias acumuladas( fa ) y las necesarias (
i i
f x ) para el
clculo de la media aritmtica.

i
x LRI LRS fa
8.5 6.5 10.5 5
12.5 10.5 14.5 16
16.5 14.5 18.5 39
20.5 18.5 22.5 70
24.5 22.5 26.5 86
28.5 26.5 30.5 96
32.5 30.5 34.5 100
34
La mediana se obtuvo con
2
I
i
n
fa
Me L c
f

= +
Donde:
I
L es el lmite real inferior de la clase mediana.
n es el nmero total de datos.
fa es la frecuencia acumulada anterior a la de la clase mediana.

i
f es la frecuencia absoluta de la clase mediana.
c es el tamao o amplitud de la clase mediana ( c LRS LRI = )
recordando que a clase mediana es el intervalo de clase donde se encuentra el
2
avo
n | |
|
\
dato,
siendo en este caso el intervalo de clase donde est el
100
50
2
avo
avo
| |
=
|
\
dato, es decir, el
cuarto intervalo, donde 22.5 18.5 4 c aos = = , as la mediana es:

100
39
2
18.5 4 18.5 1.4193 19.9193
31
Me aos

= + = + =
Cuartiles. El cuartil N-simo se obtiene con:
4
N I
i
n
N fa
Q L c
f

= +
Donde:
I
L es el lmite real inferior de la clase donde est el N-esimo cuartil.
n es el nmero total de datos.
fa es la frecuencia acumulada anterior a la de la clase mediana.

i
f es la frecuencia absoluta de la clase dode est el N-esimo cuartil.
c es el tamao o amplitud de la clase mediana ( c LRS LRI = )

as, si se calcula el cuartil 1 la clase donde est, es el intervalo de clase donde se encuentra
el
100
1 25
4
avo
avo
| |
=
|
\
dato, es decir, el tercer intervalo, donde 18.5 14.5 4 c aos = = , as el
primer cuartil es:

1
100
1 16
4
14.5 4 14.5 1.5652 16.0652
23
Q aos

= + = + =

Valor de la variable que describe que el 25% de los habitantes de esa colonia que asisten a
la escuela son menores de 16.0652 aos.

Ejercicio:
Comprueba que el
3
23.75 Q aos = e interpreta su significado, recuerda que el cuartil 2 es la
mediana.
Deciles. El decil N-simo se obtiene con:
10
N I
i
n
N fa
D L c
f

= +
35
Donde:
I
L es el lmite real inferior de la clase donde est el N-esimo decil.
n es el nmero total de datos.
fa es la frecuencia acumulada anterior a la de la clase mediana.

i
f es la frecuencia absoluta de la clase donde est el N-esimo decil.
c es el tamao o amplitud de la clase mediana ( c LRS LRI = )

as, si se calcula el decil 8 la clase donde est, es el intervalo de clase donde se encuentra
el
100
8 80
10
avo
avo
| |
=
|
\
dato, es decir, el quinto intervalo, donde 26.5 22.5 4 c aos = = , as el
octavo decil es:

8
100
8 70
10
22.5 4 22.5 2.5 25
16
D aos

= + = + =
Valor de la variable que describe que el 80% de los habitantes de esa colonia que asisten a
la escuela son menores de 25 aos o que el 20% son mayores de 25 aos.

Ejercicio:
Comprueba que el
3
16.9347 D aos = e interpreta su significado, recuerda que el decil 5 es la
mediana.
Percentiles. El percentil N-simo se obtiene con:
100
N I
i
n
N fa
P L c
f

= +
Donde:
I
L es el lmite real inferior de la clase donde est el N-esimo percentil.
n es el nmero total de datos.
fa es la frecuencia acumulada anterior a la de la clase mediana.

i
f es la frecuencia absoluta de la clase dode est el N-esimo percentil.
c es el tamao o amplitud de la clase mediana ( c LRS LRI = )

as, si se calcula el percentil 53, la clase donde est es el intervalo de clase donde se
encuentra el 53
100
avo
n | |

|
\
dato, siendo en este caso el intervalo de clase donde est el
100
53 53
100
avo
avo
| |
=
|
\
dato, es decir, el cuarto intervalo, donde 18.5 14.5 4 c aos = = , as el
percentil 53 es:


53
100
53 39
100
18.5 4 18.5 1.8064 20.3064
31
P aos

= + = + =
Valor de la variable que describe que el 53% de los habitantes de esa colonia que asisten a
la escuela son menores de 20.3064 aos.





36
Ejercicio
Comprueba que el
10
12.3181 P aos = e interpreta su significado y recuerda que el percentil 50
es la mediana.


REGLA EMPIRICA

En un gran nmero de estudios estadsticos, el uso conjunto de la media y la desviacin
estndar, permite conocer la distribucin porcentual de una muestra, an cuando no se
conozcan los datos muestrales en su totalidad. Esta situacin se verifica de manera general
en distribuciones de datos con una sola moda y simtricas como es la distribucin normal
para la cual se cumple que:

En el intervalo ( s x s x + , ) se encuentra el 68% de los datos.
En el intervalo ( s x s x 2 , 2 + ) se encuentra el 95% de los datos.
En el intervalo ( s x s x 3 , 3 + ) se encuentra el 99% de los datos.

Aunque esta ltima regla es aplicable especificamente a la distribucin normal, con
frecuencia se aplica como gua para cualquier distribucin.

Por ejemplo si se aplica un prueba estandarizada a 500 alumnos y se obtiene una media de
6 y una desviacin estndar de 1.5, si la distribucin es unimodal y bastante simtrica,
entonces en el intervalo (6-1.5,6+1.5)=(4.5,7.5) se tiene al 68% de los alumnos, es decir, 340
de los alumnos obtuvieron calificacin entre 4.5 y 7.5




















37

UNIDAD 2. DATOS BIVARIADOS

Propsito.
Al finalizar esta unidad debes haber comprendido la forma en que se establece una relacin
entre dos variables, a partir de tablas, diagramas, regresiones y correlaciones y as describir
la naturaleza e intensidad lineal de esa relacin.


Se ha tratado con variables numricas y se ha estudiado una caracterstica de inters, como
puede ser el nmero de materias que han acreditado, la edad de los alumnos del CCH, etc.

Ahora se consideran ms caractersticas de inters como puede ser: el tiempo que tarda un
alumno en llegar a el CCH y lo que gasta en transporte, o la distancia promedio que recorre
para llegar al plantel. Otro sera el peso, la estatura y el periodo de embarazo (das
promedio), de un beb al nacer.

Se quiere saber si existe, o no, relacin lineal entre dos o ms variables. Si existe, se debe
saber que tipo de relacin es.

El mtodo empleado es el mtodo de la regresin lineal.

El objetivo estadstico (terico) del mtodo de regresin lineal es el de evaluar si dicho
modelo se ajusta o no al proceso estudiado.

Diagrama de dispersin
Se desea analizar comportamiento de las variables: estatura (X) y peso (Y) de alumnos
entre 15 y 18 aos. Se debe evaluar si el modelo de regresin lineal puede ajustarse o no.
La poblacin estadstica se compone segn el principio a mayor estatura, mayor peso.
Se elabora una grafica donde aparecen los valores muestrales obtenidos con muestras
aleatorias (x
1
, y
1
), (x
2
, y
2
), , (x
n
, y
n
). Esta grafica se le nombra diagrama de dispersin.


Diagrama de dispersin
Estatura
P
e
s
o



38
Si los valores muestrales dan una configuracin de puntos como el del diagrama de
dispersin, el modelo se llama de regresin lineal simple.
Cabe aclarar que la dispersin de puntos no solamente es lineal, hay dispersiones
cuadrticas y el modelo sera de regresin cuadrtica, adems se pueden utilizar modelos
de regresin exponencial, logartmica, etc.

Tambin hay la posibilidad de que entre las variables X y Y no exista relacin alguna. Una
vez evaluada la pertinencia del modelo, se procede a describir y explicar el comportamiento
del proceso mediante la construccin del modelo respectivo. Este paso permite efectuar otros
aspectos como la de predecir y pronosticar su comportamiento.

Correlacin entre dos variables numricas
El objetivo estadstico es el de ver si existe o no una relacin de carcter lineal entre dos
variables aleatorias, si existe, entonces medir el grado de intensidad de la linealidad, esto se
logra al calcular el coeficiente de correlacin lineal de Pearson, denotado por r

( ) ( )
2 2
2 2
n XY X Y
r
n X X n Y Y

=
( (

( (





El coeficiente (r) toma valores en el intervalo -1 r 1.

-Por tanto, r puede ser -1, -0.98, -0.85,; esto significa que la relacin entre X y Y es
inversamente proporcional, (a menor X mayor Y)
-Si r se acerca a 0, la relacin entre las variables es casi nula, esto quiere decir que no hay
relacin entre ellas.
-Si r se acerca a 1 significa que la relacin entre X y Y es proporcional, (a mayor X mayor Y).

Modelo de Regresin Lineal Simple
Al tener una tendencia lineal entre las variables X y Y el modelo matemtico a proponerse es
de una recta. Para determinar la ecuacin de la recta de la forma

Y mx b = +

Se necesita calcular los valores de m y b que corresponden a la pendiente y a la ordenada al
origen respectivamente.

Para determinar la recta de mejor ajuste se recurre al mtodo de mnimos cuadrados:

Se encontrar m y b de tal forma que la suma de los cuadrados de los residuos sea mnima

La estimacin de los coeficientes de la recta de regresin m y b, se calculan con:

a) Y bn m X = +


2
XY b X m X = +



las cuales se conocen como ecuaciones normales y al resolverse como simultneas,
determinan los valores de la pendiente m y la ordenada al origen b

39
o con:
b)
( )
2
2
n XY X Y
m
n X X



y
Y m X
b
n

=



Ejemplo
Los siguientes datos corresponden a los resultados de un estudio acerca de la cantidad de
azcar refinada (Y) mediante un cierto proceso a varias temperaturas diferentes (X). Los
datos se codificaron y se registraron en la tabla siguiente:

X
Temperatura
Y
Azcar transformada
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
8.1
7.8
8.5
9.8
9.5
8.9
8.6
10.2
9.3
9.2
10.5

Para calcular el coeficiente de correlacin, tenemos:

X Y X*Y X
2
Y
2
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
8.1
7.8
8.5
9.8
9.5
8.9
8.6
10.2
9.3
9.2
10.5
8.10
8.58
10.20
12.74
13.30
13.35
13.76
17.34
16.74
17.48
21.0
1.0
1.21
1.44
1.69
1.96
2.25
2.56
2.89
3.24
3.61
4.00
65.61
60.84
72.25
96.04
90.25
79.21
73.96
104.04
86.49
84.64
110.25
16.5 100.40 152.59 25.85 923.58

Se registran 11 parejas ordenadas (X,Y), por tanto n = 11.
Coeficiente de correlacin r

( ) ( )
2 2 2 2
2 2
11 152.59 16.5 100.4
0.71
(11 25.85 16.5 )(11 923.58 100.4 )
n XY X Y
r
n X X n Y Y


= = =
( (

( (




Este valor de 0.71 r = se interpreta como una correlacin positiva moderada.
40
La recta de regresin lineal, que es de la forma Y = mx + b, su pendiente y ordenada al
origen, se determinan como:


( )
2 2
2
11 152.59 16.5 100.4
1.73
11 25.85 16.5
n XY X Y
m
n X X


= = =






100.4 1.73 16.5
6.53
11
Y m X
b
n


= = =


Por lo que la recta de regresin lineal, que es la recta que mejor se ajusta a los datos, es:

Y = 1.73X + 6.53

La ecuacin de la recta de regresin nos permite estimar la cantidad de azcar producida
para una determinada temperatura as para una temperatura de 1.75, se tiene que al sustituir
1.75 X = se obtiene para 9.56 Y = es la cantidad promedio de azcar refinada obtenida a esa
temperatura.

Ejercicios.
1. Para la siguiente tabla que muestra la estatura de un beb al nacer Y (cm) que
depende del perodo de embarazo de su mam X (das promedio).








a) Construye el diagrama de dispersin
b) Completa la tabla
c) Calcula el coeficiente de correlacin de Pearson.
d) Encuentra la ecuacin de la recta de regresin.
e) Traza sobre el diagrama de dispersin, la recta de regresin
f) Determina la estatura estimada de un beb al nacer si el tiempo promedio de
embarazo fue de 280 das.
g) Determina el tiempo estimado de embarazo de un beb que midi al nacer
50.4 cm.
2. La siguiente tabla representa la densidad de un mineral (X) y su contenido de hierro
(Y)








X Y XY X
2
Y
2
277.1 48
279.3 49
281.4 50
283.2 51
284.8 52

X Y XY X
2
Y
2

2.8
3.0
3.2
3.2
3.4
27
30
30
34
36


41
a) Completa la tabla.
b) Construye el diagrama de dispersin.
c) Calcula el coeficiente de correlacin r,
d) Determina la ecuacin de regresin lineal.
e) Traza sobre el diagrama de dispersin, la recta de regresin.
f) Si la densidad del material es 2.9, determina el valor estimado del contenido
de hierro.
g) Si el contenido de hierro es de 31, determina la densidad estimada del
material.


































42


UNIDAD 3. PROBABILIDAD

Propsito.
Al finalizar esta unidad sabrs los que son los fenmenos aleatorios, al resolver problemas
utilizando los enfoques, subjetivo, frecuentista y clsico, y comprenders los conceptos
fundamentales que te permiten asociar a la probabilidad y a sus reglas directamente con la
Inferencia Estadstica.

EL azar y la realidad

La presencia de fenmenos imprevisibles en sus resultados o manifestaciones en la realidad
que nos rodea es bastante patente. La casualidad y el azar gobiernan muchos
acontecimientos de nuestras vidas. Nuestro trabajo, la familia, cuando conducimos un coche
e incluso los rincones ms ocultos de la ciencia estn infludos por lo impredecible. Por ello,
el hombre ha tratado de controlar el mundo del azar para no depender de un simple golpe de
suerte (aunque no siempre ha obtenido buenos resultados).

Fenmenos deterministas y fenmenos aleatorios.

Decimos que un fenmeno es determinista si es posible determinar, con la exactitud
deseada, lo que va ha ocurrir como resultado del fenmeno (al repetir el fenmeno bajo las
mismas circunstancias, produce el mismo resultado).
Un fenmeno aleatorio se caracteriza por la propiedad de que su realizacin bajo un conjunto
dado de circunstancias no siempre produce el mismo resultado, sino que puede tener
diferentes resultados, y no tenemos forma de determinar cual de ellos ocurrir. Por ejemplo
en el experimento de lanzar una moneda, se puede apreciar los dos tipos de fenmenos:
determinista (tenemos la certeza de que la moneda caer al suelo) y aleatorio (no podemos
predecir qu lado de la moneda quedar hacia arriba).

Fuentes de fenmenos aleatorios

En la Biologa
Muchas de las caractersticas heredadas en el nacimiento no se pueden prever de
antemano, sino que dependen del azar: el gnero, el color del pelo, el peso al nacer. La
transmisin de los caracteres genticos obedece a las leyes del clculo de probabilidades.

En la Medicina
La posibilidad de contagio o no en una epidemia, la duracin de un cierto sntoma, la
posibilidad de un diagnstico correcto cuando hay varias posibles enfermedades que
presentan sntomas parecidos, son ejemplos de situaciones donde el azar est presente.

En el mundo fsico
La duracin, intensidad y extensin de las lluvias, tormentas o granizos; la intensidad y
direccin del viento. las temperaturas mximas o mnimas, etc.


43

En el mundo social
En la sociedad en que vivimos, la familia, la escuela, el trabajo, estn llenos de situaciones
en las que predomina la incertidumbre. El nmero de hijos en la familia, la edad de los
padres al contraer matrimonio, el tipo de trabajo, la terminacin de los estudios escolares,
son ejemplos de fenmenos aleatorios en la vida social.

Las definiciones de probabilidad.

Laplace (1812) defini la probabilidad como la tasa de casos favorables sobre el nmero total
de casos igualmente posibles, pero tambin lo hizo Leibniz en 1678. Para Laplace, la teora
del azar, consiste en reducir todos los acontecimientos del mismo tipo a un cierto nmero de
casos igualmente posibles, es decir, aquellos para los que estamos igualmente indecisos
acerca de su existencia.

William Emerson (1776) distingue la probabilidad matemtica (o terica) y probabilidad
frecuentista, dando una buena descripcin de esta ltima:

Aunque es imposible determinar con certeza cmo ocurrir un acontecimiento, puede
determinarse matemticamente, sin embargo, qu verosimilitud o grado de probabilidad hay
de que ocurra o deje de ocurrir, excepto que se haga un nmero infinito de repeticiones y
entonces una con la otra llevarn siempre a la misma cosa que se obtiene con el clculo.

Una teora mucho ms aplicable y muy sostenida, que evita alguna de estas dificultades, es
la frecuencia relativa o interpretacin estadstica. Puede atriburse en gran medida, a este
punto de vista el adelanto registrado en la aplicacin de la probabilidad, no slo a la fsica y a
la astronoma, sino tambin a la biologa, a las ciencias sociales y a los negocios. La
interpretacin estadstica est estrechamente relacionada con el punto de vista expresado
por Aristteles: que lo probable es aquello que ocurre diariamente.

Conceptos bsicos en Probabilidad

Con el propsito de continuar con el estudio de la Probabilidad de manera sistemtica,
usaremos las siguientes definiciones:

La probabilidad es un trmino utilizado para describir un experimento con un resultado
aleatorio, lo que se conoce como experimento aleatorio. En la prctica, un experimento es
el proceso por medio del cual la medicin de una observacin es registrada.

El primer componente de un modelo de probabilidad, es el conjunto de todos los posibles
resultados del experimento llamado espacio muestral ( ). Por ejemplo, si consideramos
que lanzar una moneda es un experimento aleatorio, los posibles resultados son guila o sol.
Simblicamente, el espacio muestral de lanzar una moneda es = {guila, sol}.

Por otro lado, si se lanza un dado cuyas caras estn numeradas del 1 al 6, la posibilidad de
que el nmero mostrado sea un 7 es un evento que no puede ocurrir y a ste evento se le
llama evento imposible, se denota por y su probabilidad de ocurrencia es cero.

44
Si lanzamos una moneda, tenemos la seguridad de que obtendremos uno de los resultados
posibles contenidos en , cada uno de stos resultados se conocen como eventos
simples, stos eventos comnmente se denotan por E
i
. Una caracterstica evidente de los
eventos simples, es que en un experimento aleatorio ocurre uno y solo un evento simple.

En resumen el clculo de probabilidades tiene las siguientes verdades bsicas o
axiomas.

1. Si E es un evento cualquiera, entonces ( ) 1 0 E P
2. Si o S, es el evento seguro, entonces ( ) 1 = P o ( ) 1 P S =
3. Si E
1,
E
2,
E
k
son

eventos mutuamente excluyentes, entonces
P(E
1
o E
2
o . E
k
)=P(E
1
)+P(E
2
)++P(E
k
)

Tambin es importante que sepas el uso correcto de algunos trminos en espaol que se
usan cotidianamente en el clculo de probabilidades.

Conectivo y

Este conectivo y significa que estamos interesados en la ocurrencia simultnea o conjunta de
dos resultados en una situacin aleatoria.

Ejemplo 1. Supngase que se arrojan simultneamente un dado y una moneda y se quiere
calcular la probabilidad de obtener un 3 y un guila. La probabilidad de obtener un 3 es
6
1
y
la probabilidad de que salga guila en un volado es
2
1
; entonces la probabilidad de obtener
un 3 y un guila al lanzar simultneamente un dado y una moneda es
1 1
6 2
y , es decir,
1 1 1
6 2 12
= . Esta situacin se simboliza como:
1 1 1
(3 ) (3 ) (3) ( )
6 2 12
P y A P A P P A = = = = I
El razonamiento anterior se puede aplicar siempre y cuando la probabilidad de ocurrencia de
cualquiera de los dos eventos no afecte la probabilidad de ocurrencia del otro, es decir,
cuando ambos eventos no estn relacionados.

Ejemplo 2. Calcular la probabilidad de obtener tres cincos en el lanzamiento de 3 dados.
Como los eventos no estn relacionados (son independientes), entonces
1 1 1 1
(5 5 5) (5 5 5) (5) (5) (5)
6 6 6 216
P y y P P P P = = = = I I
La respuesta de estos ejemplos se hizo relacionando el conectivo y con la interseccin de
conjuntos y con la operacin aritmtica multiplicacin

Conectivo o

Supngase que se desea calcular la probabilidad de obtener un nmero par en el
lanzamiento de un dado, es decir, calcular la probabilidad de obtener 2 o 4 o 6, la respuesta
se obtiene relacionando el conectivo o con la unin de conjuntos y con la operacin
aritmtica adicin, as:
45
1 1 1 3 1
(2 4 6) (2 4 6) 0.5
6 6 6 6 2
P o o P U U = = + + = = =
La condicin para poder sumar probabilidades en esta forma es que los eventos sean
mutuamente excluyentes, es decir, que no puedan ocurrir conjuntamente.

Este procedimiento puede conducir a errores si los eventos no son mutuamente excluyentes.

Ejemplo: Sean los eventos:

A: Un tirador acierta en el blanco
B: Otro tirador acierta en el mismo blanco.

Si se sabe que: P(A)=0.8 y P(B)=0.7,determinar la probabilidad de que los dos tiradores
apuntando al mismo blanco, acierten uno u otro.

Si quisiramos utilizar el procedimiento anterior en esta situacin, nos encontraramos con
que ( ) ( ) ( ) ( ) 0.8 0.7 1.5 P Ao B P A B P A P B = = + = + = U resultado evidentemente absurdo,
porque como ya lo hemos sealado, la probabilidad de un evento no puede ser mayor a 1. El
error proviene del hecho de no considerar que ambos eventos no son mutuamente
excluyentes, porque es muy posible que ambos tiradores hagan blanco simultneamente.
La forma correcta de calcularla es ( ) ( ) ( ) ( ) ( ) P Ao B P A B P A P B P A B = = + U I ,es decir, se
debe restar de 1.5, la probabilidad de que ambos tiradores hagan blanco simultneamente.

Eventos simples y su probabilidad

Ejemplo 1. Consideremos una encuesta a 34 estudiantes, clasificados de acuerdo con las
variables gnero y resultado de un examen final en Estadstica.

Masculino
(M)
Femenino
(F)
Total
Aprobado (A) 2 10 12
No aprobado (NA) 9 13 22
Total 11 23 34

En esta tabla se puede observar que el espacio muestral se forma con las combinaciones de
los valores de ambas variables: (A y M), ((A y F), (NA y M) y (NA y F).

En esta situacin los eventos simples con sus probabilidades son:
Seleccionar una mujer (F)
6764 . 0
34
23
) ( = = F P
Seleccionar un hombre (H)
11
( ) 0.3236
34
P H = =
Seleccionar una persona que aprob el examen (A)
12
( ) 0.3529
34
P A = =
46
Seleccionar una persona que no aprob el examen (NA).
22
( ) 0.6471
34
P NA = =


Clculo de probabilidades de eventos compuestos

Los eventos compuestos se forman combinando varios eventos simples. A continuacin
calcularemos probabilidades para eventos compuestos.

Consideremos la encuesta a 34 estudiantes, clasificados de acuerdo con las variables
gnero y resultado de un examen final en Estadstica.

Masculino
(M)
Femenino
(F)
Total
Aprobado (A) 2 10 12
No aprobado (NA) 9 13 22
Total 11 23 34

Podemos obtener directamente las probabilidades de los eventos compuestos:

2
( ) ( ) 0.0588
34
10
( ) ( ) 0.2941
34
9
( ) ( ) 0.2647
34
13
( ) ( ) 0.3823
34
P A y M P A M
P A y F P A F
P NA y M P NA M
P NA y F P NA F
= = =
= = =
= = =
= = =
I
I
I
I


La probabilidad de ocurrencia de dos eventos cuando ya se tiene cierta informacin de
uno de ellos.

Otra situacin de inters consiste en determinar la probabilidad de un evento si ha ocurrido el
otro. Por ejemplo, si seleccionamos un estudiante de la muestra de 34, cul es la
probabilidad de que haya aprobado (A), si se sabe que es mujer (F)? La informacin se sabe
que es mujer condiciona la probabilidad de ocurrencia del evento aprobar, es decir, de las 23
alumnas en la muestra solamente nos interesan aquellas que aprobaron (10); de esta
manera, la probabilidad de ocurrencia (llamada probabilidad condicional), es 4347 . 0
23
10
=
Observe que si se calcula solamente P(A), se obtiene 3529 . 0
34
12
= , pero la influencia del
evento F modifica su probabilidad a 0.4347

De manera semejante, podemos calcular la probabilidad de seleccionar una mujer si se sabe
(dado que) aprob. Aqu nicamente nos interesa una parte de la muestra (12 estudiantes
47
que aprobaron), y de estos solamente seleccionamos a las mujeres, por lo tanto, la
probabilidad deseada es 8333 . 0
12
10
=
Existen tambin algunas proposiciones (frmulas) que junto con los axiomas permiten el
clculo de probabilidades de ocurrencia de dos eventos A y B

Si dos eventos no son mutuamente excluyentes

( ) ( ) ( ) ( ) P A B P A P B P A B = + U I
lo que se interpreta como la probabilidad de ocurrencia de A o B, es igual a la suma de
probabilidades de A con B menos la probabilidad de ocurrencia de A y B.

Si dos o ms eventos son mutuamente excluyentes, entonces:

( ) ( ) ( ) ( ) P A B C P A P B P C = + + U U

que se interpreta como la probabilidad de ocurrencia de A o B o C, es igual a la suma de
probabilidades de A con B con C.

La probabilidad de ocurrencia de un evento A o de un evento B.

Frecuentemente el inters se centra en calcular la probabilidad de ocurrencia de uno u otro
evento. Si los dos eventos son mutuamente excluyentes, la probabilidad se calcula como la
suma de las probabilidades simples, pero cuando los eventos no son mutuamente
excluyentes, el procedimiento anterior tiene que modificarse. Por ejemplo, al seleccionar un
alumno, cul es la probabilidad de que sea mujer (F) o no haya aprobado (NA)?

Si pensamos que los eventos son mutuamente excluyentes, entonces
23 22 45
( ) ( ) ( ) ( ) 1.3235
34 34 34
P F o NA P F NA P F P NA = = + = + = = U , resultado incorrecto porque la
probabilidad encontrada es mayor a 1. Como se mencion anteriormente, el error proviene
de no considerar que los eventos no son mutuamente excluyentes, es decir, de no tomar en
consideracin la ocurrencia simultnea de los eventos (F y NA). Cmo eliminar este
error?

Una manera consiste en considerar que en la ocurrencia de estos dos eventos, digamos A y
B, nos interesa en realidad la ocurrencia de tres eventos:

a) que ocurra el evento A
b) que ocurra el evento B
c) que ocurran ambos eventos A y B.

De acuerdo con esto, las probabilidades de inters para la ocurrencia del evento F o el
evento NA, son:

a)
10
( )
34
P FyA = , nos interesa porque ocurre el evento F (aunque no ocurra el evento A).
48
b)
9
( ) ( )
34
P NA y M P NA M = = I , nos interesa porque ocurre el evento NA (aunque no ocurra
el evento M).
c)
13
( ) ( )
34
P F y NA P F NA = = I , nos interesa porque ocurren ambos eventos F y NA.

As,
10 9 13 32
( ) ( ) ( ) ( ) ( ) 0.9411
34 34 34 34
P F o NA P F NA P A F P NA M P F NA = = + + = + + = = U I I I
que es equivalente a:
23 22 13 32
( ) ( ) ( ) ( ) ( ) 0.9411
34 34 34 34
P F o NA P F NA P F P NA P F NA = = + = + = = U I
Los procedimientos anteriores tambin se pueden utilizar cuando se conocen las
probabilidades simples y las probabilidades conjuntas para dos eventos (A y B). Para
ilustrarlo consideremos la siguiente situacin:

Una compaa desea probar un producto en una zona comercial seleccionada
aleatoriamente. Las reas de ubicacin de los mercados pueden ser clasificadas con base en
su ubicacin y densidad de poblacin, para ello se definen los siguientes eventos (referidos
al nmero de mercados en cada categora) y sus probabilidades asociadas:

Ubicacin Este (E), P(E) = 0.6

Ubicacin Oeste (O), P(O) = 0.4

Densidad de poblacin urbana (U), P(U) = 0.36

Densidad de poblacin rural (R), P(R) = 0.64

Ubicacin Este y densidad urbana (E y U), P(E y U) = 0.2

Informacin que es conveniente organizar en una tabla de contingencia

Densidad de
Poblacin Rural (R)
Densidad de
Poblacin Urbana (U)
Total
Ubicacin Oeste (O) 0.24 0.16 0.4
Ubicacin Este (E) 0.4 0.2 0.6
Total 0.64 0.36 1

Con este arreglo podemos contestar las siguientes preguntas:

a) Si se selecciona un mercado al azar, la probabilidad de que tenga ubicacin este o se
encuentre en rea de poblacin urbana, es:

( ) ( ) ( ) ( ) ( ) 0.4 0.16 0.2 0.76 P E oU P E U P E y R P O yU P E yU = = + + = + + = U
que es equivalente a:

( ) ( ) ( ) ( ) ( ) 0.6 0.36 0.2 0.76 P EoU P E U P E P U P E U = = + = + = U I
49
b) Si se selecciona un mercado al azar, la probabilidad de que tenga ubicacin oeste dado
que(si se sabe que) es del rea rural, es:


( ) 0.24
( ) ( / ) 0.375
( ) 0.64
P O R
P O dado R P O R
P R
= = = =
I


Para calcular la probabilidad de dos eventos correlacionados o dependientes, se tiene:

Si La probabilidad de ocurrencia del evento B afecta la probabilidad de ocurrencia del
evento A, se denota como Probabilidad Condicional, se simboliza como P(A/B) y se
calcula con:

( )
( / )
( )
P A B
P A B
P B
=
I
, con 0 ) ( B P

Regla de la multiplicacin para dos eventos correlacionados o dependientes.

Si en la expresin anterior se despeja ( ) P A B I , se obtiene

( ) ( / ) ( ) P A B P A B P B = I , que es la expresin para calcular la probabilidad de ocurrencia
simultnea de dos eventos que no son independientes.

Procedimiento estadstico para determinar si dos eventos A y B son independientes.

Si en la regla de la multiplicacin para dos eventos correlacionados o dependientes ocurre
que ) ( ) / ( A P B A P = , entonces resulta que los eventos A y B son independientes, es decir, la
ocurrencia del evento B no altera de ninguna manera la ocurrencia del evento A. Esta
situacin implica que la regla de la multiplicacin se modifica a: ( ) ( ) ( ) P A B P A P B = I

De manera general, dos eventos A y B son independientes si y solo si se cumple cualquiera
de las siguientes igualdades:
( / ) ( )
( / ) ( ) ( ) ( )
P A B P A
P A B P B P A P B
=
=


Ejemplo. Si se tiene la siguiente tabla de contingencia para los eventos
c c
B B A A , , ,
Los eventos
c c
B A , se llaman eventos complementarios y sus probabilidades se calculan
como: ) ( 1 ) ( A P A P
c
= y ) ( 1 ) ( B P B P
c
=


B
c
B
Total
A 75 225 300
c
A
50 150 200
Total 125 375 500

Para determinar si los eventos A y B son o no independientes (estn o no correlacionados),
utilizaremos las expresiones anteriores para observar si se cumplen o no se cumplen:
50

6 . 0
500
300
) (
6 . 0
125
75
) / (
= =
= =
A P
B A P


Como ) ( ) / ( A P B A P = , se concluye que los eventos A y B son independientes (no estn
correlacionados).

( ) ( ) ( )
75 300 125
500 500 500
0.15 0.15
P A B P A P B =
=
=
I


Como la igualdad se verifica, se concluye que los eventos A y B son independientes.


Procedimiento para determinar si dos eventos son mutuamente excluyentes

Dos eventos A y B son mutuamente excluyentes si
( )
( / ) 0
( )
P A B
P A B
P B
= =
I

Por ejemplo los eventos A y B anteriores no son mutuamente excluyentes porque
0 6 . 0 ) / ( = B A P pero son independientes, porque 6 . 0 ) ( ) / ( = = A P B A P
Finalmente, sealamos que cuando se calcula la probabilidad conjunta de dos eventos, por
mtodo, se debe de pensar que ambos estn correlacionados o que no son independientes,
es decir, no se debe de partir del hecho de que no estn correlacionados, a menos que se
diga de manera clara que son independientes.


Ejercicios

1. Determina el espacio muestral para cada uno de los siguientes
experimentos.

a) El lanzamiento de una moneda cargada cuya probabilidad de que
caiga sol es el doble de que caiga guila,

b) La suma de los puntos de las caras superiores de un dado de 12
caras

c) La extraccin al azar de un gis de una caja donde se encuentran 8
gises blancos, 6 rojos, 4 amarillos y 12 azules.

2. A continuacin se presentan los resultados de una investigacin sobre los tipos de
sangre en una encuesta a 300 personas. Los datos se organizan en una matriz o tabla
de contingencia.

51
O A B AB Totales
Rh(+) 114 96 27 8 245
Rh(-) 23 22 7 3 55
Totales 137 118 34 11 300

Si se elige al azar una de esas persona cul es la probabilidad de qu

a) Tenga sangre tipo A o tipo B?
b) Tenga sangre tipo A o tipo B o tipo AB?
c) Tenga Rh(+) o sea del tipo A?
d) Tenga Rh(-) y sea del tipo AB?
e) Tenga sangre tipo O dado que su Rh es positivo?
f) Son independientes los eventos Rh(+) tipo O?

3. La probabilidad de que una enfermera encuentre a uno de sus pacientes en casa es
0.8. Suponiendo que hay independencia de eventos, cul es la probabilidad de que
en dos visitas que hace al da la enfermera, encuentre a sus pacientes en casa?.

4. El consejero escolar de un colegio estim las probabilidades de xito en la universidad
para tres alumnos X. Y y Z, de ltimo ao en 0.9, 0.8 y 0.6 respectivamente, cul es
la probabilidad de que los tres tengan xito en la universidad? Suponga independencia
de eventos.

5. Si la probabilidad de que un estudiante apruebe Estadstica es
3
5
y de que apruebe
Biologa es
2
3
, determina la probabilidad de que apruebe al menos una de las dos
materias

6. Se ha recibido un cargamento de toronjas con las siguientes caractersticas: 10% son
rosadas sin semilla, 20% son blancas sin semilla, 30% son rosadas con semilla y 40%
son blancas con semilla. Si se selecciona aleatoriamente una toronja del cargamento,
determina la probabilidad de que:

a) sea sin semilla
b) sea blanca
c) sea rosada o sin semilla
d) sea rosada dado que es sin semilla
e) sea sin semilla dado que es rosada.

7. Si en uno de los libreros de la biblioteca de una escuela se encuentran 8 libros
mutilados y 9 en buen estado, determina la probabilidad de que si un usuario elige al
azar:

a) un libro, est mutilado
b) uno est en buen estado.
c) tres libros, los tres estn en buenas condiciones.
d) cuatro libros, la mitad estn en buen estado.
52
e) cinco libros, 3 estn en buen estado y 2 mutilados.

8 Una refaccionaria vende refacciones nuevas y usadas. El 60% de las refacciones en
existencia son usadas, y al mismo tiempo el 61% de ellas son usadas o defectuosas,
si el 5% de las piezas son defectuosas, qu porcentaje de esas refacciones son
usadas y defectuosas?

9. Una persona tiene una entrevista relacionada con un empleo ofrecido por una
compaa, la probabilidad de que adquiera el trabajo despus de la entrevista es de
0.68 La probabilidad de que la compaa tenga inters en esta persona es de 0.36. La
probabilidad de que adquiera el trabajo dado que la compaa tenga inters, es de
0.88

a) Encuentra la probabilidad de que la persona adquiera el trabajo y la compaa
tenga inters.
b) Determina la probabilidad de que la compaa tenga inters dado que adquiri el
trabajo.
c) Son independientes los eventos la persona adquiera el trabajo y la compaa
tenga inters?

10. En una ciudad hay una alta incidencia de cirrosis entre la poblacin. Se sospecha
que se debe al alto ndice de consumo de alcohol. Se hacen estudios estadsticos
que asocian presencia de la enfermedad con consumo de alcohol. Se encuentra
que el 40% de la poblacin consume alcohol, el 20% padece la enfermedad y el 5%
consume alcohol y padece la enfermedad. Se verifica la creencia?

Respuestas a los ejercicios..

Pgina 6. G,A,F,E,D,B,H

Pgina 8. 1. Aleatoria, cualitativa, discreta
2. Aleatoria, cuantitativa, discreta.
3. Aleatoria, cuantitativa, discreta.
4. Determinstica, Cuantitativa, continua.
5. Aleatoria, cuantitativa, discreta.
6. Aleatoria, cualitativa, discreta.
7. Aleatoria, cualitativa, discreta.
8. Determinstica, cualitativa, discreta.
9. Determinstica, cuantitativa, discreta.
10. Aleatoria, cuantitativa, continua.









53
Pgina 11

Intervalo Frecuencia Marca de
clase
Lmites reales
de clase
Frecuencia
relativa
Frecuencia
acumulada

29 - 37
38 - 46
47 - 55
56 - 64
65 73

5
10
15
18
12

33
42
51
60
69

28.5 37.5
37.5 46.5
46.5 55.5
55.5 64.5
64.5 73.5


0.083
0.166
0.25
0.3
0.2

5
15
30
48
60


Pginas 22 a 25.
1.
5.6
3
x
Me
Mo No tiene
=
=
=
2.
2.5
2.5
x
Me
Mo No tiene
=
=
=
4. 9 x =
7.
7.5
7.5
x
Me
Mo No tiene
=
=
=
8. b) 9. a) 10. 5 x =

11. a) Categrica, nominal o cualitativa
b) con Toshiba

12. a) [ ) 22, 28 13. 8.8, 9, 9.2, 9.5 y 9.8 14. a) S
b) Mediana b) S
c) S

15.
$8363.63
$7000.00
$4166.67 $13000.00
x
Me
Mo y
=
=
=
16.
$8.175
$8.166
$8.361
x
Me
Mo
=
=
=
17.
150.516
150.5
150.4285
x cm
Me cm
Mo cm
=
=
=


18. $ 45.00 por Kg. 19. 63 Kg. 20. 9.5 Kg.

21. 8 reactivos. 22. Incorrecto, el correcto es 3.8928 cm.

Pginas 29 a 30
1. En la Ciudad de Washington ya que tiene 2.449 s =
2. Si los datos son iguales, no hay variacin.
3. a) La mejor variedad es la A porque su 3.88 x = , es la ms alta.
b) La variedad ms consistente es B porque su 0.557 s = es menor.
4. a) A b) A c) B
5. Al fabricante I porque su 0.0027 s =
6. 7.165 s puntos =
54
7.
2
$7.2943 $2.7008 s y s = =


Pgina 301 a 32
1.
Hay ms variabilidad en invierno porque su . . 0.217 CV =


2. b) 3. a)

Pgina 40 a 41.
1. b) La tabla muestra la estatura de un beb al nacer, X (cm), y el perodo de embarazo,
Y (das promedio).

X Y XY X
2
Y
2
48 277.1 13300.8 2304 76784.41
49 279.3 13685.7 2401 78008.49
50 281.4 14070.0 2500 79185.96
51 283.2 14443.2 2601 80202.24
52 284.8 14809.6 2704 81111.04
250 1405.8 70309.3 12510 395292.14

c) El coeficiente de correlacin de Pearson es r = 0.9978
d) Con m = 1.93 y b = 184.66
La recta tiene como ecuacin Y = 1.93X + 184.66
f) Si Y = 280 es el nmero de das de embarazo X = 49.398 cm. es la estatura del beb
g) Si X = 50.4 cm. es la estura del beb Y = 281.93 es el promedio de das de embarazo.


2. b) Tabla de Regresin del contenido de hierro Y de un mineral de hierro con densidad X.

X Y XY X
2
Y
2

2.8
3.0
3.2
3.2
3.4
27
30
30
34
36
75.6
90.0
96.0
108.8
122.4
7.84
9.00
10.24
10.24
11.56
729
900
900
1156
1296
15.6 157 492.8 48.88 4981

c) Coeficiente de correlacin es r = 0.91
d) Con m = 14.23 y b = 13
La ecuacin de la recta de regresin es Y = 14.23X 13
f) Si X = 2.9 es la densidad Y = 28.267 es el contenido de hierro.
g) Si Y = 31 es el contenido de hierro X = 3.092 es la densidad.







55
Pginas 50 a 52
1. a) { } , S guila sol = b) { } 2, 3, 4, 5, 6, 7,...24 S = c) { } , , , S gis blanco gis rojo gis amarillo gis azul =


2.
a)
118 34 152
( ) 0.5066
300 300 300
P A B = + = = U
b)
118 34 11 163
( ) 0.5433
300 300 300 300
P A B AB = + + = = U U
c)
245 118 96 267
( ( ) ) 0.89
300 300 300 300
P Rh A + = + = = U
d)
3
( ( ) ) 0.01
300
P Rh AB = = I
e)
114
114
300
( / ( )) 0.4653
245
245
300
P O Rh + = = =
f) No son independientes.

3. ( ) 0.8 0.8 0.64 P Encontrar Encontrar = = I

4. P(XyYyZ)=0.432

5. P=0.8666

6. a)
( ) 0.3 P Sin semilla =

b) ( ) 0.6 P Blanca =
c) ( ) 0.6 P Rosada o sin semilla =
d) ( / ) 0.333 P Rosada Sin semilla =
e) ( / ) 0.25 P Sin semilla Rosada =

7. a) P=0.4705
b)
9
17
P =
c)
21
170
P =
d)
36
85
P =
e)
1179
3094
P =

8. El 4%

9. a) 0.3168 P =
b) 0.4658 P =
c) No son independientes.

56
10. Se verifica la creencia.





BIBLIOGRAFIA RECOMENDADA PARA CONSULTA Y APOYO

DANIEL, W. D. (1981) Estadstica con aplicaciones a las Ciencias Sociales y a la Educacin.
Mc Graw -Hill. Mxico.

JOHNSON, R. (1990) Estadstica Elemental. Grupo Editorial Iberoamericano. Mxico.

SPIEGEL. Estadstica. Mc. Graw-Hill. Mxico.

STEVENSON, Williams J. Estadstica para Adminitracin y Economa. Harla. Mxico.

WILLOUGHBY, Stephen S. Probabilidad y Estadstica. Publicaciones Cultural. Mxico.

También podría gustarte