P. 1
Est Ad is Tic A

Est Ad is Tic A

|Views: 66|Likes:
Publicado porĐeivi's Mendez

More info:

Published by: Đeivi's Mendez on Nov 22, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

01/26/2013

pdf

text

original

NOTAS DE ESTAD´ıSTICA Y PROBABILIDAD

MG.SC. DAVID SIERRA PORTA
ACTUALIZADO AL 19 de abril de 2009
´
Indice general
Resumen 6
1. Introducci´ on a la Estad´ıstica 7
1.1. Peque˜ na definici´ on y algunos conceptos b´ asicos 7
1.2. Niveles de Medida 9
1.3. M´ etodos de recolecci´ on de datos 9
1.3.1. La entrevista 9
1.3.2. La encuesta 10
1.3.3. Cuestionario 11
1.3.4. La observaci´ on 12
2. La estad´ıstica descriptiva 13
2.1. Distribuciones de frecuencia 13
2.1.1. Terminolog´ıa adicional 13
2.1.2. Creando una tabla de frecuencias 14
2.1.3. Notaci´ on Matem´ atica 15
2.1.4. Frecuencia acumulada 15
2.1.5. La frecuencia relativa 16
2.1.6. Los histogramas 16
2.2. Medidas de Tendencia Central (MTC) 19
2.2.1. La Media Aritmetica 20
2.2.2. La Media 20
2.2.3. La Mediana 20
2.2.4. La moda 21
2.2.5. Propiedades de la media, mediana y moda 21
2.2.6. El promedio ponderado 22
2.2.7. Otros tipos de medias 22
2.2.8. Formas de las distribuciones de datos 24
2.3. Medidas de variaci´ on 25
2.3.1. Rango 26
2.3.2. La Varianza 26
1
2.3.3. La Desviaci´ on Est´ andar 27
2.3.4. La Desviaci´ on Media 27
2.3.5. Covarianza 28
2.3.6. Coeficiente de Correlaci´ on de Pearson 28
2.3.7. Coeficientes de asimetr´ıa y curtosis 29
2.4. Teorema que envuelven cuestiones sobre la Desviaci´ on Est´ andar 30
2.4.1. La regla emp´ırica 31
2.4.2. Teorema de Chebychev 31
2.5. Medidas de Posici´ on 31
2.5.1. Cuartiles 32
2.5.2. Deciles 32
2.5.3. Centiles o percentiles 33
2.6. Problemas de final de cap´ıtulo 33
3. M´ etodos cuantitativos de an´ alisis predictivo, regresi´ on 37
3.1. Correlaci´ on y regresi´ on 37
3.2. Distribuciones bidimensionales 37
3.3. La idea de la correlaci´ on 38
3.4. Encontrando la relaci´ on. Regresi´ on 40
3.4.1. El coeficiente de correlaci´ on 40
3.4.2. Regresi´ on lineal. El M´ etodo de los M´ınimos Cuadrados 41
4. An´ alisis Combinatorio 46
4.1. Introducci´ on 46
4.2. Permutaciones (u ordenaciones) con repetici´ on 47
4.3. Permutaciones (u ordenaciones) sin repetici´ on 47
4.4. Combinaciones 47
4.5. An´ alisis y Metodolog´ıa propuesta para la resoluci´ on de problemas de Teor´ıa de conteo 48
5. Probabilidad 49
5.1. Introducci´ on: La probabilidad 49
5.2. La probabilidad 51
5.3. Experimentos de Probabilidad 51
5.4. Calculando la probabilidad de un evento 53
5.4.1. Probabilidad Emp´ırica 53
5.4.2. Probabilidad cl´ asica 54
5.5. Axiomas de la probabilidad 54
5.6. Posibilidades y probabilidades 55
5.7. Propiedades de la probabilidad de eventos no elementales 56
5.8. Probabilidad condicionada 57
5.9. Probabilidad total 58
5.9.1. Teorema de la probabilidad total 58
5.10. Teorema de Bayes 58
5.11. Problemas de final de cap´ıtulo 59
6. Variable aleatoria y funci´ on de distribuci´ on 63
6.1. Introducci´ on 63
6.2. Variable aleatoria unidimensional 64
6.3. Variables discretas 64
6.4. Variables continuas 65
2
6.5. Caracter´ısticas de una v.a. 66
6.5.1. Definici´ on. (Esperanza Matem´ atica) 66
6.5.2. Definici´ on. (Varianza) 67
6.6. Inecuaci´ on de Chevyshev 67
6.7. Problemas de final de cap´ıtulo 68
7. Distribuciones de Probabilidad Binomial y Normal 70
7.1. Introducci´ on 70
7.2. La distribuci´ on binomial o de Bernoulli 70
7.2.1. El uso de las tablas de la distribuci´ on binomial 72
7.2.2. Probabilidades acumuladas 73
7.2.3. Media y desviaci´ on t´ıpica en una distribuci´ on binomial 74
7.3. La distribuci´ on Normal 74
7.3.1. Uso de las tablas de la distribuci´ on normal N(0; 1) 76
7.3.2. C´ alculo de otras probabilidades 77
7.3.3. C´ alculo de probabilidadesen normales N( ¯ x; σ) 79
7.3.4. Otro uso de las tablas 80
7.4. Relaci´ on entre la distribuci´ on binomial y la distribuci´ on normal 80
7.4.1. Teorema Central del L´ımite 81
3
´
Indice de figuras
2.1. As´ı luce un histograma de frecuencias. 18
2.2. Ejemplo de como debe construirse un histograma simple. 19
2.3. Muchas posibilidades para la construcci´ on del histograma. 19
2.4. Una distribuci´ on sim´ etrica. Ve´ ase la igual proporci´ on de barras con alturas aproximadas a ambos
lados de la media. 24
2.5. Una distribuci´ on sezgada a la derecha. Ve´ ase la desigual proporci´ on de barras con alturas
aproximadas a ambos lados de la media. 25
2.6. Una distribuci´ on sezgada a la izquierda. Ve´ ase la igual proporci´ on de barras con alturas
aproximadas a ambos lados de la media. 25
2.7. Una distribuci´ on uniforme. Las barras tienen aproximadamente la misma altura a ambos lados de
la media. 26
2.8. El coeficiente de correlaci´ on de Pearson establece la posibilidad de un ajuste de los puntos en la
muestra. 29
2.9. Distintas posibilidades de la forma del histograma en relaci´ on con el valor num´ erico de el
coeficiente de Fisher. 30
2.10. Distintas posibilidades de la forma del histograma en relaci´ on con el valor num´ erico de el
coeficiente de curtosis. 31
3.1. Ejemplo de de un diagrama de dispersi´ on o nube de puntos. 38
3.2. Regresi´ on lineal: Los puntos tienden a describirse a partir de una recta que los representa
aproximadamente a todos. 39
3.3. Regresi´ on lineal: la cantidad de intentos a medida que aumenta hace que el n´ umero de error
disminuya. 39
3.4. Regresi´ on lineal: Al parecer n existe relaci´ on entre la distancia a la que se vive de la Universidad
y la calificaci´ on que se obtiene. 40
3.5. Regresi´ on lineal: Al parecer n existe relaci´ on entre la distancia a la que se vive de la Universidad
y la calificaci´ on que se obtiene. 41
3.6. La curva de regresi´ on lineal en t´ erminos de los cambios de la funci´ on. 42
4
3.7. Representaci´ on de x(t) para un cuerpo que se mueve con movimiento uniformemente acelerado.
(a) A tiempos largos no se aprecia bien la curvatura de la curva y, dado que el coeficiente de
correlaci´ on lineal es muy cercano a la unidad, podr´ıa suponerse que la correlaci´ on es lineal. (b)
log(x) en funci´ on de log(t), de donde se deduce que la relaci´ on no es lineal sino cuadr´ atica. 45
4.1. Metodolog´ıa sencilla para la resoluci´ on de problemas. 48
7.1. Distribuci´ on de estaturas de 1400 mujeres. 74
7.2. Distribuci´ on normal N( ¯ x; σ). El m´ aximo est´ a en ( ¯ x,
1

2πσ
2
). 75
7.3. Distribuci´ on normal N(0; 1). El m´ aximo est´ a en (0,
1


). 76
7.4. Area encerrada por la curva normal desde −∞ hasta k. 76
7.5. p(Z > k). Basta pasar al complementario. 77
7.6. p(Z ≤−k).Las probabilidades de valores negativos no est´ an tabuladas. 78
7.7. p(Z ≤−k) = p(Z > k). La simetr´ıa permite reducir este caso al anterior. 78
7.8. p(Z >−k). 78
7.9. p(Z >−k) = p(Z ≤ k).La simetr´ıa permite reducir este caso al que ya est´ a tabulado. 78
7.10. p(k
1
≤ Z ≤ k
2
). Probabilidad comprendida entre dos valores. 79
7.11. p(Z ≤k
2
) en la primera imagen. p(Z ≤k
1
) en la segunda. Al restar obtenemos el ´ area pedida. 79
5
Resumen
Se presentan a continuaci´ on unas notas de Estad´ıstica Elemental y Fundamental, para el curso Estad´ıstica y
M´ etodos Num´ ericos de la Facultad Experimental de Ciencias de la Universidad del Zulia, LUZ, para la carrera
de F´ısica.
El objetivo del curso es que el alumno se familiarice con las herramientas anal´ıticas esenciales necesarias para
comprender el funcionamiento y las consecuencias de la aplicaci´ on de la teor´ıa estad´ıstica a la resoluci´ on de
problemas en f´ısica.
6
Cap´ıtulo 1
Introducci ´ on a la Estad´ıstica
1.1. Peque˜ na definici´ on y algunos conceptos b´ asicos
La Estad´ıstica es la ciencia de recoger o colectar, organizar, analizar e interpretar datos, en principio cualesquie-
ra. Existen dos tipos de estad´ısticas: Descriptiva: tabula, representa y describe una serie de datos que pueden
ser cuantitativos o cualitativos, sin sacar conclusiones, y la Inferencial: infiere propiedades de gran n´ umero de
datos recogidos de una muestra tomada de la poblaci´ on. La estad´ıstica descriptiva es una ciencia que analiza
series de datos (por ejemplo, edad de una poblaci´ on, altura de los estudiantes de una escuela, temperatura en los
meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.
Las variables pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir num´ ericamente (por ejemplo: nacionalidad, color
de la piel, sexo).
Variables cuantitativas: tienen valor num´ erico (edad, precio de un producto, ingresos anuales).
Las variables tambi´ en se pueden clasificar en:
Variables unidimensionales: s´ olo recogen informaci´ on sobre una caracter´ıstica (por ejemplo: edad de
los alunmos de una clase).
Variables bidimensionales: recogen informaci´ on sobre dos caracter´ısticas de la poblaci´ on (por ejemplo:
edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen informaci´ on sobre tres o m´ as caracter´ısticas (por ejemplo: edad,
altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: s´ olo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: n´ umero de hermanos (puede
ser 1, 2, 3....,etc, pero, por ejemplo, nunca podr´ a ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un
veh´ıculo puede ser 80,3 km/h, 94,57 km/h...etc.
7
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:
1. Individuo: cualquier elemento que porte informaci´ on sobre el fen´ omeno que se estudia. As´ı, si estu-
diamos la altura de los ni˜ nos de una clase, cada alumno es un individuo; si estudiamos el precio de la
vivienda, cada vivienda es un individuo.
2. Poblaci´ on: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten informaci´ on
sobre el fen´ omeo que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la
poblaci´ on ser´ a el total de las viviendas de dicha ciudad.
3. Muestra: subconjunto que seleccionamos de la poblaci´ on. As´ı, si se estudia el precio de la vivienda de
una ciudad, lo normal ser´ a no recoger informaci´ on sobre todas las viviendas de la ciudad (ser´ıa una labor
muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficiente-
mente representativo.
Por ejemplo, si estamos interesados en medir los salarios de todos los cient´ıficos de las universidades del pa´ıs,
el conjunto de datos que representan la poblaci´ on ser´ıa en este caso la lista de todos los salarios de cualquier
universidad en Venezuela. Una muestra podr´ıa ser obtenida seleccionando 10 universidades de una lista unos
cuantos estados seleccionados al azar con sus respectivos salarios, por su puesto.
A su vez, digamos que por ejemplo estuvi´ eramos interesados en conocer la opini´ on de la gente en Venezuela
acerca de la posibilidad o necesidad de incrementar la cantidad de puestos en los cuales de distribuye peri´ odico
a nivel nacional. Por su puesto, que la poblaci´ on estar´ a integrada por todas las respuestas de todos los ciudada-
nos del territorio nacional. Una muestra estar´ıa asegurada por ejemplo si tom´ asemos 1000 encuestas repartidas
en todos los estados deacuerdo con la densidad poblacional de cada uno, respondiendo a la pregunta en cuesti´ on.
Para medir en estad´ıstica es obvio que necesitaremos adem´ as una definici´ on para la cuantificaci´ on de las cosas o
fen´ omenos, de la misma manera como se hace una clasificaci´ on en la f´ısica para n´ umeros ordinarios y vectores.
Es decir, es importante, clasificar, qu´ e podemos medir y c´ omo, toda vez, que existe una clasificaci´ on para el
comportamiento de una variable. As´ı entonces tendremos que definir los tipos de medida:
Par´ ametro - una medida num´ erica hecha usando el conjunto de datos de la poblaci´ on en general,
estad´ıstico - un valor num´ erico soportado en el conjunto de datos del espacio muestral.
Por ejemplo: Usando el conjunto de datos que describen los salarios de los cient´ıficos, nosotros pudi´ eramos
calcular el salario promedio de los cient´ıficos que laboran en las universidades Venezolanas.
´
Este promedio cal-
culado debe tomarse por un par´ ametro. Mientras que si tomamos en cuenta la data proveniente de la escogencia
al azar de las 10 universidades, entonces, ´ ete valor debe nombrarse como un estad´ıstico.
Es por su puesto, muy sencillo darse cuenta que la poblaci´ on es un conjunto mucho m´ as grande que la muestra.
Adem´ as, debe advertirse que si la poblaci´ on tomada y seleccionada es muy grande, entonces probeblemente
ser´ a imposible poder calcular par´ ametros de alg´ un inter´ es particular. A menos que la poblaci´ on sea bastante pe-
que˜ na calcular ser´ıa muy dif´ıcil. Sin embargo, seleccionar poblaciones muy peque˜ nas es problem´ atico, adem´ as
de peligroso, y miente en el sentido cient´ıfico. En esencia, la idea general es poder seleccionar siempre mues-
tras, m´ as peque˜ nas, por su puesto, que la poblaci´ on y encontrar o calcular estad´ısticos muestrales que pudieran
dar explicaciones preliminares de lo que pasa en la data total o poblaci´ on. La idea fundamental es usar ´ estos
estad´ısticos para inferir o estimar los par´ ametros poblacionales, que es lo que en realidad importa.
8
La pericia de los cient´ıficos se encuentra en tratar de construir buenas muestras a partir de poblaciones muy
grandes, tales que los estad´ısticos calculados a partir de ´ estas muestras, sean buenas para estimar los par´ ametros
necesarios. Desafortunadamente, estimar estad´ısticos nunca es 100% seguro, pero si que podr´ıa ser en alguna
medida cercana.
1.2. Niveles de Medida
Existen varios seg´ un los valores que toman los datos.
1. Datos nominales: pueden ser del tipo cualitaticos s´ olamente. Los valores para los datos sirven para
etiquetar, pero las etiquetas no tienen atributo de orden. Por ejemplo: el tipo de sangre, el grado de
estudio, el tipo de raza, el tipo de bacteria en el intestino de una cierta especie de pescado.
2. Datos ordinales: pueden tanto de tipo cualitativos como cuantitativos. Los valores atribuidos a los datos
son etiquetas, pero a diferencia de los anteriores, para ´ estos si est´ a prescrito un orden en particular. Por
ejemplo: las posiciones del torneo de futbol profesional Venezolano, el nivel de sensura de uan pel´ıcula.
3. Datos intervalos: s´ olo son cuantitativos. Los valores que toman los datos son num´ ericos, tienen un orden
natural y la diferencia entre los valores que toman los datos son significativas. Por ejemplo: la temperatura,
el a˜ no de naciemiento.
4. Datos raz´ on: son siempre cuantitativos. Los valores son num´ ericos, tienen orden, y la tanto la diferencia
como la raz´ on entre los valores son significativas. Por ejemplo, el peso de una persona, el volumen.
1.3. M´ etodos de recolecci´ on de datos
La recolecci´ on de datos se refiere al uso de una gran diversidad de t´ ecnicas y herramientas que pueden ser
utilizadas por el analista para desarrollar los sistemas de informaci´ on, los cuales pueden ser la entrevistas, la
encuesta, el cuestionario, la observaci´ on, el diagrama de flujo y el diccionario de datos.
Todas estos instrumentos se aplicar´ a en un momento en particular, con la finalidad de buscar informaci´ on que
ser´ a ´ util a una investigaci´ on en com´ un. En la presente investigaci´ on trata con detalle los pasos que se debe seguir
en el proceso de recolecci´ on de datos, con las t´ ecnicas ya antes nombradas.
Los analistas utilizan una variedad de m´ etodos a fin de recopilar los datos sobre una situaci´ on existente, como
entrevistas, cuestionarios, inspecci´ on de registros (revisi´ on en el sitio) y observaci´ on. Cada uno tiene ventajas y
desventajas. Generalmente, se utilizan dos o tres para complementar el trabajo de cada una y ayudar a asegurar
una investigaci´ on completa.
1.3.1. La entrevista
Las entrevistas se utilizan para recabar informaci´ on en forma verbal, a trav´ es de preguntas que propone el analis-
ta. Quienes responden pueden ser gerentes o empleados, los cuales son usuarios actuales del sistema existente,
9
usuarios potenciales del sistema propuesto o aquellos que proporcionar´ an datos o ser´ an afectados por la apli-
caci´ on propuesta. El analista puede entrevistar al personal en forma individual o en grupos algunos analistas
prefieren este m´ etodo a las otras t´ ecnicas que se estudiar´ an m´ as adelante. Sin embargo, las entrevistas no siem-
pre son la mejor fuente de datos de aplicaci´ on.
Dentro de una organizaci´ on, la entrevistas es la t´ ecnica m´ as significativa y productiva de que dispone el analista
para recabar datos. En otras palabras, la entrevistas es un intercambio de informaci´ on que se efect´ ua cara a cara.
Es un canal de comunicaci´ on entre el analista y la organizaci´ on; sirve para obtener informaci´ on acerca de las
necesidades y la manera de satisfacerlas, as´ı como concejo y comprensi´ on por parte del usuario para toda idea
o m´ etodo nuevos. Por otra parte, la entrevista ofrece al analista una excelente oportunidad para establecer una
corriente de simpat´ıa con el personal usuario, lo cual es fundamental en transcurso del estudio.
Realizar entrevistas toma tiempo; por lo tanto no es posible utilizar este m´ etodo para recopilar toda la infor-
maci´ on que se necesite en la investigaci´ on; incluso el analista debe verificar los datos recopilados utilizando
unos de los otros m´ etodos de recabaci´ on de datos. La entrevista se aplican en todos los niveles gerencial y de
empleados y dependa de quien pueda proporcionar la mayor parte de la informaci´ on ´ util para el estudio los
analistas que estudian la administraci´ on de inventarios pueden entrevistar a los trabajadores del embarque y de
recepci´ on, al personal de almac´ en y a los supervisores de los diferentes turnos, es decir. Aquellas personas que
realmente trabajan en el almac´ en, tambi´ en entrevistar´ an a los gerentes m´ as importante.
La habilidad del entrevistador es vital para el ´ exito en la b´ usqueda de hecho por medio de la entrevista. Las
buenas entrevista depende del conocimiento del analista tanto de la preparaci´ on del objetivo de una entrevista
espec´ıfica como de las preguntas por realizar a una persona determinada.
1.3.2. La encuesta
Hoy en d´ıa la palabra “encuesta” se usa m´ as frecuentemente para describir un m´ etodo de obtener informaci´ on
de una muestra de individuos. Esta “muestra” es usualmente s´ olo una fracci´ on de la poblaci´ on bajo estudio.
Por ejemplo, antes de una elecci´ on, una muestra de electores es interrogada para determinar c´ omo los candida-
tos y los asuntos son percibidos por el p´ ublico - un fabricante hace una encuesta al mercado potencial antes de
introducir un nuevo producto - una entidad del gobierno comisiona una encuesta para obtener informaci´ on para
evaluar legislaci´ on existente o para preparar y proponer nueva legislaci´ on.
No tan s´ olo las encuestas tienen una gran variedad de prop´ ositos, sino que tambi´ en pueden conducirse de mu-
chas maneras, incluyendo por tel´ efono, por correo o en persona. A´ un as´ı, todas las encuestas tienen algunas
caracter´ısticas en com´ un.
A diferencia de un censo, donde todos los miembros de la poblaci´ on son estudiados, las encuestas recogen in-
formaci´ on de una porci´ on de la poblaci´ on de inter´ es, dependiendo el tama˜ no de la muestra en el prop´ osito del
estudio. En una encuesta bona fide, la muestra no es seleccionada caprichosamente o s´ olo de personas que se
ofrecen como voluntarios para participar. La muestra es seleccionada cient´ıficamente de manera que cada per-
sona en la poblaci´ on tenga una oportunidad medible de ser seleccionada. De esta manera los resultados pueden
10
ser proyectados con seguridad de la muestra a la poblaci´ on mayor. La informaci´ on es recogida usando proce-
dimientos estandarizados de manera que a cada individuo se le hacen las mismas preguntas en mas o menos
la misma manera. La intenci´ on de la encuesta no es describir los individuos particulares quienes, por azar, son
parte de la muestra sino obtener un perfil compuesto de la poblaci´ on.
El tama˜ no de muestra requerido en una encuesta depende en parte de la calidad estad´ıstica necesaria para los
establecer los hallazgos; esto a su vez, est´ a relacionado en c´ omo esos hallazgos ser´ an usados.
A´ un as´ı, no hay una regla simple para el tama˜ no de muestra que pueda ser usada en todas las encuestas. Mucho
de esto depende de los recursos profesionales y fiscales disponibles. Los analistas frecuentemente encuentran
que una muestra de tama˜ no moderado es suficiente estad´ıstica y operacionalmente. Por ejemplo, las muy co-
nocidas encuestas nacionales frecuentemente usan cerca de 1,000 personas para obtener informaci´ on razonable
sobre actitudes y opiniones nacionales.
1.3.3. Cuestionario
Los cuestionarios proporcionan una alternativa muy ´ util para la entrevista; si embargo, existen ciertas carac-
ter´ısticas que pueden ser apropiada en algunas situaciones e inapropiadas en otra. Al igual que la entrevistas,
deben dise˜ narse cuidadosamente para una m´ axima efectividad.
Recabaci´ on de datos mediante cuestionarios. Para los analistas los cuestionarios pueden ser la ´ unica forma
posible de relacionarse con un gran n´ umero de personas para conocer varios aspectos del sistema. Cuando se
llevan a cabo largos estudios en varios departamento, se puede distribuir los cuestionarios a todas las personas
apropiadas para recabar hechos en relaci´ on al sistema. En mayor parte de los casos, el analista no ver´ a a los que
responde; no obstante, tambi´ en esto es una ventaja porque aplican muchas entrevista ayuda a asegurar que el
interpelado cuenta con mayor anonimato y puedan darse respuestas mas honesta ( y menos respuestas prehechas
o estereotipadas). Tambi´ en las preguntas estandarizadas pueden proporcionar datos m´ as confiable.
Selecci´ on de formas para cuestionarios. El desarrollo y distribuci´ on de los cuestionarios; por lo tanto, el tiem-
po invertido en esto debe utilizarse en una forma inteligente. Tambi´ en es importante el formato y contenido de
las preguntas en la recopilaci´ on de hechos significativos.
Existen dos formas de cuestionarios para recabar datos: cuestionarios abiertos y cerrados, y se aplican depen-
diendo de si los analistas conocen de antemano todas las posibles respuestas de las preguntas y pueden incluirlas.
Con frecuencia se utilizan ambas formas en los estudios de sistemas.
Cuestionario Abierto. Al igual que las entrevistas, los cuestionarios pueden ser abiertos y se aplican cuando se
quieren conocer los sentimientos, opiniones y experiencias generales; tambi´ en son ´ utiles al explorar el problema
b´ asico, por ejemplo, un analista que utiliza cuestionarios para estudiar los m´ etodos de verificaci´ on de cr´ edito,
es un medio.El formato abierto proporciona una amplia oportunidad para quienes respondan escriba las razones
de sus ideas. Algunas personas sin embargo, encuentran m´ as f´ acil escoger una de un conjunto de respuestas
preparadas que pensar por s´ı mismas.
11
Cuestionario Cerrado. El cuestionario cerrado limita las respuestas posibles del interrogado. Por medio de un
cuidadoso estilo en la pregunta, el analista puede controlar el marco de referencia. Este formato es el m´ etodo
para obtener informaci´ on sobre los hechos. Tambi´ en fuerza a los individuos para que tomen una posici´ on y
forma su opini´ on sobre los aspectos importantes.
1.3.4. La observaci´ on
Otra t´ ecnica ´ util para el analista en su progreso de investigaci´ on, consiste en observar a las personas cuan-
do efect´ uan su trabajo. Como t´ ecnica de investigaci´ on, la observaci´ on tiene amplia aceptaci´ on cient´ıfica. Los
soci´ ologos, sic´ ologos e ingenieros industriales utilizan extensamente ´ esta t´ ecnica con el fin de estudiar a las
personas en sus actividades de grupo y como miembros de la organizaci´ on. El prop´ osito de la organizaci´ on es
m´ ultiple: permite al analista determinar que se est´ a haciendo, como se est´ a haciendo, quien lo hace, cuando se
lleva a cabo, cuanto tiempo toma, d´ onde se hace y por que se hace.
El analista de sistemas puede observar de tres maneras b´ asicas. Primero, puede observar a una persona o actitud
sin que el observado se d´ e cuenta y su interacci´ on por aparte del propio analista. Quiz´ a esta alternativa tenga poca
importancia para el an´ alisis de sistemas, puesto que resulta casi imposible reunir las condiciones necesarias.
Segundo, el analista puede observar una operaci´ on sin intervenir para nada, pero estando la persona observada
enteramente consciente de la observaci´ on. Por ´ ultimo, puede observar y a la vez estar en contacto con las
personas observas. La interacci´ on puede consistir simplemente en preguntar respecto a una tarea espec´ıfica,
pedir una explicaci´ on, etc.
12
Cap´ıtulo 2
La estad´ıstica descriptiva
2.1. Distribuciones de frecuencia
Una distribuci´ on de frecuencias es una tabla usada para describir un conjunto de datos. Una tabla de frecuen-
cias muestra datos particulares o intervalos o rangos de datos llamados clases de datos. En el caso de mostrar
intervalos de datos, se define un valor, que consistir´ aen el el valor que representa a dicha clase, usualmente es
llamado marca de clase. Adem´ as la tabla de frecuencias muestra un n´ umero a continuaci´ on del dato o marca de
clase, que representa el n´ umero de veces que ´ este valor se repite en la data, a ´ este n´ umero se le llama frecuencia,
o frecuencia de la clase.
Por ejemplo: sup´ ongase que 20 estudiantes de estad´ıstica poseen las siguientes notas a continuaci´ on en una
escala de 0 a 100 puntos: 97, 92, 88, 75, 83, 67, 89, 55, 72, 78, 81, 91, 57, 63, 67, 74, 87, 84, 98, 46. Puede
construirse una tabla de frecuencias para cada nota, as´ı en ´ esta tabla tendr´ıamos unas 100 filas aproximadamente.
Para resumir espacio pudiera organizarse todo en clases tales como 90-99, 80-89, 70-79 etc. y contando el
n´ umero de datos pertenecientes a cada intervalo. As´ı obtendr´ıamos algo como sigue:
Intervalo Marca de Clase Frecuencia
90-99 94.5 4
80-89 84.5 6
70-79 74.5 4
60-69 64.5 3
50-59 54.5 2
40-49 44.5 1
Note que la suma de la columnas de frecuencias es igual a 20, el n´ umero de todos los datos existentes.
2.1.1. Terminolog´ıa adicional
1. L´ımite inferior de clase: es el menor valor en el intervalo de clase. Lo denotaremos como L
i
.
2. L´ımite superior de clase: es el mayor valor en el intervalo de clase. Lo denotaremos como L
s
.
13
3. Ancho de clase: es la diferencia entre dos l´ımites de clases superiores (o inferiores) consecutivos. Todos
las clases deber´ıan tener el mismo ancho.
4. Marca de clase: es por lo general el valor medio de los datos de cada intervalo. Pudiera escogerse otro
criterio para definir la marca de clase, no tiene mucha importancia, sin embargo, cualquiera sea la esco-
gencia que se haga, lo importante es que ´ este dato represente todo el intervalo de clase. Lo denotaremos
por L
c
.
L
c
=
L
i
+L
s
2
. (2.1)
Ejemplo: Para la tabla de frecuencias anterior de las notas de los ex´ amenes de estad´ıstica, se tiene que: los
l´ımites superiores de clase son: 99, 89, 79, 69, 59, y 49; los l´ımites inferiores de clase son: 90, 80, 70, 60, 50, y
40. Las marcas de clase son: 94.5, 84.5, 74.5, 64.5, 54.5, y 44.5. El ancho de cada clase es 10.
2.1.2. Creando una tabla de frecuencias
Para crear table de frecuencias es necesario seguir los pasos a continuaci´ on.
1. Lo m´ as importantes es contar o disponer de alguna data que sea de utilidad y con la cual se quisiera
estimar algunos valores y/o caracter´ısticas importantes de inter´ es.
2. Decidir deacuerdo al n´ umero de datos y las caracter´ısticas de los mismos las clases necesarias para opti-
mizar los resultados y agilizar los c´ alculos seguidos.
3. Dividir el rango de la data por el n´ umero de clases para obtener un estimado del ancho de las clases.
Rango = Mayor valor −Menor valor. (2.2)
4. Decidir los l´ımites de las clases.
5. Construir la tabla de frecuencia contando el n´ umero de datos en cada uno de los intervalos de clase.
El n´ umero de tramos en los que se agrupa la informaci´ on es una decisi´ on que debe tomar el analista: la regla
es que mientras m´ as tramos se utilicen menos informaci´ on se pierde, pero puede que menos representativa e
informativa sea la tabla.
Ejercicio: Construiremos a continuaci´ on una tabla de frecuencias con 6 marcas de clases o intervalos de
clase para la data siguiente. Los datos se corresponden con los montos pagados por 28 conductores diferentes
en una estaci´ on de gasolina, por el consumo de la misma. Los montos son en Bol´ıvares Fuertes (Bs.F): 7, 4, 18,
4, 9, 8, 8, 7, 6, 2, 9, 5, 9, 12, 4, 14, 15, 7, 10, 2, 3, 11, 4, 4, 9, 12, 5, 3.
Soluci´ on: En este caso se tendr´ a como dato que se quiere hacer una tabla que tenga ni m´ as ni menos 6 initervalos
de clase, por tanto, observando la data nos daremos cuenta que el menor monto pagado es 2 mientras que el
mayor es 18, por tanto, el rango de la clase ser´ a aproximadamente 18−2 =16, y por tanto para estimar el ancho
de cada clase dividimos el n´ umero calculado anteriormente entre el n´ umero de clases dispuesto, as´ı cada clase
tendr´ a un ancho de
16
6
= 2,66. Tendremos en definitiva algo como lo que sigue:
14
Clase Intervalo Marca de Clase Frecuencia
Clase I 1-3 2 4
Clase II 4-6 5 8
Clase III 7-9 8 9
Clase IV 10-12 11 4
Clase V 13-15 14 2
Clase VI 16-18 17 1
2.1.3. Notaci´ on Matem´ atica
En lo que sigue se usar´ a la siguiente simbolog´ıa y las siguientes variables que usaremos para referirnos a objetos
o valores que definiremos en adelante, a menos que se indique otra cosa.
Representaremos los valores que toma una cierta variable en una cierta data como x, n representar´ a el n´ umero de
valores en el conjunto de datos muestrales, N el n´ umero de valores en el conjunto poblacional, y f la frecuencia
de cada datos o cada marca de clase. Como siempre usaremos la simbolog´ıa ∑ para indicar la suma de todos los
valores de una variable o expresi´ on.
Usando ´ esta notaci´ on, y de manera obvia, pudiera escribirse la sentencia de que la suma de todas las frecuencias
en la tabla de frecuencias es igual al n´ umero de valores en el conjunto de los datos,
N

i=1
f
i
= n. (2.3)
2.1.4. Frecuencia acumulada
La frecuencia acumulada de una clase de datos es el n´ umero de elementos que existe en esa clase y todos los
de las clases previas. En otras palabras, la frecuencia acumulada de una clase es la frecuencia de la clase m´ as
todas las frecuencias de las clases anteriores a ´ esta. Puede ser tanto decreciente como creciente, si se acumulan
las frecuencias desde la ´ ultima clase o la primera clase respectivamente.
Ejemplo: En la data presentada acerca de las notas de los ex´ amenes de estad´ıstica puediera construirse la
siguiente tabla de frecuencias acumuladas:
Clase Intervalo Marca de Clase Frecuencia Frec. Acumulada ↑ Frec. Acumulada ↓
I 90-99 94.5 4 4 20
II 80-89 84.5 6 10 16
III 70-79 74.5 4 14 10
IV 60-69 64.5 3 17 6
V 50-59 54.5 2 19 3
VI 40-49 44.5 1 20 1
N´ otese que la ´ ultima entrada en la columna de la frecuencia acumulada creciente es justamente n = 20, lo mis-
mo sucede para la frecuencia acumulada decreciente.
Ejercicio: A˜ nadiremos a la tabla de frecuencias para el caso de los consumos de gasolina, dos nuevas colum-
15
nas para la frecuencia acumulada creciente y decreciente respectivamente.
Soluci´ on: Tendremos en definitiva algo como lo que sigue:
Clase Intervalo Marca de Clase Frecuencia Frec. Acumulada ↑ Frec. Acumulada ↓
Clase I 1-3 2 4 4 28
Clase II 4-6 5 8 12 24
Clase III 7-9 8 9 21 16
Clase IV 10-12 11 4 25 7
Clase V 13-15 14 2 27 3
Clase VI 16-18 17 1 28 1
2.1.5. La frecuencia relativa
La frecuencia relativa de un dato o marca de clase se define como el porcentaje de elementos en esa clase en
relaci´ on con el total de datos de la muestra. Se denota por f
ri
. Es sencillo calcular la frecuencia relativa como:
f
ri
=
f
i
n
. (2.4)
En vista que el n´ umero f
i
es siempre menor que n, por razones m´ as que obvias, es entonces inmediato que f
ri
es un n´ umero que puede oscilar entre los valores 0 y 1, es decir, 0 ≤ f
ri
≤ 1. Adicionalmente pudiera definirse
la frecuencia relativa porcentual como:
f
ri
% = f
ri
×100%. (2.5)
Ejemplo: Para la tabla anterior tendremos:
Clase Intervalo Marca de Clase Frec. Frec. Acum. ↑ Frec. Relat.
Clase I 1-3 2 4 4 .142
Clase II 4-6 5 8 12 .285
Clase III 7-9 8 9 21 .321
Clase IV 10-12 11 4 25 .142
Clase V 13-15 14 2 27 .071
Clase VI 16-18 17 1 28 .035
Note que la suma de todas las frecuencias relativas en la columna, suma aproximadamente 1, coincidente con el
hecho de que existe una posibilidad de 100% de que pudiera ocurrier “cualquiera” de las cosas que describen
la data, si pasa alguna de ellas, por su puesto.
2.1.6. Los histogramas
Un histograma es una representaci´ on gr´ afica de una variable en forma de barras, donde la superficie de cada ba-
rra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias,
y en el eje horizontal los valores de las variables, normalmente se˜ nalando las marcas de clase, es decir, la mitad
del intervalo en el que est´ an agrupados los datos. Un histograma es un resumen gr´ afico de la variaci´ on de un
conjunto de datos. La naturaleza gr´ afica del histograma nos permite ver pautas que son dif´ıciles de observar en
una simple tabla num´ erica. Esta herramienta se utiliza especialmente en la Comprobaci´ on de teor´ıas y Pruebas
16
de validez.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por co-
modidad, sus valores se agrupan en clases, es decir, valores contiguos. En los casos en los que los datos son
cualitativos (no-num´ ericos), como sexo, grado de acuerdo o nivel de estudios, es preferible un diagrama de
sectores.
Sabemos que los valores var´ıan en todo conjunto de datos. Esta variaci´ on sigue cierta pauta. El prop´ osito del
an´ alisis de un histograma es, por un lado, identificar y clasificar la pauta de variaci´ on, y por otro desarrollar
una explicaci´ on razonable y relevante de la pauta. La explicaci´ on debe basarse en los conocimientos generales
y en la observaci´ on de las situaciones espec´ıficas y debe ser confirmada mediante un an´ alisis adicional. Las
pautas habituales de variaci´ on m´ as comunes son la distribuci´ on en campana, con dos picos, plana, en peine,
sesgada, truncada, con un pico aislado, o con un pico en el extremo. Los histogramas son m´ as frecuentes en
ciencias sociales, humanas y econ´ omicas que en ciencias naturales y exactas. Y permite la comparaci´ on de los
resultados de un proceso.
Construcci´ on de un histograma
1. Paso 1: Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.
2. Paso 2: Obtener el n´ umero de clases, existen varios criterios para determinar el n´ umero de clases (o
barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es exacto. Algunos autores
recomiendan de cinco a quince clases, dependiendo de c´ omo est´ en los datos y cu´ antos sean. Un criterio
usado frecuentemente es que el n´ umero de clases debe ser aproximadamente a la ra´ız cuadrada del n´ umero
de datos. Por ejemplo, la ra´ız cuadrada de 30 ( n´ umero de art´ıculos) es mayor que cinco, por lo que se
seleccionan seis clases.
3. Paso 3: Establecer la longitud de clase: es igual al rango entre el n´ umero de clases.
4. Paso 4: Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en
relaci´ on al resultado del PASO 2 en intervalos iguales.
5. Paso 5: Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace un
gr´ afico de barras, las bases de las barras son los intervalos de clases y altura son la frecuencia de las clases.
Si se unen los puntos medios de la base superior de los rect´ angulos se obtiene el pol´ıgono de frecuencias.
Ejemplo: A una fabrica de envases de vidrio, un cliente le est´ a exigiendo que la capacidad de cierto tipo de
botella sea de 13 ml, con una tolerancia de m´ as menos 1 ml. La f´ abrica establece un programa de mejora de
calidad para que las botellas que se fabriquen cumplan con los requisitos del cliente. Al realizar el muestreo se
obtienen los siguientes datos de las capacidades de botellas al azar: 11, 12, 13, 12, 13, 14, 14, 15, 11, 12, 13,
12, 14, 15, 11, 12, 16, 16, 14, 13, 14, 14, 13, 15, 15.
En ´ este caso puede seguirse los pasos anteriormente explicitados y entonces:
Rango = Mayor valor −Menor valor = 16 −11 = 5.
# de clases =

25 = 5.
Longitud de la clase =
5
5
= 1.
17
Se tiene entonces:
Clase Intervalo Marca de Clase Frec. Frec. Acum. ↑ Frec. Relat.
Clase I 11-12 11.5 3 3 .12
Clase II 12-13 12.5 5 8 .20
Clase III 13-14 13.5 5 13 .20
Clase IV 14-15 14.5 6 19 .24
Clase V 15-16 15.5 6 25 .24
El histograma de frecuencias se muestra a continuaci´ on:
Figura 2.1: As´ı luce un histograma de frecuencias.
Ejemplos de otros tipos de representaciones gr´ aficas
Hay histogramas donde se agrupan los datos en clases, y se cuenta cu´ antas observaciones (frecuencia absoluta)
hay en cada una de ellas. En algunas variables (variables cualitativas) las clases est´ an definidas de modo natural,
por ejemplo, sexo con dos clases: mujer, var´ on o grupo sangu´ıneo con cuatro: A, B, AB, O. En las variables
cuantitativas, las clases hay que definirlas expl´ıcitamente (intervalos de clase).
Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuencias, absolutas o relativas,
en el de ordenadas (eje vertical).
Varias posibilidades:
Un pol´ıgono de frecuencias es un gr´ afico de linea que representa la informaci´ on de la tabla de frecuencias. Justo
como los histogramas, el eje vertical representa las frecuencias, que pueden ser tambi´ en las relativas, mientras
que el eje horizontal representa la medici´ on de la variable en el conjunto de datos. Para construir el gr´ afico,
un punto es dibujado por cada marca de clase, en el caso del histograma es el punto en la parte m´ as alta de la
barra y en la mitad de la misma, ´ este punto representa, por su puesto, la frecuencia de la clase. Para terminar
se conectan todos los puntos con lineas rectas. Los pol´ıgonos de frecuencias ser´ a de mucha utilidad luego para
estimar la curva de predicci´ on y para estimar el tipo de distribuci´ on particular que sigue el fen´ omeno.
18
Figura 2.2: Ejemplo de como debe construirse un histograma simple.
Figura 2.3: Muchas posibilidades para la construcci´ on del histograma.
2.2. Medidas de Tendencia Central (MTC)
Una Medida de Tendencia Central es un valor usado para representar el “promedio” t´ıpico en el conjunto de los
datos.
19
Al describir grupos de observaciones, con frecuencia se desea describir el grupo con un solo n´ umero. Para tal
fin, desde luego, no se usar´ a el valor mas elevado ni el valor mas peque˜ no como ´ unico representante, ya que solo
representan los extremos. Mas bien que valores t´ıpicos. Entonces ser´ıa mas adecuado buscar un valor central.
Las medidas que describen un valor t´ıpico en un grupo de observaciones suelen llamarse medidas de tenden-
cia central..Es importante tener en cuenta que estas medidas se aplican a grupos mas bien que a individuos.
un promedio es una caracter´ıstica de grupo, no individual. Entre las medidas de tendencia se encuentran las
siguientes.
2.2.1. La Media Aritmetica
La medida de tendencia central mas obvia que se puede elegir, es el simple promedio de las observaciones
del grupo, es decir el valor obtenido sumando las observaciones y dividiendo esta suma por el n´ umero de
observaciones que hay en el grupo. La media resume en un valor las caracter´ısticas de una variable teniendo en
cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas
2.2.2. La Media
La suma de todos los valores de el conjunto de datos dividido por el n´ umero de valores en la data es lo que
se conoce como la media. La media para el espacio muestral es denotada por ¯ x mientras que la media para la
poblaci´ on es denotada porla letra griega µ.
¯ x =

n
i=1
x
i
n
, para los valores de la muestra, (2.6)
µ =

N
i=1
x
i
N
, para los valores de la poblaci´ on. (2.7)
Ejemplo: El promedio o la media de los resultados en un examen de f´ısica cuyas notas han sido: 10, 15, 17,
7, 16, 8, 10, 19, 15, 10, 8; es:
¯ x =

n
i=1
x
i
n
=
135
11
= 12,27.
Ejercicio: Calcular la media de cada uno de los ejemplos explicitados en las secciones anteriores.
2.2.3. La Mediana
La mediana es un valor el cual separa el 50 % de los valores mayores de la data del 50 % restante menor. Para
calcular la mediana, lo m´ as sencillos es localizar todos los datos en orden, y entonces buscar el punto medio de
los mismos. Si n es impar, el valor medio ser´ a justamente la mediana; por el contrario si n es par, entonces la
mediana ser´ a el valor medio de los dos valores centrales. Utilizaremos como notaci´ on la siguiente para referir-
nos a ´ este valor, x
0,5
.
Ejemplo: La mediana para el conjunto de datos de las notas del examen de f´ısica puede calcularse ordenando
as´ı:
7, 8, 8, 10, 10, 10, 15, 15, 16, 17, 19 (2.8)
20
vemos el n = 11, por tanto la mediana es el dato del centro de esta distribuci ´ on ordeada, el cual es el dato con
el orden 6to, es decir x
0,5
= 10.
Ejercicio: Calcular la mediana de cada uno de los ejemplos explicitados en las secciones anteriores.
2.2.4. La moda
De todos los valores de la data, la moda resulta ser el valor que aparece repetida el mayor n´ umero de veces
en el conjunto, o lo que es lo mismo, el dato con mayor frecunecia. Pudiera pasar que dos o varios datos se
repitieran con la misma frecuencia, en este caso, se considera llamar a la distribuci´ on con un nombre particular
en virtud de cuantos valores moda existan, asi, si s´ olo un valor es que el tiene mayor frecuencia, entonces, a
esta distribuci´ on se le llamar´ a unimodal; si tiene dos modas, entonces, se le llamar´ a bimodal y si tiene m´ as se le
llamar´ a polimodal.
Ejemplo: La moda para el conjunto de datos de las notas del examen de f´ısica puede calcularse ordenando
as´ı:
7, 8, 8, 10, 10, 10, 15, 15, 16, 17, 19 (2.9)
vemos el dato con mayor frecuencia es el 10, por tanto la moda es el 10.
Ejercicio: Calcular la moda de cada uno de los ejemplos explicitados en las secciones anteriores.
2.2.5. Propiedades de la media, mediana y moda
Propiedades de la media
1. La media es la m´ as com´ un de todas las medidas de tendencia central usadas para el an´ alisis de los datos.
2. Todo conjunto de datos de nivel de intervalo y de nivel de raz´ on tiene un valor medio.
3. Al evaluar la media se incluyen todos los valores.
4. Un conjunto de datos s´ olo tiene una media. Esta es un valor ´ unico.
5. La media es una medida muy ´ util para comparar dos o m´ as poblaciones.
6. La media es la ´ unica medida de ubicaci´ on donde la suma de las desviaciones de cada valor con respecto
a la media, siempre ser´ a cero.
n

i=1
(x
i
− ¯ x) = 0. (2.10)
7. La media podr´ıa no ser un promedio adecuado para representar datos no regulares. La media se ve afec-
tada de modo notable por valores extraordinariamente grandes o peque˜ nos.
8. No se puede determinar la media de datos de extremo abierto (Ej: U$S 100.000 y mayor).
Propiedades de la mediana
1. Es ´ unica, s´ olo existe una mediana para un conjunto de datos.
2. No se ve afectada por valores muy grandes o muy peque˜ nos.
3. Puede calcularse para una distribuci´ on de frecuencias con una clase de extremo abierto, si la medina no
se encuentra en una clase de tal extremo.
4. Puede obtenerse para datos de nivel de raz´ on, de intervalo y ordinal (excepto para el nominal).
21
Propiedades de la moda
1. Puede determinarse para todos los niveles de datos: nominal, ordinal, de intervalo y de raz´ on.
2. No se ve afectada por valores muy altos o muy bajos.
3. Al igual que la mediana, puede utilizarse como medida de tendencia central para distribuciones con clases
de extremo abierto.
4. Para muchos conjuntos de datos no hay valor modal porque ning´ un valor aparece m´ as de una vez.
5. Para algunos conjuntos de datos hay m´ as de una moda (bimodal = que tiene dos modas).
2.2.6. El promedio ponderado
Es un caso especial de la media aritm´ etica. Se denomina media ponderada de un conjunto de n´ umeros al resul-
tado de multiplicar cada uno de los n´ umeros por un valor particular para cada uno de ellos, llamado su peso,
obteniendo a continuaci´ on la suma de estos productos, y dividiendo el resultado de esta suma de productos entre
la suma de los pesos seg´ un la caracter´ıstica de cada n´ umero inicial. Este “peso” depende de la importancia o
significancia de cada uno de los valores.
Para una serie de datos, X =x
1
, x
2
, ..., x
n
, a la que corresponden los pesos W =w
1
, w
2
, ..., w
n
, la media ponderada
se calcula como:
¯ x
W
=

n
i=1
x
i
w
i

n
i=1
w
i
, (2.11)
o:
¯ x
W
=
x
1
w
1
+x
2
w
2
+x
3
w
3
+... +x
n
w
n
w
1
+w
2
+w
3
+... +w
n
. (2.12)
Un ejemplo es la obtenci´ on de la media ponderada de las notas de una oposici´ on en la que se asigna distinta
importancia (peso) a cada una de las pruebas de que consta el examen.
Ejercicio: Promedio de puntos del grado. Asignamos a los grados las letra con los valores: A = 4, B = 3,
C =2, D=1, F =0, y entonces cada valor del grado se cuenta seg´ un el n´ umero de los cr´ editos ganados con ese
grado. Calcular el grado de un estudiante que ha ganado 12 cr´ editos de las A, 21 cr´ editos de los B, 5 cr´ editos
de las C y 3 cr´ editos de D’s.
Ejercicio: Grado del curso. El nota final en este curso se calcula seg´ un la escala siguiente: La preparaci´ on
cuenta con el 15 %, el 20 % por cada ex´ amen de tres que hay, y el examen final vale el 25 %. Podemos sacar la
cuenta para cada componente del grado final con su porcentaje para calcular el grado final. Calcular la cuenta
final para un estudiante que ha anotado 95 en la preparaci´ on, tiene notas de los examenes de 83, 94, y 77, y
una nota en el examen final es de 88.
2.2.7. Otros tipos de medias
Media cuadr´ atica
La media cuadr´ atica es igual a la ra´ız cuadrada de la suma de los cuadrados de los valores dividida entre el
n´ umero de datos:
¯ x =
2
¸

n
i=1
a
2
i
n
=
2
¸
a
2
1
+a
2
2
+· · · +a
2
n
n
. (2.13)
22
Esta media como medida de asociaci´ on tiene aplicaciones tanto en ciencias biol´ ogicas como en medicina.
A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los errores de medida. En
tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo. Este problema
se resuelve, mediante la denominada media cuadr´ atica. Consiste en elevar al cuadrado todas las observaciones
(as´ı los signos negativos desaparecen), en obtener despu´ e´ es su media aritm´ e´ etica y en extraer, finalmente, la ra´ız
cuadrada de dicha media para volver a la unidad de medida original.
Media geom´ etrica
La media geom´ etrica de una cantidad finita de n´ umeros (digamos n n´ umeros) es la ra´ız n-´ esima del producto de
todos los n´ umeros.
¯ x =
n
¸
n

i=1
x
i
=
n

x
1
· x
2
· · · x
n
. (2.14)
Por ejemplo, la media geom´ etrica de 2 y 18 es
2

2 · 18 =
2

36 = 6.
Otro ejemplo, la media de 1, 3 y 9 seria
3

1 · 3 · 9 =
3

27 = 3.
S´ olo es relevante la media geom´ etrica si todos los n´ umeros son positivos. Si uno de ellos es 0, entonces el
resultado es 0. Si hay un n´ umero negativo (o una cantidad impar de ellos) entonces la media geom´ etrica es, o
bien negativa o bien inexistente en los n´ umeros reales.
En muchas ocasiones se utiliza su trasformaci´ on en el manejo estad´ıstico de variables con distribuci´ on no nor-
mal.
La media geom´ etrica es relevante cuando varias cantidades son sumadas para producir un total.
Media arm´ onica
La media arm´ onica, representada por H, de una cantidad finita de n´ umeros es igual al rec´ıproco, o inverso, de la
media aritm´ etica de los rec´ıprocos de dichos n´ umeros. As´ı, dados los n´ umeros a
1
, a
2
, ..., a
n
, la media arm´ onica
ser´ a igual a:
H =
n

n
i=1
1
a
i
=
n
(
1
a
1
+· · · +
1
a
n
)
. (2.15)
La media arm´ onica resulta poco influida por la existencia de determinados valores mucho m´ as grandes que el
conjunto de los otros, siendo en cambio sensible a valores mucho m´ as peque˜ nos que el conjunto.
La media arm´ onica no est´ a definida en el caso de la existencia en el conjunto de valores nulos.
23
Media generalizada
La media generalizada es una abstracci´ on de los diversos tipos de media (geom´ etrica, aritm´ etica, arm´ onica, etc).
Se define como:
¯ x(m) =
_
m
_
1
n

n
i=1
x
m
i
si m 0
n
_

n
i=1
x
i
si m = 0
_
, (2.16)
en donde el par´ ametro m indica si la media es:
aritm´ etica, con m = 1,
geom´ etrica, con m = 0,
arm´ onica, con m = −1,
cuadr´ atica, con m = 2.
Obs´ ervese que para valores de m ≤ 0 la expresi´ on s´ olo tiene sentido si todos los x
i
≥ 0.
Ejercicio: Calcule los valores de las medias anteriormente definiddas para todas las situaciones y conjunto
de datos anteriores.
2.2.8. Formas de las distribuciones de datos
Podemos clasificar varias formas de las distribuciones de datos deacuerdo al lugar que ocupan las medidas de
tendencia central m´ as usuales anteriormente definidas.
Sim´ etrica
La distribuci´ on de datos es aproximadamente de la misma forma a ambos lados de la linea central, en donde
se encuentra aproximadamente la media. La media y la mediada (y la moda, si es unimodal) son pr´ acticamente
iguales en una distribuci´ on sim´ etrica.
Figura 2.4: Una distribuci´ on sim´ etrica. Ve´ ase la igual proporci´ on de barras con alturas aproximadas a ambos
lados de la media.
24
Sesgada a la derecha
Unos cuantos valores se encuentran la izquierda de la media, pero la mayor´ıa de todos los datos se encuentran
muy agrupados y acumulados a la derecha de la misma. Generalmente la mediana es m´ as peque˜ na que la media.
Por lo tanto, en ´ este caso, la media se encuentra a la derecha de la mediana.
Figura 2.5: Una distribuci´ on sezgada a la derecha. Ve´ ase la desigual proporci´ on de barras con alturas aproxima-
das a ambos lados de la media.
Sesgada a la izquierda
Unos cuantos valores se encuentran la derecha de la media, pero la mayor´ıa de todos los datos se encuentran
muy agrupados y acumulados a la izquierda de la misma. Generalmente la mediana es m´ as grande que la media.
Por lo tanto, en ´ este caso, la media se encuentra a la izquierda de la mediana.
Figura 2.6: Una distribuci´ on sezgada a la izquierda. Ve´ ase la igual proporci´ on de barras con alturas aproximadas
a ambos lados de la media.
Uniforme
Todos los datos est´ an igualmente representados.
2.3. Medidas de variaci´ on
Para conseguir una visi´ on completa y comprensiva de los datos hay que complementar las medidas de tendencia
central con las de otras propiedades de los mismos. Por ejemplo, el grado en que los datos se parecen o diferen-
25
Figura 2.7: Una distribuci´ on uniforme. Las barras tienen aproximadamente la misma altura a ambos lados de la
media.
cian entre s´ı. A esta propiedad se la denomina variabilidad o variaci´ on. Entre los indicadores de variaci´ on m´ as
utilizados est´ an la varianza y la desviaci´ on t´ıpica.
Las medidas de dispersi´ on, como tambi´ en se les conoce, muestran la variabilidad de una distribuci´ on, indicando
por medio de un n´ umero o estad´ıstico si las diferentes puntuaciones de una variable est´ an muy alejadas de la
media. Cuanto mayor sea ese valor mayor ser´ a la variabilidad, cuanto menor sea, mas homog´ eneo ser´ a a la
media. As´ı se sabe si todos los casos son parecidos o var´ıan mucho entre ellos.
Para calcular la variabilidad que una distribuci´ on tiene respecto de su media, se calcula la media de las desvia-
ciones de las puntuaciones respecto a la media aritm´ etica. Pero la suma de las desviaciones es siempre cero,
as´ı que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor
absoluto (Desviaci´ on media) y otra es tomando las desviaciones al cuadrado (Varianza).
2.3.1. Rango
El rango estad´ıstico es la diferencia entre el valor m´ınimo y el valor m´ aximo en un grupo de n´ umeros. Para
averiguar el rango de un grupo de n´ umeros: ordenamos los n´ umeros seg´ un su tama˜ no, y luego restamos el valor
m´ınimo del valor m´ aximo.
2.3.2. La Varianza
Es el promedio de las distancias al cuadrado desde los valores en x
i
hasta la media ¯ x en una muestra de n sujetos.
Se denota usualmente por s
2
x
s
2
x
=

i=1
(x
i
− ¯ x)
2
n −1
, varianza muestral, (2.17)
s
2
x
=

i=1
(x
i
−µ)
2
N
, varianza poblacional. (2.18)
La varianza es una variable estad´ıstica que mide la dispersi´ on de los valores respecto a un valor central (media),
es decir, la media de las diferencias cuadr´ aticas de n puntuaciones respecto a su media aritm´ etica.
26
Propiedades
La varianza es siempre positiva o 0: S
2
X
≥ 0.
Si a los datos de la distribuci´ on les sumamos una cantidad constante la varianza no se modifica. Sea
Y
i
= X
i
+k, entonces
S
2
Y
=
∑(Y
i

¯
Y)
2
n
=
∑[(X
i
+k) −(
¯
X +k)]
2
n
=
∑(X
i
+k −
¯
X −k)
2
n
=
∑(X
i

¯
X)
2
n
= S
2
X
(2.19)
Si a los datos de la distribuci´ on les multiplicamos una constante, la varianza queda multiplicada por el
cuadrado de esa constante. Si Y
i
= X
i
· k, entonces
S
2
Y
=
∑(Y
i

¯
Y)
2
n
=
∑(X
i
· k −
¯
X · k)
2
n
=
∑[k · (X
i

¯
X)]
2
n
=
∑[k
2
· (X
i

¯
X)
2
]
n
= k
2
· S
2
X
(2.20)
Propiedad distributiva: S
2
(X+Y)
= S
2
X
+S
2
Y
.
Si tenemos k grupos con tama˜ nos n
1
, ..., n
k
, y con medias y varianzas conocidas ( ¯ x
1
, ¯ x
2
, ..., ¯ x
k
) y (S
2
1
, S
2
2
, ..., S
2
k
),
entonces se puede definir la varianza total como:
s
2
T
=

i
n
i
S
2
i

i
n
i
+

j
n
j
(x
j
− ¯ x
T
)
2

j
n
j
, (2.21)
donde
¯ x
T
=

i
n
i
¯ x
i

i
n
i
. (2.22)
2.3.3. La Desviaci´ on Est´ andar
La varianza a veces no se interpreta claramente ya que se mide en unidades cuadr´ aticas. Para evitar ese problema
se define otra medida de dispersi´ on, que es la desviaci´ on t´ıpica, que se halla como la ra´ız cuadrada positiva de la
varianza. La desviaci´ on t´ıpica nos informa sobre la dispersi´ on de los datos respecto al valor de la media; cuanto
mayor sea su valor, m´ as dispersos estar´ an los datos.
S
x
=
¸

n
i=1
(x
i
− ¯ x)
2
n −1
, Desviaci´ on t´ıpica muestral (2.23)
σ
x
=
_

n
i=1
(X
i
−µ)
2
N
, Desviaci´ on t´ıpica poblacional (2.24)
2.3.4. La Desviaci´ on Media
Es la otra posibilidad para conocer la variabilidad de los datos en la distribuci´ on de frecuencias sin tener que
elebar al cuadrado la diferencia de datos respecto de la media:
d
M
=

i
(x
i
− ¯ x)
n
. (2.25)
Ejercicio: Calcule todas la medidas de variabilidad definiddas para todas las situaciones y conjunto de datos
anteriores.
27
2.3.5. Covarianza
La covarianza entre dos variables es un estad´ıstico resumen indicador de si las puntuaciones est´ an relacionadas
entre s´ı. La formulaci´ on cl´ asica, se simboliza por la letra griega sigma (σ
xy
) cuando ha sido calculada en la
poblaci´ on. Si se obtiene sobre una muestra, se designa por la letra “s
xy
”.
La formula suele aparecer expresada como:
ˆ
S
xy
=

n
i=1
x
i
y
i
n −1
=

n
i=1
(X
i

¯
X)(Y
i

¯
Y)
n −1
. (2.26)
Este tipo de estad´ıstico puede utilizarse para medir el grado de relaci´ on de dos variables si ambas utilizan una
escala de medida a nivel de intervalo/raz´ on (variables cuantitativas).
La expresi´ on se resuelve promediando el producto de las puntuaciones diferenciales por su tama˜ no muestral (n
pares de puntuaciones, n −1 en su forma insesgada). Este estad´ıstico, refleja la relaci´ on lineal que existe entre
dos variables. El resultado num´ erico fluctua entre los rangos de +infinito a -infinito. Al no tener unos l´ımites
establecidos no puede determinarse el grado de relaci´ on lineal que existe entre las dos variables, solo es posible
ver la tendencia.
Propiedades
−∞ ≤ S
xy
≤ +∞.
Se tiene que
S
xy
=
_
¸
_
¸
_
> 0, Correlaci´ on directa. Recta de regresi´ o creciente.
= 0, No hay correlaci´ on.
< 0. Correlaci´ on inversa. Recta de regresi´ on decreciente.
(2.27)
2.3.6. Coeficiente de Correlaci´ on de Pearson
El coeficiente de correlaci´ on de Pearson, r, nos permite saber si el ajuste de la nube de puntos a la recta de regre-
si´ on obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones
t´ıpicas (ra´ız cuadrada de las varianzas).
r =
V
xy
_
V
x
V
y
=
S
xy
_
S
2
x
S
2
y
=
S
xy
S
x
S
y
. (2.28)
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos
expresiones siguientes:
r =
∑x
i
y
i
n
− ¯ x¯ y
_
_
∑x
2
i
n
−x
−2
__
∑y
2
i
n
−y
−2
_
, (2.29)
r =
n∑x
i
y
i
−∑x
i ∑y
i
_
_
n∑x
2
i
−(∑x
i
)
2
__
n∑y
2
i
−(∑y
i
)
2
_
. (2.30)
28
Propiedades
El coeficiente de correlaci´ on, r, presenta valores entre -1 y +1.
Cuando r es pr´ oximo a 0, no hay correlaci´ on lineal entre las variables. La nube de puntos est´ a muy
dispersa o bien no forma una l´ınea recta. No se puede trazar una recta de regresi´ on.
Cuando r es cercano a +1, hay una buena correlaci´ on positiva entre las variables seg´ un un modelo lineal
y la recta de regresi´ on que se determine tendr´ a pendiente positiva, ser´ a creciente.
Cuando r es cercano a -1, hay una buena correlaci´ on negativa entre las variables seg´ un un modelo lineal
y la recta de regresi´ on que se determine tendr´ a pendiente negativa: es decreciente.
Figura 2.8: El coeficiente de correlaci´ on de Pearson establece la posibilidad de un ajuste de los puntos en la
muestra.
2.3.7. Coeficientes de asimetr´ıa y curtosis
Asimetr´ıa
Hemos comentado que el concepto de asimetr´ıa se refiere a si la curva que forman los valores de la serie pre-
senta la misma forma a izquierda y derecha de un valor central.
Para medir el nivel de asimetr´ıa se utiliza el llamado Coeficiente de Asimetr´ıa de Fisher, que viene definido:
g =
∑i
(x
i
−¯ x)
3
n
_
∑i
(x
i
−¯ x)
2
n
_
3/2
. (2.31)
Los resultados pueden ser los siguientes:
g = 0 (distribuci´ on sim´ etrica; existe la misma concentraci´ on de valores a la derecha y a la izquierda de la
media).
g > 0 (distribuci´ on asim´ etrica positiva; existe mayor concentraci´ on de valores a la derecha de la media
que a su izquierda).
g < 0 (distribuci´ on asim´ etrica negativa; existe mayor concentraci´ on de valores a la izquierda de la media
que a su derecha).
29
Figura 2.9: Distintas posibilidades de la forma del histograma en relaci´ on con el valor num´ erico de el coeficiente
de Fisher.
Curtosis
El Coeficiente de Curtosis analiza el grado de concentraci´ on que presentan los valores alrededor de la zona
central de la distribuci´ on.
Se definen 3 tipos de distribuciones seg´ un su grado de curtosis:
1. Distribuci´ on mesoc´ urtica: presenta un grado de concentraci´ on medio alrededor de los valores centrales
de la variable (el mismo que presenta una distribuci´ on normal).
2. Distribuci´ on leptoc´ urtica : presenta un elevado grado de concentraci´ on alrededor de los valores centrales
de la variable.
3. Distribuci´ on platic´ urtica: presenta un reducido grado de concentraci´ on alrededor de los valores centrales
de la variable.
El Coeficiente de Curtosis viene definido por la siguiente f´ ormula:
k =
∑i
(x
i
−¯ x)
4
n
_
∑i
(x
i
−¯ x)
2
n
_
2
−3 (2.32)
Los resultados pueden ser los siguientes:
k = 0 (distribuci´ on mesoc´ urtica).
k > 0 (distribuci´ on leptoc´ urtica ).
k < 0 (distribuci´ on platic´ urtica).
Ejercicio: Calcule los valores de los coeficientes de simetr´ıa de Fisher y de Curtosis para todas las situaciones
y conjunto de datos anteriores. Identifique los tipos de gr´ aficas que sean.
2.4. Teorema que envuelven cuestiones sobre la Desviaci´ on Est´ andar
La desviaci´ on est´ andar de una data es una cantidad importante debido a que limita el n´ umero de valores que
pueden ser encontrados en alguna determinada regi´ on de la distribuci´ o respecto del promedio.
30
Figura 2.10: Distintas posibilidades de la forma del histograma en relaci´ on con el valor num´ erico de el coefi-
ciente de curtosis.
2.4.1. La regla emp´ırica
Aplica s´ olo cuando la distribuci´ on de datos es del tipo campana, y establec que:
Aproximadamente el 68 % de los datos se encuentran a una desviaci´ on est´ andar de la media, es decir en
el intervalo [ ¯ x −σ, ¯ x +σ],
aproximadamente el 95 % de los datos se encuentran a dos desviaci´ on est´ andar de la media, es decir en
el intervalo [ ¯ x −2σ, ¯ x+2σ],
aproximadamente el 99 % de los datos se encuentran a tres desviaci´ on est´ andar de la media, es decir en
el intervalo [ ¯ x −3σ, ¯ x+3σ]
2.4.2. Teorema de Chebychev
Aplica a cualquier tipo de data. Estavlece que la porci´ on de valores que deben estar a k-desviaciones de la media
est´ a como m´ınimo a 1 −
1
k
2
.
Nota: el teorema de Chebychev establece s´ olo los l´ımites inferiores para wen los cuales se encuentra una deter-
minada cantidad de datos, mientras que la regla emp´ırica si que da buenas aproximaciones.
Ejercicio: Haga uso de los teoremas anteriores sobre la desviaci´ on est´ andar para hacer un an´ alisis de las
distribuciones de las situaciones y conjunto de datos anteriores.
2.5. Medidas de Posici´ on
Las medidas de posici´ on nos facilitan informaci´ on sobre la serie de datos que estamos analizando. La descrip-
ci´ on de un conjunto de datos, incluye como un elemento de importancia la ubicaci´ on de ´ estos dentro de un
contexto de valores posible.
Se trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. En vez de manejar todos
los datos sobre las variables, tarea que puede ser pesada, podemos caracterizar su distribuci´ on de frecuencias
mediante algunos valores num´ ericos, eligiendo como resumen de los datos un valor alrededor del cual se encuen-
tran distribuidos los valores de la variable. Pero estas medidas de posici´ on de una distribuci´ on de frecuencias
han de cumplir determinadas condiciones para que sean verdaderamente representativas de la variable a la que
31
resumen. Toda s´ıntesis de una distribuci´ on se considerara como operativa si intervienen en su determinaci´ on
todos y cada uno de los valores de la distribuci´ on, siendo ´ unica para cada distribuci´ on de frecuencias y siendo
siempre calculable y de f´ acil obtenci´ on. A continuaci´ on se describen las medidas de posici´ on m´ as comunes
utilizadas en estad´ıstica, como lo son:
Cuartiles: Hay 3 cuartiles que dividen a una distribuci´ on en 4 partes iguales: primero, segundo y tecer
cuartil.
Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil).
Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero al noventa y nueve
percentil).
2.5.1. Cuartiles
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente
iguales.
Hay tres cuartiles denotados usualmente Q
1
, Q
2
, Q
3
. El segundo cuartil es precisamente la mediana. El primer
cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25 %) de todos los valores de la sucesi´ on
(ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75 %) de
los datos.
Como los cuartiles adquieren su mayor importancia cuando contamos un n´ umero grande de datos y tenemos en
cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La f´ ormula para el
c´ alculo de los cuartiles cuando se trata de datos agrupados es la siguiente:
Q
k
= L
k
+
k
_
n
4
_
−F
k
f
k
c, para k = 1, 2, 3 (2.33)
donde:
Lk = L´ımite real inferior de la clase del cuartil k,
n = N´ umero de datos,
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k,
fk = Frecuencia de la clase del cuartil k,
c = Longitud del intervalo de la clase del cuartil k.
2.5.2. Deciles
Los deciles son ciertos n´ umeros que dividen la sucesi´ on de datos ordenados en diez partes porcentualmente
iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambi´ en
un caso particular de los percentiles. Los deciles se denotan D
1
, D
2
,..., D
9
, que se leen primer decil, segundo
decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados.
32
Para datos agrupados los deciles se calculan mediante la f´ ormula.
D
k
= L
k
+
k
_
n
10
_
−F
k
f
k
c, para k = 1, 2, ..., 9 (2.34)
donde:
Lk = L´ımite real inferior de la clase del decil k,
n = N´ umero de datos,
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k,
fk = Frecuencia de la clase del decil k,
c = Longitud del intervalo de la clase del decil k.
2.5.3. Centiles o percentiles
Los percentiles son, tal vez, las medidas m´ as utilizadas para prop´ ositos de ubicaci´ on o clasificaci´ on de las per-
sonas cuando atienden caracter´ısticas tales como peso, estatura, etc.
Los percentiles son ciertos n´ umeros que dividen la sucesi´ on de datos ordenados en cien partes porcentualmente
iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percen-
tiles (P
1
, P
2
,..., P
99
), le´ıdos primer percentil,..., percentil 99.
Cuando los datos est´ an agrupados en una tabla de frecuencias, se calculan mediante la f´ ormula:
P
k
= L
k
+
k
_
n
100
_
−F
k
f
k
c, para k = 1, 2, ..., 99 (2.35)
donde:
Lk = L´ımite real inferior de la clase del decil k,
n = N´ umero de datos,
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k,
fk = Frecuencia de la clase del decil k,
c = Longitud del intervalo de la clase del decil k.
Ejercicio: Calcule los valores de los tres cuartiles, los diez deciles y algunos de los centiles para todas las
situaciones y conjunto de datos anteriores.
2.6. Problemas de final de cap´ıtulo
A continuaci´ on una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de
los problemas pudiera usarse todo lo reflejado en estas notas, as´ı como tambi´ en cualquier herramienta compu-
tacional o tecnol´ ogica disponible.
1. En un centro hospitalario de la provincia de Sevilla se ha tratado, con un nuevo medicamento llamado
SINDOLORCABEZON, durante 5 d´ıas a un grupo de pacientes, todos ellos padecen de jaqueca cr´ onica
(se despiertan todos los d´ıas con dolor de cabeza). Se realiza un estudio sobre el n´ umero de d´ıas que un
paciente sufre mejor´ıa con el anterior medicamento obteniendo la tabla:
33
Datos (x
i
) Frecuencias
0 100
1 250
2 300
3 500
4 450
5 2000
(a) Realizando el gr´ afico adecuado y hallando los promedios (Media aritm´ etica, Media arm´ onica, Media
geom´ etrica, Moda, y Mediana), indicar cu´ al ser´ıa el que mejor representar´ıa los datos, (Contesta razo-
nadamente y con el mayor detalle posible). (b) Calcula tambi´ en el porcentaje de pacientes que sienten
mejor´ıa con el medicamento en todos los d´ıas del tratamiento. (c) ¿Por qu´ e no calculamos el coeficiente
de variaci´ on para ver la representatividad de la media? (d) ¿Habr´ıa que hallarlo?. (e) Calcula el D
3
, Q
3
,
P
65
. ¿Qu´ e significados tienen?
A aquellos pacientes que sienten mejor´ıa todos los d´ıas del tratamiento se les realiza un estudio sobre
el tiempo de reacci´ on del medicamento (en minutos), encontr´ andose recogido los datos en la siguiente
tabla:
Tiempo de reacci´ on N´ umero de pacientes
0-10 300
10-20 500
20-30 400
30-40 500
40-50 300
Se pide: (a) Escribir las f´ ormulas de las diferentes medias e indicar cu´ al de las tres te parece m´ as adecuada
para aplicar en este ejercicio (Razonadamente). (b) A todos los pacientes que tardan en reaccionar m´ as
de 35’ se le aplica el medicamento complementario PAQUENODUELA para acelerar los efectos de
SINDOLORCABEZON. Hallar el n´ umero de pacientes a los que se le aplica este segundo medicamento.
(c) Estudiar la representatividad del tiempo medio de reacci´ on. ¿Es representativo? ¿Por qu´ e? (d) El
Gobierno est´ a pensando en introducir un medicamento con las caracter´ısticas de SINDOLORCABEZON.
Existen en el mercado junto con este dos productos m´ as PALACABEZAy SINJAQUECAHOY. El tiempo
medio de reacci´ on de cada uno de ellos es respectivamente 25 y 30 minutos, con una varianza de 200 y
300 minutos2. Explica detalladamente que criterio de selecci´ on estad´ıstico podr´ıa aplicar el Gobierno.
Seg´ un el criterio anterior que medicamento ser´ıa el que pasar´ıa a engrosar la lista de medicamentos de la
Seguridad Social.
2. Se ha realizado una encuesta a 30 personas en la que se les pregunta el n´ umero de personas que conviven
en el domicilio habitualmente. Las respuestas obtenidas han sido las siguientes: 1, 4, 4, 1, 3, 5, 3, 2, 4, 1,
6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3. (a) Calcule la distribuci´ on de frecuencias de la variable
obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas. (b) ¿Qu´ e proporci´ on
de hogares est´ a compuesta por tres o menos personas? ¿Qu´ e proporci´ on de individuos vive en hogares
con tres o menos miembros? (c) Dibuje el diagrama de barras de frecuencias y el diagrama en escalera.
(d) Agrupe por intervalos de amplitud 2 los valores de la variable, calcule su distribuci´ on de frecuencias
y represente el histograma correspondiente.
3. Tenemos la siguiente informaci´ on sobre el gasto semanal en ocio de un grupo de estudiantes universita-
rios.
34
Nivel de gastos # de J´ ovenes
0-5 4
5-10 11
10-15 16
15-20 22
20-25 8
25-30 6
(a) Calcule la distribuci´ on de frecuencias de la variable y las densidades de frecuencias. (b) Dibuje el
histograma de frecuencias. (c) Dibuje el pol´ıgono de frecuencias acumuladas.
4. En un estudio sobre consumo de gasolina en una gran ciudad se eligi´ o una muestra de 100 veh´ıculos
y se observ´ o el n´ umero de litros que consum´ıan en un d´ıa, obteni´ endose la siguiente distribuci´ on de
frecuencias.
# de Litros # de Autom´ oviles
1-7 4
7-10 8
10-12 35
12-14 30
14-18 20
18-25 3
(a) Calcule la distribuci´ on de frecuencias, obteniendo, adem´ as, la amplitud de cada intervalo as´ı como sus
respectivas marcas de clase y las densidades de frecuencia. (b) Represente gr´ aficamente la distribuci´ on
de frecuencias mediante un histograma.
5. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el n´ umero de em-
pleados que hay en cada una de ellas para un estudio posterior. Las observaciones obtenidas han sido: 12,
10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13,14,15, 11, 11, 12, 16, 17, 17,16,16, 15, 14, 12, 11, 11, 11, 12, 12,
12, 15, 13, 14, 16, 15, 18, 19, 18, 10, 11, 12, 12, 11, 13, 13, 15, 13, 11, 12. (a) Calcule la distribuci´ on de
frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumula-
das. (b) ¿Qu´ e proporci´ on de sucursales tiene m´ as de 15 empleados? (c) Dibuje el diagrama de barras y el
diagrama en escalera correspondientes. (d) Agrupe en intervalos de amplitud 3 los valores de la variable,
calcule su distribuci´ on de frecuencias y represente su histograma y su pol´ıgono de frecuencias acumula-
das. (e) Agrupe la variable en los intervalos que considere conveniente de amplitud variable, calcule las
densidades de frecuencia de cada intervalo y represente el histograma correspondiente.
6. La siguiente distribuci´ on expresa el n´ umero de coches vendidos durante una semana por cada uno de los
50 concesionarios que una determinada firma tiene en Espa˜ na:
# de autos vendidos # de Concesionarios
1 5
3 12
4 20
6 8
10 5
Se pide: (a) Media aritm´ etica, mediana y moda. (b) Desviaci´ on t´ıpica, coeficiente de correlaci´ on, coe-
ficiente de variaci´ on de Pearson. (c) Coeficientes de asimetr´ıa de Fisher y de Curtosis, compruebe con
la forma del pol´ıgono de frecuencias. Para todo haga siempre un an´ alisis de los datos y los estimadores
calculados.
7. Sea la distribuci´ on referida a beneficios anuales de 38 empresas madrile˜ nas:
35
Beneficio (Miles de Euros) # de Empresas
230-280 5
280-330 7
330-580 14
580-630 9
630-780 3
Se pide: (a) Calcular el beneficio medio de estas 38 empresas madrile˜ nas. (b) ¿Cu´ al es el beneficio mayor
de la mitad de las empresas m´ as modestas? (c) Determinar el beneficio m´ as frecuente. (d) Estudiar la
dispersi´ on de esta distribuci´ on a partir del recorrido intercuart´ılico, desviaci´ on t´ıpica y coeficiente de
variaci´ on de Pearson. (e) Estudiar la forma de esta distribuci´ on.
8. La distribuci´ on del importe de las facturas por reparaci´ on de carrocer´ıa de una muestra de 80 veh´ıculos
en un taller, viene dada por la tabla siguiente:
Importe (Euros) # de Veh´ıculos
0-60 10
60-80 20
80-120 40
120-240 10
Se pide: (a) Calcular el importe medio. Estudiar la representatividad de esta media. (b) Calcular el importe
mediano y el importe m´ as frecuente. (c) ¿Qu´ e interpretaci´ on tienen en este caso los deciles? Calcular el
tercer decil. (d) ¿Cu´ al es el importe m´ aximo pagado por las 60 reparaciones m´ as baratas? (e) Estudiar la
asimetr´ıa a partir del coeficiente de asimetr´ıa de Fisher. (f) Estudiar la curtosis.
9. Una empresa ten´ıa a finales de 2003 mil seiscientos cincuenta accionistas distribuidos de la siguiente
forma:
# de acciones # de accionistas
0-20 1030
20-60 380
60-100 180
100-500 50
500-1000 10
Se pide: (a) Hallar el n´ umero medio de acciones por accionista y su desviaci´ on t´ıpica. (b) Hallar la me-
diana. (c) Decida, con base estad´ıstica, el grado de concentraci´ on de las acciones. (d) ¿Qu´ e porcentaje del
total de acciones poseen los accionistas mayoritarios? (e) ¿Qu´ e porcentaje de los accionistas minoritarios
posee el 20 % del total de acciones?
36
Cap´ıtulo 3
M´ etodos cuantitativos de an´ alisis
predictivo, regresi ´ on
3.1. Correlaci´ on y regresi´ on
En f´ısica como en otras ´ areas es importante a veces, tener una relaci´ on entre muchos datos de los que se estu-
dian para una situaci´ on dada. Por ejemplo, en un caso sencillo, digamos que alguien est´ a interesado un peque˜ no
problema para estudiar una cierta caracter´ıstica en unos moluscos muy raros con caparaz´ on. Para dicho estudio
digamos que el investigador, como primer paso, toma datos de los pesos y las dimensiones del caparaz´ on de
dichos moluscos. Como usted podr´ a inferir, es muy posible, que para la poblaci´ on de estudio, una dimensi´ on
grande en la muestra de los caparazones pudiera corresponder a caracoles o moluscos m´ as pesados. As´ı, uno es-
tar´ıa tentado a decir que el tama˜ no del caparaz´ on est´ a relacionado con el peso del molusco. Esto, por su puesto,
es una supusici´ on ya que podr´ıa haber resultados para los cuales ´ esto no sea cierto. As´ı que desde luego, como
siempre todo debe tomarse supuesto, en el sentido estricto estad´ıstico.
Como veremos m´ as adelante, algunas veces es posible emparentar, o en otras palabras m´ as t´ ecnicas, relacionar
ambas caracter´ısticas de alguna manera funcional, o mejor dicho, a trav´ es de una funci´ on. Si ´ este fuera el
caso entonces uno pudiera inferir, a partir de la funci´ on que relaciona dichas variables, una descripci´ on de la
poblaci´ on de estudio y/o catalogar especies en t´ erminos de sus caracter´ısticas. Hay que advertir, que pudieramos
tener tambi´ en una relaci´ on entre ambas variables o caracter´ısticas que no sea funcional, es posible, sin embargo,
no nos interesaremos por ese tipo de relaciones. Estamos interesado en las relaciones que se pueden hacer
cu´ ando una o m´ as variables estan emparentadas a trav´ es de alguna(s) funci´ on(es) matem´ aticas. El presente
cap´ıtulo est´ a dedicado a estas cuestiones. Esto ser´ a, como veremos ´ util para resolver muchos problemas.
3.2. Distribuciones bidimensionales
Cuando sobre una poblaci´ on estudiamos simult´ aneamente los valores de dos variables estad´ısticas, el conjunto
de los pares de valores correspondientes a cada individuo se denomina distribuci´ on bidimensional.
37
Por ejemplo: Las notas de 10 alumnos en Matem´ aticas y en F´ısica vienen dadas en la siguiente tabla:
F´ısica 4 10 10 12 12 14 14 16 18 16
Matem´ aticas 4 4 10 12 10 14 10 16 14 20
Los pares de valores (4,4),(10,4),(10,10),...;(18,14),(16,20), forman la distribuci´ on bidimensional.
3.3. La idea de la correlaci´ on
Es frecuente que estudiemos sobre una misma poblaci´ on los valores de dos variables estad´ısticas distintas, con
el fin de ver si existe alguna relaci´ on entre ellas, es decir, si los cambios en una de ellas influyen en los valores
de la otra. Si ocurre esto decimos que las variables est´ an correlacionadas o bien que hay correlaci´ on entre ellas.
En el ejemplo anterior parece que hay cierta tendencia a que cuanto mejor es la nota en F´ısica, mejor es la de
Matem´ atica.
La primera forma de describir una distribuci´ on bidimensional (y por tanto, saber si lo es) es representar los
pares de valores en el plano cartesiano. El gr´ afico obtenido recibe el nombre de nube de puntos o diagrama de
dispersi´ on.
Figura 3.1: Ejemplo de de un diagrama de dispersi´ on o nube de puntos.
Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva.
Aqu´ı nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si as´ı ocurre diremos que hay
correlaci´ on lineal. La recta se denomina recta de regresi´ on.
Hablaremos de correlaci´ on lineal fuerte cuando la nube se parezca mucho a una recta y ser´ a cada vez m´ as d´ ebil
(o menos fuerte) cuando la nube vaya desparram´ andose con respecto a la recta.
38
Figura 3.2: Regresi´ on lineal: Los puntos tienden a describirse a partir de una recta que los representa aproxima-
damente a todos.
En el gr´ afico observamos que en nuestro ejemplo la correlaci´ on es bastante fuerte, ya que la recta que hemos
dibujado est´ a pr´ oxima a los puntos de la nube.
Cuando la recta es creciente la correlaci´ on es positiva o directa: al aumentar una variable, la otra tiene tambi´ en
tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlaci´ on es negativa o
inversa: al aumentar una variable, la otra tiene tendencia a disminuir.
Por ejemplo: Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas.
En la gr´ afica se describen el n´ umero de errores que corresponden a los intentos realizados. Observa que hay
una correlaci´ on muy fuerte (los puntos est´ an casi alineados) y negativa (la recta es decreciente).
Figura 3.3: Regresi´ on lineal: la cantidad de intentos a medida que aumenta hace que el n´ umero de error dismi-
nuya.
Por ejemplo: A 12 alumnos de un centro se les pregunt´ o a qu´ e distancia estaba su residencia de la Universidad,
con fin de estudiar si esta variable estaba relacionada con la nota media obtenida. Se obtuvieron los datos que
figuran en la siguiente tabla:
39
Distancia (en Km) 0.05 0.1 0.12 0.4 0.5 0.7 1 1.2 2.1 2.5 3 3
Nota media 8.4 4 5.7 9.1 6.3 6.7 4.3 5.4 7.8 4.5 7.2 8.1
Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la correlaci´ on es pr´ actica-
mente inexistente, es decir, no tiene nada que ver con el rendimiento acad´ emico la distancia del domicilio a la
Universidad.
Figura 3.4: Regresi´ on lineal: Al parecer n existe relaci´ on entre la distancia a la que se vive de la Universidad y
la calificaci´ on que se obtiene.
3.4. Encontrando la relaci´ on. Regresi´ on
3.4.1. El coeficiente de correlaci´ on
S´ olo para recordar, tenga en cuenta la lecci´ on aprendida en la secci´ on (2.3.6). Teniamos que el coeficiente de
correlaci´ on de Pearson, r, nos permite saber si el ajuste de la nube de puntos a la recta de regresi´ on obtenida
es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones t´ıpicas (ra´ız
cuadrada de las varianzas).
r =
V
xy
_
V
x
V
y
=
S
xy
_
S
2
x
S
2
y
=
S
xy
S
x
S
y
. (3.1)
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos
expresiones siguientes:
r =
∑x
i
y
i
n
− ¯ x¯ y
_
_
∑x
2
i
n
−x
−2
__
∑y
2
i
n
−y
−2
_
, (3.2)
r =
n∑x
i
y
i
−∑x
i ∑y
i
_
_
n∑x
2
i
−(∑x
i
)
2
__
n∑y
2
i
−(∑y
i
)
2
_
. (3.3)
El corefiente de correlaci´ on ten´ıa las siguientes propiedades muy interesantes:
40
El coeficiente de correlaci´ on, r, presenta valores entre -1 y +1.
Cuando r es pr´ oximo a 0, no hay correlaci´ on lineal entre las variables. La nube de puntos est´ a muy
dispersa o bien no forma una l´ınea recta. No se puede trazar una recta de regresi´ on.
Cuando r es cercano a +1, hay una buena correlaci´ on positiva entre las variables seg´ un un modelo lineal
y la recta de regresi´ on que se determine tendr´ a pendiente positiva, ser´ a creciente.
Cuando r es cercano a -1, hay una buena correlaci´ on negativa entre las variables seg´ un un modelo lineal
y la recta de regresi´ on que se determine tendr´ a pendiente negativa: es decreciente.
3.4.2. Regresi´ on lineal. El M´ etodo de los M´ınimos Cuadrados
Hemos enfatizado sobre la importancia de las representaciones gr´ aficas y hemos visto la utilidad de las versiones
linealizadas de los gr´ aficos (X,Y). A menudo nos confrontamos con situaciones en las que existe o suponemos
que existe una relaci´ on lineal entre las variables X e Y.
Surge de modo natural la pregunta: ¿cu´ al es la relaci´ on anal´ıtica que mejor se ajusta a nuestros datos? El m´ etodo
de cuadrados m´ınimos es un procedimiento general que nos permite responder esta pregunta. Cuando la relaci´ on
entre las variables X e Y es lineal, el m´ etodo de ajuste por cuadrados m´ınimos se denomina tambi´ en m´ etodo
de regresi´ on lineal. En este cap´ıtulo discutiremos este ´ ultimo caso. El lector puede consultar a continuaci´ on una
discusi´ on del caso general de cuadrados m´ınimos cuando el modelo es no lineal y los datos est´ an afectados de
errores.
Figura 3.5: Regresi´ on lineal: Al parecer n existe relaci´ on entre la distancia a la que se vive de la Universidad y
la calificaci´ on que se obtiene.
La dispersi´ on de los valores est´ a asociada a la fluctuaci´ on de los valores de cada variable. Observamos o supo-
nemos una tendencia lineal entre las variables y nos preguntamos sobre cu´ al es la mejor recta:
y(x) = ax +b, (3.4)
que representa el caso de inter´ es.
Es ´ util definir la funci´ on χ
2
(Chi-cuadrado):
χ
2
=

i
[y
i
−(ax
i
+b)]
2
, (3.5)
41
Figura 3.6: La curva de regresi´ on lineal en t´ erminos de los cambios de la funci´ on.
que es una medida de la desviaci´ on total de los valores observados y
i
respecto de los predichos por el modelo
lineal ax +b. Los mejores valores de la pendiente a y la ordenada al origen b son aquellos que minimizan esta
desviaci´ on total, o sea, son los valores que remplazados en la ecuaci´ on (3.4) minimizan la funci´ on χ
2
, ecuaci´ on
(3.5). Los par´ ametros a y b pueden obtenerse usando t´ ecnicas matem´ aticas que hacen uso del c´ alculo diferencial.
Aplicando estas t´ ecnicas, el problema de minimizaci´ on se reduce al de resolver el par de ecuaciones:
d
da
χ
2
= 0,
d
db
χ
2
= 0, (3.6)
de donde resulta despu´ es de algunos c´ alculos
a =
N∑x
i
y
i
−∑x
i ∑y
i
N∑x
2
i
−(∑x
i
)
2
, (3.7)
b =
N∑x
2
i
∑y
i
−∑x
i ∑x
i
y
i
N∑x
2
i
−(∑x
i
)
2
. (3.8)
Actualmente, la mayor´ıa de los programas de an´ alisis de datos y planillas de c´ alculo, realizan el proceso de mi-
nimizaci´ on en forma autom´ atica y dan los resultados de los mejores valores de a y b, o sea los valores indicado
por la ecuaciones anteriores.
El criterio de m´ınimos cuadrados reemplaza el juicio personal de quien mire los gr´ aficos y defina cu´ al es la
mejor recta. En los programas como Excel, Origin, etc., este c´ alculo se realiza usando la herramienta regresi´ on
lineal.
o
.
a
juste lineal”. Los resultados en las ecuaciones anteriores se aplican en el caso lineal cuando todos
los datos de la variable dependiente tienen la misma incertidumbre absoluta y la incertidumbre de la variable
independiente se considera despreciable.
42
Una medida de la calidad o bondad del ajuste realizado viene dado por el coeficiente de correlaci´ on de Pearson
entre las variables X e Y, escrito ahora equivalentemente como:
r
2
=
Cov(x, y)
2
Var(x) · Var(y)
, (3.9)
Cov(x, y) =
N∑x
i
y
i
−∑x
i ∑y
i
N
2
, (3.10)
Var(x) =
∑x
2
i
N

_
∑x
i
N
_
2
=< x
2
>< x >
2
, (3.11)
Var(y) =
∑y
2
i
N

_
∑y
i
N
_
2
=< y
2
>< y >
2
. (3.12)
El valor de r var´ıa entre -1 y 1 como siempre. Si r es ±1 o pr´ oximo a estos valores, decimos que el modelo
lineal es adecuado para describir los datos experimentales. Cuando r se aparta de estos extremos decimos que
una expresi´ on lineal no es una buena descripci´ on de los datos. En este caso, conviene analizar el gr´ afico y buscar
una relaci´ on no-lineal que aproxime mejor la dependencia. Dado que r mide el grado de correlaci´ on lineal entre
los datos, si, por ejemplo, los pares de puntos (X,Y) tienen una relaci´ on tal que caen sobre un c´ırculo, aunque
ellos est´ an correlacionados, tendr´ıamos r ∼0. Desde luego, si los pares (X,Y) no tienen correlaci´ on alguna entre
ellos, tambi´ en tendr´ıamos r ∼ 0.
Frecuentemente el resultado que deseamos determinar de nuestro experimento es alguno de los par´ ametros de la
ecuaci´ on (3.4). Por ejemplo, si deseamos determinar la constante el´ astica k de un resorte a partir de mediciones
de fuerzas aplicadas F
i
y estiramientos x
i
que le producen al resorte, k ser´ a precisamente la pendiente de la recta
que mejor se ajusta a los datos. Otro ejemplo es la obtenci´ on de la resistencia el´ ectrica R de un conductor, que
deseamos determinar a partir de mediciones de tensi´ on V
i
y la corriente que lo atraviesa I
i
. Por consiguiente, es
´ util disponer de un modo de estimar las incertidumbres asociadas a la determinaci´ on de los par´ ametros a y b de
la ecuaci´ on (3.4).
La importancia del m´ etodo de cuadrados m´ınimos reside en el hecho que nos permite obtener valores de la
desviaci´ on est´ andar o sea los errores asociados a los par´ ametros a y b, que denotaremos con los s´ımbolos σ
a
y
σ
b
. En esta secci´ on s´ olo presentamos los resultados de utilidad m´ as frecuente en el laboratorio; el lector intere-
sado podr´ a encontrar un tratamiento m´ as exhaustivo en las referencias. Las incertidumbres de los par´ ametros
del ajuste vienen dadas por las expresiones:
σ
a
=
¸
χ
2
N
N · Var(x)
, (3.13)
σ
b
=
¸
χ
2
N
· ∑x
2
i
N · Var(x)
, (3.14)
donde χ
2
N
, conocido como el valor de Chi-cuadrado por grado de libertad, viene dada por:
χ
2
N
=
1
N −2
· χ
2
. (3.15)
43
Las incertidumbres de los par´ ametros a y b tambi´ en pueden escribirse en t´ erminos del coeficiente de correlaci´ on
r del siguiente modo:
σ
a
=
¸
a
2
N −2
·
_
1
r
2
−1
_
, (3.16)
σ
b
= σ
a
_
< x
2
>, (3.17)
donde
< x
2
>=
∑x
2
i
N
. (3.18)
Estas expresiones son de mucha utilidad para estimar σ
a
y σ
b
, ya que la mayor´ıa de las planillas de c´ alculo y
programas de ajuste, por los regular indican los valores de los par´ ametros a y b que mejor ajustan los datos y el
valor de r.
Precausiones en el an´ alisis
No siempre es suficiente admitir que dos variables siguen una relaci´ on lineal gui´ andonos por lo que muestra
un gr´ afico de los datos en escalas lineales. Menos aun si s´ olo evaluamos el coeficiente de correlaci´ on del ajuste
lineal que propondr´ıamos a partir de este gr´ afico. Un gr´ afico de Y =X
1,1
(variables sin correlaci´ on lineal) puede
ajustarse por una recta y obtenerse a la vez un coeficiente de correlaci´ on lineal (inexistente) de, por ejemplo,
0,998. Un gr´ afico de datos experimentales de Y = X con algo de dispersi´ on fortuita de los puntos, podr´ıa de-
venir en un coeficiente de, por ejemplo, 0,995, menor que el anterior. Entre los coeficientes hay una diferencia,
apenas, del 3 por mil. Pero en un gr´ afico log-log, la diferencia de pendientes ser´ a la que hay entre 1.1 y 1.0,
lo que representa un 10 % de discrepancia entre los exponentes de la variable X. Estos m´ etodos de an´ alisis
nos ense˜ nan que los efectos de correlaci´ on pueden estar enmascarados por el efecto del ruido”de los datos. En
ocasiones lo dif´ıcil es establecer si existe correlaci´ on entre las variables, aun cuando los datos provengan de
fuentes ”limpias”que hayan producido datos con relativamente poca dispersi´ on. Muchas veces la decisi´ on entre
dos alternativas debe hacerse usando otros criterios. Por ejemplo, la consistencia con otros conjuntos de datos o
sobre la base de consideraciones de simetr´ıa o concordancia con teor´ıas bien establecidas.
Por ejemplo: Imaginemos un experimento donde se mide la distancia que recorre un m´ ovil sobre una l´ınea
recta mientras una fuerza constante act´ ua sobre ´ el. Esperamos que el movimiento sea uniformemente acelera-
do. Supongamos que el cuerpo parte del reposo, que medimos x(t) a tiempos largos. En la figura se ven los
resultados.
Si los datos experimentales se analizan sobre el gr´ afico de escalas lineales, el ajuste por un modelo lineal es
m´ as que tentador. Hecho esto, se obtiene la ecuaci´ on de la mejor recta y un coeficiente de correlaci´ on muy alto,
r = 0,99959. Sin embargo, un modelo basado en las ecuaciones de la din´ amica dice que
x =
1
2
at
2
,
donde a es la aceleraci´ on. En la Figura est´ an los logaritmos de los mismos datos, de donde se ve claramente
la proporcionalidad x ∼ t
2
que predice el modelo, dif´ıcilmente demostrable a partir del gr´ afico de la Figura.
Evidentemente, el uso de una aproximaci´ on lineal no es buena en este problema y el mero juicio del valor del
coeficiente de correlaci´ on no es suficiente.
44
Figura 3.7: Representaci´ on de x(t) para un cuerpo que se mueve con movimiento uniformemente acelerado. (a)
A tiempos largos no se aprecia bien la curvatura de la curva y, dado que el coeficiente de correlaci´ on lineal es
muy cercano a la unidad, podr´ıa suponerse que la correlaci´ on es lineal. (b) log(x) en funci´ on de log(t), de donde
se deduce que la relaci´ on no es lineal sino cuadr´ atica.
45
Cap´ıtulo 4
An´ alisis Combinatorio
4.1. Introducci´ on
En ocasiones el trabajo de enumerar los posibles sucesos que ocurren en una situaci´ on dada se convierte en algo
dif´ıcil de lograr o, simplemente, tedioso. El an´ alisis combinatorio, o c´ alculo combinatorio, permite enumerar
tales casos o sucesos y as´ı obtener la probabilidad de eventos m´ as complejos.
En el caso de que existan m´ as de un suceso a observar, habr´ıa que contar el n´ umero de veces que pueden ocurrir
todos los sucesos que se desean observar, para ello se utiliza el principio fundamental de conteo:
Si un suceso se puede presentar de n
1
formas, y otro se puede presentar de n
2
formas, entonces el n´ umero de
formas en que ambos sucesos pueden presentarse en ese orden es de n
1
n
2
.
En otras palabras, basta multiplicar el n´ umero de formas en que se pueden presentar cada uno de los sucesos a
observar.
Este principio nos remite autom´ aticamente al factorial de un n´ umero natural, que se puede pensar como una
funci´ on con dominio los n´ umeros naturales junto con el cero y codominio los n´ umeros naturales. El factorial de
un n´ umero n, denotado n!, se define como:
n! = n.(n −1).(n −2)..,2,1, si n > 0, (4.1)
= 1, si n = 0.
Ahora, n es muy grande el proceso de c´ alculo se vuelve tedioso y muy cargado, incluso para una computadora,
por lo que se utiliza la aproximaci´ on de Stirling a n!:
n! ∼

2πn
2n+1
2
e
−n
. (4.2)
46
donde e ∼ 2,71828..., que es la base de los logaritmos neperianos.
En el an´ alisis combinatorio se definen las permutaciones, con o sin repetici´ on, y las combinaciones.
4.2. Permutaciones (u ordenaciones) con repetici´ on
Las permutaciones son tambi´ en conocidas como ordenaciones, y de hecho toman este nombre porque son orde-
naciones de r objetos de n dados. En este curso las representaremos como P
r
n
.
Ejemplo: Sea A = {a, b, c, d}, ¿cu´ antas ”palabras”de dos letras se pueden obtener?. Se pide formar per-
mutaciones u ordenaciones de 2 letras, cuando el total de letras es 4. En este caso r = 2 y n = 4. Las ”pala-
bras”formadas son: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd, da, db, dc, dd. En total son 16.
En general, si se toman r objetos de n, la cantidad de permutaciones u ordenaciones con repetici´ on obtenidas
son:
P
r
n
= n
r
. (4.3)
4.3. Permutaciones (u ordenaciones) sin repetici´ on
En este caso, a diferencia del anterior, se realizan ordenaciones de r objetos de n dados atendiendo a la situaci´ on
de cada objeto en la ordenaci´ on. Su representaci´ on ser´ a P
r
n
.
Ejemplo: Sea el mismo conjunto A ={a, b, c, d}, ¿cu´ antas ordenaciones sin repetici´ on se pueden obtener? Lo
que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12 en total.
En general, si se toman r objetos de un total de n, la cantidad de permutaciones
P
r
n
=
n!
(n −r)!
. (4.4)
4.4. Combinaciones
Es una selecci´ on de r objetos de n dados sin atender a la ordenaci´ on de los mismos. Es decir, es la obtenci´ on de
subcojuntos, de r elementos cada uno, a partir de un conjunto inicial de n elementos. La denotaremos con C
r
n
,
´ o
_
n
k
_
.
Ejemplo: Si tomamos el mismo conjunto A = {a, b, c, d}, ¿cu´ antos subconjuntos de 2 elementos cada uno se
pueden obtener? Haci´ endolos se obtienen: a,b, a,c, a,d, b,c, b,d, c,d. Son seis los subconjuntos.
47
En general, si de n objetos dados se hacen combinaciones de r objetos cada una, el n´ umero de combinaciones
obtenidas son:
C
r
n
=
_
n
r
_
=
n.(n −1).(n −1)...(n −r +1)
r!
=
n!
r!(n −r)!
, (4.5)
o, que es lo mismo,
C
r
n
=
_
n
r
_
=
P
r
n
r!
. (4.6)
4.5. An´ alisis y Metodolog´ıa propuesta para la resoluci´ on de problemas de Teor´ıa de
conteo
Para resolver problemas b´ asicos y sencillos de teor´ıa de conteo basta con seguir el siguiente diagrama.
Figura 4.1: Metodolog´ıa sencilla para la resoluci´ on de problemas.
48
Cap´ıtulo 5
Probabilidad
5.1. Introducci´ on: La probabilidad
La palabra probabilidad no tiene una definici´ on consistente. De hecho, hay dos amplias categor´ıas de interpre-
taciones de la probabilidad: los frecuentistas hablan de probabilidades s´ olo cuando se trata de experimentos
aleatorios bien definidos. La frecuencia relativa de ocurrencia del resultado de un experimento, cuando se repite
el experimento, es una medida de la probabilidad de ese suceso aleatorio. Los bayesianos, no obstante, asignan
las probabilidades a cualquier declaraci´ on, incluso cuando no implica un proceso aleatorio, como una manera
de representar su verosimilitud subjetiva.
El estudio cient´ıfico de la probabilidad es un desarrollo moderno. Los juegos de azar muestran que ha habido un
inter´ es en cuantificar las ideas de la probabilidad durante milenios, pero las descripciones matem´ aticas exactas
de utilidad en estos problemas s´ olo surgieron mucho despu´ es.
Seg´ un Richard Jeffrey, “Antes de la mitad del siglo XVII, el t´ ermino ’probable’ (en lat´ın probable) significaba
aprobable, y se aplicaba en ese sentido, un´ıvocamente, a la opini´ on y a la acci´ on. Una acci´ on u opini´ on probable
era una que las personas sensatas emprender´ıan o mantendr´ıan, en las circunstancias.” [Ve´ ase: Jeffrey, R.C.,
Probability and the Art of Judgment, Cambridge University Press. (1992). pp. 54-55. ISBN 0-521-39459-7].
Dos aplicaciones principales de la teor´ıa de la probabilidad en el d´ıa a d´ıa son en el an´ alisis de riesgo y en
el comercio de los mercados de materias primas. Los gobiernos normalmente aplican m´ etodos probabil´ısticos
en regulaci´ on ambiental donde se les llama “an´ alisis de v´ıas de dispersi´ on”, y a menudo miden el bienestar
usando m´ etodos que son estoc´ asticos por naturaleza, y escogen qu´ e proyectos emprender bas´ andose en an´ alisis
estad´ısticos de su probable efecto en la poblaci´ on como un conjunto. No es correcto decir que la estad´ıstica
est´ a incluida en el propio modelado, ya que t´ıpicamente los an´ alisis de riesgo son para una ´ unica vez y por lo
tanto requieren m´ as modelos de probabilidad fundamentales, por ej. “la probabilidad de otro 11-S”. Una ley de
n´ umeros peque˜ nos tiende a aplicarse a todas aquellas elecciones y percepciones del efecto de estas elecciones,
lo que hace de las medidas probabil´ısticas un tema pol´ıtico.
49
Un buen ejemplo es el efecto de la probabilidad percibida de cualquier conflicto generalizado sobre los precios
del petr´ oleo en Oriente Medio - que producen un efecto domin´ o en la econom´ıa en conjunto. Un c´ alculo por
un mercado de materias primas en que la guerra es m´ as probable en contra de menos probable probablemente
env´ıa los precios hacia arriba o hacia abajo e indica a otros comerciantes esa opini´ on. Por consiguiente, las pro-
babilidades no se calculan independientemente y tampoco son necesariamente muy racionales. La teor´ıa de las
finanzas conductuales surgi´ o para describir el efecto de este pensamiento de grupo en el precio, en la pol´ıtica, y
en la paz y en los conflictos.
Se puede decir razonablemente que el descubrimiento de m´ etodos rigurosos para calcular y combinar los c´ alcu-
los de probabilidad ha tenido un profundo efecto en la sociedad moderna. Por consiguiente, puede ser de alguna
importancia para la mayor´ıa de los ciudadanos entender c´ omo se c´ alculan los pron´ osticos y las probabilidades,
y c´ omo contribuyen a la reputaci´ on y a las decisiones, especialmente en una democracia.
Otra aplicaci´ on significativa de la teor´ıa de la probabilidad en el d´ıa a d´ıa es en la fiabilidad. Muchos bienes de
consumo, como los autom´ oviles y la electr´ onica de consumo, utilizan la teor´ıa de la fiabilidad en el dise˜ no del
producto para reducir la probabilidad de aver´ıa. La probabilidad de aver´ıa tambi´ en est´ a estrechamente relacio-
nada con la garant´ıa del producto.
Se puede decir que no existe una cosa llamada probabilidad. Tambi´ en se puede decir que la probabilidad es
la medida de nuestro grado de incertidumbre, o esto es, el grado de nuestra ignorancia dada una situaci´ on. Por
consiguiente, puede haber una probabilidad de 1 entre 52 de que la primera carta en un baraja de cartas es la J de
diamantes. Sin embargo, si uno mira la primera carta y la reemplaza, entonces la probabilidad es o bien 100 % o
0 %, y la elecci´ on correcta puede ser hecha con precisi´ on por el que ve la carta. La f´ısica moderna proporciona
ejemplos importantes de situaciones determin´ısticas donde s´ olo la descripci´ on probabil´ıstica es factible debido
a informaci´ on incompleta y la complejidad de un sistema as´ı como ejemplos de fen´ omenos realmente aleatorios.
En un universo determinista, basado en los conceptos newtonianos, no hay probabilidad si se conocen todas las
condiciones. En el caso de una ruleta, si la fuerza de la mano y el periodo de esta fuerza es conocido, entonces
el n´ umero donde la bola parar´ a ser´ a seguro. Naturalmente, esto tambi´ en supone el conocimiento de la inercia
y la fricci´ on de la ruleta, el peso, lisura y redondez de la bola, las variaciones en la velocidad de la mano du-
rante el movimiento y as´ı sucesivamente. Una descripci´ on probabil´ıstica puede entonces ser m´ as pr´ actica que
la mec´ anica newtoniana para analizar el modelo de las salidas de lanzamientos repetidos de la ruleta. Los f´ısi-
cos se encuentran con la misma situaci´ on en la teor´ıa cin´ etica de los gases, donde el sistema determin´ıstico en
principio, es tan complejo (con el n´ umero de mol´ eculas t´ıpicamente del orden de magnitud de la constante de
Avogadro 6 ×10
23
) que s´ olo la descripci´ on estad´ıstica de sus propiedades es viable.
La mec´ anica cu´ antica, debido al principio de indeterminaci´ on de Heisenberg, s´ olo puede ser descrita actual-
mente a trav´ es de distribuciones de probabilidad, lo que le da una gran importancia a las descripciones proba-
bil´ısticas. Albert Einstein coment´ o estupendamente en una carta a Max Born: Jedenfalls bin ich
˜
A¼berzeugt,
daβ der Alte nicht w
˜
A¼rfelt. (Estoy convencido de que Dios no tira el dado). No obstante hoy en d´ıa no existe
un medio mejor para describir la f´ısica cu´ antica si no es a trav´ es de la teor´ıa de la probabilidad. Mucha gente
hoy en d´ıa confunde el hecho de que la mec´ anica cu´ antica se describe a trav´ es de distribuciones de probabilidad
con la suposici´ on de que es por ello un proceso aleatorio, cuando la mec´ anica cu´ antica es probabil´ıstica no por
el hecho de que siga procesos aleatorios sino por el hecho de no poder determinar con precisi´ on sus par´ ametros
50
fundamentales, lo que imposibilita la creaci´ on de un sistema de ecuaciones determinista. (Tomado de wikipedia,
busque “probabilidad”).
5.2. La probabilidad
La probabilidad es una medida de la posibilidad de que un “evento ocurra. En vista de la caractrer´ıstica de
´ esta medida, la cantidad que la describe es siempre un n´ umero que se encuentra en un intervalo [0, 1], donde o
equivale a una posibilidad nula de que el evento ocurra mientras que 1 representa el hecho de que evento va a
ocurrir con toda seguridad. En otras palabras, la medida de la probabiliudad es siempre una fracci´ on o decimal
indicando la porci´ on o porcetaje de la veces que un evento ocurre.
Ejemplo: 40 % de chance de que llueva, average de bateo de .313, la probabilidad de obtener un royal flush en
poker es 1:649740. La interpretaci´ on: Un 40 % de chance de que llueva significa que si nosotros miramos todos
los d´ıas con caracter´ısticas similares, entonces de cada 100 d´ıas con estas condiciones, 40 de ellos ser´ an d´ıas
con lluvia; un porcentaje de bateo de .313 significa que el jugado llegar´ a a una base o har´ aun hit en el 31.3 %
(.313) de todos los intentos al bateo, es decir, de cada 100 veces que batea, s´ olo 31 veces aproximadamente hace
un hit; dram´ aticamente se tendr´ a que si uno quiere obtener un royal flush en una partida de poker, entonces
quiz´ as tenga que esperar hasta 649740 manos para obtener uno.
5.3. Experimentos de Probabilidad
Un experimento probabil´ıstico es cualquier proceso que produce un resultado o una observaci´ on y tiene por
finalidad de determinar posibilidades.
Ejemplo: Lanzar un dado o una moneda, escoger un nombre de varios revueltos en un vaso, sacar una carta
de un mazo.
Cuando se realiza un experimento, se obtienen un conjunto de valores. A este conjunto de valores que puede
tomar una variable se le denomina espacio muestral.
Ejemplo: El universo de el experimento de lanzar una moneda tiene dos resultados: cara y sello, as´ı podemos
escribir:
S = {cara, sello}
En el experimento de lanzar un dado, se tienen 6 posibles resultados, as´ı:
S = {1, 2, 3, 4, 5, 6}
Desde ahora definiremos evento como cualquier colecci´ on de resultados de un espacio de eventos o universo,
es decir, pudiera cofeccionarse subconjuntos del universo de un evento y crear nuevos eventos.
51
Si existen m´ as de una variable, el espacio muestral est´ a formado por las combinaciones de valores de cada una
de las variables.
Ejemplo: En el caso de el experimento de lanzar un dado, uno podr´ıa definir dos nuevos eventos del universo
tomando algunos que tienen una caracter´ıstica com´ un, as´ı
P = {Resultados pares} = {2, 4, 6},
I = {Resultados impares} = {1, 3, 5},
As´ı mismo podr´ıan confeccionarse eventos en el experimento de sacar una carta de un mazo, uno podr´ıa inven-
tar nuevos eventos, por ejemplo, los resultados posibles de sacar un rey, tiene cuatro resultados correspondien-
tes con los cuatro reyes de los cuatro distintos tipos de dibujo que tienen las cartas, o bien, el rey de corazones,
el rey de picas, el rey de espadas y el rey de tr´ eboles.
Un evento E para un experimento se dice que ocurre si y s´ olo si el resultado de el experimento es uno de los
que pertenecen a E.
Si tomamos un subconjunto cualquiera del espacio muestral tenemos lo que se denomina un evento, y si ´ este
consta de un solo elemento entonces es un evento elemental.
Ejemplo: Si P es el evento descrito anteriormente de obtener los n´ umeros pares en el lanzamiento de un dado,
entonces si al lanzar el dado el n´ umero mostrado es un 4, entonces uno podr´ıa decir que el evento P ocurre, si
el n´ umero mostrado es 1, entonces uno debe decir que el evento P no ocurre.
Como se puede uno imaginar, existen eventos que siempre, no importa el n´ umero de experimentos o su situa-
ci´ on, ocurren, y en cambio existen otros que nunca ocurren. Los que siempre ocurren son los eventos seguros,
y los que nunca son los eventos imposibles.
Sin embargo, no todos los resultados son al azar, pues si un experimento es cualquier proceso entonces los re-
sultados pueden tomar cualquier tipo de valor. Por esta raz´ on, se define como experimento aleatorio al proceso
en el que se pueden predecir con certeza la ocurrencia de sus eventos, con excepci´ on del seguro o del imposible.
Hay que hacer la observaci´ on que esta definici´ on habla en t´ erminos generales y no espec´ıficamente sobre alg´ un
experimento en particular.
A aquella variable que est´ a asociada a un experimento de este tipo se le denomina variable aleatoria. En cam-
bio, a un experimento no aleatorio se le denomina experimento determin´ıstico.
Cuando hablamos de varios eventos dentro del mismo experimento se pueden dar varios casos. Si dos o m´ as
eventos no pueden ocurrir simult´ aneamente, se llaman eventos mutuamente excluyentes, es decir, que la in-
tersecci´ on de ambos eventos es vac´ıa.
Por otro lado, en ocasiones un evento o m´ as eventos dependen de otro evento previo, es decir, un evento A ocurre
dado que ocurri´ o un evento B. Si existe este tipo de relaci´ on entre eventos se dice que son eventos dependientes
52
o condicionados (el evento A depende del evento B, o el resultado del evento A est´ a condicionado al resultado
del evento B). Por otro lado, si no existe tal relaci´ on entre eventos se dice que son eventos independientes. Los
criterios de dependencia o de independencia se definir´ an m´ as adelante, en t´ erminos de probabilidad condicional.
5.4. Calculando la probabilidad de un evento
Para calcular la probabilidad de eventos es necesario que ´ estos se comporten de una manera m´ as o menos esta-
ble. Precisamente, se echa mano de la regularidad estad´ıstica, que es la propiedad de los fen´ omenos aleatorios,
y que consiste en que al aumentar el n´ umero de repeticiones de un experimento en condiciones pr´ acticamente
constantes, la frecuencia relativa de ocurrencia para cada evento tiende a un valor fijo.
La probabilidad de un evento E es denotada por P(E) y siempre representa la fracci´ on o porcentaje de ocurrencia
de que E ocurra. Algunas caracter´ısticas exibe esta formulaci´ on:
Para un evento E, se tiene que 0 ≤ P(E) ≤ 1.
Un evento E es llamado evento imposible si ocurre que P(E) = 0.
Un evento E es llamado evento cierto si ocurre que P(E) = 1.
La probabilidad P(E) puede ser calculada de dos modos distintos.
5.4.1. Probabilidad Emp´ırica
Tambi´ en llamada la probabilidad frecuencial de un evento es el valor fijo al que tienden las frecuencias rela-
tivas de ocurrencia del evento de acuerdo a la regularidad estad´ıstica. Esta definici´ on ser´ıa la m´ as real, pero
proporciona probabilidades aproximadas, es decir, proporciona estimaciones y no valores reales. Adem´ as, los
resultados son a posteriori, pues se necesita realizar el experimento para poder obtenerlo.
Por ejemplo, uno podr´ıa calcular la probabilidad de obtener una suma de 7 cuando dos dados son lanzados mu-
chas veces, digamos 100 veces, y calculando que porcentaje de las veces sale 7. As´ı mismo tambi´ en se podr´ıa
calcular la probabilidad de que un jugador de basketball anote una cesta libre de tablerocalculando el porcentaje
de las veces que lo ha hecho en el pasado con estad´ısticas anteriores.
Para calcular la probabilidad de esta manera podr´ıa usarse la siguiente f´ ormula:
P(E) =
n´ umero de intentos en los que ocurre E
n´ umero de intentos totales
. (5.1)
Ejemplo: Digamos que la siguiente tabla representa las notas que obtienen en un ex´ amnen en base a 100
puntos un grupo de estudiantes:
Notas N´ umero de estudiantes
90-99 4
80-90 6
70-79 4
60-69 3
50-59 2
40-49 1
53
Si el evento A es evento en el que un estudiante obtiene entre 90 y 99 puntos, la probabilidad de sacar un
ex´ amen al azar y que sea una nota entre 90 y 99 puntos ser´ a:
P(A) =
cantidad de estudiantes que obtienen notas entre 90 y 99 puntos
cantidad total de estudiantes
=
4
20
= 0,20.
5.4.2. Probabilidad cl´ asica
La probabilidad cl´ asica de un evento E, que denotaremos por P(E), se define como el n´ umero de eventos
elementales que componen al evento E, entre el n´ umero de eventos elementales que componen el espacio
muestral:
P(E) =
n´ umero de eventos elementales que componen al evento E
n´ umero de eventos elementales que componen el espacio muestral
. (5.2)
Es la definici´ on m´ as utilizada porque supone de antemano, y se necesita como requisito indispensable, que todos
los eventos elementales tienen la misma probabilidad de ocurrir.
Ejemplo: Cuando se lanza una moneda, se obtienen dos resultados posibles: cara o sello. Digamos que el
evento que salga cara lo denotamos por A y a la de sello B. La probabilidad de que salga una cara al lanzar la
moneda ser´ a
P(A) = P(B) = P(cara) = P(sello) =
1
2
.
En el caso del ejemplo en el que uno lanza un dado, entonces se tendr´ a
P(sale 1) = P(sale 5) =
1
6
.
Note que para el c´ alculo de la probabilidad desde ´ esta perspectiva cl´ asica no es necesario de ninguna manera
que se tenga que confeccionar y realizar el experimento. Vasta, como se ve, que uno tenga pleno conocimiento
de el espacio muestral y sus respectivos resultados, por su puesto.
5.5. Axiomas de la probabilidad
Recordemos primero que las frecuencias relativas de una distribuci´ on ten´ıan las siguientes propiedades:
Las frecuencias relativas son mayores o iguales que cero.
La frecuencia relativa del espacio muestral es igual a la unidad.
Si dos eventos son mutuamente excluyentes, es decir que no ocurren simult´ aneamente, entonces la fre-
cuencia relativa de su uni´ on es la suma de las frecuencias relativas de cada uno.
54
Tomando en cuenta que la probabilidad de un evento, de acuerdo a la definici´ on ya expuesta, es la frecuencia
relativa cuando se aumenta el tama˜ no de la muestra, se tienen lo siguiente.
Si E es un evento de un espacio muestral S y P(E) es la probabilidad de E, entonces se satisfacen los axiomas
de la probabilidad:
1. La probabilidad de un evento E, es un n´ umero siempre entre 0 y 1, es decir, 0 ≤P(E) ≤ 1.
2. Se le llama a E evento seguro a un evento cuando P(E) = 1. Por otro lado, se le llama evento imposible
si P(E) = 0.
3. La probabilidad del universo es la m´ axima, P(S) = 1.
4. Si E
1
, E
2
,..., E
n
, son eventos mutuamente excluyentes, entonces
P(E
1
∪E
2
∪... ∪E
n
) = P
_
n
_
i=1
E
i
_
=
n

i=1
P(E
i
). (5.3)
Con estos axiomas podremos tratar algunas de las propiedades de la probabilidad de eventos.
5.6. Posibilidades y probabilidades
En los escrito anteriormente hemos utilizada indistintamente en algunos momentos las palabras posibilidad y
probabilidad. La principal motivaci´ on de esta secci´ on es hacer una diferenciaci´ on de estas dos cosas. En prin-
cipio pareciera l´ ogico que uno pudiera definir la probabilidad en t´ ermino de las posibilidades de que un evento
ocurra, sin embargo, hablando en t´ erminos generales, la palabra posibilidad proviene de referirse a ciertos jue-
gos de apuestas en las que se utiliza la frase: “la posibilidad de ganar es de x a y”, por ejemplo, “la posibilidad
de que gane es de 3 a 1”.
Cuando uno habla de ´ esa manera es inebitable pensar en que tal frase est´ a ligada de alguna manera a razones,
en el sentido matem´ atico de la palabra. Efectivamente, la posibilidad de que ocurra un evento se determina
mediante la raz´ on de la probabilidad de que ocurra a la probabilidad de que no ocurra.
Esto quiere decir que si la probabilidad de que un evento ocurra es p, entonces las posibilidades de que ocurra
son x a y, si
x
y
=
p
1 − p
, (5.4)
de tal manera que x y y son n´ umeros enteros.
Ejemplo: Si se tiran dos monedas normales (no trucadas), la probabilidad de que las dos monedas caigan
cara es de
1
4
. Esto quiere decir si alguien apuesta a que las dos monedas no caen simult´ aneamente en cara, la
posibilidad de ganar la apuesta es de
3
4
1 −
3
4
=
0,75
0,25
=
3
1
,
55
es decir, la posibilidad de ganar la apuesta es de 3 a 1.
Hemos de considerar que si es mayor la probabilidad de que no ocurra un evento, entonces se acostumbra men-
cionar las posibilidades en contra del evento.
Ejemplo: Si se tira un dado no trucado, sabemos que la probabilidad de obtener un cuatro es
1
6
, es decir que
la posibilidad de obtener un cuatro es de 1 a 6; pero se acostumbra decir que las posibilidades en contra, esto
es, de no obtener un cuatro es de 6 a 1.
Inversamente, en el caso de tener las posibilidades de un evento, entonces es f´ acil obtener su probabilidad, pues
si la posibilidad de un evento es de x a y, entonces la probabilidad p de que ocurra tal evento es
p =
x
x +y
. (5.5)
Ejemplo: En la Copa Mundial de Futbol Francia 1998 se dec´ıa que el equipo mexicano ten´ıa una posibilidad
de 1 a 75 de llegar a ser el campe´ on del torneo. Si se desea encontrar la probabilidad de que el equipo mexicano
llegase a ser campe´ on, entonces se tiene que
p =
x
x +y
=
1
1 +75
=
1
76
= 0,01311,
es la probabilidad de que ocurriese el evento.
Esto tiene la ventaja de que permite, en combinaci´ on con el tercer axioma de la probabilidad, medir la con-
fiabilidad que tienen las opiniones de las personas sobre las posibilidades que le asignan a algunos eventos.
Esto quiere decir que el c´ alculo de las probabilidades de dos eventos mutuamente excluyentes a partir de las
posibilidades otorgadas de manera subjetiva resulta como un criterio de consistencia.
Ejemplo: Un crimin´ ologo piensa que las posibilidades de que en la pr´ oxima semana la cantidad de delitos
en una ciudad aumente con respecto a la anterior es de 5 a 2, de que sea la misma cantidad de delitos es
de 1 a 3 y las posibilidades de que aumente la cantidad o sea la misma es de 7 a 4. Si se desea saber si
son consistentes las probabilidades correspondientes habr´ıa que hacer los c´ alculos. Las probabilidades de que
aumente la cantidad de delitos, que sea igual la cantidad de delitos, y de que aumente o sea igual la cantidad
de delitos es, respectivamente, de
p
aumente
=
5
5 +2
=
5
7
, p
igual
=
1
1 +3
=
1
4
, p
aumente
=
7
7 +4
=
7
11
,
y dado que
5
7
+
1
4
=
27
28
(como son eventos mutuamente excluyentes) no es lo mismo que
7
11
, entonces los criterios
del crimin´ ologo pueden ser cuestionados.
5.7. Propiedades de la probabilidad de eventos no elementales
Cuando se tienen eventos elementales no existe mucho problema en el sentido del c´ alculo de las probabilidades,
pues basta con una contabilizaci´ on o el uso directo del c´ alculo combinatorio. Pero en el caso de eventos no ele-
mentales, que son los compuestos por m´ as de un evento elemental, el proceder de manera an´ aloga resulta muy
56
complejo y las operaciones pueden sobrepasar la capacidad de c´ alculo existente. Sin embargo, utilizando los
axiomas de la probabilidad y las siguientes propiedades, se podr´ an expresar las probabilidades de estos eventos
en t´ erminos de los eventos elementales que lo componen, siempre y cuando se conozcan las probabilidades de
´ estos.
Veamos la probabilidad de una uni´ on de eventos, la cual la podremos calcular de la siguiente manera:
1. Propiedad 1. Si A y B son dos eventos, la probabilidad de que ocurra A o B es igual a la suma de las
probabilidades de ocurrencia de A y de B, menos la probabilidad de que ocurran A y B simult´ aneamente.
Es decir,
P(A∪B) = P(A) +P(B) −P(A∩B) (5.6)
Ahora, si el caso es que los eventos sean mutuamente excluyentes se tiene:
2. Propiedad 2. Si dos eventos, A y B, son mutuamente excluyentes entonces la probabilidad de que ocurra
A o B es igual a la suma de las probabilidades de ocurrencia de A y de B. Es decir
P(A∪B) = P(A) +P(B). (5.7)
Otra propiedad que se deriva de las anteriores es cuando se busca la probabilidad del complemento de un
evento E, que denotaremos como
¯
E:
3. Propiedad 3. Si E es un evento y
¯
E su complemento, entonces
P(
¯
E) = 1 −P(E). (5.8)
5.8. Probabilidad condicionada
En el c´ alculo de las probabilidades de algunos sucesos, el valor de dicha probabilidad var´ a en funci´ on del cono-
cimiento de determinadas informaciones relativas a estos sucesos.
Ejemplo: Si disponemos de una urna que contiene cuatro bolas numeradas del 1 al 4, extraemos una bola y
seguidamente la volvemos a introducir para realizar una segunda extracci´ on, la probabilidad de extraer, por
ejemplo, la bola n´ umero 3 en la segunda extracci´ on es la misma que en la primera. Si realizamos el mismo pro-
ceso sin reemplazar la bola extra´ıda la probabilidad de extraer, por ejemplo, la bola n´ umero 3 en la segunda
extracci´ on depender´ a de la bola extra´ıda en primer lugar.
Definici´ on. Sean A y B dos sucesos tal que P(A) 0, se llama probabilidad de B condicionada a A, P(B|A), a
la probabilidad de B tomando como espacio muestral A, es decir, la probabilidad de que ocurra B dado que ha
sucedido A. La probabilidad de que ocurra un evento A dado que ocurri´ o el evento B (el evento A depende del
evento B) es:
P(A|B) =
P(A∩B)
P(B)
. (5.9)
Hay que notar que esta propiedad no es conmutativa, situaci´ on que s´ı ocurre con la probabilidad de uni´ on o la
intersecci´ on de eventos, por lo que no hay que confundir P(A|B) y P(B|A).
Ejemplo: Consideremos el experimento de “lanzar un dado al aire”. Calculemos, por ejemplo, la probabilidad
57
de obtener un 3 sabiendo que ha salido un n´ umero impar. Definimos los sucesos A = {sacar 3} y B = {1, 3, 5};
entonces, P(A|B) = 1/3, puesto que si sabemos que ha salido un n´ umero impar, los casos posibles ahora son 3
y los casos favorables al suceso A s´ olo 1.
El conocimiento de que ha ocurrido el suceso A modifica, en algunas ocasiones, la probabilidad del suceso B,
pero en otras no. Los sucesos en los que, conociendo que uno ha ocurrido, no se modifica la probabilidad del
otro, decimos que son independientes y, si se modifica, decimos que son dependientes entre s´ı.
Finalmente, el criterio para la independencia de eventos queda como sigue:
Definici´ on. Dos eventos A y B son independientes si y s´ olo si
P(A|B) = P(A), P(B|A) = P(B), (5.10)
o, lo que es lo mismo,
P(A|B) = P(A)P(B). (5.11)
5.9. Probabilidad total
Llamamos sistema completo de sucesos a una familia de sucesos A
1
, A
2
, ..., A
n
que cumplen:
Son incompatibles dos a dos, A
i
∩A
j
=φ.
La uni´ on de todos ellos es el suceso seguro,

n
i=1
A
i
= S.
5.9.1. Teorema de la probabilidad total
Sea A
1
, A
2
, ..., A
n
un sistema completo de sucesos tales que la probabilidad de cada uno de ellos es distinta de
cero, y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B|A
i
), entonces la
probabilidad del suceso B viene dada por la expresi´ on:
P(B) = P(A
1
)P(B|A
1
) +P(A
2
)P(B|A
2
) +... +P(A
n
)P(B|A
n
). (5.12)
5.10. Teorema de Bayes
En el a˜ no 1763, dos a˜ nos despu´ es de la muerte de Thomas Bayes (1702-1761), se public´ o una memoria en la
que aparece, por vez primera, la determinaci´ on de la probabilidad de las causas a partir de los efectos que han
podido ser observados. El c´ alculo de dichas probabilidades recibe el nombre de teorema de Bayes.
Sea A
1
, A
2
, ..., A
n
un sistema completo de sucesos, tales que la probabilidad de cada uno de ellos es distinta
de cero, y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B|A
i
). entonces la
probabilidad P(A
i
|B) viene dada por la expresi´ on:
P(A
i
|B) =
P(A
i
)P(B|A
i
)
P(B)
=
P(A
i
)P(B|A
i
)
P(A
1
)P(B|A
1
) +P(A
2
)P(B|A
2
) +... +P(A
n
)P(B|A
n
)
. (5.13)
58
5.11. Problemas de final de cap´ıtulo
A continuaci´ on una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de
los problemas pudiera usarse todo lo reflejado en estas notas, as´ı como tambi´ en cualquier herramienta compu-
tacional o tecnol´ ogica disponible.
1. Con los jugadores de un club de f´ utbol se forman dos equipos para jugar un partido de entrenamiento;
entre los dos equipos se re´ unen 6 defensas, 8 medios, 6 delanteros y 2 porteros. El entrenador sabe que
en estos partidos, la probabilidad de que se lesione un jugador es 0.22 si es delantero, 0.11 si es medio,
0.055 si es defensa y 0 si es portero. (a) Calcular la probabilidad de que se lesione uno cualquiera de los
jugadores en este partido. (b) Si se sabe que un jugador se ha lesionado, determinar la probabilidad de
que haya sido un defensa.
2. Tras un estudio estad´ıstico en una ciudad se observa que el 70 % de los motoristas son varones y, de estos,
el 60 % llevan habitualmente casco. El porcentaje de mujeres que conducen habitualmente con casco es
del 40 %. Se pide: (a) Calcular la probabilidad de que un motorista elegido al azar lleve casco. (b) Se
elige un motorista al azar y se observa que lleva casco. ¿Cu´ al es la probabilidad de que sea var´ on?
3. En una ciudad, el 35 % vota al partido A, el 45 % vota al partido B y el resto se abstiene. Se sabe adem´ as
que el 20 % de los votantes de A, el 30 % de los de B y el 15 % de los que se abstienen, son mayores de
60 a˜ nos. Se pide: (a) Hallar la probabilidad de que un ciudadano elegido al azar sea mayor de 60 a˜ nos.
(b) Hallar la probabilidad de que un ciudadano mayor de 60 a˜ nos se haya abstenido.
4. Los alumnos de Primero de Biolog´ıa tienen que realizar dos pruebas, una te´ orica y otra pr´ actica. La
probabilidad de que un estudiante apruebe la parte te´ orica es de 0.6, la probabilidad de que apruebe la
parte pr´ actica es de 0.8 y la probabilidad de que apruebe ambas pruebas es 0.5. (a) ¿Son independientes
los sucesos aprobar la parte te´ orica y la parte pr´ actica? (b) ¿Cu´ al es la probabilidad de que un alumno no
apruebe ninguno de los dos ex´ amenes? (c) ¿Cu´ al es la probabilidad de que un alumno apruebe solamente
uno de los dos ex´ amenes? (d) Se sabe que un alumno aprob´ o la teor´ıa. ¿Cu´ al es la probabilidad de que
apruebe tambi´ en la pr´ actica?
5. En una baraja de 40 cartas. (a) Se toman dos cartas sin reemplazamiento. ¿Cu´ al es la probabilidad de que
las dos sean de distinto n´ umero? (b) Y si se toman tres cartas, ¿Cu´ al es la probabilidad de que los tres
n´ umeros sean distintos?
6. Tenemos un dado con tres “1”, dos “2” y un “3”. Lo tiramos dos veces consecutivas y anotamos la suma
de los resultados. (a) ¿Cu´ al es el Espacio Muestral? (b) ¿Cu´ al es la probabilidad de que la suma sea 4?
(c) ¿Cu´ al es la suma m´ as probable? ¿Cu´ anto vale su probabilidad?
7. Tenemos dos dados A y B, ambos trucados. En el dado A hay tres “1” y tres “2” y en el dado B hay dos
“1” y cuatro “2”. Se elige un dado al azar y se tira. (a) ¿Cu´ al es la probabilidad de obtener un “1”? (b)
Sabiendo que se ha obtenido un “2”, ¿Cu´ al es la probabilidad de que se haya elegido el dado B?
8. En una caja hay x bolas blancas y 1 bola roja. Al extraer de la caja dos bolas al azar sin reemplazamiento,
la probabilidad de que sean blancas es 1/2. Calcula el n´ umero de bolas blancas que debe tener la caja.
9. El 35 % de los cr´ editos de un banco es para vivienda, el 50 % para industrias y el 15 % para consumo
diverso. Resultan fallidos el 20 % de los cr´ editos para vivienda, el 15 % de los cr´ editos para industrias y
el 70 % de los cr´ editos para consumo. Calcula la probabilidad de que se pague un cr´ edito elegido al azar.
10. El volumen de producci´ on en tres plantas diferentes de una f´ abrica es de 500 unidades en la primera,
1000 unidades en la segunda y 2000 en la tercera. Sabiendo que el porcentaje de unidades defectuosas
producidas en cada planta es del 1 %, 0.8 % y 2 %, respectivamente, calcula la probabilidad de que al
seleccionar una unidad al azar sea defectuosa.
11. El 20 % de los empleados de una empresa son ingenieros y otro 20 % son economistas. El 75 % de los
ingenieros ocupan un puesto directivo y el 50 % de los economistas tambi´ en, mientras que de los no
59
ingenieros y no economistas solamente el 20 % ocupan un puesto directivo. ¿Cu´ al es la probabilidad de
que un empleado directivo elegido al azar sea ingeniero?
12. Se toman dos barajas espa˜ nolas de 40 cartas. Se extrae al azar una carta de la primera baraja y se introduce
en la segunda baraja. Se mezclan las cartas de esta segunda baraja y se extrae una carta, que resulta ser el
dos de oros. ¿Cu´ al es la probabilidad de que la primera carta extra´ıda fuese una espada?
13. En un conjunto de estudiantes el 15 % estudia alem´ an, el 30 % estudia franc´ es y el 10 % ambas materias.
(a) ¿Son independientes los sucesos estudiar alem´ an y estudiar franc´ es?. (b) Si se elige un estudiante al
azar, calcule la probabilidad de que no estudie franc´ es ni alem´ an.
14. Un ladr´ on, al huir de un polic´ıa, puede hacerlo por las calles A, B o C, con probabilidades p(A) = 0, 25,
p(B) = 0, 6 y p(C) = 0, 15 respectivamente. La probabilidad de ser alcanzado por la calle es 0,4 si huye
por la calle B es 0,5 y si huye por la calle C es 0,6. (a) Calcule la probabilidad de que la polic´ıa alcance
al ladr´ on. (b) Si el ladr´ on ha sido alcanzado, ¿cu´ al es la probabilidad de que haya sido en la calle A?
15. De una urna con 4 bolas blancas y 2 negras se extraen al azar, sucesivamente y sin reemplazamiento,
dos bolas, (a) ¿Cu´ al es la probabilidad de que las bolas extraidas sean blancas? (b) Si la segunda bola ha
resultado ser negra, ¿cu´ al es la probabilidad de que la primera tambi´ en lo haya sido?
16. Sean Ay Bdos sucesos de un experimento aleatorio tales que: P(A) =0, 6, P(B) =0, 5 y P(A
c
∪B
c
) =0, 7.
(a) Calc´ ulese P(A∩B) y raz´ onese si los sucesos A y B son independientes. (b) Calc´ ulese P(A∪B).
17. En un estudio realizado en cierta Universidad se ha determinado que un 20 % de sus estudiantes no
utilizan los transportes p´ ublicos para acudir a sus clases y que un 65 % de los estudiantes que utilizan
los transportes p´ ublicos tambi´ en hacen uso del comedor universitario. Calcular la probabilidad de que
seleccionado al azar un estudiante en esa Universidad resulte ser usuario de los transportes p´ ublicos y del
comedor universitario. Justificar la respuesta.
18. Una urna contiene dos monedas de plata y tres de cobre. Otra contiene cuatro monedas de plata y tres
de cobre. Si se elige una urna al azar y se extrae una moneda al azar. ¿Cu´ al es la probabilidad de que la
moneda extra´ıda sea de plata?.
19. Un dado est´ a trucado de manera que son iguales las probabilidades de obtener 2, 4 o 6, tambi´ en son
iguales las probabilidades de obtener 1, 3 o 5 y la probabilidad de obtener 2 es doble que la probabilidad
de sacar 1. Deducir razonadamente cu´ al es la probabilidad de que al lanzar el dado dos veces se obtenga
una suma igual a 7.
20. Una experiencia aleatoria consiste en preguntar a tres personas distintas, elegidas al azar, si son partidarias
o no de consumir un determinado producto. (a) Escribe el espacio muestral asociado a dicho experimento,
utilizando la letra ”s”para las respuestas afirmativas y ”n”para las negativas. (b) ¿Qu´ e elementos del es-
pacio muestral anterior constituyen el suceso .
a
l menos dos de las personas son partidarias de consumir el
producto
¿
(c) Describe el suceso contrario de ”m´ as de una persona es partidaria de consumir el producto”
21. En un supermercado el 70 % de las compras las realizan las mujeres; de las compras realizadas por estas,
el 80 % supera las 600 BsF, mientras que de las compras realizadas por hombres s´ olo el 30 % supera esa
cantidad. (a) Elegido un ticket de compra al azar, ¿cu´ al es la probabilidad de que supere las 600 BsF? (b)
Si se sabe que el ticket de compra no supera las 600 BsF ¿cu´ al es la probabilidad de que la compra haya
sido hecha por una mujer?
22. Se extrae una carta de una baraja espa˜ nola de 40 cartas. Si la carta extraida es un rey, nos dirigimos a la
urna I; en caso contrario a la urna II. A continuaci´ on, extraemos una bola. El contenido de la urna I es de
7 bolas blancas y 5 negras y el de la urna II es de 6 bolas blancas y 4 negras. Halla: (a) La probabilidad
de que la bola extraida sea blanca y de la urna II. (b) La probabilidad de que la bola extraida sea negra.
23. En una ciudad el 55 % de los habitantes consume pan integral, el 30 % consume pan de multicereales y
el 20 % consume ambos. Se pide: (I) Sabiendo que un habitante consume pan integral, ¿cu´ al es la proba-
bilidad de que coma pan de multicereales? (II) Sabiendo que un habitante consume pan de multicereales,
60
¿cu´ al es la probabilidad de que no consume pan integral? (III) ¿Cu´ al es la probabilidad de que una persona
de esa ciudad no consuma ninguno de los dos tipos de pan?
24. Si A y B son dos sucesos tales que: P(A) =
3
8
, P(B) =
1
2
y P(A∩B) =
1
4
. Calcula P(A
c
∩B
c
).
25. Tengo dos urnas, dos bolas blancas y dos bolas negras. Se desea saber como debo distribuir las bolas en
las urnas para que, al elegir una urna al azar, sea m´ axima la probabilidad de obtener una bola blanca. La
´ unica condici´ on exigida es que cada una tenga al menos una bola.
26. Se estima que s´ olo un 20 % de los que compran acciones en Bolsa tienen conocimientos burs´ atiles. De
ellos el 80 % obtienen beneficios. De los que compran acciones sin conocimientos burs´ atiles, s´ olo un
10 % obtienen beneficios. Se desea saber: (a) El tanto por ciento de los que compran acciones en Bolsa
que obtienen beneficios. (b) Si se elige al azar una persona que ha comprado acciones en Bolsa y resulta
que ha obtenido beneficios, ¿cu´ al es la probabilidad de que tenga conocimientos burs´ atiles?
27. El equipo directivo de cierta empresa del sector de hosteler´ıa est´ a constituido por 25 personas de las que
un 60 % son mujeres. El gerente tiene que seleccionar a una persona de dicho equipo para que represente
a la empresa en un certamen internacional. Decide lanzar una moneda: si sale cara, selecciona a una mujer
y si sale cruz, a un hombre. Sabiendo que 5 mujeres y 3 hombres del equipo directivo no hablan ingl´ es,
determina, justificando la respuesta, la probabilidad de que la persona seleccionada hable ingl´ es.
28. Dos personas piensan cada una de ellas un n´ umero del 0 al 9. Calcula la probabilidad de que las dos
personas no piensen el mismo n´ umero.
29. Dos sucesos tienen probabilidades 0,4 y 0,5. Sabiendo que son independientes, calcula la probabilidad de
que no suceda ninguno de los dos.
30. En una Universidad existen tres facultades: A, B y C. En A hay matriculadas 150 chicas y 50 chicos;
en B, 300 chicas y 200 chicos; y en C, 150 chicas y 150 chicos. (a) Calcula la probabilidad de que un
estudiante, elegido al azar, sea chico. (b) Si un estudiante elegido al azar resultara ser chico, ¿cu´ al es su
facultad m´ as probable?
31. Se escuchan tres discos y se vuelven a guardar al azar. ¿Cu´ al es la probabilidad de que al menos uno de
los discos haya sido guardado en el envoltorio que le correspond´ıa?
32. Se considera una c´ elula en el instante t=0. En el intante t=1 la c´ elula puede: bien reproducirse, divi-
di´ endose en dos, con probabilidad 3/4, o bien morir con probabilidad 1/4. Si la c´ elula se divide, entonces
en el tiempo t=2 cada uno de sus dos descendientes puede tambi´ en subdividirse o morir, con las mismas
probabilidades que antes, independientemente uno de otro. (a) ¿Cu´ antas c´ elulas es posible que haya en el
tiempo t=2? (b) ¿Con qu´ e probabilidad?
33. Una caja contiene 10 bolas blancas, 5 negras y 5 rojas. Se extraen dos bolas consecutivamente de la caja.
Calcula la probabilidad de que las dos sean blancas si: (a) Antes de extraer la segunda bola se vuelve a
meter la primera en la caja. (b) La segunda bola se extrae sin haber metido la primera en la caja.
34. Un monedero contiene 2 monedas de plata y 3 de cobre, y otro contiene 4 de plata y 3 de cobre. Si se
elige un monedero al azar y se extrae una moneda ¿Cu´ al es la probabilidad de que sea de plata?
35. En una oficina el 70 % de los empleados son asturianos. De entre los asturianos, el 50 % son hombres,
mientras que de los no asturianos, s´ olo son hombres el 20 %. ¿Qu´ e porcentaje de empleados no asturianos
son mujeres? (a) Calcula la probabilidad de que un empleado de la oficina sea mujer. (b) Fernando trabaja
en dicha oficina. ¿Cu´ al es la probabilidad de que sea asturiano?
36. El 12 % de los habitantes de un pa´ıs padece cierta enfermedad. Para el diagn´ ostico de esta, se dispone de
un procedimiento que no es completamente fiable ya que da positivo en el 90 % de los casos de personas
realmente enfermas, pero tambi´ en da positivo en el 5 % de personas sanas. ¿Cu´ al es la probabilidad de
que est´ e sana una persona a la que el procedimiento le ha dado positivo?
37. En un ayuntamiento hay 5 concejales del partido A, 4 del B y 1 del C. Si se eligen al azar y sucesivamente
tres concejales, ¿cu´ al es la probabilidad de que los tres sean del partido A? ¿y la de que pertenezcan a
61
partidos distintos?
38. Un dado ha sido trucado de manera que la probabilidad de sacar un n´ umero par es el doble que la de sacar
un n´ umero impar. Se lanza el dado y se pide: La probabilidad de obtener un n´ umero par (a) Si, a la vez,
se lanza un dado no trucado, la probabilidad de obtener un n´ umero par y un n´ umero impar. (b) Si, a la
vez, se lanza un dado no trucado, la probabilidad de obtener, al menos, un n´ umero impar.
62
Cap´ıtulo 6
Variable aleatoria y funci ´ on de
distribuci ´ on
6.1. Introducci´ on
En este tema se tratar´ a de formalizar num´ ericamente los resultados de un fen´ omeno aleatorio. Por tanto, una
variable aleatoria es un valor num´ erico que corresponde a un resultado de un experimento aleatorio. Algunos
ejemplos son: n´ umero de caras obtenidas al lanzar seis veces una moneda, n´ umero de llamadas que recibe un
tel´ efono durante una hora, tiempo de fallo de una componente el´ ectrica, etc.
El estudio que se har´ a en este tema ser´ a an´ alogo al que se hace con las variables estad´ısticas en descriptiva.
As´ı retomaremos el concepto de distribuci´ on y las caracter´ısticas num´ ericas, como la media y varianza. El papel
que all´ı jugaba la frecuencia relativa lo juega ahora la probabilidad. Esto va a proporcionar aspectos y propie-
dades referentes a fen´ omenos aleatorios que permitir´ an modelos muy estudiados en la actualidad.
En este tema se introduce el concepto de variable aleatoria y se estudian los distintos tipos de variables aleato-
rias a un nivel muy general, lo que nos permitir´ a manejar los modelos estad´ısticos para describir los posibles
resultados de un experimento aleatorio y asignar probabilidades a los diferentes sucesos que nos interesen.
Tanto en la vida cotidiana como en el campo cient´ıfico estamos habituados a observar fen´ omenos aleatorios
cuyos resultados se expresan mediante n´ umeros; por ejemplo el voltaje de salida en una fuente de alimentaci´ on,
el n´ umero de personas en la cola del cine, la velocidad de conexi´ on a la red, etc. Incluso en problemas de
naturaleza puramente cualitativa es muy frecuente recurrir a la codificaci´ on num´ erica; en situaciones tales como:
el diagn´ ostico de un paciente ”sano.
o
.
en
fermo”, preguntas del tipo
ˆ
A¿estudias o trabajas?, etc., las respuestas
son usualmente codificadas con 0 y 1, aunque en realidad podr´ıa emplearse cualquier pareja de s´ımbolos con
igual precisi´ on.
63
6.2. Variable aleatoria unidimensional
Este proceso de cuantificaci´ on nos lleva de manera natural a considerar la siguiente definici´ on:
Dado un experimento aleatorio y asociado al mismo, un espacio probabil´ıstico (E, A, P), una variable aleatoria
(V.A.) es una aplicaci´ on X : E → ℜ, a cada valor de X, del espacio muestral le hace corresponder un n´ umero
real. Se dice que X es una variable aleatoria si para cualquier x perteneciente a ℜ, el conjunto de los sucesos
elementales le hace corresponder un valor que verifica:
∀X ∈ ℜ, X(S) ≤ X (6.1)
Ejemplo: Consideramos un experimento aleatorio de lanzar una moneda al aire tres veces y anotamos
el resultado. Se define la variable aleatoria X como n´ umero de caras aparecidas en los tres lanzamientos.
Calcular el espacio muestral y comprobar que es una variable aleatoria. La soluci´ on es la siguiente, E =
(C, X, X), (X,C, X), (X, X,C), (C,C, X), (C, X,C), (X,C,C), (C,C,C), (X, X, X), en donde
Eventos Valor de la v.a.
φ X ≤ 0
(X, X, X) 0 ≤ X ≤ 1
(C,C,C)(X,C, X)(X, X,C) 1 ≤ X ≤ 2
(C,C, X)(C, X,C)(X,C,C) 2 ≤ X ≤ 3
(C,C,C) X > 3
En general emplearemos las siglas v.a. para referirnos a una variable aleatoria.
Para caracterizar la distribuci´ on de probabilidad inducida por una v.a. X definiremos una nueva funci´ on m´ as
sencilla de manejar:
Definici´ on. (Funci´ on de distribuci´ on). Dada la v.a. X se denomina funci´ on de distribuci´ on asociada a X, a la
funci´ on F : ℜ→ℜ definida por:
F(t) = Pr[X ≤t] = Pr(X ∈ (−∞, t]), ∀t ∈ ℜ. (6.2)
Las propiedades m´ as importantes de las funciones de distribuci´ on son:
1. F(−∞) = l´ım
n→−∞
Pr[X ≤t] = 0.
2. F(∞) = l´ım
n→∞
Pr[X ≤t] = 0.
3. La funci´ on es continua por la derecha, es decir, l´ım
h→0
+ F(t +h) = F(t)
4. F es no decreciente, es decir, si t
1
<t
2
entonces F(t
1
) ≤ F(t
2
).
Teorema. Una funci´ on F : ℜ → ℜ se dice que es de distribuci´ on si y s´ olo si verifica las cuatro propiedades
anteriores.
6.3. Variables discretas
Definici´ on. (Variable discreta). Una variable aleatoria discreta es aquella que s´ olo puede tomar valores dentro
de un conjunto finito o infinito numerable.
64
Definici´ on. (Funci´ on de probabilidad). Sea X una v.a. discreta que toma los valores x
i
con probabilidades
p
i
= Pr(X = x
i
), con ∑
i
p
i
= 1. Se denomina funci´ on de probabilidad de la variable X a la funci´ on que asigna a
cada x
i
su probabilidad p
i
.
En las variables aleatorias discretas la funci´ on de distribuci´ on viene dada por la siguiente expresi´ on:
F(t) = Pr[X ≤t] =

x
i
≤t
Pr(x
i
). (6.3)
Esta funci´ on es escalonada, no decreciente, con saltos de discontinuidad en los puntos x
i
. El valor del salto en
x
i
coincide con la probabilidad, p
i
, de dicho valor.
6.4. Variables continuas
Definici´ on. (Variable continua). Una variable aleatoria continua es aquella que toma valores en uno o varios
intervalos de la recta real.
En las v.a. continuas la funci´ on de distribuci´ on no se puede calcular como la suma de las probabilidades de
ciertos puntos porque el conjunto de posibles valores de la variable es no numerable. Para abordar esta nueva
situaci´ on necesitamos la noci´ on de funci´ on de densidad.
Definici´ on. (Funci´ on de densidad). Dada una v.a. continua X, su funci´ on de densidad es la funci´ on real de
variable real
f (x) = l´ım
h→0
+
Pr(x −h ≤X ≤ x +h)
2h
. (6.4)
De este modo, surge el concepto de funci´ on de densidad como la funci´ on l´ımite a la cual se aproxima el histo-
grama. As´ı, la probabilidad de un intervalo (a, b) ser´ a el ´ area limitada por esta funci´ on de densidad, las rectas
x = a, x = b y el eje de abscisas.
Aunque, de acuerdo con la anterior, la probabilidad de que la variable aleatoria tome un valor concreto es igual
a cero, tiene sentido analizar lo ”densamente”que est´ a repartida la probabilidad en torno a ese valor.
De la definici´ on anterior, se deduce que la funci´ on de densidad verifica las siguientes propiedades:
f (x) > 0, ∀x ∈ ℜ, (6.5)
_

−∞
f (x)dx = 1. (6.6)
En general, cualquier funci´ on real que verifica las propiedades anteriores es la funci´ on de densidad de alguna
v.a. continua X.
65
La funci´ on de distribuci´ on de una v.a. continua X se expresa a partir de la funci´ on de densidad como:
F(t) =
_
t
−∞
f (x)dx, ∀x ∈ ℜ (6.7)
Esta funci´ on es continua.
Por lo tanto, la funci´ on de densidad de una v.a. continua es la derivada de su funci´ on de distribuci´ on, f (x) =
F

(x).
6.5. Caracter´ısticas de una v.a.
Las medidas resumen definidas para v.e. pueden generalizarse al caso de variables aleatorias, sin m´ as que
equiparar las frecuencias relativas de variables estad´ısticas con las probabilidades de las variables aleatorias.
Entre los descriptores m´ as habituales de las variables aleatorias se encuentran los siguientes.
6.5.1. Definici´ on. (Esperanza Matem´ atica)
Cuando se realiza un experimento determinista el resultado del experimento es ´ unico en contraposici´ on con
un experimento aleatorio en el cual existen un intervalo de valores, seg´ un la variable aleatoria definida, donde
es posible que ocurra cualquier resultado. En ocasiones, por simplicidad, se aproxima la forma de explicar un
experimento aleatorio en t´ erminos de un experimento determinista pero con la dificultad de no tener argumentos
suficientes para escoger el resultado ´ unico que se asociar´ıa al experimento determinista. El conocimiento del
concepto de valor esperado ayuda a eliminar la dificultad planteada.
Dada una v. a. X definida sobre (E,A,Pr), se denomina esperanza o valor medio de X a la siguiente expresi´ on
µ = E(X) =

x
i
∈S
X
x
i
P(x
i
), si X es discreta, (6.8)
µ = E(X) =
_

−∞
x f (x)dx, si X es continua (6.9)
La esperanza de una v.a. verifica las siguientes propiedades:
E(aX +b) = aE(X) +b. (6.10)
E(X ±Y) = E(X) ±E(Y). (6.11)
Si X e Y son independientes, entonces E(XY) = E(X)E(Y). (6.12)
La estructura de la Ecuaci´ on 4.1 se presenta en otros contextos, como por ejemplo en Mec´ anica, donde la fun-
ci´ on de densidad de probabilidades tiene el sentido de la distribuci´ on de la masa a lo largo de un eje y el valor
esperado se corresponde con el centro de esa masa.
En el contexto de la teor´ıa de probabilidades una variable aleatoria estar´ a definida en un cierto intervalo cuyo
c¸entro.
es
su valor esperado. En este sentido, se podr´ıa decir que el experimento aleatorio est´ a definido alrededor
66
del valor esperado y la ponderaci´ on de cada uno de los posibles resultados viene dada en t´ erminos del valor de
la funci´ on de densidad correspondiente en cada punto. El concepto del valor esperado permite aglutinar en un
n´ umero los aportes ponderados de cada uno de los posibles resultados del experimento.
Ejemplo: una v.a. Y cuya funci ´ on de densiad de probabilidad est´ a dada por la expresi´ on: f (y) =λexp(−λy),
cuando y ≥ 0 y cero para cualquier otro valor. Hallar el valor esperado de dicha funci´ on de densidad de pro-
babilidad.
6.5.2. Definici´ on. (Varianza)
En la secci´ on anterior se analiz´ o la definici´ on de valor esperado tanto desde el punto de vista matem´ atico como
desde el punto de vista del fen´ omeno aleatorio involucrado. Este valor permite ubicar r´ apidamente la regi´ on
donde est´ a definida la variable como aquella regi´ on que se encuentra alrededor del valor esperado. Pero no
proporciona informaci´ on acerca del tama˜ no de esa regi´ on. Una medida de la dispersi´ on o de la concentraci´ on
de la variable alrededor de su valor esperado lo proporciona la varianza.
La varianza de una v.a. X viene dada por la expresi´ on
σ
2
=Var(X) = E
_
(X −µ)
2
¸
=

x
i
∈S
X
(x
i
−µ)
2
P(x
i
), si X es discreta, (6.13)
σ
2
=Var(X) = E
_
(X −µ)
2
¸
=
_

−∞
(x −µ)
2
f (x)dx, si X es continua (6.14)
La varianza de una v.a. verifica las siguientes propiedades:
Var(X) 0. (6.15)
Var(aX +b) = a
2
Var(X). (6.16)
Var(X) = E(X
2
) −E(X)
2
. (6.17)
Si X e Y son independientes, Var(X +Y) =Var(X −Y) =Var(X) +Var(Y). (6.18)
Ejemplo: una v.a. Y cuya funci ´ on de densiad de probabilidad est´ a dada por la expresi´ on: f (y) =λexp(−λy),
cuando y ≥0 y cero para cualquier otro valor. Hallar la varianza de dicha funci´ on de densidad de probabilidad.
6.6. Inecuaci´ on de Chevyshev
La definici´ on de variable aleatoria y de las funciones de distribuci´ on y de densidad refleja el comportamiento
del experimento aleatorio que se est´ a analizando. Se ha verificado en diversas oportunidades que la forma de las
funciones de distribuci´ on y de densidad debe seguir un cierto patr´ on que obliga a que no todo tipo de funci´ on
puede ser considerada para este tipo de representaci´ on. En este orden de ideas, el conocimiento del valor espe-
rado y la varianza proporciona informaci´ on adicional acerca de la forma de estas funciones y, en consecuencia,
de las probabilidades asignadas a diversos tipos de eventos. Este tipo de informaci´ on llega hasta el extremo
de indicar topes en el valor de la probabilidad de ocurrencia de ciertos eventos para cualquier tipo de variable
67
aleatoria.
La inecuaci´ on de Chevyschev permite conocer un l´ımite al valor que puede tener la probabilidad de un cierto
tipo de evento independientemente de la forma de su funci´ on de densidad de probabilidades.
Definici´ on: Sea una variable aleatoria X de la cual s´ olo conocemos su valor esperado E(X) y su varianza V(X).
Sea un evento del tipo X −E(X) ≤ kσ
X
, entonces la probabilidad de ocurrencia de este evento tiene un valor
m´ınimo que es una funci´ on del valor real positivo k y no depende de la forma de la funci´ on de densidad de
probabilidades de X.
PX −E(X) ≤ kσ
X
1 −
1
k
2
(6.19)
Notas:
El valor m´ınimo de la probabilidad del evento mencionado se calcula utilizando el lado derecho de la
Ecuaci´ on anterior.
La expresi´ on anterior se conoce como la inecuaci´ on de Chevyschev.
6.7. Problemas de final de cap´ıtulo
A continuaci´ on una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de
los problemas pudiera usarse todo lo reflejado en estas notas, as´ı como tambi´ en cualquier herramienta compu-
tacional o tecnol´ ogica disponible.
1. Se lanza al aire una moneda tres veces. Calcula la funci´ on de masa y la de distribuci´ on de X: No de cruces
obtenido.
2. Se ha comprobado experimentalmente que la vida ´ util de una bater´ıa es una variable aleatoria cuya fun-
ci´ on de densidad es:
f (x) = be
(
−ax), si x ≥ 0, con a, b ≥ 0.
Determina la relaci´ on entre a y b. Obt´ en la funci´ on de distribuci´ on de la variable y calcula la probabilidad
de que una bater´ıa dure un tiempo mayor a 1/a. Sol. P=0,3678
3. Un PEQ consta de 10 preguntas tipo test, cada una de ellas con 4 posibles respuestas. Cada pregunta
contestada correctamente es un punto. Cada fallo descuenta 0,5 puntos. Como ser´ a la calificaci´ on del
alumno si ´ este contesta a todas al azar.
4. Por experiencia se sabe que la probabilidad de que llames al ambulatorio y no comunique es de 0,25.
Demuestra matem´ aticamente que el n´ umero esperado de llamadas que debes hacer para que te cojan es
de 4.
5. Una variable aleatoria tiene por funci´ on de densidad:
f (x) =
1
12
(x
2
+1), si 0 ≤ x ≤ 3.
Calcular la media de X y su varianza. Sol. µ = 2,0625, σ
2
= 0,5461.
68
6. Los retrasos en las entregas de los pedidos en una f´ abrica respecto de la planificaci´ on establecida siguen
una variable aleatoria cuya funci´ on de densidad es:
f (x) =
2
π
1
1 +x
2
, si −1 ≤ x ≤ 1.
Cu´ al es el retraso medio de un pedido y la desviaci´ on t´ıpica. Propone un intervalo de tiempos de retraso,
centrado en el retraso medio, para el 90 % de los casos. Sol. µ = 0, σ
2
= 2,28, (-0,84; 0,84)
7. Una f´ abrica de coches vende de media, al a˜ no, 50 unidades de su modelo m´ as caro, con una desviaci´ on
t´ıpica de 10. Cu´ antos coches de este modelo debe de tener disponibles si se quiere garantizar la demanda
al momento de estos veh´ıculos, con una probabilidad del 95 %? Sol. 95 coches
69
Cap´ıtulo 7
Distribuciones de Probabilidad
Binomial y Normal
7.1. Introducci´ on
Estudiaremos en este tema dos de las distribuciones de probabilidad m´ as importantes y que son imprescindi-
bles a la hora de adentrarnos en el estudio de la inferencia estad´ıstica. La distribuci´ on binomial es uno de los
primeros ejemplos de las llamadas distribuciones discretas (que s´ olo pueden tomar un n´ umero finito, o infinito
numerable, de valores). Fue estudiada por Jakob Bernoulli (Suiza, 1654-1705), qui´ en escribi´ o el primer trata-
do importante sobre probabilidad, .
A
rs conjectandi”(El arte de pronosticar). Los Bernoulli formaron una de las
sagas de matem´ aticos m´ as importantes de la historia. La distribuci´ on normal es un ejemplo de las distribucio-
nes continuas, y aparece en multitud de fen´ omenos sociales y cient´ıficos. Fue estudiada, entre otros, por J.K.F.
Gauss (Alemania, 1777-1855), uno de los m´ as famosos matem´ aticos de la historia. La gr´ afica de la distribuci´ on
normal en forma de campana se denomina Campana de Gauss.
7.2. La distribuci´ on binomial o de Bernoulli
La distribuci´ on binomial est´ a asociada a experimentos del siguiente tipo:
Realizamos n veces cierto experimento en el que consideramos s´ olo la posibilidad de ´ exito o fracaso.
La obtenci´ on de ´ exito o fracaso en cada ocasi´ on es independiente de la obtenci´ on de ´ exito o fracaso en
las dem´ as ocasiones.
La probabilidad de obtener ´ exito o fracaso siempre es la misma en cada ocasi´ on.
Ve´ amoslo con un ejemplo.
Tiramos un dado 7 veces y contamos el n´ umero de cincos que obtenemos. ¿Cu´ al es la probabilidad de obtener
tres cincos?.
70
Este es un t´ıpico ejemplo de distribuci´ on binomial, pues estamos repitiendo 7 veces el experimento de lanzar un
dado. ¿Cu´ al es nuestro ´ exito?.
Evidentemente, sacar un 5, que es en lo que nos fijamos.
El fracaso, por tanto, ser´ a no sacar 5, sino sacar cualquier otro n´ umero. Por tanto,
´
Exito = E = ”sacar un
5”→ p(E) =
1
6
, Fracaso = F = ”no sacar un 5”→ p(F) =
5
6
.
Para calcular la probabilidad que nos piden, fij´ emonos en que nos dicen que sacamos 3 cincos y por lo tanto
tenemos 3 ´ exitos y 4 fracasos, ¿de cu´ antas maneras pueden darse estas posibilidades?. Podr´ıamos sacar 3 cincos
en las 3 primeras tiradas y luego 4 tiradas sin sacar cinco, es decir: EEEFFFF. Pero tambi´ en podr´ıamos sacar
EFEFFFE, es decir que en realidad estamos calculando de cu´ antas maneras se pueden ordenar 4 fracasos y
3 ´ exitos. Recordando las t´ ecnicas combinatorias, este problema se reduce a calcular las permutaciones con
elementos repetidos:
P
3,4
7
=
7!
3!4!
=
7 · 6 · 5
3 · 2 · 1
= 35 formas
Y por tanto, como p(E) =
1
6
y tengo 3 ´ exitos y p(F) =
5
6
y tengo 4 fracasos:
p(tener 3 ´ exitos y 4 fracasos) = 35 ·
1
6
·
1
6
·
1
6
·
5
6
·
5
6
·
5
6
·
5
6
= 0,0781
Formalizando lo obtenido, en una variable binomial con 7 repeticiones y con probabilidad de ´ exito
1
6
, la proba-
bilidad de obtener 3 ´ exitos es 0.0781, y lo expresar´ıamos:
Bin
_
7;
1
6
_
, entonces p(x = 3) = 0,0781
Como repetir este proceso ser´ıa bastante penoso en la mayor´ıa de los casos, lo mejor es recurrir a la siguiente
f´ ormula que expresa la probabilidad de obtener cierto n´ umero de ´ eitos en una distribuci´ on binomial:
Definici´ on de distribuci´ on binomial:
Si realizamos n veces un experimento en el que podemos obtener ´ exito, E, con probabilidad p y fracaso, F,
con probabilidad q (q = 1 − p), diremos que estamos ante una distribuci´ on binomial de par´ ametros n y p, y lo
representaremos por Bin(n; p). En este caso la probabilidad de obtener k ´ exitos viene dada por:
p(x = k) =
_
n
k
_
p
k
q
(n−k)
=
_
n
k
_
p
k
(1 − p)
(n−k)
(7.1)
Nota: Observar que las probabilidades de ´ exito y fracaso son complementarias, es decir,q = 1 − p y p = 1 −q,
por lo que basta saber una de ellas para calcular la otra.
Ejemplo: Antes ten´ıamos Bin
_
7;
1
6
_
, y quer´ıamos calcular p(X = 3) (obtener 3 ´ exitos). Aplicando la f´ ormula:
p(x = 3) =
_
7
3
_
·
1
6
3
·
5
6
4
= 0,0781.
71
Ejemplo: Supongamos que la probabilidad de que una pareja tenga un hijo o una hija es igual. Calcular
la probabilidad de que una familia con 6 descendientes tenga 2 hijos. En este caso Exito = E = tener hi jo y
p(E) = 0,5. Fracaso = F = tener hi ja y p(F) = 0,5. Estamos por tanto ante una binomial Bin(6; 0,5) y nos
piden p(X = 2). Si aplicamos la f ´ ormula es:
p(x = 2) =
_
6
2
_
· 0,5
2
· 0,5
4
= 0,2344.
Nota: La elecci´ on de ´ exito o fracaso es subjetiva y queda a elecci´ on de la persona que resuelve el problema,
pero teniendo cuidado de plantear correctamente lo que se pide. En el caso concreto del ejemplo anterior, si:
Exito = tener hi ja, como nos piden la probabilidad de que una familia con 6 hijos tenga 2 hijos, si el ´ exito es
tener hija hemos de plantearnos cu´ al es la probabilidad de tener 4 ´ exitos (4 hijas), es decir:
p(x = 4) =
_
6
4
_
· 0,5
4
· 0,5
2
= 0,2344.
Evidentemente sale lo mismo, pero hay que ser consecuente a la hora de elegir el ´ exito y el fracaso y la pregunta
que nos hagan.
7.2.1. El uso de las tablas de la distribuci´ on binomial
La distribuci´ on binomial se encuentra tabulada por lo que es f´ acil calcular probabilidades sin necesidad de hacer
demasiadas cuentas. Para usar las tablas de la distribuci´ on binomial es necesario conocer:
El n´ umero de veces que se realiza el experimento (n).
La probabilidad de ´ exito (p).
El n´ umero de ´ exitos (k).
La probabilidad p se busca en la primera fila (valores desde 0.01 hasta 0.5).
El n´ umero de veces que se realiza el experimento, en la primera columna (valores desde 2 a 10) y el n´ umero de
´ exitos a su lado.
Por ejemplo en el caso anterior, Bin(6; 0,5) , p(X = 2), la columna p = 0,5 es la ´ ultima, y cuando n = 6 y k = 2
encontramos 0.2344, el valor que hab´ıamos calculado.
Nota importante: El caso en que p > 0,5, no se encuentra tabulado. La raz´ on es bien sencilla. Si p > 0,5,
entonces q < 0,5 y basta intercambiar los papeles de ´ exito y fracaso para que podamos utilizar la tabla.
Ejemplo: La probabilidad de que un alumno de 2do de Bachillerato apruebe las Matem´ aticas es de 0.7. Si con-
sideramos un grupo de 8 alumnos, ¿cu´ al es la probabilidad de que cinco de ellos aprueben las Matem´ aticas?.
Si ´ exito = .
a
probar
2
fracaso = ”suspender”, entonces p = 0,7 y q = 0,3. Tenemos, por tanto, una Bin(8; 0,7).
Nos piden calcular p(X = 5), que no se puede calcular mediante las tablas porque p = 0,7 y s´ olo tenemos
hasta p =0,5. Por tanto si intercambiamos ´ exito = ”suspender
2
fracaso =.
a
probar.
en
tonces p =0,3, q =0,7, es
72
decir la nueva binomial es Bin(8; 0,3) y nos piden que aprueben 5 de 8, es decir que suspendan 3 de 8 o lo que
es lo mismo, que tengamos 3 ´ exitos, p(X = 3), y buscando en la tabla es p(X = 3) = 0,2541. Tambi´ en, desde
luego podr´ıamos haber utilizado la f´ ormula desde el principio, utilizar la Bin(8; 0,7) y olvidarnos de tablas
para hacer:
p(x = 5) =
_
8
5
_
· 0,7
5
· 0,3
3
= 0,254.
7.2.2. Probabilidades acumuladas
Es posible que nos pidan no s´ olo la probabilidad de que ocurran un cierto n´ umero de ´ exitos en concreto, sino que
ocurran como mucho ”k”´ exitos o preguntas similares. En el ejemplo anterior, por ejemplo, podr´ıan pedirnos: a)
¿Cu´ al es la probabilidad de que aprueben como mucho 2 alumnos?.
Si ´ exito = aprobar y fracaso = suspender, p = 0,7 y q = 0,3, entonces nos piden p(X ≤ 2). En este caso, basta
pensar en que para que aprueben 2 alumnos como mucho, puede que aprueben 2, 1 o ninguno, es decir:
p(X ≤ 2) = p(X = 0) + p(X = 1) + p(X = 2) = 0,0001 +0,0012 +0,01 = 0,1013
(haz las cuentas)
b) ¿Cu´ al es la probabilidad de que aprueben entre 3 y 6 alumnos (inclusive)?. Del mismo modo:
p(3 ≤ X ≤ 6) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) = 0,0467+0,1361+0,2541+0,2965 = 0,7334
Hemos de tener en cuenta que para la distribuci´ on binomial, en las tablas s´ olo se admiten valores hasta n = 10
(10 repeticiones del experimento). Para valores de n > 10, inevitablemente hemos de utilizar la f´ ormula.
Ejemplo: Los alumnos de cierta clase se encuentran en una proporci´ on del 67 % que estudian ingl´ es y el
resto franc´ es. Tomamos una muestra de 15 alumnos de la clase, calcular: a) Probabilidad de que al menos
encontremos tres alumnos de ingl´ es. b) Probabilidad de que los 15 alumnos estudien ingl´ es. c) Probabilidad
de que estudien ingl´ es entre 7 y 10 alumnos. Si ´ exito = estudiar ingl´ es, p = 0,67 y fracaso = estudiar franc´ es,
q = 1 −0,67 = 0,33. Manejamos por tanto una Bin(15; 0,67). Para la parte a), se tendr´ a
p(X > 3) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) +... + p(X = 15).
Una opci´ on es calcular estas 13 probabilidades y sumarlas. Como hay que aplicar la f´ ormula para calcular
cada una, la tarea se puede hacer bastante larga. Otra opci´ on, m´ as sencilla, es pasar al complementario. El
complementario de encontrar al menos 3 alumnos de ingl´ es es encontrar como mucho 2 alumnos de ingl´ es,
p(X ≤ 2). Es decir,
p(X > 3) = 1 − p(X < 3) = 1 − p(X ≤ 2) = 1 −(p(X = 0) + p(X = 1) + p(X = 2))
y s´ olo tenemos que calcular 3 probabilidades: p(X = 0) ∼ 0 , p(X = 1) = 0,000001, p(X = 2) = 0,000026
(compru´ ebalo!). Por lo cual,
p(X > 3) = 1 −(0 +0,000001 +0,000026) = 1 −0,000027 = 0,999973
73
Para la parte b), se tendr´ a
p(X = 15) = 0,0025
(aplica la f´ ormula). Para la parte c), se tendr´ a
p(7 ≤X ≤10) = p(X =7)+p(X =8)+p(X =9)+p(X =10) =0,0549+0,1114+0,1759+0,2142 =0,5564.
7.2.3. Media y desviaci´ on t´ıpica en una distribuci´ on binomial
Aunque no se demostar´ a, en una distribuci´ on binomial Bin(n; p), el n´ umero esperado de ´ exitos o media, viene
dado por ¯ x = np. (Recordemos que la media es una medidad de centralizaci´ on).
La desviaci´ on t´ıpica, σ , que es una medida de dispersi´ on y mide lo alejados que est´ an los datos de la media,
viene dada por σ =

npq.
7.3. La distribuci´ on Normal
Al estudiar aspectos tan cotidianos como:
Caracteres morfol´ ogicos de individuos ( personas, animales, plantas) de una misma raza. como tallas,
pesos, envergaduras, etc.
Caracteres fisiol´ ogicos, como el efecto de una misma dosis de un f´ armaco, o de una misma cantidad de
abono.
Caracteres sociol´ ogicos, como el consumo de ciertos productos por individuos de un mismo grupo hu-
mano.
Caracteres psicol´ ogicos, como el cociente intelectual, grado de adaptaci´ on a un medio.
Caracteres f´ısicos, como la resistencia a la rotura de ciertas piezas.
todos ellos tienen en com´ un que se distribuyen ”normalmente”. ¿Qu´ e quiere decir esta expresi´ on?. Pu´ es, por
ejemplo, si hacemos una estad´ıstica para conocer la altura de 1400 mujeres y representamos los resultados en
un diagrama de barras, obtenemos:
Figura 7.1: Distribuci´ on de estaturas de 1400 mujeres.
74
Las gr´ aficas de este tipo son muy corrientes: Hay pocos individuos en los extremos y un aumento paulatino
hasta llegar a la parte central del recorrido, donde est´ a la mayor´ıa de ellos.
Definici´ on: Diremos que una distribuci´ on de probabilidad sigue una distribuci´ on normal de media ¯ x y desviaci´ on
t´ıpica σ, y lo representaremos por N( ¯ x; σ) cuando la representaci´ on gr´ afica de su funci´ on de densidad es una
curva positiva continua, sim´ etrica respecto a la media, de m´ aximo en la media, y que tiene 2 puntos de inflexi´ on
, situados a ambos lados de la media ( ¯ x −σ y ¯ x +σ respectivamente) y a distancia de σ ella, es decir de la
forma:
Figura 7.2: Distribuci´ on normal N( ¯ x; σ). El m´ aximo est´ a en ( ¯ x,
1

2πσ
2
).
Dependiendo de los valores que tomen ¯ x y σ, la gr´ afica de esta funci´ on puede ser m´ as o menos alargada, achata-
da, etc..., pero en cualquier caso siempre tiene las mismas condiciones de simetr´ıa, continuidad, etc, rese˜ nadas
anteriormente.
El concepto de funci´ on de densidad introducido anteriormente no se estudiar´ a con profundidad. Baste decir que
la funci´ on de densidad determina la forma de cada distribuci´ on de probabilidad. En el caso de la distribuci´ on
normal de par´ ametros ¯ x y σ, dicha funci´ on viene dada por:
f (x) =
1

2πσ
2
e

(x−¯ x)
2

2
(7.2)
Propiedad: El ´ area encerrada bajo la curva normal N( ¯ x; σ) siempre es 1.
La demostraci´ on de este resultado no es nada sencilla e implica el uso de resultados matem´ aticos que exceden
el nivel de este curso.
De entre todas las curvas normales N( ¯ x; σ), la m´ as sencilla, usada y conocida es aquella que tiene por media 0
y por desviaci´ on t´ıpica 1, N(0, 1).
Esta normal est´ andar se suele representar por Z. La gr´ afica de esta curva se denomina campana de Gauss y se
puede observar en la figura:
Su funci´ on de densidad ser´ a:
f (x) =
1


e

x
2
2
(7.3)
75
Figura 7.3: Distribuci´ on normal N(0; 1). El m´ aximo est´ a en (0,
1


).
Puesto que el ´ area bajo esta curva normal es 1, podemos definir una probabilidad de la siguiente manera:
Para un valor cualquiera k, definimos la probabilidad de que la distribuci´ on Z, N(0; 1), sea menor o igual que k
como:
p(Z ≤ k) = Area encerrada bajo la curva normal N(0, 1) desde −∞ hasta k (7.4)
(es decir la parte rayada de la figura siguiente).
Figura 7.4: Area encerrada por la curva normal desde −∞ hasta k.
Ahora bien, ¿c´ omo calcular dicha ´ area?. F´ acil: Dichas ´ areas o probabilidades se encuentran tabuladas.
7.3.1. Uso de las tablas de la distribuci´ on normal N(0; 1)
La normal N(0; 1) se encuentra tabulada, para valores a partir de 0 y hasta 3.99. Si por ejemplo queremos
calcular p(Z ≤ 2,78), hemos de realizar los pasos:
Buscar la parte entera y las d´ ecimas en la primera columna (en este caso 2.7).
Buscar las cent´ esimas en la primera fila (en este caso 8).
En el punto com´ un a la fila y la columna que hemos encontrado, tenemos la probabilidad buscada, en este
caso 0.9973. Por tanto p(Z ≤2,78) = 0,9973.
Si queremos calcular una probabilidad de un valor mayor que 3.99, basta fijarse en que las probabilidades corre-
pondientes a valores tales como 3.62 y mayores ya valen 0.9999 (pr´ acticamente 1). Por eso, para estos valores
mayores que 3.99, diremos que la probabilidad es aproximadamente 1. As´ı: p(Z ≤5,62) ∼1 aunque no aparez-
ca en la tabla.
Por otra parte, fij´ emonos en que en este tipo de distribuciones no tiene sentido plantearse probabilidades del
tipo p(Z = k), ya que siempre valen 0, al no encerrar ning´ un ´ area. Por tanto, si nos pidiesen p(Z = 3,2), basta
76
decir que p(Z = 3,2) = 0.
Este tipo de distribuciones en las cuales la probabilidad de tomar un valor concreto es 0 se demoniman distribu-
ciones continuas, para diferenciarlas de otras en las que esto no ocurre, como por ejemplo la binomial, que es
una distribuci´ on discreta.
As´ı, al pasar al complementario, si tenemos Z >k, su complementario ser´ a Z <k, pero como incluir k no influye
en la probabilidad, al calcular probabilidades podemos escribir:
p(Z > k) = 1 − p(Z < k) = 1 − p(Z ≤ k) (7.5)
S´ olo se puede hacer esto en distribuciones continuas, en el caso de la binomial esto no se puede hacer y hay que
ser cuidadosos con el paso al complementario.
Ejemplo: Buscar en la tabla de la normal est´ andar N(0; 1) las probabilidades: a) p(Z ≤1,15), b) p(Z ≤0,5),
c) p(Z ≤ 0,82), d) p(Z ≤ 1,05), e) p(Z ≤ 4,27), f) p(Z ≤ 18,09)
7.3.2. C´ alculo de otras probabilidades
Si k es positivo y queremos calcular p(Z >k), es decir el ´ area rayada: basta pasar al complementario, es decir:
Figura 7.5: p(Z > k). Basta pasar al complementario.
p(Z > k) = 1 − p(Z ≤ k) y esta ´ ultima probabilidad ya se encuentra tabulada.
Ejemplo: Calcular p(Z > 0,3) y p(Z > 2,07).
Si k es positivo y queremos calcular p(Z ≤ −k), es decir el ´ area: por simetr´ıa, p(Z ≤ −k) = p(Z > k) y ´ esta
se calcula como en el caso anterior. Se puede observar la igualdad de ´ areas en la figura:
Ejemplo: Calcular p(Z ≤ −0,78) y p(Z ≤ −3,2).
Si k es positivo y queremos calcular p(Z > −k), es decir el ´ area rayada: entonces, por simetr´ıa p(Z > −k) =
p(Z ≤ k):
Ejemplo: Calcular p(Z > −0,96) y p(Z > −1,01).
77
Figura 7.6: p(Z ≤ −k).Las probabilidades de valores negativos no est´ an tabuladas.
Figura 7.7: p(Z ≤ −k) = p(Z > k). La simetr´ıa permite reducir este caso al anterior.
Figura 7.8: p(Z > −k).
Figura 7.9: p(Z > −k) = p(Z ≤ k).La simetr´ıa permite reducir este caso al que ya est´ a tabulado.
Probabilidades comprendidas entre dos valores, p(k
1
≤ Z ≤ k
2
) ,es decir el ´ area rayada: se calcula restando
las ´ areas:
Ejemplo: Calcular p(−0,96 ≤ Z ≤ 1,49) y p(−1,32 ≤ Z ≤ −0,57).
78
Figura 7.10: p(k
1
≤ Z ≤ k
2
). Probabilidad comprendida entre dos valores.
Figura 7.11: p(Z ≤ k
2
) en la primera imagen. p(Z ≤ k
1
) en la segunda. Al restar obtenemos el ´ area pedida.
Ejemplo: Calcular p(Z =2), p(Z ≤2), p(Z >2), p(Z ≤−2), p(Z >−2), p(−2 ≤Z ≤2), p(0,81 ≤Z ≤1,33).
7.3.3. C´ alculo de probabilidadesen normales N( ¯ x; σ)
Si no tenemos una distribuci´ on N(0; 1), sino una N( ¯ x; σ) cualquiera,
ˆ
A¿¿c´ omo calcular probabilidades, si no
tenemos tabla salvo para N(0; 1)?.
El siguiente resultado nos da la respuesta.
Propiedad: Si X sigue una distribuci´ on N( ¯ x; σ), entonces la variable Z =
X−¯ x
σ
sigue una distribuci´ on N(0, 1).
(El paso de la variable X →N( ¯ x; σ) a la Z → N(0; 1) se denomina tipificaci´ on de la variable X).
Ejemplo: Las estaturas de 600 soldados se distribuyen de acuerdo a una distribuci´ on normal de media 168 y
desviaci´ on t´ıpica 8 cm. ¿Cu´ antos soldados miden entre 166 y 170 cm?. Sea X la distribuci ´ on de los soldados ,
X es una N(168, 8). Nos piden p(166 ≤ X ≤ 170). Utilizando el resultado anterior, primero restamos x = 168
en la desigualdad: p(166 ≤ X ≤ 170) = p(166 −168 ≤ X −168 ≤ 170 −168) = p(−2 ≤ X −168 ≤ 2). Y
ahora dividimos entre σ = 8, con lo que acabamos de tipificar: p(166 ≤ X ≤ 170) = p(−2 ≤ X −168 ≤ 2) =
p
_

2
8

X−168
8

2
8
_
. Llamando a
X−168
8
= Z, ´ esta ya es normal N(0, 1) y se encuentra en las tablas: p(166 ≤
X ≤ 170) = p(−0,25 ≤ Z ≤ 0,25) = p(Z ≤ 0,25) − p(Z ≤ −0,25) = (tablas) = 0,5987 −0,4013 = 0,1974,
(pues p(Z ≤ −0,25) = p(Z > 0,25) = 1 − p(Z ≤ 0,25) = 1 −0,5987 = 0,4013).
Ejemplo: En una distribuci´ on N(22, 5), calcula: p(X ≤ 27), p(X > 27), p(X > 125), p(15 ≤ X ≤ 20),
p(17 ≤ X ≤ 30).
79
Ejemplo: Los pesos de 60 soldados siguen una distribuci´ on N(67, 5). Calcula la probabilidad de que el peso
sea: a) mayor de 80 kg, b) 50 kg. o menos, c) menos de 60 kg, d) 70 kg, e) entre 60 y 70 kg inclusive.
7.3.4. Otro uso de las tablas
Hasta ahora nos han dado la distribuci´ on normal N(0; 1) y nos ped´ıan p(Z ≤ k) siendo k un cierto n´ umero, y
nos ped´ıan calcular dicha probabilidad.
Ahora bien, otra pregunta puede ser: Dado que en una normal N(0; 1) sabemos que p(Z ≤ k) = 0,9573, ¿qui´ en
es k?.
La resoluci´ on es bien sencilla. Basta buscar 0.9573 dentro de la tabla de la distribuci´ on normal, y lo encontramos
en el cruce de la fila 1.7 con la columna 2, y por lo tanto k debe ser 1.72.
Ejemplo: Calcular k si: a) p(Z ≤ k) = 0,8078. b) p(Z ≤ k) = 0,0028.
En caso de que el valor a buscar no aparezca directamente dentro de la tabla de la distribuci´ on normal, pueden
ocurrir dos posibilidades:
Si el valor se encuentra entre dos valores de la tabla y a la misma distancia (aproximadamente) de cada
uno de ellos, por ejemplo: p(Z ≤ k) = 0,7982. En este caso el valor buscado ser´ a la media entre los
valores extremos. Si buscamos en la tabla este valor no aparece directamente, sino que se encuentra entre
los valores 0.7967 (que corresponde a 0.83) y 0.7996 (que corresponde a 0.84). Por tanto el valor de k
ser´ a: k =
0,83+0,84
2
= 0,835.
Si el valor est´ a entre dos valores, pero muy cercano a uno de ellos, directamente tomamos este valor, por
ejemplo: p(Z ≤ k) = 0,7970. El valor m´ as cercano es 0.9767 (que corresponde a 0.83) y como el valor
buscado est´ a muy cerca de ´ el, entonces directamente k = 0,83.
Si la distribuci´ on no es normal N(0; 1), sino N( ¯ x; σ), tendremos que tipificar previamente.
Ejemplo: si X sigue una normal N(6; 3) y p(X ≤ k) = 0,9082, calcula k. Tipificando: p
_
X−6
3

k−6
3
_
=
0,9082 → p
_
Z ≤
k−6
3
_
= 0,9082, y buscando en la tabla,
k−6
3
= 1,33 →k −6 = 3,99 →k = 9,99.
Ejemplo: Calcular k si p(X ≤ k) = 0,6141 y X sigue una N(15, 4).
Ejemplo: De una variable normal N( ¯ x; σ) se sabe que p(X ≤7) = 0,9772 y p(X ≤ 6,5) = 0,8413. Calcular:
a) ¯ x y σ. b) p(5,65 ≤ X ≤ 6,25). c) El n´ umero k tal que p(X > k) = 0,3.
7.4. Relaci´ on entre la distribuci´ on binomial y la distribuci´ on normal
Es un hecho comprobado que cuando tenemos una distribuci´ on Bin(n; p), a medida que n crece, es dif´ıcil hacer
uso de las f´ ormulas y/o tablas.
80
Por ejemplo, tiramos un dado 100 veces, calcular la probabilidad de obtener entre 20 y 33 cincos (inclusive).
Si ´ exito = obtener cinco entonces p = 1/6 y fracaso = no obtener cinco y q = 5/6. Tenemos una Bin
_
100;
1
6
_
, y
nos piden p(20 ≤ X ≤ 33). Es inviable aplicar las tablas (pues repetimos el experimento 100 veces) y tampoco
la f´ ormula pues es inviable calcular, por ejemplo,
p(X = 32) =
_
100
32
_
·
_
1
6
_
3
2 ·
_
5
6
_
6
8
¿C´ omo resolver el problema?. Del siguiente modo.
7.4.1. Teorema Central del L´ımite
La distribuci´ on binomial Bin(n; p) se aproxima a una curva normal de media ¯ x = np y desviaci´ on t´ıpica
σ =

npq, cuando n tiende a ∞, es decir, cuando n se hace muy grande.
La aproximaci´ on se puede aplicar (es una buena aproximaci´ on) s´ olo si n es grande, en concreto n >30 y adem´ as
np >5 y nq >5. Si no se cumplen estas condiciones NO podemos aproximar la binomial que tengamos por una
distribuci´ on normal.
En caso de que podamos aproximar, debemos tener en cuenta que estamos pasando de una variable discreta
(binomial) a una continua (normal), y por tanto son distribuciones diferentes. El ”precio”que hay que pagar por
pasar de una a otra se denomina c¸orrecci´ on por continuidad
2
consiste en hacer determinados ajustes para que la
aproximaci´ on realizada sea lo m´ as precisa posible.
As´ı, si nos piden p(X = k) en una distribuci´ on binomial X, y aproximamos X por una distribuci´ on normal, y,
no podemos calcular directamente p(Y=k) porque, como ya se ha comentado anteriormente, en una distribuci´ on
continua todas estas probabilidades valen 0. La correcci´ on por continuidad consiste en tomar un peque˜ no inter-
valo de longitud 1 alrededor del punto k.
De otro modo, si nos piden p(X = k) con X binomial, con la aproximaci´ on normal Y deberemos calcular
p(k −0,5 ≤Y ≤ k +0,5).
Del mismo modo se razona en el caso de probabilidades acumuladas en la binomial. Algunos ejemplos.
Si nos piden p(X <k) con X binomial, aproximando por Y normal calcularemos p(Y ≤k −0,5). La explicaci´ on
de que haya que restar 0.5 y no sumarlo es que queremos que X sea menor estrictamente que k, con lo cu´ al, si
sumase 0.5 , el propio k aparecer´ıa en la probabilidad a calcular y NO debe aparecer.
Por contra, si debi´ esemos calcular p(X ≤ k), con X binomial, fij´ emonos que ahora k SI est´ a incluido en la pro-
babilidad y por tanto al aproximar por la normal Y deber´ıamos calcular p(Y ≤ k +0,5).
81
Comprender estos dos hechos es fundamental para realizar bien la correci´ on por continuidad al aproximar una
distribuci´ on binomial por una normal.
En el caso anterior, ¯ x = np =
100
6
= 16,67 y σ =

npq =
_
500
36
= 3,73. De modo que, como n > 30, np =
16,67 > 5 y nq = 83,33 > 5, se pude aproximar la binomial por la normal, es decir:
X → Bin
_
100;
1
6
_
∼Y → N(16,67; 3,73)
Entonces: p(20 ≤X ≤ 33) ∼

p(20−0,5 ≤Y ≤33+0,5) = p
_
19,5−16,67
3,73

Y−16,67
3,73

33,5−16,67
3,73
_
= p(0,89 ≤
Z ≤4,51) = p(Z ≤4,51)−p(Z ≤0,89) ∼1−0,8133 =0,1867. Notemos que en el paso se˜ nalado por (*) hemos
cambiado X(binomial) por Y(normal) y se ha realizado la correcci´ on por continuidad.
82
Bibliograf´ıa
[1] Jeffrey, R.C., Probability and the Art of Judgment, Cambridge University Press. (1992). pp. 54-55 . ISBN
0-521-39459-7.
[2] Olav Kallenberg, Probabilistic Symmetries and Invariance Principles. Springer -Verlag, New York
(2005). 510 pp. ISBN 0-387-25115-4.
[3] Kallenberg, O., Foundations of Modern Probability, 2nd ed. Springer Series in Statistics. (2002). 650 pp.
ISBN 0-387-95313-2.
[4] P. Bevington and D. K. Robinson, Data reduction and error analysis for the physical sciences, 2nd ed.
(McGraw Hill, New York, 1993).
[5] Stuardt L. Meyer, Data analysis for scientists and engineers (John Willey & Sons, Inc., New York, 1975).
[6] D. C. Baird, Experimentaci´ on, 2a ed. (Prentice-Hall Hispanoamericana S.A., M´ exico, 1991).
[7] J. Higbie,
¨
Uncertainty in the linear regression slope.
A
m. J. Phys. 59, 184 (1991)
[8] J. Orear, ”Least squares when both variables have uncertainties”, Am. J. Phys. ibid., 50, 912 (1982).
[9] ”Simple method for fitting data when both variables have uncertainties”D. Barker and L.M. Diana Am.
J. Phys. 42, 224 (1974).
[10] ”Linear least-squares fits with errors in both coordinates.”II: Comments on parameter variances - B.
Cameron Reed - Am. J. Phys., Vol. 60, No. 1, 1992.
[11] Estad´ıstica - M. Spiegel - McGraw Hill 2da. Ed. Bogot´ a 1997
[12] S. Gil y E.Rodr´ıguez, F´ısica re-Creativa, Prentice Hall, Buenos Aires 2001.
83

´ndice general I

Resumen 6 1. Introducci´ n a la Estad´stica 7 o ı 1.1. Peque˜ a definici´ n y algunos conceptos b´ sicos 7 n o a 1.2. Niveles de Medida 9 1.3. M´ todos de recolecci´ n de datos 9 e o 1.3.1. La entrevista 9 1.3.2. La encuesta 10 1.3.3. Cuestionario 11 1.3.4. La observaci´ n 12 o 2. La estad´stica descriptiva 13 ı 2.1. Distribuciones de frecuencia 13 2.1.1. Terminolog´a adicional 13 ı 2.1.2. Creando una tabla de frecuencias 14 2.1.3. Notaci´ n Matem´ tica 15 o a 2.1.4. Frecuencia acumulada 15 2.1.5. La frecuencia relativa 16 2.1.6. Los histogramas 16 2.2. Medidas de Tendencia Central (MTC) 19 2.2.1. La Media Aritmetica 20 2.2.2. La Media 20 2.2.3. La Mediana 20 2.2.4. La moda 21 2.2.5. Propiedades de la media, mediana y moda 21 2.2.6. El promedio ponderado 22 2.2.7. Otros tipos de medias 22 2.2.8. Formas de las distribuciones de datos 24 2.3. Medidas de variaci´ n 25 o 2.3.1. Rango 26 2.3.2. La Varianza 26 1

2.3.3. La Desviaci´ n Est´ ndar 27 o a 2.3.4. La Desviaci´ n Media 27 o 2.3.5. Covarianza 28 2.3.6. Coeficiente de Correlaci´ n de Pearson 28 o 2.3.7. Coeficientes de asimetr´a y curtosis 29 ı 2.4. Teorema que envuelven cuestiones sobre la Desviaci´ n Est´ ndar 30 o a 2.4.1. La regla emp´rica 31 ı 2.4.2. Teorema de Chebychev 31 2.5. Medidas de Posici´ n 31 o 2.5.1. Cuartiles 32 2.5.2. Deciles 32 2.5.3. Centiles o percentiles 33 2.6. Problemas de final de cap´tulo 33 ı 3. M´ todos cuantitativos de an´ lisis predictivo, regresi´ n 37 e a o 3.1. Correlaci´ n y regresi´ n 37 o o 3.2. Distribuciones bidimensionales 37 3.3. La idea de la correlaci´ n 38 o 3.4. Encontrando la relaci´ n. Regresi´ n 40 o o 3.4.1. El coeficiente de correlaci´ n 40 o 3.4.2. Regresi´ n lineal. El M´ todo de los M´nimos Cuadrados 41 o e ı 4. An´ lisis Combinatorio 46 a 4.1. Introducci´ n 46 o 4.2. Permutaciones (u ordenaciones) con repetici´ n 47 o 4.3. Permutaciones (u ordenaciones) sin repetici´ n 47 o 4.4. Combinaciones 47 4.5. An´ lisis y Metodolog´a propuesta para la resoluci´ n de problemas de Teor´a de conteo 48 a ı o ı 5. Probabilidad 49 5.1. Introducci´ n: La probabilidad 49 o 5.2. La probabilidad 51 5.3. Experimentos de Probabilidad 51 5.4. Calculando la probabilidad de un evento 53 5.4.1. Probabilidad Emp´rica 53 ı 5.4.2. Probabilidad cl´ sica 54 a 5.5. Axiomas de la probabilidad 54 5.6. Posibilidades y probabilidades 55 5.7. Propiedades de la probabilidad de eventos no elementales 56 5.8. Probabilidad condicionada 57 5.9. Probabilidad total 58 5.9.1. Teorema de la probabilidad total 58 5.10. Teorema de Bayes 58 5.11. Problemas de final de cap´tulo 59 ı 6. Variable aleatoria y funci´ n de distribuci´ n 63 o o 6.1. Introducci´ n 63 o 6.2. Variable aleatoria unidimensional 64 6.3. Variables discretas 64 6.4. Variables continuas 65 2

6.5. Caracter´sticas de una v.a. 66 ı 6.5.1. Definici´ n. (Esperanza Matem´ tica) 66 o a 6.5.2. Definici´ n. (Varianza) 67 o 6.6. Inecuaci´ n de Chevyshev 67 o 6.7. Problemas de final de cap´tulo 68 ı 7. Distribuciones de Probabilidad Binomial y Normal 70 7.1. Introducci´ n 70 o 7.2. La distribuci´ n binomial o de Bernoulli 70 o 7.2.1. El uso de las tablas de la distribuci´ n binomial 72 o 7.2.2. Probabilidades acumuladas 73 7.2.3. Media y desviaci´ n t´pica en una distribuci´ n binomial 74 o ı o 7.3. La distribuci´ n Normal 74 o 7.3.1. Uso de las tablas de la distribuci´ n normal N(0; 1) 76 o 7.3.2. C´ lculo de otras probabilidades 77 a 7.3.3. C´ lculo de probabilidadesen normales N(x; σ ) 79 a ¯ 7.3.4. Otro uso de las tablas 80 7.4. Relaci´ n entre la distribuci´ n binomial y la distribuci´ n normal 80 o o o 7.4.1. Teorema Central del L´mite 81 ı

3

6. 39 Regresi´ n lineal: la cantidad de intentos a medida que aumenta hace que el n´ mero de error o u disminuya.2. Ve´ se la igual proporci´ n de barras con alturas aproximadas a ambos o e a o lados de la media.2.3. 25 2. Las barras tienen aproximadamente la misma altura a ambos lados de o la media.1. 25 2. 38 o Regresi´ n lineal: Los puntos tienden a describirse a partir de una recta que los representa o aproximadamente a todos. 29 2. Una distribuci´ n sezgada a la derecha. 30 2. 41 o La curva de regresi´ n lineal en t´ rminos de los cambios de la funci´ n.8.1. 19 o Una distribuci´ n sim´ trica. 3.4. 2. 3. Ejemplo de de un diagrama de dispersi´ n o nube de puntos. 26 2.4. 2. 3.6. 19 Muchas posibilidades para la construcci´ n del histograma. 39 Regresi´ n lineal: Al parecer n existe relaci´ n entre la distancia a la que se vive de la Universidad o o y la calificaci´ n que se obtiene. 3. 42 o e o 4 .´ndice de figuras I As´ luce un histograma de frecuencias. 40 o Regresi´ n lineal: Al parecer n existe relaci´ n entre la distancia a la que se vive de la Universidad o o y la calificaci´ n que se obtiene.10.5. 24 2. 18 ı Ejemplo de como debe construirse un histograma simple. El coeficiente de correlaci´ n de Pearson establece la posibilidad de un ajuste de los puntos en la o muestra. Ve´ se la desigual proporci´ n de barras con alturas o a o aproximadas a ambos lados de la media.9. 3. Distintas posibilidades de la forma del histograma en relaci´ n con el valor num´ rico de el o e coeficiente de curtosis. 2. Distintas posibilidades de la forma del histograma en relaci´ n con el valor num´ rico de el o e coeficiente de Fisher. Una distribuci´ n sezgada a la izquierda. 31 2. Una distribuci´ n uniforme.7. Ve´ se la igual proporci´ n de barras con alturas o a o aproximadas a ambos lados de la media. 3.5.3.

Al restar obtenemos el area pedida.8. 78 ı p(Z > −k). 77 p(Z ≤ −k). 48 ı o Distribuci´ n de estaturas de 1400 mujeres. Probabilidad comprendida entre dos valores. 1). 78 p(Z > −k) = p(Z ≤ k).1. 7. dado que el coeficiente de correlaci´ n lineal es muy cercano a la unidad.3. σ ). 76 p(Z > k). La simetr´a permite reducir este caso al anterior. 7. 74 o Distribuci´ n normal N(x. 76 2π 4.9.La simetr´a permite reducir este caso al que ya est´ tabulado.7. de donde se deduce que la relaci´ n no es lineal sino cuadr´ tica. 7.11. 7.10. 79 ´ 5 . 78 a p(Z ≤ −k) = p(Z > k). 7. El m´ ximo est´ en (x.7. Representaci´ n de x(t) para un cuerpo que se mueve con movimiento uniformemente acelerado. o (a) A tiempos largos no se aprecia bien la curvatura de la curva y. 79 p(Z ≤ k2 ) en la primera imagen.3. Distribuci´ n normal N(0. 78 ı a p(k1 ≤ Z ≤ k2 ). El m´ ximo est´ en (0. podr´a suponerse que la correlaci´ n es lineal. Basta pasar al complementario. 7. 7.5. 75 2πσ 2 1 √ ). 7.Las probabilidades de valores negativos no est´ n tabuladas. (b) o ı o log(x) en funci´ n de log(t).6.2.4. 7. 7. 7. o ¯ a a ¯ √ 1 ). p(Z ≤ k1 ) en la segunda.1. 45 o o a Metodolog´a sencilla para la resoluci´ n de problemas. o a a Area encerrada por la curva normal desde −∞ hasta k.

Resumen Se presentan a continuaci´ n unas notas de Estad´stica Elemental y Fundamental. ı 6 . LUZ. para la carrera e e de F´sica. para el curso Estad´stica y o ı ı M´ todos Num´ ricos de la Facultad Experimental de Ciencias de la Universidad del Zulia. ı El objetivo del curso es que el alumno se familiarice con las herramientas anal´ticas esenciales necesarias para ı comprender el funcionamiento y las consecuencias de la aplicaci´ n de la teor´a estad´stica a la resoluci´ n de o ı ı o problemas en f´sica.

color e de la piel.57 km/h. 2. en principio cualesquieı ra. 94. etc) y trata de extraer conclusiones sobre el comportamiento de estas variables. a Continuas: pueden tomar cualquier valor real dentro de un intervalo. por ejemplo. Por ejemplo: n´ mero de hermanos (puede o u ser 1... Las variables pueden ser de dos tipos: Variables cualitativas o atributos: no se pueden medir num´ ricamente (por ejemplo: nacionalidad. representa y describe una serie de datos que pueden ı ser cuantitativos o cualitativos. Por ejemplo. Pequena definici´ n y algunos conceptos b´ sicos o a La Estad´stica es la ciencia de recoger o colectar. la velocidad de un veh´culo puede ser 80. y la Inferencial: infiere propiedades de gran n´ mero de u datos recogidos de una muestra tomada de la poblaci´ n. 2. e Las variables tambi´ n se pueden clasificar en: e Variables unidimensionales: s´ lo recogen informaci´ n sobre una caracter´stica (por ejemplo: edad de o o ı los alunmos de una clase). Variables cuantitativas: tienen valor num´ rico (edad. sin sacar conclusiones. 3. Existen dos tipos de estad´sticas: Descriptiva: tabula. -4. Variables pluridimensionales: recogen informaci´ n sobre tres o m´ s caracter´sticas (por ejemplo: edad.45).. Por su parte.. sexo).. edad de una poblaci´ n. precio de un producto.etc.etc. nunca podr´ ser 3. ı 7 . etc. organizar. temperatura en los o meses de verano. La estad´stica descriptiva es una ciencia que analiza o ı series de datos (por ejemplo. ingresos anuales). Variables bidimensionales: recogen informaci´ n sobre dos caracter´sticas de la poblaci´ n (por ejemplo: o ı o edad y altura de los alumnos de una clase).).3 km/h.1. o a ı altura y peso de los alumnos de una clase). 8. altura de los estudiantes de una escuela.Cap´tulo 1 ı ´ Introduccion a la Estad´stica ı ˜ 1. las variables cuantitativas se pueden clasificar en discretas y continuas: Discretas: s´ lo pueden tomar valores enteros (1. analizar e interpretar datos.. pero.

2. si se estudia el precio de la vivienda de o ı una ciudad. digamos que por ejemplo estuvi´ ramos interesados en conocer la opini´ n de la gente en Venezuela e o acerca de la posibilidad o necesidad de incrementar la cantidad de puestos en los cuales de distribuye peri´ dico o a nivel nacional. animales. entonces probeblemente a o ser´ imposible poder calcular par´ metros de alg´ n inter´ s particular. de la misma manera como se hace una clasificaci´ n en la f´sica para n´ meros ordinarios y vectores. ´ ı Es por su puesto. Una muestra podr´a ser obtenida seleccionando 10 universidades de una lista unos ı cuantos estados seleccionados al azar con sus respectivos salarios. la o poblaci´ n ser´ el total de las viviendas de dicha ciudad. que existe una clasificaci´ n para el e o o comportamiento de una variable. Individuo: cualquier elemento que porte informaci´ n sobre el fen´ meno que se estudia. As´ entonces tendremos que definir los tipos de medida: ı Par´ metro . es importante. y miente en el sentido cient´fico. 3. Por ejemplo. que es lo que en realidad importa. debe advertirse que si la poblaci´ n tomada y seleccionada es muy grande. por su puesto. ı a 8 .) que porten informaci´ n o o sobre el fen´ meo que se estudia. etc. Por su puesto. Una muestra estar´a asegurada por ejemplo si tom´ semos 1000 encuestas repartidas ı a en todos los estados deacuerdo con la densidad poblacional de cada uno. si estudiamos el precio de la n vivienda. La idea fundamental es usar estos o ´ estad´sticos para inferir o estimar los par´ metros poblacionales. seleccionar poblaciones muy peque˜ as es problem´ tico. Mientras que si tomamos en cuenta la data proveniente de la escogencia a al azar de las 10 universidades. objetos. Sin embargo. si estuo o ı diamos la altura de los ni˜ os de una clase. muy sencillo darse cuenta que la poblaci´ n es un conjunto mucho m´ s grande que la muestra. o Para medir en estad´stica es obvio que necesitaremos adem´ s una definici´ n para la cuantificaci´ n de las cosas o ı a o o fen´ menos.Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos: 1. m´ s peque˜ as.una medida num´ rica hecha usando el conjunto de datos de la poblaci´ n en general. ı e Por ejemplo: Usando el conjunto de datos que describen los salarios de los cient´ficos. respondiendo a la pregunta en cuesti´ n. qu´ podemos medir y c´ mo. a e o estad´stico . si estudiamos el precio de la vivienda en una ciudad. toda vez. entonces. lo normal ser´ no recoger informaci´ n sobre todas las viviendas de la ciudad (ser´a una labor a o ı muy compleja). que la poblaci´ n estar´ integrada por todas las respuestas de todos los ciudadao a nos del territorio nacional. As´. adem´ s n ı ı n a a de peligroso. En esencia. ı ı el conjunto de datos que representan la poblaci´ n ser´a en este caso la lista de todos los salarios de cualquier o ı universidad en Venezuela. por su puesto. As´. si estamos interesados en medir los salarios de todos los cient´ficos de las universidades del pa´s. o o ı u Es decir. o a Muestra: subconjunto que seleccionamos de la poblaci´ n. A menos que la poblaci´ n sea bastante pea a u e o que˜ a calcular ser´a muy dif´cil. A su vez. o a Adem´ s. Poblaci´ n: conjunto de todos los individuos (personas. la idea general es poder seleccionar siempre muesı tras. nosotros pudi´ ramos ı e ´ calcular el salario promedio de los cient´ficos que laboran en las universidades Venezolanas. cada alumno es un individuo. ete valor debe nombrarse como un estad´stico. Este promedio calı culado debe tomarse por un par´ metro. sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo. clasificar. cada vivienda es un individuo. Por ejemplo.un valor num´ rico soportado en el conjunto de datos del espacio muestral. que la poblaci´ n y encontrar o calcular estad´sticos muestrales que pudieran a n o ı dar explicaciones preliminares de lo que pasa en la data total o poblaci´ n.

para estos si est´ prescrito un orden en particular. el diagrama de flujo y el diccionario de datos. como e o entrevistas. el nivel de sensura de uan pel´cula. Niveles de Medida Existen varios seg´ n los valores que toman los datos. los cuales pueden ser la entrevistas. el grado de estudio. o Todas estos instrumentos se aplicar´ en un momento en particular. Quienes responden pueden ser gerentes o empleados. tienen un orden o e natural y la diferencia entre los valores que toman los datos son significativas. o e Los analistas utilizan una variedad de m´ todos a fin de recopilar los datos sobre una situaci´ n existente. el volumen. 3. pero las etiquetas no tienen atributo de orden. a trav´ s de preguntas que propone el analiso ta. el cuestionario. Por ejemplo. el tipo de bacteria en el intestino de una cierta especie de pescado. La entrevista e Las entrevistas se utilizan para recabar informaci´ n en forma verbal. M´ todos de recolecci´ n de datos e o La recolecci´ n de datos se refiere al uso de una gran diversidad de t´ cnicas y herramientas que pueden ser o e utilizadas por el analista para desarrollar los sistemas de informaci´ n. u 1. la o encuesta. la observaci´ n. el peso de una persona. pero si que podr´a ser en alguna ı ı medida cercana. cuestionarios. 4.La pericia de los cient´ficos se encuentra en tratar de construir buenas muestras a partir de poblaciones muy ı grandes. Generalmente. Desafortunadamente. 9 . pero a diferencia de los anteriores. sean buenas para estimar los par´ metros ı ´ a necesarios. se utilizan dos o tres para complementar el trabajo de cada una y ayudar a asegurar una investigaci´ n completa. el tipo de raza. o 2. estimar estad´sticos nunca es 100 % seguro.3. Cada uno tiene ventajas y o o o desventajas. Los valores para los datos sirven para o etiquetar. inspecci´ n de registros (revisi´ n en el sitio) y observaci´ n.1.2. Los valores atribuidos a los datos son etiquetas. Datos nominales: pueden ser del tipo cualitaticos s´ lamente. Datos ordinales: pueden tanto de tipo cualitativos como cuantitativos. con las t´ cnicas ya antes nombradas. o 1. con la finalidad de buscar informaci´ n que a o ser´ util a una investigaci´ n en com´ n. 1. tales que los estad´sticos calculados a partir de estas muestras. los cuales son usuarios actuales del sistema existente. n Datos raz´ n: son siempre cuantitativos. el a˜ o de naciemiento. Por ´ a ı ejemplo: las posiciones del torneo de futbol profesional Venezolano. Los valores que toman los datos son num´ ricos. tienen orden. Los valores son num´ ricos. 1. Por ejemplo: el tipo de sangre. En la presente investigaci´ n trata con detalle los pasos que se debe seguir a´ o u o en el proceso de recolecci´ n de datos. y la tanto la diferencia o e como la raz´ n entre los valores son significativas. Datos intervalos: s´ lo son cuantitativos.3. Por ejemplo: la temperatura.

por lo tanto no es posible utilizar este m´ todo para recopilar toda la infore maci´ n que se necesite en la investigaci´ n. sirve para obtener informaci´ n acerca de las o o o necesidades y la manera de satisfacerlas. sino que tambi´ n pueden conducirse de muo o e chas maneras. En otras palabras. antes de una elecci´ n. las encuestas recogen ino formaci´ n de una porci´ n de la poblaci´ n de inter´ s. En una encuesta bona fide. as´ como concejo y comprensi´ n por parte del usuario para toda idea ı o o m´ todo nuevos. ı 1. una muestra de electores es interrogada para determinar c´ mo los candidao o tos y los asuntos son percibidos por el p´ blico . Las ´ u buenas entrevista depende del conocimiento del analista tanto de la preparaci´ n del objetivo de una entrevista o espec´fica como de las preguntas por realizar a una persona determinada.3. lo cual es fundamental en transcurso del estudio. o o No tan s´ lo las encuestas tienen una gran variedad de prop´ sitos. la entrevistas es la t´ cnica m´ s significativa y productiva de que dispone el analista o e a para recabar datos. donde todos los miembros de la poblaci´ n son estudiados. e e a a La habilidad del entrevistador es vital para el exito en la b´ squeda de hecho por medio de la entrevista. por correo o en persona.una entidad del gobierno comisiona una encuesta para obtener informaci´ n para o evaluar legislaci´ n existente o para preparar y proponer nueva legislaci´ n. todas las encuestas tienen algunas e u ı caracter´sticas en com´ n. o Dentro de una organizaci´ n. ı u A diferencia de un censo. A´ n as´. o o o Por ejemplo. Sin embargo. al personal de almac´ n y a los supervisores de los diferentes turnos. la entrevistas es un intercambio de informaci´ n que se efect´ a cara a cara. incluso el analista debe verificar los datos recopilados utilizando o o unos de los otros m´ todos de recabaci´ n de datos. Esta “muestra” es usualmente s´ lo una fracci´ n de la poblaci´ n bajo estudio. la muestra no es seleccionada caprichosamente o s´ lo de personas que se o ofrecen como voluntarios para participar. la entrevista ofrece al analista una excelente oportunidad para establecer una e corriente de simpat´a con el personal usuario. las entrevistas no sieme e a a pre son la mejor fuente de datos de aplicaci´ n. La muestra es seleccionada cient´ficamente de manera que cada perı sona en la poblaci´ n tenga una oportunidad medible de ser seleccionada. tambi´ n entrevistar´ n a los gerentes m´ s importante. Aquellas personas que o e realmente trabajan en el almac´ n.usuarios potenciales del sistema propuesto o aquellos que proporcionar´ n datos o ser´ n afectados por la aplia a caci´ n propuesta. La entrevista se aplican en todos los niveles gerencial y de e o empleados y dependa de quien pueda proporcionar la mayor parte de la informaci´ n util para el estudio los o ´ analistas que estudian la administraci´ n de inventarios pueden entrevistar a los trabajadores del embarque y de o recepci´ n. La encuesta Hoy en d´a la palabra “encuesta” se usa m´ s frecuentemente para describir un m´ todo de obtener informaci´ n ı a e o de una muestra de individuos. Por otra parte. De esta manera los resultados pueden o 10 . El analista puede entrevistar al personal en forma individual o en grupos algunos analistas o prefieren este m´ todo a las otras t´ cnicas que se estudiar´ n m´ s adelante. dependiendo el tama˜ o de la muestra en el prop´ sito del o o o e n o estudio.un fabricante hace una encuesta al mercado potencial antes de u introducir un nuevo producto . incluyendo por tel´ fono. es decir. o u Es un canal de comunicaci´ n entre el analista y la organizaci´ n.2. ı Realizar entrevistas toma tiempo.

o Existen dos formas de cuestionarios para recabar datos: cuestionarios abiertos y cerrados. y se aplican dependiendo de si los analistas conocen de antemano todas las posibles respuestas de las preguntas y pueden incluirlas. Con frecuencia se utilizan ambas formas en los estudios de sistemas. n a Recabaci´ n de datos mediante cuestionarios. Cuestionario Abierto. un analista que utiliza cuestionarios para estudiar los m´ todos de verificaci´ n de cr´ dito. La intenci´ n de la encuesta no es describir los individuos particulares quienes. Cuestionario Los cuestionarios proporcionan una alternativa muy util para la entrevista. o El tama˜ o de muestra requerido en una encuesta depende en parte de la calidad estad´stica necesaria para los n ı establecer los hallazgos. En mayor parte de los casos. Por ejemplo. encuentran m´ s f´ cil escoger una de un conjunto de respuestas a a preparadas que pensar por s´ mismas. Algunas personas sin embargo. Cuando se u llevan a cabo largos estudios en varios departamento. por azar. ı 11 . el tiemo o po invertido en esto debe utilizarse en una forma inteligente. opiniones y experiencias generales. La informaci´ n es recogida usando proceo o dimientos estandarizados de manera que a cada individuo se le hacen las mismas preguntas en mas o menos la misma manera. se puede distribuir los cuestionarios a todas las personas apropiadas para recabar hechos en relaci´ n al sistema. las muy con ı nocidas encuestas nacionales frecuentemente usan cerca de 1. a e o e es un medio. El desarrollo y distribuci´ n de los cuestionarios.000 personas para obtener informaci´ n razonable o sobre actitudes y opiniones nacionales. esto a su vez. Para los analistas los cuestionarios pueden ser la unica forma o ´ posible de relacionarse con un gran n´ mero de personas para conocer varios aspectos del sistema. por ejemplo. Mucho u ı n de esto depende de los recursos profesionales y fiscales disponibles. a o a A´ n as´. tambi´ n son utiles al explorar el problema e ´ b´ sico. tambi´ n esto es una ventaja porque aplican muchas entrevista ayuda a asegurar que el e interpelado cuenta con mayor anonimato y puedan darse respuestas mas honesta ( y menos respuestas prehechas o estereotipadas).3. Tambi´ n las preguntas estandarizadas pueden proporcionar datos m´ s confiable. est´ relacionado en c´ mo esos hallazgos ser´ n usados. Tambi´ n es importante el formato y contenido de e las preguntas en la recopilaci´ n de hechos significativos. ı deben dise˜ arse cuidadosamente para una m´ xima efectividad. Al igual que la entrevistas. son o parte de la muestra sino obtener un perfil compuesto de la poblaci´ n. existen ciertas carac´ ter´sticas que pueden ser apropiada en algunas situaciones e inapropiadas en otra. 1. los cuestionarios pueden ser abiertos y se aplican cuando se quieren conocer los sentimientos. Al igual que las entrevistas. no obstante.ser proyectados con seguridad de la muestra a la poblaci´ n mayor. no hay una regla simple para el tama˜ o de muestra que pueda ser usada en todas las encuestas. e a Selecci´ n de formas para cuestionarios.3. si embargo. Los analistas frecuentemente encuentran que una muestra de tama˜ o moderado es suficiente estad´stica y operacionalmente.El formato abierto proporciona una amplia oportunidad para quienes respondan escriba las razones de sus ideas. el analista no ver´ a los que o a responde. por lo tanto.

Quiz´ esta alternativa tenga poca e o a importancia para el an´ lisis de sistemas. cuanto tiempo toma. o 1. La interacci´ n puede consistir simplemente en preguntar respecto a una tarea espec´fica. consiste en observar a las personas cuane ´ o do efect´ an su trabajo. o ı pedir una explicaci´ n. Los u e o o o ı soci´ logos.3.Cuestionario Cerrado. como se est´ haciendo. El prop´ sito de la organizaci´ n es o o o m´ ltiple: permite al analista determinar que se est´ haciendo. a Segundo.4. Por ultimo. puede observar a una persona o actitud a sin que el observado se d´ cuenta y su interacci´ n por aparte del propio analista. quien lo hace. etc. Primero. el analista puede observar una operaci´ n sin intervenir para nada. El cuestionario cerrado limita las respuestas posibles del interrogado. la observaci´ n tiene amplia aceptaci´ n cient´fica. puede observar y a la vez estar en contacto con las o ´ personas observas. sic´ logos e ingenieros industriales utilizan extensamente esta t´ cnica con el fin de estudiar a las o o ´ e personas en sus actividades de grupo y como miembros de la organizaci´ n. o El analista de sistemas puede observar de tres maneras b´ sicas. d´ nde se hace y por que se hace. Por medio de un cuidadoso estilo en la pregunta. el analista puede controlar el marco de referencia. Como t´ cnica de investigaci´ n. Este formato es el m´ todo e para obtener informaci´ n sobre los hechos. puesto que resulta casi imposible reunir las condiciones necesarias. La observaci´ n o Otra t´ cnica util para el analista en su progreso de investigaci´ n. Tambi´ n fuerza a los individuos para que tomen una posici´ n y o e o forma su opini´ n sobre los aspectos importantes. o 12 . cuando se u a a lleva a cabo. pero estando la persona observada o enteramente consciente de la observaci´ n.

5 84. 83. 63. 89. 46. 91. 80-89. Distribuciones de frecuencia Una distribuci´ n de frecuencias es una tabla usada para describir un conjunto de datos. 88. 72.Cap´tulo 2 ı La estad´stica descriptiva ı 2. 81. que consistir´ en el el valor que representa a dicha clase.5 64.5 Frecuencia 4 6 4 3 2 1 Note que la suma de la columnas de frecuencias es igual a 20. 84.1. Puede ı construirse una tabla de frecuencias para cada nota.5 54. ı ´ Para resumir espacio pudiera organizarse todo en clases tales como 90-99. 87. 57. as´ en esta tabla tendr´amos unas 100 filas aproximadamente. Una tabla de frecueno cias muestra datos particulares o intervalos o rangos de datos llamados clases de datos. 75. En el caso de mostrar intervalos de datos. L´mite inferior de clase: es el menor valor en el intervalo de clase. se define un valor. Lo denotaremos como Li .5 44.1.5 74. u 2. 67. 74. 67. usualmente es a llamado marca de clase. Terminolog´a adicional ı 1. 78. ı 13 . y contando el n´ mero de datos pertenecientes a cada intervalo. a este n´ mero se le llama frecuencia. Por ejemplo: sup´ ngase que 20 estudiantes de estad´stica poseen las siguientes notas a continuaci´ n en una o ı o escala de 0 a 100 puntos: 97.1. el n´ mero de todos los datos existentes. 92. 98. 55. ı L´mite superior de clase: es el mayor valor en el intervalo de clase. Adem´ s la tabla de frecuencias muestra un n´ mero a continuaci´ n del dato o marca de a u o clase. As´ obtendr´amos algo como sigue: u ı ı Intervalo 90-99 80-89 70-79 60-69 50-59 40-49 Marca de Clase 94. u ´ ´ u o frecuencia de la clase. Lo denotaremos como Ls . 2. que representa el n´ mero de veces que este valor se repite en la data. 70-79 etc.

ı e Decidir deacuerdo al n´ mero de datos y las caracter´sticas de los mismos las clases necesarias para optiu ı mizar los resultados y agilizar los c´ lculos seguidos. Pudiera escogerse otro criterio para definir la marca de clase. 64. 3.1. ı Marca de clase: es por lo general el valor medio de los datos de cada intervalo. no tiene mucha importancia. (2. Lo m´ s importantes es contar o disponer de alguna data que sea de utilidad y con la cual se quisiera a estimar algunos valores y/o caracter´sticas importantes de inter´ s. Todos ı las clases deber´an tener el mismo ancho. 9. 3. 69. Los datos se corresponden con los montos pagados por 28 conductores diferentes en una estaci´ n de gasolina. 7. 54. 5. por el consumo de la misma.66. 70. El ancho de cada clase es 10. se tiene que: los a ı l´mites superiores de clase son: 99.5. sin embargo. y 44. 74.2. Li + Ls Lc = . 2. 2. a Dividir el rango de la data por el n´ mero de clases para obtener un estimado del ancho de las clases. 14. pero puede que menos representativa e a o informativa sea la tabla. 10. observando la data nos daremos cuenta que el menor monto pagado es 2 mientras que el mayor es 18. 18. 79. as´ cada clase u u ı tendr´ un ancho de 16 = 2.F): 7. y por tanto para estimar el ancho a de cada clase dividimos el n´ mero calculado anteriormente entre el n´ mero de clases dispuesto. 50. 4. 9. u (2. Decidir los l´mites de las clases. 2.5. los l´mites inferiores de clase son: 90. 4. 12. 9. 11. Creando una tabla de frecuencias Para crear table de frecuencias es necesario seguir los pasos a continuaci´ n.5. Las marcas de clase son: 94. 4. cualquiera sea la escogencia que se haga. 60. 5. ı Construir la tabla de frecuencia contando el n´ mero de datos en cada uno de los intervalos de clase. o 1. 8. y 49. 9. Ancho de clase: es la diferencia entre dos l´mites de clases superiores (o inferiores) consecutivos. el rango de la clase ser´ aproximadamente 18 − 2 = 16.2) El n´ mero de tramos en los que se agrupa la informaci´ n es una decisi´ n que debe tomar el analista: la regla u o o es que mientras m´ s tramos se utilicen menos informaci´ n se pierde. 84. 4. y ı ı 40. 3. lo importante es que este dato represente todo el intervalo de clase. 4.5. por tanto. 59. 89. 4. 15. 5. 8. Lo denotaremos ´ por Lc . 80. u Rango = Mayor valor − Menor valor. por tanto.5.3. 7. 12. Soluci´ n: En este caso se tendr´ como dato que se quiere hacer una tabla que tenga ni m´ s ni menos 6 initervalos o a a de clase. 2. Tendremos en definitiva algo como lo que sigue: a 6 14 . Los montos son en Bol´vares Fuertes (Bs.5.1) 2 Ejemplo: Para la tabla de frecuencias anterior de las notas de los ex´ menes de estad´stica. Ejercicio: Construiremos a continuaci´ n una tabla de frecuencias con 6 marcas de clases o intervalos de o clase para la data siguiente. o ı 4. 6.

Notaci´ n Matem´ tica o a Intervalo 1-3 4-6 7-9 10-12 13-15 16-18 Marca de Clase 2 5 8 11 14 17 Frecuencia 4 8 9 4 2 1 En lo que sigue se usar´ la siguiente simbolog´a y las siguientes variables que usaremos para referirnos a objetos a ı o valores que definiremos en adelante.5 44. n representar´ el n´ mero de a u valores en el conjunto de datos muestrales. u i=1 ∑ fi = n.4. Representaremos los valores que toma una cierta variable en una cierta data como x. lo miso ´ mo sucede para la frecuencia acumulada decreciente.5 84. N el n´ mero de valores en el conjunto poblacional.1.3) 2.5 74. ´ Ejemplo: En la data presentada acerca de las notas de los ex´ menes de estad´stica puediera construirse la a ı siguiente tabla de frecuencias acumuladas: Clase I II III IV V VI Intervalo 90-99 80-89 70-79 60-69 50-59 40-49 Marca de Clase 94.1.3. Acumulada ↓ 20 16 10 6 3 1 N´ tese que la ultima entrada en la columna de la frecuencia acumulada creciente es justamente n = 20. N (2.5 Frecuencia 4 6 4 3 2 1 Frec. Puede ser tanto decreciente como creciente. dos nuevas column 15 . y de manera obvia. Frecuencia acumulada La frecuencia acumulada de una clase de datos es el n´ mero de elementos que existe en esa clase y todos los u de las clases previas. si se acumulan ´ las frecuencias desde la ultima clase o la primera clase respectivamente. y f la frecuencia u de cada datos o cada marca de clase. la frecuencia acumulada de una clase es la frecuencia de la clase m´ s a todas las frecuencias de las clases anteriores a esta. o Usando esta notaci´ n.Clase Clase I Clase II Clase III Clase IV Clase V Clase VI 2. En otras palabras.5 64. Acumulada ↑ 4 10 14 17 19 20 Frec. Ejercicio: A˜ adiremos a la tabla de frecuencias para el caso de los consumos de gasolina. pudiera escribirse la sentencia de que la suma de todas las frecuencias ´ o en la tabla de frecuencias es igual al n´ mero de valores en el conjunto de los datos.5 54. a menos que se indique otra cosa. Como siempre usaremos la simbolog´a ∑ para indicar la suma de todos los ı valores de una variable o expresi´ n.

1. Los histogramas Un histograma es una representaci´ n gr´ fica de una variable en forma de barras.nas para la frecuencia acumulada creciente y decreciente respectivamente. Esta herramienta se utiliza especialmente en la Comprobaci´ n de teor´as y Pruebas e o ı 16 . y en el eje horizontal los valores de las variables. ↑ Frec. Acum. (2.4) Frec. Se denota por fri . Soluci´ n: Tendremos en definitiva algo como lo que sigue: o Clase Intervalo Marca de Clase Frecuencia Clase I 1-3 2 4 Clase II 4-6 5 8 Clase III 7-9 8 9 Clase IV 10-12 11 4 Clase V 13-15 14 2 Clase VI 16-18 17 1 2. Acumulada ↑ 4 12 21 25 27 28 Frec.285 Clase III 7-9 8 9 21 . si pasa alguna de ellas. Adicionalmente pudiera definirse u la frecuencia relativa porcentual como: fri % = fri × 100 %. Clase I 1-3 2 4 4 . por su puesto. Es sencillo calcular la frecuencia relativa como: o fri = fi . En el eje vertical se representan las frecuencias. por razones m´ s que obvias. es decir. suma aproximadamente 1.1. es entonces inmediato que fri u a es un n´ mero que puede oscilar entre los valores 0 y 1. donde la superficie de cada bao a rra es proporcional a la frecuencia de los valores representados.5.142 Clase II 4-6 5 8 12 . es decir.071 Clase VI 16-18 17 1 28 . Acumulada ↓ 28 24 16 7 3 1 En vista que el n´ mero fi es siempre menor que n. normalmente se˜ alando las marcas de clase.5) Ejemplo: Para la tabla anterior tendremos: Clase Intervalo Marca de Clase Frec. coincidente con el hecho de que existe una posibilidad de 100 % de que pudiera ocurrier “cualquiera” de las cosas que describen la data.321 Clase IV 10-12 11 4 25 . La naturaleza gr´ fica del histograma nos permite ver pautas que son dif´ciles de observar en a ı una simple tabla num´ rica.035 Note que la suma de todas las frecuencias relativas en la columna. 0 ≤ fri ≤ 1.142 Clase V 13-15 14 2 27 . Un histograma es un resumen gr´ fico de la variaci´ n de un a a o conjunto de datos. 2. Relat. n (2.6. la mitad n del intervalo en el que est´ n agrupados los datos. La frecuencia relativa La frecuencia relativa de un dato o marca de clase se define como el porcentaje de elementos en esa clase en relaci´ n con el total de datos de la muestra. Frec.

Y permite la comparaci´ n de los o o resultados de un proceso. Esta variaci´ n sigue cierta pauta. Paso 1: Determinar el rango de los datos. 17 . 15. 12. √ # de clases = 25 = 5. por lo que se ı u ı seleccionan seis clases. En este caso puede seguirse los pasos anteriormente explicitados y entonces: ´ Rango = Mayor valor − Menor valor = 16 − 11 = 5. valores contiguos. 13. sus valores se agrupan en clases. En los casos en los que los datos son cualitativos (no-num´ ricos). por comodidad. identificar y clasificar la pauta de variaci´ n. con un pico aislado. 4. humanas y econ´ micas que en ciencias naturales y exactas. 13. Rango es igual al dato mayor menos el dato menor. 13. 14. es preferible un diagrama de e sectores. La f´ brica establece un programa de mejora de a a calidad para que las botellas que se fabriquen cumplan con los requisitos del cliente. Un criterio o e a usado frecuentemente es que el n´ mero de clases debe ser aproximadamente a la ra´z cuadrada del n´ mero u ı u de datos. dependiendo de c´ mo est´ n los datos y cu´ ntos sean. 13. grado de acuerdo o nivel de estudios. Ejemplo: A una fabrica de envases de vidrio. 5. 14. existen varios criterios para determinar el n´ mero de clases (o u u barras) -por ejemplo la regla de Sturgess-. Paso 3: Establecer la longitud de clase: es igual al rango entre el n´ mero de clases. 12. 12. plana. 13. Algunos autores recomiendan de cinco a quince clases. por un lado. 15. Al realizar el muestreo se obtienen los siguientes datos de las capacidades de botellas al azar: 11. Sin embargo ninguno de ellos es exacto. como franjas de edades o altura de la muestra. 12. Los histogramas son m´ s frecuentes en a ciencias sociales. 11. 5 Longitud de la clase = 5 = 1. a Si se unen los puntos medios de la base superior de los rect´ ngulos se obtiene el pol´gono de frecuencias. o Paso 5: Graficar el histograma: En caso de que las clases sean todas de la misma amplitud. se hace un gr´ fico de barras. con dos picos. 2. Sabemos que los valores var´an en todo conjunto de datos.de validez. 15. 11. y por otro desarrollar a o o una explicaci´ n razonable y relevante de la pauta. como sexo. La explicaci´ n debe basarse en los conocimientos generales o y en la observaci´ n de las situaciones espec´ficas y debe ser confirmada mediante un an´ lisis adicional. 16. Por ejemplo. a ı 3. Las o ı a pautas habituales de variaci´ n m´ s comunes son la distribuci´ n en campana. las bases de las barras son los intervalos de clases y altura son la frecuencia de las clases. u Paso 4: Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en relaci´ n al resultado del PASO 2 en intervalos iguales. 16. la ra´z cuadrada de 30 ( n´ mero de art´culos) es mayor que cinco. o a o sesgada. o con un pico en el extremo. truncada. El prop´ sito del ı o o an´ lisis de un histograma es. Construcci´ n de un histograma o 1. 14. 14. Se utiliza cuando se estudia una variable continua. con una tolerancia de m´ s menos 1 ml. 14. 14. en peine. y. un cliente le est´ exigiendo que la capacidad de cierto tipo de a botella sea de 13 ml. 12. Paso 2: Obtener el n´ mero de clases. 15. es decir.

. y se cuenta cu´ ntas observaciones (frecuencia absoluta) a hay en cada una de ellas. AB. Justo ı a o como los histogramas. ↑ 3 8 13 19 25 Frec. en el caso del histograma es el punto en la parte m´ s alta de la a barra y en la mitad de la misma. absolutas o relativas. Varias posibilidades: Un pol´gono de frecuencias es un gr´ fico de linea que representa la informaci´ n de la tabla de frecuencias.12 . En las variables o ı cuantitativas. O. por su puesto.5 Frec.1: As´ luce un histograma de frecuencias. B. en el de ordenadas (eje vertical). o a un punto es dibujado por cada marca de clase. Acum. Para terminar ´ se conectan todos los puntos con lineas rectas. el eje vertical representa las frecuencias. las clases hay que definirlas expl´citamente (intervalos de clase).Se tiene entonces: Clase Clase I Clase II Clase III Clase IV Clase V Intervalo 11-12 12-13 13-14 14-15 15-16 Marca de Clase 11. este punto representa. que pueden ser tambi´ n las relativas. la frecuencia de la clase. ı Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuencias.5 12. Relat.5 14. 3 5 5 6 6 Frec.20 . mientras e que el eje horizontal representa la medici´ n de la variable en el conjunto de datos. Los pol´gonos de frecuencias ser´ de mucha utilidad luego para ı a estimar la curva de predicci´ n y para estimar el tipo de distribuci´ n particular que sigue el fen´ meno.5 15. Para construir el gr´ fico.24 . ı Ejemplos de otros tipos de representaciones gr´ ficas a Hay histogramas donde se agrupan los datos en clases.20 .5 13.24 El histograma de frecuencias se muestra a continuaci´ n: o Figura 2. var´ n o grupo sangu´neo con cuatro: A. sexo con dos clases: mujer. o o o 18 . a por ejemplo. En algunas variables (variables cualitativas) las clases est´ n definidas de modo natural.

19 . Medidas de Tendencia Central (MTC) Una Medida de Tendencia Central es un valor usado para representar el “promedio” t´pico en el conjunto de los ı datos.3: Muchas posibilidades para la construcci´ n del histograma.2. o 2.Figura 2. Figura 2.2: Ejemplo de como debe construirse un histograma simple.

x0. 16. ı ı Las medidas que describen un valor t´pico en un grupo de observaciones suelen llamarse medidas de tendenı cia central. para los valores de la muestra. Entonces ser´a mas adecuado buscar un valor central. y entonces buscar el punto medio de a los mismos. 15.5 . 10. Si n es impar. La media para el espacio muestral es denotada por x mientras que la media para la ¯ poblaci´ n es denotada porla letra griega µ .Es importante tener en cuenta que estas medidas se aplican a grupos mas bien que a individuos. 19. n 11 Ejercicio: Calcular la media de cada uno de los ejemplos explicitados en las secciones anteriores. ´ Ejemplo: La mediana para el conjunto de datos de las notas del examen de f´sica puede calcularse ordenando ı as´: ı 7. 17. 8. no se usar´ el valor mas elevado ni el valor mas peque˜ o como unico representante.27. La media resume en un valor las caracter´sticas de una variable teniendo en ı cuenta a todos los casos. 10.3. 7. Para tal u fin. 15. Entre las medidas de tendencia se encuentran las ı siguientes.2. es: 135 ∑n xi x = i=1 = ¯ = 12. no individual.1. La Mediana La mediana es un valor el cual separa el 50 % de los valores mayores de la data del 50 % restante menor. 8.7) ı Ejemplo: El promedio o la media de los resultados en un examen de f´sica cuyas notas han sido: 10. ya que solo a n ´ representan los extremos. n ∑N xi o µ = i=1 . N x= ¯ (2. entonces la a mediana ser´ el valor medio de los dos valores centrales. 2. 15. 10. es el simple promedio de las observaciones del grupo. 8. Solamente puede utilizarse con variables cuantitativas 2. por el contrario si n es par. desde luego. con frecuencia se desea describir el grupo con un solo n´ mero. Para calcular la mediana.2.. 10. el valor medio ser´ justamente la mediana. o ∑n xi i=1 . un promedio es una caracter´stica de grupo. lo m´ s sencillos es localizar todos los datos en orden. es decir el valor obtenido sumando las observaciones y dividiendo esta suma por el n´ mero de u observaciones que hay en el grupo. 17. 2. para los valores de la poblaci´ n. 15.2. 8.6) (2. Utilizaremos como notaci´ n la siguiente para referira o nos a este valor.8) 20 . La Media La suma de todos los valores de el conjunto de datos dividido por el n´ mero de valores en la data es lo que u se conoce como la media.2. 10. Mas bien que valores t´picos. La Media Aritmetica La medida de tendencia central mas obvia que se puede elegir.Al describir grupos de observaciones. 19 (2. 16.

5. entonces. La media se ve afecı tada de modo notable por valores extraordinariamente grandes o peque˜ os. 10. Propiedades de la mediana 1. 8. n No se puede determinar la media de datos de extremo abierto (Ej: U$S 100. Esta es un valor unico. 3. o lo que es lo mismo. La media podr´a no ser un promedio adecuado para representar datos no regulares. 4. 4.10) 7. por tanto la moda es el 10. Ejercicio: Calcular la mediana de cada uno de los ejemplos explicitados en las secciones anteriores. si la medina no o se encuentra en una clase de tal extremo. 8. de intervalo y ordinal (excepto para el nominal). 2. mediana y moda Propiedades de la media 1.2. a o esta distribuci´ n se le llamar´ unimodal.2. n (2. 10.5 = 10. La media es la m´ s com´ n de todas las medidas de tendencia central usadas para el an´ lisis de los datos. si tiene dos modas. Puede obtenerse para datos de nivel de raz´ n. Un conjunto de datos s´ lo tiene una media. 17. si s´ lo un valor es que el tiene mayor frecuencia. s´ lo existe una mediana para un conjunto de datos. siempre ser´ cero. 15. o 21 . 6. ´ a La media es la unica medida de ubicaci´ n donde la suma de las desviaciones de cada valor con respecto ´ o a la media.5. n Puede calcularse para una distribuci´ n de frecuencias con una clase de extremo abierto. 15. por tanto la mediana es el dato del centro de esta distribuci´ n ordeada. 16. ´ o No se ve afectada por valores muy grandes o muy peque˜ os. 3.4. el dato con mayor frecunecia. se considera llamar a la distribuci´ n con un nombre particular o en virtud de cuantos valores moda existan. es decir x0. en este caso. entonces. la moda resulta ser el valor que aparece repetida el mayor n´ mero de veces u en el conjunto. a u a Todo conjunto de datos de nivel de intervalo y de nivel de raz´ n tiene un valor medio. Ejercicio: Calcular la moda de cada uno de los ejemplos explicitados en las secciones anteriores. a Ejemplo: La moda para el conjunto de datos de las notas del examen de f´sica puede calcularse ordenando ı as´: ı 7. 2. asi. o Al evaluar la media se incluyen todos los valores. o ´ La media es una medida muy util para comparar dos o m´ s poblaciones.000 y mayor). Pudiera pasar que dos o varios datos se repitieran con la misma frecuencia. Es unica. se le llamar´ bimodal y si tiene m´ s se le o a a a llamar´ polimodal. 2. 2.9) vemos el dato con mayor frecuencia es el 10.vemos el n = 11. 19 (2. 8. La moda De todos los valores de la data. a i=1 ¯ ∑ (xi − x) = 0. 10. Propiedades de la media. el cual es el dato con o el orden 6to.

Para una serie de datos. o No se ve afectada por valores muy altos o muy bajos.. 3. 5.. . D = 1. 2. ordinal. u a Para muchos conjuntos de datos no hay valor modal porque ning´ n valor aparece m´ s de una vez.11) xW = i=1 ¯ ∑n wi i=1 o: x1 w1 + x2 w2 + x3 w3 + . Al igual que la mediana.6.. 94. x2 .13) x= ¯ n n 22 . a la que corresponden los pesos W = w1 . F = 0. 21 cr´ ditos de los B. y el examen final vale el 25 %. 2. 5 cr´ ditos e e e de las C y 3 cr´ ditos de D’s. e Ejercicio: Grado del curso. y 77. Podemos sacar la a cuenta para cada componente del grado final con su porcentaje para calcular el grado final. El promedio ponderado Es un caso especial de la media aritm´ tica.. 4. tiene notas de los examenes de 83. el 20 % por cada ex´ men de tres que hay.12) w1 + w2 + w3 + . y dividiendo el resultado de esta suma de productos entre o la suma de los pesos seg´ n la caracter´stica de cada n´ mero inicial. + wn Un ejemplo es la obtenci´ n de la media ponderada de las notas de una oposici´ n en la que se asigna distinta o o importancia (peso) a cada una de las pruebas de que consta el examen. xn . wn . llamado su peso. y entonces cada valor del grado se cuenta seg´ n el n´ mero de los cr´ ditos ganados con ese u u e grado. B = 3.2... y o una nota en el examen final es de 88. Ejercicio: Promedio de puntos del grado. (2. + xnwn xW = ¯ ... la media ponderada se calcula como: ∑n xi wi . Otros tipos de medias Media cuadr´ tica a La media cuadr´ tica es igual a la ra´z cuadrada de la suma de los cuadrados de los valores dividida entre el a ı n´ mero de datos: u n 2 2 2 2 a + a + · · · + a2 2 ∑ n i=1 ai 1 2 = .7. (2. Asignamos a los grados las letra con los valores: A = 4.. Para algunos conjuntos de datos hay m´ s de una moda (bimodal = que tiene dos modas). w2 .. Puede determinarse para todos los niveles de datos: nominal. (2. Calcular la cuenta final para un estudiante que ha anotado 95 en la preparaci´ n. u obteniendo a continuaci´ n la suma de estos productos.2.Propiedades de la moda 1. de intervalo y de raz´ n. Este “peso” depende de la importancia o u ı u significancia de cada uno de los valores. . El nota final en este curso se calcula seg´ n la escala siguiente: La preparaci´ n u o cuenta con el 15 %. a 2. X = x1 . Calcular el grado de un estudiante que ha ganado 12 cr´ ditos de las A. Se denomina media ponderada de un conjunto de n´ meros al resule u tado de multiplicar cada uno de los n´ meros por un valor particular para cada uno de ellos. C = 2. puede utilizarse como medida de tendencia central para distribuciones con clases de extremo abierto.

. Si uno de ellos es 0. o o A veces la variable toma valores positivos y negativos. la ra´z ı e´ e´ ı cuadrada de dicha media para volver a la unidad de medida original. por ejemplo. an . Este problema se resuelve. u n √ x = n ∏ xi = n x1 · x2 · · · xn . a n La media arm´ nica no est´ definida en el caso de la existencia en el conjunto de valores nulos. u En muchas ocasiones se utiliza su trasformaci´ n en el manejo estad´stico de variables con distribuci´ n no noro ı o mal. como ocurre. Media geom´ trica e La media geom´ trica de una cantidad finita de n´ meros (digamos n n´ meros) es la ra´z n-´ sima del producto de e u u ı e todos los n´ meros.14) i=1 Por ejemplo.15) ( a1 + · · · + a1n ) ∑i=1 ai La media arm´ nica resulta poco influida por la existencia de determinados valores mucho m´ s grandes que el o a conjunto de los otros. Consiste en elevar al cuadrado todas las observaciones a (as´ los signos negativos desaparecen). mediante la denominada media cuadr´ tica. la media de 1. la media geom´ trica de 2 y 18 es e √ 2 Otro ejemplo.. en obtener despu´ es su media aritm´ etica y en extraer. En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo. o a 23 . 1·3·9= √ 3 27 = 3. finalmente. o inverso. o u e bien negativa o bien inexistente en los n´ meros reales. La media geom´ trica es relevante cuando varias cantidades son sumadas para producir un total. e Media arm´ nica o La media arm´ nica..Esta media como medida de asociaci´ n tiene aplicaciones tanto en ciencias biol´ gicas como en medicina. . ¯ (2. (2. entonces el o e u resultado es 0. S´ lo es relevante la media geom´ trica si todos los n´ meros son positivos. la media arm´ nica e ı u ı u o ser´ igual a: a n n H= n 1 = 1 . de una cantidad finita de n´ meros es igual al rec´proco. siendo en cambio sensible a valores mucho m´ s peque˜ os que el conjunto. representada por H. de la o u ı media aritm´ tica de los rec´procos de dichos n´ meros. As´. dados los n´ meros a1 . Si hay un n´ mero negativo (o una cantidad impar de ellos) entonces la media geom´ trica es. en los errores de medida. a2 . 3 y 9 seria √ 3 2 · 18 = √ 2 36 = 6.

e arm´ nica. a 1 n n ∑n xm i=1 i ∏ n xi i=1 si m 0 .Media generalizada La media generalizada es una abstracci´ n de los diversos tipos de media (geom´ trica.2. si m = 0 (2. con m = 2. La media y la mediada (y la moda. Ve´ se la igual proporci´ n de barras con alturas aproximadas a ambos o e a o lados de la media. o e e o Se define como: m x(m) = ¯ en donde el par´ metro m indica si la media es: a aritm´ tica. con m = 1. 2. 24 . etc). o e Figura 2.4: Una distribuci´ n sim´ trica. con m = −1. Formas de las distribuciones de datos Podemos clasificar varias formas de las distribuciones de datos deacuerdo al lugar que ocupan las medidas de tendencia central m´ s usuales anteriormente definidas. en donde o se encuentra aproximadamente la media. aritm´ tica. con m = 0. o cuadr´ tica.16) Obs´ rvese que para valores de m ≤ 0 la expresi´ n s´ lo tiene sentido si todos los xi ≥ 0.8. si es unimodal) son pr´ cticamente a iguales en una distribuci´ n sim´ trica. arm´ nica. a Sim´ trica e La distribuci´ n de datos es aproximadamente de la misma forma a ambos lados de la linea central. e geom´ trica. e o o Ejercicio: Calcule los valores de las medias anteriormente definiddas para todas las situaciones y conjunto de datos anteriores.

Uniforme Todos los datos est´ n igualmente representados. pero la mayor´a de todos los datos se encuentran ı muy agrupados y acumulados a la derecha de la misma. Ve´ se la desigual proporci´ n de barras con alturas aproximao a o das a ambos lados de la media.6: Una distribuci´ n sezgada a la izquierda. Ve´ se la igual proporci´ n de barras con alturas aproximadas o a o a ambos lados de la media. en este caso. a n Por lo tanto. Medidas de variaci´ n o Para conseguir una visi´ n completa y comprensiva de los datos hay que complementar las medidas de tendencia o central con las de otras propiedades de los mismos. el grado en que los datos se parecen o diferen25 .Sesgada a la derecha Unos cuantos valores se encuentran la izquierda de la media. a 2. pero la mayor´a de todos los datos se encuentran ı muy agrupados y acumulados a la izquierda de la misma. ´ Figura 2. la media se encuentra a la izquierda de la mediana. en este caso. Generalmente la mediana es m´ s grande que la media. Generalmente la mediana es m´ s peque˜ a que la media. a Por lo tanto. la media se encuentra a la derecha de la mediana. Sesgada a la izquierda Unos cuantos valores se encuentran la derecha de la media.3.5: Una distribuci´ n sezgada a la derecha. ´ Figura 2. Por ejemplo.

o 2. ı o es decir. y luego restamos el valor u u u n m´nimo del valor m´ ximo. Para ı ı a u averiguar el rango de un grupo de n´ meros: ordenamos los n´ meros seg´ n su tama˜ o. varianza poblacional. Una es tomando las desviaciones en valor ı absoluto (Desviaci´ n media) y otra es tomando las desviaciones al cuadrado (Varianza). se calcula la media de las desviao ciones de las puntuaciones respecto a la media aritm´ tica. cuanto menor sea. A esta propiedad se la denomina variabilidad o variaci´ n. Cuanto mayor sea ese valor mayor ser´ la variabilidad.1. la media de las diferencias cuadr´ ticas de n puntuaciones respecto a su media aritm´ tica. cian entre s´. n−1 ∑ (xi − µ )2 s2 = i=1 . Entre los indicadores de variaci´ n m´ s ı o o a utilizados est´ n la varianza y la desviaci´ n t´pica. varianza muestral. ¯ Se denota usualmente por s2 x ¯ ∑i=1 (xi − x)2 .2. a e 26 . x N s2 = x (2. mas homog´ neo ser´ a la a e a media. As´ se sabe si todos los casos son parecidos o var´an mucho entre ellos. Las barras tienen aproximadamente la misma altura a ambos lados de la o media.Figura 2.3. a o ı Las medidas de dispersi´ n. e as´ que se adoptan dos clases de estrategias para salvar este problema.17) (2.3. muestran la variabilidad de una distribuci´ n. Rango El rango estad´stico es la diferencia entre el valor m´nimo y el valor m´ ximo en un grupo de n´ meros.18) La varianza es una variable estad´stica que mide la dispersi´ n de los valores respecto a un valor central (media). Pero la suma de las desviaciones es siempre cero. ı a 2. ı ı Para calcular la variabilidad que una distribuci´ n tiene respecto de su media.7: Una distribuci´ n uniforme. como tambi´ n se les conoce. La Varianza Es el promedio de las distancias al cuadrado desde los valores en xi hasta la media x en una muestra de n sujetos. indicando o e o por medio de un n´ mero o estad´stico si las diferentes puntuaciones de una variable est´ n muy alejadas de la u ı a media.

.. entonces 2 SY = ¯ ¯ ¯ ¯ ∑(Xi · k − X · k)2 ∑[k · (Xi − X)]2 ∑[k2 · (Xi − X)2 ] ∑(Yi − Y )2 2 = = = = k 2 · SX n n n n (2. la varianza queda multiplicada por el o cuadrado de esa constante. Desviaci´ n t´pica poblacional o ı N Es la otra posibilidad para conocer la variabilidad de los datos en la distribuci´ n de frecuencias sin tener que o elebar al cuadrado la diferencia de datos respecto de la media: dM = ¯ ∑i (xi − x) . S2 . m´ s dispersos estar´ n los datos. . La desviaci´ n t´pica nos informa sobre la dispersi´ n de los datos respecto al valor de la media. que se halla como la ra´z cuadrada positiva de la o o ı ı o varianza. Si Yi = Xi · k. ∑i ni (2.19) Si a los datos de la distribuci´ n les multiplicamos una constante. La Desviaci´ n Media o ∑n (Xi − µ )2 i=1 . xk ) y (S1 . 2 2 2 Si tenemos k grupos con tama˜ os n1 .. x2 .3. Desviaci´ n t´pica muestral o ı n−1 (2.23) (2.25) Ejercicio: Calcule todas la medidas de variabilidad definiddas para todas las situaciones y conjunto de datos anteriores. nk .20) 2 2 2 Propiedad distributiva: S(X+Y ) = SX + SY . ... Si a los datos de la distribuci´ n les sumamos una cantidad constante la varianza no se modifica. entonces 2 SY = ¯ ¯ ¯ ¯ ∑[(Xi + k) − (X + k)]2 ∑(Xi + k − X − k)2 ∑(Xi − X)2 ∑(Yi − Y )2 2 = = = = SX n n n n (2. . Sk ).3. Para evitar ese problema a se define otra medida de dispersi´ n.. ∑i ni ∑j nj 2 (2. Sea o Yi = Xi + k..21) xT = ¯ ¯ ∑i ni xi . que es la desviaci´ n t´pica. y con medias y varianzas conocidas (x1 .4. 27 .Propiedades 2 La varianza es siempre positiva o 0: SX ≥ 0.. a a Sx = ¯ ∑n (xi − x)2 i=1 .22) 2.24) σx = 2. La Desviaci´ n Est´ ndar o a La varianza a veces no se interpreta claramente ya que se mide en unidades cuadr´ ticas. n ¯ ¯ ¯ entonces se puede definir la varianza total como: s2 = T donde ¯ ∑i ni Si2 ∑ j n j (x j − xT ) + . cuanto o ı mayor sea su valor.. n (2.3.

refleja la relaci´ n lineal que existe entre ı o dos variables.28) Teniendo en cuenta el valor de la covarianza y las varianzas. El resultado num´ rico fluctua entre los rangos de +infinito a -infinito. No hay correlaci´ n. Se define como el cociente entre la covarianza y el producto de las desviaciones o t´picas (ra´z cuadrada de las varianzas).30) 28 .26) Este tipo de estad´stico puede utilizarse para medir el grado de relaci´ n de dos variables si ambas utilizan una ı o escala de medida a nivel de intervalo/raz´ n (variables cuantitativas). se puede evaluar mediante cualquiera de las dos expresiones siguientes: r= ∑ xi yi n ∑ x2 i n − xy ¯¯ − x−2 ∑ y2 i n . Al no tener unos l´mites e ı establecidos no puede determinarse el grado de relaci´ n lineal que existe entre las dos variables. Este estad´stico. n − 1 en su forma insesgada).27) 2. ı ı r= Vxy = VxVy Sxy 2 2 Sx Sy = Sxy . Sx Sy (2. Recta de regresi´ creciente. se simboliza por la letra griega sigma (σxy ) cuando ha sido calculada en la ı o a poblaci´ n. Coeficiente de Correlaci´ n de Pearson o El coeficiente de correlaci´ n de Pearson. o La expresi´ n se resuelve promediando el producto de las puntuaciones diferenciales por su tama˜ o muestral (n o n pares de puntuaciones. Correlaci´ n directa. o o  Sxy = = 0.3.5. Propiedades −∞ ≤ Sxy ≤ +∞.29) r= n ∑ xi yi − ∑ xi ∑ yi n ∑ x2 − (∑ xi )2 i n ∑ y2 − (∑ yi )2 i (2. n−1 n−1 (2.3. r. (2. − y−2 .6. nos permite saber si el ajuste de la nube de puntos a la recta de regreo si´ n obtenida es satisfactorio. La formulaci´ n cl´ sica. Correlaci´ n inversa.2. o La formula suele aparecer expresada como: ¯ ¯ ∑n xi yi ∑n (Xi − X)(Yi − Y ) ˆ Sxy = i=1 = i=1 . Recta de regresi´ n decreciente. se designa por la letra “sxy ”. solo es posible o ver la tendencia. o   < 0. o o (2. Covarianza La covarianza entre dos variables es un estad´stico resumen indicador de si las puntuaciones est´ n relacionadas ı a entre s´. Se tiene que  > 0. Si se obtiene sobre una muestra.

29 . hay una buena correlaci´ n negativa entre las variables seg´ n un modelo lineal o u y la recta de regresi´ n que se determine tendr´ pendiente negativa: es decreciente. o a Figura 2. 2. r. ser´ creciente. (2. ı Para medir el nivel de asimetr´a se utiliza el llamado Coeficiente de Asimetr´a de Fisher. o a a Cuando r es cercano a -1.31) Los resultados pueden ser los siguientes: g = 0 (distribuci´ n sim´ trica. o Cuando r es pr´ ximo a 0. hay una buena correlaci´ n positiva entre las variables seg´ n un modelo lineal o u y la recta de regresi´ n que se determine tendr´ pendiente positiva.8: El coeficiente de correlaci´ n de Pearson establece la posibilidad de un ajuste de los puntos en la o muestra. no hay correlaci´ n lineal entre las variables. g < 0 (distribuci´ n asim´ trica negativa.Propiedades El coeficiente de correlaci´ n. ı o Cuando r es cercano a +1. existe la misma concentraci´ n de valores a la derecha y a la izquierda de la o e o media). presenta valores entre -1 y +1. que viene definido: ı g= ¯ ∑i (xi −x)3 n ¯ ∑i (xi −x)2 n 3/2 . Coeficientes de asimetr´a y curtosis ı Asimetr´a ı Hemos comentado que el concepto de asimetr´a se refiere a si la curva que forman los valores de la serie preı senta la misma forma a izquierda y derecha de un valor central. existe mayor concentraci´ n de valores a la izquierda de la media o e o que a su derecha). La nube de puntos est´ muy o o a dispersa o bien no forma una l´nea recta. No se puede trazar una recta de regresi´ n. existe mayor concentraci´ n de valores a la derecha de la media o e o que a su izquierda). g > 0 (distribuci´ n asim´ trica positiva.7.3.

o u k > 0 (distribuci´ n leptoc´ rtica ).9: Distintas posibilidades de la forma del histograma en relaci´ n con el valor num´ rico de el coeficiente o e de Fisher. a 2. Distribuci´ n mesoc´ rtica: presenta un grado de concentraci´ n medio alrededor de los valores centrales o u o de la variable (el mismo que presenta una distribuci´ n normal).4. o u Ejercicio: Calcule los valores de los coeficientes de simetr´a de Fisher y de Curtosis para todas las situaciones ı y conjunto de datos anteriores. o Distribuci´ n leptoc´ rtica : presenta un elevado grado de concentraci´ n alrededor de los valores centrales o u o de la variable. Teorema que envuelven cuestiones sobre la Desviaci´ n Est´ ndar o a La desviaci´ n est´ ndar de una data es una cantidad importante debido a que limita el n´ mero de valores que o a u pueden ser encontrados en alguna determinada regi´ n de la distribuci´ respecto del promedio. El Coeficiente de Curtosis viene definido por la siguiente f´ rmula: o k= ¯ ∑i (xi −x)4 n ¯ ∑i (xi −x)2 n 2 −3 (2.Figura 2. 2. o o 30 . o Se definen 3 tipos de distribuciones seg´ n su grado de curtosis: u 1. 3.32) Los resultados pueden ser los siguientes: k = 0 (distribuci´ n mesoc´ rtica). Identifique los tipos de gr´ ficas que sean. Curtosis El Coeficiente de Curtosis analiza el grado de concentraci´ n que presentan los valores alrededor de la zona o central de la distribuci´ n. o u k < 0 (distribuci´ n platic´ rtica). Distribuci´ n platic´ rtica: presenta un reducido grado de concentraci´ n alrededor de los valores centrales o u o de la variable.

x + σ ]. Se trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. tarea que puede ser pesada.4. La regla emp´rica ı Aplica s´ lo cuando la distribuci´ n de datos es del tipo campana. y establec que: o o Aproximadamente el 68 % de los datos se encuentran a una desviaci´ n est´ ndar de la media. podemos caracterizar su distribuci´ n de frecuencias mediante algunos valores num´ ricos. La descripo o ci´ n de un conjunto de datos. ¯ ¯ aproximadamente el 95 % de los datos se encuentran a dos desviaci´ n est´ ndar de la media.2.4.1. es decir en o a el intervalo [x − σ . eligiendo como resumen de los datos un valor alrededor del cual se encuene tran distribuidos los valores de la variable. es decir en o a ¯ el intervalo [x − 2σ . Pero estas medidas de posici´ n de una distribuci´ n de frecuencias o o han de cumplir determinadas condiciones para que sean verdaderamente representativas de la variable a la que 31 . ı Ejercicio: Haga uso de los teoremas anteriores sobre la desviaci´ n est´ ndar para hacer un an´ lisis de las o a a distribuciones de las situaciones y conjunto de datos anteriores. a ı Nota: el teorema de Chebychev establece s´ lo los l´mites inferiores para wen los cuales se encuentra una detero ı minada cantidad de datos. es decir en o a el intervalo [x − 3σ . ¯ aproximadamente el 99 % de los datos se encuentran a tres desviaci´ n est´ ndar de la media. incluye como un elemento de importancia la ubicaci´ n de estos dentro de un o o ´ contexto de valores posible. x + 2σ ].Figura 2. 2.10: Distintas posibilidades de la forma del histograma en relaci´ n con el valor num´ rico de el coefio e ciente de curtosis. Medidas de Posici´ n o Las medidas de posici´ n nos facilitan informaci´ n sobre la serie de datos que estamos analizando. En vez de manejar todos o los datos sobre las variables.5. mientras que la regla emp´rica si que da buenas aproximaciones. 2. Teorema de Chebychev Aplica a cualquier tipo de data. x + 3σ ] ¯ ¯ 2. Estavlece que la porci´ n de valores que deben estar a k-desviaciones de la media o est´ como m´nimo a 1 − k12 .

2. al igual que los cuartiles. Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero al noventa y nueve percentil).2. Toda s´ntesis de una distribuci´ n se considerara como operativa si intervienen en su determinaci´ n ı o o todos y cada uno de los valores de la distribuci´ n. Cuartiles Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. segundo decil. D9 . Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales. 3 (2. ı n = N´ mero de datos.. k n 4 − Fk c. La f´ rmula para el o c´ lculo de los cuartiles cuando se trata de datos agrupados es la siguiente: a Qk = Lk + donde: Lk = L´mite real inferior de la clase del cuartil k. son tambi´ n e un caso particular de los percentiles. como lo son: ı Cuartiles: Hay 3 cuartiles que dividen a una distribuci´ n en 4 partes iguales: primero. 2. u Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k. es el valor en el cual o por debajo del cual queda un cuarto (25 %) de todos los valores de la sucesi´ n o (ordenada). Q3 . Q2 . Los deciles. 32 .resumen.1. fk para k = 1. Deciles Los deciles son ciertos n´ meros que dividen la sucesi´ n de datos ordenados en diez partes porcentualmente u o iguales. Los deciles se denotan D1 . segundo y tecer o cuartil.5. D2 . que se leen primer decil. c = Longitud del intervalo de la clase del cuartil k. el tercer cuartil. A continuaci´ n se describen las medidas de posici´ n m´ s comunes a o o o a utilizadas en estad´stica. son ampliamente utilizados... es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75 %) de los datos. El segundo cuartil es precisamente la mediana. El primer cuartil. Como los cuartiles adquieren su mayor importancia cuando contamos un n´ mero grande de datos y tenemos en u cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. siendo unica para cada distribuci´ n de frecuencias y siendo o ´ o siempre calculable y de f´ cil obtenci´ n.5. Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil). etc. Hay tres cuartiles denotados usualmente Q1 . fk = Frecuencia de la clase del cuartil k.33) 2..

2.Para datos agrupados los deciles se calculan mediante la f´ rmula..... ı n = N´ mero de datos. as´ como tambi´ n cualquier herramienta compuı e tacional o tecnol´ gica disponible.. todos ellos padecen de jaqueca cr´ nica ı o (se despiertan todos los d´as con dolor de cabeza). con un nuevo medicamento llamado SINDOLORCABEZON. o 1. Los percentiles (P1 ..6. Ejercicio: Calcule los valores de los tres cuartiles. Se realiza un estudio sobre el n´ mero de d´as que un ı u ı paciente sufre mejor´a con el anterior medicamento obteniendo la tabla: ı 33 . percentil 99. ı Cuando los datos est´ n agrupados en una tabla de frecuencias.. En cada uno de o los problemas pudiera usarse todo lo reflejado en estas notas. tal vez. o Dk = Lk + k n 10 fk − Fk c. Problemas de final de cap´tulo ı A continuaci´ n una serie de problemas de repaso y estudio para fijar los conceptos anteriores. fk = Frecuencia de la clase del decil k.. 9 (2.. estatura.. 99 (2.34) donde: Lk = L´mite real inferior de la clase del decil k. para k = 1. 2. etc. P99 ). u Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. . se calculan mediante la f´ rmula: a o Pk = Lk + k n 100 fk − Fk c. ı Los percentiles son ciertos n´ meros que dividen la sucesi´ n de datos ordenados en cien partes porcentualmente u o iguales. c = Longitud del intervalo de la clase del decil k. 2...5. 2. los diez deciles y algunos de los centiles para todas las situaciones y conjunto de datos anteriores. c = Longitud del intervalo de la clase del decil k. u Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. le´dos primer percentil. durante 5 d´as a un grupo de pacientes.. En un centro hospitalario de la provincia de Sevilla se ha tratado. ı n = N´ mero de datos. P2 . Centiles o percentiles Los percentiles son.35) donde: Lk = L´mite real inferior de la clase del decil k. para k = 1. fk = Frecuencia de la clase del decil k. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. .3.. las medidas m´ s utilizadas para prop´ sitos de ubicaci´ n o clasificaci´ n de las pera o o o sonas cuando atienden caracter´sticas tales como peso.

6. Explica detalladamente que criterio de selecci´ n estad´stico podr´a aplicar el Gobierno. 1. 2. 3. Media a e o geom´ trica. 34 3. Tenemos la siguiente informaci´ n sobre el gasto semanal en ocio de un grupo de estudiantes universitao rios. 1. 3. 5. . 2. (Contesta razoe a ı ı nadamente y con el mayor detalle posible). 2. 4. indicar cu´ l ser´a el que mejor representar´a los datos. (e) Calcula el D3 . (c) ¿Por qu´ no calculamos el coeficiente ı ı e de variaci´ n para ver la representatividad de la media? (d) ¿Habr´a que hallarlo?. 2. encontr´ ndose recogido los datos en la siguiente o a tabla: Tiempo de reacci´ n Numero de pacientes o ´ 0-10 300 10-20 500 20-30 400 30-40 500 40-50 300 Se pide: (a) Escribir las f´ rmulas de las diferentes medias e indicar cu´ l de las tres te parece m´ s adecuada o a a para aplicar en este ejercicio (Razonadamente). 3. 7. 3. 6. (b) ¿Qu´ proporci´ n e o de hogares est´ compuesta por tres o menos personas? ¿Qu´ proporci´ n de individuos vive en hogares a e o con tres o menos miembros? (c) Dibuje el diagrama de barras de frecuencias y el diagrama en escalera. u (c) Estudiar la representatividad del tiempo medio de reacci´ n. ¿Qu´ significados tienen? e A aquellos pacientes que sienten mejor´a todos los d´as del tratamiento se les realiza un estudio sobre ı ı el tiempo de reacci´ n del medicamento (en minutos). 5. 2. Moda. Hallar el n´ mero de pacientes a los que se le aplica este segundo medicamento. (b) A todos los pacientes que tardan en reaccionar m´ s a de 35’ se le aplica el medicamento complementario PAQUENODUELA para acelerar los efectos de SINDOLORCABEZON. con una varianza de 200 y o 300 minutos2. (d) Agrupe por intervalos de amplitud 2 los valores de la variable. ¿Es representativo? ¿Por qu´ ? (d) El o e Gobierno est´ pensando en introducir un medicamento con las caracter´sticas de SINDOLORCABEZON. 3. o ı P65 . (a) Calcule la distribuci´ n de frecuencias de la variable o obteniendo las frecuencias absolutas. 3. 4. 4. (b) Calcula tambi´ n el porcentaje de pacientes que sienten e mejor´a con el medicamento en todos los d´as del tratamiento. Media arm´ nica. 2. 3. relativas y sus correspondientes acumuladas. El tiempo a medio de reacci´ n de cada uno de ellos es respectivamente 25 y 30 minutos. Q3 . 1. 5. 5. 3. 8. calcule su distribuci´ n de frecuencias o y represente el histograma correspondiente. 4. Las respuestas obtenidas han sido las siguientes: 1. a ı Existen en el mercado junto con este dos productos m´ s PALACABEZA y SINJAQUECAHOY. Se ha realizado una encuesta a 30 personas en la que se les pregunta el n´ mero de personas que conviven u en el domicilio habitualmente. 2. 4. o ı ı Seg´ n el criterio anterior que medicamento ser´a el que pasar´a a engrosar la lista de medicamentos de la u ı ı Seguridad Social. y Mediana).Datos (xi ) 0 1 2 3 4 5 Frecuencias 100 250 300 500 450 2000 (a) Realizando el gr´ fico adecuado y hallando los promedios (Media aritm´ tica.

13. 11. 9. 7. coee o ı o ficiente de variaci´ n de Pearson. relativas y sus correspondientes acumuladas. coeficiente de correlaci´ n. compruebe con o ı la forma del pol´gono de frecuencias. # de Litros # de Autom´ viles o 1-7 4 7-10 8 10-12 35 12-14 30 14-18 20 18-25 3 (a) Calcule la distribuci´ n de frecuencias. 16. Sea la distribuci´ n referida a beneficios anuales de 38 empresas madrile˜ as: o n 35 5. 13. 12. 10. 14. (b) Desviaci´ n t´pica.15. 13. 11. En un estudio sobre consumo de gasolina en una gran ciudad se eligi´ una muestra de 100 veh´culos o ı y se observ´ el n´ mero de litros que consum´an en un d´a. 12. 17. 12. 15. 9. (e) Agrupe la variable en los intervalos que considere conveniente de amplitud variable. 18. mediana y moda. (b) Dibuje el o histograma de frecuencias. 10. obteniendo. 11. 12. 18. 11. 13. 11. la amplitud de cada intervalo as´ como sus o a ı respectivas marcas de clase y las densidades de frecuencia. obteni´ ndose la siguiente distribuci´ n de o u ı ı e o frecuencias. 15. (b) ¿Qu´ proporci´ n de sucursales tiene m´ s de 15 empleados? (c) Dibuje el diagrama de barras y el e o a diagrama en escalera correspondientes. 17. 10. 15. La siguiente distribuci´ n expresa el n´ mero de coches vendidos durante una semana por cada uno de los o u 50 concesionarios que una determinada firma tiene en Espa˜ a: n # de autos vendidos # de Concesionarios 1 5 3 12 4 20 6 8 10 5 Se pide: (a) Media aritm´ tica. 11. calcule su distribuci´ n de frecuencias y represente su histograma y su pol´gono de frecuencias acumulao ı das. (a) Calcule la distribuci´ n de o frecuencias de la variable obteniendo las frecuencias absolutas. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el n´ mero de emu pleados que hay en cada una de ellas para un estudio posterior. (b) Represente gr´ ficamente la distribuci´ n a o de frecuencias mediante un histograma. Las observaciones obtenidas han sido: 12. (c) Coeficientes de asimetr´a de Fisher y de Curtosis.16. 13. 10. 12. 15. . 16. ı 4. Para todo haga siempre un an´ lisis de los datos y los estimadores ı a calculados. 11. 12. 19. 11. 15. calcule las densidades de frecuencia de cada intervalo y represente el histograma correspondiente. 14. 6. (d) Agrupe en intervalos de amplitud 3 los valores de la variable. 16. 11. 12. (c) Dibuje el pol´gono de frecuencias acumuladas. 11.16.14.Nivel de gastos # de J´ venes o 0-5 4 5-10 11 10-15 16 15-20 22 20-25 8 25-30 6 (a) Calcule la distribuci´ n de frecuencias de la variable y las densidades de frecuencias. 12. adem´ s. 12.

(f) Estudiar la curtosis. (d) ¿Qu´ porcentaje del ı o e e total de acciones poseen los accionistas mayoritarios? (e) ¿Qu´ porcentaje de los accionistas minoritarios posee el 20 % del total de acciones? 36 . Beneficio (Miles de Euros) # de Empresas 230-280 5 280-330 7 330-580 14 580-630 9 630-780 3 Se pide: (a) Calcular el beneficio medio de estas 38 empresas madrile˜ as. (e) Estudiar la forma de esta distribuci´ n. (d) Estudiar la a a dispersi´ n de esta distribuci´ n a partir del recorrido intercuart´lico. (b) Hallar la meu o ı diana. 9. ı ı Una empresa ten´a a finales de 2003 mil seiscientos cincuenta accionistas distribuidos de la siguiente ı forma: # de acciones # de accionistas 0-20 1030 20-60 380 60-100 180 100-500 50 500-1000 10 Se pide: (a) Hallar el n´ mero medio de acciones por accionista y su desviaci´ n t´pica. desviaci´ n t´pica y coeficiente de o o ı o ı variaci´ n de Pearson. el grado de concentraci´ n de las acciones. viene dada por la tabla siguiente: Importe (Euros) # de Veh´culos ı 0-60 10 60-80 20 80-120 40 120-240 10 Se pide: (a) Calcular el importe medio. (b) ¿Cu´ l es el beneficio mayor n a de la mitad de las empresas m´ s modestas? (c) Determinar el beneficio m´ s frecuente.8. Estudiar la representatividad de esta media. (c) Decida. o o La distribuci´ n del importe de las facturas por reparaci´ n de carrocer´a de una muestra de 80 veh´culos o o ı ı en un taller. con base estad´stica. (c) ¿Qu´ interpretaci´ n tienen en este caso los deciles? Calcular el a e o tercer decil. (d) ¿Cu´ l es el importe m´ ximo pagado por las 60 reparaciones m´ s baratas? (e) Estudiar la a a a asimetr´a a partir del coeficiente de asimetr´a de Fisher. (b) Calcular el importe mediano y el importe m´ s frecuente.

algunas veces es posible emparentar. a trav´ s de una funci´ n. digamos que alguien est´ interesado un peque˜ o o a n problema para estudiar una cierta caracter´stica en unos moluscos muy raros con caparaz´ n. toma datos de los pesos y las dimensiones del caparaz´ n de o dichos moluscos. una descripci´ n de la o o poblaci´ n de estudio y/o catalogar especies en t´ rminos de sus caracter´sticas. Distribuciones bidimensionales Cuando sobre una poblaci´ n estudiamos simult´ neamente los valores de dos variables estad´sticas. que pudieramos o e ı tener tambi´ n una relaci´ n entre ambas variables o caracter´sticas que no sea funcional. el conjunto o a ı de los pares de valores correspondientes a cada individuo se denomina distribuci´ n bidimensional. es muy posible. sin embargo. Esto ser´ . Hay que advertir. Esto. como primer paso. ı n o a es una supusici´ n ya que podr´a haber resultados para los cuales esto no sea cierto. El presente a a e o a cap´tulo est´ dedicado a estas cuestiones. Correlaci´ n y regresi´ n o o En f´sica como en otras areas es importante a veces. Como usted podr´ inferir. e o ı no nos interesaremos por ese tipo de relaciones. tener una relaci´ n entre muchos datos de los que se estuı ´ o dian para una situaci´ n dada. ı a a ´ 3. relacionar a a e ambas caracter´sticas de alguna manera funcional. Para dicho estudio ı o digamos que el investigador. en el sentido estricto estad´stico. o 37 . uno esa ı tar´a tentado a decir que el tama˜ o del caparaz´ n est´ relacionado con el peso del molusco. por su puesto. como o ı ´ ı siempre todo debe tomarse supuesto. ı Como veremos m´ s adelante. una dimensi´ n a o o grande en la muestra de los caparazones pudiera corresponder a caracoles o moluscos m´ s pesados.1. Si este fuera el ı e o ´ caso entonces uno pudiera inferir. es posible. que para la poblaci´ n de estudio. a partir de la funci´ n que relaciona dichas variables. As´ que desde luego. en un caso sencillo.2. Por ejemplo. o en otras palabras m´ s t´ cnicas. o mejor dicho. como veremos util para resolver muchos problemas. Estamos interesado en las relaciones que se pueden hacer cu´ ndo una o m´ s variables estan emparentadas a trav´ s de alguna(s) funci´ n(es) matem´ ticas. regresion 3. As´.Cap´tulo 3 ı ´ ´ Metodos cuantitativos de analisis ´ predictivo.

4).. a La primera forma de describir una distribuci´ n bidimensional (y por tanto. es decir.Por ejemplo: Las notas de 10 alumnos en Matem´ ticas y en F´sica vienen dadas en la siguiente tabla: a ı F´sica ı Matem´ ticas a 4 4 10 4 10 10 12 12 12 10 14 14 14 10 16 16 18 14 16 20 Los pares de valores (4. La recta se denomina recta de regresi´ n.(18.3. o Figura 3.(16.. si los cambios en una de ellas influyen en los valores o de la otra. Si ocurre esto decimos que las variables est´ n correlacionadas o bien que hay correlaci´ n entre ellas.(10. o Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aqu´ nos limitaremos a ver si los puntos se distribuyen alrededor de una recta.4). mejor es la de ı Matem´ tica. a o En el ejemplo anterior parece que hay cierta tendencia a que cuanto mejor es la nota en F´sica.. con o ı el fin de ver si existe alguna relaci´ n entre ellas. o o Hablaremos de correlaci´ n lineal fuerte cuando la nube se parezca mucho a una recta y ser´ cada vez m´ s d´ bil o a a e (o menos fuerte) cuando la nube vaya desparram´ ndose con respecto a la recta.14)..10).20). El gr´ fico obtenido recibe el nombre de nube de puntos o diagrama de a dispersi´ n. o 3.(10. La idea de la correlaci´ n o Es frecuente que estudiemos sobre una misma poblaci´ n los valores de dos variables estad´sticas distintas.1: Ejemplo de de un diagrama de dispersi´ n o nube de puntos. a 38 . forman la distribuci´ n bidimensional. Si as´ ocurre diremos que hay ı ı correlaci´ n lineal. saber si lo es) es representar los o pares de valores en el plano cartesiano.

En el gr´ fico observamos que en nuestro ejemplo la correlaci´ n es bastante fuerte. ya que la recta que hemos a o dibujado est´ pr´ xima a los puntos de la nube. a o Cuando la recta es creciente la correlaci´ n es positiva o directa: al aumentar una variable. como en el ejemplo anterior.3: Regresi´ n lineal: la cantidad de intentos a medida que aumenta hace que el n´ mero de error dismio u nuya. la otra tiene tendencia a disminuir. Cuando la recta es decreciente la correlaci´ n es negativa o o inversa: al aumentar una variable. En la gr´ fica se describen el n´ mero de errores que corresponden a los intentos realizados. Por ejemplo: Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. o e con fin de estudiar si esta variable estaba relacionada con la nota media obtenida. Por ejemplo: A 12 alumnos de un centro se les pregunt´ a qu´ distancia estaba su residencia de la Universidad. o a Figura 3.Figura 3. Se obtuvieron los datos que figuran en la siguiente tabla: 39 . Observa que hay a u una correlaci´ n muy fuerte (los puntos est´ n casi alineados) y negativa (la recta es decreciente).2: Regresi´ n lineal: Los puntos tienden a describirse a partir de una recta que los representa aproximao damente a todos. la otra tiene tambi´ n o e tendencia a aumentar.

Se define como el cociente entre la covarianza y el producto de las desviaciones t´picas (ra´z ı ı cuadrada de las varianzas).2) r= n ∑ xi yi − ∑ xi ∑ yi n ∑ x2 − (∑ xi )2 i n ∑ y2 − (∑ yi )2 i (3. tenga en cuenta la lecci´ n aprendida en la secci´ n (2.4 9.5 6. − y−2 .1 0.7 0.3) El corefiente de correlaci´ n ten´a las siguientes propiedades muy interesantes: o ı 40 .4: Regresi´ n lineal: Al parecer n existe relaci´ n entre la distancia a la que se vive de la Universidad y o o la calificaci´ n que se obtiene. Teniamos que el coeficiente de o o o correlaci´ n de Pearson.1 Observamos una nube de puntos que no nos sugiere ninguna recta concreta.4 2.2 3 8.7 1 4. r. Encontrando la relaci´ n. Regresi´ n o o o 3.Distancia (en Km) Nota media 0.4 0.4.3.6). (3.5 4.4.1. El coeficiente de correlaci´ n S´ lo para recordar.2 5. porque la correlaci´ n es pr´ cticao a mente inexistente.8 2.12 5.05 8. nos permite saber si el ajuste de la nube de puntos a la recta de regresi´ n obtenida o o es satisfactorio.1 4 0. (3.1 7. Vxy Sxy Sxy r= .3 0. o 3. no tiene nada que ver con el rendimiento acad´ mico la distancia del domicilio a la e Universidad. se puede evaluar mediante cualquiera de las dos expresiones siguientes: r= ∑ xi yi n ∑ x2 i n − xy ¯¯ − x−2 ∑ y2 i n . Figura 3.5 3 7.3 1.7 6.1) = = Sx Sy VxVy S2 S2 x y Teniendo en cuenta el valor de la covarianza y las varianzas. es decir.

r. no hay correlaci´ n lineal entre las variables. el m´ todo de ajuste por cuadrados m´nimos se denomina tambi´ n m´ todo e ı e e de regresi´ n lineal. que representa el caso de inter´ s. ı o Cuando r es cercano a +1. Observamos o supoo a o nemos una tendencia lineal entre las variables y nos preguntamos sobre cu´ l es la mejor recta: a y(x) = ax + b. A menudo nos confrontamos con situaciones en las que existe o suponemos a que existe una relaci´ n lineal entre las variables X e Y.5: Regresi´ n lineal: Al parecer n existe relaci´ n entre la distancia a la que se vive de la Universidad y o o la calificaci´ n que se obtiene. El lector puede consultar a continuaci´ n una o ı ´ o discusi´ n del caso general de cuadrados m´nimos cuando el modelo es no lineal y los datos est´ n afectados de o ı a errores.El coeficiente de correlaci´ n.4) χ 2 = ∑ [yi − (axi + b)]2 .5) 41 .Y). hay una buena correlaci´ n negativa entre las variables seg´ n un modelo lineal o u y la recta de regresi´ n que se determine tendr´ pendiente negativa: es decreciente. No se puede trazar una recta de regresi´ n. En este cap´tulo discutiremos este ultimo caso. El M´ todo de los M´nimos Cuadrados o e ı Hemos enfatizado sobre la importancia de las representaciones gr´ ficas y hemos visto la utilidad de las versiones a linealizadas de los gr´ ficos (X. e Es util definir la funci´ n χ 2 (Chi-cuadrado): ´ o (3. ser´ creciente. o Surge de modo natural la pregunta: ¿cu´ l es la relaci´ n anal´tica que mejor se ajusta a nuestros datos? El m´ todo a o ı e de cuadrados m´nimos es un procedimiento general que nos permite responder esta pregunta. presenta valores entre -1 y +1. Figura 3.4. o Cuando r es pr´ ximo a 0.2. La nube de puntos est´ muy o o a dispersa o bien no forma una l´nea recta. o a 3. i (3. Regresi´ n lineal. o La dispersi´ n de los valores est´ asociada a la fluctuaci´ n de los valores de cada variable. Cuando la relaci´ n ı o entre las variables X e Y es lineal. o a a Cuando r es cercano a -1. hay una buena correlaci´ n positiva entre las variables seg´ n un modelo lineal o u y la recta de regresi´ n que se determine tendr´ pendiente positiva.

ecuaci´ n o o o (3. etc. 42 . da de donde resulta despu´ s de algunos c´ lculos e a a= b= N ∑ xi yi − ∑ xi ∑ yi . o sea los valores indicado o a por la ecuaciones anteriores. a e a a Aplicando estas t´ cnicas.o . realizan el proceso de miı a a nimizaci´ n en forma autom´ tica y dan los resultados de los mejores valores de a y b.Figura 3. En los programas como Excel.4) minimizan la funci´ n χ 2 . Los mejores valores de la pendiente a y la ordenada al origen b son aquellos que minimizan esta o desviaci´ n total.7) (3.8) d 2 χ = 0. Los resultados en las ecuaciones anteriores se aplican en el caso lineal cuando todos los datos de la variable dependiente tienen la misma incertidumbre absoluta y la incertidumbre de la variable independiente se considera despreciable. Los par´ metros a y b pueden obtenerse usando t´ cnicas matem´ ticas que hacen uso del c´ lculo diferencial.6) N ∑ x2 ∑ yi − ∑ xi ∑ xi yi i . N ∑ x2 − (∑ xi )2 i (3. Origin.ajuste lineal”. el problema de minimizaci´ n se reduce al de resolver el par de ecuaciones: e o d 2 χ = 0. son los valores que remplazados en la ecuaci´ n (3. N ∑ x2 − (∑ xi )2 i Actualmente. db (3. El criterio de m´nimos cuadrados reemplaza el juicio personal de quien mire los gr´ ficos y defina cu´ l es la ı a a mejor recta. o e o que es una medida de la desviaci´ n total de los valores observados yi respecto de los predichos por el modelo o lineal ax + b.6: La curva de regresi´ n lineal en t´ rminos de los cambios de la funci´ n. la mayor´a de los programas de an´ lisis de datos y planillas de c´ lculo.5). este c´ lculo se realiza usando la herramienta regresi´ n a o lineal. o sea..

escrito ahora equivalentemente como: r2 = Cov(x.Y) no tienen correlaci´ n alguna entre a ı o ellos. aunque ellos est´ n correlacionados. − N N ∑ y2 ∑ yi i − N N 2 (3. por ejemplo. conocido como el valor de Chi-cuadrado por grado de libertad. decimos que el modelo ı o lineal es adecuado para describir los datos experimentales. los pares de puntos (X. Dado que r mide el grado de correlaci´ n lineal entre o o o ı los datos.12) Cov(x. si los pares (X.15) 43 . Var(x) ·Var(y) N ∑ xi yi − ∑ xi ∑ yi .14) 2 donde χN .Una medida de la calidad o bondad del ajuste realizado viene dado por el coeficiente de correlaci´ n de Pearson o entre las variables X e Y. si. viene dada por: 2 χN = 1 · χ 2. Las incertidumbres de los par´ metros a a a del ajuste vienen dadas por las expresiones: σa σb = = 2 χN . y)2 . y) = Var(x) = Var(y) = =< y2 >< y >2 . tambi´ n tendr´amos r ∼ 0. Por consiguiente. e ı Frecuentemente el resultado que deseamos determinar de nuestro experimento es alguno de los par´ metros de la a ecuaci´ n (3. k ser´ precisamente la pendiente de la recta a que mejor se ajusta a los datos. Cuando r se aparta de estos extremos decimos que una expresi´ n lineal no es una buena descripci´ n de los datos. que o e deseamos determinar a partir de mediciones de tensi´ n Vi y la corriente que lo atraviesa Ii . N ·Var(x) 2 χ N · ∑ x2 i . Si r es ±1 o pr´ ximo a estos valores. N −2 (3.4). N2 2 ∑ xi ∑ x2 i =< x2 >< x >2 .9) (3. En este caso.13) (3. Por ejemplo. el lector interesado podr´ encontrar un tratamiento m´ s exhaustivo en las referencias. que denotaremos con los s´mbolos σa y o a a ı o o a σb . Otro ejemplo es la obtenci´ n de la resistencia el´ ctrica R de un conductor. si deseamos determinar la constante el´ stica k de un resorte a partir de mediciones o a de fuerzas aplicadas Fi y estiramientos xi que le producen al resorte. Desde luego.4).10) (3. o La importancia del m´ todo de cuadrados m´nimos reside en el hecho que nos permite obtener valores de la e ı desviaci´ n est´ ndar o sea los errores asociados a los par´ metros a y b.11) (3.Y) tienen una relaci´ n tal que caen sobre un c´rculo. N ·Var(x) (3. es o util disponer de un modo de estimar las incertidumbres asociadas a la determinaci´ n de los par´ metros a y b de ´ o a la ecuaci´ n (3. conviene analizar el gr´ fico y buscar o o a una relaci´ n no-lineal que aproxime mejor la dependencia. El valor de r var´a entre -1 y 1 como siempre. En esta secci´ n s´ lo presentamos los resultados de utilidad m´ s frecuente en el laboratorio. tendr´amos r ∼ 0.

17) < x2 >= (3. la consistencia con otros conjuntos de datos o sobre la base de consideraciones de simetr´a o concordancia con teor´as bien establecidas.998. Supongamos que el cuerpo parte del reposo. por ejemplo. o 44 . del 3 por mil.0. ya que la mayor´a de las planillas de c´ lculo y programas de ajuste. Pero en un gr´ fico log-log. a apenas. a lo que representa un 10 % de discrepancia entre los exponentes de la variable X.1 y 1. el ajuste por un modelo lineal es a m´ s que tentador. ı a Evidentemente. podr´a dea o ı venir en un coeficiente de. Esperamos que el movimiento sea uniformemente acelerau ´ do. 2 donde a es la aceleraci´ n. Por ejemplo. a o o r = 0. Entre los coeficientes hay una diferencia. de donde se ve claramente o a la proporcionalidad x ∼ t 2 que predice el modelo. dif´cilmente demostrable a partir del gr´ fico de la Figura. ∑ x2 i .99959. En n o ocasiones lo dif´cil es establecer si existe correlaci´ n entre las variables. por los regular indican los valores de los par´ metros a y b que mejor ajustan los datos y el a valor de r.16) (3. por ejemplo. En la figura se ven los resultados. Muchas veces la decisi´ n entre o o dos alternativas debe hacerse usando otros criterios. o 0. ı ı Por ejemplo: Imaginemos un experimento donde se mide la distancia que recorre un m´ vil sobre una l´nea o ı recta mientras una fuerza constante act´ a sobre el. la diferencia de pendientes ser´ la que hay entre 1. menor que el anterior.Las incertidumbres de los par´ metros a y b tambi´ n pueden escribirse en t´ rminos del coeficiente de correlaci´ n a e e o r del siguiente modo: σa σb donde = = σa 1 a2 · 2 −1 . Sin embargo. N (3. aun cuando los datos provengan de ı o fuentes ”limpias”que hayan producido datos con relativamente poca dispersi´ n. el uso de una aproximaci´ n lineal no es buena en este problema y el mero juicio del valor del o coeficiente de correlaci´ n no es suficiente. 0. se obtiene la ecuaci´ n de la mejor recta y un coeficiente de correlaci´ n muy alto.18) ı a Estas expresiones son de mucha utilidad para estimar σa y σb . Un gr´ fico de datos experimentales de Y = X con algo de dispersi´ n fortuita de los puntos. Estos m´ todos de an´ lisis e a nos ense˜ an que los efectos de correlaci´ n pueden estar enmascarados por el efecto del ruido”de los datos. que medimos x(t) a tiempos largos. un modelo basado en las ecuaciones de la din´ mica dice que a 1 x = at 2 .995. Si los datos experimentales se analizan sobre el gr´ fico de escalas lineales. Hecho esto. N −2 r < x2 >. Un gr´ fico de Y = X 1.1 (variables sin correlaci´ n lineal) puede ı a a ajustarse por una recta y obtenerse a la vez un coeficiente de correlaci´ n lineal (inexistente) de. Precausiones en el an´ lisis a No siempre es suficiente admitir que dos variables siguen una relaci´ n lineal gui´ ndonos por lo que muestra o a un gr´ fico de los datos en escalas lineales. En la Figura est´ n los logaritmos de los mismos datos. Menos aun si s´ lo evaluamos el coeficiente de correlaci´ n del ajuste a o o o lineal que propondr´amos a partir de este gr´ fico.

o a 45 .Figura 3. (a) o A tiempos largos no se aprecia bien la curvatura de la curva y. podr´a suponerse que la correlaci´ n es lineal.7: Representaci´ n de x(t) para un cuerpo que se mueve con movimiento uniformemente acelerado. (b) log(x) en funci´ n de log(t). de donde ı o o se deduce que la relaci´ n no es lineal sino cuadr´ tica. dado que el coeficiente de correlaci´ n lineal es o muy cercano a la unidad.

Cap´tulo 4 ı

´ Analisis Combinatorio

4.1. Introducci´ n o
En ocasiones el trabajo de enumerar los posibles sucesos que ocurren en una situaci´ n dada se convierte en algo o dif´cil de lograr o, simplemente, tedioso. El an´ lisis combinatorio, o c´ lculo combinatorio, permite enumerar ı a a tales casos o sucesos y as´ obtener la probabilidad de eventos m´ s complejos. ı a En el caso de que existan m´ s de un suceso a observar, habr´a que contar el n´ mero de veces que pueden ocurrir a ı u todos los sucesos que se desean observar, para ello se utiliza el principio fundamental de conteo: Si un suceso se puede presentar de n1 formas, y otro se puede presentar de n2 formas, entonces el n´ mero de u formas en que ambos sucesos pueden presentarse en ese orden es de n1 n2 . En otras palabras, basta multiplicar el n´ mero de formas en que se pueden presentar cada uno de los sucesos a u observar. Este principio nos remite autom´ ticamente al factorial de un n´ mero natural, que se puede pensar como una a u funci´ n con dominio los n´ meros naturales junto con el cero y codominio los n´ meros naturales. El factorial de o u u un n´ mero n, denotado n!, se define como: u n! = n.(n − 1).(n − 2)..,2,1, = 1, si n = 0. si n > 0, (4.1)

Ahora, n es muy grande el proceso de c´ lculo se vuelve tedioso y muy cargado, incluso para una computadora, a por lo que se utiliza la aproximaci´ n de Stirling a n!: o n! ∼ √ 2n+1 2π n 2 e−n . (4.2) 46

donde e ∼ 2,71828..., que es la base de los logaritmos neperianos. En el an´ lisis combinatorio se definen las permutaciones, con o sin repetici´ n, y las combinaciones. a o

4.2. Permutaciones (u ordenaciones) con repetici´ n o
Las permutaciones son tambi´ n conocidas como ordenaciones, y de hecho toman este nombre porque son ordee r naciones de r objetos de n dados. En este curso las representaremos como Pn . Ejemplo: Sea A = {a, b, c, d}, ¿cu´ ntas ”palabras”de dos letras se pueden obtener?. Se pide formar pera mutaciones u ordenaciones de 2 letras, cuando el total de letras es 4. En este caso r = 2 y n = 4. Las ”palabras”formadas son: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd, da, db, dc, dd. En total son 16. En general, si se toman r objetos de n, la cantidad de permutaciones u ordenaciones con repetici´ n obtenidas o son: r (4.3) Pn = nr .

4.3. Permutaciones (u ordenaciones) sin repetici´ n o
En este caso, a diferencia del anterior, se realizan ordenaciones de r objetos de n dados atendiendo a la situaci´ n o de cada objeto en la ordenaci´ n. Su representaci´ n ser´ Pn . o o a r Ejemplo: Sea el mismo conjunto A = {a, b, c, d}, ¿cu´ ntas ordenaciones sin repetici´ n se pueden obtener? Lo a o que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12 en total. En general, si se toman r objetos de un total de n, la cantidad de permutaciones
r Pn =

n! . (n − r)!

(4.4)

4.4. Combinaciones
Es una selecci´ n de r objetos de n dados sin atender a la ordenaci´ n de los mismos. Es decir, es la obtenci´ n de o o o r subcojuntos, de r elementos cada uno, a partir de un conjunto inicial de n elementos. La denotaremos con Cn , n o k . ´ Ejemplo: Si tomamos el mismo conjunto A = {a, b, c, d}, ¿cu´ ntos subconjuntos de 2 elementos cada uno se a pueden obtener? Haci´ ndolos se obtienen: a,b, a,c, a,d, b,c, b,d, c,d. Son seis los subconjuntos. e

47

En general, si de n objetos dados se hacen combinaciones de r objetos cada una, el n´ mero de combinaciones u obtenidas son: n.(n − 1).(n − 1)...(n − r + 1) n n! r Cn = = = , (4.5) r! r!(n − r)! r o, que es lo mismo,
r Cn =

Pr n = n. r! r

(4.6)

4.5. An´ lisis y Metodolog´a propuesta para la resoluci´ n de problemas de Teor´a de a ı o ı conteo
Para resolver problemas b´ sicos y sencillos de teor´a de conteo basta con seguir el siguiente diagrama. a ı

Figura 4.1: Metodolog´a sencilla para la resoluci´ n de problemas. ı o

48

Cap´tulo 5 ı

Probabilidad

5.1. Introducci´ n: La probabilidad o
La palabra probabilidad no tiene una definici´ n consistente. De hecho, hay dos amplias categor´as de interpreo ı taciones de la probabilidad: los frecuentistas hablan de probabilidades s´ lo cuando se trata de experimentos o aleatorios bien definidos. La frecuencia relativa de ocurrencia del resultado de un experimento, cuando se repite el experimento, es una medida de la probabilidad de ese suceso aleatorio. Los bayesianos, no obstante, asignan las probabilidades a cualquier declaraci´ n, incluso cuando no implica un proceso aleatorio, como una manera o de representar su verosimilitud subjetiva. El estudio cient´fico de la probabilidad es un desarrollo moderno. Los juegos de azar muestran que ha habido un ı inter´ s en cuantificar las ideas de la probabilidad durante milenios, pero las descripciones matem´ ticas exactas e a de utilidad en estos problemas s´ lo surgieron mucho despu´ s. o e Seg´ n Richard Jeffrey, “Antes de la mitad del siglo XVII, el t´ rmino ’probable’ (en lat´n probable) significaba u e ı aprobable, y se aplicaba en ese sentido, un´vocamente, a la opini´ n y a la acci´ n. Una acci´ n u opini´ n probable ı o o o o era una que las personas sensatas emprender´an o mantendr´an, en las circunstancias.” [Ve´ se: Jeffrey, R.C., ı ı a Probability and the Art of Judgment, Cambridge University Press. (1992). pp. 54-55. ISBN 0-521-39459-7]. Dos aplicaciones principales de la teor´a de la probabilidad en el d´a a d´a son en el an´ lisis de riesgo y en ı ı ı a el comercio de los mercados de materias primas. Los gobiernos normalmente aplican m´ todos probabil´sticos e ı en regulaci´ n ambiental donde se les llama “an´ lisis de v´as de dispersi´ n”, y a menudo miden el bienestar o a ı o usando m´ todos que son estoc´ sticos por naturaleza, y escogen qu´ proyectos emprender bas´ ndose en an´ lisis e a e a a estad´sticos de su probable efecto en la poblaci´ n como un conjunto. No es correcto decir que la estad´stica ı o ı est´ incluida en el propio modelado, ya que t´picamente los an´ lisis de riesgo son para una unica vez y por lo a ı a ´ tanto requieren m´ s modelos de probabilidad fundamentales, por ej. “la probabilidad de otro 11-S”. Una ley de a n´ meros peque˜ os tiende a aplicarse a todas aquellas elecciones y percepciones del efecto de estas elecciones, u n lo que hace de las medidas probabil´sticas un tema pol´tico. ı ı

49

cuando la mec´ nica cu´ ntica es probabil´stica no por o a a ı el hecho de que siga procesos aleatorios sino por el hecho de no poder determinar con precisi´ n sus par´ metros o a 50 . el peso. utilizan la teor´a de la fiabilidad en el dise˜ o del o o ı n producto para reducir la probabilidad de aver´a. Por o consiguiente. entonces la probabilidad es o bien 100 % o 0 %. (Estoy convencido de que Dios no tira el dado). entonces el n´ mero donde la bola parar´ ser´ seguro. ı o a o y c´ mo contribuyen a la reputaci´ n y a las decisiones. La f´sica moderna proporciona o o ı ejemplos importantes de situaciones determin´sticas donde s´ lo la descripci´ n probabil´stica es factible debido ı o o ı a informaci´ n incompleta y la complejidad de un sistema as´ como ejemplos de fen´ menos realmente aleatorios. Por consiguiente. si la fuerza de la mano y el periodo de esta fuerza es conocido.que producen un efecto domin´ en la econom´a en conjunto. s´ lo puede ser descrita actuala a o o mente a trav´ s de distribuciones de probabilidad. Se puede decir razonablemente que el descubrimiento de m´ todos rigurosos para calcular y combinar los c´ lcue a los de probabilidad ha tenido un profundo efecto en la sociedad moderna. En el caso de una ruleta. Un c´ lculo por o o ı a un mercado de materias primas en que la guerra es m´ s probable en contra de menos probable probablemente a env´a los precios hacia arriba o hacia abajo e indica a otros comerciantes esa opini´ n. y o ı en la paz y en los conflictos. las proı o babilidades no se calculan independientemente y tampoco son necesariamente muy racionales. La mec´ nica cu´ ntica. lo que le da una gran importancia a las descripciones probae ˜ bil´sticas. Tambi´ n se puede decir que la probabilidad es la medida de nuestro grado de incertidumbre. Los f´sia ı cos se encuentran con la misma situaci´ n en la teor´a cin´ tica de los gases. basado en los conceptos newtonianos. especialmente en una democracia. si uno mira la primera carta y la reemplaza. donde el sistema determin´stico en o ı e ı principio. ı o ˜ ı daβ der Alte nicht wA¼rfelt. Muchos bienes de o ı consumo. debido al principio de indeterminaci´ n de Heisenberg. Una descripci´ n probabil´stica puede entonces ser m´ s pr´ ctica que ı o ı a a la mec´ nica newtoniana para analizar el modelo de las salidas de lanzamientos repetidos de la ruleta. en la pol´tica. puede ser de alguna importancia para la mayor´a de los ciudadanos entender c´ mo se c´ lculan los pron´ sticos y las probabilidades. ı e Se puede decir que no existe una cosa llamada probabilidad. Naturalmente.Un buen ejemplo es el efecto de la probabilidad percibida de cualquier conflicto generalizado sobre los precios del petr´ leo en Oriente Medio . no hay probabilidad si se conocen todas las condiciones. La teor´a de las ı finanzas conductuales surgi´ para describir el efecto de este pensamiento de grupo en el precio. las variaciones en la velocidad de la mano duo rante el movimiento y as´ sucesivamente. Albert Einstein coment´ estupendamente en una carta a Max Born: Jedenfalls bin ich A¼berzeugt. y la elecci´ n correcta puede ser hecha con precisi´ n por el que ve la carta. o o ı ı Otra aplicaci´ n significativa de la teor´a de la probabilidad en el d´a a d´a es en la fiabilidad. Sin embargo. Por consiguiente. o ı o En un universo determinista. esto tambi´ n supone el conocimiento de la inercia u a a e y la fricci´ n de la ruleta. como los autom´ viles y la electr´ nica de consumo. es tan complejo (con el n´ mero de mol´ culas t´picamente del orden de magnitud de la constante de u e ı o o ı Avogadro 6 × 1023) que s´ lo la descripci´ n estad´stica de sus propiedades es viable. lisura y redondez de la bola. o esto es. Mucha gente ı a e ı e hoy en d´a confunde el hecho de que la mec´ nica cu´ ntica se describe a trav´ s de distribuciones de probabilidad ı a a con la suposici´ n de que es por ello un proceso aleatorio. La probabilidad de aver´a tambi´ n est´ estrechamente relacioı ı e a nada con la garant´a del producto. puede haber una probabilidad de 1 entre 52 de que la primera carta en un baraja de cartas es la J de diamantes. No obstante hoy en d´a no existe un medio mejor para describir la f´sica cu´ ntica si no es a trav´ s de la teor´a de la probabilidad. el grado de nuestra ignorancia dada una situaci´ n.

5. 5. o Ejemplo: 40 % de chance de que llueva. La interpretaci´ n: Un 40 % de chance de que llueva significa que si nosotros miramos todos o los d´as con caracter´sticas similares. 3. pudiera cofeccionarse subconjuntos del universo de un evento y crear nuevos eventos. entonces de cada 100 d´as con estas condiciones. la medida de la probabiliudad es siempre una fracci´ n o decimal o indicando la porci´ n o porcetaje de la veces que un evento ocurre. sello} En el experimento de lanzar un dado.3. donde o ´ u equivale a una posibilidad nula de que el evento ocurra mientras que 1 representa el hecho de que evento va a ocurrir con toda seguridad.313.313) de todos los intentos al bateo. 2. la cantidad que la describe es siempre un n´ mero que se encuentra en un intervalo [0. lo que imposibilita la creaci´ n de un sistema de ecuaciones determinista. escoger un nombre de varios revueltos en un vaso. average de bateo de . 1]. 6} Desde ahora definiremos evento como cualquier colecci´ n de resultados de un espacio de eventos o universo. La probabilidad La probabilidad es una medida de la posibilidad de que un “evento ocurra. (Tomado de wikipedia. s´ lo 31 veces aproximadamente hace o un hit. Experimentos de Probabilidad Un experimento probabil´stico es cualquier proceso que produce un resultado o una observaci´ n y tiene por ı o finalidad de determinar posibilidades. Ejemplo: El universo de el experimento de lanzar una moneda tiene dos resultados: cara y sello. de cada 100 veces que batea. En otras palabras.313 significa que el jugado llegar´ a una base o har´ un hit en el 31. En vista de la caractrer´stica de ı esta medida. a 5. se tienen 6 posibles resultados. Ejemplo: Lanzar un dado o una moneda. 51 . o es decir. 4. o busque “probabilidad”). as´: ı S = {1. la probabilidad de obtener un royal flush en poker es 1:649740.fundamentales. as´ podemos ı escribir: S = {cara. A este conjunto de valores que puede tomar una variable se le denomina espacio muestral. sacar una carta de un mazo. 40 de ellos ser´ n d´as ı ı ı a ı con lluvia.2. un porcentaje de bateo de .3 % a a (. Cuando se realiza un experimento. es decir. se obtienen un conjunto de valores. dram´ ticamente se tendr´ que si uno quiere obtener un royal flush en una partida de poker. entonces a a quiz´ s tenga que esperar hasta 649740 manos para obtener uno.

Si existe este tipo de relaci´ n entre eventos se dice que son eventos dependientes o o 52 P = {Resultados pares} = {2. en ocasiones un evento o m´ s eventos dependen de otro evento previo. ı Cuando hablamos de varios eventos dentro del mismo experimento se pueden dar varios casos. que la ina tersecci´ n de ambos eventos es vac´a. Ejemplo: Si P es el evento descrito anteriormente de obtener los n´ meros pares en el lanzamiento de un dado. si u ı el n´ mero mostrado es 1. se define como experimento aleatorio al proceso o en el que se pueden predecir con certeza la ocurrencia de sus eventos. Sin embargo. y en cambio existen otros que nunca ocurren. es decir. 3. y si este ´ consta de un solo elemento entonces es un evento elemental. e Un evento E para un experimento se dice que ocurre si y s´ lo si el resultado de el experimento es uno de los o que pertenecen a E. a un experimento no aleatorio se le denomina experimento determin´stico. uno podr´a invenı ı ı tar nuevos eventos. los resultados posibles de sacar un rey. Por esta raz´ n. no importa el n´ mero de experimentos o su situau ci´ n. el rey de corazones. as´ ı u ı I = {Resultados impares} = {1. u entonces si al lanzar el dado el n´ mero mostrado es un 4. existen eventos que siempre. un evento A ocurre a dado que ocurri´ un evento B. Ejemplo: En el caso de el experimento de lanzar un dado. o Hay que hacer la observaci´ n que esta definici´ n habla en t´ rminos generales y no espec´ficamente sobre alg´ n o o e ı u experimento en particular. u Como se puede uno imaginar. o ı Por otro lado. se llaman eventos mutuamente excluyentes. es decir. el espacio muestral est´ formado por las combinaciones de valores de cada una a a de las variables. As´ mismo podr´an confeccionarse eventos en el experimento de sacar una carta de un mazo. por ejemplo. uno podr´a definir dos nuevos eventos del universo ı tomando algunos que tienen una caracter´stica com´ n. 4. pues si un experimento es cualquier proceso entonces los resultados pueden tomar cualquier tipo de valor. con excepci´ n del seguro o del imposible. . Si dos o m´ s a eventos no pueden ocurrir simult´ neamente. En cama bio. 6}.Si existen m´ s de una variable. no todos los resultados son al azar. entonces uno podr´a decir que el evento P ocurre. Si tomamos un subconjunto cualquiera del espacio muestral tenemos lo que se denomina un evento. el rey de picas. tiene cuatro resultados correspondientes con los cuatro reyes de los cuatro distintos tipos de dibujo que tienen las cartas. o bien. ocurren. A aquella variable que est´ asociada a un experimento de este tipo se le denomina variable aleatoria. entonces uno debe decir que el evento P no ocurre. Los que siempre ocurren son los eventos seguros. el rey de espadas y el rey de tr´ boles. o y los que nunca son los eventos imposibles. 5}.

Un evento E es llamado evento imposible si ocurre que P(E) = 0. la frecuencia relativa de ocurrencia para cada evento tiende a un valor fijo. o el resultado del evento A est´ condicionado al resultado a del evento B). pero ı o ı a proporciona probabilidades aproximadas. si no existe tal relaci´ n entre eventos se dice que son eventos independientes. se tiene que 0 ≤ P(E) ≤ 1.1) Ejemplo: Digamos que la siguiente tabla representa las notas que obtienen en un ex´ mnen en base a 100 a puntos un grupo de estudiantes: Notas Numero de estudiantes ´ 90-99 4 80-90 6 70-79 4 60-69 3 50-59 2 40-49 1 53 . y calculando que porcentaje de las veces sale 7.4. Esta definici´ n ser´a la m´ s real. Por ejemplo. Algunas caracter´sticas exibe esta formulaci´ n: ı o Para un evento E. uno podr´a calcular la probabilidad de obtener una suma de 7 cuando dos dados son lanzados muı ı e ı chas veces. n´ mero de intentos totales u (5. 5. en t´ rminos de probabilidad condicional. Calculando la probabilidad de un evento Para calcular la probabilidad de eventos es necesario que estos se comporten de una manera m´ s o menos esta´ a ble.1. a a e 5. o La probabilidad de un evento E es denotada por P(E) y siempre representa la fracci´ n o porcentaje de ocurrencia de que E ocurra. Probabilidad Emp´rica ı Tambi´ n llamada la probabilidad frecuencial de un evento es el valor fijo al que tienden las frecuencias relae tivas de ocurrencia del evento de acuerdo a la regularidad estad´stica. Los o criterios de dependencia o de independencia se definir´ n m´ s adelante. ı Para calcular la probabilidad de esta manera podr´a usarse la siguiente f´ rmula: ı o P(E) = n´ mero de intentos en los que ocurre E u . los a resultados son a posteriori. que es la propiedad de los fen´ menos aleatorios. Por otro lado. pues se necesita realizar el experimento para poder obtenerlo. Adem´ s. Un evento E es llamado evento cierto si ocurre que P(E) = 1.4. La probabilidad P(E) puede ser calculada de dos modos distintos. proporciona estimaciones y no valores reales.o condicionados (el evento A depende del evento B. digamos 100 veces. es decir. As´ mismo tambi´ n se podr´a calcular la probabilidad de que un jugador de basketball anote una cesta libre de tablerocalculando el porcentaje de las veces que lo ha hecho en el pasado con estad´sticas anteriores. ı o y que consiste en que al aumentar el n´ mero de repeticiones de un experimento en condiciones pr´ cticamente u a constantes. se echa mano de la regularidad estad´stica. Precisamente.

6 Note que para el c´ lculo de la probabilidad desde esta perspectiva cl´ sica no es necesario de ninguna manera a ´ a que se tenga que confeccionar y realizar el experimento. es decir que no ocurren simult´ neamente. la probabilidad de sacar un ex´ men al azar y que sea una nota entre 90 y 99 puntos ser´ : a a P(A) = cantidad de estudiantes que obtienen notas entre 90 y 99 puntos 4 = = 0. Vasta.20. entonces la frea cuencia relativa de su uni´ n es la suma de las frecuencias relativas de cada uno. Si dos eventos son mutuamente excluyentes. 5.2) n´ mero de eventos elementales que componen el espacio muestral u Es la definici´ n m´ s utilizada porque supone de antemano. Axiomas de la probabilidad Recordemos primero que las frecuencias relativas de una distribuci´ n ten´an las siguientes propiedades: o ı Las frecuencias relativas son mayores o iguales que cero. 2 En el caso del ejemplo en el que uno lanza un dado. Ejemplo: Cuando se lanza una moneda.2. entonces se tendr´ a 1 P(sale 1) = P(sale 5) = . entre el n´ mero de eventos elementales que componen el espacio u muestral: n´ mero de eventos elementales que componen al evento E u P(E) = .4. La probabilidad de que salga una cara al lanzar la moneda ser´ a 1 P(A) = P(B) = P(cara) = P(sello) = . y se necesita como requisito indispensable.Si el evento A es evento en el que un estudiante obtiene entre 90 y 99 puntos. La frecuencia relativa del espacio muestral es igual a la unidad. por su puesto. que todos o a los eventos elementales tienen la misma probabilidad de ocurrir. que denotaremos por P(E). se define como el n´ mero de eventos a u elementales que componen al evento E. cantidad total de estudiantes 20 5. Probabilidad cl´ sica a La probabilidad cl´ sica de un evento E. o 54 .5. (5. se obtienen dos resultados posibles: cara o sello. que uno tenga pleno conocimiento de el espacio muestral y sus respectivos resultados. como se ve. Digamos que el evento que salga cara lo denotamos por A y a la de sello B.

es la frecuencia o relativa cuando se aumenta el tama˜ o de la muestra. son eventos mutuamente excluyentes. entonces n P(E1 ∪ E2 ∪ . o Esto quiere decir que si la probabilidad de que un evento ocurra es p. u Se le llama a E evento seguro a un evento cuando P(E) = 1. la posibilidad de ganar la apuesta es de 3 0. 4. n Si E es un evento de un espacio muestral S y P(E) es la probabilidad de E. sin embargo. En prino o o cipio pareciera l´ gico que uno pudiera definir la probabilidad en t´ rmino de las posibilidades de que un evento o e ocurra.4) y 1− p de tal manera que x y y son n´ meros enteros.Tomando en cuenta que la probabilidad de un evento... u Ejemplo: Si se tiran dos monedas normales (no trucadas). La probabilidad de un evento E. La principal motivaci´ n de esta secci´ n es hacer una diferenciaci´ n de estas dos cosas. E2 . 2. i=1 n (5. En . de acuerdo a la definici´ n ya expuesta. la probabilidad de que las dos monedas caigan 1 a cara es de 4 . 5... (5. se tienen lo siguiente. a Si E1 . hablando en t´ rminos generales. P(S) = 1. ´ a en el sentido matem´ tico de la palabra.25 1 1− 3 4 55 . Cuando uno habla de esa manera es inebitable pensar en que tal frase est´ ligada de alguna manera a razones. entonces las posibilidades de que ocurra son x a y. por ejemplo. Esto quiere decir si alguien apuesta a que las dos monedas no caen simult´ neamente en cara. la posibilidad de que ocurra un evento se determina a mediante la raz´ n de la probabilidad de que ocurra a la probabilidad de que no ocurra. entonces se satisfacen los axiomas de la probabilidad: 1. si x p = . Por otro lado..75 3 4 = = . Efectivamente. es un n´ mero siempre entre 0 y 1. La probabilidad del universo es la m´ xima. ∪ En ) = P Ei i=1 = ∑ P(Ei ). 0 ≤ P(E) ≤ 1. 0. Posibilidades y probabilidades En los escrito anteriormente hemos utilizada indistintamente en algunos momentos las palabras posibilidad y probabilidad. es decir. “la posibilidad de que gane es de 3 a 1”.3) Con estos axiomas podremos tratar algunas de las propiedades de la probabilidad de eventos. se le llama evento imposible si P(E) = 0.. la palabra posibilidad proviene de referirse a ciertos juee gos de apuestas en las que se utiliza la frase: “la posibilidad de ganar es de x a y”. 3.6.

5) p= x+y Ejemplo: En la Copa Mundial de Futbol Francia 1998 se dec´a que el equipo mexicano ten´a una posibilidad ı ı de 1 a 75 de llegar a ser el campe´ n del torneo. de paumente = 5 5 1 1 7 7 = . Pero en el caso de eventos no eleo a mentales. o 5. pigual = = . Las probabilidades de que ı a aumente la cantidad de delitos. entonces se acostumbra mencionar las posibilidades en contra del evento. Propiedades de la probabilidad de eventos no elementales Cuando se tienen eventos elementales no existe mucho problema en el sentido del c´ lculo de las probabilidades. medir la cono fiabilidad que tienen las opiniones de las personas sobre las posibilidades que le asignan a algunos eventos. entonces la probabilidad p de que ocurra tal evento es x . Esto quiere decir que el c´ lculo de las probabilidades de dos eventos mutuamente excluyentes a partir de las a posibilidades otorgadas de manera subjetiva resulta como un criterio de consistencia. entonces es f´ cil obtener su probabilidad. entonces se tiene que o p= 1 1 x = = = 0. entonces los criterios 5 y dado que 7 + 1 = 27 (como son eventos mutuamente excluyentes) no es lo mismo que 4 28 del crimin´ logo pueden ser cuestionados. de que sea la misma cantidad de delitos es de 1 a 3 y las posibilidades de que aumente la cantidad o sea la misma es de 7 a 4. x + y 1 + 75 76 es la probabilidad de que ocurriese el evento. (5. que son los compuestos por m´ s de un evento elemental. 5+2 7 1+3 4 7 + 4 11 7 11 . Inversamente. Esto tiene la ventaja de que permite.01311. respectivamente. el proceder de manera an´ loga resulta muy a a 56 . en combinaci´ n con el tercer axioma de la probabilidad. Si se desea saber si son consistentes las probabilidades correspondientes habr´a que hacer los c´ lculos. de no obtener un cuatro es de 6 a 1. sabemos que la probabilidad de obtener un cuatro es 6 .7. y de que aumente o sea igual la cantidad de delitos es. Si se desea encontrar la probabilidad de que el equipo mexicano o llegase a ser campe´ n. pues a si la posibilidad de un evento es de x a y. a pues basta con una contabilizaci´ n o el uso directo del c´ lculo combinatorio. esto es. es decir que la posibilidad de obtener un cuatro es de 1 a 6. paumente = = . que sea igual la cantidad de delitos. pero se acostumbra decir que las posibilidades en contra. Hemos de considerar que si es mayor la probabilidad de que no ocurra un evento.es decir. en el caso de tener las posibilidades de un evento. la posibilidad de ganar la apuesta es de 3 a 1. Ejemplo: Un crimin´ logo piensa que las posibilidades de que en la pr´ xima semana la cantidad de delitos o o en una ciudad aumente con respecto a la anterior es de 5 a 2. 1 Ejemplo: Si se tira un dado no trucado.

si el caso es que los eventos sean mutuamente excluyentes se tiene: Propiedad 2. que denotaremos como E: ¯ Propiedad 3.8. o Ejemplo: Consideremos el experimento de “lanzar un dado al aire”. por o ejemplo. Si dos eventos. o a ı o Definici´ n. Otra propiedad que se deriva de las anteriores es cuando se busca la probabilidad del complemento de un ¯ evento E. Es decir P(A ∪ B) = P(A) + P(B). la probabilidad de extraer. se llama probabilidad de B condicionada a A. por lo que no hay que confundir P(A|B) y P(B|A). la bola n´ mero 3 en la segunda extracci´ n es la misma que en la primera. Propiedad 1. la cual la podremos calcular de la siguiente manera: o 1. utilizando los a axiomas de la probabilidad y las siguientes propiedades. Sean A y B dos sucesos tal que P(A) 0. es decir. (5.7) 3. Probabilidad condicionada En el c´ lculo de las probabilidades de algunos sucesos. Si realizamos el mismo prou o ceso sin reemplazar la bola extra´da la probabilidad de extraer. menos la probabilidad de que ocurran A y B simult´ neamente. la probabilidad de que ocurra B dado que ha sucedido A. La probabilidad de que ocurra un evento A dado que ocurri´ el evento B (el evento A depende del o evento B) es: P(A ∩ B) .6) 2. la probabilidad de que ocurra A o B es igual a la suma de las probabilidades de ocurrencia de A y de B. A y B. Calculemos. situaci´ n que s´ ocurre con la probabilidad de uni´ n o la o ı o intersecci´ n de eventos. (5. por ejemplo. entonces ¯ P(E) = 1 − P(E). son mutuamente excluyentes entonces la probabilidad de que ocurra A o B es igual a la suma de las probabilidades de ocurrencia de A y de B.8) 5. Ahora. Si A y B son dos eventos. (5. la bola n´ mero 3 en la segunda ı u extracci´ n depender´ de la bola extra´da en primer lugar. la probabilidad 57 . el valor de dicha probabilidad var´ en funci´ n del conoa a o cimiento de determinadas informaciones relativas a estos sucesos. P(B|A). se podr´ n expresar las probabilidades de estos eventos a en t´ rminos de los eventos elementales que lo componen.complejo y las operaciones pueden sobrepasar la capacidad de c´ lculo existente. siempre y cuando se conozcan las probabilidades de e estos. por ejemplo. Ejemplo: Si disponemos de una urna que contiene cuatro bolas numeradas del 1 al 4. ´ Veamos la probabilidad de una uni´ n de eventos. P(A ∪ B) = P(A) + P(B) − P(A ∩ B) (5. a la probabilidad de B tomando como espacio muestral A. Si E es un evento y E su complemento. extraemos una bola y seguidamente la volvemos a introducir para realizar una segunda extracci´ n. a Es decir. Sin embargo.9) P(A|B) = P(B) Hay que notar que esta propiedad no es conmutativa.

el criterio para la independencia de eventos queda como sigue: Definici´ n.9. An un sistema completo de sucesos. P(B) P(A1 )P(B|A1 ) + P(A2)P(B|A2 ) + . 3. o El conocimiento de que ha ocurrido el suceso A modifica.. no se modifica la probabilidad del otro. + P(An)P(B|An ) (5.. ı Finalmente. la probabilidad del suceso B. la determinaci´ n de la probabilidad de las causas a partir de los efectos que han o podido ser observados.1. por vez primera. u entonces. Teorema de la probabilidad total Sea A1 . los casos posibles ahora son 3 u y los casos favorables al suceso A s´ lo 1. A2 .. o i=1 5.10. . entonces la probabilidad del suceso B viene dada por la expresi´ n: o P(B) = P(A1 )P(B|A1 ) + P(A2 )P(B|A2 ) + . decimos que son dependientes entre s´.. .. dos a˜ os despu´ s de la muerte de Thomas Bayes (1702-1761).. decimos que son independientes y. P(A|B) = P(A)P(B). (5.. P(A|B) = 1/3.12) 5.11) P(B|A) = P(B). An un sistema completo de sucesos tales que la probabilidad de cada uno de ellos es distinta de cero.13) 58 . si se modifica. 5}. (5.. a Sea A1 .de obtener un 3 sabiendo que ha salido un n´ mero impar. Ai ∩ A j = φ .10) 5.9. en algunas ocasiones. pero en otras no. Probabilidad total Llamamos sistema completo de sucesos a una familia de sucesos A1 . puesto que si sabemos que ha salido un n´ mero impar. . o. La uni´ n de todos ellos es el suceso seguro. Los sucesos en los que. n Ai = S. + P(An)P(B|An ). se public´ una memoria en la n n e o que aparece.. y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B|Ai ). A2 . conociendo que uno ha ocurrido... entonces la probabilidad P(Ai |B) viene dada por la expresi´ n: o P(Ai |B) = P(Ai )P(B|Ai ) P(Ai )P(B|Ai ) = . El c´ lculo de dichas probabilidades recibe el nombre de teorema de Bayes. lo que es lo mismo. y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B|Ai ). An que cumplen: Son incompatibles dos a dos. (5. Teorema de Bayes En el a˜ o 1763.. tales que la probabilidad de cada uno de ellos es distinta de cero. Definimos los sucesos A = {sacar 3} y B = {1. Dos eventos A y B son independientes si y s´ lo si o o P(A|B) = P(A). A2 ..

(a) ¿Son independientes a los sucesos aprobar la parte te´ rica y la parte pr´ ctica? (b) ¿Cu´ l es la probabilidad de que un alumno no o a a apruebe ninguno de los dos ex´ menes? (c) ¿Cu´ l es la probabilidad de que un alumno apruebe solamente a a uno de los dos ex´ menes? (d) Se sabe que un alumno aprob´ la teor´a. ¿Cu´ l es la probabilidad de que los tres u a n´ meros sean distintos? u Tenemos un dado con tres “1”. 8 medios. la probabilidad de que sean blancas es 1/2. En cada uno de o los problemas pudiera usarse todo lo reflejado en estas notas. o a 1000 unidades en la segunda y 2000 en la tercera. Se sabe adem´ s a que el 20 % de los votantes de A. 7. 4. (a) ¿Cu´ l es la probabilidad de obtener un “1”? (b) a Sabiendo que se ha obtenido un “2”. Resultan fallidos el 20 % de los cr´ ditos para vivienda. Problemas de final de cap´tulo ı A continuaci´ n una serie de problemas de repaso y estudio para fijar los conceptos anteriores. (a) Se toman dos cartas sin reemplazamiento. n Los alumnos de Primero de Biolog´a tienen que realizar dos pruebas. 6 delanteros y 2 porteros. El entrenador sabe que u en estos partidos. Calcula el n´ mero de bolas blancas que debe tener la caja. e e El volumen de producci´ n en tres plantas diferentes de una f´ brica es de 500 unidades en la primera. Se elige un dado al azar y se tira. (b) Si se sabe que un jugador se ha lesionado. 0. el 45 % vota al partido B y el resto se abstiene. determinar la probabilidad de que haya sido un defensa. el 50 % para industrias y el 15 % para consumo e diverso.055 si es defensa y 0 si es portero. Con los jugadores de un club de f´ tbol se forman dos equipos para jugar un partido de entrenamiento. 5. Sabiendo que el porcentaje de unidades defectuosas producidas en cada planta es del 1 %. dos “2” y un “3”. ambos trucados. 3. Tras un estudio estad´stico en una ciudad se observa que el 70 % de los motoristas son varones y. El 75 % de los ingenieros ocupan un puesto directivo y el 50 % de los economistas tambi´ n. la probabilidad de que se lesione un jugador es 0. La ı o a probabilidad de que un estudiante apruebe la parte te´ rica es de 0. 11. 10.8 y la probabilidad de que apruebe ambas pruebas es 0. u El 35 % de los cr´ ditos de un banco es para vivienda. n n (b) Hallar la probabilidad de que un ciudadano mayor de 60 a˜ os se haya abstenido. mientras que de los no e 59 2. En el dado A hay tres “1” y tres “2” y en el dado B hay dos “1” y cuatro “2”. Al extraer de la caja dos bolas al azar sin reemplazamiento. (a) ¿Cu´ l es el Espacio Muestral? (b) ¿Cu´ l es la probabilidad de que la suma sea 4? a a (c) ¿Cu´ l es la suma m´ s probable? ¿Cu´ nto vale su probabilidad? a a a Tenemos dos dados A y B. El porcentaje de mujeres que conducen habitualmente con casco es del 40 %. ¿Cu´ l es la probabilidad de que se haya elegido el dado B? a En una caja hay x bolas blancas y 1 bola roja. una te´ rica y otra pr´ ctica. Calcula la probabilidad de que se pague un cr´ dito elegido al azar.5. 6. 9. Lo tiramos dos veces consecutivas y anotamos la suma de los resultados. o 1. calcula la probabilidad de que al seleccionar una unidad al azar sea defectuosa.11 si es medio.5. ı el 60 % llevan habitualmente casco. (b) Se elige un motorista al azar y se observa que lleva casco. respectivamente. la probabilidad de que apruebe la o parte pr´ ctica es de 0. Se pide: (a) Hallar la probabilidad de que un ciudadano elegido al azar sea mayor de 60 a˜ os. el 15 % de los cr´ ditos para industrias y e e el 70 % de los cr´ ditos para consumo. son mayores de 60 a˜ os. 0. u entre los dos equipos se re´ nen 6 defensas. 8. el 35 % vota al partido A.11.8 % y 2 %. Se pide: (a) Calcular la probabilidad de que un motorista elegido al azar lleve casco. 0.6. ¿Cu´ l es la probabilidad de que a las dos sean de distinto n´ mero? (b) Y si se toman tres cartas. El 20 % de los empleados de una empresa son ingenieros y otro 20 % son economistas. ¿Cu´ l es la probabilidad de que sea var´ n? a o En una ciudad. el 30 % de los de B y el 15 % de los que se abstienen. ¿Cu´ l es la probabilidad de que a o ı a apruebe tambi´ n la pr´ ctica? e a En una baraja de 40 cartas.22 si es delantero. . de estos. as´ como tambi´ n cualquier herramienta compuı e tacional o tecnol´ gica disponible. (a) Calcular la probabilidad de que se lesione uno cualquiera de los jugadores en este partido.

(b) Calc´ lese P(A ∪ B). 18. puede hacerlo por las calles A. 14. A continuaci´ n. Halla: (a) La probabilidad de que la bola extraida sea blanca y de la urna II. 15 respectivamente. 17. el 80 % supera las 600 BsF. Se extrae al azar una carta de la primera baraja y se introduce n en la segunda baraja. 4 o 6. ¿cu´ l es la probabilidad de que haya sido en la calle A? o o a De una urna con 4 bolas blancas y 2 negras se extraen al azar. 21. Se mezclan las cartas de esta segunda baraja y se extrae una carta. Otra contiene cuatro monedas de plata y tres de cobre. Justificar la respuesta. En una ciudad el 55 % de los habitantes consume pan integral. (b) La probabilidad de que la bola extraida sea negra. Si la carta extraida es un rey. 6 y p(C) = 0. ¿cu´ l es la probaa bilidad de que coma pan de multicereales? (II) Sabiendo que un habitante consume pan de multicereales. Una experiencia aleatoria consiste en preguntar a tres personas distintas. ı Un dado est´ trucado de manera que son iguales las probabilidades de obtener 2. (a) Elegido un ticket de compra al azar. 6. 25. B o C. (a) Escribe el espacio muestral asociado a dicho experimento. 13. e a Un ladr´ n. que resulta ser el dos de oros. 7. en caso contrario a la urna II. 5 y P(Ac ∪Bc ) = 0. utilizando la letra ”s”para las respuestas afirmativas y ”n”para las negativas. 22. ¿cu´ l es la probabilidad de que supere las 600 BsF? (b) a Si se sabe que el ticket de compra no supera las 600 BsF ¿cu´ l es la probabilidad de que la compra haya a sido hecha por una mujer? Se extrae una carta de una baraja espa˜ ola de 40 cartas. 60 .al menos dos de las personas son partidarias de consumir el producto¿ (c) Describe el suceso contrario de ”m´ s de una persona es partidaria de consumir el producto” a En un supermercado el 70 % de las compras las realizan las mujeres. 20. tambi´ n son a e iguales las probabilidades de obtener 1. el 30 % consume pan de multicereales y el 20 % consume ambos. P(B) = 0.12. Si se elige una urna al azar y se extrae una moneda al azar. (b) Si el ladr´ n ha sido alcanzado. 3 o 5 y la probabilidad de obtener 2 es doble que la probabilidad de sacar 1. 19. extraemos una bola. Una urna contiene dos monedas de plata y tres de cobre. a e (a) ¿Son independientes los sucesos estudiar alem´ n y estudiar franc´ s?. si son partidarias o no de consumir un determinado producto. dos bolas. ¿Cu´ l es la probabilidad de a que un empleado directivo elegido al azar sea ingeniero? Se toman dos barajas espa˜ olas de 40 cartas. al huir de un polic´a. nos dirigimos a la n urna I. o ı p(B) = 0. ¿Cu´ l es la probabilidad de que la primera carta extra´da fuese una espada? a ı En un conjunto de estudiantes el 15 % estudia alem´ n. (b) ¿Qu´ elementos del ese pacio muestral anterior constituyen el suceso . (a) Calcule la probabilidad de que la polic´a alcance ı al ladr´ n. con probabilidades p(A) = 0. sucesivamente y sin reemplazamiento. Deducir razonadamente cu´ l es la probabilidad de que al lanzar el dado dos veces se obtenga a una suma igual a 7. Se pide: (I) Sabiendo que un habitante consume pan integral. calcule la probabilidad de que no estudie franc´ s ni alem´ n.6. La probabilidad de ser alcanzado por la calle es 0. el 30 % estudia franc´ s y el 10 % ambas materias. u o u En un estudio realizado en cierta Universidad se ha determinado que un 20 % de sus estudiantes no utilizan los transportes p´ blicos para acudir a sus clases y que un 65 % de los estudiantes que utilizan u los transportes p´ blicos tambi´ n hacen uso del comedor universitario. Calcular la probabilidad de que u e seleccionado al azar un estudiante en esa Universidad resulte ser usuario de los transportes p´ blicos y del u comedor universitario. (a) Calc´ lese P(A ∩ B) y raz´ nese si los sucesos A y B son independientes.4 si huye por la calle B es 0. mientras que de las compras realizadas por hombres s´ lo el 30 % supera esa o cantidad.5 y si huye por la calle C es 0. de las compras realizadas por estas. ¿cu´ l es la probabilidad de que la primera tambi´ n lo haya sido? a e Sean A y B dos sucesos de un experimento aleatorio tales que: P(A) = 0. 15. 23. ¿Cu´ l es la probabilidad de que la a moneda extra´da sea de plata?. 16. El contenido de la urna I es de o 7 bolas blancas y 5 negras y el de la urna II es de 6 bolas blancas y 4 negras. elegidas al azar. ingenieros y no economistas solamente el 20 % ocupan un puesto directivo. (a) ¿Cu´ l es la probabilidad de que las bolas extraidas sean blancas? (b) Si la segunda bola ha a resultado ser negra. (b) Si se elige un estudiante al a e azar.

La a unica condici´ n exigida es que cada una tenga al menos una bola. entonces e e en el tiempo t=2 cada uno de sus dos descendientes puede tambi´ n subdividirse o morir. 34. pero tambi´ n da positivo en el 5 % de personas sanas. ¿cu´ l es la probabilidad de que los tres sean del partido A? ¿y la de que pertenezcan a a 61 . 31. a un hombre. calcula la probabilidad de que no suceda ninguno de los dos. s´ lo un a o 10 % obtienen beneficios. Se desea saber como debo distribuir las bolas en las urnas para que. sea m´ xima la probabilidad de obtener una bola blanca. independientemente uno de otro. ¿Qu´ porcentaje de empleados no asturianos o e son mujeres? (a) Calcula la probabilidad de que un empleado de la oficina sea mujer. e Dos personas piensan cada una de ellas un n´ mero del 0 al 9. 33. En una Universidad existen tres facultades: A. dos bolas blancas y dos bolas negras. ´ o Se estima que s´ lo un 20 % de los que compran acciones en Bolsa tienen conocimientos burs´ tiles. 35.4 y 0. (a) Calcula la probabilidad de que un estudiante. 150 chicas y 150 chicos. selecciona a una mujer y si sale cruz. 4 del B y 1 del C. Se extraen dos bolas consecutivamente de la caja. ¿Cu´ l es la probabilidad de e a que est´ sana una persona a la que el procedimiento le ha dado positivo? e En un ayuntamiento hay 5 concejales del partido A. ¿Cu´ l es la probabilidad de que al menos uno de a los discos haya sido guardado en el envoltorio que le correspond´a? ı Se considera una c´ lula en el instante t=0. al elegir una urna al azar. 2 4 Tengo dos urnas. 26. Si se eligen al azar y sucesivamente tres concejales. 25. sea chico. Sabiendo que 5 mujeres y 3 hombres del equipo directivo no hablan ingl´ s. De o a ellos el 80 % obtienen beneficios. ¿cu´ l es la probabilidad de que tenga conocimientos burs´ tiles? a a El equipo directivo de cierta empresa del sector de hosteler´a est´ constituido por 25 personas de las que ı a un 60 % son mujeres. s´ lo son hombres el 20 %. De los que compran acciones sin conocimientos burs´ tiles. en B. (a) ¿Cu´ ntas c´ lulas es posible que haya en el a e tiempo t=2? (b) ¿Con qu´ probabilidad? e Una caja contiene 10 bolas blancas. 28. ¿Cu´ l es la probabilidad de que sea asturiano? a El 12 % de los habitantes de un pa´s padece cierta enfermedad. P(B) = 1 y P(A ∩ B) = 1 . Calcula la probabilidad de que las dos u personas no piensen el mismo n´ mero. justificando la respuesta. ¿cu´ l es su a facultad m´ s probable? a Se escuchan tres discos y se vuelven a guardar al azar. la probabilidad de que la persona seleccionada hable ingl´ s. Para el diagn´ stico de esta. con las mismas e probabilidades que antes. 32. Sabiendo que son independientes. Un monedero contiene 2 monedas de plata y 3 de cobre. Si se elige un monedero al azar y se extrae una moneda ¿Cu´ l es la probabilidad de que sea de plata? a En una oficina el 70 % de los empleados son asturianos.24. 300 chicas y 200 chicos. El gerente tiene que seleccionar a una persona de dicho equipo para que represente a la empresa en un certamen internacional. ¿cu´ l es la probabilidad de que no consume pan integral? (III) ¿Cu´ l es la probabilidad de que una persona a a de esa ciudad no consuma ninguno de los dos tipos de pan? 3 Si A y B son dos sucesos tales que: P(A) = 8 . (b) Fernando trabaja en dicha oficina. De entre los asturianos. el 50 % son hombres. o bien morir con probabilidad 1/4. (b) Si un estudiante elegido al azar resultara ser chico. (b) Si se elige al azar una persona que ha comprado acciones en Bolsa y resulta que ha obtenido beneficios. 30. B y C. y otro contiene 4 de plata y 3 de cobre. divie e di´ ndose en dos. Se desea saber: (a) El tanto por ciento de los que compran acciones en Bolsa que obtienen beneficios. 29. elegido al azar. Calcula P(Ac ∩ Bc ). (b) La segunda bola se extrae sin haber metido la primera en la caja. 27. u Dos sucesos tienen probabilidades 0. 5 negras y 5 rojas. mientras que de los no asturianos. Calcula la probabilidad de que las dos sean blancas si: (a) Antes de extraer la segunda bola se vuelve a meter la primera en la caja. y en C. se dispone de ı o un procedimiento que no es completamente fiable ya que da positivo en el 90 % de los casos de personas realmente enfermas. e determina. En A hay matriculadas 150 chicas y 50 chicos. con probabilidad 3/4. Decide lanzar una moneda: si sale cara. 37. 36. Si la c´ lula se divide.5. En el intante t=1 la c´ lula puede: bien reproducirse.

al menos. u u se lanza un dado no trucado.38. partidos distintos? Un dado ha sido trucado de manera que la probabilidad de sacar un n´ mero par es el doble que la de sacar u un n´ mero impar. u 62 . a la vez. la probabilidad de obtener. se lanza un dado no trucado. un n´ mero impar. la probabilidad de obtener un n´ mero par y un n´ mero impar. (b) Si. Se lanza el dado y se pide: La probabilidad de obtener un n´ mero par (a) Si. a la u u vez.

etc. en situaciones tales como: o e ˆ el diagn´ stico de un paciente ”sano. o a En este tema se introduce el concepto de variable aleatoria y se estudian los distintos tipos de variables aleatorias a un nivel muy general. a a a ı As´ retomaremos el concepto de distribuci´ n y las caracter´sticas num´ ricas. las respuestas o son usualmente codificadas con 0 y 1. Por tanto. El papel ı o ı e que all´ jugaba la frecuencia relativa lo juega ahora la probabilidad. preguntas del tipo A¿estudias o trabajas?. aunque en realidad podr´a emplearse cualquier pareja de s´mbolos con ı ı igual precisi´ n.Cap´tulo 6 ı ´ Variable aleatoria y funcion de ´ distribucion 6. Incluso en problemas de u o naturaleza puramente cualitativa es muy frecuente recurrir a la codificaci´ n num´ rica.1. etc.enfermo”. Tanto en la vida cotidiana como en el campo cient´fico estamos habituados a observar fen´ menos aleatorios ı o cuyos resultados se expresan mediante n´ meros.o . por ejemplo el voltaje de salida en una fuente de alimentaci´ n. o 63 . u o el n´ mero de personas en la cola del cine. Algunos e ejemplos son: n´ mero de caras obtenidas al lanzar seis veces una moneda. una a e o variable aleatoria es un valor num´ rico que corresponde a un resultado de un experimento aleatorio. Introducci´ n o En este tema se tratar´ de formalizar num´ ricamente los resultados de un fen´ meno aleatorio. Esto va a proporcionar aspectos y propieı dades referentes a fen´ menos aleatorios que permitir´ n modelos muy estudiados en la actualidad. etc. como la media y varianza. lo que nos permitir´ manejar los modelos estad´sticos para describir los posibles a ı resultados de un experimento aleatorio y asignar probabilidades a los diferentes sucesos que nos interesen. e e El estudio que se har´ en este tema ser´ an´ logo al que se hace con las variables estad´sticas en descriptiva. n´ mero de llamadas que recibe un u u tel´ fono durante una hora. tiempo de fallo de una componente el´ ctrica. la velocidad de conexi´ n a la red..

X). X)(X. F(∞) = l´mn→∞ Pr[X ≤ t] = 0. X). (X. F es no decreciente.a. del espacio muestral le hace corresponder un n´ mero o u real.C.C).C.C. (C.C) 1≤X ≤2 (C.3. (6. P). Se dice que X es una variable aleatoria si para cualquier x perteneciente a ℜ.C.C.t]). (X.C) 2≤X ≤3 (C.C)(X. X. Una funci´ n F : ℜ → ℜ se dice que es de distribuci´ n si y s´ lo si verifica las cuatro propiedades o o o anteriores. ı 3. a la o o o o o funci´ n F : ℜ → ℜ definida por: o F(t) = Pr[X ≤ t] = Pr(X ∈ (−∞. X. (X. X). en donde Eventos Valor de la v. Para caracterizar la distribuci´ n de probabilidad inducida por una v. La soluci´ n es la siguiente.a.C). un espacio probabil´stico (E. es decir.C). Una variable aleatoria discreta es aquella que s´ lo puede tomar valores dentro o o de un conjunto finito o infinito numerable. Dada la v. X. X. Variable aleatoria unidimensional Este proceso de cuantificaci´ n nos lleva de manera natural a considerar la siguiente definici´ n: o o Dado un experimento aleatorio y asociado al mismo.a.C. (C. X) 0≤X ≤1 (C.2) Las propiedades m´ s importantes de las funciones de distribuci´ n son: a o 1.2.1) Ejemplo: Consideramos un experimento aleatorio de lanzar una moneda al aire tres veces y anotamos el resultado. Teorema. ı 2.C) X >3 En general emplearemos las siglas v.C)(X. (Variable discreta). La funci´ n es continua por la derecha. una variable aleatoria ı (V. X). X)(C. φ X ≤0 (X. u Calcular el espacio muestral y comprobar que es una variable aleatoria. X. ∀t ∈ ℜ. Variables discretas Definici´ n. X(S) ≤ X (6.C. si t1 < t2 entonces F(t1 ) ≤ F(t2 ).C. a cada valor de X. (X. A. el conjunto de los sucesos elementales le hace corresponder un valor que verifica: ∀X ∈ ℜ.6. X. Se define la variable aleatoria X como n´ mero de caras aparecidas en los tres lanzamientos.C). 6. l´mh→0+ F(t + h) = F(t) o ı 4. X. (Funci´ n de distribuci´ n).C.a.) es una aplicaci´ n X : E → ℜ. para referirnos a una variable aleatoria. X se denomina funci´ n de distribuci´ n asociada a X. 64 .A. es decir. (C. E = o (C. X definiremos una nueva funci´ n m´ s o o a sencilla de manejar: Definici´ n. F(−∞) = l´mn→−∞ Pr[X ≤ t] = 0.

continua X. continua X.6) f (x)dx = 1. Dada una v. El valor del salto en o xi coincide con la probabilidad. cualquier funci´ n real que verifica las propiedades anteriores es la funci´ n de densidad de alguna o o v. pi . Variables continuas o Definici´ n.Definici´ n.5) (6. Aunque. (6. (Funci´ n de densidad). la probabilidad de un intervalo (a. ∞ −∞ ∀x ∈ ℜ.a.4. Para abordar esta nueva situaci´ n necesitamos la noci´ n de funci´ n de densidad. con saltos de discontinuidad en los puntos xi . En las variables aleatorias discretas la funci´ n de distribuci´ n viene dada por la siguiente expresi´ n: o o o F(t) = Pr[X ≤ t] = xi ≤t ∑ Pr(xi ). se deduce que la funci´ n de densidad verifica las siguientes propiedades: o o f (x) > 0.a. As´. la probabilidad de que la variable aleatoria tome un valor concreto es igual a cero. (Funci´ n de probabilidad). (6. En general.3) Esta funci´ n es escalonada.a. b) ser´ el area limitada por esta funci´ n de densidad. Se denomina funci´ n de probabilidad de la variable X a la funci´ n que asigna a cada xi su probabilidad pi .a. las rectas ı a ´ o x = a. surge el concepto de funci´ n de densidad como la funci´ n l´mite a la cual se aproxima el histoo o ı grama. En las v. su funci´ n de densidad es la funci´ n real de o o o o variable real Pr(x − h ≤ X ≤ x + h) . Sea X una v. (6. 65 . con ∑i pi = 1. continuas la funci´ n de distribuci´ n no se puede calcular como la suma de las probabilidades de o o ciertos puntos porque el conjunto de posibles valores de la variable es no numerable. de acuerdo con la anterior. x = b y el eje de abscisas. (Variable continua). no decreciente.4) f (x) = l´m ı 2h h→0+ De este modo. o o o Definici´ n. a De la definici´ n anterior. Una variable aleatoria continua es aquella que toma valores en uno o varios intervalos de la recta real. 6. de dicho valor. discreta que toma los valores xi con probabilidades o o o o pi = Pr(X = xi ). tiene sentido analizar lo ”densamente”que est´ repartida la probabilidad en torno a ese valor.

10) (6. E(X ± Y ) = E(X) ± E(Y ). se podr´a decir que el experimento aleatorio est´ definido alrededor ¸ ı a 66 . f (x) = o o o F ′ (x). continua X se expresa a partir de la funci´ n de densidad como: o o o t F(t) = Esta funci´ n es continua. verifica las siguientes propiedades: E(aX + b) = aE(X) + b.e. Definici´ n.7) Por lo tanto. x f (x)dx. En ocasiones. si X es continua (6.a. por simplicidad. a 6. Caracter´sticas de una v.8) (6. continua es la derivada de su funci´ n de distribuci´ n. (Esperanza Matem´ tica) o a Cuando se realiza un experimento determinista el resultado del experimento es unico en contraposici´ n con ´ o un experimento aleatorio en el cual existen un intervalo de valores. entonces E(XY ) = E(X)E(Y ). o −∞ f (x)dx. Si X e Y son independientes. se denomina esperanza o valor medio de X a la siguiente expresi´ n o µ µ = E(X) = = E(X) = xi ∈SX ∞ −∞ ∑ xi P(xi ). ı Entre los descriptores m´ s habituales de las variables aleatorias se encuentran los siguientes. ı Las medidas resumen definidas para v.a. 6.12) La estructura de la Ecuaci´ n 4.a.5.9) La esperanza de una v.a.La funci´ n de distribuci´ n de una v.1. sin m´ s que a equiparar las frecuencias relativas de variables estad´sticas con las probabilidades de las variables aleatorias. como por ejemplo en Mec´ nica.Pr).es su valor esperado. X definida sobre (E. En este sentido.1 se presenta en otros contextos. pueden generalizarse al caso de variables aleatorias. donde la funo a ci´ n de densidad de probabilidades tiene el sentido de la distribuci´ n de la masa a lo largo de un eje y el valor o o esperado se corresponde con el centro de esa masa.A. ∀x ∈ ℜ (6. En el contexto de la teor´a de probabilidades una variable aleatoria estar´ definida en un cierto intervalo cuyo ı a centro. la funci´ n de densidad de una v. seg´ n la variable aleatoria definida. (6. El conocimiento del ´ ı concepto de valor esperado ayuda a eliminar la dificultad planteada. si X es discreta. se aproxima la forma de explicar un experimento aleatorio en t´ rminos de un experimento determinista pero con la dificultad de no tener argumentos e suficientes para escoger el resultado unico que se asociar´a al experimento determinista. donde u es posible que ocurra cualquier resultado.11) (6.5. a. Dada una v.

Se ha verificado en diversas oportunidades que la forma de las a funciones de distribuci´ n y de densidad debe seguir un cierto patr´ n que obliga a que no todo tipo de funci´ n o o o puede ser considerada para este tipo de representaci´ n. Si X e Y son independientes. (x − µ )2 f (x)dx.18) Var(aX + b) = a Var(X). Hallar el valor esperado de dicha funci´ n de densidad de proo babilidad.13) (6. Pero no a o proporciona informaci´ n acerca del tama˜ o de esa regi´ n. Definici´ n.a.17) (6. Inecuaci´ n de Chevyshev o La definici´ n de variable aleatoria y de las funciones de distribuci´ n y de densidad refleja el comportamiento o o del experimento aleatorio que se est´ analizando.a. (Varianza) o En la secci´ n anterior se analiz´ la definici´ n de valor esperado tanto desde el punto de vista matem´ tico como o o o a desde el punto de vista del fen´ meno aleatorio involucrado. o de las probabilidades asignadas a diversos tipos de eventos. si X es discreta. verifica las siguientes propiedades: Var(X) 0. Y cuya funci´ n de densiad de probabilidad est´ dada por la expresi´ n: f (y) = λ exp(−λ y). Ejemplo: una v. La varianza de una v. Var(X) = E(X 2 ) − E(X)2. Una medida de la dispersi´ n o de la concentraci´ n o n o o o de la variable alrededor de su valor esperado lo proporciona la varianza. el conocimiento del valor espeo rado y la varianza proporciona informaci´ n adicional acerca de la forma de estas funciones y. u Ejemplo: una v.14) La varianza de una v.a. o a o cuando y ≥ 0 y cero para cualquier otro valor.del valor esperado y la ponderaci´ n de cada uno de los posibles resultados viene dada en t´ rminos del valor de o e la funci´ n de densidad correspondiente en cada punto.5. 2 (6. Este tipo de informaci´ n llega hasta el extremo o de indicar topes en el valor de la probabilidad de ocurrencia de ciertos eventos para cualquier tipo de variable 67 . o 6. Var(X + Y ) = Var(X − Y ) = Var(X) + Var(Y ).15) (6. Y cuya funci´ n de densiad de probabilidad est´ dada por la expresi´ n: f (y) = λ exp(−λ y). si X es continua (6. En este orden de ideas. Este valor permite ubicar r´ pidamente la regi´ n o a o donde est´ definida la variable como aquella regi´ n que se encuentra alrededor del valor esperado.16) (6. El concepto del valor esperado permite aglutinar en un o n´ mero los aportes ponderados de cada uno de los posibles resultados del experimento.6. o a o cuando y ≥ 0 y cero para cualquier otro valor.2.a. en consecuencia. 6. X viene dada por la expresi´ n o σ 2 = Var(X) = E (X − µ )2 σ 2 = Var(X) = E (X − µ )2 = = xi ∈SX ∞ −∞ ∑ (xi − µ )2P(xi ). Hallar la varianza de dicha funci´ n de densidad de probabilidad.

5. Obt´ n la funci´ n de distribuci´ n de la variable y calcula la probabilidad o e o o de que una bater´a dure un tiempo mayor a 1/a. o o Sea un evento del tipo X − E(X) ≤ kσX .19) P X − E(X) ≤ kσX 1 − 2 k Notas: El valor m´nimo de la probabilidad del evento mencionado se calcula utilizando el lado derecho de la ı Ecuaci´ n anterior. b ≥ 0. La inecuaci´ n de Chevyschev permite conocer un l´mite al valor que puede tener la probabilidad de un cierto o ı tipo de evento independientemente de la forma de su funci´ n de densidad de probabilidades. 3. as´ como tambi´ n cualquier herramienta compuı e tacional o tecnol´ gica disponible. ´ Por experiencia se sabe que la probabilidad de que llames al ambulatorio y no comunique es de 0. o o 6. cada una de ellas con 4 posibles respuestas. Cada fallo descuenta 0. 68 . si x ≥ 0. Calcula la funci´ n de masa y la de distribuci´ n de X: No de cruces o o obtenido. σ 2 = 0. µ = 2. o 1. Calcular la media de X y su varianza. Cada pregunta contestada correctamente es un punto. 1 (6.5461.aleatoria. En cada uno de o los problemas pudiera usarse todo lo reflejado en estas notas. Sol.3678 ı Un PEQ consta de 10 preguntas tipo test. Se lanza al aire una moneda tres veces. Problemas de final de cap´tulo ı A continuaci´ n una serie de problemas de repaso y estudio para fijar los conceptos anteriores.5 puntos.25. entonces la probabilidad de ocurrencia de este evento tiene un valor m´nimo que es una funci´ n del valor real positivo k y no depende de la forma de la funci´ n de densidad de ı o o probabilidades de X. 4. Una variable aleatoria tiene por funci´ n de densidad: o f (x) = 1 2 (x + 1). 12 si 0 ≤ x ≤ 3. Demuestra matem´ ticamente que el n´ mero esperado de llamadas que debes hacer para que te cojan es a u de 4. 2. Como ser´ la calificaci´ n del a o alumno si este contesta a todas al azar. Se ha comprobado experimentalmente que la vida util de una bater´a es una variable aleatoria cuya fun´ ı ci´ n de densidad es: o f (x) = be( − ax). o Definici´ n: Sea una variable aleatoria X de la cual s´ lo conocemos su valor esperado E(X) y su varianza V (X). Sol.0625. con a. P=0.7. Determina la relaci´ n entre a y b. o La expresi´ n anterior se conoce como la inecuaci´ n de Chevyschev.

6. 95 coches ı 69 . con una probabilidad del 95 %? Sol.84. con una desviaci´ n a n a o t´pica de 10. para el 90 % de los casos. σ 2 = 2. a o ı centrado en el retraso medio. 50 unidades de su modelo m´ s caro. al a˜ o. Cu´ ntos coches de este modelo debe de tener disponibles si se quiere garantizar la demanda ı a al momento de estos veh´culos. π 1 + x2 si −1 ≤ x ≤ 1. 0. Los retrasos en las entregas de los pedidos en una f´ brica respecto de la planificaci´ n establecida siguen a o una variable aleatoria cuya funci´ n de densidad es: o f (x) = 2 1 . Propone un intervalo de tiempos de retraso.84) Una f´ brica de coches vende de media. (-0. 7. Cu´ l es el retraso medio de un pedido y la desviaci´ n t´pica. µ = 0.28. Sol.

o ı Gauss (Alemania.1. Los Bernoulli formaron una de las sagas de matem´ ticos m´ s importantes de la historia. o ´ La obtenci´ n de exito o fracaso en cada ocasi´ n es independiente de la obtenci´ n de exito o fracaso en o ´ o o ´ las dem´ s ocasiones. uno de los m´ s famosos matem´ ticos de la historia. ¿Cu´ l es la probabilidad de obtener u a tres cincos?. Introducci´ n o Estudiaremos en este tema dos de las distribuciones de probabilidad m´ s importantes y que son imprescindia bles a la hora de adentrarnos en el estudio de la inferencia estad´stica. de valores). qui´ n escribi´ el primer tratae o do importante sobre probabilidad.2. a Tiramos un dado 7 veces y contamos el n´ mero de cincos que obtenemos. o infinito o u numerable. La distribuci´ n binomial es uno de los ı o primeros ejemplos de las llamadas distribuciones discretas (que s´ lo pueden tomar un n´ mero finito. 1777-1855).F. 70 . entre otros. a La probabilidad de obtener exito o fracaso siempre es la misma en cada ocasi´ n. La distribuci´ n normal es un ejemplo de las distribucioa a o nes continuas. La gr´ fica de la distribuci´ n a a a o normal en forma de campana se denomina Campana de Gauss. y aparece en multitud de fen´ menos sociales y cient´ficos. Fue estudiada.Cap´tulo 7 ı Distribuciones de Probabilidad Binomial y Normal 7. por J. 7. La distribuci´ n binomial o de Bernoulli o La distribuci´ n binomial est´ asociada a experimentos del siguiente tipo: o a Realizamos n veces cierto experimento en el que consideramos s´ lo la posibilidad de exito o fracaso. ´ o Ve´ moslo con un ejemplo.Ars conjectandi”(El arte de pronosticar). Fue estudiada por Jakob Bernoulli (Suiza. . 1654-1705).K.

por tanto.1) Nota: Observar que las probabilidades de exito y fracaso son complementarias. Fracaso = F = ”no sacar un 5”→ p(F) = 5 . ´ por lo que basta saber una de ellas para calcular la otra. Recordando las t´ cnicas combinatorias. E. 1 . En este caso la probabilidad de obtener k exitos viene dada por: ´ p(x = k) = n k (n−k) n k pq = p (1 − p)(n−k) k k (7. lo mejor es recurrir a la siguiente ı ı f´ rmula que expresa la probabilidad de obtener cierto n´ mero de eitos en una distribuci´ n binomial: o u ´ o Definici´ n de distribuci´ n binomial: o o Si realizamos n veces un experimento en el que podemos obtener exito. Por tanto.q = 1 − p y p = 1 − q. este problema se reduce a calcular las permutaciones con ´ e elementos repetidos: 7! 7·6·5 3. Aplicando la f´ rmula: ı ı o ´ 6 p(x = 3) = 7 13 54 = 0. ¿Cu´ l es nuestro exito?. que es en lo que nos fijamos. en una variable binomial con 7 repeticiones y con probabilidad de exito 1 . con probabilidad p y fracaso. es decir: EEEFFFF. entonces p(x = 3) = 0. y lo expresar´amos: ´ ı Bin 7. es decir que en realidad estamos calculando de cu´ ntas maneras se pueden ordenar 4 fracasos y a 3 exitos. sacar un 5. sino sacar cualquier otro n´ mero. como p(E) = 1 6 y tengo 3 exitos y p(F) = ´ 5 6 y tengo 4 fracasos: 1 1 1 5 5 5 5 p(tener 3 exitos y 4 fracasos) = 35 · · · · · · · = 0. la proba´ 6 bilidad de obtener 3 exitos es 0. y lo o a representaremos por Bin(n.Este es un t´pico ejemplo de distribuci´ n binomial. a ´ Evidentemente. ser´ no sacar 5. F.0781. ¿de cu´ ntas maneras pueden darse estas posibilidades?. 1 . 6 6 Para calcular la probabilidad que nos piden. p). Podr´amos sacar 3 cincos ´ a ı en las 3 primeras tiradas y luego 4 tiradas sin sacar cinco. y quer´amos calcular p(X = 3) (obtener 3 exitos). es decir. pues estamos repitiendo 7 veces el experimento de lanzar un ı o dado. fij´ monos en que nos dicen que sacamos 3 cincos y por lo tanto e tenemos 3 exitos y 4 fracasos. Ejemplo: Antes ten´amos Bin 7. diremos que estamos ante una distribuci´ n binomial de par´ metros n y p. Exito = E = ”sacar un a u 5”→ p(E) = 1 . Pero tambi´ n podr´amos sacar e ı EFEFFFE.4 P7 = = = 35 formas 3!4! 3 · 2 · 1 Y por tanto. ´ El fracaso. ´ con probabilidad q (q = 1 − p).0781 ´ 6 6 6 6 6 6 6 Formalizando lo obtenido.0781. · · 3 6 6 71 .0781 6 Como repetir este proceso ser´a bastante penoso en la mayor´a de los casos.

Calcular la probabilidad de que una familia con 6 descendientes tenga 2 hijos. ı Nota importante: El caso en que p > 0. ´ El n´ mero de exitos (k).7). el valor que hab´amos calculado.aprobar fracaso = ”suspender”. si: Exito = tener hi ja. u ´ La probabilidad p se busca en la primera fila (valores desde 0. Por tanto si intercambiamos exito = ”suspender fracaso =.2344. no se encuentra tabulado.5. por tanto. es ´ 2 2 72 . 0. o entonces q < 0.2. Si cona sideramos un grupo de 8 alumnos. Para usar las tablas de la distribuci´ n binomial es necesario conocer: o El n´ mero de veces que se realiza el experimento (n). la columna p = 0. En el caso concreto del ejemplo anterior.5 y basta intercambiar los papeles de exito y fracaso para que podamos utilizar la tabla. ´ Ejemplo: La probabilidad de que un alumno de 2do de Bachillerato apruebe las Matem´ ticas es de 0. entonces p = 0. 0.5.2344. 2 Nota: La elecci´ n de exito o fracaso es subjetiva y queda a elecci´ n de la persona que resuelve el problema. Tenemos. Si p > 0.entonces p = 0. una Bin(8. 0.5.1. Si aplicamos la f´ rmula es: o p(x = 2) = 6 · 0.52 = 0.7 y q = 0.5). Fracaso = F = tener hi ja y p(F) = 0. 4 Evidentemente sale lo mismo. o ´ o pero teniendo cuidado de plantear correctamente lo que se pide.7.5 es la ultima.54 · 0. q = 0.5.aprobar. ´ Por ejemplo en el caso anterior.2344. ¿cu´ l es la probabilidad de que cinco de ellos aprueben las Matem´ ticas?. es decir: a ´ p(x = 4) = 6 · 0.52 · 0. o 7.7.Ejemplo: Supongamos que la probabilidad de que una pareja tenga un hijo o una hija es igual. Estamos por tanto ante una binomial Bin(6. si el exito es ´ tener hija hemos de plantearnos cu´ l es la probabilidad de tener 4 exitos (4 hijas).54 = 0.3. pero hay que ser consecuente a la hora de elegir el exito y el fracaso y la pregunta ´ que nos hagan.7 y s´ lo tenemos o hasta p = 0.3.01 hasta 0. En este caso Exito = E = tener hi jo y p(E) = 0.5) . como nos piden la probabilidad de que una familia con 6 hijos tenga 2 hijos. El uso de las tablas de la distribuci´ n binomial La distribuci´ n binomial se encuentra tabulada por lo que es f´ cil calcular probabilidades sin necesidad de hacer o a demasiadas cuentas. u La probabilidad de exito (p). en la primera columna (valores desde 2 a 10) y el n´ mero de u u exitos a su lado. Bin(6. y cuando n = 6 y k = 2 ´ encontramos 0. p(X = 2). ´ Nos piden calcular p(X = 5). El n´ mero de veces que se realiza el experimento.5. que no se puede calcular mediante las tablas porque p = 0. La raz´ n es bien sencilla.5) y nos piden p(X = 2). a a Si exito = .

67). c) Probabilidad e e de que estudien ingl´ s entre 7 y 10 alumnos. Manejamos por tanto una Bin(15. Tomamos una muestra de 15 alumnos de la clase.2.000027 = 0. Del mismo modo: a p(3 ≤ X ≤ 6) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) = 0. basta ´ pensar en que para que aprueben 2 alumnos como mucho.0001 + 0. p(X = 3). + p(X = 15). es decir que suspendan 3 de 8 o lo que es lo mismo. p = 0.2541. por ejemplo.7) y olvidarnos de tablas ı o para hacer: 8 p(x = 5) = · 0. es pasar al complementario.0012 + 0.1013 (haz las cuentas) b) ¿Cu´ l es la probabilidad de que aprueben entre 3 y 6 alumnos (inclusive)?. Una opci´ n es calcular estas 13 probabilidades y sumarlas. a Si exito = aprobar y fracaso = suspender.000026) = 1 − 0. e e p(X ≤ 2). m´ s sencilla. en las tablas s´ lo se admiten valores hasta n = 10 o o (10 repeticiones del experimento). 0. 0.67 y fracaso = estudiar franc´ s. El o a complementario de encontrar al menos 3 alumnos de ingl´ s es encontrar como mucho 2 alumnos de ingl´ s. entonces nos piden p(X ≤ 2). p(X = 1) = 0.33 = 0. calcular: a) Probabilidad de que al menos e encontremos tres alumnos de ingl´ s. sino que o u ´ ocurran como mucho ”k”´ xitos o preguntas similares. 5 7. Si exito = estudiar ingl´ s..3.2965 = 0. es decir: p(X ≤ 2) = p(X = 0) + p(X = 1) + p(X = 2) = 0.01 = 0.000001 + 0.1361 + 0.2. b) Probabilidad de que los 15 alumnos estudien ingl´ s.33. p(X > 3) = 1 − p(X < 3) = 1 − p(X ≤ 2) = 1 − (p(X = 0) + p(X = 1) + p(X = 2)) y s´ lo tenemos que calcular 3 probabilidades: p(X = 0) ∼ 0 . 0. inevitablemente hemos de utilizar la f´ rmula. desde e ´ luego podr´amos haber utilizado la f´ rmula desde el principio.000001. se tendr´ a p(X > 3) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) + .254. 1 o ninguno.. Tambi´ n.67 = 0. Probabilidades acumuladas Es posible que nos pidan no s´ lo la probabilidad de que ocurran un cierto n´ mero de exitos en concreto.7334 Hemos de tener en cuenta que para la distribuci´ n binomial.000026 o (compru´ balo!).999973 73 . Para la parte a). e p(X > 3) = 1 − (0 + 0. Por lo cual.2541 + 0.0467 + 0. podr´an pedirnos: a) e ı ¿Cu´ l es la probabilidad de que aprueben como mucho 2 alumnos?. la tarea se puede hacer bastante larga. Para valores de n > 10. p = 0. e e e ´ q = 1 − 0. puede que aprueben 2.decir la nueva binomial es Bin(8. que tengamos 3 exitos. o Ejemplo: Los alumnos de cierta clase se encuentran en una proporci´ n del 67 % que estudian ingl´ s y el o e resto franc´ s.75 · 0.7 y q = 0.3) y nos piden que aprueben 5 de 8. y buscando en la tabla es p(X = 3) = 0. En este caso. En el ejemplo anterior. Como hay que aplicar la f´ rmula para calcular o o cada una. p(X = 2) = 0. utilizar la Bin(8. Es decir. Otra opci´ n.

grado de adaptaci´ n a un medio. como el consumo de ciertos productos por individuos de un mismo grupo huo mano. La distribuci´ n Normal Al estudiar aspectos tan cotidianos como: Caracteres morfol´ gicos de individuos ( personas. viene a o dado por x = np. el n´ mero esperado de exitos o media.1114 + 0. Caracteres psicol´ gicos. se tendr´ a p(X = 15) = 0.0549 + 0. Para la parte c). Caracteres fisiol´ gicos. o 7. o pesos.3.Para la parte b). o o Caracteres f´sicos. envergaduras. etc.1: Distribuci´ n de estaturas de 1400 mujeres. obtenemos: Figura 7. animales.2142 = 0. Media y desviaci´ n t´pica en una distribuci´ n binomial o ı o u ´ Aunque no se demostar´ . como tallas. plantas) de una misma raza. 7. (Recordemos que la media es una medidad de centralizaci´ n).5564. ¯ o La desviaci´ n t´pica.2. Pu´ s. por u e o e ejemplo. σ . como la resistencia a la rotura de ciertas piezas.0025 (aplica la f´ rmula). si hacemos una estad´stica para conocer la altura de 1400 mujeres y representamos los resultados en ı un diagrama de barras. o ı o a √ viene dada por σ = npq. como el cociente intelectual. como el efecto de una misma dosis de un f´ rmaco. o 74 . ¿Qu´ quiere decir esta expresi´ n?. que es una medida de dispersi´ n y mide lo alejados que est´ n los datos de la media.1759 + 0. se tendr´ o a p(7 ≤ X ≤ 10) = p(X = 7)+ p(X = 8)+ p(X = 9)+ p(X = 10) = 0. en una distribuci´ n binomial Bin(n. p).3. o de una misma cantidad de o a abono. ı todos ellos tienen en com´ n que se distribuyen ”normalmente”. Caracteres sociol´ gicos.

σ ).. donde est´ la mayor´a de ellos. a ı Definici´ n: Diremos que una distribuci´ n de probabilidad sigue una distribuci´ n normal de media x y desviaci´ n o o o ¯ o t´pica σ .3) 75 . de m´ ximo en la media. es decir de la ¯ forma: Figura 7. La gr´ fica de esta curva se denomina campana de Gauss y se a a puede observar en la figura: Su funci´ n de densidad ser´ : o a x2 1 f (x) = √ e− 2 2π (7.. 1). σ ) siempre es 1. o ¯ a a ¯ √ 1 ). rese˜ adas ı n anteriormente.2) Propiedad: El area encerrada bajo la curva normal N(x. dicha funci´ n viene dada por: a ¯ o (x−x)2 ¯ 1 − f (x) = √ e 2σ 2 2πσ 2 (7. y lo representaremos por N(x. Baste decir que o a la funci´ n de densidad determina la forma de cada distribuci´ n de probabilidad. El concepto de funci´ n de densidad introducido anteriormente no se estudiar´ con profundidad. En el caso de la distribuci´ n o o o normal de par´ metros x y σ .2: Distribuci´ n normal N(x. usada y conocida es aquella que tiene por media 0 ¯ a y por desviaci´ n t´pica 1. la m´ s sencilla. o ı Esta normal est´ ndar se suele representar por Z. sim´ trica respecto a la media. 2πσ 2 a o a Dependiendo de los valores que tomen x y σ . etc. situados a ambos lados de la media (x − σ y x + σ respectivamente) y a distancia de σ ella. achata¯ da. σ ) cuando la representaci´ n gr´ fica de su funci´ n de densidad es una ı ¯ o a o curva positiva continua. la gr´ fica de esta funci´ n puede ser m´ s o menos alargada. y que tiene 2 puntos de inflexi´ n e a o ¯ . σ ). ´ ¯ La demostraci´ n de este resultado no es nada sencilla e implica el uso de resultados matem´ ticos que exceden o a el nivel de este curso. El m´ ximo est´ en (x. pero en cualquier caso siempre tiene las mismas condiciones de simetr´a. De entre todas las curvas normales N(x.Las gr´ ficas de este tipo son muy corrientes: Hay pocos individuos en los extremos y un aumento paulatino a hasta llegar a la parte central del recorrido.. continuidad. N(0. etc.

9973.2). fij´ monos en que en este tipo de distribuciones no tiene sentido plantearse probabilidades del e tipo p(Z = k). para estos valores a mayores que 3.7). basta u ´ 76 . definimos la probabilidad de que la distribuci´ n Z. diremos que la probabilidad es aproximadamente 1. e Buscar las cent´ simas en la primera fila (en este caso 8). Por eso. 1). El m´ ximo est´ en (0. F´ cil: Dichas areas o probabilidades se encuentran tabuladas.99. tenemos la probabilidad buscada.99.3: Distribuci´ n normal N(0.62 y mayores ya valen 0. para valores a partir de 0 y hasta 3. ya que siempre valen 0. si nos pidiesen p(Z = 3.9973. ¿c´ mo calcular dicha area?. Uso de las tablas de la distribuci´ n normal N(0. Por otra parte. Por tanto p(Z ≤ 2. Figura 7. Si por ejemplo queremos calcular p(Z ≤ 2. e En el punto com´ n a la fila y la columna que hemos encontrado. o ´ a ´ 7.9999 (pr´ cticamente 1). o a a √1 ).4: Area encerrada por la curva normal desde −∞ hasta k. sea menor o igual que k o como: p(Z ≤ k) = Area encerrada bajo la curva normal N(0. hemos de realizar los pasos: Buscar la parte entera y las d´ cimas en la primera columna (en este caso 2. en este u caso 0. basta fijarse en que las probabilidades correpondientes a valores tales como 3. podemos definir una probabilidad de la siguiente manera: ´ Para un valor cualquiera k. 1) o La normal N(0. N(0.1.62) ∼ 1 aunque no aparezı ca en la tabla.78). Si queremos calcular una probabilidad de un valor mayor que 3.3. 1) desde −∞ hasta k (7.4) (es decir la parte rayada de la figura siguiente). Ahora bien. 1).99. al no encerrar ning´ n area. As´: p(Z ≤ 5.Figura 7.78) = 0. 1) se encuentra tabulada. 2π Puesto que el area bajo esta curva normal es 1. Por tanto.

p(Z ≤ −k) = p(Z > k) y esta ´ ı ´ se calcula como en el caso anterior. o As´. f) p(Z ≤ 18.15).5) S´ lo se puede hacer esto en distribuciones continuas.2). Este tipo de distribuciones en las cuales la probabilidad de tomar un valor concreto es 0 se demoniman distribuciones continuas.05). Si k es positivo y queremos calcular p(Z > −k). ´ Ejemplo: Calcular p(Z > 0.2.5). 77 .27). e) p(Z ≤ 4.78) y p(Z ≤ −3. su complementario ser´ Z < k. al calcular probabilidades podemos escribir: p(Z > k) = 1 − p(Z < k) = 1 − p(Z ≤ k) (7.82). es decir el area rayada: entonces. 1) las probabilidades: a) p(Z ≤ 1.3) y p(Z > 2.07). es decir el area rayada: basta pasar al complementario. si tenemos Z > k. Se puede observar la igualdad de areas en la figura: ´ Ejemplo: Calcular p(Z ≤ −0. para diferenciarlas de otras en las que esto no ocurre.01). a c) p(Z ≤ 0. al pasar al complementario.decir que p(Z = 3.3. en el caso de la binomial esto no se puede hacer y hay que o ser cuidadosos con el paso al complementario.2) = 0. Ejemplo: Buscar en la tabla de la normal est´ ndar N(0. como por ejemplo la binomial. pero como incluir k no influye ı a en la probabilidad. es decir el area: por simetr´a. d) p(Z ≤ 1. p(Z > k) = 1 − p(Z ≤ k) y esta ultima probabilidad ya se encuentra tabulada. por simetr´a p(Z > −k) = ´ ı p(Z ≤ k): Ejemplo: Calcular p(Z > −0. Si k es positivo y queremos calcular p(Z ≤ −k). C´ lculo de otras probabilidades a Si k es positivo y queremos calcular p(Z > k).5: p(Z > k). que es una distribuci´ n discreta. b) p(Z ≤ 0.96) y p(Z > −1.09) 7. Basta pasar al complementario. es decir: ´ Figura 7.

La simetr´a permite reducir este caso al anterior.6: p(Z ≤ −k).7: p(Z ≤ −k) = p(Z > k). p(k1 ≤ Z ≤ k2 ) .57).8: p(Z > −k).Figura 7. ı Figura 7. 78 .96 ≤ Z ≤ 1. ı a Probabilidades comprendidas entre dos valores.32 ≤ Z ≤ −0.es decir el area rayada: se calcula restando ´ las areas: ´ Ejemplo: Calcular p(−0. a Figura 7.La simetr´a permite reducir este caso al que ya est´ tabulado.49) y p(−1.Las probabilidades de valores negativos no est´ n tabuladas. Figura 7.9: p(Z > −k) = p(Z ≤ k).

4013 = 0. Llamando a X−168 = Z. primero restamos x = 168 en la desigualdad: p(166 ≤ X ≤ 170) = p(166 − 168 ≤ X − 168 ≤ 170 − 168) = p(−2 ≤ X − 168 ≤ 2).5987 − 0. p(−2 ≤ Z ≤ 2).25) = (tablas) = 0. p(Z > 2).11: p(Z ≤ k2 ) en la primera imagen.25 ≤ Z ≤ 0. p(Z > −2).81 ≤ Z ≤ 1. Utilizando el resultado anterior. Y ahora dividimos entre σ = 8. ´ Ejemplo: Calcular p(Z = 2). (pues p(Z ≤ −0. 1) y se encuentra en las tablas: p(166 ≤ ´ 8 8 X ≤ 170) = p(−0. 1)?. ¿Cu´ ntos soldados miden entre 166 y 170 cm?. Nos piden p(166 ≤ X ≤ 170). p(X > 27). 7. σ ) cualquiera. p(Z ≤ k1 ) en la segunda. 1). σ ) a ¯ ˆ o Si no tenemos una distribuci´ n N(0.10: p(k1 ≤ Z ≤ k2 ). 1) se denomina tipificaci´ n de la variable X). σ ) a la Z → N(0.33). p(Z ≤ 2). entonces la variable Z = X−x sigue una distribuci´ n N(0.25) = p(Z ≤ 0. Figura 7. Sea X la distribuci´ n de los soldados . p(Z ≤ −2).3.5987 = 0.1974.25) = 1 − p(Z ≤ 0. C´ lculo de probabilidadesen normales N(x. o ı a o X es una N(168. esta ya es normal N(0.25) = 1 − 0. p(15 ≤ X ≤ 20). ¯ Propiedad: Si X sigue una distribuci´ n N(x. 79 .Figura 7. sino una N(x. p(X > 125). Ejemplo: En una distribuci´ n N(22. o ¯ o σ o (El paso de la variable X → N(x. σ ). 8). El siguiente resultado nos da la respuesta. ¯ Ejemplo: Las estaturas de 600 soldados se distribuyen de acuerdo a una distribuci´ n normal de media 168 y o desviaci´ n t´pica 8 cm.25) = p(Z > 0. 1). calcula: p(X ≤ 27). A¿¿c´ mo calcular probabilidades.4013).3. p(0. o p(17 ≤ X ≤ 30). Al restar obtenemos el area pedida. si no o ¯ tenemos tabla salvo para N(0. 5).25) − p(Z ≤ −0. con lo que acabamos de tipificar: p(166 ≤ X ≤ 170) = p(−2 ≤ X − 168 ≤ 2) = 2 2 p − 8 ≤ X−168 ≤ 8 . Probabilidad comprendida entre dos valores.

4. y o ı u nos ped´an calcular dicha probabilidad. ı Ahora bien. 4).9082 → p Z ≤ k−6 = 0.83. o menos. σ ).835. 1). k−6 = 1.6141 y X sigue una N(15. Calcular: ¯ a) x y σ . por a ejemplo: p(Z ≤ k) = 0.72. En este caso el valor buscado ser´ la media entre los a valores extremos.9573. Relaci´ n entre la distribuci´ n binomial y la distribuci´ n normal o o o Es un hecho comprobado que cuando tenemos una distribuci´ n Bin(n. En caso de que el valor a buscar no aparezca directamente dentro de la tabla de la distribuci´ n normal. directamente tomamos este valor. pero muy cercano a uno de ellos. y buscando en la tabla. d) 70 kg. b) p(Z ≤ k) = 0. Tipificando: p X−6 ≤ 3 0. 1) sabemos que p(Z ≤ k) = 0.3.9573 dentro de la tabla de la distribuci´ n normal. y por lo tanto k debe ser 1.84 = 0.83) y 0. e) entre 60 y 70 kg inclusive. Si buscamos en la tabla este valor no aparece directamente.5) = 0.65 ≤ X ≤ 6. c) El n´ mero k tal que p(X > k) = 0. Calcula la probabilidad de que el peso o sea: a) mayor de 80 kg.7982.9082.7970.7996 (que corresponde a 0. 3) y p(X ≤ k) = 0.4. es dif´cil hacer o ı uso de las f´ rmulas y/o tablas.25).33 → k − 6 = 3. calcula k. El valor m´ s cercano es 0. 3 3 Ejemplo: Calcular k si p(X ≤ k) = 0.9772 y p(X ≤ 6.84). o 80 . sino que se encuentra entre los valores 0. Basta buscar 0.8413. Por tanto el valor de k ser´ : k = 0. σ ) se sabe que p(X ≤ 7) = 0. sino N(x. a medida que n crece. b) p(5.3. y lo encontramos o o en el cruce de la fila 1. otra pregunta puede ser: Dado que en una normal N(0. ¯ u k−6 3 = 7.7967 (que corresponde a 0. 5).9767 (que corresponde a 0. Ejemplo: De una variable normal N(x. b) 50 kg. Otro uso de las tablas Hasta ahora nos han dado la distribuci´ n normal N(0. a 2 Si el valor est´ entre dos valores.8078.83) y como el valor a buscado est´ muy cerca de el.83+0. por ejemplo: p(Z ≤ k) = 0. 7.9082.0028. 1) y nos ped´an p(Z ≤ k) siendo k un cierto n´ mero.7 con la columna 2. Ejemplo: Calcular k si: a) p(Z ≤ k) = 0.99 → k = 9. p). tendremos que tipificar previamente. ¿qui´ n e es k?. o ¯ Ejemplo: si X sigue una normal N(6. pueden o ocurrir dos posibilidades: Si el valor se encuentra entre dos valores de la tabla y a la misma distancia (aproximadamente) de cada uno de ellos. c) menos de 60 kg. entonces directamente k = 0. La resoluci´ n es bien sencilla.Ejemplo: Los pesos de 60 soldados siguen una distribuci´ n N(67. a ´ Si la distribuci´ n no es normal N(0.99.

5). aproximando por Y normal calcularemos p(Y ≤ k − 0. Si no se cumplen estas condiciones NO podemos aproximar la binomial que tengamos por una distribuci´ n normal.5 ≤ Y ≤ k + 0. p) se aproxima a una curva normal de media x = np y desviaci´ n t´pica o ¯ o ı √ σ = npq. El ”precio”que hay que pagar por pasar de una a otra se denomina correcci´ n por continuidad consiste en hacer determinados ajustes para que la ¸ o aproximaci´ n realizada sea lo m´ s precisa posible. fij´ monos que ahora k SI est´ incluido en la proe e a babilidad y por tanto al aproximar por la normal Y deber´amos calcular p(Y ≤ k + 0. con X binomial. ı Por contra. y ´ 6 nos piden p(20 ≤ X ≤ 33). y por tanto son distribuciones diferentes. si nos piden p(X = k) en una distribuci´ n binomial X. Si exito = obtener cinco entonces p = 1/6 y fracaso = no obtener cinco y q = 5/6. con la aproximaci´ n normal Y deberemos calcular o p(k − 0.5 . cuando n tiende a ∞. con lo cu´ l. Si nos piden p(X < k) con X binomial. o a As´. 1 .5). Es inviable aplicar las tablas (pues repetimos el experimento 100 veces) y tampoco la f´ rmula pues es inviable calcular.Por ejemplo. el propio k aparecer´a en la probabilidad a calcular y NO debe aparecer. si nos piden p(X = k) con X binomial.4. Teorema Central del L´mite ı La distribuci´ n binomial Bin(n. es decir. ı o o no podemos calcular directamente p(Y=k) porque. y. Algunos ejemplos. ı 2 81 . en concreto n > 30 y adem´ s o o o a np > 5 y nq > 5. como ya se ha comentado anteriormente. en una distribuci´ n o continua todas estas probabilidades valen 0. La explicaci´ n o de que haya que restar 0. La aproximaci´ n se puede aplicar (es una buena aproximaci´ n) s´ lo si n es grande. Del siguiente modo. y aproximamos X por una distribuci´ n normal. La correcci´ n por continuidad consiste en tomar un peque˜ o intero n valo de longitud 1 alrededor del punto k. por ejemplo.1. cuando n se hace muy grande.5). o 7. calcular la probabilidad de obtener entre 20 y 33 cincos (inclusive). Del mismo modo se razona en el caso de probabilidades acumuladas en la binomial. De otro modo. Tenemos una Bin 100. o p(X = 32) = 100 1 · 32 6 3 2· 5 6 6 8 ¿C´ mo resolver el problema?. debemos tener en cuenta que estamos pasando de una variable discreta (binomial) a una continua (normal). si a sumase 0. si debi´ semos calcular p(X ≤ k). o En caso de que podamos aproximar. tiramos un dado 100 veces.5 y no sumarlo es que queremos que X sea menor estrictamente que k.

o √ 500 En el caso anterior.5 ≤ Y ≤ 33 + 0.67.Comprender estos dos hechos es fundamental para realizar bien la correci´ n por continuidad al aproximar una o distribuci´ n binomial por una normal.67 = p(0.33 > 5.73 3.67 > 5 y nq = 83.51)− p(Z ≤ 0. como n > 30. 1 6 ∼ Y → N(16. es decir: X → Bin 100. np = 16.51) = p(Z ≤ 4. x = np = 100 = 16. De modo que.67 ≤ 33. 3.89 ≤ 3. se pude aproximar la binomial por la normal.89) ∼ 1 − 0.73) Entonces: p(20 ≤ X ≤ 33) ∼∗ p(20 − 0.5−16.5) = p 19.1867.67 ≤ Y −16.67 y σ = npq = ¯ 6 36 = 3.73 3. Notemos que en el paso se˜ alado por (*) hemos n cambiado X(binomial) por Y (normal) y se ha realizado la correcci´ n por continuidad. o 82 .73.5−16.73 Z ≤ 4.8133 = 0.

1991). 50.. Springer -Verlag. 224 (1974).. O. 2nd ed. 184 (1991) [8] J. K. [9] ”Simple method for fitting data when both variables have uncertainties”D. Orear. 60. [10] ”Linear least-squares fits with errors in both coordinates. (2002). R.. Probability and the Art of Judgment. Foundations of Modern Probability. F´sica re-Creativa. Phys. Baird. 2a ed. Bogot´ 1997 ı a [12] S.C. Buenos Aires 2001. Data analysis for scientists and engineers (John Willey & Sons. Meyer. pp.”II: Comments on parameter variances . Barker and L. C.Rodr´guez. Bevington and D.M. 912 (1982). Springer Series in Statistics. [5] Stuardt L. o e ¨ [7] J. Diana Am. Cameron Reed . Phys. Robinson. New York. Am. Ed.B. ISBN 0-521-39459-7. New York. (Prentice-Hall Hispanoamericana S. Gil y E.. 54-55 . [11] Estad´stica . Spiegel . 1975). ISBN 0-387-25115-4. Higbie. (McGraw Hill. J. Prentice Hall. [6] D.McGraw Hill 2da. ibid.M. 1992..Am. Phys. ISBN 0-387-95313-2. J. M´ xico. Data reduction and error analysis for the physical sciences. Phys. 650 pp.. New York (2005). J. 59. Vol. Probabilistic Symmetries and Invariance Principles. ı ı 83 . Uncertainty in the linear regression slope. 510 pp.A. 2nd ed. [3] Kallenberg. ”Least squares when both variables have uncertainties”.Bibliograf´a ı [1] Jeffrey. 1. 1993). Inc.Am. Experimentaci´ n. 42. J. [4] P. Cambridge University Press. (1992). [2] Olav Kallenberg. No.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->