NOTAS DE ESTAD´ıSTICA Y PROBABILIDAD

MG.SC. DAVID SIERRA PORTA
ACTUALIZADO AL 19 de abril de 2009
´
Indice general
Resumen 6
1. Introducci´ on a la Estad´ıstica 7
1.1. Peque˜ na definici´ on y algunos conceptos b´ asicos 7
1.2. Niveles de Medida 9
1.3. M´ etodos de recolecci´ on de datos 9
1.3.1. La entrevista 9
1.3.2. La encuesta 10
1.3.3. Cuestionario 11
1.3.4. La observaci´ on 12
2. La estad´ıstica descriptiva 13
2.1. Distribuciones de frecuencia 13
2.1.1. Terminolog´ıa adicional 13
2.1.2. Creando una tabla de frecuencias 14
2.1.3. Notaci´ on Matem´ atica 15
2.1.4. Frecuencia acumulada 15
2.1.5. La frecuencia relativa 16
2.1.6. Los histogramas 16
2.2. Medidas de Tendencia Central (MTC) 19
2.2.1. La Media Aritmetica 20
2.2.2. La Media 20
2.2.3. La Mediana 20
2.2.4. La moda 21
2.2.5. Propiedades de la media, mediana y moda 21
2.2.6. El promedio ponderado 22
2.2.7. Otros tipos de medias 22
2.2.8. Formas de las distribuciones de datos 24
2.3. Medidas de variaci´ on 25
2.3.1. Rango 26
2.3.2. La Varianza 26
1
2.3.3. La Desviaci´ on Est´ andar 27
2.3.4. La Desviaci´ on Media 27
2.3.5. Covarianza 28
2.3.6. Coeficiente de Correlaci´ on de Pearson 28
2.3.7. Coeficientes de asimetr´ıa y curtosis 29
2.4. Teorema que envuelven cuestiones sobre la Desviaci´ on Est´ andar 30
2.4.1. La regla emp´ırica 31
2.4.2. Teorema de Chebychev 31
2.5. Medidas de Posici´ on 31
2.5.1. Cuartiles 32
2.5.2. Deciles 32
2.5.3. Centiles o percentiles 33
2.6. Problemas de final de cap´ıtulo 33
3. M´ etodos cuantitativos de an´ alisis predictivo, regresi´ on 37
3.1. Correlaci´ on y regresi´ on 37
3.2. Distribuciones bidimensionales 37
3.3. La idea de la correlaci´ on 38
3.4. Encontrando la relaci´ on. Regresi´ on 40
3.4.1. El coeficiente de correlaci´ on 40
3.4.2. Regresi´ on lineal. El M´ etodo de los M´ınimos Cuadrados 41
4. An´ alisis Combinatorio 46
4.1. Introducci´ on 46
4.2. Permutaciones (u ordenaciones) con repetici´ on 47
4.3. Permutaciones (u ordenaciones) sin repetici´ on 47
4.4. Combinaciones 47
4.5. An´ alisis y Metodolog´ıa propuesta para la resoluci´ on de problemas de Teor´ıa de conteo 48
5. Probabilidad 49
5.1. Introducci´ on: La probabilidad 49
5.2. La probabilidad 51
5.3. Experimentos de Probabilidad 51
5.4. Calculando la probabilidad de un evento 53
5.4.1. Probabilidad Emp´ırica 53
5.4.2. Probabilidad cl´ asica 54
5.5. Axiomas de la probabilidad 54
5.6. Posibilidades y probabilidades 55
5.7. Propiedades de la probabilidad de eventos no elementales 56
5.8. Probabilidad condicionada 57
5.9. Probabilidad total 58
5.9.1. Teorema de la probabilidad total 58
5.10. Teorema de Bayes 58
5.11. Problemas de final de cap´ıtulo 59
6. Variable aleatoria y funci´ on de distribuci´ on 63
6.1. Introducci´ on 63
6.2. Variable aleatoria unidimensional 64
6.3. Variables discretas 64
6.4. Variables continuas 65
2
6.5. Caracter´ısticas de una v.a. 66
6.5.1. Definici´ on. (Esperanza Matem´ atica) 66
6.5.2. Definici´ on. (Varianza) 67
6.6. Inecuaci´ on de Chevyshev 67
6.7. Problemas de final de cap´ıtulo 68
7. Distribuciones de Probabilidad Binomial y Normal 70
7.1. Introducci´ on 70
7.2. La distribuci´ on binomial o de Bernoulli 70
7.2.1. El uso de las tablas de la distribuci´ on binomial 72
7.2.2. Probabilidades acumuladas 73
7.2.3. Media y desviaci´ on t´ıpica en una distribuci´ on binomial 74
7.3. La distribuci´ on Normal 74
7.3.1. Uso de las tablas de la distribuci´ on normal N(0; 1) 76
7.3.2. C´ alculo de otras probabilidades 77
7.3.3. C´ alculo de probabilidadesen normales N( ¯ x; σ) 79
7.3.4. Otro uso de las tablas 80
7.4. Relaci´ on entre la distribuci´ on binomial y la distribuci´ on normal 80
7.4.1. Teorema Central del L´ımite 81
3
´
Indice de figuras
2.1. As´ı luce un histograma de frecuencias. 18
2.2. Ejemplo de como debe construirse un histograma simple. 19
2.3. Muchas posibilidades para la construcci´ on del histograma. 19
2.4. Una distribuci´ on sim´ etrica. Ve´ ase la igual proporci´ on de barras con alturas aproximadas a ambos
lados de la media. 24
2.5. Una distribuci´ on sezgada a la derecha. Ve´ ase la desigual proporci´ on de barras con alturas
aproximadas a ambos lados de la media. 25
2.6. Una distribuci´ on sezgada a la izquierda. Ve´ ase la igual proporci´ on de barras con alturas
aproximadas a ambos lados de la media. 25
2.7. Una distribuci´ on uniforme. Las barras tienen aproximadamente la misma altura a ambos lados de
la media. 26
2.8. El coeficiente de correlaci´ on de Pearson establece la posibilidad de un ajuste de los puntos en la
muestra. 29
2.9. Distintas posibilidades de la forma del histograma en relaci´ on con el valor num´ erico de el
coeficiente de Fisher. 30
2.10. Distintas posibilidades de la forma del histograma en relaci´ on con el valor num´ erico de el
coeficiente de curtosis. 31
3.1. Ejemplo de de un diagrama de dispersi´ on o nube de puntos. 38
3.2. Regresi´ on lineal: Los puntos tienden a describirse a partir de una recta que los representa
aproximadamente a todos. 39
3.3. Regresi´ on lineal: la cantidad de intentos a medida que aumenta hace que el n´ umero de error
disminuya. 39
3.4. Regresi´ on lineal: Al parecer n existe relaci´ on entre la distancia a la que se vive de la Universidad
y la calificaci´ on que se obtiene. 40
3.5. Regresi´ on lineal: Al parecer n existe relaci´ on entre la distancia a la que se vive de la Universidad
y la calificaci´ on que se obtiene. 41
3.6. La curva de regresi´ on lineal en t´ erminos de los cambios de la funci´ on. 42
4
3.7. Representaci´ on de x(t) para un cuerpo que se mueve con movimiento uniformemente acelerado.
(a) A tiempos largos no se aprecia bien la curvatura de la curva y, dado que el coeficiente de
correlaci´ on lineal es muy cercano a la unidad, podr´ıa suponerse que la correlaci´ on es lineal. (b)
log(x) en funci´ on de log(t), de donde se deduce que la relaci´ on no es lineal sino cuadr´ atica. 45
4.1. Metodolog´ıa sencilla para la resoluci´ on de problemas. 48
7.1. Distribuci´ on de estaturas de 1400 mujeres. 74
7.2. Distribuci´ on normal N( ¯ x; σ). El m´ aximo est´ a en ( ¯ x,
1

2πσ
2
). 75
7.3. Distribuci´ on normal N(0; 1). El m´ aximo est´ a en (0,
1


). 76
7.4. Area encerrada por la curva normal desde −∞ hasta k. 76
7.5. p(Z > k). Basta pasar al complementario. 77
7.6. p(Z ≤−k).Las probabilidades de valores negativos no est´ an tabuladas. 78
7.7. p(Z ≤−k) = p(Z > k). La simetr´ıa permite reducir este caso al anterior. 78
7.8. p(Z >−k). 78
7.9. p(Z >−k) = p(Z ≤ k).La simetr´ıa permite reducir este caso al que ya est´ a tabulado. 78
7.10. p(k
1
≤ Z ≤ k
2
). Probabilidad comprendida entre dos valores. 79
7.11. p(Z ≤k
2
) en la primera imagen. p(Z ≤k
1
) en la segunda. Al restar obtenemos el ´ area pedida. 79
5
Resumen
Se presentan a continuaci´ on unas notas de Estad´ıstica Elemental y Fundamental, para el curso Estad´ıstica y
M´ etodos Num´ ericos de la Facultad Experimental de Ciencias de la Universidad del Zulia, LUZ, para la carrera
de F´ısica.
El objetivo del curso es que el alumno se familiarice con las herramientas anal´ıticas esenciales necesarias para
comprender el funcionamiento y las consecuencias de la aplicaci´ on de la teor´ıa estad´ıstica a la resoluci´ on de
problemas en f´ısica.
6
Cap´ıtulo 1
Introducci ´ on a la Estad´ıstica
1.1. Peque˜ na definici´ on y algunos conceptos b´ asicos
La Estad´ıstica es la ciencia de recoger o colectar, organizar, analizar e interpretar datos, en principio cualesquie-
ra. Existen dos tipos de estad´ısticas: Descriptiva: tabula, representa y describe una serie de datos que pueden
ser cuantitativos o cualitativos, sin sacar conclusiones, y la Inferencial: infiere propiedades de gran n´ umero de
datos recogidos de una muestra tomada de la poblaci´ on. La estad´ıstica descriptiva es una ciencia que analiza
series de datos (por ejemplo, edad de una poblaci´ on, altura de los estudiantes de una escuela, temperatura en los
meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.
Las variables pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir num´ ericamente (por ejemplo: nacionalidad, color
de la piel, sexo).
Variables cuantitativas: tienen valor num´ erico (edad, precio de un producto, ingresos anuales).
Las variables tambi´ en se pueden clasificar en:
Variables unidimensionales: s´ olo recogen informaci´ on sobre una caracter´ıstica (por ejemplo: edad de
los alunmos de una clase).
Variables bidimensionales: recogen informaci´ on sobre dos caracter´ısticas de la poblaci´ on (por ejemplo:
edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen informaci´ on sobre tres o m´ as caracter´ısticas (por ejemplo: edad,
altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: s´ olo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: n´ umero de hermanos (puede
ser 1, 2, 3....,etc, pero, por ejemplo, nunca podr´ a ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un
veh´ıculo puede ser 80,3 km/h, 94,57 km/h...etc.
7
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:
1. Individuo: cualquier elemento que porte informaci´ on sobre el fen´ omeno que se estudia. As´ı, si estu-
diamos la altura de los ni˜ nos de una clase, cada alumno es un individuo; si estudiamos el precio de la
vivienda, cada vivienda es un individuo.
2. Poblaci´ on: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten informaci´ on
sobre el fen´ omeo que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la
poblaci´ on ser´ a el total de las viviendas de dicha ciudad.
3. Muestra: subconjunto que seleccionamos de la poblaci´ on. As´ı, si se estudia el precio de la vivienda de
una ciudad, lo normal ser´ a no recoger informaci´ on sobre todas las viviendas de la ciudad (ser´ıa una labor
muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficiente-
mente representativo.
Por ejemplo, si estamos interesados en medir los salarios de todos los cient´ıficos de las universidades del pa´ıs,
el conjunto de datos que representan la poblaci´ on ser´ıa en este caso la lista de todos los salarios de cualquier
universidad en Venezuela. Una muestra podr´ıa ser obtenida seleccionando 10 universidades de una lista unos
cuantos estados seleccionados al azar con sus respectivos salarios, por su puesto.
A su vez, digamos que por ejemplo estuvi´ eramos interesados en conocer la opini´ on de la gente en Venezuela
acerca de la posibilidad o necesidad de incrementar la cantidad de puestos en los cuales de distribuye peri´ odico
a nivel nacional. Por su puesto, que la poblaci´ on estar´ a integrada por todas las respuestas de todos los ciudada-
nos del territorio nacional. Una muestra estar´ıa asegurada por ejemplo si tom´ asemos 1000 encuestas repartidas
en todos los estados deacuerdo con la densidad poblacional de cada uno, respondiendo a la pregunta en cuesti´ on.
Para medir en estad´ıstica es obvio que necesitaremos adem´ as una definici´ on para la cuantificaci´ on de las cosas o
fen´ omenos, de la misma manera como se hace una clasificaci´ on en la f´ısica para n´ umeros ordinarios y vectores.
Es decir, es importante, clasificar, qu´ e podemos medir y c´ omo, toda vez, que existe una clasificaci´ on para el
comportamiento de una variable. As´ı entonces tendremos que definir los tipos de medida:
Par´ ametro - una medida num´ erica hecha usando el conjunto de datos de la poblaci´ on en general,
estad´ıstico - un valor num´ erico soportado en el conjunto de datos del espacio muestral.
Por ejemplo: Usando el conjunto de datos que describen los salarios de los cient´ıficos, nosotros pudi´ eramos
calcular el salario promedio de los cient´ıficos que laboran en las universidades Venezolanas.
´
Este promedio cal-
culado debe tomarse por un par´ ametro. Mientras que si tomamos en cuenta la data proveniente de la escogencia
al azar de las 10 universidades, entonces, ´ ete valor debe nombrarse como un estad´ıstico.
Es por su puesto, muy sencillo darse cuenta que la poblaci´ on es un conjunto mucho m´ as grande que la muestra.
Adem´ as, debe advertirse que si la poblaci´ on tomada y seleccionada es muy grande, entonces probeblemente
ser´ a imposible poder calcular par´ ametros de alg´ un inter´ es particular. A menos que la poblaci´ on sea bastante pe-
que˜ na calcular ser´ıa muy dif´ıcil. Sin embargo, seleccionar poblaciones muy peque˜ nas es problem´ atico, adem´ as
de peligroso, y miente en el sentido cient´ıfico. En esencia, la idea general es poder seleccionar siempre mues-
tras, m´ as peque˜ nas, por su puesto, que la poblaci´ on y encontrar o calcular estad´ısticos muestrales que pudieran
dar explicaciones preliminares de lo que pasa en la data total o poblaci´ on. La idea fundamental es usar ´ estos
estad´ısticos para inferir o estimar los par´ ametros poblacionales, que es lo que en realidad importa.
8
La pericia de los cient´ıficos se encuentra en tratar de construir buenas muestras a partir de poblaciones muy
grandes, tales que los estad´ısticos calculados a partir de ´ estas muestras, sean buenas para estimar los par´ ametros
necesarios. Desafortunadamente, estimar estad´ısticos nunca es 100% seguro, pero si que podr´ıa ser en alguna
medida cercana.
1.2. Niveles de Medida
Existen varios seg´ un los valores que toman los datos.
1. Datos nominales: pueden ser del tipo cualitaticos s´ olamente. Los valores para los datos sirven para
etiquetar, pero las etiquetas no tienen atributo de orden. Por ejemplo: el tipo de sangre, el grado de
estudio, el tipo de raza, el tipo de bacteria en el intestino de una cierta especie de pescado.
2. Datos ordinales: pueden tanto de tipo cualitativos como cuantitativos. Los valores atribuidos a los datos
son etiquetas, pero a diferencia de los anteriores, para ´ estos si est´ a prescrito un orden en particular. Por
ejemplo: las posiciones del torneo de futbol profesional Venezolano, el nivel de sensura de uan pel´ıcula.
3. Datos intervalos: s´ olo son cuantitativos. Los valores que toman los datos son num´ ericos, tienen un orden
natural y la diferencia entre los valores que toman los datos son significativas. Por ejemplo: la temperatura,
el a˜ no de naciemiento.
4. Datos raz´ on: son siempre cuantitativos. Los valores son num´ ericos, tienen orden, y la tanto la diferencia
como la raz´ on entre los valores son significativas. Por ejemplo, el peso de una persona, el volumen.
1.3. M´ etodos de recolecci´ on de datos
La recolecci´ on de datos se refiere al uso de una gran diversidad de t´ ecnicas y herramientas que pueden ser
utilizadas por el analista para desarrollar los sistemas de informaci´ on, los cuales pueden ser la entrevistas, la
encuesta, el cuestionario, la observaci´ on, el diagrama de flujo y el diccionario de datos.
Todas estos instrumentos se aplicar´ a en un momento en particular, con la finalidad de buscar informaci´ on que
ser´ a ´ util a una investigaci´ on en com´ un. En la presente investigaci´ on trata con detalle los pasos que se debe seguir
en el proceso de recolecci´ on de datos, con las t´ ecnicas ya antes nombradas.
Los analistas utilizan una variedad de m´ etodos a fin de recopilar los datos sobre una situaci´ on existente, como
entrevistas, cuestionarios, inspecci´ on de registros (revisi´ on en el sitio) y observaci´ on. Cada uno tiene ventajas y
desventajas. Generalmente, se utilizan dos o tres para complementar el trabajo de cada una y ayudar a asegurar
una investigaci´ on completa.
1.3.1. La entrevista
Las entrevistas se utilizan para recabar informaci´ on en forma verbal, a trav´ es de preguntas que propone el analis-
ta. Quienes responden pueden ser gerentes o empleados, los cuales son usuarios actuales del sistema existente,
9
usuarios potenciales del sistema propuesto o aquellos que proporcionar´ an datos o ser´ an afectados por la apli-
caci´ on propuesta. El analista puede entrevistar al personal en forma individual o en grupos algunos analistas
prefieren este m´ etodo a las otras t´ ecnicas que se estudiar´ an m´ as adelante. Sin embargo, las entrevistas no siem-
pre son la mejor fuente de datos de aplicaci´ on.
Dentro de una organizaci´ on, la entrevistas es la t´ ecnica m´ as significativa y productiva de que dispone el analista
para recabar datos. En otras palabras, la entrevistas es un intercambio de informaci´ on que se efect´ ua cara a cara.
Es un canal de comunicaci´ on entre el analista y la organizaci´ on; sirve para obtener informaci´ on acerca de las
necesidades y la manera de satisfacerlas, as´ı como concejo y comprensi´ on por parte del usuario para toda idea
o m´ etodo nuevos. Por otra parte, la entrevista ofrece al analista una excelente oportunidad para establecer una
corriente de simpat´ıa con el personal usuario, lo cual es fundamental en transcurso del estudio.
Realizar entrevistas toma tiempo; por lo tanto no es posible utilizar este m´ etodo para recopilar toda la infor-
maci´ on que se necesite en la investigaci´ on; incluso el analista debe verificar los datos recopilados utilizando
unos de los otros m´ etodos de recabaci´ on de datos. La entrevista se aplican en todos los niveles gerencial y de
empleados y dependa de quien pueda proporcionar la mayor parte de la informaci´ on ´ util para el estudio los
analistas que estudian la administraci´ on de inventarios pueden entrevistar a los trabajadores del embarque y de
recepci´ on, al personal de almac´ en y a los supervisores de los diferentes turnos, es decir. Aquellas personas que
realmente trabajan en el almac´ en, tambi´ en entrevistar´ an a los gerentes m´ as importante.
La habilidad del entrevistador es vital para el ´ exito en la b´ usqueda de hecho por medio de la entrevista. Las
buenas entrevista depende del conocimiento del analista tanto de la preparaci´ on del objetivo de una entrevista
espec´ıfica como de las preguntas por realizar a una persona determinada.
1.3.2. La encuesta
Hoy en d´ıa la palabra “encuesta” se usa m´ as frecuentemente para describir un m´ etodo de obtener informaci´ on
de una muestra de individuos. Esta “muestra” es usualmente s´ olo una fracci´ on de la poblaci´ on bajo estudio.
Por ejemplo, antes de una elecci´ on, una muestra de electores es interrogada para determinar c´ omo los candida-
tos y los asuntos son percibidos por el p´ ublico - un fabricante hace una encuesta al mercado potencial antes de
introducir un nuevo producto - una entidad del gobierno comisiona una encuesta para obtener informaci´ on para
evaluar legislaci´ on existente o para preparar y proponer nueva legislaci´ on.
No tan s´ olo las encuestas tienen una gran variedad de prop´ ositos, sino que tambi´ en pueden conducirse de mu-
chas maneras, incluyendo por tel´ efono, por correo o en persona. A´ un as´ı, todas las encuestas tienen algunas
caracter´ısticas en com´ un.
A diferencia de un censo, donde todos los miembros de la poblaci´ on son estudiados, las encuestas recogen in-
formaci´ on de una porci´ on de la poblaci´ on de inter´ es, dependiendo el tama˜ no de la muestra en el prop´ osito del
estudio. En una encuesta bona fide, la muestra no es seleccionada caprichosamente o s´ olo de personas que se
ofrecen como voluntarios para participar. La muestra es seleccionada cient´ıficamente de manera que cada per-
sona en la poblaci´ on tenga una oportunidad medible de ser seleccionada. De esta manera los resultados pueden
10
ser proyectados con seguridad de la muestra a la poblaci´ on mayor. La informaci´ on es recogida usando proce-
dimientos estandarizados de manera que a cada individuo se le hacen las mismas preguntas en mas o menos
la misma manera. La intenci´ on de la encuesta no es describir los individuos particulares quienes, por azar, son
parte de la muestra sino obtener un perfil compuesto de la poblaci´ on.
El tama˜ no de muestra requerido en una encuesta depende en parte de la calidad estad´ıstica necesaria para los
establecer los hallazgos; esto a su vez, est´ a relacionado en c´ omo esos hallazgos ser´ an usados.
A´ un as´ı, no hay una regla simple para el tama˜ no de muestra que pueda ser usada en todas las encuestas. Mucho
de esto depende de los recursos profesionales y fiscales disponibles. Los analistas frecuentemente encuentran
que una muestra de tama˜ no moderado es suficiente estad´ıstica y operacionalmente. Por ejemplo, las muy co-
nocidas encuestas nacionales frecuentemente usan cerca de 1,000 personas para obtener informaci´ on razonable
sobre actitudes y opiniones nacionales.
1.3.3. Cuestionario
Los cuestionarios proporcionan una alternativa muy ´ util para la entrevista; si embargo, existen ciertas carac-
ter´ısticas que pueden ser apropiada en algunas situaciones e inapropiadas en otra. Al igual que la entrevistas,
deben dise˜ narse cuidadosamente para una m´ axima efectividad.
Recabaci´ on de datos mediante cuestionarios. Para los analistas los cuestionarios pueden ser la ´ unica forma
posible de relacionarse con un gran n´ umero de personas para conocer varios aspectos del sistema. Cuando se
llevan a cabo largos estudios en varios departamento, se puede distribuir los cuestionarios a todas las personas
apropiadas para recabar hechos en relaci´ on al sistema. En mayor parte de los casos, el analista no ver´ a a los que
responde; no obstante, tambi´ en esto es una ventaja porque aplican muchas entrevista ayuda a asegurar que el
interpelado cuenta con mayor anonimato y puedan darse respuestas mas honesta ( y menos respuestas prehechas
o estereotipadas). Tambi´ en las preguntas estandarizadas pueden proporcionar datos m´ as confiable.
Selecci´ on de formas para cuestionarios. El desarrollo y distribuci´ on de los cuestionarios; por lo tanto, el tiem-
po invertido en esto debe utilizarse en una forma inteligente. Tambi´ en es importante el formato y contenido de
las preguntas en la recopilaci´ on de hechos significativos.
Existen dos formas de cuestionarios para recabar datos: cuestionarios abiertos y cerrados, y se aplican depen-
diendo de si los analistas conocen de antemano todas las posibles respuestas de las preguntas y pueden incluirlas.
Con frecuencia se utilizan ambas formas en los estudios de sistemas.
Cuestionario Abierto. Al igual que las entrevistas, los cuestionarios pueden ser abiertos y se aplican cuando se
quieren conocer los sentimientos, opiniones y experiencias generales; tambi´ en son ´ utiles al explorar el problema
b´ asico, por ejemplo, un analista que utiliza cuestionarios para estudiar los m´ etodos de verificaci´ on de cr´ edito,
es un medio.El formato abierto proporciona una amplia oportunidad para quienes respondan escriba las razones
de sus ideas. Algunas personas sin embargo, encuentran m´ as f´ acil escoger una de un conjunto de respuestas
preparadas que pensar por s´ı mismas.
11
Cuestionario Cerrado. El cuestionario cerrado limita las respuestas posibles del interrogado. Por medio de un
cuidadoso estilo en la pregunta, el analista puede controlar el marco de referencia. Este formato es el m´ etodo
para obtener informaci´ on sobre los hechos. Tambi´ en fuerza a los individuos para que tomen una posici´ on y
forma su opini´ on sobre los aspectos importantes.
1.3.4. La observaci´ on
Otra t´ ecnica ´ util para el analista en su progreso de investigaci´ on, consiste en observar a las personas cuan-
do efect´ uan su trabajo. Como t´ ecnica de investigaci´ on, la observaci´ on tiene amplia aceptaci´ on cient´ıfica. Los
soci´ ologos, sic´ ologos e ingenieros industriales utilizan extensamente ´ esta t´ ecnica con el fin de estudiar a las
personas en sus actividades de grupo y como miembros de la organizaci´ on. El prop´ osito de la organizaci´ on es
m´ ultiple: permite al analista determinar que se est´ a haciendo, como se est´ a haciendo, quien lo hace, cuando se
lleva a cabo, cuanto tiempo toma, d´ onde se hace y por que se hace.
El analista de sistemas puede observar de tres maneras b´ asicas. Primero, puede observar a una persona o actitud
sin que el observado se d´ e cuenta y su interacci´ on por aparte del propio analista. Quiz´ a esta alternativa tenga poca
importancia para el an´ alisis de sistemas, puesto que resulta casi imposible reunir las condiciones necesarias.
Segundo, el analista puede observar una operaci´ on sin intervenir para nada, pero estando la persona observada
enteramente consciente de la observaci´ on. Por ´ ultimo, puede observar y a la vez estar en contacto con las
personas observas. La interacci´ on puede consistir simplemente en preguntar respecto a una tarea espec´ıfica,
pedir una explicaci´ on, etc.
12
Cap´ıtulo 2
La estad´ıstica descriptiva
2.1. Distribuciones de frecuencia
Una distribuci´ on de frecuencias es una tabla usada para describir un conjunto de datos. Una tabla de frecuen-
cias muestra datos particulares o intervalos o rangos de datos llamados clases de datos. En el caso de mostrar
intervalos de datos, se define un valor, que consistir´ aen el el valor que representa a dicha clase, usualmente es
llamado marca de clase. Adem´ as la tabla de frecuencias muestra un n´ umero a continuaci´ on del dato o marca de
clase, que representa el n´ umero de veces que ´ este valor se repite en la data, a ´ este n´ umero se le llama frecuencia,
o frecuencia de la clase.
Por ejemplo: sup´ ongase que 20 estudiantes de estad´ıstica poseen las siguientes notas a continuaci´ on en una
escala de 0 a 100 puntos: 97, 92, 88, 75, 83, 67, 89, 55, 72, 78, 81, 91, 57, 63, 67, 74, 87, 84, 98, 46. Puede
construirse una tabla de frecuencias para cada nota, as´ı en ´ esta tabla tendr´ıamos unas 100 filas aproximadamente.
Para resumir espacio pudiera organizarse todo en clases tales como 90-99, 80-89, 70-79 etc. y contando el
n´ umero de datos pertenecientes a cada intervalo. As´ı obtendr´ıamos algo como sigue:
Intervalo Marca de Clase Frecuencia
90-99 94.5 4
80-89 84.5 6
70-79 74.5 4
60-69 64.5 3
50-59 54.5 2
40-49 44.5 1
Note que la suma de la columnas de frecuencias es igual a 20, el n´ umero de todos los datos existentes.
2.1.1. Terminolog´ıa adicional
1. L´ımite inferior de clase: es el menor valor en el intervalo de clase. Lo denotaremos como L
i
.
2. L´ımite superior de clase: es el mayor valor en el intervalo de clase. Lo denotaremos como L
s
.
13
3. Ancho de clase: es la diferencia entre dos l´ımites de clases superiores (o inferiores) consecutivos. Todos
las clases deber´ıan tener el mismo ancho.
4. Marca de clase: es por lo general el valor medio de los datos de cada intervalo. Pudiera escogerse otro
criterio para definir la marca de clase, no tiene mucha importancia, sin embargo, cualquiera sea la esco-
gencia que se haga, lo importante es que ´ este dato represente todo el intervalo de clase. Lo denotaremos
por L
c
.
L
c
=
L
i
+L
s
2
. (2.1)
Ejemplo: Para la tabla de frecuencias anterior de las notas de los ex´ amenes de estad´ıstica, se tiene que: los
l´ımites superiores de clase son: 99, 89, 79, 69, 59, y 49; los l´ımites inferiores de clase son: 90, 80, 70, 60, 50, y
40. Las marcas de clase son: 94.5, 84.5, 74.5, 64.5, 54.5, y 44.5. El ancho de cada clase es 10.
2.1.2. Creando una tabla de frecuencias
Para crear table de frecuencias es necesario seguir los pasos a continuaci´ on.
1. Lo m´ as importantes es contar o disponer de alguna data que sea de utilidad y con la cual se quisiera
estimar algunos valores y/o caracter´ısticas importantes de inter´ es.
2. Decidir deacuerdo al n´ umero de datos y las caracter´ısticas de los mismos las clases necesarias para opti-
mizar los resultados y agilizar los c´ alculos seguidos.
3. Dividir el rango de la data por el n´ umero de clases para obtener un estimado del ancho de las clases.
Rango = Mayor valor −Menor valor. (2.2)
4. Decidir los l´ımites de las clases.
5. Construir la tabla de frecuencia contando el n´ umero de datos en cada uno de los intervalos de clase.
El n´ umero de tramos en los que se agrupa la informaci´ on es una decisi´ on que debe tomar el analista: la regla
es que mientras m´ as tramos se utilicen menos informaci´ on se pierde, pero puede que menos representativa e
informativa sea la tabla.
Ejercicio: Construiremos a continuaci´ on una tabla de frecuencias con 6 marcas de clases o intervalos de
clase para la data siguiente. Los datos se corresponden con los montos pagados por 28 conductores diferentes
en una estaci´ on de gasolina, por el consumo de la misma. Los montos son en Bol´ıvares Fuertes (Bs.F): 7, 4, 18,
4, 9, 8, 8, 7, 6, 2, 9, 5, 9, 12, 4, 14, 15, 7, 10, 2, 3, 11, 4, 4, 9, 12, 5, 3.
Soluci´ on: En este caso se tendr´ a como dato que se quiere hacer una tabla que tenga ni m´ as ni menos 6 initervalos
de clase, por tanto, observando la data nos daremos cuenta que el menor monto pagado es 2 mientras que el
mayor es 18, por tanto, el rango de la clase ser´ a aproximadamente 18−2 =16, y por tanto para estimar el ancho
de cada clase dividimos el n´ umero calculado anteriormente entre el n´ umero de clases dispuesto, as´ı cada clase
tendr´ a un ancho de
16
6
= 2,66. Tendremos en definitiva algo como lo que sigue:
14
Clase Intervalo Marca de Clase Frecuencia
Clase I 1-3 2 4
Clase II 4-6 5 8
Clase III 7-9 8 9
Clase IV 10-12 11 4
Clase V 13-15 14 2
Clase VI 16-18 17 1
2.1.3. Notaci´ on Matem´ atica
En lo que sigue se usar´ a la siguiente simbolog´ıa y las siguientes variables que usaremos para referirnos a objetos
o valores que definiremos en adelante, a menos que se indique otra cosa.
Representaremos los valores que toma una cierta variable en una cierta data como x, n representar´ a el n´ umero de
valores en el conjunto de datos muestrales, N el n´ umero de valores en el conjunto poblacional, y f la frecuencia
de cada datos o cada marca de clase. Como siempre usaremos la simbolog´ıa ∑ para indicar la suma de todos los
valores de una variable o expresi´ on.
Usando ´ esta notaci´ on, y de manera obvia, pudiera escribirse la sentencia de que la suma de todas las frecuencias
en la tabla de frecuencias es igual al n´ umero de valores en el conjunto de los datos,
N

i=1
f
i
= n. (2.3)
2.1.4. Frecuencia acumulada
La frecuencia acumulada de una clase de datos es el n´ umero de elementos que existe en esa clase y todos los
de las clases previas. En otras palabras, la frecuencia acumulada de una clase es la frecuencia de la clase m´ as
todas las frecuencias de las clases anteriores a ´ esta. Puede ser tanto decreciente como creciente, si se acumulan
las frecuencias desde la ´ ultima clase o la primera clase respectivamente.
Ejemplo: En la data presentada acerca de las notas de los ex´ amenes de estad´ıstica puediera construirse la
siguiente tabla de frecuencias acumuladas:
Clase Intervalo Marca de Clase Frecuencia Frec. Acumulada ↑ Frec. Acumulada ↓
I 90-99 94.5 4 4 20
II 80-89 84.5 6 10 16
III 70-79 74.5 4 14 10
IV 60-69 64.5 3 17 6
V 50-59 54.5 2 19 3
VI 40-49 44.5 1 20 1
N´ otese que la ´ ultima entrada en la columna de la frecuencia acumulada creciente es justamente n = 20, lo mis-
mo sucede para la frecuencia acumulada decreciente.
Ejercicio: A˜ nadiremos a la tabla de frecuencias para el caso de los consumos de gasolina, dos nuevas colum-
15
nas para la frecuencia acumulada creciente y decreciente respectivamente.
Soluci´ on: Tendremos en definitiva algo como lo que sigue:
Clase Intervalo Marca de Clase Frecuencia Frec. Acumulada ↑ Frec. Acumulada ↓
Clase I 1-3 2 4 4 28
Clase II 4-6 5 8 12 24
Clase III 7-9 8 9 21 16
Clase IV 10-12 11 4 25 7
Clase V 13-15 14 2 27 3
Clase VI 16-18 17 1 28 1
2.1.5. La frecuencia relativa
La frecuencia relativa de un dato o marca de clase se define como el porcentaje de elementos en esa clase en
relaci´ on con el total de datos de la muestra. Se denota por f
ri
. Es sencillo calcular la frecuencia relativa como:
f
ri
=
f
i
n
. (2.4)
En vista que el n´ umero f
i
es siempre menor que n, por razones m´ as que obvias, es entonces inmediato que f
ri
es un n´ umero que puede oscilar entre los valores 0 y 1, es decir, 0 ≤ f
ri
≤ 1. Adicionalmente pudiera definirse
la frecuencia relativa porcentual como:
f
ri
% = f
ri
×100%. (2.5)
Ejemplo: Para la tabla anterior tendremos:
Clase Intervalo Marca de Clase Frec. Frec. Acum. ↑ Frec. Relat.
Clase I 1-3 2 4 4 .142
Clase II 4-6 5 8 12 .285
Clase III 7-9 8 9 21 .321
Clase IV 10-12 11 4 25 .142
Clase V 13-15 14 2 27 .071
Clase VI 16-18 17 1 28 .035
Note que la suma de todas las frecuencias relativas en la columna, suma aproximadamente 1, coincidente con el
hecho de que existe una posibilidad de 100% de que pudiera ocurrier “cualquiera” de las cosas que describen
la data, si pasa alguna de ellas, por su puesto.
2.1.6. Los histogramas
Un histograma es una representaci´ on gr´ afica de una variable en forma de barras, donde la superficie de cada ba-
rra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias,
y en el eje horizontal los valores de las variables, normalmente se˜ nalando las marcas de clase, es decir, la mitad
del intervalo en el que est´ an agrupados los datos. Un histograma es un resumen gr´ afico de la variaci´ on de un
conjunto de datos. La naturaleza gr´ afica del histograma nos permite ver pautas que son dif´ıciles de observar en
una simple tabla num´ erica. Esta herramienta se utiliza especialmente en la Comprobaci´ on de teor´ıas y Pruebas
16
de validez.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por co-
modidad, sus valores se agrupan en clases, es decir, valores contiguos. En los casos en los que los datos son
cualitativos (no-num´ ericos), como sexo, grado de acuerdo o nivel de estudios, es preferible un diagrama de
sectores.
Sabemos que los valores var´ıan en todo conjunto de datos. Esta variaci´ on sigue cierta pauta. El prop´ osito del
an´ alisis de un histograma es, por un lado, identificar y clasificar la pauta de variaci´ on, y por otro desarrollar
una explicaci´ on razonable y relevante de la pauta. La explicaci´ on debe basarse en los conocimientos generales
y en la observaci´ on de las situaciones espec´ıficas y debe ser confirmada mediante un an´ alisis adicional. Las
pautas habituales de variaci´ on m´ as comunes son la distribuci´ on en campana, con dos picos, plana, en peine,
sesgada, truncada, con un pico aislado, o con un pico en el extremo. Los histogramas son m´ as frecuentes en
ciencias sociales, humanas y econ´ omicas que en ciencias naturales y exactas. Y permite la comparaci´ on de los
resultados de un proceso.
Construcci´ on de un histograma
1. Paso 1: Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.
2. Paso 2: Obtener el n´ umero de clases, existen varios criterios para determinar el n´ umero de clases (o
barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es exacto. Algunos autores
recomiendan de cinco a quince clases, dependiendo de c´ omo est´ en los datos y cu´ antos sean. Un criterio
usado frecuentemente es que el n´ umero de clases debe ser aproximadamente a la ra´ız cuadrada del n´ umero
de datos. Por ejemplo, la ra´ız cuadrada de 30 ( n´ umero de art´ıculos) es mayor que cinco, por lo que se
seleccionan seis clases.
3. Paso 3: Establecer la longitud de clase: es igual al rango entre el n´ umero de clases.
4. Paso 4: Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en
relaci´ on al resultado del PASO 2 en intervalos iguales.
5. Paso 5: Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace un
gr´ afico de barras, las bases de las barras son los intervalos de clases y altura son la frecuencia de las clases.
Si se unen los puntos medios de la base superior de los rect´ angulos se obtiene el pol´ıgono de frecuencias.
Ejemplo: A una fabrica de envases de vidrio, un cliente le est´ a exigiendo que la capacidad de cierto tipo de
botella sea de 13 ml, con una tolerancia de m´ as menos 1 ml. La f´ abrica establece un programa de mejora de
calidad para que las botellas que se fabriquen cumplan con los requisitos del cliente. Al realizar el muestreo se
obtienen los siguientes datos de las capacidades de botellas al azar: 11, 12, 13, 12, 13, 14, 14, 15, 11, 12, 13,
12, 14, 15, 11, 12, 16, 16, 14, 13, 14, 14, 13, 15, 15.
En ´ este caso puede seguirse los pasos anteriormente explicitados y entonces:
Rango = Mayor valor −Menor valor = 16 −11 = 5.
# de clases =

25 = 5.
Longitud de la clase =
5
5
= 1.
17
Se tiene entonces:
Clase Intervalo Marca de Clase Frec. Frec. Acum. ↑ Frec. Relat.
Clase I 11-12 11.5 3 3 .12
Clase II 12-13 12.5 5 8 .20
Clase III 13-14 13.5 5 13 .20
Clase IV 14-15 14.5 6 19 .24
Clase V 15-16 15.5 6 25 .24
El histograma de frecuencias se muestra a continuaci´ on:
Figura 2.1: As´ı luce un histograma de frecuencias.
Ejemplos de otros tipos de representaciones gr´ aficas
Hay histogramas donde se agrupan los datos en clases, y se cuenta cu´ antas observaciones (frecuencia absoluta)
hay en cada una de ellas. En algunas variables (variables cualitativas) las clases est´ an definidas de modo natural,
por ejemplo, sexo con dos clases: mujer, var´ on o grupo sangu´ıneo con cuatro: A, B, AB, O. En las variables
cuantitativas, las clases hay que definirlas expl´ıcitamente (intervalos de clase).
Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuencias, absolutas o relativas,
en el de ordenadas (eje vertical).
Varias posibilidades:
Un pol´ıgono de frecuencias es un gr´ afico de linea que representa la informaci´ on de la tabla de frecuencias. Justo
como los histogramas, el eje vertical representa las frecuencias, que pueden ser tambi´ en las relativas, mientras
que el eje horizontal representa la medici´ on de la variable en el conjunto de datos. Para construir el gr´ afico,
un punto es dibujado por cada marca de clase, en el caso del histograma es el punto en la parte m´ as alta de la
barra y en la mitad de la misma, ´ este punto representa, por su puesto, la frecuencia de la clase. Para terminar
se conectan todos los puntos con lineas rectas. Los pol´ıgonos de frecuencias ser´ a de mucha utilidad luego para
estimar la curva de predicci´ on y para estimar el tipo de distribuci´ on particular que sigue el fen´ omeno.
18
Figura 2.2: Ejemplo de como debe construirse un histograma simple.
Figura 2.3: Muchas posibilidades para la construcci´ on del histograma.
2.2. Medidas de Tendencia Central (MTC)
Una Medida de Tendencia Central es un valor usado para representar el “promedio” t´ıpico en el conjunto de los
datos.
19
Al describir grupos de observaciones, con frecuencia se desea describir el grupo con un solo n´ umero. Para tal
fin, desde luego, no se usar´ a el valor mas elevado ni el valor mas peque˜ no como ´ unico representante, ya que solo
representan los extremos. Mas bien que valores t´ıpicos. Entonces ser´ıa mas adecuado buscar un valor central.
Las medidas que describen un valor t´ıpico en un grupo de observaciones suelen llamarse medidas de tenden-
cia central..Es importante tener en cuenta que estas medidas se aplican a grupos mas bien que a individuos.
un promedio es una caracter´ıstica de grupo, no individual. Entre las medidas de tendencia se encuentran las
siguientes.
2.2.1. La Media Aritmetica
La medida de tendencia central mas obvia que se puede elegir, es el simple promedio de las observaciones
del grupo, es decir el valor obtenido sumando las observaciones y dividiendo esta suma por el n´ umero de
observaciones que hay en el grupo. La media resume en un valor las caracter´ısticas de una variable teniendo en
cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas
2.2.2. La Media
La suma de todos los valores de el conjunto de datos dividido por el n´ umero de valores en la data es lo que
se conoce como la media. La media para el espacio muestral es denotada por ¯ x mientras que la media para la
poblaci´ on es denotada porla letra griega µ.
¯ x =

n
i=1
x
i
n
, para los valores de la muestra, (2.6)
µ =

N
i=1
x
i
N
, para los valores de la poblaci´ on. (2.7)
Ejemplo: El promedio o la media de los resultados en un examen de f´ısica cuyas notas han sido: 10, 15, 17,
7, 16, 8, 10, 19, 15, 10, 8; es:
¯ x =

n
i=1
x
i
n
=
135
11
= 12,27.
Ejercicio: Calcular la media de cada uno de los ejemplos explicitados en las secciones anteriores.
2.2.3. La Mediana
La mediana es un valor el cual separa el 50 % de los valores mayores de la data del 50 % restante menor. Para
calcular la mediana, lo m´ as sencillos es localizar todos los datos en orden, y entonces buscar el punto medio de
los mismos. Si n es impar, el valor medio ser´ a justamente la mediana; por el contrario si n es par, entonces la
mediana ser´ a el valor medio de los dos valores centrales. Utilizaremos como notaci´ on la siguiente para referir-
nos a ´ este valor, x
0,5
.
Ejemplo: La mediana para el conjunto de datos de las notas del examen de f´ısica puede calcularse ordenando
as´ı:
7, 8, 8, 10, 10, 10, 15, 15, 16, 17, 19 (2.8)
20
vemos el n = 11, por tanto la mediana es el dato del centro de esta distribuci ´ on ordeada, el cual es el dato con
el orden 6to, es decir x
0,5
= 10.
Ejercicio: Calcular la mediana de cada uno de los ejemplos explicitados en las secciones anteriores.
2.2.4. La moda
De todos los valores de la data, la moda resulta ser el valor que aparece repetida el mayor n´ umero de veces
en el conjunto, o lo que es lo mismo, el dato con mayor frecunecia. Pudiera pasar que dos o varios datos se
repitieran con la misma frecuencia, en este caso, se considera llamar a la distribuci´ on con un nombre particular
en virtud de cuantos valores moda existan, asi, si s´ olo un valor es que el tiene mayor frecuencia, entonces, a
esta distribuci´ on se le llamar´ a unimodal; si tiene dos modas, entonces, se le llamar´ a bimodal y si tiene m´ as se le
llamar´ a polimodal.
Ejemplo: La moda para el conjunto de datos de las notas del examen de f´ısica puede calcularse ordenando
as´ı:
7, 8, 8, 10, 10, 10, 15, 15, 16, 17, 19 (2.9)
vemos el dato con mayor frecuencia es el 10, por tanto la moda es el 10.
Ejercicio: Calcular la moda de cada uno de los ejemplos explicitados en las secciones anteriores.
2.2.5. Propiedades de la media, mediana y moda
Propiedades de la media
1. La media es la m´ as com´ un de todas las medidas de tendencia central usadas para el an´ alisis de los datos.
2. Todo conjunto de datos de nivel de intervalo y de nivel de raz´ on tiene un valor medio.
3. Al evaluar la media se incluyen todos los valores.
4. Un conjunto de datos s´ olo tiene una media. Esta es un valor ´ unico.
5. La media es una medida muy ´ util para comparar dos o m´ as poblaciones.
6. La media es la ´ unica medida de ubicaci´ on donde la suma de las desviaciones de cada valor con respecto
a la media, siempre ser´ a cero.
n

i=1
(x
i
− ¯ x) = 0. (2.10)
7. La media podr´ıa no ser un promedio adecuado para representar datos no regulares. La media se ve afec-
tada de modo notable por valores extraordinariamente grandes o peque˜ nos.
8. No se puede determinar la media de datos de extremo abierto (Ej: U$S 100.000 y mayor).
Propiedades de la mediana
1. Es ´ unica, s´ olo existe una mediana para un conjunto de datos.
2. No se ve afectada por valores muy grandes o muy peque˜ nos.
3. Puede calcularse para una distribuci´ on de frecuencias con una clase de extremo abierto, si la medina no
se encuentra en una clase de tal extremo.
4. Puede obtenerse para datos de nivel de raz´ on, de intervalo y ordinal (excepto para el nominal).
21
Propiedades de la moda
1. Puede determinarse para todos los niveles de datos: nominal, ordinal, de intervalo y de raz´ on.
2. No se ve afectada por valores muy altos o muy bajos.
3. Al igual que la mediana, puede utilizarse como medida de tendencia central para distribuciones con clases
de extremo abierto.
4. Para muchos conjuntos de datos no hay valor modal porque ning´ un valor aparece m´ as de una vez.
5. Para algunos conjuntos de datos hay m´ as de una moda (bimodal = que tiene dos modas).
2.2.6. El promedio ponderado
Es un caso especial de la media aritm´ etica. Se denomina media ponderada de un conjunto de n´ umeros al resul-
tado de multiplicar cada uno de los n´ umeros por un valor particular para cada uno de ellos, llamado su peso,
obteniendo a continuaci´ on la suma de estos productos, y dividiendo el resultado de esta suma de productos entre
la suma de los pesos seg´ un la caracter´ıstica de cada n´ umero inicial. Este “peso” depende de la importancia o
significancia de cada uno de los valores.
Para una serie de datos, X =x
1
, x
2
, ..., x
n
, a la que corresponden los pesos W =w
1
, w
2
, ..., w
n
, la media ponderada
se calcula como:
¯ x
W
=

n
i=1
x
i
w
i

n
i=1
w
i
, (2.11)
o:
¯ x
W
=
x
1
w
1
+x
2
w
2
+x
3
w
3
+... +x
n
w
n
w
1
+w
2
+w
3
+... +w
n
. (2.12)
Un ejemplo es la obtenci´ on de la media ponderada de las notas de una oposici´ on en la que se asigna distinta
importancia (peso) a cada una de las pruebas de que consta el examen.
Ejercicio: Promedio de puntos del grado. Asignamos a los grados las letra con los valores: A = 4, B = 3,
C =2, D=1, F =0, y entonces cada valor del grado se cuenta seg´ un el n´ umero de los cr´ editos ganados con ese
grado. Calcular el grado de un estudiante que ha ganado 12 cr´ editos de las A, 21 cr´ editos de los B, 5 cr´ editos
de las C y 3 cr´ editos de D’s.
Ejercicio: Grado del curso. El nota final en este curso se calcula seg´ un la escala siguiente: La preparaci´ on
cuenta con el 15 %, el 20 % por cada ex´ amen de tres que hay, y el examen final vale el 25 %. Podemos sacar la
cuenta para cada componente del grado final con su porcentaje para calcular el grado final. Calcular la cuenta
final para un estudiante que ha anotado 95 en la preparaci´ on, tiene notas de los examenes de 83, 94, y 77, y
una nota en el examen final es de 88.
2.2.7. Otros tipos de medias
Media cuadr´ atica
La media cuadr´ atica es igual a la ra´ız cuadrada de la suma de los cuadrados de los valores dividida entre el
n´ umero de datos:
¯ x =
2
¸

n
i=1
a
2
i
n
=
2
¸
a
2
1
+a
2
2
+· · · +a
2
n
n
. (2.13)
22
Esta media como medida de asociaci´ on tiene aplicaciones tanto en ciencias biol´ ogicas como en medicina.
A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los errores de medida. En
tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo. Este problema
se resuelve, mediante la denominada media cuadr´ atica. Consiste en elevar al cuadrado todas las observaciones
(as´ı los signos negativos desaparecen), en obtener despu´ e´ es su media aritm´ e´ etica y en extraer, finalmente, la ra´ız
cuadrada de dicha media para volver a la unidad de medida original.
Media geom´ etrica
La media geom´ etrica de una cantidad finita de n´ umeros (digamos n n´ umeros) es la ra´ız n-´ esima del producto de
todos los n´ umeros.
¯ x =
n
¸
n

i=1
x
i
=
n

x
1
· x
2
· · · x
n
. (2.14)
Por ejemplo, la media geom´ etrica de 2 y 18 es
2

2 · 18 =
2

36 = 6.
Otro ejemplo, la media de 1, 3 y 9 seria
3

1 · 3 · 9 =
3

27 = 3.
S´ olo es relevante la media geom´ etrica si todos los n´ umeros son positivos. Si uno de ellos es 0, entonces el
resultado es 0. Si hay un n´ umero negativo (o una cantidad impar de ellos) entonces la media geom´ etrica es, o
bien negativa o bien inexistente en los n´ umeros reales.
En muchas ocasiones se utiliza su trasformaci´ on en el manejo estad´ıstico de variables con distribuci´ on no nor-
mal.
La media geom´ etrica es relevante cuando varias cantidades son sumadas para producir un total.
Media arm´ onica
La media arm´ onica, representada por H, de una cantidad finita de n´ umeros es igual al rec´ıproco, o inverso, de la
media aritm´ etica de los rec´ıprocos de dichos n´ umeros. As´ı, dados los n´ umeros a
1
, a
2
, ..., a
n
, la media arm´ onica
ser´ a igual a:
H =
n

n
i=1
1
a
i
=
n
(
1
a
1
+· · · +
1
a
n
)
. (2.15)
La media arm´ onica resulta poco influida por la existencia de determinados valores mucho m´ as grandes que el
conjunto de los otros, siendo en cambio sensible a valores mucho m´ as peque˜ nos que el conjunto.
La media arm´ onica no est´ a definida en el caso de la existencia en el conjunto de valores nulos.
23
Media generalizada
La media generalizada es una abstracci´ on de los diversos tipos de media (geom´ etrica, aritm´ etica, arm´ onica, etc).
Se define como:
¯ x(m) =
_
m
_
1
n

n
i=1
x
m
i
si m 0
n
_

n
i=1
x
i
si m = 0
_
, (2.16)
en donde el par´ ametro m indica si la media es:
aritm´ etica, con m = 1,
geom´ etrica, con m = 0,
arm´ onica, con m = −1,
cuadr´ atica, con m = 2.
Obs´ ervese que para valores de m ≤ 0 la expresi´ on s´ olo tiene sentido si todos los x
i
≥ 0.
Ejercicio: Calcule los valores de las medias anteriormente definiddas para todas las situaciones y conjunto
de datos anteriores.
2.2.8. Formas de las distribuciones de datos
Podemos clasificar varias formas de las distribuciones de datos deacuerdo al lugar que ocupan las medidas de
tendencia central m´ as usuales anteriormente definidas.
Sim´ etrica
La distribuci´ on de datos es aproximadamente de la misma forma a ambos lados de la linea central, en donde
se encuentra aproximadamente la media. La media y la mediada (y la moda, si es unimodal) son pr´ acticamente
iguales en una distribuci´ on sim´ etrica.
Figura 2.4: Una distribuci´ on sim´ etrica. Ve´ ase la igual proporci´ on de barras con alturas aproximadas a ambos
lados de la media.
24
Sesgada a la derecha
Unos cuantos valores se encuentran la izquierda de la media, pero la mayor´ıa de todos los datos se encuentran
muy agrupados y acumulados a la derecha de la misma. Generalmente la mediana es m´ as peque˜ na que la media.
Por lo tanto, en ´ este caso, la media se encuentra a la derecha de la mediana.
Figura 2.5: Una distribuci´ on sezgada a la derecha. Ve´ ase la desigual proporci´ on de barras con alturas aproxima-
das a ambos lados de la media.
Sesgada a la izquierda
Unos cuantos valores se encuentran la derecha de la media, pero la mayor´ıa de todos los datos se encuentran
muy agrupados y acumulados a la izquierda de la misma. Generalmente la mediana es m´ as grande que la media.
Por lo tanto, en ´ este caso, la media se encuentra a la izquierda de la mediana.
Figura 2.6: Una distribuci´ on sezgada a la izquierda. Ve´ ase la igual proporci´ on de barras con alturas aproximadas
a ambos lados de la media.
Uniforme
Todos los datos est´ an igualmente representados.
2.3. Medidas de variaci´ on
Para conseguir una visi´ on completa y comprensiva de los datos hay que complementar las medidas de tendencia
central con las de otras propiedades de los mismos. Por ejemplo, el grado en que los datos se parecen o diferen-
25
Figura 2.7: Una distribuci´ on uniforme. Las barras tienen aproximadamente la misma altura a ambos lados de la
media.
cian entre s´ı. A esta propiedad se la denomina variabilidad o variaci´ on. Entre los indicadores de variaci´ on m´ as
utilizados est´ an la varianza y la desviaci´ on t´ıpica.
Las medidas de dispersi´ on, como tambi´ en se les conoce, muestran la variabilidad de una distribuci´ on, indicando
por medio de un n´ umero o estad´ıstico si las diferentes puntuaciones de una variable est´ an muy alejadas de la
media. Cuanto mayor sea ese valor mayor ser´ a la variabilidad, cuanto menor sea, mas homog´ eneo ser´ a a la
media. As´ı se sabe si todos los casos son parecidos o var´ıan mucho entre ellos.
Para calcular la variabilidad que una distribuci´ on tiene respecto de su media, se calcula la media de las desvia-
ciones de las puntuaciones respecto a la media aritm´ etica. Pero la suma de las desviaciones es siempre cero,
as´ı que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor
absoluto (Desviaci´ on media) y otra es tomando las desviaciones al cuadrado (Varianza).
2.3.1. Rango
El rango estad´ıstico es la diferencia entre el valor m´ınimo y el valor m´ aximo en un grupo de n´ umeros. Para
averiguar el rango de un grupo de n´ umeros: ordenamos los n´ umeros seg´ un su tama˜ no, y luego restamos el valor
m´ınimo del valor m´ aximo.
2.3.2. La Varianza
Es el promedio de las distancias al cuadrado desde los valores en x
i
hasta la media ¯ x en una muestra de n sujetos.
Se denota usualmente por s
2
x
s
2
x
=

i=1
(x
i
− ¯ x)
2
n −1
, varianza muestral, (2.17)
s
2
x
=

i=1
(x
i
−µ)
2
N
, varianza poblacional. (2.18)
La varianza es una variable estad´ıstica que mide la dispersi´ on de los valores respecto a un valor central (media),
es decir, la media de las diferencias cuadr´ aticas de n puntuaciones respecto a su media aritm´ etica.
26
Propiedades
La varianza es siempre positiva o 0: S
2
X
≥ 0.
Si a los datos de la distribuci´ on les sumamos una cantidad constante la varianza no se modifica. Sea
Y
i
= X
i
+k, entonces
S
2
Y
=
∑(Y
i

¯
Y)
2
n
=
∑[(X
i
+k) −(
¯
X +k)]
2
n
=
∑(X
i
+k −
¯
X −k)
2
n
=
∑(X
i

¯
X)
2
n
= S
2
X
(2.19)
Si a los datos de la distribuci´ on les multiplicamos una constante, la varianza queda multiplicada por el
cuadrado de esa constante. Si Y
i
= X
i
· k, entonces
S
2
Y
=
∑(Y
i

¯
Y)
2
n
=
∑(X
i
· k −
¯
X · k)
2
n
=
∑[k · (X
i

¯
X)]
2
n
=
∑[k
2
· (X
i

¯
X)
2
]
n
= k
2
· S
2
X
(2.20)
Propiedad distributiva: S
2
(X+Y)
= S
2
X
+S
2
Y
.
Si tenemos k grupos con tama˜ nos n
1
, ..., n
k
, y con medias y varianzas conocidas ( ¯ x
1
, ¯ x
2
, ..., ¯ x
k
) y (S
2
1
, S
2
2
, ..., S
2
k
),
entonces se puede definir la varianza total como:
s
2
T
=

i
n
i
S
2
i

i
n
i
+

j
n
j
(x
j
− ¯ x
T
)
2

j
n
j
, (2.21)
donde
¯ x
T
=

i
n
i
¯ x
i

i
n
i
. (2.22)
2.3.3. La Desviaci´ on Est´ andar
La varianza a veces no se interpreta claramente ya que se mide en unidades cuadr´ aticas. Para evitar ese problema
se define otra medida de dispersi´ on, que es la desviaci´ on t´ıpica, que se halla como la ra´ız cuadrada positiva de la
varianza. La desviaci´ on t´ıpica nos informa sobre la dispersi´ on de los datos respecto al valor de la media; cuanto
mayor sea su valor, m´ as dispersos estar´ an los datos.
S
x
=
¸

n
i=1
(x
i
− ¯ x)
2
n −1
, Desviaci´ on t´ıpica muestral (2.23)
σ
x
=
_

n
i=1
(X
i
−µ)
2
N
, Desviaci´ on t´ıpica poblacional (2.24)
2.3.4. La Desviaci´ on Media
Es la otra posibilidad para conocer la variabilidad de los datos en la distribuci´ on de frecuencias sin tener que
elebar al cuadrado la diferencia de datos respecto de la media:
d
M
=

i
(x
i
− ¯ x)
n
. (2.25)
Ejercicio: Calcule todas la medidas de variabilidad definiddas para todas las situaciones y conjunto de datos
anteriores.
27
2.3.5. Covarianza
La covarianza entre dos variables es un estad´ıstico resumen indicador de si las puntuaciones est´ an relacionadas
entre s´ı. La formulaci´ on cl´ asica, se simboliza por la letra griega sigma (σ
xy
) cuando ha sido calculada en la
poblaci´ on. Si se obtiene sobre una muestra, se designa por la letra “s
xy
”.
La formula suele aparecer expresada como:
ˆ
S
xy
=

n
i=1
x
i
y
i
n −1
=

n
i=1
(X
i

¯
X)(Y
i

¯
Y)
n −1
. (2.26)
Este tipo de estad´ıstico puede utilizarse para medir el grado de relaci´ on de dos variables si ambas utilizan una
escala de medida a nivel de intervalo/raz´ on (variables cuantitativas).
La expresi´ on se resuelve promediando el producto de las puntuaciones diferenciales por su tama˜ no muestral (n
pares de puntuaciones, n −1 en su forma insesgada). Este estad´ıstico, refleja la relaci´ on lineal que existe entre
dos variables. El resultado num´ erico fluctua entre los rangos de +infinito a -infinito. Al no tener unos l´ımites
establecidos no puede determinarse el grado de relaci´ on lineal que existe entre las dos variables, solo es posible
ver la tendencia.
Propiedades
−∞ ≤ S
xy
≤ +∞.
Se tiene que
S
xy
=
_
¸
_
¸
_
> 0, Correlaci´ on directa. Recta de regresi´ o creciente.
= 0, No hay correlaci´ on.
< 0. Correlaci´ on inversa. Recta de regresi´ on decreciente.
(2.27)
2.3.6. Coeficiente de Correlaci´ on de Pearson
El coeficiente de correlaci´ on de Pearson, r, nos permite saber si el ajuste de la nube de puntos a la recta de regre-
si´ on obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones
t´ıpicas (ra´ız cuadrada de las varianzas).
r =
V
xy
_
V
x
V
y
=
S
xy
_
S
2
x
S
2
y
=
S
xy
S
x
S
y
. (2.28)
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos
expresiones siguientes:
r =
∑x
i
y
i
n
− ¯ x¯ y
_
_
∑x
2
i
n
−x
−2
__
∑y
2
i
n
−y
−2
_
, (2.29)
r =
n∑x
i
y
i
−∑x
i ∑y
i
_
_
n∑x
2
i
−(∑x
i
)
2
__
n∑y
2
i
−(∑y
i
)
2
_
. (2.30)
28
Propiedades
El coeficiente de correlaci´ on, r, presenta valores entre -1 y +1.
Cuando r es pr´ oximo a 0, no hay correlaci´ on lineal entre las variables. La nube de puntos est´ a muy
dispersa o bien no forma una l´ınea recta. No se puede trazar una recta de regresi´ on.
Cuando r es cercano a +1, hay una buena correlaci´ on positiva entre las variables seg´ un un modelo lineal
y la recta de regresi´ on que se determine tendr´ a pendiente positiva, ser´ a creciente.
Cuando r es cercano a -1, hay una buena correlaci´ on negativa entre las variables seg´ un un modelo lineal
y la recta de regresi´ on que se determine tendr´ a pendiente negativa: es decreciente.
Figura 2.8: El coeficiente de correlaci´ on de Pearson establece la posibilidad de un ajuste de los puntos en la
muestra.
2.3.7. Coeficientes de asimetr´ıa y curtosis
Asimetr´ıa
Hemos comentado que el concepto de asimetr´ıa se refiere a si la curva que forman los valores de la serie pre-
senta la misma forma a izquierda y derecha de un valor central.
Para medir el nivel de asimetr´ıa se utiliza el llamado Coeficiente de Asimetr´ıa de Fisher, que viene definido:
g =
∑i
(x
i
−¯ x)
3
n
_
∑i
(x
i
−¯ x)
2
n
_
3/2
. (2.31)
Los resultados pueden ser los siguientes:
g = 0 (distribuci´ on sim´ etrica; existe la misma concentraci´ on de valores a la derecha y a la izquierda de la
media).
g > 0 (distribuci´ on asim´ etrica positiva; existe mayor concentraci´ on de valores a la derecha de la media
que a su izquierda).
g < 0 (distribuci´ on asim´ etrica negativa; existe mayor concentraci´ on de valores a la izquierda de la media
que a su derecha).
29
Figura 2.9: Distintas posibilidades de la forma del histograma en relaci´ on con el valor num´ erico de el coeficiente
de Fisher.
Curtosis
El Coeficiente de Curtosis analiza el grado de concentraci´ on que presentan los valores alrededor de la zona
central de la distribuci´ on.
Se definen 3 tipos de distribuciones seg´ un su grado de curtosis:
1. Distribuci´ on mesoc´ urtica: presenta un grado de concentraci´ on medio alrededor de los valores centrales
de la variable (el mismo que presenta una distribuci´ on normal).
2. Distribuci´ on leptoc´ urtica : presenta un elevado grado de concentraci´ on alrededor de los valores centrales
de la variable.
3. Distribuci´ on platic´ urtica: presenta un reducido grado de concentraci´ on alrededor de los valores centrales
de la variable.
El Coeficiente de Curtosis viene definido por la siguiente f´ ormula:
k =
∑i
(x
i
−¯ x)
4
n
_
∑i
(x
i
−¯ x)
2
n
_
2
−3 (2.32)
Los resultados pueden ser los siguientes:
k = 0 (distribuci´ on mesoc´ urtica).
k > 0 (distribuci´ on leptoc´ urtica ).
k < 0 (distribuci´ on platic´ urtica).
Ejercicio: Calcule los valores de los coeficientes de simetr´ıa de Fisher y de Curtosis para todas las situaciones
y conjunto de datos anteriores. Identifique los tipos de gr´ aficas que sean.
2.4. Teorema que envuelven cuestiones sobre la Desviaci´ on Est´ andar
La desviaci´ on est´ andar de una data es una cantidad importante debido a que limita el n´ umero de valores que
pueden ser encontrados en alguna determinada regi´ on de la distribuci´ o respecto del promedio.
30
Figura 2.10: Distintas posibilidades de la forma del histograma en relaci´ on con el valor num´ erico de el coefi-
ciente de curtosis.
2.4.1. La regla emp´ırica
Aplica s´ olo cuando la distribuci´ on de datos es del tipo campana, y establec que:
Aproximadamente el 68 % de los datos se encuentran a una desviaci´ on est´ andar de la media, es decir en
el intervalo [ ¯ x −σ, ¯ x +σ],
aproximadamente el 95 % de los datos se encuentran a dos desviaci´ on est´ andar de la media, es decir en
el intervalo [ ¯ x −2σ, ¯ x+2σ],
aproximadamente el 99 % de los datos se encuentran a tres desviaci´ on est´ andar de la media, es decir en
el intervalo [ ¯ x −3σ, ¯ x+3σ]
2.4.2. Teorema de Chebychev
Aplica a cualquier tipo de data. Estavlece que la porci´ on de valores que deben estar a k-desviaciones de la media
est´ a como m´ınimo a 1 −
1
k
2
.
Nota: el teorema de Chebychev establece s´ olo los l´ımites inferiores para wen los cuales se encuentra una deter-
minada cantidad de datos, mientras que la regla emp´ırica si que da buenas aproximaciones.
Ejercicio: Haga uso de los teoremas anteriores sobre la desviaci´ on est´ andar para hacer un an´ alisis de las
distribuciones de las situaciones y conjunto de datos anteriores.
2.5. Medidas de Posici´ on
Las medidas de posici´ on nos facilitan informaci´ on sobre la serie de datos que estamos analizando. La descrip-
ci´ on de un conjunto de datos, incluye como un elemento de importancia la ubicaci´ on de ´ estos dentro de un
contexto de valores posible.
Se trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. En vez de manejar todos
los datos sobre las variables, tarea que puede ser pesada, podemos caracterizar su distribuci´ on de frecuencias
mediante algunos valores num´ ericos, eligiendo como resumen de los datos un valor alrededor del cual se encuen-
tran distribuidos los valores de la variable. Pero estas medidas de posici´ on de una distribuci´ on de frecuencias
han de cumplir determinadas condiciones para que sean verdaderamente representativas de la variable a la que
31
resumen. Toda s´ıntesis de una distribuci´ on se considerara como operativa si intervienen en su determinaci´ on
todos y cada uno de los valores de la distribuci´ on, siendo ´ unica para cada distribuci´ on de frecuencias y siendo
siempre calculable y de f´ acil obtenci´ on. A continuaci´ on se describen las medidas de posici´ on m´ as comunes
utilizadas en estad´ıstica, como lo son:
Cuartiles: Hay 3 cuartiles que dividen a una distribuci´ on en 4 partes iguales: primero, segundo y tecer
cuartil.
Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil).
Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero al noventa y nueve
percentil).
2.5.1. Cuartiles
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente
iguales.
Hay tres cuartiles denotados usualmente Q
1
, Q
2
, Q
3
. El segundo cuartil es precisamente la mediana. El primer
cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25 %) de todos los valores de la sucesi´ on
(ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75 %) de
los datos.
Como los cuartiles adquieren su mayor importancia cuando contamos un n´ umero grande de datos y tenemos en
cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La f´ ormula para el
c´ alculo de los cuartiles cuando se trata de datos agrupados es la siguiente:
Q
k
= L
k
+
k
_
n
4
_
−F
k
f
k
c, para k = 1, 2, 3 (2.33)
donde:
Lk = L´ımite real inferior de la clase del cuartil k,
n = N´ umero de datos,
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k,
fk = Frecuencia de la clase del cuartil k,
c = Longitud del intervalo de la clase del cuartil k.
2.5.2. Deciles
Los deciles son ciertos n´ umeros que dividen la sucesi´ on de datos ordenados en diez partes porcentualmente
iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambi´ en
un caso particular de los percentiles. Los deciles se denotan D
1
, D
2
,..., D
9
, que se leen primer decil, segundo
decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados.
32
Para datos agrupados los deciles se calculan mediante la f´ ormula.
D
k
= L
k
+
k
_
n
10
_
−F
k
f
k
c, para k = 1, 2, ..., 9 (2.34)
donde:
Lk = L´ımite real inferior de la clase del decil k,
n = N´ umero de datos,
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k,
fk = Frecuencia de la clase del decil k,
c = Longitud del intervalo de la clase del decil k.
2.5.3. Centiles o percentiles
Los percentiles son, tal vez, las medidas m´ as utilizadas para prop´ ositos de ubicaci´ on o clasificaci´ on de las per-
sonas cuando atienden caracter´ısticas tales como peso, estatura, etc.
Los percentiles son ciertos n´ umeros que dividen la sucesi´ on de datos ordenados en cien partes porcentualmente
iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percen-
tiles (P
1
, P
2
,..., P
99
), le´ıdos primer percentil,..., percentil 99.
Cuando los datos est´ an agrupados en una tabla de frecuencias, se calculan mediante la f´ ormula:
P
k
= L
k
+
k
_
n
100
_
−F
k
f
k
c, para k = 1, 2, ..., 99 (2.35)
donde:
Lk = L´ımite real inferior de la clase del decil k,
n = N´ umero de datos,
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k,
fk = Frecuencia de la clase del decil k,
c = Longitud del intervalo de la clase del decil k.
Ejercicio: Calcule los valores de los tres cuartiles, los diez deciles y algunos de los centiles para todas las
situaciones y conjunto de datos anteriores.
2.6. Problemas de final de cap´ıtulo
A continuaci´ on una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de
los problemas pudiera usarse todo lo reflejado en estas notas, as´ı como tambi´ en cualquier herramienta compu-
tacional o tecnol´ ogica disponible.
1. En un centro hospitalario de la provincia de Sevilla se ha tratado, con un nuevo medicamento llamado
SINDOLORCABEZON, durante 5 d´ıas a un grupo de pacientes, todos ellos padecen de jaqueca cr´ onica
(se despiertan todos los d´ıas con dolor de cabeza). Se realiza un estudio sobre el n´ umero de d´ıas que un
paciente sufre mejor´ıa con el anterior medicamento obteniendo la tabla:
33
Datos (x
i
) Frecuencias
0 100
1 250
2 300
3 500
4 450
5 2000
(a) Realizando el gr´ afico adecuado y hallando los promedios (Media aritm´ etica, Media arm´ onica, Media
geom´ etrica, Moda, y Mediana), indicar cu´ al ser´ıa el que mejor representar´ıa los datos, (Contesta razo-
nadamente y con el mayor detalle posible). (b) Calcula tambi´ en el porcentaje de pacientes que sienten
mejor´ıa con el medicamento en todos los d´ıas del tratamiento. (c) ¿Por qu´ e no calculamos el coeficiente
de variaci´ on para ver la representatividad de la media? (d) ¿Habr´ıa que hallarlo?. (e) Calcula el D
3
, Q
3
,
P
65
. ¿Qu´ e significados tienen?
A aquellos pacientes que sienten mejor´ıa todos los d´ıas del tratamiento se les realiza un estudio sobre
el tiempo de reacci´ on del medicamento (en minutos), encontr´ andose recogido los datos en la siguiente
tabla:
Tiempo de reacci´ on N´ umero de pacientes
0-10 300
10-20 500
20-30 400
30-40 500
40-50 300
Se pide: (a) Escribir las f´ ormulas de las diferentes medias e indicar cu´ al de las tres te parece m´ as adecuada
para aplicar en este ejercicio (Razonadamente). (b) A todos los pacientes que tardan en reaccionar m´ as
de 35’ se le aplica el medicamento complementario PAQUENODUELA para acelerar los efectos de
SINDOLORCABEZON. Hallar el n´ umero de pacientes a los que se le aplica este segundo medicamento.
(c) Estudiar la representatividad del tiempo medio de reacci´ on. ¿Es representativo? ¿Por qu´ e? (d) El
Gobierno est´ a pensando en introducir un medicamento con las caracter´ısticas de SINDOLORCABEZON.
Existen en el mercado junto con este dos productos m´ as PALACABEZAy SINJAQUECAHOY. El tiempo
medio de reacci´ on de cada uno de ellos es respectivamente 25 y 30 minutos, con una varianza de 200 y
300 minutos2. Explica detalladamente que criterio de selecci´ on estad´ıstico podr´ıa aplicar el Gobierno.
Seg´ un el criterio anterior que medicamento ser´ıa el que pasar´ıa a engrosar la lista de medicamentos de la
Seguridad Social.
2. Se ha realizado una encuesta a 30 personas en la que se les pregunta el n´ umero de personas que conviven
en el domicilio habitualmente. Las respuestas obtenidas han sido las siguientes: 1, 4, 4, 1, 3, 5, 3, 2, 4, 1,
6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3. (a) Calcule la distribuci´ on de frecuencias de la variable
obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas. (b) ¿Qu´ e proporci´ on
de hogares est´ a compuesta por tres o menos personas? ¿Qu´ e proporci´ on de individuos vive en hogares
con tres o menos miembros? (c) Dibuje el diagrama de barras de frecuencias y el diagrama en escalera.
(d) Agrupe por intervalos de amplitud 2 los valores de la variable, calcule su distribuci´ on de frecuencias
y represente el histograma correspondiente.
3. Tenemos la siguiente informaci´ on sobre el gasto semanal en ocio de un grupo de estudiantes universita-
rios.
34
Nivel de gastos # de J´ ovenes
0-5 4
5-10 11
10-15 16
15-20 22
20-25 8
25-30 6
(a) Calcule la distribuci´ on de frecuencias de la variable y las densidades de frecuencias. (b) Dibuje el
histograma de frecuencias. (c) Dibuje el pol´ıgono de frecuencias acumuladas.
4. En un estudio sobre consumo de gasolina en una gran ciudad se eligi´ o una muestra de 100 veh´ıculos
y se observ´ o el n´ umero de litros que consum´ıan en un d´ıa, obteni´ endose la siguiente distribuci´ on de
frecuencias.
# de Litros # de Autom´ oviles
1-7 4
7-10 8
10-12 35
12-14 30
14-18 20
18-25 3
(a) Calcule la distribuci´ on de frecuencias, obteniendo, adem´ as, la amplitud de cada intervalo as´ı como sus
respectivas marcas de clase y las densidades de frecuencia. (b) Represente gr´ aficamente la distribuci´ on
de frecuencias mediante un histograma.
5. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el n´ umero de em-
pleados que hay en cada una de ellas para un estudio posterior. Las observaciones obtenidas han sido: 12,
10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13,14,15, 11, 11, 12, 16, 17, 17,16,16, 15, 14, 12, 11, 11, 11, 12, 12,
12, 15, 13, 14, 16, 15, 18, 19, 18, 10, 11, 12, 12, 11, 13, 13, 15, 13, 11, 12. (a) Calcule la distribuci´ on de
frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumula-
das. (b) ¿Qu´ e proporci´ on de sucursales tiene m´ as de 15 empleados? (c) Dibuje el diagrama de barras y el
diagrama en escalera correspondientes. (d) Agrupe en intervalos de amplitud 3 los valores de la variable,
calcule su distribuci´ on de frecuencias y represente su histograma y su pol´ıgono de frecuencias acumula-
das. (e) Agrupe la variable en los intervalos que considere conveniente de amplitud variable, calcule las
densidades de frecuencia de cada intervalo y represente el histograma correspondiente.
6. La siguiente distribuci´ on expresa el n´ umero de coches vendidos durante una semana por cada uno de los
50 concesionarios que una determinada firma tiene en Espa˜ na:
# de autos vendidos # de Concesionarios
1 5
3 12
4 20
6 8
10 5
Se pide: (a) Media aritm´ etica, mediana y moda. (b) Desviaci´ on t´ıpica, coeficiente de correlaci´ on, coe-
ficiente de variaci´ on de Pearson. (c) Coeficientes de asimetr´ıa de Fisher y de Curtosis, compruebe con
la forma del pol´ıgono de frecuencias. Para todo haga siempre un an´ alisis de los datos y los estimadores
calculados.
7. Sea la distribuci´ on referida a beneficios anuales de 38 empresas madrile˜ nas:
35
Beneficio (Miles de Euros) # de Empresas
230-280 5
280-330 7
330-580 14
580-630 9
630-780 3
Se pide: (a) Calcular el beneficio medio de estas 38 empresas madrile˜ nas. (b) ¿Cu´ al es el beneficio mayor
de la mitad de las empresas m´ as modestas? (c) Determinar el beneficio m´ as frecuente. (d) Estudiar la
dispersi´ on de esta distribuci´ on a partir del recorrido intercuart´ılico, desviaci´ on t´ıpica y coeficiente de
variaci´ on de Pearson. (e) Estudiar la forma de esta distribuci´ on.
8. La distribuci´ on del importe de las facturas por reparaci´ on de carrocer´ıa de una muestra de 80 veh´ıculos
en un taller, viene dada por la tabla siguiente:
Importe (Euros) # de Veh´ıculos
0-60 10
60-80 20
80-120 40
120-240 10
Se pide: (a) Calcular el importe medio. Estudiar la representatividad de esta media. (b) Calcular el importe
mediano y el importe m´ as frecuente. (c) ¿Qu´ e interpretaci´ on tienen en este caso los deciles? Calcular el
tercer decil. (d) ¿Cu´ al es el importe m´ aximo pagado por las 60 reparaciones m´ as baratas? (e) Estudiar la
asimetr´ıa a partir del coeficiente de asimetr´ıa de Fisher. (f) Estudiar la curtosis.
9. Una empresa ten´ıa a finales de 2003 mil seiscientos cincuenta accionistas distribuidos de la siguiente
forma:
# de acciones # de accionistas
0-20 1030
20-60 380
60-100 180
100-500 50
500-1000 10
Se pide: (a) Hallar el n´ umero medio de acciones por accionista y su desviaci´ on t´ıpica. (b) Hallar la me-
diana. (c) Decida, con base estad´ıstica, el grado de concentraci´ on de las acciones. (d) ¿Qu´ e porcentaje del
total de acciones poseen los accionistas mayoritarios? (e) ¿Qu´ e porcentaje de los accionistas minoritarios
posee el 20 % del total de acciones?
36
Cap´ıtulo 3
M´ etodos cuantitativos de an´ alisis
predictivo, regresi ´ on
3.1. Correlaci´ on y regresi´ on
En f´ısica como en otras ´ areas es importante a veces, tener una relaci´ on entre muchos datos de los que se estu-
dian para una situaci´ on dada. Por ejemplo, en un caso sencillo, digamos que alguien est´ a interesado un peque˜ no
problema para estudiar una cierta caracter´ıstica en unos moluscos muy raros con caparaz´ on. Para dicho estudio
digamos que el investigador, como primer paso, toma datos de los pesos y las dimensiones del caparaz´ on de
dichos moluscos. Como usted podr´ a inferir, es muy posible, que para la poblaci´ on de estudio, una dimensi´ on
grande en la muestra de los caparazones pudiera corresponder a caracoles o moluscos m´ as pesados. As´ı, uno es-
tar´ıa tentado a decir que el tama˜ no del caparaz´ on est´ a relacionado con el peso del molusco. Esto, por su puesto,
es una supusici´ on ya que podr´ıa haber resultados para los cuales ´ esto no sea cierto. As´ı que desde luego, como
siempre todo debe tomarse supuesto, en el sentido estricto estad´ıstico.
Como veremos m´ as adelante, algunas veces es posible emparentar, o en otras palabras m´ as t´ ecnicas, relacionar
ambas caracter´ısticas de alguna manera funcional, o mejor dicho, a trav´ es de una funci´ on. Si ´ este fuera el
caso entonces uno pudiera inferir, a partir de la funci´ on que relaciona dichas variables, una descripci´ on de la
poblaci´ on de estudio y/o catalogar especies en t´ erminos de sus caracter´ısticas. Hay que advertir, que pudieramos
tener tambi´ en una relaci´ on entre ambas variables o caracter´ısticas que no sea funcional, es posible, sin embargo,
no nos interesaremos por ese tipo de relaciones. Estamos interesado en las relaciones que se pueden hacer
cu´ ando una o m´ as variables estan emparentadas a trav´ es de alguna(s) funci´ on(es) matem´ aticas. El presente
cap´ıtulo est´ a dedicado a estas cuestiones. Esto ser´ a, como veremos ´ util para resolver muchos problemas.
3.2. Distribuciones bidimensionales
Cuando sobre una poblaci´ on estudiamos simult´ aneamente los valores de dos variables estad´ısticas, el conjunto
de los pares de valores correspondientes a cada individuo se denomina distribuci´ on bidimensional.
37
Por ejemplo: Las notas de 10 alumnos en Matem´ aticas y en F´ısica vienen dadas en la siguiente tabla:
F´ısica 4 10 10 12 12 14 14 16 18 16
Matem´ aticas 4 4 10 12 10 14 10 16 14 20
Los pares de valores (4,4),(10,4),(10,10),...;(18,14),(16,20), forman la distribuci´ on bidimensional.
3.3. La idea de la correlaci´ on
Es frecuente que estudiemos sobre una misma poblaci´ on los valores de dos variables estad´ısticas distintas, con
el fin de ver si existe alguna relaci´ on entre ellas, es decir, si los cambios en una de ellas influyen en los valores
de la otra. Si ocurre esto decimos que las variables est´ an correlacionadas o bien que hay correlaci´ on entre ellas.
En el ejemplo anterior parece que hay cierta tendencia a que cuanto mejor es la nota en F´ısica, mejor es la de
Matem´ atica.
La primera forma de describir una distribuci´ on bidimensional (y por tanto, saber si lo es) es representar los
pares de valores en el plano cartesiano. El gr´ afico obtenido recibe el nombre de nube de puntos o diagrama de
dispersi´ on.
Figura 3.1: Ejemplo de de un diagrama de dispersi´ on o nube de puntos.
Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva.
Aqu´ı nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si as´ı ocurre diremos que hay
correlaci´ on lineal. La recta se denomina recta de regresi´ on.
Hablaremos de correlaci´ on lineal fuerte cuando la nube se parezca mucho a una recta y ser´ a cada vez m´ as d´ ebil
(o menos fuerte) cuando la nube vaya desparram´ andose con respecto a la recta.
38
Figura 3.2: Regresi´ on lineal: Los puntos tienden a describirse a partir de una recta que los representa aproxima-
damente a todos.
En el gr´ afico observamos que en nuestro ejemplo la correlaci´ on es bastante fuerte, ya que la recta que hemos
dibujado est´ a pr´ oxima a los puntos de la nube.
Cuando la recta es creciente la correlaci´ on es positiva o directa: al aumentar una variable, la otra tiene tambi´ en
tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlaci´ on es negativa o
inversa: al aumentar una variable, la otra tiene tendencia a disminuir.
Por ejemplo: Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas.
En la gr´ afica se describen el n´ umero de errores que corresponden a los intentos realizados. Observa que hay
una correlaci´ on muy fuerte (los puntos est´ an casi alineados) y negativa (la recta es decreciente).
Figura 3.3: Regresi´ on lineal: la cantidad de intentos a medida que aumenta hace que el n´ umero de error dismi-
nuya.
Por ejemplo: A 12 alumnos de un centro se les pregunt´ o a qu´ e distancia estaba su residencia de la Universidad,
con fin de estudiar si esta variable estaba relacionada con la nota media obtenida. Se obtuvieron los datos que
figuran en la siguiente tabla:
39
Distancia (en Km) 0.05 0.1 0.12 0.4 0.5 0.7 1 1.2 2.1 2.5 3 3
Nota media 8.4 4 5.7 9.1 6.3 6.7 4.3 5.4 7.8 4.5 7.2 8.1
Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la correlaci´ on es pr´ actica-
mente inexistente, es decir, no tiene nada que ver con el rendimiento acad´ emico la distancia del domicilio a la
Universidad.
Figura 3.4: Regresi´ on lineal: Al parecer n existe relaci´ on entre la distancia a la que se vive de la Universidad y
la calificaci´ on que se obtiene.
3.4. Encontrando la relaci´ on. Regresi´ on
3.4.1. El coeficiente de correlaci´ on
S´ olo para recordar, tenga en cuenta la lecci´ on aprendida en la secci´ on (2.3.6). Teniamos que el coeficiente de
correlaci´ on de Pearson, r, nos permite saber si el ajuste de la nube de puntos a la recta de regresi´ on obtenida
es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones t´ıpicas (ra´ız
cuadrada de las varianzas).
r =
V
xy
_
V
x
V
y
=
S
xy
_
S
2
x
S
2
y
=
S
xy
S
x
S
y
. (3.1)
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos
expresiones siguientes:
r =
∑x
i
y
i
n
− ¯ x¯ y
_
_
∑x
2
i
n
−x
−2
__
∑y
2
i
n
−y
−2
_
, (3.2)
r =
n∑x
i
y
i
−∑x
i ∑y
i
_
_
n∑x
2
i
−(∑x
i
)
2
__
n∑y
2
i
−(∑y
i
)
2
_
. (3.3)
El corefiente de correlaci´ on ten´ıa las siguientes propiedades muy interesantes:
40
El coeficiente de correlaci´ on, r, presenta valores entre -1 y +1.
Cuando r es pr´ oximo a 0, no hay correlaci´ on lineal entre las variables. La nube de puntos est´ a muy
dispersa o bien no forma una l´ınea recta. No se puede trazar una recta de regresi´ on.
Cuando r es cercano a +1, hay una buena correlaci´ on positiva entre las variables seg´ un un modelo lineal
y la recta de regresi´ on que se determine tendr´ a pendiente positiva, ser´ a creciente.
Cuando r es cercano a -1, hay una buena correlaci´ on negativa entre las variables seg´ un un modelo lineal
y la recta de regresi´ on que se determine tendr´ a pendiente negativa: es decreciente.
3.4.2. Regresi´ on lineal. El M´ etodo de los M´ınimos Cuadrados
Hemos enfatizado sobre la importancia de las representaciones gr´ aficas y hemos visto la utilidad de las versiones
linealizadas de los gr´ aficos (X,Y). A menudo nos confrontamos con situaciones en las que existe o suponemos
que existe una relaci´ on lineal entre las variables X e Y.
Surge de modo natural la pregunta: ¿cu´ al es la relaci´ on anal´ıtica que mejor se ajusta a nuestros datos? El m´ etodo
de cuadrados m´ınimos es un procedimiento general que nos permite responder esta pregunta. Cuando la relaci´ on
entre las variables X e Y es lineal, el m´ etodo de ajuste por cuadrados m´ınimos se denomina tambi´ en m´ etodo
de regresi´ on lineal. En este cap´ıtulo discutiremos este ´ ultimo caso. El lector puede consultar a continuaci´ on una
discusi´ on del caso general de cuadrados m´ınimos cuando el modelo es no lineal y los datos est´ an afectados de
errores.
Figura 3.5: Regresi´ on lineal: Al parecer n existe relaci´ on entre la distancia a la que se vive de la Universidad y
la calificaci´ on que se obtiene.
La dispersi´ on de los valores est´ a asociada a la fluctuaci´ on de los valores de cada variable. Observamos o supo-
nemos una tendencia lineal entre las variables y nos preguntamos sobre cu´ al es la mejor recta:
y(x) = ax +b, (3.4)
que representa el caso de inter´ es.
Es ´ util definir la funci´ on χ
2
(Chi-cuadrado):
χ
2
=

i
[y
i
−(ax
i
+b)]
2
, (3.5)
41
Figura 3.6: La curva de regresi´ on lineal en t´ erminos de los cambios de la funci´ on.
que es una medida de la desviaci´ on total de los valores observados y
i
respecto de los predichos por el modelo
lineal ax +b. Los mejores valores de la pendiente a y la ordenada al origen b son aquellos que minimizan esta
desviaci´ on total, o sea, son los valores que remplazados en la ecuaci´ on (3.4) minimizan la funci´ on χ
2
, ecuaci´ on
(3.5). Los par´ ametros a y b pueden obtenerse usando t´ ecnicas matem´ aticas que hacen uso del c´ alculo diferencial.
Aplicando estas t´ ecnicas, el problema de minimizaci´ on se reduce al de resolver el par de ecuaciones:
d
da
χ
2
= 0,
d
db
χ
2
= 0, (3.6)
de donde resulta despu´ es de algunos c´ alculos
a =
N∑x
i
y
i
−∑x
i ∑y
i
N∑x
2
i
−(∑x
i
)
2
, (3.7)
b =
N∑x
2
i
∑y
i
−∑x
i ∑x
i
y
i
N∑x
2
i
−(∑x
i
)
2
. (3.8)
Actualmente, la mayor´ıa de los programas de an´ alisis de datos y planillas de c´ alculo, realizan el proceso de mi-
nimizaci´ on en forma autom´ atica y dan los resultados de los mejores valores de a y b, o sea los valores indicado
por la ecuaciones anteriores.
El criterio de m´ınimos cuadrados reemplaza el juicio personal de quien mire los gr´ aficos y defina cu´ al es la
mejor recta. En los programas como Excel, Origin, etc., este c´ alculo se realiza usando la herramienta regresi´ on
lineal.
o
.
a
juste lineal”. Los resultados en las ecuaciones anteriores se aplican en el caso lineal cuando todos
los datos de la variable dependiente tienen la misma incertidumbre absoluta y la incertidumbre de la variable
independiente se considera despreciable.
42
Una medida de la calidad o bondad del ajuste realizado viene dado por el coeficiente de correlaci´ on de Pearson
entre las variables X e Y, escrito ahora equivalentemente como:
r
2
=
Cov(x, y)
2
Var(x) · Var(y)
, (3.9)
Cov(x, y) =
N∑x
i
y
i
−∑x
i ∑y
i
N
2
, (3.10)
Var(x) =
∑x
2
i
N

_
∑x
i
N
_
2
=< x
2
>< x >
2
, (3.11)
Var(y) =
∑y
2
i
N

_
∑y
i
N
_
2
=< y
2
>< y >
2
. (3.12)
El valor de r var´ıa entre -1 y 1 como siempre. Si r es ±1 o pr´ oximo a estos valores, decimos que el modelo
lineal es adecuado para describir los datos experimentales. Cuando r se aparta de estos extremos decimos que
una expresi´ on lineal no es una buena descripci´ on de los datos. En este caso, conviene analizar el gr´ afico y buscar
una relaci´ on no-lineal que aproxime mejor la dependencia. Dado que r mide el grado de correlaci´ on lineal entre
los datos, si, por ejemplo, los pares de puntos (X,Y) tienen una relaci´ on tal que caen sobre un c´ırculo, aunque
ellos est´ an correlacionados, tendr´ıamos r ∼0. Desde luego, si los pares (X,Y) no tienen correlaci´ on alguna entre
ellos, tambi´ en tendr´ıamos r ∼ 0.
Frecuentemente el resultado que deseamos determinar de nuestro experimento es alguno de los par´ ametros de la
ecuaci´ on (3.4). Por ejemplo, si deseamos determinar la constante el´ astica k de un resorte a partir de mediciones
de fuerzas aplicadas F
i
y estiramientos x
i
que le producen al resorte, k ser´ a precisamente la pendiente de la recta
que mejor se ajusta a los datos. Otro ejemplo es la obtenci´ on de la resistencia el´ ectrica R de un conductor, que
deseamos determinar a partir de mediciones de tensi´ on V
i
y la corriente que lo atraviesa I
i
. Por consiguiente, es
´ util disponer de un modo de estimar las incertidumbres asociadas a la determinaci´ on de los par´ ametros a y b de
la ecuaci´ on (3.4).
La importancia del m´ etodo de cuadrados m´ınimos reside en el hecho que nos permite obtener valores de la
desviaci´ on est´ andar o sea los errores asociados a los par´ ametros a y b, que denotaremos con los s´ımbolos σ
a
y
σ
b
. En esta secci´ on s´ olo presentamos los resultados de utilidad m´ as frecuente en el laboratorio; el lector intere-
sado podr´ a encontrar un tratamiento m´ as exhaustivo en las referencias. Las incertidumbres de los par´ ametros
del ajuste vienen dadas por las expresiones:
σ
a
=
¸
χ
2
N
N · Var(x)
, (3.13)
σ
b
=
¸
χ
2
N
· ∑x
2
i
N · Var(x)
, (3.14)
donde χ
2
N
, conocido como el valor de Chi-cuadrado por grado de libertad, viene dada por:
χ
2
N
=
1
N −2
· χ
2
. (3.15)
43
Las incertidumbres de los par´ ametros a y b tambi´ en pueden escribirse en t´ erminos del coeficiente de correlaci´ on
r del siguiente modo:
σ
a
=
¸
a
2
N −2
·
_
1
r
2
−1
_
, (3.16)
σ
b
= σ
a
_
< x
2
>, (3.17)
donde
< x
2
>=
∑x
2
i
N
. (3.18)
Estas expresiones son de mucha utilidad para estimar σ
a
y σ
b
, ya que la mayor´ıa de las planillas de c´ alculo y
programas de ajuste, por los regular indican los valores de los par´ ametros a y b que mejor ajustan los datos y el
valor de r.
Precausiones en el an´ alisis
No siempre es suficiente admitir que dos variables siguen una relaci´ on lineal gui´ andonos por lo que muestra
un gr´ afico de los datos en escalas lineales. Menos aun si s´ olo evaluamos el coeficiente de correlaci´ on del ajuste
lineal que propondr´ıamos a partir de este gr´ afico. Un gr´ afico de Y =X
1,1
(variables sin correlaci´ on lineal) puede
ajustarse por una recta y obtenerse a la vez un coeficiente de correlaci´ on lineal (inexistente) de, por ejemplo,
0,998. Un gr´ afico de datos experimentales de Y = X con algo de dispersi´ on fortuita de los puntos, podr´ıa de-
venir en un coeficiente de, por ejemplo, 0,995, menor que el anterior. Entre los coeficientes hay una diferencia,
apenas, del 3 por mil. Pero en un gr´ afico log-log, la diferencia de pendientes ser´ a la que hay entre 1.1 y 1.0,
lo que representa un 10 % de discrepancia entre los exponentes de la variable X. Estos m´ etodos de an´ alisis
nos ense˜ nan que los efectos de correlaci´ on pueden estar enmascarados por el efecto del ruido”de los datos. En
ocasiones lo dif´ıcil es establecer si existe correlaci´ on entre las variables, aun cuando los datos provengan de
fuentes ”limpias”que hayan producido datos con relativamente poca dispersi´ on. Muchas veces la decisi´ on entre
dos alternativas debe hacerse usando otros criterios. Por ejemplo, la consistencia con otros conjuntos de datos o
sobre la base de consideraciones de simetr´ıa o concordancia con teor´ıas bien establecidas.
Por ejemplo: Imaginemos un experimento donde se mide la distancia que recorre un m´ ovil sobre una l´ınea
recta mientras una fuerza constante act´ ua sobre ´ el. Esperamos que el movimiento sea uniformemente acelera-
do. Supongamos que el cuerpo parte del reposo, que medimos x(t) a tiempos largos. En la figura se ven los
resultados.
Si los datos experimentales se analizan sobre el gr´ afico de escalas lineales, el ajuste por un modelo lineal es
m´ as que tentador. Hecho esto, se obtiene la ecuaci´ on de la mejor recta y un coeficiente de correlaci´ on muy alto,
r = 0,99959. Sin embargo, un modelo basado en las ecuaciones de la din´ amica dice que
x =
1
2
at
2
,
donde a es la aceleraci´ on. En la Figura est´ an los logaritmos de los mismos datos, de donde se ve claramente
la proporcionalidad x ∼ t
2
que predice el modelo, dif´ıcilmente demostrable a partir del gr´ afico de la Figura.
Evidentemente, el uso de una aproximaci´ on lineal no es buena en este problema y el mero juicio del valor del
coeficiente de correlaci´ on no es suficiente.
44
Figura 3.7: Representaci´ on de x(t) para un cuerpo que se mueve con movimiento uniformemente acelerado. (a)
A tiempos largos no se aprecia bien la curvatura de la curva y, dado que el coeficiente de correlaci´ on lineal es
muy cercano a la unidad, podr´ıa suponerse que la correlaci´ on es lineal. (b) log(x) en funci´ on de log(t), de donde
se deduce que la relaci´ on no es lineal sino cuadr´ atica.
45
Cap´ıtulo 4
An´ alisis Combinatorio
4.1. Introducci´ on
En ocasiones el trabajo de enumerar los posibles sucesos que ocurren en una situaci´ on dada se convierte en algo
dif´ıcil de lograr o, simplemente, tedioso. El an´ alisis combinatorio, o c´ alculo combinatorio, permite enumerar
tales casos o sucesos y as´ı obtener la probabilidad de eventos m´ as complejos.
En el caso de que existan m´ as de un suceso a observar, habr´ıa que contar el n´ umero de veces que pueden ocurrir
todos los sucesos que se desean observar, para ello se utiliza el principio fundamental de conteo:
Si un suceso se puede presentar de n
1
formas, y otro se puede presentar de n
2
formas, entonces el n´ umero de
formas en que ambos sucesos pueden presentarse en ese orden es de n
1
n
2
.
En otras palabras, basta multiplicar el n´ umero de formas en que se pueden presentar cada uno de los sucesos a
observar.
Este principio nos remite autom´ aticamente al factorial de un n´ umero natural, que se puede pensar como una
funci´ on con dominio los n´ umeros naturales junto con el cero y codominio los n´ umeros naturales. El factorial de
un n´ umero n, denotado n!, se define como:
n! = n.(n −1).(n −2)..,2,1, si n > 0, (4.1)
= 1, si n = 0.
Ahora, n es muy grande el proceso de c´ alculo se vuelve tedioso y muy cargado, incluso para una computadora,
por lo que se utiliza la aproximaci´ on de Stirling a n!:
n! ∼

2πn
2n+1
2
e
−n
. (4.2)
46
donde e ∼ 2,71828..., que es la base de los logaritmos neperianos.
En el an´ alisis combinatorio se definen las permutaciones, con o sin repetici´ on, y las combinaciones.
4.2. Permutaciones (u ordenaciones) con repetici´ on
Las permutaciones son tambi´ en conocidas como ordenaciones, y de hecho toman este nombre porque son orde-
naciones de r objetos de n dados. En este curso las representaremos como P
r
n
.
Ejemplo: Sea A = {a, b, c, d}, ¿cu´ antas ”palabras”de dos letras se pueden obtener?. Se pide formar per-
mutaciones u ordenaciones de 2 letras, cuando el total de letras es 4. En este caso r = 2 y n = 4. Las ”pala-
bras”formadas son: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd, da, db, dc, dd. En total son 16.
En general, si se toman r objetos de n, la cantidad de permutaciones u ordenaciones con repetici´ on obtenidas
son:
P
r
n
= n
r
. (4.3)
4.3. Permutaciones (u ordenaciones) sin repetici´ on
En este caso, a diferencia del anterior, se realizan ordenaciones de r objetos de n dados atendiendo a la situaci´ on
de cada objeto en la ordenaci´ on. Su representaci´ on ser´ a P
r
n
.
Ejemplo: Sea el mismo conjunto A ={a, b, c, d}, ¿cu´ antas ordenaciones sin repetici´ on se pueden obtener? Lo
que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12 en total.
En general, si se toman r objetos de un total de n, la cantidad de permutaciones
P
r
n
=
n!
(n −r)!
. (4.4)
4.4. Combinaciones
Es una selecci´ on de r objetos de n dados sin atender a la ordenaci´ on de los mismos. Es decir, es la obtenci´ on de
subcojuntos, de r elementos cada uno, a partir de un conjunto inicial de n elementos. La denotaremos con C
r
n
,
´ o
_
n
k
_
.
Ejemplo: Si tomamos el mismo conjunto A = {a, b, c, d}, ¿cu´ antos subconjuntos de 2 elementos cada uno se
pueden obtener? Haci´ endolos se obtienen: a,b, a,c, a,d, b,c, b,d, c,d. Son seis los subconjuntos.
47
En general, si de n objetos dados se hacen combinaciones de r objetos cada una, el n´ umero de combinaciones
obtenidas son:
C
r
n
=
_
n
r
_
=
n.(n −1).(n −1)...(n −r +1)
r!
=
n!
r!(n −r)!
, (4.5)
o, que es lo mismo,
C
r
n
=
_
n
r
_
=
P
r
n
r!
. (4.6)
4.5. An´ alisis y Metodolog´ıa propuesta para la resoluci´ on de problemas de Teor´ıa de
conteo
Para resolver problemas b´ asicos y sencillos de teor´ıa de conteo basta con seguir el siguiente diagrama.
Figura 4.1: Metodolog´ıa sencilla para la resoluci´ on de problemas.
48
Cap´ıtulo 5
Probabilidad
5.1. Introducci´ on: La probabilidad
La palabra probabilidad no tiene una definici´ on consistente. De hecho, hay dos amplias categor´ıas de interpre-
taciones de la probabilidad: los frecuentistas hablan de probabilidades s´ olo cuando se trata de experimentos
aleatorios bien definidos. La frecuencia relativa de ocurrencia del resultado de un experimento, cuando se repite
el experimento, es una medida de la probabilidad de ese suceso aleatorio. Los bayesianos, no obstante, asignan
las probabilidades a cualquier declaraci´ on, incluso cuando no implica un proceso aleatorio, como una manera
de representar su verosimilitud subjetiva.
El estudio cient´ıfico de la probabilidad es un desarrollo moderno. Los juegos de azar muestran que ha habido un
inter´ es en cuantificar las ideas de la probabilidad durante milenios, pero las descripciones matem´ aticas exactas
de utilidad en estos problemas s´ olo surgieron mucho despu´ es.
Seg´ un Richard Jeffrey, “Antes de la mitad del siglo XVII, el t´ ermino ’probable’ (en lat´ın probable) significaba
aprobable, y se aplicaba en ese sentido, un´ıvocamente, a la opini´ on y a la acci´ on. Una acci´ on u opini´ on probable
era una que las personas sensatas emprender´ıan o mantendr´ıan, en las circunstancias.” [Ve´ ase: Jeffrey, R.C.,
Probability and the Art of Judgment, Cambridge University Press. (1992). pp. 54-55. ISBN 0-521-39459-7].
Dos aplicaciones principales de la teor´ıa de la probabilidad en el d´ıa a d´ıa son en el an´ alisis de riesgo y en
el comercio de los mercados de materias primas. Los gobiernos normalmente aplican m´ etodos probabil´ısticos
en regulaci´ on ambiental donde se les llama “an´ alisis de v´ıas de dispersi´ on”, y a menudo miden el bienestar
usando m´ etodos que son estoc´ asticos por naturaleza, y escogen qu´ e proyectos emprender bas´ andose en an´ alisis
estad´ısticos de su probable efecto en la poblaci´ on como un conjunto. No es correcto decir que la estad´ıstica
est´ a incluida en el propio modelado, ya que t´ıpicamente los an´ alisis de riesgo son para una ´ unica vez y por lo
tanto requieren m´ as modelos de probabilidad fundamentales, por ej. “la probabilidad de otro 11-S”. Una ley de
n´ umeros peque˜ nos tiende a aplicarse a todas aquellas elecciones y percepciones del efecto de estas elecciones,
lo que hace de las medidas probabil´ısticas un tema pol´ıtico.
49
Un buen ejemplo es el efecto de la probabilidad percibida de cualquier conflicto generalizado sobre los precios
del petr´ oleo en Oriente Medio - que producen un efecto domin´ o en la econom´ıa en conjunto. Un c´ alculo por
un mercado de materias primas en que la guerra es m´ as probable en contra de menos probable probablemente
env´ıa los precios hacia arriba o hacia abajo e indica a otros comerciantes esa opini´ on. Por consiguiente, las pro-
babilidades no se calculan independientemente y tampoco son necesariamente muy racionales. La teor´ıa de las
finanzas conductuales surgi´ o para describir el efecto de este pensamiento de grupo en el precio, en la pol´ıtica, y
en la paz y en los conflictos.
Se puede decir razonablemente que el descubrimiento de m´ etodos rigurosos para calcular y combinar los c´ alcu-
los de probabilidad ha tenido un profundo efecto en la sociedad moderna. Por consiguiente, puede ser de alguna
importancia para la mayor´ıa de los ciudadanos entender c´ omo se c´ alculan los pron´ osticos y las probabilidades,
y c´ omo contribuyen a la reputaci´ on y a las decisiones, especialmente en una democracia.
Otra aplicaci´ on significativa de la teor´ıa de la probabilidad en el d´ıa a d´ıa es en la fiabilidad. Muchos bienes de
consumo, como los autom´ oviles y la electr´ onica de consumo, utilizan la teor´ıa de la fiabilidad en el dise˜ no del
producto para reducir la probabilidad de aver´ıa. La probabilidad de aver´ıa tambi´ en est´ a estrechamente relacio-
nada con la garant´ıa del producto.
Se puede decir que no existe una cosa llamada probabilidad. Tambi´ en se puede decir que la probabilidad es
la medida de nuestro grado de incertidumbre, o esto es, el grado de nuestra ignorancia dada una situaci´ on. Por
consiguiente, puede haber una probabilidad de 1 entre 52 de que la primera carta en un baraja de cartas es la J de
diamantes. Sin embargo, si uno mira la primera carta y la reemplaza, entonces la probabilidad es o bien 100 % o
0 %, y la elecci´ on correcta puede ser hecha con precisi´ on por el que ve la carta. La f´ısica moderna proporciona
ejemplos importantes de situaciones determin´ısticas donde s´ olo la descripci´ on probabil´ıstica es factible debido
a informaci´ on incompleta y la complejidad de un sistema as´ı como ejemplos de fen´ omenos realmente aleatorios.
En un universo determinista, basado en los conceptos newtonianos, no hay probabilidad si se conocen todas las
condiciones. En el caso de una ruleta, si la fuerza de la mano y el periodo de esta fuerza es conocido, entonces
el n´ umero donde la bola parar´ a ser´ a seguro. Naturalmente, esto tambi´ en supone el conocimiento de la inercia
y la fricci´ on de la ruleta, el peso, lisura y redondez de la bola, las variaciones en la velocidad de la mano du-
rante el movimiento y as´ı sucesivamente. Una descripci´ on probabil´ıstica puede entonces ser m´ as pr´ actica que
la mec´ anica newtoniana para analizar el modelo de las salidas de lanzamientos repetidos de la ruleta. Los f´ısi-
cos se encuentran con la misma situaci´ on en la teor´ıa cin´ etica de los gases, donde el sistema determin´ıstico en
principio, es tan complejo (con el n´ umero de mol´ eculas t´ıpicamente del orden de magnitud de la constante de
Avogadro 6 ×10
23
) que s´ olo la descripci´ on estad´ıstica de sus propiedades es viable.
La mec´ anica cu´ antica, debido al principio de indeterminaci´ on de Heisenberg, s´ olo puede ser descrita actual-
mente a trav´ es de distribuciones de probabilidad, lo que le da una gran importancia a las descripciones proba-
bil´ısticas. Albert Einstein coment´ o estupendamente en una carta a Max Born: Jedenfalls bin ich
˜
A¼berzeugt,
daβ der Alte nicht w
˜
A¼rfelt. (Estoy convencido de que Dios no tira el dado). No obstante hoy en d´ıa no existe
un medio mejor para describir la f´ısica cu´ antica si no es a trav´ es de la teor´ıa de la probabilidad. Mucha gente
hoy en d´ıa confunde el hecho de que la mec´ anica cu´ antica se describe a trav´ es de distribuciones de probabilidad
con la suposici´ on de que es por ello un proceso aleatorio, cuando la mec´ anica cu´ antica es probabil´ıstica no por
el hecho de que siga procesos aleatorios sino por el hecho de no poder determinar con precisi´ on sus par´ ametros
50
fundamentales, lo que imposibilita la creaci´ on de un sistema de ecuaciones determinista. (Tomado de wikipedia,
busque “probabilidad”).
5.2. La probabilidad
La probabilidad es una medida de la posibilidad de que un “evento ocurra. En vista de la caractrer´ıstica de
´ esta medida, la cantidad que la describe es siempre un n´ umero que se encuentra en un intervalo [0, 1], donde o
equivale a una posibilidad nula de que el evento ocurra mientras que 1 representa el hecho de que evento va a
ocurrir con toda seguridad. En otras palabras, la medida de la probabiliudad es siempre una fracci´ on o decimal
indicando la porci´ on o porcetaje de la veces que un evento ocurre.
Ejemplo: 40 % de chance de que llueva, average de bateo de .313, la probabilidad de obtener un royal flush en
poker es 1:649740. La interpretaci´ on: Un 40 % de chance de que llueva significa que si nosotros miramos todos
los d´ıas con caracter´ısticas similares, entonces de cada 100 d´ıas con estas condiciones, 40 de ellos ser´ an d´ıas
con lluvia; un porcentaje de bateo de .313 significa que el jugado llegar´ a a una base o har´ aun hit en el 31.3 %
(.313) de todos los intentos al bateo, es decir, de cada 100 veces que batea, s´ olo 31 veces aproximadamente hace
un hit; dram´ aticamente se tendr´ a que si uno quiere obtener un royal flush en una partida de poker, entonces
quiz´ as tenga que esperar hasta 649740 manos para obtener uno.
5.3. Experimentos de Probabilidad
Un experimento probabil´ıstico es cualquier proceso que produce un resultado o una observaci´ on y tiene por
finalidad de determinar posibilidades.
Ejemplo: Lanzar un dado o una moneda, escoger un nombre de varios revueltos en un vaso, sacar una carta
de un mazo.
Cuando se realiza un experimento, se obtienen un conjunto de valores. A este conjunto de valores que puede
tomar una variable se le denomina espacio muestral.
Ejemplo: El universo de el experimento de lanzar una moneda tiene dos resultados: cara y sello, as´ı podemos
escribir:
S = {cara, sello}
En el experimento de lanzar un dado, se tienen 6 posibles resultados, as´ı:
S = {1, 2, 3, 4, 5, 6}
Desde ahora definiremos evento como cualquier colecci´ on de resultados de un espacio de eventos o universo,
es decir, pudiera cofeccionarse subconjuntos del universo de un evento y crear nuevos eventos.
51
Si existen m´ as de una variable, el espacio muestral est´ a formado por las combinaciones de valores de cada una
de las variables.
Ejemplo: En el caso de el experimento de lanzar un dado, uno podr´ıa definir dos nuevos eventos del universo
tomando algunos que tienen una caracter´ıstica com´ un, as´ı
P = {Resultados pares} = {2, 4, 6},
I = {Resultados impares} = {1, 3, 5},
As´ı mismo podr´ıan confeccionarse eventos en el experimento de sacar una carta de un mazo, uno podr´ıa inven-
tar nuevos eventos, por ejemplo, los resultados posibles de sacar un rey, tiene cuatro resultados correspondien-
tes con los cuatro reyes de los cuatro distintos tipos de dibujo que tienen las cartas, o bien, el rey de corazones,
el rey de picas, el rey de espadas y el rey de tr´ eboles.
Un evento E para un experimento se dice que ocurre si y s´ olo si el resultado de el experimento es uno de los
que pertenecen a E.
Si tomamos un subconjunto cualquiera del espacio muestral tenemos lo que se denomina un evento, y si ´ este
consta de un solo elemento entonces es un evento elemental.
Ejemplo: Si P es el evento descrito anteriormente de obtener los n´ umeros pares en el lanzamiento de un dado,
entonces si al lanzar el dado el n´ umero mostrado es un 4, entonces uno podr´ıa decir que el evento P ocurre, si
el n´ umero mostrado es 1, entonces uno debe decir que el evento P no ocurre.
Como se puede uno imaginar, existen eventos que siempre, no importa el n´ umero de experimentos o su situa-
ci´ on, ocurren, y en cambio existen otros que nunca ocurren. Los que siempre ocurren son los eventos seguros,
y los que nunca son los eventos imposibles.
Sin embargo, no todos los resultados son al azar, pues si un experimento es cualquier proceso entonces los re-
sultados pueden tomar cualquier tipo de valor. Por esta raz´ on, se define como experimento aleatorio al proceso
en el que se pueden predecir con certeza la ocurrencia de sus eventos, con excepci´ on del seguro o del imposible.
Hay que hacer la observaci´ on que esta definici´ on habla en t´ erminos generales y no espec´ıficamente sobre alg´ un
experimento en particular.
A aquella variable que est´ a asociada a un experimento de este tipo se le denomina variable aleatoria. En cam-
bio, a un experimento no aleatorio se le denomina experimento determin´ıstico.
Cuando hablamos de varios eventos dentro del mismo experimento se pueden dar varios casos. Si dos o m´ as
eventos no pueden ocurrir simult´ aneamente, se llaman eventos mutuamente excluyentes, es decir, que la in-
tersecci´ on de ambos eventos es vac´ıa.
Por otro lado, en ocasiones un evento o m´ as eventos dependen de otro evento previo, es decir, un evento A ocurre
dado que ocurri´ o un evento B. Si existe este tipo de relaci´ on entre eventos se dice que son eventos dependientes
52
o condicionados (el evento A depende del evento B, o el resultado del evento A est´ a condicionado al resultado
del evento B). Por otro lado, si no existe tal relaci´ on entre eventos se dice que son eventos independientes. Los
criterios de dependencia o de independencia se definir´ an m´ as adelante, en t´ erminos de probabilidad condicional.
5.4. Calculando la probabilidad de un evento
Para calcular la probabilidad de eventos es necesario que ´ estos se comporten de una manera m´ as o menos esta-
ble. Precisamente, se echa mano de la regularidad estad´ıstica, que es la propiedad de los fen´ omenos aleatorios,
y que consiste en que al aumentar el n´ umero de repeticiones de un experimento en condiciones pr´ acticamente
constantes, la frecuencia relativa de ocurrencia para cada evento tiende a un valor fijo.
La probabilidad de un evento E es denotada por P(E) y siempre representa la fracci´ on o porcentaje de ocurrencia
de que E ocurra. Algunas caracter´ısticas exibe esta formulaci´ on:
Para un evento E, se tiene que 0 ≤ P(E) ≤ 1.
Un evento E es llamado evento imposible si ocurre que P(E) = 0.
Un evento E es llamado evento cierto si ocurre que P(E) = 1.
La probabilidad P(E) puede ser calculada de dos modos distintos.
5.4.1. Probabilidad Emp´ırica
Tambi´ en llamada la probabilidad frecuencial de un evento es el valor fijo al que tienden las frecuencias rela-
tivas de ocurrencia del evento de acuerdo a la regularidad estad´ıstica. Esta definici´ on ser´ıa la m´ as real, pero
proporciona probabilidades aproximadas, es decir, proporciona estimaciones y no valores reales. Adem´ as, los
resultados son a posteriori, pues se necesita realizar el experimento para poder obtenerlo.
Por ejemplo, uno podr´ıa calcular la probabilidad de obtener una suma de 7 cuando dos dados son lanzados mu-
chas veces, digamos 100 veces, y calculando que porcentaje de las veces sale 7. As´ı mismo tambi´ en se podr´ıa
calcular la probabilidad de que un jugador de basketball anote una cesta libre de tablerocalculando el porcentaje
de las veces que lo ha hecho en el pasado con estad´ısticas anteriores.
Para calcular la probabilidad de esta manera podr´ıa usarse la siguiente f´ ormula:
P(E) =
n´ umero de intentos en los que ocurre E
n´ umero de intentos totales
. (5.1)
Ejemplo: Digamos que la siguiente tabla representa las notas que obtienen en un ex´ amnen en base a 100
puntos un grupo de estudiantes:
Notas N´ umero de estudiantes
90-99 4
80-90 6
70-79 4
60-69 3
50-59 2
40-49 1
53
Si el evento A es evento en el que un estudiante obtiene entre 90 y 99 puntos, la probabilidad de sacar un
ex´ amen al azar y que sea una nota entre 90 y 99 puntos ser´ a:
P(A) =
cantidad de estudiantes que obtienen notas entre 90 y 99 puntos
cantidad total de estudiantes
=
4
20
= 0,20.
5.4.2. Probabilidad cl´ asica
La probabilidad cl´ asica de un evento E, que denotaremos por P(E), se define como el n´ umero de eventos
elementales que componen al evento E, entre el n´ umero de eventos elementales que componen el espacio
muestral:
P(E) =
n´ umero de eventos elementales que componen al evento E
n´ umero de eventos elementales que componen el espacio muestral
. (5.2)
Es la definici´ on m´ as utilizada porque supone de antemano, y se necesita como requisito indispensable, que todos
los eventos elementales tienen la misma probabilidad de ocurrir.
Ejemplo: Cuando se lanza una moneda, se obtienen dos resultados posibles: cara o sello. Digamos que el
evento que salga cara lo denotamos por A y a la de sello B. La probabilidad de que salga una cara al lanzar la
moneda ser´ a
P(A) = P(B) = P(cara) = P(sello) =
1
2
.
En el caso del ejemplo en el que uno lanza un dado, entonces se tendr´ a
P(sale 1) = P(sale 5) =
1
6
.
Note que para el c´ alculo de la probabilidad desde ´ esta perspectiva cl´ asica no es necesario de ninguna manera
que se tenga que confeccionar y realizar el experimento. Vasta, como se ve, que uno tenga pleno conocimiento
de el espacio muestral y sus respectivos resultados, por su puesto.
5.5. Axiomas de la probabilidad
Recordemos primero que las frecuencias relativas de una distribuci´ on ten´ıan las siguientes propiedades:
Las frecuencias relativas son mayores o iguales que cero.
La frecuencia relativa del espacio muestral es igual a la unidad.
Si dos eventos son mutuamente excluyentes, es decir que no ocurren simult´ aneamente, entonces la fre-
cuencia relativa de su uni´ on es la suma de las frecuencias relativas de cada uno.
54
Tomando en cuenta que la probabilidad de un evento, de acuerdo a la definici´ on ya expuesta, es la frecuencia
relativa cuando se aumenta el tama˜ no de la muestra, se tienen lo siguiente.
Si E es un evento de un espacio muestral S y P(E) es la probabilidad de E, entonces se satisfacen los axiomas
de la probabilidad:
1. La probabilidad de un evento E, es un n´ umero siempre entre 0 y 1, es decir, 0 ≤P(E) ≤ 1.
2. Se le llama a E evento seguro a un evento cuando P(E) = 1. Por otro lado, se le llama evento imposible
si P(E) = 0.
3. La probabilidad del universo es la m´ axima, P(S) = 1.
4. Si E
1
, E
2
,..., E
n
, son eventos mutuamente excluyentes, entonces
P(E
1
∪E
2
∪... ∪E
n
) = P
_
n
_
i=1
E
i
_
=
n

i=1
P(E
i
). (5.3)
Con estos axiomas podremos tratar algunas de las propiedades de la probabilidad de eventos.
5.6. Posibilidades y probabilidades
En los escrito anteriormente hemos utilizada indistintamente en algunos momentos las palabras posibilidad y
probabilidad. La principal motivaci´ on de esta secci´ on es hacer una diferenciaci´ on de estas dos cosas. En prin-
cipio pareciera l´ ogico que uno pudiera definir la probabilidad en t´ ermino de las posibilidades de que un evento
ocurra, sin embargo, hablando en t´ erminos generales, la palabra posibilidad proviene de referirse a ciertos jue-
gos de apuestas en las que se utiliza la frase: “la posibilidad de ganar es de x a y”, por ejemplo, “la posibilidad
de que gane es de 3 a 1”.
Cuando uno habla de ´ esa manera es inebitable pensar en que tal frase est´ a ligada de alguna manera a razones,
en el sentido matem´ atico de la palabra. Efectivamente, la posibilidad de que ocurra un evento se determina
mediante la raz´ on de la probabilidad de que ocurra a la probabilidad de que no ocurra.
Esto quiere decir que si la probabilidad de que un evento ocurra es p, entonces las posibilidades de que ocurra
son x a y, si
x
y
=
p
1 − p
, (5.4)
de tal manera que x y y son n´ umeros enteros.
Ejemplo: Si se tiran dos monedas normales (no trucadas), la probabilidad de que las dos monedas caigan
cara es de
1
4
. Esto quiere decir si alguien apuesta a que las dos monedas no caen simult´ aneamente en cara, la
posibilidad de ganar la apuesta es de
3
4
1 −
3
4
=
0,75
0,25
=
3
1
,
55
es decir, la posibilidad de ganar la apuesta es de 3 a 1.
Hemos de considerar que si es mayor la probabilidad de que no ocurra un evento, entonces se acostumbra men-
cionar las posibilidades en contra del evento.
Ejemplo: Si se tira un dado no trucado, sabemos que la probabilidad de obtener un cuatro es
1
6
, es decir que
la posibilidad de obtener un cuatro es de 1 a 6; pero se acostumbra decir que las posibilidades en contra, esto
es, de no obtener un cuatro es de 6 a 1.
Inversamente, en el caso de tener las posibilidades de un evento, entonces es f´ acil obtener su probabilidad, pues
si la posibilidad de un evento es de x a y, entonces la probabilidad p de que ocurra tal evento es
p =
x
x +y
. (5.5)
Ejemplo: En la Copa Mundial de Futbol Francia 1998 se dec´ıa que el equipo mexicano ten´ıa una posibilidad
de 1 a 75 de llegar a ser el campe´ on del torneo. Si se desea encontrar la probabilidad de que el equipo mexicano
llegase a ser campe´ on, entonces se tiene que
p =
x
x +y
=
1
1 +75
=
1
76
= 0,01311,
es la probabilidad de que ocurriese el evento.
Esto tiene la ventaja de que permite, en combinaci´ on con el tercer axioma de la probabilidad, medir la con-
fiabilidad que tienen las opiniones de las personas sobre las posibilidades que le asignan a algunos eventos.
Esto quiere decir que el c´ alculo de las probabilidades de dos eventos mutuamente excluyentes a partir de las
posibilidades otorgadas de manera subjetiva resulta como un criterio de consistencia.
Ejemplo: Un crimin´ ologo piensa que las posibilidades de que en la pr´ oxima semana la cantidad de delitos
en una ciudad aumente con respecto a la anterior es de 5 a 2, de que sea la misma cantidad de delitos es
de 1 a 3 y las posibilidades de que aumente la cantidad o sea la misma es de 7 a 4. Si se desea saber si
son consistentes las probabilidades correspondientes habr´ıa que hacer los c´ alculos. Las probabilidades de que
aumente la cantidad de delitos, que sea igual la cantidad de delitos, y de que aumente o sea igual la cantidad
de delitos es, respectivamente, de
p
aumente
=
5
5 +2
=
5
7
, p
igual
=
1
1 +3
=
1
4
, p
aumente
=
7
7 +4
=
7
11
,
y dado que
5
7
+
1
4
=
27
28
(como son eventos mutuamente excluyentes) no es lo mismo que
7
11
, entonces los criterios
del crimin´ ologo pueden ser cuestionados.
5.7. Propiedades de la probabilidad de eventos no elementales
Cuando se tienen eventos elementales no existe mucho problema en el sentido del c´ alculo de las probabilidades,
pues basta con una contabilizaci´ on o el uso directo del c´ alculo combinatorio. Pero en el caso de eventos no ele-
mentales, que son los compuestos por m´ as de un evento elemental, el proceder de manera an´ aloga resulta muy
56
complejo y las operaciones pueden sobrepasar la capacidad de c´ alculo existente. Sin embargo, utilizando los
axiomas de la probabilidad y las siguientes propiedades, se podr´ an expresar las probabilidades de estos eventos
en t´ erminos de los eventos elementales que lo componen, siempre y cuando se conozcan las probabilidades de
´ estos.
Veamos la probabilidad de una uni´ on de eventos, la cual la podremos calcular de la siguiente manera:
1. Propiedad 1. Si A y B son dos eventos, la probabilidad de que ocurra A o B es igual a la suma de las
probabilidades de ocurrencia de A y de B, menos la probabilidad de que ocurran A y B simult´ aneamente.
Es decir,
P(A∪B) = P(A) +P(B) −P(A∩B) (5.6)
Ahora, si el caso es que los eventos sean mutuamente excluyentes se tiene:
2. Propiedad 2. Si dos eventos, A y B, son mutuamente excluyentes entonces la probabilidad de que ocurra
A o B es igual a la suma de las probabilidades de ocurrencia de A y de B. Es decir
P(A∪B) = P(A) +P(B). (5.7)
Otra propiedad que se deriva de las anteriores es cuando se busca la probabilidad del complemento de un
evento E, que denotaremos como
¯
E:
3. Propiedad 3. Si E es un evento y
¯
E su complemento, entonces
P(
¯
E) = 1 −P(E). (5.8)
5.8. Probabilidad condicionada
En el c´ alculo de las probabilidades de algunos sucesos, el valor de dicha probabilidad var´ a en funci´ on del cono-
cimiento de determinadas informaciones relativas a estos sucesos.
Ejemplo: Si disponemos de una urna que contiene cuatro bolas numeradas del 1 al 4, extraemos una bola y
seguidamente la volvemos a introducir para realizar una segunda extracci´ on, la probabilidad de extraer, por
ejemplo, la bola n´ umero 3 en la segunda extracci´ on es la misma que en la primera. Si realizamos el mismo pro-
ceso sin reemplazar la bola extra´ıda la probabilidad de extraer, por ejemplo, la bola n´ umero 3 en la segunda
extracci´ on depender´ a de la bola extra´ıda en primer lugar.
Definici´ on. Sean A y B dos sucesos tal que P(A) 0, se llama probabilidad de B condicionada a A, P(B|A), a
la probabilidad de B tomando como espacio muestral A, es decir, la probabilidad de que ocurra B dado que ha
sucedido A. La probabilidad de que ocurra un evento A dado que ocurri´ o el evento B (el evento A depende del
evento B) es:
P(A|B) =
P(A∩B)
P(B)
. (5.9)
Hay que notar que esta propiedad no es conmutativa, situaci´ on que s´ı ocurre con la probabilidad de uni´ on o la
intersecci´ on de eventos, por lo que no hay que confundir P(A|B) y P(B|A).
Ejemplo: Consideremos el experimento de “lanzar un dado al aire”. Calculemos, por ejemplo, la probabilidad
57
de obtener un 3 sabiendo que ha salido un n´ umero impar. Definimos los sucesos A = {sacar 3} y B = {1, 3, 5};
entonces, P(A|B) = 1/3, puesto que si sabemos que ha salido un n´ umero impar, los casos posibles ahora son 3
y los casos favorables al suceso A s´ olo 1.
El conocimiento de que ha ocurrido el suceso A modifica, en algunas ocasiones, la probabilidad del suceso B,
pero en otras no. Los sucesos en los que, conociendo que uno ha ocurrido, no se modifica la probabilidad del
otro, decimos que son independientes y, si se modifica, decimos que son dependientes entre s´ı.
Finalmente, el criterio para la independencia de eventos queda como sigue:
Definici´ on. Dos eventos A y B son independientes si y s´ olo si
P(A|B) = P(A), P(B|A) = P(B), (5.10)
o, lo que es lo mismo,
P(A|B) = P(A)P(B). (5.11)
5.9. Probabilidad total
Llamamos sistema completo de sucesos a una familia de sucesos A
1
, A
2
, ..., A
n
que cumplen:
Son incompatibles dos a dos, A
i
∩A
j
=φ.
La uni´ on de todos ellos es el suceso seguro,

n
i=1
A
i
= S.
5.9.1. Teorema de la probabilidad total
Sea A
1
, A
2
, ..., A
n
un sistema completo de sucesos tales que la probabilidad de cada uno de ellos es distinta de
cero, y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B|A
i
), entonces la
probabilidad del suceso B viene dada por la expresi´ on:
P(B) = P(A
1
)P(B|A
1
) +P(A
2
)P(B|A
2
) +... +P(A
n
)P(B|A
n
). (5.12)
5.10. Teorema de Bayes
En el a˜ no 1763, dos a˜ nos despu´ es de la muerte de Thomas Bayes (1702-1761), se public´ o una memoria en la
que aparece, por vez primera, la determinaci´ on de la probabilidad de las causas a partir de los efectos que han
podido ser observados. El c´ alculo de dichas probabilidades recibe el nombre de teorema de Bayes.
Sea A
1
, A
2
, ..., A
n
un sistema completo de sucesos, tales que la probabilidad de cada uno de ellos es distinta
de cero, y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B|A
i
). entonces la
probabilidad P(A
i
|B) viene dada por la expresi´ on:
P(A
i
|B) =
P(A
i
)P(B|A
i
)
P(B)
=
P(A
i
)P(B|A
i
)
P(A
1
)P(B|A
1
) +P(A
2
)P(B|A
2
) +... +P(A
n
)P(B|A
n
)
. (5.13)
58
5.11. Problemas de final de cap´ıtulo
A continuaci´ on una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de
los problemas pudiera usarse todo lo reflejado en estas notas, as´ı como tambi´ en cualquier herramienta compu-
tacional o tecnol´ ogica disponible.
1. Con los jugadores de un club de f´ utbol se forman dos equipos para jugar un partido de entrenamiento;
entre los dos equipos se re´ unen 6 defensas, 8 medios, 6 delanteros y 2 porteros. El entrenador sabe que
en estos partidos, la probabilidad de que se lesione un jugador es 0.22 si es delantero, 0.11 si es medio,
0.055 si es defensa y 0 si es portero. (a) Calcular la probabilidad de que se lesione uno cualquiera de los
jugadores en este partido. (b) Si se sabe que un jugador se ha lesionado, determinar la probabilidad de
que haya sido un defensa.
2. Tras un estudio estad´ıstico en una ciudad se observa que el 70 % de los motoristas son varones y, de estos,
el 60 % llevan habitualmente casco. El porcentaje de mujeres que conducen habitualmente con casco es
del 40 %. Se pide: (a) Calcular la probabilidad de que un motorista elegido al azar lleve casco. (b) Se
elige un motorista al azar y se observa que lleva casco. ¿Cu´ al es la probabilidad de que sea var´ on?
3. En una ciudad, el 35 % vota al partido A, el 45 % vota al partido B y el resto se abstiene. Se sabe adem´ as
que el 20 % de los votantes de A, el 30 % de los de B y el 15 % de los que se abstienen, son mayores de
60 a˜ nos. Se pide: (a) Hallar la probabilidad de que un ciudadano elegido al azar sea mayor de 60 a˜ nos.
(b) Hallar la probabilidad de que un ciudadano mayor de 60 a˜ nos se haya abstenido.
4. Los alumnos de Primero de Biolog´ıa tienen que realizar dos pruebas, una te´ orica y otra pr´ actica. La
probabilidad de que un estudiante apruebe la parte te´ orica es de 0.6, la probabilidad de que apruebe la
parte pr´ actica es de 0.8 y la probabilidad de que apruebe ambas pruebas es 0.5. (a) ¿Son independientes
los sucesos aprobar la parte te´ orica y la parte pr´ actica? (b) ¿Cu´ al es la probabilidad de que un alumno no
apruebe ninguno de los dos ex´ amenes? (c) ¿Cu´ al es la probabilidad de que un alumno apruebe solamente
uno de los dos ex´ amenes? (d) Se sabe que un alumno aprob´ o la teor´ıa. ¿Cu´ al es la probabilidad de que
apruebe tambi´ en la pr´ actica?
5. En una baraja de 40 cartas. (a) Se toman dos cartas sin reemplazamiento. ¿Cu´ al es la probabilidad de que
las dos sean de distinto n´ umero? (b) Y si se toman tres cartas, ¿Cu´ al es la probabilidad de que los tres
n´ umeros sean distintos?
6. Tenemos un dado con tres “1”, dos “2” y un “3”. Lo tiramos dos veces consecutivas y anotamos la suma
de los resultados. (a) ¿Cu´ al es el Espacio Muestral? (b) ¿Cu´ al es la probabilidad de que la suma sea 4?
(c) ¿Cu´ al es la suma m´ as probable? ¿Cu´ anto vale su probabilidad?
7. Tenemos dos dados A y B, ambos trucados. En el dado A hay tres “1” y tres “2” y en el dado B hay dos
“1” y cuatro “2”. Se elige un dado al azar y se tira. (a) ¿Cu´ al es la probabilidad de obtener un “1”? (b)
Sabiendo que se ha obtenido un “2”, ¿Cu´ al es la probabilidad de que se haya elegido el dado B?
8. En una caja hay x bolas blancas y 1 bola roja. Al extraer de la caja dos bolas al azar sin reemplazamiento,
la probabilidad de que sean blancas es 1/2. Calcula el n´ umero de bolas blancas que debe tener la caja.
9. El 35 % de los cr´ editos de un banco es para vivienda, el 50 % para industrias y el 15 % para consumo
diverso. Resultan fallidos el 20 % de los cr´ editos para vivienda, el 15 % de los cr´ editos para industrias y
el 70 % de los cr´ editos para consumo. Calcula la probabilidad de que se pague un cr´ edito elegido al azar.
10. El volumen de producci´ on en tres plantas diferentes de una f´ abrica es de 500 unidades en la primera,
1000 unidades en la segunda y 2000 en la tercera. Sabiendo que el porcentaje de unidades defectuosas
producidas en cada planta es del 1 %, 0.8 % y 2 %, respectivamente, calcula la probabilidad de que al
seleccionar una unidad al azar sea defectuosa.
11. El 20 % de los empleados de una empresa son ingenieros y otro 20 % son economistas. El 75 % de los
ingenieros ocupan un puesto directivo y el 50 % de los economistas tambi´ en, mientras que de los no
59
ingenieros y no economistas solamente el 20 % ocupan un puesto directivo. ¿Cu´ al es la probabilidad de
que un empleado directivo elegido al azar sea ingeniero?
12. Se toman dos barajas espa˜ nolas de 40 cartas. Se extrae al azar una carta de la primera baraja y se introduce
en la segunda baraja. Se mezclan las cartas de esta segunda baraja y se extrae una carta, que resulta ser el
dos de oros. ¿Cu´ al es la probabilidad de que la primera carta extra´ıda fuese una espada?
13. En un conjunto de estudiantes el 15 % estudia alem´ an, el 30 % estudia franc´ es y el 10 % ambas materias.
(a) ¿Son independientes los sucesos estudiar alem´ an y estudiar franc´ es?. (b) Si se elige un estudiante al
azar, calcule la probabilidad de que no estudie franc´ es ni alem´ an.
14. Un ladr´ on, al huir de un polic´ıa, puede hacerlo por las calles A, B o C, con probabilidades p(A) = 0, 25,
p(B) = 0, 6 y p(C) = 0, 15 respectivamente. La probabilidad de ser alcanzado por la calle es 0,4 si huye
por la calle B es 0,5 y si huye por la calle C es 0,6. (a) Calcule la probabilidad de que la polic´ıa alcance
al ladr´ on. (b) Si el ladr´ on ha sido alcanzado, ¿cu´ al es la probabilidad de que haya sido en la calle A?
15. De una urna con 4 bolas blancas y 2 negras se extraen al azar, sucesivamente y sin reemplazamiento,
dos bolas, (a) ¿Cu´ al es la probabilidad de que las bolas extraidas sean blancas? (b) Si la segunda bola ha
resultado ser negra, ¿cu´ al es la probabilidad de que la primera tambi´ en lo haya sido?
16. Sean Ay Bdos sucesos de un experimento aleatorio tales que: P(A) =0, 6, P(B) =0, 5 y P(A
c
∪B
c
) =0, 7.
(a) Calc´ ulese P(A∩B) y raz´ onese si los sucesos A y B son independientes. (b) Calc´ ulese P(A∪B).
17. En un estudio realizado en cierta Universidad se ha determinado que un 20 % de sus estudiantes no
utilizan los transportes p´ ublicos para acudir a sus clases y que un 65 % de los estudiantes que utilizan
los transportes p´ ublicos tambi´ en hacen uso del comedor universitario. Calcular la probabilidad de que
seleccionado al azar un estudiante en esa Universidad resulte ser usuario de los transportes p´ ublicos y del
comedor universitario. Justificar la respuesta.
18. Una urna contiene dos monedas de plata y tres de cobre. Otra contiene cuatro monedas de plata y tres
de cobre. Si se elige una urna al azar y se extrae una moneda al azar. ¿Cu´ al es la probabilidad de que la
moneda extra´ıda sea de plata?.
19. Un dado est´ a trucado de manera que son iguales las probabilidades de obtener 2, 4 o 6, tambi´ en son
iguales las probabilidades de obtener 1, 3 o 5 y la probabilidad de obtener 2 es doble que la probabilidad
de sacar 1. Deducir razonadamente cu´ al es la probabilidad de que al lanzar el dado dos veces se obtenga
una suma igual a 7.
20. Una experiencia aleatoria consiste en preguntar a tres personas distintas, elegidas al azar, si son partidarias
o no de consumir un determinado producto. (a) Escribe el espacio muestral asociado a dicho experimento,
utilizando la letra ”s”para las respuestas afirmativas y ”n”para las negativas. (b) ¿Qu´ e elementos del es-
pacio muestral anterior constituyen el suceso .
a
l menos dos de las personas son partidarias de consumir el
producto
¿
(c) Describe el suceso contrario de ”m´ as de una persona es partidaria de consumir el producto”
21. En un supermercado el 70 % de las compras las realizan las mujeres; de las compras realizadas por estas,
el 80 % supera las 600 BsF, mientras que de las compras realizadas por hombres s´ olo el 30 % supera esa
cantidad. (a) Elegido un ticket de compra al azar, ¿cu´ al es la probabilidad de que supere las 600 BsF? (b)
Si se sabe que el ticket de compra no supera las 600 BsF ¿cu´ al es la probabilidad de que la compra haya
sido hecha por una mujer?
22. Se extrae una carta de una baraja espa˜ nola de 40 cartas. Si la carta extraida es un rey, nos dirigimos a la
urna I; en caso contrario a la urna II. A continuaci´ on, extraemos una bola. El contenido de la urna I es de
7 bolas blancas y 5 negras y el de la urna II es de 6 bolas blancas y 4 negras. Halla: (a) La probabilidad
de que la bola extraida sea blanca y de la urna II. (b) La probabilidad de que la bola extraida sea negra.
23. En una ciudad el 55 % de los habitantes consume pan integral, el 30 % consume pan de multicereales y
el 20 % consume ambos. Se pide: (I) Sabiendo que un habitante consume pan integral, ¿cu´ al es la proba-
bilidad de que coma pan de multicereales? (II) Sabiendo que un habitante consume pan de multicereales,
60
¿cu´ al es la probabilidad de que no consume pan integral? (III) ¿Cu´ al es la probabilidad de que una persona
de esa ciudad no consuma ninguno de los dos tipos de pan?
24. Si A y B son dos sucesos tales que: P(A) =
3
8
, P(B) =
1
2
y P(A∩B) =
1
4
. Calcula P(A
c
∩B
c
).
25. Tengo dos urnas, dos bolas blancas y dos bolas negras. Se desea saber como debo distribuir las bolas en
las urnas para que, al elegir una urna al azar, sea m´ axima la probabilidad de obtener una bola blanca. La
´ unica condici´ on exigida es que cada una tenga al menos una bola.
26. Se estima que s´ olo un 20 % de los que compran acciones en Bolsa tienen conocimientos burs´ atiles. De
ellos el 80 % obtienen beneficios. De los que compran acciones sin conocimientos burs´ atiles, s´ olo un
10 % obtienen beneficios. Se desea saber: (a) El tanto por ciento de los que compran acciones en Bolsa
que obtienen beneficios. (b) Si se elige al azar una persona que ha comprado acciones en Bolsa y resulta
que ha obtenido beneficios, ¿cu´ al es la probabilidad de que tenga conocimientos burs´ atiles?
27. El equipo directivo de cierta empresa del sector de hosteler´ıa est´ a constituido por 25 personas de las que
un 60 % son mujeres. El gerente tiene que seleccionar a una persona de dicho equipo para que represente
a la empresa en un certamen internacional. Decide lanzar una moneda: si sale cara, selecciona a una mujer
y si sale cruz, a un hombre. Sabiendo que 5 mujeres y 3 hombres del equipo directivo no hablan ingl´ es,
determina, justificando la respuesta, la probabilidad de que la persona seleccionada hable ingl´ es.
28. Dos personas piensan cada una de ellas un n´ umero del 0 al 9. Calcula la probabilidad de que las dos
personas no piensen el mismo n´ umero.
29. Dos sucesos tienen probabilidades 0,4 y 0,5. Sabiendo que son independientes, calcula la probabilidad de
que no suceda ninguno de los dos.
30. En una Universidad existen tres facultades: A, B y C. En A hay matriculadas 150 chicas y 50 chicos;
en B, 300 chicas y 200 chicos; y en C, 150 chicas y 150 chicos. (a) Calcula la probabilidad de que un
estudiante, elegido al azar, sea chico. (b) Si un estudiante elegido al azar resultara ser chico, ¿cu´ al es su
facultad m´ as probable?
31. Se escuchan tres discos y se vuelven a guardar al azar. ¿Cu´ al es la probabilidad de que al menos uno de
los discos haya sido guardado en el envoltorio que le correspond´ıa?
32. Se considera una c´ elula en el instante t=0. En el intante t=1 la c´ elula puede: bien reproducirse, divi-
di´ endose en dos, con probabilidad 3/4, o bien morir con probabilidad 1/4. Si la c´ elula se divide, entonces
en el tiempo t=2 cada uno de sus dos descendientes puede tambi´ en subdividirse o morir, con las mismas
probabilidades que antes, independientemente uno de otro. (a) ¿Cu´ antas c´ elulas es posible que haya en el
tiempo t=2? (b) ¿Con qu´ e probabilidad?
33. Una caja contiene 10 bolas blancas, 5 negras y 5 rojas. Se extraen dos bolas consecutivamente de la caja.
Calcula la probabilidad de que las dos sean blancas si: (a) Antes de extraer la segunda bola se vuelve a
meter la primera en la caja. (b) La segunda bola se extrae sin haber metido la primera en la caja.
34. Un monedero contiene 2 monedas de plata y 3 de cobre, y otro contiene 4 de plata y 3 de cobre. Si se
elige un monedero al azar y se extrae una moneda ¿Cu´ al es la probabilidad de que sea de plata?
35. En una oficina el 70 % de los empleados son asturianos. De entre los asturianos, el 50 % son hombres,
mientras que de los no asturianos, s´ olo son hombres el 20 %. ¿Qu´ e porcentaje de empleados no asturianos
son mujeres? (a) Calcula la probabilidad de que un empleado de la oficina sea mujer. (b) Fernando trabaja
en dicha oficina. ¿Cu´ al es la probabilidad de que sea asturiano?
36. El 12 % de los habitantes de un pa´ıs padece cierta enfermedad. Para el diagn´ ostico de esta, se dispone de
un procedimiento que no es completamente fiable ya que da positivo en el 90 % de los casos de personas
realmente enfermas, pero tambi´ en da positivo en el 5 % de personas sanas. ¿Cu´ al es la probabilidad de
que est´ e sana una persona a la que el procedimiento le ha dado positivo?
37. En un ayuntamiento hay 5 concejales del partido A, 4 del B y 1 del C. Si se eligen al azar y sucesivamente
tres concejales, ¿cu´ al es la probabilidad de que los tres sean del partido A? ¿y la de que pertenezcan a
61
partidos distintos?
38. Un dado ha sido trucado de manera que la probabilidad de sacar un n´ umero par es el doble que la de sacar
un n´ umero impar. Se lanza el dado y se pide: La probabilidad de obtener un n´ umero par (a) Si, a la vez,
se lanza un dado no trucado, la probabilidad de obtener un n´ umero par y un n´ umero impar. (b) Si, a la
vez, se lanza un dado no trucado, la probabilidad de obtener, al menos, un n´ umero impar.
62
Cap´ıtulo 6
Variable aleatoria y funci ´ on de
distribuci ´ on
6.1. Introducci´ on
En este tema se tratar´ a de formalizar num´ ericamente los resultados de un fen´ omeno aleatorio. Por tanto, una
variable aleatoria es un valor num´ erico que corresponde a un resultado de un experimento aleatorio. Algunos
ejemplos son: n´ umero de caras obtenidas al lanzar seis veces una moneda, n´ umero de llamadas que recibe un
tel´ efono durante una hora, tiempo de fallo de una componente el´ ectrica, etc.
El estudio que se har´ a en este tema ser´ a an´ alogo al que se hace con las variables estad´ısticas en descriptiva.
As´ı retomaremos el concepto de distribuci´ on y las caracter´ısticas num´ ericas, como la media y varianza. El papel
que all´ı jugaba la frecuencia relativa lo juega ahora la probabilidad. Esto va a proporcionar aspectos y propie-
dades referentes a fen´ omenos aleatorios que permitir´ an modelos muy estudiados en la actualidad.
En este tema se introduce el concepto de variable aleatoria y se estudian los distintos tipos de variables aleato-
rias a un nivel muy general, lo que nos permitir´ a manejar los modelos estad´ısticos para describir los posibles
resultados de un experimento aleatorio y asignar probabilidades a los diferentes sucesos que nos interesen.
Tanto en la vida cotidiana como en el campo cient´ıfico estamos habituados a observar fen´ omenos aleatorios
cuyos resultados se expresan mediante n´ umeros; por ejemplo el voltaje de salida en una fuente de alimentaci´ on,
el n´ umero de personas en la cola del cine, la velocidad de conexi´ on a la red, etc. Incluso en problemas de
naturaleza puramente cualitativa es muy frecuente recurrir a la codificaci´ on num´ erica; en situaciones tales como:
el diagn´ ostico de un paciente ”sano.
o
.
en
fermo”, preguntas del tipo
ˆ
A¿estudias o trabajas?, etc., las respuestas
son usualmente codificadas con 0 y 1, aunque en realidad podr´ıa emplearse cualquier pareja de s´ımbolos con
igual precisi´ on.
63
6.2. Variable aleatoria unidimensional
Este proceso de cuantificaci´ on nos lleva de manera natural a considerar la siguiente definici´ on:
Dado un experimento aleatorio y asociado al mismo, un espacio probabil´ıstico (E, A, P), una variable aleatoria
(V.A.) es una aplicaci´ on X : E → ℜ, a cada valor de X, del espacio muestral le hace corresponder un n´ umero
real. Se dice que X es una variable aleatoria si para cualquier x perteneciente a ℜ, el conjunto de los sucesos
elementales le hace corresponder un valor que verifica:
∀X ∈ ℜ, X(S) ≤ X (6.1)
Ejemplo: Consideramos un experimento aleatorio de lanzar una moneda al aire tres veces y anotamos
el resultado. Se define la variable aleatoria X como n´ umero de caras aparecidas en los tres lanzamientos.
Calcular el espacio muestral y comprobar que es una variable aleatoria. La soluci´ on es la siguiente, E =
(C, X, X), (X,C, X), (X, X,C), (C,C, X), (C, X,C), (X,C,C), (C,C,C), (X, X, X), en donde
Eventos Valor de la v.a.
φ X ≤ 0
(X, X, X) 0 ≤ X ≤ 1
(C,C,C)(X,C, X)(X, X,C) 1 ≤ X ≤ 2
(C,C, X)(C, X,C)(X,C,C) 2 ≤ X ≤ 3
(C,C,C) X > 3
En general emplearemos las siglas v.a. para referirnos a una variable aleatoria.
Para caracterizar la distribuci´ on de probabilidad inducida por una v.a. X definiremos una nueva funci´ on m´ as
sencilla de manejar:
Definici´ on. (Funci´ on de distribuci´ on). Dada la v.a. X se denomina funci´ on de distribuci´ on asociada a X, a la
funci´ on F : ℜ→ℜ definida por:
F(t) = Pr[X ≤t] = Pr(X ∈ (−∞, t]), ∀t ∈ ℜ. (6.2)
Las propiedades m´ as importantes de las funciones de distribuci´ on son:
1. F(−∞) = l´ım
n→−∞
Pr[X ≤t] = 0.
2. F(∞) = l´ım
n→∞
Pr[X ≤t] = 0.
3. La funci´ on es continua por la derecha, es decir, l´ım
h→0
+ F(t +h) = F(t)
4. F es no decreciente, es decir, si t
1
<t
2
entonces F(t
1
) ≤ F(t
2
).
Teorema. Una funci´ on F : ℜ → ℜ se dice que es de distribuci´ on si y s´ olo si verifica las cuatro propiedades
anteriores.
6.3. Variables discretas
Definici´ on. (Variable discreta). Una variable aleatoria discreta es aquella que s´ olo puede tomar valores dentro
de un conjunto finito o infinito numerable.
64
Definici´ on. (Funci´ on de probabilidad). Sea X una v.a. discreta que toma los valores x
i
con probabilidades
p
i
= Pr(X = x
i
), con ∑
i
p
i
= 1. Se denomina funci´ on de probabilidad de la variable X a la funci´ on que asigna a
cada x
i
su probabilidad p
i
.
En las variables aleatorias discretas la funci´ on de distribuci´ on viene dada por la siguiente expresi´ on:
F(t) = Pr[X ≤t] =

x
i
≤t
Pr(x
i
). (6.3)
Esta funci´ on es escalonada, no decreciente, con saltos de discontinuidad en los puntos x
i
. El valor del salto en
x
i
coincide con la probabilidad, p
i
, de dicho valor.
6.4. Variables continuas
Definici´ on. (Variable continua). Una variable aleatoria continua es aquella que toma valores en uno o varios
intervalos de la recta real.
En las v.a. continuas la funci´ on de distribuci´ on no se puede calcular como la suma de las probabilidades de
ciertos puntos porque el conjunto de posibles valores de la variable es no numerable. Para abordar esta nueva
situaci´ on necesitamos la noci´ on de funci´ on de densidad.
Definici´ on. (Funci´ on de densidad). Dada una v.a. continua X, su funci´ on de densidad es la funci´ on real de
variable real
f (x) = l´ım
h→0
+
Pr(x −h ≤X ≤ x +h)
2h
. (6.4)
De este modo, surge el concepto de funci´ on de densidad como la funci´ on l´ımite a la cual se aproxima el histo-
grama. As´ı, la probabilidad de un intervalo (a, b) ser´ a el ´ area limitada por esta funci´ on de densidad, las rectas
x = a, x = b y el eje de abscisas.
Aunque, de acuerdo con la anterior, la probabilidad de que la variable aleatoria tome un valor concreto es igual
a cero, tiene sentido analizar lo ”densamente”que est´ a repartida la probabilidad en torno a ese valor.
De la definici´ on anterior, se deduce que la funci´ on de densidad verifica las siguientes propiedades:
f (x) > 0, ∀x ∈ ℜ, (6.5)
_

−∞
f (x)dx = 1. (6.6)
En general, cualquier funci´ on real que verifica las propiedades anteriores es la funci´ on de densidad de alguna
v.a. continua X.
65
La funci´ on de distribuci´ on de una v.a. continua X se expresa a partir de la funci´ on de densidad como:
F(t) =
_
t
−∞
f (x)dx, ∀x ∈ ℜ (6.7)
Esta funci´ on es continua.
Por lo tanto, la funci´ on de densidad de una v.a. continua es la derivada de su funci´ on de distribuci´ on, f (x) =
F

(x).
6.5. Caracter´ısticas de una v.a.
Las medidas resumen definidas para v.e. pueden generalizarse al caso de variables aleatorias, sin m´ as que
equiparar las frecuencias relativas de variables estad´ısticas con las probabilidades de las variables aleatorias.
Entre los descriptores m´ as habituales de las variables aleatorias se encuentran los siguientes.
6.5.1. Definici´ on. (Esperanza Matem´ atica)
Cuando se realiza un experimento determinista el resultado del experimento es ´ unico en contraposici´ on con
un experimento aleatorio en el cual existen un intervalo de valores, seg´ un la variable aleatoria definida, donde
es posible que ocurra cualquier resultado. En ocasiones, por simplicidad, se aproxima la forma de explicar un
experimento aleatorio en t´ erminos de un experimento determinista pero con la dificultad de no tener argumentos
suficientes para escoger el resultado ´ unico que se asociar´ıa al experimento determinista. El conocimiento del
concepto de valor esperado ayuda a eliminar la dificultad planteada.
Dada una v. a. X definida sobre (E,A,Pr), se denomina esperanza o valor medio de X a la siguiente expresi´ on
µ = E(X) =

x
i
∈S
X
x
i
P(x
i
), si X es discreta, (6.8)
µ = E(X) =
_

−∞
x f (x)dx, si X es continua (6.9)
La esperanza de una v.a. verifica las siguientes propiedades:
E(aX +b) = aE(X) +b. (6.10)
E(X ±Y) = E(X) ±E(Y). (6.11)
Si X e Y son independientes, entonces E(XY) = E(X)E(Y). (6.12)
La estructura de la Ecuaci´ on 4.1 se presenta en otros contextos, como por ejemplo en Mec´ anica, donde la fun-
ci´ on de densidad de probabilidades tiene el sentido de la distribuci´ on de la masa a lo largo de un eje y el valor
esperado se corresponde con el centro de esa masa.
En el contexto de la teor´ıa de probabilidades una variable aleatoria estar´ a definida en un cierto intervalo cuyo
c¸entro.
es
su valor esperado. En este sentido, se podr´ıa decir que el experimento aleatorio est´ a definido alrededor
66
del valor esperado y la ponderaci´ on de cada uno de los posibles resultados viene dada en t´ erminos del valor de
la funci´ on de densidad correspondiente en cada punto. El concepto del valor esperado permite aglutinar en un
n´ umero los aportes ponderados de cada uno de los posibles resultados del experimento.
Ejemplo: una v.a. Y cuya funci ´ on de densiad de probabilidad est´ a dada por la expresi´ on: f (y) =λexp(−λy),
cuando y ≥ 0 y cero para cualquier otro valor. Hallar el valor esperado de dicha funci´ on de densidad de pro-
babilidad.
6.5.2. Definici´ on. (Varianza)
En la secci´ on anterior se analiz´ o la definici´ on de valor esperado tanto desde el punto de vista matem´ atico como
desde el punto de vista del fen´ omeno aleatorio involucrado. Este valor permite ubicar r´ apidamente la regi´ on
donde est´ a definida la variable como aquella regi´ on que se encuentra alrededor del valor esperado. Pero no
proporciona informaci´ on acerca del tama˜ no de esa regi´ on. Una medida de la dispersi´ on o de la concentraci´ on
de la variable alrededor de su valor esperado lo proporciona la varianza.
La varianza de una v.a. X viene dada por la expresi´ on
σ
2
=Var(X) = E
_
(X −µ)
2
¸
=

x
i
∈S
X
(x
i
−µ)
2
P(x
i
), si X es discreta, (6.13)
σ
2
=Var(X) = E
_
(X −µ)
2
¸
=
_

−∞
(x −µ)
2
f (x)dx, si X es continua (6.14)
La varianza de una v.a. verifica las siguientes propiedades:
Var(X) 0. (6.15)
Var(aX +b) = a
2
Var(X). (6.16)
Var(X) = E(X
2
) −E(X)
2
. (6.17)
Si X e Y son independientes, Var(X +Y) =Var(X −Y) =Var(X) +Var(Y). (6.18)
Ejemplo: una v.a. Y cuya funci ´ on de densiad de probabilidad est´ a dada por la expresi´ on: f (y) =λexp(−λy),
cuando y ≥0 y cero para cualquier otro valor. Hallar la varianza de dicha funci´ on de densidad de probabilidad.
6.6. Inecuaci´ on de Chevyshev
La definici´ on de variable aleatoria y de las funciones de distribuci´ on y de densidad refleja el comportamiento
del experimento aleatorio que se est´ a analizando. Se ha verificado en diversas oportunidades que la forma de las
funciones de distribuci´ on y de densidad debe seguir un cierto patr´ on que obliga a que no todo tipo de funci´ on
puede ser considerada para este tipo de representaci´ on. En este orden de ideas, el conocimiento del valor espe-
rado y la varianza proporciona informaci´ on adicional acerca de la forma de estas funciones y, en consecuencia,
de las probabilidades asignadas a diversos tipos de eventos. Este tipo de informaci´ on llega hasta el extremo
de indicar topes en el valor de la probabilidad de ocurrencia de ciertos eventos para cualquier tipo de variable
67
aleatoria.
La inecuaci´ on de Chevyschev permite conocer un l´ımite al valor que puede tener la probabilidad de un cierto
tipo de evento independientemente de la forma de su funci´ on de densidad de probabilidades.
Definici´ on: Sea una variable aleatoria X de la cual s´ olo conocemos su valor esperado E(X) y su varianza V(X).
Sea un evento del tipo X −E(X) ≤ kσ
X
, entonces la probabilidad de ocurrencia de este evento tiene un valor
m´ınimo que es una funci´ on del valor real positivo k y no depende de la forma de la funci´ on de densidad de
probabilidades de X.
PX −E(X) ≤ kσ
X
1 −
1
k
2
(6.19)
Notas:
El valor m´ınimo de la probabilidad del evento mencionado se calcula utilizando el lado derecho de la
Ecuaci´ on anterior.
La expresi´ on anterior se conoce como la inecuaci´ on de Chevyschev.
6.7. Problemas de final de cap´ıtulo
A continuaci´ on una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de
los problemas pudiera usarse todo lo reflejado en estas notas, as´ı como tambi´ en cualquier herramienta compu-
tacional o tecnol´ ogica disponible.
1. Se lanza al aire una moneda tres veces. Calcula la funci´ on de masa y la de distribuci´ on de X: No de cruces
obtenido.
2. Se ha comprobado experimentalmente que la vida ´ util de una bater´ıa es una variable aleatoria cuya fun-
ci´ on de densidad es:
f (x) = be
(
−ax), si x ≥ 0, con a, b ≥ 0.
Determina la relaci´ on entre a y b. Obt´ en la funci´ on de distribuci´ on de la variable y calcula la probabilidad
de que una bater´ıa dure un tiempo mayor a 1/a. Sol. P=0,3678
3. Un PEQ consta de 10 preguntas tipo test, cada una de ellas con 4 posibles respuestas. Cada pregunta
contestada correctamente es un punto. Cada fallo descuenta 0,5 puntos. Como ser´ a la calificaci´ on del
alumno si ´ este contesta a todas al azar.
4. Por experiencia se sabe que la probabilidad de que llames al ambulatorio y no comunique es de 0,25.
Demuestra matem´ aticamente que el n´ umero esperado de llamadas que debes hacer para que te cojan es
de 4.
5. Una variable aleatoria tiene por funci´ on de densidad:
f (x) =
1
12
(x
2
+1), si 0 ≤ x ≤ 3.
Calcular la media de X y su varianza. Sol. µ = 2,0625, σ
2
= 0,5461.
68
6. Los retrasos en las entregas de los pedidos en una f´ abrica respecto de la planificaci´ on establecida siguen
una variable aleatoria cuya funci´ on de densidad es:
f (x) =
2
π
1
1 +x
2
, si −1 ≤ x ≤ 1.
Cu´ al es el retraso medio de un pedido y la desviaci´ on t´ıpica. Propone un intervalo de tiempos de retraso,
centrado en el retraso medio, para el 90 % de los casos. Sol. µ = 0, σ
2
= 2,28, (-0,84; 0,84)
7. Una f´ abrica de coches vende de media, al a˜ no, 50 unidades de su modelo m´ as caro, con una desviaci´ on
t´ıpica de 10. Cu´ antos coches de este modelo debe de tener disponibles si se quiere garantizar la demanda
al momento de estos veh´ıculos, con una probabilidad del 95 %? Sol. 95 coches
69
Cap´ıtulo 7
Distribuciones de Probabilidad
Binomial y Normal
7.1. Introducci´ on
Estudiaremos en este tema dos de las distribuciones de probabilidad m´ as importantes y que son imprescindi-
bles a la hora de adentrarnos en el estudio de la inferencia estad´ıstica. La distribuci´ on binomial es uno de los
primeros ejemplos de las llamadas distribuciones discretas (que s´ olo pueden tomar un n´ umero finito, o infinito
numerable, de valores). Fue estudiada por Jakob Bernoulli (Suiza, 1654-1705), qui´ en escribi´ o el primer trata-
do importante sobre probabilidad, .
A
rs conjectandi”(El arte de pronosticar). Los Bernoulli formaron una de las
sagas de matem´ aticos m´ as importantes de la historia. La distribuci´ on normal es un ejemplo de las distribucio-
nes continuas, y aparece en multitud de fen´ omenos sociales y cient´ıficos. Fue estudiada, entre otros, por J.K.F.
Gauss (Alemania, 1777-1855), uno de los m´ as famosos matem´ aticos de la historia. La gr´ afica de la distribuci´ on
normal en forma de campana se denomina Campana de Gauss.
7.2. La distribuci´ on binomial o de Bernoulli
La distribuci´ on binomial est´ a asociada a experimentos del siguiente tipo:
Realizamos n veces cierto experimento en el que consideramos s´ olo la posibilidad de ´ exito o fracaso.
La obtenci´ on de ´ exito o fracaso en cada ocasi´ on es independiente de la obtenci´ on de ´ exito o fracaso en
las dem´ as ocasiones.
La probabilidad de obtener ´ exito o fracaso siempre es la misma en cada ocasi´ on.
Ve´ amoslo con un ejemplo.
Tiramos un dado 7 veces y contamos el n´ umero de cincos que obtenemos. ¿Cu´ al es la probabilidad de obtener
tres cincos?.
70
Este es un t´ıpico ejemplo de distribuci´ on binomial, pues estamos repitiendo 7 veces el experimento de lanzar un
dado. ¿Cu´ al es nuestro ´ exito?.
Evidentemente, sacar un 5, que es en lo que nos fijamos.
El fracaso, por tanto, ser´ a no sacar 5, sino sacar cualquier otro n´ umero. Por tanto,
´
Exito = E = ”sacar un
5”→ p(E) =
1
6
, Fracaso = F = ”no sacar un 5”→ p(F) =
5
6
.
Para calcular la probabilidad que nos piden, fij´ emonos en que nos dicen que sacamos 3 cincos y por lo tanto
tenemos 3 ´ exitos y 4 fracasos, ¿de cu´ antas maneras pueden darse estas posibilidades?. Podr´ıamos sacar 3 cincos
en las 3 primeras tiradas y luego 4 tiradas sin sacar cinco, es decir: EEEFFFF. Pero tambi´ en podr´ıamos sacar
EFEFFFE, es decir que en realidad estamos calculando de cu´ antas maneras se pueden ordenar 4 fracasos y
3 ´ exitos. Recordando las t´ ecnicas combinatorias, este problema se reduce a calcular las permutaciones con
elementos repetidos:
P
3,4
7
=
7!
3!4!
=
7 · 6 · 5
3 · 2 · 1
= 35 formas
Y por tanto, como p(E) =
1
6
y tengo 3 ´ exitos y p(F) =
5
6
y tengo 4 fracasos:
p(tener 3 ´ exitos y 4 fracasos) = 35 ·
1
6
·
1
6
·
1
6
·
5
6
·
5
6
·
5
6
·
5
6
= 0,0781
Formalizando lo obtenido, en una variable binomial con 7 repeticiones y con probabilidad de ´ exito
1
6
, la proba-
bilidad de obtener 3 ´ exitos es 0.0781, y lo expresar´ıamos:
Bin
_
7;
1
6
_
, entonces p(x = 3) = 0,0781
Como repetir este proceso ser´ıa bastante penoso en la mayor´ıa de los casos, lo mejor es recurrir a la siguiente
f´ ormula que expresa la probabilidad de obtener cierto n´ umero de ´ eitos en una distribuci´ on binomial:
Definici´ on de distribuci´ on binomial:
Si realizamos n veces un experimento en el que podemos obtener ´ exito, E, con probabilidad p y fracaso, F,
con probabilidad q (q = 1 − p), diremos que estamos ante una distribuci´ on binomial de par´ ametros n y p, y lo
representaremos por Bin(n; p). En este caso la probabilidad de obtener k ´ exitos viene dada por:
p(x = k) =
_
n
k
_
p
k
q
(n−k)
=
_
n
k
_
p
k
(1 − p)
(n−k)
(7.1)
Nota: Observar que las probabilidades de ´ exito y fracaso son complementarias, es decir,q = 1 − p y p = 1 −q,
por lo que basta saber una de ellas para calcular la otra.
Ejemplo: Antes ten´ıamos Bin
_
7;
1
6
_
, y quer´ıamos calcular p(X = 3) (obtener 3 ´ exitos). Aplicando la f´ ormula:
p(x = 3) =
_
7
3
_
·
1
6
3
·
5
6
4
= 0,0781.
71
Ejemplo: Supongamos que la probabilidad de que una pareja tenga un hijo o una hija es igual. Calcular
la probabilidad de que una familia con 6 descendientes tenga 2 hijos. En este caso Exito = E = tener hi jo y
p(E) = 0,5. Fracaso = F = tener hi ja y p(F) = 0,5. Estamos por tanto ante una binomial Bin(6; 0,5) y nos
piden p(X = 2). Si aplicamos la f ´ ormula es:
p(x = 2) =
_
6
2
_
· 0,5
2
· 0,5
4
= 0,2344.
Nota: La elecci´ on de ´ exito o fracaso es subjetiva y queda a elecci´ on de la persona que resuelve el problema,
pero teniendo cuidado de plantear correctamente lo que se pide. En el caso concreto del ejemplo anterior, si:
Exito = tener hi ja, como nos piden la probabilidad de que una familia con 6 hijos tenga 2 hijos, si el ´ exito es
tener hija hemos de plantearnos cu´ al es la probabilidad de tener 4 ´ exitos (4 hijas), es decir:
p(x = 4) =
_
6
4
_
· 0,5
4
· 0,5
2
= 0,2344.
Evidentemente sale lo mismo, pero hay que ser consecuente a la hora de elegir el ´ exito y el fracaso y la pregunta
que nos hagan.
7.2.1. El uso de las tablas de la distribuci´ on binomial
La distribuci´ on binomial se encuentra tabulada por lo que es f´ acil calcular probabilidades sin necesidad de hacer
demasiadas cuentas. Para usar las tablas de la distribuci´ on binomial es necesario conocer:
El n´ umero de veces que se realiza el experimento (n).
La probabilidad de ´ exito (p).
El n´ umero de ´ exitos (k).
La probabilidad p se busca en la primera fila (valores desde 0.01 hasta 0.5).
El n´ umero de veces que se realiza el experimento, en la primera columna (valores desde 2 a 10) y el n´ umero de
´ exitos a su lado.
Por ejemplo en el caso anterior, Bin(6; 0,5) , p(X = 2), la columna p = 0,5 es la ´ ultima, y cuando n = 6 y k = 2
encontramos 0.2344, el valor que hab´ıamos calculado.
Nota importante: El caso en que p > 0,5, no se encuentra tabulado. La raz´ on es bien sencilla. Si p > 0,5,
entonces q < 0,5 y basta intercambiar los papeles de ´ exito y fracaso para que podamos utilizar la tabla.
Ejemplo: La probabilidad de que un alumno de 2do de Bachillerato apruebe las Matem´ aticas es de 0.7. Si con-
sideramos un grupo de 8 alumnos, ¿cu´ al es la probabilidad de que cinco de ellos aprueben las Matem´ aticas?.
Si ´ exito = .
a
probar
2
fracaso = ”suspender”, entonces p = 0,7 y q = 0,3. Tenemos, por tanto, una Bin(8; 0,7).
Nos piden calcular p(X = 5), que no se puede calcular mediante las tablas porque p = 0,7 y s´ olo tenemos
hasta p =0,5. Por tanto si intercambiamos ´ exito = ”suspender
2
fracaso =.
a
probar.
en
tonces p =0,3, q =0,7, es
72
decir la nueva binomial es Bin(8; 0,3) y nos piden que aprueben 5 de 8, es decir que suspendan 3 de 8 o lo que
es lo mismo, que tengamos 3 ´ exitos, p(X = 3), y buscando en la tabla es p(X = 3) = 0,2541. Tambi´ en, desde
luego podr´ıamos haber utilizado la f´ ormula desde el principio, utilizar la Bin(8; 0,7) y olvidarnos de tablas
para hacer:
p(x = 5) =
_
8
5
_
· 0,7
5
· 0,3
3
= 0,254.
7.2.2. Probabilidades acumuladas
Es posible que nos pidan no s´ olo la probabilidad de que ocurran un cierto n´ umero de ´ exitos en concreto, sino que
ocurran como mucho ”k”´ exitos o preguntas similares. En el ejemplo anterior, por ejemplo, podr´ıan pedirnos: a)
¿Cu´ al es la probabilidad de que aprueben como mucho 2 alumnos?.
Si ´ exito = aprobar y fracaso = suspender, p = 0,7 y q = 0,3, entonces nos piden p(X ≤ 2). En este caso, basta
pensar en que para que aprueben 2 alumnos como mucho, puede que aprueben 2, 1 o ninguno, es decir:
p(X ≤ 2) = p(X = 0) + p(X = 1) + p(X = 2) = 0,0001 +0,0012 +0,01 = 0,1013
(haz las cuentas)
b) ¿Cu´ al es la probabilidad de que aprueben entre 3 y 6 alumnos (inclusive)?. Del mismo modo:
p(3 ≤ X ≤ 6) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) = 0,0467+0,1361+0,2541+0,2965 = 0,7334
Hemos de tener en cuenta que para la distribuci´ on binomial, en las tablas s´ olo se admiten valores hasta n = 10
(10 repeticiones del experimento). Para valores de n > 10, inevitablemente hemos de utilizar la f´ ormula.
Ejemplo: Los alumnos de cierta clase se encuentran en una proporci´ on del 67 % que estudian ingl´ es y el
resto franc´ es. Tomamos una muestra de 15 alumnos de la clase, calcular: a) Probabilidad de que al menos
encontremos tres alumnos de ingl´ es. b) Probabilidad de que los 15 alumnos estudien ingl´ es. c) Probabilidad
de que estudien ingl´ es entre 7 y 10 alumnos. Si ´ exito = estudiar ingl´ es, p = 0,67 y fracaso = estudiar franc´ es,
q = 1 −0,67 = 0,33. Manejamos por tanto una Bin(15; 0,67). Para la parte a), se tendr´ a
p(X > 3) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) +... + p(X = 15).
Una opci´ on es calcular estas 13 probabilidades y sumarlas. Como hay que aplicar la f´ ormula para calcular
cada una, la tarea se puede hacer bastante larga. Otra opci´ on, m´ as sencilla, es pasar al complementario. El
complementario de encontrar al menos 3 alumnos de ingl´ es es encontrar como mucho 2 alumnos de ingl´ es,
p(X ≤ 2). Es decir,
p(X > 3) = 1 − p(X < 3) = 1 − p(X ≤ 2) = 1 −(p(X = 0) + p(X = 1) + p(X = 2))
y s´ olo tenemos que calcular 3 probabilidades: p(X = 0) ∼ 0 , p(X = 1) = 0,000001, p(X = 2) = 0,000026
(compru´ ebalo!). Por lo cual,
p(X > 3) = 1 −(0 +0,000001 +0,000026) = 1 −0,000027 = 0,999973
73
Para la parte b), se tendr´ a
p(X = 15) = 0,0025
(aplica la f´ ormula). Para la parte c), se tendr´ a
p(7 ≤X ≤10) = p(X =7)+p(X =8)+p(X =9)+p(X =10) =0,0549+0,1114+0,1759+0,2142 =0,5564.
7.2.3. Media y desviaci´ on t´ıpica en una distribuci´ on binomial
Aunque no se demostar´ a, en una distribuci´ on binomial Bin(n; p), el n´ umero esperado de ´ exitos o media, viene
dado por ¯ x = np. (Recordemos que la media es una medidad de centralizaci´ on).
La desviaci´ on t´ıpica, σ , que es una medida de dispersi´ on y mide lo alejados que est´ an los datos de la media,
viene dada por σ =

npq.
7.3. La distribuci´ on Normal
Al estudiar aspectos tan cotidianos como:
Caracteres morfol´ ogicos de individuos ( personas, animales, plantas) de una misma raza. como tallas,
pesos, envergaduras, etc.
Caracteres fisiol´ ogicos, como el efecto de una misma dosis de un f´ armaco, o de una misma cantidad de
abono.
Caracteres sociol´ ogicos, como el consumo de ciertos productos por individuos de un mismo grupo hu-
mano.
Caracteres psicol´ ogicos, como el cociente intelectual, grado de adaptaci´ on a un medio.
Caracteres f´ısicos, como la resistencia a la rotura de ciertas piezas.
todos ellos tienen en com´ un que se distribuyen ”normalmente”. ¿Qu´ e quiere decir esta expresi´ on?. Pu´ es, por
ejemplo, si hacemos una estad´ıstica para conocer la altura de 1400 mujeres y representamos los resultados en
un diagrama de barras, obtenemos:
Figura 7.1: Distribuci´ on de estaturas de 1400 mujeres.
74
Las gr´ aficas de este tipo son muy corrientes: Hay pocos individuos en los extremos y un aumento paulatino
hasta llegar a la parte central del recorrido, donde est´ a la mayor´ıa de ellos.
Definici´ on: Diremos que una distribuci´ on de probabilidad sigue una distribuci´ on normal de media ¯ x y desviaci´ on
t´ıpica σ, y lo representaremos por N( ¯ x; σ) cuando la representaci´ on gr´ afica de su funci´ on de densidad es una
curva positiva continua, sim´ etrica respecto a la media, de m´ aximo en la media, y que tiene 2 puntos de inflexi´ on
, situados a ambos lados de la media ( ¯ x −σ y ¯ x +σ respectivamente) y a distancia de σ ella, es decir de la
forma:
Figura 7.2: Distribuci´ on normal N( ¯ x; σ). El m´ aximo est´ a en ( ¯ x,
1

2πσ
2
).
Dependiendo de los valores que tomen ¯ x y σ, la gr´ afica de esta funci´ on puede ser m´ as o menos alargada, achata-
da, etc..., pero en cualquier caso siempre tiene las mismas condiciones de simetr´ıa, continuidad, etc, rese˜ nadas
anteriormente.
El concepto de funci´ on de densidad introducido anteriormente no se estudiar´ a con profundidad. Baste decir que
la funci´ on de densidad determina la forma de cada distribuci´ on de probabilidad. En el caso de la distribuci´ on
normal de par´ ametros ¯ x y σ, dicha funci´ on viene dada por:
f (x) =
1

2πσ
2
e

(x−¯ x)
2

2
(7.2)
Propiedad: El ´ area encerrada bajo la curva normal N( ¯ x; σ) siempre es 1.
La demostraci´ on de este resultado no es nada sencilla e implica el uso de resultados matem´ aticos que exceden
el nivel de este curso.
De entre todas las curvas normales N( ¯ x; σ), la m´ as sencilla, usada y conocida es aquella que tiene por media 0
y por desviaci´ on t´ıpica 1, N(0, 1).
Esta normal est´ andar se suele representar por Z. La gr´ afica de esta curva se denomina campana de Gauss y se
puede observar en la figura:
Su funci´ on de densidad ser´ a:
f (x) =
1


e

x
2
2
(7.3)
75
Figura 7.3: Distribuci´ on normal N(0; 1). El m´ aximo est´ a en (0,
1


).
Puesto que el ´ area bajo esta curva normal es 1, podemos definir una probabilidad de la siguiente manera:
Para un valor cualquiera k, definimos la probabilidad de que la distribuci´ on Z, N(0; 1), sea menor o igual que k
como:
p(Z ≤ k) = Area encerrada bajo la curva normal N(0, 1) desde −∞ hasta k (7.4)
(es decir la parte rayada de la figura siguiente).
Figura 7.4: Area encerrada por la curva normal desde −∞ hasta k.
Ahora bien, ¿c´ omo calcular dicha ´ area?. F´ acil: Dichas ´ areas o probabilidades se encuentran tabuladas.
7.3.1. Uso de las tablas de la distribuci´ on normal N(0; 1)
La normal N(0; 1) se encuentra tabulada, para valores a partir de 0 y hasta 3.99. Si por ejemplo queremos
calcular p(Z ≤ 2,78), hemos de realizar los pasos:
Buscar la parte entera y las d´ ecimas en la primera columna (en este caso 2.7).
Buscar las cent´ esimas en la primera fila (en este caso 8).
En el punto com´ un a la fila y la columna que hemos encontrado, tenemos la probabilidad buscada, en este
caso 0.9973. Por tanto p(Z ≤2,78) = 0,9973.
Si queremos calcular una probabilidad de un valor mayor que 3.99, basta fijarse en que las probabilidades corre-
pondientes a valores tales como 3.62 y mayores ya valen 0.9999 (pr´ acticamente 1). Por eso, para estos valores
mayores que 3.99, diremos que la probabilidad es aproximadamente 1. As´ı: p(Z ≤5,62) ∼1 aunque no aparez-
ca en la tabla.
Por otra parte, fij´ emonos en que en este tipo de distribuciones no tiene sentido plantearse probabilidades del
tipo p(Z = k), ya que siempre valen 0, al no encerrar ning´ un ´ area. Por tanto, si nos pidiesen p(Z = 3,2), basta
76
decir que p(Z = 3,2) = 0.
Este tipo de distribuciones en las cuales la probabilidad de tomar un valor concreto es 0 se demoniman distribu-
ciones continuas, para diferenciarlas de otras en las que esto no ocurre, como por ejemplo la binomial, que es
una distribuci´ on discreta.
As´ı, al pasar al complementario, si tenemos Z >k, su complementario ser´ a Z <k, pero como incluir k no influye
en la probabilidad, al calcular probabilidades podemos escribir:
p(Z > k) = 1 − p(Z < k) = 1 − p(Z ≤ k) (7.5)
S´ olo se puede hacer esto en distribuciones continuas, en el caso de la binomial esto no se puede hacer y hay que
ser cuidadosos con el paso al complementario.
Ejemplo: Buscar en la tabla de la normal est´ andar N(0; 1) las probabilidades: a) p(Z ≤1,15), b) p(Z ≤0,5),
c) p(Z ≤ 0,82), d) p(Z ≤ 1,05), e) p(Z ≤ 4,27), f) p(Z ≤ 18,09)
7.3.2. C´ alculo de otras probabilidades
Si k es positivo y queremos calcular p(Z >k), es decir el ´ area rayada: basta pasar al complementario, es decir:
Figura 7.5: p(Z > k). Basta pasar al complementario.
p(Z > k) = 1 − p(Z ≤ k) y esta ´ ultima probabilidad ya se encuentra tabulada.
Ejemplo: Calcular p(Z > 0,3) y p(Z > 2,07).
Si k es positivo y queremos calcular p(Z ≤ −k), es decir el ´ area: por simetr´ıa, p(Z ≤ −k) = p(Z > k) y ´ esta
se calcula como en el caso anterior. Se puede observar la igualdad de ´ areas en la figura:
Ejemplo: Calcular p(Z ≤ −0,78) y p(Z ≤ −3,2).
Si k es positivo y queremos calcular p(Z > −k), es decir el ´ area rayada: entonces, por simetr´ıa p(Z > −k) =
p(Z ≤ k):
Ejemplo: Calcular p(Z > −0,96) y p(Z > −1,01).
77
Figura 7.6: p(Z ≤ −k).Las probabilidades de valores negativos no est´ an tabuladas.
Figura 7.7: p(Z ≤ −k) = p(Z > k). La simetr´ıa permite reducir este caso al anterior.
Figura 7.8: p(Z > −k).
Figura 7.9: p(Z > −k) = p(Z ≤ k).La simetr´ıa permite reducir este caso al que ya est´ a tabulado.
Probabilidades comprendidas entre dos valores, p(k
1
≤ Z ≤ k
2
) ,es decir el ´ area rayada: se calcula restando
las ´ areas:
Ejemplo: Calcular p(−0,96 ≤ Z ≤ 1,49) y p(−1,32 ≤ Z ≤ −0,57).
78
Figura 7.10: p(k
1
≤ Z ≤ k
2
). Probabilidad comprendida entre dos valores.
Figura 7.11: p(Z ≤ k
2
) en la primera imagen. p(Z ≤ k
1
) en la segunda. Al restar obtenemos el ´ area pedida.
Ejemplo: Calcular p(Z =2), p(Z ≤2), p(Z >2), p(Z ≤−2), p(Z >−2), p(−2 ≤Z ≤2), p(0,81 ≤Z ≤1,33).
7.3.3. C´ alculo de probabilidadesen normales N( ¯ x; σ)
Si no tenemos una distribuci´ on N(0; 1), sino una N( ¯ x; σ) cualquiera,
ˆ
A¿¿c´ omo calcular probabilidades, si no
tenemos tabla salvo para N(0; 1)?.
El siguiente resultado nos da la respuesta.
Propiedad: Si X sigue una distribuci´ on N( ¯ x; σ), entonces la variable Z =
X−¯ x
σ
sigue una distribuci´ on N(0, 1).
(El paso de la variable X →N( ¯ x; σ) a la Z → N(0; 1) se denomina tipificaci´ on de la variable X).
Ejemplo: Las estaturas de 600 soldados se distribuyen de acuerdo a una distribuci´ on normal de media 168 y
desviaci´ on t´ıpica 8 cm. ¿Cu´ antos soldados miden entre 166 y 170 cm?. Sea X la distribuci ´ on de los soldados ,
X es una N(168, 8). Nos piden p(166 ≤ X ≤ 170). Utilizando el resultado anterior, primero restamos x = 168
en la desigualdad: p(166 ≤ X ≤ 170) = p(166 −168 ≤ X −168 ≤ 170 −168) = p(−2 ≤ X −168 ≤ 2). Y
ahora dividimos entre σ = 8, con lo que acabamos de tipificar: p(166 ≤ X ≤ 170) = p(−2 ≤ X −168 ≤ 2) =
p
_

2
8

X−168
8

2
8
_
. Llamando a
X−168
8
= Z, ´ esta ya es normal N(0, 1) y se encuentra en las tablas: p(166 ≤
X ≤ 170) = p(−0,25 ≤ Z ≤ 0,25) = p(Z ≤ 0,25) − p(Z ≤ −0,25) = (tablas) = 0,5987 −0,4013 = 0,1974,
(pues p(Z ≤ −0,25) = p(Z > 0,25) = 1 − p(Z ≤ 0,25) = 1 −0,5987 = 0,4013).
Ejemplo: En una distribuci´ on N(22, 5), calcula: p(X ≤ 27), p(X > 27), p(X > 125), p(15 ≤ X ≤ 20),
p(17 ≤ X ≤ 30).
79
Ejemplo: Los pesos de 60 soldados siguen una distribuci´ on N(67, 5). Calcula la probabilidad de que el peso
sea: a) mayor de 80 kg, b) 50 kg. o menos, c) menos de 60 kg, d) 70 kg, e) entre 60 y 70 kg inclusive.
7.3.4. Otro uso de las tablas
Hasta ahora nos han dado la distribuci´ on normal N(0; 1) y nos ped´ıan p(Z ≤ k) siendo k un cierto n´ umero, y
nos ped´ıan calcular dicha probabilidad.
Ahora bien, otra pregunta puede ser: Dado que en una normal N(0; 1) sabemos que p(Z ≤ k) = 0,9573, ¿qui´ en
es k?.
La resoluci´ on es bien sencilla. Basta buscar 0.9573 dentro de la tabla de la distribuci´ on normal, y lo encontramos
en el cruce de la fila 1.7 con la columna 2, y por lo tanto k debe ser 1.72.
Ejemplo: Calcular k si: a) p(Z ≤ k) = 0,8078. b) p(Z ≤ k) = 0,0028.
En caso de que el valor a buscar no aparezca directamente dentro de la tabla de la distribuci´ on normal, pueden
ocurrir dos posibilidades:
Si el valor se encuentra entre dos valores de la tabla y a la misma distancia (aproximadamente) de cada
uno de ellos, por ejemplo: p(Z ≤ k) = 0,7982. En este caso el valor buscado ser´ a la media entre los
valores extremos. Si buscamos en la tabla este valor no aparece directamente, sino que se encuentra entre
los valores 0.7967 (que corresponde a 0.83) y 0.7996 (que corresponde a 0.84). Por tanto el valor de k
ser´ a: k =
0,83+0,84
2
= 0,835.
Si el valor est´ a entre dos valores, pero muy cercano a uno de ellos, directamente tomamos este valor, por
ejemplo: p(Z ≤ k) = 0,7970. El valor m´ as cercano es 0.9767 (que corresponde a 0.83) y como el valor
buscado est´ a muy cerca de ´ el, entonces directamente k = 0,83.
Si la distribuci´ on no es normal N(0; 1), sino N( ¯ x; σ), tendremos que tipificar previamente.
Ejemplo: si X sigue una normal N(6; 3) y p(X ≤ k) = 0,9082, calcula k. Tipificando: p
_
X−6
3

k−6
3
_
=
0,9082 → p
_
Z ≤
k−6
3
_
= 0,9082, y buscando en la tabla,
k−6
3
= 1,33 →k −6 = 3,99 →k = 9,99.
Ejemplo: Calcular k si p(X ≤ k) = 0,6141 y X sigue una N(15, 4).
Ejemplo: De una variable normal N( ¯ x; σ) se sabe que p(X ≤7) = 0,9772 y p(X ≤ 6,5) = 0,8413. Calcular:
a) ¯ x y σ. b) p(5,65 ≤ X ≤ 6,25). c) El n´ umero k tal que p(X > k) = 0,3.
7.4. Relaci´ on entre la distribuci´ on binomial y la distribuci´ on normal
Es un hecho comprobado que cuando tenemos una distribuci´ on Bin(n; p), a medida que n crece, es dif´ıcil hacer
uso de las f´ ormulas y/o tablas.
80
Por ejemplo, tiramos un dado 100 veces, calcular la probabilidad de obtener entre 20 y 33 cincos (inclusive).
Si ´ exito = obtener cinco entonces p = 1/6 y fracaso = no obtener cinco y q = 5/6. Tenemos una Bin
_
100;
1
6
_
, y
nos piden p(20 ≤ X ≤ 33). Es inviable aplicar las tablas (pues repetimos el experimento 100 veces) y tampoco
la f´ ormula pues es inviable calcular, por ejemplo,
p(X = 32) =
_
100
32
_
·
_
1
6
_
3
2 ·
_
5
6
_
6
8
¿C´ omo resolver el problema?. Del siguiente modo.
7.4.1. Teorema Central del L´ımite
La distribuci´ on binomial Bin(n; p) se aproxima a una curva normal de media ¯ x = np y desviaci´ on t´ıpica
σ =

npq, cuando n tiende a ∞, es decir, cuando n se hace muy grande.
La aproximaci´ on se puede aplicar (es una buena aproximaci´ on) s´ olo si n es grande, en concreto n >30 y adem´ as
np >5 y nq >5. Si no se cumplen estas condiciones NO podemos aproximar la binomial que tengamos por una
distribuci´ on normal.
En caso de que podamos aproximar, debemos tener en cuenta que estamos pasando de una variable discreta
(binomial) a una continua (normal), y por tanto son distribuciones diferentes. El ”precio”que hay que pagar por
pasar de una a otra se denomina c¸orrecci´ on por continuidad
2
consiste en hacer determinados ajustes para que la
aproximaci´ on realizada sea lo m´ as precisa posible.
As´ı, si nos piden p(X = k) en una distribuci´ on binomial X, y aproximamos X por una distribuci´ on normal, y,
no podemos calcular directamente p(Y=k) porque, como ya se ha comentado anteriormente, en una distribuci´ on
continua todas estas probabilidades valen 0. La correcci´ on por continuidad consiste en tomar un peque˜ no inter-
valo de longitud 1 alrededor del punto k.
De otro modo, si nos piden p(X = k) con X binomial, con la aproximaci´ on normal Y deberemos calcular
p(k −0,5 ≤Y ≤ k +0,5).
Del mismo modo se razona en el caso de probabilidades acumuladas en la binomial. Algunos ejemplos.
Si nos piden p(X <k) con X binomial, aproximando por Y normal calcularemos p(Y ≤k −0,5). La explicaci´ on
de que haya que restar 0.5 y no sumarlo es que queremos que X sea menor estrictamente que k, con lo cu´ al, si
sumase 0.5 , el propio k aparecer´ıa en la probabilidad a calcular y NO debe aparecer.
Por contra, si debi´ esemos calcular p(X ≤ k), con X binomial, fij´ emonos que ahora k SI est´ a incluido en la pro-
babilidad y por tanto al aproximar por la normal Y deber´ıamos calcular p(Y ≤ k +0,5).
81
Comprender estos dos hechos es fundamental para realizar bien la correci´ on por continuidad al aproximar una
distribuci´ on binomial por una normal.
En el caso anterior, ¯ x = np =
100
6
= 16,67 y σ =

npq =
_
500
36
= 3,73. De modo que, como n > 30, np =
16,67 > 5 y nq = 83,33 > 5, se pude aproximar la binomial por la normal, es decir:
X → Bin
_
100;
1
6
_
∼Y → N(16,67; 3,73)
Entonces: p(20 ≤X ≤ 33) ∼

p(20−0,5 ≤Y ≤33+0,5) = p
_
19,5−16,67
3,73

Y−16,67
3,73

33,5−16,67
3,73
_
= p(0,89 ≤
Z ≤4,51) = p(Z ≤4,51)−p(Z ≤0,89) ∼1−0,8133 =0,1867. Notemos que en el paso se˜ nalado por (*) hemos
cambiado X(binomial) por Y(normal) y se ha realizado la correcci´ on por continuidad.
82
Bibliograf´ıa
[1] Jeffrey, R.C., Probability and the Art of Judgment, Cambridge University Press. (1992). pp. 54-55 . ISBN
0-521-39459-7.
[2] Olav Kallenberg, Probabilistic Symmetries and Invariance Principles. Springer -Verlag, New York
(2005). 510 pp. ISBN 0-387-25115-4.
[3] Kallenberg, O., Foundations of Modern Probability, 2nd ed. Springer Series in Statistics. (2002). 650 pp.
ISBN 0-387-95313-2.
[4] P. Bevington and D. K. Robinson, Data reduction and error analysis for the physical sciences, 2nd ed.
(McGraw Hill, New York, 1993).
[5] Stuardt L. Meyer, Data analysis for scientists and engineers (John Willey & Sons, Inc., New York, 1975).
[6] D. C. Baird, Experimentaci´ on, 2a ed. (Prentice-Hall Hispanoamericana S.A., M´ exico, 1991).
[7] J. Higbie,
¨
Uncertainty in the linear regression slope.
A
m. J. Phys. 59, 184 (1991)
[8] J. Orear, ”Least squares when both variables have uncertainties”, Am. J. Phys. ibid., 50, 912 (1982).
[9] ”Simple method for fitting data when both variables have uncertainties”D. Barker and L.M. Diana Am.
J. Phys. 42, 224 (1974).
[10] ”Linear least-squares fits with errors in both coordinates.”II: Comments on parameter variances - B.
Cameron Reed - Am. J. Phys., Vol. 60, No. 1, 1992.
[11] Estad´ıstica - M. Spiegel - McGraw Hill 2da. Ed. Bogot´ a 1997
[12] S. Gil y E.Rodr´ıguez, F´ısica re-Creativa, Prentice Hall, Buenos Aires 2001.
83

´ndice general I

Resumen 6 1. Introducci´ n a la Estad´stica 7 o ı 1.1. Peque˜ a definici´ n y algunos conceptos b´ sicos 7 n o a 1.2. Niveles de Medida 9 1.3. M´ todos de recolecci´ n de datos 9 e o 1.3.1. La entrevista 9 1.3.2. La encuesta 10 1.3.3. Cuestionario 11 1.3.4. La observaci´ n 12 o 2. La estad´stica descriptiva 13 ı 2.1. Distribuciones de frecuencia 13 2.1.1. Terminolog´a adicional 13 ı 2.1.2. Creando una tabla de frecuencias 14 2.1.3. Notaci´ n Matem´ tica 15 o a 2.1.4. Frecuencia acumulada 15 2.1.5. La frecuencia relativa 16 2.1.6. Los histogramas 16 2.2. Medidas de Tendencia Central (MTC) 19 2.2.1. La Media Aritmetica 20 2.2.2. La Media 20 2.2.3. La Mediana 20 2.2.4. La moda 21 2.2.5. Propiedades de la media, mediana y moda 21 2.2.6. El promedio ponderado 22 2.2.7. Otros tipos de medias 22 2.2.8. Formas de las distribuciones de datos 24 2.3. Medidas de variaci´ n 25 o 2.3.1. Rango 26 2.3.2. La Varianza 26 1

2.3.3. La Desviaci´ n Est´ ndar 27 o a 2.3.4. La Desviaci´ n Media 27 o 2.3.5. Covarianza 28 2.3.6. Coeficiente de Correlaci´ n de Pearson 28 o 2.3.7. Coeficientes de asimetr´a y curtosis 29 ı 2.4. Teorema que envuelven cuestiones sobre la Desviaci´ n Est´ ndar 30 o a 2.4.1. La regla emp´rica 31 ı 2.4.2. Teorema de Chebychev 31 2.5. Medidas de Posici´ n 31 o 2.5.1. Cuartiles 32 2.5.2. Deciles 32 2.5.3. Centiles o percentiles 33 2.6. Problemas de final de cap´tulo 33 ı 3. M´ todos cuantitativos de an´ lisis predictivo, regresi´ n 37 e a o 3.1. Correlaci´ n y regresi´ n 37 o o 3.2. Distribuciones bidimensionales 37 3.3. La idea de la correlaci´ n 38 o 3.4. Encontrando la relaci´ n. Regresi´ n 40 o o 3.4.1. El coeficiente de correlaci´ n 40 o 3.4.2. Regresi´ n lineal. El M´ todo de los M´nimos Cuadrados 41 o e ı 4. An´ lisis Combinatorio 46 a 4.1. Introducci´ n 46 o 4.2. Permutaciones (u ordenaciones) con repetici´ n 47 o 4.3. Permutaciones (u ordenaciones) sin repetici´ n 47 o 4.4. Combinaciones 47 4.5. An´ lisis y Metodolog´a propuesta para la resoluci´ n de problemas de Teor´a de conteo 48 a ı o ı 5. Probabilidad 49 5.1. Introducci´ n: La probabilidad 49 o 5.2. La probabilidad 51 5.3. Experimentos de Probabilidad 51 5.4. Calculando la probabilidad de un evento 53 5.4.1. Probabilidad Emp´rica 53 ı 5.4.2. Probabilidad cl´ sica 54 a 5.5. Axiomas de la probabilidad 54 5.6. Posibilidades y probabilidades 55 5.7. Propiedades de la probabilidad de eventos no elementales 56 5.8. Probabilidad condicionada 57 5.9. Probabilidad total 58 5.9.1. Teorema de la probabilidad total 58 5.10. Teorema de Bayes 58 5.11. Problemas de final de cap´tulo 59 ı 6. Variable aleatoria y funci´ n de distribuci´ n 63 o o 6.1. Introducci´ n 63 o 6.2. Variable aleatoria unidimensional 64 6.3. Variables discretas 64 6.4. Variables continuas 65 2

6.5. Caracter´sticas de una v.a. 66 ı 6.5.1. Definici´ n. (Esperanza Matem´ tica) 66 o a 6.5.2. Definici´ n. (Varianza) 67 o 6.6. Inecuaci´ n de Chevyshev 67 o 6.7. Problemas de final de cap´tulo 68 ı 7. Distribuciones de Probabilidad Binomial y Normal 70 7.1. Introducci´ n 70 o 7.2. La distribuci´ n binomial o de Bernoulli 70 o 7.2.1. El uso de las tablas de la distribuci´ n binomial 72 o 7.2.2. Probabilidades acumuladas 73 7.2.3. Media y desviaci´ n t´pica en una distribuci´ n binomial 74 o ı o 7.3. La distribuci´ n Normal 74 o 7.3.1. Uso de las tablas de la distribuci´ n normal N(0; 1) 76 o 7.3.2. C´ lculo de otras probabilidades 77 a 7.3.3. C´ lculo de probabilidadesen normales N(x; σ ) 79 a ¯ 7.3.4. Otro uso de las tablas 80 7.4. Relaci´ n entre la distribuci´ n binomial y la distribuci´ n normal 80 o o o 7.4.1. Teorema Central del L´mite 81 ı

3

3. Distintas posibilidades de la forma del histograma en relaci´ n con el valor num´ rico de el o e coeficiente de curtosis. 3. 39 Regresi´ n lineal: la cantidad de intentos a medida que aumenta hace que el n´ mero de error o u disminuya. El coeficiente de correlaci´ n de Pearson establece la posibilidad de un ajuste de los puntos en la o muestra. 3.1. 29 2.7.2. 24 2. 31 2.9. Las barras tienen aproximadamente la misma altura a ambos lados de o la media. 19 Muchas posibilidades para la construcci´ n del histograma. 30 2. Una distribuci´ n sezgada a la derecha. Distintas posibilidades de la forma del histograma en relaci´ n con el valor num´ rico de el o e coeficiente de Fisher.2.1.6. 38 o Regresi´ n lineal: Los puntos tienden a describirse a partir de una recta que los representa o aproximadamente a todos. Ve´ se la desigual proporci´ n de barras con alturas o a o aproximadas a ambos lados de la media. 3. 25 2. 3. 40 o Regresi´ n lineal: Al parecer n existe relaci´ n entre la distancia a la que se vive de la Universidad o o y la calificaci´ n que se obtiene.4.´ndice de figuras I As´ luce un histograma de frecuencias. 2. 42 o e o 4 . Una distribuci´ n sezgada a la izquierda. 41 o La curva de regresi´ n lineal en t´ rminos de los cambios de la funci´ n. Una distribuci´ n uniforme.5. 3. 39 Regresi´ n lineal: Al parecer n existe relaci´ n entre la distancia a la que se vive de la Universidad o o y la calificaci´ n que se obtiene. 18 ı Ejemplo de como debe construirse un histograma simple.3. 25 2. Ve´ se la igual proporci´ n de barras con alturas o a o aproximadas a ambos lados de la media. 19 o Una distribuci´ n sim´ trica.8.10.4. Ve´ se la igual proporci´ n de barras con alturas aproximadas a ambos o e a o lados de la media.6. 26 2.5.3. 2. 2. Ejemplo de de un diagrama de dispersi´ n o nube de puntos.

La simetr´a permite reducir este caso al anterior. 78 p(Z > −k) = p(Z ≤ k).8.5. 7.11. 7. 7. Representaci´ n de x(t) para un cuerpo que se mueve con movimiento uniformemente acelerado. 78 ı a p(k1 ≤ Z ≤ k2 ). 7. Probabilidad comprendida entre dos valores.7. σ ). 48 ı o Distribuci´ n de estaturas de 1400 mujeres. 45 o o a Metodolog´a sencilla para la resoluci´ n de problemas. o ¯ a a ¯ √ 1 ).9. 7.1.1. 79 ´ 5 . 7. 76 p(Z > k). (b) o ı o log(x) en funci´ n de log(t).2. 7. 74 o Distribuci´ n normal N(x. podr´a suponerse que la correlaci´ n es lineal. 7.6. Al restar obtenemos el area pedida.3. 1). 76 2π 4. 78 a p(Z ≤ −k) = p(Z > k). 7. Distribuci´ n normal N(0. 7. Basta pasar al complementario. o a a Area encerrada por la curva normal desde −∞ hasta k.Las probabilidades de valores negativos no est´ n tabuladas. El m´ ximo est´ en (0. 7. dado que el coeficiente de correlaci´ n lineal es muy cercano a la unidad. 78 ı p(Z > −k).10. 75 2πσ 2 1 √ ).La simetr´a permite reducir este caso al que ya est´ tabulado.7. 77 p(Z ≤ −k). o (a) A tiempos largos no se aprecia bien la curvatura de la curva y. de donde se deduce que la relaci´ n no es lineal sino cuadr´ tica.3. p(Z ≤ k1 ) en la segunda. 79 p(Z ≤ k2 ) en la primera imagen. El m´ ximo est´ en (x.4.

ı El objetivo del curso es que el alumno se familiarice con las herramientas anal´ticas esenciales necesarias para ı comprender el funcionamiento y las consecuencias de la aplicaci´ n de la teor´a estad´stica a la resoluci´ n de o ı ı o problemas en f´sica. ı 6 . para el curso Estad´stica y o ı ı M´ todos Num´ ricos de la Facultad Experimental de Ciencias de la Universidad del Zulia.Resumen Se presentan a continuaci´ n unas notas de Estad´stica Elemental y Fundamental. para la carrera e e de F´sica. LUZ.

. altura de los estudiantes de una escuela. Variables pluridimensionales: recogen informaci´ n sobre tres o m´ s caracter´sticas (por ejemplo: edad. ingresos anuales).etc. 2.Cap´tulo 1 ı ´ Introduccion a la Estad´stica ı ˜ 1.). por ejemplo.3 km/h. sexo). Variables bidimensionales: recogen informaci´ n sobre dos caracter´sticas de la poblaci´ n (por ejemplo: o ı o edad y altura de los alumnos de una clase). representa y describe una serie de datos que pueden ı ser cuantitativos o cualitativos. 3. Existen dos tipos de estad´sticas: Descriptiva: tabula. etc) y trata de extraer conclusiones sobre el comportamiento de estas variables. color e de la piel. Por su parte.. en principio cualesquieı ra.. Por ejemplo: n´ mero de hermanos (puede o u ser 1. Por ejemplo. 8.1. -4. o a ı altura y peso de los alumnos de una clase). Las variables pueden ser de dos tipos: Variables cualitativas o atributos: no se pueden medir num´ ricamente (por ejemplo: nacionalidad. precio de un producto.. ı 7 . e Las variables tambi´ n se pueden clasificar en: e Variables unidimensionales: s´ lo recogen informaci´ n sobre una caracter´stica (por ejemplo: edad de o o ı los alunmos de una clase). las variables cuantitativas se pueden clasificar en discretas y continuas: Discretas: s´ lo pueden tomar valores enteros (1. La estad´stica descriptiva es una ciencia que analiza o ı series de datos (por ejemplo. analizar e interpretar datos.. 94. etc. temperatura en los o meses de verano. nunca podr´ ser 3.57 km/h. a Continuas: pueden tomar cualquier valor real dentro de un intervalo. Pequena definici´ n y algunos conceptos b´ sicos o a La Estad´stica es la ciencia de recoger o colectar. la velocidad de un veh´culo puede ser 80. y la Inferencial: infiere propiedades de gran n´ mero de u datos recogidos de una muestra tomada de la poblaci´ n. edad de una poblaci´ n. Variables cuantitativas: tienen valor num´ rico (edad. 2. sin sacar conclusiones..etc. organizar.45). pero.

As´. Mientras que si tomamos en cuenta la data proveniente de la escogencia a al azar de las 10 universidades. si se estudia el precio de la vivienda de o ı una ciudad. Una muestra podr´a ser obtenida seleccionando 10 universidades de una lista unos ı cuantos estados seleccionados al azar con sus respectivos salarios. si estuo o ı diamos la altura de los ni˜ os de una clase. Por ejemplo. muy sencillo darse cuenta que la poblaci´ n es un conjunto mucho m´ s grande que la muestra. si estamos interesados en medir los salarios de todos los cient´ficos de las universidades del pa´s. A su vez. ı ı el conjunto de datos que representan la poblaci´ n ser´a en este caso la lista de todos los salarios de cualquier o ı universidad en Venezuela. por su puesto. Sin embargo. y miente en el sentido cient´fico. entonces. Por su puesto. cada vivienda es un individuo. debe advertirse que si la poblaci´ n tomada y seleccionada es muy grande. adem´ s n ı ı n a a de peligroso. que existe una clasificaci´ n para el e o o comportamiento de una variable. toda vez. qu´ podemos medir y c´ mo. la o poblaci´ n ser´ el total de las viviendas de dicha ciudad.un valor num´ rico soportado en el conjunto de datos del espacio muestral. entonces probeblemente a o ser´ imposible poder calcular par´ metros de alg´ n inter´ s particular. Individuo: cualquier elemento que porte informaci´ n sobre el fen´ meno que se estudia. objetos. a e o estad´stico . 2. lo normal ser´ no recoger informaci´ n sobre todas las viviendas de la ciudad (ser´a una labor a o ı muy compleja). o a Adem´ s. ı a 8 . A menos que la poblaci´ n sea bastante pea a u e o que˜ a calcular ser´a muy dif´cil. etc. es importante. 3. Poblaci´ n: conjunto de todos los individuos (personas. digamos que por ejemplo estuvi´ ramos interesados en conocer la opini´ n de la gente en Venezuela e o acerca de la posibilidad o necesidad de incrementar la cantidad de puestos en los cuales de distribuye peri´ dico o a nivel nacional. de la misma manera como se hace una clasificaci´ n en la f´sica para n´ meros ordinarios y vectores.una medida num´ rica hecha usando el conjunto de datos de la poblaci´ n en general. ete valor debe nombrarse como un estad´stico. la idea general es poder seleccionar siempre muesı tras. nosotros pudi´ ramos ı e ´ calcular el salario promedio de los cient´ficos que laboran en las universidades Venezolanas. que la poblaci´ n y encontrar o calcular estad´sticos muestrales que pudieran a n o ı dar explicaciones preliminares de lo que pasa en la data total o poblaci´ n. cada alumno es un individuo. As´. o a Muestra: subconjunto que seleccionamos de la poblaci´ n. Este promedio calı culado debe tomarse por un par´ metro. La idea fundamental es usar estos o ´ estad´sticos para inferir o estimar los par´ metros poblacionales.Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos: 1. En esencia. clasificar. Una muestra estar´a asegurada por ejemplo si tom´ semos 1000 encuestas repartidas ı a en todos los estados deacuerdo con la densidad poblacional de cada uno. sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo. ´ ı Es por su puesto. ı e Por ejemplo: Usando el conjunto de datos que describen los salarios de los cient´ficos. As´ entonces tendremos que definir los tipos de medida: ı Par´ metro . o Para medir en estad´stica es obvio que necesitaremos adem´ s una definici´ n para la cuantificaci´ n de las cosas o ı a o o fen´ menos. o o ı u Es decir. animales. respondiendo a la pregunta en cuesti´ n. que es lo que en realidad importa. seleccionar poblaciones muy peque˜ as es problem´ tico. si estudiamos el precio de la vivienda en una ciudad. por su puesto. Por ejemplo.) que porten informaci´ n o o sobre el fen´ meo que se estudia. que la poblaci´ n estar´ integrada por todas las respuestas de todos los ciudadao a nos del territorio nacional. si estudiamos el precio de la n vivienda. m´ s peque˜ as.

y la tanto la diferencia o e como la raz´ n entre los valores son significativas. como e o entrevistas. los cuales pueden ser la entrevistas. Desafortunadamente. 1. Datos ordinales: pueden tanto de tipo cualitativos como cuantitativos. la o encuesta. el a˜ o de naciemiento. el tipo de bacteria en el intestino de una cierta especie de pescado. con las t´ cnicas ya antes nombradas. Niveles de Medida Existen varios seg´ n los valores que toman los datos. Cada uno tiene ventajas y o o o desventajas. con la finalidad de buscar informaci´ n que a o ser´ util a una investigaci´ n en com´ n. el volumen. M´ todos de recolecci´ n de datos e o La recolecci´ n de datos se refiere al uso de una gran diversidad de t´ cnicas y herramientas que pueden ser o e utilizadas por el analista para desarrollar los sistemas de informaci´ n. La entrevista e Las entrevistas se utilizan para recabar informaci´ n en forma verbal. inspecci´ n de registros (revisi´ n en el sitio) y observaci´ n. Generalmente. sean buenas para estimar los par´ metros ı ´ a necesarios. Datos nominales: pueden ser del tipo cualitaticos s´ lamente. cuestionarios. Los valores atribuidos a los datos son etiquetas. Por ejemplo: la temperatura. el cuestionario. 1. tales que los estad´sticos calculados a partir de estas muestras. estimar estad´sticos nunca es 100 % seguro. para estos si est´ prescrito un orden en particular. el diagrama de flujo y el diccionario de datos. el grado de estudio. pero si que podr´a ser en alguna ı ı medida cercana. u 1. tienen un orden o e natural y la diferencia entre los valores que toman los datos son significativas. Por ´ a ı ejemplo: las posiciones del torneo de futbol profesional Venezolano.1. se utilizan dos o tres para complementar el trabajo de cada una y ayudar a asegurar una investigaci´ n completa. o e Los analistas utilizan una variedad de m´ todos a fin de recopilar los datos sobre una situaci´ n existente.La pericia de los cient´ficos se encuentra en tratar de construir buenas muestras a partir de poblaciones muy ı grandes. tienen orden. pero las etiquetas no tienen atributo de orden. Los valores que toman los datos son num´ ricos.3. n Datos raz´ n: son siempre cuantitativos. 9 . Por ejemplo. 4.3.2. Quienes responden pueden ser gerentes o empleados. o Todas estos instrumentos se aplicar´ en un momento en particular. Los valores son num´ ricos. Por ejemplo: el tipo de sangre. En la presente investigaci´ n trata con detalle los pasos que se debe seguir a´ o u o en el proceso de recolecci´ n de datos. el nivel de sensura de uan pel´cula. el peso de una persona. la observaci´ n. los cuales son usuarios actuales del sistema existente. o 1. pero a diferencia de los anteriores. o 2. 3. Los valores para los datos sirven para o etiquetar. Datos intervalos: s´ lo son cuantitativos. el tipo de raza. a trav´ s de preguntas que propone el analiso ta.

Sin embargo. Esta “muestra” es usualmente s´ lo una fracci´ n de la poblaci´ n bajo estudio. incluso el analista debe verificar los datos recopilados utilizando o o unos de los otros m´ todos de recabaci´ n de datos.usuarios potenciales del sistema propuesto o aquellos que proporcionar´ n datos o ser´ n afectados por la aplia a caci´ n propuesta.3.una entidad del gobierno comisiona una encuesta para obtener informaci´ n para o evaluar legislaci´ n existente o para preparar y proponer nueva legislaci´ n. e e a a La habilidad del entrevistador es vital para el exito en la b´ squeda de hecho por medio de la entrevista. as´ como concejo y comprensi´ n por parte del usuario para toda idea ı o o m´ todo nuevos. donde todos los miembros de la poblaci´ n son estudiados. incluyendo por tel´ fono. sirve para obtener informaci´ n acerca de las o o o necesidades y la manera de satisfacerlas. o Dentro de una organizaci´ n. por lo tanto no es posible utilizar este m´ todo para recopilar toda la infore maci´ n que se necesite en la investigaci´ n. la entrevistas es la t´ cnica m´ s significativa y productiva de que dispone el analista o e a para recabar datos. La entrevista se aplican en todos los niveles gerencial y de e o empleados y dependa de quien pueda proporcionar la mayor parte de la informaci´ n util para el estudio los o ´ analistas que estudian la administraci´ n de inventarios pueden entrevistar a los trabajadores del embarque y de o recepci´ n. La muestra es seleccionada cient´ficamente de manera que cada perı sona en la poblaci´ n tenga una oportunidad medible de ser seleccionada. o o No tan s´ lo las encuestas tienen una gran variedad de prop´ sitos. una muestra de electores es interrogada para determinar c´ mo los candidao o tos y los asuntos son percibidos por el p´ blico . ı 1. A´ n as´. lo cual es fundamental en transcurso del estudio. El analista puede entrevistar al personal en forma individual o en grupos algunos analistas o prefieren este m´ todo a las otras t´ cnicas que se estudiar´ n m´ s adelante. la entrevista ofrece al analista una excelente oportunidad para establecer una e corriente de simpat´a con el personal usuario. Las ´ u buenas entrevista depende del conocimiento del analista tanto de la preparaci´ n del objetivo de una entrevista o espec´fica como de las preguntas por realizar a una persona determinada. Aquellas personas que o e realmente trabajan en el almac´ n. por correo o en persona. ı Realizar entrevistas toma tiempo. las entrevistas no sieme e a a pre son la mejor fuente de datos de aplicaci´ n. todas las encuestas tienen algunas e u ı caracter´sticas en com´ n. la entrevistas es un intercambio de informaci´ n que se efect´ a cara a cara. De esta manera los resultados pueden o 10 . sino que tambi´ n pueden conducirse de muo o e chas maneras. las encuestas recogen ino formaci´ n de una porci´ n de la poblaci´ n de inter´ s. es decir. tambi´ n entrevistar´ n a los gerentes m´ s importante. En una encuesta bona fide. o o o Por ejemplo. La encuesta Hoy en d´a la palabra “encuesta” se usa m´ s frecuentemente para describir un m´ todo de obtener informaci´ n ı a e o de una muestra de individuos.2. la muestra no es seleccionada caprichosamente o s´ lo de personas que se o ofrecen como voluntarios para participar.un fabricante hace una encuesta al mercado potencial antes de u introducir un nuevo producto . al personal de almac´ n y a los supervisores de los diferentes turnos. antes de una elecci´ n. ı u A diferencia de un censo. o u Es un canal de comunicaci´ n entre el analista y la organizaci´ n. En otras palabras. dependiendo el tama˜ o de la muestra en el prop´ sito del o o o e n o estudio. Por otra parte.

La informaci´ n es recogida usando proceo o dimientos estandarizados de manera que a cada individuo se le hacen las mismas preguntas en mas o menos la misma manera. por lo tanto. Tambi´ n las preguntas estandarizadas pueden proporcionar datos m´ s confiable. tambi´ n esto es una ventaja porque aplican muchas entrevista ayuda a asegurar que el e interpelado cuenta con mayor anonimato y puedan darse respuestas mas honesta ( y menos respuestas prehechas o estereotipadas). Para los analistas los cuestionarios pueden ser la unica forma o ´ posible de relacionarse con un gran n´ mero de personas para conocer varios aspectos del sistema. Mucho u ı n de esto depende de los recursos profesionales y fiscales disponibles. En mayor parte de los casos. Por ejemplo. no hay una regla simple para el tama˜ o de muestra que pueda ser usada en todas las encuestas. o El tama˜ o de muestra requerido en una encuesta depende en parte de la calidad estad´stica necesaria para los n ı establecer los hallazgos. por azar. Cuando se u llevan a cabo largos estudios en varios departamento. a e o e es un medio.El formato abierto proporciona una amplia oportunidad para quienes respondan escriba las razones de sus ideas. los cuestionarios pueden ser abiertos y se aplican cuando se quieren conocer los sentimientos.3. esto a su vez. tambi´ n son utiles al explorar el problema e ´ b´ sico. n a Recabaci´ n de datos mediante cuestionarios. se puede distribuir los cuestionarios a todas las personas apropiadas para recabar hechos en relaci´ n al sistema. Con frecuencia se utilizan ambas formas en los estudios de sistemas. La intenci´ n de la encuesta no es describir los individuos particulares quienes. si embargo. e a Selecci´ n de formas para cuestionarios.ser proyectados con seguridad de la muestra a la poblaci´ n mayor. o Existen dos formas de cuestionarios para recabar datos: cuestionarios abiertos y cerrados. 1.3. Cuestionario Los cuestionarios proporcionan una alternativa muy util para la entrevista. El desarrollo y distribuci´ n de los cuestionarios. el analista no ver´ a los que o a responde. ı 11 . no obstante. opiniones y experiencias generales. est´ relacionado en c´ mo esos hallazgos ser´ n usados. y se aplican dependiendo de si los analistas conocen de antemano todas las posibles respuestas de las preguntas y pueden incluirlas. Cuestionario Abierto. por ejemplo. un analista que utiliza cuestionarios para estudiar los m´ todos de verificaci´ n de cr´ dito. las muy con ı nocidas encuestas nacionales frecuentemente usan cerca de 1. Algunas personas sin embargo. son o parte de la muestra sino obtener un perfil compuesto de la poblaci´ n. Los analistas frecuentemente encuentran que una muestra de tama˜ o moderado es suficiente estad´stica y operacionalmente. a o a A´ n as´.000 personas para obtener informaci´ n razonable o sobre actitudes y opiniones nacionales. Al igual que la entrevistas. ı deben dise˜ arse cuidadosamente para una m´ xima efectividad. Tambi´ n es importante el formato y contenido de e las preguntas en la recopilaci´ n de hechos significativos. el tiemo o po invertido en esto debe utilizarse en una forma inteligente. existen ciertas carac´ ter´sticas que pueden ser apropiada en algunas situaciones e inapropiadas en otra. Al igual que las entrevistas. encuentran m´ s f´ cil escoger una de un conjunto de respuestas a a preparadas que pensar por s´ mismas.

Los u e o o o ı soci´ logos. La observaci´ n o Otra t´ cnica util para el analista en su progreso de investigaci´ n. puesto que resulta casi imposible reunir las condiciones necesarias. como se est´ haciendo. Primero. Este formato es el m´ todo e para obtener informaci´ n sobre los hechos. pero estando la persona observada o enteramente consciente de la observaci´ n. o El analista de sistemas puede observar de tres maneras b´ sicas. o 1. puede observar y a la vez estar en contacto con las o ´ personas observas. Quiz´ esta alternativa tenga poca e o a importancia para el an´ lisis de sistemas. El cuestionario cerrado limita las respuestas posibles del interrogado. el analista puede observar una operaci´ n sin intervenir para nada.4. etc. o ı pedir una explicaci´ n. o 12 . a Segundo. puede observar a una persona o actitud a sin que el observado se d´ cuenta y su interacci´ n por aparte del propio analista. Por ultimo. Como t´ cnica de investigaci´ n. cuanto tiempo toma. Tambi´ n fuerza a los individuos para que tomen una posici´ n y o e o forma su opini´ n sobre los aspectos importantes. sic´ logos e ingenieros industriales utilizan extensamente esta t´ cnica con el fin de estudiar a las o o ´ e personas en sus actividades de grupo y como miembros de la organizaci´ n. El prop´ sito de la organizaci´ n es o o o m´ ltiple: permite al analista determinar que se est´ haciendo. cuando se u a a lleva a cabo.Cuestionario Cerrado. consiste en observar a las personas cuane ´ o do efect´ an su trabajo. Por medio de un cuidadoso estilo en la pregunta. d´ nde se hace y por que se hace.3. el analista puede controlar el marco de referencia. la observaci´ n tiene amplia aceptaci´ n cient´fica. La interacci´ n puede consistir simplemente en preguntar respecto a una tarea espec´fica. quien lo hace.

usualmente es a llamado marca de clase.1. se define un valor. 74. Lo denotaremos como Li . 80-89. 84.1.5 84. Por ejemplo: sup´ ngase que 20 estudiantes de estad´stica poseen las siguientes notas a continuaci´ n en una o ı o escala de 0 a 100 puntos: 97. 89. ı ´ Para resumir espacio pudiera organizarse todo en clases tales como 90-99. Terminolog´a adicional ı 1. que consistir´ en el el valor que representa a dicha clase. 75. ı L´mite superior de clase: es el mayor valor en el intervalo de clase. Adem´ s la tabla de frecuencias muestra un n´ mero a continuaci´ n del dato o marca de a u o clase.Cap´tulo 2 ı La estad´stica descriptiva ı 2. 83. Distribuciones de frecuencia Una distribuci´ n de frecuencias es una tabla usada para describir un conjunto de datos. 70-79 etc. ı 13 . u 2.5 44. as´ en esta tabla tendr´amos unas 100 filas aproximadamente. a este n´ mero se le llama frecuencia. 67. u ´ ´ u o frecuencia de la clase. 78.5 74. y contando el n´ mero de datos pertenecientes a cada intervalo. Puede ı construirse una tabla de frecuencias para cada nota. 91. 81. L´mite inferior de clase: es el menor valor en el intervalo de clase. 88.1.5 64.5 54. En el caso de mostrar intervalos de datos. Una tabla de frecueno cias muestra datos particulares o intervalos o rangos de datos llamados clases de datos. 57. Lo denotaremos como Ls . 63. 2. que representa el n´ mero de veces que este valor se repite en la data. 72. 46. 92. 55. As´ obtendr´amos algo como sigue: u ı ı Intervalo 90-99 80-89 70-79 60-69 50-59 40-49 Marca de Clase 94. 87. el n´ mero de todos los datos existentes. 98.5 Frecuencia 4 6 4 3 2 1 Note que la suma de la columnas de frecuencias es igual a 20. 67.

5. Ancho de clase: es la diferencia entre dos l´mites de clases superiores (o inferiores) consecutivos. Los datos se corresponden con los montos pagados por 28 conductores diferentes en una estaci´ n de gasolina. 3. as´ cada clase u u ı tendr´ un ancho de 16 = 2. Pudiera escogerse otro criterio para definir la marca de clase. 8. 14. 7. o ı 4. 4. 69. Lo m´ s importantes es contar o disponer de alguna data que sea de utilidad y con la cual se quisiera a estimar algunos valores y/o caracter´sticas importantes de inter´ s. no tiene mucha importancia. y por tanto para estimar el ancho a de cada clase dividimos el n´ mero calculado anteriormente entre el n´ mero de clases dispuesto. 70. 89.5. o 1. y 44. 9. ı e Decidir deacuerdo al n´ mero de datos y las caracter´sticas de los mismos las clases necesarias para optiu ı mizar los resultados y agilizar los c´ lculos seguidos. 54. el rango de la clase ser´ aproximadamente 18 − 2 = 16. Lo denotaremos ´ por Lc . se tiene que: los a ı l´mites superiores de clase son: 99. 5. 84. los l´mites inferiores de clase son: 90. 10.1. 8. 80. 3.1) 2 Ejemplo: Para la tabla de frecuencias anterior de las notas de los ex´ menes de estad´stica. Ejercicio: Construiremos a continuaci´ n una tabla de frecuencias con 6 marcas de clases o intervalos de o clase para la data siguiente. 5. Los montos son en Bol´vares Fuertes (Bs.2. 50. 12.66. 64. y 49. 9. 9. u (2. por el consumo de la misma. pero puede que menos representativa e a o informativa sea la tabla. 11. cualquiera sea la escogencia que se haga. 2. 4. u Rango = Mayor valor − Menor valor. por tanto. 18. El ancho de cada clase es 10. Todos ı las clases deber´an tener el mismo ancho.F): 7. lo importante es que este dato represente todo el intervalo de clase. 60. sin embargo. a Dividir el rango de la data por el n´ mero de clases para obtener un estimado del ancho de las clases. 3. 59. Soluci´ n: En este caso se tendr´ como dato que se quiere hacer una tabla que tenga ni m´ s ni menos 6 initervalos o a a de clase. Creando una tabla de frecuencias Para crear table de frecuencias es necesario seguir los pasos a continuaci´ n. 4. Las marcas de clase son: 94.5. 74.2) El n´ mero de tramos en los que se agrupa la informaci´ n es una decisi´ n que debe tomar el analista: la regla u o o es que mientras m´ s tramos se utilicen menos informaci´ n se pierde. Li + Ls Lc = . (2. 5. 4. 9. 4. 7. 4. 79. y ı ı 40. Tendremos en definitiva algo como lo que sigue: a 6 14 . 12.5.5. 6. 2.5. 2. observando la data nos daremos cuenta que el menor monto pagado es 2 mientras que el mayor es 18. por tanto.3. ı Marca de clase: es por lo general el valor medio de los datos de cada intervalo. ı Construir la tabla de frecuencia contando el n´ mero de datos en cada uno de los intervalos de clase. Decidir los l´mites de las clases. 15. 2.

1.3) 2. si se acumulan ´ las frecuencias desde la ultima clase o la primera clase respectivamente. En otras palabras. Notaci´ n Matem´ tica o a Intervalo 1-3 4-6 7-9 10-12 13-15 16-18 Marca de Clase 2 5 8 11 14 17 Frecuencia 4 8 9 4 2 1 En lo que sigue se usar´ la siguiente simbolog´a y las siguientes variables que usaremos para referirnos a objetos a ı o valores que definiremos en adelante. Frecuencia acumulada La frecuencia acumulada de una clase de datos es el n´ mero de elementos que existe en esa clase y todos los u de las clases previas. y f la frecuencia u de cada datos o cada marca de clase.5 64.5 54.5 Frecuencia 4 6 4 3 2 1 Frec. Acumulada ↓ 20 16 10 6 3 1 N´ tese que la ultima entrada en la columna de la frecuencia acumulada creciente es justamente n = 20. Ejercicio: A˜ adiremos a la tabla de frecuencias para el caso de los consumos de gasolina. N (2. Puede ser tanto decreciente como creciente.5 74. N el n´ mero de valores en el conjunto poblacional.Clase Clase I Clase II Clase III Clase IV Clase V Clase VI 2. n representar´ el n´ mero de a u valores en el conjunto de datos muestrales. pudiera escribirse la sentencia de que la suma de todas las frecuencias ´ o en la tabla de frecuencias es igual al n´ mero de valores en el conjunto de los datos.1. ´ Ejemplo: En la data presentada acerca de las notas de los ex´ menes de estad´stica puediera construirse la a ı siguiente tabla de frecuencias acumuladas: Clase I II III IV V VI Intervalo 90-99 80-89 70-79 60-69 50-59 40-49 Marca de Clase 94. a menos que se indique otra cosa. Representaremos los valores que toma una cierta variable en una cierta data como x. Como siempre usaremos la simbolog´a ∑ para indicar la suma de todos los ı valores de una variable o expresi´ n. Acumulada ↑ 4 10 14 17 19 20 Frec.5 84. y de manera obvia.3. la frecuencia acumulada de una clase es la frecuencia de la clase m´ s a todas las frecuencias de las clases anteriores a esta. dos nuevas column 15 .4. lo miso ´ mo sucede para la frecuencia acumulada decreciente. o Usando esta notaci´ n.5 44. u i=1 ∑ fi = n.

coincidente con el hecho de que existe una posibilidad de 100 % de que pudiera ocurrier “cualquiera” de las cosas que describen la data. (2. La frecuencia relativa La frecuencia relativa de un dato o marca de clase se define como el porcentaje de elementos en esa clase en relaci´ n con el total de datos de la muestra. por su puesto.1. Esta herramienta se utiliza especialmente en la Comprobaci´ n de teor´as y Pruebas e o ı 16 .321 Clase IV 10-12 11 4 25 . Acumulada ↑ 4 12 21 25 27 28 Frec. la mitad n del intervalo en el que est´ n agrupados los datos.285 Clase III 7-9 8 9 21 . Clase I 1-3 2 4 4 . Frec. ↑ Frec. es decir.035 Note que la suma de todas las frecuencias relativas en la columna. y en el eje horizontal los valores de las variables. Se denota por fri .142 Clase V 13-15 14 2 27 . es decir. si pasa alguna de ellas. Los histogramas Un histograma es una representaci´ n gr´ fica de una variable en forma de barras.5) Ejemplo: Para la tabla anterior tendremos: Clase Intervalo Marca de Clase Frec. 0 ≤ fri ≤ 1.6. por razones m´ s que obvias.071 Clase VI 16-18 17 1 28 . En el eje vertical se representan las frecuencias. Soluci´ n: Tendremos en definitiva algo como lo que sigue: o Clase Intervalo Marca de Clase Frecuencia Clase I 1-3 2 4 Clase II 4-6 5 8 Clase III 7-9 8 9 Clase IV 10-12 11 4 Clase V 13-15 14 2 Clase VI 16-18 17 1 2. Es sencillo calcular la frecuencia relativa como: o fri = fi . donde la superficie de cada bao a rra es proporcional a la frecuencia de los valores representados. Un histograma es un resumen gr´ fico de la variaci´ n de un a a o conjunto de datos. Acumulada ↓ 28 24 16 7 3 1 En vista que el n´ mero fi es siempre menor que n. suma aproximadamente 1. Acum. Adicionalmente pudiera definirse u la frecuencia relativa porcentual como: fri % = fri × 100 %.5.4) Frec.nas para la frecuencia acumulada creciente y decreciente respectivamente. normalmente se˜ alando las marcas de clase.142 Clase II 4-6 5 8 12 .1. Relat. 2. es entonces inmediato que fri u a es un n´ mero que puede oscilar entre los valores 0 y 1. n (2. La naturaleza gr´ fica del histograma nos permite ver pautas que son dif´ciles de observar en a ı una simple tabla num´ rica.

o a o sesgada. truncada. 13. 12. Por ejemplo. y. sus valores se agrupan en clases. La f´ brica establece un programa de mejora de a a calidad para que las botellas que se fabriquen cumplan con los requisitos del cliente. La explicaci´ n debe basarse en los conocimientos generales o y en la observaci´ n de las situaciones espec´ficas y debe ser confirmada mediante un an´ lisis adicional. En este caso puede seguirse los pasos anteriormente explicitados y entonces: ´ Rango = Mayor valor − Menor valor = 16 − 11 = 5. 12. con una tolerancia de m´ s menos 1 ml. 4. Un criterio o e a usado frecuentemente es que el n´ mero de clases debe ser aproximadamente a la ra´z cuadrada del n´ mero u ı u de datos. 13. 12. 17 . Los histogramas son m´ s frecuentes en a ciencias sociales. 15. a Si se unen los puntos medios de la base superior de los rect´ ngulos se obtiene el pol´gono de frecuencias. 13. plana. 14. Y permite la comparaci´ n de los o o resultados de un proceso. y por otro desarrollar a o o una explicaci´ n razonable y relevante de la pauta. 16. 14. identificar y clasificar la pauta de variaci´ n. se hace un gr´ fico de barras. Paso 2: Obtener el n´ mero de clases. a ı 3. 14. la ra´z cuadrada de 30 ( n´ mero de art´culos) es mayor que cinco. como franjas de edades o altura de la muestra. 12. 15. u Paso 4: Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en relaci´ n al resultado del PASO 2 en intervalos iguales. por un lado. por lo que se ı u ı seleccionan seis clases. 14. 16. Al realizar el muestreo se obtienen los siguientes datos de las capacidades de botellas al azar: 11. El prop´ sito del ı o o an´ lisis de un histograma es. grado de acuerdo o nivel de estudios. un cliente le est´ exigiendo que la capacidad de cierto tipo de a botella sea de 13 ml. o Paso 5: Graficar el histograma: En caso de que las clases sean todas de la misma amplitud. 11. 12. como sexo. Las o ı a pautas habituales de variaci´ n m´ s comunes son la distribuci´ n en campana. Algunos autores recomiendan de cinco a quince clases. 13. Paso 1: Determinar el rango de los datos. con un pico aislado. Ejemplo: A una fabrica de envases de vidrio. dependiendo de c´ mo est´ n los datos y cu´ ntos sean. es decir. 5 Longitud de la clase = 5 = 1. Sin embargo ninguno de ellos es exacto. Sabemos que los valores var´an en todo conjunto de datos. es preferible un diagrama de e sectores. las bases de las barras son los intervalos de clases y altura son la frecuencia de las clases. con dos picos. existen varios criterios para determinar el n´ mero de clases (o u u barras) -por ejemplo la regla de Sturgess-. En los casos en los que los datos son cualitativos (no-num´ ricos). 15. 5. √ # de clases = 25 = 5. en peine. Esta variaci´ n sigue cierta pauta. Construcci´ n de un histograma o 1. Paso 3: Establecer la longitud de clase: es igual al rango entre el n´ mero de clases.de validez. valores contiguos. por comodidad. Se utiliza cuando se estudia una variable continua. 14. 13. humanas y econ´ micas que en ciencias naturales y exactas. o con un pico en el extremo. 14. 15. Rango es igual al dato mayor menos el dato menor. 2. 11.

5 13. Justo ı a o como los histogramas. el eje vertical representa las frecuencias.20 . o a un punto es dibujado por cada marca de clase.24 El histograma de frecuencias se muestra a continuaci´ n: o Figura 2. en el caso del histograma es el punto en la parte m´ s alta de la a barra y en la mitad de la misma. mientras e que el eje horizontal representa la medici´ n de la variable en el conjunto de datos. Para construir el gr´ fico. O. este punto representa.5 12.20 .12 . . la frecuencia de la clase. en el de ordenadas (eje vertical). a por ejemplo. absolutas o relativas. que pueden ser tambi´ n las relativas. Varias posibilidades: Un pol´gono de frecuencias es un gr´ fico de linea que representa la informaci´ n de la tabla de frecuencias. ↑ 3 8 13 19 25 Frec. Relat. las clases hay que definirlas expl´citamente (intervalos de clase). ı Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuencias. Acum. y se cuenta cu´ ntas observaciones (frecuencia absoluta) a hay en cada una de ellas. En algunas variables (variables cualitativas) las clases est´ n definidas de modo natural. por su puesto.1: As´ luce un histograma de frecuencias.24 . B.5 14. 3 5 5 6 6 Frec. o o o 18 . En las variables o ı cuantitativas.Se tiene entonces: Clase Clase I Clase II Clase III Clase IV Clase V Intervalo 11-12 12-13 13-14 14-15 15-16 Marca de Clase 11.5 15. var´ n o grupo sangu´neo con cuatro: A. ı Ejemplos de otros tipos de representaciones gr´ ficas a Hay histogramas donde se agrupan los datos en clases. Para terminar ´ se conectan todos los puntos con lineas rectas.5 Frec. sexo con dos clases: mujer. AB. Los pol´gonos de frecuencias ser´ de mucha utilidad luego para ı a estimar la curva de predicci´ n y para estimar el tipo de distribuci´ n particular que sigue el fen´ meno.

o 2. 19 .2: Ejemplo de como debe construirse un histograma simple. Figura 2.3: Muchas posibilidades para la construcci´ n del histograma.2.Figura 2. Medidas de Tendencia Central (MTC) Una Medida de Tendencia Central es un valor usado para representar el “promedio” t´pico en el conjunto de los ı datos.

15. 2.6) (2. desde luego. ´ Ejemplo: La mediana para el conjunto de datos de las notas del examen de f´sica puede calcularse ordenando ı as´: ı 7. La Media Aritmetica La medida de tendencia central mas obvia que se puede elegir.3. 17.Al describir grupos de observaciones. no individual. 8. Para calcular la mediana. 10.2. Entonces ser´a mas adecuado buscar un valor central. 15. 16. Utilizaremos como notaci´ n la siguiente para referira o nos a este valor. 8. para los valores de la muestra. La media resume en un valor las caracter´sticas de una variable teniendo en ı cuenta a todos los casos. no se usar´ el valor mas elevado ni el valor mas peque˜ o como unico representante. por el contrario si n es par. es decir el valor obtenido sumando las observaciones y dividiendo esta suma por el n´ mero de u observaciones que hay en el grupo. para los valores de la poblaci´ n. Solamente puede utilizarse con variables cuantitativas 2. 10. 16. 8. 19. ı ı Las medidas que describen un valor t´pico en un grupo de observaciones suelen llamarse medidas de tendenı cia central. La media para el espacio muestral es denotada por x mientras que la media para la ¯ poblaci´ n es denotada porla letra griega µ . 7. 15.27. 10. 10. o ∑n xi i=1 .. Mas bien que valores t´picos. es el simple promedio de las observaciones del grupo.7) ı Ejemplo: El promedio o la media de los resultados en un examen de f´sica cuyas notas han sido: 10. lo m´ s sencillos es localizar todos los datos en orden. x0.5 . con frecuencia se desea describir el grupo con un solo n´ mero. Si n es impar. n 11 Ejercicio: Calcular la media de cada uno de los ejemplos explicitados en las secciones anteriores. entonces la a mediana ser´ el valor medio de los dos valores centrales. un promedio es una caracter´stica de grupo.1. 17.8) 20 .2. La Mediana La mediana es un valor el cual separa el 50 % de los valores mayores de la data del 50 % restante menor. 15. 10. 2. N x= ¯ (2. ya que solo a n ´ representan los extremos. n ∑N xi o µ = i=1 .Es importante tener en cuenta que estas medidas se aplican a grupos mas bien que a individuos.2. Entre las medidas de tendencia se encuentran las ı siguientes. 8.2. el valor medio ser´ justamente la mediana. 19 (2. La Media La suma de todos los valores de el conjunto de datos dividido por el n´ mero de valores en la data es lo que u se conoce como la media. y entonces buscar el punto medio de a los mismos. Para tal u fin. es: 135 ∑n xi x = i=1 = ¯ = 12.

16. a i=1 ¯ ∑ (xi − x) = 0.9) vemos el dato con mayor frecuencia es el 10. 2. de intervalo y ordinal (excepto para el nominal). La media podr´a no ser un promedio adecuado para representar datos no regulares. 8. Un conjunto de datos s´ lo tiene una media. si s´ lo un valor es que el tiene mayor frecuencia. 17. La moda De todos los valores de la data. se considera llamar a la distribuci´ n con un nombre particular o en virtud de cuantos valores moda existan. Es unica. ´ o No se ve afectada por valores muy grandes o muy peque˜ os. 10. 2. 8.5. el dato con mayor frecunecia.2. o 21 .5 = 10. o ´ La media es una medida muy util para comparar dos o m´ s poblaciones. a o esta distribuci´ n se le llamar´ unimodal. entonces. en este caso. se le llamar´ bimodal y si tiene m´ s se le o a a a llamar´ polimodal. siempre ser´ cero. o lo que es lo mismo. Propiedades de la mediana 1. 4. asi. n Puede calcularse para una distribuci´ n de frecuencias con una clase de extremo abierto. entonces. el cual es el dato con o el orden 6to. 10. Propiedades de la media. Esta es un valor unico. por tanto la moda es el 10. si tiene dos modas. a u a Todo conjunto de datos de nivel de intervalo y de nivel de raz´ n tiene un valor medio. si la medina no o se encuentra en una clase de tal extremo. 3. 2. Puede obtenerse para datos de nivel de raz´ n. 10. la moda resulta ser el valor que aparece repetida el mayor n´ mero de veces u en el conjunto. o Al evaluar la media se incluyen todos los valores.000 y mayor).vemos el n = 11. Ejercicio: Calcular la mediana de cada uno de los ejemplos explicitados en las secciones anteriores. La media se ve afecı tada de modo notable por valores extraordinariamente grandes o peque˜ os. 15. Pudiera pasar que dos o varios datos se repitieran con la misma frecuencia. mediana y moda Propiedades de la media 1. 3. n No se puede determinar la media de datos de extremo abierto (Ej: U$S 100. 8. a Ejemplo: La moda para el conjunto de datos de las notas del examen de f´sica puede calcularse ordenando ı as´: ı 7.2. n (2. Ejercicio: Calcular la moda de cada uno de los ejemplos explicitados en las secciones anteriores. La media es la m´ s com´ n de todas las medidas de tendencia central usadas para el an´ lisis de los datos. s´ lo existe una mediana para un conjunto de datos. 4. 19 (2. es decir x0. 6. ´ a La media es la unica medida de ubicaci´ n donde la suma de las desviaciones de cada valor con respecto ´ o a la media. por tanto la mediana es el dato del centro de esta distribuci´ n ordeada. 2. 15.10) 7.4. 5.

. llamado su peso. Se denomina media ponderada de un conjunto de n´ meros al resule u tado de multiplicar cada uno de los n´ meros por un valor particular para cada uno de ellos. wn . 5 cr´ ditos e e e de las C y 3 cr´ ditos de D’s. y dividiendo el resultado de esta suma de productos entre o la suma de los pesos seg´ n la caracter´stica de cada n´ mero inicial.. 2. de intervalo y de raz´ n. + xnwn xW = ¯ . (2. Calcular la cuenta final para un estudiante que ha anotado 95 en la preparaci´ n. a 2. ordinal. 3. .. y el examen final vale el 25 %. u a Para muchos conjuntos de datos no hay valor modal porque ning´ n valor aparece m´ s de una vez. Podemos sacar la a cuenta para cada componente del grado final con su porcentaje para calcular el grado final. e Ejercicio: Grado del curso. D = 1. F = 0. Para una serie de datos. o No se ve afectada por valores muy altos o muy bajos.6. Ejercicio: Promedio de puntos del grado. x2 . Asignamos a los grados las letra con los valores: A = 4.12) w1 + w2 + w3 + . B = 3. . Puede determinarse para todos los niveles de datos: nominal.11) xW = i=1 ¯ ∑n wi i=1 o: x1 w1 + x2 w2 + x3 w3 + . puede utilizarse como medida de tendencia central para distribuciones con clases de extremo abierto. El nota final en este curso se calcula seg´ n la escala siguiente: La preparaci´ n u o cuenta con el 15 %.. 2.7. Este “peso” depende de la importancia o u ı u significancia de cada uno de los valores. + wn Un ejemplo es la obtenci´ n de la media ponderada de las notas de una oposici´ n en la que se asigna distinta o o importancia (peso) a cada una de las pruebas de que consta el examen..2. C = 2.. El promedio ponderado Es un caso especial de la media aritm´ tica. xn . 5.. w2 . a la que corresponden los pesos W = w1 . X = x1 .13) x= ¯ n n 22 . Otros tipos de medias Media cuadr´ tica a La media cuadr´ tica es igual a la ra´z cuadrada de la suma de los cuadrados de los valores dividida entre el a ı n´ mero de datos: u n 2 2 2 2 a + a + · · · + a2 2 ∑ n i=1 ai 1 2 = . Calcular el grado de un estudiante que ha ganado 12 cr´ ditos de las A. y entonces cada valor del grado se cuenta seg´ n el n´ mero de los cr´ ditos ganados con ese u u e grado. el 20 % por cada ex´ men de tres que hay. 4. Para algunos conjuntos de datos hay m´ s de una moda (bimodal = que tiene dos modas).. u obteniendo a continuaci´ n la suma de estos productos. la media ponderada se calcula como: ∑n xi wi . (2. (2...2. y o una nota en el examen final es de 88.Propiedades de la moda 1. 94. y 77. 21 cr´ ditos de los B. tiene notas de los examenes de 83. Al igual que la mediana.

o u e bien negativa o bien inexistente en los n´ meros reales. Consiste en elevar al cuadrado todas las observaciones a (as´ los signos negativos desaparecen). e Media arm´ nica o La media arm´ nica. dados los n´ meros a1 .. an . la ra´z ı e´ e´ ı cuadrada de dicha media para volver a la unidad de medida original. mediante la denominada media cuadr´ tica. en los errores de medida. S´ lo es relevante la media geom´ trica si todos los n´ meros son positivos. la media de 1. (2.14) i=1 Por ejemplo. Si hay un n´ mero negativo (o una cantidad impar de ellos) entonces la media geom´ trica es. 1·3·9= √ 3 27 = 3. o o A veces la variable toma valores positivos y negativos.. por ejemplo. como ocurre. finalmente. Media geom´ trica e La media geom´ trica de una cantidad finita de n´ meros (digamos n n´ meros) es la ra´z n-´ sima del producto de e u u ı e todos los n´ meros. de una cantidad finita de n´ meros es igual al rec´proco. Si uno de ellos es 0. siendo en cambio sensible a valores mucho m´ s peque˜ os que el conjunto. ¯ (2. u En muchas ocasiones se utiliza su trasformaci´ n en el manejo estad´stico de variables con distribuci´ n no noro ı o mal. o a 23 . la media geom´ trica de 2 y 18 es e √ 2 Otro ejemplo. As´. .15) ( a1 + · · · + a1n ) ∑i=1 ai La media arm´ nica resulta poco influida por la existencia de determinados valores mucho m´ s grandes que el o a conjunto de los otros. o inverso. de la o u ı media aritm´ tica de los rec´procos de dichos n´ meros.Esta media como medida de asociaci´ n tiene aplicaciones tanto en ciencias biol´ gicas como en medicina. representada por H. a n La media arm´ nica no est´ definida en el caso de la existencia en el conjunto de valores nulos. 3 y 9 seria √ 3 2 · 18 = √ 2 36 = 6. a2 . En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo. Este problema se resuelve.. u n √ x = n ∏ xi = n x1 · x2 · · · xn . entonces el o e u resultado es 0. La media geom´ trica es relevante cuando varias cantidades son sumadas para producir un total. en obtener despu´ es su media aritm´ etica y en extraer. la media arm´ nica e ı u ı u o ser´ igual a: a n n H= n 1 = 1 .

si m = 0 (2. Formas de las distribuciones de datos Podemos clasificar varias formas de las distribuciones de datos deacuerdo al lugar que ocupan las medidas de tendencia central m´ s usuales anteriormente definidas. con m = 1. aritm´ tica. e o o Ejercicio: Calcule los valores de las medias anteriormente definiddas para todas las situaciones y conjunto de datos anteriores. arm´ nica. 24 . o cuadr´ tica. Ve´ se la igual proporci´ n de barras con alturas aproximadas a ambos o e a o lados de la media. a Sim´ trica e La distribuci´ n de datos es aproximadamente de la misma forma a ambos lados de la linea central. e geom´ trica.4: Una distribuci´ n sim´ trica. con m = 0.16) Obs´ rvese que para valores de m ≤ 0 la expresi´ n s´ lo tiene sentido si todos los xi ≥ 0. 2. etc). e arm´ nica. con m = −1.Media generalizada La media generalizada es una abstracci´ n de los diversos tipos de media (geom´ trica. o e Figura 2. con m = 2. o e e o Se define como: m x(m) = ¯ en donde el par´ metro m indica si la media es: a aritm´ tica. en donde o se encuentra aproximadamente la media. si es unimodal) son pr´ cticamente a iguales en una distribuci´ n sim´ trica. a 1 n n ∑n xm i=1 i ∏ n xi i=1 si m 0 . La media y la mediada (y la moda.2.8.

a n Por lo tanto. el grado en que los datos se parecen o diferen25 . a 2. ´ Figura 2. pero la mayor´a de todos los datos se encuentran ı muy agrupados y acumulados a la izquierda de la misma. ´ Figura 2.5: Una distribuci´ n sezgada a la derecha.6: Una distribuci´ n sezgada a la izquierda. Sesgada a la izquierda Unos cuantos valores se encuentran la derecha de la media. Por ejemplo. Medidas de variaci´ n o Para conseguir una visi´ n completa y comprensiva de los datos hay que complementar las medidas de tendencia o central con las de otras propiedades de los mismos. Generalmente la mediana es m´ s grande que la media. Uniforme Todos los datos est´ n igualmente representados. Ve´ se la desigual proporci´ n de barras con alturas aproximao a o das a ambos lados de la media. la media se encuentra a la derecha de la mediana. Generalmente la mediana es m´ s peque˜ a que la media.3.Sesgada a la derecha Unos cuantos valores se encuentran la izquierda de la media. a Por lo tanto. en este caso. pero la mayor´a de todos los datos se encuentran ı muy agrupados y acumulados a la derecha de la misma. la media se encuentra a la izquierda de la mediana. Ve´ se la igual proporci´ n de barras con alturas aproximadas o a o a ambos lados de la media. en este caso.

Rango El rango estad´stico es la diferencia entre el valor m´nimo y el valor m´ ximo en un grupo de n´ meros.7: Una distribuci´ n uniforme. Una es tomando las desviaciones en valor ı absoluto (Desviaci´ n media) y otra es tomando las desviaciones al cuadrado (Varianza). la media de las diferencias cuadr´ ticas de n puntuaciones respecto a su media aritm´ tica. As´ se sabe si todos los casos son parecidos o var´an mucho entre ellos. cian entre s´. a e 26 . varianza poblacional. cuanto menor sea. varianza muestral.3. ı ı Para calcular la variabilidad que una distribuci´ n tiene respecto de su media. o 2. Las barras tienen aproximadamente la misma altura a ambos lados de la o media.1.18) La varianza es una variable estad´stica que mide la dispersi´ n de los valores respecto a un valor central (media). ı a 2. ı o es decir. se calcula la media de las desviao ciones de las puntuaciones respecto a la media aritm´ tica. Entre los indicadores de variaci´ n m´ s ı o o a utilizados est´ n la varianza y la desviaci´ n t´pica.Figura 2. Pero la suma de las desviaciones es siempre cero. mas homog´ neo ser´ a la a e a media. ¯ Se denota usualmente por s2 x ¯ ∑i=1 (xi − x)2 .3. e as´ que se adoptan dos clases de estrategias para salvar este problema. n−1 ∑ (xi − µ )2 s2 = i=1 . y luego restamos el valor u u u n m´nimo del valor m´ ximo. a o ı Las medidas de dispersi´ n. indicando o e o por medio de un n´ mero o estad´stico si las diferentes puntuaciones de una variable est´ n muy alejadas de la u ı a media. La Varianza Es el promedio de las distancias al cuadrado desde los valores en xi hasta la media x en una muestra de n sujetos. x N s2 = x (2. Cuanto mayor sea ese valor mayor ser´ la variabilidad.2. muestran la variabilidad de una distribuci´ n. como tambi´ n se les conoce.17) (2. A esta propiedad se la denomina variabilidad o variaci´ n. Para ı ı a u averiguar el rango de un grupo de n´ meros: ordenamos los n´ meros seg´ n su tama˜ o.

. que se halla como la ra´z cuadrada positiva de la o o ı ı o varianza.4. que es la desviaci´ n t´pica. 2 2 2 Si tenemos k grupos con tama˜ os n1 .3.22) 2. n ¯ ¯ ¯ entonces se puede definir la varianza total como: s2 = T donde ¯ ∑i ni Si2 ∑ j n j (x j − xT ) + . Sea o Yi = Xi + k.24) σx = 2. Desviaci´ n t´pica muestral o ı n−1 (2. La Desviaci´ n Media o ∑n (Xi − µ )2 i=1 . ∑i ni ∑j nj 2 (2.3.. n (2... . la varianza queda multiplicada por el o cuadrado de esa constante. m´ s dispersos estar´ n los datos.20) 2 2 2 Propiedad distributiva: S(X+Y ) = SX + SY . a a Sx = ¯ ∑n (xi − x)2 i=1 . Si Yi = Xi · k. x2 . nk . Desviaci´ n t´pica poblacional o ı N Es la otra posibilidad para conocer la variabilidad de los datos en la distribuci´ n de frecuencias sin tener que o elebar al cuadrado la diferencia de datos respecto de la media: dM = ¯ ∑i (xi − x) . S2 .... entonces 2 SY = ¯ ¯ ¯ ¯ ∑(Xi · k − X · k)2 ∑[k · (Xi − X)]2 ∑[k2 · (Xi − X)2 ] ∑(Yi − Y )2 2 = = = = k 2 · SX n n n n (2. Sk ). La desviaci´ n t´pica nos informa sobre la dispersi´ n de los datos respecto al valor de la media. .25) Ejercicio: Calcule todas la medidas de variabilidad definiddas para todas las situaciones y conjunto de datos anteriores.Propiedades 2 La varianza es siempre positiva o 0: SX ≥ 0. Si a los datos de la distribuci´ n les sumamos una cantidad constante la varianza no se modifica. y con medias y varianzas conocidas (x1 . entonces 2 SY = ¯ ¯ ¯ ¯ ∑[(Xi + k) − (X + k)]2 ∑(Xi + k − X − k)2 ∑(Xi − X)2 ∑(Yi − Y )2 2 = = = = SX n n n n (2.. La Desviaci´ n Est´ ndar o a La varianza a veces no se interpreta claramente ya que se mide en unidades cuadr´ ticas. . xk ) y (S1 . ∑i ni (2. Para evitar ese problema a se define otra medida de dispersi´ n.21) xT = ¯ ¯ ∑i ni xi .23) (2. cuanto o ı mayor sea su valor.3. 27 ..19) Si a los datos de la distribuci´ n les multiplicamos una constante.

o La expresi´ n se resuelve promediando el producto de las puntuaciones diferenciales por su tama˜ o muestral (n o n pares de puntuaciones.26) Este tipo de estad´stico puede utilizarse para medir el grado de relaci´ n de dos variables si ambas utilizan una ı o escala de medida a nivel de intervalo/raz´ n (variables cuantitativas). La formulaci´ n cl´ sica. Recta de regresi´ creciente. refleja la relaci´ n lineal que existe entre ı o dos variables.3. Este estad´stico. (2. solo es posible o ver la tendencia. o La formula suele aparecer expresada como: ¯ ¯ ∑n xi yi ∑n (Xi − X)(Yi − Y ) ˆ Sxy = i=1 = i=1 . Covarianza La covarianza entre dos variables es un estad´stico resumen indicador de si las puntuaciones est´ n relacionadas ı a entre s´.5. Coeficiente de Correlaci´ n de Pearson o El coeficiente de correlaci´ n de Pearson. se puede evaluar mediante cualquiera de las dos expresiones siguientes: r= ∑ xi yi n ∑ x2 i n − xy ¯¯ − x−2 ∑ y2 i n . Se tiene que  > 0. o o  Sxy = = 0.6. n−1 n−1 (2. Si se obtiene sobre una muestra.30) 28 . El resultado num´ rico fluctua entre los rangos de +infinito a -infinito. n − 1 en su forma insesgada).28) Teniendo en cuenta el valor de la covarianza y las varianzas. Correlaci´ n inversa.29) r= n ∑ xi yi − ∑ xi ∑ yi n ∑ x2 − (∑ xi )2 i n ∑ y2 − (∑ yi )2 i (2. se simboliza por la letra griega sigma (σxy ) cuando ha sido calculada en la ı o a poblaci´ n.2. Propiedades −∞ ≤ Sxy ≤ +∞. r. ı ı r= Vxy = VxVy Sxy 2 2 Sx Sy = Sxy .27) 2. se designa por la letra “sxy ”. Recta de regresi´ n decreciente. nos permite saber si el ajuste de la nube de puntos a la recta de regreo si´ n obtenida es satisfactorio. − y−2 .3. o o (2. Correlaci´ n directa. Se define como el cociente entre la covarianza y el producto de las desviaciones o t´picas (ra´z cuadrada de las varianzas). o   < 0. No hay correlaci´ n. Sx Sy (2. Al no tener unos l´mites e ı establecidos no puede determinarse el grado de relaci´ n lineal que existe entre las dos variables.

no hay correlaci´ n lineal entre las variables. No se puede trazar una recta de regresi´ n.8: El coeficiente de correlaci´ n de Pearson establece la posibilidad de un ajuste de los puntos en la o muestra. o a Figura 2. La nube de puntos est´ muy o o a dispersa o bien no forma una l´nea recta. 2. ı Para medir el nivel de asimetr´a se utiliza el llamado Coeficiente de Asimetr´a de Fisher. (2. presenta valores entre -1 y +1. hay una buena correlaci´ n positiva entre las variables seg´ n un modelo lineal o u y la recta de regresi´ n que se determine tendr´ pendiente positiva. g < 0 (distribuci´ n asim´ trica negativa. ı o Cuando r es cercano a +1. o a a Cuando r es cercano a -1. existe la misma concentraci´ n de valores a la derecha y a la izquierda de la o e o media). r. 29 .7. o Cuando r es pr´ ximo a 0. existe mayor concentraci´ n de valores a la izquierda de la media o e o que a su derecha).31) Los resultados pueden ser los siguientes: g = 0 (distribuci´ n sim´ trica. g > 0 (distribuci´ n asim´ trica positiva.3. existe mayor concentraci´ n de valores a la derecha de la media o e o que a su izquierda).Propiedades El coeficiente de correlaci´ n. Coeficientes de asimetr´a y curtosis ı Asimetr´a ı Hemos comentado que el concepto de asimetr´a se refiere a si la curva que forman los valores de la serie preı senta la misma forma a izquierda y derecha de un valor central. que viene definido: ı g= ¯ ∑i (xi −x)3 n ¯ ∑i (xi −x)2 n 3/2 . hay una buena correlaci´ n negativa entre las variables seg´ n un modelo lineal o u y la recta de regresi´ n que se determine tendr´ pendiente negativa: es decreciente. ser´ creciente.

Distribuci´ n platic´ rtica: presenta un reducido grado de concentraci´ n alrededor de los valores centrales o u o de la variable.32) Los resultados pueden ser los siguientes: k = 0 (distribuci´ n mesoc´ rtica).4. El Coeficiente de Curtosis viene definido por la siguiente f´ rmula: o k= ¯ ∑i (xi −x)4 n ¯ ∑i (xi −x)2 n 2 −3 (2. 3. Curtosis El Coeficiente de Curtosis analiza el grado de concentraci´ n que presentan los valores alrededor de la zona o central de la distribuci´ n. 2. Teorema que envuelven cuestiones sobre la Desviaci´ n Est´ ndar o a La desviaci´ n est´ ndar de una data es una cantidad importante debido a que limita el n´ mero de valores que o a u pueden ser encontrados en alguna determinada regi´ n de la distribuci´ respecto del promedio. a 2. Distribuci´ n mesoc´ rtica: presenta un grado de concentraci´ n medio alrededor de los valores centrales o u o de la variable (el mismo que presenta una distribuci´ n normal). Identifique los tipos de gr´ ficas que sean. o o 30 . o u k < 0 (distribuci´ n platic´ rtica). o u k > 0 (distribuci´ n leptoc´ rtica ).Figura 2.9: Distintas posibilidades de la forma del histograma en relaci´ n con el valor num´ rico de el coeficiente o e de Fisher. o Distribuci´ n leptoc´ rtica : presenta un elevado grado de concentraci´ n alrededor de los valores centrales o u o de la variable. o u Ejercicio: Calcule los valores de los coeficientes de simetr´a de Fisher y de Curtosis para todas las situaciones ı y conjunto de datos anteriores. o Se definen 3 tipos de distribuciones seg´ n su grado de curtosis: u 1.

¯ ¯ aproximadamente el 95 % de los datos se encuentran a dos desviaci´ n est´ ndar de la media.1. 2. podemos caracterizar su distribuci´ n de frecuencias mediante algunos valores num´ ricos.5.4. La regla emp´rica ı Aplica s´ lo cuando la distribuci´ n de datos es del tipo campana. ı Ejercicio: Haga uso de los teoremas anteriores sobre la desviaci´ n est´ ndar para hacer un an´ lisis de las o a a distribuciones de las situaciones y conjunto de datos anteriores. En vez de manejar todos o los datos sobre las variables. Pero estas medidas de posici´ n de una distribuci´ n de frecuencias o o han de cumplir determinadas condiciones para que sean verdaderamente representativas de la variable a la que 31 . es decir en o a ¯ el intervalo [x − 2σ . es decir en o a el intervalo [x − 3σ . Teorema de Chebychev Aplica a cualquier tipo de data. ¯ aproximadamente el 99 % de los datos se encuentran a tres desviaci´ n est´ ndar de la media.Figura 2.2.10: Distintas posibilidades de la forma del histograma en relaci´ n con el valor num´ rico de el coefio e ciente de curtosis. es decir en o a el intervalo [x − σ . Se trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. x + σ ]. a ı Nota: el teorema de Chebychev establece s´ lo los l´mites inferiores para wen los cuales se encuentra una detero ı minada cantidad de datos. 2. x + 3σ ] ¯ ¯ 2. incluye como un elemento de importancia la ubicaci´ n de estos dentro de un o o ´ contexto de valores posible. tarea que puede ser pesada. La descripo o ci´ n de un conjunto de datos. Estavlece que la porci´ n de valores que deben estar a k-desviaciones de la media o est´ como m´nimo a 1 − k12 . y establec que: o o Aproximadamente el 68 % de los datos se encuentran a una desviaci´ n est´ ndar de la media.4. Medidas de Posici´ n o Las medidas de posici´ n nos facilitan informaci´ n sobre la serie de datos que estamos analizando. eligiendo como resumen de los datos un valor alrededor del cual se encuene tran distribuidos los valores de la variable. mientras que la regla emp´rica si que da buenas aproximaciones. x + 2σ ].

Q3 . Deciles Los deciles son ciertos n´ meros que dividen la sucesi´ n de datos ordenados en diez partes porcentualmente u o iguales.. fk para k = 1. Los deciles se denotan D1 . Como los cuartiles adquieren su mayor importancia cuando contamos un n´ mero grande de datos y tenemos en u cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. Cuartiles Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. Q2 . D9 . es el valor en el cual o por debajo del cual queda un cuarto (25 %) de todos los valores de la sucesi´ n o (ordenada). 32 . son ampliamente utilizados. que se leen primer decil.5. siendo unica para cada distribuci´ n de frecuencias y siendo o ´ o siempre calculable y de f´ cil obtenci´ n.. Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil). 2. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales.5. 2. segundo decil. c = Longitud del intervalo de la clase del cuartil k.1.2. son tambi´ n e un caso particular de los percentiles. El segundo cuartil es precisamente la mediana.resumen. fk = Frecuencia de la clase del cuartil k. es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75 %) de los datos. u Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k. 3 (2. Hay tres cuartiles denotados usualmente Q1 . etc. ı n = N´ mero de datos. como lo son: ı Cuartiles: Hay 3 cuartiles que dividen a una distribuci´ n en 4 partes iguales: primero. Los deciles.. El primer cuartil.. La f´ rmula para el o c´ lculo de los cuartiles cuando se trata de datos agrupados es la siguiente: a Qk = Lk + donde: Lk = L´mite real inferior de la clase del cuartil k. segundo y tecer o cuartil. A continuaci´ n se describen las medidas de posici´ n m´ s comunes a o o o a utilizadas en estad´stica. D2 . k n 4 − Fk c. Toda s´ntesis de una distribuci´ n se considerara como operativa si intervienen en su determinaci´ n ı o o todos y cada uno de los valores de la distribuci´ n. el tercer cuartil.33) 2. Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero al noventa y nueve percentil). al igual que los cuartiles.

Centiles o percentiles Los percentiles son.6. Se realiza un estudio sobre el n´ mero de d´as que un ı u ı paciente sufre mejor´a con el anterior medicamento obteniendo la tabla: ı 33 .. 2. las medidas m´ s utilizadas para prop´ sitos de ubicaci´ n o clasificaci´ n de las pera o o o sonas cuando atienden caracter´sticas tales como peso. 99 (2. 9 (2. para k = 1. Los percentiles (P1 . durante 5 d´as a un grupo de pacientes... todos ellos padecen de jaqueca cr´ nica ı o (se despiertan todos los d´as con dolor de cabeza). .. ı n = N´ mero de datos. se calculan mediante la f´ rmula: a o Pk = Lk + k n 100 fk − Fk c. estatura. En cada uno de o los problemas pudiera usarse todo lo reflejado en estas notas. le´dos primer percentil..35) donde: Lk = L´mite real inferior de la clase del decil k. ı Cuando los datos est´ n agrupados en una tabla de frecuencias.. as´ como tambi´ n cualquier herramienta compuı e tacional o tecnol´ gica disponible.. 2. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. P99 ).. . percentil 99.. ı Los percentiles son ciertos n´ meros que dividen la sucesi´ n de datos ordenados en cien partes porcentualmente u o iguales. Problemas de final de cap´tulo ı A continuaci´ n una serie de problemas de repaso y estudio para fijar los conceptos anteriores. c = Longitud del intervalo de la clase del decil k.. tal vez. los diez deciles y algunos de los centiles para todas las situaciones y conjunto de datos anteriores. ı n = N´ mero de datos. En un centro hospitalario de la provincia de Sevilla se ha tratado.. para k = 1. c = Longitud del intervalo de la clase del decil k. fk = Frecuencia de la clase del decil k. o 1.34) donde: Lk = L´mite real inferior de la clase del decil k. 2. 2. con un nuevo medicamento llamado SINDOLORCABEZON. P2 ... u Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.3. etc. Ejercicio: Calcule los valores de los tres cuartiles. fk = Frecuencia de la clase del decil k..Para datos agrupados los deciles se calculan mediante la f´ rmula. u Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.5. o Dk = Lk + k n 10 fk − Fk c.

2. indicar cu´ l ser´a el que mejor representar´a los datos. 8. 3. 5. encontr´ ndose recogido los datos en la siguiente o a tabla: Tiempo de reacci´ n Numero de pacientes o ´ 0-10 300 10-20 500 20-30 400 30-40 500 40-50 300 Se pide: (a) Escribir las f´ rmulas de las diferentes medias e indicar cu´ l de las tres te parece m´ s adecuada o a a para aplicar en este ejercicio (Razonadamente). relativas y sus correspondientes acumuladas. Hallar el n´ mero de pacientes a los que se le aplica este segundo medicamento. Las respuestas obtenidas han sido las siguientes: 1. 2. y Mediana). u (c) Estudiar la representatividad del tiempo medio de reacci´ n. (b) ¿Qu´ proporci´ n e o de hogares est´ compuesta por tres o menos personas? ¿Qu´ proporci´ n de individuos vive en hogares a e o con tres o menos miembros? (c) Dibuje el diagrama de barras de frecuencias y el diagrama en escalera. 3. 2. 4. 1. 3. (b) A todos los pacientes que tardan en reaccionar m´ s a de 35’ se le aplica el medicamento complementario PAQUENODUELA para acelerar los efectos de SINDOLORCABEZON. 3. 6. Se ha realizado una encuesta a 30 personas en la que se les pregunta el n´ mero de personas que conviven u en el domicilio habitualmente. Media arm´ nica. a ı Existen en el mercado junto con este dos productos m´ s PALACABEZA y SINJAQUECAHOY. 1. 2. 4. con una varianza de 200 y o 300 minutos2. 2. 3. 5. (a) Calcule la distribuci´ n de frecuencias de la variable o obteniendo las frecuencias absolutas. ¿Es representativo? ¿Por qu´ ? (d) El o e Gobierno est´ pensando en introducir un medicamento con las caracter´sticas de SINDOLORCABEZON. 5. (Contesta razoe a ı ı nadamente y con el mayor detalle posible). Media a e o geom´ trica. (e) Calcula el D3 . (c) ¿Por qu´ no calculamos el coeficiente ı ı e de variaci´ n para ver la representatividad de la media? (d) ¿Habr´a que hallarlo?. 3. 3. 2. 2. 7.Datos (xi ) 0 1 2 3 4 5 Frecuencias 100 250 300 500 450 2000 (a) Realizando el gr´ fico adecuado y hallando los promedios (Media aritm´ tica. (d) Agrupe por intervalos de amplitud 2 los valores de la variable. 3. Tenemos la siguiente informaci´ n sobre el gasto semanal en ocio de un grupo de estudiantes universitao rios. Q3 . o ı ı Seg´ n el criterio anterior que medicamento ser´a el que pasar´a a engrosar la lista de medicamentos de la u ı ı Seguridad Social. 5. 34 3. . El tiempo a medio de reacci´ n de cada uno de ellos es respectivamente 25 y 30 minutos. Moda. ¿Qu´ significados tienen? e A aquellos pacientes que sienten mejor´a todos los d´as del tratamiento se les realiza un estudio sobre ı ı el tiempo de reacci´ n del medicamento (en minutos). (b) Calcula tambi´ n el porcentaje de pacientes que sienten e mejor´a con el medicamento en todos los d´as del tratamiento. o ı P65 . Explica detalladamente que criterio de selecci´ n estad´stico podr´a aplicar el Gobierno. 6. 1. calcule su distribuci´ n de frecuencias o y represente el histograma correspondiente. 4. 4. 4.

12. (b) ¿Qu´ proporci´ n de sucursales tiene m´ s de 15 empleados? (c) Dibuje el diagrama de barras y el e o a diagrama en escalera correspondientes.16. 14. Para todo haga siempre un an´ lisis de los datos y los estimadores ı a calculados. 19. 15. Sea la distribuci´ n referida a beneficios anuales de 38 empresas madrile˜ as: o n 35 5. obteni´ ndose la siguiente distribuci´ n de o u ı ı e o frecuencias. (d) Agrupe en intervalos de amplitud 3 los valores de la variable.Nivel de gastos # de J´ venes o 0-5 4 5-10 11 10-15 16 15-20 22 20-25 8 25-30 6 (a) Calcule la distribuci´ n de frecuencias de la variable y las densidades de frecuencias. 12. (b) Represente gr´ ficamente la distribuci´ n a o de frecuencias mediante un histograma. 10. En un estudio sobre consumo de gasolina en una gran ciudad se eligi´ una muestra de 100 veh´culos o ı y se observ´ el n´ mero de litros que consum´an en un d´a. 12. coeficiente de correlaci´ n. 11. 15. 16. (b) Dibuje el o histograma de frecuencias. 10. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el n´ mero de emu pleados que hay en cada una de ellas para un estudio posterior. 11. (b) Desviaci´ n t´pica. 17.14. . mediana y moda. La siguiente distribuci´ n expresa el n´ mero de coches vendidos durante una semana por cada uno de los o u 50 concesionarios que una determinada firma tiene en Espa˜ a: n # de autos vendidos # de Concesionarios 1 5 3 12 4 20 6 8 10 5 Se pide: (a) Media aritm´ tica. 13. 6. 7. adem´ s. 16. 12. 11. 12. 12. coee o ı o ficiente de variaci´ n de Pearson. compruebe con o ı la forma del pol´gono de frecuencias. (c) Dibuje el pol´gono de frecuencias acumuladas. 11. calcule las densidades de frecuencia de cada intervalo y represente el histograma correspondiente. 12. 11. 12. 15. 12. 13. la amplitud de cada intervalo as´ como sus o a ı respectivas marcas de clase y las densidades de frecuencia.15. Las observaciones obtenidas han sido: 12. 17. 18. 13. 9. (c) Coeficientes de asimetr´a de Fisher y de Curtosis. relativas y sus correspondientes acumuladas. (e) Agrupe la variable en los intervalos que considere conveniente de amplitud variable. 13. ı 4. 13. (a) Calcule la distribuci´ n de o frecuencias de la variable obteniendo las frecuencias absolutas. 11. 14.16. 11. 18. 10. 15. 10. 11. 15. 16. calcule su distribuci´ n de frecuencias y represente su histograma y su pol´gono de frecuencias acumulao ı das. obteniendo. 11. 9. # de Litros # de Autom´ viles o 1-7 4 7-10 8 10-12 35 12-14 30 14-18 20 18-25 3 (a) Calcule la distribuci´ n de frecuencias. 11.

(e) Estudiar la forma de esta distribuci´ n. viene dada por la tabla siguiente: Importe (Euros) # de Veh´culos ı 0-60 10 60-80 20 80-120 40 120-240 10 Se pide: (a) Calcular el importe medio. (d) ¿Qu´ porcentaje del ı o e e total de acciones poseen los accionistas mayoritarios? (e) ¿Qu´ porcentaje de los accionistas minoritarios posee el 20 % del total de acciones? 36 .8. Beneficio (Miles de Euros) # de Empresas 230-280 5 280-330 7 330-580 14 580-630 9 630-780 3 Se pide: (a) Calcular el beneficio medio de estas 38 empresas madrile˜ as. (d) ¿Cu´ l es el importe m´ ximo pagado por las 60 reparaciones m´ s baratas? (e) Estudiar la a a a asimetr´a a partir del coeficiente de asimetr´a de Fisher. ı ı Una empresa ten´a a finales de 2003 mil seiscientos cincuenta accionistas distribuidos de la siguiente ı forma: # de acciones # de accionistas 0-20 1030 20-60 380 60-100 180 100-500 50 500-1000 10 Se pide: (a) Hallar el n´ mero medio de acciones por accionista y su desviaci´ n t´pica. (b) ¿Cu´ l es el beneficio mayor n a de la mitad de las empresas m´ s modestas? (c) Determinar el beneficio m´ s frecuente. (d) Estudiar la a a dispersi´ n de esta distribuci´ n a partir del recorrido intercuart´lico. o o La distribuci´ n del importe de las facturas por reparaci´ n de carrocer´a de una muestra de 80 veh´culos o o ı ı en un taller. con base estad´stica. el grado de concentraci´ n de las acciones. (f) Estudiar la curtosis. (c) ¿Qu´ interpretaci´ n tienen en este caso los deciles? Calcular el a e o tercer decil. (b) Hallar la meu o ı diana. 9. (c) Decida. desviaci´ n t´pica y coeficiente de o o ı o ı variaci´ n de Pearson. (b) Calcular el importe mediano y el importe m´ s frecuente. Estudiar la representatividad de esta media.

una dimensi´ n a o o grande en la muestra de los caparazones pudiera corresponder a caracoles o moluscos m´ s pesados. a partir de la funci´ n que relaciona dichas variables. tener una relaci´ n entre muchos datos de los que se estuı ´ o dian para una situaci´ n dada. a trav´ s de una funci´ n. ı a a ´ 3.Cap´tulo 3 ı ´ ´ Metodos cuantitativos de analisis ´ predictivo. El presente a a e o a cap´tulo est´ dedicado a estas cuestiones. en un caso sencillo. por su puesto. sin embargo. toma datos de los pesos y las dimensiones del caparaz´ n de o dichos moluscos. como veremos util para resolver muchos problemas. una descripci´ n de la o o poblaci´ n de estudio y/o catalogar especies en t´ rminos de sus caracter´sticas.1. que pudieramos o e ı tener tambi´ n una relaci´ n entre ambas variables o caracter´sticas que no sea funcional. uno esa ı tar´a tentado a decir que el tama˜ o del caparaz´ n est´ relacionado con el peso del molusco. Para dicho estudio ı o digamos que el investigador.2. Esto ser´ . o en otras palabras m´ s t´ cnicas. que para la poblaci´ n de estudio. en el sentido estricto estad´stico. e o ı no nos interesaremos por ese tipo de relaciones. algunas veces es posible emparentar. As´ que desde luego. Como usted podr´ inferir. es muy posible. Estamos interesado en las relaciones que se pueden hacer cu´ ndo una o m´ s variables estan emparentadas a trav´ s de alguna(s) funci´ n(es) matem´ ticas. ı Como veremos m´ s adelante. regresion 3. Esto. Por ejemplo. Si este fuera el ı e o ´ caso entonces uno pudiera inferir. Hay que advertir. como primer paso. o mejor dicho. As´. Correlaci´ n y regresi´ n o o En f´sica como en otras areas es importante a veces. el conjunto o a ı de los pares de valores correspondientes a cada individuo se denomina distribuci´ n bidimensional. relacionar a a e ambas caracter´sticas de alguna manera funcional. o 37 . digamos que alguien est´ interesado un peque˜ o o a n problema para estudiar una cierta caracter´stica en unos moluscos muy raros con caparaz´ n. ı n o a es una supusici´ n ya que podr´a haber resultados para los cuales esto no sea cierto. Distribuciones bidimensionales Cuando sobre una poblaci´ n estudiamos simult´ neamente los valores de dos variables estad´sticas. como o ı ´ ı siempre todo debe tomarse supuesto. es posible.

1: Ejemplo de de un diagrama de dispersi´ n o nube de puntos. La recta se denomina recta de regresi´ n.10). es decir.Por ejemplo: Las notas de 10 alumnos en Matem´ ticas y en F´sica vienen dadas en la siguiente tabla: a ı F´sica ı Matem´ ticas a 4 4 10 4 10 10 12 12 12 10 14 14 14 10 16 16 18 14 16 20 Los pares de valores (4.14). Aqu´ nos limitaremos a ver si los puntos se distribuyen alrededor de una recta.4).(18. forman la distribuci´ n bidimensional. El gr´ fico obtenido recibe el nombre de nube de puntos o diagrama de a dispersi´ n..(10. saber si lo es) es representar los o pares de valores en el plano cartesiano.20).. si los cambios en una de ellas influyen en los valores o de la otra. o o Hablaremos de correlaci´ n lineal fuerte cuando la nube se parezca mucho a una recta y ser´ cada vez m´ s d´ bil o a a e (o menos fuerte) cuando la nube vaya desparram´ ndose con respecto a la recta. o Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. La idea de la correlaci´ n o Es frecuente que estudiemos sobre una misma poblaci´ n los valores de dos variables estad´sticas distintas. a 38 .3.(10. a o En el ejemplo anterior parece que hay cierta tendencia a que cuanto mejor es la nota en F´sica. a La primera forma de describir una distribuci´ n bidimensional (y por tanto. o Figura 3. con o ı el fin de ver si existe alguna relaci´ n entre ellas. Si as´ ocurre diremos que hay ı ı correlaci´ n lineal. o 3. mejor es la de ı Matem´ tica. Si ocurre esto decimos que las variables est´ n correlacionadas o bien que hay correlaci´ n entre ellas..(16..4).

2: Regresi´ n lineal: Los puntos tienden a describirse a partir de una recta que los representa aproximao damente a todos. o a Figura 3. la otra tiene tambi´ n o e tendencia a aumentar. En el gr´ fico observamos que en nuestro ejemplo la correlaci´ n es bastante fuerte. Se obtuvieron los datos que figuran en la siguiente tabla: 39 . Observa que hay a u una correlaci´ n muy fuerte (los puntos est´ n casi alineados) y negativa (la recta es decreciente). la otra tiene tendencia a disminuir. ya que la recta que hemos a o dibujado est´ pr´ xima a los puntos de la nube. como en el ejemplo anterior. Cuando la recta es decreciente la correlaci´ n es negativa o o inversa: al aumentar una variable. a o Cuando la recta es creciente la correlaci´ n es positiva o directa: al aumentar una variable. o e con fin de estudiar si esta variable estaba relacionada con la nota media obtenida. Por ejemplo: Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. Por ejemplo: A 12 alumnos de un centro se les pregunt´ a qu´ distancia estaba su residencia de la Universidad.Figura 3.3: Regresi´ n lineal: la cantidad de intentos a medida que aumenta hace que el n´ mero de error dismio u nuya. En la gr´ fica se describen el n´ mero de errores que corresponden a los intentos realizados.

no tiene nada que ver con el rendimiento acad´ mico la distancia del domicilio a la e Universidad. Teniamos que el coeficiente de o o o correlaci´ n de Pearson. Figura 3.1) = = Sx Sy VxVy S2 S2 x y Teniendo en cuenta el valor de la covarianza y las varianzas. (3.3.7 1 4.1 7. nos permite saber si el ajuste de la nube de puntos a la recta de regresi´ n obtenida o o es satisfactorio. Regresi´ n o o o 3.5 4.8 2.7 0.5 6.4 2. Se define como el cociente entre la covarianza y el producto de las desviaciones t´picas (ra´z ı ı cuadrada de las varianzas).2 3 8.4 9.1 4 0.Distancia (en Km) Nota media 0.2 5. Encontrando la relaci´ n. r. es decir.7 6.3 1.1 Observamos una nube de puntos que no nos sugiere ninguna recta concreta.1.4.3 0.05 8.4. El coeficiente de correlaci´ n S´ lo para recordar.1 0. porque la correlaci´ n es pr´ cticao a mente inexistente.6). se puede evaluar mediante cualquiera de las dos expresiones siguientes: r= ∑ xi yi n ∑ x2 i n − xy ¯¯ − x−2 ∑ y2 i n . o 3.2) r= n ∑ xi yi − ∑ xi ∑ yi n ∑ x2 − (∑ xi )2 i n ∑ y2 − (∑ yi )2 i (3. − y−2 . tenga en cuenta la lecci´ n aprendida en la secci´ n (2.5 3 7. (3.12 5. Vxy Sxy Sxy r= .4 0.3) El corefiente de correlaci´ n ten´a las siguientes propiedades muy interesantes: o ı 40 .4: Regresi´ n lineal: Al parecer n existe relaci´ n entre la distancia a la que se vive de la Universidad y o o la calificaci´ n que se obtiene.

El lector puede consultar a continuaci´ n una o ı ´ o discusi´ n del caso general de cuadrados m´nimos cuando el modelo es no lineal y los datos est´ n afectados de o ı a errores.4. hay una buena correlaci´ n negativa entre las variables seg´ n un modelo lineal o u y la recta de regresi´ n que se determine tendr´ pendiente negativa: es decreciente. ı o Cuando r es cercano a +1.4) χ 2 = ∑ [yi − (axi + b)]2 . o a 3. r.El coeficiente de correlaci´ n. o Surge de modo natural la pregunta: ¿cu´ l es la relaci´ n anal´tica que mejor se ajusta a nuestros datos? El m´ todo a o ı e de cuadrados m´nimos es un procedimiento general que nos permite responder esta pregunta. no hay correlaci´ n lineal entre las variables. o La dispersi´ n de los valores est´ asociada a la fluctuaci´ n de los valores de cada variable. hay una buena correlaci´ n positiva entre las variables seg´ n un modelo lineal o u y la recta de regresi´ n que se determine tendr´ pendiente positiva. A menudo nos confrontamos con situaciones en las que existe o suponemos a que existe una relaci´ n lineal entre las variables X e Y. No se puede trazar una recta de regresi´ n. La nube de puntos est´ muy o o a dispersa o bien no forma una l´nea recta.5) 41 . Figura 3.5: Regresi´ n lineal: Al parecer n existe relaci´ n entre la distancia a la que se vive de la Universidad y o o la calificaci´ n que se obtiene. i (3. el m´ todo de ajuste por cuadrados m´nimos se denomina tambi´ n m´ todo e ı e e de regresi´ n lineal. presenta valores entre -1 y +1.2. ser´ creciente. que representa el caso de inter´ s. Cuando la relaci´ n ı o entre las variables X e Y es lineal. El M´ todo de los M´nimos Cuadrados o e ı Hemos enfatizado sobre la importancia de las representaciones gr´ ficas y hemos visto la utilidad de las versiones a linealizadas de los gr´ ficos (X. e Es util definir la funci´ n χ 2 (Chi-cuadrado): ´ o (3. Observamos o supoo a o nemos una tendencia lineal entre las variables y nos preguntamos sobre cu´ l es la mejor recta: a y(x) = ax + b. o Cuando r es pr´ ximo a 0. Regresi´ n lineal.Y). o a a Cuando r es cercano a -1. En este cap´tulo discutiremos este ultimo caso.

4) minimizan la funci´ n χ 2 . el problema de minimizaci´ n se reduce al de resolver el par de ecuaciones: e o d 2 χ = 0. 42 . El criterio de m´nimos cuadrados reemplaza el juicio personal de quien mire los gr´ ficos y defina cu´ l es la ı a a mejor recta. este c´ lculo se realiza usando la herramienta regresi´ n a o lineal.8) d 2 χ = 0. Los par´ metros a y b pueden obtenerse usando t´ cnicas matem´ ticas que hacen uso del c´ lculo diferencial. da de donde resulta despu´ s de algunos c´ lculos e a a= b= N ∑ xi yi − ∑ xi ∑ yi . Los mejores valores de la pendiente a y la ordenada al origen b son aquellos que minimizan esta o desviaci´ n total. ecuaci´ n o o o (3. realizan el proceso de miı a a nimizaci´ n en forma autom´ tica y dan los resultados de los mejores valores de a y b. son los valores que remplazados en la ecuaci´ n (3. Los resultados en las ecuaciones anteriores se aplican en el caso lineal cuando todos los datos de la variable dependiente tienen la misma incertidumbre absoluta y la incertidumbre de la variable independiente se considera despreciable.. o sea. a e a a Aplicando estas t´ cnicas. o e o que es una medida de la desviaci´ n total de los valores observados yi respecto de los predichos por el modelo o lineal ax + b.Figura 3.5).7) (3. la mayor´a de los programas de an´ lisis de datos y planillas de c´ lculo. db (3. o sea los valores indicado o a por la ecuaciones anteriores. En los programas como Excel. Origin.ajuste lineal”.6) N ∑ x2 ∑ yi − ∑ xi ∑ xi yi i . etc. N ∑ x2 − (∑ xi )2 i (3.6: La curva de regresi´ n lineal en t´ rminos de los cambios de la funci´ n. N ∑ x2 − (∑ xi )2 i Actualmente.o .

Cuando r se aparta de estos extremos decimos que una expresi´ n lineal no es una buena descripci´ n de los datos. y)2 . escrito ahora equivalentemente como: r2 = Cov(x. viene dada por: 2 χN = 1 · χ 2. Por ejemplo. Si r es ±1 o pr´ ximo a estos valores. N ·Var(x) 2 χ N · ∑ x2 i .4).11) (3. conviene analizar el gr´ fico y buscar o o a una relaci´ n no-lineal que aproxime mejor la dependencia. Otro ejemplo es la obtenci´ n de la resistencia el´ ctrica R de un conductor. k ser´ precisamente la pendiente de la recta a que mejor se ajusta a los datos. y) = Var(x) = Var(y) = =< y2 >< y >2 . Las incertidumbres de los par´ metros a a a del ajuste vienen dadas por las expresiones: σa σb = = 2 χN . si deseamos determinar la constante el´ stica k de un resorte a partir de mediciones o a de fuerzas aplicadas Fi y estiramientos xi que le producen al resorte.15) 43 . En esta secci´ n s´ lo presentamos los resultados de utilidad m´ s frecuente en el laboratorio. tendr´amos r ∼ 0.10) (3. los pares de puntos (X. que denotaremos con los s´mbolos σa y o a a ı o o a σb .Y) tienen una relaci´ n tal que caen sobre un c´rculo.4). conocido como el valor de Chi-cuadrado por grado de libertad.13) (3. En este caso.9) (3. aunque ellos est´ n correlacionados. N −2 (3. el lector interesado podr´ encontrar un tratamiento m´ s exhaustivo en las referencias. si. si los pares (X. tambi´ n tendr´amos r ∼ 0. e ı Frecuentemente el resultado que deseamos determinar de nuestro experimento es alguno de los par´ metros de la a ecuaci´ n (3.12) Cov(x. − N N ∑ y2 ∑ yi i − N N 2 (3. por ejemplo. que o e deseamos determinar a partir de mediciones de tensi´ n Vi y la corriente que lo atraviesa Ii . es o util disponer de un modo de estimar las incertidumbres asociadas a la determinaci´ n de los par´ metros a y b de ´ o a la ecuaci´ n (3. N ·Var(x) (3. Desde luego. El valor de r var´a entre -1 y 1 como siempre. Var(x) ·Var(y) N ∑ xi yi − ∑ xi ∑ yi . N2 2 ∑ xi ∑ x2 i =< x2 >< x >2 . decimos que el modelo ı o lineal es adecuado para describir los datos experimentales. o La importancia del m´ todo de cuadrados m´nimos reside en el hecho que nos permite obtener valores de la e ı desviaci´ n est´ ndar o sea los errores asociados a los par´ metros a y b.14) 2 donde χN . Por consiguiente.Una medida de la calidad o bondad del ajuste realizado viene dado por el coeficiente de correlaci´ n de Pearson o entre las variables X e Y. Dado que r mide el grado de correlaci´ n lineal entre o o o ı los datos.Y) no tienen correlaci´ n alguna entre a ı o ellos.

a apenas. podr´a dea o ı venir en un coeficiente de. aun cuando los datos provengan de ı o fuentes ”limpias”que hayan producido datos con relativamente poca dispersi´ n. un modelo basado en las ecuaciones de la din´ mica dice que a 1 x = at 2 . de donde se ve claramente o a la proporcionalidad x ∼ t 2 que predice el modelo. que medimos x(t) a tiempos largos. Un gr´ fico de datos experimentales de Y = X con algo de dispersi´ n fortuita de los puntos. la consistencia con otros conjuntos de datos o sobre la base de consideraciones de simetr´a o concordancia con teor´as bien establecidas.99959. Sin embargo. Por ejemplo. ∑ x2 i . Esperamos que el movimiento sea uniformemente acelerau ´ do. Muchas veces la decisi´ n entre o o dos alternativas debe hacerse usando otros criterios. dif´cilmente demostrable a partir del gr´ fico de la Figura. En n o ocasiones lo dif´cil es establecer si existe correlaci´ n entre las variables. a lo que representa un 10 % de discrepancia entre los exponentes de la variable X. se obtiene la ecuaci´ n de la mejor recta y un coeficiente de correlaci´ n muy alto. por ejemplo. Entre los coeficientes hay una diferencia.998.Las incertidumbres de los par´ metros a y b tambi´ n pueden escribirse en t´ rminos del coeficiente de correlaci´ n a e e o r del siguiente modo: σa σb donde = = σa 1 a2 · 2 −1 . la diferencia de pendientes ser´ la que hay entre 1. 2 donde a es la aceleraci´ n. Pero en un gr´ fico log-log. ya que la mayor´a de las planillas de c´ lculo y programas de ajuste. 0. Hecho esto. ı a Evidentemente.995. por los regular indican los valores de los par´ metros a y b que mejor ajustan los datos y el a valor de r.1 y 1. N −2 r < x2 >. menor que el anterior.1 (variables sin correlaci´ n lineal) puede ı a a ajustarse por una recta y obtenerse a la vez un coeficiente de correlaci´ n lineal (inexistente) de. o 0. del 3 por mil. En la Figura est´ n los logaritmos de los mismos datos. N (3. a o o r = 0. En la figura se ven los resultados. por ejemplo. Estos m´ todos de an´ lisis e a nos ense˜ an que los efectos de correlaci´ n pueden estar enmascarados por el efecto del ruido”de los datos. o 44 . el ajuste por un modelo lineal es a m´ s que tentador. Si los datos experimentales se analizan sobre el gr´ fico de escalas lineales.16) (3. Menos aun si s´ lo evaluamos el coeficiente de correlaci´ n del ajuste a o o o lineal que propondr´amos a partir de este gr´ fico. ı ı Por ejemplo: Imaginemos un experimento donde se mide la distancia que recorre un m´ vil sobre una l´nea o ı recta mientras una fuerza constante act´ a sobre el.0. Un gr´ fico de Y = X 1. Precausiones en el an´ lisis a No siempre es suficiente admitir que dos variables siguen una relaci´ n lineal gui´ ndonos por lo que muestra o a un gr´ fico de los datos en escalas lineales.18) ı a Estas expresiones son de mucha utilidad para estimar σa y σb .17) < x2 >= (3. el uso de una aproximaci´ n lineal no es buena en este problema y el mero juicio del valor del o coeficiente de correlaci´ n no es suficiente. Supongamos que el cuerpo parte del reposo.

de donde ı o o se deduce que la relaci´ n no es lineal sino cuadr´ tica. dado que el coeficiente de correlaci´ n lineal es o muy cercano a la unidad. (a) o A tiempos largos no se aprecia bien la curvatura de la curva y. (b) log(x) en funci´ n de log(t).7: Representaci´ n de x(t) para un cuerpo que se mueve con movimiento uniformemente acelerado. o a 45 . podr´a suponerse que la correlaci´ n es lineal.Figura 3.

Cap´tulo 4 ı

´ Analisis Combinatorio

4.1. Introducci´ n o
En ocasiones el trabajo de enumerar los posibles sucesos que ocurren en una situaci´ n dada se convierte en algo o dif´cil de lograr o, simplemente, tedioso. El an´ lisis combinatorio, o c´ lculo combinatorio, permite enumerar ı a a tales casos o sucesos y as´ obtener la probabilidad de eventos m´ s complejos. ı a En el caso de que existan m´ s de un suceso a observar, habr´a que contar el n´ mero de veces que pueden ocurrir a ı u todos los sucesos que se desean observar, para ello se utiliza el principio fundamental de conteo: Si un suceso se puede presentar de n1 formas, y otro se puede presentar de n2 formas, entonces el n´ mero de u formas en que ambos sucesos pueden presentarse en ese orden es de n1 n2 . En otras palabras, basta multiplicar el n´ mero de formas en que se pueden presentar cada uno de los sucesos a u observar. Este principio nos remite autom´ ticamente al factorial de un n´ mero natural, que se puede pensar como una a u funci´ n con dominio los n´ meros naturales junto con el cero y codominio los n´ meros naturales. El factorial de o u u un n´ mero n, denotado n!, se define como: u n! = n.(n − 1).(n − 2)..,2,1, = 1, si n = 0. si n > 0, (4.1)

Ahora, n es muy grande el proceso de c´ lculo se vuelve tedioso y muy cargado, incluso para una computadora, a por lo que se utiliza la aproximaci´ n de Stirling a n!: o n! ∼ √ 2n+1 2π n 2 e−n . (4.2) 46

donde e ∼ 2,71828..., que es la base de los logaritmos neperianos. En el an´ lisis combinatorio se definen las permutaciones, con o sin repetici´ n, y las combinaciones. a o

4.2. Permutaciones (u ordenaciones) con repetici´ n o
Las permutaciones son tambi´ n conocidas como ordenaciones, y de hecho toman este nombre porque son ordee r naciones de r objetos de n dados. En este curso las representaremos como Pn . Ejemplo: Sea A = {a, b, c, d}, ¿cu´ ntas ”palabras”de dos letras se pueden obtener?. Se pide formar pera mutaciones u ordenaciones de 2 letras, cuando el total de letras es 4. En este caso r = 2 y n = 4. Las ”palabras”formadas son: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd, da, db, dc, dd. En total son 16. En general, si se toman r objetos de n, la cantidad de permutaciones u ordenaciones con repetici´ n obtenidas o son: r (4.3) Pn = nr .

4.3. Permutaciones (u ordenaciones) sin repetici´ n o
En este caso, a diferencia del anterior, se realizan ordenaciones de r objetos de n dados atendiendo a la situaci´ n o de cada objeto en la ordenaci´ n. Su representaci´ n ser´ Pn . o o a r Ejemplo: Sea el mismo conjunto A = {a, b, c, d}, ¿cu´ ntas ordenaciones sin repetici´ n se pueden obtener? Lo a o que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12 en total. En general, si se toman r objetos de un total de n, la cantidad de permutaciones
r Pn =

n! . (n − r)!

(4.4)

4.4. Combinaciones
Es una selecci´ n de r objetos de n dados sin atender a la ordenaci´ n de los mismos. Es decir, es la obtenci´ n de o o o r subcojuntos, de r elementos cada uno, a partir de un conjunto inicial de n elementos. La denotaremos con Cn , n o k . ´ Ejemplo: Si tomamos el mismo conjunto A = {a, b, c, d}, ¿cu´ ntos subconjuntos de 2 elementos cada uno se a pueden obtener? Haci´ ndolos se obtienen: a,b, a,c, a,d, b,c, b,d, c,d. Son seis los subconjuntos. e

47

En general, si de n objetos dados se hacen combinaciones de r objetos cada una, el n´ mero de combinaciones u obtenidas son: n.(n − 1).(n − 1)...(n − r + 1) n n! r Cn = = = , (4.5) r! r!(n − r)! r o, que es lo mismo,
r Cn =

Pr n = n. r! r

(4.6)

4.5. An´ lisis y Metodolog´a propuesta para la resoluci´ n de problemas de Teor´a de a ı o ı conteo
Para resolver problemas b´ sicos y sencillos de teor´a de conteo basta con seguir el siguiente diagrama. a ı

Figura 4.1: Metodolog´a sencilla para la resoluci´ n de problemas. ı o

48

Cap´tulo 5 ı

Probabilidad

5.1. Introducci´ n: La probabilidad o
La palabra probabilidad no tiene una definici´ n consistente. De hecho, hay dos amplias categor´as de interpreo ı taciones de la probabilidad: los frecuentistas hablan de probabilidades s´ lo cuando se trata de experimentos o aleatorios bien definidos. La frecuencia relativa de ocurrencia del resultado de un experimento, cuando se repite el experimento, es una medida de la probabilidad de ese suceso aleatorio. Los bayesianos, no obstante, asignan las probabilidades a cualquier declaraci´ n, incluso cuando no implica un proceso aleatorio, como una manera o de representar su verosimilitud subjetiva. El estudio cient´fico de la probabilidad es un desarrollo moderno. Los juegos de azar muestran que ha habido un ı inter´ s en cuantificar las ideas de la probabilidad durante milenios, pero las descripciones matem´ ticas exactas e a de utilidad en estos problemas s´ lo surgieron mucho despu´ s. o e Seg´ n Richard Jeffrey, “Antes de la mitad del siglo XVII, el t´ rmino ’probable’ (en lat´n probable) significaba u e ı aprobable, y se aplicaba en ese sentido, un´vocamente, a la opini´ n y a la acci´ n. Una acci´ n u opini´ n probable ı o o o o era una que las personas sensatas emprender´an o mantendr´an, en las circunstancias.” [Ve´ se: Jeffrey, R.C., ı ı a Probability and the Art of Judgment, Cambridge University Press. (1992). pp. 54-55. ISBN 0-521-39459-7]. Dos aplicaciones principales de la teor´a de la probabilidad en el d´a a d´a son en el an´ lisis de riesgo y en ı ı ı a el comercio de los mercados de materias primas. Los gobiernos normalmente aplican m´ todos probabil´sticos e ı en regulaci´ n ambiental donde se les llama “an´ lisis de v´as de dispersi´ n”, y a menudo miden el bienestar o a ı o usando m´ todos que son estoc´ sticos por naturaleza, y escogen qu´ proyectos emprender bas´ ndose en an´ lisis e a e a a estad´sticos de su probable efecto en la poblaci´ n como un conjunto. No es correcto decir que la estad´stica ı o ı est´ incluida en el propio modelado, ya que t´picamente los an´ lisis de riesgo son para una unica vez y por lo a ı a ´ tanto requieren m´ s modelos de probabilidad fundamentales, por ej. “la probabilidad de otro 11-S”. Una ley de a n´ meros peque˜ os tiende a aplicarse a todas aquellas elecciones y percepciones del efecto de estas elecciones, u n lo que hace de las medidas probabil´sticas un tema pol´tico. ı ı

49

si uno mira la primera carta y la reemplaza. Se puede decir razonablemente que el descubrimiento de m´ todos rigurosos para calcular y combinar los c´ lcue a los de probabilidad ha tenido un profundo efecto en la sociedad moderna. En el caso de una ruleta. Un c´ lculo por o o ı a un mercado de materias primas en que la guerra es m´ s probable en contra de menos probable probablemente a env´a los precios hacia arriba o hacia abajo e indica a otros comerciantes esa opini´ n. donde el sistema determin´stico en o ı e ı principio. lo que le da una gran importancia a las descripciones probae ˜ bil´sticas. entonces la probabilidad es o bien 100 % o 0 %. Sin embargo. Mucha gente ı a e ı e hoy en d´a confunde el hecho de que la mec´ nica cu´ ntica se describe a trav´ s de distribuciones de probabilidad ı a a con la suposici´ n de que es por ello un proceso aleatorio. como los autom´ viles y la electr´ nica de consumo. o o ı ı Otra aplicaci´ n significativa de la teor´a de la probabilidad en el d´a a d´a es en la fiabilidad. utilizan la teor´a de la fiabilidad en el dise˜ o del o o ı n producto para reducir la probabilidad de aver´a. debido al principio de indeterminaci´ n de Heisenberg. s´ lo puede ser descrita actuala a o o mente a trav´ s de distribuciones de probabilidad. en la pol´tica. No obstante hoy en d´a no existe un medio mejor para describir la f´sica cu´ ntica si no es a trav´ s de la teor´a de la probabilidad. esto tambi´ n supone el conocimiento de la inercia u a a e y la fricci´ n de la ruleta. es tan complejo (con el n´ mero de mol´ culas t´picamente del orden de magnitud de la constante de u e ı o o ı Avogadro 6 × 1023) que s´ lo la descripci´ n estad´stica de sus propiedades es viable. no hay probabilidad si se conocen todas las condiciones. las variaciones en la velocidad de la mano duo rante el movimiento y as´ sucesivamente. Una descripci´ n probabil´stica puede entonces ser m´ s pr´ ctica que ı o ı a a la mec´ nica newtoniana para analizar el modelo de las salidas de lanzamientos repetidos de la ruleta. Por o consiguiente. o esto es. puede haber una probabilidad de 1 entre 52 de que la primera carta en un baraja de cartas es la J de diamantes. o ı o En un universo determinista. Por consiguiente. Albert Einstein coment´ estupendamente en una carta a Max Born: Jedenfalls bin ich A¼berzeugt. La f´sica moderna proporciona o o ı ejemplos importantes de situaciones determin´sticas donde s´ lo la descripci´ n probabil´stica es factible debido ı o o ı a informaci´ n incompleta y la complejidad de un sistema as´ como ejemplos de fen´ menos realmente aleatorios. Tambi´ n se puede decir que la probabilidad es la medida de nuestro grado de incertidumbre. Muchos bienes de o ı consumo.que producen un efecto domin´ en la econom´a en conjunto. ı o ˜ ı daβ der Alte nicht wA¼rfelt. Por consiguiente. especialmente en una democracia. La mec´ nica cu´ ntica. y la elecci´ n correcta puede ser hecha con precisi´ n por el que ve la carta. basado en los conceptos newtonianos. ı o a o y c´ mo contribuyen a la reputaci´ n y a las decisiones. La probabilidad de aver´a tambi´ n est´ estrechamente relacioı ı e a nada con la garant´a del producto. las proı o babilidades no se calculan independientemente y tampoco son necesariamente muy racionales. ı e Se puede decir que no existe una cosa llamada probabilidad. entonces el n´ mero donde la bola parar´ ser´ seguro. Naturalmente.Un buen ejemplo es el efecto de la probabilidad percibida de cualquier conflicto generalizado sobre los precios del petr´ leo en Oriente Medio . si la fuerza de la mano y el periodo de esta fuerza es conocido. el peso. La teor´a de las ı finanzas conductuales surgi´ para describir el efecto de este pensamiento de grupo en el precio. (Estoy convencido de que Dios no tira el dado). puede ser de alguna importancia para la mayor´a de los ciudadanos entender c´ mo se c´ lculan los pron´ sticos y las probabilidades. el grado de nuestra ignorancia dada una situaci´ n. lisura y redondez de la bola. cuando la mec´ nica cu´ ntica es probabil´stica no por o a a ı el hecho de que siga procesos aleatorios sino por el hecho de no poder determinar con precisi´ n sus par´ metros o a 50 . y o ı en la paz y en los conflictos. Los f´sia ı cos se encuentran con la misma situaci´ n en la teor´a cin´ tica de los gases.

sello} En el experimento de lanzar un dado.3 % a a (. 4. la probabilidad de obtener un royal flush en poker es 1:649740. sacar una carta de un mazo. (Tomado de wikipedia. Ejemplo: Lanzar un dado o una moneda. En otras palabras. 2. la medida de la probabiliudad es siempre una fracci´ n o decimal o indicando la porci´ n o porcetaje de la veces que un evento ocurre. La interpretaci´ n: Un 40 % de chance de que llueva significa que si nosotros miramos todos o los d´as con caracter´sticas similares. o busque “probabilidad”). La probabilidad La probabilidad es una medida de la posibilidad de que un “evento ocurra. un porcentaje de bateo de . de cada 100 veces que batea.2.313 significa que el jugado llegar´ a una base o har´ un hit en el 31. donde o ´ u equivale a una posibilidad nula de que el evento ocurra mientras que 1 representa el hecho de que evento va a ocurrir con toda seguridad. as´ podemos ı escribir: S = {cara. s´ lo 31 veces aproximadamente hace o un hit. A este conjunto de valores que puede tomar una variable se le denomina espacio muestral. 3. 6} Desde ahora definiremos evento como cualquier colecci´ n de resultados de un espacio de eventos o universo. Experimentos de Probabilidad Un experimento probabil´stico es cualquier proceso que produce un resultado o una observaci´ n y tiene por ı o finalidad de determinar posibilidades. es decir. escoger un nombre de varios revueltos en un vaso.313. Ejemplo: El universo de el experimento de lanzar una moneda tiene dos resultados: cara y sello. lo que imposibilita la creaci´ n de un sistema de ecuaciones determinista. se tienen 6 posibles resultados. Cuando se realiza un experimento.313) de todos los intentos al bateo. entonces a a quiz´ s tenga que esperar hasta 649740 manos para obtener uno.fundamentales. 1]. 5. 51 . se obtienen un conjunto de valores. la cantidad que la describe es siempre un n´ mero que se encuentra en un intervalo [0. 5. 40 de ellos ser´ n d´as ı ı ı a ı con lluvia. dram´ ticamente se tendr´ que si uno quiere obtener un royal flush en una partida de poker. a 5.3. pudiera cofeccionarse subconjuntos del universo de un evento y crear nuevos eventos. En vista de la caractrer´stica de ı esta medida. o Ejemplo: 40 % de chance de que llueva. entonces de cada 100 d´as con estas condiciones. as´: ı S = {1. o es decir. average de bateo de .

Los que siempre ocurren son los eventos seguros. por ejemplo. ocurren. no todos los resultados son al azar. Por esta raz´ n. uno podr´a definir dos nuevos eventos del universo ı tomando algunos que tienen una caracter´stica com´ n. 6}.Si existen m´ s de una variable. o Hay que hacer la observaci´ n que esta definici´ n habla en t´ rminos generales y no espec´ficamente sobre alg´ n o o e ı u experimento en particular. uno podr´a invenı ı ı tar nuevos eventos. que la ina tersecci´ n de ambos eventos es vac´a. As´ mismo podr´an confeccionarse eventos en el experimento de sacar una carta de un mazo. los resultados posibles de sacar un rey. y en cambio existen otros que nunca ocurren. si u ı el n´ mero mostrado es 1. . el rey de picas. Si existe este tipo de relaci´ n entre eventos se dice que son eventos dependientes o o 52 P = {Resultados pares} = {2. se llaman eventos mutuamente excluyentes. el espacio muestral est´ formado por las combinaciones de valores de cada una a a de las variables. Si tomamos un subconjunto cualquiera del espacio muestral tenemos lo que se denomina un evento. e Un evento E para un experimento se dice que ocurre si y s´ lo si el resultado de el experimento es uno de los o que pertenecen a E. Ejemplo: En el caso de el experimento de lanzar un dado. con excepci´ n del seguro o del imposible. A aquella variable que est´ asociada a un experimento de este tipo se le denomina variable aleatoria. en ocasiones un evento o m´ s eventos dependen de otro evento previo. entonces uno podr´a decir que el evento P ocurre. u entonces si al lanzar el dado el n´ mero mostrado es un 4. Si dos o m´ s a eventos no pueden ocurrir simult´ neamente. pues si un experimento es cualquier proceso entonces los resultados pueden tomar cualquier tipo de valor. 3. tiene cuatro resultados correspondientes con los cuatro reyes de los cuatro distintos tipos de dibujo que tienen las cartas. En cama bio. se define como experimento aleatorio al proceso o en el que se pueden predecir con certeza la ocurrencia de sus eventos. Ejemplo: Si P es el evento descrito anteriormente de obtener los n´ meros pares en el lanzamiento de un dado. o bien. 5}. entonces uno debe decir que el evento P no ocurre. 4. as´ ı u ı I = {Resultados impares} = {1. un evento A ocurre a dado que ocurri´ un evento B. no importa el n´ mero de experimentos o su situau ci´ n. ı Cuando hablamos de varios eventos dentro del mismo experimento se pueden dar varios casos. o ı Por otro lado. a un experimento no aleatorio se le denomina experimento determin´stico. es decir. existen eventos que siempre. el rey de espadas y el rey de tr´ boles. u Como se puede uno imaginar. Sin embargo. el rey de corazones. es decir. o y los que nunca son los eventos imposibles. y si este ´ consta de un solo elemento entonces es un evento elemental.

la frecuencia relativa de ocurrencia para cada evento tiende a un valor fijo. pero ı o ı a proporciona probabilidades aproximadas. en t´ rminos de probabilidad condicional. se tiene que 0 ≤ P(E) ≤ 1.4. 5. digamos 100 veces.4. ı Para calcular la probabilidad de esta manera podr´a usarse la siguiente f´ rmula: ı o P(E) = n´ mero de intentos en los que ocurre E u . Un evento E es llamado evento imposible si ocurre que P(E) = 0. As´ mismo tambi´ n se podr´a calcular la probabilidad de que un jugador de basketball anote una cesta libre de tablerocalculando el porcentaje de las veces que lo ha hecho en el pasado con estad´sticas anteriores. n´ mero de intentos totales u (5. si no existe tal relaci´ n entre eventos se dice que son eventos independientes. La probabilidad P(E) puede ser calculada de dos modos distintos. se echa mano de la regularidad estad´stica. uno podr´a calcular la probabilidad de obtener una suma de 7 cuando dos dados son lanzados muı ı e ı chas veces. Adem´ s.1) Ejemplo: Digamos que la siguiente tabla representa las notas que obtienen en un ex´ mnen en base a 100 a puntos un grupo de estudiantes: Notas Numero de estudiantes ´ 90-99 4 80-90 6 70-79 4 60-69 3 50-59 2 40-49 1 53 . Por ejemplo. a a e 5. es decir. y calculando que porcentaje de las veces sale 7. Precisamente. Algunas caracter´sticas exibe esta formulaci´ n: ı o Para un evento E. Por otro lado. ı o y que consiste en que al aumentar el n´ mero de repeticiones de un experimento en condiciones pr´ cticamente u a constantes. los a resultados son a posteriori. o La probabilidad de un evento E es denotada por P(E) y siempre representa la fracci´ n o porcentaje de ocurrencia de que E ocurra.1. que es la propiedad de los fen´ menos aleatorios. proporciona estimaciones y no valores reales.o condicionados (el evento A depende del evento B. Probabilidad Emp´rica ı Tambi´ n llamada la probabilidad frecuencial de un evento es el valor fijo al que tienden las frecuencias relae tivas de ocurrencia del evento de acuerdo a la regularidad estad´stica. Esta definici´ n ser´a la m´ s real. Calculando la probabilidad de un evento Para calcular la probabilidad de eventos es necesario que estos se comporten de una manera m´ s o menos esta´ a ble. Un evento E es llamado evento cierto si ocurre que P(E) = 1. o el resultado del evento A est´ condicionado al resultado a del evento B). Los o criterios de dependencia o de independencia se definir´ n m´ s adelante. pues se necesita realizar el experimento para poder obtenerlo.

Digamos que el evento que salga cara lo denotamos por A y a la de sello B. y se necesita como requisito indispensable. 2 En el caso del ejemplo en el que uno lanza un dado. Axiomas de la probabilidad Recordemos primero que las frecuencias relativas de una distribuci´ n ten´an las siguientes propiedades: o ı Las frecuencias relativas son mayores o iguales que cero. Si dos eventos son mutuamente excluyentes. entonces la frea cuencia relativa de su uni´ n es la suma de las frecuencias relativas de cada uno.Si el evento A es evento en el que un estudiante obtiene entre 90 y 99 puntos. que todos o a los eventos elementales tienen la misma probabilidad de ocurrir. Probabilidad cl´ sica a La probabilidad cl´ sica de un evento E. se define como el n´ mero de eventos a u elementales que componen al evento E.20. Ejemplo: Cuando se lanza una moneda. (5. que denotaremos por P(E). entre el n´ mero de eventos elementales que componen el espacio u muestral: n´ mero de eventos elementales que componen al evento E u P(E) = .4. o 54 . La frecuencia relativa del espacio muestral es igual a la unidad.2) n´ mero de eventos elementales que componen el espacio muestral u Es la definici´ n m´ s utilizada porque supone de antemano. entonces se tendr´ a 1 P(sale 1) = P(sale 5) = .2. 6 Note que para el c´ lculo de la probabilidad desde esta perspectiva cl´ sica no es necesario de ninguna manera a ´ a que se tenga que confeccionar y realizar el experimento. se obtienen dos resultados posibles: cara o sello. Vasta. 5. la probabilidad de sacar un ex´ men al azar y que sea una nota entre 90 y 99 puntos ser´ : a a P(A) = cantidad de estudiantes que obtienen notas entre 90 y 99 puntos 4 = = 0. es decir que no ocurren simult´ neamente. que uno tenga pleno conocimiento de el espacio muestral y sus respectivos resultados. La probabilidad de que salga una cara al lanzar la moneda ser´ a 1 P(A) = P(B) = P(cara) = P(sello) = . como se ve. por su puesto.5. cantidad total de estudiantes 20 5.

P(S) = 1. se tienen lo siguiente. 3. hablando en t´ rminos generales.. ∪ En ) = P Ei i=1 = ∑ P(Ei ). o Esto quiere decir que si la probabilidad de que un evento ocurra es p. si x p = . la probabilidad de que las dos monedas caigan 1 a cara es de 4 . En prino o o cipio pareciera l´ gico que uno pudiera definir la probabilidad en t´ rmino de las posibilidades de que un evento o e ocurra. Esto quiere decir si alguien apuesta a que las dos monedas no caen simult´ neamente en cara. 0. ´ a en el sentido matem´ tico de la palabra. En .. Por otro lado. son eventos mutuamente excluyentes. la posibilidad de ganar la apuesta es de 3 0. 5. “la posibilidad de que gane es de 3 a 1”. u Se le llama a E evento seguro a un evento cuando P(E) = 1. de acuerdo a la definici´ n ya expuesta. es decir. n Si E es un evento de un espacio muestral S y P(E) es la probabilidad de E. la posibilidad de que ocurra un evento se determina a mediante la raz´ n de la probabilidad de que ocurra a la probabilidad de que no ocurra.. se le llama evento imposible si P(E) = 0. sin embargo..25 1 1− 3 4 55 . entonces las posibilidades de que ocurra son x a y.4) y 1− p de tal manera que x y y son n´ meros enteros. La probabilidad del universo es la m´ xima.75 3 4 = = . i=1 n (5. Cuando uno habla de esa manera es inebitable pensar en que tal frase est´ ligada de alguna manera a razones..Tomando en cuenta que la probabilidad de un evento. 4. la palabra posibilidad proviene de referirse a ciertos juee gos de apuestas en las que se utiliza la frase: “la posibilidad de ganar es de x a y”. u Ejemplo: Si se tiran dos monedas normales (no trucadas). Efectivamente. La principal motivaci´ n de esta secci´ n es hacer una diferenciaci´ n de estas dos cosas. (5. es un n´ mero siempre entre 0 y 1. por ejemplo.. entonces n P(E1 ∪ E2 ∪ . E2 . entonces se satisfacen los axiomas de la probabilidad: 1. a Si E1 . La probabilidad de un evento E. 2. es la frecuencia o relativa cuando se aumenta el tama˜ o de la muestra. Posibilidades y probabilidades En los escrito anteriormente hemos utilizada indistintamente en algunos momentos las palabras posibilidad y probabilidad.3) Con estos axiomas podremos tratar algunas de las propiedades de la probabilidad de eventos.6. 0 ≤ P(E) ≤ 1.

Pero en el caso de eventos no eleo a mentales. entonces la probabilidad p de que ocurra tal evento es x . entonces se tiene que o p= 1 1 x = = = 0. (5. de paumente = 5 5 1 1 7 7 = . de no obtener un cuatro es de 6 a 1. Hemos de considerar que si es mayor la probabilidad de que no ocurra un evento. Ejemplo: Un crimin´ logo piensa que las posibilidades de que en la pr´ xima semana la cantidad de delitos o o en una ciudad aumente con respecto a la anterior es de 5 a 2. entonces los criterios 5 y dado que 7 + 1 = 27 (como son eventos mutuamente excluyentes) no es lo mismo que 4 28 del crimin´ logo pueden ser cuestionados. Si se desea saber si son consistentes las probabilidades correspondientes habr´a que hacer los c´ lculos.5) p= x+y Ejemplo: En la Copa Mundial de Futbol Francia 1998 se dec´a que el equipo mexicano ten´a una posibilidad ı ı de 1 a 75 de llegar a ser el campe´ n del torneo. esto es. pues a si la posibilidad de un evento es de x a y. o 5. que son los compuestos por m´ s de un evento elemental. entonces es f´ cil obtener su probabilidad. el proceder de manera an´ loga resulta muy a a 56 . sabemos que la probabilidad de obtener un cuatro es 6 .01311. medir la cono fiabilidad que tienen las opiniones de las personas sobre las posibilidades que le asignan a algunos eventos. de que sea la misma cantidad de delitos es de 1 a 3 y las posibilidades de que aumente la cantidad o sea la misma es de 7 a 4. 1 Ejemplo: Si se tira un dado no trucado. a pues basta con una contabilizaci´ n o el uso directo del c´ lculo combinatorio. y de que aumente o sea igual la cantidad de delitos es. Esto quiere decir que el c´ lculo de las probabilidades de dos eventos mutuamente excluyentes a partir de las a posibilidades otorgadas de manera subjetiva resulta como un criterio de consistencia. Propiedades de la probabilidad de eventos no elementales Cuando se tienen eventos elementales no existe mucho problema en el sentido del c´ lculo de las probabilidades. Las probabilidades de que ı a aumente la cantidad de delitos. la posibilidad de ganar la apuesta es de 3 a 1. que sea igual la cantidad de delitos. 5+2 7 1+3 4 7 + 4 11 7 11 . entonces se acostumbra mencionar las posibilidades en contra del evento. en combinaci´ n con el tercer axioma de la probabilidad. paumente = = . Esto tiene la ventaja de que permite.7. Si se desea encontrar la probabilidad de que el equipo mexicano o llegase a ser campe´ n. Inversamente. respectivamente. pero se acostumbra decir que las posibilidades en contra. x + y 1 + 75 76 es la probabilidad de que ocurriese el evento.es decir. es decir que la posibilidad de obtener un cuatro es de 1 a 6. pigual = = . en el caso de tener las posibilidades de un evento.

se llama probabilidad de B condicionada a A. Sean A y B dos sucesos tal que P(A) 0. entonces ¯ P(E) = 1 − P(E). si el caso es que los eventos sean mutuamente excluyentes se tiene: Propiedad 2.7) 3. la bola n´ mero 3 en la segunda extracci´ n es la misma que en la primera. Si E es un evento y E su complemento. la probabilidad de que ocurra B dado que ha sucedido A. Calculemos. Si dos eventos. la cual la podremos calcular de la siguiente manera: o 1. el valor de dicha probabilidad var´ en funci´ n del conoa a o cimiento de determinadas informaciones relativas a estos sucesos.8) 5. extraemos una bola y seguidamente la volvemos a introducir para realizar una segunda extracci´ n. la probabilidad 57 . son mutuamente excluyentes entonces la probabilidad de que ocurra A o B es igual a la suma de las probabilidades de ocurrencia de A y de B. Si A y B son dos eventos. por lo que no hay que confundir P(A|B) y P(B|A). Es decir P(A ∪ B) = P(A) + P(B). La probabilidad de que ocurra un evento A dado que ocurri´ el evento B (el evento A depende del o evento B) es: P(A ∩ B) . a la probabilidad de B tomando como espacio muestral A. ´ Veamos la probabilidad de una uni´ n de eventos. A y B. por o ejemplo.complejo y las operaciones pueden sobrepasar la capacidad de c´ lculo existente. la probabilidad de extraer. (5. la bola n´ mero 3 en la segunda ı u extracci´ n depender´ de la bola extra´da en primer lugar. (5. se podr´ n expresar las probabilidades de estos eventos a en t´ rminos de los eventos elementales que lo componen. que denotaremos como E: ¯ Propiedad 3. (5. menos la probabilidad de que ocurran A y B simult´ neamente. P(A ∪ B) = P(A) + P(B) − P(A ∩ B) (5.6) 2. Ejemplo: Si disponemos de una urna que contiene cuatro bolas numeradas del 1 al 4. o Ejemplo: Consideremos el experimento de “lanzar un dado al aire”. por ejemplo. P(B|A). es decir. siempre y cuando se conozcan las probabilidades de e estos. la probabilidad de que ocurra A o B es igual a la suma de las probabilidades de ocurrencia de A y de B. Otra propiedad que se deriva de las anteriores es cuando se busca la probabilidad del complemento de un ¯ evento E. o a ı o Definici´ n. Probabilidad condicionada En el c´ lculo de las probabilidades de algunos sucesos. situaci´ n que s´ ocurre con la probabilidad de uni´ n o la o ı o intersecci´ n de eventos. Propiedad 1. Sin embargo. por ejemplo.9) P(A|B) = P(B) Hay que notar que esta propiedad no es conmutativa. Ahora. utilizando los a axiomas de la probabilidad y las siguientes propiedades.8. Si realizamos el mismo prou o ceso sin reemplazar la bola extra´da la probabilidad de extraer. a Es decir.

P(A|B) = P(A)P(B). o. a Sea A1 . Definimos los sucesos A = {sacar 3} y B = {1. y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B|Ai ). 5}. Ai ∩ A j = φ . Teorema de Bayes En el a˜ o 1763. pero en otras no.13) 58 . (5. A2 . P(A|B) = 1/3. y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B|Ai ). Teorema de la probabilidad total Sea A1 .. si se modifica.11) P(B|A) = P(B). decimos que son dependientes entre s´.. el criterio para la independencia de eventos queda como sigue: Definici´ n. se public´ una memoria en la n n e o que aparece. ı Finalmente. + P(An)P(B|An ) (5. An que cumplen: Son incompatibles dos a dos.9.. (5. la probabilidad del suceso B... A2 .9. P(B) P(A1 )P(B|A1 ) + P(A2)P(B|A2 ) + . decimos que son independientes y.12) 5. puesto que si sabemos que ha salido un n´ mero impar. . en algunas ocasiones.10) 5. o El conocimiento de que ha ocurrido el suceso A modifica. 3. Dos eventos A y B son independientes si y s´ lo si o o P(A|B) = P(A). entonces la probabilidad P(Ai |B) viene dada por la expresi´ n: o P(Ai |B) = P(Ai )P(B|Ai ) P(Ai )P(B|Ai ) = . entonces la probabilidad del suceso B viene dada por la expresi´ n: o P(B) = P(A1 )P(B|A1 ) + P(A2 )P(B|A2 ) + . + P(An)P(B|An )... por vez primera.. Probabilidad total Llamamos sistema completo de sucesos a una familia de sucesos A1 . .de obtener un 3 sabiendo que ha salido un n´ mero impar. A2 . u entonces.1.10.... La uni´ n de todos ellos es el suceso seguro. los casos posibles ahora son 3 u y los casos favorables al suceso A s´ lo 1. lo que es lo mismo. Los sucesos en los que. (5. conociendo que uno ha ocurrido. An un sistema completo de sucesos. la determinaci´ n de la probabilidad de las causas a partir de los efectos que han o podido ser observados. no se modifica la probabilidad del otro. An un sistema completo de sucesos tales que la probabilidad de cada uno de ellos es distinta de cero. . tales que la probabilidad de cada uno de ellos es distinta de cero. El c´ lculo de dichas probabilidades recibe el nombre de teorema de Bayes.. dos a˜ os despu´ s de la muerte de Thomas Bayes (1702-1761).. n Ai = S. o i=1 5.

Se pide: (a) Calcular la probabilidad de que un motorista elegido al azar lleve casco. . la probabilidad de que se lesione un jugador es 0. 0. En el dado A hay tres “1” y tres “2” y en el dado B hay dos “1” y cuatro “2”. Al extraer de la caja dos bolas al azar sin reemplazamiento. de estos. ¿Cu´ l es la probabilidad de que a o ı a apruebe tambi´ n la pr´ ctica? e a En una baraja de 40 cartas.8 % y 2 %. ¿Cu´ l es la probabilidad de que a las dos sean de distinto n´ mero? (b) Y si se toman tres cartas. (a) Se toman dos cartas sin reemplazamiento. ¿Cu´ l es la probabilidad de que se haya elegido el dado B? a En una caja hay x bolas blancas y 1 bola roja. el 15 % de los cr´ ditos para industrias y e e el 70 % de los cr´ ditos para consumo. (b) Si se sabe que un jugador se ha lesionado. 8 medios. el 50 % para industrias y el 15 % para consumo e diverso. 8. respectivamente. u El 35 % de los cr´ ditos de un banco es para vivienda. u entre los dos equipos se re´ nen 6 defensas. ı el 60 % llevan habitualmente casco.055 si es defensa y 0 si es portero. o a 1000 unidades en la segunda y 2000 en la tercera. Con los jugadores de un club de f´ tbol se forman dos equipos para jugar un partido de entrenamiento. 10.6. Sabiendo que el porcentaje de unidades defectuosas producidas en cada planta es del 1 %. El entrenador sabe que u en estos partidos. (a) Calcular la probabilidad de que se lesione uno cualquiera de los jugadores en este partido. son mayores de 60 a˜ os. Problemas de final de cap´tulo ı A continuaci´ n una serie de problemas de repaso y estudio para fijar los conceptos anteriores.8 y la probabilidad de que apruebe ambas pruebas es 0. calcula la probabilidad de que al seleccionar una unidad al azar sea defectuosa. 3. determinar la probabilidad de que haya sido un defensa. el 30 % de los de B y el 15 % de los que se abstienen. mientras que de los no e 59 2.5. 7. 4. el 35 % vota al partido A. 9. 0. ¿Cu´ l es la probabilidad de que sea var´ n? a o En una ciudad. la probabilidad de que apruebe la o parte pr´ ctica es de 0. El porcentaje de mujeres que conducen habitualmente con casco es del 40 %. Calcula la probabilidad de que se pague un cr´ dito elegido al azar.11. (a) ¿Cu´ l es la probabilidad de obtener un “1”? (b) a Sabiendo que se ha obtenido un “2”. (a) ¿Son independientes a los sucesos aprobar la parte te´ rica y la parte pr´ ctica? (b) ¿Cu´ l es la probabilidad de que un alumno no o a a apruebe ninguno de los dos ex´ menes? (c) ¿Cu´ l es la probabilidad de que un alumno apruebe solamente a a uno de los dos ex´ menes? (d) Se sabe que un alumno aprob´ la teor´a. En cada uno de o los problemas pudiera usarse todo lo reflejado en estas notas. El 75 % de los ingenieros ocupan un puesto directivo y el 50 % de los economistas tambi´ n. e e El volumen de producci´ n en tres plantas diferentes de una f´ brica es de 500 unidades en la primera. Calcula el n´ mero de bolas blancas que debe tener la caja. o 1.22 si es delantero. (a) ¿Cu´ l es el Espacio Muestral? (b) ¿Cu´ l es la probabilidad de que la suma sea 4? a a (c) ¿Cu´ l es la suma m´ s probable? ¿Cu´ nto vale su probabilidad? a a a Tenemos dos dados A y B. as´ como tambi´ n cualquier herramienta compuı e tacional o tecnol´ gica disponible. 11. una te´ rica y otra pr´ ctica. Resultan fallidos el 20 % de los cr´ ditos para vivienda. ambos trucados. n Los alumnos de Primero de Biolog´a tienen que realizar dos pruebas. Se sabe adem´ s a que el 20 % de los votantes de A.5. La ı o a probabilidad de que un estudiante apruebe la parte te´ rica es de 0. dos “2” y un “3”. el 45 % vota al partido B y el resto se abstiene. 5. Lo tiramos dos veces consecutivas y anotamos la suma de los resultados. 6. El 20 % de los empleados de una empresa son ingenieros y otro 20 % son economistas. Se pide: (a) Hallar la probabilidad de que un ciudadano elegido al azar sea mayor de 60 a˜ os. (b) Se elige un motorista al azar y se observa que lleva casco. ¿Cu´ l es la probabilidad de que los tres u a n´ meros sean distintos? u Tenemos un dado con tres “1”.11 si es medio. la probabilidad de que sean blancas es 1/2. 6 delanteros y 2 porteros. Tras un estudio estad´stico en una ciudad se observa que el 70 % de los motoristas son varones y. Se elige un dado al azar y se tira. n n (b) Hallar la probabilidad de que un ciudadano mayor de 60 a˜ os se haya abstenido. 0.

(b) ¿Qu´ elementos del ese pacio muestral anterior constituyen el suceso . 20. ¿Cu´ l es la probabilidad de que la a moneda extra´da sea de plata?. ¿Cu´ l es la probabilidad de que la primera carta extra´da fuese una espada? a ı En un conjunto de estudiantes el 15 % estudia alem´ n. u o u En un estudio realizado en cierta Universidad se ha determinado que un 20 % de sus estudiantes no utilizan los transportes p´ blicos para acudir a sus clases y que un 65 % de los estudiantes que utilizan u los transportes p´ blicos tambi´ n hacen uso del comedor universitario. el 80 % supera las 600 BsF. tambi´ n son a e iguales las probabilidades de obtener 1. 15. (a) ¿Cu´ l es la probabilidad de que las bolas extraidas sean blancas? (b) Si la segunda bola ha a resultado ser negra. Si la carta extraida es un rey.al menos dos de las personas son partidarias de consumir el producto¿ (c) Describe el suceso contrario de ”m´ s de una persona es partidaria de consumir el producto” a En un supermercado el 70 % de las compras las realizan las mujeres. Deducir razonadamente cu´ l es la probabilidad de que al lanzar el dado dos veces se obtenga a una suma igual a 7. (a) Calc´ lese P(A ∩ B) y raz´ nese si los sucesos A y B son independientes. En una ciudad el 55 % de los habitantes consume pan integral. 25. 19. dos bolas.4 si huye por la calle B es 0. en caso contrario a la urna II. 60 . ı Un dado est´ trucado de manera que son iguales las probabilidades de obtener 2. ¿cu´ l es la probabilidad de que haya sido en la calle A? o o a De una urna con 4 bolas blancas y 2 negras se extraen al azar. (a) Elegido un ticket de compra al azar. Una experiencia aleatoria consiste en preguntar a tres personas distintas. al huir de un polic´a. puede hacerlo por las calles A. (b) Si el ladr´ n ha sido alcanzado. Se pide: (I) Sabiendo que un habitante consume pan integral. 5 y P(Ac ∪Bc ) = 0. El contenido de la urna I es de o 7 bolas blancas y 5 negras y el de la urna II es de 6 bolas blancas y 4 negras. Si se elige una urna al azar y se extrae una moneda al azar. el 30 % consume pan de multicereales y el 20 % consume ambos. de las compras realizadas por estas. nos dirigimos a la n urna I. 3 o 5 y la probabilidad de obtener 2 es doble que la probabilidad de sacar 1. ¿cu´ l es la probaa bilidad de que coma pan de multicereales? (II) Sabiendo que un habitante consume pan de multicereales.6. 14. mientras que de las compras realizadas por hombres s´ lo el 30 % supera esa o cantidad. ¿cu´ l es la probabilidad de que la primera tambi´ n lo haya sido? a e Sean A y B dos sucesos de un experimento aleatorio tales que: P(A) = 0. (b) Calc´ lese P(A ∪ B). La probabilidad de ser alcanzado por la calle es 0. 17. 4 o 6. con probabilidades p(A) = 0. Halla: (a) La probabilidad de que la bola extraida sea blanca y de la urna II. e a Un ladr´ n. 22. calcule la probabilidad de que no estudie franc´ s ni alem´ n. Otra contiene cuatro monedas de plata y tres de cobre. Justificar la respuesta. Se mezclan las cartas de esta segunda baraja y se extrae una carta. 23. si son partidarias o no de consumir un determinado producto.12. o ı p(B) = 0. 7. Calcular la probabilidad de que u e seleccionado al azar un estudiante en esa Universidad resulte ser usuario de los transportes p´ blicos y del u comedor universitario. el 30 % estudia franc´ s y el 10 % ambas materias. utilizando la letra ”s”para las respuestas afirmativas y ”n”para las negativas. (b) La probabilidad de que la bola extraida sea negra. ¿Cu´ l es la probabilidad de a que un empleado directivo elegido al azar sea ingeniero? Se toman dos barajas espa˜ olas de 40 cartas. a e (a) ¿Son independientes los sucesos estudiar alem´ n y estudiar franc´ s?. Se extrae al azar una carta de la primera baraja y se introduce n en la segunda baraja. sucesivamente y sin reemplazamiento.5 y si huye por la calle C es 0. Una urna contiene dos monedas de plata y tres de cobre. 15 respectivamente. 6 y p(C) = 0. P(B) = 0. B o C. ¿cu´ l es la probabilidad de que supere las 600 BsF? (b) a Si se sabe que el ticket de compra no supera las 600 BsF ¿cu´ l es la probabilidad de que la compra haya a sido hecha por una mujer? Se extrae una carta de una baraja espa˜ ola de 40 cartas. ingenieros y no economistas solamente el 20 % ocupan un puesto directivo. extraemos una bola. 21. 6. (b) Si se elige un estudiante al a e azar. (a) Calcule la probabilidad de que la polic´a alcance ı al ladr´ n. (a) Escribe el espacio muestral asociado a dicho experimento. 16. 13. A continuaci´ n. 18. que resulta ser el dos de oros. elegidas al azar.

Calcula la probabilidad de que las dos u personas no piensen el mismo n´ mero. ¿cu´ l es su a facultad m´ s probable? a Se escuchan tres discos y se vuelven a guardar al azar. justificando la respuesta. pero tambi´ n da positivo en el 5 % de personas sanas. 33. 37. 35. Sabiendo que son independientes. (b) Si se elige al azar una persona que ha comprado acciones en Bolsa y resulta que ha obtenido beneficios. ¿Cu´ l es la probabilidad de e a que est´ sana una persona a la que el procedimiento le ha dado positivo? e En un ayuntamiento hay 5 concejales del partido A. 28. 150 chicas y 150 chicos. sea m´ xima la probabilidad de obtener una bola blanca. El gerente tiene que seleccionar a una persona de dicho equipo para que represente a la empresa en un certamen internacional. divie e di´ ndose en dos. ´ o Se estima que s´ lo un 20 % de los que compran acciones en Bolsa tienen conocimientos burs´ tiles. 2 4 Tengo dos urnas. Si se eligen al azar y sucesivamente tres concejales. (b) Si un estudiante elegido al azar resultara ser chico. 36. se dispone de ı o un procedimiento que no es completamente fiable ya que da positivo en el 90 % de los casos de personas realmente enfermas. 5 negras y 5 rojas. con las mismas e probabilidades que antes. s´ lo un a o 10 % obtienen beneficios. (b) La segunda bola se extrae sin haber metido la primera en la caja. al elegir una urna al azar. ¿Cu´ l es la probabilidad de que sea asturiano? a El 12 % de los habitantes de un pa´s padece cierta enfermedad. independientemente uno de otro. ¿Cu´ l es la probabilidad de que al menos uno de a los discos haya sido guardado en el envoltorio que le correspond´a? ı Se considera una c´ lula en el instante t=0. Si se elige un monedero al azar y se extrae una moneda ¿Cu´ l es la probabilidad de que sea de plata? a En una oficina el 70 % de los empleados son asturianos. 29. En A hay matriculadas 150 chicas y 50 chicos. mientras que de los no asturianos. Decide lanzar una moneda: si sale cara. Se desea saber: (a) El tanto por ciento de los que compran acciones en Bolsa que obtienen beneficios. y otro contiene 4 de plata y 3 de cobre.4 y 0. 31. el 50 % son hombres. ¿cu´ l es la probabilidad de que no consume pan integral? (III) ¿Cu´ l es la probabilidad de que una persona a a de esa ciudad no consuma ninguno de los dos tipos de pan? 3 Si A y B son dos sucesos tales que: P(A) = 8 . P(B) = 1 y P(A ∩ B) = 1 . calcula la probabilidad de que no suceda ninguno de los dos. Sabiendo que 5 mujeres y 3 hombres del equipo directivo no hablan ingl´ s. la probabilidad de que la persona seleccionada hable ingl´ s.5. Calcula la probabilidad de que las dos sean blancas si: (a) Antes de extraer la segunda bola se vuelve a meter la primera en la caja. (b) Fernando trabaja en dicha oficina. (a) Calcula la probabilidad de que un estudiante. sea chico. y en C. Si la c´ lula se divide. en B. ¿Qu´ porcentaje de empleados no asturianos o e son mujeres? (a) Calcula la probabilidad de que un empleado de la oficina sea mujer. Calcula P(Ac ∩ Bc ). B y C. e determina. selecciona a una mujer y si sale cruz. 4 del B y 1 del C. De entre los asturianos. 30. Un monedero contiene 2 monedas de plata y 3 de cobre. con probabilidad 3/4. ¿cu´ l es la probabilidad de que tenga conocimientos burs´ tiles? a a El equipo directivo de cierta empresa del sector de hosteler´a est´ constituido por 25 personas de las que ı a un 60 % son mujeres. En una Universidad existen tres facultades: A. 27. 300 chicas y 200 chicos. 26. s´ lo son hombres el 20 %. 34. u Dos sucesos tienen probabilidades 0.24. De los que compran acciones sin conocimientos burs´ tiles. e Dos personas piensan cada una de ellas un n´ mero del 0 al 9. entonces e e en el tiempo t=2 cada uno de sus dos descendientes puede tambi´ n subdividirse o morir. 32. 25. ¿cu´ l es la probabilidad de que los tres sean del partido A? ¿y la de que pertenezcan a a 61 . elegido al azar. a un hombre. La a unica condici´ n exigida es que cada una tenga al menos una bola. Se extraen dos bolas consecutivamente de la caja. En el intante t=1 la c´ lula puede: bien reproducirse. o bien morir con probabilidad 1/4. (a) ¿Cu´ ntas c´ lulas es posible que haya en el a e tiempo t=2? (b) ¿Con qu´ probabilidad? e Una caja contiene 10 bolas blancas. dos bolas blancas y dos bolas negras. De o a ellos el 80 % obtienen beneficios. Para el diagn´ stico de esta. Se desea saber como debo distribuir las bolas en las urnas para que.

partidos distintos? Un dado ha sido trucado de manera que la probabilidad de sacar un n´ mero par es el doble que la de sacar u un n´ mero impar. u u se lanza un dado no trucado. se lanza un dado no trucado. (b) Si. la probabilidad de obtener. Se lanza el dado y se pide: La probabilidad de obtener un n´ mero par (a) Si. u 62 . un n´ mero impar. al menos.38. la probabilidad de obtener un n´ mero par y un n´ mero impar. a la u u vez. a la vez.

Algunos e ejemplos son: n´ mero de caras obtenidas al lanzar seis veces una moneda. u o el n´ mero de personas en la cola del cine.o . etc. aunque en realidad podr´a emplearse cualquier pareja de s´mbolos con ı ı igual precisi´ n. e e El estudio que se har´ en este tema ser´ an´ logo al que se hace con las variables estad´sticas en descriptiva. por ejemplo el voltaje de salida en una fuente de alimentaci´ n. Tanto en la vida cotidiana como en el campo cient´fico estamos habituados a observar fen´ menos aleatorios ı o cuyos resultados se expresan mediante n´ meros. n´ mero de llamadas que recibe un u u tel´ fono durante una hora. una a e o variable aleatoria es un valor num´ rico que corresponde a un resultado de un experimento aleatorio. El papel ı o ı e que all´ jugaba la frecuencia relativa lo juega ahora la probabilidad.. las respuestas o son usualmente codificadas con 0 y 1.1. preguntas del tipo A¿estudias o trabajas?. lo que nos permitir´ manejar los modelos estad´sticos para describir los posibles a ı resultados de un experimento aleatorio y asignar probabilidades a los diferentes sucesos que nos interesen.Cap´tulo 6 ı ´ Variable aleatoria y funcion de ´ distribucion 6. Por tanto. etc. o 63 . tiempo de fallo de una componente el´ ctrica.enfermo”. etc. en situaciones tales como: o e ˆ el diagn´ stico de un paciente ”sano. Introducci´ n o En este tema se tratar´ de formalizar num´ ricamente los resultados de un fen´ meno aleatorio. a a a ı As´ retomaremos el concepto de distribuci´ n y las caracter´sticas num´ ricas. Incluso en problemas de u o naturaleza puramente cualitativa es muy frecuente recurrir a la codificaci´ n num´ rica. o a En este tema se introduce el concepto de variable aleatoria y se estudian los distintos tipos de variables aleatorias a un nivel muy general. como la media y varianza. la velocidad de conexi´ n a la red. Esto va a proporcionar aspectos y propieı dades referentes a fen´ menos aleatorios que permitir´ n modelos muy estudiados en la actualidad.

C). X. Teorema.C) 1≤X ≤2 (C.) es una aplicaci´ n X : E → ℜ. 6. Una variable aleatoria discreta es aquella que s´ lo puede tomar valores dentro o o de un conjunto finito o infinito numerable. Para caracterizar la distribuci´ n de probabilidad inducida por una v. (C. a cada valor de X.a. (Variable discreta).C.C.C. X. (X.C) X >3 En general emplearemos las siglas v. Dada la v. 64 .C.a.C). es decir. X.C) 2≤X ≤3 (C. X). l´mh→0+ F(t + h) = F(t) o ı 4. La funci´ n es continua por la derecha. X. ı 3. Variable aleatoria unidimensional Este proceso de cuantificaci´ n nos lleva de manera natural a considerar la siguiente definici´ n: o o Dado un experimento aleatorio y asociado al mismo. es decir.C)(X. E = o (C. del espacio muestral le hace corresponder un n´ mero o u real.2. (6.C.a. X). u Calcular el espacio muestral y comprobar que es una variable aleatoria. (C. (X. X)(C. F(−∞) = l´mn→−∞ Pr[X ≤ t] = 0. X definiremos una nueva funci´ n m´ s o o a sencilla de manejar: Definici´ n. X. una variable aleatoria ı (V. X. en donde Eventos Valor de la v. un espacio probabil´stico (E.2) Las propiedades m´ s importantes de las funciones de distribuci´ n son: a o 1. F(∞) = l´mn→∞ Pr[X ≤ t] = 0. el conjunto de los sucesos elementales le hace corresponder un valor que verifica: ∀X ∈ ℜ. si t1 < t2 entonces F(t1 ) ≤ F(t2 ).C. (C. X)(X. X) 0≤X ≤1 (C.A. F es no decreciente.C). A.3.C)(X.C. La soluci´ n es la siguiente.1) Ejemplo: Consideramos un experimento aleatorio de lanzar una moneda al aire tres veces y anotamos el resultado. ı 2. Se dice que X es una variable aleatoria si para cualquier x perteneciente a ℜ. Una funci´ n F : ℜ → ℜ se dice que es de distribuci´ n si y s´ lo si verifica las cuatro propiedades o o o anteriores.C. Se define la variable aleatoria X como n´ mero de caras aparecidas en los tres lanzamientos.t]). P).6. X. X(S) ≤ X (6. X se denomina funci´ n de distribuci´ n asociada a X. a la o o o o o funci´ n F : ℜ → ℜ definida por: o F(t) = Pr[X ≤ t] = Pr(X ∈ (−∞. ∀t ∈ ℜ. φ X ≤0 (X. (Funci´ n de distribuci´ n). para referirnos a una variable aleatoria.a. Variables discretas Definici´ n. (X. X).C. X).C). (X.

a. de acuerdo con la anterior. tiene sentido analizar lo ”densamente”que est´ repartida la probabilidad en torno a ese valor. continua X.5) (6. (6. surge el concepto de funci´ n de densidad como la funci´ n l´mite a la cual se aproxima el histoo o ı grama. la probabilidad de que la variable aleatoria tome un valor concreto es igual a cero.4. En las v.6) f (x)dx = 1.3) Esta funci´ n es escalonada. o o o Definici´ n. b) ser´ el area limitada por esta funci´ n de densidad.a. se deduce que la funci´ n de densidad verifica las siguientes propiedades: o o f (x) > 0. Se denomina funci´ n de probabilidad de la variable X a la funci´ n que asigna a cada xi su probabilidad pi . de dicho valor. Una variable aleatoria continua es aquella que toma valores en uno o varios intervalos de la recta real. continuas la funci´ n de distribuci´ n no se puede calcular como la suma de las probabilidades de o o ciertos puntos porque el conjunto de posibles valores de la variable es no numerable. (Variable continua). (Funci´ n de densidad). En general. As´. Dada una v. x = b y el eje de abscisas. El valor del salto en o xi coincide con la probabilidad. con ∑i pi = 1. (6.a. (6. su funci´ n de densidad es la funci´ n real de o o o o variable real Pr(x − h ≤ X ≤ x + h) .4) f (x) = l´m ı 2h h→0+ De este modo. ∞ −∞ ∀x ∈ ℜ. discreta que toma los valores xi con probabilidades o o o o pi = Pr(X = xi ). 6. continua X. Aunque. (Funci´ n de probabilidad). Para abordar esta nueva situaci´ n necesitamos la noci´ n de funci´ n de densidad. Sea X una v. con saltos de discontinuidad en los puntos xi .a. no decreciente. la probabilidad de un intervalo (a. Variables continuas o Definici´ n. En las variables aleatorias discretas la funci´ n de distribuci´ n viene dada por la siguiente expresi´ n: o o o F(t) = Pr[X ≤ t] = xi ≤t ∑ Pr(xi ). pi .Definici´ n. cualquier funci´ n real que verifica las propiedades anteriores es la funci´ n de densidad de alguna o o v. las rectas ı a ´ o x = a. a De la definici´ n anterior. 65 .

pueden generalizarse al caso de variables aleatorias.8) (6.a. X definida sobre (E.9) La esperanza de una v.1. seg´ n la variable aleatoria definida. continua es la derivada de su funci´ n de distribuci´ n.es su valor esperado. continua X se expresa a partir de la funci´ n de densidad como: o o o t F(t) = Esta funci´ n es continua.12) La estructura de la Ecuaci´ n 4.e. En este sentido.10) (6. En el contexto de la teor´a de probabilidades una variable aleatoria estar´ definida en un cierto intervalo cuyo ı a centro. Definici´ n.1 se presenta en otros contextos.a. ∀x ∈ ℜ (6. ı Entre los descriptores m´ s habituales de las variables aleatorias se encuentran los siguientes.Pr). Caracter´sticas de una v.La funci´ n de distribuci´ n de una v.11) (6. como por ejemplo en Mec´ nica.5. a 6. se aproxima la forma de explicar un experimento aleatorio en t´ rminos de un experimento determinista pero con la dificultad de no tener argumentos e suficientes para escoger el resultado unico que se asociar´a al experimento determinista. por simplicidad. (Esperanza Matem´ tica) o a Cuando se realiza un experimento determinista el resultado del experimento es unico en contraposici´ n con ´ o un experimento aleatorio en el cual existen un intervalo de valores. Dada una v. si X es discreta. ı Las medidas resumen definidas para v. E(X ± Y ) = E(X) ± E(Y ). El conocimiento del ´ ı concepto de valor esperado ayuda a eliminar la dificultad planteada. verifica las siguientes propiedades: E(aX + b) = aE(X) + b. Si X e Y son independientes. se podr´a decir que el experimento aleatorio est´ definido alrededor ¸ ı a 66 .a. donde la funo a ci´ n de densidad de probabilidades tiene el sentido de la distribuci´ n de la masa a lo largo de un eje y el valor o o esperado se corresponde con el centro de esa masa. si X es continua (6.7) Por lo tanto. (6. f (x) = o o o F ′ (x). donde u es posible que ocurra cualquier resultado. 6. se denomina esperanza o valor medio de X a la siguiente expresi´ n o µ µ = E(X) = = E(X) = xi ∈SX ∞ −∞ ∑ xi P(xi ). entonces E(XY ) = E(X)E(Y ). En ocasiones. a.A.a. x f (x)dx.5. la funci´ n de densidad de una v. sin m´ s que a equiparar las frecuencias relativas de variables estad´sticas con las probabilidades de las variables aleatorias. o −∞ f (x)dx.

15) (6.a. o a o cuando y ≥ 0 y cero para cualquier otro valor.18) Var(aX + b) = a Var(X).13) (6. Este valor permite ubicar r´ pidamente la regi´ n o a o donde est´ definida la variable como aquella regi´ n que se encuentra alrededor del valor esperado.a. Inecuaci´ n de Chevyshev o La definici´ n de variable aleatoria y de las funciones de distribuci´ n y de densidad refleja el comportamiento o o del experimento aleatorio que se est´ analizando.6. en consecuencia. verifica las siguientes propiedades: Var(X) 0.16) (6. Este tipo de informaci´ n llega hasta el extremo o de indicar topes en el valor de la probabilidad de ocurrencia de ciertos eventos para cualquier tipo de variable 67 . Var(X + Y ) = Var(X − Y ) = Var(X) + Var(Y ).del valor esperado y la ponderaci´ n de cada uno de los posibles resultados viene dada en t´ rminos del valor de o e la funci´ n de densidad correspondiente en cada punto.17) (6. 6. Ejemplo: una v. Pero no a o proporciona informaci´ n acerca del tama˜ o de esa regi´ n. o a o cuando y ≥ 0 y cero para cualquier otro valor. En este orden de ideas. o de las probabilidades asignadas a diversos tipos de eventos. el conocimiento del valor espeo rado y la varianza proporciona informaci´ n adicional acerca de la forma de estas funciones y. La varianza de una v. (x − µ )2 f (x)dx. si X es continua (6. Y cuya funci´ n de densiad de probabilidad est´ dada por la expresi´ n: f (y) = λ exp(−λ y).5. Hallar la varianza de dicha funci´ n de densidad de probabilidad. si X es discreta. 2 (6. (Varianza) o En la secci´ n anterior se analiz´ la definici´ n de valor esperado tanto desde el punto de vista matem´ tico como o o o a desde el punto de vista del fen´ meno aleatorio involucrado. u Ejemplo: una v. Hallar el valor esperado de dicha funci´ n de densidad de proo babilidad. Definici´ n. Se ha verificado en diversas oportunidades que la forma de las a funciones de distribuci´ n y de densidad debe seguir un cierto patr´ n que obliga a que no todo tipo de funci´ n o o o puede ser considerada para este tipo de representaci´ n.14) La varianza de una v.a. o 6. Var(X) = E(X 2 ) − E(X)2.2.a. Y cuya funci´ n de densiad de probabilidad est´ dada por la expresi´ n: f (y) = λ exp(−λ y). Si X e Y son independientes. El concepto del valor esperado permite aglutinar en un o n´ mero los aportes ponderados de cada uno de los posibles resultados del experimento. X viene dada por la expresi´ n o σ 2 = Var(X) = E (X − µ )2 σ 2 = Var(X) = E (X − µ )2 = = xi ∈SX ∞ −∞ ∑ (xi − µ )2P(xi ). Una medida de la dispersi´ n o de la concentraci´ n o n o o o de la variable alrededor de su valor esperado lo proporciona la varianza.

0625. o Definici´ n: Sea una variable aleatoria X de la cual s´ lo conocemos su valor esperado E(X) y su varianza V (X). 1 (6. 12 si 0 ≤ x ≤ 3. En cada uno de o los problemas pudiera usarse todo lo reflejado en estas notas.aleatoria. Se ha comprobado experimentalmente que la vida util de una bater´a es una variable aleatoria cuya fun´ ı ci´ n de densidad es: o f (x) = be( − ax). Obt´ n la funci´ n de distribuci´ n de la variable y calcula la probabilidad o e o o de que una bater´a dure un tiempo mayor a 1/a. Como ser´ la calificaci´ n del a o alumno si este contesta a todas al azar. Problemas de final de cap´tulo ı A continuaci´ n una serie de problemas de repaso y estudio para fijar los conceptos anteriores. si x ≥ 0. o o Sea un evento del tipo X − E(X) ≤ kσX . o o 6. Cada fallo descuenta 0.25. o 1. La inecuaci´ n de Chevyschev permite conocer un l´mite al valor que puede tener la probabilidad de un cierto o ı tipo de evento independientemente de la forma de su funci´ n de densidad de probabilidades.19) P X − E(X) ≤ kσX 1 − 2 k Notas: El valor m´nimo de la probabilidad del evento mencionado se calcula utilizando el lado derecho de la ı Ecuaci´ n anterior. Se lanza al aire una moneda tres veces. entonces la probabilidad de ocurrencia de este evento tiene un valor m´nimo que es una funci´ n del valor real positivo k y no depende de la forma de la funci´ n de densidad de ı o o probabilidades de X. b ≥ 0. Calcula la funci´ n de masa y la de distribuci´ n de X: No de cruces o o obtenido. Una variable aleatoria tiene por funci´ n de densidad: o f (x) = 1 2 (x + 1). σ 2 = 0. Calcular la media de X y su varianza. Sol. 3.5 puntos. µ = 2. Demuestra matem´ ticamente que el n´ mero esperado de llamadas que debes hacer para que te cojan es a u de 4. o La expresi´ n anterior se conoce como la inecuaci´ n de Chevyschev. cada una de ellas con 4 posibles respuestas. P=0. 2. Cada pregunta contestada correctamente es un punto.7. 5.3678 ı Un PEQ consta de 10 preguntas tipo test. Determina la relaci´ n entre a y b. 68 . ´ Por experiencia se sabe que la probabilidad de que llames al ambulatorio y no comunique es de 0. Sol. con a. 4. as´ como tambi´ n cualquier herramienta compuı e tacional o tecnol´ gica disponible.5461.

Cu´ ntos coches de este modelo debe de tener disponibles si se quiere garantizar la demanda ı a al momento de estos veh´culos.84) Una f´ brica de coches vende de media. con una desviaci´ n a n a o t´pica de 10.6. 7. Sol. a o ı centrado en el retraso medio. Los retrasos en las entregas de los pedidos en una f´ brica respecto de la planificaci´ n establecida siguen a o una variable aleatoria cuya funci´ n de densidad es: o f (x) = 2 1 . σ 2 = 2. Propone un intervalo de tiempos de retraso. µ = 0. con una probabilidad del 95 %? Sol. para el 90 % de los casos. π 1 + x2 si −1 ≤ x ≤ 1. Cu´ l es el retraso medio de un pedido y la desviaci´ n t´pica.84. 95 coches ı 69 . (-0. 0. 50 unidades de su modelo m´ s caro. al a˜ o.28.

La distribuci´ n binomial es uno de los ı o primeros ejemplos de las llamadas distribuciones discretas (que s´ lo pueden tomar un n´ mero finito.F. uno de los m´ s famosos matem´ ticos de la historia. a Tiramos un dado 7 veces y contamos el n´ mero de cincos que obtenemos.Ars conjectandi”(El arte de pronosticar). por J. . La distribuci´ n normal es un ejemplo de las distribucioa a o nes continuas.K. La gr´ fica de la distribuci´ n a a a o normal en forma de campana se denomina Campana de Gauss. o ´ La obtenci´ n de exito o fracaso en cada ocasi´ n es independiente de la obtenci´ n de exito o fracaso en o ´ o o ´ las dem´ s ocasiones. a La probabilidad de obtener exito o fracaso siempre es la misma en cada ocasi´ n. 1777-1855). La distribuci´ n binomial o de Bernoulli o La distribuci´ n binomial est´ asociada a experimentos del siguiente tipo: o a Realizamos n veces cierto experimento en el que consideramos s´ lo la posibilidad de exito o fracaso. 1654-1705).Cap´tulo 7 ı Distribuciones de Probabilidad Binomial y Normal 7. y aparece en multitud de fen´ menos sociales y cient´ficos. 7. Fue estudiada. o ı Gauss (Alemania.2.1. Fue estudiada por Jakob Bernoulli (Suiza. de valores). qui´ n escribi´ el primer tratae o do importante sobre probabilidad. ´ o Ve´ moslo con un ejemplo. o infinito o u numerable. ¿Cu´ l es la probabilidad de obtener u a tres cincos?. Los Bernoulli formaron una de las sagas de matem´ ticos m´ s importantes de la historia. Introducci´ n o Estudiaremos en este tema dos de las distribuciones de probabilidad m´ s importantes y que son imprescindia bles a la hora de adentrarnos en el estudio de la inferencia estad´stica. 70 . entre otros.

como p(E) = 1 6 y tengo 3 exitos y p(F) = ´ 5 6 y tengo 4 fracasos: 1 1 1 5 5 5 5 p(tener 3 exitos y 4 fracasos) = 35 · · · · · · · = 0. lo mejor es recurrir a la siguiente ı ı f´ rmula que expresa la probabilidad de obtener cierto n´ mero de eitos en una distribuci´ n binomial: o u ´ o Definici´ n de distribuci´ n binomial: o o Si realizamos n veces un experimento en el que podemos obtener exito. que es en lo que nos fijamos. pues estamos repitiendo 7 veces el experimento de lanzar un ı o dado. En este caso la probabilidad de obtener k exitos viene dada por: ´ p(x = k) = n k (n−k) n k pq = p (1 − p)(n−k) k k (7. es decir: EEEFFFF. Fracaso = F = ”no sacar un 5”→ p(F) = 5 . fij´ monos en que nos dicen que sacamos 3 cincos y por lo tanto e tenemos 3 exitos y 4 fracasos. Exito = E = ”sacar un a u 5”→ p(E) = 1 .Este es un t´pico ejemplo de distribuci´ n binomial. y lo expresar´amos: ´ ı Bin 7. y quer´amos calcular p(X = 3) (obtener 3 exitos). y lo o a representaremos por Bin(n. Por tanto. ¿Cu´ l es nuestro exito?. 6 6 Para calcular la probabilidad que nos piden. Aplicando la f´ rmula: ı ı o ´ 6 p(x = 3) = 7 13 54 = 0. ¿de cu´ ntas maneras pueden darse estas posibilidades?. sacar un 5. ser´ no sacar 5. p). Pero tambi´ n podr´amos sacar e ı EFEFFFE. entonces p(x = 3) = 0. es decir que en realidad estamos calculando de cu´ ntas maneras se pueden ordenar 4 fracasos y a 3 exitos. es decir. Ejemplo: Antes ten´amos Bin 7. Podr´amos sacar 3 cincos ´ a ı en las 3 primeras tiradas y luego 4 tiradas sin sacar cinco.4 P7 = = = 35 formas 3!4! 3 · 2 · 1 Y por tanto.1) Nota: Observar que las probabilidades de exito y fracaso son complementarias. 1 . ´ El fracaso. 1 . con probabilidad p y fracaso. ´ por lo que basta saber una de ellas para calcular la otra.0781 ´ 6 6 6 6 6 6 6 Formalizando lo obtenido.0781. la proba´ 6 bilidad de obtener 3 exitos es 0. Recordando las t´ cnicas combinatorias. este problema se reduce a calcular las permutaciones con ´ e elementos repetidos: 7! 7·6·5 3. a ´ Evidentemente. · · 3 6 6 71 . ´ con probabilidad q (q = 1 − p).0781. por tanto.q = 1 − p y p = 1 − q. E. diremos que estamos ante una distribuci´ n binomial de par´ metros n y p. sino sacar cualquier otro n´ mero. en una variable binomial con 7 repeticiones y con probabilidad de exito 1 . F.0781 6 Como repetir este proceso ser´a bastante penoso en la mayor´a de los casos.

La raz´ n es bien sencilla. 0. o entonces q < 0.2344.Ejemplo: Supongamos que la probabilidad de que una pareja tenga un hijo o una hija es igual. es ´ 2 2 72 .52 · 0. pero hay que ser consecuente a la hora de elegir el exito y el fracaso y la pregunta ´ que nos hagan. En el caso concreto del ejemplo anterior. 2 Nota: La elecci´ n de exito o fracaso es subjetiva y queda a elecci´ n de la persona que resuelve el problema.7 y s´ lo tenemos o hasta p = 0. Si p > 0. Por tanto si intercambiamos exito = ”suspender fracaso =.7).2344.2344. En este caso Exito = E = tener hi jo y p(E) = 0.5. Tenemos.7. o ´ o pero teniendo cuidado de plantear correctamente lo que se pide. u ´ La probabilidad p se busca en la primera fila (valores desde 0. Calcular la probabilidad de que una familia con 6 descendientes tenga 2 hijos. entonces p = 0. en la primera columna (valores desde 2 a 10) y el n´ mero de u u exitos a su lado. ´ Por ejemplo en el caso anterior.01 hasta 0. Estamos por tanto ante una binomial Bin(6.5) .5.7 y q = 0. 0.5. el valor que hab´amos calculado. y cuando n = 6 y k = 2 ´ encontramos 0. la columna p = 0.5 y basta intercambiar los papeles de exito y fracaso para que podamos utilizar la tabla.3.3. es decir: a ´ p(x = 4) = 6 · 0.aprobar. como nos piden la probabilidad de que una familia con 6 hijos tenga 2 hijos. ´ Ejemplo: La probabilidad de que un alumno de 2do de Bachillerato apruebe las Matem´ ticas es de 0.7.52 = 0.aprobar fracaso = ”suspender”. ı Nota importante: El caso en que p > 0. El n´ mero de veces que se realiza el experimento. Si cona sideramos un grupo de 8 alumnos. ´ El n´ mero de exitos (k). Fracaso = F = tener hi ja y p(F) = 0. no se encuentra tabulado. q = 0.5) y nos piden p(X = 2). El uso de las tablas de la distribuci´ n binomial La distribuci´ n binomial se encuentra tabulada por lo que es f´ cil calcular probabilidades sin necesidad de hacer o a demasiadas cuentas. Bin(6.5. ¿cu´ l es la probabilidad de que cinco de ellos aprueben las Matem´ ticas?. una Bin(8. que no se puede calcular mediante las tablas porque p = 0. 4 Evidentemente sale lo mismo. a a Si exito = .1.5.54 = 0. p(X = 2). por tanto. Si aplicamos la f´ rmula es: o p(x = 2) = 6 · 0. ´ Nos piden calcular p(X = 5). Para usar las tablas de la distribuci´ n binomial es necesario conocer: o El n´ mero de veces que se realiza el experimento (n).entonces p = 0.54 · 0.2.5). si: Exito = tener hi ja. si el exito es ´ tener hija hemos de plantearnos cu´ l es la probabilidad de tener 4 exitos (4 hijas). 0. u La probabilidad de exito (p). o 7.5 es la ultima.

a Si exito = aprobar y fracaso = suspender. Tambi´ n. 1 o ninguno. Una opci´ n es calcular estas 13 probabilidades y sumarlas. e p(X > 3) = 1 − (0 + 0.33. Si exito = estudiar ingl´ s..000027 = 0. Es decir. 0. e e p(X ≤ 2). es decir que suspendan 3 de 8 o lo que es lo mismo. p(X = 3).7) y olvidarnos de tablas ı o para hacer: 8 p(x = 5) = · 0. m´ s sencilla. p = 0. e e e ´ q = 1 − 0.999973 73 .33 = 0. 0. Tomamos una muestra de 15 alumnos de la clase.2541. en las tablas s´ lo se admiten valores hasta n = 10 o o (10 repeticiones del experimento). podr´an pedirnos: a) e ı ¿Cu´ l es la probabilidad de que aprueben como mucho 2 alumnos?.75 · 0. Del mismo modo: a p(3 ≤ X ≤ 6) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) = 0.254.0467 + 0. puede que aprueben 2. Probabilidades acumuladas Es posible que nos pidan no s´ lo la probabilidad de que ocurran un cierto n´ mero de exitos en concreto.2. 5 7. + p(X = 15). entonces nos piden p(X ≤ 2).2965 = 0. basta ´ pensar en que para que aprueben 2 alumnos como mucho.000001 + 0. desde e ´ luego podr´amos haber utilizado la f´ rmula desde el principio.0012 + 0.decir la nueva binomial es Bin(8. En este caso. sino que o u ´ ocurran como mucho ”k”´ xitos o preguntas similares. p = 0. por ejemplo.000026 o (compru´ balo!). 0. y buscando en la tabla es p(X = 3) = 0. utilizar la Bin(8. que tengamos 3 exitos.000026) = 1 − 0.0001 + 0.1013 (haz las cuentas) b) ¿Cu´ l es la probabilidad de que aprueben entre 3 y 6 alumnos (inclusive)?. El o a complementario de encontrar al menos 3 alumnos de ingl´ s es encontrar como mucho 2 alumnos de ingl´ s. b) Probabilidad de que los 15 alumnos estudien ingl´ s. Manejamos por tanto una Bin(15. Para la parte a).3.67). p(X = 2) = 0..01 = 0.67 = 0.2541 + 0. Para valores de n > 10. inevitablemente hemos de utilizar la f´ rmula. la tarea se puede hacer bastante larga. se tendr´ a p(X > 3) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) + .7334 Hemos de tener en cuenta que para la distribuci´ n binomial. p(X = 1) = 0. p(X > 3) = 1 − p(X < 3) = 1 − p(X ≤ 2) = 1 − (p(X = 0) + p(X = 1) + p(X = 2)) y s´ lo tenemos que calcular 3 probabilidades: p(X = 0) ∼ 0 .7 y q = 0.67 y fracaso = estudiar franc´ s. c) Probabilidad e e de que estudien ingl´ s entre 7 y 10 alumnos. Por lo cual. En el ejemplo anterior. es pasar al complementario.3) y nos piden que aprueben 5 de 8. calcular: a) Probabilidad de que al menos e encontremos tres alumnos de ingl´ s. Como hay que aplicar la f´ rmula para calcular o o cada una.1361 + 0. es decir: p(X ≤ 2) = p(X = 0) + p(X = 1) + p(X = 2) = 0. o Ejemplo: Los alumnos de cierta clase se encuentran en una proporci´ n del 67 % que estudian ingl´ s y el o e resto franc´ s.000001. Otra opci´ n.2.

como el efecto de una misma dosis de un f´ rmaco. el n´ mero esperado de exitos o media.5564.1114 + 0. Para la parte c). p).3. ¿Qu´ quiere decir esta expresi´ n?. como el consumo de ciertos productos por individuos de un mismo grupo huo mano. o de una misma cantidad de o a abono. se tendr´ o a p(7 ≤ X ≤ 10) = p(X = 7)+ p(X = 8)+ p(X = 9)+ p(X = 10) = 0. Caracteres psicol´ gicos. o pesos.Para la parte b).1759 + 0. 7. como el cociente intelectual. o 74 . viene a o dado por x = np. Media y desviaci´ n t´pica en una distribuci´ n binomial o ı o u ´ Aunque no se demostar´ . como la resistencia a la rotura de ciertas piezas.1: Distribuci´ n de estaturas de 1400 mujeres. Caracteres fisiol´ gicos.2. o ı o a √ viene dada por σ = npq. animales. que es una medida de dispersi´ n y mide lo alejados que est´ n los datos de la media. σ .0025 (aplica la f´ rmula). grado de adaptaci´ n a un medio. La distribuci´ n Normal Al estudiar aspectos tan cotidianos como: Caracteres morfol´ gicos de individuos ( personas. etc.2142 = 0. como tallas. envergaduras. o o Caracteres f´sicos.0549 + 0. en una distribuci´ n binomial Bin(n.3. si hacemos una estad´stica para conocer la altura de 1400 mujeres y representamos los resultados en ı un diagrama de barras. ¯ o La desviaci´ n t´pica. por u e o e ejemplo. plantas) de una misma raza. ı todos ellos tienen en com´ n que se distribuyen ”normalmente”. obtenemos: Figura 7. Caracteres sociol´ gicos. se tendr´ a p(X = 15) = 0. Pu´ s. (Recordemos que la media es una medidad de centralizaci´ n). o 7.

El m´ ximo est´ en (x. De entre todas las curvas normales N(x. N(0. etc.Las gr´ ficas de este tipo son muy corrientes: Hay pocos individuos en los extremos y un aumento paulatino a hasta llegar a la parte central del recorrido. o ¯ a a ¯ √ 1 ). etc. achata¯ da. 2πσ 2 a o a Dependiendo de los valores que tomen x y σ . la gr´ fica de esta funci´ n puede ser m´ s o menos alargada.. rese˜ adas ı n anteriormente. El concepto de funci´ n de densidad introducido anteriormente no se estudiar´ con profundidad. la m´ s sencilla.. es decir de la ¯ forma: Figura 7. Baste decir que o a la funci´ n de densidad determina la forma de cada distribuci´ n de probabilidad. de m´ ximo en la media. σ ). o ı Esta normal est´ ndar se suele representar por Z. a ı Definici´ n: Diremos que una distribuci´ n de probabilidad sigue una distribuci´ n normal de media x y desviaci´ n o o o ¯ o t´pica σ . pero en cualquier caso siempre tiene las mismas condiciones de simetr´a. σ ) cuando la representaci´ n gr´ fica de su funci´ n de densidad es una ı ¯ o a o curva positiva continua.. dicha funci´ n viene dada por: a ¯ o (x−x)2 ¯ 1 − f (x) = √ e 2σ 2 2πσ 2 (7. y lo representaremos por N(x.2) Propiedad: El area encerrada bajo la curva normal N(x.2: Distribuci´ n normal N(x. 1). ´ ¯ La demostraci´ n de este resultado no es nada sencilla e implica el uso de resultados matem´ ticos que exceden o a el nivel de este curso. donde est´ la mayor´a de ellos. sim´ trica respecto a la media. σ ) siempre es 1. En el caso de la distribuci´ n o o o normal de par´ metros x y σ .3) 75 . continuidad. La gr´ fica de esta curva se denomina campana de Gauss y se a a puede observar en la figura: Su funci´ n de densidad ser´ : o a x2 1 f (x) = √ e− 2 2π (7. σ ). y que tiene 2 puntos de inflexi´ n e a o ¯ . usada y conocida es aquella que tiene por media 0 ¯ a y por desviaci´ n t´pica 1. situados a ambos lados de la media (x − σ y x + σ respectivamente) y a distancia de σ ella.

1) o La normal N(0. o a a √1 ). sea menor o igual que k o como: p(Z ≤ k) = Area encerrada bajo la curva normal N(0. Por eso.9973.62 y mayores ya valen 0. Por otra parte. Por tanto p(Z ≤ 2. 1).4: Area encerrada por la curva normal desde −∞ hasta k.99.9999 (pr´ cticamente 1). Si queremos calcular una probabilidad de un valor mayor que 3. en este u caso 0.78) = 0. Uso de las tablas de la distribuci´ n normal N(0.3.62) ∼ 1 aunque no aparezı ca en la tabla. 1). fij´ monos en que en este tipo de distribuciones no tiene sentido plantearse probabilidades del e tipo p(Z = k). si nos pidiesen p(Z = 3. 1) se encuentra tabulada. al no encerrar ning´ n area.2).78). El m´ ximo est´ en (0. ya que siempre valen 0. Ahora bien.4) (es decir la parte rayada de la figura siguiente). 1) desde −∞ hasta k (7. As´: p(Z ≤ 5. N(0. podemos definir una probabilidad de la siguiente manera: ´ Para un valor cualquiera k. Por tanto.99. diremos que la probabilidad es aproximadamente 1. e En el punto com´ n a la fila y la columna que hemos encontrado. hemos de realizar los pasos: Buscar la parte entera y las d´ cimas en la primera columna (en este caso 2. ¿c´ mo calcular dicha area?. basta u ´ 76 . para valores a partir de 0 y hasta 3. para estos valores a mayores que 3. basta fijarse en que las probabilidades correpondientes a valores tales como 3.Figura 7. F´ cil: Dichas areas o probabilidades se encuentran tabuladas.3: Distribuci´ n normal N(0.9973.7). e Buscar las cent´ simas en la primera fila (en este caso 8).99. o ´ a ´ 7. 2π Puesto que el area bajo esta curva normal es 1.1. Si por ejemplo queremos calcular p(Z ≤ 2. Figura 7. definimos la probabilidad de que la distribuci´ n Z. tenemos la probabilidad buscada.

f) p(Z ≤ 18. C´ lculo de otras probabilidades a Si k es positivo y queremos calcular p(Z > k). es decir el area rayada: basta pasar al complementario. Si k es positivo y queremos calcular p(Z > −k).09) 7.96) y p(Z > −1. para diferenciarlas de otras en las que esto no ocurre. 1) las probabilidades: a) p(Z ≤ 1. que es una distribuci´ n discreta. e) p(Z ≤ 4. Este tipo de distribuciones en las cuales la probabilidad de tomar un valor concreto es 0 se demoniman distribuciones continuas. al pasar al complementario. su complementario ser´ Z < k.3. Basta pasar al complementario. pero como incluir k no influye ı a en la probabilidad. es decir: ´ Figura 7.78) y p(Z ≤ −3.5).5) S´ lo se puede hacer esto en distribuciones continuas. Si k es positivo y queremos calcular p(Z ≤ −k).27). 77 . o As´.5: p(Z > k). d) p(Z ≤ 1. a c) p(Z ≤ 0. ´ Ejemplo: Calcular p(Z > 0.2) = 0.01). si tenemos Z > k.82).2). p(Z > k) = 1 − p(Z ≤ k) y esta ultima probabilidad ya se encuentra tabulada. es decir el area: por simetr´a. en el caso de la binomial esto no se puede hacer y hay que o ser cuidadosos con el paso al complementario. b) p(Z ≤ 0. al calcular probabilidades podemos escribir: p(Z > k) = 1 − p(Z < k) = 1 − p(Z ≤ k) (7. por simetr´a p(Z > −k) = ´ ı p(Z ≤ k): Ejemplo: Calcular p(Z > −0. p(Z ≤ −k) = p(Z > k) y esta ´ ı ´ se calcula como en el caso anterior.decir que p(Z = 3. Ejemplo: Buscar en la tabla de la normal est´ ndar N(0. como por ejemplo la binomial. Se puede observar la igualdad de areas en la figura: ´ Ejemplo: Calcular p(Z ≤ −0. es decir el area rayada: entonces.15).07).2.05).3) y p(Z > 2.

8: p(Z > −k).57).96 ≤ Z ≤ 1. Figura 7. La simetr´a permite reducir este caso al anterior.Figura 7.7: p(Z ≤ −k) = p(Z > k). ı Figura 7.6: p(Z ≤ −k). p(k1 ≤ Z ≤ k2 ) . 78 .es decir el area rayada: se calcula restando ´ las areas: ´ Ejemplo: Calcular p(−0.32 ≤ Z ≤ −0.49) y p(−1. a Figura 7.Las probabilidades de valores negativos no est´ n tabuladas.La simetr´a permite reducir este caso al que ya est´ tabulado. ı a Probabilidades comprendidas entre dos valores.9: p(Z > −k) = p(Z ≤ k).

1)?. 79 . σ ) a la Z → N(0. ¿Cu´ ntos soldados miden entre 166 y 170 cm?. o ¯ o σ o (El paso de la variable X → N(x. p(15 ≤ X ≤ 20).3. ¯ Ejemplo: Las estaturas de 600 soldados se distribuyen de acuerdo a una distribuci´ n normal de media 168 y o desviaci´ n t´pica 8 cm.4013 = 0. El siguiente resultado nos da la respuesta. p(X > 125). Y ahora dividimos entre σ = 8. p(Z > −2). si no o ¯ tenemos tabla salvo para N(0. A¿¿c´ mo calcular probabilidades.81 ≤ Z ≤ 1.25) − p(Z ≤ −0. Figura 7. p(Z ≤ 2). p(X > 27).25) = 1 − p(Z ≤ 0. sino una N(x. entonces la variable Z = X−x sigue una distribuci´ n N(0. p(−2 ≤ Z ≤ 2). Utilizando el resultado anterior. 1) y se encuentra en las tablas: p(166 ≤ ´ 8 8 X ≤ 170) = p(−0. 7. ´ Ejemplo: Calcular p(Z = 2). p(Z ≤ k1 ) en la segunda. 1). esta ya es normal N(0. Sea X la distribuci´ n de los soldados .25) = p(Z ≤ 0. Ejemplo: En una distribuci´ n N(22. 5). Probabilidad comprendida entre dos valores.25) = p(Z > 0.4013).5987 − 0. p(0. primero restamos x = 168 en la desigualdad: p(166 ≤ X ≤ 170) = p(166 − 168 ≤ X − 168 ≤ 170 − 168) = p(−2 ≤ X − 168 ≤ 2).5987 = 0. p(Z ≤ −2). Llamando a X−168 = Z. ¯ Propiedad: Si X sigue una distribuci´ n N(x.Figura 7. o p(17 ≤ X ≤ 30).11: p(Z ≤ k2 ) en la primera imagen. C´ lculo de probabilidadesen normales N(x.10: p(k1 ≤ Z ≤ k2 ).25) = 1 − 0. σ ) cualquiera.25 ≤ Z ≤ 0. σ ).25) = (tablas) = 0. 1) se denomina tipificaci´ n de la variable X).3. σ ) a ¯ ˆ o Si no tenemos una distribuci´ n N(0. con lo que acabamos de tipificar: p(166 ≤ X ≤ 170) = p(−2 ≤ X − 168 ≤ 2) = 2 2 p − 8 ≤ X−168 ≤ 8 .33). (pues p(Z ≤ −0.1974. 1). 8). p(Z > 2). calcula: p(X ≤ 27). Nos piden p(166 ≤ X ≤ 170). Al restar obtenemos el area pedida. o ı a o X es una N(168.

a medida que n crece.835. Basta buscar 0.83+0.4. calcula k.4. σ ) se sabe que p(X ≤ 7) = 0.7996 (que corresponde a 0.3. 1) y nos ped´an p(Z ≤ k) siendo k un cierto n´ mero.83) y como el valor a buscado est´ muy cerca de el. Relaci´ n entre la distribuci´ n binomial y la distribuci´ n normal o o o Es un hecho comprobado que cuando tenemos una distribuci´ n Bin(n. σ ).7970. p). Otro uso de las tablas Hasta ahora nos han dado la distribuci´ n normal N(0. Ejemplo: De una variable normal N(x.9082. a 2 Si el valor est´ entre dos valores. o menos. En este caso el valor buscado ser´ la media entre los a valores extremos. 7.9573 dentro de la tabla de la distribuci´ n normal. y por lo tanto k debe ser 1.9082. 4).9767 (que corresponde a 0.7982.33 → k − 6 = 3.65 ≤ X ≤ 6. ı Ahora bien. Calcula la probabilidad de que el peso o sea: a) mayor de 80 kg. o 80 . pero muy cercano a uno de ellos. otra pregunta puede ser: Dado que en una normal N(0.Ejemplo: Los pesos de 60 soldados siguen una distribuci´ n N(67. Calcular: ¯ a) x y σ . a ´ Si la distribuci´ n no es normal N(0. k−6 = 1.84).84 = 0. o ¯ Ejemplo: si X sigue una normal N(6.0028.9772 y p(X ≤ 6. pueden o ocurrir dos posibilidades: Si el valor se encuentra entre dos valores de la tabla y a la misma distancia (aproximadamente) de cada uno de ellos. c) menos de 60 kg.25).83. tendremos que tipificar previamente. 5). es dif´cil hacer o ı uso de las f´ rmulas y/o tablas. b) p(5. ¯ u k−6 3 = 7. por ejemplo: p(Z ≤ k) = 0. c) El n´ mero k tal que p(X > k) = 0.3. e) entre 60 y 70 kg inclusive.72.5) = 0. La resoluci´ n es bien sencilla.7 con la columna 2. y buscando en la tabla. Si buscamos en la tabla este valor no aparece directamente. ¿qui´ n e es k?. Ejemplo: Calcular k si: a) p(Z ≤ k) = 0. sino que se encuentra entre los valores 0. b) 50 kg. 3 3 Ejemplo: Calcular k si p(X ≤ k) = 0. sino N(x. b) p(Z ≤ k) = 0. y lo encontramos o o en el cruce de la fila 1. Tipificando: p X−6 ≤ 3 0.7967 (que corresponde a 0. 1).99 → k = 9.83) y 0. Por tanto el valor de k ser´ : k = 0. d) 70 kg. 1) sabemos que p(Z ≤ k) = 0.9082 → p Z ≤ k−6 = 0. directamente tomamos este valor. 3) y p(X ≤ k) = 0.6141 y X sigue una N(15.8078.9573.8413. El valor m´ s cercano es 0.99. entonces directamente k = 0. por a ejemplo: p(Z ≤ k) = 0. y o ı u nos ped´an calcular dicha probabilidad. En caso de que el valor a buscar no aparezca directamente dentro de la tabla de la distribuci´ n normal.

fij´ monos que ahora k SI est´ incluido en la proe e a babilidad y por tanto al aproximar por la normal Y deber´amos calcular p(Y ≤ k + 0. La explicaci´ n o de que haya que restar 0. y aproximamos X por una distribuci´ n normal. en una distribuci´ n o continua todas estas probabilidades valen 0. De otro modo. p) se aproxima a una curva normal de media x = np y desviaci´ n t´pica o ¯ o ı √ σ = npq. cuando n se hace muy grande. con la aproximaci´ n normal Y deberemos calcular o p(k − 0. Si nos piden p(X < k) con X binomial. ı 2 81 . Si exito = obtener cinco entonces p = 1/6 y fracaso = no obtener cinco y q = 5/6. El ”precio”que hay que pagar por pasar de una a otra se denomina correcci´ n por continuidad consiste en hacer determinados ajustes para que la ¸ o aproximaci´ n realizada sea lo m´ s precisa posible. tiramos un dado 100 veces. cuando n tiende a ∞. o a As´. el propio k aparecer´a en la probabilidad a calcular y NO debe aparecer. Algunos ejemplos. Del mismo modo se razona en el caso de probabilidades acumuladas en la binomial. y ´ 6 nos piden p(20 ≤ X ≤ 33). por ejemplo. 1 . en concreto n > 30 y adem´ s o o o a np > 5 y nq > 5. y. La aproximaci´ n se puede aplicar (es una buena aproximaci´ n) s´ lo si n es grande. y por tanto son distribuciones diferentes. calcular la probabilidad de obtener entre 20 y 33 cincos (inclusive). Es inviable aplicar las tablas (pues repetimos el experimento 100 veces) y tampoco la f´ rmula pues es inviable calcular.5 y no sumarlo es que queremos que X sea menor estrictamente que k.5).5). o En caso de que podamos aproximar. La correcci´ n por continuidad consiste en tomar un peque˜ o intero n valo de longitud 1 alrededor del punto k.5 ≤ Y ≤ k + 0. Teorema Central del L´mite ı La distribuci´ n binomial Bin(n. si nos piden p(X = k) con X binomial. Tenemos una Bin 100.5). si debi´ semos calcular p(X ≤ k). como ya se ha comentado anteriormente.Por ejemplo. con X binomial. es decir. Del siguiente modo. debemos tener en cuenta que estamos pasando de una variable discreta (binomial) a una continua (normal). aproximando por Y normal calcularemos p(Y ≤ k − 0.4. ı o o no podemos calcular directamente p(Y=k) porque. con lo cu´ l. o 7.1. o p(X = 32) = 100 1 · 32 6 3 2· 5 6 6 8 ¿C´ mo resolver el problema?. ı Por contra. si nos piden p(X = k) en una distribuci´ n binomial X. Si no se cumplen estas condiciones NO podemos aproximar la binomial que tengamos por una distribuci´ n normal.5 . si a sumase 0.

5−16.5 ≤ Y ≤ 33 + 0. De modo que.51) = p(Z ≤ 4.5−16.67. Notemos que en el paso se˜ alado por (*) hemos n cambiado X(binomial) por Y (normal) y se ha realizado la correcci´ n por continuidad.73. es decir: X → Bin 100. np = 16.1867.89) ∼ 1 − 0. como n > 30.8133 = 0.5) = p 19.67 = p(0.Comprender estos dos hechos es fundamental para realizar bien la correci´ n por continuidad al aproximar una o distribuci´ n binomial por una normal. 3.73) Entonces: p(20 ≤ X ≤ 33) ∼∗ p(20 − 0.89 ≤ 3.67 ≤ Y −16.33 > 5.67 > 5 y nq = 83. x = np = 100 = 16. o √ 500 En el caso anterior.73 3.51)− p(Z ≤ 0. o 82 .67 y σ = npq = ¯ 6 36 = 3.73 Z ≤ 4. se pude aproximar la binomial por la normal.67 ≤ 33. 1 6 ∼ Y → N(16.73 3.

ibid. Am. Phys.Am. 1991). Prentice Hall. Orear. F´sica re-Creativa. 1975). J. Inc. Phys. O. 1992. Ed. 2a ed. Cameron Reed . 1993). Springer Series in Statistics.McGraw Hill 2da. Data analysis for scientists and engineers (John Willey & Sons.B. pp. Meyer. New York.. Uncertainty in the linear regression slope. [2] Olav Kallenberg.. Higbie.. Phys. No.. ISBN 0-387-25115-4. Probabilistic Symmetries and Invariance Principles. 1. Bogot´ 1997 ı a [12] S. Experimentaci´ n. Diana Am. 224 (1974). Gil y E. Vol. J. ı ı 83 . J. 54-55 . [9] ”Simple method for fitting data when both variables have uncertainties”D.M. 60. Bevington and D. 510 pp. Data reduction and error analysis for the physical sciences. R. 42. [10] ”Linear least-squares fits with errors in both coordinates. Springer -Verlag. [6] D.M. [4] P.C. M´ xico.Am. [11] Estad´stica . 2nd ed. [3] Kallenberg. Cambridge University Press. Phys. 50. 184 (1991) [8] J. Robinson. Probability and the Art of Judgment. New York.Rodr´guez. Baird. 2nd ed. C. K. ISBN 0-521-39459-7. Buenos Aires 2001.A. ”Least squares when both variables have uncertainties”.. (Prentice-Hall Hispanoamericana S. Spiegel . ISBN 0-387-95313-2. Barker and L. New York (2005).Bibliograf´a ı [1] Jeffrey. 59. (McGraw Hill. (2002). [5] Stuardt L. o e ¨ [7] J. Foundations of Modern Probability. (1992). 912 (1982). 650 pp..”II: Comments on parameter variances . J.

Sign up to vote on this title
UsefulNot useful