Está en la página 1de 77

Apuntes del curso Probabilidad y

Estadística 1 para Ingeniería

Juan Manuel Jiménez Rodríguez, MBA


profjmjr@gmail.com
2021
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

“—Winwood Reade escribe muy bien acerca del tema —dijo Holmes—. Hace observar que mientras
el hombre, tomado individualmente, es un acertijo irresoluble, el conjunto de los hombres se
convierte en una certidumbre matemática. No puede usted, por ejemplo, anunciar de antemano
qué es lo que hará un hombre determinado, pero se puede prever con precisión lo que hará la
mayoría de ellos. Eso es lo que dice la estadística.”
Sir Arthur Conan Doyle

Sapere Aude
Atrévete a saber
i
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Tabla de contenido

Introducción .............................................................................................................................................................1
Historia de la Estadística ......................................................................................................................................1
Concepto de Estadística ........................................................................................................................................4
La observación estadística ....................................................................................................................................5
Fuentes estadísticas............................................................................................................................................10
Estadística descriptiva ...........................................................................................................................................12
Datos no agrupados...............................................................................................................................................12
Medidas de posición: Los cuantiles.....................................................................................................................13
Deciles .............................................................................................................................................................13
Cuartiles ..........................................................................................................................................................13
Quintiles ..........................................................................................................................................................13
Percentiles ......................................................................................................................................................13
Medidas de centralización o tendencia central ..................................................................................................14
Media Aritmética ............................................................................................................................................14
Mediana..........................................................................................................................................................15
Moda ..............................................................................................................................................................15
Medidas de Dispersión........................................................................................................................................16
Rango ..............................................................................................................................................................16
Varianza ..........................................................................................................................................................16
Desviación estándar o Típica ..........................................................................................................................17
Coeficiente de variación..................................................................................................................................17
Medidas de Forma o Distribución .......................................................................................................................18
Asimetría.........................................................................................................................................................18
Curtosis ...........................................................................................................................................................20
Datos Agrupados ...................................................................................................................................................21
Diagramas de tallo y hoja ...................................................................................................................................21
Histogramas, polígonos de frecuencia y ojivas ..................................................................................................22
Diagramas de caja y bigotes ..............................................................................................................................26
Distribuciones de frecuencia ...............................................................................................................................27
Variables .........................................................................................................................................................27
Intervalos y límites de clase ............................................................................................................................27
Limites reales de clases...................................................................................................................................28
Tamaño o anchura de un intervalo de clase ...................................................................................................28

Sapere Aude
Atrévete a saber
ii
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Punto medio o marca de clase........................................................................................................................29
Reglas generales para formar las distribuciones de frecuencia .....................................................................29
Frecuencia absoluta ........................................................................................................................................29
Frecuencia relativa .........................................................................................................................................29
Frecuencia absoluta acumulada .....................................................................................................................29
Frecuencia relativa acumulada.......................................................................................................................29
Análisis e interpretación datos numéricos en las distribuciones de frecuencia..................................................30
Medidas de posición: los cuantiles .................................................................................................................30
Medidas de tendencia central ........................................................................................................................31
Medidas de variabilidad .................................................................................................................................31
Medidas de distribución .................................................................................................................................32
Ejercicio ...........................................................................................................................................................32
Probabilidad ...........................................................................................................................................................33
Espacios muestrales y eventos ...........................................................................................................................33
Conteo de los puntos de la muestra ...................................................................................................................36
El principio fundamental del conteo o Regla de multiplicación......................................................................36
Permutaciones ................................................................................................................................................37
Permutaciones por grupos..............................................................................................................................37
Permutaciones Circulares ...............................................................................................................................38
Permutaciones por clases ...............................................................................................................................38
Combinaciones................................................................................................................................................39
Concepto Clásico de Probabilidad ......................................................................................................................40
Concepto Frecuentista de Probabilidad ..............................................................................................................40
Concepto axiomático de probabilidad ................................................................................................................41
Concepto Subjetivo de Probabilidad ...................................................................................................................41
Reglas aditivas ....................................................................................................................................................43
Probabilidad condicional ....................................................................................................................................44
La regla de producto o regla multiplicativa ........................................................................................................47
Probabilidad Total ..............................................................................................................................................48
Regla de Bayes ....................................................................................................................................................49
Análisis de Confiabilidad .....................................................................................................................................51
Propagación de errores .........................................................................................................................................56
Combinaciones lineales de las mediciones .........................................................................................................59
Mediciones repetidas..........................................................................................................................................60
Mediciones repetidas con incertidumbres diferentes .........................................................................................61
Combinaciones lineales de mediciones dependientes ........................................................................................62
Sapere Aude
Atrévete a saber
iii
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Variables aleatorias y distribuciones de probabilidad .........................................................................................64
Variable Aleatoria...............................................................................................................................................64
Distribuciones discretas de probabilidad ............................................................................................................66
Media y varianza de una variable aleatoria .......................................................................................................68

Sapere Aude
Atrévete a saber
iv
Introducción

La palabra estadística a menudo nos trae a la mente imágenes de números apilados en grandes arreglos y tablas,
de volúmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones, ingresos, deudas, créditos y
así sucesivamente. En realidad, es mucho más que sólo números apilados y gráficas bonitas; es una ciencia con
tanta antigüedad como la escritura, y es por sí misma auxiliar de todas las demás ciencias. Los mercados, la
medicina, la ingeniería, los gobiernos, etc. Se nombran entre los más destacados clientes de ésta. La ausencia de
ésta conllevaría a un caos generalizado, dejando a los administradores y ejecutivos sin información vital a la hora
de tomar decisiones en tiempos de incertidumbre.

La Estadística que conocemos hoy en día debe gran parte de su realización a los trabajos matemáticos de aquellos
hombres que desarrollaron la teoría de las probabilidades, con la cual se adhirió a la Estadística a las ciencias
formales. La Estadística es una ciencia cuyo objetivo es reunir una información cuantitativa concerniente a
individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis de estos datos unos significados
precisos o unas previsiones para el futuro. En general, es la ciencia que trata de la recopilación, organización
presentación, análisis e interpretación de datos numéricos con el fin de realizar una toma de decisión más
efectiva.

Algunos autores tienen definiciones de la Estadística semejantes a las anteriores, y algunos otros no tan
semejantes. Algunos establecen que es “la ciencia que tiene por objeto el estudio cuantitativo de los colectivos”;
otros la definen como la expresión cuantitativa del conocimiento dispuesta en forma adecuada para el escrutinio
y análisis. La más aceptada define la Estadística como “La ciencia que tiene por objeto aplicar las leyes de la
cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su predicción
próxima”.

Los estudiantes confunden comúnmente los demás términos asociados con las Estadísticas, una confusión que
es conveniente aclarar debido a que esta palabra tiene tres significados: la palabra estadística, en primer término
se usa para referirse a la información estadística; también se utiliza para referirse al conjunto de técnicas y
métodos que se utilizan para analizar la información estadística; y el término estadístico, en singular y en
masculino, se refiere a una medida derivada de una muestra.

Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para organizar y resumir
datos numéricos. La estadística descriptiva, por ejemplo trata de la tabulación de datos, su presentación en forma
gráfica o ilustrativa y el cálculo de medidas descriptivas.

Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad, control de
calidad y en otras actividades; estudios de consumidores; análisis de resultados en deportes; administradores de
instituciones; en la educación; organismos políticos; médicos; y por otras personas que intervienen en la toma
de decisiones.

Historia de la Estadística

Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia
el año 3050 antes de Cristo, prolijos datos relativos a la población y la riqueza del país. De acuerdo al historiador
griego Heródoto, dicho registro de riqueza y población se hizo con el objetivo de preparar la construcción de las
pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto.
En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos obtenidos en dos
recuentos de la población hebrea. El rey David por otra parte, ordenó a Joab, general del ejército hacer un censo

1
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
de Israel con la finalidad de conocer el número de la población. También los chinos efectuaron censos hace más
de cuarenta siglos. Los griegos efectuaron censos periódicamente con fines tributarios, sociales (división de
tierras) y militares (cálculo de recursos y hombres disponibles). La investigación histórica revela que se realizaron
69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.

Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los recursos de
la estadística. Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación
de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las
riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo sucedía uno de estos
empadronamientos de la población bajo la autoridad del imperio.

Durante los mil años siguientes a la caída del imperio Romano se realizaron muy pocas operaciones Estadísticas,
con la notable excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve
en el 758 y por Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos censos parciales
de siervos. En Inglaterra, Guillermo el Conquistador recopiló el Domesday Book o libro del Gran Catastro para el
año 1086, un documento de la propiedad, extensión y valor de las tierras de Inglaterra. Esa obra fue el primer
compendio estadístico de Inglaterra.

Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la técnica romana,
los métodos estadísticos permanecieron casi olvidados durante la Edad Media. Durante los siglos XV, XVI, y XVII,
hombres como Leonardo de Vinci, Nicolás Copérnico, Galileo, Neper, William Harvey, Sir Francis Bacon y René
Descartes, hicieron grandes operaciones al método científico, de tal forma que cuando se crearon los Estados
Nacionales y surgió como fuerza el comercio internacional existía ya un método capaz de aplicarse a los datos
económicos. Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique
VII tenía por la peste. Más o menos por la misma época, en Francia la ley exigió a los clérigos registrar los
bautismos, fallecimientos y matrimonios. Durante un brote de peste que apareció a fines de la década de 1500,
el gobierno inglés comenzó a publicar estadística semanales de los decesos. Esa costumbre continuó muchos
años, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad) contenían los nacimientos y fallecimientos por
sexo.

En 1662, el capitán John Graunt usó documentos que abarcaban treinta años y efectuó predicciones sobre el
número de personas que morirían de varias enfermedades y sobre las proporciones de nacimientos de varones
y mujeres que cabía esperar. El trabajo de Graunt, condensado en su obra Natural and Political
Observations...Made upon the Bills of Mortality (Observaciones Políticas y Naturales ...Hechas a partir de las
Cuentas de Mortalidad), fue un esfuerzo innovador en el análisis estadístico.

Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de los recursos nacionales,
comprensiva de datos sobre organización política, instrucciones sociales, comercio y poderío militar. Durante el
siglo XVII aportó indicaciones más concretas de métodos de observación y análisis cuantitativo y amplió los
campos de la inferencia y la teoría Estadística. Los eruditos del siglo XVII demostraron especial interés por la
Estadística Demográfica como resultado de la especulación sobre si la población aumentaba, decrecía o
permanecía estática.

En los tiempos modernos tales métodos fueron resucitados por algunos reyes que necesitaban conocer las
riquezas monetarias y el potencial humano de sus respectivos países. El primer empleo de los datos estadísticos
para fines ajenos a la política tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que
vivía en Breslau. Este investigador se propuso destruir la antigua creencia popular de que en los años terminados

Sapere Aude
Atrévete a saber
2
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
en siete moría más gente que en los restantes, y para lograrlo hurgó pacientemente en los archivos parroquiales
de la ciudad. Después de revisar miles de partidas de defunción pudo demostrar que en tales años no fallecían
más personas que en los demás. Los procedimientos de Neumann fueron conocidos por el astrónomo inglés
Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida humana. Sus cálculos
sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compañías de seguros.

Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis Maseres, Lagrange y Laplace
desarrollaron la teoría de probabilidades. No obstante, durante cierto tiempo, la teoría de las probabilidades
limitó su aplicación a los juegos de azar y hasta el siglo XVIII no comenzó a aplicarse a los grandes problemas
científicos. Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística,
que extrajo del término italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva ciencia
serían el aliado más eficaz del gobernante consciente. La raíz remota de la palabra se halla, por otra parte, en el
término latino status, que significa estado o situación; Esta etimología aumenta el valor intrínseco de la palabra,
por cuanto la estadística revela el sentido cuantitativo de las más variadas situaciones.

Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este interpretó la teoría de la
probabilidad para su uso en las ciencias sociales y resolver la aplicación del principio de promedios y de la
variabilidad a los fenómenos sociales. Quételect fue el primero en realizar la aplicación práctica de todo el
método Estadístico, entonces conocido, a las diversas ramas de la ciencia. Entretanto, en el período del 1800 al
1820 se desarrollaron dos conceptos matemáticos fundamentales para la teoría Estadística; la teoría de los
errores de observación, aportada por Laplace y Gauss; y la teoría de los mínimos cuadrados desarrollada por
Laplace, Gauss y Legendre.

A finales del siglo XIX, Sir Francis Gaston ideó el método conocido por Correlación, que tenía por objeto medir la
influencia relativa de los factores sobre las variables. De aquí partió el desarrollo del coeficiente de correlación
creado por Karl Pearson y otros cultivadores de la ciencia biométrica como J. Pease Norton, R. H. Hooker y G.
Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones.

Los progresos más recientes en el campo de la Estadística se refieren al ulterior desarrollo del cálculo de
probabilidades, particularmente en la rama denominada indeterminismo o relatividad, se ha demostrado que el
determinismo fue reconocido en la Física como resultado de las investigaciones atómicas y que este principio se
juzga aplicable tanto a las ciencias sociales como a las físicas.

La historia de la estadística está resumida en tres grandes etapas o fases.

✓ Primera Fase: Los Censos: Desde el momento en que se constituye una autoridad política, la idea de
inventariar de una forma más o menos regular la población y las riquezas existentes en el territorio está
ligada a la conciencia de soberanía y a los primeros esfuerzos administrativos.

✓ Segunda Fase: De la Descripción de los Conjuntos a la Aritmética Política: Las ideas mercantilistas
extrañan una intensificación de este tipo de investigación. Colbert multiplica las encuestas sobre
artículos manufacturados, el comercio y la población: los intendentes del Reino envían a París sus
memorias. Vauban, más conocido por sus fortificaciones o su Dime Royale, que es la primera propuesta
de un impuesto sobre los ingresos, se señala como el verdadero precursor de los sondeos. Más tarde,
Bufón se preocupa de esos problemas antes de dedicarse a la historia natural. La escuela inglesa
proporciona un nuevo progreso al superar la fase puramente descriptiva. Sus tres principales
representantes son Graunt, Petty y Halley. El penúltimo es autor de la famosa Aritmética Política.

Sapere Aude
Atrévete a saber
3
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Chaptal, ministro del interior francés, publica en 1801 el primer censo general de población, desarrolla
los estudios industriales, de las producciones y los cambios, haciéndose sistemáticos durante las dos
terceras partes del siglo XIX.

✓ Tercera Fase: Estadística y Cálculo de Probabilidades: El cálculo de probabilidades se incorpora


rápidamente como un instrumento de análisis extremadamente poderoso para el estudio de los
fenómenos económicos y sociales y en general para el estudio de fenómenos “cuyas causas son
demasiados complejas para conocerlos totalmente y hacer posible su análisis”.

Concepto de Estadística

Es frecuente que la Estadística se identifique con una tabla o colección de datos ordenados y sistemáticos, lo que
en realidad son estadísticas. Esta forma de entender la Estadística tiene su origen en el significado etimológico
del término, dado que la palabra Estadística deriva del latín “status” y se remonta a los tiempos en los que los
estados-naciones recababan datos, especialmente sobre renta y población, a efectos de recaudación impuestos
y mantenimiento del ejército. Al identificarse esos datos con el estado, terminaron conociéndose como
estadística.

Debe reconocerse que la estadística nace con la necesidad del ser humano de desarrollarse en sociedad, pues se
requiere de ella para lograr la armonía en cuanto al desarrollo social de las diferentes tribus y sus interrelaciones.
Desde este punto de vista, la estadística es tan antigua como el hombre social.

En cambio, la Estadística entendida como ciencia tiene un origen más reciente y el gran desarrollo que ha tenido
a lo largo del siglo XX. Como ciencia, la Estadística está formada por el conjunto de métodos y técnicas que
permiten la obtención, organización, síntesis, descripción e interpretación de datos, para la toma de decisiones
en ambientes de incertidumbre.

Este objetivo tiene su razón de ser en el hecho de que la Estadística misma, se preocupa del estudio de lo que
podemos denominar como fenómenos de masas; ya que los datos aislados no suponen la necesidad de
analizarlos, pues si la información es escasa no tiene sentido plantearse problemas de organización ni de síntesis.

Si se estudian los gastos de transporte de las empresas distribuidoras de productos de consumo masivo y se tiene
información para solo dos empresas, entonces con esos dos datos no tiene sentido preparar todo un análisis
mediante una tablas o gráficos, pues la escasez de información no debiera ser nunca objeto de análisis
estadístico, dada que la descripción de la misma es irrelevante y a partir de ella poco se puede decir en relación
con los gastos en transporte de todas las empresas del ramo.

La metodología estadística adquiere relevancia cuando se analiza un elevado volumen de datos, pues por lo
general, tras esa “masa de datos” se esconden ciertas regularidades o leyes de comportamiento que nos
permitirán, una vez descritas, tomar decisiones en ambiente de incertidumbre, siempre que esta pueda
cuantificarse en términos de probabilidad, pues esas decisiones se basan en una serie de leyes que, a diferencia
de las leyes de la física, no son exactas, sino que están sujetas a errores.

Entonces, podemos establecer que la Estadística es una disciplina científica que se interesa en los fenómenos
típicos o las regularidades que presentan un conjunto de datos y trata de determinar las propiedades de esos
conjuntos. Está ligada con el método científico en la toma, organización, recopilación, presentación y análisis de

Sapere Aude
Atrévete a saber
4
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con dichas
conclusiones.

Además, podemos dividir la Estadística en dos ramas principales: la Estadística Descriptiva, que es la más antigua
de la Estadística y su objeto es el análisis de los datos para descubrir o describir las posibles regularidades que
presenten, la que a su vez se divide en descriptiva (área de la estadística que busca describir y analizar un grupo
dado, sin sacar inferencias o conclusiones de un grupo mayor) e inferencial (área de la estadística que trata de
las condiciones bajo las cuales las inferencias obtenidas sobre una muestra representativa de una población, son
válidas); y la Teoría de la Probabilidad, que nace después y se usa para trasladar el conocimiento estadístico al
manejo de las incertidumbres. La unión de ambas ha dado lugar a lo que se conoce como Estadística Matemática.

La observación estadística

Se ha establecido que la Estadística se dedica al estudio de los fenómenos de masas, es decir, centra su interés
en la observación de grupos amplios de entes o elementos, los cuales pueden ser personas o cosas, a los que se
les llama Población.

Ahora bien, una vez que se tiene claro que el objeto de la Estadística es la observación y estudio de las
poblaciones, la siguiente cuestión que puede plantearse es como ha de realizarse esa observación. La misma
puede ser exhaustiva o parcial. Las dos formas tienen ventajas e inconvenientes. En el caso de la observación
exhaustiva o total, y si se asume que no hay errores de medida entonces, lo que se consigue es eliminar la
incertidumbre.

En primera instancia, debe definirse que el dato estadístico es la información numérica o cuantitativa sobre un
tema, para un cierto período, organizada de tal forma que muestra los aspectos más significativos y de mayor
interés de dicho tema. En general es un conjunto de números referidos a una misma característica y recogidos
de tal modo que pueden ser comparados, analizados o interpretados.

Frente a esa ventaja fundamental, la observación exhaustiva tiene un grave inconveniente: el coste. Se trata
tanto de un coste económico, como social, ecológico, de espacio temporal, es decir, el coste desde una
perspectiva global. Imaginemos la siguiente situación: ante la posibilidad de lograr un puesto en la Federación
de estudiantes, un candidato quiere saber cuál es la intención de voto del electorado estudiantil. Para ello tiene
dos opciones: preguntarle a todos los estudiantes o solo a un grupo de ellos. En el primer caso estamos frente a
una observación exhaustiva y ante esta situación, para el candidato que lleva a delante la observación, no habrá
incertidumbre alguna respecto al resultado final de las elecciones, siempre y cuando no haya errores de medida,
los cuales se podrían originar en la falta de sinceridad en la respuesta de los electores, por las no respuestas,
entre otras posibles causas. Normalmente no se realiza este tipo de observación dado que el tamaño de la
población es demasiado grande, lo que conlleva un coste que hace poco aconsejable esa opción. Un ejemplo de
una operación estadística de carácter exhaustivo, dentro de la estadística oficial, son los censos de población.

La alternativa al enfoque anterior es la observación parcial, lo que implica que no se observa a toda la población.
Dentro de esta forma de proceder se pueden distinguir dos categorías distintas: la subpoblación y la muestra.
Con la primera lo que se hace es observar a un conjunto de entes o elementos de la población, que guardan
entre si una cierta característica y que los diferencia de los demás.

Así, retomando el ejemplo anterior, los electores que no han votado antes porque en las elecciones anteriores
no habían ingresado a la institución educativa constituyen una subpoblación. Al proceder de esta forma se

Sapere Aude
Atrévete a saber
5
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
consigue realizar una operación estadística en menos tiempo y a menor costo pero, en cambio, la incertidumbre
acerca de la intención de voto del electorado es enorme, pues esa subpoblación no representa en absoluto a
toda la población. Su intención de voto no tiene por qué coincidir con la de los demás electores.

No obstante, esta forma de observar la población puede resultar de gran interés en determinados casos.
Pensemos que nuestro interés se centra es cuantificar la ocupación hotelera en una zona turística. En esta
situación, en lugar de preguntar a todos los establecimientos que se dedican a esta actividad económica, podría
resultar suficiente con preguntarle solo a los hoteles a partir de una cierta categoría, por ejemplo a los de tres y
más estrellas pues, en este caso, esos elementos de la población son determinantes de la población total y los
demás tienen poca incidencia en el volumen de ocupación.

La segunda opción de la observación parcial consiste en tomar una muestra. En este caso se observará también
un subconjunto de elementos de la población, pero ahora los elementos de la muestra no guardan ninguna
característica especial que los diferencie de los demás; al contrario, con una muestra lo que se pretende es
representar a toda la población. Podríamos decir que la muestra es una población de tamaño reducido.

Las ventajas de observar la población de forma parcial y, en especial, para el caso de seleccionar muestras son,
en algunos casos, evidentes:

• En primer lugar, reduce el tiempo de observación, considerando que si el tiempo que se dedica a observar los
elementos de la población es excesivo, podría ocurrir que los resultados llegaran más tarde de lo necesario.
Siguiendo con el ejemplo de las elecciones, si el periodo de observación es superior al tiempo hasta que
tengan lugar las elecciones, entonces cuando se disponga de resultados sobre intención de voto ya no son
necesarios. En general, si lo que se pretende al observar la población es analizar una característica que no
cambia mucho con el transcurso del tiempo, entonces no importará demasiado que el periodo de observación
sea razonablemente largo. Por el contrario, si esa característica está sometida a fuertes variaciones en
periodos de tiempo cortos o si el plazo de presentación de resultados es breve, en tales circunstancias la
observación parcial, mediante una muestra, es el procedimiento más indicado.

• En segundo lugar, está el tema de los costos, que en la observación parcial son más reducidos que en el caso
de la exhaustiva.

• Finalmente, la observación parcial presenta también la ventaja de que reduce las pruebas destructivas.
Imaginemos que nos encontramos frente a un estudio de control de la calidad de la producción de una
empresa que se dedica a la fabricación de vigas de hormigón para obras civiles. Esas vigas habrán de
someterse a presiones altas para conocer su resistencia a la ruptura. Pero si somete toda la producción a este
tipo de pruebas destructivas entonces no hay producción. Bastaría en este caso con seleccionar una muestra
y, aplicarle ese tipo de pruebas a los elementos de la misma, para tener una idea razonable de cuál es la
resistencia a la ruptura de las vigas producidas por la empresa.

Pero no todo son ventajas en la observación parcial. El principal inconveniente se deriva de que la observación
no es exhaustiva y en estos casos las características de la población serán desconocidas, pues aunque la muestra
pretenda representar lo más fielmente posible a la población, con los datos de la muestra solo podremos conocer
las características de esos valores muestrales. Entre las características observadas en la muestra y las de la
población habrá siempre una diferencia que se conoce como error muestral. Es precisamente este error muestral
el que lleva a que las decisiones, en relación con las características poblacionales, se tomen en situaciones de
incertidumbre.

Sapere Aude
Atrévete a saber
6
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

Veamos esto de una forma gráfica y sencilla. En la Figura se han representado una población con todos sus
elementos y una muestra de los mismos. Como puede apreciarse, la población toma valores que van del 1 al 9,
mientras que en la muestra el valor 4 no está incluido. Así pues, según la muestra, los valores de la población van
del 1 al 3 y del 4 al 9, pero eso no es cierto, solo es aproximado. Se está cometiendo un error.

Población y muestra

La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística Descriptiva y la Inferencial.

✓ Estadística Descriptiva: consiste sobre todo en la presentación de datos en forma de tablas y gráficas. Esta
comprende cualquier actividad relacionada con los datos y está diseñada para resumir o describir los mismos
sin factores pertinentes adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como
tales.

✓ Estadística Inferencial: se deriva de muestras, de observaciones hechas sólo acerca de una parte de un
conjunto numeroso de elementos y esto implica que su análisis requiere de generalizaciones que van más allá
de los datos. Como consecuencia, la característica más importante del reciente crecimiento de la estadística
ha sido un cambio en el énfasis de los métodos que describen a métodos que sirven para hacer
generalizaciones. La Estadística Inferencial investiga o analiza una población partiendo de una muestra
tomada.

El conjunto de los métodos que se utilizan para medir las características de la información, para resumir los
valores individuales, y para analizar los datos a fin de extraerles el máximo de información, es lo que se llama
método estadístico. Los métodos de análisis para la información cuantitativa se pueden dividir en los siguientes
siete pasos:

1. Definición del problema.


2. Recopilación de la información existente.
3. Obtención de información original.
4. Clasificación.
5. Presentación.
6. Análisis.
7. Obtención de conclusiones.

Al momento de recopilar los datos que serán procesados se es susceptible de cometer errores así como durante
los cómputos de los mismos. No obstante, hay otros errores que no tienen nada que ver con la digitación y que
no son tan fácilmente identificables. Algunos de estos errores son:

Sapere Aude
Atrévete a saber
7
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
✓ Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de comenzar a estudiar
un problema, y existen muchas maneras en que una perspectiva o estado mental pueda influir en la
recopilación y en el análisis de la información. En estos casos se dice que hay un sesgo cuando el individuo da
mayor peso a los datos que apoyan su opinión que a aquellos que la contradicen. Un caso extremo de sesgo
sería la situación donde primero se toma una decisión y después se utiliza el análisis estadístico para justificar
la decisión ya tomada.

✓ Datos no comparables: el establecer comparaciones es una de las partes más importantes del análisis
estadístico, pero es extremadamente importante que tales comparaciones se hagan entre datos que sean
comparables.

✓ Proyección descuidada de tendencias: la proyección simplista de tendencias pasadas hacia el futuro es uno
de los errores que más ha desacreditado el uso del análisis estadístico.

✓ Muestreo Incorrecto: en la mayoría de los estudios sucede que el volumen de información disponible es tan
inmenso que se hace necesario estudiar muestras, para derivar conclusiones acerca de la población a que
pertenece la muestra. Si la muestra se selecciona correctamente, tendrá básicamente las mismas
propiedades que la población de la cual fue extraída; pero si el muestreo se realiza incorrectamente, entonces
puede suceder que los resultados no signifiquen nada.

Variables y atributos

Se ha señalado que el objeto de estudio de la Estadística son las poblaciones, que están formadas por entes o
elementos y que el número total de ellos determina el tamaño de la población. Para estudiar una población, lo
primero que debe hacerse es observarla de alguna de las formas ya señaladas. Observar una población es
equivalente a observar sus elementos y esos elementos poseen una serie de características que son las que
realmente se observan. Por ejemplo, el conjunto de todas las empresas industriales radicadas en una localidad
constituye una población. Los elementos de esa población son las empresas. Pero una empresa no se observa en
abstracto, ya que lo que realmente tiene interés son sus características, como por ejemplo el número de
empleados, el volumen de ventas, los costes salariales, los gastos en publicidad, los beneficios de las mismas, la
naturaleza de los productos que fabrican, etc.

A todas estas características de los elementos de una población se les conoce de forma genérica como variables
y son susceptibles de medirse y a cada una de esas posibles mediciones o realizaciones se les conoce como
valores, datos u observaciones.

La naturaleza de las observaciones que realicemos en una investigación, será de gran importancia a la hora de
elegir el método estadístico más apropiado para abordar su análisis. Por ejemplo, lo que estudiamos en cada
individuo de la una muestra son las variables (edad, sexo, peso, talla, tensión arterial sistólica, etcétera). Los
datos son los valores que toma la variable en cada caso. Lo que vamos a realizar con la observación es medir, es
decir, asignar valores a las variables incluidas en el estudio. Deberemos además concretar la escala de medida
que aplicaremos a cada variable.

Entonces, podemos decir que una variable estadística es cada una de las características o cualidades que poseen
los individuos de una población, una propiedad característica de la población que estamos interesados en
estudiar.

Sapere Aude
Atrévete a saber
8
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
En general, las variables, o caracteres cuantitativos, son aquellos que pueden ser expresados mediante números
y son susceptibles de medición, como, por ejemplo, la estatura, el peso, el salario, la edad, etc. Según Murray R.
Spiegel, (1992) "una variable es un símbolo, tal como X, Y, Hx, que puede tomar un valor cualquiera de un
conjunto determinado de ellos, llamado dominio de la variable. En el caso de que la variable pueda tomar
solamente un valor, se le llama constante."

Todos los elementos de la población poseen los mismos tipos de caracteres, pero como estos en general no
suelen representarse con la misma intensidad, es obvio que las variables toman distintos valores. Por lo tanto,
estos distintos números o medidas que toman los caracteres son los "valores de la variable". Todos ellos juntos
constituyen una variable.

Los atributos, también llamados caracteres cualitativos, son aquellos que no son susceptibles de medición, es
decir que no se pueden expresar mediante un número. Según IUTIN (1997). "Reciben el nombre de variables
cualitativas o atributos, aquellas características que pueden presentarse en individuos que constituyen un
conjunto”. La forma de expresar los atributos es mediante palabras, por ejemplo; profesión, estado civil, sexo,
nacionalidad, etc. Puede notar que los atributos no se presentan en la misma forma en todos los elementos.
Estas distintas formas en que se presentan los atributos reciben el nombre de "modalidades". Por ejemplo, el
estado civil de cada uno de los estudiantes del curso de estadística, no se presenta en la misma modalidad en
todos.

Se les denomina variable porque son características que, al ser medidas en diferentes individuos, son
susceptibles de adoptar diferentes valores. Existen diferentes tipos de variables, entre ellas:

1. Según la medición:
1.1 Variables cualitativas
1.2 Variables cuantitativas
2. Según la influencia
2.1 Variables independientes
2.2 Variables dependientes
3. Otras
3.1 Variable interviniente
3.2 Variable moderadora

Si analizamos las variables según la medición, encontraremos:

1. Variables cualitativas: Son las variables que expresan distintas cualidades, características o modalidad, y no
pueden ser medidas con números. Cada modalidad que se presenta se denomina atributo o categoría y la
medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas
cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando
pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:

a. Variable cualitativa ordinal: También llamada variable cuasicuantitativa, puede tomar distintos valores
ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones
sea uniforme, por ejemplo: leve, moderado, grave.
b. Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden
como por ejemplo los colores o el lugar de residencia.

Sapere Aude
Atrévete a saber
9
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
2. Variables cuantitativas: Son las variables que se expresan mediante cantidades numéricas, por tanto se
pueden realizar operaciones aritméticas con ella. Las variables cuantitativas además pueden ser:

a. Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que
puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores
específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).
b. Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de
valores. Por ejemplo, la masa (2,3 kg, 2,4 kg, 2,5 kg, ...) o la altura (1,64 m, 1,65 m, 1,66 m, ...), que
solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un
valor entre dos variables.

Si las analizamos según la influencia que asignemos a unas variables sobre otras, podrán ser:

1. Variables independientes: Una variable independiente es aquella cuyo valor no depende del de otra variable.
Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrínsecamente a
los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables
independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de
un sesgo. Es aquella característica o propiedad que se supone ser la causa del fenómeno estudiado. En
investigación experimental se llama así a la variable que el investigador manipula.
2. Variables dependientes: Una variable dependiente es aquella cuyos valores dependen de los que tomen otra
variable. Son las variables de respuesta que se observan en el estudio y que podrían estar influenciadas por
los valores de las variables independientes. Hayman (1974) la define como propiedad o característica que se
trata de cambiar mediante la manipulación de la variable independiente. La variable dependiente es el factor
que es observado y medido para determinar el efecto de la variable independiente.

Otros tipos de variables que se pueden determinar son:

1. Variable interviniente: Son aquellas características o propiedades que de una manera u otra afectan el
resultado que se espera y están vinculadas con las variables independientes y dependientes.
2. Variable moderadora: Según Tuckman: representan un tipo especial de variable independiente, que es
secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la variable independiente
primaria y las variables dependientes.

Fuentes estadísticas

Se ha indicado que el objetivo de la Estadística es el estudio de los fenómenos de masas y que ello requiere el
manejo de una información numérica amplia. La cuestión inmediata que surge es saber de dónde se puede
obtener esa información, sin la cual el análisis estadístico no se puede realizar. En definitiva, se trata de conocer
las fuentes que suministran información de carácter estadístico. Estas fuentes son susceptibles de clasificarse
según distintos criterios: Atendiendo al agente que elabore esa información, la misma puede agruparse en
endógena y exógena; la primera sería la que elabora el propio investigador

Si es endógena, la operación estadística conducente a recabar los datos necesarios para la realización del análisis
estadístico, se supone que es realizada por el propio investigador, quien se encargará de observar los distintos
caracteres, cuantitativos o cualitativos, relevantes de los elementos de una población. El resultado será una base
de datos, obtenida mediante una muestra, o cualquiera de los otros procedimientos indicados con anterioridad,

Sapere Aude
Atrévete a saber
10
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
que permitirá el correspondiente análisis estadístico. Esta situación se da cuando no existe fuente alternativa
exógena capaz de facilitar esa información.

Si la fuente es exógena, la podemos definir como aquella cuyo objeto principal es la obtención de información
estadística pero que no actúa como usuaria. Las fuentes exógenas son múltiples y a su vez se las puede clasificar
en dos categorías distintas. Por un lado, están las fuentes oficiales o públicas y, por otro, las privadas. De todas
ellas las que generan mayor volumen de información son las primeras, es decir, las oficiales o públicas. Estas
últimas se pueden clasificar, a su vez, según el ámbito espacial en que desarrollan sus competencias en materia
estadística. Así se tienen las fuentes de carácter internacional, las de ámbito estatal, las de ámbito regional o
autonómico y las de carácter local.

Sapere Aude
Atrévete a saber
11
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Estadística descriptiva
Datos no agrupados

Una de las principales funciones de la estadística consiste en la descripción de los datos; ya sea por medio de
medidas (estimadores), gráficos o tablas en las que se puedan apreciar claramente el comportamiento y las
tendencias de la información recopilada. Debemos recordar que la estadística es un sistema o método empleado
en la recolección, organización, análisis e interpretación de los datos. Esta ciencia se divide en dos fases; la
primera corresponde a la Estadística descriptiva, cuya finalidad es agrupar y representar la información de forma
ordenada, de tal manera que nos permita identificar rápidamente aspectos característicos del comportamiento
de los datos. La segunda fase corresponde a la Estadística de Inferencia, la cual busca dar explicación al
comportamiento o hallar conclusiones de un amplio grupo de individuos, objetos o sucesos a través del análisis
de una pequeña fracción de sus componentes (Muestra).

En este capítulo nos concentraremos exclusivamente en la Estadística Descriptiva y los procedimientos que la
componen, como las medidas de tendencia central, medidas de distribución y las medidas de dispersión. Antes
de conocer cada una de estas medidas es necesario resaltar la diferencia entre Población y Muestra. Se denomina
Población al total de los elementos que componen un conjunto, el cual es el objeto de interés de un estudio.

Las poblaciones pueden ser finitas o infinitas de acuerdo si se conoce el total de los elementos que la componen
o no. Generalmente es bastante difícil realizar un estudio con el total de la población, ya sea porque es demasiado
grande, requiere demasiado tiempo para su análisis, los costos son muy elevados, se desconoce el total de
elementos, etc. Por estas razones se suele sustraer una pequeña fracción de la población para realizar los análisis;
de tal manera que las conclusiones que se extraigan sobre la fracción sean aplicables a la población. A esta
fracción se le denomina Muestra y cada uno de los procedimientos estadísticos presenta algunas variaciones en
sus ecuaciones de acuerdo si los datos representan muestras o poblaciones.

Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que nos resumen la
información contenida en ella. El siguiente cuadro nos muestra un panorama global de las medidas descriptivas:

Posición: que dividen un conjunto ordenado de datos en grupos con igual cantidad de
elementos. Trataremos los deciles, cuartiles, quintiles y percentiles.

Centralización: indican valores con respecto a los que los datos parecen agruparse.
Estudiaremos la media aritmética, la mediana y la moda.
Medidas descriptivas
Dispersión: indican la mayor o menor concentración de los datos con respecto a las
medidas de centralización. Estudiaremos el rango o recorrido, la varianza, la
desviación estándar y el coeficiente de variación.

Forma o distribución: identifican la forma en que se separan o aglomeran los valores


de acuerdo con su representación gráfica. Estudiaremos los coeficientes de sesgo y
de curtosis.

Sapere Aude
Atrévete a saber
12
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

Medidas de posición: Los cuantiles

Los cuantiles son valores de la distribución que la dividen en partes iguales, es decir, en intervalos, que
comprenden el mismo número de valores. Los más usados son los cuartiles, los deciles, los quintiles y los
percentiles.

Deciles

Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso
particular de los percentiles. Por ejemplo, el tercer decil (D3) es el menor valor que es mayor que un 30% de los
datos, el sétimo decil (D7) es el menor valor que es mayor que un 70% de los datos.

Cuartiles

Son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso particular
de los percentiles. El primer cuartil (Q1) es el menor valor que es mayor que una cuarta parte de los datos, el
segundo cuartil (Q2) (la mediana), es el menor valor que es mayor que la mitad de los datos y el tercer cuartil (Q3)
es el menor valor que es mayor que tres cuartas partes de los datos.

Quintiles

Son los cuatro valores que dividen al conjunto de datos ordenados en cinco partes iguales, son también un caso
particular de los percentiles. Por ejemplo, el tercer quintil (K3) es el menor valor que es mayor que un 20% de los
datos, el cuarto quintil (K4) es el menor valor que es mayor que un 80% de los datos.

Percentiles

Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden
15 (P15) deja por debajo al 15% de las observaciones, y por encima queda el 85%.

Para obtener un cuantil, se obtiene primero el percentil correspondiente y luego se utiliza la fórmula general
para calcular los percentiles:
𝑚 ∙ (𝑛 + 1)
𝑃𝑚 = 𝑌𝑗 + ( − 𝑗) (𝑌𝑗+1 − 𝑌𝑗 )
100
Donde:
𝑚∙(𝑛+1)
j = parte entera de 100 , que representa la posición en los datos ordenados.
Yj representa el valor de la posición j en los datos ordenados.

Definamos un conjunto de datos no agrupados, es decir, datos y no grupos o clases de datos, como el siguiente:

78 48 1 82
31 22 32 84
86 68 72 6
44 75 42 3
50 84 64 98
Sapere Aude
Atrévete a saber
13
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

Lo primero que debemos hacer es ordenarlos:


1
3
6
22
31
32
42
44
48
50
64
68
72
75
78
82
84
84
86
98

A partir de ese ordenamiento, definiremos algunas medidas de posición: D3, Q2, K4; P15:

30 ∗ (20 + 1)
𝐷3 = 𝑃30 = 𝑌6 + ( − 6) (𝑌6+1 − 𝑌6 ) = 32 + (6,3 − 6)(42 − 32) = 35
100
50 ∗ (20 + 1)
𝑄2 = 𝑃50 = 𝑌10 + ( − 10) (𝑌10+1 − 𝑌10 ) = 50 + (10,5 − 10)(64 − 50) = 57
100
80 ∗ (20 + 1)
𝐾4 = 𝑃80 = 𝑌16 + ( − 16) (𝑌16+1 − 𝑌16 ) = 82 + (16,8 − 16)(84 − 82) = 83,6
100
15 ∗ (20 + 1)
𝑃15 = 𝑌3 + ( − 3) (𝑌3+1 − 𝑌3 ) = 6 + (3,15 − 3)(22 − 6) = 8,4
100

Medidas de centralización o tendencia central

Este tipo de medidas nos permiten identificar y ubicar el punto (valor) alrededor del cual se tienden a reunir los
datos (“Punto central”). Estas medidas aplicadas a las características de las unidades de una muestra se les
denomina estimadores o estadígrafos; mientras que aplicadas a poblaciones se les denomina parámetros o
valores estadísticos de la población. Los principales métodos utilizados para ubicar el punto central son la media,
la mediana y la moda.

Media Aritmética

Es la medida de posición central más utilizada, la más conocida y la más sencilla de calcular, debido
principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su
Sapere Aude
Atrévete a saber
14
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado
grandes o pequeños. La media se define como la suma de todos los valores observados, dividido por el número
total de observaciones.
∑ 𝑥𝑖
𝜇 = 𝑥̅ =
𝑛
1070
En el ejemplo que hemos estado utilizando, la media aritmética sería: 𝑥̅ = 20 = 53,5.
Es importante resaltar que existe una gran variedad de medias como la Media geométrica, la Media ponderada,
la Media cuadrática, etc. En general, a la media aritmética se le conoce como media o como promedio.

Mediana

Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, nos permite
conocer el valor que se encuentra exactamente en la mitad del conjunto de datos después que las observaciones
se han ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran por debajo
de este valor y la otra mitad por encima del mismo.

La mediana nos indica el valor que separa los datos en dos fracciones iguales, con el cincuenta por ciento de los
datos cada una. Para las muestras que cuentan con un número impar de observaciones o datos, la mediana dará
como resultado la posición del medio de los datos; mientras que para las muestras con un número par de
observaciones se deben promediar los valores de las dos posiciones centrales.

En el ejemplo que estamos desarrollando, como el número de observaciones es par (20), entonces se deben
50+64
promediar los dos datos del centro de los datos ordenados: 𝑀𝑒 = = 57. Obsérvese que la mediana es igual
2
a Q2, D5 y P50.

Moda

La medida modal nos indica el valor que más veces se repite dentro de los datos. Es posible que en algunas
ocasiones se presenten dos o más valores con la mayor frecuencia, lo que se conoce como multimodal, o que no
se presente repetición de datos, lo que se conoce como amodal.

En el ejemplo que estamos realizando, tenemos que el valor 84 se repite dos veces, y no hay otro valor que se
repita, por lo que la moda es Mo = 84. Si hubiese un valor que se repite tres veces, aunque el 84 se repita dos
veces, ese valor asumiría el rango de Moda.

En conclusión, las Medidas de tendencia central nos permiten identificar los valores más representativos de los
datos, de acuerdo con la manera como se tienden a concentrar. La Media (𝜇 𝑜 𝑥̅ ) nos indica el promedio de los
datos; es decir, nos informa el valor que obtendría cada uno de los individuos si se distribuyeran los valores en
partes iguales. La Mediana (Me) por el contrario nos informa el valor que separa los datos en dos partes iguales,
cada una de las cuales cuenta con el cincuenta por ciento de los datos. Por último, la Moda (Mo) nos indica el
valor que más se repite dentro de los datos.

En cuanto a la simbología, µ representa la media poblacional mientras que 𝑥̅ la media muestral, Me la mediana
y Mo la moda.

Sapere Aude
Atrévete a saber
15
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

Medidas de Dispersión

Así como las medidas de tendencia central nos permiten identificar el punto central de los datos, las medidas de
dispersión nos permiten reconocer qué tanto se dispersan los datos alrededor del punto central; es decir, nos
indican cuanto se desvían las observaciones alrededor de su promedio aritmético (Media 𝑥̅ ). Este tipo de medidas
son parámetros informativos que nos permiten conocer cómo los valores de los datos se reparten a través de
eje X, mediante un valor numérico que representa el promedio de dispersión de los datos. Las medidas de
dispersión más importantes y las más utilizadas son el Rango, la Varianza, la Desviación estándar (o Típica) y el
Coeficiente de Variación.

Rango

Esta medida nos permite identificar la separación total entre los extremos de los datos, es decir, la longitud del
rango de datos. Se calcula restándole al mayor valor de los datos, el menor valor de los datos: 𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 .
En nuestro ejemplo, el rango sería: 𝑅 = 98 − 1 = 97.

Varianza

Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su
punto central (Media 𝑥̅ ). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (con el
fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados
de las diferencias de cada valor respecto a la media y dividiendo este resultado por el número de observaciones
que se tengan.

La varianza se calcula como:


(𝑥−𝜇)2
𝜎2 = ∑ 𝑛
si es poblacional
(𝑥−𝑥̅ ) 2
𝑠2 = ∑ si es muestral
𝑛−1
En nuestro ejemplo:

(1 - 53,5)2 / 19 = 145,07
(3 - 53,5)2 / 19 = 134,22
(6 - 53,5)2 / 19 = 118,75
(22 - 53,5)2 / 19 = 52,22
(31 - 53,5)2 / 19 = 26,64
(32 - 53,5)2 / 19 = 24,33
(42 - 53,5)2 / 19 = 6,96
(44 - 53,5)2 / 19 = 4,75
(48 - 53,5)2 / 19 = 1,59
(50 - 53,5)2 / 19 = 0,64
(64 - 53,5)2 / 19 = 5,80
(68 - 53,5)2 / 19 = 11,07
(72 - 53,5)2 / 19 = 18,01
(75 - 53,5)2 / 19 = 24,33
(78 - 53,5)2 / 19 = 31,59
Sapere Aude
Atrévete a saber
16
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
(82 - 53,5)2 / 19 = 42,75
(84 - 53,5)2 / 19 = 48,96
(84 - 53,5)2 / 19 = 48,96
(86 - 53,5)2 / 19 = 55,59
(98 - 53,5)2 / 19 = 104,22
s2 = 906,47
Desviación estándar o Típica

Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos respecto a su punto
central o media. La desviación estándar nos da como resultado un valor numérico que representa el promedio
de diferencia que hay entre los datos y la media. Para calcular la desviación estándar basta con hallar la raíz
cuadrada de la varianza. En nuestro ejemplo: 𝑠 = √906,47 = 30,11.

Para comprender el concepto de las medidas de distribución vamos a suponer que el gerente de una empresa
de alimentos desea saber que tanto varían los pesos de los empaques (en gramos), de uno de sus productos; por
lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes
pesos (490, 500, 510, 515 y 520) gramos respectivamente.

Por lo que su media es:


490+500+510+515+520 2535
𝑥̅ = 5
= 5
= 507
El rango sería R = 520 -490 = 30.

La varianza sería:
(490−507)2 +(500−507)2 +(510−507)2 +(515−507)2 +(520−507)2 289+49+9+64+169 580
𝑠2 = 5−1
= 4
= 4
= 145

Por lo tanto, la desviación estándar sería:


𝑠 = √145 = 12,04

Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con una tendencia a variar
por debajo o por encima de dicho peso en 12 gramos. Esta información le permite al gerente determinar cuánto
es el promedio de perdidas causado por el exceso de peso en los empaques y le da las bases para tomar los
correctivos necesarios en el proceso de empacado.

En cuanto a la simbología, σ2 representa la varianza poblacional, s2 la varianza muestral, σ representa la


desviación estándar poblacional, s la desviación estándar muestral y R representa el Rango.

Coeficiente de variación

En estadística, cuando se desea hacer referencia a la relación entre el tamaño de la media y la variabilidad de la
variable, se utiliza el coeficiente de variación. Su fórmula expresa la desviación estándar como porcentaje de la
media aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación
típica o estándar. Por otro lado, presenta problemas ya que a diferencia de la desviación típica este coeficiente
es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media dé,
por tanto, un valor positivo. A mayor valor del coeficiente de variación mayor heterogeneidad de los valores de
la variable; y a menor coeficiente de variación, mayor homogeneidad en los valores de la variable. Suele
representarse por medio de las siglas CV.
Sapere Aude
Atrévete a saber
17
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

Se calcula:
𝜎 𝑠
𝐶𝑉 = =
̅
|𝜇| |𝑥|

30,11
En nuestro ejemplo, el 𝐶𝑉 = 53,5
= 0,56.

Entre sus propiedades se detalla que el coeficiente de variación no posee unidades, es típicamente menor que
uno, sin embargo en ciertas distribuciones de probabilidad puede ser 1 o mayor que 1, para su mejor
interpretación se expresa como porcentaje, depende de la desviación típica, también llamada "desviación
estándar", y en mayor medida de la media aritmética, dado que cuando ésta es 0 o muy próxima a este valor el
CV pierde significado, ya que puede dar valores muy grandes, que no necesariamente implican dispersión de
datos. El coeficiente de variación es común en varios campos de la probabilidad aplicada, como teoría de
renovación y teoría de colas. En estos campos la distribución exponencial es a menudo más importante que la
distribución normal. La desviación típica de una distribución exponencial es igual a su media, por lo que su
coeficiente de variación es 1. Las distribuciones con un CV menor que uno, como la distribución de Erlang se
consideran de "baja varianza", mientras que aquellas con un CV mayor que uno, como la distribución
hiperexponencial se consideran de "alta varianza". Algunas fórmulas en estos campos se expresan usando el
cuadrado del coeficiente de variación, abreviado como SCV.

Medidas de Forma o Distribución

Las medidas de forma o distribución nos permiten identificar la forma en que se separan o aglomeran los valores
de acuerdo con su representación gráfica. Estas medidas describen la manera como los datos tienden a reunirse
de acuerdo con la frecuencia con que se hallen dentro de la información. Su utilidad radica en la posibilidad de
identificar las características de la distribución sin necesidad de generar el gráfico. Sus principales medidas son
la Asimetría y la Curtosis.

Asimetría

La asimetría es la medida que indica la simetría de la distribución de una variable respecto a la media aritmética,
sin necesidad de hacer la representación gráfica. Los coeficientes de asimetría indican si hay el mismo número
de elementos a izquierda y derecha de la media.

Existen tres tipos de curva de distribución según su asimetría:

• Asimetría negativa: la cola de la distribución se alarga para valores inferiores a la media.


• Simétrica: hay el mismo número de elementos a izquierda y derecha de la media. En este caso, coinciden
la media, la mediana y la moda. La distribución se adapta a la forma de la campana de Gauss, o
distribución normal.
• Asimetría positiva: la cola de la distribución se alarga para valores superiores a la media.

Sapere Aude
Atrévete a saber
18
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

Existen tres coeficientes de asimetría:

Coeficiente de asimetría de Fisher: El coeficiente de asimetría de Fisher CAF evalúa la proximidad de los datos a
su media x. Cuanto mayor sea la suma ∑𝑁 3
𝑖=1(𝑥𝑖 − 𝑥̅ ) , mayor será la asimetría. Sea el conjunto X = (x1, x2, …, xN),
entonces la fórmula de la asimetría de Fisher es:
∑𝑁 𝑖=1(𝑥𝑖 − 𝑥̅ )
3
𝐶𝐴𝐹 =
𝑁𝑠 3
• Si CAF < 0: la distribución tiene una asimetría negativa y se alarga a valores menores que la media.
• Si CAF = 0: la distribución es simétrica.
• Si CAF > 0: la distribución tiene una asimetría positiva y se alarga a valores mayores que la media.

En nuestro ejemplo: 𝐶𝐴𝐹 = −0,36, por lo que la distribución es asimétrica negativa. Compruébelo.

Coeficiente de asimetría de Pearson: El coeficiente de asimetría de Pearson CAP mide la diferencia entre la media
y la moda respecto a la dispersión del conjunto X = (x1, x2, …, xN). Este procedimiento, menos usado, lo
emplearemos solamente en distribuciones unimodales y poco asimétricas.
𝑥̅ − 𝑀𝑜
𝐶𝐴𝑃 =
𝑠

• Si CAP < 0: la distribución tiene una asimetría negativa, puesto que la media es menor que la moda.
• Si CAP = 0: la distribución es simétrica.
• Si CAP > 0: la distribución tiene una asimetría positiva, ya que la media es mayor que la moda.

En nuestro caso 𝐶𝐴𝑃 = −1,01, por lo que la distribución es asimétrica negativa. Compruébelo.
Sapere Aude
Atrévete a saber
19
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

Coeficiente de asimetría de Bowley: El coeficiente de asimetría de Bowley CAB toma como referencia los cuartiles
para determinar si la distribución es simétrica o no. Para aplicar este coeficiente, se supone que el
comportamiento de la distribución en los extremos es similar. Sea el conjunto X = (x 1, x2, …, xN), la asimetría de
Bowley es:
𝑄3 + 𝑄1 − 2𝑀𝑒
𝐶𝐴𝐵 =
𝑄3 − 𝑄1
• Si CAB < 0: la distribución tiene una asimetría negativa, puesto que la distancia de la mediana al primer
cuartil es menor que al tercero.
• Si CAB = 0: la distribución es simétrica, ya que el primer y tercer cuartil están a la misma distancia de la
mediana.
• Si CAB > 0: la distribución tiene una asimetría positiva, ya que la distancia de la mediana al tercer cuartil
es mayor que al primero.

Para nuestro ejemplo 𝐶𝐴𝐵 = −0,46, por lo que la distribución es asimétrica negativa. Compruébelo.

Para todos los casos de asimetría, se considerará que el valor 0 se logra en el intervalo [0,5, -0,5], a efectos de
compensar los redondeos que se hacen en los cálculos, usualmente usaremos dos decimales para expresar la
asimetría. Dado lo anterior, consideraremos que los coeficientes de asimetría de Fisher y Bowley nos dan una
asimetría estimada como simétrica.

Curtosis

La curtosis (o apuntamiento) es una medida de forma que mide cuán escarpada o achatada está una curva o
distribución. Este coeficiente indica la cantidad de datos que hay cercanos a la media, de manera que a mayor
grado de curtosis, más escarpada (o apuntada) será la forma de la curva.

La curtosis se mide promediando la cuarta potencia de la diferencia entre cada elemento del conjunto y la media,
dividido entre la desviación típica elevado también a la cuarta potencia. Sea el conjunto X=(x1, x2,…, xN), entonces
el coeficiente de curtosis será:
∑𝑁𝑖=1(𝑥𝑖 − 𝑥̅ )
4
𝐶𝐶 = −3
𝑁𝑠 4

En la distribución normal se verifica que μ4 = 3σ4, donde μ4 es el momento de orden 4 respecto a la media y ha
sustraído 3, que es la curtosis de la distribución normal o gaussiana, con objeto de generar un coeficiente que
valga 0 para la Normal y tome a ésta como referencia de apuntamiento. Tomando la distribución normal como
referencia, una distribución puede ser:
• Leptocúrtica, cuando CC > 0: más apuntada y con colas menos anchas que la normal.
• Platicúrtica, cuando CC < 0: menos apuntada y con colas más anchas que la normal.
• Mesocúrtica, cuando CC = 0: tiene una distribución normal.
Sapere Aude
Atrévete a saber
20
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

Para la curtosis, se considerará que el valor 0 se logra en el intervalo [0,5, -0,5], a efectos de compensar los
redondeos que se hacen en los cálculos, usualmente usaremos dos decimales para expresar la curtosis. En
nuestro ejemplo, se tendrá que 𝐶𝐶 = −1,24, por lo que la distribución es platicúrtica. Compruébelo.

Datos Agrupados

Diagramas de tallo y hoja

La media, mediana y la desviación estándar son resúmenes numéricos de una muestra o de una población. Los
resúmenes gráficos también se usan para ayudar a visualizar una lista de números. Un resumen gráfico es el
diagrama de tallo y hoja. Una gráfica de tallos y hojas constituye una manera simple de resumir un conjunto de
datos.

Cada elemento de la muestra se divide en dos partes: un tallo, que consta de uno o dos dígitos que están en el
extremo izquierdo, y la hoja, que consta del siguiente dígito significativo. Cada renglón del diagrama de tallos y
hojas contiene todos los elementos de la muestra con un tallo dado. El diagrama de tallos y hojas es una forma
compacta de representar los datos. También indica un poco su forma.

Si se tienen los datos:


91 17 87 27 19
66 50 76 28 56
74 28 61 31 95
50 58 87 45 57
62 50 32 42 93
74 4 65 46 95
79 13 21 45 38
71 41 32 76 59
94 68 50 27 17
79 13 87 17 38
56 4 70 94 81

Su diagrama de tallo y hojas sería:


Tallo Hojas
0 4, 4
1 3, 3, 7, 7, 7, 9
2 1, 7, 7, 8, 8
3 1, 2, 2, 8, 8
4 1, 2, 5, 5, 6
Sapere Aude
Atrévete a saber
21
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
5 0, 0, 0, 0, 6, 6, 7, 8, 9
6 1, 2, 5, 6, 8
7 0, 1, 4, 4, 6, 6, 9, 9
8 1, 7, 7, 7
9 1, 3, 4, 4, 5, 5

Histogramas, polígonos de frecuencia y ojivas

Un histograma es una gráfica que da una idea de la “forma” de una muestra, indicando las regiones donde los
puntos de la muestra están concentrados y las regiones donde son escasos. En estadística, un histograma es una
representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a
la frecuencia de los valores representados. En el eje vertical se representan las frecuencias y en el eje horizontal
los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que
están agrupados los datos.

En términos matemáticos, puede ser definido como una función inyectiva (mapeo) que acumula (cuenta) las
observaciones que pertenecen a cada subintervalo de una partición. El histograma, como es tradicionalmente
entendido, no es más que la representación gráfica de dicha función. Se utiliza cuando se estudia una variable
continua y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos.

Entre los diferentes tipos de diagramas que existen, los diagramas de barras simples representan la frecuencia
simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la
categoría que representa. El Polígono de frecuencias es un gráfico de líneas de las frecuencias absolutas de los
valores de una distribución en el cual la altura del punto asociado a un valor de las variables es proporcional a la
frecuencia de dicho valor. La Ojiva de frecuencias acumuladas porcentuales es un gráfico acumulativo, el cual es
muy útil cuando se quiere representar el rango porcentual de cada valor en una distribución de frecuencias. En
los gráficos las barras se encuentran juntas y en la tabla los números poseen en el primer miembro un corchete
y en el segundo un paréntesis, por ejemplo: [10-20).

Los histogramas y los polígonos de frecuencia son dos representaciones gráficas de las distribuciones de
frecuencia:

1. Un histograma o histograma de frecuencias consiste en una serie de rectángulos que tienen:

a. Sus bases sobre un eje horizontal (el eje X) con centros en las marcas de clase y longitud igual al tamaño
de los intervalos de clase.

b. Superficies proporcionales a las frecuencias de clase: Si los intervalos de clase tienen todos iguales
tamaños, las alturas de los rectángulos son proporcionales a las frecuencias de clase y se acostumbra en
tal caso a tomar las alturas numéricamente iguales a las frecuencias de clase. Si los intervalos de clase no
son de igual tamaño, estas alturas deberán ser calculadas.

2. Un polígono de frecuencias es un gráfico de línea trazado sobre las marcas de clase. Puede obtenerse uniendo
los puntos medios de los techos de los rectángulos en el histograma.

Sapere Aude
Atrévete a saber
22
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Construcción de un histograma

Paso 1: Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.
Paso 2: Obtener los números de clases, existen varios criterios para determinar el número de clases (o barras),
sin embargo ninguno de ellos es exacto. Recomendamos de cinco a veinte clases, dependiendo de cómo
estén los datos y cuántos sean. Un criterio usado frecuentemente es que el número de clases debe ser
aproximadamente a la raíz cuadrada del número de datos. Por ejemplo, la raíz cuadrada de 30 (número
de artículos) es mayor que cinco, por lo que se seleccionan seis clases.
Paso 3: Establecer la longitud de clase: es igual al rango dividido por el número de clases.
Paso 4: Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en relación con
el resultado del Paso 2 en intervalos iguales.
Paso 5: Graficar el histograma. En caso de que las clases sean todas de la misma amplitud, se hace un gráfico de
barras, las bases de las barras son los intervalos de clases y altura son la frecuencia de las clases. Si se
unen los puntos medios de la base superior de los rectángulos se obtiene el polígono de frecuencias.

El histograma y el polígono de frecuencias correspondiente a una distribución de frecuencias de las alturas de


estudiantes se muestran en el mismo sistema de ejes en la Fig. 1. Se acostumbra a prolongar el polígono con PQ
y RS hasta las marcas de clase inferior y superior inmediatas, que corresponderían a la clase de frecuencia cero.
En tal caso, la suma de las áreas de los rectángulos del histograma es igual al área total limitada por el polígono
de frecuencias y el eje X.

Figura 1

Si las frecuencias del anterior gráfico de frecuencias se sustituyen por las correspondientes frecuencias relativas,
se denomina distribución de frecuencias relativas o distribución porcentual. Las representaciones gráficas de
distribuciones de frecuencia relativa pueden obtenerse del histograma o del polígono de frecuencias, sin más
que cambiar la escala vertical de frecuencia a frecuencia relativa, conservándose exactamente el mismo
diagrama. Los gráficos que resultan se llaman histogramas de frecuencias relativas o histogramas porcentuales
y polígonos de frecuencias relativas o polígonos porcentuales, respectivamente.

La frecuencia total de todos los valores menores que el límite real superior de clase de un intervalo de clase dado,
se conoce como frecuencia acumulada hasta ese intervalo de clase inclusive. Una tabla que represente las
frecuencias acumuladas se llama distribución de frecuencias acumuladas, tabla de frecuencias acumuladas o
brevemente distribución acumulada, y se muestra un ejemplo en la Tabla 1.

Sapere Aude
Atrévete a saber
23
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Altura Número de
(cm) estudiantes
Menor que 159,5 0
Menor que 162,5 5
Menor que 165,5 23
Menor que 168,5 65
Menor que 171,5 92
Menor que 174,5 100
Alturas de Estudiantes,
Tabla 1
Un gráfico que muestre las frecuencias acumuladas menores que cualquier límite real superior de clase trazado
sobre los límites reales superiores de clase se llama polígono de frecuencias acumuladas u ojiva y se muestra en
la Fig. 2 para la distribución de la altura de los estudiantes.
100%
100%
80% 92%
Acumuladas
Frecuencias

60% 65%
40%
20% 23%
0% 5%
0%
< 159,5 < 162,5 < 165,5 < 168,5 < 171,5 < 174,5
Altura en cm

Figura 2

En algunos casos es preferible considerar una distribución de frecuencias acumuladas de todos los valores
mayores o iguales al límite real inferior de clase de cada intervalo de clase. En este caso consideramos las alturas
de 159,5 centímetros o más, 162,5 centímetros o más, etc., ésta se llama a veces distribución acumulada «o
más», mientras que la considerada anteriormente es la distribución acumulada «menor que». De la una se
obtiene fácilmente la otra. Las correspondientes ojivas se llaman «o más» y «menor que». Siempre que nos
refiramos a distribuciones acumuladas u ojivas sin especificar, se entenderá que son del tipo «menor que».

La frecuencia relativa acumulada o frecuencia porcentual acumulada es la frecuencia acumulada dividida por la
frecuencia total. Por ejemplo, la frecuencia relativa acumulada de alturas menores que 168,5 centímetros es
65/100 = 65 %, queriendo con ello decir que el 65 % de los estudiantes tienen alturas menores de 168,5
centímetros.

Si se utilizan en la Tabla 1 y Fig. 2 las frecuencias relativas acumuladas en lugar de las frecuencias acumuladas,
los resultados se llaman distribuciones de frecuencias relativas acumuladas o distribuciones porcentuales
acumuladas y polígonos de frecuencias relativas acumuladas u ojivas porcentuales, respectivamente.

El conjunto de datos puede considerarse normalmente como perteneciente a una muestra extraída, de una
población grande. A causa de las muchas observaciones que podemos realizar en la población es posible
teóricamente (para datos continuos) elegir los intervalos de clase muy pequeños y todavía tener un número
adecuado de observaciones dentro de cada clase. Así se tiene que el polígono de frecuencias o el de frecuencias
relativas para una población grande puede estar formado por muchos pequeños segmentos rectos que
aproximan el conjunto a una curva, las curvas de este tipo pueden llamarse curvas de frecuencias o curvas de
frecuencias relativas, respectivamente.
Sapere Aude
Atrévete a saber
24
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

Es razonable esperar que tales curvas teóricas provengan de la suavización de los polígonos de frecuencias o de
los polígonos de frecuencias relativas de la muestra, la aproximación es tanto más exacta conforme aumenta el
tamaño de la muestra. Por esta razón una curva de frecuencias se conoce como un polígono de frecuencias
suavizado.

De una forma análoga las ojivas suavizadas provienen de la suavización de los polígonos de frecuencias
acumuladas u ojivas. Normalmente es más sencillo suavizar una ojiva que un polígono de frecuencias.

Las curvas de frecuencia presentan determinadas formas características que les distinguen como se indica en la
Figura 3.

Simétrica o bien formada Sesgada a la derecha Sesgada a la izquierda


(sesgo positivo) (sesgo negativo)

En forma de J En forma de J invertida En forma de U

Bimodal
Multimodal
Figura 3

a. Las curvas de frecuencia simétricas o bien formadas se caracterizan por el hecho de que las
observaciones que equidistan del máximo central tienen la misma frecuencia. Un ejemplo
importante es la curva normal.

b. En las curvas de frecuencia moderadamente asimétricas o sesgadas la cola de la curva a un lado


del máximo central es mayor que al otro lado. Si la cola mayor se presenta a la derecha de la
curva se dice que ésta está sesgada a la derecha o que tiene sesgo positivo, mientras que si
ocurre lo contrario se dice que la curva está sesgada a la izquierda o que tiene un sesgo negativo.

c. En las curvas en forma de J o de / invertida, el máximo se presenta en un extremo.

d. Las curvas de frecuencias en forma de U tienen el máximo en ambos extremos.

e. Una curva de frecuencias bimodal tiene dos máximos.

Una curva de frecuencias multimodal tiene más de dos máximos.

Sapere Aude
Atrévete a saber
25
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Diagramas de caja y bigotes

Un diagrama de caja constituye una gráfica que incluye la mediana, el primero y el tercer cuartil y cualquier dato
atípico que se presente en una muestra. Los diagramas de caja son fáciles de comprender, pero hay una pequeña
terminología asociada con ellos. El rango intercuartil es la diferencia entre el tercer y el primer cuartil. Observe
que debido a que 75% de los datos son menores que el tercer cuartil y que 25% de los datos son menores que el
primer cuartil, la mitad de los datos está entre el primero y el tercer cuartil. Por tanto, el rango intercuartil
representa la distancia necesaria para atravesar la mitad de los datos de en medio. Se ha definido a los datos
atípicos como puntos que son inusualmente grandes o pequeños.

Para construirlo se siguen los siguientes pasos:

Paso 1: Ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles Q1, Q2 y Q3 y el rango intercuartílico
(RIC = Q3 – Q1).
Paso 2: Los bigotes, las líneas que se extienden desde la caja, se extienden desde el valor mínimo de la serie hasta
el valor máximo de la serie o hasta ± 1,5 veces el RIC. Cuando los datos se extienden más allá de estos
valores relativos al RIC, significa que hay valores atípicos en la serie y entonces hay que calcular los límites
superior e inferior, Li y Ls, para lo que se consideran atípicos los valores inferiores a Q1 – 1,5RIC o
superiores a Q3 + 1,5RIC. Luego se buscan los últimos valores que no son atípicos, que serán los extremos
de los bigotes.

Paso 3: Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).

Paso 4: El diagrama consta de una caja cuyo lado inferior es el primer cuartil y el lado superior es el tercer cuartil.
La mediana se dibuja como una línea horizontal. Los datos “atípicos” se grafican por separado y se indican
con cruces en la figura. Los que se extienden desde la parte superior a la inferior de la caja son líneas
verticales llamadas “bigotes”. Éstos terminan en los puntos más extremos que no son atípicos.

Los diagramas de caja y bigotes proporcionan una visión general de la simetría de la distribución de los datos; si
la mediana no está en el centro del rectángulo, la distribución no es simétrica. Son útiles para ver la presencia de
valores atípicos también llamados outliers. Pertenece a las herramientas de la estadística descriptiva y permite
ver cómo es la dispersión de los puntos con la mediana, los percentiles 25 y 75 y los valores máximos y mínimos.
Ponen en una sola dimensión los datos de un histograma, facilitando así el análisis de la información al detectar
que el 50% de la población está en los límites de la caja.

Considere que se tienen los datos:


75 57 78 81 90
90 92 55 94 86
67 88 59 53 66

Con ellos se obtiene:


Pm m m(n+1)/100 j Yj Yj+1
Q1 = 59 25 4,00 4 59 66
Q2 = 78 50 8,00 8 78 81
Q3 = 90 75 12,00 12 90 90
Min = 53
Max = 94
Sapere Aude
Atrévete a saber
26
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
RIC = 31
Li = 32
Ls = 125

Distribuciones de frecuencia

Las estadísticas son producto de la operación de contar o medir y pueden nacer de características cuantificables
(en forma continua o discreta) o cualificables. Las distribuciones de frecuencias son las clasificaciones que se
refieren a variables cuantitativas o cualitativas y que constituyen un instrumento de trabajo estadístico.

En el análisis e interpretación de las estadísticas correspondientes a datos cuantitativos, es necesario disponer


de elementos descriptivos que informen acerca de la forma o patrón de distribución de los datos, de la posición
de la distribución (alrededor de qué valor tienden a concentrarse los datos, valores conocidos como datos
centrales) y la dispersión o variabilidad de los datos alrededor de los valores centrales o medios.

Para obtener estos elementos descriptivos se recurre a la Distribución de Frecuencias, que puede definirse como
una ordenación o arreglo de datos en clases o categorías que muestran, para cada una de ellas, el número de
elementos que contiene o la frecuencia de ellos. En el tema de las Distribuciones de Frecuencias, se utilizan
términos como variables, intervalos o clases, frecuencias absolutas y frecuencias relativas.

Variables

Una variable es la característica que se está midiendo. Existen dos categorías o tipo de variables: la variable
cualitativa, que expresa un atributo o característica, y la variable cuantitativa que es aquella que puede ser
expresada numéricamente. La variable cualitativa a su vez puede subdividirse en variable discreta, aquella que
entre dos valores próximos puede tomar a lo sumo un número finito de valores, y la variable continua, que puede
tomar los infinitos valores de un intervalo. En muchas ocasiones la diferencia es más teórica que práctica, ya que
los aparatos de medida dificultan que puedan existir todos los valores del intervalo. La variable se denota por las
mayúsculas de letras finales del alfabeto castellano; a su vez cada una de estas variables puede tomar distintos
valores, colocándole un subíndice, que indica orden: X = [X1, X2, X3, ......, XK-2, XK-1, XK].

Intervalos y límites de clase

Cuando se tiene una distribución con un gran número de variables, se suele agrupar en intervalos para facilitar
la comprensión de los datos, lo cual tiene un inconveniente: se pierde información sobre la propia distribución.
Se indica por Li al extremo inferior del intervalo, también llamado clase, y por Ls al extremo superior. Para operar
Sapere Aude
Atrévete a saber
27
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
se utiliza la marca de clase, el punto medio de un intervalo. Para calcularla, se puede definir como el promedio
de los valores extremos del intervalo, esto es sumar los extremos y dividir entre 2. La amplitud del intervalo, sería
la longitud del intervalo, se representa por: a = Ls – Li y se obtiene dividiendo la amplitud general entre las clases.
El número de clases no debe ser menor de 5 ni mayor de 20.

Un símbolo que define una clase, tal como 50 - 55, se conoce como intervalo de clase. Los números extremos,
50 y 55, son los límites de clase; el número menor 50 es el límite inferior de la clase y el mayor 55 es el límite
superior. Los términos clase e intervalo de clase se utilizan a menudo indistintamente, aunque el intervalo de
clase es realmente un símbolo para la clase.

Un intervalo de clase que, al menos teóricamente, no tiene límite superior o inferior, se conoce como intervalo
de clase abierto. Por ejemplo, al referirse a la edad de grupos de individuos el intervalo de clase, «mayores de
65 años» es un intervalo de clase abierto.

Puede decirse que los límites de clase son los valores que definen una clase separándola de la anterior y de la
posterior, deben definir las clases de forma que sean exhaustivas (permiten clasificar todas las observaciones en
alguna de ellas) y mutuamente excluyentes (ninguna observación puede ser incluida en más de una clase. Los
límites indicados se muestran en la distribución y los reales señalan la extensión de la clase (se calculan dividiendo
a la mitad las unidades que separan la clase). El valor central de la clase se denomina Punto Medio o Marca de
Clase y si hay valores sobre los cuales existen concentraciones de datos, es recomendable que se asuman como
punto medio. Las clases abiertas se usan cuando la amplitud escogida obliga a tener clases vacías y no permiten
el cálculo del punto medio ni otras variables.

Limites reales de clases

Las variables se registran con una determinada aproximación, por lo que el intervalo de clase, por ejemplo 50 –
55, teóricamente incluye todas las medidas desde 49,50 a 55,50. Estos números, representados brevemente por
los números exactos 49,5 y 55,5, se conocen como límites reales de clase o límites verdaderos de clase; el menor
de ellos, 49,5, es el límite real inferior y el mayor de ellos, 55,5, es el límite real superior.

Prácticamente, los límites reales de clase se obtienen sumando al límite superior de un intervalo de clase el límite
inferior del intervalo de clase contiguo superior y dividiendo por 2. A veces, los límites reales de clase se utilizan
para simbolizar las clases. Por ejemplo, las clases podrían indicarse por 49,5 – 55,5, 55,5 – 60,5, sin embargo, con
tal notación aparece una ambigüedad, pues los límites reales de clase no coincidirían con las observaciones
reales. Así si una observación fuese 55,5 no sería posible discernir si pertenece al intervalo de clase 49,5 – 55,6
o al 55,5 – 60,5.

Tamaño o anchura de un intervalo de clase

El tamaño o anchura de un intervalo de clase es la diferencia entre los límites reales de clase que lo forman y se
conoce como anchura de clase, tamaño de clase o longitud de clase. Si todos los intervalos de clase de una
distribución de frecuencias tienen igual anchura, esta anchura común se representa por c. En tal caso, c es igual
a la diferencia entre dos sucesivos límites de clase inferiores o superiores, reales o no. En el caso específico de
los límites reales, el ancho de clase puede definirse como la diferencia entre dos límites reales de una misma
clase. El ancho de clase también puede definirse a partir de la marca de clase (MC) señalando que es la diferencia
entre dos marcas de clase consecutivas.

Sapere Aude
Atrévete a saber
28
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Punto medio o marca de clase

La marca de clase es el punto medio del intervalo de clase y se obtiene sumando los límites inferior y superior de
la clase y dividiendo por 2. Así, la marca de clase del intervalo 50 - 55 es (50 + 55)/2 = 52,5. La marca de clase se
llama también punto medio de la clase. Para análisis matemáticos posteriores, todas las observaciones
pertenecientes a un intervalo de clase dado se suponen coincidentes con la marca de clase. Así, todas las alturas
en el intervalo de clase 50 - 55 centímetros se considerarán como de 52,5 centímetros.

Reglas generales para formar las distribuciones de frecuencia

1. Determinar el mayor y el menor entre los datos registrados y así encontrar el rango (diferencia entre el mayor
y el menor de los datos).

2. Dividir el rango en un número conveniente de intervalos de clase del mismo tamaño. Si esto no es posible,
utilizar intervalos de clase de diferente tamaño o intervalos de clase abiertos. El número de intervalos de clase
se toma generalmente entre 5 y 20 dependiendo de los datos. Los intervalos de clase se eligen también de
forma que las marcas de clase o puntos medios coincidan con datos realmente observados, lo que tiende a
aminorar el llamado error de agrupamiento en los análisis matemáticos posteriores. Sin embargo, los límites
reales de clase no coincidirán con los datos observados.

3. Determinar el número de observaciones que caen dentro de cada intervalo de clase, es decir, encontrar las
frecuencias de clase.

Frecuencia absoluta

Se denomina así al número de repeticiones que presenta una observación. Se representa por ni. Se define como
el número de observaciones pertenecientes a una misma clase.

Frecuencia relativa

Es la frecuencia absoluta dividida por el número total de datos (ni / N), se suele expresar en porcentaje. La suma
de todas las frecuencias relativas siempre debe ser igual a la unidad.

Frecuencia absoluta acumulada

Es la suma de los distintos valores de la frecuencia absoluta tomando como referencia un individuo dado. La
última frecuencia absoluta acumulada es igual al número total de observaciones:
N1 = n1
N2 = n1 + n2
Nn = n1 + n2 + ...... +nn-1 + nn = n

Frecuencia relativa acumulada

Es el resultado de dividir cada frecuencia absoluta acumulada por el número total de datos, se la suele
representar con la notación: Fi. De igual forma, también se puede definir a partir de la frecuencia relativa, como
suma de los distintos valores de la frecuencia relativa, tomando como referencia un individuo dado. La última
frecuencia relativa acumulada es igual a la unidad.

Sapere Aude
Atrévete a saber
29
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Análisis e interpretación datos numéricos en las distribuciones de frecuencia

Para el análisis estadístico tiene gran importancia el contar con elementos descriptivos acerca de la tendencia
central, su posición, la forma o patrón de distribución de los datos y la dispersión o variabilidad alrededor de los
valores centrales. Cuando se analiza una gran cantidad de datos, la distribución de frecuencias y su
representación gráfica, ayudan significativamente a conocer estos aspectos. Es necesario, tanto para el análisis
e interpretación del conjunto de datos como para realizar comparaciones entre varios conjuntos de valores,
obtener medidas que resuman o condensen las características en cuanto a posición y variabilidad.

Cuando se construyen y representan gráficamente distribuciones de frecuencias, puede notarse que es bastante
corriente que adopten una forma similar a la de una campana, es decir, una acumulación de valores hacia la
parte central y pocos valores en los extremos.

Existe un sistema de símbolos, una notación, para el tratamiento de las medidas estadísticas, deducir las fórmulas
y examinar las propiedades de las medidas. En general, la letra x se usa para indicar la variable en consideración;
un subíndice i que toma valores enteros positivos, sirve para indicar el valor particular o específico de la variable
en el iésimo elemento del grupo estudiado, el subíndice, por lo tanto, sirve para distinguir una observación de
otra, también puede ser utilizado para indicar orden de selección, orden de magnitud o algún otro orden que
interese. El cálculo de las medidas estadísticas requiere sumar ciertos números de una característica, operación
de suma que puede indicarse con el símbolo ∑ (sigma), o símbolo de sumatoria.

Medidas de posición: los cuantiles

En algunas ocasiones es importante obtener valores que dividan el conjunto de datos en fracciones específicas.
Así como la mediana divide el conjunto de datos en dos partes iguales, es decir, la mitad de los valores son
inferiores a la mediana y la otra mitad son superiores, si cada una de estas mitades se volviera a dividir por la
mitad, el conjunto quedaría dividido en cuatro partes y cada parte se llamará cuartil.

Pero el conjunto puede dividirse también por 10 (deciles) o por 100 (percentiles) y todos se llaman cuantiles.
Tanto la mediana, como los cuartiles y los deciles pueden expresarse como percentiles. Por ejemplo: Me = P50 =
D5 = Q2; Q3 = P75; D4 = P40. Así que conociendo los percentiles se puede averiguar cualquier cuantil.

Para el cálculo de los percentiles el conjunto de datos debe estar ordenado, luego se aplica la siguiente fórmula:

𝑃𝑚 = 𝐿𝑟𝑖 + ((𝑚 ∗ 𝑁/100) – 𝐹𝑎 ) ∗ 𝑐⁄𝑓


Donde:
Lri es el límite real inferior de la clase donde se ubica el percentil deseado.
m es el valor del percentil buscado
Pm es el valor del percentil m.
N es la cantidad total de datos o frecuencia total.
Fa es la frecuencia acumulada de la clase anterior al percentil buscado.
f es la frecuencia de la clase del percentil buscado.
c es el intervalo de la clase donde está el percentil m o ancho de clase.

Sapere Aude
Atrévete a saber
30
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Medidas de tendencia central

La moda se convierte en la clase modal, es decir, la clase en donde hay mayor densidad de frecuencias por unidad
de intervalo. Luego de obtenida la clase modal, se obtiene entonces la moda. 𝑀𝑜 = 𝐿𝑟𝑖 + (𝑓 − 𝑓𝑎 ) ∙ 𝑐 / (2𝑓 −
𝑓𝑎 − 𝑓𝑝 ) , donde Lri es el límite inferior real de la clase modal, f es la frecuencia de la clase modal, fa es la
frecuencia de la clase anterior a la clase modal y fp es la frecuencia posterior a la de la clase modal.

La mediana se define como el valor de la observación al cual corresponde la frecuencia acumulada 𝑁 / 2 y se


calcula 𝑀𝑒 = 𝐿𝑟𝑖 + (𝑁/2 – 𝐹𝑎 ) ∗ 𝑐 /𝑓, donde N es el número total de observaciones o suma de las frecuencias
absolutas, Lri es el límite inferior real de la mediana, f es la frecuencia absoluta de la clase donde está la mediana,
Fa es la frecuencia acumulada de la clase anterior a la clase de la mediana y c el intervalo de la clase donde está
la mediana.

La media aritmética se calcula con la siguiente fórmula:


∑ 𝑥𝑖 𝑓𝑖 ∑ 𝑥𝑖 𝑓𝑖
𝑥̅ = =
∑ 𝑓𝑖 𝑛
Donde:
xi es el punto medio de la clase i
fi es la frecuencia de la clase
n es la cantidad total de datos (∑ 𝑓𝑖 )

Medidas de variabilidad

Cuando los datos están agrupados en una distribución de frecuencias, los valores individuales de cada medición
u observación se desconocen y solo se sabe que la frecuencia representa el número de observaciones contenidas
en cada clase o intervalo de variación, el cual contiene un valor representativo denominado marca de clase.

El rango o recorrido de una distribución de frecuencia solo se puede estimar basándose en los límites de la
misma. Así, para calcular el rango se resta al límite superior de la distribución el límite inferior de la misma,
resultado que representa o aproxima al valor real del rango de los datos.

Para calcular la varianza de los datos de una distribución de frecuencias, deben considerarse las limitaciones que
la misma presenta en cuanto a la realidad de los datos y las realidades que esta distribución representa. En el
caso de que se desee calcular la varianza de una muestra, debe usarse la fórmula:
2
∑𝐾
𝑖=1 𝑓𝑖 ∗ (𝑥𝑖 − 𝑥̅ )
2
𝑠 =[ ]
𝑁−1
Donde:

K es el número total de clases.


xi es el punto medio de la clase i.
𝑥̅ es la media aritmética de la distribución de frecuencias.
N es la frecuencia total

Si se trata de una población, en vez de N – 1 se utiliza N. Para el cálculo de la desviación estándar, se obtiene la
raíz cuadrada de la varianza; para el cálculo de la desviación relativa se divide la desviación absoluta entre la
media (D = d / 𝑥̅ ) y para el cálculo del coeficiente de variación se divide la desviación estándar entre la media
(CV = s / 𝑥̅ )
Sapere Aude
Atrévete a saber
31
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Medidas de distribución

Para calcular el momento de orden r de una distribución de frecuencias de datos muestrales, se utiliza la siguiente
fórmula:
∑𝑘𝑖=1 𝑥𝑖 ∗ 𝑓𝑖
𝑚𝑟 =
𝑁−1

Para los momentos de orden r respecto a la media, la formula sería:

∑𝑘𝑖=1(𝑥𝑖 − 𝑥̅ )𝑟 ∗ 𝑓𝑖
𝑚𝑟 =
̅̅̅̅
𝑁−1

En el caso del sesgo y la curtosis, las fórmulas son casi las mismas. Para el sesgo:

∑𝑘𝑖=1(𝑥𝑖 − 𝑥̅ )3 ∗ 𝑓𝑖
̅̅̅̅3
𝑚 𝑁−1 ∑𝑘𝑖=1(𝑥𝑖 − 𝑥̅ )3 ∗ 𝑓𝑖
𝐶𝐴 = 3 = =
𝑠 𝑠3 (𝑁 − 1) ∗ 𝑠 3
Y para la curtosis:

∑𝑘𝑖=1(𝑥𝑖 − 𝑥̅ )4 ∗ 𝑓𝑖
𝑚4
̅̅̅̅ 𝑁−1 ∑𝑘𝑖=1(𝑥𝑖 − 𝑥̅ )4 ∗ 𝑓𝑖
𝐶𝐶 = 4 = − 3 = −3
𝑠 𝑠4 (𝑁 − 1) ∗ 𝑠 4

Donde:

K es el número total de clases.


xi es el punto medio de la clase i.
𝑥̅ es la media aritmética de la distribución de frecuencias.
N es la frecuencia total

Si se trata de una muestra, en vez de N se utiliza N - 1.

Ejercicio

Puede bajar un ejercicio del tema del vínculo ejercicio, el cual está hecho en Excel 2016.

Sapere Aude
Atrévete a saber
32
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Probabilidad

En estadística, los fenómenos son eventos comunes, que atraen la atención del investigador, son observables y,
en la mayoría de los casos, cuantificables y/o calificables.

Los fenómenos o experimentos estadísticos se pueden clasificar como determinísticos o aleatorios. Los
determinísticos son aquellos que repetidos en idénticas condiciones nos llevan siempre al mismo resultado. Los
aleatorios, aunque las condiciones del experimento no cambien, tienen un resultado impredecible antes de
realizarlo. De forma específica se dice que un experimento aleatorio es aquel que puede concretarse en al menos
dos resultados posibles, con incertidumbre en cuanto a cuál de ellos tendrá lugar.

En general diremos que las características de un experimento aleatorio son las siguientes:

1. El experimento se puede repetir u observar de forma indefinida en circunstancias prácticamente iguales.

2. Aunque no podemos predecir el resultado particular del experimento, sí que podemos conocer el
conjunto de todos los posibles resultados.

3. Si el experimento se repite pocas veces, los resultados parecen mostrar un comportamiento caótico,
mientras que si se repite un número infinito de veces empieza a detectarse una regularidad en el
comportamiento de los resultados.

Espacios muestrales y eventos

Una de las características del experimento aleatorio es que, aunque los resultados individuales no son
predecibles con anterioridad, en cambio sí que podemos saber cuál es el conjunto de todos sus posibles
resultados.

A ese conjunto de posibles resultados se les llama espacio muestral y se representa por la letra S. Así pues, S será
un conjunto formado por todos los posibles resultados del experimento.

1. Un experimento consiste en lanzar una moneda y si sale escudo lanzarla una segunda vez. Si sale corona en
el primer lanzamiento, entonces se lanza un dado una vez. Determine el espacio muestral.
S = {C1, C2, C3, C4, C5, C6, EE, EC}

S
C1, C2, C3,
C4, C5, C6,
EE, EC

Sapere Aude
Atrévete a saber
33
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

2. Suponga que se seleccionan, de forma aleatoria, tres artículos de un proceso de fabricación. Cada artículo se
inspecciona y se clasifica como defectuoso, D, o no defectuoso, N. Obtenga el espacio muestral.

S = {DDD, DDN, DND, DNN, NDD, NDN, NND, NNN}

a. Sea A el evento de que el tercer artículo esté dañado, determine los puntos muestrales de este evento.
A = {DDD, DND, NDD, NND}

b. Sea B el evento de que el segundo artículo no esté dañado, determine los puntos muestrales de este
evento.
B = {DND, DNN, NND, NNN}

c. Sea C el evento de que haya solo dos artículos dañados, determine los puntos muestrales de este evento.
C = {DDN, DND, NDD}

El complemento de un evento E es un evento que contiene todos los elementos del espacio muestral que no
están en el evento E y se denota como E’, Ec o 𝐸̅ . Como S es igual a la unión de los eventos E y E’, entonces E’ es
el espacio muestral menos los elementos de E.

d. Determine el complemento de C (C’, CC, 𝐶̅ ).


C’ = {DDD, DNN, NDN, NND, NNN}

La intersección de dos eventos es el conjunto que contiene los elementos comunes de dichos eventos y se
representa con el símbolo ∩ entre las letras que representan los eventos (E1 ∩ E2).
Sapere Aude
Atrévete a saber
34
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
e. Encuentre la intersección de A y B (A ∩ B).
A ∩ B = {DND, NND}

f. Encuentre la intersección A ∩ C’
A ∩ C’ = {DDD, NND}

g. Sea D = {DNN, NDN, NNN} encuentre la intersección A ∩ D


A ∩ D = {Φ} se dice que A y D son disjuntos o mutuamente excluyentes, porque no tienen elementos en
común.

La unión de dos eventos es el conjunto que contiene todos los elementos de ambos eventos, sin repetir, y se
representa con el símbolo U entre las letras que representan los eventos (E1 U E2).

h. Encuentre la unión de B y D (B U D).


B U D = {DND, DNN, NDN, NND, NNN}

i. Encuentre la unión de B y C (B U C).


B U C = {DND, DNN, NND, NNN, DDN, NDD}

3. Sean M = {x | 3 < x < 9} y N = {x | 5 < x < 12}, encuentre M U N y M ∩ N.


M = {4, 5, 6, 7, 8}
N = {6, 7, 8, 9, 10, 11}
M U N = {4, 5, 6, 7, 8, 9, 10, 11}
M U N = {x | 4 ≤ x ≤ 11}
M ∩ N = {6, 7, 8}
M ∩ N = {x | 5 < x < 9}

4. Sean A = {x | 0 < x ≤ 6}, B = {x | 4 < x < 8} y C = {x | x ≥ 5} para S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}. Utilizando
el Diagrama de Venn encuentre A ∩ B ∩ C.
A = {1, 2, 3, 4, 5, 6}
B = {5, 6, 7}
C = {5, 6, 7, 8, 9, 10, 11, 12}

A ∩ B ∩ C = {5, 6}

Sapere Aude
Atrévete a saber
35
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Conteo de los puntos de la muestra
El principio fundamental del conteo o Regla de multiplicación

Si una operación se puede llevar a cabo en n1 formas, y si para cada una de éstas se puede realizar una segunda
operación en n2 formas, entonces las dos operaciones se pueden ejecutar juntas de n1∙n2 formas. Si una
operación se puede ejecutar en n1 formas, y si para cada una de éstas se puede llevar a cabo una segunda
operación en n2 formas, y para cada una de las primeras dos se puede realizar una tercera operación en n3 formas,
y así sucesivamente, entonces la serie de k operaciones se puede realizar en n1∙n2∙∙∙nk formas.

5. ¿Cuántos puntos muestrales hay en el espacio muestral cuando se lanza un par de dados una vez?
6 ∙ 6 = 36

6. Un urbanista de un nuevo condominio ofrece a los posibles compradores de una casa elegir entre 4 distintos
tipos de fachada y cada una de ellas puede ser de una planta, dos plantas o a desniveles ¿En cuántas formas
diferentes puede un comprador ordenar una de estas casas?
4 ∙ 3 = 12

7. Si un miembro de un club que tiene 22 integrantes necesitara elegir un presidente y un tesorero, ¿de cuántas
maneras diferentes se podría elegir a ambos?
22 ∙ 21 = 462

8. José va a armar una computadora y para comprar las partes tiene que elegir entre las siguientes opciones:
tres marcas de tarjeta madre, cuatro marcas de discos duros, dos marcas de memorias, dos marcas de monitor
y cinco tiendas locales en las que puede adquirir en conjunto los accesorios restantes. ¿De cuántas formas
diferentes puede José comprar las partes?
3 ∙ 4 ∙ 2 ∙ 2 ∙ 5 = 240

9. Se tienen los números 1, 2, 4, 5, 6, 8, 9. ¿Cuántos números de 4 dígitos se pueden formar con ellos, si se
pueden repetir? ¿Cuántos si no se pueden repetir? ¿Cuántos de los que no se pueden repetir son mayores al
valor 4050?
___ ___ ___ ___
7 7 7 7 = 2401
___ ___ ___ ___
7 6 5 4 = 840
___ ___ ___ ___
5 6 5 4 = 600

10.¿Cuántos números pares de cuatro dígitos se pueden formar con los dígitos 0, 1, 2, 4, 5, 6 y 9, si cada dígito
se puede usar sólo una vez?
Como el número debe ser par, tenemos sólo n1 = 4 opciones para la posición de las unidades. Para un número
de cuatro dígitos la posición de los millares no puede ser 0, por lo que consideramos la posición de las
unidades en dos partes: 0 o diferente de 0.
Para las unidades igual a 0:
___ ___ ___ _0_
6 5 4 1 = 120
Si la posición de las unidades no es 0, entonces:

Sapere Aude
Atrévete a saber
36
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
___ ___ ___ ___
5 5 4 3 = 300
Para un total de 120 + 300 = 420 posibles números pares de cuatro dígitos con los números señalados.

11.¿Cuántos números impares de cuatro dígitos se pueden formar con los dígitos 0, 1, 2, 3, 5, 6 y 9, si cada dígito
se puede usar sólo una vez? ¿Cuántos serán mayores a 5000?
___ ___ ___ ___
5 5 4 4 = 400

Para determinar cuántos son mayores a 5000, debe considerarse si en el primer número hay un par o un
impar. Si hay un par:
___ ___ ___ ___
1 5 4 4 = 80
Si hay un impar, entonces
___ ___ ___ ___
2 5 4 3 = 120
Da un total de 80 + 120 = 200 posibles números impares de cuatro dígitos con los números señalados.

Permutaciones

Para cualquier entero no negativo n, n!, denominado “n factorial”, se define como n! = n∙(n – 1) ∙∙∙ (2)∙(1), con el
caso especial de 0! = 1. Entonces, el número de permutaciones de n objetos es n!.

12.Se tienen 6 letras y se quieren construir palabras de 6 letras, aunque no tengan sentido, ¿cuántas se pueden
construir?
6! = 720
______
6 5 4 3 2 1 = 720

13.Se tienen los números 3, 4, 5, 6, 7 y se desea formar números de 5 dígitos. ¿Cuántos se pueden formar, si no
se pueden repetir?
__ __ __ __ __
5 4 3 2 1 = 120
5! = 120

Permutaciones por grupos

𝑛!
El número de permutaciones de n objetos distintos tomados en grupos de r a la vez es 𝑛𝑃𝑟 = (𝑛−𝑟)! donde n > r.

14.Se va a otorgar uno de tres premios (a la investigación, la enseñanza y el servicio) a un grupo de 25 profesores
universitarios. Si cada profesor puede recibir un premio como máximo, ¿cuántas selecciones posibles habría?
25!
25𝑃3 = (25−3)! = 13 800

Sapere Aude
Atrévete a saber
37
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
15.En una ONG compuesta por 75 asociados se va a elegir a un presidente y a un secretario. ¿Cuántas opciones
diferentes de funcionarios son posibles si:
a) No hay restricciones:
75P2 = 5 550

b) José participará sólo si él es el presidente:


74P1 = 74
74P2 = 5 402
Para un total de 74 + 5 402 = 5 476

c) Ana y Carlos participarán juntos o no lo harán:


2P2 = 2
73P2 = 5 256
Para un total de 2 + 5 256 = 5 258

d) Pedro y María no participarán juntos:


Si Pedro y María no son elegidos tenemos: 73P2 = 5 256
Si Pedro o María son elegidos en alguno de los dos puestos tenemos, para cada uno:
2P2 ∙ 73P1 = 146
Entonces en total tenemos 5 256 + 146 + 146 = 5 548
Otra forma sería 75P2 – 2 = 5 548

Permutaciones Circulares

Las permutaciones que ocurren al arreglar objetos en un círculo se llaman permutaciones circulares. Dos
permutaciones circulares no se consideran diferentes a menos que los objetos correspondientes en los dos
arreglos estén precedidos o seguidos por un objeto diferente, conforme avancemos en la dirección de las
manecillas del reloj. El número de permutaciones de n objetos ordenados en un círculo es (n – 1)!

16.Anita invita a siete de sus amigos a cenar en su casa. Ella tiene una mesa circular de 8 plazas. De cuantas
formas distintas los puede sentar si:
a) No hay restricciones;
(8 – 1)! = 5 040
b) Dos de sus amigos se tienen que sentar necesariamente juntos.
2! ∙ (7-1)! = 1 440

17.José es un Chef Profesional y tiene 4 sartenes de cerámica, tres de acero inoxidable, cinco de teflón, seis de
titanio y 3 de hierro fundido. Los debe ordenar en un holder circular, pero los de cada tipo los debe dejar
juntos. ¿De cuántas formas los puede ordenar?
4P4 ∙ 3P3 ∙ 5P5 ∙ 6P6 ∙ 3P3 ∙ (5-1)! = 1 791 590 400

Permutaciones por clases

El número de permutaciones distintas de n objetos, en el que n1 son de una clase, n2 de una segunda clase,..., nk
𝑛!
de una k-ésima clase es: 𝑛 !∙𝑛 !∙𝑛 !∙∙∙∙𝑛 ! donde n1 + n2 + n3 + ∙∙∙ + nk = n
1 2 3 𝑘

Sapere Aude
Atrévete a saber
38
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
18.Durante un entrenamiento de fútbol colegial, el entrenador necesita tener a 8 jugadores parados en una fila
defensiva. Entre estos 8 jugadores hay 1 de primer año, 2 de segundo año, 3 de tercer año y 2 de cuarto año.
¿De cuántas formas diferentes se pueden arreglar en una fila si lo único que los distingue es el año que cursan?
8!
1!∙2!∙3!∙2!
= 1 680
19.Una empresa tiene 4 sucursales en un Mall, y tiene 12 empleados para repartir en dichas tiendas. La tienda A
requiere de 5 empleados, la B requiere de 4 empleados, y las tiendas C y D requieren de 2 empleados cada
una. ¿De cuántas formas puede repartir a sus empleados en las sucursales?
Como n = 5 + 4 + 2 + 2 = 13 y se tienen 12 empleados, entonces no se puede hacer la repartición deseada.

20.Un hotel va a hospedar a nueve oradores que asisten a una conferencia, ¿en cuántas formas los puede asignar
a una habitación triple y a tres dobles?
9!
= 7560
3!∙2!∙2!∙2!

Combinaciones

En algunos casos es necesario determinar el número de formas de seleccionar r objetos de n sin importar el
orden, a lo que se le llama obtener combinaciones. Una combinación es una partición de dos celdas, una contiene
los r objetos seleccionados y la otra contiene los (n – r) objetos restantes. Las combinaciones se denotan como
(𝑛𝑟) o nCr. El número de combinaciones de n objetos distintos tomados de r a la vez es:
𝑛 𝑛!
( ) = 𝑛𝐶𝑟 =
𝑟 (𝑛
𝑟! − 𝑟)!

21.De cuatro ingenieros civiles y tres ingenieros mecánicos encuentre el número de comités que se pueden
formar que consistan en dos civiles y un mecánico.
4! 24 24
(42) = 4𝐶2 = 2!(4−2)! = 2!∙2! = 4 = 6
3! 6 6
(31) = 3𝐶1 = 1!(3−1)! = 1∙2! = 2 = 3
6 ∙ 3 = 18

22.Encuentre el número de formas en las que se pueden asignar seis maestros a cuatro secciones de un curso
universitario, si ningún maestro se asigna a más de una sección.
6!
(64) = 6𝐶4 = 4!(6−4)! = 15

23.Marlita invito a nueve de sus amigos a cenar. Ella tiene dos mesas circulares, una principal con 6 plazas y otra
aledaña con 4 plazas. Todos sus amigos son igualmente estimados, pero dos de ellos son novios, por lo que
decidió sentarlos juntos a la mesa principal y en la mesa secundaria ubicará a los 4 amigos que no estén en la
principal. ¿De cuantas maneras puede sentar a sus amigos a la mesa principal, si no le importa como queden
acomodados? ¿Y si le importa cómo queden acomodados?

Marlita se ubica en la mesa por ser anfitriona, al igual que los novios. Dado lo anterior, quedan 3 plazas en la
mesa principal y 7 amigos entre los cuales escoger. Si no le importa cómo queden acomodados, la respuesta
sería que hay 1C1 ∙ 2C2 ∙ 7C3 ∙ 2! formas de sentarlos en la mesa, es decir, 70 formas (1C1 para ubicar a Marlita,
2C2 para ubicar a los novios, 7C3 para ubicar a los amigos y (3-1)! por tratarse de una mesa circular). Si le
importa cómo queden acomodados, la fórmula sería igual, pero con permutaciones: 1P1 ∙ 2P2 ∙ 7P3 ∙ 2! = 840
formas de sentarlos en la mesa si el orden importa.

Sapere Aude
Atrévete a saber
39
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
24.Un niño le pide a su madre que le lleve cinco cartuchos de Nintendo Switch™ de su colección de 10 juegos
recreativos y 5 de deportes. ¿De cuántas maneras podría su madre llevarle 3 juegos recreativos y 2 de
deportes?
(10
3
) = 10𝐶3 = 120 (52) = 5𝐶2 = 10 120 ∙ 10 = 1200

Concepto Clásico de Probabilidad

El primero en dar una definición clásica de probabilidad fue Jakob Bernoulli en 1713, reformulada después por
Abraham De Moivre de la siguiente manera:

"...una fracción en la que el numerador es igual al número de apariciones del suceso y el denominador es igual
al número total de casos en los que el suceso pueda o no pueda ocurrir. Tal fracción expresa la probabilidad de
que ocurra el suceso".

El enfoque clásico de la probabilidad está basado en la suposición de que todos los resultados del experimento
son igualmente posibles. La probabilidad se calcula de la siguiente manera:

número de posibles resultados del evento


Probabilidad =
número total de resultados posibles del experimento

La principal dificultad que presenta esta interpretación de la probabilidad es que se basa en sucesos
equiprobables, siendo fácil para problemas sencillos, como los de cartas, dados o urnas, es casi imposible para
problemas más complejos.

Concepto Frecuentista de Probabilidad

Bernoulli resolvió la cuestión de cómo hallar la probabilidad de ocurrencia de un suceso aun siendo imposible
contar los casos favorables:

"Aquí hay otro camino disponible para alcanzar el resultado deseado. Lo que no se puede hallar a priori se puede
obtener a posteriori, es decir, mediante la observación múltiple de los resultados de pruebas similares…"

De esta manera, Bernoulli introdujo el concepto de probabilidad "frecuentista" o "estadística": asignar como
probabilidad de un suceso el resultado que se obtendría si el proceso se repitiera en condiciones similares un
número grande de veces.

La probabilidad de que suceda un evento es determinada observando como sucede el evento en el pasado. En
términos de fórmula:

número de veces que sucedió el evento en el pasado


Probabilidad =
número total de observaciones

Algunas dificultades que presenta este enfoque de la probabilidad es que no dice cuál es el número "grande" de
observaciones necesario, o que se entiende por condiciones similares, porque si las condiciones son las mismas
los resultados serán también los mismos.

Sapere Aude
Atrévete a saber
40
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Concepto axiomático de probabilidad

La definición axiomática de probabilidad se debe a Andréi Nikoláyevich Kolmogorov (1933), quien consideró la
relación entre la frecuencia relativa de un suceso y su probabilidad cuando el número de veces que se realiza el
experimento es muy grande.

Dado un espacio muestral S, diremos que P es una probabilidad sobre un evento dado si las siguientes
propiedades (axiomas) son verificadas:

Axioma 1
La probabilidad de que ocurra un evento A cualquiera se encuentra entre cero y uno.
0 > P(A) > 1

Axioma 2
La probabilidad de que ocurra el espacio muestral es 1. P(S) = 1

Axioma 3
Si A y B son eventos mutuamente exclusivos, es decir que no tienen elementos en común, entonces:
P(A B) = P(A) + P(B)
Si se tienen n eventos mutuamente exclusivos A1, A2, A3,.....An, entonces:
P(A1 A2 ... An) = P(A1) + P(A2) + ... + P(An)

Concepto Subjetivo de Probabilidad

En el segundo cuarto del siglo XX surgió una nueva interpretación, llamada ‘subjetiva’, según la cual la
probabilidad mide el grado de creencia de un individuo en la verdad de una proposición, variando entre 0 (el
individuo cree que es falso) a 1 (cree que es cierto). Esta interpretación fue propuesta por primera vez por el
filósofo Frank P. Ramsey. Para los subjetivistas la probabilidad de un suceso debe variar en función de la nueva
información recibida respecto del suceso.

Según este enfoque la probabilidad de que un evento en particular suceda es asignada basándose en cualquier
información disponible, como intuición, opiniones etc.

25.¿Cuál es la probabilidad de obtener un 2 en el lanzamiento de un dado?


1
𝑃(2) = 6

26.¿Cuál es la probabilidad de obtener un número impar en el lanzamiento de un dado?


3 1
𝑃(1, 3, 5) = 6 = 2

27.¿Cuál es la probabilidad de obtener un número primo en el lanzamiento de un dado?


3 1
𝑃(2, 3, 5) = 6 = 2

28.¿Cuál es la probabilidad de ganar el premio mayor de la lotería, si se compra un entero?


1
𝑃(𝐺𝑜𝑟𝑑𝑜) = 100000 = 0,00001 = 0,001%

Sapere Aude
Atrévete a saber
41
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
29.¿Y si se compran dos o tres enteros de lotería?
La probabilidad se mantiene, lo que aumenta es la posibilidad. La probabilidad es una variable cuantitativa,
la posibilidad es una variable cualitativa.

30.Se lanza dos veces una moneda, ¿cuál es la probabilidad de que se obtenga al menos una corona?
S = {EC, CE, CC, EE}
P(al menos una corona) = ¾ = 0,75 = 75%

31.Se carga un dado de forma que sea dos veces más probable que salga un número par que uno impar. Si E es
el evento de que ocurra un número menor que 4 en un solo lanzamiento del dado, encuentre P(E). Si F es el
evento de que ocurra un número mayor o igual a 3, determine P(F).
X w P(X)
1 1 1/9
2 2 2/9
3 1 1/9
4 2 2/9
5 1 1/9
6 2 2/9
Total 9 1
P(< 4) = 4/9 P(≥ 3) = 6/9 = 2/3

32.En el ejemplo anterior, sea A el evento de que salga un número par y sea B el evento de que salga un número
divisible entre 3. Encuentre probabilidad de que ocurran los dos eventos y la probabilidad de que ocurra
alguno de los dos eventos.
Ocurran los dos eventos = {6} → 𝑃(ocurran los dos eventos ) = 2⁄9
Ocurra alguno de los dos eventos = {2, 3, 4, 6} → 𝑃(ocurra alguno de los dos eventos) = 2⁄9 + 1⁄9 +
2⁄ + 2⁄ = 7⁄
9 9 9

33.A una clase de estadística para ingenieros asisten 15 estudiantes de ingeniería industrial, 10 de ingeniería
topográfica, 10 de ingeniería mecánica, 10 de ingeniería eléctrica y 8 de ingeniería civil. Si el profesor elige al
azar a un estudiante para que conteste una pregunta, ¿qué probabilidades hay de que el elegido sea a)
estudiante de ingeniería industrial, b) estudiante de ingeniería civil o estudiante de ingeniería topográfica?
𝑎) 𝑃(𝐼𝐼) = 15⁄53
(8 + 10)⁄ 18
𝑏) 𝑃(𝐼𝐶 𝑈 𝐼𝑇) = 53 = ⁄53

34.En un juego de cartas, Danielita ha ganado 20 de los 45 juegos realizados. ¿Cuál es la probabilidad de que
Dani gane el próximo juego?
𝑃(Dani gane el próximo juego) = 20⁄45 = 4⁄9

35.En una mano de póquer (cinco cartas), encuentre la probabilidad de tener dos ases y tres jotas.
𝐹𝑜𝑟𝑚𝑎𝑠 𝑑𝑒 𝑡𝑒𝑛𝑒𝑟 𝑑𝑜𝑠 𝑎𝑠𝑒𝑠 = 4𝐶2 = 6
𝐹𝑜𝑟𝑚𝑎𝑠 𝑑𝑒 𝑡𝑒𝑛𝑒𝑟 𝑡𝑟𝑒𝑠 𝑗𝑜𝑡𝑎𝑠 = 4𝐶3 = 4
𝐹𝑜𝑟𝑚𝑎𝑠 𝑑𝑒 𝑡𝑒𝑛𝑒𝑟 𝑑𝑜𝑠 𝑎𝑠𝑒𝑠 𝑦 𝑡𝑟𝑒𝑠 𝑗𝑜𝑡𝑎𝑠 = 6 ∙ 4 = 24
𝐹𝑜𝑟𝑚𝑎𝑠 𝑑𝑒 𝑟𝑒𝑝𝑎𝑟𝑡𝑖𝑟 𝑢𝑛𝑎 𝑚𝑎𝑛𝑜 𝑑𝑒 5 𝑐𝑎𝑟𝑡𝑎𝑠 = 52𝐶5 = 2 598 960
𝑃(𝑑𝑜𝑠 𝑎𝑠𝑒𝑠 𝑦 𝑡𝑟𝑒𝑠 𝑗𝑜𝑡𝑎𝑠) = 24⁄2 598 960 = 1⁄108 290 = 9,23 ∙ 10−6 = 0,00000923 = 0,000923%
Sapere Aude
Atrévete a saber
42
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
36.En una mano de póquer (cinco cartas), encuentre la probabilidad de tener tres ases y una Q y una K.
𝐹𝑜𝑟𝑚𝑎𝑠 𝑑𝑒 𝑡𝑒𝑛𝑒𝑟 𝑡𝑟𝑒𝑠 𝑎𝑠𝑒𝑠 = 4𝐶3 = 4
𝐹𝑜𝑟𝑚𝑎𝑠 𝑑𝑒 𝑡𝑒𝑛𝑒𝑟 𝑢𝑛𝑎 𝑟𝑒𝑖𝑛𝑎 = 4𝐶1 = 4
𝐹𝑜𝑟𝑚𝑎𝑠 𝑑𝑒 𝑡𝑒𝑛𝑒𝑟 𝑢𝑛 𝑟𝑒𝑦 = 4𝐶1 = 4
𝐹𝑜𝑟𝑚𝑎𝑠 𝑑𝑒 𝑡𝑒𝑛𝑒𝑟 𝑡𝑟𝑒𝑠 𝑎𝑠𝑒𝑠, 𝑢𝑛𝑎 𝑄 𝑦 𝑢𝑛𝑎 𝐾 = 4 ∙ 4 ∙ 4 = 64
𝐹𝑜𝑟𝑚𝑎𝑠 𝑑𝑒 𝑟𝑒𝑝𝑎𝑟𝑡𝑖𝑟 𝑢𝑛𝑎 𝑚𝑎𝑛𝑜 𝑑𝑒 5 𝑐𝑎𝑟𝑡𝑎𝑠 = 52𝐶5 = 2 598 960
𝑃(𝑡𝑟𝑒𝑠 𝑎𝑠𝑒𝑠, 𝑢𝑛𝑎 𝑄 𝑦 𝑢𝑛𝑎 𝐾) = 64⁄2 598 960 = 4⁄162 435 = 2,46 ∙ 10−5 = 0,0000246 = 0,00246%

Reglas aditivas

Si A y B son dos eventos, entonces P(A U B) = P(A) + P(B) – P(A ∩ B).

Si A y B son mutuamente excluyentes o disjuntos, entonces P(A U B) = P(A) + P(B).

37.Al final del cuatrimestre Dani se va a graduar en la Facultad de Ingeniería de una universidad. Después de
tener entrevistas en dos empresas en donde quiere trabajar, determina que la probabilidad que tiene de
lograr una oferta de empleo en la empresa A es 0,8 y que la probabilidad de obtenerla en la empresa B es 0,6.
Si, por otro lado, considera que la probabilidad de recibir ofertas de ambas empresas es 0,5, ¿qué probabilidad
tiene de obtener al menos una oferta de esas dos empresas?
P(A ∪ B) = P(A) + P(B) – P(A ∩ B) = 0,8 + 0,6 – 0,5 = 0,9

38.¿Cuál es la probabilidad de obtener un total de 7 u 11 cuando se lanza un par de dados?


6 2 8 2
P (A ∪ B) = P (A) + P (B ) = 36 + 36 = 36 = 9

Si A1, A2,..., An son mutuamente excluyentes, entonces P(A1 ∪ A2 ∪ ・・・ ∪ An) = P(A1) + P(A2) + ・・・ + P(An).
Un conjunto de eventos {A1, A2,… An} de un espacio muestral S se denomina partición de S si A1, A2,…, An son
mutuamente excluyentes y A1 ∪ A2 ∪ ・・・ ∪ An = S. Por lo tanto, tenemos que si A1, A2,..., An es una partición
de un espacio muestral S, entonces P(A1 ∪ A2 ∪ ・・・ ∪ An) = P(A1) + P(A2) + ・・・ + P(An) = P(S) = 1.

Para tres eventos no excluyentes A, B y C, P(A ∪ B ∪ C) = P(A) + P(B) + P(C) – P(A ∩ B) – P(A ∩ C) – P(B ∩ C) + P(A
∩ B ∩ C).

Sapere Aude
Atrévete a saber
43
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

39.Las probabilidades de que un individuo que compra un automóvil nuevo elija uno de color verde, uno blanco,
uno rojo o uno azul son 0,09, 0,15, 0,21 y 0,23, respectivamente, ¿cuál es la probabilidad de que un comprador
dado adquiera un automóvil nuevo que tenga uno de esos colores?
P(V ∪ B ∪ R ∪ A) = P(V) + P(B) + P(R) + P(A) = 0,09 + 0,15 + 0,21 + 0,23 = 0,68

40.Si las probabilidades de que un mecánico automotriz dé servicio a 3, 4, 5, 6, 7, 8 o más vehículos en un día de
trabajo dado son 0,12, 0,19, 0,28, 0,24, 0,10 y 0,07, respectivamente, ¿cuál es la probabilidad de que dé
servicio al menos a 5 vehículos el siguiente día de trabajo?
P(E) = 0,28 + 0,24 + 0,10 + 0,07 = 0,69
P(E′) = P (Ec) = 0,12 + 0,19 = 0,31
P(E) = 1 – 0,31 = 0,69

41.Suponga que las especificaciones del fabricante para la longitud del cable de cierto tipo de computadora son
2000 ± 10 milímetros. En esta industria se sabe que el cable pequeño tiene la misma probabilidad de salir
defectuoso (de no cumplir con las especificaciones) que el cable grande. Es decir, la probabilidad de que
aleatoriamente se produzca un cable con una longitud mayor que 2010 milímetros es igual a la probabilidad
de producirlo con una longitud menor que 1990 milímetros. Se sabe que la probabilidad de que el
procedimiento de producción cumpla con las especificaciones es 0,99.
a) ¿Cuál es la probabilidad de que un cable elegido al azar sea muy largo?
b) ¿Cuál es la probabilidad de que un cable elegido al azar sea más grande que 1990 milímetros?
Sea E el evento de que un cable cumpla con las especificaciones. Sean P y G los eventos de que el cable sea
muy pequeño o muy grande, respectivamente. Entonces:
a) P (1990 ≤ X ≤ 2010) = P(E) = 0,99 y P(P) = P(G) = (1 – 0,99) / 2 = 0,005 = 0,5%.

b) Si la longitud de un cable seleccionado al azar se denota con X, tenemos


P (1990 ≤ X ≤ 2010) = P(E) = 0,99
Como P (X ≥ 2010) = P(G) = 0,005
P (X ≥ 1990) = P(E) + P(G) = 0,99 + 0,005 = 0,995
Esto también se resuelve de la siguiente forma:
P (X ≥ 1990) + P (X < 1990) = 1
Así, P (X ≥ 1990) = 1 – P (X < 1990) = 1 – P(P) = 1 – 0,005 = 0,995

Probabilidad condicional

La probabilidad de que ocurra un evento B cuando se sabe que ya ocurrió algún evento A se llama probabilidad
condicional y se denota con P(B|A). El símbolo P(B|A) por lo general se lee como “la probabilidad de que ocurra
B, dado que ocurrió A”, o simplemente, “la probabilidad de B, dado A”. La probabilidad condicional de B, dado
A, que se denota con P(B|A), se define como:
Sapere Aude
Atrévete a saber
44
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
𝑃(𝐴∩𝐵)
𝑃(𝐵|𝐴) = 𝑃(𝐴)
, siempre que P(A) > 0.

Se puede establecer también que P(A|B) es:


𝑃(𝐴∩𝐵)
𝑃(𝐴|𝐵) = 𝑃(𝐵)
, siempre que P(B) > 0.

Dos eventos A y B son independientes si y solo si P(B|A) = P(B) o P(A|B) = P(A), si se asume la existencia de
probabilidad condicional. De otra forma, A y B son dependientes.

42.Una empresa cuenta con 500 empleados. La siguiente tabla muestra la distribución de empleados en lo
relativo a su escolaridad. Si se escoge un empleado al azar, determine la probabilidad de que (a) solo tenga
como escolaridad la escuela, (b) tenga más de treinta y cinco años y su escolaridad es técnica, (c) sea
universitario de más de 35 años, (d) tenga un postgrado y 35 años o menos, (e) tenga entre 35 y 45 años y
haya logrado como máximo estudios técnicos, (f) tenga como mínimo estudios de colegio, (g) se seleccionó
una persona con escolaridad técnica de más de 25 años, cuál es la probabilidad de que tenga más de 35 años,
(h) se seleccionó una persona de 45 años o menos, cuál es la probabilidad de que al menos tenga escolaridad
técnica.

Escolaridad \ Edad ≤25 >25 y ≤35 >35 y ≤45 >45 Total


Escuela 8 12 15 45 80
Colegio 35 30 40 30 135
Técnica 80 40 30 50 200
Universidad 13 33 12 8 66
Postgrado 1 3 5 10 19
Total 137 118 102 143 500

a) A: Solo tiene como escolaridad la escuela 𝑃(𝐴) = 80⁄500 = 8⁄50 = 4⁄25 = 0,16 = 16%

b) B: Tiene más de treinta y cinco años y su escolaridad es técnica


80
500 80 16
𝑃(𝐵) = 𝑃(𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑 𝑡é𝑐𝑛𝑖𝑐𝑎|𝑡𝑖𝑒𝑛𝑒 𝑚á𝑠 𝑑𝑒 35 𝑎ñ𝑜𝑠) = 245 = 245 = 49 = 0,3265 = 32,65%
500

c) C: Es universitario de más de 35 años


𝑃(𝐶) = 𝑃(𝑡𝑖𝑒𝑛𝑒 𝑚á𝑠 𝑑𝑒 35 𝑎ñ𝑜𝑠|𝑈𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑡𝑎𝑟𝑖𝑜) = 20⁄66 = 10⁄33 = 0,3030 = 30,30%

d) D: Tiene un postgrado y 35 años o menos


𝑃(𝐷) = 𝑃(𝑡𝑖𝑒𝑛𝑒 35 años o menos|tiene un postgrado) = 4⁄19 = 0,2105 = 21,05%

e) E: Tiene entre 35 y 45 años y ha logrado como máximo estudios técnicos


𝑃(𝐸) = 𝑃(tiene como máximo estudios técnicos|tiene entre 35 y 45 años) = 85⁄102 = 5⁄6
= 0,8333 = 83,33%

80
f) F: Tiene como mínimo estudios de colegio. 𝑃(𝐹) = 1 − 500 = 420⁄500 = 21⁄25 = 0,84 = 84%

g) G: Se seleccionó una persona con escolaridad técnica de más de 25 años y tiene más de 35 años
Sapere Aude
Atrévete a saber
45
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
𝑃(𝐺) = 𝑃(𝑡𝑖𝑒𝑛𝑒 𝑚á𝑠 𝑑𝑒 35 𝑎ñ𝑜𝑠|𝑡𝑖𝑒𝑛𝑒 𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑 𝑡é𝑐𝑛𝑖𝑐𝑎 𝑑𝑒 𝑚á𝑠 𝑑𝑒 25 𝑎ñ𝑜𝑠) = 80⁄120 = 2⁄3
= 0,6667 = 66,67%

h) H: se seleccionó una persona de 45 años o menos y al menos tiene escolaridad técnica


𝑃(𝐻) = 𝑃(𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑡𝑖𝑒𝑛𝑒 𝑒𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑 𝑡é𝑐𝑛𝑖𝑐𝑎|𝑡𝑖𝑒𝑛𝑒 45 𝑎ñ𝑜𝑠 𝑜 𝑚𝑒𝑛𝑜𝑠) = 217⁄357 = 31⁄51 =
0,6078 = 60,78%

43.Sea la población de adultos de una pequeña ciudad que cumplen con los requisitos para obtener un título
universitario, clasificada de acuerdo con su sexo y situación laboral. Los datos se presentan en la siguiente
tabla:
Empleado Desempleado Total
Hombre 460 40 500
Mujer 140 260 400
Total 600 300 900
Se selecciona al azar a uno de estos individuos para que realice un viaje a través del país con el fin de promover
las ventajas de establecer industrias nuevas en la ciudad. Nos interesaremos en los eventos siguientes,
determine la probabilidad para cada caso señalado: a) Se elige un hombre y el elegido tiene empleo. b) Se
elige una persona desempleada que resulta ser mujer. c) Se elige una mujer que tiene empleo. d) Se elige un
hombre que no tiene empleo. e) Se elige entre los hombres y resulta que no tiene empleo. f) De todas las
mujeres se elige una y resulta estar empleada.
460
460
a) 𝑃(𝐻|𝐸) = 900
600 = 600 = 23⁄30 = 0,7667 = 76,67%
900
260
b) 𝑃(𝑀|𝐷) = 300 = 13⁄15 = 0,8667 = 86,67%
140
c) 𝑃(𝑀|𝐸) = 600 = 7⁄30 = 0,2333 = 23,33%
40
d) 𝑃(𝐻|𝐷) = 300 = 2⁄15 = 0,1333 = 13,33%
40 2
e) 𝑃(𝐷|𝐻) = 500 = 25 = 0,08 = 8%
140 7
f) 𝑃(𝐸|𝑀) = = = 0,35 = 35%
400 20

44.La probabilidad de que un vuelo programado normalmente salga a tiempo es P(D) = 0,83, la probabilidad de
que llegue a tiempo es P(A) = 0,82 y la probabilidad de que salga y llegue a tiempo es P(D ∩ A) = 0,78. Calcule
la probabilidad de que un avión a) llegue a tiempo, dado que salió a tiempo; b) salió a tiempo, dado que llegó
a tiempo y c) llegue a tiempo dado que no salió a tiempo.
a) La probabilidad de que llegue a tiempo dado que salió a tiempo sería:
𝑃(𝐴∩𝐷) 0,78
𝑃(𝐴|𝐷) = 𝑃(𝐷)
= = 0,939759 = 93,98%
0,83
b) La probabilidad de que haya salido a tiempo dado que llegó a tiempo sería:
0,78
𝑃(𝐷|𝐴) = 0,82 = 0,9512195 = 95,12%
c) La probabilidad de que llegue a tiempo dado que no salió a tiempo sería:
𝑃(𝐴∩𝐷𝐶 ) 0,82−0,78 0,04 4
𝑃(𝐴|𝐷 ′ ) = ̅)
𝑃(𝐷
= 1−0,83
= 0,17 = 17 = 0,235294 = 23,53%

45.Considere un proceso industrial en el ramo textil, en el que se producen listones de una tela específica. Los
listones pueden resultar con defectos en dos de sus características: la longitud y la textura. En el segundo
caso el proceso de identificación es muy complicado. A partir de información histórica del proceso se sabe
que 10% de los listones no pasan la prueba de longitud, que 5% no pasan la prueba de textura y que sólo 0,8%
Sapere Aude
Atrévete a saber
46
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
no pasan ninguna de las dos pruebas. Si en el proceso se elige un listón al azar y una medición rápida identifica
que no pasa la prueba de longitud, ¿cuál es la probabilidad de que la textura esté defectuosa? Considere que
T es el defecto en la textura y L el defecto en la longitud.
Lo que se busca es P(T|L):
𝑃(𝑇|𝐿) = 𝑃(𝐿) = 0,008⁄0,1 = 2⁄25 = 0,08 = 8%
𝑃(𝑇∩𝐿)

46.Considere el evento en el que se sacan 2 cartas, una después de la otra, de una baraja ordinaria, con
reemplazo. Se definen los eventos A: la primera carta es un as y B: la segunda carta es una espada. Encuentre
P(B) y P(B|A).
13
𝑃(𝐵) = 52 = 1⁄4
𝑃(𝐵|𝐴) = 𝑃(𝐵) = 13⁄52 = 1⁄4

La regla de producto o regla multiplicativa

La regla multiplicativa o regla de producto, nos permite calcular la probabilidad de que ocurran dos eventos. Si
en un experimento pueden ocurrir los eventos A y B, entonces:
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐵|𝐴) =
𝑃(𝐴)
de donde:
P(A ∩ B) = P(A)P(B|A)

siempre que P(A) > 0. Por consiguiente, la probabilidad de que ocurran A y B es igual a la probabilidad de que
ocurra A multiplicada por la probabilidad condicional de que ocurra B, dado que ocurre A. Como los eventos
A ∩ B y B ∩ A son equivalentes, se deduce que también podemos escribir:

P(A ∩ B) = P(B ∩ A) = P(B)P(A|B)

En otras palabras, no importa que evento se considere como A ni que evento se considere como B.

47.Suponga que tenemos una caja de fusibles que contiene 20 unidades, de las cuales 5 están defectuosas. Si se
seleccionan 2 fusibles al azar y se retiran de la caja, uno después del otro, sin reemplazar el primero, ¿cuál es
la probabilidad de que ambos fusibles estén defectuosos?
5 4 20 1
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∙ 𝑃(𝐵|𝐴) = 20 ∙ 19 = 380 = 19 = 0,0526 = 5,26%

48.Una bolsa contiene 4 bolas blancas y 3 negras, y una segunda bolsa contiene 3 blancas y 5 negras. Se saca una
bola de la primera bolsa y se coloca sin verla en la segunda bolsa. ¿Cuál es la probabilidad de que ahora se
saque una bola negra de la segunda bolsa?

Sapere Aude
Atrévete a saber
47
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
𝑃((𝑁1 ∩ 𝑁2 ) 𝑈 (𝐵1 ∩ 𝑁2 )) = 𝑃(𝑁1 ∩ 𝑁2 ) + 𝑃(𝐵1 ∩ 𝑁2 ) = 𝑃(𝑁1 ) ∙ 𝑃(𝑁2 |𝑁1 ) + 𝑃(𝐵1 ) ∙ 𝑃(𝑁2 |𝐵1 )
3 6 4 5 38
𝑃(𝑁1 ) ∙ 𝑃(𝑁2 |𝑁1 ) + 𝑃(𝐵1 ) ∙ 𝑃(𝑁2 |𝐵1 ) = ( ) ∙ ( ) + ( ) ∙ ( ) = = 0,6032 = 60,32%
7 9 7 9 63

49.Una pequeña ciudad dispone de un carro de bomberos y una ambulancia para emergencias. La probabilidad
de que el carro de bomberos esté disponible cuando se necesite es 0,98 y la probabilidad de que la ambulancia
esté disponible cuando se le requiera es 0,92. En el evento de un herido en un incendio, calcule la probabilidad
de que tanto la ambulancia como el carro de bomberos estén disponibles, suponiendo que operan de forma
independiente.
𝑃(𝐴 ∩ 𝐵) = 0,92 ∙ 0,98 = 0,9016

Si en un experimento pueden ocurrir los eventos A1, A2,..., Ak, entonces:


P(A1 ∩ A2 ∩···∩Ak) = P(A1)∙P(A2|A1) ∙P(A3|A1 ∩ A2)・・・P(Ak|A1 ∩ A2 ∩・・・∩Ak-1)

Si los eventos A1, A2,..., Ak son independientes, entonces:


P(A1 ∩ A2 ∩···∩Ak) = P(A1) ∙P(A2)・・・P(Ak)

50.Se sacan tres cartas seguidas, sin reemplazo, de una baraja ordinaria. Encuentre la probabilidad de que ocurra
el evento A1 ∩ A2 ∩ A3, donde A1 es el evento de que la primera carta sea un as rojo, A2 el evento de que la
segunda carta sea un 10 o una jota y A3 el evento de que la tercera carta sea mayor que 3 pero menor que 7.
2 12
𝑃(𝐴1 ) = 52 = 1⁄26 𝑃(𝐴2 |𝐴1 ) = 8⁄51 𝑃(𝐴3 |𝐴1 ∩ 𝐴2 ) = 50 = 6⁄25
8
𝑃(𝐴1 ∩ 𝐴2 ∩ 𝐴3 ) = 1⁄26 ∙ 8⁄51 ∙ 6⁄25 = = 0,001448 = 0,1448%
5525

51.La contaminación de los ríos en Costa Rica es un grave problema. Considere los siguientes eventos: A = {El río
está contaminado}, B = {Una prueba en una muestra de agua detecta contaminación} y C = {Se permite la
pesca}. Suponga:
P (A) = 0,25, P (B | A) = 0,70, P (B | Ac) = 0,22 P (C | A ∩ B) = 0,22
c c
P (C | A ∩ B) = 0,18 P (C | A ∩ B ) = 0,78 P (C | Ac ∩ Bc) = 0,92

a. Encuentre P (A ∩ B ∩ C)
P (A ∩ B ∩ C): = P(A) ∙ P(B | A) ∙ P(C|A ∩ B) = 0,25 ∙ 0,70 ∙ 0,22 = 0,0385 = 3,85%
b. Encuentre P (Bc ∩ C)
P(Bc ∩ C) = P(A ∩ Bc ∩ C) + P(Ac ∩ Bc ∩ C) = P(A) ∙ P(Bc | A) ∙ P(C | A ∩ Bc) + P(Ac) ∙ P(Bc | Ac) ∙ P(C | Ac ∩ Bc)
P(Bc ∩ C) = 0,25 ∙ (1 - 0,70) ∙ 0,78 + (1 - 0,25) ∙ (1 - 0,22) ∙ 0,92 = 0,0585 + 0,5382 = 0,5967 = 59,67%
c. Encuentre P(C)
P(C) = P(A ∩ B ∩ C) + P(A ∩ Bc ∩ C) + P(Ac ∩ B ∩ C) + P(Ac ∩ Bc ∩ C)
P(C) = 0,0385 + 0,0585 + P(Ac) ∙ P(B|Ac) ∙ P(C|Ac ∩ B) + 0,5382 = 0,6352 + (1 – 0,25) ∙ 0,22 ∙ 0,18 = 0,6649

Probabilidad Total

Sea el caso en donde el espacio muestral se parte en k subconjuntos y tenemos un evento que se interseca con
varios de esos subconjuntos, como se muestra en el siguiente diagrama:

Sapere Aude
Atrévete a saber
48
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

El teorema de probabilidad total o regla de eliminación indica:

Si los eventos B1, B2,... Bk constituyen una partición del espacio muestral S, tal que P(Bi) ≠ 0 para i = 1, 2,..., k,
entonces, para cualquier evento A de S se tiene que: 𝑃(𝐴) = ∑𝑘𝑖=1 𝑃(𝐵𝑖 ∩ 𝐴) = ∑𝑘𝑖=1 𝑃(𝐵𝑖 ) ⋅ 𝑃(𝐴|𝐵𝑖 ).

52.Tres máquinas de cierta planta de ensamble, B1, B2 y B3, montan 30%, 45% y 25% de los productos,
respectivamente. Se sabe por experiencia que 2%, 3% y 2% de los productos ensamblados por cada máquina,
respectivamente, tienen defectos. Ahora bien, suponga que se selecciona de forma aleatoria un producto
terminado. ¿Cuál es la probabilidad de que esté defectuoso?
𝑃(𝐷) = 𝑃(𝐵1 ) ∙ 𝑃(𝐷|𝐵1 ) + 𝑃(𝐵2 ) ∙ 𝑃(𝐷|𝐵2 ) + 𝑃(𝐵3 ) ∙ 𝑃(𝐷|𝐵3 )
49
𝑃(𝐷) = 0,3 ∙ 0,02 + 0,45 ∙ 0,03 + 0,25 ∙ 0,02 = 2000 = 0,0245 = 2,45%

Regla de Bayes

La Regla de Bayes señala que si los eventos B1, B2,..., Bk constituyen una partición del espacio muestral S, donde
P(Bi) ≠ 0 para i = 1, 2,...,k, entonces, para cualquier evento A en S, tal que P(A) ≠ 0,
𝑃(𝐵𝑗 ∩𝐴) 𝑃(𝐵𝑗 )⋅𝑃(𝐴|𝐵𝑗 )
𝑃(𝐵𝑗 |𝐴) = =
∑𝑘
𝑖=1 𝑃(𝐵𝑖 ∩𝐴) ∑𝑘
𝑖=1 𝑃(𝐵𝑖 )⋅𝑃(𝐴|𝐵𝑖 )

53.Con referencia al ejemplo anterior, si se elige al azar un producto y se encuentra que está defectuoso, ¿cuál
es la probabilidad de que haya sido ensamblado con la máquina B3?
𝑃(𝐵3 )∙𝑃(𝐷|𝐵3 ) 0,25∙0,02 0,005 10
𝑃(𝐵3 |𝐷) = = = = = 0,2041 = 20,41%
𝑃(𝐵1 )∙𝑃(𝐷|𝐵1 )+𝑃(𝐵2 )∙𝑃(𝐷|𝐵2 )+𝑃(𝐵3 )∙𝑃(𝐷|𝐵3 ) 0,0245 0,0245 49
𝑃(𝐵3 |𝐷) = 0,2040816327 = 20,41%
La probabilidad de que haya sido ensamblado con la máquina B3 es del 20,41%.

54.En un colegio los alumnos pueden optar por cursar como lengua extranjera inglés o francés. En un
determinado curso, el 80% de los alumnos estudia inglés y el resto francés. El 35% de los que estudian inglés
son hombres y de los que estudian francés el 45% son hombres. Elegido un alumno al azar, ¿cuál es la
probabilidad de estudie francés dado que es mujer?
𝑃(𝐹)⋅𝑃(𝑀|𝐹) 0,2⋅0,55 11
𝑃(𝐹|𝑀) = 𝑃(𝐹)⋅𝑃(𝑀|𝐹)+𝑃(𝐹)⋅𝑃(𝐻|𝐹)
= 0,2⋅0,55+0,2⋅0,45 = 20 = 0,55 = 55%
La probabilidad de estudie francés dado que es mujer es del 55%.

55.El 20% de los empleados de una empresa son ingenieros y otro 20% son economistas. El 75% de los ingenieros
ocupan un puesto directivo y el 50% de los economistas también, mientras que los no ingenieros y los no
economistas solamente el 20% ocupa un puesto directivo. ¿Cuál es la probabilidad de que un empleado
directivo elegido al azar sea ingeniero?

Sapere Aude
Atrévete a saber
49
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
𝑃(𝐼)∙𝑃(𝐷|𝐼) 0,2∙0,75 15
𝑃(𝐼|𝐷) = 𝑃(𝐼)∙𝑃(𝐷|𝐼)+𝑃(𝐸)∙𝑃(𝐷|𝐸)+𝑃(𝑁)∙𝑃(𝐷|𝑁)
= 0,2∙0,75+0,2∙0,5+0,6∙0,2
= 37 = 0,4054 = 40,54%
La probabilidad de que un empleado directivo elegido al azar sea ingeniero es del 40,54%.

56.Una empresa de manufactura emplea tres planos analíticos para el diseño y desarrollo de un producto
específico. Por razones de costos los tres se utilizan en momentos diferentes. De hecho, los planos 1, 2 y 3 se
utilizan para 30%, 20% y 50% de los productos, respectivamente. La tasa de defectos difiere en los tres
procedimientos de la siguiente manera: P(D|P1) = 0,01, P(D|P2) = 0,03, P(D|P3) = 0,02, en donde P(D|Pj) es la
probabilidad de que un producto esté defectuoso, dado el plano j. Si se observa un producto al azar y se
descubre que está defectuoso, ¿cuál de los planos tiene más probabilidad de haber sido utilizado y, por lo
tanto, de ser el responsable?
𝑃(𝐷) = 0,3 ∙ 0,01 + 0,2 ∙ 0,03 + 0,5 ∙ 0,02 = 0,003 + 0,006 + 0,01 = 0,019 = 1,9%
0,003 3
𝑃(𝐷|𝑃1 ) = = = 0,1579 = 15,79%
0,019 19
0,006 6
𝑃(𝐷|𝑃2 ) = 0,019 = 19 = 0,3158 = 31,58%
0,01 10
𝑃(𝐷|𝑃3 ) = 0,019 = 19 = 0,5263 = 52,63%
El plano que tiene más probabilidad de haberse usado es el plano 3.

57.La probabilidad de que haya un accidente en una fábrica que dispone de alarma es 0,1. La probabilidad de
que suene esta sí se ha producido algún incidente es de 0,97 y la probabilidad de que suene si no ha sucedido
ningún incidente es 0,02. En el supuesto de que haya funcionado la alarma, ¿cuál es la probabilidad de que
no haya habido ningún incidente?
𝑃(𝑁)∙𝑃(𝑆|𝑁)
𝑃(𝑁|𝑆) = 𝑃(𝑁)∙𝑃(𝑆|𝑁)+𝑃(𝐴)𝑃(𝑆|𝐴)
0,9∙0,02 0,018
𝑃(𝑁|𝑆) = = = 0,1565 = 15,65%
0,9∙0,02+0,1∙0,97 0,115
La probabilidad de que no haya habido ningún incidente y que la alarma haya sonado es de un 15,65%.

58.Una empresa tiene cuatro inspectores de producto que colocan una etiqueta con la fecha de caducidad en
cada uno de los productos producidos en una línea de ensamblaje. El inspector A coloca la etiqueta en el 20%
de los productos y no la pone una vez cada 200 unidades; el inspector B la coloca en el 40% de los productos
y no la pone en uno de cada cien productos; el inspector C la coloca en el 25% de los productos y no lo hace
en el 2% de los casos; finalmente el inspector D etiqueta el resto de los productos, pero falla en 2 de cada 300
productos. Si se recibe una queja de un consumidor respecto a que su producto no tiene fecha de caducidad,
cuál es la probabilidad de que el inspector C sea el culpable.

Inspector % Etiquetado % Error


A 20% 1/200 = 0,005 = 0,5%
B 40% 1/100 = 0,01 = 1%
C 25% 2% = 0,02
D 15% 2/300 = 0,0067=0,67%

0,25 ∙ 0,02 0,005


𝑃(𝐶 | 𝑄𝑢𝑒𝑗𝑎) = = = 0, ̅45
̅̅̅ = 45, ̅45
̅̅̅%
0,2 ∙ 0,005+0,4 ∙ 0,01+0,25 ∙ 0,02+0,15 ∙ 0,0067 0,011
La probabilidad de que el inspector C sea el culpable de que el producto no tenga fecha de caducidad es de
un 45,45%.

Sapere Aude
Atrévete a saber
50
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
59.Tenemos tres urnas: A con 3 bolas rojas y 5 negras, B con 2 bolas rojas y 1 negra y C con 2 bolas rojas y 3
negras. Escogemos una urna al azar y extraemos una bola. Si la bola ha sido roja, ¿cuál es la probabilidad de
haber sido extraída de la urna A?
La probabilidad pedida es P(A|R). Utilizando el teorema de Bayes, tenemos:
𝑃(𝐴)𝑃(𝑅|𝐴)
P(A|R) = 𝑃(𝐴)𝑃(𝑅|𝐴)+𝑃(𝐵)𝑃(𝑅|𝐵)+𝑃(𝐶)𝑃(𝑅|𝐶)
1 3
∙ 45
3 8
𝑃(𝐴|𝑅) = 1 3 1 2 1 2 = 173 = 0,2601 = 26,01%
∙ + ∙ + ∙
3 8 3 3 3 5
La probabilidad de que la bola roja haya sido extraída de la urna A es de un 26,01%.

60.Se sabe que el 65% de los accidentes de tráfico que se producen durante la noche de los sábados, se deben a
la ingesta excesiva de alcohol, el 25% se deben a la imprudencia del conductor y el resto a otras causas, (fallo
mecánico…etc.). En estos accidentes, el resultado es nefasto el 30% de las veces en el primer caso, el 20% en
el segundo y el 5% en el tercero. a) Calcular la probabilidad de que uno de estos accidentes no tenga resultado
nefasto. b) Si se produce un accidente sin resultado nefasto, calcular la probabilidad de que la causa de dicho
accidente sea la ingesta excesiva de alcohol.
a) La probabilidad pedida es P(NN):
𝑃(𝑁𝑁) = 0,65 ∙ 0,70 + 0,25 ∙ 0,80 + 0,10 ∙ 0,95 = 0,75 = 75%
b) La probabilidad pedida es P(NN|A):
0,65 ∙ 0,70 91
𝑃(𝑁𝑁|𝐴) = = = 0,6067 = 60,67%
0,75 150

61.Supongamos que tenemos 4 cajas con componentes electrónicos dentro. La caja 1 contiene 2000
componentes, con un 5% de defectuosos; la caja 2 contiene 500 componentes, con un 40% de defectuosos;
las cajas 3 y 4 contienen 1000 componentes cada una, con un 10% de defectuosos. ¿Cuál es la probabilidad
de escoger al azar un componente defectuoso? Si se escoge un componente al azar y resulta ser defectuoso,
¿cuál es la probabilidad de que pertenezca a la caja 1?

Caja 1 Caja 2 Caja 3 Caja 4 Total


Total de productos 2000 500 1000 1000 4500
% del Total 4/9 1/9 2/9 2/9 1
% Defectuoso por caja 5% 40% 10% 10%
% Defectuoso 1/45 2/45 1/45 1/45 1/9
P(D) = 1/9
1
45 1
𝑃(𝐶1 |𝐷) = 1 = 5 = 0,20 = 20%
9

Análisis de Confiabilidad

El análisis de confiabilidad es una rama de la Ingeniería que se dedica al cálculo de las tasas de funcionamiento
o falla de los sistemas. Usualmente se requiere de técnicas y métodos matemáticos avanzados, pero hay aspectos
básicos que es necesario reconocer, para poder entender este análisis.

Se tienen fundamentalmente dos tipos de sistemas: serie y paralelo. Dado un sistema con dos componentes A y
B, independientes entre sí, si los componentes están conectados en serie, es decir el sistema funciona si ambos
componentes funcionan, para lograr la probabilidad de funcionamiento del sistema se utiliza la fórmula

Sapere Aude
Atrévete a saber
51
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
P(F) = P (A ∩ B) y al ser independientes, P(F) = P(A)∙P(B). Si los componentes están conectados en paralelo, es
decir el sistema funciona si funciona alguno de los componentes, para lograr la probabilidad de funcionamiento
del sistema se utiliza la fórmula P(F) = P(A U B) y al ser independientes, P(F) = P(A) + P(B) – P(A)∙P(B).

En general, una buena técnica de solución es dividir el sistema en pequeños subsistemas serie o paralelo, para
resolverlos de lo más sencillo a lo más complejo. Deben utilizarse todos los decimales en el cálculo y siempre se
trabaja con las probabilidades de funcionamiento.

Ejemplo: Un sistema consta de seis componentes conectados, como se muestra en el diagrama siguiente:
B C
A F
D E

Suponga que A, B, C, D, E y F funcionan de manera independiente. Si las probabilidades de que B, C, D, E y F fallen


son de 8%, 4%, 7%, 7% y 10% respectivamente, y la probabilidad de que A no falle es de 95% ¿cuál es la
probabilidad de que el sistema opere correctamente?

Construyamos los siguientes subsistemas: S1 la serie BC, S2 la serie DE, S3 el paralelo S1 ∙ S2 y al final se resuelve
la serie A ∙ S3 ∙ F. Debemos obtener las probabilidades de funcionamiento de cada uno de los componentes:
Componente P falla P funcionamiento
A 0,05 0,95
B 0,08 0,92
C 0,04 0,96
D 0,07 0,93
E 0,07 0,93
F 0,10 0,90
Entonces:
S1 = 0,92 ∙ 0,96 = 0,8832
S2 = 0,93 ∙ 0,93 = 0,8649
S3 = 0,8832 + 0,8649 - 0,8832 ∙ 0,8649 = 0,98422032
S = 0,95 ∙ 0,98422032 ∙ 0,90 = 0,8415083736

La probabilidad de que el sistema opere correctamente es de P(F) = 84,15%, por lo que la probabilidad de falla
del sistema sería P(f) = 1 – 0,8415 = 15,85%.

62.Encuentre la probabilidad de falla del siguiente sistema, si se tienen las probabilidades de fallas indicadas en
el cuadro:
Elemento P(f) P(F) Elemento P(f) P(F) Elemento P(f) P(F)
A 13% 87% D 8% 92% G 9% 91%
B 10% 90% E 1% 99%
C 7% 93% F 12% 88%

S1: P(C U D) = 0,9944


Sapere Aude
Atrévete a saber
52
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
S2: P(S1 U E) = 0,999944
S3: P(A ∩ B ∩ S2 ∩ F ∩ G) = 0,6269912865216
P(F) = 62,70%
P(f) = 37,30%

63.Determine la probabilidad de funcionamiento del siguiente sistema, si se conoce que:


a. Las probabilidades de funcionamiento de los elementos A, E, H y L son de un 95%.
b. Las probabilidades de funcionamiento de los elementos B, C, J y K son de un 97%.
c. Las probabilidades de funcionamiento de los elementos D, F y G son de un 98%.
d. La probabilidad de falla del elemento I es de un 2%.

S1 = P(B U C ) = 0,9991
S2 = P(D U E ) = 0,999
S3 = P(S2 U F ) = 0,99998
S4 = P(G U H ) = 0,999
S5 = P(S4 U I ) = 0,99998
S6 = P(J U K ) = 0,9991
S7 = P(A ∩ S1 ∩ S3 ∩ S5 ∩ S6 ∩ L) = 0,900840196336109
P(F) = 90,08%

64.Determine las probabilidades de funcionamiento y falla del sistema que se muestra, si se tiene que:
Elemento P(f) P(F) Elemento P(f) P(F) Elemento P(f) P(F)
A 0,08 0,92 C 0,07 0,93 E 0,10 0,90
B 0,03 0,97 D 0,11 0,89 F 0,06 0,94

S1 = P(A ∩ D) = 0,8188
S2 = P(B ∩ E) = 0,873
S3 = P(C ∩ F) = 0,8742
S4 = P(S1 U S2) = 0,9769876
S5 = P(S4 U S3) = 0,99710504008
S6 = P(A U B) = 0,9976
S7 = P(S6 U C) = 0,999832
S8 = P(C U D) = 0,9923
S9 = P(S8 U E) = 0,99923
S10 = P(S5 ∩ S7 ∩ S9 ∩ S7) = 0,996002528
Sapere Aude
Atrévete a saber
53
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
P(F) = 99,60%
P(f) = 0,40%

65.Determine la probabilidad de funcionamiento del siguiente sistema, si se conoce que:


a. Las probabilidades de funcionamiento de los elementos A y E son de un 96%.
b. Las probabilidades de funcionamiento de los elementos B y C son de un 94%.
c. La probabilidad de falla del elemento D es de un 3%.

S1 = P(A ∩ B) = 0,9024
S2 = P(A ∩ D) = 0,9312
S3 = P (S1 U S2) = 0,99328512
S4 = P (S3 U S3) = 0,999954910386586
S5 = P(C ∩ D ∩ E) = 0,875328
S6 = P(B ∩ E ∩ C) = 0,848256
S7 = P (S5 U S6) = 0,981081772032
S8 = P (S7 U S7) = 0,999642101
S9 = P (S4 ∩ S8) = 0,99959702717468
P(F) = 99,96%
P(f) = 0,04%

66.Determine las probabilidades de falla y funcionamiento del siguiente sistema, si se tiene que:
Elemento P(F) P(f) Elemento P(F) P(f)
A 97% E 88%
B 5% F 12%
C 3% G 15%
D 7%

S1 = P(B U C) = 0,9985
S2 = P(B ∩ D) = 0,8835
S3 = P(C ∩ E) = 0,8536
S4 = P(S2 U S3) = 0,9829444
S5 = P(S4 ∩ F) = 0,864991072
S6 = P(F U G) = 0,982
S7 = P(B ∩ D ∩S6 ∩ G) = 0,73745745
S8 = P(S5 U S7) = 0,964554412
Sapere Aude
Atrévete a saber
54
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
S9 = P(A ∩ S1 ∩ A ∩ S8) = 0,906187922
P(F) = 90,62%
P(f) = 9,38%

67.Determine la probabilidad de falla del sistema mostrado en la figura, si se sabe que la probabilidad de falla de
A = 3%, de B = 2,5%, de C = 4%, de D = 3,5% y de E = 4,5%

S1 = P(A ∩ C) = 0,93120
S2 = P(S1 U B) = 0,99828
S3 = 0,723031406196251
P(F) = 72,30%
P(f) = 27,70%

68.Analice el siguiente sistema y determine su probabilidad de falla, si P(FA) = 0,95, P(FB) = 0,92 y P(FC) = 0,90.

S1 = P(A U B) = 0,996
S2 = P(A ∩ B ∩ C ∩ A) = 0,74727
S3 = P(A U S2) = 0,9873635
S4 = P(B ∩ C ∩ S1 ∩ S1 ∩ C ∩ B S3) = 0,671516083571613
P(F) = 67,15%
P(f) = 32,85%

Sapere Aude
Atrévete a saber
55
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Propagación de errores

La medición es fundamental en el trabajo de investigación y con frecuencia científicos e ingenieros realizan


cálculos con cantidades medidas. Cualquier procedimiento de medición tiene errores, por lo que, en general, los
valores medidos son algo diferentes de los valores reales. Cuando se realiza un cálculo con mediciones, los
errores en éstas producen un error en el valor calculado, por lo que decimos que el error se propaga de las
mediciones al valor calculado. Existen métodos para conocer la magnitud del error en una cantidad calculada, si
se tiene cierto conocimiento con respecto al tamaño de los errores en las mediciones.

Un biólogo pesa un espécimen en una balanza. Toma cinco mediciones y obtiene los siguientes datos (en
gramos): 231,4, 232,5, 230,9, 231,3, 230,4. Todas las mediciones son diferentes y es probable que ninguna sea
igual a la masa real del espécimen. A la diferencia entre un valor medido y el valor real se le llama error en el
valor medido.

Supongamos que las mediciones del espécimen se leen en una marca en una escala, si la balanza no está calibrada
adecuadamente, cada medición va a estar alejada de su valor real en cierta cantidad fija; por tanto, una
calibración inadecuada aporta errores de la misma magnitud en cada medición, a lo que se le llama error
sistemático o sesgo. Otra fuente de error es la interpolación entre las marcas de graduación de la escala, la
magnitud del error debida a la interpolación quizá varíe entre mediciones y es probable que sea benéfico para
algunas mediciones y negativo para otras; en este caso es razonable suponer que a largo plazo el promedio de
los errores por interpolación será igual a cero, por lo que a este error se le denomina error aleatorio.

En general, se puede establecer que el error de una medición lo integran el error sistemático o sesgo y el error
aleatorio. El sesgo representa la parte del error que es igual para cada medición mientras que el aleatorio varía
entre mediciones y, en promedio, tiende a cero en si se hacen una gran cantidad de mediciones. Existen algunas
fuentes de error contribuyen con ambos tipos de error, una de ellas es el error de paralaje, que constituye la
diferencia en la posición evidente de una marca cuando se observa desde ángulos diferentes; la magnitud de
este error depende de la posición del observador con respecto a la escala y como consecuencia de que la posición
variará un poco entre lecturas, el paralaje contribuye al error aleatorio; pero si el observador tiende a apoyarse
un poco de un lado en vez de otro, el paralaje también contribuye al sesgo.

Cualquier medición se puede considerar como la suma del valor real más las contribuciones de cada uno de los
dos componentes del error: Valor medido = Valor real + sesgo + error aleatorio.

Dado que una parte del error es aleatorio, es pertinente utilizar un modelo estadístico para estudiar los errores
de medición, con lo que se modelará cada valor medido como una variable aleatoria, tomada de una población
de mediciones posibles. La media aritmética μ de la población, representa la parte de la medición que es igual
en todas las realizaciones, por lo que μ es la suma del valor real más el sesgo. La desviación estándar σ de la
población, representa la desviación estándar del error aleatorio, es decir, representa la variación debida al hecho
de que por éste, cada medición tiene un valor diferente; podemos intuir que σ constituye el valor de un error
aleatorio estándar.

Existen dos aspectos del proceso de medición a los que se les debe prestar atención. El primero es la exactitud,
que está determinada por el sesgo, el cual es la diferencia entre la media de la medición (μ) y el valor real; entre
más pequeño sea el sesgo, más exacto será el proceso de medición, por lo que si la media μ es igual al valor real
el sesgo será 0, siendo el proceso de medición insesgado.

Sapere Aude
Atrévete a saber
56
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
El otro aspecto del proceso de medición al que se le debe prestar atención es la precisión, que constituye el
grado con que tienden a coincidir las mediciones repetidas de la misma cantidad que está siendo evaluada. Si las
mediciones repetidas son poco dispersas, la precisión es alta; si son muy dispersas, la precisión es baja. Así las
cosas, la precisión se determina mediante la desviación estándar del proceso de medición (σ). Es común entre
ingenieros y científicos, referirse a σ como incertidumbre aleatoria o incertidumbre estadística del proceso de
medición, por lo que para simplificar le llamaremos incertidumbre.

Cuando se determina un valor medido, debe reportarse una estimación aproximada del sesgo y de la
incertidumbre, con la finalidad de describir la exactitud y la precisión de la medición. En la vida real no se conoce
el valor real que se está midiendo, por lo que se requiere información adicional acerca del mismo, si no, no se
puede calcular el sesgo. Se puede obtener esta información adicional, por ejemplo, midiendo repetidamente una
cantidad conocida cuyo valor real se conoce y estimar al sesgo como la diferencia entre el promedio de las
mediciones y el valor real conocido. Otra manera para calcular el sesgo puede ser comparar el promedio de un
gran número de mediciones con otra medición hecha con un proceso más elaborado, para el que se sabe que el
sesgo es despreciable. La estimación del sesgo es esencialmente el proceso de calibración, para el cual se necesita
información externa al dispositivo de medición.

Valor medido = media ± incertidumbre: 256,47 ± 0,52 kg

La expresión tiene la forma a ± b, y es importante darse cuenta de que las expresiones que contienen el símbolo
± pueden tener muchos significados. En este caso significa que a es un valor medido y b constituye la
incertidumbre en a. Algunas personas usan a ± b para indicar que b es el valor máximo para el error, o que b es
un múltiplo de la incertidumbre, generalmente dos o tres veces la incertidumbre; se utiliza también para denotar
un intervalo de confianza, que es un intervalo que se calcula de tal forma para que probablemente contenga al
valor real. Siempre que se encuentre con el símbolo ± se debe asegurar que se comprende el contexto en el cual
se utiliza.

1. Se sabe que una muestra de laboratorio de gas tiene una concentración de monóxido de carbono (CO) de
50 partes por millón (ppm). Se utiliza un espectrómetro para tomar nueve mediciones independientes de
esta concentración. Las nueve mediciones, en ppm, se muestran en la tabla. Estime el sesgo y la
incertidumbre en una medición del espectrómetro.
48 48 51
50 52 51
48 50 49
Media = 49,67 ppm
Sesgo = - 0,33 ppm
Incertidumbre = 1,50 ppm
Valor medido = 49,67 ± 1,50 ppm

2. Ahora se utiliza un espectrómetro diferente para medir la concentración de CO en otra muestra de gas. La
concentración real de esta muestra es desconocida. Se hacen doce mediciones (en ppm) que se muestran
en la tabla. Estime la incertidumbre en una medición de este espectrómetro. ¿Se puede estimar el sesgo?
58 63 60
64 59 60
63 59 59
59 62 63

Sapere Aude
Atrévete a saber
57
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Media = 60,75 ppm Sesgo = No se puede estimar.
Incertidumbre = 2,09 ppm Valor medido = 60,75 ± 2,09 ppm

3. El espectrómetro del primer ejemplo se ha recalibrado, por lo que se puede suponer que el sesgo es
despreciable. Ahora aquél se utiliza para medir la concentración de CO en otra muestra de gas. La medición
es 75,4 ppm. ¿Cómo se expresaría esta medición?
Valor medido = 75,4 ± 1,5 ppm

4. Se mide cuatro veces el punto de ebullición del agua. Los resultados son 110,01°C, 110,02°C, 109,99°C y
110,01°C. ¿Cuál de los siguientes enunciados describe mejor este proceso de medición?
a) Exacto, pero no preciso.
b) Preciso, pero no exacto.
c) Ni exacto ni preciso.
d) Tanto exacto como preciso.

5. Se usan dos aparatos para medir el punto de fusión del p-amino-benceno. Se toman números iguales de
mediciones en cada uno de los aparatos. El resultado en el primer aparato es 90 ± 1°C y el resultado en el
segundo es 90 ± 2°C. a) ¿Se puede decir qué aparato es más exacto? Si es así, indique cuál. Si no, explique
por qué. b) ¿Se puede decir qué aparato es más preciso? Si es así, diga cuál. Si no, explique por qué.

6. La longitud de un objeto está dada como 3,21 ± 0,02 cm. Verdadero o falso:
a) La longitud se midió de 3,21 cm.
b) La longitud real del objeto es de 3,21 cm.
c) El sesgo en la medición es de 0,02 cm.
d) La incertidumbre en la medición es de 0,02 cm.

7. Para algunos procesos de medición, la incertidumbre es aproximadamente proporcional al valor de la


medición. Por ejemplo, se dice que cierta balanza tiene una incertidumbre de ± 2%. Se pesa un objeto en
esta balanza.
a) Dado que la lectura es de 100 g, exprese la incertidumbre en esta medición, en gramos.
b) Dado que la lectura es de 50 g, exprese la incertidumbre en esta medición, en gramos.

8. Una persona se para sobre una balanza de baño. La lectura es de 100 kg. Después de que la persona se baja,
dicha lectura es de 2 kg.
a) ¿Es posible estimar la incertidumbre en esta medición? Si es así, estímela. Si no, explique por qué.
b) ¿Es posible estimar el sesgo en esta medición? Si es así, estímelo. Si no, explique por qué.

9. Una persona sube y baja de una balanza de baño cuatro veces. Las lecturas (en kg) son 98, 101, 100 y 102.
Cada vez que la persona se baja de la balanza, la lectura es de 2 kg.
a) ¿Es posible estimar la incertidumbre en estas mediciones? Si es así, estímela. Si no, explique por qué.
b) ¿Es posible estimar el sesgo en estas mediciones? Si es así, estímelo. Si no, explique por qué.

10. En un escenario hipotético, el Laboratorio Costarricense de Metrología ha recibido una nueva réplica del
kilogramo. Se pesa cinco veces. Las mediciones son las siguientes, en unidades de microgramos arriba de 1
kg: 114,3, 82,6, 136,4, 126,8, 100,7.
a) ¿Es posible estimar la incertidumbre en estas mediciones? Si es así, estímela. Si no, explique por qué.
b) ¿Es posible estimar el sesgo en estas mediciones? Si es así, estímelo. Si no, explique por qué.

Sapere Aude
Atrévete a saber
58
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
11. Ahora se pesa el kilogramo cinco veces en una balanza diferente. Las mediciones son las siguientes, en
unidades de microgramos arriba de 1 kg: 25,6, 26,8, 26,2, 26,8, 25,4.
a) ¿Es posible estimar la incertidumbre en estas mediciones? Si es así, estímela. Si no, explique por qué.
b) ¿Es posible estimar el sesgo en estas mediciones? Si es así, estímelo. Si no, explique por qué.

12. Un nuevo y desconocido peso se pesa en la misma balanza que se utilizó en el ejercicio anterior y la medición
es 127 μg arriba de 1 kg. Utilizando la información obtenida, ¿es posible tener una medición más exacta? Si
es así, ¿cuál es ésta? Si no, explique por qué.

13. El artículo “Calibration of an FTIR Spectrometer” (P. Pankratz, en Statistical Case Studies for Industrial and
Process Improvement, SIAM-ASA, 1997:19-38) describe el uso de un espectrómetro para hacer cinco
mediciones del contenido de carbono (en ppm) de cierta placa de silicio, cuyo contenido real de carbono se
sabía que era de 1,144 7 ppm. Las mediciones fueron 1,073 0, 1,082 5, 1,071 1, 1,087 0 y 1,097 9.
a) ¿Es posible estimar la incertidumbre en estas mediciones? Si es así, estímela. Si no, explique por qué.
b) ¿Es posible estimar el sesgo en estas mediciones? Si es así, estímelo. Si no, explique por qué.

14. Se midió ocho veces la longitud de una varilla. Las mediciones en centímetros, en el orden en que fueron
tomados, fueron 21,20, 21,22, 21,25, 21,26, 21,28, 21,30, 21,32 y 21,35.
a) ¿Estas mediciones parecen ser una muestra aleatoria de una población de mediciones posibles? ¿Por
qué sí? o ¿Por qué no?
b) ¿Es posible estimar la incertidumbre en estas mediciones? Explique.

Combinaciones lineales de las mediciones

A menudo se suman constantes a las mediciones, se multiplican mediciones por constantes, o se suman dos o
más mediciones. Las incertidumbres se ven afectadas debido a estas operaciones aritméticas.

Si X es una medición y c es una constante, entonces:


𝜎𝑐𝑋 = |𝑐|𝜎𝑋

Si X1, . . . , Xn son mediciones independientes y c1, . . . , cn son constantes, entonces:


𝜎𝑐1 𝑋1 +⋯+𝑐𝑛 𝑋𝑛 = √𝑐12 𝜎𝑋21 + ⋯ + 𝑐𝑛2 𝜎𝑋2𝑛

15. El radio de un círculo mide 3,0 ± 0,1 cm. Estime la circunferencia y determine la incertidumbre en la
estimación.
Sea R el radio del círculo. El valor medido de R es de 3,0 cm y la incertidumbre es la desviación estándar de
esta medición, que es σR = 0,1 cm. La circunferencia está dada por C = 2πR. La incertidumbre en C es σC, la
desviación estándar de C. Debido a que 2π es una constante, se tiene:
𝐶 = 2 ∙ 𝜋 ∙ 3,0 = 18,8 𝑐𝑚
𝜎𝑐 = |2𝜋|𝜎𝑅 = 6,28 · 0,1 𝑐𝑚 = 0,6 𝑐𝑚

La circunferencia es 18,8 ± 0,6 cm.

Sapere Aude
Atrévete a saber
59
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
16. El radio de un círculo mide 5,1 ± 0,2 cm. Estime la circunferencia y determine la incertidumbre en la
estimación.
C = 2πr
r = 5,1 cm
σr = 0,2 cm
C = 32,0 cm
σC = 1,3 cm
Circunferencia = 32,0 ± 1,3 cm

17. Un artículo se forma al colocar dos componentes, uno detrás de otro. Las longitudes de éstos se miden de
manera independiente, por medio de un proceso que da una medición aleatoria con incertidumbre 0,11 cm.
La longitud del artículo se estima sumando las dos longitudes medidas. Suponga que las mediciones son
5,25 y 3,75 cm. Estime la longitud del artículo y determine la incertidumbre en el cálculo.
x1 = 5,25 cm
x2 = 3,75 cm
σ = 0,11 cm
Fórmula: x1 + x2
L = 9,00 cm
𝜎𝐿 = √12 ∙ 0,112 + 12 ∙ 0,112 = 0,16 𝑐𝑚
Longitud = 9,00 ± 0,16 cm

18. Un topógrafo mide el perímetro de un terreno rectangular. Toma medidas de dos lados adyacentes, 65,15
± 0,07 m y 92,08 ± 0,09 m. Estas mediciones son independientes. Para estimar el perímetro del terreno el
topógrafo decide aplicar la fórmula 2X + 2Y. Estime el perímetro y determine la incertidumbre en la
estimación. El asistente del topógrafo sugiere que se calcule la incertidumbre en P mediante un método
diferente, su razonamiento es que P = X + X + Y + Y, determine el perímetro con este método y compare los
valores. Si son diferentes, ¿por qué lo son? ¿Cuál está equivocado?
L1 = 65,15 m
σ1 = 0,07 m
L2 = 92,08 m
σ2 = 0,09 m
P = 314,46 m
𝜎𝑃 = √22 ∙ 0,072 + 22 ∙ 0,092 = 0,23 𝑚
PS = 314,46 m
𝜎𝑃𝑠 = √0,072 + 0,072 + 0,092 + 0,092 = 0,16 𝑚
La equivocación radica en que de los cuatro términos de la suma no todos son independientes.
Específicamente, X + X no es la suma de cantidades independientes y tampoco Y + Y. Con el fin de utilizar la
ecuación para calcular la incertidumbre en P, se debe expresar a P como la suma de cantidades
independientes; es decir, P = 2X + 2Y.

Mediciones repetidas

Una de las mejores maneras de reducir la incertidumbre es tomar varias mediciones independientes y
determinar el promedio de ellas. Las mediciones en este caso son una muestra aleatoria simple de una población
y su promedio es la media de la muestra. Los métodos para el cálculo de la media y de la desviación estándar de
una muestra se presentaron anteriormente Estos métodos se pueden aplicar para calcular la media y la
incertidumbre en el promedio de las mediciones repetidas independientes.
Sapere Aude
Atrévete a saber
60
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Si X1, . . . , Xn son n mediciones independientes, cada una con media μ e incertidumbre σ, entonces la media de
𝜎
la muestra 𝑥̅ es una medición con media 𝜇𝑋̅ = 𝜇 e incertidumbre 𝜎𝑋̅ = 𝑛. Si se realizan muchas mediciones

independientes de la misma cantidad, entonces el promedio de éstas tiene la misma media de cada medición
individual, pero la desviación estándar se reduce en un factor igual a la raíz cuadrada del tamaño de la muestra.
En otras palabras, el promedio de varias mediciones repetidas tiene la misma exactitud y es más preciso que
cualquier única medición.

19. La longitud de un componente se mide con un proceso cuya incertidumbre es de 0,07 cm. Si se hicieron 35
mediciones independientes y se utiliza el promedio de éstas para estimar la longitud, ¿cuál será la
incertidumbre? ¿Cuánto más preciso es el promedio de 35 mediciones que el de una sola medición?
0,07
𝜎𝑋̅ = = 0,01 𝑐𝑚. Es 5,92 veces más preciso que si se hiciera una sola medición.
√35

20. La masa de una roca se midió nueve veces en una balanza cuya incertidumbre no se conoce. Las nueve
mediciones (en gramos) son 21,10, 21,05, 20,98, 21,12, 21,05, 20,99, 21,02, 20,97 y 21,03. Estime la masa
de la roca y determine la incertidumbre en la estimación.
𝑥̅𝑚
̅ = 21,03 𝑔, 𝑠𝑚 ̅ = 0,02 𝑔, masa = 21,03 ± 0,02 g.

21. En un lote rectangular, dos lados adyacentes de un terreno se calcularon de X = 57,75 con s = ± 0,07 m y Y =
75,25 con s = ± 0,09 m. Se supone que el presupuesto para este proyecto es suficiente para hacer 14
mediciones más. Cada lado ya se ha medido una vez. Un ingeniero sugiere asignar las nuevas mediciones a
cada lado equitativamente, por lo que éste será medido ocho veces. Un segundo ingeniero sugiere hacer las
14 mediciones en el lado más largo, ya que ese lado se mide con incertidumbre más grande. Estime la
incertidumbre en el perímetro bajo cada plan. ¿Con cuál plan se obtiene la incertidumbre más pequeña?
2∙0,07 2 2∙0,09 2
𝜎𝐿 = √( ) +( )
√𝑛1 √𝑛2
𝜎𝐿𝐴 = 0,08, 𝜎𝐿𝐵 = 0,15. Con el plan A se obtiene la incertidumbre más pequeña.

Mediciones repetidas con incertidumbres diferentes

A veces al repetir las mediciones se puede tener incertidumbres diferentes. Esto puede ocurrir, por ejemplo,
cuando las mediciones se hacen con instrumentos diferentes. La mejor manera de combinar las mediciones en
este caso es con un promedio ponderado, más que con la media de la muestra.

22. Un ingeniero mide el periodo de un péndulo (en segundos) de 2,0 ± 0,2 s. Se hizo otra medición
independiente con un reloj más preciso y el resultado es de 2,2 ± 0,1 s. El promedio de estas dos mediciones
es 2,1 s. Determine la incertidumbre en esta cantidad.
0,2 2 0,1 2
𝜎𝑃 = √( 2 ) + ( 2 ) = 0,1 𝑠

23. En el ejemplo anterior, otro ingeniero sugiere que, dado que Y es una medición más precisa que X, podría
ser más preciso un promedio ponderado en el cual Y fuera más pesado que X que el promedio no ponderado.
Específicamente, el ingeniero sugiere que al elegir una constante adecuada c entre 0 y 1, el promedio
ponderado cX + (1 - c)Y podría tener una incertidumbre más pequeña que el promedio no ponderado (1/2)X
+ (1/2)Y que se consideró en el ejemplo. Expresando la incertidumbre en el promedio ponderado cX + (1 -
c)Y en función de c, encuentre el valor de c que minimiza la incertidumbre y el valor medido.

Sapere Aude
Atrévete a saber
61
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
2
𝜎𝑝𝑒𝑜𝑟
𝑐𝑚𝑒𝑗𝑜𝑟 = 2 2
𝜎𝑚𝑒𝑗𝑜𝑟 +𝜎𝑝𝑒𝑜𝑟
0,2 2
𝑐 = 0,22 +0,12 = 0,8
𝜎𝑃 = √(0,8 ∙ 0,1)2 + (0,2 ∙ 0,2)2 = 0,09 𝑠
𝑝𝑝 = 0,8 ∙ 2,2 + 0,2 ∙ 2,0 = 2,16
Valor medido = 2,16 ± 0,09 s

Combinaciones lineales de mediciones dependientes

Imagine que X y Y son mediciones con incertidumbres sX y sY y se desea calcular la incertidumbre en la suma X +
Y. Si X y Y son dependientes, la incertidumbre en la suma podría ser más grande o menor que en el caso
independiente y no se puede determinar con sólo sX y sY. Por ejemplo, si errores aleatorios positivos en X tienden
a ocurrir al lado de errores aleatorios negativos en Y, y viceversa, aquéllos tenderán a contrarrestarse cuando se
calcula la suma X + Y, así la incertidumbre en X + Y será más pequeña que en el caso independiente. Por otro
lado, si los errores aleatorios en X y Y tienden a tener el mismo signo, la incertidumbre en X + Y será mayor que
en el caso independiente.

Si X1, . . . , Xn son mediciones y c1, . . . , cn son constantes, entonces 𝜎𝑐1 𝑥1 + ⋯ + 𝜎𝑐𝑛 𝑥𝑛 ≤ |𝑐1 |𝜎𝑋1 + ⋯ + |𝑐𝑛 |𝜎𝑋𝑛 .
La expresión del lado derecho de la desigualdad es una estimación conservadora de la incertidumbre en 𝑐1 𝜎𝑋1 +
⋯ + 𝑐𝑛 𝜎𝑋𝑛 .

24. Un topógrafo está midiendo el perímetro de un terreno rectangular. Mide dos lados adyacentes de 70,25 ±
0,05 m y 95,50 ± 0,08 m. Estas mediciones no son necesariamente independientes. Determine con una
estimación conservadora la incertidumbre del perímetro del terreno.
𝑃 = 2 ∙ 70,25 + 2 ∙ 95,50 = 331,5 𝑚
𝜎𝑃 ≤ 2 ∙ 0,05 + 2 ∙ 0,08 = 0,26 𝑚
El perímetro del terreno es 331,5 m con una incertidumbre menor o igual a 0,26 m.

Ejercicios

25. Suponga que X y Y son mediciones independientes con incertidumbres σX = 0,2 y σY = 0,4. Determine las
incertidumbres en las cantidades siguientes:
a) 3X
b) X - Y
c) 2X + 3Y

26. Una medición del diámetro de un cilindro tiene incertidumbre de 2 mm. ¿Cuántas mediciones se deben
hacer para que se pueda calcular el diámetro con una incertidumbre de sólo 0,5 mm?

27. En el artículo “The World’s Longest Continued Series of Sea Level Observations” (M. Ekman en
Paleogeography, 1988:73-77), la media del nivel anual de elevación de la tierra en Estocolmo, Suecia, se
estimó de 4,93 ± 0,23 mm durante 1774-1884 y de 3,92 ± 0,19 mm durante 1885-1984. Estime la diferencia
en la media anual de elevación entre estos dos espacios de tiempo y determine la incertidumbre en el
cálculo.

Sapere Aude
Atrévete a saber
62
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
28. Un hueco cilíndrico es perforado con un bloque de acero y se fabrica un pistón cilíndrico que quepa en el
hueco. El diámetro del hueco es 20,00 ± 0,01 cm y el diámetro del pistón es 19,90 ± 0,02 cm. La holgura es
la mitad de la diferencia entre los diámetros. Estime la holgura y determine la incertidumbre en el cálculo.

29. El ancho y la altura de una pieza de madera de 2 × 4 son en realidad de 1,5 × 3,5 pulgadas. Suponga que la
incertidumbre en estas cantidades es despreciable. La longitud de una pieza de 2 × 4 se mide de 72 ± 0,1
pulgadas. Estime el volumen de la pieza de madera y determine la incertidumbre en la estimación.

30. El periodo T de un péndulo simple está dado por 𝑇 = 2𝜋√𝐿⁄𝑔 donde L es la longitud del péndulo y g la
aceleración debido a la gravedad. Por tanto, si se miden L y T, se puede calcular g con g = 4π2L/T2. Suponga
que se sabe que el periodo es T = 1,5 s con incertidumbre despreciable y que se mide L de 0,559 ± 0,005 m.
Estime g y determine la incertidumbre en la estimación.

31. Se hacen nueve mediciones independientes de la longitud de una varilla. El promedio de las nueve
mediciones es 𝑥̅ = 5,238 cm y la desviación estándar es σ = 0,081 cm.
a) ¿Está la incertidumbre en el valor 5,238 cm más cerca de 0,009, 0,027 o 0,081 cm? Explique.
b) Otra varilla se mide una vez con el mismo proceso. La medición es 5,423 cm. ¿Está la incertidumbre de
este valor más cerca de 0,009, 0,027 o 0,081 cm? Explique.

32. Cierta balanza tiene una incertidumbre de 3 g y un sesgo de 2 g.


a) Se hace una sola medición en esta balanza. ¿Cuáles son el sesgo y la incertidumbre en esta medición?
b) Se hacen cuatro mediciones independientes en esta balanza. ¿Cuáles son el sesgo y la incertidumbre en
el promedio de estas mediciones?
c) Se hacen 400 mediciones independientes en esta balanza. ¿Cuáles son el sesgo y la incertidumbre en el
promedio de estas mediciones?
d) Conforme se hacen más mediciones, ¿la incertidumbre se hace más pequeña, más grande o permanece
constante?
e) Conforme se hacen más mediciones, ¿el sesgo se hace más pequeño, más grande o permanece
constante?

33. El volumen de una roca se mide colocándola sobre un cilindro graduado parcialmente lleno de agua y se
mide el aumento en el volumen. Se hacen ocho mediciones independientes. El promedio de las mediciones
es 87,0 mL y la desviación estándar es 2,0 mL.
a) Estime el volumen de la roca y determine la incertidumbre en la estimación.
b) Se hacen ocho mediciones adicionales, hasta hacer un total de 16. ¿Cuál es la incertidumbre,
aproximadamente, en el promedio de las 16 mediciones?
c) Aproximadamente ¿cuántas mediciones se necesitarían para reducir la incertidumbre a 0,4 mL?

34. Un estudiante mide la constante de un resorte k, se carga un resorte y se mide la elongación. (De acuerdo
con la ley de Hooke, si l es la carga y e la elongación, entonces k = l/e.) Suponga que se hacen cinco
mediciones independientes y los valores medidos de k (en N/m) son 36,4, 35,4, 38,6, 36,6 y 38,0:
d) a) Estime la constante del resorte y determine la incertidumbre en la estimación.
e) b) Determine un valor aproximado para la incertidumbre en el promedio de las diez mediciones.
f) c) ¿Aproximadamente cuántas mediciones se deben hacer para reducir la incertidumbre a 0,3 N/m?
g) d) Un segundo resorte, similar al primero, mide la constante del resorte una vez. El valor medido de k es
39,3. ¿Aproximadamente cuál es el valor de la incertidumbre?

Sapere Aude
Atrévete a saber
63
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Variables aleatorias y distribuciones de probabilidad

Variable Aleatoria

Concepto: Una variable aleatoria es una función que asocia un número real con cada elemento del espacio
muestral. Por convención, la letra mayúscula (X) representa a la Variable Aleatoria y la minúscula (x) a un valor
específico de la variable.

Ejercicio 1
Se prueban tres componentes electrónicos, determinando si están defectuosos (D) o no defectuosos (N),
encuentre el espacio muestral y asigne un valor x a cada elemento del espacio muestral, indicando el número de
componentes defectuosos.
S x S x
NNN 0 NDD 2
NND 1 DND 2
NDN 1 DDN 2
DNN 1 DDD 3
X = {0, 1, 2, 3}

Ejercicio 2
Un empleado de una bodega de materiales de una construcción entrega cascos de seguridad al azar a tres
empleados de la empresa. El orden de recepción son José, Marco y Pedro. Liste los puntos del espacio muestral
para los posibles órdenes de regreso de los cascos y encuentre el valor b de la variable aleatoria B que representa
el número de asociaciones acertadas. Definamos como elementos J que representa a José, M que representa a
Marco y P que representa a Pedro. Los cascos se entregan en el orden JMP.
Orden b Orden b
JMP 3 MJP 1
JPM 1 PMJ 1
PJM 0 MPJ 0
B = {0, 1, 3}

Ejercicio 3
Se sacan tres bolas de manera sucesiva, sin reemplazo, de una urna que contiene 2 bolas rojas, 3 negras y 2
azules. Determine el espacio muestral y los valores de la variable aleatoria X, que representan la cantidad de
bolas azules que se sacan de la urna.
Definamos como elementos R que representa al color rojo, N que representa al color negro y A que representa
al color azul. Los puntos muestrales serán:

Puntos Puntos Puntos Puntos Puntos


x x x x x
Muestrales Muestrales Muestrales Muestrales Muestrales
NNN 0 RNR 0 NAA 2 RAA 2 RNA 1
NNR 0 RRN 0 ANA 2 RRA 1 RAN 1
NRN 0 NNA 1 AAN 2 RAR 1 NAR 1
RNN 0 NAN 1 AAR 2 ARR 1 NRA 1
NRR 0 ANN 1 ARA 2 ANR 1 ARN 1
X = {0, 1, 2}
Sapere Aude
Atrévete a saber
64
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Ejercicio 4
Suponga que un ingeniero eléctrico tiene seis resistores a la mano. Tres de ellos tienen etiqueta de 10 Ω y los
otros tres tienen etiqueta de 20 Ω. El ingeniero quiere conectar un resistor de 10 Ω y un resistor de 20 Ω en serie,
para crear una resistencia de 30 Ω. Ahora se supone que, en efecto, los tres resistores etiquetados con 10 Ω
tienen las resistencias reales de 9, 10 y 11 Ω y que los tres resistores etiquetados con 20 Ω tienen las resistencias
reales de 19, 20 y 21 Ω. Encuentre el espacio muestral y determine los valores de la variable aleatoria Z, si éstos
son la suma de las resistencias.
Resultado z Resultado z Resultado z
(9, 19) 28 (10, 19) 29 (11, 19) 30
(9, 20) 29 (10, 20) 30 (11, 20) 31
(9, 21) 30 (10, 21) 31 (11, 21) 32
Z = {28, 29, 30, 31, 32}

Ejercicio 5
Se lanza un dado hasta que ocurra un tres. Determine el espacio muestral y la variable aleatoria Z de la ocurrencia
del número 3.
Sea F la no ocurrencia del número 3 y V la ocurrencia del mismo. Entonces el espacio muestral de la ocurrencia
del número tres será {V, FV, FFV, FFFV, FFFFV, FFFFFV, FFFFFFV, ….} Z = {1}

Concepto: Si un espacio muestral contiene un número finito de posibilidades, o una serie interminable con tantos
elementos como números enteros existen, se llama espacio muestral discreto.

Concepto: Si un espacio muestral contiene un número infinito de posibilidades, igual al número de puntos en un
segmento de recta, se le denomina espacio muestral continuo.

En los ejercicios 1 a 4, el espacio muestral es finito y discreto, mientras que en el número 5 el espacio muestral
es infinito y discreto.

Concepto: Una variable aleatoria se llama variable aleatoria discreta si se puede contar su conjunto de posibles
resultados, caso contrario, si la variable aleatoria toma valores en la escala continua se le denomina variable
aleatoria continua.

Ejercicio 6
Con frecuencia los chips de computadora tienen imperfecciones en su superficie. Para cierto tipo de chip de
computadora, 9% no tiene imperfecciones, 22% contiene una imperfección, 26% presenta dos imperfecciones,
20% contiene tres imperfecciones, 12% tiene cuatro imperfecciones y 11% presenta cinco imperfecciones. Sea Y
el número de imperfecciones en un chip elegido aleatoriamente. ¿Cuáles son los valores posibles de Y? ¿Y es
discreta o continua?
Los valores posibles para Y son los enteros 0, 1, 2, 3, 4 y 5. La variable aleatoria Y es discreta, ya que solamente
asume valores enteros.

Sapere Aude
Atrévete a saber
65
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Distribuciones discretas de probabilidad

Concepto: Denominaremos distribución de probabilidad, función de masa de probabilidad o distribución de


probabilidad de la variable aleatoria X, al conjunto de pares ordenados (x, f(x)) si para cada posible resultado de
X se cumple:
𝑓(𝑥) ≥ 0 ∑𝑥 𝑓(𝑥) = 1 𝑃(𝑋 = 𝑥) = 𝑓(𝑥)

Ejercicio 7
Determine la función de masa de los ejercicios 1 a 4.
S X f(x) S X f(x)
NNN 0 1/8 NDD 2 1/8
NND 1 1/8 DND 2 1/8
NDN 1 1/8 DDN 2 1/8
DNN 1 1/8 DDD 3 1/8

X 0 1 2 3 Σ
f(x) 1/8 3/8 3/8 1/8 1

Orden B f(b) Orden B f(b)


JMP 3 1/6 PMJ 1 1/6
JPM 1 1/6 MPJ 0 1/6
PJM 0 1/6 MJP 1 1/6

X 0 1 3 Σ
f(x) 2/6 3/6 1/6 1

Puntos Puntos Puntos Puntos


X f(x) X f(x) X f(x) X f(x)
Muestrales Muestrales Muestrales Muestrales
NNN 0 1/25 NNA 1 1/25 ARA 2 1/25 RAN 1 1/25
NNR 0 1/25 NAN 1 1/25 RAA 2 1/25 NAR 1 1/25
NRN 0 1/25 ANN 1 1/25 RRA 1 1/25 NRA 1 1/25
RNN 0 1/25 NAA 2 1/25 RAR 1 1/25 ARN 1 1/25
NRR 0 1/25 ANA 2 1/25 ARR 1 1/25
RNR 0 1/25 AAN 2 1/25 ANR 1 1/25
RRN 0 1/25 AAR 2 1/25 RNA 1 1/25

X 0 1 2 Σ
f(x) 7/25 12/25 6/25 1

Resultado Z f(x) Resultado Z f(x) Resultado Z f(x)


(9, 19) 28 1/9 (10, 19) 29 1/9 (11, 19) 30 1/9
(9, 20) 29 1/9 (10, 20) 30 1/9 (11, 20) 31 1/9
(9, 21) 30 1/9 (10, 21) 31 1/9 (11, 21) 32 1/9

X 28 29 30 31 32 Σ
f(x) 1/9 2/9 3/9 2/9 1/9 1
Sapere Aude
Atrévete a saber
66
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Ejercicio 8
Se tiene un embarque de 8 microcomputadores iguales, que va dirigido a una tienda especializada, el cual
contiene 3 computadores defectuosos. Si una empresa compra 2 computadores elegidos al azar, determine la
distribución de probabilidad del número de computadores defectuosos que puede adquirir la empresa.
(𝑥3)∙(2−𝑥
5
) 3𝐶𝑥 ∙ 5𝐶(2−𝑥)
Sea 𝑓(𝑥) = = la función de masa de probabilidad del caso propuesto. Entonces:
(82) 8𝐶2
X 0 1 2 Σ
f(x) 5/14 15/28 3/28 1

Ejercicio 9
Si una agencia turística vende el 50% de su inventario de tiquetes a Qatar 2022 con hotel 5 estrellas, encuentre
la fórmula de la distribución de probabilidad del número de tiquetes de dicho tipo entre los siguientes cuatro
tiquetes que venda la agencia y determine la distribución de probabilidad.
Dado que en cada venta puede o no venderse el tiquete con la condición indicada, por el Teorema Fundamental
del Conteo sabemos que hay 24 posibles formas de vender los tiquetes, lo cual resulta en 16. Entonces la fórmula
(𝑥4)
sería: 𝑓(𝑥) = 16
, para x = 0, 1, 2, 3, 4.
X 0 1 2 3 4 Σ
f(x) 1/16 1/4 3/8 1/4 1/16 1

Concepto: La distribución acumulada F(x) de una variable aleatoria discreta X con distribución de probabilidad
f(x) es: F(X) = P(X ≤ x) = ∑𝑡≤𝑥 𝑓(𝑡) 𝑝𝑎𝑟𝑎 − ∞ < 𝑥 < ∞.

Ejercicio 10
Determine las distribuciones acumuladas de los ejercicios 8 y 9.
X 0 1 2
f(x) 5/14 15/28 3/28
F(X) 10/28 25/28 1

X 0 1 2 3 4
f(x) 1/16 4/16 6/16 4/16 1/16
F(X) 1/16 5/16 11/16 15/16 1

Ejercicio 11
Determine las distribuciones acumuladas de los ejercicios 1 a 4.

X 0 1 2 3
f(x) 1/8 3/8 3/8 1/8
F(X) 1/8 4/8 7/8 1

X 0 1 3
f(x) 2/6 3/6 1/6
F(X) 2/6 5/6 1

X 0 1 2
f(x) 7/25 12/25 6/25
F(X) 7/25 19/25 1
Sapere Aude
Atrévete a saber
67
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

X 28 29 30 31 32
f(x) 1/9 2/9 3/9 2/9 1/9
F(x) 1/9 3/9 6/9 8/9 1

Ejercicio 12
Sea W la variable aleatoria que da el número de escudos menos el número de coronas en tres lanzamientos de
una moneda. Liste los elementos del espacio muestral S para los tres lanzamientos de la moneda y asigne un
valor w de W a cada punto muestral. Determine la distribución de probabilidad y la distribución acumulada.

Pto Muestral EEE EEC ECE CEE ECC CEC CCE CCC
W 3 1 1 1 -1 -1 -1 -3

W -3 -1 1 3
f(w) 1/8 3/8 3/8 1/8
F(w) 1/8 4/8 7/8 1

Ejercicio 13
Un embarque de 8 automóviles extranjeros contiene 3 que tienen ligeras manchas de pintura. Suponga que una
agencia recibe 4 de estos automóviles al azar, liste los elementos del espacio muestral S usando las letras M y N
para “manchado” y “sin mancha”, respectivamente; luego asigne a cada punto muestral un valor x de la variable
aleatoria X que representa el número de automóviles con manchas de pintura que compró la agencia. Encuentre
la distribución acumulada.
Puntos Puntos Puntos
X X X
Muestrales Muestrales Muestrales
MMMN 3 MNMN 2 MNNN 1
MMNM 3 MNNM 2 NMNN 1
MNMM 3 NMMN 2 NNMN 1
NMMM 3 NMNM 2 NNNM 1
MMNN 2 NNMM 2 NNNN 0

X 0 1 2 3
f(x) 1/15 4/15 6/15 4/15
F(X) 1/15 5/15 11/15 1

Media y varianza de una variable aleatoria

Sea X una variable aleatoria con distribución de probabilidad f(x), se calcula la media de X como:
𝜇 = 𝐸(𝑋) = ∑ 𝑥𝑓(𝑥)
𝑥
donde la sumatoria se hace sobre todos los valores posibles de X. A veces la media de X se llama esperanza, o
valor esperado, de X y también se denota por E(X) o por μ.

Sapere Aude
Atrévete a saber
68
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
Ejercicio 14
Un inspector de calidad muestrea un lote que contiene siete componentes, tres defectuosos y cuatro buenos. El
inspector toma una muestra de tres componentes. Encuentre el valor esperado del número de componentes
buenos en esta muestra.
(𝑥4)(3−𝑥
3
) 4𝐶𝑥 ∙ 3𝐶(3−𝑥)
La función de masa de la distribución será: 𝑓(𝑥) = =
(73) 7𝐶3

X 0 1 2 3 Σ
f(x) 1/35 12/35 18/35 4/35 1
F(x) 1/35 13/35 31/35 1
x∙f(x) 0 12/35 36/35 12/35 12/7

Ejercicio 15
En un juego de azar se pagarán $25 a una persona si y solo si salen escudos o coronas cuando se lanzan tres
monedas, caso contrario la persona debe pagar $ 10. ¿Cuál es su ganancia esperada?
Dado que cada moneda solo puede presentar dos resultados (escudo o corona) se puede establecer por el
Teorema Universal del Conteo que se van a tener ocho posibles resultados (2 x 2 x 2 = 8), de los cuales solo 2 van
a ser éxito (3 escudos o 3 coronas). Así las cosas, de acuerdo con la probabilidad clásica, la probabilidad de ganar
es ¼ y la de perder es de ¾, por lo que la ganancia esperada es: E(X) = 0,25 ∙ $25 – 0,75 ∙ $10 = –$1,25.

Ejercicio 16
Encuentre la Esperanza Matemática de los ejercicios 10 a 13.
X 0 1 2 Σ
f(x) 5/14 15/28 3/28 1
F(X) 10/28 25/28 1 1
x∙f(x) 0 15/28 6/28 ¾

X 0 1 2 3 4 Σ
f(x) 1/16 4/16 6/16 4/16 1/16 1
F(X) 1/16 5/16 11/16 15/16 1 1
x∙f(x) 0 4/16 12/16 12/16 4/16 2

X 0 1 2 3 Σ
f(x) 1/8 3/8 3/8 1/8 1
F(X) 1/8 4/8 7/8 1 1
x∙f(x) 0 3/8 6/8 3/8 3/2

X 0 1 3 Σ
f(x) 2/6 3/6 1/6 1
F(X) 2/6 5/6 1 1
x∙f(x) 0 3/6 3/6 1

X 0 1 2 Σ
f(x) 7/25 12/25 6/25 1
F(X) 7/25 19/25 1 1
x∙f(x) 0 12/25 12/25 24/25

Sapere Aude
Atrévete a saber
69
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras

X 28 29 30 31 32 Σ
f(x) 1/9 2/9 3/9 2/9 1/9 1
F(x) 1/9 3/9 6/9 8/9 1 1
x∙f(x) 28/9 58/9 90/9 62/9 32/9 30

W -3 -1 1 3 Σ
f(w) 1/8 3/8 3/8 1/8 1
F(w) 1/8 4/8 7/8 1 1
x∙f(x) -3/8 -3/8 3/8 3/8 0

X 0 1 2 3 Σ
f(x) 1/15 4/15 6/15 4/15 1
F(X) 1/15 5/15 11/15 1 1
x∙f(x) 0 4/15 12/15 12/15 28/15

Se define a la varianza poblacional de una variable aleatoria discreta como:


𝜎𝑥2 = ∑𝑥(𝑥 − 𝜇𝑥 )2 𝑓(𝑥)
Una fórmula alternativa para la varianza está dada por:
𝜎𝑥2 = ∑𝑥 𝑥 2 𝑓(𝑥) − 𝜇𝑥2
La desviación estándar es la raíz cuadrada de la varianza: 𝜎𝑥 = √𝜎𝑥2 .

Ejercicio 17
Calcule las varianzas y las desviaciones estándar de los ejercicios 14 a 16.
Para el ejercicio 14
X 0 1 2 3 Σ
f(x) 1/35 12/35 18/35 4/35 1
x∙f(x) 0 12/35 36/35 12/35 12/7
f(x)(x – μ)2 144/1715 60/343 72/1715 324/1715 24/49
x2f(x) 0 12/35 72/35 36/35 24/7
2√6
σ2 = 24/7 – (12/7)2 = 24/49 σ = 7

Para el ejercicio 15
11025 3675 3675
𝜎𝑥2 = ∑𝑥(𝑥 − 𝜇𝑥 )2 𝑓(𝑥) = (25 − −1,25)2 ∙ 0,25 + (−10 − −1,25)2 ∙ 0,75 = 64 + 64 = 16
3675 35∙√3
𝜎𝑥2 = ∑𝑥 𝑥 2 𝑓(𝑥) − 𝜇𝑥2 = 252 ∙ 0,25 + (−10)2 ∙ 0,75 − (−1,25)2 = 𝜎=
16 4

Para el ejercicio 16
X 0 1 2 Σ
f(x) 5/14 15/28 3/28 1
xf(x) 0 15/28 6/28 ¾
x2f(x) 0 15/28 12/28 27/28
σ2 45/112
3√35
σ
28

Sapere Aude
Atrévete a saber
70
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
X 0 1 2 3 4 Σ
f(x) 1/16 4/16 6/16 4/16 1/16 1
xf(x) 0 4/16 12/16 12/16 4/16 2
x2f(x) 0 4/16 24/16 36/16 1 5
2
σ 1
σ 1

X 0 1 2 3 Σ
f(x) 1/8 3/8 3/8 1/8 1
xf(x) 0 3/8 6/8 3/8 3/2
x2f(x) 0 3/8 12/8 9/8 3
σ2 ¾
σ √3⁄
2

X 0 1 3 Σ
f(x) 2/6 3/6 1/6 1
xf(x) 0 3/6 3/6 1
x2f(x) 0 3/6 9/6 2
σ2 1
σ 1

X 0 1 2 Σ
f(x) 7/25 12/25 6/25 1
xf(x) 0 12/25 12/25 24/25
x2f(x) 0 12/25 24/25 36/25
2
σ 324/625
σ 18/25

X 28 29 30 31 32 Σ
f(x) 1/9 2/9 3/9 2/9 1/9 1
xf(x) 28/9 58/9 90/9 62/9 32/9 30
x2f(x) 784/9 1682/9 300 1922/9 1024/9 2704/3
σ2 4/3
2√3
σ
3

W -3 -1 1 3 Σ
f(w) 1/8 3/8 3/8 1/8 1
xf(x) -3/8 -3/8 3/8 3/8 0
x2f(x) 9/8 3/8 3/8 9/8 3
σ2 3
σ √3

Sapere Aude
Atrévete a saber
71
Probabilidad y Estadística 1
Las cifras no mienten, pero los mentirosos también usan cifras
X 0 1 2 3 Σ
f(x) 1/15 4/15 6/15 4/15 1
xf(x) 0 4/15 12/15 12/15 28/15
x2f(x) 0 4/15 24/15 36/15 64/15
2
σ 176/225
4√11
σ
15

Ejercicio 18
Un resistor en un circuito dado tiene una resistencia en el rango de 99 Ω - 101 Ω. Un ingeniero obtiene dos
resistores. La probabilidad de que ambos satisfagan la especificación es 0,36, la probabilidad de que exactamente
uno de ellos satisfaga la especificación es 0,48 y la probabilidad de que ninguno de ellos lo haga es 0,16. Sea X el
número de resistores que satisface la especificación. Determine la función de masa de probabilidad, la media, la
varianza y la desviación estándar de X.

X 0 1 2 Σ
f(x) 0,16 0,48 0,36 1
x∙f(x) 0 0,48 0,72 1,2
x2f(x) 0 0,48 1,44 1,92
2
σ 0,48
2√3
σ
5

Sapere Aude
Atrévete a saber
72

También podría gustarte