Está en la página 1de 66

Estimado alumno:

Estamos muy contentos porque nos eligió y confió en nosotros para que lo acompañemos
en el camino que lo llevará a completar sus estudios secundarios.
Le damos la bienvenida. Y ahora le contamos brevemente de qué se trata este Módulo de
Informática I.
El módulo fue especialmente diseñado para el estudio autónomo. Está dividido en 4
unidades, para que Ud. administre sus tiempos de estudios y llegue a la instancia de la
evaluación final con el conocimiento y la confianza necesarios para superarla.
Es un material de educación a distancia porque usted está en su casa, nosotros en la
nuestra y nos encontraremos en las tutorías presenciales o a través de Internet en un espacio
común que llamaremos Escuela Virtual.
Es un apoyo al estudio. Usted estudia las unidades, resuelve las actividades allí propuestas,
confronta sus respuestas con las correcciones y en cuanto se le presente alguna duda, la
plantea, ya sea en los encuentros tutoriales o a través de la Escuela Virtual, y desde aquí le
respondemos su consulta.
Por tratarse de una modalidad de estudio autónomo le brindamos algunas pautas, para
ayudarlo en la organización de sus actividades académicas:
ra a los encuentros tutoriales habiendo realizado una lectura previa de la unidad a
tratarse de acuerdo al cronograma propuesto.
ealice las actividades de autoevaluación cuando el tutor lo indique y en caso de dudas
plantéelas en el próximo encuentro, o a través de la Escuela Virtual.
edíquele tiempo en su hogar al estudio de la asignatura. Haga del estudio un hábito,
estudie semanalmente, no espere al momento de la evaluación final para estudiar
todo el módulo.
Tenga en cuenta, a fin de fortalecer su aprendizaje, consultar la bibliografía complementaria
y los recursos didácticos propuestos. Los mismos se encuentran enumerados al final del
presente módulo.
Para ingresar al Aula Virtual ingrese a www.capacitare.org.ar, siguiendo los pasos
indicados en el Manual “Acceso al Aula Virtual” que se le entregó al inscribirse en la carrera.
Y así iniciamos el trabajo con este manual. Hágalo despacio, con respeto por el
conocimiento, con responsabilidad y con amor por el compromiso asumido que lo llevará a
cristalizar un paso más hacia su formación secundaria.
Recuerde que su tutor y todo el equipo directivo del “Instituto Capacitare” están a su
disposición, sólo tiene que concurrir a las tutorías o enviar un mensaje de correo electrónico.
Juntos conformamos un equipo cuyo objetivo es ayudarlo a sortear todas las dificultades
para que Ud. alcance el título de Bachiller. Usted de un lado, con sus sueños, ilusiones y
proyecto personal, y del otro nosotros con nuestro compromiso.
¡Adelante entonces! Un saludo afectuoso.
Equipo Docente y Directivo
Instituto Multimedia de Educación a Distancia
y Capacitación Laboral CAPACITARE
ESTADÍSTICA

ÍNDICE

UNIDAD 1: Estadística: Definición


Estadística: Definición
Población
Muestra
Valores estadísticos
Variable, Datos

UNIDAD 2: Valores estadísticos


Serie simple
Media
Mediana
Moda
Frecuencia

UNIDAD 3: Diagramas
Diagrama de bastones
Diagrama de sectores
Histograma y Polígono de frecuencias
Histograma y Polígono de frecuencias relativas
Frecuencia acumulada
Relación entre media, mediana y moda

UNIDAD 4: Distribución de intervalos de clase


Determinación de la media
Determinación de la mediana
Determinación de la moda
Valores de dispersión
Cuartiles y percentiles

UNIDAD 5: Probabilidades
Probabilidades: Definición
Eventos: Definición y Clasificación
Determinación de probabilidades
Probabilidad subjetiva
Regla aditiva
Regla multiplicativa

UNIDAD 6: Relación entre eventos


Eventos complementarios
Eventos mutuamente excluyentes
Eventos independientes
Probabilidades marginales bajo dependencia estadística

FUNDACIÓN CAPACITARE 1
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA UNIDAD 1

ESTADÍSTICA: DEFINICIÓN
Estadística: Definición
Población
Muestra
Valores estadísticos
Variable, Datos
ESTADISTICA: DEFINICIÓN
DEFINICIÓN
Es el conjunto de métodos y técnicas que permiten determinar, de una
muestra debidamente representativa de una población, los valores
estadísticos, a fin de poder inferir sobre los parámetros poblacionales con
un cierto grado de bondad

Esta definición comprende tanto a la estadística descriptiva como a la estadística inferencial.


Mark Berenson y David Levine, definen Estadística descriptiva como “El conjunto de métodos
que incluyen la recolección, presentación y caracterización de un conjunto de datos con el fin de
describir apropiadamente sus características”.
Mientras que a la estadística inferencial la definen como “Conjunto de métodos que hacen
posible la estimación de una característica de la población o la toma de una decisión referente a
una población basándose solo en los resultados de una muestra”.
La comprensión de estas definiciones se ve facilitada si se aclaran convenientemente algunos
términos de las mismas.
POBLACIÓN
¿Qué se entiende por población?

DEFINICIÓN

El conjunto de datos cuantificable pertenecientes al sistema en estudio


constituye la población

Esto implica que si el sistema en estudio es la producción agrícola ganadera de la Provincia


de Córdoba, entonces el mismo estará constituido por todos los establecimientos agropecuarios
de la Provincia. Si en cambio se pretende estudiar la edad promedio de los estudiantes de la
Universidad de Buenos Aires, la población estará conformada por todos los estudiantes de esa
Institución. Si se presenta en un Estudio Publicitario, la necesidad de plantear una campaña para
promover la venta de un nuevo perfume en la ciudad de Córdoba, la población a estudiar estará
constituida por todas las mujeres de dicha ciudad en condiciones de seleccionar y elegir un

2
www.capacitare.org.ar
ESTADÍSTICA
perfume. Si se pretendiere realizar un estudio sobre la calidad de los tomates producidos en las
quintas de los alrededores de la ciudad, entonces todas las quintas con producción de tomates
próxima a la ciudad de Córdoba se constituirán en la población.
Pudiere ser de importancia para un nuevo gobierno provincial prever el comportamiento de
los contribuyentes a las obligaciones impositivas, en caso de reducir el monto de los impuestos,
en este caso la población estará constituida por todos los contribuyentes
A fin de poder tomar las medidas más adecuadas será necesario contar con la mayor
información posible, si los datos informativos con los que contamos provienen del estudio de
toda la población, no sería necesario realizar ninguna inferencia, decimos que se ha efectuado
un censo de la población. Pero en ese caso dicha mayor exactitud va acompañada por un mayor
costo y tiempo que evidentemente encarece el proceso. Es decir, los resultados que puede
entregarnos un censo tienen el carácter de ser exactos, pero los costos que determinan los
mismos pueden no justificar dicha exactitud cuándo, con muestras debidamente seleccionadas
se determinan esos valores con un cierto grado de error que se puede regular y que más adelante
veremos.
Por otra parte en algunas situaciones particulares el censo se presenta impracticable o puede
no ser conveniente. Piense el lector que si el estudio se refiriere al comportamiento de las abejas
en un colmenar, la población tendría el carácter de infinita y por lo tanto sería imposible censarla.
Supongamos que se desata una epidemia en la población y debemos analizar la respuesta a
un cierto medicamento. Pretender estudiar la respuesta de toda la población a la nueva droga
llevaría un tiempo enorme tal que al cumplirse tal vez no tendría sentido la aplicación del
medicamento.
Una Empresa automotriz recibe de una Autopartista una partida de 500 pernos de pistón,
Recepción debe decidir su aceptación. Dentro de los ensayos a realizar sobre las piezas, además
de dimensiones y dureza se debe efectuar un ensayo de tracción para el cual sería necesario
destruir la pieza, en este caso sería entonces imposible ensayar todas ellas. Por otro lado, si el
verificar las dimensiones constituyere otro ensayo a realizar, genera en la cantidad de pernos
verificados un efecto particular sobre el operario que lo realiza, lo cual lo lleva a cometer errores,
en algunos casos superiores a los que se cometerían efectuando un muestreo. Tendríamos
también que tener en cuenta el costo de mano de obra que representa la verificación de esos
elementos.
Esto que hemos expresado nos lleva a la necesidad de poder tomar decisiones en base a las
inferencias que sobre una población podemos hacer de resultas del análisis y estudio de una
muestra de la misma.

FUNDACIÓN CAPACITARE 3
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA MUESTRA
De acuerdo a lo visto en el ítem anterior, estudiar el comportamiento de una población a
través de un censo, se torna en la mayoría de los casos impracticable, es por esa razón que el
análisis se efectúa por medio de una muestra que esté constituida por una parte de todos los
valores poblacionales.

DEFINICIÓN

Una muestra estará constituida por un subconjunto de la población

Cada uno de los elementos que forman parte de la muestra se denominan observación.
MUESTRA DEBIDAMENTE REPRESENTATIVA
Si bien es cierto que una muestra está constituida por elementos pertenecientes a la
población, tendremos que comprender que no todo subconjunto de la población se constituye
en una muestra debidamente representativa. Vale tal vez recordar que en 1936 en vísperas a las
elecciones presidenciales de EE.UU., la encuestadora LITERARY DIGEST pronosticó el triunfo del
candidato Republicano con un apreciable margen por sobre su opositor Roosevelt. El pronóstico
se basaba sobre los resultados de una encuesta hecha sobre una muestra de dos millones de
habitantes. No obstante el triunfo fue del candidato demócrata y el error en la inferencia se debía
a que los encuestados fueron seleccionados entre los poseedores de automóviles y abonados
telefónicos. En esos momentos los que estaban mejor posicionados para poseer automóvil y
líneas telefónicas correspondían a la clase media y alta, en su mayoría con tendencias
republicanas, pero el triunfó quedó en manos de Roosevelt apoyados por la masa poblacional de
menores recursos.

DEFINICIÓN
Una muestra se dice que es debidamente representativa de una población
cuando presenta sus mismas características

Presentar las mismas características que la población implica que, si el 20% de la población
cumple con una determinada propiedad, se espera que el 20% de la muestra cumpla con esa
misma propiedad.
Esto permite disminuir los errores que se cometen cuando se efectúa la inferencia de los
parámetros poblacionales a partir de los valores determinados en la muestra.
VALORES ESTADÍSTICOS
El estudio realizado sobre una muestra nos permite determinar valores cuyas características
nos referiremos más adelante y a los cuales se los denomina estimadores pudiendo también
tomar el nombre de valores estadísticos, mediante los cuales se podrá efectuar una correcta
estimación sobre los valores de la población.
Por otra parte, los valores propios de la población toman el nombre de Parámetros.

4
www.capacitare.org.ar
ESTADÍSTICA
Si se pretendiere determinar el salario de los empleados metalúrgicos del País, tomaríamos
una muestra constituida por operarios de distintas empresas y distintas provincias y siempre
proporcional al número de operarios de cada lugar, el salario promedio obtenido en la muestra
se denomina estadístico, mientras que el salario promedio de toda la población obrera
metalúrgica se constituye en parámetro
PARÁMETROS

DEFINICIÓN
Los valores en estudio, que en la muestra toman el nombre de Estadísticos,
en la población se los denominan Parámetros

DEFINICIÓN
Se define como bondad al margen de seguridad con que se realiza la
inferencia de acuerdo a los estudios realizados sobre la o las muestras

Aseverar que tal político ganará las próximas elecciones presidenciales no tiene peso como
información si no se lo acompaña con un grado de seguridad. Indicar que las encuestas los dan
ganador por tal cantidad de puntos, solo es tomado en cuenta cuando se acompaña esa
información con una determinada seguridad.

VARIABLE, DATOS
Debemos tener en cuenta que la Estadística basa su aplicación en el estudio y análisis de
números los que se denominan Datos. Si dichos datos son obtenidos a través de una muestra, se
los llama observaciones, las que deben responder a una determinada característica que es la que
tenemos en estudio, puede ser la producción avícola en la provincia, la inversión de dinero en
publicidad en los distintos medios durante el año 1998, o a la cantidad de precipitaciones en el
sur de la provincia, la concurrencia a un Centro Comercial, las temperaturas máximas diarias
durante el mes de marzo en una determinada localidad, el número de alumnos ingresados en
cada una de las Universidades de la provincia de Córdoba en el corriente año, cada una de estas
toma el nombre de Variable. En definitiva cada vez que nos aboquemos a un estudio estadístico
debemos de tener en cuenta que dicho estudio corresponde a una Variable, y que de ésta se
tendrán Datos y los que corresponden a Observaciones realizadas. Mediante la aplicación de
métodos y técnicas estadísticas se estudian estas observaciones y se determinan los estadísticos.
TIPO DE VARIABLE
En una fábrica de automotores puede considerarse necesario determinar el número de
automóviles de cada modelo producidos durante el último trimestre, a fin de poder compararlo
con las unidades producidas durante el mismo período del año anterior y poder prever la
producción para los futuras períodos. Al Ministerio de Agricultura y Ganadería, le será

FUNDACIÓN CAPACITARE 5
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA imprescindible definir la cantidad de hectáreas sembradas de maíz en todo el País y en
condiciones de ser levantadas en la próxima cosecha. En la localidad de Embalse de Río Tercero,
se tienen piletas en donde se efectúa la cría de pejerreyes y por lo tanto le será de suma
importancia definir, para cada período del proceso el tamaño promedio de los peces. Para una
planta generadora de energía eléctrica, le es necesario determinar los picos de consumo de
energía durante el día y el consumo durante las diferentes épocas del año. Puede ser deseable
para la Secretaría de Cultura de la Municipalidad de la ciudad de Córdoba, definir el grado de
calidad que poseen los Artistas Plásticos, para lo cual será necesario valorizar las obras de cada
uno de ellos. Observará el lector que el tipo de dato de cada una de las incógnitas en estudio
puede tener características diferentes. En el estudio de la producción de automóviles, la cantidad
de unidades producidas es un número entero definido, no es así en el caso de querer determinar
la longitud de los peces que se crían en Embalse, ya que la exactitud de la misma dependerá del
instrumento con que se realice el proceso. En el caso de pretender determinar el grado de calidad
de los maestros plásticos de Córdoba, no hay la menor duda en que, la definición de la misma
dependerá del criterio experiencia y capacidad de quien realice la valorización de cada obra. Es
decir será necesario efectuar una clasificación de los tipos de datos:

Discretos
Cuantitativos
Continuos
Tipos de Datos
Nominales
Cualitativos
Jerarquizados

DISCRETOS
Se dice que un valor es discreto cuando es el resultado de un conteo.
 Número de televisores por hogar
 Cantidad de alumnos aprobados o reprobados en una evaluación
 Número de habitantes por médicos en una localidad; etc.
Tómense éstos como modelos de datos discretos.
CONTINUOS
Se dice que una variable es del tipo continuo cuando asume valores dentro de un intervalo
de números reales.
 Las alturas de los alumnos de un curso
 La longitud de peces en un lago
 El volumen de precipitaciones anuales etc.
Es decir en definitiva, cuando el valor del dato u observación se mide en un intervalo, decimos
que es del tipo continuo.

6
www.capacitare.org.ar
ESTADÍSTICA
NOMINALES
Cuando los valores que adopta la variable en estudio puede ser clasificada de acuerdo a
categorías, tal como lo sería el responder a una encuesta efectuada al personal de una Empresa
automotriz y en la cual se plantea la situación de cada uno en cuanto a su estado civil. Sabemos
que en este caso se tendrían las categorías de:
Soltero casado viudo divorciado
O el caso de realizar un estudio en un club social, en donde nos encontraremos con que sus
asociados se encuentran categorizados por edad según:
Infantiles cadetes mayores
En estos casos en donde los datos se pueden agrupar por categorías es necesario introducir,
a fin de poder realizar su estudio, una cierta codificación. De cualquier manera no se podrán
hacer estudios matemáticos entre categorías.
JERARQUIZADOS
Este tipo de dato se presenta cuando es necesario otorgarle a la variable una cierta jerarquía
de orden. Supongamos tener que estudiar el grado de calidad de las obras expuestas por un
cierto número de plásticos de Córdoba a fin de asignar los correspondientes premios. A tal efecto
será necesario acudir al juicio de un perito que permita definir el grado de categoría de cada uno
de los participantes, esto implica que en el proceso de jerarquizar las obras de cada uno influirá
el criterio de quién realiza el estudio, tal vez de ser otro el que efectúe el análisis pudiere
modificar dicho orden. Como conclusión entonces no podrá en este tipo de variable asegurar la
exactitud del cálculo.

FUNDACIÓN CAPACITARE 7
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA UNIDAD 2

VALORES ESTADÍSTICOS
Serie simple
Media
Mediana
Moda
Frecuencia
VALORES ESTADÍSTICOS
Al definir los objetivos de la Estadística, expresábamos la necesidad de poder inferir sobre las
características de la población, a través del análisis y estudio de la muestra. Todos los valores que
se determinan en la muestra se denominan estadísticos, mientras que los valores propios de la
población se denominan parámetros. Además los valores estadísticos se pueden clasificar de
acuerdo a sus características de la siguiente manera:

Media

De tendencia
Mediana
central o posición

Moda

Rango
Valores estadísticos
Desvío medio

De dispersión Varianza

Desviación estándar

Coeficiente de variación

SERIE SIMPLE
A los efectos de preparar un Congreso Internacional en una zona del Sur del País, se ha
solicitado el registro de las temperaturas mínimas de los últimos once días del mes de julio del
año anterior, obteniendo como respuesta los siguientes datos:
-2 0 1 -1 -3 -1 -2 -2 1 0 -2
La primera operación a realizar para el estudio de esa muestra es la de ordenar las
observaciones de menor a mayor.
El conjunto de observaciones ordenadas de menor a mayor se denomina Serie Simple.
-3 -2 -2 -2 -2 -1 -1 0 0 1 1

8
www.capacitare.org.ar
ESTADÍSTICA
En este caso, la variable en estudio está dada por las temperaturas y cada una de las
observaciones corresponderá a un nuevo valor adoptado por la incógnita.
𝑥 = temperatura
𝑛 = número de observaciones = 11
La Serie simple se puede expresar como:
𝑥1 𝑥2 𝑥3 𝑥4 . . . . . . . . . . . . . . . . . . . . . . . . . . . 𝑥𝑛
donde:
𝑥1 = −3 𝑦 𝑥𝑛 = 1
Con todos los valores que adopta la variable en estudio se genera una distribución,
denominada Distribución de la Variable en estudio.
MEDIA

DEFINICIÓN
Se define como media aritmética o promedio de una distribución al cociente
entre la suma de todas las observaciones dividido el número total de ellas

Es conveniente aclarar que la media poblacional se define como:


𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛
𝜇=
𝑁
𝑁 tamaño de la población
Cuya denotación general es:
∑𝑁
𝑖 𝑥1
𝜇=
𝑁
Mientras que en la muestra el estadístico x corresponde a la media de la muestra.
𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛
𝑥̅ =
𝑛
𝑛 es el número de observaciones.
Se denota como:
𝑛

∑ 𝑥𝑖
𝑥̅ = 𝑖

FUNDACIÓN CAPACITARE 9
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA El siguiente diagrama representa la analogía entre la media poblacional para una población y
la media muestral para una muestra:

Población

𝜇 Muestra
Tamaño 𝑁
𝑥̅

Tamaño 𝑛

En nuestro caso:
−3 + (−2) + (−2) + (−2) + (−2) + (−1) + (−1) + 0 + 0 + 1 + 1
𝑥̅ =
11
Dentro de los valores estadísticos de posición central la media es el de mayor
representatividad, pero debemos tener presente que a su vez es el más sensible a los valores
extremos de la distribución
Los valores extremos de la distribución pueden influir en el valor de la media y de esa manera
hacerle perder su condición de referente, tenga Ud. en cuenta el siguiente ejemplo:

EJEMPLO

En una Empresa con 9 operarios que ganan cada uno de ellos la cantidad de $1000
mensuales, y con un Gerente general cuyo sueldo es de $10.000, el sueldo promedio para esa
distribución será:
1000 + 1000 + 1000 + ⋯ + 10000 19000
𝜇= =
10 10
𝜇 = $1900
Esto estaría indicando que el sueldo promedio de los empleados de la empresa es de
$1900, cifra ésta que de ninguna manera representa la realidad.

RECORDAR
MEDIA Cantidad de elementos

Población 𝜇 𝑁

Muestra 𝑥 𝑛

10
www.capacitare.org.ar
ESTADÍSTICA
MEDIANA

DEFINICIÓN
Se define como Mediana de una distribución, al valor que ocupa el punto
medio de la distribución

Ocupar el punto medio de la distribución implica que la mediana deja a la izquierda la misma
cantidad de valores que a la derecha. Todos los valores que se encuentran a la izquierda son
menores o eventualmente iguales a él, mientras que los valores que se ubican a la derecha serán
mayores o eventualmente iguales a él.
Continuando con el ejemplo referido a las temperaturas en una localidad del Sur:

−3 −2 −2 −2 −2 −1 −1 0 0 1 1
𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8 𝑥9 𝑥10 𝑥11

𝑀𝑒 = 𝑥6 = −1
Teniendo presente que el número de observaciones 𝑛 = 11 el valor que ocupa el lugar
central de la distribución corresponderá a 𝑥6 y por lo tanto la mediana toma el valor de −1.
Cuando el número de componentes de la distribución es impar, la mediana está
perfectamente definida, pero para el caso de que n sea par, no se tiene un único valor central,
en este caso la mediana estará dada por el promedio de los dos valores centrales. Suponiendo
que se le quitara el último valor a la distribución de temperaturas que estamos analizando, el
número de observaciones 𝑛 = 10 y los dos valores centrales serían 𝑥5 y 𝑥6 .

−3 −2 −2 −2 −2 −1 −1 0 0 1
𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8 𝑥9 𝑥10

Se tendría en este caso


𝑥5 + 𝑥6
𝑀𝑒 =
2

FUNDACIÓN CAPACITARE 11
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA Podemos generalizar el valor de la mediana para una distribución de 𝑛 valores teniendo en
cuenta que el número de observaciones sea par o impar:
Si 𝑛 es impar
𝑀𝑒 = 𝑥𝑖
donde 𝑖 = (𝑛 + 1)/2
Mediana
Si 𝑛 es par
𝑥(𝑛⁄2) + 𝑥(𝑛⁄2+1)
𝑀𝑒 =
2

Para determinar el valor de la mediana de una serie simple o distribución de frecuencia es


necesario tener en cuenta el número de observaciones, si n es impar, la mediana pertenece a la
distribución y está dada por el valor que ocupa el punto central de la misma. En el caso de que n
sea impar, el valor de la mediana está dado por el promedio de los dos valores centrales, esto
implica que puede pertenecer a la distribución solo en el caso de que los valores centrales sean
iguales:
a) 4 6 6 8 Me = 6
b) 2 10 18 20 Me = 14
c) 4,3 5,8 6,2 7,2 8,5 9,6 Me = 6,7
d) 2 3 3 6 9 Me = 3
e) 3,5 4,7 6,8 7,3 9,6 10 12,5 Me = 7,3
Observe el lector que a diferencia de la media o promedio la cual se ve influenciada por los
valores extremos, según ya vimos, no ocurre lo mismo con la mediana la cual se presenta como
insensible a los valores extremos y por lo tanto describe con mayor exactitud las distribuciones
en donde los valores extremos son sensibles .Son ejemplo de este tipo de distribuciones:
a) los ingresos personales
b) Las retribuciones generales en una empresa
c) Gastos domésticos
d) Ingresos netos por hogar, etc.
No obstante todo esto las propiedades que presenta la media y que veremos más adelante
la hace más atractiva para su utilización.
MODA

DEFINICIÓN

Se define como Moda de una distribución al valor que más veces se repite

En nuestro caso −2 se repite en cuatro oportunidades y por lo tanto éste valor se constituye
en moda de la distribución.
𝑀𝑜 = −2

12
www.capacitare.org.ar
ESTADÍSTICA
Con respecto a este valor es necesario aclarar que si en una distribución se tiene más de un
valor con el mismo máximo de repeticiones, cada uno de ellos se constituirá en una nueva moda,
es decir que una distribución puede tener más de una moda. En caso de tener dos modas se la
denomina bimodal y en caso de tres trimodal, etc.
Así mismo si se presentare el caso en que todos los valores de la distribución tienen el mismo
número de repeticiones, diremos que dicha distribución no tiene moda.
FRECUENCIA

DEFINICIÓN
Dada una distribución se define como Frecuencia de un valor, al número de
veces que el mismo se repite

EJEMPLO

En la distribución correspondiente a las temperaturas mínimos tomadas en una localidad


del Sur del País durante los últimos 10 días, defina para cada valor su frecuencia:
-2 -2 -4 -1 -1 -1 0 -3 -2 -1
para −4 𝑠𝑢 𝑓 = 1
−3 𝑠𝑢 𝑓 = 1
−2 𝑠𝑢 𝑓 = 3
−1 𝑠𝑢 𝑓 = 4
0 𝑠𝑢 𝑓 = 1

∑𝑓 = 0

Tenga en cuenta que la suma de todas las frecuencias es igual al número total de
observaciones.

DISTRIBUCIÓN DE FRECUENCIA
En la mayoría de los casos nos encontraremos con una cantidad de observaciones 𝑛 que
superan los 20, por lo tanto pretender operar con una serie simple se tornaría engorroso, en
estos casos será conveniente seleccionar los valores de acuerdo a una determinada clase y
determinar de cada una de ellas su frecuencia, de allí que es común encontrar a este tipo de
distribución como Distribución de intervalos, a los efectos de facilitar el aprendizaje del alumno
subdividiremos este tipo de distribución en dos grupos:
1) cuando la amplitud de intervalo es igual a 1
2) cuando la amplitud del intervalo de clase toma un valor mayor a 1

FUNDACIÓN CAPACITARE 13
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA CASO A ANALIZAR
Supongamos tener que estudiar el número de accidentes que se producen en una playa de
estacionamiento durante los últimos 50 días. Los datos relevados son los siguientes
5 6 4 4 4 3 2 7 5 4 4 1
0 4 2 1 3 2 2 0 1 4 4 7
4 3 2 1 4 2 5 4 3 5 6 7
4 4 5 2 3 6 4 3 1 3 4 4
5 6
Es observable que trabajar con todos los valores como lo presenta la serie simple sería por
demás engorroso si no se dispusiera de una computadora, pero si clasificamos los valores, en
este caso de acuerdo a su valor numérico y para cada uno de ellos determinamos su frecuencia,
podríamos confeccionar una tabla de las siguientes características:
Tabla 1
Clase 𝑥𝑖 𝑓𝑖
1 0 2
2 1 5
3 2 7
4 3 8
5 4 16
6 5 5
7 6 4
8 7 3

∑ 𝑓𝑖 = 𝑖 50

Si ahora analizamos la tabla de esta manera, se simplifica enormemente la determinación de


la media ya que en lugar de efectuar la suma de todas las observaciones, efectuaremos el
producto de cada valor por su frecuencia y la suma de estos productos lo dividiremos por el
número total de observaciones.

∑(𝑥𝑖 . 𝑓𝑖 )
𝑖
𝑥̅ =
8

∑ 𝑓𝑖
𝑖

Nota: Debemos tener presente que estamos frente a una muestra


A los efectos de facilitar los cálculos, generemos en la tabla una nueva columna conteniendo
los productos de 𝑥𝑖 . 𝑓𝑖 .

14
www.capacitare.org.ar
ESTADÍSTICA
Tabla 2
Clase 𝑥𝑖 𝑓𝑖 𝑥𝑖 . 𝑓𝑖
1 0 2 0
2 1 5 5
3 2 7 14
4 3 8 24
5 4 16 64
6 5 5 25
7 6 4 24
8 7 3 21
50 177

De esta manera podemos calcular la media como:

∑(𝑥𝑖 . 𝑓𝑖 )
𝑖 177
𝑥̅ = = = 3,54
50
𝑛

El valor de la media o promedio de la distribución es de


𝑥̅ = 3,54
FRECUENCIA RELATIVA

DEFINICIÓN
Se define como frecuencia relativa de un valor y se expresa como 𝑓𝑟i, al
cociente entre su frecuencia y la suma de todas las frecuencias (la suma de
todas las frecuencias es igual al número de elementos de la distribución)

𝑓𝑖
𝑓𝑟𝑖 =
∑ 𝑓𝑖
Como ∑ 𝑓𝑖 = 𝑛, también se puede expresar
𝑓𝑖
𝑓𝑟𝑖 =
𝑛
Podemos ampliar la tabla de frecuencias con una nueva columna que contenga la 𝑓𝑟 de cada
clase:

FUNDACIÓN CAPACITARE 15
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA Tabla 3
Clase 𝑥𝑖 𝑓𝑖 𝑥𝑖 . 𝑓𝑖 𝑓𝑟𝑖
1 0 2 0 0,04
2 1 5 5 0,1
3 2 7 14 0,14
4 3 8 24 0,16
5 4 16 64 0,32
6 5 5 25 0,1
7 6 4 24 0,08
8 7 3 21 0,06
50 177 1

PROPIEDAD

La suma de todas las frecuencias relativas correspondientes a los valores


clases de una distribución es igual a 1

∑ 𝑓𝑟𝑖 = 𝑓𝑟1 + 𝑓𝑟2 + 𝑓𝑟3 + ⋯ + 𝑓𝑟𝑛 = 1

Tener en cuenta:
El concepto de frecuencia relativa, la media de una distribución poblacional también se puede
expresar como:

∑(𝑥𝑖 . 𝑓𝑖 )
𝜇= = ∑(𝑥𝑖 . 𝑓𝑖 / ∑ 𝑓𝑖 )
∑ 𝑓𝑖

𝜇 = ∑(𝑥𝑖 . 𝑓𝑖 )

FRECUENCIA ACUMULADA
Se define como frecuencia acumulada de una clase (por ejemplo 𝑖) y se la denota como 𝑓𝑎𝑖 ,
a la suma de su frecuencia y la suma de las frecuencias de los valores que le anteceden.

DEFINICIÓN
Se define como frecuencia acumulada de una clase (por ejemplo 𝑖) y se la
denota como 𝑓𝑎𝑖, a la suma de su frecuencia y la suma de las frecuencias de
los valores que le anteceden

16
www.capacitare.org.ar
ESTADÍSTICA
Analicemos la Tabla 3 de la tratada anteriormente, (correspondía al número de accidentes
que se produjeron durante los últimos 50 días en una playa de estacionamiento), teniendo en
cuenta la definición de frecuencia acumulada tendremos:
Tabla 4
Clase 𝑥𝑖 𝑓𝑖 𝑥𝑖 . 𝑓𝑖 𝑓𝑟𝑖 𝑓𝑎𝑖
1 0 2 0 0,04 2
2 1 5 5 0,1 7
3 2 7 14 0,14 14
4 3 8 24 0,16 22
5 4 16 64 0,32 38
6 5 5 25 0,1 43
7 6 4 24 0,08 47
8 7 3 21 0,06 50
50 177 1

¿Cuáles son las bondades que nos brinda la frecuencia acumulada?


a) Nos indica con su lectura el número de valores pertenecientes a la distribución que se
ubican a la izquierda de cada uno de ellos. Si se quiere saber cuántos días se
registraron menos de 2 accidentes, se tendrá la frecuencia acumulada del 1, es decir
7, lo que implica que de los 50 días analizados solo en 7 de ellos se tuvieron menos de
dos accidentes diarios, pero con valores menores o iguales a 2 se tuvieron 14, quiere
decir que, de los 50 días, en 14 de ellos se tuvieron 2 o menos de 2 accidentes diarios,
este análisis indica también que, del total de días analizados, 7 de ellos tuvieron
exactamente 2 accidentes diarios.
b) Más adelante cuando efectuemos su graficación Ud. podrá visualizar con mayor
claridad esta propiedad.
c) También nos permite determinar rápidamente el valor de la mediana. Analizando
nuestro caso, el número de observaciones es par, por lo que la mediana será el
promedio de los dos valores centrales, el 𝑥𝑛/2 y el 𝑥(𝑛/2 + 1) . Para determinar el valor
que ocupa la posición 𝑛/2 (en este caso 50/2 = 25, el 𝑥25 , nos ubicamos en la
columna correspondiente a frecuencia acumuladas y determinamos a cuál de las
clases le corresponde la menor frecuencia acumulada que contiene a 𝑛/2, en este
caso le corresponde a la quinta clase, cuyo valor es el 4, desde la 𝑥23 , hasta la 𝑥38 le
corresponden 4, por lo tanto la 𝑀𝑒 = 4.

FUNDACIÓN CAPACITARE 17
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA FRECUENCIA DESACUMULADA

DEFINICIÓN
Se define como frecuencia desacumulada de un valor, 𝑓𝑑𝑠 de una
distribución, a la diferencia entre el número total de observaciones y su
frecuencia acumulada

Es decir que para un valor cualquiera se verifica que:


𝑓𝑑𝑠𝑖 = 𝑛 − 𝑓𝑎𝑖
Analicemos la Tabla 5 a la cual se le creó una nueva columna conteniendo la frecuencia
desacumulada, aplicando su definición.
Tabla 5

Clase 𝑥𝑖 𝑓𝑖 𝑥𝑖 . 𝑓𝑖 𝑓𝑟𝑖 𝑓𝑎𝑖 𝑓𝑑𝑠


1 0 2 0 0,04 2 48
2 1 5 5 0,1 7 43
3 2 7 14 0,14 14 36
4 3 8 24 0,16 22 28
5 4 16 64 0,32 38 12
6 5 5 25 0,1 43 7
7 6 4 24 0,08 47 3
8 7 3 21 0,06 50 0
50 177 1

De la definición se desprende que:


𝑓𝑎𝑖 + 𝑓𝑑𝑠𝑖 = 𝑛
Bien podemos decir que la frecuencia desacumulada es el complemento a 𝑛 de la acumulada,
es decir que para cada uno de los valores nos indica cuantos tenemos a la derecha de él. La
frecuencia desacumulada del valor de 𝑥 = 2, nos indica que la distribución posee 36
observaciones mayores que ese valor. También podríamos valernos de este parámetro para la
determinación de la mediana, dejamos para que Ud. efectúe el análisis correspondiente a esa
situación Analizaremos más adelante el diagrama representativo de ambas frecuencias
correspondientes a una distribución

18
www.capacitare.org.ar
ESTADÍSTICA
DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS NOMINALES
Consideremos las ventas de los distintos tipos de sabor de gaseosas realizadas en el Bar de
una Universidad durante un día de concurrencia normal del alumnado.
Colas 55
Naranja 63
Limón 72
Tónicas 44
Agua con gas 15
Agua sin gas 18
Jugos 33
En este caso no tiene sentido determinar el valor de la media de la distribución, téngase en
cuenta que las clases están dadas por los distintos tipos de bebidas, luego tiene sentido decir que
la más vendidas son las bebidas de limón, siguiéndole en importancia las de naranja, es decir el
valor de tendencia central que utilizaremos en casos como estos le corresponde a la Moda. Sí
sería conveniente generar una tabla de frecuencias y determinar los porcentajes de cada uno de
los sabores.
Tabla 6

𝑥𝑖 𝑓𝑖 𝑓𝑟𝑖 𝑓𝑖 %

Agua c/gas 15 0,05 5

Agua s/gas 18 0,06 6

Jugos 33 0,11 11

Tónicas 44 0,1467 14,67

Colas 55 0,1833 18,33

Naranjas 63 0,21 21

Limón 72 0,24 24

∑ 𝑓𝑖 = 300 ∑ 𝑓𝑖 % = 100

FUNDACIÓN CAPACITARE 19
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA UNIDAD 3

DIAGRAMAS
Diagrama de bastones
Diagrama de sectores
Histograma y Polígono de frecuencias
Histograma y Polígono de frecuencias relativas
Frecuencia acumulada
Relación entre media, mediana y moda
DIAGRAMAS
El poder graficar los valores estadísticos nos permite realizar una lectura rápida de la
distribución y sacar conclusiones inmediatas de la misma.
Sería suficiente abrir una hoja de cálculo para observar la cantidad variada de gráficos con
que puede ser representada una distribución: Diagramas de: Líneas, Barras, Barras acumuladas,
de Sectores o circular, Diagramas x-y, de Bastones, etc. En este texto haremos referencia a los
diagramas: Circular, de Bastones e Histogramas y a una combinación de los gráficos de Bastones,
Barras y x-y Dispersión.

EJEMPLO

Supongamos tener para analizar las notas obtenidas por 20 alumnos de una división en la
asignatura de Estadística:
9 7 6 6 6 5 3 4 5 5 8 7 8 7 7 6 5 6 4 10
Generaremos una distribución de frecuencias complementándola con: Frecuencias
relativas, Frecuencia acumulada y por último Frecuencia desacumulada.
Tabla 7
𝑥𝑖 𝑓𝑖 𝑓𝑟𝑖 𝑓𝑎𝑖 𝑓𝑑𝑠
3 1 0,05 1 19
4 2 0,1 3 17
5 4 0,2 7 13
6 5 0,25 12 8
7 4 0,2 16 4
8 2 0,1 18 2
9 1 0,05 19 1
10 1 0,05 20 0
20 1

Toda vez que se presenta una tabla tal como la Tabla 7, la primera pregunta que surge es,
“que se debe graficar” debe de tenerse siempre en cuenta que cada vez que se habla de graficar
estamos deseando volcar en forma gráfica una cierta relación. En la presente situación, la
variable en estudio es la calificación, por lo cual se podría graficar la relación:

20
www.capacitare.org.ar
ESTADÍSTICA
 Calificación y frecuencia
 Calificación y frecuencia relativa
 Calificación y frecuencia acumulada
 Calificación y frecuencia desacumulada
DIAGRAMA DE BASTONES
Llevaremos en el eje de las abscisas las calificaciones y en el eje de las ordenadas las
frecuencias y representamos mediante un segmento centrado en cada una de las calificaciones
su correspondiente frecuencia; tendremos nuestro primer diagrama. Cada uno de los bastones
corresponde a la frecuencia de cada calificación y toma el nombre de densidad de frecuencia
entendiéndose como tal al cociente:
𝑓𝑖
𝑑𝑓 =
∆𝑥
es decir frecuencia por unidad de intervalo de clase
Gráfico 1

DIAGRAMA DE BASTONES
6

5
Frecuencia

0
3 4 5 6 7 8 9 10
Calificaciones

DIAGRAMA DE SECTORES
Para este gráfico debemos tener presente que el ángulo central del círculo es de 360º y que
cada una de las clases estará dada por un sector cuyo ángulo será proporcional a su frecuencia:
Supongamos la calificación de 3 cuya frecuencia es 1 tendremos que:
20 (suma de todas las frecuencias) ------------------------ 360º
a 1 (frecuencia del 3) ----------------------- 𝛼1 = 360º. 1 / 20 = 18º
Analicemos la calificación del 4 cuya frecuencia es 2:
20 (suma de todas las frecuencias) ------------------------ 360º
a 2 (frecuencia del 4) ----------------------- 𝛼1 = 360º. 2 / 20 = 36º

FUNDACIÓN CAPACITARE 21
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA Repitamos el procedimiento para el 5 el cual tiene frecuencia 4
20 (suma de todas las frecuencias) ------------------------ 360º
a 4 (frecuencia del 5) ----------------------- 𝛼1 = 360º. 4 / 20 = 72º
Debe tenerse en cuenta que en todos los casos la operación que nos permite determinar el
ángulo de cada sector está dado por el producto entre 360º y el cociente de la frecuencia de la
calificación en estudio y la suma de todas las frecuencias (𝑁), cociente éste que según ya vimos
corresponde a la frecuencia relativa (𝑓𝑟𝑖 = 𝑓 / 𝑁), es decir que el ángulo correspondiente a un
determinado sector está dado por el producto entre 360º y su frecuencia relativa:
𝛼𝑖 = 360º. 𝑓𝑟𝑖
Gráfico 2

DIAGRAMA DE SECTORES
10 3
9
4

En realidad es más interesante plantear este mismo diagrama pero expresado en porcentajes,
para lo cual el análisis es muy similar al anterior. Al total de observaciones, 20 en este caso, le
corresponderá el 100% y por lo tanto para cualquiera de las observaciones con frecuencia 𝑓𝑖 le
corresponde será:
Si a 20 ------------------------ 100%
𝑓𝑖 ------------------------------- %𝑖 = 100 . 𝑓𝑖 / 20
Nuevamente nos encontramos
DIAGRAMA DE SECTORES
con que el porcentaje
correspondiente a cada una de las
CALIFICACIONES EN PORCENTAJES
10 3
9
calificaciones estará dado por el 5% 5% 4
5%
10%
producto entre 100 y la frecuencia 8
10%
relativa correspondiente a cada
una de ellas. El gráfico tiene la
5
misma estructura anterior.
20%
7
20%
Gráfico 3

6
25%

22
www.capacitare.org.ar
ESTADÍSTICA
HISTOGRAMA DE FRECUENCIAS
Éste es otro de los diagramas de gran utilización para el cual es necesario considerar un
sistema de ejes cartesianos ortogonales, debiendo representar en el eje de las abscisas las
calificaciones y en el de las ordenadas la frecuencia, las clases están dadas por las calificaciones.
El intervalo entre dos clases sucesivas se denomina “amplitud de intervalo”, en este caso es la
unidad y se la expresa como 𝛥𝑥 = 1. Si consideramos el diagrama de bastones y a partir del
extremo inferior de cada uno de ellos llevamos tanto a izquierda como a derecha la mitad del
intervalo, en nuestro caso 1 / 2 = 0,5 y levantamos las ordenadas correspondientes, nos
encontramos con un diagrama de barras sin discontinuidades al que denominaremos
Histograma, en este caso de Histograma de Frecuencias.
Gráfico 4

HISTOGRAMA DE FRECUENCIAS
6

4
Frecuencia

0
0 1 2 3 4 5 6 7 8 9 10 11
Calificaciones

La superficie encerrada por cada una de las barras está dada por el producto entre la base Δx
por la altura que según ya vimos estaba dada por la densidad de frecuencia.
𝑑𝑓𝑖 = 𝑓𝑖 /𝛥𝑥
por lo tanto:
𝑆𝑖 = 𝛥𝑥. 𝑑𝑓𝑖 = 𝛥𝑥. 𝑓𝑖 / 𝛥𝑥 = 𝑓𝑖
Cada una de ellas tendrá un valor igual a su frecuencia y el área total del diagrama será
entonces la suma de todas las frecuencias e igual a 𝑁.
𝛴𝑆𝑖 = 𝛴 𝑓𝑖 = 𝑁
POLÍGONO DE FRECUENCIAS
Si se unen los puntos medios superiores de cada una de las barras del histograma y se
considera cero las frecuencias de las clases adyacentes a los extremos de la distribución, se
formará con el eje de las abscisas un polígono denominado, en este caso, como Polígono de
Frecuencias:

FUNDACIÓN CAPACITARE 23
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA Gráfico 5
6

3
fi
2

0
2 3 4 5 6 7 8 9 10 11
xi

El área encerrada por el polígono de frecuencias es igual al área encerrada por el histograma
de frecuencias.
Consideremos la barra del histograma correspondiente al valor de la variable 𝑥 = 6.
Observamos que mientras que la superficie del triángulo superior de la barra que pertenece al
histograma no pertenece al polígono, la superficie del triángulo inferior no perteneciente al
histograma si pertenece ahora al polígono, como las superficies de ambos triángulos son iguales,
lo son también las superficies del polígono y del histograma de frecuencias.
HISTOGRAMA DE FRECUENCIAS RELATIVAS
Si en el eje de ordenadas se representan a las frecuencia relativas en lugar de las frecuencias,
se obtiene el Histograma de Frecuencias Relativas que tendrá las mismas características que el
diagrama de frecuencias ya que 𝑓𝑟𝑖 = 𝑓𝑖 / 𝑁, es decir que se divide a los valores de la ordenada
por un valor constante 𝑁 y por lo tanto gráficamente representa un cambio de escalas.
En este caso la altura de cada barra está dada por la densidad de frecuencia relativa
𝑑𝑓𝑟𝑖 = 𝑓𝑟𝑖 / 𝛥𝑥
Y por lo tanto al igual que en el diagrama anterior, la superficie encerrada por cada una de
las barras del Histograma será igual a su frecuencia relativa:
𝑆𝑖 = 𝛥𝑥. 𝑓𝑟𝑖 / 𝛥𝑥 = 𝑓𝑟𝑖
De tal manera que el área encerrada por el Histograma de frecuencias relativas será ahora
igual a la suma de todas las frecuencias relativas y por tal razón igual a 1:

∑ 𝑆𝑖 = ∑ 𝑓𝑟𝑖 = 1

24
www.capacitare.org.ar
ESTADÍSTICA
Gráfico 6
0,3
HISTOGRAMA DE FRECUENCIAS RELATIVAS
0,25

0,2

0,15
fri

0,1

0,05

0
2 3 4 5 6 7 8 9 10 11
xi

POLÍGONO DE FRECUENCIAS RELATIVAS


De la misma manera en que definimos al polígono de frecuencias, se define también al
polígono de frecuencias relativas. Tanto la superficie encerrada por el polígono de frecuencias
relativas como el del Histograma de esas mismas frecuencias son iguales a 1.
Gráfico 7
0,3
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS RELATIVAS
0,25

0,2

0,15
fri

0,1

0,05

0
2 3 4 5 6 7 8 9 10 11
xi

FRECUENCIA ACUMULADA
Supongamos analizar el número de accidentes de trabajo que se producen diariamente en
una empresa metalúrgica local, para lo cual se han considerado los detectados durante los
últimos veinte días.
5 4 6 3 4 5 3 7 3 4 2 0 2 1 3 4 2 5 6 1
Confeccionaremos una tabla de frecuencias:

FUNDACIÓN CAPACITARE 25
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA Tabla 8
𝑥𝑖 𝑓𝑖 𝑓𝑎𝑖
0 1 1
1 2 3
2 3 6
3 4 10
4 4 14
5 3 17
6 2 19
7 1 20

∑ 𝑓𝑖 = 20

Para confeccionar el gráfico de frecuencias acumuladas llevaremos sobre el eje de las abscisas
los valores observados y en el eje de las ordenadas las frecuencias acumuladas.
Para el primer valor de la distribución cero, la frecuencia acumulada vale 1, este valor se
mantendrá constante hasta 1 en donde la frecuencia acumulada toma el valor de 3, se mantiene
constante hasta el valor observado de 2 en donde la 𝑓𝑎 adopta el valor de 6 y así sucesivamente
hasta el valor de 7 en donde 𝑓𝑎 toma el valor de 20 y se mantiene constante con este valor. Siga
esto en el gráfico 8.
Gráfico 8
25
FRECUENCIA ACUMULADA
20
Frecuencia acumulada

15

10

0
0 1 2 3 4 5 6 7 8 9
OBSERVACIONES

Observe el lector con que claridad este diagrama le entrega información. Por ejemplo
analizando la observación 4, el punto inferior de la barra indica que menores a 4 accidentes
diarios se han producido en 10 oportunidades mientras que el punto superior indica que en 14
oportunidades se han producido 4 o menos accidentes diarios. De igual manera en 17
oportunidades se produjeron menos de 6 accidentes en un día y que en sólo 2 oportunidades se
produjeron 6 accidentes.

26
www.capacitare.org.ar
ESTADÍSTICA
De igual manera podemos graficar la frecuencia desacumulada conjuntamente con la
acumulada tal como lo muestra el Gráfico 8 denominado comúnmente como gráfico de
escalones. Debe tenerse en cuenta que para cualquier valor observado la suma de la frecuencia
acumulada y la desacumulada es igual al número total de observaciones.
𝑓𝑎 + 𝑓𝑑𝑠 = 𝑛
Gráfico 9

La intersección de ambas gráficas debe de verificarse para 𝑓𝑎 = 𝑓𝑑𝑠 = 𝑛/2.


En el punto de intersección ambas frecuencias son iguales por lo que podemos decir que:
𝑓𝑎 + 𝑓𝑑𝑠 = 𝑓𝑎 + 𝑓𝑎 = 𝑛
por lo que
2 𝑓𝑎 = 𝑛
y
𝑓𝑎 = 𝑛 / 2
RELACIÓN ENTRE MEDIA, MEDIANA Y MODA
Cuando nos referimos al histograma de frecuencias relativas decíamos que el área encerrada
por cada una de las barras nos entregaba el valor de la frecuencia relativa del valor
correspondiente a dicha barra. Si este concepto lo extendemos a toda la distribución podemos
asegurar que considerando un determinado intervalo de las observaciones el área encerrada por
el histograma en dicho intervalo será igual a su frecuencia relativa, valor que según ya vimos
multiplicada por 100 nos entrega el porcentaje de observaciones comprendidas en ese intervalo.
Además demostramos que la superficie encerrada por el histograma de frecuencias relativas era
igual a la superficie del polígono de 𝑓𝑟. Simplificando, el área encerrada por el polígono de
frecuencias relativa es igual a 1 y esto implica también que encierra el 100% de las
observaciones.
Analicemos las distribuciones correspondientes a las calificaciones obtenidas por tres
divisiones que denominaremos como A, B y C en la asignatura de Estadística:

FUNDACIÓN CAPACITARE 27
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA Tabla 9
𝐴 𝐵 𝐶
𝑥𝑖 𝑓𝑖 𝑓𝑖 𝑓𝑖
1 6 0 0
2 8 1 0
3 5 2 1
4 4 4 1
5 3 5 2
6 2 6 4
7 1 5 5
8 1 4 7
9 0 2 5
10 0 1 2
30 30 27

Las tres distribuciones tienen características distintas, veamos:

𝜇 = ∑(𝑥𝑖 . 𝑓𝑖 ) / 𝑁 = 3,1667

𝐴 𝑀𝑒 = (𝑥15 + 𝑥16 ) / 2 = 3
𝑀𝑜 = 2

𝜇 = ∑(𝑥𝑖 . 𝑓𝑖 ) / 𝑁 = 6

𝐵 𝑀𝑒 = 𝑥16 = 6
𝑀𝑜 = 2

𝜇 = ∑(𝑥𝑖 . 𝑓𝑖 ) / 𝑁 = 7,296

𝐶 𝑀𝑒 = 𝑥14 = 8
𝑀𝑜 = 8

Si graficamos los histogramas y polígonos de las frecuencias relativas de cada una de las
distribuciones relativas suavizando convenientemente los lados del polígono, nos encontraremos
con los siguientes gráficos:

28
www.capacitare.org.ar
ESTADÍSTICA
Gráfico 10 (División A)
0,3
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
0,25 RELATIVAS

frecuencia 0,2

0,15

0,1

0,05

0
1 2 3 4 5 6 7 8 9 10
OBSERVACIONES

Gráfico 11 (División B)
0,25
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
0,2 RELATIVAS
frecuencia

0,15

0,1

0,05

0
1 2 3 4 5 6 7 8 9 10
OBSERVACIONES

Gráfico 12 (División C)
0,25 HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
RELATIVAS
0,2
frecuencia

0,15

0,1

0,05

0
1 2 3 4 5 6 7 8 9 10
OBSERVACIONES

FUNDACIÓN CAPACITARE 29
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA En el caso de la división 𝐵 se observa una cierta simetría respecto a un eje vertical coincidente
con la mediana la moda y la media, decimos entonces que la distribución es del tipo Normal, y
que en ese caso coinciden los tres valores 𝜇; 𝑀𝑒 y 𝑀𝑜.
En el 𝐴 la distribución se presenta en forma asimétrica y en este caso decimos que
corresponde a una asimétrica derecha asignándosele un signo positivo. A su vez, la observación
de mayor ordenada le corresponderá a la moda y la media tendrá que dividir al área total en dos
áreas iguales, de acuerdo a su gráfica y a sus valores se observa que la media tiene un valor mayor
a la mediana y que a su vez ésta se ubica entre la media y la moda.
Al analizar la última distribución 𝐶 observamos que la misma es asimétrica, tiene sesgo
izquierdo y se le asigna signo negativo. Nuevamente la moda queda definida por correspóndele
a la abscisa de mayor ordenada, la mediana 𝑀𝑒 si bien en este caso coincidiría con el valor de la
moda, la media se ubica a la izquierda de la moda, no olvidemos que la distribución pivotea en
ese punto. La mediana se ubica en general entre la media y la moda aunque en este caso por
tratar con variable discreta, la 𝑀𝑒 coincide con la 𝑀𝑜.
En toda distribución sesgada ya sea a la derecha o a la izquierda, el segmento comprendido
por la media y la mediana es aproximadamente un tercio del segmento comprendida entre la
media y la moda.
Una distribución puede ser:

Simétrica 𝜇 = 𝑀𝑒 = 𝑀𝑜

Distribución Derecha 𝜇 < 𝑀𝑒 < = 𝑀𝑜


Asimétrica
Izquierda 𝜇 > 𝑀𝑒 > = 𝑀𝑜

30
www.capacitare.org.ar
ESTADÍSTICA

UNIDAD 4

DISTRIBUCIÓN DE INTERVALOS DE CLASE


Determinación de la media
Determinación de la mediana
Determinación de la moda
Valores de dispersión
Cuartiles y percentiles
DISTRIBUCIÓN DE INTERVALOS DE CLASE
En una unidad militar de entrenamiento para futuros oficiales, se han determinado los
tiempos que tardan los integrantes de un pelotón en cruzar la pista de combate. Estos valores
expresados en minutos son los siguientes:
3,1 3,4 3,6 3,6 3,6 3,7 3,7 3,8 3,8 3,9 3,9
4,0 4,0 4,1 4,2 4,2 4,3 4,3 4,4 4,5 4,6
El jefe de pelotón necesita realizar un estudio estadístico sobre estos tiempos a los efectos
de determinar:
a) Qué proporción de hombres tardan menos de 3,5’ en cruzar la pista de combate
b) Qué proporción de los hombres del pelotón tardan menos de 4’ en cruzar la pista
En casos como el presentado, donde el número de observaciones es mayor a 20 y la variable
en estudio es del tipo continua, se hace necesario definir como clases a intervalos y determinar
como frecuencia de cada uno de ellos al número de observaciones que contienen. En este caso
la distribución toma el nombre de distribución de intervalos de clase.
Para generar una distribución de intervalos de clase debe tener en cuenta:
a) La cantidad de intervalos: La determinación del número de intervalos, a los que
llamaremos como 𝑘 está relacionada con el número de observaciones 𝑛. Mientras que
algunos operadores definen:
𝑘 = 𝑛
Otros deciden optar por la expresión:
𝑘 = 1 + 𝑙𝑜𝑔2 (𝑛)
Pero en general se puede definir el valor de 𝑘 teniendo en cuenta que:
5 <= 𝑘 <= 15
Es decir que el número de intervalos debe estar comprendido entre 5 y 15. Una
cantidad menor de intervalos da lugar a una distribución con información insuficiente.

FUNDACIÓN CAPACITARE 31
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA Por otro lado una cantidad mayor a 15 intervalos genera una distribución que resulta
engorroso operar.
Para el caso que tenemos en estudio y teniendo en cuenta que 𝑛 = 21, la raíz
cuadrada de 21 es de 4,58 y considerando la última condición, adoptaremos para 𝑘
el valor de 5
𝑘=5
b) La amplitud de intervalo 𝛥𝑥 para la cual adoptaremos la expresión:
𝑥𝑛 − 𝑥1
𝛥𝑥 =
𝑘
Para nuestro caso:
4,6 − 3,1
𝛥𝑥 = = 0,3
5
c) No puede haber un intervalo con frecuencia cero, si esa situación se presentare, será
necesario modificar la cantidad de intervalos o la amplitud de intervalo.
d) Al definir los límites de los intervalos debe tenerse en cuenta la posibilidad que uno
de ellos puede ser cerrado y el otro abierto:
e) Es conveniente que todos los intervalos tengan el mismo tamaño y cuando esto no
sea posible, los intervalos de diferente amplitud deben ubicarse en los extremos
f) No es conveniente que las observaciones coincidan con los límites de los intervalos,
de esta manera desaparece la duda en cuanto a la pertenencia de una observación a
un intervalo o a su adyacente.
En este caso particular, teniendo en cuenta que todas las observaciones tienen un
solo decimal, y que el menor es 3,1, adoptaremos como inicio de la distribución el
valor de 3,09, de esta manera nos aseguramos que la primera observación quede
contenida en el primer intervalo, y además como la amplitud de intervalo es de 0,3,
en ningún caso una observación coincidirá con los límites.
3,09 3,39 3,69 3,99 4,29 4,6
[-----------------)[-----------------)[-----------------)[-----------------)[-----------------]

Podemos ahora confeccionar la tabla de distribución de intervalos de clase, teniendo


en cuenta que, a los efectos de referenciar a cada intervalo, definiremos al punto
medio de cada uno de ellos como el valor representativo e igual a la semisuma de sus
límites, toma el nombre de marca de clase y se lo denota como 𝑥𝑚𝑖 .
3,09 3,39 3,69 3,99 4,29 4,6
[--------|--------)[--------|--------)[--------|--------)[--------|--------)[--------|--------]
3,24 3,54 3,84 4,14 4,14
DETERMINACIÓN DE LA MEDIA
Para determinar la media de la distribución consideramos que todos los valores
pertenecientes a cada intervalo están uniformemente distribuidos en dicho intervalo, de esta
manera la suma de todos ellos estará dada por el producto entre la marca de clase por la
frecuencia de ese intervalo.

32
www.capacitare.org.ar
ESTADÍSTICA
∑( 𝑥𝑚𝑖 ∗ 𝑓𝑖 )
𝜇 =
𝑁
Para su determinación creamos una nueva columna conteniendo los productos de 𝑥𝑚𝑖 ∗ 𝑓𝑖 :
Tabla 10
𝐿𝑖 𝐿𝑠 𝑓𝑖 𝑥𝑚𝑖 𝑥𝑚𝑖 ∗ 𝑓𝑖
3,09 3,39 1 3,24 3,24
3,39 3,69 4 3,54 14,16
3,69 3,99 6 3,84 23,04
3,99 4,29 5 4,14 20,7
4,29 4,6 5 4,445 22,225
21 83,365
83,365
𝜇 = = 3,9697
21
Esto nos indica que el tiempo promedio empleado por los integrantes del pelotón para cruzar
la pista de combate es de 3,9697
HISTOGRAMA DE FRECUENCIA
Para confeccionar el Histograma y Polígono de frecuencias debemos tener presente que las
frecuencias de los intervalos adyacentes a los extremos de nuestra distribución son nulas,
además se representa en el eje horizontal las marcas de clase.
Gráfico 13
7

4
f

0
2,94 3,24 3,54 3,84 4,14 4,445 4,74
x

DETERMINACIÓN DE LA MEDIANA
La mediana tendrá que estar ubicada en el intervalo cuya menor frecuencia acumulada
contiene a la observación 𝑥(𝑛⁄2) , es por lo tanto conveniente determinar las columnas que
contengan a las frecuencias acumuladas y desacumuladas.

FUNDACIÓN CAPACITARE 33
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA Tabla 11
𝐿𝑖 𝐿𝑠 𝑓𝑖 𝑥𝑚𝑖 𝑥𝑚𝑖 ∗ 𝑓𝑖 𝑓𝑎𝑖 𝑓𝑑𝑠𝑖

2,79 3,09 0 2,94 0 0 21

3,09 3,39 1 3,24 3,24 1 20

3,39 3,69 4 3,54 14,16 5 16

3,69 3,99 6 3,84 23,04 11 10

3,99 4,29 5 4,14 20,7 16 5

4,29 4,6 5 4,445 22,225 21 0

4,6 4,39 0 40,74 0 21 0

De acuerdo a la tabla, la mediana se ubica en el intervalo [3,69 ; 3,99) al que denominaremos


intervalo medial, y para el cuál la frecuencia acumulada es de 11 y por lo tanto contiene a los
valores correspondientes a 𝑥10 y 𝑥11 , pero faltaría determinar el valor que más se aproxime al
real.
Para la determinación de la mediana en una distribución de intervalos de clase tendremos
dos métodos:
a) Método gráfico
Tracemos los diagramas correspondientes a la frecuencia acumulada:
Analizando dicho diagrama podemos observar que de los 21 integrantes del pelotón
sólo 5 de ellos cruzan la pista en menos de 3,54’, es decir que, mediante análisis del
diagrama podemos reconstruir la tabla.
Gráfico 14
25

20

15
fa

10

0
2,94 3,24 3,54 3,84 4,14 4,445 4,74
x

Combinemos en un mismo diagrama, las representaciones de frecuencia acumulada


y desacumulada. Este gráfico toma el nombre de Ojiva.

34
www.capacitare.org.ar
ESTADÍSTICA
Gráfico 15
25

20

15
fa - fds

10

0
2,94 3,24 3,54 3,84 4,14 4,445 4,74
x

Como ambas frecuencias se representan en el eje vertical, en el punto intersección


ambas es iguales y como su suma
𝑓𝑎 + 𝑓𝑑𝑠 = 𝑁
Debe verificarse que el valor de esas frecuencias, en ese punto es igual a 𝑁/2.
Como la mediana es el valor que ocupa el punto medio, la abscisa correspondiente al
punto intersección tendrá su valor. Por lo tanto las coordenadas del punto
intersección serán (𝑀𝑒; 𝑛/2).
b) Método Analítico
Analizaremos el intervalo medial:
Gráfico 16

FUNDACIÓN CAPACITARE 35
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA Al iniciar el intervalo 3,69 su frecuencia acumulada tiene el valor de 5 (que denominaremos
frecuencia acumulada inferior y la denotaremos como 𝑓𝑎𝑖). De la misma manera al finalizar ese
intervalo (𝑥 = 3,69) su frecuencia acumulada es de 11 (a la denominaremos frecuencia
acumulada superior y la denotaremos como 𝑓𝑎𝑠). Esa variación de frecuencia acumulada de 5 a
11 es justamente la frecuencia correspondiente al intervalo medial (𝑓𝑚 = 6). Además como el
total de observaciones es de 21, 𝑁/2 = 10,5.
Consideremos los triángulos 123 y 12’3’ ambos rectángulos en 2 y 2’ respectivamente.
Esos triángulos son semejantes y por lo tanto sus lados homólogos son proporcionales.
2−3 1−2
=
2’ − 3’ 1 − 2’
Si reemplazamos tendremos:
𝑓𝑚 ∆𝑥
=
𝑁/2 − 𝑓𝑎𝑖 𝑀𝑒 − 𝐿𝑖
Despejando 𝑀𝑒 tendremos:
∆𝑥(𝑁/2 − 𝑓𝑎𝑖)
𝑀𝑒 = 𝐿𝑖 +
𝑓𝑚

En este caso particular, la 𝑀𝑒 = 3,69 + 0,3 ∗ ((10,5 − 5) / 6


𝑀𝑒 = 3,965’
DETERMINACIÓN DE LA MODA
Se define como intervalo modal al intervalo de mayor frecuencia, en este caso corresponderá
a [3,69; 3,99) con frecuencia 6, coincide con el medial, pero bien podría no coincidir, para la
determinación de la moda, consideremos en el histograma de frecuencia, el intervalo modal y
los intervalos adyacentes.
Gráfico 17

36
www.capacitare.org.ar
ESTADÍSTICA
Si definimos a
𝑑1 = (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑚𝑜𝑑𝑎𝑙) – (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑞𝑢𝑒 𝑙𝑒 𝑠𝑢𝑐𝑒𝑑𝑒):
𝑑1 = 6 − 4 = 2
Y como
𝑑2 = (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑚𝑜𝑑𝑎𝑙) – (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑞𝑢𝑒 𝑙𝑒 𝑠𝑢𝑐𝑒𝑑𝑒):
𝑑2 = 6 − 5 = 1

Como 𝐿𝑖 se define al inicio del intervalo modal (3,69), el valor de la moda de una distribución
de intervalos de clase está dada por la expresión:
𝑀𝑜 = 𝐿𝑖 + 𝛥𝑥. ( 𝑑1 /(𝑑1 + 𝑑2 ) )
En este caso tendremos:
𝑀𝑜 = 3,69 + 0,3 (2 / (2 + 1)) = 3,89’
Conclusiones:
En una distribución de intervalos de clase, la moda se encuentra siempre ubicada en el
intervalo modal, pero desplazada hacia el intervalo adyacente de mayor frecuencia. Los valores
determinados para la media, mediana y moda, indican que la distribución tiene un leve sesgo
derecho:
Media 𝜇 = 3,9697’
Mediana 𝑀𝑒 = 3,965’
Moda 𝑀𝑜 = 3,89’
𝜇 > 𝑀𝑒 > 𝑀𝑜
VALORES DE DISPERSIÓN
¿Son suficientes los valores de posición central para determinar las características de una
distribución? Para responder a esta pregunta observemos la siguiente situación:
Tenemos tres distribuciones que presenten la misma media, la misma moda y la misma
mediana pero no obstante ello las tres son distintas.
Pueden tenerse dos distribuciones mismo número de elementos o también conformadas por
los mismos elementos y no obstante ello ambas son distintas.

FUNDACIÓN CAPACITARE 37
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA Tabla 12

𝑋1 𝑌1 𝑋2 𝑌2
0 0 0 0
1 3 1 6
2 4 2 8
3 7 3 4
4 5 4 3
5 4 5 2
6 2 6 2
7 1 7 1
8 0 8 0
26 26

Gráfico 19
8

0
0 1 2 3 4 5 6 7 8 9

Gráfico 20
9

0
0 1 2 3 4 5 6 7 8 9

38
www.capacitare.org.ar
ESTADÍSTICA
Es necesario entonces considerar valores que nos determinen cuan dispersos están. Estos
valores se denominan valores de dispersión:
RANGO O AMPLITUD

DEFINICIÓN

La diferencia entre los valores extremos de una distribución se denomina


Alcance o Rango y se lo denota como 𝑅

Si definimos a 𝑥𝑛 como el mayor valor observado y a 𝑥1 como el más pequeño, entonces:


𝑅 = 𝑥𝑛 – 𝑥1
Si bien, una vez ordenados todos los valores, el cálculo de la amplitud o recorrido es simple e
inmediata, no nos brinda ninguna información sobre las características de los valores
intermedios. Veamos las siguientes distribuciones:
A) 0 1 1 2 4 6 8 10 12 14
B) 50 50,1 50,2 50,3 50,5 50,6 50,7 50,8 60 64
En la distribución A
𝑅 = 14 – 0 = 14
En la distribución B
𝑅 = 64 – 50 = 14
Ambas tienen el mismo número de elementos, el mismo alcance, no obstante ello son
distintas, es decir que el Rango o Amplitud de una distribución nos entrega una información
limitada.
DESVÍO MEDIO
Para determinar el grado de dispersión de los valores de la distribución, debemos definir con
respecto a qué punto de referencia se toman las distancias, el punto de referencia más utilizado
es la media de la de la distribución
Considerando el ejercicio al inicio de la Unidad (Los tiempos que los integrantes de un pelotón
tardan en cruzar la pista de combate), la distribución de intervalos la representábamos como:
3,09 3,39 3,69 3,99 4,29 4,6
[--------|--------)[--------|--------)[--------|--------)[--------|--------)[--------|--------]
3,24 3,54 3,84 4,14 4,14
𝑑1 𝜇 = 3,9697
𝑑2
En el primer intervalo se encuentra una sola observación, la cual consideramos es coincidente
con la marca de clase, luego su distancia respecto a la media será:

FUNDACIÓN CAPACITARE 39
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA 𝑑1 = 𝑥𝑚1 − 𝜇
La dispersión de los valores ubicados en el segundo intervalo, en este caso son 4 y habiendo
considerado que los mismos se encuentran uniformemente distribuidos en dicho intervalo, la
dispersión respecto a la media estará dada por el producto de la distancia de la marca de clase
por el número de observaciones
𝑑2 = 𝑥𝑚2 − 𝜇
Podríamos intentar considerar como un valor representativo de la dispersión de los valores
respecto a la media, al promedio de los desvíos medios:
∑(𝑚𝑥𝑖 − 𝜇 ) . 𝑓𝑖
𝑝𝑑𝑚 =
𝑁
Pero nos encontramos con que la suma de todos los desvíos es nula y siempre lo serán por
considerar como punto de referencia a la media. Todas las distancias de las marcas de clase que
se ubiquen a la izquierda de la media serán negativas, mientras que las distancias de los que se
ubiquen a la derecha serán positivas. El problema radica en anular los signos negativos, para ello
podemos:
a) considerar los desvíos absolutos medios, de esta manera no se tendría ningún desvío
negativo y la suma de los desvíos absolutos medios sería distinta de cero, salvo el caso
en que todas las observaciones sean iguales. La expresión matemática quedaría como:
∑|(𝑚𝑥𝑖 − 𝜇 )| . 𝑓𝑖
𝐷𝑀 =
𝑁
Esta expresión se define como Desvío medio (Promedio de los desvíos absolutos medios).
En nuestro caso en estudio conformaremos la tabla correspondiente a la distribución de
intervalos pero incluiremos una nueva columna conteniendo los desvíos absolutos medias.
Tabla 13
𝐿𝑖 𝐿𝑠 𝑓𝑖 𝑥𝑚𝑖 𝑥𝑚𝑖 . 𝑓𝑖 𝑓𝑎𝑖 𝑓𝑑𝑠𝑖 |𝑥𝑚𝑖 − 𝑀𝑒| . 𝑓𝑖

2,79 3,09 0 2,94 0 0 21 0,000


3,09 3,39 1 3,24 3,24 1 20 0,730
3,39 3,69 4 3,54 14,16 5 16 1,719
3,69 3,99 6 3,84 23,04 11 10 0,779
3,99 4,29 5 4,14 20,7 16 5 0,851
4,29 4,6 5 4,445 22,225 21 0 2,736
4,6 4,39 0 40,74 0 21 0 0,000
21 83,365 6,455

Aplicando la fórmula correspondiente, el desvío medio será:


6,455
𝐷𝑀 = = 0,3074
21

40
www.capacitare.org.ar
ESTADÍSTICA
VARIANZA
Otra forma de obtener todos los desvíos positivos, sería elevándolos al cuadrado es decir:
∑(𝑚𝑥𝑖 − 𝜇 )2 . 𝑓𝑖
𝑝𝑑𝑚𝑐 =
𝑁

DEFINICIÓN

Esta expresión que definimos como: el promedio de los desvíos cuadráticos


medios y se denomina Varianza

Es conveniente entonces considerar una nueva columna conteniendo la suma de los desvíos
cuadráticos medios tal como la tabla:
Tabla 14
𝐿𝑖 𝐿𝑠 𝑓𝑖 𝑥𝑚𝑖 𝑥𝑚𝑖 . 𝑓𝑖 𝑓𝑎𝑖 𝑓𝑑𝑠𝑖 |𝑥𝑚𝑖 − 𝑀𝑒| . 𝑓𝑖 (𝑥𝑚𝑖 − 𝑀𝑒)2 . 𝑓𝑖

2,79 3,09 0 2,94 0 0 21 0,000 0


3,09 3,39 1 3,24 3,24 1 20 0,730 0,53255244
3,39 3,69 4 3,54 14,16 5 16 1,719 0,73878118
3,69 3,99 6 3,84 23,04 11 10 0,779 0,10102891
3,99 4,29 5 4,14 20,7 16 5 0,851 0,14490505
4,29 4,6 5 4,445 22,225 21 0 2,736 1,12925624
4,6 4,39 0 40,74 0 21 0 0,000 0
21 83,365 6,455 2,647

2,647
𝑉𝑎𝑟(𝑥) = = 0,126 𝑚𝑖𝑛2
21
También se la denota como:
𝜎 2 = 0,126 𝑚𝑖𝑛2
DESVIACIÓN ESTANDAR
La Varianza es un valor que determina un cierto grado de dispersión, pero en relación a lo
que nosotros buscábamos, nos encontramos con que no tenemos el promedio de los desvíos
medios, si no que contamos con el promedio de los desvíos cuadráticos medios. Una
aproximación estaría obteniendo la raíz cuadrada de la varianza:

∑(𝑚𝑥𝑖 − 𝜇 )2 . 𝑓𝑖
𝜎 = √
𝑁

O abreviando

FUNDACIÓN CAPACITARE 41
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA 𝜎 = √𝑉𝑎𝑟(𝑥)
𝜎 = 0,126 = 0,3549’
FRECUENCIA
Definimos a la desviación estándar como la raíz cuadrada de la varianza y prácticamente
entrega el grado de dispersión de los valores de una distribución con respecto a la media.
Para dos distribuciones con la misma media, tendrá más dispersión aquella que tiene una
mayor desviación estándar, tal como lo indica la gráfica
Gráfico 21

COEFICIENTE DE VARIACIÓN
En muchas oportunidades es conveniente comparar distribuciones de distinta media o de
distinto tipo, por ejemplo si analizamos alturas y peso de los alumnos de un curso de una
Universidad, los valores de posición central y de dispersión de una de ellas estarán dados en
metros o centímetros, pero los de la otra serán en Kg., luego en principio sería incorrecto
pretender comparar las dispersiones de esas distribuciones, a fin de poder comparar se opera
con el Coeficiente de Variación, que está dado por el cociente entre el desviación estándar de la
distribución y su media, expresada de manera porcentual:
𝜎
𝐶𝑉 = . 100%
𝜇
Como tanto la desviación estándar y la media tienen las mismas unidades, al dividirlas se
simplifican y nos queda un coeficiente, es adimensional. Por otra parte el CV entrega la
proporción de la desviación estándar respecto de la media. En el caso que nos ocupa el:
0,3549
𝐶𝑉 = . 100% = 8,94
3,9697
Supongamos que se realiza el estudio de altura y peso de los alumnos de un curso, y que los
resultados arrojados son:
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑀𝑒 𝐶𝑉
Peso 𝜎 = 10 𝐾𝑔 71 𝐾𝑔 14,08%
Altura 𝜎 = 6 𝑐𝑚 168 𝑐𝑚 3,57%

42
www.capacitare.org.ar
ESTADÍSTICA
Estos últimos valores del 𝐶𝑉 indican que, la distribución correspondiente a la altura tiene
menos dispersión que la correspondiente a los pesos.
CUARTILES Y PERCENTILES
En muchas ocasiones es necesario contar con una subdivisión de los datos en determinadas
fracciones, llamados en de manera general como fractiles. De esta manera una fracción o
proporción de datos caen en un fractil o por debajo de éste. De acuerdo al número de
subdivisiones los fractiles toman un nombre determinado, así estas pueden ser:
a) en 10 partes. En este caso cada una de esas partes toman el nombre de decil
b) en cuatro partes: En ese caso cada una de ellas toma el nombre de cuartil
c) en cambio si la subdivisión es en 100 partes, se la denomina a cada una de ellas como
centil.
El alcance interfractil, dada por la diferencia entre dos fractiles constituye una medida de
dispersión entre ellos.
En general los fractiles más utilizados lo constituyen los cuartiles y percentiles. Subdividir a
los datos en cuatro fractiles implica que el 50% de los datos están por debajo del segundo cuartil
y el 75% de las observaciones están por debajo del tercer cuartil, representados gráficamente
implica:

𝑋1 𝑄1 𝑄2 𝑄3 𝑋𝑛

Una cuarta parte de las observaciones se encuentran por debajo de 𝑄1, como que también ½
están por debajo de 𝑄2 . Entre 𝑄3 y 𝑄1 se concentra el 50% de las observaciones. Es necesario
aclarar que 𝑄1 como 𝑄2 y 𝑄3 son los puntos fractiles, por debajo de cada uno de ellos se
encuentran los porcentajes los correspondientes porcentajes de datos.
Cuando el número de valores no es lo suficientemente grande la determinación exacta de los
cuartiles puede ser complicada, ya que es factible que el valor del cuartil quede entre
observaciones, de cualquier manera en general podemos decir que la determinación de cada
cuartil quede satisfecha con las expresiones:
La determinación de los cuartiles para datos no agrupados está dada por las expresiones:
𝑄1 = 𝑋(1⁄4𝑁+1⁄4)
𝑄2 = 𝑋(1⁄2𝑁+1⁄2)
𝑄3 = 𝑋(3⁄4𝑁+1⁄4)

Observe que el valor del segundo cuartil corresponde al valor de la mediana. Si recordamos
que, el área encerrada por el polígono de frecuencias era igual al número de observaciones, sería
lógico suponer entonces que en un diagrama correspondiente al polígono de frecuencias

FUNDACIÓN CAPACITARE 43
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA suavizado, las superficies encerradas por dicho diagrama serán proporcionales al número de
observaciones correspondientes a la misma. Con este concepto definimos los cuartiles
gráficamente según Gráfico 22.
Gráfico 22

𝑄1 𝑄2 𝑄3
Se define como Rango Intercuartil o propagación media a la diferencia:
𝑅𝐼 = 𝑄3 – 𝑄1
Percentiles: De la misma manera en que la distribución en estudio la podemos dividir en
cuatro partes, en el caso de hacerlo en 100 cada una de ellos tomará el nombre de percentil, un
percentil 𝑧 cualquiera es un valor tal que 𝑧 por ciento de las observaciones quedan a su izquierda
mientras que (100 − 𝑧) porcientos de los valores quedan a su derecha. El percentil 80 está
dejando a su izquierda el 80% de los valores de la distribución, es decir todos aquellos menores
a él, y por lo tanto el 20% de la distribución lo superan, es decir quedan a su derecha.
Gráfico 23

44
www.capacitare.org.ar
ESTADÍSTICA
REGLA EMPÍRICA

Según vimos en el punto anterior, dada una distribución, el valor de su desviación


estándar nos indica el grado de dispersión de sus valores con respecto a la media, pero es en
realidad la Regla Empírica, quien relaciona a los dos parámetros : 𝜇 y 𝜎 con el siguiente
enunciado:
En el intervalo centrado en la media y tal que su origen izquierdo esté dado por la media
menos un desviación estándar y el derecho por la media más un desviación estándar, se
agrupa el 68 % de los valores de la distribución; En el intervalo comprendido por la media
menos dos desviaciones estándar y más dos desviaciones se ubica el 95% de los valores de la
distribución, por último en el intervalo comprendido por la media menos tres desviaciones
estándar y la media más tres desvíos estándar se tendrá el 99,7% de 𝑁 (suele considerarse
en muchas oportunidades en este intervalo el 100% de 𝑁).
Debe de tener en cuenta que, entre el inicio de la gráfica y su fin, se encuentran ubicados
todos los valores de la distribución 𝑁.

Gráfico 24

Resumen Regla Empírica


(𝜇 ± 1𝜎) 𝑠𝑒 𝑡𝑖𝑒𝑛𝑒 𝑒𝑙 68% 𝑑𝑒 𝑁
(𝜇 ± 2𝜎) 𝑠𝑒 𝑡𝑖𝑒𝑛𝑒 𝑒𝑙 95% 𝑑𝑒 𝑁
(𝜇 ± 3𝜎)𝑠𝑒 𝑐𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎 𝑒𝑙 100% 𝑑𝑒 𝑁

FUNDACIÓN CAPACITARE 45
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA UNIDAD 5

PROBABILIDADES
Probabilidades: Definición
Eventos: Definición y clasificación
Determinación de probabilidades
Probabilidad subjetiva
Regla aditiva
Regla multiplicativa
PROBABILIDADES
Siempre que se encare un problema estadístico debe tenerse en cuenta el grado de
posibilidad de que ciertos sucesos hayan ocurrido o vayan a ocurrir. Por ejemplo, a un político le
interesará conocer el grado de seguridad de las encuestas que determinan un porcentaje dado
de votantes para las próximas elecciones o a un inversionista le interesará saber qué grado de
riesgo corre su capital en la compra de determinadas acciones. Las matemáticas de las
probabilidades se relacionan, en sus orígenes, con los juegos de azar, por lo que no debe extrañar
que para el estudio de ella, se utilicen como ejemplos, resultados posibles en lanzamientos de
dados o monedas, en los posibles resultados de una jugada de ruleta, etc. Independientemente
de esas aplicaciones particulares, el estudio de probabilidades indica que existe incertidumbre
con respecto a la ocurrencia o no de un determinado evento. En muchas oportunidades puede
ser virtualmente imposible predecir cuál será el resultado de una determinada acción, pero es
posible anticipar cuál es el resultado que se espera de dicha acción.
Resumiendo, el estudio de esta unidad nos lleva a cuantificar cuan probable es la ocurrencia
de un determinado evento.
A continuación presentamos un problema en el que se requerirán los temas que
desarrollaremos en esta unidad:

PROBLEMA

La gerencia de una compañía de Seguros está preocupada por el número de unidades


automotrices que son robadas en la vía pública en una determinada ciudad.
A partir de ello, efectúa la consulta correspondiente a la sección de robos y hurtos de la
policía quién le reporta la siguiente información:
 La cuarta parte de los propietarios de automotores de esa comunidad deja las
llaves puestas en los automóviles al estacionarlos.
 Además y de acuerdo a estadísticas el 5% de los automóviles que, estacionados
tienen las llaves puestas, son robados de la vía pública,
 mientras que sólo el 1% de los automóviles que no tienen las llaves puestas son
robados.

46
www.capacitare.org.ar
ESTADÍSTICA
Indique Ud. la probabilidad de que un automóvil que ha sido robado en esa ciudad haya
tenido las llaves puestas.

PROBABILIDADES

DEFINICIÓN

Cuando un fenómeno puede presentarse de distintas maneras, la factibilidad


de ocurrencia de cada una de ellas se la define como probabilidad

Cada una de las distintas maneras en que puede presentarse el fenómeno se denomina
evento.
Cuando lanzamos un dado, éste puede presentarse de seis maneras distintas, refiriéndonos
al número que presenta su cara superior, cada una de ellas recibe el nombre de evento y la
designaremos con la letra E, así tendremos:
𝐸1 : que presente un As
𝐸2 : que presente un dos
𝐸3 : que presente un tres
𝐸4 : que presente un cuatro
𝐸5 : que presente un cinco o
𝐸6 : que se presente con un seis
La probabilidad de un evento es un número real comprendido entre 0 y 1
0 < 𝑃 (𝐸) < 1
Y puede representarse como un número decimal o como fracción.
Una probabilidad de valor cero indica la imposibilidad de ocurrencia, por el contrario una
probabilidad igual a 1 significa la certeza.
La probabilidad de que al lanzar una moneda se obtenga una cara o una cruz es
𝑃 (𝑐𝑎𝑟𝑎 𝑜 𝑐𝑟𝑢𝑧) = 1
así mismo en el lanzamiento de un dado, la probabilidad de obtener un siete es imposible, un
dado no puede tener siete caras:
𝑃(𝑥 = 7) = 0
EVENTOS: DEFINICIÓN Y CLASIFICACIÓN
Pero regresemos al lanzamiento de un dado perfectamente balanceado, podríamos
considerar también como evento, la aparición de un número par en la cara superior del dado, lo
que se daría en el caso de presentarse el 2, el 4 o el 6 y lo representaremos con la letra 𝐴, para
diferenciarlo de los anteriores.

FUNDACIÓN CAPACITARE 47
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA 𝐴: que salga un número par
O podríamos considerar también la aparición de un impar claro que en este caso, la condición
de obtener un número impar se satisface con la aparición del 1, del 3 o del 5, tres de los posibles
eventos en el lanzamiento del dado, vemos entonces que es necesario clasificar los eventos:

Simples
Eventos
Compuestos

Un evento se dice que es compuesto cuando está conformado por más de un evento simple,
de esta manera, también serían eventos compuestos:
𝐵: que se presente con un número mayor o igual a 4
𝐶: que sea par y mayor o igual a 4
𝐷: que sea un número par o mayor o igual a 4
Claro que también podríamos expresar al evento 𝐶 como aquel para el cuál debe cumplirse
conjuntamente 𝐴 y 𝐵
𝐶 = (𝐴 𝑦 𝐵)
De la misma manera:
𝐷 = (𝐴 𝑜 𝐵)
es decir 𝐷 se cumple cuando al menos uno de los dos 𝐴 o 𝐵 se cumple.
DETERMINACIÓN DE PROBABILIDADES
Se tiene tres planteos básicos para definir una probabilidad, éstas son:
a) Planteamiento clásico
b) Planteamiento basado en la frecuencia relativa
c) Planteamiento subjetivo
Cada una de ellas es aplicada según las circunstancias y es el Estadístico quien decide su
aplicabilidad. Analizaremos cada una de ellas
PLANTEAMIENTO CLÁSICO
Cuando un fenómeno puede presentarse de 𝑛 formas distintas, todas ellas igualmente
posibles, y de esas 𝑛 formas en 𝑐 de ellas lo hace con una determinada característica, entonces,
la probabilidad de que al presentarse el fenómeno lo haga con la característica en estudio está
dado por el cociente de 𝑐 sobre 𝑛
𝑐
𝑃=
𝑛
Si a 𝑐 se lo denomina como número de casos favorables y a 𝑛 como número de casos posibles
podríamos expresar la probabilidad clásica como:
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
𝑃=
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠

48
www.capacitare.org.ar
ESTADÍSTICA
Es necesario tener en cuenta que para que esta expresión sea correcta todas las formas en
que puede presentarse el fenómeno deben ser igualmente posibles.
Con este concepto la probabilidad de que al lanzar un dado presente la cara con un número
par será de:
3
𝑃(𝐴) =
6
3 son los casos favorables (2, 4 𝑦 6) y el número de casos posibles es 6.
Recordemos el evento 𝐶 debía cumplir con la condición de ser par y mayor o igual que 4, es
decir, debía cumplirse simultáneamente los eventos 𝐴 y 𝐵
𝑃 (𝐶) = 𝑃 (𝐴 𝑦 𝐵)
En este caso los eventos favorables son 𝐸4 y 𝐸6, cumplen con la condición de ser pares y
mayores o iguales a 4 por lo tanto aplicando el concepto de probabilidad clásica empírica
tendremos:
2
𝑃(𝐶) =
6
PLANTEAMIENTO EN BASE A LA FRECUENCIA RELATIVA.
Analicemos el lanzamiento de una moneda y descartemos la posibilidad de que, en un
lanzamiento la misma caiga de canto (en ese hipotético caso se dejaría rodar a la moneda hasta
su caída). Dos son los eventos simples en que puede presentarse el fenómeno, que se obtenga
una cara o una cruz. Luego la probabilidad de obtener una cara de acuerdo al planteamiento
clásico será:
1
𝑃(𝑐𝑎𝑟𝑎) = = 0,5
2
Por otra parte si en 10 lanzamientos se obtuvieron cuatro caras y seis cruces entonces la
frecuencia relativa de obtención de caras es:
4
𝑓𝑟(𝑐𝑎𝑟𝑎) = = 0,4
20

Si este valor lo representamos gráficamente en un sistema de ejes coordenados ortogonales


donde, en el eje de las abscisas llevamos el número de lanzamientos y en las ordenadas las
frecuencias relativas, tendremos un punto tal como lo entrega el diagrama.

FUNDACIÓN CAPACITARE 49
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA Gráfico 25

Si seguimos lanzando la moneda y cada 10 nuevos lanzamientos obtenemos la frecuencia


relativa de obtención de caras para el total de lanzamientos y lo vamos graficando obtendremos
el siguiente diagrama:
Gráfico 26

El diagrama indica que a medida que aumenta el número de lanzamientos la frecuencia


relativa de la obtención de cara se aproxima a 0,5, valor de la probabilidad entregada por la
expresión clásica, esto nos permite enunciar la Ley de los Grandes Números que dice:
Cuando un fenómeno se pone en evidencia de distintas maneras, la frecuencia relativa de
ocurrencia de cada una de ellas tiende a coincidir con su probabilidad de ocurrencia cuando el
número de veces que se presenta el fenómeno es lo suficientemente grande.
Es decir que en este caso se define como probabilidad a la frecuencia relativa observada de
un evento durante un gran número de intentos.
Veamos las características de este método mediante el siguiente ejemplo:

PROBLEMA

De acuerdo a las estadísticas llevadas a cabo por una Cía. de seguros, ésta informa que de
las personas del sexo masculino de 50 años, aproximadamente 65 de cada 100.000 mueren
durante el período de un año. De acuerdo al método de frecuencia relativa, la probabilidad
de que una persona asegurada del sexo masculino con una edad de 50 años, muera en el
término de un año es de
65
𝑃= = 0,00065
100.000

50
www.capacitare.org.ar
ESTADÍSTICA
Es necesario tener presente que el grado de bondad de la probabilidad calculada mediante
este método, depende del número de veces en que fuera evaluado el proceso y por tal motivo,
determinada la frecuencia relativa. La definición expresa que para que la probabilidad de
ocurrencia de un proceso coincida con su frecuencia relativa de ocurrencia, ésta debe estar
calculada sobre la presentación de un número suficientemente grande del fenómeno.
PROBABILIDAD SUBJETIVA
La probabilidad subjetiva queda librada al criterio de quién la determina en función de la
evidencia con que se cuente para la misma, ésta puede ser en base a la frecuencia relativa de
ocurrencia en eventos pasados o simplemente de acuerdo a sus supuestos. Este tipo de
probabilidad se da cuando los eventos se presentan un número reducido de veces.
Supóngase cumplir las funciones gerente de Recursos Humanos en una Empresa y debe elegir
un candidato de entre cuatro que presentan vitae similares, con iguales apariencias y niveles de
relación. El que Ud. elija a uno de ellos es haberle asignado una determinada probabilidad a la
potencialidad futura de ese hombre y considera ser superior a la asignada a los otros. En este
caso el hecho de no existir una frecuencia relativa del fenómeno no lo libera de la toma de
decisión. Es importante tener presente que, personas distintas frente a la misma situación
pueden asignar probabilidades subjetivas distintas.
REPRESENTACIÓN GRÁFICA
Retomemos el fenómeno correspondiente al lanzamiento de un dado. En muchas ocasiones
es conveniente operar probabilidades en forma gráfica, para ello nos valdremos del Diagrama de
Venn. Para la confección de este diagrama representamos mediante puntos cada uno de los
eventos simples en que puede presentarse el fenómeno, cada uno de ellos se denomina punto
muestral y el espacio conformado por todos los puntos muestrales se denominará espacio
muestral y se lo denota como (𝑆)
Para el caso que nos ocupa tendremos:
Gráfico 27

S 𝐸1 𝐸5

𝐸2
𝐸3
𝐸4 𝐸6

Cada uno de los puntos considerados corresponde a cada uno de los posibles eventos en que
puede presentarse el lanzamiento del dado.
Es necesario además asignarle a cada uno de los puntos muestrales un valor de probabilidad
pero teniendo en cuenta que el valor de probabilidad asignado debe cumplir con la condición de
ser mayor o igual a cero pero menor o igual a 1:
0 ≤ 𝑃(𝐸𝑖 ) ≤ 1

FUNDACIÓN CAPACITARE 51
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA donde 𝑖 varía entre 1 y 6, para este caso
Además debe cumplirse que, la suma de las probabilidades de todos los puntos muestrales
sea igual a 1
𝑖=6

∑ 𝑃(𝐸𝑖 ) = 1
𝑖=1

En el caso que nos ocupa, todas las caras tienen la misma probabilidad de ocurrencia, por lo
tanto la probabilidad que le asignaremos a cada punto muestral será de
1
𝑃 (𝐸𝑖 ) =
6
La probabilidad de que al lanzar el dado se obtenga un número par
𝐴: obtener un par
Este evento compuesto se cumple en el caso de obtener un dos, o un cuatro o un seis
Gráficamente tendremos:
Gráfico 28

𝐸1 𝐸5
S
𝐴
𝐸2
𝐸6
𝐸3
𝐸4

𝐴 se cumple si se cumple 𝐸2 o 𝐸4 o 𝐸62 , y por lo tanto queda verificado gráficamente


𝑃(𝐴) = 𝑃 (𝐸2 ) + 𝑃 (𝐸4 ) + 𝑃 (𝐸6 )
El evento compuesto 𝐴 es la unión de los eventos simples 𝐸2 , 𝐸4 y 𝐸6 , teniendo en cuenta el
valor de la probabilidad de ocurrencia asignada a cada una de ellos, tendremos
𝑃(𝐴) = 1/6 + 1/6 + 1/6 = 3/6
Veamos la probabilidad de obtener un número mayor o igual a 4 (recordemos que 𝐵 es un
número mayor o igual que 4.
𝐵 se cumple si se verifica 𝐸4 o 𝐸5 o 𝐸6 , también en este caso gráficamente verificamos que:
𝑃 (𝐵) = 𝑃 (𝐸4 ) + 𝑃 (𝐸5 ) + 𝑃 (𝐸6 )
Gráfico 29

𝐸1 𝐸3

𝐸2
𝐸2

𝐸4 𝐸6
𝐵

𝑃 (𝐵) = 1/6 + 1/6 + 1/6 = 3/6


52
www.capacitare.org.ar
ESTADÍSTICA
Analicemos ahora el evento 𝐶 que sea par y mayor o igual a 4, en este caso deben cumplirse
ambas condiciones simultáneamente
𝑃(𝐶) = 𝑃(𝐴 𝑦 𝐵)
En el gráfico observamos que la condición de ser par y mayor o igual 4 sólo lo cumplen los
eventos 𝐸4 y 𝐸6
Gráfico 30

𝐸1 𝐴
𝐸3
𝐸2
𝐵
𝐸4 𝐸6 𝐸5

Que corresponde justamente a la intersección de los eventos 𝐴 y 𝐵


𝑃(𝐶) = 𝑃(𝐴 ∧ 𝐵) = 2/6
Analicemos el evento 𝐷, obtener un número par o un número mayor o igual a 4,
𝑃(𝐷) = 𝑃(𝐴 𝑜 𝐵)
Gráfico 31

𝐸1
𝐴 𝐸3
𝐸2
𝐵
𝐸4 𝐸6 𝐸5

Gráficamente observamos que esta condición lo cumplen solo los eventos 𝐸2 , 𝐸4 , 𝐸5 y 𝐸6 ,


por lo tanto la probabilidad del evento compuesto D será:
𝑃 (𝐷) = 𝑃 (𝐸2 ) + 𝑃 (𝐸4 ) + 𝑃 (𝐸5 ) + 𝑃 (𝐸6 )
𝑃 (𝐷) = 4 / 6
En este caso no podemos aplicar la suma de las probabilidades de 𝐴 y 𝐵 porque tienen una
zona en común (recordemos que esa zona en común correspondía a (𝐴 𝑦 𝐵)) que la estaríamos
sumando dos veces, por lo que, a fin de obtener correctamente la probabilidad de 𝐷 tendríamos
que restársela:
𝑃(𝐴 𝑜 𝐵) = 𝑃(𝐴) + 𝑃 (𝐵)– 𝑃(𝐴 𝑦 𝐵)
𝑃(𝐴 𝑜 𝐵) = 3/6 + 3/6 – 2/6 = 4/6
conclusión a la que ya habíamos arribado gráficamente.

FUNDACIÓN CAPACITARE 53
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA Podemos deducir según lo visto que, gráficamente los eventos compuestos surgen de la unión
o intersección de eventos, sean estos simples o compuestos. La probabilidad de obtener un
número par 𝑃(𝐴) está dada por la unión de los eventos simples 𝐸2 , 𝐸4 y 𝐸6 , mientras que la
probabilidad de obtener un par o un número ≥ 4 está dada por la unión de los eventos
compuestos 𝐴 y 𝐵
REGLA ADITIVA
Tenemos ahora una expresión que nos entrega la probabilidad de la unión de eventos.
Expresión que toma el nombre de Regla Aditiva:
𝑃(𝐴 𝑜 𝐵) = 𝑃(𝐴) + 𝑃 (𝐵) – 𝑃(𝐴 𝑦 𝐵)
Sería conveniente determinar cuál es la expresión que nos determina la intersección de
eventos, para ello analicemos el siguiente caso:
¿Cuál es la probabilidad que habiendo obtenido en el lanzamiento del dado un número ≥ 4
éste sea par? A este tipo de probabilidad se denomina condicional y se la expresa como 𝑃(𝐴 / 𝐵)
Expresión que se lee como probabilidad de ocurrencia de 𝐴 según 𝐵.
Si la cara obtenida contiene un número mayor o igual a 4 tendrá que ser el 4 o el 5 o el 6,
solo tres casos posibles y de los cuales solo dos de ellos cumplen con la condición de ser par, por
lo tanto si nos ajustamos a la definición clásica de probabilidades:
𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 2
𝑃(𝐴 / 𝐵) = =
𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 3
Por otra parte, la condición que deben cumplir los casos favorables es la de ser mayor o igual
a 4 y además, deben cumplir con la condición de ser par, es decir, deben satisfacer
simultáneamente 𝐴 y 𝐵, mientras que los casos posibles estarán dados por los eventos simples
que constituyen a 𝐵, mayores o iguales a 4. Pudiendo expresarla como:
𝑃( 𝐴 ∩ 𝐵)
𝑃(𝐴⁄𝐵 ) =
𝑃(𝐵)
La expresión indica que: La probabilidad de ocurrencia de 𝐴 según 𝐵, está dada por el
cociente entre la probabilidad de ocurrencia conjunta de 𝐴 y 𝐵 sobre la probabilidad de 𝐵.
Si recordamos que
2
𝑃(𝐴 ∩ 𝐵) =
6
y
3
𝑃(𝐵) =
6
Reemplazando tendremos
2/6 2
𝑃(𝐴⁄𝐵 ) = =
3/6 3
Resultado al que habíamos arribado por razonamiento y aplicación de la definición clásica.

54
www.capacitare.org.ar
ESTADÍSTICA
REGLA MULTIPLICATIVA
La expresión anterior no solo nos entrega la probabilidad condicionada de ocurrencia de 𝐴
según 𝐵 sino que, nos permite obtener la expresión multiplicativa, si pasamos el denominador
del segundo miembro multiplicando al primero, e intercambiando los miembros:

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵) . 𝑃(𝐴⁄𝐵 )

De la misma manera arribaríamos a la expresión:

𝑃(𝐵 ∩ 𝐴) = 𝑃(𝐴) . 𝑃(𝐵⁄𝐴)

Debe tener en cuenta el alumno que:


𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵 ∩ 𝐴)
Si tenemos en cuenta que gráficamente los eventos compuestos están conformados por la
unión (suma) o intersección (producto) de eventos, las expresiones determinadas por la regla
aditiva y multiplicativa nos permitirán resolver las probabilidades de eventos compuestos.
Regla aditiva: 𝑃(𝐴 𝑜 𝐵) = 𝑃(𝐴) + 𝑃 (𝐵) – 𝑃(𝐴 𝑦 𝐵)
Regla multiplicativa: 𝑃(𝐴 𝑦 𝐵) = 𝑃(𝐴) . 𝑃(𝐵⁄𝐴) = 𝑃(𝐵) . 𝑃(𝐴⁄𝐵 )

FUNDACIÓN CAPACITARE 55
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA UNIDAD 6

RELACIÓN DE EVENTOS
Eventos complementarios
Eventos mutuamente excluyentes
Eventos independientes
Probabilidades marginales bajo dependencia estadística
RELACIÓN ENTRE EVENTOS
De acuerdo a lo estudiado, hemos visto que dos o más eventos pueden combinarse para dar
eventos compuestos y esos tipos de combinación estaban representados gráficamente por una
unión de eventos o por una intersección de ellos. Matemáticamente, la unión está dada por una
disyunción o, probabilidad de ocurrencia de por lo menos uno de ellos, esta probabilidad estaba
determinada por la regla aditiva, mientras que a la intersección le corresponde el conectivo lógico
y, es una conjunción e indica la ocurrencia simultanea de ambos eventos y su probabilidad
denominada probabilidad conjunta, esta probabilidad es satisfecha por la regla multiplicativa.
Independientemente del concepto precedente, el evento compuesto generado por la
relación entre los eventos 𝐴 y 𝐵 se la puede clasificar como:

Complementarios

Relación entre eventos Mutuamente excluyentes

Independientes

EVENTOS COMPLEMENTARIOS
Dos eventos 𝐴 y 𝐵 se denominan COMPLEMENTARIOS cuando la suma de sus probabilidades
es igual a 1:
𝑃(𝐴) + 𝑃 (𝐵) = 1
Si tenemos presente el espacio muestral en donde cada una de los eventos posee una
probabilidad y la suma de todas ellas es igual a 1, nos indica que dada el evento 𝐴, su
complemento estará constituido por todos los puntos muestrales de dicho espacio que no
pertenezcan a 𝐴 y se lo denomina como 𝐴̅ (todo lo que no es 𝐴 constituye su complemento)
Gráfico 32

𝑆
𝐵 𝐵 = 𝐴̅
𝐴

56
www.capacitare.org.ar
ESTADÍSTICA
EVENTOS MUTUAMENTE EXCLUYENTES
Se dice que dos eventos son mutuamente excluyentes cuando la ocurrencia de uno de ellos
implica la no ocurrencia del otro.
Gráfico 33

𝐴 𝐵

Gráficamente no presentarán ningún punto en común.


En el lanzamiento de un dado, la obtención de un cuatro es mutuamente excluyente con
cualquiera de las otras cinco opciones. Representado gráficamente en un diagrama de Venn.
Podemos decir que todos los eventos simples en que puede presentarse un fenómeno son
mutuamente excluyentes. Consideremos nuevamente el lanzamiento de un dado perfectamente
balanceado, seis son los eventos simples posibles, y todos ellos son mutuamente excluyentes, la
ocurrencia de uno de ellos implica automáticamente la no ocurrencia de los otros. Ninguno de
ellos tiene puntos en común Gráfico 34.
Gráfico 34

𝐸1 𝐸5

𝐸2
𝐸3
𝐸4 𝐸6

El no poder ocurrir simultáneamente implica que la probabilidad de ocurrencia simultánea


de ellos sea igual a cero.
𝑃 (𝐸1 ∩ 𝐸2 ) = 0
Al igual que
𝑃 (𝐸2 ∩ 𝐸5 ) = 0
Y en general dados dos eventos 𝐴 y 𝐵 si son mutuamente excluyentes debe cumplirse que
𝑃(𝐴 ∩ 𝐵) = 0
Por lo tanto en este caso, cuando los eventos son mutuamente excluyentes, la probabilidad
de ocurrencia de por lo menos uno de ellos será igual a la suma de sus probabilidades:
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)

FUNDACIÓN CAPACITARE 57
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA Acotación
Como conclusión podemos decir que dados dos eventos 𝐴 y 𝐵, si son complementarios
ambos eventos 𝐴 y 𝐵, este último = 𝐴̅ será exhaustivamente excluyentes ya que no es posible
obtener otro resultado para el fenómeno que no sea uno de ellos. Resumiendo, si dos eventos
son complementarios indefectiblemente son mutuamente excluyentes.
EVENTOS INDEPENDIENTES
Supongamos que lanzamos una moneda, la probabilidad de obtener una cara es de ½. Si
lanzamos otra moneda, la probabilidad de obtener una cara será también de ½.
¿Cuál es la probabilidad de que se obtenga una cara en la segunda moneda habiéndose
obtenido una cara en la primera? Consideramos que será también de ½, no existe relación alguna
entre el resultado de la primera y la probabilidad de ocurrencia de la segunda moneda,
tendríamos que afirmar:
𝑃(𝑐𝑎𝑟𝑎 2º/𝑐𝑎𝑟𝑎 1º) = 𝑃(𝑐𝑎𝑟𝑎 2º)
Que se lee, la probabilidad de que la segunda moneda se obtenga cara, habiéndose obtenido
cara en la primera moneda es igual a la probabilidad de obtener cara en la segunda moneda.
Decimos que los eventos son independientes.

DEFINICIÓN

Dos eventos se dicen que son independientes, cuando la ocurrencia de uno


de ellos no modifica la probabilidad de ocurrencia del otro

Y se expresa como:
𝑃(𝐴 / 𝐵) = 𝑃(𝐴)
La probabilidad que Juan apruebe Estadística es independiente de que Boca gane en el
próximo partido.
Si recordamos la regla multiplicativa:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵) . 𝑃(𝐴/𝐵)
Cuando los eventos son independientes
𝑃(𝐴/𝐵) = 𝑃(𝐴)
Por la tanto la expresión matemática de la probabilidad conjunta toma la forma de:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) . 𝑃(𝐵)
Lo que se expresa como:
Cuando dos eventos son independientes, la ocurrencia simultánea de ambos es igual al
producto de sus probabilidades

58
www.capacitare.org.ar
ESTADÍSTICA
En muchas oportunidades se le hace difícil al alumno definir cuando existe dependencia o
independencia de dos eventos. Supongamos que extraemos una carta de un mazo de cartas
españolas de un total de cuarenta y definimos:
𝐶1 = sacar una carta de espadas en una primera extracción y
𝐶2 = extraer una carta de espadas en la segunda extracción
La probabilidad de extraer una carta de espadas en la primera extracción será de
10 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
𝑃(𝐶1 ) =
40 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
Pero la probabilidad de extraer una espada en la segunda extracción queda supeditada a la
forma en que se realice el proceso, es decir, con reposición o sin reposición.
Si se realiza con reposición, luego de efectuar la primera extracción, la carta se coloca
nuevamente en el mazo y se mezcla, la probabilidad de extraer una carta de espadas será
nuevamente de
10
𝑃(𝐶2 ) =
40
Los eventos son independientes. Pero si el proceso se realiza sin reposición, la probabilidad
de extraer una espada en segundo término depende de la carta extraída en la primera
oportunidad (que sea o no una espada).
La probabilidad de extraer una espada en la segunda oportunidad no habiendo obtenido una
espada en la primera será de:
10
𝑃(𝑒𝑠𝑝𝑎𝑑𝑎 𝑒𝑛 2º /𝑛𝑜 𝑒𝑠𝑝𝑎𝑑𝑎 𝑒𝑛 1º) =
39
Mientras que la probabilidad de obtener una espada en la segunda oportunidad habiendo
obtenido una espada en la primera será:
9
𝑃(𝑒𝑠𝑝𝑎𝑑𝑎 𝑒𝑛 2º /𝑒𝑠𝑝𝑎𝑑𝑎 𝑒𝑛 1º) =
39
Aclaraciones
1. Se define como probabilidad marginal a la probabilidad simple correspondiente a un
evento. Si lanzamos una moneda que esté perfectamente balanceada, la probabilidad
de obtener una cara es de 0,5, esto es cierto para cualquier lanzamiento, no importa
cuántas veces se lance la moneda ni cuales fueron los resultados anteriores. Cada
nuevo lanzamiento es único e independiente de los resultados que se hubieren
obtenido en lanzamientos anteriores.
2. En el inicio del estudio de probabilidades se hace complejo definir claramente sucesos
mutuamente excluyentes y eventos independientes a estos efectos se tendrá muy en
cuenta la siguiente premisa.

FUNDACIÓN CAPACITARE 59
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA IMPORTANTE
Los sucesos mutuamente excluyentes deben ser dependientes, pero los
sucesos dependientes no tienen necesariamente que ser mutuamente
excluyentes

PROBABILIDADES MARGINALES BAJO DEPENDENCIA ESTADÍSTICA


La probabilidad marginal en condiciones de dependencia estadística se determina mediante
la suma de las probabilidades de todos los eventos conjuntos en los que se presenta el evento
sencillo.
Supongamos tener una caja con 10 bolillas que presentan las siguientes características:
Tres son rojas con puntos
Una es roja con franjas
Dos son grises con puntos
Cuatro son grises con franjas
La probabilidad de extraer una bola gris, estará dada por la suma de las probabilidades de
obtener una bola gris con puntos y una bola gris con franjas:
𝑃 (𝑔𝑟𝑖𝑠) = 𝑃 (𝑔𝑟𝑖𝑠 ∩ 𝑝𝑢𝑛𝑡𝑜𝑠) + 𝑃(𝑔𝑟𝑖𝑠 ∩ 𝑓𝑟𝑎𝑛𝑗𝑎𝑠)
Recordar que de manera general la 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) . 𝑃 (𝐵/𝐴) que se lee La probabilidad
de 𝐴 y 𝐵 es igual a la probabilidad de 𝐴 por la probabilidad de 𝐴 según 𝐵
En nuestro caso:
𝑃(𝑔𝑟𝑖𝑠 𝑦 𝑝𝑢𝑛𝑡𝑜𝑠) = 𝑃(𝑔𝑟𝑖𝑠) . 𝑃(𝑝𝑢𝑛𝑡𝑜𝑠/𝑠𝑒𝑔ú𝑛 𝑔𝑟𝑖𝑠) = 6/10 . 2/6 = 2/10
Además
𝑃(𝑔𝑟𝑖𝑠 𝑦 𝑓𝑟𝑎𝑛𝑗𝑎𝑠) = 𝑃(𝑔𝑟𝑖𝑠) . 𝑃(𝑓𝑟𝑎𝑛𝑗𝑎𝑠/𝑠𝑒𝑔ú𝑛 𝑔𝑟𝑖𝑠) = 6/10 ∗ 4/6 = 4/10
Por lo tanto la probabilidad de obtener una bolilla gris será:
𝑃(𝑔𝑟𝑖𝑠) = 𝑃(𝑔𝑟𝑖𝑠 𝑦 𝑝𝑢𝑛𝑡𝑜𝑠) + 𝑃(𝑔𝑟𝑖𝑠 𝑦 𝑓𝑟𝑎𝑛𝑗𝑎𝑠)
𝑃(𝑔𝑟𝑖𝑠) = 0,2 + 0,4 = 0,6
Analicemos la siguiente situación:
Un Club local con 400 socios los clasifica de acuerdo a su edad, en tres categorías, Infantiles,
Cadetes y Mayores. Además en cada categoría los clasifica de acuerdo a su sexo en Varones y
Mujeres según consta en la siguiente tabla:

SEXO INFANTILES CADETES MAYORES


Varones 150 100 30
Mujeres 70 30 20

Si se elige azarosamente la ficha de un socio indique Ud. la probabilidad que:


a) Corresponda a una mujer

60
www.capacitare.org.ar
ESTADÍSTICA
De acuerdo a la definición la probabilidad de mujer estará dada por la suma de las
probabilidades de los eventos conjuntos donde se presenta la mujer, es decir
Si designamos a mujer como 𝐹, a varón como 𝑉, infantiles como 𝐼, cadetes como 𝐶 y
mayores como 𝑀 podemos expresar:
𝑃(𝐹) = 𝑃(𝐹 ∩ 𝐼) + 𝑃(𝐹 ∩ 𝐶) + 𝑃(𝐹 ∩ 𝑀)
70 30 20 120
𝑃(𝐹) = + + =
400 400 400 400
Resultado al cual podríamos haber llegado rápidamente si completamos la tabla anterior con
una nueva fila y una columna más que contengan los totales:

SEXO INFANTILES CADETES MAYORES TOTALES


Varones 150 100 30 280
Mujeres 70 30 20 120
TOTALES 220 13 50 400

De esta manera la Probabilidad:


𝑃(𝐹) = 120/400
Suponga que quiere determinar la probabilidad de que elegida la ficha de un socio
azarosamente, le corresponda a un varón siendo que pertenecía a un infantil. Aplicando la
expresión general de probabilidades dependientes tendremos:
𝑃(𝑉 ∩ 𝐼)
𝑃(𝑉/𝐼) =
𝑃(𝐼)
Desarrollando las expresiones del numerador y del denominador tendremos:
𝑃(𝑉) . 𝑃(𝐼 ⁄𝑉 )
𝑃(𝑉 ⁄𝐼 ) =
𝑃(𝐼 ∩ 𝐹) + 𝑃(𝐼 ∩ 𝑉)
Desarrollando las probabilidades conjuntas del denominador tendríamos:
𝑃(𝑉) . 𝑃(𝐼 ⁄𝑉 )
𝑃(𝑉 ⁄𝐼 ) =
𝑃(𝐹) . 𝑃(𝐼 ⁄𝐹 ) + 𝑃(𝑉) . 𝑃(𝐼 ⁄𝑉 )
Expresión que se la conoce como Teorema de Bayes.
El teorema o Regla de Bayes en sí, trata la revisión de las estimaciones iniciales de la
probabilidad dada la evidencia de la muestra. En síntesis permite estudiar nueva información y
revisar nuestras anteriores estimaciones.
Para el caso que estamos tratando, aplicar Bayes nos entregaría:
220 150
𝑃(𝑉 ⁄𝐼 ) = 400 . 220
120 70 280 150
400 . 120 + 400 . 280

FUNDACIÓN CAPACITARE 61
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
ESTADÍSTICA Simplificando tendremos
150
𝑃(𝑉 ⁄𝐼 ) =
220
Claro que la tabla facilita la determinación de estas probabilidades condicionadas analizando
el problema de la siguiente manera:
La probabilidad de que corresponda a un varón, sabiendo que la ficha pertenece a un infantil,
circunscribe el espacio muestral solo al número de infantiles 220 que corresponderá al número
de casos factibles, por otro lado los casos favorables se dará por la cantidad de varones infantiles
que se tengan, en este caso 150, luego aplicando la expresión clásica de probabilidades
150
𝑃(𝑉 ⁄𝐼 ) =
220

Analicemos el siguiente problema


Una empresa metalúrgica produce pernos de pistón para un determinado tipo de motor. La
producción se efectúa con tres máquinas a las que designaremos como 𝑀1 , 𝑀2 y 𝑀3 . La máquina
𝑀1 Produce el 50% de los pernos mientras que la 𝑀2 el 30%, se sabe además que la máquina
𝑀1 produce un 4% de piezas defectuosas mientras que la 𝑀2 produce el 8% y de los pernos
producidos por la 𝑀3 el 10% presenta fallas
Si tomamos azarosamente un perno listo para embalar y el mismo está defectuoso, indique
Ud. cuál es la probabilidad de que lo haya producido la máquina 𝑀1 .
De acuerdo a lo solicitado por el enunciado nuestra incógnita es la Probabilidad de que un
perno lo hubiera producido 𝑀1 sabiendo que el mismo está defectuoso.
𝑃 (𝐷 ∩ 𝑀1 )
𝑃(𝑀1 ⁄𝐷) = (1)
𝑃(𝐷)
De acuerdo a los datos tenemos que la probabilidad de que un perno cualquiera lo produjera
cada una de las máquinas será:
𝑃 (𝑀1 ) = 0,5
𝑃 (𝑀2 ) = 0,3
𝑃 (𝑀3 ) = 0,2
Por otra parte conociendo los porcentajes de pernos defectuosos producidos por cada una
de las máquinas tendremos:
La probabilidad de que habiéndola producido 𝑀1 esté defectuoso
𝑃 (𝐷/𝑀1 ) = 0,04
De idéntica manera tendremos:
𝑃 (𝐷/𝑀2 ) = 0,08
y
𝑃 (𝐷/𝑀3 ) = 0,1

62
www.capacitare.org.ar
ESTADÍSTICA
Desarrollando la expresión (1) de acuerdo al teorema de Bayes tendremos:
𝑃(𝑀1 ) . 𝑃 (𝐷/𝑀1 )
𝑃(𝑀1 ⁄𝐷) =
𝑃 (𝐷 ∩ 𝑀1 ) + 𝑃 (𝐷 ∩ 𝑀2 ) + 𝑃 (𝐷 ∩ 𝑀3 )
Desarrollando el denominador:
𝑃(𝑀1 ) . 𝑃 (𝐷/𝑀1 )
𝑃(𝑀1 ⁄𝐷) =
𝑃(𝑀1 ) . 𝑃 (𝐷/𝑀1 ) + 𝑃(𝑀2 ) . 𝑃 (𝐷/𝑀2 ) + 𝑃(𝑀3 ) . 𝑃 (𝐷/𝑀3 )
Reemplazando valores tendremos:
0,5 . 0,04 0,02
𝑃(𝑀1 ⁄𝐷 ) = =
0,5 .0,04 + 0,3 . 0,08 + 0,2 . 0,1 0,02 + 0,024 + 0,02
La probabilidad que un perno, que se sabe está defectuoso, lo produjera 𝑀1 es igual a:
0,02
𝑃(𝑀1 ⁄𝐷) =
0,064
RESOLUCIÓN DEL PROBLEMA
Al inicio de la Unidad 5 se nos planteó el siguiente problema, el cual no podíamos resolver
por falta de herramientas, pero ahora estamos ya en condiciones de resolver.
“La cuarta parte de los propietarios de automotores de esa comunidad deja las llaves puestas
en los automóviles al estacionarlos. Además y de acuerdo a estadísticas el 5% de los automóviles
que estacionados tienen las llaves puestas son robados de la vía pública mientras que solo el 1%
de los automóviles que no tienen las llaves puestas son robados. Indique Ud. la probabilidad de
que un automóvil que ha sido robado en esa ciudad haya tenido las llaves puestas”
Si definimos como evento 𝐴, el dejar las llaves en el estacionamiento, 𝐵 el evento de no
dejarlas y 𝑅 que el automóvil fuera robado, entonces tendremos:
𝑃(𝐴) = 0,25
Por lo tanto la
𝑃(𝐵) = 0,75
Además la probabilidad de que un auto estacionado con las llaves puestas sea robado es de:
𝑃(𝑅/𝐴) = 0,05
y la probabilidad de que sea robado en caso de no tener las llaves puestas es:
𝑃(𝑅/𝐵) = 0,01
Lo solicitado en el problema es la probabilidad de que habiendo sido robado un automóvil,
éste tuviera las llaves puestas. Expresando esta probabilidad condicionada:
𝑃(𝐴 ∩ 𝑅)
𝑃(𝐴/𝑅) =
𝑃(𝑅)
Desarrollando esta expresión tendremos la Regla de Bayes:

FUNDACIÓN CAPACITARE 63
Castilla 336 (2804) Campana –  (03489) 423656 / 468374 –  consultas@capacitare.org.ar
𝑃(𝐴) . 𝑃 (𝑅/𝐴)
ESTADÍSTICA 𝑃(𝐴⁄𝑅 ) =
𝑃 (𝐴 ∩ 𝑅) + 𝑃 (𝐵 ∩ 𝑅)
Que desarrollando el denominador, también podemos expresar como:
𝑃(𝐴) . 𝑃 (𝑅/𝐴)
𝑃(𝐴⁄𝑅 ) =
𝑃(𝐴) . 𝑃 (𝑅/𝐴) + 𝑃(𝐵) . 𝑃 (𝑅/𝐵)
Reemplazando por valores:
0,25 . 0,05 0,0125 0,0125
𝑃(𝐴⁄𝑅 ) = = =
0,25 . 0,05 + 0,75 . 0,01 0,0125 + 0,0075 0,02

𝑃(𝐴/𝑅) = 0,6255

64
www.capacitare.org.ar

También podría gustarte