Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estamos muy contentos porque nos eligió y confió en nosotros para que lo acompañemos
en el camino que lo llevará a completar sus estudios secundarios.
Le damos la bienvenida. Y ahora le contamos brevemente de qué se trata este Módulo de
Informática I.
El módulo fue especialmente diseñado para el estudio autónomo. Está dividido en 4
unidades, para que Ud. administre sus tiempos de estudios y llegue a la instancia de la
evaluación final con el conocimiento y la confianza necesarios para superarla.
Es un material de educación a distancia porque usted está en su casa, nosotros en la
nuestra y nos encontraremos en las tutorías presenciales o a través de Internet en un espacio
común que llamaremos Escuela Virtual.
Es un apoyo al estudio. Usted estudia las unidades, resuelve las actividades allí propuestas,
confronta sus respuestas con las correcciones y en cuanto se le presente alguna duda, la
plantea, ya sea en los encuentros tutoriales o a través de la Escuela Virtual, y desde aquí le
respondemos su consulta.
Por tratarse de una modalidad de estudio autónomo le brindamos algunas pautas, para
ayudarlo en la organización de sus actividades académicas:
ra a los encuentros tutoriales habiendo realizado una lectura previa de la unidad a
tratarse de acuerdo al cronograma propuesto.
ealice las actividades de autoevaluación cuando el tutor lo indique y en caso de dudas
plantéelas en el próximo encuentro, o a través de la Escuela Virtual.
edíquele tiempo en su hogar al estudio de la asignatura. Haga del estudio un hábito,
estudie semanalmente, no espere al momento de la evaluación final para estudiar
todo el módulo.
Tenga en cuenta, a fin de fortalecer su aprendizaje, consultar la bibliografía complementaria
y los recursos didácticos propuestos. Los mismos se encuentran enumerados al final del
presente módulo.
Para ingresar al Aula Virtual ingrese a www.capacitare.org.ar, siguiendo los pasos
indicados en el Manual “Acceso al Aula Virtual” que se le entregó al inscribirse en la carrera.
Y así iniciamos el trabajo con este manual. Hágalo despacio, con respeto por el
conocimiento, con responsabilidad y con amor por el compromiso asumido que lo llevará a
cristalizar un paso más hacia su formación secundaria.
Recuerde que su tutor y todo el equipo directivo del “Instituto Capacitare” están a su
disposición, sólo tiene que concurrir a las tutorías o enviar un mensaje de correo electrónico.
Juntos conformamos un equipo cuyo objetivo es ayudarlo a sortear todas las dificultades
para que Ud. alcance el título de Bachiller. Usted de un lado, con sus sueños, ilusiones y
proyecto personal, y del otro nosotros con nuestro compromiso.
¡Adelante entonces! Un saludo afectuoso.
Equipo Docente y Directivo
Instituto Multimedia de Educación a Distancia
y Capacitación Laboral CAPACITARE
ESTADÍSTICA
ÍNDICE
UNIDAD 3: Diagramas
Diagrama de bastones
Diagrama de sectores
Histograma y Polígono de frecuencias
Histograma y Polígono de frecuencias relativas
Frecuencia acumulada
Relación entre media, mediana y moda
UNIDAD 5: Probabilidades
Probabilidades: Definición
Eventos: Definición y Clasificación
Determinación de probabilidades
Probabilidad subjetiva
Regla aditiva
Regla multiplicativa
FUNDACIÓN CAPACITARE 1
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA UNIDAD 1
ESTADÍSTICA: DEFINICIÓN
Estadística: Definición
Población
Muestra
Valores estadísticos
Variable, Datos
ESTADISTICA: DEFINICIÓN
DEFINICIÓN
Es el conjunto de métodos y técnicas que permiten determinar, de una
muestra debidamente representativa de una población, los valores
estadísticos, a fin de poder inferir sobre los parámetros poblacionales con
un cierto grado de bondad
DEFINICIÓN
2
www.capacitare.org.ar
ESTADÍSTICA
perfume. Si se pretendiere realizar un estudio sobre la calidad de los tomates producidos en las
quintas de los alrededores de la ciudad, entonces todas las quintas con producción de tomates
próxima a la ciudad de Córdoba se constituirán en la población.
Pudiere ser de importancia para un nuevo gobierno provincial prever el comportamiento de
los contribuyentes a las obligaciones impositivas, en caso de reducir el monto de los impuestos,
en este caso la población estará constituida por todos los contribuyentes
A fin de poder tomar las medidas más adecuadas será necesario contar con la mayor
información posible, si los datos informativos con los que contamos provienen del estudio de
toda la población, no sería necesario realizar ninguna inferencia, decimos que se ha efectuado
un censo de la población. Pero en ese caso dicha mayor exactitud va acompañada por un mayor
costo y tiempo que evidentemente encarece el proceso. Es decir, los resultados que puede
entregarnos un censo tienen el carácter de ser exactos, pero los costos que determinan los
mismos pueden no justificar dicha exactitud cuándo, con muestras debidamente seleccionadas
se determinan esos valores con un cierto grado de error que se puede regular y que más adelante
veremos.
Por otra parte en algunas situaciones particulares el censo se presenta impracticable o puede
no ser conveniente. Piense el lector que si el estudio se refiriere al comportamiento de las abejas
en un colmenar, la población tendría el carácter de infinita y por lo tanto sería imposible censarla.
Supongamos que se desata una epidemia en la población y debemos analizar la respuesta a
un cierto medicamento. Pretender estudiar la respuesta de toda la población a la nueva droga
llevaría un tiempo enorme tal que al cumplirse tal vez no tendría sentido la aplicación del
medicamento.
Una Empresa automotriz recibe de una Autopartista una partida de 500 pernos de pistón,
Recepción debe decidir su aceptación. Dentro de los ensayos a realizar sobre las piezas, además
de dimensiones y dureza se debe efectuar un ensayo de tracción para el cual sería necesario
destruir la pieza, en este caso sería entonces imposible ensayar todas ellas. Por otro lado, si el
verificar las dimensiones constituyere otro ensayo a realizar, genera en la cantidad de pernos
verificados un efecto particular sobre el operario que lo realiza, lo cual lo lleva a cometer errores,
en algunos casos superiores a los que se cometerían efectuando un muestreo. Tendríamos
también que tener en cuenta el costo de mano de obra que representa la verificación de esos
elementos.
Esto que hemos expresado nos lleva a la necesidad de poder tomar decisiones en base a las
inferencias que sobre una población podemos hacer de resultas del análisis y estudio de una
muestra de la misma.
FUNDACIÓN CAPACITARE 3
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA MUESTRA
De acuerdo a lo visto en el ítem anterior, estudiar el comportamiento de una población a
través de un censo, se torna en la mayoría de los casos impracticable, es por esa razón que el
análisis se efectúa por medio de una muestra que esté constituida por una parte de todos los
valores poblacionales.
DEFINICIÓN
Cada uno de los elementos que forman parte de la muestra se denominan observación.
MUESTRA DEBIDAMENTE REPRESENTATIVA
Si bien es cierto que una muestra está constituida por elementos pertenecientes a la
población, tendremos que comprender que no todo subconjunto de la población se constituye
en una muestra debidamente representativa. Vale tal vez recordar que en 1936 en vísperas a las
elecciones presidenciales de EE.UU., la encuestadora LITERARY DIGEST pronosticó el triunfo del
candidato Republicano con un apreciable margen por sobre su opositor Roosevelt. El pronóstico
se basaba sobre los resultados de una encuesta hecha sobre una muestra de dos millones de
habitantes. No obstante el triunfo fue del candidato demócrata y el error en la inferencia se debía
a que los encuestados fueron seleccionados entre los poseedores de automóviles y abonados
telefónicos. En esos momentos los que estaban mejor posicionados para poseer automóvil y
líneas telefónicas correspondían a la clase media y alta, en su mayoría con tendencias
republicanas, pero el triunfó quedó en manos de Roosevelt apoyados por la masa poblacional de
menores recursos.
DEFINICIÓN
Una muestra se dice que es debidamente representativa de una población
cuando presenta sus mismas características
Presentar las mismas características que la población implica que, si el 20% de la población
cumple con una determinada propiedad, se espera que el 20% de la muestra cumpla con esa
misma propiedad.
Esto permite disminuir los errores que se cometen cuando se efectúa la inferencia de los
parámetros poblacionales a partir de los valores determinados en la muestra.
VALORES ESTADÍSTICOS
El estudio realizado sobre una muestra nos permite determinar valores cuyas características
nos referiremos más adelante y a los cuales se los denomina estimadores pudiendo también
tomar el nombre de valores estadísticos, mediante los cuales se podrá efectuar una correcta
estimación sobre los valores de la población.
Por otra parte, los valores propios de la población toman el nombre de Parámetros.
4
www.capacitare.org.ar
ESTADÍSTICA
Si se pretendiere determinar el salario de los empleados metalúrgicos del País, tomaríamos
una muestra constituida por operarios de distintas empresas y distintas provincias y siempre
proporcional al número de operarios de cada lugar, el salario promedio obtenido en la muestra
se denomina estadístico, mientras que el salario promedio de toda la población obrera
metalúrgica se constituye en parámetro
PARÁMETROS
DEFINICIÓN
Los valores en estudio, que en la muestra toman el nombre de Estadísticos,
en la población se los denominan Parámetros
DEFINICIÓN
Se define como bondad al margen de seguridad con que se realiza la
inferencia de acuerdo a los estudios realizados sobre la o las muestras
Aseverar que tal político ganará las próximas elecciones presidenciales no tiene peso como
información si no se lo acompaña con un grado de seguridad. Indicar que las encuestas los dan
ganador por tal cantidad de puntos, solo es tomado en cuenta cuando se acompaña esa
información con una determinada seguridad.
VARIABLE, DATOS
Debemos tener en cuenta que la Estadística basa su aplicación en el estudio y análisis de
números los que se denominan Datos. Si dichos datos son obtenidos a través de una muestra, se
los llama observaciones, las que deben responder a una determinada característica que es la que
tenemos en estudio, puede ser la producción avícola en la provincia, la inversión de dinero en
publicidad en los distintos medios durante el año 1998, o a la cantidad de precipitaciones en el
sur de la provincia, la concurrencia a un Centro Comercial, las temperaturas máximas diarias
durante el mes de marzo en una determinada localidad, el número de alumnos ingresados en
cada una de las Universidades de la provincia de Córdoba en el corriente año, cada una de estas
toma el nombre de Variable. En definitiva cada vez que nos aboquemos a un estudio estadístico
debemos de tener en cuenta que dicho estudio corresponde a una Variable, y que de ésta se
tendrán Datos y los que corresponden a Observaciones realizadas. Mediante la aplicación de
métodos y técnicas estadísticas se estudian estas observaciones y se determinan los estadísticos.
TIPO DE VARIABLE
En una fábrica de automotores puede considerarse necesario determinar el número de
automóviles de cada modelo producidos durante el último trimestre, a fin de poder compararlo
con las unidades producidas durante el mismo período del año anterior y poder prever la
producción para los futuras períodos. Al Ministerio de Agricultura y Ganadería, le será
FUNDACIÓN CAPACITARE 5
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA imprescindible definir la cantidad de hectáreas sembradas de maíz en todo el País y en
condiciones de ser levantadas en la próxima cosecha. En la localidad de Embalse de Río Tercero,
se tienen piletas en donde se efectúa la cría de pejerreyes y por lo tanto le será de suma
importancia definir, para cada período del proceso el tamaño promedio de los peces. Para una
planta generadora de energía eléctrica, le es necesario determinar los picos de consumo de
energía durante el día y el consumo durante las diferentes épocas del año. Puede ser deseable
para la Secretaría de Cultura de la Municipalidad de la ciudad de Córdoba, definir el grado de
calidad que poseen los Artistas Plásticos, para lo cual será necesario valorizar las obras de cada
uno de ellos. Observará el lector que el tipo de dato de cada una de las incógnitas en estudio
puede tener características diferentes. En el estudio de la producción de automóviles, la cantidad
de unidades producidas es un número entero definido, no es así en el caso de querer determinar
la longitud de los peces que se crían en Embalse, ya que la exactitud de la misma dependerá del
instrumento con que se realice el proceso. En el caso de pretender determinar el grado de calidad
de los maestros plásticos de Córdoba, no hay la menor duda en que, la definición de la misma
dependerá del criterio experiencia y capacidad de quien realice la valorización de cada obra. Es
decir será necesario efectuar una clasificación de los tipos de datos:
Discretos
Cuantitativos
Continuos
Tipos de Datos
Nominales
Cualitativos
Jerarquizados
DISCRETOS
Se dice que un valor es discreto cuando es el resultado de un conteo.
Número de televisores por hogar
Cantidad de alumnos aprobados o reprobados en una evaluación
Número de habitantes por médicos en una localidad; etc.
Tómense éstos como modelos de datos discretos.
CONTINUOS
Se dice que una variable es del tipo continuo cuando asume valores dentro de un intervalo
de números reales.
Las alturas de los alumnos de un curso
La longitud de peces en un lago
El volumen de precipitaciones anuales etc.
Es decir en definitiva, cuando el valor del dato u observación se mide en un intervalo, decimos
que es del tipo continuo.
6
www.capacitare.org.ar
ESTADÍSTICA
NOMINALES
Cuando los valores que adopta la variable en estudio puede ser clasificada de acuerdo a
categorías, tal como lo sería el responder a una encuesta efectuada al personal de una Empresa
automotriz y en la cual se plantea la situación de cada uno en cuanto a su estado civil. Sabemos
que en este caso se tendrían las categorías de:
Soltero casado viudo divorciado
O el caso de realizar un estudio en un club social, en donde nos encontraremos con que sus
asociados se encuentran categorizados por edad según:
Infantiles cadetes mayores
En estos casos en donde los datos se pueden agrupar por categorías es necesario introducir,
a fin de poder realizar su estudio, una cierta codificación. De cualquier manera no se podrán
hacer estudios matemáticos entre categorías.
JERARQUIZADOS
Este tipo de dato se presenta cuando es necesario otorgarle a la variable una cierta jerarquía
de orden. Supongamos tener que estudiar el grado de calidad de las obras expuestas por un
cierto número de plásticos de Córdoba a fin de asignar los correspondientes premios. A tal efecto
será necesario acudir al juicio de un perito que permita definir el grado de categoría de cada uno
de los participantes, esto implica que en el proceso de jerarquizar las obras de cada uno influirá
el criterio de quién realiza el estudio, tal vez de ser otro el que efectúe el análisis pudiere
modificar dicho orden. Como conclusión entonces no podrá en este tipo de variable asegurar la
exactitud del cálculo.
FUNDACIÓN CAPACITARE 7
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA UNIDAD 2
VALORES ESTADÍSTICOS
Serie simple
Media
Mediana
Moda
Frecuencia
VALORES ESTADÍSTICOS
Al definir los objetivos de la Estadística, expresábamos la necesidad de poder inferir sobre las
características de la población, a través del análisis y estudio de la muestra. Todos los valores que
se determinan en la muestra se denominan estadísticos, mientras que los valores propios de la
población se denominan parámetros. Además los valores estadísticos se pueden clasificar de
acuerdo a sus características de la siguiente manera:
Media
De tendencia
Mediana
central o posición
Moda
Rango
Valores estadísticos
Desvío medio
De dispersión Varianza
Desviación estándar
Coeficiente de variación
SERIE SIMPLE
A los efectos de preparar un Congreso Internacional en una zona del Sur del País, se ha
solicitado el registro de las temperaturas mínimas de los últimos once días del mes de julio del
año anterior, obteniendo como respuesta los siguientes datos:
-2 0 1 -1 -3 -1 -2 -2 1 0 -2
La primera operación a realizar para el estudio de esa muestra es la de ordenar las
observaciones de menor a mayor.
El conjunto de observaciones ordenadas de menor a mayor se denomina Serie Simple.
-3 -2 -2 -2 -2 -1 -1 0 0 1 1
8
www.capacitare.org.ar
ESTADÍSTICA
En este caso, la variable en estudio está dada por las temperaturas y cada una de las
observaciones corresponderá a un nuevo valor adoptado por la incógnita.
𝑥 = temperatura
𝑛 = número de observaciones = 11
La Serie simple se puede expresar como:
𝑥1 𝑥2 𝑥3 𝑥4 . . . . . . . . . . . . . . . . . . . . . . . . . . . 𝑥𝑛
donde:
𝑥1 = −3 𝑦 𝑥𝑛 = 1
Con todos los valores que adopta la variable en estudio se genera una distribución,
denominada Distribución de la Variable en estudio.
MEDIA
DEFINICIÓN
Se define como media aritmética o promedio de una distribución al cociente
entre la suma de todas las observaciones dividido el número total de ellas
∑ 𝑥𝑖
𝑥̅ = 𝑖
FUNDACIÓN CAPACITARE 9
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA El siguiente diagrama representa la analogía entre la media poblacional para una población y
la media muestral para una muestra:
Población
𝜇 Muestra
Tamaño 𝑁
𝑥̅
Tamaño 𝑛
En nuestro caso:
−3 + (−2) + (−2) + (−2) + (−2) + (−1) + (−1) + 0 + 0 + 1 + 1
𝑥̅ =
11
Dentro de los valores estadísticos de posición central la media es el de mayor
representatividad, pero debemos tener presente que a su vez es el más sensible a los valores
extremos de la distribución
Los valores extremos de la distribución pueden influir en el valor de la media y de esa manera
hacerle perder su condición de referente, tenga Ud. en cuenta el siguiente ejemplo:
EJEMPLO
En una Empresa con 9 operarios que ganan cada uno de ellos la cantidad de $1000
mensuales, y con un Gerente general cuyo sueldo es de $10.000, el sueldo promedio para esa
distribución será:
1000 + 1000 + 1000 + ⋯ + 10000 19000
𝜇= =
10 10
𝜇 = $1900
Esto estaría indicando que el sueldo promedio de los empleados de la empresa es de
$1900, cifra ésta que de ninguna manera representa la realidad.
RECORDAR
MEDIA Cantidad de elementos
Población 𝜇 𝑁
Muestra 𝑥 𝑛
10
www.capacitare.org.ar
ESTADÍSTICA
MEDIANA
DEFINICIÓN
Se define como Mediana de una distribución, al valor que ocupa el punto
medio de la distribución
Ocupar el punto medio de la distribución implica que la mediana deja a la izquierda la misma
cantidad de valores que a la derecha. Todos los valores que se encuentran a la izquierda son
menores o eventualmente iguales a él, mientras que los valores que se ubican a la derecha serán
mayores o eventualmente iguales a él.
Continuando con el ejemplo referido a las temperaturas en una localidad del Sur:
−3 −2 −2 −2 −2 −1 −1 0 0 1 1
𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8 𝑥9 𝑥10 𝑥11
𝑀𝑒 = 𝑥6 = −1
Teniendo presente que el número de observaciones 𝑛 = 11 el valor que ocupa el lugar
central de la distribución corresponderá a 𝑥6 y por lo tanto la mediana toma el valor de −1.
Cuando el número de componentes de la distribución es impar, la mediana está
perfectamente definida, pero para el caso de que n sea par, no se tiene un único valor central,
en este caso la mediana estará dada por el promedio de los dos valores centrales. Suponiendo
que se le quitara el último valor a la distribución de temperaturas que estamos analizando, el
número de observaciones 𝑛 = 10 y los dos valores centrales serían 𝑥5 y 𝑥6 .
−3 −2 −2 −2 −2 −1 −1 0 0 1
𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8 𝑥9 𝑥10
FUNDACIÓN CAPACITARE 11
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA Podemos generalizar el valor de la mediana para una distribución de 𝑛 valores teniendo en
cuenta que el número de observaciones sea par o impar:
Si 𝑛 es impar
𝑀𝑒 = 𝑥𝑖
donde 𝑖 = (𝑛 + 1)/2
Mediana
Si 𝑛 es par
𝑥(𝑛⁄2) + 𝑥(𝑛⁄2+1)
𝑀𝑒 =
2
DEFINICIÓN
Se define como Moda de una distribución al valor que más veces se repite
En nuestro caso −2 se repite en cuatro oportunidades y por lo tanto éste valor se constituye
en moda de la distribución.
𝑀𝑜 = −2
12
www.capacitare.org.ar
ESTADÍSTICA
Con respecto a este valor es necesario aclarar que si en una distribución se tiene más de un
valor con el mismo máximo de repeticiones, cada uno de ellos se constituirá en una nueva moda,
es decir que una distribución puede tener más de una moda. En caso de tener dos modas se la
denomina bimodal y en caso de tres trimodal, etc.
Así mismo si se presentare el caso en que todos los valores de la distribución tienen el mismo
número de repeticiones, diremos que dicha distribución no tiene moda.
FRECUENCIA
DEFINICIÓN
Dada una distribución se define como Frecuencia de un valor, al número de
veces que el mismo se repite
EJEMPLO
∑𝑓 = 0
Tenga en cuenta que la suma de todas las frecuencias es igual al número total de
observaciones.
DISTRIBUCIÓN DE FRECUENCIA
En la mayoría de los casos nos encontraremos con una cantidad de observaciones 𝑛 que
superan los 20, por lo tanto pretender operar con una serie simple se tornaría engorroso, en
estos casos será conveniente seleccionar los valores de acuerdo a una determinada clase y
determinar de cada una de ellas su frecuencia, de allí que es común encontrar a este tipo de
distribución como Distribución de intervalos, a los efectos de facilitar el aprendizaje del alumno
subdividiremos este tipo de distribución en dos grupos:
1) cuando la amplitud de intervalo es igual a 1
2) cuando la amplitud del intervalo de clase toma un valor mayor a 1
FUNDACIÓN CAPACITARE 13
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA CASO A ANALIZAR
Supongamos tener que estudiar el número de accidentes que se producen en una playa de
estacionamiento durante los últimos 50 días. Los datos relevados son los siguientes
5 6 4 4 4 3 2 7 5 4 4 1
0 4 2 1 3 2 2 0 1 4 4 7
4 3 2 1 4 2 5 4 3 5 6 7
4 4 5 2 3 6 4 3 1 3 4 4
5 6
Es observable que trabajar con todos los valores como lo presenta la serie simple sería por
demás engorroso si no se dispusiera de una computadora, pero si clasificamos los valores, en
este caso de acuerdo a su valor numérico y para cada uno de ellos determinamos su frecuencia,
podríamos confeccionar una tabla de las siguientes características:
Tabla 1
Clase 𝑥𝑖 𝑓𝑖
1 0 2
2 1 5
3 2 7
4 3 8
5 4 16
6 5 5
7 6 4
8 7 3
∑ 𝑓𝑖 = 𝑖 50
∑(𝑥𝑖 . 𝑓𝑖 )
𝑖
𝑥̅ =
8
∑ 𝑓𝑖
𝑖
14
www.capacitare.org.ar
ESTADÍSTICA
Tabla 2
Clase 𝑥𝑖 𝑓𝑖 𝑥𝑖 . 𝑓𝑖
1 0 2 0
2 1 5 5
3 2 7 14
4 3 8 24
5 4 16 64
6 5 5 25
7 6 4 24
8 7 3 21
50 177
∑(𝑥𝑖 . 𝑓𝑖 )
𝑖 177
𝑥̅ = = = 3,54
50
𝑛
DEFINICIÓN
Se define como frecuencia relativa de un valor y se expresa como 𝑓𝑟i, al
cociente entre su frecuencia y la suma de todas las frecuencias (la suma de
todas las frecuencias es igual al número de elementos de la distribución)
𝑓𝑖
𝑓𝑟𝑖 =
∑ 𝑓𝑖
Como ∑ 𝑓𝑖 = 𝑛, también se puede expresar
𝑓𝑖
𝑓𝑟𝑖 =
𝑛
Podemos ampliar la tabla de frecuencias con una nueva columna que contenga la 𝑓𝑟 de cada
clase:
FUNDACIÓN CAPACITARE 15
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA Tabla 3
Clase 𝑥𝑖 𝑓𝑖 𝑥𝑖 . 𝑓𝑖 𝑓𝑟𝑖
1 0 2 0 0,04
2 1 5 5 0,1
3 2 7 14 0,14
4 3 8 24 0,16
5 4 16 64 0,32
6 5 5 25 0,1
7 6 4 24 0,08
8 7 3 21 0,06
50 177 1
PROPIEDAD
Tener en cuenta:
El concepto de frecuencia relativa, la media de una distribución poblacional también se puede
expresar como:
∑(𝑥𝑖 . 𝑓𝑖 )
𝜇= = ∑(𝑥𝑖 . 𝑓𝑖 / ∑ 𝑓𝑖 )
∑ 𝑓𝑖
𝜇 = ∑(𝑥𝑖 . 𝑓𝑖 )
FRECUENCIA ACUMULADA
Se define como frecuencia acumulada de una clase (por ejemplo 𝑖) y se la denota como 𝑓𝑎𝑖 ,
a la suma de su frecuencia y la suma de las frecuencias de los valores que le anteceden.
DEFINICIÓN
Se define como frecuencia acumulada de una clase (por ejemplo 𝑖) y se la
denota como 𝑓𝑎𝑖, a la suma de su frecuencia y la suma de las frecuencias de
los valores que le anteceden
16
www.capacitare.org.ar
ESTADÍSTICA
Analicemos la Tabla 3 de la tratada anteriormente, (correspondía al número de accidentes
que se produjeron durante los últimos 50 días en una playa de estacionamiento), teniendo en
cuenta la definición de frecuencia acumulada tendremos:
Tabla 4
Clase 𝑥𝑖 𝑓𝑖 𝑥𝑖 . 𝑓𝑖 𝑓𝑟𝑖 𝑓𝑎𝑖
1 0 2 0 0,04 2
2 1 5 5 0,1 7
3 2 7 14 0,14 14
4 3 8 24 0,16 22
5 4 16 64 0,32 38
6 5 5 25 0,1 43
7 6 4 24 0,08 47
8 7 3 21 0,06 50
50 177 1
FUNDACIÓN CAPACITARE 17
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA FRECUENCIA DESACUMULADA
DEFINICIÓN
Se define como frecuencia desacumulada de un valor, 𝑓𝑑𝑠 de una
distribución, a la diferencia entre el número total de observaciones y su
frecuencia acumulada
18
www.capacitare.org.ar
ESTADÍSTICA
DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS NOMINALES
Consideremos las ventas de los distintos tipos de sabor de gaseosas realizadas en el Bar de
una Universidad durante un día de concurrencia normal del alumnado.
Colas 55
Naranja 63
Limón 72
Tónicas 44
Agua con gas 15
Agua sin gas 18
Jugos 33
En este caso no tiene sentido determinar el valor de la media de la distribución, téngase en
cuenta que las clases están dadas por los distintos tipos de bebidas, luego tiene sentido decir que
la más vendidas son las bebidas de limón, siguiéndole en importancia las de naranja, es decir el
valor de tendencia central que utilizaremos en casos como estos le corresponde a la Moda. Sí
sería conveniente generar una tabla de frecuencias y determinar los porcentajes de cada uno de
los sabores.
Tabla 6
𝑥𝑖 𝑓𝑖 𝑓𝑟𝑖 𝑓𝑖 %
Jugos 33 0,11 11
Naranjas 63 0,21 21
Limón 72 0,24 24
∑ 𝑓𝑖 = 300 ∑ 𝑓𝑖 % = 100
FUNDACIÓN CAPACITARE 19
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA UNIDAD 3
DIAGRAMAS
Diagrama de bastones
Diagrama de sectores
Histograma y Polígono de frecuencias
Histograma y Polígono de frecuencias relativas
Frecuencia acumulada
Relación entre media, mediana y moda
DIAGRAMAS
El poder graficar los valores estadísticos nos permite realizar una lectura rápida de la
distribución y sacar conclusiones inmediatas de la misma.
Sería suficiente abrir una hoja de cálculo para observar la cantidad variada de gráficos con
que puede ser representada una distribución: Diagramas de: Líneas, Barras, Barras acumuladas,
de Sectores o circular, Diagramas x-y, de Bastones, etc. En este texto haremos referencia a los
diagramas: Circular, de Bastones e Histogramas y a una combinación de los gráficos de Bastones,
Barras y x-y Dispersión.
EJEMPLO
Supongamos tener para analizar las notas obtenidas por 20 alumnos de una división en la
asignatura de Estadística:
9 7 6 6 6 5 3 4 5 5 8 7 8 7 7 6 5 6 4 10
Generaremos una distribución de frecuencias complementándola con: Frecuencias
relativas, Frecuencia acumulada y por último Frecuencia desacumulada.
Tabla 7
𝑥𝑖 𝑓𝑖 𝑓𝑟𝑖 𝑓𝑎𝑖 𝑓𝑑𝑠
3 1 0,05 1 19
4 2 0,1 3 17
5 4 0,2 7 13
6 5 0,25 12 8
7 4 0,2 16 4
8 2 0,1 18 2
9 1 0,05 19 1
10 1 0,05 20 0
20 1
Toda vez que se presenta una tabla tal como la Tabla 7, la primera pregunta que surge es,
“que se debe graficar” debe de tenerse siempre en cuenta que cada vez que se habla de graficar
estamos deseando volcar en forma gráfica una cierta relación. En la presente situación, la
variable en estudio es la calificación, por lo cual se podría graficar la relación:
20
www.capacitare.org.ar
ESTADÍSTICA
Calificación y frecuencia
Calificación y frecuencia relativa
Calificación y frecuencia acumulada
Calificación y frecuencia desacumulada
DIAGRAMA DE BASTONES
Llevaremos en el eje de las abscisas las calificaciones y en el eje de las ordenadas las
frecuencias y representamos mediante un segmento centrado en cada una de las calificaciones
su correspondiente frecuencia; tendremos nuestro primer diagrama. Cada uno de los bastones
corresponde a la frecuencia de cada calificación y toma el nombre de densidad de frecuencia
entendiéndose como tal al cociente:
𝑓𝑖
𝑑𝑓 =
∆𝑥
es decir frecuencia por unidad de intervalo de clase
Gráfico 1
DIAGRAMA DE BASTONES
6
5
Frecuencia
0
3 4 5 6 7 8 9 10
Calificaciones
DIAGRAMA DE SECTORES
Para este gráfico debemos tener presente que el ángulo central del círculo es de 360º y que
cada una de las clases estará dada por un sector cuyo ángulo será proporcional a su frecuencia:
Supongamos la calificación de 3 cuya frecuencia es 1 tendremos que:
20 (suma de todas las frecuencias) ------------------------ 360º
a 1 (frecuencia del 3) ----------------------- 𝛼1 = 360º. 1 / 20 = 18º
Analicemos la calificación del 4 cuya frecuencia es 2:
20 (suma de todas las frecuencias) ------------------------ 360º
a 2 (frecuencia del 4) ----------------------- 𝛼1 = 360º. 2 / 20 = 36º
FUNDACIÓN CAPACITARE 21
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA Repitamos el procedimiento para el 5 el cual tiene frecuencia 4
20 (suma de todas las frecuencias) ------------------------ 360º
a 4 (frecuencia del 5) ----------------------- 𝛼1 = 360º. 4 / 20 = 72º
Debe tenerse en cuenta que en todos los casos la operación que nos permite determinar el
ángulo de cada sector está dado por el producto entre 360º y el cociente de la frecuencia de la
calificación en estudio y la suma de todas las frecuencias (𝑁), cociente éste que según ya vimos
corresponde a la frecuencia relativa (𝑓𝑟𝑖 = 𝑓 / 𝑁), es decir que el ángulo correspondiente a un
determinado sector está dado por el producto entre 360º y su frecuencia relativa:
𝛼𝑖 = 360º. 𝑓𝑟𝑖
Gráfico 2
DIAGRAMA DE SECTORES
10 3
9
4
En realidad es más interesante plantear este mismo diagrama pero expresado en porcentajes,
para lo cual el análisis es muy similar al anterior. Al total de observaciones, 20 en este caso, le
corresponderá el 100% y por lo tanto para cualquiera de las observaciones con frecuencia 𝑓𝑖 le
corresponde será:
Si a 20 ------------------------ 100%
𝑓𝑖 ------------------------------- %𝑖 = 100 . 𝑓𝑖 / 20
Nuevamente nos encontramos
DIAGRAMA DE SECTORES
con que el porcentaje
correspondiente a cada una de las
CALIFICACIONES EN PORCENTAJES
10 3
9
calificaciones estará dado por el 5% 5% 4
5%
10%
producto entre 100 y la frecuencia 8
10%
relativa correspondiente a cada
una de ellas. El gráfico tiene la
5
misma estructura anterior.
20%
7
20%
Gráfico 3
6
25%
22
www.capacitare.org.ar
ESTADÍSTICA
HISTOGRAMA DE FRECUENCIAS
Éste es otro de los diagramas de gran utilización para el cual es necesario considerar un
sistema de ejes cartesianos ortogonales, debiendo representar en el eje de las abscisas las
calificaciones y en el de las ordenadas la frecuencia, las clases están dadas por las calificaciones.
El intervalo entre dos clases sucesivas se denomina “amplitud de intervalo”, en este caso es la
unidad y se la expresa como 𝛥𝑥 = 1. Si consideramos el diagrama de bastones y a partir del
extremo inferior de cada uno de ellos llevamos tanto a izquierda como a derecha la mitad del
intervalo, en nuestro caso 1 / 2 = 0,5 y levantamos las ordenadas correspondientes, nos
encontramos con un diagrama de barras sin discontinuidades al que denominaremos
Histograma, en este caso de Histograma de Frecuencias.
Gráfico 4
HISTOGRAMA DE FRECUENCIAS
6
4
Frecuencia
0
0 1 2 3 4 5 6 7 8 9 10 11
Calificaciones
La superficie encerrada por cada una de las barras está dada por el producto entre la base Δx
por la altura que según ya vimos estaba dada por la densidad de frecuencia.
𝑑𝑓𝑖 = 𝑓𝑖 /𝛥𝑥
por lo tanto:
𝑆𝑖 = 𝛥𝑥. 𝑑𝑓𝑖 = 𝛥𝑥. 𝑓𝑖 / 𝛥𝑥 = 𝑓𝑖
Cada una de ellas tendrá un valor igual a su frecuencia y el área total del diagrama será
entonces la suma de todas las frecuencias e igual a 𝑁.
𝛴𝑆𝑖 = 𝛴 𝑓𝑖 = 𝑁
POLÍGONO DE FRECUENCIAS
Si se unen los puntos medios superiores de cada una de las barras del histograma y se
considera cero las frecuencias de las clases adyacentes a los extremos de la distribución, se
formará con el eje de las abscisas un polígono denominado, en este caso, como Polígono de
Frecuencias:
FUNDACIÓN CAPACITARE 23
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA Gráfico 5
6
3
fi
2
0
2 3 4 5 6 7 8 9 10 11
xi
El área encerrada por el polígono de frecuencias es igual al área encerrada por el histograma
de frecuencias.
Consideremos la barra del histograma correspondiente al valor de la variable 𝑥 = 6.
Observamos que mientras que la superficie del triángulo superior de la barra que pertenece al
histograma no pertenece al polígono, la superficie del triángulo inferior no perteneciente al
histograma si pertenece ahora al polígono, como las superficies de ambos triángulos son iguales,
lo son también las superficies del polígono y del histograma de frecuencias.
HISTOGRAMA DE FRECUENCIAS RELATIVAS
Si en el eje de ordenadas se representan a las frecuencia relativas en lugar de las frecuencias,
se obtiene el Histograma de Frecuencias Relativas que tendrá las mismas características que el
diagrama de frecuencias ya que 𝑓𝑟𝑖 = 𝑓𝑖 / 𝑁, es decir que se divide a los valores de la ordenada
por un valor constante 𝑁 y por lo tanto gráficamente representa un cambio de escalas.
En este caso la altura de cada barra está dada por la densidad de frecuencia relativa
𝑑𝑓𝑟𝑖 = 𝑓𝑟𝑖 / 𝛥𝑥
Y por lo tanto al igual que en el diagrama anterior, la superficie encerrada por cada una de
las barras del Histograma será igual a su frecuencia relativa:
𝑆𝑖 = 𝛥𝑥. 𝑓𝑟𝑖 / 𝛥𝑥 = 𝑓𝑟𝑖
De tal manera que el área encerrada por el Histograma de frecuencias relativas será ahora
igual a la suma de todas las frecuencias relativas y por tal razón igual a 1:
∑ 𝑆𝑖 = ∑ 𝑓𝑟𝑖 = 1
24
www.capacitare.org.ar
ESTADÍSTICA
Gráfico 6
0,3
HISTOGRAMA DE FRECUENCIAS RELATIVAS
0,25
0,2
0,15
fri
0,1
0,05
0
2 3 4 5 6 7 8 9 10 11
xi
0,2
0,15
fri
0,1
0,05
0
2 3 4 5 6 7 8 9 10 11
xi
FRECUENCIA ACUMULADA
Supongamos analizar el número de accidentes de trabajo que se producen diariamente en
una empresa metalúrgica local, para lo cual se han considerado los detectados durante los
últimos veinte días.
5 4 6 3 4 5 3 7 3 4 2 0 2 1 3 4 2 5 6 1
Confeccionaremos una tabla de frecuencias:
FUNDACIÓN CAPACITARE 25
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA Tabla 8
𝑥𝑖 𝑓𝑖 𝑓𝑎𝑖
0 1 1
1 2 3
2 3 6
3 4 10
4 4 14
5 3 17
6 2 19
7 1 20
∑ 𝑓𝑖 = 20
Para confeccionar el gráfico de frecuencias acumuladas llevaremos sobre el eje de las abscisas
los valores observados y en el eje de las ordenadas las frecuencias acumuladas.
Para el primer valor de la distribución cero, la frecuencia acumulada vale 1, este valor se
mantendrá constante hasta 1 en donde la frecuencia acumulada toma el valor de 3, se mantiene
constante hasta el valor observado de 2 en donde la 𝑓𝑎 adopta el valor de 6 y así sucesivamente
hasta el valor de 7 en donde 𝑓𝑎 toma el valor de 20 y se mantiene constante con este valor. Siga
esto en el gráfico 8.
Gráfico 8
25
FRECUENCIA ACUMULADA
20
Frecuencia acumulada
15
10
0
0 1 2 3 4 5 6 7 8 9
OBSERVACIONES
Observe el lector con que claridad este diagrama le entrega información. Por ejemplo
analizando la observación 4, el punto inferior de la barra indica que menores a 4 accidentes
diarios se han producido en 10 oportunidades mientras que el punto superior indica que en 14
oportunidades se han producido 4 o menos accidentes diarios. De igual manera en 17
oportunidades se produjeron menos de 6 accidentes en un día y que en sólo 2 oportunidades se
produjeron 6 accidentes.
26
www.capacitare.org.ar
ESTADÍSTICA
De igual manera podemos graficar la frecuencia desacumulada conjuntamente con la
acumulada tal como lo muestra el Gráfico 8 denominado comúnmente como gráfico de
escalones. Debe tenerse en cuenta que para cualquier valor observado la suma de la frecuencia
acumulada y la desacumulada es igual al número total de observaciones.
𝑓𝑎 + 𝑓𝑑𝑠 = 𝑛
Gráfico 9
FUNDACIÓN CAPACITARE 27
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA Tabla 9
𝐴 𝐵 𝐶
𝑥𝑖 𝑓𝑖 𝑓𝑖 𝑓𝑖
1 6 0 0
2 8 1 0
3 5 2 1
4 4 4 1
5 3 5 2
6 2 6 4
7 1 5 5
8 1 4 7
9 0 2 5
10 0 1 2
30 30 27
𝜇 = ∑(𝑥𝑖 . 𝑓𝑖 ) / 𝑁 = 3,1667
𝐴 𝑀𝑒 = (𝑥15 + 𝑥16 ) / 2 = 3
𝑀𝑜 = 2
𝜇 = ∑(𝑥𝑖 . 𝑓𝑖 ) / 𝑁 = 6
𝐵 𝑀𝑒 = 𝑥16 = 6
𝑀𝑜 = 2
𝜇 = ∑(𝑥𝑖 . 𝑓𝑖 ) / 𝑁 = 7,296
𝐶 𝑀𝑒 = 𝑥14 = 8
𝑀𝑜 = 8
Si graficamos los histogramas y polígonos de las frecuencias relativas de cada una de las
distribuciones relativas suavizando convenientemente los lados del polígono, nos encontraremos
con los siguientes gráficos:
28
www.capacitare.org.ar
ESTADÍSTICA
Gráfico 10 (División A)
0,3
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
0,25 RELATIVAS
frecuencia 0,2
0,15
0,1
0,05
0
1 2 3 4 5 6 7 8 9 10
OBSERVACIONES
Gráfico 11 (División B)
0,25
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
0,2 RELATIVAS
frecuencia
0,15
0,1
0,05
0
1 2 3 4 5 6 7 8 9 10
OBSERVACIONES
Gráfico 12 (División C)
0,25 HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
RELATIVAS
0,2
frecuencia
0,15
0,1
0,05
0
1 2 3 4 5 6 7 8 9 10
OBSERVACIONES
FUNDACIÓN CAPACITARE 29
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA En el caso de la división 𝐵 se observa una cierta simetría respecto a un eje vertical coincidente
con la mediana la moda y la media, decimos entonces que la distribución es del tipo Normal, y
que en ese caso coinciden los tres valores 𝜇; 𝑀𝑒 y 𝑀𝑜.
En el 𝐴 la distribución se presenta en forma asimétrica y en este caso decimos que
corresponde a una asimétrica derecha asignándosele un signo positivo. A su vez, la observación
de mayor ordenada le corresponderá a la moda y la media tendrá que dividir al área total en dos
áreas iguales, de acuerdo a su gráfica y a sus valores se observa que la media tiene un valor mayor
a la mediana y que a su vez ésta se ubica entre la media y la moda.
Al analizar la última distribución 𝐶 observamos que la misma es asimétrica, tiene sesgo
izquierdo y se le asigna signo negativo. Nuevamente la moda queda definida por correspóndele
a la abscisa de mayor ordenada, la mediana 𝑀𝑒 si bien en este caso coincidiría con el valor de la
moda, la media se ubica a la izquierda de la moda, no olvidemos que la distribución pivotea en
ese punto. La mediana se ubica en general entre la media y la moda aunque en este caso por
tratar con variable discreta, la 𝑀𝑒 coincide con la 𝑀𝑜.
En toda distribución sesgada ya sea a la derecha o a la izquierda, el segmento comprendido
por la media y la mediana es aproximadamente un tercio del segmento comprendida entre la
media y la moda.
Una distribución puede ser:
Simétrica 𝜇 = 𝑀𝑒 = 𝑀𝑜
30
www.capacitare.org.ar
ESTADÍSTICA
UNIDAD 4
FUNDACIÓN CAPACITARE 31
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA Por otro lado una cantidad mayor a 15 intervalos genera una distribución que resulta
engorroso operar.
Para el caso que tenemos en estudio y teniendo en cuenta que 𝑛 = 21, la raíz
cuadrada de 21 es de 4,58 y considerando la última condición, adoptaremos para 𝑘
el valor de 5
𝑘=5
b) La amplitud de intervalo 𝛥𝑥 para la cual adoptaremos la expresión:
𝑥𝑛 − 𝑥1
𝛥𝑥 =
𝑘
Para nuestro caso:
4,6 − 3,1
𝛥𝑥 = = 0,3
5
c) No puede haber un intervalo con frecuencia cero, si esa situación se presentare, será
necesario modificar la cantidad de intervalos o la amplitud de intervalo.
d) Al definir los límites de los intervalos debe tenerse en cuenta la posibilidad que uno
de ellos puede ser cerrado y el otro abierto:
e) Es conveniente que todos los intervalos tengan el mismo tamaño y cuando esto no
sea posible, los intervalos de diferente amplitud deben ubicarse en los extremos
f) No es conveniente que las observaciones coincidan con los límites de los intervalos,
de esta manera desaparece la duda en cuanto a la pertenencia de una observación a
un intervalo o a su adyacente.
En este caso particular, teniendo en cuenta que todas las observaciones tienen un
solo decimal, y que el menor es 3,1, adoptaremos como inicio de la distribución el
valor de 3,09, de esta manera nos aseguramos que la primera observación quede
contenida en el primer intervalo, y además como la amplitud de intervalo es de 0,3,
en ningún caso una observación coincidirá con los límites.
3,09 3,39 3,69 3,99 4,29 4,6
[-----------------)[-----------------)[-----------------)[-----------------)[-----------------]
32
www.capacitare.org.ar
ESTADÍSTICA
∑( 𝑥𝑚𝑖 ∗ 𝑓𝑖 )
𝜇 =
𝑁
Para su determinación creamos una nueva columna conteniendo los productos de 𝑥𝑚𝑖 ∗ 𝑓𝑖 :
Tabla 10
𝐿𝑖 𝐿𝑠 𝑓𝑖 𝑥𝑚𝑖 𝑥𝑚𝑖 ∗ 𝑓𝑖
3,09 3,39 1 3,24 3,24
3,39 3,69 4 3,54 14,16
3,69 3,99 6 3,84 23,04
3,99 4,29 5 4,14 20,7
4,29 4,6 5 4,445 22,225
21 83,365
83,365
𝜇 = = 3,9697
21
Esto nos indica que el tiempo promedio empleado por los integrantes del pelotón para cruzar
la pista de combate es de 3,9697
HISTOGRAMA DE FRECUENCIA
Para confeccionar el Histograma y Polígono de frecuencias debemos tener presente que las
frecuencias de los intervalos adyacentes a los extremos de nuestra distribución son nulas,
además se representa en el eje horizontal las marcas de clase.
Gráfico 13
7
4
f
0
2,94 3,24 3,54 3,84 4,14 4,445 4,74
x
DETERMINACIÓN DE LA MEDIANA
La mediana tendrá que estar ubicada en el intervalo cuya menor frecuencia acumulada
contiene a la observación 𝑥(𝑛⁄2) , es por lo tanto conveniente determinar las columnas que
contengan a las frecuencias acumuladas y desacumuladas.
FUNDACIÓN CAPACITARE 33
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA Tabla 11
𝐿𝑖 𝐿𝑠 𝑓𝑖 𝑥𝑚𝑖 𝑥𝑚𝑖 ∗ 𝑓𝑖 𝑓𝑎𝑖 𝑓𝑑𝑠𝑖
20
15
fa
10
0
2,94 3,24 3,54 3,84 4,14 4,445 4,74
x
34
www.capacitare.org.ar
ESTADÍSTICA
Gráfico 15
25
20
15
fa - fds
10
0
2,94 3,24 3,54 3,84 4,14 4,445 4,74
x
FUNDACIÓN CAPACITARE 35
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA Al iniciar el intervalo 3,69 su frecuencia acumulada tiene el valor de 5 (que denominaremos
frecuencia acumulada inferior y la denotaremos como 𝑓𝑎𝑖). De la misma manera al finalizar ese
intervalo (𝑥 = 3,69) su frecuencia acumulada es de 11 (a la denominaremos frecuencia
acumulada superior y la denotaremos como 𝑓𝑎𝑠). Esa variación de frecuencia acumulada de 5 a
11 es justamente la frecuencia correspondiente al intervalo medial (𝑓𝑚 = 6). Además como el
total de observaciones es de 21, 𝑁/2 = 10,5.
Consideremos los triángulos 123 y 12’3’ ambos rectángulos en 2 y 2’ respectivamente.
Esos triángulos son semejantes y por lo tanto sus lados homólogos son proporcionales.
2−3 1−2
=
2’ − 3’ 1 − 2’
Si reemplazamos tendremos:
𝑓𝑚 ∆𝑥
=
𝑁/2 − 𝑓𝑎𝑖 𝑀𝑒 − 𝐿𝑖
Despejando 𝑀𝑒 tendremos:
∆𝑥(𝑁/2 − 𝑓𝑎𝑖)
𝑀𝑒 = 𝐿𝑖 +
𝑓𝑚
36
www.capacitare.org.ar
ESTADÍSTICA
Si definimos a
𝑑1 = (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑚𝑜𝑑𝑎𝑙) – (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑞𝑢𝑒 𝑙𝑒 𝑠𝑢𝑐𝑒𝑑𝑒):
𝑑1 = 6 − 4 = 2
Y como
𝑑2 = (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑚𝑜𝑑𝑎𝑙) – (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑞𝑢𝑒 𝑙𝑒 𝑠𝑢𝑐𝑒𝑑𝑒):
𝑑2 = 6 − 5 = 1
Como 𝐿𝑖 se define al inicio del intervalo modal (3,69), el valor de la moda de una distribución
de intervalos de clase está dada por la expresión:
𝑀𝑜 = 𝐿𝑖 + 𝛥𝑥. ( 𝑑1 /(𝑑1 + 𝑑2 ) )
En este caso tendremos:
𝑀𝑜 = 3,69 + 0,3 (2 / (2 + 1)) = 3,89’
Conclusiones:
En una distribución de intervalos de clase, la moda se encuentra siempre ubicada en el
intervalo modal, pero desplazada hacia el intervalo adyacente de mayor frecuencia. Los valores
determinados para la media, mediana y moda, indican que la distribución tiene un leve sesgo
derecho:
Media 𝜇 = 3,9697’
Mediana 𝑀𝑒 = 3,965’
Moda 𝑀𝑜 = 3,89’
𝜇 > 𝑀𝑒 > 𝑀𝑜
VALORES DE DISPERSIÓN
¿Son suficientes los valores de posición central para determinar las características de una
distribución? Para responder a esta pregunta observemos la siguiente situación:
Tenemos tres distribuciones que presenten la misma media, la misma moda y la misma
mediana pero no obstante ello las tres son distintas.
Pueden tenerse dos distribuciones mismo número de elementos o también conformadas por
los mismos elementos y no obstante ello ambas son distintas.
FUNDACIÓN CAPACITARE 37
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA Tabla 12
𝑋1 𝑌1 𝑋2 𝑌2
0 0 0 0
1 3 1 6
2 4 2 8
3 7 3 4
4 5 4 3
5 4 5 2
6 2 6 2
7 1 7 1
8 0 8 0
26 26
Gráfico 19
8
0
0 1 2 3 4 5 6 7 8 9
Gráfico 20
9
0
0 1 2 3 4 5 6 7 8 9
38
www.capacitare.org.ar
ESTADÍSTICA
Es necesario entonces considerar valores que nos determinen cuan dispersos están. Estos
valores se denominan valores de dispersión:
RANGO O AMPLITUD
DEFINICIÓN
FUNDACIÓN CAPACITARE 39
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA 𝑑1 = 𝑥𝑚1 − 𝜇
La dispersión de los valores ubicados en el segundo intervalo, en este caso son 4 y habiendo
considerado que los mismos se encuentran uniformemente distribuidos en dicho intervalo, la
dispersión respecto a la media estará dada por el producto de la distancia de la marca de clase
por el número de observaciones
𝑑2 = 𝑥𝑚2 − 𝜇
Podríamos intentar considerar como un valor representativo de la dispersión de los valores
respecto a la media, al promedio de los desvíos medios:
∑(𝑚𝑥𝑖 − 𝜇 ) . 𝑓𝑖
𝑝𝑑𝑚 =
𝑁
Pero nos encontramos con que la suma de todos los desvíos es nula y siempre lo serán por
considerar como punto de referencia a la media. Todas las distancias de las marcas de clase que
se ubiquen a la izquierda de la media serán negativas, mientras que las distancias de los que se
ubiquen a la derecha serán positivas. El problema radica en anular los signos negativos, para ello
podemos:
a) considerar los desvíos absolutos medios, de esta manera no se tendría ningún desvío
negativo y la suma de los desvíos absolutos medios sería distinta de cero, salvo el caso
en que todas las observaciones sean iguales. La expresión matemática quedaría como:
∑|(𝑚𝑥𝑖 − 𝜇 )| . 𝑓𝑖
𝐷𝑀 =
𝑁
Esta expresión se define como Desvío medio (Promedio de los desvíos absolutos medios).
En nuestro caso en estudio conformaremos la tabla correspondiente a la distribución de
intervalos pero incluiremos una nueva columna conteniendo los desvíos absolutos medias.
Tabla 13
𝐿𝑖 𝐿𝑠 𝑓𝑖 𝑥𝑚𝑖 𝑥𝑚𝑖 . 𝑓𝑖 𝑓𝑎𝑖 𝑓𝑑𝑠𝑖 |𝑥𝑚𝑖 − 𝑀𝑒| . 𝑓𝑖
40
www.capacitare.org.ar
ESTADÍSTICA
VARIANZA
Otra forma de obtener todos los desvíos positivos, sería elevándolos al cuadrado es decir:
∑(𝑚𝑥𝑖 − 𝜇 )2 . 𝑓𝑖
𝑝𝑑𝑚𝑐 =
𝑁
DEFINICIÓN
Es conveniente entonces considerar una nueva columna conteniendo la suma de los desvíos
cuadráticos medios tal como la tabla:
Tabla 14
𝐿𝑖 𝐿𝑠 𝑓𝑖 𝑥𝑚𝑖 𝑥𝑚𝑖 . 𝑓𝑖 𝑓𝑎𝑖 𝑓𝑑𝑠𝑖 |𝑥𝑚𝑖 − 𝑀𝑒| . 𝑓𝑖 (𝑥𝑚𝑖 − 𝑀𝑒)2 . 𝑓𝑖
2,647
𝑉𝑎𝑟(𝑥) = = 0,126 𝑚𝑖𝑛2
21
También se la denota como:
𝜎 2 = 0,126 𝑚𝑖𝑛2
DESVIACIÓN ESTANDAR
La Varianza es un valor que determina un cierto grado de dispersión, pero en relación a lo
que nosotros buscábamos, nos encontramos con que no tenemos el promedio de los desvíos
medios, si no que contamos con el promedio de los desvíos cuadráticos medios. Una
aproximación estaría obteniendo la raíz cuadrada de la varianza:
∑(𝑚𝑥𝑖 − 𝜇 )2 . 𝑓𝑖
𝜎 = √
𝑁
O abreviando
FUNDACIÓN CAPACITARE 41
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA 𝜎 = √𝑉𝑎𝑟(𝑥)
𝜎 = 0,126 = 0,3549’
FRECUENCIA
Definimos a la desviación estándar como la raíz cuadrada de la varianza y prácticamente
entrega el grado de dispersión de los valores de una distribución con respecto a la media.
Para dos distribuciones con la misma media, tendrá más dispersión aquella que tiene una
mayor desviación estándar, tal como lo indica la gráfica
Gráfico 21
COEFICIENTE DE VARIACIÓN
En muchas oportunidades es conveniente comparar distribuciones de distinta media o de
distinto tipo, por ejemplo si analizamos alturas y peso de los alumnos de un curso de una
Universidad, los valores de posición central y de dispersión de una de ellas estarán dados en
metros o centímetros, pero los de la otra serán en Kg., luego en principio sería incorrecto
pretender comparar las dispersiones de esas distribuciones, a fin de poder comparar se opera
con el Coeficiente de Variación, que está dado por el cociente entre el desviación estándar de la
distribución y su media, expresada de manera porcentual:
𝜎
𝐶𝑉 = . 100%
𝜇
Como tanto la desviación estándar y la media tienen las mismas unidades, al dividirlas se
simplifican y nos queda un coeficiente, es adimensional. Por otra parte el CV entrega la
proporción de la desviación estándar respecto de la media. En el caso que nos ocupa el:
0,3549
𝐶𝑉 = . 100% = 8,94
3,9697
Supongamos que se realiza el estudio de altura y peso de los alumnos de un curso, y que los
resultados arrojados son:
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑀𝑒 𝐶𝑉
Peso 𝜎 = 10 𝐾𝑔 71 𝐾𝑔 14,08%
Altura 𝜎 = 6 𝑐𝑚 168 𝑐𝑚 3,57%
42
www.capacitare.org.ar
ESTADÍSTICA
Estos últimos valores del 𝐶𝑉 indican que, la distribución correspondiente a la altura tiene
menos dispersión que la correspondiente a los pesos.
CUARTILES Y PERCENTILES
En muchas ocasiones es necesario contar con una subdivisión de los datos en determinadas
fracciones, llamados en de manera general como fractiles. De esta manera una fracción o
proporción de datos caen en un fractil o por debajo de éste. De acuerdo al número de
subdivisiones los fractiles toman un nombre determinado, así estas pueden ser:
a) en 10 partes. En este caso cada una de esas partes toman el nombre de decil
b) en cuatro partes: En ese caso cada una de ellas toma el nombre de cuartil
c) en cambio si la subdivisión es en 100 partes, se la denomina a cada una de ellas como
centil.
El alcance interfractil, dada por la diferencia entre dos fractiles constituye una medida de
dispersión entre ellos.
En general los fractiles más utilizados lo constituyen los cuartiles y percentiles. Subdividir a
los datos en cuatro fractiles implica que el 50% de los datos están por debajo del segundo cuartil
y el 75% de las observaciones están por debajo del tercer cuartil, representados gráficamente
implica:
𝑋1 𝑄1 𝑄2 𝑄3 𝑋𝑛
Una cuarta parte de las observaciones se encuentran por debajo de 𝑄1, como que también ½
están por debajo de 𝑄2 . Entre 𝑄3 y 𝑄1 se concentra el 50% de las observaciones. Es necesario
aclarar que 𝑄1 como 𝑄2 y 𝑄3 son los puntos fractiles, por debajo de cada uno de ellos se
encuentran los porcentajes los correspondientes porcentajes de datos.
Cuando el número de valores no es lo suficientemente grande la determinación exacta de los
cuartiles puede ser complicada, ya que es factible que el valor del cuartil quede entre
observaciones, de cualquier manera en general podemos decir que la determinación de cada
cuartil quede satisfecha con las expresiones:
La determinación de los cuartiles para datos no agrupados está dada por las expresiones:
𝑄1 = 𝑋(1⁄4𝑁+1⁄4)
𝑄2 = 𝑋(1⁄2𝑁+1⁄2)
𝑄3 = 𝑋(3⁄4𝑁+1⁄4)
Observe que el valor del segundo cuartil corresponde al valor de la mediana. Si recordamos
que, el área encerrada por el polígono de frecuencias era igual al número de observaciones, sería
lógico suponer entonces que en un diagrama correspondiente al polígono de frecuencias
FUNDACIÓN CAPACITARE 43
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA suavizado, las superficies encerradas por dicho diagrama serán proporcionales al número de
observaciones correspondientes a la misma. Con este concepto definimos los cuartiles
gráficamente según Gráfico 22.
Gráfico 22
𝑄1 𝑄2 𝑄3
Se define como Rango Intercuartil o propagación media a la diferencia:
𝑅𝐼 = 𝑄3 – 𝑄1
Percentiles: De la misma manera en que la distribución en estudio la podemos dividir en
cuatro partes, en el caso de hacerlo en 100 cada una de ellos tomará el nombre de percentil, un
percentil 𝑧 cualquiera es un valor tal que 𝑧 por ciento de las observaciones quedan a su izquierda
mientras que (100 − 𝑧) porcientos de los valores quedan a su derecha. El percentil 80 está
dejando a su izquierda el 80% de los valores de la distribución, es decir todos aquellos menores
a él, y por lo tanto el 20% de la distribución lo superan, es decir quedan a su derecha.
Gráfico 23
44
www.capacitare.org.ar
ESTADÍSTICA
REGLA EMPÍRICA
Gráfico 24
FUNDACIÓN CAPACITARE 45
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA UNIDAD 5
PROBABILIDADES
Probabilidades: Definición
Eventos: Definición y clasificación
Determinación de probabilidades
Probabilidad subjetiva
Regla aditiva
Regla multiplicativa
PROBABILIDADES
Siempre que se encare un problema estadístico debe tenerse en cuenta el grado de
posibilidad de que ciertos sucesos hayan ocurrido o vayan a ocurrir. Por ejemplo, a un político le
interesará conocer el grado de seguridad de las encuestas que determinan un porcentaje dado
de votantes para las próximas elecciones o a un inversionista le interesará saber qué grado de
riesgo corre su capital en la compra de determinadas acciones. Las matemáticas de las
probabilidades se relacionan, en sus orígenes, con los juegos de azar, por lo que no debe extrañar
que para el estudio de ella, se utilicen como ejemplos, resultados posibles en lanzamientos de
dados o monedas, en los posibles resultados de una jugada de ruleta, etc. Independientemente
de esas aplicaciones particulares, el estudio de probabilidades indica que existe incertidumbre
con respecto a la ocurrencia o no de un determinado evento. En muchas oportunidades puede
ser virtualmente imposible predecir cuál será el resultado de una determinada acción, pero es
posible anticipar cuál es el resultado que se espera de dicha acción.
Resumiendo, el estudio de esta unidad nos lleva a cuantificar cuan probable es la ocurrencia
de un determinado evento.
A continuación presentamos un problema en el que se requerirán los temas que
desarrollaremos en esta unidad:
PROBLEMA
46
www.capacitare.org.ar
ESTADÍSTICA
Indique Ud. la probabilidad de que un automóvil que ha sido robado en esa ciudad haya
tenido las llaves puestas.
PROBABILIDADES
DEFINICIÓN
Cada una de las distintas maneras en que puede presentarse el fenómeno se denomina
evento.
Cuando lanzamos un dado, éste puede presentarse de seis maneras distintas, refiriéndonos
al número que presenta su cara superior, cada una de ellas recibe el nombre de evento y la
designaremos con la letra E, así tendremos:
𝐸1 : que presente un As
𝐸2 : que presente un dos
𝐸3 : que presente un tres
𝐸4 : que presente un cuatro
𝐸5 : que presente un cinco o
𝐸6 : que se presente con un seis
La probabilidad de un evento es un número real comprendido entre 0 y 1
0 < 𝑃 (𝐸) < 1
Y puede representarse como un número decimal o como fracción.
Una probabilidad de valor cero indica la imposibilidad de ocurrencia, por el contrario una
probabilidad igual a 1 significa la certeza.
La probabilidad de que al lanzar una moneda se obtenga una cara o una cruz es
𝑃 (𝑐𝑎𝑟𝑎 𝑜 𝑐𝑟𝑢𝑧) = 1
así mismo en el lanzamiento de un dado, la probabilidad de obtener un siete es imposible, un
dado no puede tener siete caras:
𝑃(𝑥 = 7) = 0
EVENTOS: DEFINICIÓN Y CLASIFICACIÓN
Pero regresemos al lanzamiento de un dado perfectamente balanceado, podríamos
considerar también como evento, la aparición de un número par en la cara superior del dado, lo
que se daría en el caso de presentarse el 2, el 4 o el 6 y lo representaremos con la letra 𝐴, para
diferenciarlo de los anteriores.
FUNDACIÓN CAPACITARE 47
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA 𝐴: que salga un número par
O podríamos considerar también la aparición de un impar claro que en este caso, la condición
de obtener un número impar se satisface con la aparición del 1, del 3 o del 5, tres de los posibles
eventos en el lanzamiento del dado, vemos entonces que es necesario clasificar los eventos:
Simples
Eventos
Compuestos
Un evento se dice que es compuesto cuando está conformado por más de un evento simple,
de esta manera, también serían eventos compuestos:
𝐵: que se presente con un número mayor o igual a 4
𝐶: que sea par y mayor o igual a 4
𝐷: que sea un número par o mayor o igual a 4
Claro que también podríamos expresar al evento 𝐶 como aquel para el cuál debe cumplirse
conjuntamente 𝐴 y 𝐵
𝐶 = (𝐴 𝑦 𝐵)
De la misma manera:
𝐷 = (𝐴 𝑜 𝐵)
es decir 𝐷 se cumple cuando al menos uno de los dos 𝐴 o 𝐵 se cumple.
DETERMINACIÓN DE PROBABILIDADES
Se tiene tres planteos básicos para definir una probabilidad, éstas son:
a) Planteamiento clásico
b) Planteamiento basado en la frecuencia relativa
c) Planteamiento subjetivo
Cada una de ellas es aplicada según las circunstancias y es el Estadístico quien decide su
aplicabilidad. Analizaremos cada una de ellas
PLANTEAMIENTO CLÁSICO
Cuando un fenómeno puede presentarse de 𝑛 formas distintas, todas ellas igualmente
posibles, y de esas 𝑛 formas en 𝑐 de ellas lo hace con una determinada característica, entonces,
la probabilidad de que al presentarse el fenómeno lo haga con la característica en estudio está
dado por el cociente de 𝑐 sobre 𝑛
𝑐
𝑃=
𝑛
Si a 𝑐 se lo denomina como número de casos favorables y a 𝑛 como número de casos posibles
podríamos expresar la probabilidad clásica como:
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
𝑃=
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
48
www.capacitare.org.ar
ESTADÍSTICA
Es necesario tener en cuenta que para que esta expresión sea correcta todas las formas en
que puede presentarse el fenómeno deben ser igualmente posibles.
Con este concepto la probabilidad de que al lanzar un dado presente la cara con un número
par será de:
3
𝑃(𝐴) =
6
3 son los casos favorables (2, 4 𝑦 6) y el número de casos posibles es 6.
Recordemos el evento 𝐶 debía cumplir con la condición de ser par y mayor o igual que 4, es
decir, debía cumplirse simultáneamente los eventos 𝐴 y 𝐵
𝑃 (𝐶) = 𝑃 (𝐴 𝑦 𝐵)
En este caso los eventos favorables son 𝐸4 y 𝐸6, cumplen con la condición de ser pares y
mayores o iguales a 4 por lo tanto aplicando el concepto de probabilidad clásica empírica
tendremos:
2
𝑃(𝐶) =
6
PLANTEAMIENTO EN BASE A LA FRECUENCIA RELATIVA.
Analicemos el lanzamiento de una moneda y descartemos la posibilidad de que, en un
lanzamiento la misma caiga de canto (en ese hipotético caso se dejaría rodar a la moneda hasta
su caída). Dos son los eventos simples en que puede presentarse el fenómeno, que se obtenga
una cara o una cruz. Luego la probabilidad de obtener una cara de acuerdo al planteamiento
clásico será:
1
𝑃(𝑐𝑎𝑟𝑎) = = 0,5
2
Por otra parte si en 10 lanzamientos se obtuvieron cuatro caras y seis cruces entonces la
frecuencia relativa de obtención de caras es:
4
𝑓𝑟(𝑐𝑎𝑟𝑎) = = 0,4
20
FUNDACIÓN CAPACITARE 49
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA Gráfico 25
PROBLEMA
De acuerdo a las estadísticas llevadas a cabo por una Cía. de seguros, ésta informa que de
las personas del sexo masculino de 50 años, aproximadamente 65 de cada 100.000 mueren
durante el período de un año. De acuerdo al método de frecuencia relativa, la probabilidad
de que una persona asegurada del sexo masculino con una edad de 50 años, muera en el
término de un año es de
65
𝑃= = 0,00065
100.000
50
www.capacitare.org.ar
ESTADÍSTICA
Es necesario tener presente que el grado de bondad de la probabilidad calculada mediante
este método, depende del número de veces en que fuera evaluado el proceso y por tal motivo,
determinada la frecuencia relativa. La definición expresa que para que la probabilidad de
ocurrencia de un proceso coincida con su frecuencia relativa de ocurrencia, ésta debe estar
calculada sobre la presentación de un número suficientemente grande del fenómeno.
PROBABILIDAD SUBJETIVA
La probabilidad subjetiva queda librada al criterio de quién la determina en función de la
evidencia con que se cuente para la misma, ésta puede ser en base a la frecuencia relativa de
ocurrencia en eventos pasados o simplemente de acuerdo a sus supuestos. Este tipo de
probabilidad se da cuando los eventos se presentan un número reducido de veces.
Supóngase cumplir las funciones gerente de Recursos Humanos en una Empresa y debe elegir
un candidato de entre cuatro que presentan vitae similares, con iguales apariencias y niveles de
relación. El que Ud. elija a uno de ellos es haberle asignado una determinada probabilidad a la
potencialidad futura de ese hombre y considera ser superior a la asignada a los otros. En este
caso el hecho de no existir una frecuencia relativa del fenómeno no lo libera de la toma de
decisión. Es importante tener presente que, personas distintas frente a la misma situación
pueden asignar probabilidades subjetivas distintas.
REPRESENTACIÓN GRÁFICA
Retomemos el fenómeno correspondiente al lanzamiento de un dado. En muchas ocasiones
es conveniente operar probabilidades en forma gráfica, para ello nos valdremos del Diagrama de
Venn. Para la confección de este diagrama representamos mediante puntos cada uno de los
eventos simples en que puede presentarse el fenómeno, cada uno de ellos se denomina punto
muestral y el espacio conformado por todos los puntos muestrales se denominará espacio
muestral y se lo denota como (𝑆)
Para el caso que nos ocupa tendremos:
Gráfico 27
S 𝐸1 𝐸5
𝐸2
𝐸3
𝐸4 𝐸6
Cada uno de los puntos considerados corresponde a cada uno de los posibles eventos en que
puede presentarse el lanzamiento del dado.
Es necesario además asignarle a cada uno de los puntos muestrales un valor de probabilidad
pero teniendo en cuenta que el valor de probabilidad asignado debe cumplir con la condición de
ser mayor o igual a cero pero menor o igual a 1:
0 ≤ 𝑃(𝐸𝑖 ) ≤ 1
FUNDACIÓN CAPACITARE 51
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA donde 𝑖 varía entre 1 y 6, para este caso
Además debe cumplirse que, la suma de las probabilidades de todos los puntos muestrales
sea igual a 1
𝑖=6
∑ 𝑃(𝐸𝑖 ) = 1
𝑖=1
En el caso que nos ocupa, todas las caras tienen la misma probabilidad de ocurrencia, por lo
tanto la probabilidad que le asignaremos a cada punto muestral será de
1
𝑃 (𝐸𝑖 ) =
6
La probabilidad de que al lanzar el dado se obtenga un número par
𝐴: obtener un par
Este evento compuesto se cumple en el caso de obtener un dos, o un cuatro o un seis
Gráficamente tendremos:
Gráfico 28
𝐸1 𝐸5
S
𝐴
𝐸2
𝐸6
𝐸3
𝐸4
𝐸1 𝐸3
𝐸2
𝐸2
𝐸4 𝐸6
𝐵
𝐸1 𝐴
𝐸3
𝐸2
𝐵
𝐸4 𝐸6 𝐸5
𝐸1
𝐴 𝐸3
𝐸2
𝐵
𝐸4 𝐸6 𝐸5
FUNDACIÓN CAPACITARE 53
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA Podemos deducir según lo visto que, gráficamente los eventos compuestos surgen de la unión
o intersección de eventos, sean estos simples o compuestos. La probabilidad de obtener un
número par 𝑃(𝐴) está dada por la unión de los eventos simples 𝐸2 , 𝐸4 y 𝐸6 , mientras que la
probabilidad de obtener un par o un número ≥ 4 está dada por la unión de los eventos
compuestos 𝐴 y 𝐵
REGLA ADITIVA
Tenemos ahora una expresión que nos entrega la probabilidad de la unión de eventos.
Expresión que toma el nombre de Regla Aditiva:
𝑃(𝐴 𝑜 𝐵) = 𝑃(𝐴) + 𝑃 (𝐵) – 𝑃(𝐴 𝑦 𝐵)
Sería conveniente determinar cuál es la expresión que nos determina la intersección de
eventos, para ello analicemos el siguiente caso:
¿Cuál es la probabilidad que habiendo obtenido en el lanzamiento del dado un número ≥ 4
éste sea par? A este tipo de probabilidad se denomina condicional y se la expresa como 𝑃(𝐴 / 𝐵)
Expresión que se lee como probabilidad de ocurrencia de 𝐴 según 𝐵.
Si la cara obtenida contiene un número mayor o igual a 4 tendrá que ser el 4 o el 5 o el 6,
solo tres casos posibles y de los cuales solo dos de ellos cumplen con la condición de ser par, por
lo tanto si nos ajustamos a la definición clásica de probabilidades:
𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 2
𝑃(𝐴 / 𝐵) = =
𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 3
Por otra parte, la condición que deben cumplir los casos favorables es la de ser mayor o igual
a 4 y además, deben cumplir con la condición de ser par, es decir, deben satisfacer
simultáneamente 𝐴 y 𝐵, mientras que los casos posibles estarán dados por los eventos simples
que constituyen a 𝐵, mayores o iguales a 4. Pudiendo expresarla como:
𝑃( 𝐴 ∩ 𝐵)
𝑃(𝐴⁄𝐵 ) =
𝑃(𝐵)
La expresión indica que: La probabilidad de ocurrencia de 𝐴 según 𝐵, está dada por el
cociente entre la probabilidad de ocurrencia conjunta de 𝐴 y 𝐵 sobre la probabilidad de 𝐵.
Si recordamos que
2
𝑃(𝐴 ∩ 𝐵) =
6
y
3
𝑃(𝐵) =
6
Reemplazando tendremos
2/6 2
𝑃(𝐴⁄𝐵 ) = =
3/6 3
Resultado al que habíamos arribado por razonamiento y aplicación de la definición clásica.
54
www.capacitare.org.ar
ESTADÍSTICA
REGLA MULTIPLICATIVA
La expresión anterior no solo nos entrega la probabilidad condicionada de ocurrencia de 𝐴
según 𝐵 sino que, nos permite obtener la expresión multiplicativa, si pasamos el denominador
del segundo miembro multiplicando al primero, e intercambiando los miembros:
FUNDACIÓN CAPACITARE 55
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA UNIDAD 6
RELACIÓN DE EVENTOS
Eventos complementarios
Eventos mutuamente excluyentes
Eventos independientes
Probabilidades marginales bajo dependencia estadística
RELACIÓN ENTRE EVENTOS
De acuerdo a lo estudiado, hemos visto que dos o más eventos pueden combinarse para dar
eventos compuestos y esos tipos de combinación estaban representados gráficamente por una
unión de eventos o por una intersección de ellos. Matemáticamente, la unión está dada por una
disyunción o, probabilidad de ocurrencia de por lo menos uno de ellos, esta probabilidad estaba
determinada por la regla aditiva, mientras que a la intersección le corresponde el conectivo lógico
y, es una conjunción e indica la ocurrencia simultanea de ambos eventos y su probabilidad
denominada probabilidad conjunta, esta probabilidad es satisfecha por la regla multiplicativa.
Independientemente del concepto precedente, el evento compuesto generado por la
relación entre los eventos 𝐴 y 𝐵 se la puede clasificar como:
Complementarios
Independientes
EVENTOS COMPLEMENTARIOS
Dos eventos 𝐴 y 𝐵 se denominan COMPLEMENTARIOS cuando la suma de sus probabilidades
es igual a 1:
𝑃(𝐴) + 𝑃 (𝐵) = 1
Si tenemos presente el espacio muestral en donde cada una de los eventos posee una
probabilidad y la suma de todas ellas es igual a 1, nos indica que dada el evento 𝐴, su
complemento estará constituido por todos los puntos muestrales de dicho espacio que no
pertenezcan a 𝐴 y se lo denomina como 𝐴̅ (todo lo que no es 𝐴 constituye su complemento)
Gráfico 32
𝑆
𝐵 𝐵 = 𝐴̅
𝐴
56
www.capacitare.org.ar
ESTADÍSTICA
EVENTOS MUTUAMENTE EXCLUYENTES
Se dice que dos eventos son mutuamente excluyentes cuando la ocurrencia de uno de ellos
implica la no ocurrencia del otro.
Gráfico 33
𝐴 𝐵
𝐸1 𝐸5
𝐸2
𝐸3
𝐸4 𝐸6
FUNDACIÓN CAPACITARE 57
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA Acotación
Como conclusión podemos decir que dados dos eventos 𝐴 y 𝐵, si son complementarios
ambos eventos 𝐴 y 𝐵, este último = 𝐴̅ será exhaustivamente excluyentes ya que no es posible
obtener otro resultado para el fenómeno que no sea uno de ellos. Resumiendo, si dos eventos
son complementarios indefectiblemente son mutuamente excluyentes.
EVENTOS INDEPENDIENTES
Supongamos que lanzamos una moneda, la probabilidad de obtener una cara es de ½. Si
lanzamos otra moneda, la probabilidad de obtener una cara será también de ½.
¿Cuál es la probabilidad de que se obtenga una cara en la segunda moneda habiéndose
obtenido una cara en la primera? Consideramos que será también de ½, no existe relación alguna
entre el resultado de la primera y la probabilidad de ocurrencia de la segunda moneda,
tendríamos que afirmar:
𝑃(𝑐𝑎𝑟𝑎 2º/𝑐𝑎𝑟𝑎 1º) = 𝑃(𝑐𝑎𝑟𝑎 2º)
Que se lee, la probabilidad de que la segunda moneda se obtenga cara, habiéndose obtenido
cara en la primera moneda es igual a la probabilidad de obtener cara en la segunda moneda.
Decimos que los eventos son independientes.
DEFINICIÓN
Y se expresa como:
𝑃(𝐴 / 𝐵) = 𝑃(𝐴)
La probabilidad que Juan apruebe Estadística es independiente de que Boca gane en el
próximo partido.
Si recordamos la regla multiplicativa:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵) . 𝑃(𝐴/𝐵)
Cuando los eventos son independientes
𝑃(𝐴/𝐵) = 𝑃(𝐴)
Por la tanto la expresión matemática de la probabilidad conjunta toma la forma de:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) . 𝑃(𝐵)
Lo que se expresa como:
Cuando dos eventos son independientes, la ocurrencia simultánea de ambos es igual al
producto de sus probabilidades
58
www.capacitare.org.ar
ESTADÍSTICA
En muchas oportunidades se le hace difícil al alumno definir cuando existe dependencia o
independencia de dos eventos. Supongamos que extraemos una carta de un mazo de cartas
españolas de un total de cuarenta y definimos:
𝐶1 = sacar una carta de espadas en una primera extracción y
𝐶2 = extraer una carta de espadas en la segunda extracción
La probabilidad de extraer una carta de espadas en la primera extracción será de
10 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
𝑃(𝐶1 ) =
40 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
Pero la probabilidad de extraer una espada en la segunda extracción queda supeditada a la
forma en que se realice el proceso, es decir, con reposición o sin reposición.
Si se realiza con reposición, luego de efectuar la primera extracción, la carta se coloca
nuevamente en el mazo y se mezcla, la probabilidad de extraer una carta de espadas será
nuevamente de
10
𝑃(𝐶2 ) =
40
Los eventos son independientes. Pero si el proceso se realiza sin reposición, la probabilidad
de extraer una espada en segundo término depende de la carta extraída en la primera
oportunidad (que sea o no una espada).
La probabilidad de extraer una espada en la segunda oportunidad no habiendo obtenido una
espada en la primera será de:
10
𝑃(𝑒𝑠𝑝𝑎𝑑𝑎 𝑒𝑛 2º /𝑛𝑜 𝑒𝑠𝑝𝑎𝑑𝑎 𝑒𝑛 1º) =
39
Mientras que la probabilidad de obtener una espada en la segunda oportunidad habiendo
obtenido una espada en la primera será:
9
𝑃(𝑒𝑠𝑝𝑎𝑑𝑎 𝑒𝑛 2º /𝑒𝑠𝑝𝑎𝑑𝑎 𝑒𝑛 1º) =
39
Aclaraciones
1. Se define como probabilidad marginal a la probabilidad simple correspondiente a un
evento. Si lanzamos una moneda que esté perfectamente balanceada, la probabilidad
de obtener una cara es de 0,5, esto es cierto para cualquier lanzamiento, no importa
cuántas veces se lance la moneda ni cuales fueron los resultados anteriores. Cada
nuevo lanzamiento es único e independiente de los resultados que se hubieren
obtenido en lanzamientos anteriores.
2. En el inicio del estudio de probabilidades se hace complejo definir claramente sucesos
mutuamente excluyentes y eventos independientes a estos efectos se tendrá muy en
cuenta la siguiente premisa.
FUNDACIÓN CAPACITARE 59
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA IMPORTANTE
Los sucesos mutuamente excluyentes deben ser dependientes, pero los
sucesos dependientes no tienen necesariamente que ser mutuamente
excluyentes
60
www.capacitare.org.ar
ESTADÍSTICA
De acuerdo a la definición la probabilidad de mujer estará dada por la suma de las
probabilidades de los eventos conjuntos donde se presenta la mujer, es decir
Si designamos a mujer como 𝐹, a varón como 𝑉, infantiles como 𝐼, cadetes como 𝐶 y
mayores como 𝑀 podemos expresar:
𝑃(𝐹) = 𝑃(𝐹 ∩ 𝐼) + 𝑃(𝐹 ∩ 𝐶) + 𝑃(𝐹 ∩ 𝑀)
70 30 20 120
𝑃(𝐹) = + + =
400 400 400 400
Resultado al cual podríamos haber llegado rápidamente si completamos la tabla anterior con
una nueva fila y una columna más que contengan los totales:
FUNDACIÓN CAPACITARE 61
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
ESTADÍSTICA Simplificando tendremos
150
𝑃(𝑉 ⁄𝐼 ) =
220
Claro que la tabla facilita la determinación de estas probabilidades condicionadas analizando
el problema de la siguiente manera:
La probabilidad de que corresponda a un varón, sabiendo que la ficha pertenece a un infantil,
circunscribe el espacio muestral solo al número de infantiles 220 que corresponderá al número
de casos factibles, por otro lado los casos favorables se dará por la cantidad de varones infantiles
que se tengan, en este caso 150, luego aplicando la expresión clásica de probabilidades
150
𝑃(𝑉 ⁄𝐼 ) =
220
62
www.capacitare.org.ar
ESTADÍSTICA
Desarrollando la expresión (1) de acuerdo al teorema de Bayes tendremos:
𝑃(𝑀1 ) . 𝑃 (𝐷/𝑀1 )
𝑃(𝑀1 ⁄𝐷) =
𝑃 (𝐷 ∩ 𝑀1 ) + 𝑃 (𝐷 ∩ 𝑀2 ) + 𝑃 (𝐷 ∩ 𝑀3 )
Desarrollando el denominador:
𝑃(𝑀1 ) . 𝑃 (𝐷/𝑀1 )
𝑃(𝑀1 ⁄𝐷) =
𝑃(𝑀1 ) . 𝑃 (𝐷/𝑀1 ) + 𝑃(𝑀2 ) . 𝑃 (𝐷/𝑀2 ) + 𝑃(𝑀3 ) . 𝑃 (𝐷/𝑀3 )
Reemplazando valores tendremos:
0,5 . 0,04 0,02
𝑃(𝑀1 ⁄𝐷 ) = =
0,5 .0,04 + 0,3 . 0,08 + 0,2 . 0,1 0,02 + 0,024 + 0,02
La probabilidad que un perno, que se sabe está defectuoso, lo produjera 𝑀1 es igual a:
0,02
𝑃(𝑀1 ⁄𝐷) =
0,064
RESOLUCIÓN DEL PROBLEMA
Al inicio de la Unidad 5 se nos planteó el siguiente problema, el cual no podíamos resolver
por falta de herramientas, pero ahora estamos ya en condiciones de resolver.
“La cuarta parte de los propietarios de automotores de esa comunidad deja las llaves puestas
en los automóviles al estacionarlos. Además y de acuerdo a estadísticas el 5% de los automóviles
que estacionados tienen las llaves puestas son robados de la vía pública mientras que solo el 1%
de los automóviles que no tienen las llaves puestas son robados. Indique Ud. la probabilidad de
que un automóvil que ha sido robado en esa ciudad haya tenido las llaves puestas”
Si definimos como evento 𝐴, el dejar las llaves en el estacionamiento, 𝐵 el evento de no
dejarlas y 𝑅 que el automóvil fuera robado, entonces tendremos:
𝑃(𝐴) = 0,25
Por lo tanto la
𝑃(𝐵) = 0,75
Además la probabilidad de que un auto estacionado con las llaves puestas sea robado es de:
𝑃(𝑅/𝐴) = 0,05
y la probabilidad de que sea robado en caso de no tener las llaves puestas es:
𝑃(𝑅/𝐵) = 0,01
Lo solicitado en el problema es la probabilidad de que habiendo sido robado un automóvil,
éste tuviera las llaves puestas. Expresando esta probabilidad condicionada:
𝑃(𝐴 ∩ 𝑅)
𝑃(𝐴/𝑅) =
𝑃(𝑅)
Desarrollando esta expresión tendremos la Regla de Bayes:
FUNDACIÓN CAPACITARE 63
Castilla 336 (2804) Campana – (03489) 423656 / 468374 – consultas@capacitare.org.ar
𝑃(𝐴) . 𝑃 (𝑅/𝐴)
ESTADÍSTICA 𝑃(𝐴⁄𝑅 ) =
𝑃 (𝐴 ∩ 𝑅) + 𝑃 (𝐵 ∩ 𝑅)
Que desarrollando el denominador, también podemos expresar como:
𝑃(𝐴) . 𝑃 (𝑅/𝐴)
𝑃(𝐴⁄𝑅 ) =
𝑃(𝐴) . 𝑃 (𝑅/𝐴) + 𝑃(𝐵) . 𝑃 (𝑅/𝐵)
Reemplazando por valores:
0,25 . 0,05 0,0125 0,0125
𝑃(𝐴⁄𝑅 ) = = =
0,25 . 0,05 + 0,75 . 0,01 0,0125 + 0,0075 0,02
𝑃(𝐴/𝑅) = 0,6255
64
www.capacitare.org.ar