Está en la página 1de 106

UNIVERSIDAD TECNOLÓGICA NACIONAL

FACULTAD REGIONAL CÓRDOBA

PROFESOR TITULAR

MBA ROBERTO P. FUGIGLANDO

Año Lectivo 2020

(PRIMERA PARTE)
Dado que el objetivo perseguido en la elaboración de las presentes
NOTAS de PROBABILIDAD Y ESTADÍSTICA, para alumnos de las
distintas Carreras que se dictan en esta FRC – UTN, no es la formación
de estadísticos, se omiten en los distintos temas, desarrollos
matemáticos de la Estadística Matemática, que el alumno olvida
fácilmente, y que en nada contribuyen, para lograr un aprendizaje
significativo de la materia.

Lo importante a mi criterio, es que el estudiante de esta Facultad,


alcance a comprender el “Qué”, el “Porqué”, el “Dónde”, y el “Cuándo”,
aplicar los métodos, procedimientos y herramientas estadísticas, más
que el “Cómo” de las mismas, cuando se enfrente en su vida como
profesional, en situaciones de toma de decisiones ante situaciones de
incertidumbre, o bien como usuario de información estadística.

Por lo expuesto, en el presente curso se impartirán procedimientos


y técnicas estadísticas, con el fin de motivar a los estudiantes a:

1) Conocer la aplicación de las mismas,


2) Interpretar las distintas herramientas de la Estadística Descriptiva.
3) Adquirir destreza en la interpretación del Cálculo de Probabilidad.
4) Comprender la importancia de la aplicación del análisis estadístico,
en situaciones problemáticas de la sociedad, en la que se va a
desempeñar como profesional.

MBA Roberto P. Fugiglando


Profesor Titular

2
UNIDAD Nº I
“METODOLOGÍA ESTADÍSTICA”

SIGNIFICADO DE ESTADÍSTICA

Podemos decir que la ESTADÍSTICA, está dada por “El conjunto de métodos y
procedimientos, utilizados en la recopilación, organización, presentación, análisis e
interpretación de datos, para extraer conclusiones y tomar decisiones razonables en base a
las mismas, en situaciones de incertidumbre”. También se dice, que es: “La tecnología del
método científico que proporciona instrumentos útiles para la toma de decisiones, en
situaciones de incertidumbre”.

Se la clasifica en:

1) Descriptiva: se corresponde con la metodología utilizada, para describir un


conjunto de datos, a través de métodos numéricos o gráficos. Por ejemplo, la
evolución de las ventas en una empresa, en un cierto período de tiempo.

2) Inferencial: se corresponde con la metodología aplicada, cuando se quiere estudiar


a una cierta población estadística, tomando en consideración sólo a una parte
representativa de los elementos que la conforman. Por ejemplo, cuando se quiere
estudiar si un proceso de producción está operando “bajo control”.

POBLACIÓN ESTADÍSTICA
Está formada por la totalidad de los elementos, acerca de los cuales se realiza una
cierta investigación estadística. Por ejemplo: el total de empresas de una cierta rama de
actividad, o el agua contenida en un cierto dique.

Se la clasifica en:

1) Finita: cuando está conformada, por un número finito numerable de


componentes. Por ejemplo: la totalidad de los empleados de una empresa.

2) Infinita: cuando está conformada por un número finito no numerable, o infinitos


componentes. Por ejemplo: cuando se desea estudiar el grado de contaminación del
agua de un lago.

3
DATO ESTADÍSTICO
Es toda información susceptible se ser sometida al análisis estadístico. Es decir, que
debe poder ser comparada, analizada e interpretada, razón por la cual se dice que los datos
estadísticos, presentan relaciones significativas. De lo expuesto, se deduce que un valor
aislado, no constituye dato estadístico.

RECOPILACIÓN DE DATOS
Los datos estadísticos, pueden ser generados por el investigador mismo, o bien
haber sido recopilados por un tercero. En el primer caso, se dice que la FUENTE DE
DATOS es PRIMARIA, mientras que en el segundo caso, se dice que es SECUNDARIA.

El proceso de generación de los datos estadísticos, puede efectuarse de distintas


formas dadas por:

1) CENSO: es el proceso consistente en estudiar características de cada uno de todos


los elementos de una cierta población estadística, debiendo ser ésta finita, siendo un
relevamiento estático. Por ejemplo: un censo de población, o un inventario de
todos los productos elaborados existentes en un depósito. Cabe destacar que, en
muchas situaciones prácticas, no es posible acceder a cada uno de todos los
componentes de una población estadística, por imposibilidad, problemas de costo,
practicidad, o bien cuando el proceso de obtención del dato es destructivo, como
ocurre cuando se quiere estudiar la resistencia de un cierto material.

2) MUESTRA: consiste en estudiar características de una cierta población estadística,


tomando en consideración sólo una parte representativa de la misma, a través de las
denominadas técnicas de muestreo, de forma tal que, las conclusiones obtenidas de
esa parte, puedan ser generalizadas al resto de los elementos de la población, a
través de la metodología de la inferencia estadística. Resulta aplicable tanto a
poblaciones finitas como infinitas, siendo el único método de investigación en este
último caso, así como cuando el proceso de investigación es destructivo. Por
ejemplo, estudiar la contaminación del agua de un río, o bien la vida útil de
lámparas de luz de una determinada marca.

3) REGISTRO EXHAUSTIVO: la información estadística se obtiene por un acto


administrativo, como ocurre por ejemplo, cuando se quiere estudiar la procedencia
de los alumnos de una Facultad, la que puede obtenerse cuando el alumno
cumplimentó su inscripción en esa Facultad, así como la oficina de Registro Civil
de un lugar, cuando se desea saber el número de nacimientos inscriptos en el
mismo, en un cierto período de tiempo.

4
4) DISEÑO DE EXPERIMENTO: es el proceso que se presenta cuando el
investigador genera sus propios datos, diseñando un experimento, a la medida de
sus necesidades. Por ejemplo, probar la eficiencia de determinadas drogas para
tratar una determinada enfermedad.
Primaria

Según la Fuente

Secundaria
Recopilación de datos

Censo

Según la forma Muestra


de recolección
Registro exhaustivo

Diseño de experimento

UNIDAD ESTADÍSTICA Y UNIDAD DE RELEVAMIENTO


Se denomina unidad estadística o unidad elemental, a cada componente de una
población estadística. Por ejemplo, si se está estudiando el modelo de auto de una cierta
marca más vendido, cada auto de esa marca, sería la unidad estadística.

Se denomina unidad de relevamiento donde la información estadística va a ser


recopilada, o por quien proporciona la misma. Por ejemplo, si queremos saber de la
producción diaria de una empresa, cuántos artículos fallados fueron producidos, y existe
en la misma un área de Control de Calidad, este sector sería la unidad de relevamiento. En
un censo de población, la unidad de relevamiento es el hogar.

Cabe destacar que, existen situaciones en las que ambas unidades coinciden. Así
por ejemplo, si queremos saber las edades de los alumnos de este curso y le consultamos a
cada uno de los alumnos su edad, son coincidentes, mientras que si se obtiene el dato de los
legajos de los alumnos, no son coincidentes.

ESTUDIOS Y MÉTODOS ESTADÍSTICOS


Acorde a la intervención del investigador los estudios estadísticos pueden ser:

 Observacionales.
 Experimentales.

5
Se dice que se realizan estudios observacionales cuando los datos se generan a partir
de un censo, muestra o registro exhaustivo, y consisten en medir u observar las unidades
elementales de una cierta población midiendo, observando y registrando las características
bajo estudio.

Los estudios observacionales, pueden ser retrospectivos o prospectivos. Los


retrospectivos evalúan situaciones pasadas, en busca de una explicación de
acontecimientos actuales. Así por ejemplo estudiar el grado de formación profesional, de
los gerentes exitosos de distintas empresas. Los prospectivos, realizan un seguimiento en
el futuro de los efectos de algún acontecimiento observado, en el presente o en el pasado.
Por ejemplo registrar sistemáticamente la penetración en el mercado en los próximos años
de un cierto producto, resultante de la implementación de una nueva estrategia de ventas.

Los estudios experimentales son aquellos en los que el investigador, diseña un


experimento, consistente en aplicar uno o más tratamientos a las unidades elementales de
una cierta población, analizando los resultados obtenidos.

Considerando el objetivo perseguido por el investigador, los estudios pueden ser


exploratorios o confirmatorios. Los primeros, son aquellos aplicados cuando se quiere
determinar un modelo, que describa o explique el comportamiento de distintas variables de
los componentes de una población. Por ejemplo, tratar de encontrar un modelo
econométrico, asociado al comportamiento de las variables relacionadas con la demanda
de productos de las empresas, de una cierta rama de actividad. Los confirmatorios en
cambio tratan de determinar si el comportamiento de distintas variables, de los
componentes de una población, responden a un modelo supuesto. Por ejemplo, evaluar si
realmente un modelo econométrico propuesto, se corresponde con el comportamiento, de
las variables asociadas a la demanda de los productos de las empresas de una cierta rama de
actividad. Retrospectivos
Observacionales
Prospectivos

Según la intervención
del investigador
Experimentales

Estudios estadísticos

Exploratorios

Según el objetivo
del estudio

Confirmatorios

6
VARIABLES

De las unidades estadísticas de una determinada población podemos estudiar una o


más características dadas por la o las variables.

Se clasifican a las variables de dos formas:


1) Cualitativas o Categóricas.
2) Cuantitativas o Numéricas.

1) Son Cualitativas, aquellas en la característica bajo estudio es un atributo o


categoría. Por ejemplo: la profesión de los empleados de una empresa.

De acuerdo a la forma de medición las variables Cualitativas pueden ser


clasificadas en escalas dadas por:

a) Escala Nominal: es aquella, en la que no es


posible establecer una relación de magnitud, entre
los distintos atributos, en que puede ser expresada
la variable. Por ejemplo: nacionalidad de las
personas.

Poco relevante. Se b) Escala Ordinal: es el caso en que es posible,


aplica cuando se realiza establecer un orden de importancia entre los
un proceso de
investigación
distintos atributos en que puede ser expresada la
variable. En esta escala de medición, es posible
establecer relaciones del tipo A > B, A = B, o A <
B. Por ejemplo, la opinión de las personas, acerca
del servicio brindado por una empresa, siendo las
posibles respuestas: Excelente, Muy Bueno, Bueno,
Regular, Malo. Se observa, que no es posible decir
que los que responden Bueno están doblemente
satisfechos, en relación a los que respondieron
Malo.

2) Son Cuantitativas, aquellas en la característica bajo estudio es numérica.


Según sea la forma de obtener el valor numérico, se las clasifica en:

 Discretas: cuando el valor surge de un proceso de


conteo, asumiendo por lo tanto valores enteros. Por
ejemplo: el número de empleados de una empresa.

 Continuas: cuando el valor, surge de un proceso de


medición, siendo la diferencia entre un valor y otro un
infinitésimo, asumiendo por lo tanto cualquier valor real.
Por ejemplo: la altura de los empleados de una empresa.

7
De acuerdo a la forma de medición las variables Cuantitativas pueden ser
clasificadas en escalas dadas por:
a) Escala de Intervalos: representa un nivel superior
de medición respecto a la escala ordinal,
permitiendo establecer relaciones del tipo A > B, A
= B, o A < B. De la misma forma, es posible
comparar intervalos de valores como consecuencia
de que, a lo largo de toda la escala, dos valores
adyacentes representan siempre la misma diferencia
de magnitud, siendo posible realizar comparaciones
tal como, A > B. Una característica de esta escala,
es que el valor cero es arbitrario. Un ejemplo de
una variable en esta escala de medición, puede
estar dado por el horario de ingreso de los
empleados a su trabajo en una fábrica. Entre las 8 y
las 9 de la mañana existe la misma diferencia
horaria que entre las 4 y 5 de la tarde, pero no es
posible afirmar que quien ingresó a las 8 de la
noche, ha ingresado el doble de tarde, de aquel
que ingresó a las 8 de la mañana. Cabe destacar
que, la hora cero no indica particularmente nada.

b) Escala de Razón: representa el nivel más alto de


medición. Además de tener las propiedades de las
otras escalas, tiene un cero absoluto, pudiéndose
calcular proporciones entre los valores de la escala.
Así por ejemplo podemos afirmar que, una persona
de 38 años tiene el doble de edad que una de 19, o
que la diferencia entre una persona de 38 años y
otra de 39 es la misma que la existente entre una
persona de 19 años y otra de 20, o que una persona
de 30 años es mayor que otra de 22. Sobre esta
escala, es posible realizar todas las operaciones
matemáticas asociadas a los números (suma, resta,
multiplicación, división).

Cualitativas

Características en estudio  VARIABLES Discretas



Cuantitativas Conteo

Continuas

Medición

8
Nominal

Cualitativas

Ordinal
Escalas de medición de las VARIABLES

Intervalo
Cuantitativas
Cualitativas
Razón

Cabe destacar que de acuerdo al número de variables en estudios, los


métodos de análisis estadísticos, pueden ser Univariados o Multivariados. Los primeros
consideran una única variable, mientras que los segundos dos o más.

Univariados

Análisis estadísticos según el número de VARIABLES

Multivariados

La correcta clasificación de las variables en estudio, el número de ellas, así como la


definición de la escala de medición, orientará al investigador, sobre las técnicas
estadísticas más adecuadas para analizarlas.

PARÁMETROS Y ESTADÍGRAFOS

Se denomina Parámetro, a toda medida estadística calculada considerando a todos


los elementos, de una población bajo estudio. Por ejemplo, calcular las ventas promedio de
las empresas, de una determinada rama de actividad, considerando las ventas de cada una
de todas esas empresas.

Se denomina Estadígrafo, Estadístico o Estimador, a toda medida estadística,


calculada considerando una muestra de los elementos de una determinada población. Esta
medida, servirá de estimador, del verdadero valor del parámetro de esa población
(Inferencia Estadística).

9
UNIDAD Nº II
“ORGANIZACIÓN Y PRESENTACIÓN
DE DATOS ESTADÍSTICOS”

DISTRIBUCIONES UNIDIMENSIONALES
Cuando de las unidades estadísticas de una población bajo estudio, se considera
una sola variable, se dice que se está en presencia de una investigación unidimensional. Si
son dos las variables, bidimensional, y así sucesivamente.

SERIE SIMPLE
Se denomina de esta forma, al conjunto de datos obtenidos en bruto, luego de
realizado el relevamiento pertinente. En forma genérica, se denota con xi a cada
observación, variando el subíndice i desde 1 hasta n, siendo n el total de observaciones.
En consecuencia, simbólicamente una Serie Simple de n elementos, en una investigación
unidimensional, adoptará la forma:

x1 , x2 , x3 , …….., xn  xi / i = 1 , n

Por ejemplo, si de los 14 empleados de una empresa se quiere saber el número de


hijos que cada uno de ellos tiene, una serie simple, podrá adoptar la forma:

x1=3; x2=2; x3=3 ; x4=2; x5=1; x6=0; x7=5; x8=2; x9=3; x10=3; x11=1; x12=0; x13=1; x14=3

En el ejemplo considerado, con xi se quiere representar el número de hijos del


empleado entrevistado, que genéricamente, se los individualiza con el subíndice i.

DISTRIBUCIONES DE FRECUENCIAS
(Datos agrupados)
Pueden presentarse dos situaciones:
1) Variable Discreta
2) Variable Continua

10
DISTRIBUCIÓN DE FRECUENCIA DE
VARIABLE DISCRETA
Si los datos de una serie simple se corresponden con una variable discreta, y sus
valores son homogéneos, pueden agruparse los que son iguales, definiendo una nueva
variable, que la denotaremos con yi , variando el subíndice i, desde 1 hasta k, siendo k el
número de valores distintos de la variable observados en la serie simple. Con los valores
de la nueva variable, y el número de veces que ese valor aparece repetido, en la serie
simple, denominada frecuencia absoluta, que la denotaremos con ni, se construye una
tabla, denominada Distribución de Frecuencia o Datos Agrupados de Variable Discreta.

Considerando la serie simple anterior, correspondiente al número de hijos de los 14


empleados de una empresa, la distribución de frecuencia de variable discreta asociada,
responderá a la forma:

Nº de hijos Nº de empleados Relativa Frecuencias Acumuladas


yi ni Absoluta hi Ni Ni = n(i+1)+ni Hi Hi = Ni/n

Absoluta Relativa
0 2 0,15 2 0,15
1 3 0,21 5 0,36
2 3 0,21 8 0,57
3 5 0,36 13 0,93
5 1 0,07 14 1,00
 14 1,00

Las frecuencias absolutas ( ni ) representativas del número de veces, que el valor de


la variable aparece repetido en la serie simple, tienen las siguientes propiedades:

a) Son números enteros comprendidos entre 0 y n, siendo n el total de


observaciones.

b)  ni = n, (Nº de observaciones).

Frecuencias relativas
Se las denota con hi, y se obtienen del cociente entre las frecuencias absolutas
asociadas a cada valor de la variable, y el total de observaciones. Es decir:

hi = ni / n

11
Las frecuencias relativas, indican la importancia relativa, de cada valor de la
variable en relación al total de observaciones, pudiéndoselas interpretar en términos
porcentuales. Verifican las siguientes propiedades:

a) Son números fraccionarios, comprendidos en el intervalo: 0 ≤ hi ≤ 1.

b)  hi = 1

Frecuencias Acumuladas
Son representativas del total acumulado de frecuencias absolutas o relativas, hasta
un determinado valor de la variable. Se las denota con Ni , a las absolutas acumuladas, y
con Hi , a las relativas acumuladas.

Las últimas frecuencias acumuladas son iguales a:

 Nk = n (Total de observaciones)

 Hk = 1

Expresión genérica de una Distribución de Frecuencias de Variable


Discreta
Suponiendo k valores distintos de la variable, observados en la serie simple,
genéricamente, una distribución de frecuencias de variable discreta, responde a la
estructura:

yi ni hi Ni Hi

y1 n1 h1 N1 H1
y2 n2 h2 N2 H2
. . . . .
. . . . .
. . . . .
yk nk hk Nk Hk

 n 1

12
Representación gráfica de una Distribución de Frecuencias de Variable
Discreta

Se presentan dos situaciones:

a) Frecuencias Simples ( ni y hi )
b) Frecuencias Acumuladas ( Ni y Hi )

a) Frecuencias absolutas y relativas simples ( ni y hi )

Se corresponde con el denominado gráfico de los bastones, idénticos, para ambos


tipos de frecuencias, sólo con un cambio de escala en el eje de las ordenadas, en el caso de
las relativas, puesto que:

hi = ni / n  hi = ni . 1/n

Considerando los datos del problema anterior, el gráfico responde a la forma:

5 5/14 hi

Nº de Empleados 4 4/14

ni 3 3/14

2 2/14

1 1/14

0 1 2 3 5
Nº de hijos

13
b) Frecuencias Absolutas y Relativas Acumuladas ( Ni y Hi )

Su representación gráfica está dada por el diagrama escalonado con trazos


discontinuos, siendo el mismo, para ambos tipos de frecuencias, sólo con un cambio de
escala en el eje de las ordenadas, en el caso de las relativas, por lo expuesto anteriormente.
Considerando los datos del problema anterior, el gráfico responde a la forma:

Nº de empleados
14 1
Ni Hi
12 12/14

10 10/14

8 8/14

6 6/14

4 4/14

2 2/14

0 1 2 3 5
Nº de hijos

DISTRIBUCIÓN DE FRECUENCIA DE VARIABLE


CONTINUA
Cuando los datos de una serie simple, se corresponden con una variable discreta
con valores heterogéneos, o bien, con una variable continua, en forma agrupada los
valores de la variable, se expresan en grupos denominados genéricamente “intervalos de
clase", conteniendo valores homogéneos de la variable, en lo posible, dentro de cada
intervalo, denotándose a los extremos izquierdo y derecho de los mismos, de la forma:
y´i–1 y y´i , respectivamente.

Los intervalos de clase, no necesitan ser del mismo tamaño, pero para facilitar la
interpretación de la representación gráfica de la distribución de frecuencia, así como para
el cálculo de las distintas medidas estadísticas, es conveniente que sean del mismo tamaño.

14
Cabe destacar que los intervalos se consideran “semiabiertos por la derecha”, es
decir “desde el extremo izquierdo……hasta menos el extremo derecho”, con excepción
del último intervalo, que es “cerrado” en ambos extremos, es decir “desde…….hasta”.

Los conceptos de frecuencias absolutas y relativas simples, se corresponden con el


número de observaciones asociadas a los valores de la variable de cada intervalo, y se las
denota de la misma forma que en una distribución de frecuencia de variable discreta, (ni y
hi respectivamente). En el caso de las Acumuladas, son representativas del total
acumulado de frecuencias (absolutas o relativas), hasta el valor de la variable
correspondiente al extremo derecho del intervalo donde se encuentra, sin considerar el
valor de dicho extremo, ya que son semiabiertos por la derecha, excepto el último
intervalo. Se las denota con Ni a las Absolutas Acumuladas, y con Hi a las Relativas
Acumuladas.

Para la construcción de una Distribución de Frecuencias de Variable Continua, se


procede de la siguiente forma:

1) Se calcula el Recorrido de la variable ( R ), dado por la diferencia entre


el valor mayor y el valor menor, de los observados de la variable en la
Serie Simple. Así por ejemplo, si el mayor valor es 93 y el menor 43, el
Recorrido estará dado por:

R = 93 – 43 = 50

2) a) Si se tiene como dato el número de intervalos, es necesario


determinar la amplitud de los mismos ( ci ), de la forma:

Amplitud ( ci )  Recorrido / Nº de intervalos

Cabe destacar que la amplitud de un intervalo, está dada por la


diferencia entre el extremo derecho e izquierdo de cada intervalo de
clase, es decir:

ci = y´i - y´i–1

Así por ejemplo, si se desea una distribución de frecuencias con 5


intervalos de clase, considerando el Recorrido anterior, se tendrá:

Amplitud = 50/5 = 10

Observación: Es conveniente que la amplitud sea un número


divisible por 2. En caso de no serlo, debe ampliarse el Recorrido.
15
b) Si se da como dato la amplitud de los intervalos, debe
determinarse el número de los mismos, de la forma:

Nº de intervalos  Recorrido / Amplitud

Así por ejemplo, considerando el Recorrido anterior y una amplitud


de los intervalos de 10 se tendrá:

Nº de intervalos = 50/10 = 5

OBSERVACIÓN: En el caso de que al efectuar el cociente, se


obtenga un número decimal, debe ampliarse el Recorrido, para de esta
manera, lograr un número natural.

3) Una vez determinados los intervalos de clase, acorde a lo expuesto en


el punto anterior, debe efectuarse el conteo, consistente en asignar a
cada intervalo, los valores de la variable que figura en la Serie Simple,
es decir las frecuencias absolutas, considerando el principio de que los
intervalos son semiabiertos por la derecha, excepto el último que es
cerrado en ambos extremos, quedando determinada una tabla que es la
“Distribución de Frecuencias de Variable Continua”.

Ejemplo:
Se clasificó al personal de una empresa de acuerdo a sus edades, obteniéndose la
siguiente Distribución de Frecuencia de Variable Continua:

Edades Nº de empleados FR FAA FRA Marca de clase


y´i–1 y´i ni hi Ni Hi yi

18 26 20 0,10 20 0,10 22
26 34 30 0,15 50 0,25 30
34 42 40 0,20 90 0,45 38
42 50 50 0,25 140 0,70 46
50 58 40 0,20 180 0,90 54
58 66 20 0,10 200 1,00 62
 200 1,00

16
La “marca de clase” (yi ) está dada por el punto medio de cada intervalo de clase y se
calcula a los efectos de determinar un valor representativo de la variable de cada intervalo
de clase, para obtener las distintas medidas estadísticas. Su valor surge del cociente:

y´i - 1  y´i
yi 
2

Expresión genérica de una Distribución de


Frecuencias de Variable Continua
Suponiendo una distribución de frecuencia de variable continua, con k intervalos
de clase, simbólicamente, la podemos expresar de la forma:

Inter. de clase Marca de clase Frec. Abs. Frec. Rel. Frec.Abs.Ac. Frec.Rel.Ac.

y´i–1 y´i yi ni hi Ni Hi

y´0 y´1 y1 n1 h1 N1 H1

y´1 y´2 y2 n2 h2 N2 H2

¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨ ¨¨¨¨ ¨¨¨¨¨ ¨¨¨¨ ¨¨¨¨¨ ¨¨¨¨¨¨

y´k-1 y´k yk nk hk Nk Hk
 n 1

Representación gráfica de las frecuencias absolutas y


relativas simples en una Distribución de
Frecuencias de Variable Continua (ni y hi)

17
La representación gráfica de las frecuencias absolutas y relativas simples, da lugar
al denominado “Histograma de Frecuencias”, que adopta la forma, considerando los datos
del problema dado:

Poligonal
60 60/200
ni hi
40 40/200

20 20/200

0 0
18 26 34 42 50 58 66
Intervalos de clase

Uniendo los puntos medios de cada rectángulo del Histograma, que se corresponden
con los valores de las marcas de clase de cada intervalo, queda determinada la
“Poligonal de frecuencias absolutas o relativas Simples”, la que sirve para caracterizar
gráficamente a una distribución de frecuencias de variable continua, siendo el área entre la
poligonal, y el eje de las abscisas, igual a la suma de las superficies de los rectángulos del
histograma, que da lugar a la “densidad de frecuencias”. Cabe destacar que anteriormente,
se planteó la conveniencia de que la amplitud de los intervalos de clase sea la misma, para
facilitar la interpretación gráfica de una distribución de frecuencias.

Representación gráfica de las frecuencias absolutas y


relativas acumuladas, en una Distribución de
Frecuencias de Variable Continua (Ni y Hi)

Tanto en el caso de las Absolutas Acumuladas, como en el de las Relativas


Acumuladas su representación gráfica consiste en el denominado “Diagrama escalonado
con trazos continuos”, siendo idéntico para ambos tipos de frecuencias, sólo con un
cambio de escala en el eje de las ordenadas, en el caso de las relativas acumuladas.

Considerando los datos del problema anterior, responde a la forma:

18
210 210/200
Poligonal 200/200
180 180/200
Ni Hi
150 150/200

120 120/200

90 90/200

60 60/200
35
30 30/200

0 0
18 26 30 34 42 50 58 66
Intervalos de clase

La poligonal de Frecuencias Acumuladas, permite realizar interpolaciones


lineales gráficas. Así por ejemplo si quisiéramos saber el número de empleados con edades
de hasta 30 años, se tendrá: 20 + 15 (dado que en el segundo intervalo la frecuencia
absoluta es 30, y al ser la interpolación lineal hasta 30 años, que es la marca de clase se
tendrá 30/2 = 15).

DIAGRAMA DE TALLO Y HOJA


Otra forma de organizar datos sin procesar, en grupos, es a través de un
Diagrama o Gráfico de Tallo y Hoja, el que se construye al separar los dígitos de cada
número de los datos, en dos grupos, un tallo y una hoja. Los dígitos del extremo izquierdo,
son el tallo, y están formados por los dígitos, de más alto valor. Los dígitos del extremo
derecho, son las hojas, y contienen los valores más bajos. Si un conjunto de datos tiene
sólo dos dígitos, el tallo es el valor de la izquierda, y la hoja, el de la derecha. Por
ejemplo, si 56 es uno de los números, el tallo es 5 y la hoja 6. Para números con más
dígitos, queda librado al juicio del investigador, la determinación del tallo y hoja.

Ejemplo:
Los siguientes valores se corresponden con las calificaciones obtenidas por 35
aspirantes a un puesto de trabajo:

19
86 77 91 60 55
76 92 47 88 67
23 59 72 75 83
77 68 82 97 89
81 75 74 39 67
79 83 70 78 91
68 49 56 94 81

Construir un Diagrama de Tallos y Hojas:

Solución:
Tallo Hoja
2 3
3 9
4 7 9
5 5 6 9
6 0 7 7 8 8
7 0 2 4 5 5 6 7 7 8 9
8 1 1 2 3 3 6 8 9
9 1 1 2 4 7

Como se observa, podemos decir que un Diagrama de Tallos y Hojas presenta las
siguientes ventajas:

1) Puede verse si las calificaciones están en el extremo superior o inferior


dentro del rango de valores.

2) Los valores de los datos originales sin procesar se mantienen, permitiendo


dar una estructura del histograma de frecuencia. (Recordar que en una
distribución de frecuencia de variable continua se utiliza como
representativo de los valores de las variables de cada intervalo a las marcas
de clase).

20
UNIDAD Nº III
“PARÁMETROS Y ESTADÍSTICOS”

CONSIDERACIONES
En las unidades anteriores, se desarrollaron conceptos básicos de Estadística, así
como distintas formas de presentar en forma organizada y resumida, los datos relevados
en una investigación estadística.

En la presente unidad, consideraremos las principales medidas estadísticas


descriptivas, de resumen, de un conjunto de datos. Están dadas por:

1) Medidas de Posición.
2) Medidas de Dispersión.
3) Medidas de Forma, Asimetría o Sesgo.
4) Medidas de Puntiagudez o Curtosis.

1) MEDIDAS DE POSICIÓN
Son medidas descriptivas de resumen, representativas del valor de la variable, en
torno a la cual se concentran las observaciones. Así por ejemplo, si se tiene a las
distribuciones A y B:

A B

XA XB

21
Se observa que ambas tienen la misma forma, concentrándose los datos en torno al
valor de la variable XA, en la distribución A, y en torno a XB, en la distribución B, siendo
XA y XB valores de una medida de posición.

PRINCIPALES MEDIDAS DE POSICIÓN

1) MEDIA ARITMÉTICA

a) Serie Simple:

Dada una Serie Simple, correspondiente a una muestra de n observaciones, de


una variable xi  x1 , x2 , x3 , ………, xn , la Media Aritmética o Promedio
MUESTRAL, simbolizada con M(x) o x , surge: de la suma de los valores de la
variable observada, dividido por el número de los mismos, dando lugar a la
denominada “Fórmula de la Media Simple”. Es decir:

x1  x2  x3  ....  xn  xi
i 1
M(x)  x  
n n


Media Simple Muestral

En el caso de que la Serie Simple, se corresponda con todos los valores de la


variable de la población bajo estudio, (N observaciones) : x1 , x2 , x3 , ………,
xN, la Media Aritmética o Promedio POBLACIONAL, denotada con  va a
estar dada por:

22
N
 xi
x1  x2  x3  ....  xN i  1
M(x)  μ  
N N


Media Simple Poblacional

b) Datos Agrupados:
En el caso de una Distribución de Frecuencias, tanto de variable discreta como de
variable continua, la Media Aritmética denotada con M(y) o y , surge: de la
suma de los productos entre cada valor de la variable o marca de clase, (según
sea distribución de frecuencia de variable discreta o de variable continua,
respectivamente), y las respectivas frecuencias absolutas, dando lugar a la
denominada “Fórmula de la Media Ponderada”, pudiendo ser muestral o
poblacional según se considere los datos de una muestra o de toda la población,
respectivamente. Es decir:

n
y1.n1  y2.n2  y3.n3  ....  yn.nn  yi.ni
i 1
M(y)  y  
n n


Media Ponderada Muestral

N
 yi.ni
y1.n1  y2.n2  y3.n3  ....  yN.nN i 1
M(y)  μ  
N N

Media Ponderada Poblacional


valor de la variable (DISCRETA)
yi 
marca de clase (CONTINUA)

23
Ejemplo 1:
El número de empleados que faltaron por día en una empresa, en los últimos 20
días laborables, está dado por:

4;5;2;2;0;1;1;1;6;2;2;2;2;2;5;4;4;1;1;2

Calcular el promedio diario de empleados, que faltaron considerando:

a) Serie Simple.
b) Distribución de frecuencia de variable discreta.

Solución:

x i

a) M(x)  x  i
 Serie Simple
n


49
M (x)  x   2,45 empleados por día
20

y n i. i

b) M( y)  y  i
 y  valor de la variable  Datos Agrupados
n

Construyendo la distribución de frecuencia de Variable Discreta:

Nº de empleados ausentes Nº de días


yi ni yi.ni

0 1 0
1 5 5
2 8 16
4 3 12
5 2 10
6 1 6
∑ 20 49

24
49
Operando se obtiene  M (y)  y   2,45 empleados por día
20

Ejemplo 2:
La antigüedad en sus empleos (en años), de los empleados de un Hipermercado
está dada por:

Antigüedad (en años) Nº de empleados


y´i -1 y´i ni
3 5 50
5 7 70
7 9 90
9 11 40
11 13 30
13 15 20
∑ 300

Calcular la antigüedad promedio de los empleados.

Solución:

y n i. i

M ( y)  y  i
 y  marca de clase
n

25
Antigüedad (en años) Nº de empleados Marca de clase
y´i -1 y´i ni yi yi ni
3 5 50 4 200
5 7 70 6 420
7 9 90 8 720
9 11 40 10 400
11 13 30 12 360
13 15 20 14 280
∑ 300 2.380
Aplicando la fórmula, resulta:

 yi.ni 2.380
M (y)  y    7,93 años de antiguedad
n 300

PROPIEDADES DE LA MEDIA ARITMÉTICA


I. “La media aritmética de una constante, es la constante misma”.

M ( k ) = k ; k  constante

II. “La media aritmética del producto entre una constante y una variable es igual al
producto de la constante por la media aritmética de la variable”.


M(k.x) = k.M(x) ; k  constante

III. “La media aritmética de la suma de una constante y una variable es igual a la
suma de la constante y la media aritmética de la variable”.


M(k + x) = k + M(x) ; k  constante

26
IV. “La media aritmética de una suma de variables expresadas en igual unidad de
medida es igual a la suma de las medias aritméticas de cada una de las variables
consideradas”.

M(x + y) = M(x) + M(y) ; x, y  variables

V. “La suma de los desvíos o diferencias entre cada valor de la variable y su media
aritmética, ponderadas en el caso de datos agrupados, es igual a cero”.


a) Serie Simple  ∑ (xi - x ) = 0

b) Datos Agrupados  ∑ ( yi - y )ni = 0

VI. “La suma de los desvíos o diferencias entre cada valor de la variable y su media
aritmética elevadas al cuadrado y ponderadas en el caso de datos agrupados, es
un mínimo”.

a) Serie Simple  ∑ (xi - x )2 < ∑ (xi - k)2 ; k ≠ x

b) Datos Agrupados  ∑ ( yi - y )2. ni < ∑ ( yi - k)2. ni ; k ≠ y

MEDIA GENERAL O TOTAL


Dado un conjunto de n observaciones, las que subdividen en k grupos distintos, y
se calcula en cada uno de ellos la media aritmética, la “MEDIA TOTAL O GENERAL”,
se obtiene de la: suma de los productos entre la media de cada grupo, y su respectivo
tamaño, dividido todo por el total de observaciones.

Grupo yi ni

1 y1 n1

2 y2 n2

27
k
 yi.ni
3 y3 n3  Media General o Total  M( y )  y  i 1
n
. . . .
. . . .
k yk nk

Ejemplo:
Se clasificó al personal de una empresa en dos grupos y se calculó el sueldo medio
mensual (en dólares) en cada grupo, obteniéndose los siguientes valores:

y A = 700 y B = 8.200
Empleados ; Directivos
(A) n A = 450 (B) nB = 15

Calcular el promedio mensual de los sueldos pagados a todo el personal .

Solución:

k
 yini yA.nA  yB.nB 700.450  8200.15 438.000
M ( y )  y  i 1  M(y)  y     941,94 U$S
n nA  nB 450  15 465

yA  yB 700  8.200 8900


Promedio Erróneo  M( y )  y     4.450 U$S
2 2 2


No tomar en consideración a las Ponderaciones

28
2) MEDIANA

La Media Aritmética como medida de posición resulta útil, siempre que los valores
de la variable observada, sean homogéneos. En caso contrario, resulta más adecuada
como Medida de Posición la MEDIANA, dada por el valor de la variable que supera a no
más de la mitad de las observaciones y es superada por no más de la mitad de las mismas,
siendo menos sensible que la media aritmética ante la presencia de valores extremos. Es
decir, la MEDIANA es el valor de la variable ubicado en el medio de un conjunto de
valores ordenados de la variable, o sea el valor central. Para que un valor de la mediana
tenga sentido, el nivel de medida de los datos, debe ser por lo menos ordinal, para poder
efectuar el ordenamiento. Se la denota con Me o X.5.

Me

½

CÁLCULO DE LA MEDIANA

a) Serie Simple:
1) Se ordenan los datos en sentido creciente o decreciente.
2) Se determina la Mediana, que se corresponde con el valor de la variable
ubicado en el valor central. Es decir:

Me = x. 5 = x n+1 º
2

Observaciones:

 Si el número de datos ( n ) es par, el valor de la Mediana se obtiene


de la media aritmética de los valores centrales de la variable, siendo
su valor coincidente con uno observado, sólo si son iguales los
valores centrales.

 Si el número de datos ( n ) es impar, el valor de la Mediana será


igual a un valor realmente observado de la variable.

29
Ejemplo 1:
Las temperaturas observadas en un cierto lugar en grados centígrados (ºC), están
dadas por:

-10 ; 2 ; 1 ; 0 ; -1 ; -3 ; -4 ; 1 ; -1 ; 0 ; 3

Calcular:

1) Temperatura media.
2) Temperatura mediana.

Solución:
n

x i
 10  2  1  ......  3  12
1) Media  M(x)  x  i 1
 M( x )    - 1,09 º C
n 11 11

2) Mediana:
1. Ordenar los datos

-10
- 4
- 3
- 1
- 1
x6º  0  Me = 0 ºC
0
1
1
2
3

2. Me  x.5  x n + 1º  n = 11  Me = x 11 + 1º = x6º = 0 ºC
2 2

30
Ejemplo 2:

Las temperaturas observadas en un cierto lugar en grados centígrados (ºC), están


dadas por:

-10 ; 2 ; 1 ; 0 ; -1 ; -3 ; -4 ; 1 ; -1 ; 0 ; 3 ; 45

Calcular:

1) Temperatura media.

2) Temperatura mediana.

Solución:
n

x i
 10  2  1  ......  3  45 33
1) Media  M(x)  x  i 1
 M( x )    2,75 º C
n 12 12

2) Mediana:

1. Ordenar los datos

-10
- 4
- 3
- 1
- 1
x6º  0  Me = 0 ºC
x7º  0
1
1
2
3
45

2. n  12  Me  x  n 2 1  º  x    x
12  1
2
º  x
6,5 º  x6º x7º
2
  0 2 0  0 º C
31
Observación:

Analizando los Ejemplos 1 y 2, se observa que en el 2, sólo se agregó a la serie


simple del 1, el valor 45, lo que generó que la media aritmética pase de (-1,09 ºC) a (2,75
ºC), mientras que la mediana, no operó modificación alguna. Es por ello, que se dice que
la media aritmética es muy sensible, a la presencia de valores extremos, siendo
conveniente en estos casos calcular como medida de posición a la mediana.

b) Datos Agrupados de Variable Discreta:

En el caso de una distribución de frecuencias o datos agrupados de variable


discreta, el valor de la Mediana surge aplicando los siguientes pasos:

1. Calcular la mitad de las observaciones, es decir: n/2, siendo n el total de


datos.

2. Determinar Nj, que es la menor de las frecuencias absolutas acumuladas,


que supera a la mitad de las observaciones (n/2).

3. Relacionar Nj-1, que es la frecuencia absoluta acumulada inmediata anterior


a Nj, con n/2, pudiéndose presentar dos situaciones:

a) Nj-1 = n/2


y j - 1  y j
Me   Promedio aritmético de los valores de las variables
2
relacionadas con Nj-1 y Nj respectivamente.

b) Nj-1 < n/2  Me = yj  yj es el valor de la variable asociada a Nj.

32
Ejemplo 1:

Calcular la Mediana de la siguiente distribución de frecuencia de variable discreta:

yi ni Ni

1 9 9
3 12 21  Nj-1
Me = yj  7 15 36  Nj
9 10 46
20 5 51
100 3 54
∑ 54

Solución:

Procediendo acorde a lo antes expuesto:

1. n/2 =   n/2 = 54/2 = 27

2. Nj =   Nj = 36

3. Nj-1 = 21  Nj-1 < n/2  Me = yj  Me = 7


Ejemplo 2:
Calcular la Mediana de la siguiente distribución de frecuencia de variable discreta:

yi ni Ni

1 8 8
3 12 20
yj-1  7 7 27  Nj-1
yj  9 13 40  Nj
20 8 48
100 6 54

∑ 54

Solución:
33
Procediendo en forma análoga al problema anterior:

1. n/2 =   n/2 = 54/2 = 27

2. Nj =   Nj = 40

yj - 1  yj 79
3. Nj-1 = 27  Nj-1 = n/2  Me   Me  8
2 2

c) Datos Agrupados de Variable Continua:

En el caso de una distribución de frecuencias o datos agrupados de variable


continua, el valor de la Mediana surge de la aplicación de los siguientes pasos:

1. Calcular la mitad de las observaciones, es decir: n/2, siendo n el total de


observaciones.

2. Determinar Nj, que es la menor de las frecuencias absolutas


acumuladas, que supera a la mitad de las observaciones (n/2).

3. Relacionar Nj-1 que es la frecuencia absoluta acumulada inmediata


anterior a Nj, con n/2.
Se demuestra que, la fórmula de cálculo de la mediana, en una
distribución de frecuencia de variable continua, está dada por:

n/2  Nj  1
Me  y j - 1  cj
nj

Siendo:

 y´j-1  extremo izquierdo del intervalo correspondiente a Nj, denominado


intervalo mediano.

34
 cj  amplitud del intervalo mediano.
 n/2  mitad de las observaciones.
 Nj-1  frecuencia absoluta acumulada, inmediata anterior a Nj.
 nj  frecuencia absoluta, correspondiente al intervalo mediano.

Observación:

Si: Nj-1 = n/2  Me= y’j-1  extremo izquierdo del intervalo de clase
mediano.

Ejemplo 1:
Calcular la mediana, de la siguiente distribución de frecuencia de variable
continua:

y´i-1 y´i ni Ni

4 8 5 5
8 12 9 14  Nj-1
y´j-1  12 16 20 34  Nj
16 20 6 40
20 24 10 50

∑ 50

Solución:
1. n/2 =   n/2 = 50/2 = 25

2. Nj =   Nj = 34  Nj-1 = 14

n/2  Nj  1
3. Relacionar Nj-1 con n/2  14 < 25  Me  y j - 1  cj
nj

35
Reemplazando en la fórmula por sus iguales, resulta:

25 - 14
Me  12  4  14,2
20

Ejemplo 2:

Calcular la mediana de la siguiente distribución de frecuencia de variable continua:

y´i-1 y´i ni Ni

4 8 5 5
8 12 9 14
12 16 20 25  Nj-1
Me = y´j-1  16 20 16 41  Nj
20 24 10 50

∑ 50

Solución:
1. n/2 =   n/2 = 50/2 = 25

2. Nj =   Nj = 41 Nj-1 = 25

3. Relacionar Nj-1 con n/2  25 = 25  Me = y´j-1  Me = 16

PROPIEDAD DE LA MEDIANA
Se demuestra que: “La suma de los desvíos tomados en valores absolutos, entre
cada valor de la variable y la mediana, ponderados en el caso de una distribución de
frecuencia, es un mínimo”.

36
∑ yi - Me ni < ∑ yi - k ni ; siendo k ≠ Me

3) MODO, MODA O VALOR MODAL


Es otra medida de posición, definida por el valor de la variable con mayor
frecuencia de presentación. También se dice, que es el valor típico de un conjunto de
datos, y resulta aplicable tanto a variable cuantitativa, como a variable cualitativa.

Si de un conjunto de datos, un valor de la variable tiene mayor frecuencia que los


demás, se dice que la distribución es unimodal, mientras que si son dos los valores que
tienen mayor frecuencia, se dice que es bimodal. Cabe destacar que, si un conjunto de
datos no es exactamente bimodal pero contiene dos valores que son más dominantes que
otros, algunos investigadores denominan al conjunto de datos como bimodal incluso sin un
empate exacto para la moda. Los conjuntos de datos con más de dos modas, se conocen
como multimodales, dándose situaciones, en las que una distribución carezca de modo. Se
denota al modo con Mo.

Mo Mo Mo No existe Modo

Unimodal 
Bimodal

En el mundo de los negocios, el concepto de moda, se usa con frecuencia al


determinar medidas. Por ejemplo, la industria del vestido produce camisas, vestidos y trajes
y muchos otros productos de vestido en talles modales. Al reducir el número de talles a
unas pocas medidas modales, las compañías reducen sus costos incrementando de esta
forma sus utilidades.

37
CÁLCULO DEL MODO

a) Serie Simple: El Modo, si existe, será el valor de la variable que se


presenta con más frecuencia en la serie de datos.

Ejemplos:
Calcular en cada caso, si existe, el Modo:

1. El Nº de artículos fallados por día en una línea está dado por:

6 ; 8 ; 10 ; 8 ; 8 ; 6 ; 5 ; 3.

2. El Nº de empleados que faltaron a su trabajo, por día, está dado por:

3 ; 1 ; 1 ; 1 ; 2 ; 2 ; 2 ; 2 ; 1 ; 4 ; 5 ; 3.

3. El estado civil de un conjunto de empleados es:

Casado; Soltero; Casado; Casado; Soltero; Soltero; Soltero.

4. El medio de movilidad escogido por un grupo de empleados para ir a su


lugar de trabajo, está dado por:

Moto; Auto; Colectivo; Caminando; Moto; Colectivo; Caminando; Auto.

5. El color de los autos vendidos en una semana en una concesionaria es:

Blanco ; Rojo ; Gris ; Azul ; Negro.

Soluciones:

1. Mo = 8  Unimodal

2. Mo = 1 y Mo = 2  Bimodal

3. Mo = soltero  Unimodal

4. Mo  No existe

5. Mo  No existe
38
4) PERCENTILES o CENTILES
Son medidas de posición o tendencia central, que dividen a un grupo de datos en
100 partes. Hay 99 Percentiles, porque se necesita 99 divisores para separar un grupo de
datos en 100 partes. El n-ésimo Percentil es el valor de la variable tal que “al menos n por
ciento de los datos están bajo de ese valor, y a lo sumo (100 – n ) por ciento superan a ese
valor”. Así por ejemplo, el percentil 67 es un valor de la variable tal que, al menos el 67%
de los datos están por debajo de ese valor, y no más del 33% están sobre ese valor.

Observación: Si consideramos la definición de Mediana y de Percentiles, podemos


concluir que siempre se va a verificar que: P50 = Me (valor de la variable que supera a no
más de la mitad de las observaciones y es superado por no más de la mitad de las mismas).

5) CUARTILES
Los cuartiles son medidas de posición o tendencia central, que dividen a un
conjunto de datos en cuatro partes iguales, teniendo por lo tanto 3 cuartiles:

 Q1  Primer Cuartil: representativo del valor de la variable que supera a no


más del 25% de las observaciones y es superado por no más del 75% de las
mismas. Es decir, separa el cuarto más bajo de los datos de los tres cuartos más
altos, siendo por lo tanto igual al Percentil 25.

Q1 = P25

 Q2  Segundo Cuartil: representativo del valor de la variable que supera a no


más del 50% de las observaciones y es superado por no más del 50% de las
mismas. Es decir, separa la mitad más baja de los datos de la mitad más alta,
siendo igual al Percentil 50, e igual a la Mediana.

Q2 = P50 = Me
39
 Q3  Tercer Cuartil: representativo del valor de la variable que supera a no más del
75% de las observaciones y es superado por no más del 25% de las mismas. Es decir,
separa los tres cuartos más bajos del cuarto más alto, siendo igual al Percentil 75.

Q3 = P75

Esquemáticamente:

  
Q1 = P25 Q2 = P50 = Me Q3 = P75

6) DECILES
Son medidas de posición o tendencia central, que dividen a un grupo de datos en
10 partes iguales. Hay 9 Deciles, porque se necesita 9 divisores, para separar un grupo de
datos en 10 partes iguales. El n-ésimo Decil, es el valor de la variable tal que “al menos n
por ciento de los datos están bajo de ese valor, y a lo sumo (100 – n ) por ciento,
superan a ese valor”. Así por ejemplo, el decil 6, es un valor de la variable tal que, al
menos el 60% de los datos están por debajo de ese valor, y no más del 40% están sobre ese
valor.

Si denotamos al Decil que ocupa el lugar i de la forma: Di podemos establecer una


relación entre Deciles y Percentiles de la forma:

D1 = P10

D2 = P20
:
:
D5 = P50  Mediana
:
:
D9 = P90

OBSERVACIÓN: En forma genérica a los Percentiles, Cuartiles y Deciles, se los


denomina FRACTILES, dado que dividen a un conjunto de datos, en fracciones o partes.
Como antes se comprobó, se verifica que:
P50 = Q2 = D5 = Me

40
2) MEDIDAS DE DISPERSIÓN
Las medidas de posición o tendencia central, dan información acerca del valor de la
variable en torno al cual se concentran los datos, pero nada dicen de qué forma, los
mismos se distribuyen. Es por ello, que es necesario para describir a un conjunto de valores
de una variable, de otras herramientas analíticas que son las medidas de dispersión o
variabilidad, representativas de la dispersión de un conjunto de datos, de forma tal
que, conjuntamente con las medidas de posición, es posible obtener una descripción
numérica más completa.

Así por ejemplo, si se tiene a las distribuciones A y B:


Medida de Posición

Se observa que ambas distribuciones tienen la misma medida de posición, pero en la


distribución A los valores de la variable están más concentrados o menos dispersos que en
la distribución B.

PRINCIPALES MEDIDAS DE DISPERSIÓN

1) RECORRIDO, RANGO o AMPLITUD


41
Está dada por “la diferencia entre el mayor valor observado de la variable y el
valor menor de la misma”.
a) En el caso de una Serie Simple, el Recorrido ( R ) será el valor
resultante del cálculo:

R = xmáx – xmín

b) En el caso de Datos Agrupados, el Recorrido ( R ) será el valor


resultante del cálculo:

ym valor mayor

Variable Discreta  R = ym – y0 

y0 valor menor

y´mextremo der.último. int.

Variable Continua  R = y´m – y´0 

y´0 extremo izq.primer int.

Observaciones:

1) Cuando se desea comparar dos conjuntos de datos, expresados en la misma unidad


de medida, la aplicación práctica del Recorrido como medida de dispersión, está
condicionada a que, los conjuntos tengan el mismo valor de la Media Aritmética.

2) Si bien el Recorrido es de fácil cálculo, ya que toma en consideración sólo el valor


mayor y el menor de la variable, en los casos en que éstos sean dispares y los datos
concentrados, por ejemplo en la zona central o en uno de los extremos, su valor
como medida de dispersión carecería de sentido, por no tomar en consideración las
situaciones mencionadas.

42
3) Un uso importante del Recorrido como medida de variabilidad, es en Control de
Calidad, donde se lo utiliza para elaborar los “Gráficos de Control”, que permiten
determinar si un proceso opera “bajo control”.

RECORRIDO POCO ÚTIL


- - - ------ -- ---

 
Valor menor Valor mayor

o también:

- - - - -- - - - - - -

 
Valor menor Valor mayor

Ejemplo:

Dadas las Series Simples:

A  0 ; 25 ; 75 ; 100

B  48 ; 49 ; 51 ; 52

Considerando el Recorrido como medida de dispersión, ¿ En qué serie, los datos


son más heterogéneos o más dispersos?.

Solución:

43
RA = 100 – 0 = 100
 RA > RB  “datos más dispersos en Serie A”
RB = 52 – 48 = 4 
MA = MB = 50

“El Recorrido como medida de dispersión aporta decisión”

2) RECORRIDO O RANGO INTERCUARTÍLICO


Está dado por “la diferencia entre el tercer y primer cuartil”. Es decir, se
corresponde con la amplitud existente entre el 50% de los valores centrales:

RIQ = Q3 – Q1

Q1 Q2 Q3

Observaciones:

1) El Recorrido Intercuartílico como medida de dispersión, tiene una aplicación


práctica limitada, dado que no considera los datos ubicados a la izquierda del primer
cuartil o a la derecha del tercero.

2) Al Recorrido Intercuartílico y al Recorrido, Rango o Amplitud, al tomar en


consideración sólo dos valores de la variable, se las denomina “medidas
posicionales de dispersión”.

Ejemplo:
Si de un conjunto de datos se obtiene que:

Q3 = 36,4

Q1 = 15,1

44
Calcular el Recorrido Intercuartílico, e interpretar.

Solución:

RIQ = Q3 - Q1  RIQ = 36,4 - 15,1 = 21,3


“Existe una amplitud de 21,3 entre los extremos de los valores de la
variable ubicados en el 50% de los valores centrales”.

3) DESVIACIÓN MEDIA
Es otra medida de dispersión, y está dada por la “Media aritmética de los valores
absolutos, de los desvíos existentes entre cada valor de la variable, y la media
aritmética”.

a) Serie Simple:

N

 x -μ i

1. Poblacional  DM(x)  i 1

 x -x i

2. Muestral  DM(x)  i 1

b) Datos Agrupados:

Valor de variable (D)
N

y i - μ ni
1. Poblacional  DM(y)  i 1
; yi =
N
Marca de clase (C )

45
Valor de variable (D)
n

y i - y ni
2. Muestral  DM(y)  i 1 ; yi =
n

Marca de clase (C )

Observación:

Debido a que la Desviación Media, considera el promedio de los desvíos tomados


en valores absolutos, no permite determinar el signo de las desviaciones, razón por la cual
como
medida de dispersión, es menos útil que otras. En el campo de pronósticos, se usa
ocasionalmente como medida de error.
Ejemplo:
Un taller mecánico inició sus actividades la semana pasada, siendo el número diario
de vehículos que ingresaron a reparación

Día Nº de vehículos

Lunes 5
Martes 9
Miércoles 16
Jueves 17
Viernes 18

Calcular la Desviación Media.

Solución:
Nº de vehículos
xi xi -   xi -  

5 -8 8
9 -4 4
16 3 3
17 4 4
18 5 5
 65 0 24

46
N N

x i x i -μ
μ  μ
i 1 65
 13  DM(x)  i 1

24
 4,8
N 5 N 5

4) VARIANZA

Es una de la más importante medida de dispersión, y está dada por “La media
aritmética del cuadrado de los desvíos entre, cada valor de la variable y la respectiva
media aritmética”. Suponiendo una variable x, se la denota de la forma: V(x) o 2(x).

 FÓRMULA DE LA VARIANZA SEGÚN LA


DEFINICIÓN

a) Serie Simple:

n

 (x - x)
2

  2
V(x)  σ 2 x  M x - x  i  1
n

b) Datos Agrupados:

n

(y - y )
2

V(y) = y  M(y - y )  i  1
2

valor de la variable  Variable Discreta

yi =

marca de clase  Variable Continua

47
FÓRMULA DE CÁLCULO DE LA VARIANZA
Partiendo de la fórmula de Varianza según la definición, y suponiendo una Serie
Simple, sabemos que:

V(x) = M ( x - x )2

Operando en el segundo miembro, desarrollando el cuadrado del binomio y


aplicando propiedades de la Media Aritmética, resulta:

V(x) = M (x - x )2 = M (x2 – 2 x x + x2) = M [x2 – M(2x x ) + x2] ; M(x) = x = const.

= M(x2) – 2 x M(x) + M(x2) = M(x2) – 2 [M(x)]2 + [M(x)]2


   xi 
2 2

V(x) = M(x ) – [M(x)] 


2 2
V x   x i
 
N  N 

En forma análoga se demuestra que en el caso de datos agrupados, la fórmula de cálculo


de la Varianza va a estar dada por :

2
 yi 2 ni  yi ni 
V(y)  M( y) - My 2  Vy  
2
- 
N  N 


valor de la variable  Variable Discreta
yi =
marca de clase  Variable Continua

IMPORTANTE: un valor particular de la Varianza, NADA


INDICA

48
PROPIEDADES DE LA VARIANZA

1) “La Varianza es una magnitud no negativa”.


V(x) ≥ 0

2) “La Varianza de una constante es igual a cero”.


V(k) = 0 ; k = constante

3) “La Varianza del producto entre, una constante y una variable, es igual al
producto entre, la constante elevada al cuadrado, por la Varianza de la
variable”.

V(kx) = k2 V(x) ; k = constante

4) “La Varianza de la suma entre una constante y una variable es igual a la


varianza de la variable”.

V( k + x ) = V(x) ; k = constante

5) “La Varianza de una suma de variables, en general, no es igual a la suma


de las varianzas de cada una de las variables”.

V( x + y ) ≠ V(x) + V(y)

49
5) DESVIACIÓN ESTÁNDAR
El valor de la Varianza, viene expresado en la unidad de medida de la variable
elevada al cuadrado, mientras que las medidas de posición vienen expresadas en la unidad
de medida original de la variable, lo que no permite una comparación directa. Es por
ello que, a los fines prácticos, se utiliza como medida de dispersión a la Desviación
Estándar o Típica, dada por “La raíz cuadrada positiva de la varianza”. De esta forma,
el valor de la variable asociado a la tendencia central, así como el correspondiente a la
dispersión, se corresponderán con la unidad de medida original de la variable, permitiendo
con ello, su comparación. Se la denota con , de modo tal que:

n 2
 (xi - x )
Desviación Estándar  σ σy 2   i 1

IMPORTANTE: un valor particular de la Desviación


Estándar, NADA INDICA

Ejemplo 1:

De las10 piezas producidas en una hora en una fábrica, se verificó si alguna de ellas
presentaba algún defecto, obteniéndose los siguientes valores:

xi = Nº de defectos por pieza producida  0 ; 1 ; 3 ; 0 ; 1 ; 0 ; 1 ; 1 ; 1 ; 0

Obtener:
a) Varianza
b) Desviación Estándar

50
Considerando:

I. Serie Simple.
II. Datos Agrupados de Variable Discreta.

Solución:

I. Serie Simple:

x x2
0 0
1 1
3 9
0 0
1 1
0 0
1 1
1 1
1 1
0 0
 8 14

x   xi 
2 2
a) V(x) =  = M(x ) – [M(x)]
2 2 2
 V(x)  -
i

N  N 

10 2 2
 xi  10  2 
  xi   
V(x)   1
i -  i 1   -
 10 
14
10  
8

 1,4 - 0,64  0,76 defectos 2 
10
   10 

b) σ   V(x)  σ   0,76 (defectos)2  0,87 defectos

51
II. Datos agrupados de variable discreta

Defectos Nº de piezas
2
yi ni yi ni yi ni

0 4 0 0
1 5 5 5
3 1 3 9
 10 8 14

2
 yi 2 ni  yi ni 
V(y)  M( y) - My 2  Vy  
2
a) - 
n  n 

2
14  8 
V(y)  -    1,4 - 0,8 2  1,4 - 0,64  0,76 (defectos)2
10  10 

b) σ   0,76 (defectos) 2  0,87 defectos

Ejemplo 2:

El precio de venta al público (en dólares), de un cierto artículo en distintos


comercios de una ciudad, está dado por:

Precios Nº de comercios Marca de clase

y´i-1 y´i ni yi yi ni yi2 ni

43 53 5 48 240 11.520
53 63 7 58 406 23.548
63 73 13 68 884 60.112
73 83 9 78 702 54.756
83 93 6 88 528 46.464

 40 2.760 196.400

52
Obtener:
a) Media aritmética.
b) Varianza.
c) Desviación estándar
d) En qué intervalo se encuentra el “valor modal”?. Cómo interpreta al mismo?.

Solución:
n
 yini
a) M(y)  i  1  2.760  69 dólares
n 40

 
2
 yi 2 ni  yi ni 
b) V(y)  M y - M(y)   Vy  
2 2 - 
n  n 

V(y) 
40
-  
196.400 2.760 2
40
 149  dólares
2

c) (y) =  σ 2   149 dólares 2  12,21 dólares

d) Mo  [63 73[  “El precio más frecuente a que se vende el artículo, se


encuentra comprendido entre 63 y menos de 73 dólares”.

6) COEFICIENTE DE VARIACIÓN

Es una medida de dispersión relativa, dada por “el cociente entre la desviación
estándar y la media aritmética”, siendo una magnitud a-dimensional, es decir sin unidad
de medida, razón por la cual puede ser aplicado para comparar distribuciones, con igual o
distinta unidad de medida, pudiéndoselo expresar en porcentajes.

53

Desviación estándar σ σ
CV(x) =   CV(x) %  . 100
Media aritmética μ μ

Observación:

“Un menor valor del Coeficiente de Variación, significa una Media aritmética
más representativa como medida de posición, de un conjunto de datos”.


Si se tiene a dos distribuciones I y II, y sus respectivos Coeficientes de Variación:
CVI y CVII  Si: CVI < CVII  “MI es más representativa que MII”.

“datos más uniformes en distribución I”

“datos más parejos en distribución I”

“datos más uniformes en distribución I”

“datos más homogéneos en distribución I”

“datos menos dispersos en distribución I”

“datos con menor variabilidad en distribución I”

Ejemplo 1:

Se tiene dos acciones A y B, cuyas cotizaciones en un mercado bursátil en una semana,


permitieron el cálculo de los siguientes valores, en dólares:

Precio Medio = 64,40 Precio Medio = 13


Acción A ; Acción B
Desviación Estándar = 4,84 Desv. Estándar = 3,03

¿Qué Acción es más riesgosa?. Fundamentar.

54
Solución:
Un indicador del riesgo de una Acción, es la variabilidad en los precios de su
cotización, es decir, de la dispersión en los precios.

Si consideramos los valores de la Desviación Estándar en forma independiente


de cada una de las acciones, se observa que el de la Acción A es mayor que el de la
Acción B, con lo que concluiríamos ERRÓNEAMENTE en decir que: “la Acción A es
más riesgosa que la B, dado que sus precios de cotización, presentan mayor dispersión al
ser mayor el valor de la desviación estándar”.

La decisión es INCORRECTA, dado que los valores de los Precios Medios son
distintos, siendo por lo tanto necesario, el cálculo de una medida de dispersión relativa,
que considere no sólo la desviación estándar en forma aislada, sino que también, el
respectivo valor de la media aritmética.

En consecuencia, es necesario el cálculo del Coeficiente de Variación:

σA 4,84 u$s 4,84


CVA   CVA    0,075  7,5%
μA 64,40 u$s 64,40

“La desviación estándar es de 7,5% a partir de la media”

Procediendo en forma análoga con la Acción B, se tiene:

σB 3,03 u$s 3,03


CVB   CVB    0,233  23,3%
μB 13 u$s 13

“La desviación estándar es de 23,3% a partir de la media”
Dado que: CVB > CVA podemos CONCLUIR ADECUADAMENTE, diciendo que:
“Los precios de cotización de las Acciones B presentan mayor variabilidad relativa, y por
ende, son más riesgosas que las Acciones A”, lo que es equivalente a decir que “El precio
medio de las Acciones A, es más representativo, como medida de posición, que el de la
Acción B”.

Ejemplo 2:
La gerencia de Recursos Humanos de una empresa, desea realizar una investigación
sobre sus empleados, para lo cual se consideraron dos variables: edad y peso, deseando

55
realizar el estudio tomando aquella variable, que presente valores más homogéneos.
Relevando los datos se obtuvo que:

Media aritmética = 47 años Media aritmética = 75 kg


Edad = ; Peso=
(x) Varianza = 225 (años)2 (y) Varianza = 289 (kg)2

Solución:

Para poder determinar qué variable presenta valores más homogéneos, debemos
calcular el Coeficiente de Variación:

σx 225 años 2 15 años 15


Edad  CVx   CVx     0,319  31,9%
μx 47 años 47 años 47

“La desviación estándar es de 31,9%, a partir de la media”

σy 289 kg 2 17 kg 17
Peso  CVy   CVy     0,227  22,7%
μy 75 kg 75 kg 75

“La desviación estándar es de 22,7% a partir de la media”

CVy < CVx  M(y) “es más representativa”  valores “más HOMOGÉNEOS”.

Se trabajará con la variable PESO

SIGNIFICADO PRÁCTICO DE LA DESVIACIÓN


ESTÁNDAR
Si quisiéramos saber ¿Cómo se interpreta el valor de la Desviación Estándar?.
Podemos hacerlo, además de la aplicación del Coeficiente de Variación, utilizando dos
herramientas estadísticas, dadas por:

56
I. REGLA EMPÍRICA.
II. TEOREMA O DESIGUALDAD DE
CHEBYSHEV.

I. REGLA EMPÍRICA
Es una importante regla práctica, que se usa para expresar el porcentaje
aproximado de datos, que están dentro de un número dado de desviaciones estándar desde
la media aritmética: “En toda distribución aproximadamente simétrica, (forma de
campana), con media aritmética igual a  y desviación estándar igual a , se verifica que:

Distancia desde la media Valores aproximados dentro de la distancia

a)  ±   [ ± ]  68% de las observaciones

b)  ± 2  [ ± 2]  95% de las observaciones

c)  ± 3  [ ± 3]  99% de las observaciones

 - 3  - 2 -  +  + 2  + 3

Cabe destacar que habitualmente, los datos de numerosos fenómenos, están


distribuidos en forma de campana, como ocurre con la mayoría de las características
humanas, tales como la estatura y el peso. Por tal motivo, la REGLA EMPÍRICA, se
aplica en muchas situaciones y se usa ampliamente.

57
Ejemplo:
Las longitudes de las piezas derivadas de un cierto proceso productivo A, se
distribuyen en forma simétrica, con una media de 12 cm, y una desviación estándar de
0,4 cm.

1) Entre qué valores de longitud se encuentran aproximadamente el 68% de las


piezas?.
2) Entre qué valores de longitud se encuentran aproximadamente el 95% de las
piezas?.
3) Una pieza escogida al azar tiene una longitud de 12,6 cm: ¿Pertenece al proceso
productivo A?.
4) Una pieza escogida al azar tiene una longitud de 10,7 cm: ¿Pertenece al proceso
productivo A?.
5) Si el peso de las piezas, es en promedio de 230 gramos con una varianza 36
gramos2, considerando longitud y peso: ¿En qué aspecto es el proceso más
estable?. FUNDAMENTAR.

Solución:
 = 12 cm
X = longitud de las piezas / X  simétrica 
 = 0,4 cm

1) 68%  [ ± ]  [12 ± 0,4]  [11,6 ; 12,4]


“Entre 11,6 cm y 12,4 cm, se encuentran aproximadamente el 68% de las piezas”.

2) 95%  [ ± 2]  [12 ± 2. 0,4]  [11,2 ; 12,8]


“Entre 11,2 cm y 12,8 cm, se encuentran aproximadamente el 95% de las piezas”.

58
3) X = 12,6 cm  “PUEDE pertenecer al proceso A, siendo ALTAMENTE
PROBABLE”.


“Se encuentra comprendido dentro de los valores habituales de las mediciones”.

4) X = 10,7 cm  

99%  [ ± 3]  [12 ± 3. 0,4]  [10,8 ; 13,2]


“Entre 10,8 cm y 13,2 cm se encuentran aproximadamente el 99% de las piezas”.


“Un 1% de las piezas tienen longitudes menores a 10,8 cm o mayores a 13,2 cm”.


X = 10,7 cm


“PUEDE pertenecer al proceso A, siendo POCO PROBABLE”.

 = 230 gramos
5) Y = peso de las piezas 
2 = 36 gramos2

¿En qué aspecto es el proceso más estable?....COEFICIENTE DE VARIACIÓN

 Longitud  CV ( X ) 
σ X

0,4 cm 0,4
  0,033
μ X 12 cm 12

 Peso  CV ( Y ) 
σ Y

36 gramos 2

6 gramos

6
 0,0261
μ Y 230 gramos 230 gramos 230


CV(Y)  CV(X)  Proceso más estable, en el Peso de las piezas

59
II. TEOREMA O DESIGUALDAD DE CHEBYSHEV
(Tchebyccheff)

La REGLA EMPÍRICA, es una regla práctica, que resulta aplicable cuando los
datos, están distribuidos en forma aproximadamente simétrica. En los casos en los que los
datos no estén distribuidos en forma simétrica, o bien la forma de la distribución es
desconocida, resulta aplicable el “Teorema o Desigualdad de Chebyshev (o
Tchebyccheff)”.

La Desigualdad de Chebyshev establece que: “Si un conjunto de datos tiene


media aritmética igual a  y desviación estándar igual a , independientemente de como
sea su distribución, por lo menos 1 – 1/k2 valores, caerán dentro de: ± k desviaciones
estándar de la media aritmética”.


“Dentro de k desviaciones estándar de la media aritmética,  ± k, existe por lo
1
menos (1 - 2 ) proporción de valores”.
k

1
  x -    k  ≥ 1 - 2
; k>1
k

≥ 1 – 1/k2

-k  +k

1
1) k = 2  1 - 2
= 0,75  “Dentro de ± 2 de la media, se encuentran por lo
k
menos el 75% de los datos”.

60
1
2) k = 3  1 - 2
= 0,8889  “Dentro de ± 3 de la media, se encuentran por lo
k
menos el 88,89% de los datos”.

1
3) k = 4  1 - 2
= 0,9375  “Dentro de ± 4 de la media, se encuentra por lo
k
menos el 93,75% de los datos”.

1
4) k = 2,5  1 - 2
= 0,84  “Dentro de ± 2,5 de la media, se encuentran por lo
k
menos el 84 % de los datos”.

Observación:

Se afirma que la “Desigualdad de Chebyshev”, al establecer una cota mínima de la


proporción de datos, que quedan a una determinada cantidad de desviaciones
estándar de la media aritmética, se trata de un “enfoque conservador”.

Ejemplo:
En una cierta rama de la industria dedicada a la electrónica, la edad promedio de los
empleados profesionales tiende a ser menor que en otras actividades. Un estudio realizado
determinó que el promedio de las edades de los empleados profesionales es de 36 años con
una desviación estándar de 5 años, no existiendo un comportamiento definido en la
distribución de las edades. Aplicar la Desigualdad de Chebyshev para determinar dentro de
qué rango de edades se encuentran al menos el 85% de las edades de los trabajadores.

Solución:
 = 36 años
x = edades de los empleados / x   
 = 5 años

61
Dado que se desconoce cómo es la distribución de las edades, no podemos aplicar
la “Regla Empírica”, debiendo aplicar la “Desigualdad de Chebyshev”.

Sabemos que Chebyshev establece que:

1
  x -    k  ≥ 1 - 2
; k>1
k

Proporción de valores

Como el problema es determinar el rango, dentro del cual se encuentran “por lo


menos el 85% de las edades”:

1
1 - 2 = 0,85  k = 2,58
k

“Al menos, el 85% de las edades están comprendidas dentro de ± 2,58 de la
media aritmética”

 = 36
Siendo:    x - 36  2,58. 5 ≥ 0,85
= 5

x  36 ± 12,9


[23,1 ; 48,9]


“Al menos el 85% de las edades de los empleados, se encuentran entre 23,1 y 48,9 años”.

3) MEDIDAS DE FORMA, ASIMETRÍA O


SESGO
62
Las medidas de asimetría tienen como objetivo “Elaborar un indicador que
permita establecer el grado de simetría o asimetría que presenta una distribución, sin
necesidad de llevar a cabo su representación gráfica”. Son medidas que permiten describir
la forma de una distribución de datos. Se presentan tres situaciones:

1) Distribución simétrica:

M = Me = Mo

En toda distribución simétrica, la mitad de los datos se encuentra localizada a la


izquierda de la media aritmética y la otra mitad a la derecha, verificándose que:

Distribución simétrica  M = Me = Mo

2) Distribución asimétrica positiva, lateral derecha o sesgada positiva:

Mo Me M

En toda distribución asimétrica positiva o sesgada hacia la derecha, la parte


alargada de la curva se encuentra ubicada hacia la derecha, indicando ello que, para
valores altos de la variable, el número de observaciones es bajo, verificándose que:

Distribución asimétrica positiva  Mo < Me < M

63
3) Distribución asimétrica negativa, lateral izquierda o sesgada
negativa:

M Me Mo

En toda distribución asimétrica negativa o sesgada hacia la izquierda, la parte


alargada de la curva se encuentra ubicada hacia la izquierda, indicando ello que para
valores bajos de la variable, el número de observaciones es bajo, verificándose que:

Distribución asimétrica negativa  M < Me < Mo

Determinación del sesgo o asimetría de una distribución

Para determinar la forma de una distribución de frecuencias pueden aplicarse los


indicadores:

Coeficiente de Asimetría de Karl Pearson (Sk):

 0  Asimetría o Sesgo Negativo


3(M - Me)
Sk =  Sk  = 0  Simétrica
σ
> 0  Asimetría o Sesgo Positivo

Ejemplo:

64
Una distribución, tiene una Media Aritmética igual a 40, una Mediana igual a 36
y una desviación estándar igual a 17. ¿Cómo es la distribución, en cuanto a su forma?.

Solución:

3(M - Me) 3(40 - 36)


Aplicando: Sk   Sk    0,71 > 0  Asimetría Positiva
σ 17

Observación:
Se demuestra que en toda distribución levemente asimétrica se verifica que:

Mo = M – 3 ( M – Me )

Que es lo que se conoce con el nombre de “Método Empírico para el cálculo


del Modo.

4) MEDIDAS DE PUNTIAGUDEZ O CURTOSIS


Las medidas de Curtosis, apuntamiento o concentración central, estudian la
distribución de frecuencias en la zona central de la misma, o también del valor modal, de
forma tal que, una mayor o menor concentración de observaciones, dará lugar a una
distribución más o menos puntiaguda.

Las medidas de Curtosis, se aplican a distribuciones en forma de campana, o sea


unimodales y simétricas o con leve asimetría. Es por ello que, para su estudio, es
necesario previamente definir una distribución tipo, que se toma como modelo de
referencia, siendo ésta la distribución normal, que se corresponde con los datos de
fenómenos muy corrientes en la naturaleza, siendo su representación gráfica la
denominada Curva Normal o Campana de Gauss.

Tomando la distribución normal como referencia, pueden presentarse en lo que a


Curtosis se refiere, tres situaciones:

1) Leptocúrtica  alta concentración  más puntiaguda que la normal.

2) Mesocúrtica  concentración normal  distribución normal.

3) Platicúrtica  baja concentración  más aplanada que la normal.

65
Gráficamente:

1) Leptocúrtica:


M

2) Mesocúrtica o Normal:


M
3) Platicúrtica:


M

DISTRIBUCIONES BIDIMENSIONALES
Se denomina de esta forma, “Al conjunto de pares de valores, resultantes de
estudiar simultáneamente, de cada una de las unidades estadísticas de una determinada
población estadística, dos variables”.

66
SERIE SIMPLE
De la misma forma que en el caso de distribuciones unidimensionales, en el caso
de una distribución bidimensional, una serie simple va a estar dada por el conjunto de
pares de valores de las variables estudiadas, obtenidos en bruto.

Se denota, en forma genérica a cada variable estudiada, de la forma:

x1i y x2i ; i = 1, 2, ….. n

Ejemplo:
Dados los siguientes datos referidos a horas trabajadas y número de artículos
producidos en 10 máquinas de una empresa:

Máquinas 1 2 3 4 5 6 7 8 9 10
Horas
trabajadas 6 6 6 7 7 7 8 8 8 8
(x1)
Artículos
producidos 70 70 70 80 80 90 90 90 100 100
(x2)

La representación gráfica de los datos de una Serie Simple Bidimensional, está


dada por el “diagrama de dispersión o nube de puntos”, considerando en cada uno de los
ejes de un sistema de coordenadas cartesianas ortogonales, a las variables dadas y
representando en el plano a los puntos asociados a los pares de valores observados.

COVARIANZA

Es una medida de dispersión, representativa del grado de variación conjunta


entre dos variables, y se define como “La media aritmética del producto de las variables
desvíos respecto a la media aritmética, de cada una de las variables dadas”.

67
Dadas dos variables x e y, la Covarianza, por definición, va a estar dada por:

 (x - x ) (y - y )
i 1
i i

Cov(x , y) = M(Zx . Zy) = M[(x – x ) (y – y )] =


n

SIGNO DE LA COVARIANZA:
La Covarianza asume valores, en el intervalo: -   cov (x , y)  , con el
siguiente significado:

Aumenta una variable,


 0  relación inversa o negativa  Δ x   y la otra disminuye

Cov(x,y) = 0  variables independientes o incorrelacionadas. Son independientes entre si

> 0  relación directa o positiva  Δ x  Δ y Aumenta una variable, la otra


aumenta y viceversa

FÓRMULA DE CÁLCULO DE LA COVARIANZA:


Por definición, sabemos que la Covarianza es igual a:

Cov(x,y) = M[Zx . Zy] = M[(x - x ).(y - y )]. Efectuando el producto de los binomios:

Cov(x,y) = M[ x y - x y - x y + x y ]. Aplicando propiedad de media aritmética

Cov(x,y) = M (x y ) - x M(y) - y M(x) + x y ; x = M(x) e y = M(y)

Cov(x,y) = M (x y ) - x y - y x + x y

Cov(x,y) = M (x y ) – M(x) . M(y) 


68
VARIANZA DE UNA SUMA Y DIFERENCIA
DE DOS VARIABLES
Sabemos que en general, “La varianza de una suma o diferencia de dos variables
NO ES IGUAL a la suma o diferencia de las varianzas de cada una de ellas”. Por lo
tanto, se tratará de encontrar:

1) V(x + y) = 
2) V(x - y) = 

1) V(x + y) = 

Aplicando la definición de Varianza y considerando a la variable (x + y), resulta:

V(x + y) = M [(x + y) – M(x + y)]2 . Aplicando propiedad de media aritmética:

V(x + y) = M [x + y – M(x) – M(y) ]2 ; x = M(x) e y = M(y)

V(x + y) = M [x + y - x - y ]2 ; asociando convenientemente en la base de la potencia:

V(x + y) = M[(x - x ) + (y - y )]2 ; desarrollando el cuadrado del binomio:

V(x + y) = M[(x - x )2 + 2 (x - x )(y - y ) + (y - y )2 ]. Tomando media aritmética:

V(x + y) = M(x - x )2 + M(y - y )2 + 2 M[(x - x )(y - y )]


  
V(x) V(y) Cov(x,y)

Por lo tanto:

V(x + y) = V(x) + V(y) + 2 Cov(x,y)  x e y variables cualesquiera



“La varianza de una suma de dos variables es igual a la suma de las varianzas de cada
una de las variables dadas más dos veces la Covarianza entre las mismas”

Si x e y son variables independientes, sabemos que Cov(x,y) = 0, resultando:

69
V(x + y) = V(x) + V(y)  x e y variables independientes ( I )

“La varianza de una suma de dos variable independientes es igual a la suma de las
varianzas de cada una de las variables dadas”.

2) V(x - y) = 

Aplicando la definición de Varianza y considerando a la variable (x - y), resulta:

V(x - y) = M [(x - y) – M(x - y)]2 . Aplicando propiedad de media aritmética:

V(x - y) = M [x - y – M(x) + M(y) ]2 ; x = M(x) e y = M(y)

V(x - y) = M [x - y - x + y ]2 ; asociando convenientemente en la base de la potencia:

V(x - y) = M[(x - x ) - (y - y )]2 ; desarrollando el cuadrado del binomio:

V(x - y) = M[(x - x )2 - 2 (x - x )(y - y ) + (y - y )2 ]. Tomando media aritmética:

V(x - y) = M(x - x )2 + M(y - y )2 - 2 M[(x - x )(y - y )]


  
V(x) V(y) Cov(x,y)

Por lo tanto:

V(x - y) = V(x) + V(y) - 2 Cov(x,y)  x e y variables cualesquiera



“La varianza de una diferencia de dos variables es igual a la suma de las varianzas de
cada una de las variables dadas menos dos veces la Covarianza entre las mismas”

Si x e y son variables independientes, sabemos que Cov(x,y) = 0, resultando:

V(x - y) = V(x) + V(y)  x e y variables independientes ( II )

“La varianza de una diferencia de dos variable independientes es igual a la suma


de las varianzas de cada una de las variables dadas”

70
OBSERVACIÓN

Relacionando lo obtenido en ( I ) y ( II ), se concluye en que: “La Varianza de una


Suma o Diferencia de variables independientes, es igual a la Suma de las varianzas, de
cada una de las variables dadas.


Si x e y son variables independientes  V(x ± y) = V(x) + V(y)

71
UNIVERSIDAD TECNOLÓGICA NACIONAL
FACULTAD REGIONAL CÓRDOBA

PROFESOR TITULAR

MBA ROBERTO P. FUGIGLANDO

Año Lectivo 2020

(SEGUNDA PARTE)
UNIDAD Nº IV

“ÁLGEBRA DE PROBABILIDADES”

FENÓMENOS ALEATORIOS
En la vida real, se plantean situaciones o experimentos tales que a iguales causas y
en condiciones uniformes, siempre se producen los mismos efectos, dando lugar a los
denominados “Fenómenos Determinísticos”, de naturaleza “causística”. Por ejemplo, la
Ley de Newton, expresa que la relación entre la fuerza F de un cuerpo en movimiento, de
masa m con aceleración a, está dada por:

F=m.a

En contraposición a los anteriores, existes situaciones o experimentos tales que, a


iguales causas y en condiciones uniformes, no siempre se producen los mismos efectos,
dando lugar a los denominados “Fenómenos Aleatorios, Contingentes, Eventuales o
Probabilísticos”, de naturaleza “casuística”. Por ejemplo, qué número saldrá en el próximo
sorteo de una lotería. Es decir:

determinísticos: a = causas  = efectos  causísticos

Fenómenos

aleatorios: a = causas  = efectos  casuísticos

ESPACIO MUESTRAL
Se denomina de esta forma al conjunto formado por todos los resultados posibles
asociados a un “fenómeno aleatorio”, denotándoselo con S.
Se lo clasifica en:

1) Discreto, y
2) Continuo.

1) Es Discreto cuando asume resultados separables y contables, pudiendo ser:

a) Finito: cuando asume un número limitado de resultados. Por ejemplo, la


nota que podrá un alumno sacar en un examen, considerando la escala de
calificación utilizada en la universidad, que está dado por:

S = { 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9, 10 }

b) Infinito: cuando asume un número ilimitado de resultados. Por ejemplo,


el número de lanzamientos de un dado perfecto hasta que salga el cuatro,
siendo el espacio muestral:

S = {1 , 2 , 3 , 4 , 5 , 6 , 7 , ………………}

2) Es Continuo cuando los resultados no son separables o contables, admitiendo infinitos


valores. Por ejemplo, dar en el blanco a los puntos de un círculo (infinitos puntos), tiempo
de vida útil de un motor, etc.

Finito
Discreto
Infinito
ESPACIO MUESTRAL

Continuo Infinito
EVENTOS o SUCESOS ELEMENTALES o SIMPLES
Cada componente de un Espacio Muestral, recibe el nombre de “Evento Elemental
o Simple” y tienen las características de ser:

1) Mutuamente Excluyentes, y
2) Exhaustivos.

Lo anterior significa que, al darse uno de ellos en una prueba, no puede


simultáneamente darse otro, aunque cualquiera de los fenómenos que integran el Espacio
Muestral, podría haberse presentado. Por ejemplo, si se lanza al aire una moneda perfecta
y sale ceca, simultáneamente, no podría haber salido cara (mutuamente excluyentes),
aunque podría haber salido (exhaustivos).


S = {C, S}
 
eventos elementales

EVENTOS o SUCESOS

Se denomina de esta forma, a todo subconjunto de un Espacio Muestral,


conformado por eventos elementales o simples. La importancia de los eventos, radica en
que, sólo ellos, tienen asignado un número real que es su probabilidad. Se los denota con
letras mayúsculas: A, B, C,…..etc.

Así por ejemplo, si en el experimento consistente en el lanzamiento de un dado,


consideramos el evento: “número salido”, podríamos definir los eventos:

Espacio Muestral  S = {1 ; 2 ; 3 ; 4 ; 5 ; 6}

A = “Salida de número par”  A = { 2 ; 4 ; 6 }

B = “Salida de múltiplo de 3”  B = { 3 ; 6 }
EVENTO SEGURO o CIERTO
Es aquel evento, en el que todos los eventos elementales le son favorables, siendo
por lo tanto el espacio muestral. Esto es así puesto que, con toda certeza podemos afirmar
que alguno de sus componentes, se va a presentar en una prueba.

Evento Seguro a Cierto  Espacio Muestral  S

EVENTO IMPOSIBLE
Es aquel evento, en el cual ningún evento elemental le es favorable. Es decir, con
toda certeza, podemos afirmar que no se va a presentar en una prueba. Se lo denota con
. Por ejemplo, que en la tirada una vez de un dado perfecto, salga el 7.

Lanzamiento de un dado perfecto  “Salida de 7”  Evento imposible = 

EVENTOS MUTUAMENTE EXCLUYENTES


Dos eventos A y B son “Mutuamente Excluyentes o Disjuntos”, y se los denota de
la forma A )( B, si la ocurrencia conjunta es el evento imposible. Es decir:

Si A y B son eventos Mutuamente Excluyentes  A  B = 

Por ejemplo, si en el experimento asociado al lanzamiento de un dado se definen los


eventos:

A = “Salida de Nº par”  A={2,4,6}


 A )( B
B = “Salida de Nº impar”  B = { 1 , 3 , 5 }
UNIÓN DE EVENTOS
Dados los eventos A y B, la “Unión”, denotada de la forma: A  B, es otro evento
formado por los eventos elementales que están en A, agregándole los que están en B,
considerando una sola vez a los eventos elementales que se repiten.

Puede representarse gráficamente la Unión de Eventos, a través del denominado


Diagrama de Venn, utilizado en la Teoría de Conjuntos, de la forma:

a) Si A y B son eventos cualesquiera:

A B 
A B

b) Si A y B son eventos mutuamente excluyentes o disjuntos  A  B = :

A B 
A B

Observación:

Debe tenerse presente que:

Unión de eventos   = o = + = 

Ejemplo
Considerando el experimento del lanzamiento de un dado perfecto una vez, y
definidos los eventos:

A = “Salida de número par”  A= {2,4,6}


B = “Salida de múltiplo de 3”  B = { 3 , 6 }
C = “Salida de número impar”  C = { 1 , 3 , 5 }

Obtener los Eventos:

1. “Salida de número par o múltiplo de 3”.


2. “Salida de número par o número impar”.

Solución:
1. A o B  A  B = { 2, 3 , 4 , 6 }

2. A o C  A  C = { 1 , 2 , 3 , 4 , 5 , 6 }  Evento Seguro o Cierto

INTERSECCIÓN DE EVENTOS
Dados los eventos A y B, la “Intersección” denotada de la forma: A  B, es otro
evento formado por los eventos elementales que están simultáneamente en A y B.

Gráficamente:

a) Si A y B son eventos cualesquiera:

A B 

A B

b) Si A y B son eventos mutuamente excluyentes o disjuntos:

A B 
 A B
=
Observación:

Debe tenerse presente que:

Intersección de eventos   = y = x = 

Ejemplo
Considerando el experimento del lanzamiento de un dado perfecto una vez, y
definidos los eventos:

A = “Salida de número par”  A= {2,4,6}

B = “Salida de múltiplo de 3”  B = { 3 , 6 }

C = “Salida de número impar”  C = { 1 , 3 , 5 }

Obtener los Eventos:

1. “Salida de número par y múltiplo de 3”.


2. “Salida de número par y número impar”.

Solución:

1. A y B  A  B = { 6 }

2. A y C  A  C =   Evento Imposible.
COMPLEMENTO DE UN EVENTO
Dado un evento A, su complemento, denotado con A o A´ es otro evento,
formado por todos los eventos elementales que están en el Espacio Muestral ( S ), y no
están en el evento A.

Gráficamente:
A

A S

Ejemplo
Considerando el experimento del lanzamiento de un dado perfecto una vez, y
definido el evento:
A = “Salida de  de 3”  A = { 3 , 6 }
 
múltiplo A = {1 , 2 , 4 , 5 }

TEORÍAS PROBABILÍSTICAS
I. Teoría Clásica, Principio de la Razón Insuficiente o Enfoque
de Laplace
Acorde a esta teoría, todos los eventos elementales que conforman un espacio
muestral tienen la misma probabilidad de aparecer en un experimento cualquiera,
determinándose la probabilidad de ocurrencia de un evento A mediante el cociente:

Número de eventos elementales favorables al evento A


P( A ) 
Número de eventos elementales igualmenteposibles

Casos Favorables
P(A) 
Casos igualmenteposibles
La aplicación de esta fórmula de cálculo, está supeditada a que se conozca el
número de eventos elementales que conforman el numerador y el denominador, debiendo
ser estos últimos “igualmente posibles”. Lo expuesto, no siempre es factible conocerlo en
la práctica, motivo por el cual, su aplicación es limitada.

Ejemplos
1. La probabilidad que salga el 17 en una ruleta (con un solo cero):

P(salida 17) = 1/37

2. La probabilidad que salga un número par en una tirada de un dado perfecto:



P(salida de número par) = 3/6

3. La probabilidad que salga una carta de oro de un mazo de 40 cartas:



P(salida de oro) = 10/40

4. La probabilidad de ganar apostando a color en una ruleta (con un solo cero):



[ P (color ) = 18/37]  1/2

5. La probabilidad de ganar apostando a docena en una ruleta (con un solo cero):



[P(primera docena) = 12/37]  1/3

II. Teoría Objetiva o Enfoque Frecuencial


Dadas las limitaciones prácticas de la teoría anterior, el Enfoque Frecuencial,
establece que la probabilidad de un evento A, sólo puede determinarse a través de pruebas
empíricas, repitiendo un experimento un número grande de veces (replicar el experimento),
de modo tal que: “Si un experimento se repite un número grande de veces ( n ), y se
obtienen ( m ) resultados favorables a un evento A, siendo m  n, la probabilidad de dicho
evento, surge del cálculo:

P ( A ) = lim m/n ; m/n = hi  Frecuencia relativa


n
Lo anterior, significa decir que las frecuencias relativas ( hi ) tienden a
estabilizarse, cuando n aumenta, alrededor de un número real no negativo, que es la
Probabilidad del Evento, dando lugar al denominado “Principio de la Estabilidad de
Probabilidad”, siendo éste el sustento teórico en los procesos de investigación.

Así por ejemplo, si se tira al aire una moneda perfecta un número grande de veces,
( n ), y se cuenta el número de caras salidas ( m ), el comportamiento gráfico de las
frecuencias relativas hi = m/n responderá a la forma:

(frecuencias relativas) estabilidad


m/n 

1/2

n (número de lanzamientos)

Si bien el sustento teórico de este enfoque es válido, su implementación práctica no


siempre es posible, en especial, cuando los procesos de experimentación son destructivos,
como ocurre por ejemplo, cuando se quiere probar una droga para una cierta patología en
seres humanos.

III. Teoría o Enfoque Subjetivista


Según este enfoque, la probabilidad de un evento A depende del juicio personal del
investigador, en base a las experiencias por él recogidas. Así por ejemplo, cuando en la
zona de Cuyo, los lugareños suponen que va a ocurrir un temblor en la tierra, al ver el
comportamiento de los animales, ya que, según esas personas, siempre que observaron que
los animales reaccionaban de cierta forma, ocurrió un temblor.
IV. Teoría Axiomática
Acorde a esta teoría, los Eventos que pueden deducirse de un Espacio Muestral,
deben satisfacer los siguientes Axiomas:

1. Existencial:
“Todo evento A, tiene asociado un número real que es su probabilidad”.

 A :  P ( A) / P ( A )  

2. No Negatividad:
“La probabilidad de un evento A, es un número real no negativo”.

 A : P ( A)  0

3. Certeza:
“La probabilidad del Evento Seguro o Cierto, es igual a 1”.

S  Evento Seguro o Cierto  P ( S ) = 1

Relacionando los Axiomas anteriores, podemos concluir en que: La probabilidad de


un evento A, es un Número Real comprendido en el intervalo:

0  P(A)  1

Observaciones:
a) “La probabilidad del evento imposible, es igual a cero”.

P()=0

b) “La probabilidad del complemento de un evento ( A’ ), es igual a uno menos la


probabilidad del evento dado ( A )”.

P ( A’ ) = 1 – P ( A )
LEY DE PROBABILIDAD TOTAL o TEOREMA DE
LA SUMA

I. “La probabilidad de la UNIÓN de dos eventos cualesquiera A y B, es igual


a la suma de las probabilidades de cada uno de los eventos dados, menos la
probabilidad de la intersección entre los mismos”.

Unión  A  B  A o B

P (A  B ) = P ( A ) + P ( B ) – P ( A  B )

Gráficamente:

A B 

A B
A B

II. “Si A y B son eventos mutuamente excluyentes o disjuntos [ A )( B )] , la


probabilidad de la UNIÓN será igual a la suma de las probabilidades de
cada uno de los eventos dados”.

Si : A )( B  A  B =   P ( A  B ) = 0

P (A  B ) = P ( A ) + P ( B )
Gráficamente:

A)(B  A  B =   A  B 

A B

Ejemplo
Si de un mazo de 40 cartas españolas, se escoge una al azar, calcular la probabilidad
que sea:
1) As o Espada.
2) Oro o Copa.

Solución:
Si definimos los eventos de la forma:
A = “Salida de As”  P(A) = 4/40
B = “Salida de Espada”  P(B) = 10/40
C = “Salida de Oro”  P(C) = 10/40
D = “Salida de Copa”  P(D) = 10/40

1) P(sea As o Espada)  P (A o B ) = P (A  B )

P (A  B ) = P (A) + P( B ) – P (A  B )  P (A  B ) = 4/40 + 10/40 - 1/40 = 13/40

as de espada

2) P(sea Oro o Copa)  P (C o D ) = P (C  D )



P(C  D ) = P(C) + P(D) – P (C  D )  P (C  D ) = 10/40 + 10/40 - 0 = 20/40 = 1/2


PROBABILIDAD CONDICIONAL O
CONDICIONADA

Dado un Espacio Muestral S, formado por n eventos elementales favorables,


todos con la misma probabilidad, y considerando dentro de él a dos eventos A y B, con a y
b eventos elementales favorables respectivamente, todos con la misma probabilidad,
existiendo c eventos elementales favorables al evento intersección entre A y B , (A  B):
La probabilidad de presentación del evento A condicionada a la ocurrencia del evento
B, denotada de la forma: P(A/B), que se lee “Probabilidad de A dado B” o también
“Probabilidad de A condicionada a B”, va a estar dada por el cociente:

Número de eventos elementales favorables a A  B


P(A/B )  (I)
Número de eventos elementales favorables a B

S  n: eventos elementales
a c b A  a: eventos elementales
B  b: eventos elementales
A A B B n A  B  c: eventos elementales
S

Reemplazando en ( I ) por sus iguales resulta:

c
c P(A  B) P(A  B)
P(A/B)   n   P(A/B)  ; P(B)  0 ( II )
b b P(B) P(B)
n

Análogamente:
c
c P(A  B) P(A  B)
P(B/A)   n   P(B/A)  ; P(A)  0 ( II )
a a P(A) P(A)
n

Acorde a lo deducido en (II), puede decirse que “La probabilidad condicionada de


un evento a otro, es igual a la probabilidad de la intersección entre los eventos dados,
sobre la probabilidad del evento condición, debiendo ser la probabilidad de éste, distinta
de cero”.

Ejemplo
De un mazo de 40 cartas españolas se escoge una al azar:

1) Si se sabe que es de Oro, calcular la probabilidad que sea un


As.
2) Si se sabe que es un As, calcular la probabilidad que sea de
Oro.

Solución:
Definiendo los eventos:

A = “Salida de As”  P(A) = 4/40


B = “Salida de Oro”  P (B) = 10/40
A  B = “Salida de As y Oro”  P( A  B ) = 1/40
resulta:

1
P(A  B) 1
1) P(A/B)  ; P(B)  0  P(A/B)  40 
P(B) 10 10
40


1
P(A  B) 1
2) P(B/A)  ; P(A)  0  P(B/A)  40 
P(A) 4 4
40

Número de eventos elementales favorables a A  B 1
P(B/A )  
Número de eventos elementales favorables a A 4

PROBABILIDAD COMPUESTA
I. Eventos Dependientes:
Se dice que dos eventos A y B son dependientes, cuando la ocurrencia de uno de
ellos en una prueba, afecta a la probabilidad de presentación del otro en una prueba
siguiente, lo que significa que si el experimento consiste en extracciones sucesivas, se
trabaja sin reposición o sin reemplazo.

La probabilidad de presentación conjunta de dos eventos dependientes A y B, es


decir de la intersección entre ambos, está dada por:

P(A  B)
P(A/B)   P(A  B)  P(B) x P(A/B)
P(B)

P(A  B)
P(B/A)   P(A  B)  P(A) x P(B/A)
P(A)

Lo anterior se denomina “Regla Multiplicativa para Eventos Dependientes”,


pudiéndosela generalizar, suponiendo tres eventos dependientes, de la forma:

P(A  B  C)  P(A) x P(B/A) x P(C/A  B)


Ejemplo
Una caja contiene 10 repuestos: 6 Buenos y 4 Defectuosos. Si se escogen
sucesivamente 2 repuestos, de modo tal que el primero sacado no sea devuelto a la caja.
Calcular la probabilidad de que:

1) Ambos sean Buenos.


2) Sólo uno sea Defectuoso.

Solución:
Definidos los eventos:

B = “Salida de repuesto Bueno”.


D = “Salida de repuesto Defectuoso”.

1era. extracción 2da. extracción

B2
5
B1
4
6 D2

O
4
6 B2
D1
3
D2

El gráfico anterior, se denomina “diagrama del árbol o arborescente”, y es


particularmente útil como método, para describir gráficamente los eventos posibles
asociados a pruebas u observaciones secuenciales, indicando los subíndices el orden de la
extracción, y en cada rama, el número de elementos resultantes, luego de cada extracción.
1) P(ambos Buenos) = P(B1 y B2)
.

= P(B1  B2)  P(B1) x P(B2/B1)


6 5 30 1
= x  
10 9 90 3

2) P(sólo un Defectuoso) = P[(B1 y D2) o ((D1 y B2)]



= P (B1  D2)  P(D1  B2 )


= P(B1) x P(D2/B1) + P(D1) x P(B2/D1)

6 4 4 6 48 8
= x  x  
10 9 10 9 90 15

II. Eventos Independientes:


Se dice que dos eventos A y B son independientes, cuando la ocurrencia de uno de
ellos en una prueba, no afecta a la probabilidad de ocurrencia del otro en una prueba
siguiente, lo que significa que en experimentos consistentes en extracciones
sucesivas, se trabaja con reposición o con reemplazo.

La probabilidad de ocurrencia conjunta, es decir de la intersección de dos eventos


independientes A y B, va a estar dada por:

P(A/B) = P(A)
Si A y B son eventos independientes 

P(B/A) = P(B)

Por lo tanto:
P(A  B)  P(A) x P(B/A)  P(A  B)  P(A) x P(B)
o
P(A  B)  P(B) x P(A/B)  P(A  B)  P(B) x P(A)

De lo expuesto se deduce que: “La probabilidad de la intersección, es decir, de la


presentación conjunta de dos eventos independientes, es igual al producto de las
probabilidades de cada uno de los eventos dados”.

P(A  B)  P(A) x P(B)  A y B son eventos independie ntes

Lo anterior se denomina “Regla Multiplicativa para Eventos Independientes”,


pudiéndosela generalizar, suponiendo tres eventos independientes, de la forma:

P(A  B  C)  P(A) x P(B ) x P(C)

Observación:

“Los eventos independientes NUNCA son mutuamente excluyentes, ya que éstos


son dependientes”.

Ejemplo
Calcular las probabilidades del problema anterior, pero suponiendo que el
experimento se efectúa, reponiendo el primer repuesto escogido, antes de extraer el
siguiente.
Solución:
Definidos los eventos:

B = “Salida de repuesto Bueno”.


D = “Salida de repuesto Defectuoso”.

1era. extracción 2da. extracción

B2
6
B1
4
6 D2

O
4
6 B2
D1
4
D2

1) P(ambos Buenos) = P(B1 y B2)


.

= P(B1  B2)  P(B1) x P(B2/B1)  P(B1 ) x P(B2)


6 6 36
= x   0,36
10 10 100

2) P(sólo un Defectuoso) = P[(B1 y D2) o ((D1 y B2)]



= P (B1  D2)  P(D1  B2 )


= P(B1) x P(D2/B1) + P(D1) x P(B2/D1)

= P(B1) x P(D2)  P(D1) x P(B2)

6 4 4 6 48
= x  x   0,48
10 10 10 10 100

REGLA DE BAYES O TEOREMA DE LAS CAUSAS


Generalmente, cuando se efectúa el cálculo de alguna probabilidad, la operación se
realiza antes de la ocurrencia de un cierto acontecimiento aleatorio, dando lugar a lo que se
denomina “Probabilidad a priori”, en contraposición a los casos en los que el cálculo de
las probabilidades, se efectúa después de la ocurrencia de un cierto acontecimiento
aleatorio, dando lugar a lo que se denomina “Probabilidad a posteriori”, siendo en estas
situaciones aplicables la Regla de Bayes o Teorema de las Causas.

Suponiendo un espacio muestral S, formado por k eventos mutuamente


excluyentes: A1 , A2 , ………., Ak , que conforman una partición del espacio muestral, y
considerando un evento B, que sólo puede presentarse por la ocurrencia previa de alguno
de los Ai eventos mutuamente excluyentes. Gráficamente:

A2

A1 A2 A3

A4 A5

B
Habiéndose presentado B ( a posteriori ), interesa calcular la probabilidad de que el
mismo, haya sido generado, por ejemplo por A1. Es decir, debemos calcular la
probabilidad condicionada:

P(A1  B)
P(A1/B)  (1)
P(B)

Para poder efectuar el cálculo de una probabilidad “a posteriori”, es necesario


conocer las probabilidades “a priori”:

P(A1) y P(B/A1)

Aplicando el diagrama arborescente, se tiene:

B  P(A1  B )
A1
B

B
A2
B
O
: :
: :

B
AK
B

Se observa que:

P(A1  B ) = P(A1 ) x P(B/A1) ( 2 )

Por otra parte, del gráfico se desprende que:

P(B) = P(A1  B ) + P(A2  B )    P(Ak  B ) ,


puesto que A1, A2, ….., Ak son eventos mutuamente excluyentes.

Dado que P(Ai  B )  P(Ai) x P(B/A i), segundo miembro resulta igual a:

P(B) = P(A1) x P(B/A1) + P(A2) x P(B/A2) + . . . . . + P(Ak) x P(B/Ak)


k
P(B) =  P(A ) x P(B/A )
i 1
i i (3)

Reemplazando en el numerador y denominador de ( 1 ), por sus iguales obtenidos en


( 2 ) y ( 3 ), resulta:

P(A1  B) P(A1 ) x P(B/A 1)


P(A1/B)  = k
 P(Ai) x P(B/A i)
P(B)
i 1

Que es la Fórmula de la Regla de Bayes a aplicar para calcular la probabilidad de


que el evento B haya sido generado en A1.

Generalizando:

P(Ar  B) P(Ar ) x P(B/A r)


P(Ar/B)   k
 P(Ai) x P(B/A i)
P(B)
i 1

Que es la Fórmula de la Regla de Bayes a aplicar para calcular la probabilidad de


que el evento B haya sido generado en un evento genérico Ar.

Observación:

En la práctica no es necesario recordar la fórmula antes deducida, puesto que


diseñando el diagrama del árbol, puede efectuarse el cálculo de la probabilidad a
posteriori.
Ejemplo 1
Tres máquinas A1 , A2 y A3 producen el 50%, 30% y 20% respectivamente del total
de artículos en una fábrica. Se sabe por estudios realizados que cada máquina produce
artículos defectuosos en el orden del 3%, 4%, y 5% respectivamente. Si se extrae un
artículo al azar y resulta defectuoso, calcular la probabilidad de que haya sido elaborado en
la máquina:

a) A1
b) A2
c) A3

Solución:
Siendo:
D = “Artículo Defectuoso”
D = “Artículo No defectuoso”

El diagrama del árbol responderá a la estructura:

0,03 D
A1 0,97

D
0 ,50

0,30 0,04 D
O A2 0,96

D
0,20

0,05 D
A3 0,95

D
P(A1  D) P(A1)xP(D/A1)
a) P(A1/D) =  3
 P(Ai) x P(D/Ai)
P(D)
i 1


0,50 x 0,03 0,015
P(A1/D) =   0,41
0,50 x 0,03  0,30 x 0,04  0,20 x 0,05 0,037

P(A2  D) P(A2)xP(D/A2)
b) P(A2/D) =  3
 P(Ai) x P(D/Ai)
P(D)
i 1


0,30 x 0,04 0,012
P(A2/D) =   0,32
0,50 x 0,03  0,30 x 0,04  0,20 x 0,05 0,037

P(A3  D) P(A3)xP(D/A3)
c) P(A3/D) =  3
 P(Ai) x P(D/Ai)
P(D)
i 1


0,20 x 0,05 0,01
P(A3/D) =   0,27
0,50 x 0,03  0,30 x 0,04  0,20 x 0,05 0,037

Ejemplo 2
Un empleado puede ir a su lugar de trabajo por dos caminos alternativos: A o B,
escogiendo el primer camino, 7 de cada 10 días de trabajo. De 5 veces que toma el camino
A, llega tarde a su lugar de trabajo una vez, mientras que, de 6 veces que toma el camino
B, llega tarde 4 veces. Hoy llegó tarde. Calcular la probabilidad de que, haya tomado el
camino B.
Solución:
Considerando a los eventos:
A = “Tomar el camino A”
B = “Tomar el camino B”
T = “Llegar tarde”
T = “Llegar a horario”

El diagrama del árbol responderá a la estructura:

1/5 T
A 4/5
7/10 T

O 3/10
4/6 T
B 2/6
T

La probabilidad buscada es:

P(B  T)
P(B/T) =
P(T)

P(B) x P(T/B)
P(B/T) =
P(A) x P(T/A)  P(B) x P(T/B)

3 4
x
10 6 0,20
P(B/T) =   0,5882
7 1 3 4 0,34
x  x
10 5 10 6
Ejemplo 3

Dados los eventos A y B, siendo: P(A) = 0,30 y P(B) = 040

P(A  B) = 

a) Si A y B son eventos independientes.


b) Si A y B son eventos mutuamente excluyentes.

Solución:
a) P(A  B)  P(A)  P(B) - P(A  B)


Si A y B son eventos independientes  P(A  B)  P(A) x P(B)


P(A  B)  0,30  0,40 - 0,30 x 0,40


P(A  B)  0,70 - 0,12  0,58

b) P(A  B)  P(A)  P(B) - P(A  B)

Si A y B son eventos mutuamente excluyentes  P(A  B)  P (  ) = 0



P(A  B)  0,30  0,40 - 0


P(A  B)  0,70
Ejemplo 4

Dados los eventos A y B, siendo P(A) = 0,20 y P(B) = 040,


Obtener:
a) P(A/B)
b) P(A  B) Union

c) P(A  B) Intersectado

Suponiendo que los eventos son:


1) Independientes.
2) Mutuamente Excluyentes.

Solución:
1) Suponiendo que los eventos sean Independientes:

a) P(A/B) = P(A) = 0,20

b) P(A  B) = P(A) + P(B) – P(A  B)  P(A  B) = P(A) x P(B)


P(A  B) = 0,20 + 0,40 – 0,20 x 0,40

P(A  B) = 0,52

c) P(A  B) = P(A) x P(B)



P(A  B) = 0,20 x 0,40 = 0,08
2) Suponiendo que los eventos sean Mutuamente Excluyentes: Mutuamente
excluyente,
a) P(A/B) = P( ) = 0 da la
interseccion
el elemento
b) P(A  B) = P(A) + P(B) – P(A  B)  P(A  B) = P () = 0 imposible

P(A  B) = 0,20 + 0,40

P(A  B) = 0,60

c) P(A  B) = P()


P(A  B) = 0

Ejemplo 5
En una gran ciudad, se seleccionó una muestra aleatoria de 500 encuestados a los
efectos de obtener información diversa respecto al comportamiento de los consumidores.
Entre las preguntas formuladas, estaba: “Disfruta comprar ropa?”. De 240 hombres, 136
respondieron que sí. De las 260 mujeres, 244 respondieron que sí.

a) Construir una tabla de 2 x 2.


b) Dar un ejemplo de evento simple.
c) Dar un ejemplo de evento conjunto.
d) Cuál es el complemento del evento “disfruta comprar ropa”?,
e) Calcular la probabilidad que un encuestado elegido aleatoriamente:

1. Sea hombre.
2. Disfrute comprar ropa.
3. Sea mujer.
4. No disfrute comprar ropa.
5. Sea mujer y disfrute comprar ropa.
6. Sea hombre y no disfrute comprar ropa.
7. Sea un hombre y disfrute comprar ropa.
8. Sea mujer o disfrute comprar ropa.
9. Sea hombre o no disfrute comprar ropa.
10. Disfrute o no disfrute comprar ropa.
11. Si el encuestado elegido es mujer, cuál es la probabilidad que no disfrute
comprar ropa?.
12. Si el encuestado elegido disfruta comprar ropa, cuál es la probabilidad que
sea hombre?.
13. Si el encuestado elegido no disfruta comprar ropa, cuál es la probabilidad
que sea mujer?.
14. Si el encuestado elegido es hombre, cuál es la probabilidad que disfrute
comprar ropa?.
15. Disfrutar comprar ropa y el género del individuo, son estadísticamente
independientes?. Fundamentar.

Solución:

a) Definidos los eventos:

A = “Ser hombre”.
B = “Ser mujer”.
C = “Sí disfruta”.
D = “No disfruta”.

Sexo Hombre Mujer TOTAL


(A) (B)
Disfruta
Sí (C) 136 244 380
No (D) 104 16 120
TOTAL 240 260 500

b) “Sí disfruta”.  C
c) “Disfruta y es mujer”.  C  B
d) “No disfruta comprar ropa”  C’ = D
e)
240
1. P( A ) =  0,48
500
380
2. P( C ) =  0,76
500
260
3. P( B ) =  0,52
500
120
4. P( D ) =  0,24
500
244
5. P( B y C )  P( B  C )   0,488
500
104
6. P( A y D ) = P(A  D) =  0,208
500
136
7. P( A y C ) = P(A  C) =  0,272
500

8. P( B o C ) = P(B  C) = P(B ) + P(C ) – P(B  C)

260 380 244 396


=  -   0,792
500 500 500 500

9. P( A o D ) = P(A  D) = P(A ) + P(D ) – P(A  D)

240 120 104 256


=  -   0,512
500 500 500 500

10. P( C o D ) = P(C  D) = P(C ) + P(D ) – P(C  D)




380 120 500
=  - 0  1
500 500 500

evento seguro

16
P ( D  B ) 500 16
11. P ( D/B ) =    0,062
P(B) 260 260
500

Utilizando un diagrama arborescente, resulta:


136 C
A 104
240 D
O
260 244 C
B 16
16
D  P ( D/B ) =  0,062
260

136
P ( A  C ) 500 136
12. P( A/C ) =    0,358
P(C) 380 380
500

Utilizando en diagrama del árbol, resultaría:

136
136 A  P (A/C) =  0,358
380
C 244
380 B
O
120 104 A
D 16
B

16
P ( B  D ) 500 16
13. P (B/D ) =    0,133
P(D) 120 120
500
136
P ( C  A ) 500 136
14. P (C/A ) =    0,567
P(A) 240 240
500
15. A y C son independientes  P(C/A) = P(C)

136
P(C/A) =  0,57
240
380
P(C ) =  0,76
500

Dado que P(C/A) ≠ P(C)  el evento: “disfrutar comprar ropa” no es


independiente del evento: “ género del individuo”.

Ejemplo 6

Un sistema está conectado de la forma:

A D E

Siendo el funcionamiento de una componente en particular independiente de las


demás, con probabilidades de funcionamiento dadas por:

P(A) = 0,96 ; P(B ) = 0,95 ; P(C) = 0,94 ; P(D) = 0,97 ; P(E ) = 0.95

Calcular la probabilidad de que el sistema funcione.

Solución:
Sistema funciona ( F )  A y (B o C) y D y E

y    multiplicación
o    suma
F = { A  (B  C)  D  E} (I)

B y C funcionan en forma independiente  P(B  C) = P(B) + P(C) – P(B  C)


P(B  C) = P(B) x P(C)  P(B  C) = 0,95 + 0,94 – 0,95 x 0,94 = 0,997 ( II )

Tomando probabilidades en ( I )  P(F) = P(A) x P(B  C) x P(D) x P(E)

P(F) = 0,96 x 0,997 x 0,97 x 0,95

P(F) = 0,8820

También podría gustarte