Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MATERIAL TEÓRICO
Unidades 1 a 5
Modalidad a Distancia
Equipo Docente:
Cra. Ana Edith Cocco
Esp Rita Ester Maldonado
Lic. Matías Battaglino
Cra. Agostina Scapin
Cr. Fernando Lourenço
Año 2023
OBJETIVOS
Los establecidos para cada unidad
CONTENIDOS
Desarrollo de los contenidos de cada unidad
EJEMPLOS
Se utilizan para clarificar los contenidos.
EJERCICIOS DE CÁLCULO
Están destinados a la interpretación correcta de enunciados, uso de fórmulas y
adquisición de destrezas en el cálculo.
ARCHIVOS DE DATOS
Consisten en conjuntos de datos almacenados en formato planilla de cálculo para
ser utilizados en la resolución de ejercicios mediante las herramientas informáticas
adecuadas. Las mismas hacen referencia tanto a planillas de cálculo
convencionales como a software estadístico específico. En cada caso se analizará
la conveniencia de la herramienta a utilizar.
EJERCICIOS DE AUTOEXAMEN
Permiten que el alumno pueda establecer una medición de su nivel de aprendizaje
delos conceptos adquiridos y aumente la destreza de aplicación de los mismos en
situaciones cotidianas. Las soluciones se proporcionan en el apéndice destinado a
tal fin.
GLOSARIO
En esta sección se puntualizan y destacan los términos y conceptos desarrollados
en la unidad.
RESUMEN
Síntesis de la unidad.
Apuntes de Cátedra: Estadística - Fac. Cs.Económicas - U.N.R.C. 2
UNIDAD 1
OBJETIVOS
Proporcionar al estudiante los elementos necesarios para el tratamiento estadístico
de situaciones problemáticas.
Desarrollar habilidades para la presentación gráfica y tabular de datos cualitativos
y cuantitativos.
CONTENIDOS
A. LA NECESIDAD DE LA ESTADÍSTICA. LOS DATOS Y SU MEDICIÓN
A.1. Origen y Aplicaciones en las Ciencias Económicas
A.2. Estadística Descriptiva
A.3. Estadística Inferencial
A.4. Población y Muestra
A.5. Datos. Variables. Escala de medición
Fuentes de Datos
A.6. Cómo se realiza un trabajo estadístico.
Elemento: Individuo o entidad de los que se obtienen los datos. En la tabla anterior,
cada empresa constituye un elemento.
Por ejemplo, Cargil es un elemento, Arcor otro elemento, Sancor otro.
Cada cifra o información volcada en la tabla constituye un dato, por lo tanto toda la
tabla es el conjunto de datos a analizar.
Escalas de medición
La Escala de medición se utiliza para determinar cuánta información se encuentra
contenida en el dato.
La recolección de datos requiere alguna de las escalas de medición siguientes:
nominal, ordinal, de intervalo o de razón.
Escala nominal: Cuando el dato de una variable es un nombre que identifica una
característica de un elemento, se considera que la escala de medición es una
escala nominal. La escala de medición es nominal aun cuando los datos aparezcan
como valores numéricos ya que se usan para identificar y clasificar objetos.
No admiten criterios de orden. Cada valor se asigna a una categoría diferente.
Por ejemplo, Estado Civil de las personas que puede tomar la modalidad: soltero,
casado, divorciado, separado o viudo.
Escala Ordinal: se establece un orden jerárquico entre las categorías; ejemplo:
gerente de una empresa, jefe de sección, empleado.
Al igual que en las escalas nominales, en las escalas ordinales se emplean a
menudo porcentajes y proporciones.
Escala de intervalo: establece una distancia entre los valores de la variable, el
punto de origen de la escala es convencional, ejemplo: la temperatura corporal.
Escala de razón: presenta todas las propiedades de orden y distancia de la escala
de intervalo adicionando el punto de origen; ejemplo: el peso, la talla.
Otros Ejemplos:
a) La calificación de un examen en términos de desaprobado, aprobado o
promocionado, es una variable cualitativa, del tipo ordinal, en donde a pesar de
no haber, una característica numérica, sí en cambio, hay un orden que se
establece, en este caso de menor a mayor.
b) El número de empleados de una fábrica es una variable cuantitativa discreta.
c) La velocidad de un vehículo es una variable cuantitativa continua medida en
escala de razón.
d) El número de unidades de un artículo en existencia es una variable cuantitativa
discreta.
e) El Tonelaje total embarcado es una variable cuantitativa continua medida en
escala de razón.
f) La Profesión de una persona es una variable cualitativa medida en escala
nominal.
Solución:
a) La Tabla A.1. constituye un conjunto de datos. En él hay 24 elementos, cada una
de las empresas consideradas.
b) Cada fila de la tabla corresponde a un elemento o individuo. Cada columna, a
una variable.
c) En este conjunto de datos hay 6 variables: Recordemos que:
Actividad es una Variable Cualitativa medida en Escala Nominal.
Ventas es una Variable Cuantitativa Continua medida en Escala de razón.
P. Neto es una Variable Cuantitativa Continua medida en Escala de razón.
Activo es una Variable Cuantitativa Continua medida en Escala de razón
Empleados: es una Variable Cuantitativa medida en Escala Discreta
Resultado es una Variable Cuantitativa Continua medida en Escala de razón
Apuntes de Cátedra: Estadística - Fac. Cs.Económicas - U.N.R.C. 12
d) Promedio de Ventas = número de ventas = 12596 = 524,83.
24
e) 3 ventas de 24empresas superan los 1000, es decir un porcentaje del 12,5%
(3/24).
f) 8 empresas de 24empresas tienen menos de 800 empleados, es decir un
porcentaje del 33,33% (8/24).
g) Filtre la lista de datos de manera que sólo visualice las empresas
correspondientes a esta Actividad.
RESUMEN
Esta primera parte de la unidad introduce los conceptos básicos de la estadística
necesarios para poder realizar un trabajo estadístico.
Primeramente, se definen los conceptos elementales de población y muestra y a
continuación datos, variables y escalas de medidas con la correspondiente
clasificación.
Luego se define la estadística descriptiva e inferencial y finalmente se ingresa ya
en la elaboración de un pequeño trabajo estadístico, desde cómo recolectar datos,
organizarlos, presentarlos e interpretarlos.
Destinos Turísticos
40%
35%
30%
25%
20%
15%
10%
5%
0%
Costa Atlántica Cataratas del Noroeste Mendoza Patagonia
Iguazú Argentino
Destinos Turísticos
10%
16%
12 14 19 18
15 15 18 17
20 27 22 23
22 21 33 28
14 18 16 13
Fuente: Estadística para Administración y Economía – Anderson Sweeney Williams
Para construir una distribución de frecuencias los datos brutos se los debe agrupar
en clases y para ello es necesario definir el número de clases, el ancho que deberán
tener y fijar los límites de cada clase.
Número de clases: El fin es obtener suficientes clases de manera que se observe
la forma de distribución, y esta es una cuestión de criterio. Se recomienda emplear
entre 5 y 20 clases. Cuando los datos son pocos, cinco o seis clases bastan para
resumirlos. Si son muchos, se suele requerir más clases. Como el número de datos
en la tabla B.4 es relativamente pequeña (n = 20), se decide elaborar una
distribución de frecuencia con cinco clases.
Intervalo o ancho de clase: El número de clases y el ancho son interdependientes,
cuanto mayor sea el número de clases menor es el ancho de las clases y viceversa.
Identificando el mayor y el menor de los valores de los datos y dividiéndolo por el
número de clases se obtiene el intervalo de clase. De acuerdo con la siguiente
expresión:
Ancho aproximado de clase = Mayor valor en los datos – Valor menor en los datos
Numero de clases
La expresión ancho aproximado se debe a que se redondea el valor obtenido a
conveniencia de quien construye la distribución.
Como regla general es recomendable que el ancho sea el mismo para todas las
clases, los intervalos de clase desiguales originan problemas de análisis e
interpretación en los datos.
En los datos sobre las duraciones de las auditorías de fin de año el valor mayor en
los datos es 33 y el valor menor es 12. Como se ha decidido resumir los datos en
cinco clases, empleando la ecuación el ancho aproximado de clase que se obtiene
es (33 - 12)/5 = 4.2.
Al redondear, en la distribución de frecuencia se usa como ancho de clase cinco
días.
En la práctica el número de clases y su ancho adecuado se determinan por prueba
y error.
Y para ello se utilizan combinaciones entre número de clases e intervalo hasta
lograr la distribución que mejor resume los datos a criterio de quien la construye.
Al tener el número de clases y el intervalo o ancho de la clase, se fijan los límites
de clase.
Límites de clase. Los límites de clase deben elegirse de manera que cada dato
pertenezca a una y sólo una de las clases. El límite de clase inferior indica el menor
valor de los datos a que pertenece esa clase. El límite de clase superior indica el
mayor valor de los datos a que pertenece esa clase. Al elaborar distribuciones de
Mediante los datos de la duración de las auditorías de la tabla B.4, se elige 10 días
como límite inferior y 14 como límite superior de la primera clase. En la tabla B.5
esta clase se denota como 10–14. El valor menor, 12 (de la tabla), pertenece a la
clase 10–14. Después se elige 15 días como límite inferior y 19 como límite superior
de la clase siguiente. Así, se continúan definiendo los límites inferior y superior de
las clases hasta tener las cinco clases. El valor mayor en los datos, 33, pertenece
a la clase 30–34.
Las diferencias entre los límites inferiores de clase de clases adyacentes es el
ancho de clase. Con los dos primeros límites inferiores de clase, 10 y 15, se ve que
el ancho de clase es 15 – 10 = 5.
Una vez determinados números, ancho y límites de las clases, la distribución de
frecuencia se obtiene contando el número de datos que corresponden a cada clase.
Por ejemplo, en la tabla B.4 se observa que hay cuatro valores que pertenecen a la
clase 10-14. Por tanto, la frecuencia de la clase 10–14 es 4. Al continuar con este
proceso de conteo para las clases se obtiene la distribución de frecuencia que se
muestra en la tabla B.5. En esta distribución de frecuencia se observa lo siguiente:
1. Las duraciones de las auditorías que se presentan con más frecuencia son de la
clase 15-19 días. 8 de las 20 auditorías caen en esta clase.
2. Sólo una auditoría requirió 30 o más días.
Una observación interesante es respecto de que al organizar la información en
intervalos de frecuencia, se resume información y por lo tanto hay una perdida de
información detallada, sin embargo los beneficios de poder resumir (sobre todo una
importante cantidad de datos) en una tabla de frecuencias con intervalos,
compensa esa pérdida de detalle en la información.
Punto medio de clase. Se obtiene sumando el límite inferior y superior y
dividiéndolo por dos. Es entonces el valor medio entre el límite inferior y el límite
superior de la clase y es representativo de los valores que corresponden a cada
clase. En el caso de las duraciones de las auditorías, los cinco puntos medios de
clase son 12, 17, 22, 27 y 32.
Gráficos de puntos
Uno de los más sencillos resúmenes gráficos de datos son las gráficas de puntos.
En el eje horizontal se presenta el intervalo de los datos. Cada dato se representa
por un punto colocado sobre este eje. El gráfico B.3 es la gráfica de puntos de los
datos de la tabla B.4.
Los tres puntos que se encuentran sobre el 18 del eje horizontal indican que hubo
tres auditorías de 18 días. Las gráficas de puntos muestran los detalles de los datos
y son útiles para comparar la distribución de los datos de dos o más variables.
Gráfico B.3. Gráfica de puntos para los datos de las duraciones de las auditorías
12 13 14 15 16 17 18 19 20 21 22 23 27 28 33
Frecuencias
9
8
7
6
5
4
3
2
1
0
10-14 15-19 20-24 25-29 30-34
Simétrico
10
8
6
4
2
0
10-14 15-19 20-24 25-29 30-34
5
Frequency
4
4
2
2
1
0
10 15 20 25 30 35
tiempoaudi
25
20
15
10
0
5 10 15 20 25 30 35
112 72 69 97 107
73 92 76 86 73
126 128 118 127 124
82 104 132 134 83
92 108 96 100 92
115 76 91 102 81
95 141 81 80 106
84 119 113 98 75
68 98 115 106 95
100 85 94 106 119
Para elaborar un diagrama de tallo y hoja inicie acomodando los primeros dígitos
de cada uno de los datos a la izquierda de una línea vertical. A la derecha de la
línea vertical se anota el último dígito de cada dato. Con base en la primera fila de
la tabla B.8 (112, 72, 69, 97 y 107), los primeros cinco datos al elaborar el diagrama
de tallo y hojas serían los siguientes:
Por ejemplo, para el dato 112, se observa que los primeros dígitos, 11, se
encuentran a la izquierda de la línea y el último dato, 2, a la derecha. De manera
similar, el primer dígito, 7, del dato 72 se encuentra a la izquierda de la línea y el 2
a la derecha. Si continúa colocando el último dígito de cada dato en la fila
correspondiente a sus primeros dígitos obtiene:
6 98
7 236365
8 62311045
9 72262158854
10 748026606
11 2859359
12 6874
13 24
14 1
Una vez organizados los datos de esta manera, hay que ordenar los datos de cada
fila de menor a mayor. Entonces se obtiene el diagrama de tallo y hojas que se
muestra aquí.
6 89
7 233566
8 01123456
9 12224556788
10 002466678
11 2355899
12 4678
13 24
14 1
Los números a la izquierda de la línea vertical (6, 7, 8, 9, 10, 11, 12, 13 y 14) forman
el tallo, y cada dígito a la derecha de la línea vertical es una hoja. Por ejemplo,
considere la primera fila que tiene como tallo el 6 y como hojas 8 y 9. Esta fila indica
que hay dos datos que tienen como primer dígito el seis. Las hojas indican que
estos datos son 68 y 69.
Para atender a la forma del diagrama de tallo y hojas, se usan rectángulos que
contienen las hojas de cada tallo; con esto se obtiene lo siguiente.
7 233566
8 01123456
9 12224556788
10 002466678
11 2355899
12 4678
1
13 24
14 1
Al rotar la página sobre su costado en contra de las agujas del reloj se obtiene una
imagen de los datos que es parecida a un histograma y en el que las clases son
60–69, 70–79, 80–89, etcétera.
Aunque el diagrama de tallo y hojas parece proporcionar la misma información que
un histograma, tiene dos ventajas fundamentales:
1. El diagrama de tallo y hojas es más fácil de construir a mano.
2. En cada intervalo de clase proporciona más información que un histograma
debido a que el tallo y la hoja proporcionan el dato.
Así como para una distribución de frecuencia o para un histograma no hay un
determinado número de clases, tampoco para el diagrama de tallo y hojas hay un
número determinado de renglones o tallos. Si piensa que este diagrama original
condensa demasiado los datos, es fácil expandirlo empleando dos o más tallos por
cada primer dígito. Por ejemplo, para usar dos tallos por cada primer dígito se ponen
todos los datos que terminen en 0, 1, 2, 3 o 4 en una fila y todos los datos que
terminen en 5, 6, 7, 8 o 9 en otro. Este método se ilustra en el siguiente diagrama
expandido de tallo y hojas.
6 89
7 233
7 566
8 011234
8 56
9 12224
9 556788
10 0024
10 66678
11 23
11 55899
12 4
12 678
13 24
13
14 1
Observe que las hojas de los datos 72, 73 y 73 pertenecen al intervalo 0–4 y
aparecen con el primer tallo que tiene el valor 7. Las hojas de los valores 75, 76 y
Unidad de hoja = 10
15 6
16 47
17 369
18 1558
19 156
20 04
Observe que para definir cada hoja se emplea un solo dígito y que para construir el
diagrama sólo se usaron los primeros tres dígitos de cada dato. En la parte superior
del diagrama se ha especificado que la Unidad de hoja = 10.
Para ilustrar cómo se interpretan los datos de este diagrama considere el primer
tallo 15 y su hoja correspondiente 6. Al unir estos números obtiene 156. Para lograr
una aproximación al dato original es necesario multiplicar este número por 10, el
valor de la unidad de hoja. Por tanto, 156 x 10 = 1560 es una aproximación al dato
original empleado para construir el diagrama de tallo y hoja.
Aunque a partir de este diagrama no es posible reconstruir los datos exactos, la
convención de usar un solo dígito para cada hoja, permite construir diagramas de
tallo y hojas con datos que tengan un gran número de dígitos. En diagramas que
no se especifica la unidad de hoja, se supone que la unidad es 1.
Al dividir los totales del margen derecho de la tabulación cruzada entre el total de
esa columna se obtienen distribuciones de frecuencia relativa y frecuencia
porcentual de la variable calidad. Por ejemplo, 84/300 = 0,28.
Ventas
70
Ventas (en cientos de $)
60
50
40
30
20
10
0
0 1 2 3 4 5 6
Número de comerciales
1) Se pide:
a) Identifique las variables que se muestran graficadas.
b) Determine la mayor frecuencia para el Intervalo de edad y para Lugares
Destacados.
c) Realice la distribución de frecuencia relativa para la variable Sexo de los
seguidores. Determine la cantidad actual de seguidores hombres y
seguidores mujeres en valores absolutos.
2) Se pide:
a) Muestre la distribución de frecuencia relativa y frecuencia porcentual.
b) Realice un gráfico de barras.
INTRODUCCIÓN
En la unidad anterior estudió las representaciones de datos mediante tablas y
gráficos a los efectos de resumir los datos.
Existen circunstancias en las que ni las tablas ni los gráficos nos dan información
suficiente para la toma de decisiones. Es por ello que, en esta unidad, se presentan
varias medidas numéricas que proporcionan otras opciones para resumir datos.
Primeramente, utilizará medidas numéricas para conjuntos de datos que constan
de una sola variable. Se verán medidas que se llaman de posición, que nos
permiten decir alrededor de que valor se encuentran todos los valores de la variable
aleatoria y medidas de dispersión, que nos indican si los valores están más o menos
dispersos alrededor de la medida de posición.
En algunas ocasiones basta con calcular un promedio, por ejemplo, para
caracterizar el conjunto de datos, pero en otras, debemos calcular además, alguna
medida de dispersión para caracterizarlo mejor. Si además, queremos comparar
medidas de variación de dos o más distribuciones, tendremos que considerar
valores relativos de estas medidas.
Posteriormente, si el conjunto de datos consta de más de una variable, empleará
estas mismas medidas numéricas para cada una de las variables por separado.
Además, en el caso de dos variables, estudiará también medidas de la relación
entre dos variables.
OBJETIVOS
Lograr capacidades de comprensión, definición y cálculode las medidas de posición
y dispersión.
Ser capaz de comprender, definir y calcular las medidas de asimetría.
Ser capaz de comparar dos muestras estadísticas mediante sus medidas.
Ser capaz de caracterizar a un conjunto de datos mediante la lectura de sus
medidas.
Saber utilizar estas medidas en situaciones prácticas de la vida profesional.
CONTENIDOS
2.1. Análisis para una variable
Medidas de tendencia central y Posición
Media
Mediana
Moda
Media
La medida de posición más importante es la media, o valor promedio, de una
variable. La media proporciona una medida de posición central de los datos.
Si los datos son datos de una muestra, la media se denota 𝑥̅ .
Si los datos son datos de una población, la media se denota con la letra griega μ.
Recuerde que el valor de la primera observación de la variable x se denota con x1,
el valor de la segunda observación de la variable x con x2 y así sucesivamente. El
valor de la i-ésima observación de la variable x se denota xi. La fórmula para la
media muestral cuando se tiene una muestra de n observaciones es la siguiente.
∑ 𝑥𝑖
𝑥̅ = (2.1)
𝑛
x
i 1
i
𝑥1 +𝑥2 +𝑥3 +𝑥4 +𝑥5 36+44+52+42+26 200
𝑥̅ = = = = = 40
n 5 5 5
n
xi fi
x i 1
xi fi
(2.3)
n n
fi
i
Es necesario observar que aunque (2.1) y (2.3) tienen distintas estructuras, no hay
dos medias aritméticas. La media aritmética es una sola, lo que sucede es que en
la fórmula (2.1) se consideran los valores de cada observación aisladamente,
repitiendo los valores iguales tantas veces como aparecen, y en (2.3) en lugar de
x f
repetir los valores iguales, i , se tiene en cuenta su frecuencia de observación, i
f
, y se lo coloca una sola vez multiplicado por i .
Para calcular la media aritmética en las distribuciones con datos agrupados (series
agrupadas) se utilizan las mismas formulas (2.1) y (2.3), pero en las distribuciones
con datos agrupados, el valor de la variable es el punto medio del intervalo de clase.
Al respecto cabe recordar que cuando la variable aleatoria es continua, las
frecuencias, y los datos en general, están siempre dados para intervalos de clase.
Por el momento se omite la fórmula teórica de la media aritmética de una variable
continua. El cálculo práctico de la media se efectúa con la fórmula:
x i fi
x (2.4)
f i
x f
donde i es el punto medio del intervalo de clase y i la frecuencia con que se ha
presentado un valor en ese intervalo.
Debemos observar también que, cuando se trata de datos agrupados, la frecuencia
de cada clase se refiere a distintos valores dentro del intervalo de clase y que pocas
veces estos valores están uniformemente distribuidos en el intervalo.
Al tomar el punto medio como representativo de todos los valores de clase, se
supone que los datos están distribuidos uniformemente, y cuando esto no es cierto
se comete un error.
Ejemplo:
Se han registrado las ventas en un comercio durante 50 días, con los siguientes
resultados, en miles de pesos:
Solución
n
xi 6.862
i 1
x 137,24
a) n 50
b) El valor mayor es 153 y el menor 117, por lo tanto la amplitud del recorrido de la
variable es 153 - 117 = 36.
La amplitud del intervalo “c” tendría que ser: 36/5=7,2; pero como no es un valor
muy cómodo para trabajar entonces se amplía el recorrido a 155- 115 de modo que
c = 40/5 = 8.
Clase
Frecuencias
Li Ls
115 123 3
123 131 10
131 139 19
139 147 13
147 155 5
En el cuadro anterior hemos obtenido una distribución de frecuencias en cinco
intervalos de clase. Los datos así presentados no permiten el cálculo de los distintos
parámetros, para poder obtenerlos es necesario buscar un valor que represente los
valores de la variable incluidos en cada intervalo de clase. Para eso se trabaja con
los puntos medios de cada intervalo, que se obtienen sumando el límite inferior al
límite superior y dividirlo por dos,
( ( Li+Ls) / 2 )
En nuestra actividad los puntos medios son los que aparecen en el cuadro siguiente
en la columna número 1.
c) Se construye el cuadro siguiente a los fines de sistematizar la información. Las
columnas 1 y 2 surgen del cuadro presentado en punto b.
x i fi
6806
x 136.12 de acuerdo a la columna 3 del cuadro.
n 50
Compare con el resultado obtenido en a) y extraiga conclusiones.
xi wi
x (2.5)
wi
xi f i wi
x (2.6)
wi fi
Donde fi n.
La media geométrica
Su fórmula es:
Donde:
La media geométrica se calcula como un producto conjunto. Es decir, que todos los
valores se multiplican entre sí, de modo que si uno de ellos fuera cero, el producto
total sería cero. Por ello, debemos siempre tener en cuenta que a la hora de calcular
la media geométrica necesitamos números que sean únicamente positivos.
Una de sus principales ventajas es que es menos sensible a valores extremos (muy
grandes o muy pequeños) que podrían alterar la media de una muestra estadística.
Por el contrario, su principal desventaja es que no puede utilizarse con números
negativos.
Ejemplo: 25 – 28 – 29 – 30 – 35 Mediana = 29
Para obtener este resultado no olvide previamente ordenar de manera creciente los
valores de ventas.
Se recuerda el contenido de la tabla Empresas.xlsx, ya utilizada en unidades
anteriores:
N 1
(M e ) (2.7)
2
153 – 123 – 129 – 132 – 147 – 138 – 137 – 134 – 131 – 147 –
134 – 148 – 125 – 139 – 146 – 145 – 148 – 135 – 152 – 128 –
138 – 138 – 122 – 146 – 137 – 151 – 145 – 124 – 132 – 138 –
137 – 146 – 138 – 146 – 140 – 137 – 129 – 126 – 117 – 136 –
128 – 127 – 146 – 144 – 137 – 128 – 143 – 141 – 136 – 138 –”
Con estos datos se pide:
a) calcular la mediana de los datos originales.
b) calcular la mediana de los datos agrupados.
Solución
a) Recordar que la mediana es el valor de la variable que divide al total de datos,
ordenados en forma creciente o decreciente, en dos partes iguales.
Por lo tanto, los datos puestos en orden creciente serian:
117 – 122 – 123 – 124 – 125 – 126 – 127 – 128 – 128 – 128 –
129 – 129 – 131 – 132 – 132 – 134 – 134 – 135 – 136 – 136 –
137 – 137 – 137 – 137 – 137 – 138 – 138 – 138 – 138 – 138 –
138 – 139 – 140 – 141 – 143 – 144 – 145 – 145 – 146 – 146 –
146 – 146 – 146 – 147 – 147 – 148 – 148 – 151 – 152 – 153 –
137 138
Me 137,5
2
Cuando la frecuencia acumulada es 32, quiere decir que el orden que daba 25,5 se
encuentra dentro de esa frecuencia y por lo tanto el valor de la mediana en este
caso es el 135.
Ejemplo:
Si considera ahora un grupo de 5 personas a las que se le pregunta su edad, la
media aritmética del grupo será:
5 7 8 10 90
X 24 años
5
Esta es una cifra que no representa al grupo de ninguna manera. En cambio, si
ordenamos las edades de menor a mayor y tomamos el del medio, 8, este número
si será representativo del grupo.
Aunque la media es la medida de localización central más empleada, en algunas
situaciones se prefiere la mediana.
A la media la influyen datos en extremo pequeños o considerablemente grandes.
Al generalizar lo anterior, es posible decir que cuando los datos contengan valores
extremos, es preferible usar a la mediana como medida de localización central.
Moda
La moda es el valor que se presenta más veces.
Por lo general, se usa para un número grande de observaciones, cuando el
investigador desea hacer notar el valor más popular.
La moda es un buen indicador sólo si hay una frecuencia dominante.
Ejemplo:
Considerando la planilla de cálculo Empresas.xlsx, utilizada en las unidades
anteriores, calcule la moda para el conjunto de datos que hace referencia a las
actividades de las empresas.
La moda es Industria Alimenticia que aparece 6 veces dentro del conjunto de
datos.
Hay situaciones en que la frecuencia mayor se presenta con dos o más valores
distintos. Cuando esto ocurre hay más de una moda. Si los datos contienen más de
una moda se dice que los datos son bimodales. Si contienen más de dos modas,
son multimodales. En los casos multimodales casi nunca se da la moda, pues no
resulta de mucha utilidad.
Ejemplo:
Se consideran ahora importes de sueldos correspondientes a empleados iniciales
(sin antigüedad) de una empresa.
3450 3355 3310 3480 3490 3480 3730 3550 3540 3650 3520 3925
Cuartiles
Los cuartiles son valores análogos a la mediana y los percentiles, pero en lugar de
dividir los datos ordenados en dos partes iguales, se dividen en cuatro partes. Cada
parte contiene el 25% de las observaciones.
Q1= primer cuartil, o percentil 25. Q1 = (3450+3480)/2 = 3465
Q2 =segundo cuartil, o percentil 50
Q3 = tercer cuartil, o percentil 75
Una vez más se ordenan los sueldos iniciales de menor a mayor. Q2, el segundo
cuartil (mediana), es 3505.
Hasta aquí vimos las medidas de posición, que nos incidan el valor central
alrededor del cual se distribuyen los valores del conjunto de datos.
A continuación, veremos las medidas de variación que se llaman también medidas
de concentración o medidas de dispersión, e indican de qué manera se distribuyen
los valores alrededor del valor central. Nos dicen si estos valores están
concentrados o dispersos.
1 2 3 4 5 6 7 8 9
1 2 3 4 5 6 7 8 9
Serie 3
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
1 2 3 4 5 6 7 8 9
Rango
Es la diferencia entre el mayor valor y el menor valor del conjunto de datos.
R = XM - Xm
Donde XM es el mayor valor y Xm es el menor valor.
Considerando nuevamente los valores de ventas de la planilla Empresas.xlsx, la
mayor venta es 2058,70 y la menor es 164,30. Entonces
Varianza
La varianza es una medida de variabilidad que utiliza todos los datos. La varianza
está basada en la diferencia entre el valor de cada observación (xi) y la media. Ala
diferencia entre cada valor xi y la media (cuando se trata de una muestra, μ cuando
se trata de una población) se le llama desviación respecto de la media. Si se trata
de una muestra, una desviación respecto de la media se escribe (𝑥𝑖 − 𝑥̅ ), y si se
trata de una población se escribe (𝑥𝑖 − 𝜇).
Para calcular la varianza, estas desviaciones respecto de la media se elevan al
cuadrado. Si los datos son de una población, el promedio de estas desviaciones
elevadas al cuadrado es la varianza poblacional. La varianza poblacional se denota
con la letra griega σ2. En una población en la que hay N observaciones y la media
poblacional es μ, la varianza poblacional se define como sigue:
∑(𝑥𝑖 −𝜇)2
Varianza Poblacional: 𝜎2 = 2.8
𝑁
𝑠 2 = 199075,45
𝑠 2 = 70,55
∑(𝑥𝑖 −𝜇)2
Desviación estándar Poblacional: 𝜎=√ 2.10
𝑁
∑(𝑥𝑖 −𝑥̅ )2
Desviación Estándar Muestral: 𝑠=√ 2.11
𝑁−1
√𝑠 2 = 446,18
Observe que la desviación estándar se mide en las mismas unidades que los datos
originales. Por esta razón es más fácil comparar la desviación estándar con la
Coeficiente de variación
Coeficiente de variación: para que las medidas de variación de dos o más
distribuciones sean comparables es necesario considerar valores relativos de estas
medidas.
A tal fin se forma un cociente con una medida de variación en el numerador y una
medida de posición en el denominador como unidad de medida.
Aunque cualquier medida de las que hemos visto se puede utilizar en el numerador
y denominador respectivamente, lo corriente es utilizar la desviación típica como
medida de variación, y la media aritmética como medida de posición, o sea
CV para poblaciones
x
y
s
CV para muestras
X
Se utiliza a los efectos de que las medidas de variación de dos o más distribuciones,
sean comparables. Continuando con nuestro de ejemplo de valores de venta, el
coeficiente de variación será en este caso:
¿Cuáles son las medidas más utilizadas para describir un conjunto de datos
y cuándo se utilizan?
La desviación estándar y la media son las dos medidas más utilizadas para
describir un conjunto de datos.
La desviación estándar se emplea cuando también es apropiado el uso de
la media, es decir en distribuciones simétricas de datos numéricos.
El rango es una medida apropiada para datos numéricos cuando se desea
enfatizar valores extremos.
El coeficiente de variación es útil cuando se comparan dos distribuciones
numéricas medidas en escalas diferentes.
x M 3( x M e )
o (2.12)
Las curvas asimétricas tienen la forma que se indica en la figura 2.1.Se dice que la
distribución (a) tiene asimetría derecha o asimetría positiva y la distribución (b)
asimetría izquierda, o negativa.
Mo Me µx µx Me Mo
x M o
Asimetria
x (2.13)
3( x M e )
Asimetria
x (2.14)
En las distribuciones simétricas los coeficientes dados son iguales a cero. En las
otras distribuciones no son iguales a cero. Cuando el coeficiente es positivo, la
distribución es asimétrica derecha y cuando es negativo, asimétrica izquierda.
Mo.
Me.
Media
Mo Me µx µx Me Mo
Figura 2.3
xi fi xi fi F ( x) fi
xi x
100 3 300 3
200 7 1400 10
300 15 4500 25
400 7 2800 32
500 3 1500 35
total 35 10500
n
xi fxi 10500
i 1
x 300
n 35
Para saber cuál es el valor Modal en esta distribución, simplemente veamos el valor
de la variable que se presenta con mayor frecuencia.
En este ejemplo Media, Mediana y Moda son iguales, por lo tanto, es una
distribución simétrica.
Con los mismos valores de la variable, pero con otra frecuencia veamos que la
distribución se transforma de simétrica en asimétrica.
xi fi xi fi F ( x) fi
xi x
100 3 300 3
200 5 1000 8
300 7 2100 15
400 8 3200 23
500 12 6000 35
total 35 12.600
xi fi xi fi F ( x) fi
xi x
100 10 1000 10
200 9 1800 19
300 8 2400 27
400 5 2000 32
500 3 1500 35
total 35 8.700
Puntiagudez
3 3 3
Figura 2.4
(2.15)
Covarianza
En una muestra de tamaño n con observaciones (x1, y1), (x2, y2), etc., la covarianza
muestral se define como sigue:
∑(𝒙𝒊 −𝒙
̅)(𝒚𝒊 −𝒚
̅)
𝒔𝒙𝒚 = (2.16)
𝒏−𝟏
70
60
50
Ventas (en miles)
40
30
20
10
0
0 1 2 3 4 5 6
Nro de comerciales
Coeficiente de Correlación
Para datos muestrales el coeficiente de correlación del se define como:
𝑠𝑥𝑦
𝑟𝑥𝑦 = 𝑟𝑥𝑦 = coeficiente de correlación muestral
𝑠 𝑠
𝑥 𝑦
𝑠𝑥𝑦 = covarianza muestral
𝑠𝑥 = desviación estándar muestral de x
𝑠𝑦 = desviación estándar muestral de y
Considerando nuevamente el ejemplo con el que se viene trabajando, se calculan:
∑(𝑥𝑖 − 𝑥̅ )2 20
𝑠𝑥 = √ = √ = 1,49
𝑛−1 9
Coeficiente de Determinación
En ocasiones la correlación se eleva al cuadrado (r2) para formar el coeficiente de
determinación. Para los datos de la Tabla 2.3., el coeficiente de determinación es
0,86, esto significa que se puede explicar o pronosticar 86 % de la variabilidad en
una de las medidas, cuando se conoce el valor de la otra medida.
El coeficiente de correlación habla del grado de la relación que vincula a dos
variables.
Si deseáramos describir la forma de la relación que liga a estas dos variables
utilizaremos la regresión lineal.
Por ejemplo, los envases con detergente líquido se llenan en forma automática en
una línea de producción. Los pesos de llenado suelen tener una distribución en
forma de campana. Si el peso medio de llenado es de 16 onzas y la desviación
estándar de 0.25 onzas, la regla empírica es aplicada para sacar las conclusiones
siguientes:
• Aproximadamente 68% de los envases llenados pesarán entre 15.75 y 16.25
onzas (estarán a no más de una desviación estándar de la media).
• Cerca de 95% de los envases llenados pesarán entre 15.50 y 16.50 onzas
(estarán a no más de dos desviaciones estándar de la media).
• Casi todos los envases llenados pesarán entre 15.25 y 16.75 onzas (estarán a no
más de tres desviaciones estándar de la media).
RESUMEN
En esta unidad hemos visto cómo se caracteriza a un conjunto de datos,
resumiendo información, mediante el cálculo de sus principales medidas,
obteniendo así:
Sus medidas de posición (Media Aritmética, Mediana y Moda), las cuáles indican el
valor de la variable alrededor del cual se concentran los valores de las variables.
Sus medidas de dispersión (Varianza, Desviación Típica, Coeficiente de Variación)
indicando el grado de concentración de los valores de la variable respecto de las
medidas de posición.
Sus medidas de asimetría, indicando si la distribución de los valores de la variable
es la misma, tanto para los valores de la variable mayores a la medida de posición,
como para los valores de la variable menores a su medida de posición.
El análisis para dos variables.
Probabilidad
INTRODUCCIÓN
En las unidades previas, se identificó un conjunto de datos. A partir de él, se
distinguieron elementos y variables. Posteriormente se construyeron tablas de
frecuencias y gráficos con sus distribuciones.
En esta unidad se desarrolla el concepto de probabilidad como una herramienta
para medir la incertidumbre. Y también un conjunto de reglas que permiten asignar
y obtener valores de probabilidad. Estas herramientas y conceptos servirán como
base para el desarrollo de las próximas unidades.
Con respecto a la aplicación de la probabilidad como herramienta, se aborda de
dos maneras. La primera es sobre cómo se asignan probabilidades. Y otra forma
es la utilización como medida cuando a partir de una muestra, se infieren
conclusiones a cerca de la población.
Muchos conceptos de probabilidad son familiares en cierta forma. Quien no ha oído
hablar, por ejemplo, que existe una alta probabilidad de que mañana llueva, de que
la acción de una empresa cotice a mayor valor en el mercado, etc. Todos estos
conocimientos intuitivos, van a ser tratados con la correspondiente fundamentación
matemática, para intentar responder con brevedad a algunas preguntas tales como:
qué es la probabilidad, cómo se calcula, quienes son los que tienen probabilidad,
etc.
OBJETIVOS
Que el alumno sea capaz de comprender y definir los conceptos de: Fenómeno
Aleatorio, Espacio muestral, Evento, Variable aleatoria (continuas y discretas), y
Probabilidad.
Que sea capaz de calcular la probabilidad de una variable aleatoria.
Que sepa distinguir y calcular las probabilidades de eventos mutuamente
excluyentes e independientes.
CONTENIDOS
3.1 Incertidumbre
3.2 Espacio muestral, eventos, hechos o sucesos
3.3 Las definiciones de la probabilidad
3.4 Axiomas de la Probabilidad
3.5 Regla de la Suma
3.6 Probabilidad Condicional
3.7 Eventos Independientes
3.8 Regla de la multiplicación
3.9 Teorema de Bayes
S 1,2,3,4,5,6
Es importante observar que el espacio muestral contiene todos los resultados
posibles de un experimento aleatorio, pero cuando se realiza el experimento
solamente ocurre uno de estos eventos simples. Por eso se dice que el espacio
muestral constituye un conjunto exhaustivo de elementos que son mutuamente
excluyentes.
Así por ejemplo si se trata del experimento aleatorio tirada de la moneda, el espacio
muestral estará definido por los eventos simples:
S cara, cruz
Este espacio muestral contiene dos resultados posibles (eventos simples), pero
cuando se realice el experimento solamente se presentará uno de ellos.
Se definen a continuación los posibles tipos de eventos:
Con relación a la tirada del dado podemos establecer los siguientes eventos:
a) El evento imposible: S 0 (conjunto vacío )
b) Eventos simples:
S 2 1
S 2 2
S 3 3
S 4 4
c) Eventos compuestos son los que contienen más de un resultado posible.
Se pueden realizar muchas combinaciones. Por ejemplo:
S 7 1,2,3
En este caso podemos haber definido el evento compuesto: "los resultados de la
tirada de un dado, tal que los números sean menor a cuatro"
Y en el caso siguiente, que los resultados de la tirada del dado sean números pares.
S 8 2,4,6
d) Evento cierto: Se trata también de un evento compuesto constituido por
todos los eventos simples.
S 1,2,3,4,5,6
Existe un paralelismo entre la terminología utilizada y las reglas de la Teoría de
Conjuntos (Sixto Ríos. Métodos Estadísticos. Mc Graw Hill - 1969). Sólo a título
informativo, se resume esta vinculación en el siguiente cuadro:
Ejemplo: en el lanzamiento del dado analice los eventos pares e impares. ¿Son
mutuamente excluyentes?. Dé un ejemplo de no mutuamente excluyentes.
Enfoque subjetivo
Los enfoques anteriores dan cuenta del cálculo de probabilidades para
experimentos que se pueden repetir o que cumplen la condición de eventos
equiprobables. Sin embargo, cuando existen eventos que se realizan una sola vez,
es decir no son repetitivos, esos enfoques no están en condiciones de asignar
probabilidades y, por lo tanto, un importante conjunto de eventos no podrían
abordarse.
Por eso surge el enfoque subjetivo de probabilidades; que considera a la
probabilidad como una medida de confianza personal sobre un evento particular,
en otras palabras es una asignación de un valor a una creencia. Ese valor está
dentro del rango de 0 y 1.
Si un individuo cree que un evento A tiene el doble de posibilidades de salir que el
evento B, y A y B son los únicos eventos posibles, entonces la P(A)= 2/3 y la de
B=1/3.
El enfoque subjetivo admite que distintos individuos pueden tener, en términos de
probabilidad, ponderaciones distintas. El enfoque subjetivo tiene singular
importancia para asignar probabilidades a fenómenos que no han ocurrido o de
muy escasa frecuencia. En general el criterio de asignación descansa en el criterio
o juicio de un experto.
Estos enfoques son complementarios y se utiliza aquel que se considera más
apropiado conforme a las condiciones del fenómeno que se analiza.
Ejemplo:
De mil personas que se han entrevistado en Río cuarto, se han obtenido los datos
respecto de su nivel del estudio y su condición de empleo. Se solicita calcular la
probabilidad que un individuo tenga estudios secundarios o esté empleado.
Tabla 3.1. Promociones, en los dos últimos años, de los agentes de policía.
Hombre Mujer Total
Promovido 288 36 324
No Promovido 672 204 876
Total 960 240 1200
P( A M ) 0,24
P( A / M ) 0,30
P( M ) 0,80
El hecho de que la probabilidad condicional se pueda calcular como la razón entre
una probabilidad conjunta respecto a una probabilidad marginal proporciona la
siguiente fórmula para el cálculo de la probabilidad condicional de dos eventos A y
B.
P( A B) P( A B)
P( A / B) o P( B / A)
P( B) P( A)
Si se lanza un dado y una moneda, el resultado del lanzamiento del dado no tiene
influencia en el resultado del lanzamiento de la moneda. O la probabilidad de que
salga un 5 no afecta a la probabilidad de que salga cara.
Sin embargo, cuando consideramos la extracción de dos cartas de un mazo la
probabilidad de que salga un As tiene influencia en la probabilidad de que salga un
Basto; esto debido a que si sale un As y es el de Basto, y considerando que el mazo
es de cuarenta cartas, la probabilidad de que salga un Basto se modifica de 10/40
a 10/39 si el As que salió no fuera de Basto o de 9/39 si lo fuera.
P( A B) P( A B)
P( A / B) o P( B / A)
P( B) P( A)
Ejemplo:
Doce personas (6 mujeres, 4 hombres y dos niños) realizan un paseo en un
pequeño autobús, al llegar a cierto lugar, bajan del autobús cuatro personas una
tras otra, determine la probabilidad de que:
a) La primera y segunda persona que bajen sean mujeres, el tercero sea un niño y
por último baje un hombre
b) Que baje un niño, luego un hombre, luego otro niño y por último que baje una
mujer
Solución:
a) Sean los siguientes eventos:
S1= {baje del autobús primero una mujer}
S2= {baje del autobús en segundo lugar una mujer}
S3= {baje del autobús en tercer lugar un niño}
S4= {baje del autobús en cuarto lugar un hombre}
Por ser E1, E2,…, En una partición del espacio muestral, el suceso B, se puede
escribir como:
𝐵 = (𝐵 ∩ 𝐸1 ) ∪ (𝐵 ∩ 𝐸2 ) … ∪ (𝐵 ∩ 𝐸𝑛 )
Por el teorema del producto, el numerador del segundo término se puede escribir
como:
P(𝐸𝑖 ∩ A) = P(A/𝐸𝑖 )P(𝐸𝑖 )
Por lo tanto:
P(A/𝐸𝑖 )P(𝐸𝑖 )
P(𝐸𝑖 /A) = P(A⁄𝐸 )P(𝐸 )+P(A⁄𝐸2 )P(𝐸2 )+⋯+P(A/𝐸𝑛 )P(𝐸𝑛 )
1 1
Ejemplo 1:
La probabilidad de que haya un accidente en una fábrica que dispone de alarma es
0.1. La probabilidad de que suene la alarma si se ha producido algún incidente, es
de 0.97 y la probabilidad de que suene si no ha sucedido ningún incidente es 0.02.
En el supuesto de que haya funcionado la alarma, ¿Cuál es la probabilidad de que
no haya habido ningún incidente?
Se definen los sucesos:
I = Producirse incidente. E
A = Sonar la alarma.
Gráficamente se puede representar de la siguiente manera:
0,9 ∗ 0,02
P(I/̅ A) = = 0,157
0,1 ∗ 0,97 + 0,9 ∗ 0,02
Ejemplo 2:
Un estudio de auditoria revisa la contabilidad de una empresa considerando que en
trabajos anteriores se constataron errores en el 15% de los registros contables. Por
otra parte, se ha constatado también que del total de errores el 60% refleja valores
inusuales en los saldos registrados. Mientras que el 13% de los saldos inusuales
P(E/SI)=
Otra forma:
P(E/SI)=
Prob Probabilidades
Registracion probabilidad Bayes
condicional Saldos inusuales
RESUMEN
En esta unidad se vio:
Definiciones de Probabilidad
Probabilidad Condicionada
INTRODUCCIÓN
Esta unidad tiene como objetivo explicar la importancia de las variables aleatorias,
tanto discretas como continuas. También se explican las medidas de posición y
variación, y los principales modelos teóricos de variables aleatorias discretas y
continuas.
Los experimentos aleatorios dan como resultado eventos que están dentro del
espacio muestral. Los eventos pueden resultar en números o representar
características cualitativas. Cuando los resultados son cualitativos, es conveniente
poder darle un tratamiento numérico para estudiar el comportamiento aleatorio de
ese fenómeno. La forma de hacerlo es mediante una variable aleatoria.
En cuanto a la distribución de probabilidades, se deben diferenciar las
distribuciones de una variable aleatoria discreta y de una variable aleatoria
continua.
OBJETIVOS
Que el alumno sea capaz de comprender y definir los conceptos de: Variable
aleatoria discreta, Función de Probabilidad y función de distribución de una variable
aleatoria discreta o continua.
Que el alumno sea capaz de caracterizar a una población estadística mediante la
lectura de sus parámetros.
Que el alumno sea capaz de distinguir una distribución de probabilidad teórica
(Normal) mediante sus características.
Que el alumno sea capaz de comprender y calcular, los distintos parámetros de la
distribución Normal.
CONTENIDOS
4.1 Variable Aleatoria
4.2 Distribución de Probabilidad de una Variable Aleatoria Discreta
4.3 Parámetros en las Distribuciones de Variables Aleatorias: Esperanza
Matemática y Varianza
4.4 Distribuciones Discretas Teóricas
4.5 Distribución de Probabilidad Bipuntual
4.6 Distribución de Probabilidad Binomial
4.7 Distribución de Probabilidad de Poisson
Una Variable Aleatoria es una regla que asigna valores numéricos a cada
evento simple del espacio muestral.
S 0,1,2
Entonces:
Tabla 4.3.
Evento :
Numero Variable
Pr obabilidad
Inscripto aleatoria
P( X xi ) p( xi )
en cara X xi
sup erior
(1) (2) (3)
1 x1 1 1/ 6
2 x2 2 1/ 6
3 x3 3 1/ 6
4 x4 4 1/ 6
5 x5 5 1/ 6
6 x6 6 1/ 6
Suma 6/6 1
b)
i 0
p( x i ) 1
En una industria donde trabajan 512 obreros, cuyos salarios varían de $200,-
(aprendiz) a $ 1000,- (obrero especializado), el salario promedio alcanza a $500.-
¿qué sucederá con este promedio si:
a) ¿Se aumentan todos los salarios en $250?
b) ¿Se aumentan todos los salarios en un 50 %?
c) ¿Se aumentan todos los salarios en un 25 % más $ 125.-?
d) ¿A quiénes beneficia cada plan de aumento?
Solución:
X = salario
E(X)= 500,-
N = 512
Siendo:
𝜎 = √𝜎 2
Ejemplo de cálculo de la varianza:
Autos
P(X) (X-u)2 (X-u)2 P(x)
vendidos (X)
0 0,1 4,41 0,441
1 0,2 1,21 0,242
2 0,3 0,01 0,003
3 0,3 0,81 0,243
4 0,1 3,61 0,361
E(X) 2,1 Var(X)= 𝜎 2 1,29
2
Var (c) E c c E c c 2 0
Se ha llamado covarianza de X1 X2 a E ( X1 X1 )( X 2 X 2 ) .
Cuando las variables aleatorias X1 y X2 son independientes:
Cov ( X1 X2 ) = 0
xp (1 p)
x 0
x 1 x
p
E(X)=
Y como varianza a pq ya que:
2=E(X2) – E(X)2= p-p2 = p(1-p) = p q si q=1-p
Ejemplo:
De un total de 100 encuestas que tenía que realizar un encuestador, completó 70;
las 30 restantes no se realizaron, porque el encuestado no se encontraba en su
domicilio.
Se realiza el siguiente fenómeno aleatorio: extracción de una encuesta de las 100,
y se fija si la misma está realizada o no.
Se define la variable aleatoria X = cantidad de encuestas realizadas en la
extracción.
a) ¿Qué valores puede asumir la variable aleatoria?
b) ¿De qué distribución se trata?
c) ¿Cuál es la distribución de probabilidad de X?
d) Define y grafique P(X) y F(X).
e) ¿Cuál es la esperanza matemática de X?
f) ¿Cuál es la varianza?
Solución:
a) La variable aleatoria discreta X = cantidad de encuestas realizadas en la
extracción, puede asumir dos valores, que son:
1; si la encuesta esta realizada
X X (S )
0; si la encuesta no esta realizada
ya que en una sola extracción, la cantidad de encuestas realizadas, puede ser: 0,
si la encuesta extraída es una de las 30 no realizadas, y 1, si la encuesta es una de
las 70 que sí se realizaron.
O sea que los valores posibles que puede tomar la variable aleatoria X son: 0 o 1.
b) La variable X, tiene distribución Bipuntual, pues se trata de una población
dicotomizada, porque los individuos se dividen en dos clases, y el experimento
aleatorio consiste en extraer un individuo de esta población y fijarnos si el
individuo pertenece, o no, a una de las clases en que se divide la población.
c) La distribución de probabilidad de una variable consiste en obtener todos los
pares ordenados (x, p( x )), es decir calcular la probabilidad para cada valor de
la variable. En una distribución Bipuntual, la función de probabilidad, p(x), es
igual a:
P ( x) p x (1 p )1 x
0,30 P
1-p
0 1 x
0,30
1-p
0 1 x
1 1
e) La μ E ( X ) x p ( x) x p x (1 p)1 x p que es uno de los parámetros de la
x 0 x 0
distribución bipuntual.
x P(x) x P(x)
0 0.30 0
1 0.70 0.70
Esperanza de x 0.70
Es de hacer notar que si realizamos una sola observación, lo que equivale a hacer
n=1 en (4.6.2), obtenemos la función de probabilidad de una variable con
distribución bipuntual
F (t ) p( X t ; n, p) X t p( x; n, p) ; t real
F (t ) p( X t ; n, p) X t Cnx p x q n x ; t real
P( X i xi ) P( xi ) p xi (1 p)1 xi ; xi 0,1
El cálculo de es una tarea pesada,
especialmente para altos valores de n, así por ejemplo, si quisiéramos calcular la
probabilidad para x = 10, n = 15 y p = 0,40, tendríamos:
15 !
p( x 10, n 15; p 0,4) (0,40)10 (0.6)5
10! 5!
En la columna (2) se despliegan los valores de la variable (X) que va desde 0 hasta
4, el n correspondiente al número de ensayos.
La columna (1) tiene los valores de n-x.
La columna (3) tiene los valores correspondiente al combinatorio para cada valor
de x, se usó la función combinat(n,x) cuyo primer argumento es (número de
ensayos) y el segundo argumento es x, o sea, los respectivos valores de la variable
y que da como resultado el número de veces por el que se debe multiplicar la
columna (4). En esta columna se obtiene el valor de P(x)= (1-p)n-x, es decir, para
cuando x=3 Px (1-p)n-x =0.33 (0.7)4-3 =0.0441.
La columna (5) surge de multiplicar (3)x(4), así para x=3 será 4x0,0189=0,0756. De
esta forma se pueden obtener todos los valores.
En la columna (6) se utilizó con la función distr. binom. (X,n,p,falso) que
directamente da el valor de Cnx px (1-p)n-x para cada valor de la variable y que,
como se puede observar, coincide con lo calculado en (5).
También se puede observar que la suma de (5) y (6) es igual a 1 y cumple con
∑ni=1 Pxi = 1.
lim (1 )n e lm (1 ) x 1
n n
n y n
Llevando estos valores a (4.7.2) obtenemos la función de probabilidad de la
distribución de Poisson:
(e-μμ x )
P(X x) P(x; ) (4.7.3)
x!
Esta es la función de probabilidad o función de probabilidad en la distribución de
Poisson que se utiliza para el estudio de casos raros en poblaciones numerosas.
(4.7.3) es la probabilidad de que en una población numerosa con media se
presenten x casos raros.
Como se puede observar, los casos raros se manifiestan también según una ley,
cuando el número de pruebas es suficientemente grande.
Media Aritmética y Varianza: También es bueno tener presente que en la
distribución de Poisson p es muy pequeño y consecuentemente q = 1- p, es
prácticamente igual a 1. Debido a ello en esta distribución, que proviene de la
binomial, la media y varianza son iguales.
2 npq np
Ejemplo 1: Suponga que en la oficina del Defensor del pueblo se quiere saber si
llegarán 2 personas para ser atendidas en la próxima hora (o en una hora de
atención al público). Si se ha observado que en 80 horas han entrado para ser
atendidas 85 personas, ¿cómo se calcularía esta probabilidad?
2.71828−8.5 (8.52 )
P(2; 8.5) = .= 0,00735034
2!
P(3,1)= 0,06131324
Cuadro 4.7.2
Nro.deprof Nro
e x
.que faltan de
x!
X dias
0 0,0498 5
1 0,1494 15
2 0,2240 22
3 0,2240 22
4 0,1680 17
5 0,1008 10
6 0,0504 5
7 o mas 0,0335 3
También se han confeccionado tablas con la probabilidad acumulada de esta
distribución, o sea tablas de la función de distribución, F(x), mejor dicho de 1-F(x´).
Esta tabla se aplica para determinar la probabilidad de que se presente " x´ o más
" veces un evento que tiene baja probabilidad de presentarse. Así, la solución del
punto b) del ejemplo anterior se encuentra directamente en esta tabla para x´=6.
En cambio, la solución del punto a) se encuentra restando de uno el valor que trae
la tabla para x´=2.
En los siguientes ejemplos, veremos aplicaciones del manejo de las tablas de
probabilidades, en la distribución Poisson.
Ejemplo 3
Una firma comercial analizó una muestra de 10.000 pedidos recibidos de cierto
artículo almacenado y observó que la proporción de pedidos incompletos era
aproximadamente 0,00028, ¿Cuál es la probabilidad de que lleguen?:
a) 4 pedidos incompletos.
m
X 2.1..................2.8
0 0.1225 0.0608
1 0.2572 0.1703
2 0.2700 0.2384
3 0.1890 0.2225
4 0.0902 0.1557
5 0.0417 0.0872
6 0.0146 0.0407
.
.
5 0.0417 0.0872
6 0.0146 0.0407
m
X 2.1..................2.8
0 0.1225 0.0608
1 0.2572 0.1703
2 0.2700 0.2384
3 0.1890 0.2225
4 0.0902 0.1557
5 0.0417 0.0872
6 0.0146 0.0407
..
7
..
Ejercicio:
a) Construir la tabla de probabilidades (distribución para u=5 y u=7) y
comprobar la forma de la distribución.
b) Construir la tabla de probabilidades acumulada. Graficar
c) Mediante la tabla acumulada de probabilidad, calcular:
a) P(x>4,µ=3)
b) P(x≤4,µ=3)
c) P(1≤x≤4,µ=3)
INTRODUCCIÓN
En las unidades previas, se identificó un conjunto de datos. A partir de él, se
distinguieron elementos y variables. Posteriormente se construyeron tablas de
frecuencias y gráficos con sus distribuciones.
En la unidad 4 se estudiaron las distribuciones de probabilidades de las variables
aleatorias discretas más importantes binomial y Poisson.
En esta unidad se verán las distribuciones de probabilidad de variables aleatorias
continuas. Las variables aleatorias son continuas cuando su valor se expresa en un
intervalo o rango y tiene un número infinito de valores para ese rango específico.
Surge principalmente de procesos de medición.
Ejemplos de variables aleatorias continuas son: El peso de los camiones con cereal
en una báscula, la estatura de los alumnos de este curso, el tiempo de reparación
de los cortes de luz etc.
En cuanto a la distribución de probabilidades, se debe diferenciar de la distribución
de una variable aleatoria discreta en que la probabilidad se corresponde con
intervalos y con un valor determinado de la variable.
OBJETIVOS
Que el alumno sea capaz de distinguir una distribución de probabilidad teórica
(Normal) mediante sus características.
Que el alumno sea capaz de comprender y calcular, los distintos parámetros de la
distribución Normal.
CONTENIDOS
5.1 Distribución de Probabilidades de Variables Aleatorias Continuas
5.2 Valor esperado, Varianza y Desviación Típica de Variables Aleatorias
Continuas
5.3 La Distribución Normal
5.3.1 La distribución Normal Estándar
5.3.2 Cálculo de probabilidades para una variable normal natural
5.3.3. Aproximación de la distribución Normal a la Binomial
5.4 Ley de los grandes Números
5.5 Otras Distribuciones: Teoría de las Pequeñas Muestras
- f(x)≥0
- El área bajo la curva f(x) es igual a 1
- La probabilidad de que la variable X tome valores entre a y b se simboliza P(a ≤
X ≤ b) y es igual a la superficie entre los puntos a y b, la función de densidad y
el eje x. Por lo tanto la probabilidad de que un valor determinado de X tenga
probabilidad es 0.
Figura 5.1
Figura 5.2
Figura 5.3
La media es la que representa el centro de la distribución, esta es simétrica (igual
forma y superficie a ambos lados de la media). Como la superficie total debajo de
la función de densidad es igual a 1, a cada lado de la media el área es igual a 0,5.
Si se analiza la fórmula se puede observar que: como la desviación de X respecto
de la media está elevada al cuadrado iguales desvíos en valor absoluto representan
la misma densidad, también a mayores valores de X respecto de la media, la
Figura 5.4
Figura 5.5
t
F (t ) f ( z ) dz (5.3.1)
0 t z
t
F (t ) f ( z ) dz (5.3.2)
0
0 t z
0 t z
(5.3.4)
-t 0 t z
Regla empírica
1) A una distancia de una vez la desviación estándar o típica, se encuentra
aproximadamente el 68% del área de la curva. Es decir a μ ± σ.
2) A una distancia de dos veces la desviación estándar o típica, se encuentra
aproximadamente el 95% del área de la curva. Es decir a μ ± 2σ.
3) A una distancia de tres veces la desviación estándar o típica, se encuentra más
del 99,% del área de la curva. Es decir a μ ± 3σ.
Figura 5.4
Función de densidad
Normal(20,16): p(evento)=0,2726
0,10
0,07
Densidad
0,05
0,02
0,00
0,00 10,00 20,00 30,00 40,00
Variable
Figura 5.5
Ejemplo 2:
Una fábrica de aluminio produce un tipo de canaleta de aleación. Se sabe que la
rigidez medida en kg sobre m2 esta normalmente distribuida en μ =24,25 y una
σ=1,15. Si se elige al azar una canaleta de esta línea de producción. ¿Qué
probabilidad tendrán los siguientes valores?:
a) Entre 22,50 y 24,25
b) Entre 22,50 y 25,00
c) Entre 25,25 y 26,25
d) Mayor de 25
e) Menor de 22
Siempre las probabilidades surgen de una distribución normal estándar Z, por lo
tanto, cuando se pide un valor hasta el que se ha acumulado una probabilidad
determinada, el valor que se obtiene es un punto z. Si se necesita obtener ese valor
en términos de la variable natural o general X, se lleva el z a su equivalente x de
la variable natural. Se hace utilizando los parámetros de la variable x: μ y σ. Si para
𝑥
obtener z se usa z 𝜎−𝜇 entonces despejando x se obtiene x= μ+ z σ y de esta manera
se obtiene el valor de la variable natural X.
Esa operación se llama destipificar y el valor es un valor destipificado.
Figura 5.6
Ejemplo:
Para ver cómo se le puede usar para aproximar la distribución binomial, suponga
que nos gustaría saber la probabilidad de obtener 5, 6, 7 u 8 caras en10
lanzamientos de una moneda no alterada. Se podría utilizar la tabla para encontrar
esta probabilidad de la siguiente manera:
P(r =5, 6, 7 u 8) =P(r = 5) + P(r = 6) + P(r = 7) + P(r =8)
= 0.2461 + 0.2051 + 0.1172 + 0.0439
= 0.6123
En la figura 5.6 se dibuja una binomial con una normal sobrepuesta a ella con las
misma media (√𝑛𝑝1 − 𝑝 =√10⁄1⁄21⁄2 = √2,5= 1.581).
Observe el área bajo la curva normal entre 5 1/2 y 5 1/2. Nos damos cuenta de
que estas áreas de aproximadamente el mismo tamaño que el área de la barra
sombreada que representa la probabilidad binomial de obtener cinco caras.
Los dos “medios” (1/2) que agregamos y restamos a cinco se conocen como
factores de corrección de continuidad y se utilizan para mejorar la precisión de la
aproximación.
Al usar los factores de corrección de continuidad, vemos que la probabilidad
binomial de obtener 5, 6, 7 u 8 caras puede ser aproximada por el área bajo la curva
normal entre 4.5 y 8.5.
Determine esta probabilidad mediante el cálculo de los valores de z
correspondientes a 4.5 y 8.5
Distribución t de Student
Distribución F de Snedecor
n
( xi ) 2
(x - )
y i 1 ; recordar que z (3.2.1)
2
se distribuye x2 (chi cuadrado con n grados de libertad). También se puede escribir:
n
y z i2 ; z ~ N(0,1)
i 1
2
Una variable x (chi cuadrado) tiene grados de libertad y estos son iguales a
la cantidad de z que se suman, o sea que si se suman n variables z , la Chi
2g
3 libertad
2.5
6 g. L.
2
10 g.l.
1.5
0.5
0
0 5 10 15 20 x2 n
X
z
resulta
z
t
y
n
Normal
t4 n=4
t2 n=2
x
nx
F (m, n) m
y my
n
g(F) F2,2
F10,2
F10,10
MATERIAL PRÁCTICO
Unidades 1 a 5
Modalidad a Distancia
Año 2023
EJERCICIO Nº1
Una reconocida empresa de turismo de nuestro país, realiza un registro de los
mejores alojamientos al momento de realizar recomendaciones a sus clientes.
e) ¿Cuál es la población?
EJERCICIO Nº 3
La Empresa LIBROS. S.A. vende libros electrónicos a los miembros de su club de
venta por internet. En una encuesta literaria se les pidió a los nuevos miembros del
club que llenaran un cuestionario con 11 preguntas. Algunas de las preguntas eran:
b) ¿Eres miembro de algún otro club de venta de libros electrónicos por internet (Sí
o No)?
c) ¿Cuál es tu edad?
Responde si los datos que se obtienen con cada pregunta son cualitativos o
cuantitativos.
EJERCICIO Nº 4
La empresa ENCUESTAS realizó una encuesta telefónica empleando una muestra
aleatoria local compuesta de 503 adultos de 18 años o más. En la encuesta se les
preguntó a los participantes “Cómo considera que se alimenta en este momento.
Las respuestas podían ser Óptima, Regular, Mala o Ninguna opinión.
d) De las personas que respondieron, 23% dijo que su alimentación era óptima.
¿Cuántos fueron los individuos que dieron esta respuesta?
• La atención a la salud fue elegida por 21% como el sector con más probabilidad
de ir a la cabeza del mercado en los próximos 12 meses.
• Cuando se les preguntó cuánto tiempo se necesitaría para que las acciones de
tecnología y telecomunicación recobraran un crecimiento sostenible, la respuesta
promedio de los directivos fue 2.5 años.
c) Haga una inferencia acerca de la cantidad de tiempo que se necesitará para que
las acciones de tecnología y telecomunicación recobren un crecimiento sostenible.
EJERCICIO Nº 7
Considere el conjunto de datos de la muestra de los 10 minicomponentes que se
muestra en la siguiente tabla:
EJERCICIO Nº 8
En una encuesta a 430 viajeros de negocio se encontró que 155 de ellos empleaban
los servicios de un agente de viajes para la preparación de sus viajes.
Días Demora
Categoría Localidad Provincia Calificación Importe
del Envío
EJERCICIO Nº 2
Un cuestionario proporciona como respuestas 58 Sí, 42 No y 20 ninguna opinión.
a) En la construcción de una gráfica de pastel, ¿qué porcentaje le corresponderán
del gráfico de sectores a la respuesta Sí?
b) ¿Qué porcentaje le corresponderán del gráfico de sectores a la respuesta No?
c) Construya un gráfico de sectores.
d) Construya un gráfico de barras.
EJERCICIO Nº 3
El índice de audiencia de televisión, que mide el porcentaje de personas que tienen
televisión y que están viendo un determinado programa se llama REACH.
Por ejemplo, en Argentina, Telefe superó los 10 puntos en dos meses consecutivos,
octubre y noviembre de 2016, con una media de 10.2 puntos. Durante junio y julio
de 2014, con la transmisión exclusiva de Brasil 2014, el canal público logró
posicionarse tercero con medias por encimas de los 6.0 puntos.
Kantar Ibope Media (empresa que mide audiencia) publicó la lista de los 50
programas de televisión con los mayores índices de audiencia en la historia de la
televisión. Los datos siguientes presentan las cadenas de televisión que produjeron
estos 50 programas con mayor índice de audiencia.
EJERCICIO Nº 4
Un restaurante de Puerto Madero emplea cuestionarios en los que pide a sus
clientes que evalúen el servicio, la calidad de los alimentos, los cocteles, los precios
y la atmósfera del restaurante. Cada uno de estos puntos se evalúa con una escala
de óptimo (O), muy bueno (V), bueno (G), regular (A) y malo (P). Emplee la
estadística descriptiva para resumir los datos siguientes respecto a la calidad de
los alimentos. ¿Qué piensa acerca de la evaluación de la calidad de los alimentos
de este restaurante?
G O V G A O V O V G O V A
V O P V O G A O O O G O V
V A G O V P V O O G O O V
O G A O V O O G V A G
EJERCICIO Nº 5
Netflix, ofrece alquiler por streaming, de más de 50 000 títulos de películas. Antes
de alquilar una película, el cliente puede ver una descripción de la misma y, si así
lo desea, un resumen de las evaluaciones de la misma. Netflix emplea un sistema
de evaluación de cinco estrellas que tienen el significado siguiente:
1 estrella = Me disgustó
2 estrellas = No me disgustó
3 estrellas = Me gustó
4 estrellas = Me gustó mucho
5 estrellas = Me fascinó
Dieciocho críticos, entre los que se encontraban Roger Ebert de Chicago Sun Times
y Ty Burr de Boston Globe, proporcionaron evaluaciones en Hispanoamérica de la
película Batman inicia (Netflix.com, 1 de marzo de 2006). Las evaluaciones fueron
las siguientes:
4, 2, 5, 2, 4, 3, 3, 4, 4, 3, 4, 4, 4, 2, 4, 4, 5, 4
Notas:
*Las exportaciones cordobesas en el año 2017 alcanzaron la suma de 7.881
millones de dólares
*PP: Productos Primarios
*MOA: Manufacturas de Origen Agropecuario
*MOI: Manufacturas de Origen Industrial
*CyE: Combustibles y Energía.
Se pide:
a) Muestre la distribución de frecuencia relativa.
b) Determine el importe de exportaciones de cada rubro (expresado en millones de
dólares).
c) Si las exportaciones argentinas en el año 2017 alcanzaron la suma 58.384
millones de dólares:
-Indique qué porcentaje representan las exportaciones cordobesas sobre el
total del país.
-Construya una gráfica de pastel mostrando la participación de Córdoba
sobre el total argentino.
EJERCICIO Nº 7
Con los siguientes datos de años seleccionados aleatoriamente construya un
diagrama de tallo y hojas. Use 10 como unidad de hoja.
1161 1206 1478 1300 1604 1725 1361 1422
1221 1378 1623 1426 1557 1730 1706 1689
EJERCICIO Nº 9
Los siguientes son datos de 30 observaciones en las que intervienen dos variables,
x e y. Las categorías para x son A, B, y C; para y son 1 y 2.
Observación x y Observación x y
1 A 1 16 B 2
2 B 1 17 C 1
3 B 1 18 B 1
4 C 2 19 C 1
5 B 1 20 B 1
6 C 2 21 C 2
7 B 1 22 B 1
8 C 2 23 C 2
9 A 1 24 A 1
10 B 1 25 B 1
11 A 1 26 C 2
12 B 1 27 C 2
13 C 2 28 A 1
14 C 2 29 B 1
15 C 2 30 B 2
a) Con estos datos elabore una tabulación cruzada en la que x sea la variable
para los renglones e y para las columnas.
b) Calcule los porcentajes de los renglones.
c) Calcule los porcentajes de las columnas.
d) ¿Cuál es la relación, si hay alguna, entre las variables x e y?
EJERCICIO Nº 11
Considere la distribución de frecuencia siguiente.
CLASES FRECUENCIAS
10-19 10
20-29 14
30-39 17
40-49 7
50-59 2
EJERCICIO Nº 12
Considere los datos siguientes.
8.9 10.2 11.5 7.8 10.0 12.2 13.5 14.1 10.0 12.2
6.8 9.5 11.5 11.2 14.9 7.5 10.0 6.0 15.8 11.5
EJERCICIO Nº1
Una maestra de mosaiquismo quiere incrementar el número de alumnos que
asisten a sus talleres y para ello necesita saber a qué edades les interesa dicha
disciplina. Para ello utiliza como muestra uno de los cursos al que le dicta clases
actualmente. En este grupo tiene 13 alumnos de las siguientes edades: 60, 57, 66,
68, 58, 64, 57, 70, 53, 52, 57, 59 y 69.
Calcule:
a) media
b) mediana
c) moda.
EJERCICIO Nº 2
El Ministerio de Trabajo, Empleo y Seguridad Social emite dos veces al año un
Boletín de Estadísticas Laborales. Se tomó información sobre los salarios medios
de los años 2010 y 2011, de dos actividades relevantes de la actualidad como es
el sector comercial y de la construcción. (Revista del trabajo, año 8, Nº 10,
Julio/Diciembre 2012. Fuente: INDEC)
EJERCICIO Nº 3
Se considera como muestra las edades de alumnos regulares de la facultad de
Ciencias Económicas de la Universidad Nacional de Rio Cuarto: 23, 20, 18, 28, 24
y 25. Calcule la varianza y la desviación estándar.
EJERCICIO Nº 4
Un productor ganadero de la zona necesita información sobre los caballos que tiene
en su establecimiento. Se sabe que el promedio de vida de estos animales es de
EJERCICIO Nº 5
La edad promedio en que se inserta una persona al mercado laboral es de 22 años,
suponga que los datos tienen una distribución en forma de campana, y que la
desviación estándar es de 3, utilice la regla empírica para determinar que
porcentaje de los datos se encuentra dentro de los siguientes rangos:
a) 13-31
b) 19-25
c) 16-28
EJERCICIO Nº 6
Se quiere saber la influencia que tiene en las ventas mensuales las campañas
publicitarias en forma mensual, para ello se tomó una muestra de las principales
marcas de aguas saborizadas.
Numero de Ventas
publicidades en miles
Marcas "X" $ "Y"
Aquaruis 5 30
Ser 3 28
Naranpol 3 31
Levite 1 12
H2O 4 29
Twister 2 16
Gatorade 4 33
Total 22 179
EJERCICIO Nº 7
La nota final de una materia surge de calcular una media ponderada. Para ello se
toman las notas que han obtenido los alumnos en cuatro instancias evaluables que
determina el profesor. El responsable de la asignatura otorga un peso de 3 al
examen inicial, de 1 al trabajo entregable, 2 al trabajo final y 4 al examen final.
EJERCICIO Nº 8
Una consultora está seleccionando currículum vitae de 50 personas para cubrir
puestos de secretario administrativo, seleccionara solo aquellos que tengan
estudios universitarios y los agrupa de acuerdo a las edades:
Edades Frecuencia
25-28 10
29-32 28
33-36 8
37-40 4
a) Calcule la edad promedio por persona y la respectiva desviación estándar.
b) Calcule la varianza para los datos agrupados y su desviación estándar
EJERCICIO Nº 9
La Dirección de una empresa dedicada a la venta de automotores, con el objetivo
de reducir sus costos de almacenamiento, tomó la decisión de centrar sus
esfuerzos en vender aquellos vehículos que llevan más días en stock. En primer
lugar y antes de diseñar cualquier acción, desean tener información sobre el tiempo
de permanencia de sus bienes de cambio actuales en inventario. Para esto, un
empleado de la firma relevó la cantidad de días en stock que tienen los 10
vehículos que actualmente tiene la firma en sus depósitos, obteniendo los
siguientes valores:
10 - 15 - 24 - 24 - 30 - 14 - 30 - 35 - 30 - 38
Se pide:
a) Calcule la media, mediana y moda.
b) Calcule varianza y desviación estándar.
c) Interprete los resultados obtenidos en los incisos anteriores.
Tabla 1: Artículos
Artículo Nombre Grupo Nombre Precio Unitario
Agua Mineral Bebidas sin alcohol $ 41,32
Bife de chorizo Sugerencias $ 206,61
Bondiola de cerdo a las brasas Principales $ 206,61
Brownie Postres $ 66,12
Copa helada Postres $ 49,59
Ensalada integral Ensaladas $ 72,73
Las Perdices Malbec Vinos $ 224,79
Latitud 33 Malbec Vinos $ 176,03
Panciato Entradas $ 140,50
Panzottis de langostino Pastas $ 157,02
Terraza Alto Malbec Vinos $ 210,74
Trucha a la Manteca Sugerencias $ 157,02
Coca - Cola 1,5 Bebidas sin alcohol $ 41,32
Probabilidad
EJERCICIO Nº 1
Indique si los siguientes son fenómenos aleatorios o determinísticos:
a) Velocidad de caída de un cuerpo.
b) Calidad del producto final en un proceso productivo.
c) Duración de las lámparas de un lote.
d) Temperatura de ebullición del agua.
e) La hora de llegada de un tren que debe llegar a las diez en punto.
f) El rendimiento de un tipo de maíz.
g) Número de nacimientos en un día determinado.
h) Tasa de inflación.
EJERCICIO N° 2
El precio de una acción, puede, en un determinado día, bajar, permanecer sin
variación o subir. Si a estos tres comportamientos distintos se les asigna
respectivamente los números: 1, 2 y 3.
a) Defina el espacio muestral y confeccione un diagrama donde se muestre el
comportamiento de 2 acciones, indicando el número total de situaciones
posibles que pueden darse.
b) Defina qué entiende por evento simple y enuncie 3 de ellos; expréselos
simbólicamente.
c) Defina qué entiende por evento compuesto y enuncie por lo menos uno.
d) ¿Cuál es el evento cierto?
e) ¿Qué es un evento?
EJERCICIO N° 3
Al trasladarse a otra ciudad, un contador busca una casa de uno, de dos o de tres
dormitorios y encuentra que ninguna de las casas que se anuncian para la venta
tiene menos dormitorios que baños, pero que todas tienen, naturalmente por lo
menos un baño.
a) Confeccione un diagrama donde se muestre las distintas situaciones que
pueden darse e indique cuáles son todos los eventos simples de este espacio
muestral.
b) ¿Qué tipo de evento es el formado por todos los puntos del gráfico en donde el
número de baños es igual al de dormitorios?
c) Cite un evento imposible para este experimento.
14 10 8 18
15 3 2 5
Total 30 20 50
EJERCICIO N° 5
De 375 viajes que un señor realizo en tren, 125 veces llega demorado a destino.
a) ¿Cuál es la probabilidad de que en su próximo viaje en tren llegue demorado?
b) ¿Qué probabilidad tiene en su próximo viaje de no llegar demorado?
EJERCICIO N° 6
En base a los datos del ejercicio 2, que dice: El precio de una acción, puede, en un
determinado día, bajar, permanecer sin variación o subir. Si a estos tres
comportamientos distintos se les asigna respectivamente los números: 1, 2 y 3;
supongamos que los nueve posibles resultados tengan las siguientes
probabilidades:
Y
Segunda 3 1,3 2,3 3,3
Acción * * *
1/16 2/16 1/16
1 2 3 X
Primera Suba
Baje Perm Acción
Y
Segunda 3 1,3 2,3 3,3
Acción * * *
1/16 2/16 1/16
1 2 3 X
Primera Suba
Baje Perm Acción
EJERCICIO N° 8
Entre los 80 directivos de una empresa hay 48 casados; se sabe, además, que hay
35 con estudios universitarios concluidos de los cuáles 22 son casados.
Cuál es la probabilidad de que un director elegido al azar sea:
a) Casado o con estudios universitarios no concluidos.
b) Soltero o con estudios universitarios concluidos.
EJERCICIO N° 9
Hay 200 aspirantes a un cargo administrativo en el departamento de personal de
una compañía, que se clasifican de la siguiente manera según su edad y
experiencia previa:
Edad
Menor de 30 Mayor de 30 Total
Experiencia
Con 16 32 48
EJERCICIO N° 10
En base a los datos del ejercicio número 2,04, y siendo “X” el evento que el precio
de la primera acción baje en tanto que “Y” denota el evento de que el precio de la
segunda acción permanezca inalterable.
a) ¿Cuál es la probabilidad de que el precio de la primera acción baje si el precio
de la segunda ha permanecido inalterable?
b) ¿Cuál es la probabilidad de que el precio de la segunda acción permanezca
inalterable si el de a primera acción baja?
EJERCICIO N° 11
Se pregunta a un consultor de administración su opinión sobre la razón por la cual
la secretaria de un director ha dejado su trabajo.
Sin poder obtener ninguna información directa sobre la secretaria, el consultor toma
los siguientes datos de un estudio a gran escala sobre la moral y la motivación en
las compañías. Entre todas las secretarias insatisfechas, el 20 % lo están
principalmente porque les disgusta el trabajo, el 50% porque se sienten mal pagas
y el 30% porque tienen problema de horario. Además las correspondientes
probabilidades de que se retiren son respectivamente 0,60; 0,40 y 0,90. ¿Cuál es
la probabilidad de que la secretaria haya renunciado porque no le gustaba su tarea?
EJERCICIO N° 12
Un distribuidor de discos emplea tres personas: K, L y M, que sacan discos de
recipientes y los apilan para subsiguiente verificación y empaque.
K, prepara 1 pedido equivocado cada 100 pedidos; L se equivoca en 10 pedidos
cada 100 y M comete un error en 5 pedidos cada 100. De todos los pedidos
despachados para comprobación K, L y M, preparan respectivamente el 50 %, el
30 % y el 20 %.
Si se encuentra un pedido mal preparado. Cuáles son las respectivas
probabilidades de que el pedido haya sido preparado por:
a) K
b) L
c) M
d) K ó M
Total
Grupos|Mozos Mozo 1 Mozo 2 Mozo 3 general
Bebidas sin alcohol 2 2
Ensaladas 1 1
Entradas 1 1
Pastas 1 2 3
Postres 2 2
Principales 1 1 2
Sugerencias 2 2 1 5
Vinos 1 3 4
Total general 7 6 7 20
Tal que ∑ p( x i ) =1
Yi p (yi)
2 0,15
4 0,15
6 0,70
1,00
Tal que
∑ p( y i ) =1
EJERCICIO Nº 2
En una empresa, los salarios han tenido un promedio de $ 5.000 mensuales en el
último semestre, con una desviación típica de $ 50. Qué sucede con la varianza de
los salarios si:
a) Se aumentan en $ 450.
b) Se aumentan en el 10 %.
c) Se efectúan ambos aumentos simultáneamente.
Nº de trabajadores
Salario por hora que reciben dicho
salario
150 25
160 50
170 100
180 300
190 250
200 175
210 50
220 25
230 25
Total 1.000
Calcule la E (x).
Grafique la función de distribución de probabilidades o función de cuantía de
𝑿𝒊
Grafique la función de acumulación de la variable 𝑋𝑖
EJERCICIO Nº 4
Las variables X e Y están relacionadas por la siguiente función lineal:
Y = 0,25 X + 4
Calcule:
a) Y
b) ∂2 y
c) ∂ y
d) ∂ 2
2y
e) CV y
EJERCICIO Nº 6
DISTRIBUCION BINOMIAL
Se observa, en general, que el 10% de los troncos de árbol usados en cierto
producto son muy resinosos. Se toma una muestra al azar de 20 troncos.
a) Calcular la media.
b) Calcular la desviación típica.
EJERCICIO Nº 7
Supongamos un archivo de cuentas corrientes de una empresa de nuestro medio, en
donde se conoce que la cuarta parte de los clientes tiene saldo acreedor y el resto saldo
deudor. Si extraemos aleatoriamente, con reposición, 15 clientes, calcule las siguientes
probabilidades:
EJERCICIO Nº 8
En una fábrica trabajan 600 operarios no especializados, 150 empleados
administrativos y 250 operarios especializados.
Sea X la variable aleatoria “número de empleados administrativos que se presentan
en en 20 observaciones con reemplazo, calcule la probabilidad de que:
EJERCICIO Nº 9
DISTRIBUCION POISSON
Un empresario del transporte posee dos camiones de carga que puede utilizar
diariamente. La demanda de camiones para un día se distribuye aproximadamente
según una Ley de Poisson, con media igual a 1,5.
Calcular:
a) La probabilidad de que en un día no se presente demanda alguna.
b) La probabilidad de que en un día la demanda no sea satisfecha totalmente.
EJERCICIO Nº 10
En una fábrica los artículos defectuosos producidos por cierta máquina alcanzan al
1%. Se toma una muestra de 200 artículos, cuál es la probabilidad de que dicha
máquina produzca:
a) 4 artículos defectuosos.
b) A lo sumo 7 artículos defectuosos.
c) Más de 5 productos defectuosos.
d) 2 ó más, pero a lo sumo 4 productos defectuosos.
e) Ningún producto defectuoso.
EJERCICIO Nº 11
De acuerdo a las estadísticas que lleva prolijamente una empresa de transporte, un
conductor tiene un pinchazo de cubierta cada 200 km., suponiendo un recorrido sin
inconvenientes.
a) Calcular la probabilidad de obtener 2 ó más pinchazos en un recorrido de 1000
km.
b) Calcular la probabilidad de que en dicho recorrido no tenga ningún pinchazo.
c) Calcular la probabilidad de que tenga exactamente 3 pinchazos.
d) Calcular la probabilidad de que tenga menos de 4 pinchazos.
EJERCICIO Nº 1
Las notas de los alumnos de la Facultad de Ciencias Económicas de la Universidad
Nacional de Río Cuarto en un examen de Contabilidad, en el que se califica del 0
al 100, se distribuye Normal con media 60 y desviación típica 15. Se desea saber
el porcentaje de alumnos con notas:
a) Menores o iguales a 45.
b) Menores de 75.
c) Mayores de 30.
d) Mayores de 90.
e) Entre 30 y 45.
f) Entre 75 y 90.
g) Entre 45 y 90.
h) Entre 45 y 75.
i) Menos de 30 ó más de 75.
EJERCICIO Nº 2
Si la variable x se distribuye Normal con media 10 y desviación típica 5, x ( 10, 5 ),
determinar a qué debe ser igual x0 y x1, si :
a) P ( x < x0 ) = 0,8413
b) P ( x > x0 ) = 0,8413
c) P ( x0 < x < x1 ) = 0,9544 (probabilidad central)
EJERCICIO Nº 3
Determinar Z0 dado:
a) P( z > z0 ) = 0,3121
b) P( 0< z < z0 ) = 0,4515
c) P( z > z0 ) = 0,8023
d) P( z < z0 ) = 0,4562
e) P( -z0 < z < z0 ) = 0,7456
EJERCICIO Nº 4
Las notas de un examen fueron 0,1,2,3,4,5,6,7,8,9,10. Dependiendo del número de
respuestas correctas a 10 preguntas formuladas. La calificación media fue de 6,7 y
la desviación típica 1,2. Suponiendo que las calificaciones se distribuyen
normalmente es decir X N( 6,7; 1,2 ), determinar:
a) La nota mínima del 10% superior de la clase.
b) La nota máxima del 10% más bajo de la clase.
e) Calcule la probabilidad de Pr x 4 .
EJERCICIO N° 6
Sea X una variable aleatoria continua tal que:
1
h para 0 x h
f (x)
0 para x 0 y para x h
Calcular la E(x).
EJERCICIO N° 7
En una población de 3.428 adultos, la distribución de las estaturas es
aproximadamente Normal, con µ = 140 cm y σ = 25 cm.
Calcule la probabilidad de que una persona tenga una estatura:
a) Superior a 170 cm.
b) Inferior a 90 cm.
c) Comprendida entre 1 m. y 1,50 m.
d) Comprendida entre 1,80 m. y 1,90 m.
e) Entre qué valores queda ubicado el 40% central.
En cada uno de los incisos anteriores calcule el número de dichas personas.
EJERCICIO N° 8
El tiempo empleado en minutos, en ir de un hotel al aeropuerto por la ruta “A” se
distribuye Normal, con µ = 27 y σ = 5; mientras que por la ruta “B”, la distribución
es Normal con µ = 30 y σ = 2.
Qué ruta conviene utilizar si se dispone de 30 minutos?.
EJERCICIO N° 10
Las estaturas de un grupo de soldados se distribuyen normalmente con media igual
a 1,75 cm y varianza igual a 0,04.
Qué porcentaje de soldados tendrá una estatura inferior a 1,60.
EJERCICIO N° 11
Encuentre el área bajo la curva Normal entre:
a) Z = - 1,20 y Z = 2,40
b) Z = 1,23 y Z = 1,87
e) Z = - 0,90 y Z = 0,70
EJERCICIO N° 12
Determinar él ó los valores de Z, donde el área bajo la curva Normal:
a) Entre 0 y Z es 0,3770.
b) A la izquierda de Z es 0,8621.
c) El área entre -1,5 y Z es 0,8621.
d) Entre Z y –Z es 0,975.
EJERCICIO N° 13
DISTRIBUCIÓN CHI CUADRADO
σ 2 ∑
, este estadístico tiene una distribución χ i2 .
i= 1 i
Se desea saber sobre el mismo lo siguiente:
a) Pr 5,23 ≤ χ 2
≤ 14,8
b) Pr { χ 2 ≤ 26,2 }
c) Pr { χ 2 > 6,30 }
d) Pr { χ 2 < t 0 } = 0,01
a) Pr 5,23 ≤ χ 2
≤ 14,8
Para buscar la probabilidad de que la variable asuma un valor entre 5,23 y 14,8,
debemos entrar en la tabla de la Chi-Cuadrado y buscar en la primera columna un n =
12 (que son los grados de libertad), luego buscar en esa fila el valor de 14,8 y si
miramos en la primera fila vemos que la probabilidad acumulada hasta ese valor es de
0,75. Luego debemos restar la probabilidad acumulada hasta 5,23, hacemos el mismo
procedimiento y encontramos que la probabilidad es de 0,05 y luego restamos y
encontramos que la probabilidad entre esos dos valores es de 0,70.
0 5,23 1,48 χ2
0 26,2 χ2
0 6,30 χ2
d) Pr 2 t0 0,01
0,01
0 3,57 χ2
e) Pr { χ 2 > t 1 } = 0,05
En este punto también nos piden hallar el valor de la variable. Debemos encontrar el
valor de t1 tal que Pr { χ12 2 > t 1 } = 0,05 y ese valor en tabla es t1 = 21.
0,05
0 21 χ2
Este caso es la suma de los dos anteriores, o sea que se nos pide la probabilidad de
la unión de las dos colas:
0 χ2
EJERCICIO N° 14
Sea una distribución Chi-Cuadrado con 23 grados de libertad 23
2
, Cuál será la
probabilidad de que dicha variable asuma un valor:
EJERCICIO N° 15
Si la variable U se distribuye χ 72 , encontrar los valores χ 12 y χ 22 tales que:
a) P ( U > χ 22 ) = 0,025 b) P ( U < χ 12 ) = 0,50 c) P ( χ 12 ≤ U ≤ χ 22 ) = 0,90
EJERCICIO N° 16
DISTRIBUCIÓN T DE STUDENT
x -μ
T
6
x
i1
i x
2
n(n 1)
el cual tiene una distribución “t” de Student con n-1 = 5 grados de libertad.
Deseamos conocer antes de tomar la muestra, lo siguiente:
0,25
-0,727 0
0,75
0 0,727
0,005
0 4,032
4) En este punto nos piden Pr { t > - 0,727 } que por ser simétrica es igual a Pr
{ t < 0,727 } = 0,75
0,75
Pr { 1,476 < t < 3,365 } = Pr { t < 3,365 } - Pr { t < 1,476} = 0,99 - 0,90 = 0,09
0,09
0 1,476 3,365
6)
Pr { - 2,571 < t < 0,727 } = Pr { t < 0,727 - Pr { t < - 2,571 } = 0,75 - 1+ 0,975 = 0,725
0,725
-2,57 0 0,727
7)
Pr { - 1,476 < t < - 0,727 } =
Pr { 0,727 < t < 1,476 } = Pr { t < 1,476 } - Pr { t < 0,727 } = 0,90 - 0,75 = 0,15
-1,476 0,727
8)
Pr { - 0,727 < t < 0,727 } = { Pr { t < 0,727 } - 0,50 } x 2 = { 0,75 - 0,50 } x 2 = 0,50
-0,727 0 0,727
9)
EJERCICIO N° 17
El siguiente gráfico muestra una distribución “t” de Student con 9 grados de libertad.
-t1 0 t1 t
EJERCICIO N° 18
Hallar el número de grados de libertad que tiene la distribución de una variable “t” de
Student, si se sabe que dentro del intervalo [ - 1,350; 1,350 ] está comprendido el 80%
de los valores que puede asumir la variable. Determinados los grados de libertad, hallar
el valor to para el cual Pr (t < to) = 0,99.
Respuesta:
Grados de libertad: 13. to = 2,650.