Universidad Peruana Los Andes: Curso: Estadistica

UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL

CURSO: ESTADISTICA
“AÑO DEL BUEN SERVICIO AL CIUDADANO’’
TEMAS DE ESTADISTICA
ASIGNATURA: ESTADISTICA
DOCENTE: ING. WASHINGTON CORDOVA BONIFACIO
INTEGRANTES:
 ORTIZ QUILCA Stevin
 HUAMAN HUAYHUA Claudio
AULA: A1
TURNO: MAÑANA
CICLO: 3°
HUANCAYO - 2017
E.A.P: ING CIVIL
CURSO: ESTADISTICA
SEMANA I
INTRODUCCIÓN A LA ESTADISTICA
 ESTADÍSTICA Y SU DIVISIÓN
La Estadística para su mejor estudio se ha dividido en dos grandes ramas:

1. La Estadística Descriptiva.
2. La Estadística Inferencial.
3. La Estadística Inductiva.
4.
 CONCEPTOS BÁSICOS
1. Estadística Descriptiva:
Tienen por objeto fundamental describir y analizar las características de un
conjunto de datos, obteniéndose de esa manera conclusiones sobre las
características de dicho conjunto y sobre las relaciones existentes con otras
poblaciones, a fin de compararlas. No obstante puede no solo referirse a
la observación de todos los elementos de una población (observación
exhaustiva) sino también a la descripción de los elementos de una muestra
(observación parcial).
En relación a la estadística descriptiva, Ernesto Rivas González dice; "Para
el estudio de estas muestras, la estadística descriptiva nos provee de todos
sus medidas; medidas que cuando quieran ser aplicadas al universo total, no
tendrán la misma exactitud que tienen para la muestra, es decir al estimarse
para el universo vendrá dada con cierto margen de error; esto significa que el
valor de la medida calculada para la muestra, en el oscilará dentro de cierto
límite de confianza, que casi siempre es de un 95 a 99% de los casos.
2. Estadística Inferencial:
Se deriva de muestras, de observaciones hechas sólo acerca de una parte
de un conjunto numeroso de elementos y esto implica que su análisis
requiere de generalizaciones que van más allá de los datos. Como
consecuencia, la característica más importante del reciente crecimiento de la
estadística ha sido un cambio en el énfasis de los métodos que describen a
métodos que sirven para hacer generalizaciones. La Estadística Inferencial
investiga o analiza una población partiendo de una muestra tomada. Según
Berenson y Levine; Estadística Inferencial son procedimientos estadísticos
E.A.P: ING CIVIL
CURSO: ESTADISTICA
que sirven para deducir o inferir algo acerca de un conjunto de datos

numéricos (población), seleccionando un grupo menor de ellos (muestra).
El objetivo de la inferencia en investigación científica y tecnológica radica en
conocer clases numerosas de objetos, personas o eventos a partir de otras
relativamente pequeñas compuestas por los mismos elementos.
3. Estadística Inductiva: Está fundamentada en los resultados obtenidos del

análisis de una muestra de población, con el fin de inducir o inferir
el comportamiento o característica de la población, de donde procede, por lo
que recibe también el nombre de Inferencia estadística.
4. Método Estadístico: El conjunto de los métodos que se utilizan para medir

las características de la información, para resumir los valores individuales, y
para analizar los datos a fin de extraerles el máximo de información, es lo
que se llama métodos estadísticos. Los métodos de análisis para la
información cuantitativa se pueden dividir en los siguientes seis pasos:
1. Definición del problema.
2. Recopilación de la información existente.
3. Obtención de información original.
4. Clasificación.
5. Presentación.
6. Análisis.
1. Población:
El concepto de población en estadística va más allá de lo que comúnmente
se conoce como tal. Una población se precisa como un conjunto finito o
infinito de personas u objetos que presentan características comunes.
"Una población es un conjunto de todos los elementos que estamos
estudiando, acerca de los cuales intentamos sacar conclusiones". Levin &
Rubin (1996).
"Una población es un conjunto de elementos que presentan una característica
común". Cadenas (1974).
2. Muestra:
"Se llama muestra a una parte de la población a estudiar que sirve para
representarla". Murria R. Spiegel (1991).
"Una muestra es una colección de algunos elementos de la población, pero
no de todos". Levin & Rubin (1996).
"Una muestra debe ser definida en base de la población determinada, y las
conclusiones que se obtengan de dicha muestra solo podrán referirse a la
población en referencia", Cadenas (1974).
E.A.P: ING CIVIL
CURSO: ESTADISTICA
3. Muestreo:
Esto no es más que el procedimiento empleado para obtener una o más
muestras de una población; el muestreo es una técnica que sirve para
obtener una o más muestras de población.
 TIPOS DE VARIABLES
Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos
es de clase y no de cantidad.
Datos cuantitativos: cuando los valores de los datos representan diferentes

magnitudes, decimos que son datos cuantitativos.
Datos cronológicos: cuando los valores de los datos varían en diferentes

instantes o períodos de tiempo, los datos son reconocidos como cronológicos.
Datos geográficos: cuando los datos están referidos a una localidad geográfica
se dicen que son datos geográficos.
 FUENTES Y TÉCNICAS DE ACOPIO DE DATOS
Los datos estadísticos necesarios para la comprensión de los hechos pueden

obtenerse a través de fuentes primarias y fuentes secundarias.
 Fuentes de datos primarias: es la persona o institución que ha recolectado

directamente los datos.
 Fuentes secundarias: son las publicaciones y trabajos hechos por personas o

entidades que no han recolectado directamente la información.
Las fuentes primarias más confiables, son las efectuadas por oficinas
gubernamentales encargadas de tal fin. En la práctica, es aconsejable utilizar
fuentes de datos primarias y en última instancia cuando estas no existan, usar
estadísticas de fuentes secundarias. Con este último tipo no debemos pasar por
E.A.P: ING CIVIL
CURSO: ESTADISTICA
alto que la calidad de las conclusiones estadísticas depende en grado sumo de la

exactitud de los datos que se recaben.
SEMANA II
TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS
 CONSTRUCCIÓN DE TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS,

PARA VARIABLES CUALITATIVAS Y CUANTITATIVAS
UNIDIMENSIONALES.
A partir de una variable numérica es posible construir una distribución

de frecuencias clasificando los datos en clases o categorías definidas por el
investigador.
Las clases o intervalos de clase de una tabla de frecuencias deben ser
mutuamente excluyentes y exhaustivas, es decir, cada dato debe caer en
una y sólo una clase y todos los datos deben tener una clase a la cual
pertenecen.
¿Cómo construimos una tabla de

frecuencias?
Se divide el rango total de los datos en clases o intervalos, los que no
necesariamente deben tener la misma longitud.
Se cuenta el número de observaciones que cae en cada clase y se
determina la frecuencia en cada clase.
Se calculan las frecuencias relativas, frecuencias acumuladas y
frecuencias acumuladas relativas para cada intervalo.
Notación:
Frecuencia ⇒ fi = número de casos que cae en el intervalo i-ésimo
Frecuencia relativa porcentual ⇒ fri = (fi / n)⋅100 = porcentaje de casos
en el intervalo i-ésimo
Frecuencia acumulada ⇒ fai = f1 + f2 +. . . + fi = suma de las
frecuencias desde la primer categoría hasta la categoría i-ésima.
Frecuencia acumulada relativa porcentual ⇒ fari = (fai / n) ⋅100 =

suma de las frecuencias relativas desde la primer categoría hasta la
categoría i-ésima .
E.A.P: ING CIVIL
CURSO: ESTADISTICA
La Tabla muestra la tabla de frecuencias para los datos de tasas de

neumonía cada 1000 habitantes presentados en la Tabla 2 (Año 2000,
Argentina). Se definieron intervalos de longitud igual a 1.
Interva Frecuen Frecuencia Frecuenci Frecuencia

lo cia relativa a relativa
porcentual acumulada acumulada
[ 0, (f1i) (fri) 4. (fai) 1 (frai) 4.
1) [ 2 2
3 4
1, 2) 12. 16.
[ 2, 2 6
5 7
3) [ 8 14
8. 25.
3, 4) 3 0
5 19
[ 4,
5) [ 1 33. 20 58.
3 3
5, 6) 0 20
 [ 6, 20. 79.
1 8 21 2
7) [
7, 8) 1 4. 22 83.
[ 8, 1 2 23 3
9) [9,
1 0. 24 83.
10)
 GRAFICAS 0 3
[10, 4. 87.
11)
Construcción del histograma
2 5
a) Intervalos de clase todos de la misma
4. 91.
longitud.
2 7
4.
Se trazan dos ejes de coordenadas rectangulares. En 95.
el eje horizontal se
representan los valores de la2 variable y en el eje vertical
8 una medida de
frecuencia (frecuencia absoluta,
4. frecuencia relativa o100. frecuencia relativa
porcentual. 2 0
Indicamos en el eje horizontal los límites de los intervalos de clase.

Asociamos a cada clase una columna cuya base cubre el intervalo de clase y
cuya altura indica cuantos datos “caen” en un intervalo a través de la frecuencia
o la frecuencia relativa de la clase.
E.A.P: ING CIVIL
CURSO: ESTADISTICA
El gráfico se construye sin dejar espacio horizontal entre categorías, a menos

que una clase esté vacía (es decir tenga altura cero).
¿QUÉ CARACTERÍSTICAS OBSERVAMOS EN LOS GRÁFICOS

ANTERIORES?
- La distribución es asimétrica, con mayor concentración de datos en

tasas bajas y algunas provincias con tasas altas.
- Se observan cuatro provincias con tasas de notificación de casos de

neumonía más altas que el resto. Ellas son San Luis, Formosa, La Pampa
y Chaco. Tal vez podríamos pensar en dos agrupamientos.
- En el histograma de la izquierda observamos un único pico (o moda) pero

en el de la derecha aparenta haber dos. Es importante remarcar que
características del gráfico que no se mantienen al modificar levemente la
definición de los intervalos de clase pueden ser consideradas como
artificiales.
El propósito de un histograma es mostrar la forma de la distribución de
los datos, por lo que debemos estar atentos a los aspectos visuales de la
E.A.P: ING CIVIL
CURSO: ESTADISTICA
representación. Como hemos observado en el ejemplo, la forma del

histograma depende del número de intervalos de clase que
seleccionemos.
¿CUÁNTAS
CLASES
USAR?
Existen distintas fórmulas que permiten calcular el número máximo de

clases apropiado para un conjunto de datos, en base al rango de datos y
al número de datos.
La decisión, tal como ocurre en el gráfico de tallo-hojas, es una solución
de compromiso. En general entre 6 y 15 clases resulta ser una buena
elección. Muchos intervalos harán que caigan muy pocas observaciones
en cada clase, por lo que las alturas de las barras variarán irregularmente.
Muy pocas clases producen una gráfica más regular, pero demasiado
agrupamiento puede hacer que se pierdan las características principales.
b) Intervalos de clase de diferente
longitud.
Los datos de la Tabla presentan los casos de rubéola notificados al SI.NA.VE

durante el año 2000 según grupos de edad. Notemos que los intervalos
de edad tienen diferente longitud.
Cuando (erróneamente) se construye un histograma considerando como

altura de la barra la frecuencia relativa se obtiene la gráfica siguiente. La última
categoría de edad se truncó arbitrariamente en 80 años para poder
representarla.
Tabla. Notificaciones de casos de rubéola. Argentina, año 2000.
Intervalo Frecuencia Frecuencia

relativa (fr)
(años) (fi)
E.A.P: ING CIVIL
CURSO: ESTADISTICA
[ 0, 1) 497 10.5%
[ 1, 2)
[ 2, 5) 387 8.2%
[ 5, 10) 1100 23.3%
[10, 15) 1389 29.4%

[15, Total 4720 100.00%
798 16.9%
50)
521 11.0%
 50
28 0.6%
¿CÓMO CONSTRUIMOS EL HISTOGRAMA TENIENDO EN CUENTA QUE

LOS INTERVALOS DE CLASE SON DE DISTINTA LONGITUD?
La barra debe tener una altura tal que el área (base x altura) sea igual a la
frecuencia (o a la frecuencia relativa). Es decir,
Altura de la barra = frecuencia en el
intervalo. Longitud del
intervalo
La altura de la barra definida de este modo se denomina escala densidad porque

indica el número de datos por unidad de la variable. La última columna de la
Tabla muestra la escala densidad para los datos de la Tabla y la Figura el
histograma que se obtiene usando la escala densidad.
Tabla. Escala densidad. Notificaciones de casos de rubéola. Argentina, año

2000.
Categor Frecuen Frecuen Escal

ía cia cia a
relativa densid
[(año
0, (fi 497 10.5 10.53
) (fr) ad
1)s) [ % %
1, 2) 387
[ 2, 8.2 8.20
1100
5) % %
1389
[ 5, 23.3 7.77
10) Tota 472
798
100.00
% -- %
l 0 %
[10, 521 29.4 5.89
15) % %
[15, 28
50) 16.9 3.38
% %
E.A.P: ING CIVIL
CURSO: ESTADISTICA
SEMANA III
TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS
 Construcción de tablas bidimensionales.
. Tabulación de los datos

Cuando sobre cada individuo de una población se observan
simultáneamente dos características cuantitativas, que unidimensionalmente
podríamos representar separadamente por las variables X e Y, entonces se
dice que se está observando una variable estadística bidimensional y se
representa por (X, Y). El conjunto de valores bidimensionales de la variable
junto con sus frecuencias asociadas dará lugar a la correspondiente
distribución bidimensional de frecuencias. En el caso de variables
bidimensionales podemos distinguir dos tipos principales de tablas:
a) Tabulación en dos columnas (o en dos filas)
Si el número de datos bidimensionales es pequeño, los datos se
disponen en dos columnas (o en dos filas) ˜ sobre las que se emparejan
los correspondientes valores unidimensionales de una misma realización
de la ´ variable bidimensional, como se expresa en la tabla siguiente:
Variable X Variable Y
E.A.P: ING CIVIL
CURSO: ESTADISTICA
X1 Y1
X2 Y2
. .
. .
. .
Xn Yn
b) Tabla de doble entrada o de contingencia

Si el número de observaciones bidimensionales es grande, clasificamos
los ´ n individuos de la muestra en r clases (A1,..., Ar) respecto de la
variable X, y en k clases (B1,..., Bk) respecto de la variable Y. Entonces
los datos suelen organizarse en una tabla, que se denomina tabla de
doble entrada o de contingencia.
SEMANA IV
 MEDIDAS DE TENDENCIA CENTRAL
 Media aritmética
Es el valor promedio de un conjunto de datos. Es uno de los estadígrafos
más importantes de la estadística que localiza el punto de equilibrio o
centro de gravedad de la distribución.
 Media para datos agrupados

Supongamos que se dispone de dos conjuntos de datos en los
que se conoce la media y el número de datos de cada uno de ellos
(X1, n1-X2, n2 ). Calculamos la media de los n1 + n2 datos como
el promedio pesado.
n1 X1 n 2 X 2
X
n1  n2
Características y propiedades de la media.

a) Se usa para datos numéricos.
E.A.P: ING CIVIL
CURSO: ESTADISTICA
b) Representa el centro de gravedad o el punto de equilibrio de los datos.

Podemos imaginar a los datos como un sistema físico, en el que cada dato
tiene una “masa” unitaria y lo ubicamos sobre una barra en la posición
correspondiente a su valor. La media representa la posición en que
deberíamos ubicar el punto de apoyo para que el sistema esté en equilibrio.
 Mediana
Es un valor que divide a un conjunto de datos ordenados (creciente o
decreciente) en dos grupos con igual número de observaciones. La mitad
de las observaciones están por encima de la mediana y la otra mitad por
debajo de ella.
 La mediana- datos no agrupados
Para hallar la mediana se sigue los siguientes pasos:

 Se organiza los datos en forma creciente o decreciente.
 Si el número de datos es un número impar, el elemento
que se encuentra en la mitad del arreglo es la mediana.
 Si el número de datos es un número par la mediana es el
promedio de los dos.
 La mediana – datos agrupados
ECUACIÓN:
En donde:
n = número total de datos

Fa = Frecuencia acumulada del intervalo de clase que antecede al intervalo de la
Mediana
c = ancho del intervalo de clase de la Mediana
 Moda
Es el valor que se presenta con mayor frecuencia en un conjunto de datos. Es útil
cuando interesa conocer el valor más frecuente de la variable; por ejemplo cuando
se desea conocer los puntos críticos para estudiar el número de pasajeros por hora
que usan el transporte que circulan por un determinado avenida, el estudio
E.A.P: ING CIVIL
CURSO: ESTADISTICA
correspondiente demostrara que existen dos modas, una por la mañana alrededor
de las 8 y la otra por la tarde alrededor de las 19 horas.
Un grupo de datos puede tener una moda, dos modas, etc. En tales casos la
distribución se llama, respectivamente, unimodal, bimodal, etc.
 Datos no agrupados
Se recoge el valor que más repite.
 Datos agrupados
Li: Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia
absoluta).
fi :Frecuencia absoluta del intervalo modal.
fi-1 : Frecuencia absoluta del intervalo anterior al modal.
fi+1 : Frecuencia absoluta del intervalo posterior al modal.
ti :Amplitud de los intervalos.
Semana V
E.A.P: ING CIVIL
CURSO: ESTADISTICA
MEDIDAS DE POSICION
 CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del
cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el
tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas
partes (75%) de los datos.
 Datos Agrupados
Como los cuartiles adquieren su mayor importancia cuando contamos un número

grande de datos y tenemos en cuenta que en estos casos generalmente los datos
son resumidos en una tabla de frecuencia. La fórmula para el cálculo de los
cuartiles cuando se trata de datos agrupados es la siguiente:
k= 1, 2,3
Donde:
Lk = Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Si se desea calcular cada cuartil individualmente, mediante otra fórmula se tiene lo
siguiente:
El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los
datos; es decir, aquel valor de la variable que supera 25% de las observaciones y
es superado por el 75% de las observaciones.
 Fórmula de Q1, para series de Datos agrupados:
Donde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
E.A.P: ING CIVIL
CURSO: ESTADISTICA
El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2 = Md), es el

menor valor que es mayor que la mitad de los datos, es decir el 50% de las
observaciones son mayores que la mediana y el 50% son menores.
Donde:
Ic = intervalo de clase
El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los
datos, es decir aquel valor de la variable que supera al 75% y es superado por el
25% de las observaciones.
Donde:
Ic = intervalo de clase.
Otra manera de verlo es partir de que todas las medidas no son sino casos
particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer
cuartil 75% percentil.
 Para Datos No Agrupados
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:
- El primer cuartil:
Cuando n es par:
Cuando n es impar:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
Para el tercer cuartil
Cuando n es par:
Cuando n es impar:
 DECILES
Los deciles son ciertos números que dividen la sucesión de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto
de datos ordenados en diez partes iguales, son también un caso particular de los
percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil,
segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento académico.
 Datos Agrupados
Para datos agrupados los deciles se calculan mediante la fórmula.
k= 1, 2,3,... 9
Donde:
Lk = Límite real inferior de la clase del decil k
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra fórmula para calcular los deciles:
 El cuarto decil, es aquel valor de la variable que supera al 40%, de las
observaciones y es superado por el 60% de las observaciones.
 El quinto decil corresponde a la mediana.

E.A.P: ING CIVIL
CURSO: ESTADISTICA
 El noveno decil supera al 90% y es superado por el 10% restante.
Donde (para todos):

Ic = intervalo de clase.
 Fórmulas Datos No Agrupados

Si se tienen una serie de valores X1, X2, X3... Xn, se localiza mediante las
Cuando n es par:
Cuando n es impar:
Siendo A el número del decil.
 PERCENTIL
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de
ubicación o clasificación de las personas cuando atienden características tales
como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en
cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99),
leídos primer percentil,..., percentil 99.
 Datos Agrupados
Cuando los datos están agrupados en una tabla de frecuencias, se calculan
mediante la fórmula:
k= 1, 2,3,... 99
E.A.P: ING CIVIL
CURSO: ESTADISTICA
Donde:
Lk = Límite real inferior de la clase del decil k
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
 Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante.
 El 60 percentil, es aquel valor de la variable que supera al 60% de las

observaciones y es superado por el 40% de las observaciones.
 El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.
 Fórmulas Datos No Agrupados

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
Para los percentiles, cuando n es par:
Cuando n es impar:
Siendo A, el número del percentil.
Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con
el percentil 50 y el tercer cuartil con el percentil 75.
SEMANA VI
E.A.P: ING CIVIL
CURSO: ESTADISTICA
MEDIDAS DE DISPERSIÓN
 RANGO
 DESVIACIÓN MEDIA
La desviación media o desviación promedio es la media aritmética de los
valores absolutos de las desviaciones respecto a la media aritmética.
 PROPIEDADES
Guarda las mismas dimensiones que las observaciones. La suma
de valores absolutos es relativamente sencilla de calcular, pero esta simplicidad
tiene un inconveniente: Desde el punto de vista geométrico, la distancia que induce
la desviación media en el espacio de observaciones no es la natural (no permite
definir ángulos entre dos conjuntos de observaciones). Esto hace que sea muy
engorroso trabajar con ella a la hora de hacer inferencia a la población.
Cuando mayor sea el valor de la desviación media, mayor es la dispersión de los
datos. Sin embargo, no proporciona una relación matemática precisa entre su
magnitud y la posición de un dato dentro de una distribución.
La desviación media al tomar los valores absolutos mide una observación sin
mostrar si la misma está por encima o por debajo de la media aritmética.
 MÉTODOS DE CÁLCULO
 Para Datos No Agrupados
Se emplea la ecuación:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
 Para Datos Agrupados en Tablas de Frecuencia

Se emplea la ecuación:
 VARIANZA - DESVIACIÓN ESTÁNDAR
La varianza es la media aritmética de los cuadrados de las desviaciones

respecto a la media aritmética, es decir, es el promedio de las desviaciones
de la media elevadas al cuadrado. La desviación estándar o desviación típica
es la raíz de la varianza.
La varianza y la desviación estándar proporcionan una medida sobre el punto
hasta el cual se dispersan las observaciones alrededor de su media
aritmética.
 Propiedades
- La varianza y desviación estándar (o cualquier otra medida de dispersión)
indican el grado en que están dispersos los datos en una distribución. A
mayor medida, mayor dispersión.
- La varianza es un número muy grande con respecto a las observaciones,
por lo que con frecuencia se vuelve difícil para trabajar.
- Debido a que las desviaciones son elevadas al cuadrado y la varianza
siempre se expresa en términos de los datos originales elevados al
cuadrado, se obtiene unidades de medida de los datos que no tiene sentido
o interpretación lógica. Por ejemplo, si se calcula la varianza de una
distribución de datos medidos en metros, segundos, dólares, etc., se
obtendrá una varianza mediada en metros cuadrados, segundos cuadrados,
dólares cuadrados, respectivamente, unidades de medida que no tienen
significado lógico respecto a los datos originales.
- Para solucionar las complicaciones que se tiene con la varianza, se halla la
raíz cuadrada de la misma, es decir, se calcula la desviación estándar, la
cual es un número pequeño expresado en unidades de los datos originales y
que tiene un significado lógico respeto a los mismos.
 Para Datos No Agrupados
La varianza para una población se calcula con:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
Para Datos Agrupados en Tablas de Frecuencia

La varianza para una población se calcula con:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
SEMANA VII
MEDIDAS DE FORMA
 ASIMETRIA
Una medida de forma de una distribución que permite identificar y describir la
manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se
hallen dentro de la distribución. Permite identificar las características de la
distribución de datos sin necesidad de generar el gráfico.
 TIPOS DE ASIMETRÍA
La asimetría presenta las siguientes formas:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
 Asimetría Negativa o a la Izquierda.- Se da cuando en una

distribución la minoría de los datos está en la parte izquierda de la
media. Este tipo de distribución presenta un alargamiento o sesgo
hacia la izquierda, es decir, la distribución de los datos tiene a la
izquierda una cola más larga que a la derecha. También se dice que
una distribución es simétrica a la izquierda o tiene sesgo negativo
cuando el valor de la media aritmética es menor que la mediana y éste
valor de la mediana a su vez es menor que la moda,
en símbolos
Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta

de la simetría.
 Simétrica.- Se da cuando en una distribución se distribuyen

aproximadamente la misma cantidad de los datos a ambos lados de la media
aritmética. No tiene alargamiento o sesgo. Se representa por una curva
normal en forma de campana llamada campana de Gauss (matemático
Alemán 1777-1855) o también conocida como de Laplace (1749-
1827).También se dice que una distribución es simétrica cuando su media
aritmética, su mediana y su moda son iguales, en símbolos Md=Mo
 Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la

minoría de los datos está en la parte derecha de la media aritmética. Este
tipo de distribución presenta un alargamiento o sesgo hacia la derecha, es
decir, la distribución de los datos tiene a la derecha una cola más larga que a
la izquierda.
También se dice que una distribución es simétrica a la derecha o tiene sesgo
positivo cuando el valor de la media aritmética es mayor que la mediana y éste a
valor de la mediana a su vez es mayor que la moda, en símbolos
 MEDIDAS DE ASIMETRÍA
Coeficiente de Karl Pearson
Donde:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
= media aritmética.
Md = Mediana.
s = desviación típica o estándar.
Nota:
El Coeficiente de Pearson varía entre -3 y 3
Si As < 0 ? la distribución será asimétrica negativa.
Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.
 Medida de Yule Bowley o Medida Cuartílica
Donde:
= Cuartil uno; = Cuartil dos = Mediana; = Cuartil tres.
Nota:
La Medida de Bowley varía entre -1 y 1
Si As < 0 ? la distribución será asimétrica negativa.
Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.
 CURTOSIS
La curtosis mide el grado de agudeza o achatamiento de una distribución con

relación a la distribución normal, es decir, mide cuán puntiaguda es una distribución.
 TIPOS DE CURTOSIS
La curtosis determina el grado de concentración que presentan los valores en la
región central de la distribución. Así puede ser:
 Leptocúrtica.- Existe una gran concentración.

 Mesocúrtica.- Existe una concentración normal.
 Platicúrtica.- Existe una baja concentración.
E.A.P: ING CIVIL
CURSO: ESTADISTICA
 MEDIDAS DE CURTOSIS
 Medida de Fisher
Para datos sin agrupar se emplea la siguiente fórmula:
Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:
Para datos agrupados en intervalos se emplea la siguiente fórmula:
Dónde: = cada uno de los valores; n = número de datos; = media aritmética; =

Cuádruplo de la desviación estándar poblacional; f = frecuencia absoluta; xm =
marca de clase
Nota:
Si a < 3 ? la distribución es platicútica
Si a = 3 ? la distribución es normal o mesocúrtica
Si a > 3 ? la distribución es leptocúrtica
 Medida basada en Cuartiles y Percentiles
= (letra griega minúscula kappa) = Coeficiente percentil de curtosis

Nota:
Si < 0,263 ? la distribución es platicúrtica
Si = 0,263 ? la distribución es normal o mesocúrtica
Si > 0,263 ? la distribución es leptocúrtica
Esta medida no es muy utilizada.
E.A.P: ING CIVIL
CURSO: ESTADISTICA
1. PROBABILIDADES
1.1. CONCEPTOS BÁSICOS:
En nuestra vida cotidiana asociamos usualmente el concepto de Probabilidad a su
calificativo probable, considerando probables aquellos eventos en los que tenemos
un alto grado de creencia en su ocurrencia.
En esta línea, Probabilidad es un concepto asociado a la medida del azar. También
pensamos en el azar vinculado, fundamentalmente, con los juegos de azar, pero
desde esa óptica tan reducida se nos escapan otros muchísimos ejemplos de
fenómenos de la vida cotidiana o asociados a disciplinas de distintas ciencias donde
el azar juega un papel fundamental.
1.2. DEFINICIÓN:
Tenemos, por tanto, que probabilidad es la asignación que hacemos del grado de
creencia que tenemos sobre la ocurrencia de algo. Esta asignación, sin embargo,
debe ser coherente. Esta necesidad de que asignemos probabilidades
adecuadamente se va a plasmar en esta sección en tres reglas, conocidas como
axiomas, que debe cumplir cualquier reparto de probabilidades.
1.3. PROPIEDADES:
1.3.1. Definición clásica de la probabilidad:
Espacio muestral equiprobable: “todos los sucesos elementales tienes
igual probabilidad de ocurrir”.
 En estas condiciones se define la probabilidad de suceso a como:
𝑁° 𝐶𝑎𝑠𝑜𝑠 𝐹𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎𝑙 𝑆𝑢𝑐𝑒𝑠𝑜 𝐴 𝐶 𝐹
𝑃(𝐴) = =
𝑁° 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠 𝑃𝑜𝑠𝑖𝑏𝑙𝑒𝑠 𝐶 𝑃
1.3.2. Diagramas del árbol:
Es un método para obtener los resultados posibles de un experimento
cuando este se produce en pocas etapas.
Cada paso del experimento se representa como una ramificación de un
árbol.
E.A.P: ING CIVIL
CURSO: ESTADISTICA
1.3.3. Definición axiomática de la probabilidad:

 Álgebra de sucesos, β: “es el conjunto de todos los sucesos del
Espacio Muestral”.
 Axiomas de la probabilidad.
Consideremos una aplicación, P, del algebra de sucesos en el
conjunto de los números reales.
 Esta aplicación es una probabilidad si verifica los tres axiomas

siguientes:
*Axioma 1
𝐴 ∈ 𝛽, 0 ≤ 𝑃(𝐴)
*Axioma 2
𝑃(𝐸) = 1
*Axioma 3
E.A.P: ING CIVIL
CURSO: ESTADISTICA
1.3.4. Propiedades de la Probabilidad:

1. ∀𝐴 ∈ 𝛽, 𝑃(𝐴𝐶 ) = 1 − 𝑃(𝐴)
2. 𝑃( )=0
3. 𝑆𝑖 𝐴 ⊂ 𝐵 ⇒ 𝑃(𝐴) ≤ 𝑃(𝐵)
4. 𝑃(𝐴 − 𝐵) = 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵)
5. 𝑃(𝐴 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 𝐵)
6. 𝑃(𝐴 𝐵 𝐶) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐴 𝐵) − 𝑃(𝐴 𝐶) − 𝑃(𝐵 𝐶) +
𝑃(𝐴 𝐵 𝐶)
EJEMPLOS:
1) En una pareja, cada uno de los miembros posee genes para ojos castaños y
azules. Teniendo en cuenta que cada uno tiene la misma probabilidad de
aportar un gen para ojos castaños y ojos azules y que el gen para ojos
castaños es dominante, obtener la probabilidad de que un hijo nacido de esta
pareja tenga ojos castaños.
SOLUCIÓN:
2) Una mujer es portadora de hemofilia. Aunque la mujer no tenga la enfermedad,

puede transmitirla a sus tres hijos. Obtener las trayectorias para este
experimento mediante un diagrama del árbol.
SOLUCIÓN:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
Suponiendo que es igualmente probable que se transmita o no la enfermedad.

Obtener la probabilidad de los siguientes sucesos:
1. Ningún hijo tenga la enfermedad, (suceso A)
2. Dos hijos tengan la enfermedad, (suceso B)
𝐶𝐹 1 𝐶𝐹 3
𝑃(𝐴) = = 𝑃(𝐵) = =
𝐶𝑃 8 𝐶𝑃 8
3) Tres caballos, A, B y C están siendo tratados con tres métodos experimentales

distintos para aumentar la velocidad con la que puedan correr. Después del
tratamiento intervienen en una carrera. El caballo C tiene doble probabilidad
de ganar que B, y B doble de A.
Calcular las probabilidades de que gane cada uno.
SOLUCIÓN:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
4) Si al lanzar un dado y tengamos:

A: el suceso obtener un número menor que 5.
B: el suceso obtener un número par.
Calcule el P (A-B)
SOLUCIÓN:
5) En una población el 4% de las personas son daltónicas, el 18% hipertensas y

el 0.5% daltónicas e hipertensas. ¿Cuál es la probabilidad de que una persona
sea daltónica o hipertensa?
SOLUCIÓN:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
1.4. PROBABILIDADES CON LA TECNICA DEL CONTEO:

En esta técnica se analiza varios conjuntos y sus arreglos por medio de dos reglas
elementales de conteo: regla de multiplicación y regla de suma. En ocasiones
los arreglos se grafican por medio de diagramas de árbol. También se trabaja
por separado los casos especiales de los arreglos que se forman con una parte o
todos de los elementos de un conjunto cuando el orden en que se coloquen estos
sean importantes –permutaciones- y la elección de los elementos se realice con
o sin reemplazo; se aplicara el estudio de los casos con elementos iguales en un
conjunto y los casos cuando el orden entre los elementos de los arreglos no es
importante –combinaciones-
Termina con la parte numérica del cálculo de probabilidades donde se emplearan
las técnicas de conteo.
1.4.1. REGLA DE MULTIPLICACIÓN:

Dados 𝐴1 , . . . , 𝐴𝑘 , k conjuntos diferentes y 𝑛1 , 𝑛2 , . . . , 𝑛𝑘 las cantidades
respectivas de elementos de dichos conjuntos, entonces la cantidad de
arreglos diferentes que contienen un elemento de cada conjunto,
escribiendo primero los elementos del conjunto uno seguidos de los del
conjunto dos, sucesivamente hasta llegar al conjunto k, se llama regla
generalizada de multiplicación, y está dada por:
𝑛1 ∗ 𝑛2 . . . 𝑛𝑘
1.4.2. DIAGRAMAS DE ÁRBOL:

Es una forma de encontrar todos los arreglos que se pueden formar con
los diferentes elementos de los conjuntos que se tiene. Un arreglo es una
ramificación –desde su punto inicial hasta su punto final-, donde cada
ramificación debe tener un elemento de cada conjunto.
1.4.3. ARREGLOS CON Y SIN REEMPLAZO:

Al aplicar la regla de multiplicación se debe tomar en cuenta que no sólo
se emplea con diferentes conjuntos sino que puede estar aplicada a un
E.A.P: ING CIVIL
CURSO: ESTADISTICA
mismo conjunto en los casos que se pida realizar arreglos con todos o
alguna parte de sus elementos. Dichos arreglos, sin embargo, pueden ser
de dos tipos: cuando se permite el reemplazo (o repetición) y cuando no
se permite
1.4.3.1. ARREGLOS CON REEMPLAZO:

Dado el conjunto 𝐴 = {𝑎1 , 𝑎2 , . . . , 𝑎𝑛 } con n elementos diferentes, la
cantidad de arreglos que contengan k elementos tomados con
reemplazo del conjunto A está dada por:
𝑛𝑘
1.4.3.2. ARREGLOS SIN REEMPLAZO:
 Dado el conjunto 𝐴 = {𝑎1 , 𝑎2 , . . . , 𝑎𝑛 } con n elementos diferentes,
la cantidad de arreglos ordenados que contengan k elementos
tomados sin reemplazo del conjunto A está dado por la resultante
de:
𝑛 ∗ (𝑛 – 1) ∗ (𝑛 – 2) ∗ … ∗ (𝑛 – (𝑘 – 1))
 El factor de un numero n ϵ N se define como el producto sucesivo
𝑛(𝑛 − 1)(𝑛 − 2) … 1 y se simboliza por n!.
 Se llama permutación de k elementos escogidos de un total n
(todos diferentes) a
𝑛!
𝑃𝑘𝑛 = ,0 ≤ 𝑘 ≤ 𝑛
(𝑛 − 𝑘)!
que representa la cantidad total de arreglos ordenados de tamaño
k que se pueden formar con n elementos diferentes cuando no se
permite la repetición.
1.4.3.3. PERMUTACIONES CON ELEMENTOS IGUALES:

Para los casos en que se quieren formar arreglos con todos los
elementos de un conjunto, entre los cuales existen algunos que son
iguales, se tiene que, de forma general, cuando existen 𝑛1 elementos
iguales, 𝑛2 elementos iguales,... y 𝑛𝑚 elementos iguales, tales que
𝑛1 + 𝑛2 + . . . + 𝑛𝑚 = 𝑛, resulta la cantidad total de ordenamientos
diferentes considerando todos los n elementos por ordenamiento.
𝑛!
𝑃𝑛𝑛1𝑛2…𝑛𝑚! = ; 𝑐𝑜𝑛 𝑛1 + 𝑛2 + … + 𝑛𝑚 = 𝑛
𝑛1 ! 𝑛2 ! … 𝑛𝑚 !
1.4.3.4. COMBINACIONES:
Dado un conjunto con n elementos diferentes, se llama combinación
a cualquier subconjunto no ordenado de tamaño k. El número de
combinaciones de tamaño k que se pueden formar con los n
elementos se denota por:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
𝐶𝐾𝑁 , 0 ≤ 𝑘 ≤ 𝑛
EJEMPLOS:
1) Se tiene todas las letras del alfabeto (27 en total). ¿Cuántas palabras se
pueden formar de manera que tenga 4 vocales y 3 consonantes?
SOLUCION:
27 𝑙𝑒𝑡𝑟𝑎𝑠 = 5 𝑣𝑜𝑐𝑎𝑙𝑒𝑠 + 22𝑐𝑜𝑛𝑠𝑜𝑛𝑎𝑛𝑡𝑒𝑠
Luego:
𝐶45 ∗ 𝐶322 ∗ 𝑃7 = 𝐶45 ∗ 𝐶322 ∗ 7! = 38,808.000
2) Con 7 consonantes y 4 vocales, ¿Cuántas palabras pueden formarse

contenido cada una 3 consonantes y 2 vocales?
SOLUCION:
Elegimos 3 consonantes de las 7 que hay: 𝐶37
4
Elegimos 2 vocales de las 4 que hay: 𝐶2
𝐶37 ∗ 𝐶24 ∗ 5! = 25,200
3) Se tienen ocho libros de física, cuatro de química y siete de matemáticas,

todos ellos diferentes, ¿cuántos arreglos de tres libros, que contengan un libro
de cada tema, se pueden formar con todos los libros si primero van los de
física, seguidos por química y matemáticas?
SOLUCIÓN:
Con los datos anteriores y el uso de la regla de multiplicación, que indica el
total de arreglos de libros diferentes de cada tema, se obtiene:
8 ∗ 4 ∗ 7 = 224
4) Retomando los datos del ejemplo 1, numeral 2, es posible resolver el problema

mediante un diagrama de árbol.
Primero se representa en un punto a la ciudad A, después se trazan, a partir
de este punto, tres líneas rectas para los tres caminos de la ciudad A a la B;
de igual forma, de cada punto que representa a la ciudad B, se trazan cuatro
líneas para los cuatro caminos de la ciudad B a la C; finalmente, de cada punto
que representa la ciudad C, se trazan dos líneas para los dos caminos de la
ciudad C a la D.
E.A.P: ING CIVIL
CURSO: ESTADISTICA
Muestra todos los caminos posibles para viajar de la ciudad A a la D, pasando

por las ciudades B y C, los cuales se pueden obtener al unir rectas desde el
punto A al D sin regresar por ningún camino.
Como se observa, los diagramas de árbol son bastante sencillos y muestran
todos los arreglos posibles. Sin embargo, en los casos en que la cantidad de
elementos es grande, se tiene también una cantidad grande de ramificaciones,
y trazarlo ya no sería factible. No obstante, como se verá en la siguiente
unidad, los diagramas de árbol tienen gran aplicación al resolver problemas
de probabilidad condicional.
E.A.P: ING CIVIL
CURSO: ESTADISTICA
5) Se tienen cuatro computadoras X, tres computadoras Y y tres computadoras

W; ¿de cuántas maneras diferentes se pueden ordenar en línea recta?
SOLUCIÓN:
Se tienen en total diez computadoras, de las cuales existen cuatro, tres y tres
de cada tipo, por la fórmula 1, se tiene
10!
= 4200 (𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑎𝑟𝑟𝑒𝑔𝑙𝑜𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠)
4! 3! 3!
1.5. PROBABILIDAD CONDICIONAL:

Las probabilidades condicionadas se calculan una vez que se ha incorporado
información adicional a la situación de partida.
Las probabilidades condicionadas se calculan aplicando la siguiente fórmula:
Donde:
P (B/A) es la probabilidad de que se de el suceso B condicionada

a que se haya dado el suceso A.
P (B A) es la probabilidad del suceso simultáneo de A y de B
P (A) es la probabilidad a priori del suceso A
1.6. PROBABILIDAD TOTAL Y TEOREMA DE BAYES:

1.6.1. PROBABILIDAD TOTAL:
Nos permite calcular la probabilidad de un suceso a partir de probabilidades
condicionadas.
La fórmula para calcular esta probabilidad es:
Es decir, la probabilidad de que ocurra el suceso B (en nuestro

ejemplo, que ocurra un accidente) es igual a la suma de multiplicar
cada una de las probabilidades condicionadas de este suceso con
E.A.P: ING CIVIL
CURSO: ESTADISTICA
los diferentes sucesos A (probabilidad de un accidente cuando llueve y

cuando hace buen tiempo) por la probabilidad de cada suceso A.
Para que este teorema se pueda aplicar hace falta cumplir un

requisito:
Los sucesos A tienen que formar un sistema completo,

es decir, que contemplen todas las posibilidades (la suma
de sus probabilidades debe ser el 100%).
1.6.2. TEOREMA DE BAYES:

El Teorema de Bayes viene a seguir el proceso inverso al que hemos visto
en la probabilidad total:
Probabilidad total: a partir de las probabilidades del suceso A

(probabilidad de que llueva o de que haga buen tiempo)
deducimos la probabilidad del suceso B (que ocurra un accidente).
Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha

ocurrido un accidente) deducimos las probabilidades del suceso
A (¿estaba lloviendo o hacía buen tiempo?).
La fórmula del Teorema de Bayes es:
Tratar de explicar estar fórmula con palabras es un galimatías, así que

vamos a intentar explicarla con un ejemplo. De todos modos, antes de
entrar en el ejercicio, recordar que este teorema también exige que el
suceso A forme un sistema completo.
EJEMPLOS:
1) En un estudio sanitario se ha llegado a la conclusión de que la

probabilidad de que una persona sufra problemas coronarios (suceso B)
es el 0,10 (probabilidad a priori).
E.A.P: ING CIVIL
CURSO: ESTADISTICA
Además, la probabilidad de que una persona sufra problemas de

obesidad (suceso A) es el 0,25 y la probabilidad de que una persona
sufra a la vez problemas de obesidad y coronarios (suceso intersección
de A y B) es del 0,05.
Calcular la probabilidad de que una persona sufra problemas coronarios

si está obesa (probabilidad condicionada P(B/A)).
P (B A) = 0,05
P (A) = 0,25
P (B/A) = 0,05 / 0,25 = 0,20
Por lo tanto, la probabilidad condicionada es superior a la probabilidad a

priori. No siempre esto es así, a veces la probabilidad condicionada es
igual a la probabilidad a priori o menor.
2) En un saquito hay papeletas de tres colores, con las siguientes

probabilidades de ser elegidas:
a) Amarilla: probabilidad del 50%.
b) Verde: probabilidad del 30%
c) Roja: probabilidad del 20%.
Según el color de la papeleta elegida, podrás participar en diferentes

sorteos. Así, si la papeleta elegida es:
a) Amarilla: participas en un sorteo con una probabilidad de

ganar del 40%.
b) Verde: participas en otro sorteo con una probabilidad de

ganar del 60%
c) Roja: participas en un tercer sorteo con una probabilidad

de ganar del 80%.
E.A.P: ING CIVIL
CURSO: ESTADISTICA
Con esta información, ¿qué probabilidad tienes de ganar el sorteo en

el que participes?:
1.- Las tres papeletas forman un sistema completo: sus

probabilidades suman 100%
2.- Aplicamos la fórmula:
Luego,
P (B) = (0,50 * 0,40) + (0,30 * 0,60) + (0,20 * 0,80) = 0,54
Por tanto, la probabilidad de que ganes el sorteo es del 54%.
3) Van a cambiar a tu jefe y se barajan diversos candidatos:
a) Carlos, con una probabilidad del 60%
b) Juan, con una probabilidad del 30%
c) Luis, con una probabilidad del 10%
En función de quien sea tu próximo jefe, la probabilidad de que te suban

el sueldo es la siguiente:
a) Si sale Carlos: la probabilidad de que te suban el sueldo

es del 5%.
b) Si sale Juan: la probabilidad de que te suban el sueldo

es del 20%.
c) Si sale Luis: la probabilidad de que te suban el sueldo

es del 60%.
En definitiva, ¿cual es la probabilidad de que te suban el sueldo?:
1.- Los tres candidatos forman un sistema completo

E.A.P: ING CIVIL
CURSO: ESTADISTICA
2.- Aplicamos la fórmula:
P (B) = (0,60 * 0,05) + (0,30 * 0,20) + (0,10 * 0,60) = 0,15
Por tanto, la probabilidad de que te suban el sueldo es del 15%.

Lo llevas claro amigo.
4) De una urna que contiene 9 bolas rojas y 5 negras, se extraen

sucesivamente 2 bolas. Calcular la probabilidad de los siguientes
sucesos:
a) Que las dos sean negras

b) Que las dos sean rojas
c) Que la segunda sea roja sabiendo que la primera fue negra.
Solución:
a) Sea N1 : Sacar la 1ª negra

N 2 : Sacar la 2ª negra
5 4
P  N1  N 2   P  N1   P  N 2 / N1   
14 13
b) Sea R1 : Sacar la 1ª roja

R2 : Sacar la 2ª roja
9 8
P  R1  R2   P ( R1 )  P  R2 / R1   
14 13
a. Sea N1 : Sacar la 1ª negra

R2 : Sacar la 2ª roja
E.A.P: ING CIVIL
CURSO: ESTADISTICA
9
P ( R2 / R1 ) 
13
5) Se tiene dos urnas, la primera tiene 3 bolas blancas y 2 negras, la segunda

tiene 2 bolas blancas y 3 negras. Se elige al azar una urna y de ella se extrae
una bola. Calcular la probabilidad de que sea blanca.
Sea A1 :”elegir la urna nº1”
A2 :”elegir la urna nº2”
B :”extraer bola blanca”
1 3 1 2 1
P ( P( B)  P( A1 )  P( B / A1 )  P( A2 )  P( B / A2 )     
2 5 2 5 2
Supongamos ahora que realizada la extracción, la bola resulta ser blanca y
queremos saber qué probabilidad hay de que la bola proceda de la urna nº1.
1 3

P( A1 ) P( B / A1 ) 2 5 3
P( Ai / B)   
P( A1 ) P( B / A1 )  P( A2 ) P( B / A2 ) 1  3  1  2 5
2 5 2 5
1.7. INTRODUCCION A LAS DISTRIBUCIONES DE PROBABILIDADES:

La probabilidad se refiere al estudio de la aleatoriedad y la incertidumbre en
cuaqlquier situación donde podría ocurrir uno de varios resultados posibles.
En algunos casos se utiliza de manera informal como por ejemplo: hay un
50% de probabilidad de que llueva.
1.7.1. VARIABLES ALEATORIAS:

Una variable aleatoria es una variable que toma valores numéricos
determinados por el resultado de un experimento aleatorio. No hay que
confundir la variable aleatoria con sus posibles valores. Ejemplos:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
- nº de caras al lanzar 6 veces una moneda (valores: 0, 1, 2…)

- nº de llamadas que recibe un teléfono en una hora
- tiempo que esperan los clientes para pagar en un supermercado…
Las variables aleatorias pueden ser discretas o continuas:

- Discretas: el conjunto de posibles valores es numerable. Suelen estar
asociadas a experimentos en que se mide el número de veces que sucede
algo.
- Continuas: el conjunto de posibles valores es no numerable. Puede tomar
todos los valores de un intervalo. Son el resultado de medir.
1.7.2. DISTRIBUCION DE PROBABILIDADES:
El resultado ofrecido en el teorema anterior nos proporciona la base
del desarrollo de procedimientos para hacer inferencias con respecto
a la media  de una población normal con una varianza 2 . En este
 
caso el teorema nos dice que n Y    /  tiene una distribución
 
normal estándar. Cuando se desconoce  se le puede estimar
mediante S  S 2 y la expresión
  
Y   
n
 S 
 
nos dará como base para el desarrollo de métodos de inferencias con

respecto a .
Sea Z una variable aleatoria normal estándar y sea  una variable

2
aleatoria ji - cuadrada con  grados de libertad.

Entonces si Z y  2 son independientes,
Z
T
 2 /
se dice que tiene una distribución t con  grados de libertad.

Si Y1, Y2, ..., Yn es una muestra aleatoria de una población normal con
media  y varianza 2, se puede aplicar el teorema para demostrar que
E.A.P: ING CIVIL
CURSO: ESTADISTICA
  
Z  n   Y    /  tiene una distribución normal estándar. El teorema
 
7.3 nos dice que  2  n  1S 2 /  2 tiene una distribución  2 con
v  n  1 grados de libertad y que Z y  son independientes (ya que
2

Yy  2 los son). Por lo tanto, por la definición
 
n Y    /   
Z   Y  
T   n
2 /v n  1S 2 /  2 n  1  S 
 
tiene una distribución t con (n-1) grados de libertad.
1.7.3. MEDIDAS: ESPERANZA MATEMÁTICA Y DESVIACION ESTANDAR:

Esperanza matemática y desviación típica de una variable
aleatoria discreta. Ejemplos y ejercicios resueltos variables
aleatorias discretas.
FORMULAS:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
EJEMPLOS:
1) Se lanzan tres monedas y se cuenta el número de caras obtenidas.
Haz una tabla con las probabilidades.Calcula la esperanza matemática
y la desviación típica. Representa gráficamente las probabilidades
obtenidas.
Construimos la tabla
Llamamos xi al suceso obtener cara

Tenemos tres monedas, el número de caras xi que podemos obtener
será: 0, 1, 2 y 3.
Calculamos la probabilidad pi de cada suceso
Escribimos el espacio muestral para facilitar el recuento, los casos
posibles son 2 3 = 8
E = { CCC, CCX, CXC, XCC, XCX, XXC, CXX, XXX }
- La probabilidad de no obtener ninguna cara será obtener tres cruces
{XXX} = 1/8
- La probabilidad de obtener una cara será {XCX, XXC, CXX } =
3/8
- La probabilidad de obtener dos caras será {CCX, CXC, XCC } = 3/8
- La probabilidad de obtener tres caras será {CCC} = 1/8
Escribimos los valores de xi y pi obtenidos en la tabla.
Añadimos la columnas xi·pi y pi·xi 2 para calcular la esperanza
matemática y la desviación típica.
E.A.P: ING CIVIL
CURSO: ESTADISTICA
2) Calcular la esperanza matemática, la varianza, y la desviación típica,

de la distribución de probabilidad de las puntuaciones obtenidas al
lanzar un dado.
E.A.P: ING CIVIL
CURSO: ESTADISTICA
3) En la sala de pediatría de un hospital, el 60% de los pacientes son niñas. De

los niños el 35% son menores de 24 meses. El 20% de las niñas tienen menos
de 24 meses. Un pediatra que ingresa a la sala selecciona un infante al azar.
a. Determine el valor de la probabilidad de que sea menor de 24 meses.
b. Si el infante resulta ser menor de 24 meses. Determine la probabilidad que sea

una niña.
SOLUCIÓN:
Se definen los sucesos:
Suceso H: seleccionar una niña.

E.A.P: ING CIVIL
CURSO: ESTADISTICA
Suceso V: seleccionar un niño.

Suceso M: infante menor de 24 meses.
En los ejercicios de probabilidad total y teorema de bayes, es importante identificar
los sucesos que forman la población y cuál es la característica que tienen en común
dichos sucesos. Estos serán los sucesos condicionados.
a. En este caso, la población es de los infantes. Y la característica en común es que

sean menores de 24 meses. Por lo tanto, la probabilidad de seleccionar un infante
menor de 24 meses es un ejemplo de probabilidad total. Su probabilidad será:
b. Para identificar cuando en un ejercicio se hace referencia al teorema de bayes,

hay que partir de reconocer esta es una probabilidad condicionada y que la
característica común de los sucesos condicionantes ya ha ocurrido. Entonces, la
probabilidad de que sea niña una infante menor de 24 meses será:
4) Un médico cirujano se especializa en cirugías estéticas. Entre sus pacientes,

el 20% se realizan correcciones faciales, un 35% implantes mamarios y el
restante en otras cirugías correctivas. Se sabe además, que son de genero
masculino el 25% de los que se realizan correcciones faciales, 15% implantes
mamarios y 40% otras cirugías correctivas. Si se selecciona un paciente al
azar, determine:
a. Determine la probabilidad de que sea de género masculino
b. Si resulta que es de género masculino, determine la probabilidad que se haya

realizado una cirugía de implantes mamarios.
SOLUCIÓN:
Suceso F: pacientes que se realizan cirugías faciales

Suceso M: pacientes que se realizan implantes mamarios
Suceso O: pacientes que se realizan otras cirugías correctivas
Suceso H: pacientes de género masculino
E.A.P: ING CIVIL
CURSO: ESTADISTICA
a. La probabilidad de que sea de género masculino se refiere a un problema de

probabilidad total, ya que es el suceso condicionado y las cirugías los condicionantes.
Dicho valor será:
b. Como el suceso condicionado ha ocurrido entonces se aplica el teorema de bayes,

luego, el valor de la probabilidad será:
5) Un Doctor dispone de tres equipos electrónicos para realizar ecosonogramas.

El uso que le da a cada equipo es de 25% al primero, 35% el segundo en y
40% el tercero. Se sabe que los aparatos tienen probabilidades de error de
1%, 2% y 3% respectivamente. Un paciente busca el resultado de una
ecografía y observa que tiene un error. Determine la probabilidad de que se
ha usado el primer aparato.
SOLUCIÓN:
Suceso P: seleccionar el primer aparato

Suceso S: seleccionar el segundo aparato
Suceso T: seleccionar el tercer aparato
Suceso E: seleccionar un resultado con error
Se puede observar que la pregunta es sobre determinar la probabilidad de que un
examen errado sea del primer aparato, es decir, ya ha ocurrido el error. Por lo tanto,
debemos recurrir al teorema de bayes. Claro está, que es necesario de igual forma
obtener la probabilidad de que los aparatos produzcan un resultado erróneo, por lo
tanto:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
1.8. DISTRIBUCIUONES DE PROBABILIDADES PARA VARIABLES

ALEATORIAS DISCRETAS:
Una variable aleatoria (a partir de ahora va.) es un número real asociado al
resultado de un experimento aleatorio. Se trata, por tanto, de una función real
con dominio en el espacio muestral, X: Ω→ R.
1.8.1. BINOMIAL:
Sea X una v.a. discreta que toma los valores x = 0; 1;…; n, donde n es un número
natural conocido. Se dice que X sigue una distribución binomial de parámetros n
y p (y se nota X → B (n; p)) si su función masa es:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
Sea X → B (n; p). Entonces:
Caracterización de la distribución binomial. Supongamos que un determinado

experimento aleatorio se repite n veces de forma independiente y que en ese
experimento hay un suceso que denominamos éxito, que ocurre con probabilidad
constante p. En ese caso, la variable aleatoria X que mide el número de éxitos sigue
una B (n; p).
1.8.2. POISSON:
Sea X una va. Discreta, que puede tomar los valores x = 0; 1; 2; … Se dice que X
sigue una distribución de Poisson de parámetro λ (y se nota X ! P (λ)) si su función
masa es:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
Sea X ! P (λ). Entonces:
Caracterización de la distribución de Poisson. Consideremos el número de éxitos en

un periodo de tiempo donde los éxitos acontecen a razón de λ veces por unidad de
tiempo (en promedio) y de forma independiente. En ese caso:
X : número de ocurrencias del suceso por unidad de tiempo:
Es una variable de Poisson de parámetro λ; y se nota X ! P (λ).P
1.8.3. HIPERGEOMETRICA:
Este modelo presenta similitudes con el Binomial, pero sin la suposición de
independencia de éste último. Veámoslo:
 Partimos de un conjunto formado por N individuos divididos en dos categorías
mutuamente excluyentes: A y Ac; de manera que N1 individuos pertenecen a
la categoría A y N2 individuos, a la categoría Ac. Por tanto, se cumple que:
N = N1 + N2
 Si del conjunto anterior extraemos n individuos sin

reemplazamiento (n ≤ N), la variable X que representa el número k de
individuos que pertenecen a la categoría A (de los n extraídos) tiene por
función de densidad:
La dependencia se debe al hecho de que N es finito y las extracciones se efectúan

sin reemplazamiento. El caso de extracciones con reemplazamiento sería
equivalente al de N infinito y se resolvería mediante el modelo Binomial.
E.A.P: ING CIVIL
CURSO: ESTADISTICA
El programa siguiente nos muestra la forma de la función de densidad de esta

variable y el valor de la función de densidad y de la función de distribución en el
punto que elijamos:
 Propiedades:
1) Esperanza: E(X) = n N1 / N 2.
2) Varianza: V(X) = (n N1 N2 (N-n)) / (N2 (N-1) )
 Propiedades del modelo Hipergeométrico

1) Esperanza: E(X) = n ´ N1/N
2) Varianza: V(X) = (n ´ N1 ´ N2 (N − n))/(N2 ´ (N − 1))
EJEMPLOS:
1. En una urna o recipiente hay un total de N objetos, entre los cuales hay una
cantidad a de objetos que son defectuosos, si se seleccionan de esta
urna n objetos al azar, y sin reemplazo, ¿cuál es la probabilidad de
obtener x objetos defectuosos?
Solución:
Luego;
donde:
p(x,n) = probabilidad de obtener x objetos defectuosos de entre n seleccionados
muestras de n objetos en donde hay x que son defectuosos y n-

x buenos
todas las muestras posibles de seleccionar de n objetos tomadas de

entre N objetos en total = espacio muestral
Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son

defectuosos, si de seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2
sean defectuosos?
E.A.P: ING CIVIL
CURSO: ESTADISTICA
SOLUCIÓN:
N = 10 objetos en total
a = 3 objetos defectuosos
n = 4 objetos seleccionados en muestra
x = 2 objetos defectuosos deseados en la muestra
donde:
probabilidad asociada a cada muestra de 4 objetos que se

seleccionaron, con lo que se demuestra que las probabilidades no son constantes
formas o maneras de obtener 2 objetos defectuosos entre los 4

seleccionados = muestras de 4 objetos entre los que 2 son defectuosos
Como se observa en el desarrollo de la solución del problema, la pretensión es

demostrar que las probabilidades asociadas a cada uno de los resultados no son
constantes.
Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados

al azar sería:
E.A.P: ING CIVIL
CURSO: ESTADISTICA
2. Para evitar que lo descubran en la aduana, un viajero ha colocado 6

tabletas de narcótico en una botella que contiene 9 píldoras de vitamina que
son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas
aleatoriamente para analizarlas, a) ¿Cuál es la probabilidad de que el viajero
sea arrestado por posesión de narcóticos?, b) ¿Cuál es la probabilidad de que
no sea arrestado por posesión de narcóticos?.
SOLUCIÓN:
a) N = 9+6 =15 total de tabletas
a = 6 tabletas de narcótico
n = 3 tabletas seleccionadas
x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas
de narcótico que se puede encontrar al seleccionar las 3 tabletas
p(viajero sea arrestado por posesión de narcóticos) = p(de que entre las 3 tabletas
seleccionadas haya 1 o más tabletas de narcótico)
otra forma de resolver;
p(el viajero sea arrestado por posesión de narcóticos) = 1 – p(de que entre las
tabletas seleccionadas no haya una sola de narcótico)
E.A.P: ING CIVIL
CURSO: ESTADISTICA
b) p(no sea arrestado por posesión de narcóticos)
3. De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote

contiene 3 proyectiles defectuosos que no explotarán, ¿cuál es la probabilidad
de que , a) los 4 exploten?, b) al menos 2 no exploten?
SOLUCIÓN:
a) N = 10 proyectiles en total
a = 7 proyectiles que explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el número
de proyectiles que explotan entre la muestra que se dispara
b) N = 10 proyectiles en total
a = 3 proyectiles que no explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2 o 3 proyectiles que no explotan
p(al menos 2 no exploten) = p( 2 o más proyectiles no exploten) = p(x = 2 o 3; n=4) =

E.A.P: ING CIVIL
CURSO: ESTADISTICA
4. a)¿Cuál es la probabilidad de que una mesera se rehúse a servir bebidas

alcohólicas únicamente a dos menores de edad si verifica aleatoriamente solo
5 identificaciones de entre 9 estudiantes, de los cuales 4 no tienen la edad
suficiente?.
b) ¿Cúal es la probabilidad de que como máximo 2 de las identificaciones
pertenezcan a menores de edad?
SOLUCIÓN:
a) N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el número de identificaciones que pertenecen a personas
menores de edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad
b) N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el número de identificaciones que pertenecen a
personas menores de edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad
E.A.P: ING CIVIL
CURSO: ESTADISTICA
5. En la inspección de hojalata producida por un proceso electrolítico continuo,

se identifican 0.2 imperfecciones en promedio por minuto. Determine las
probabilidades de identificar a) una imperfección en 3 minutos, b) al menos
dos imperfecciones en 5 minutos, c) cuando más una imperfección en 15
minutos.
SOLUCIÓN:
a) x = variable que nos define el número de imperfecciones en la hojalata por cada
3 minutos = 0, 1, 2, 3, ...., etc., etc.
l = 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata
b) x = variable que nos define el número de imperfecciones en la hojalata por cada

5 minutos = 0, 1, 2, 3, ...., etc., etc.
l = 0.2 x 5 =1 imperfección en promedio por cada 5 minutos en la hojalata
=1-(0.367918+0.367918) = 0.26416
E.A.P: ING CIVIL
CURSO: ESTADISTICA
c) x = variable que nos define el número de imperfecciones en la hojalata por cada

15 minutos = 0, 1, 2, 3, ....., etc., etc.
l = 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata
= 0.0498026 + 0.149408 = 0.1992106

Universidad Peruana Los Andes: Curso: Estadistica

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Universidad Peruana Los Andes: Curso: Estadistica

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD PERUANA LOS ANDES

E.A.P: ING CIVIL

“AÑO DEL BUEN SERVICIO AL CIUDADANO’’

UNIVERSIDAD PERUANA LOS ANDES

La Estadística para su mejor estudio se ha dividido en dos grandes ramas:

que sirven para deducir o inferir algo acerca de un conjunto de datos

3. Estadística Inductiva: Está fundamentada en los resultados obtenidos del

4. Método Estadístico: El conjunto de los métodos que se utilizan para medir

Datos cuantitativos: cuando los valores de los datos representan diferentes

Datos cronológicos: cuando los valores de los datos varían en diferentes

 FUENTES Y TÉCNICAS DE ACOPIO DE DATOS

Los datos estadísticos necesarios para la comprensión de los hechos pueden

 Fuentes de datos primarias: es la persona o institución que ha recolectado

 Fuentes secundarias: son las publicaciones y trabajos hechos por personas o

alto que la calidad de las conclusiones estadísticas depende en grado sumo de la

TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS

 CONSTRUCCIÓN DE TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS,

A partir de una variable numérica es posible construir una distribución

¿Cómo construimos una tabla de

Frecuencia acumulada relativa porcentual ⇒ fari = (fai / n) ⋅100 =

La Tabla muestra la tabla de frecuencias para los datos de tasas de

Interva Frecuen Frecuencia Frecuenci Frecuencia

Indicamos en el eje horizontal los límites de los intervalos de clase.

El gráfico se construye sin dejar espacio horizontal entre categorías, a menos

¿QUÉ CARACTERÍSTICAS OBSERVAMOS EN LOS GRÁFICOS

- La distribución es asimétrica, con mayor concentración de datos en

- Se observan cuatro provincias con tasas de notificación de casos de

- En el histograma de la izquierda observamos un único pico (o moda) pero

representación. Como hemos observado en el ejemplo, la forma del

Existen distintas fórmulas que permiten calcular el número máximo de

Los datos de la Tabla presentan los casos de rubéola notificados al SI.NA.VE

Cuando (erróneamente) se construye un histograma considerando como

Tabla. Notificaciones de casos de rubéola. Argentina, año 2000.

Intervalo Frecuencia Frecuencia

[ 5, 10) 1100 23.3%

[10, 15) 1389 29.4%

¿CÓMO CONSTRUIMOS EL HISTOGRAMA TENIENDO EN CUENTA QUE

La altura de la barra definida de este modo se denomina escala densidad porque

Tabla. Escala densidad. Notificaciones de casos de rubéola. Argentina, año

Categor Frecuen Frecuen Escal

. Tabulación de los datos

b) Tabla de doble entrada o de contingencia

 Media para datos agrupados

Características y propiedades de la media.

b) Representa el centro de gravedad o el punto de equilibrio de los datos.

Para hallar la mediana se sigue los siguientes pasos:

n = número total de datos

c = ancho del intervalo de clase de la Mediana

fi :Frecuencia absoluta del intervalo modal.

fi-1 : Frecuencia absoluta del intervalo anterior al modal.

fi+1 : Frecuencia absoluta del intervalo posterior al modal.

ti :Amplitud de los intervalos.

Como los cuartiles adquieren su mayor importancia cuando contamos un número

 Fórmula de Q1, para series de Datos agrupados:

El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2 = Md), es el

 Fórmula de Q2, para series de Datos agrupados:

 Fórmula de Q3, para series de Datos agrupados:

Para el tercer cuartil

 El quinto decil corresponde a la mediana.

 El noveno decil supera al 90% y es superado por el 10% restante.

Donde (para todos):

 Fórmulas Datos No Agrupados

Siendo A el número del decil.