Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TEMAS DE ESTADISTICA
ASIGNATURA: ESTADISTICA
DOCENTE: ING. WASHINGTON CORDOVA BONIFACIO
INTEGRANTES:
ORTIZ QUILCA Stevin
HUAMAN HUAYHUA Claudio
AULA: A1
TURNO: MAÑANA
CICLO: 3°
HUANCAYO - 2017
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
SEMANA I
INTRODUCCIÓN A LA ESTADISTICA
ESTADÍSTICA Y SU DIVISIÓN
2. Estadística Inferencial:
Se deriva de muestras, de observaciones hechas sólo acerca de una parte
de un conjunto numeroso de elementos y esto implica que su análisis
requiere de generalizaciones que van más allá de los datos. Como
consecuencia, la característica más importante del reciente crecimiento de la
estadística ha sido un cambio en el énfasis de los métodos que describen a
métodos que sirven para hacer generalizaciones. La Estadística Inferencial
investiga o analiza una población partiendo de una muestra tomada. Según
Berenson y Levine; Estadística Inferencial son procedimientos estadísticos
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
1. Población:
El concepto de población en estadística va más allá de lo que comúnmente
se conoce como tal. Una población se precisa como un conjunto finito o
infinito de personas u objetos que presentan características comunes.
"Una población es un conjunto de todos los elementos que estamos
estudiando, acerca de los cuales intentamos sacar conclusiones". Levin &
Rubin (1996).
"Una población es un conjunto de elementos que presentan una característica
común". Cadenas (1974).
2. Muestra:
"Se llama muestra a una parte de la población a estudiar que sirve para
representarla". Murria R. Spiegel (1991).
"Una muestra es una colección de algunos elementos de la población, pero
no de todos". Levin & Rubin (1996).
"Una muestra debe ser definida en base de la población determinada, y las
conclusiones que se obtengan de dicha muestra solo podrán referirse a la
población en referencia", Cadenas (1974).
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
3. Muestreo:
Esto no es más que el procedimiento empleado para obtener una o más
muestras de una población; el muestreo es una técnica que sirve para
obtener una o más muestras de población.
TIPOS DE VARIABLES
Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos
es de clase y no de cantidad.
Datos geográficos: cuando los datos están referidos a una localidad geográfica
se dicen que son datos geográficos.
SEMANA II
[ 0, 1) 497 10.5%
[ 1, 2)
[ 2, 5) 387 8.2%
La barra debe tener una altura tal que el área (base x altura) sea igual a la
frecuencia (o a la frecuencia relativa). Es decir,
Altura de la barra = frecuencia en el
intervalo. Longitud del
intervalo
SEMANA III
TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS
Construcción de tablas bidimensionales.
Variable X Variable Y
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
X1 Y1
X2 Y2
. .
. .
. .
Xn Yn
SEMANA IV
MEDIDAS DE TENDENCIA CENTRAL
Media aritmética
Es el valor promedio de un conjunto de datos. Es uno de los estadígrafos
más importantes de la estadística que localiza el punto de equilibrio o
centro de gravedad de la distribución.
n1 X1 n 2 X 2
X
n1 n2
Mediana
Es un valor que divide a un conjunto de datos ordenados (creciente o
decreciente) en dos grupos con igual número de observaciones. La mitad
de las observaciones están por encima de la mediana y la otra mitad por
debajo de ella.
La mediana- datos no agrupados
En donde:
Moda
Es el valor que se presenta con mayor frecuencia en un conjunto de datos. Es útil
cuando interesa conocer el valor más frecuente de la variable; por ejemplo cuando
se desea conocer los puntos críticos para estudiar el número de pasajeros por hora
que usan el transporte que circulan por un determinado avenida, el estudio
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
correspondiente demostrara que existen dos modas, una por la mañana alrededor
de las 8 y la otra por la tarde alrededor de las 19 horas.
Un grupo de datos puede tener una moda, dos modas, etc. En tales casos la
distribución se llama, respectivamente, unimodal, bimodal, etc.
Datos no agrupados
Se recoge el valor que más repite.
Datos agrupados
Li: Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia
absoluta).
Semana V
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
MEDIDAS DE POSICION
CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del
cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el
tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas
partes (75%) de los datos.
Datos Agrupados
Donde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
Donde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los
datos, es decir aquel valor de la variable que supera al 75% y es superado por el
25% de las observaciones.
Donde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Otra manera de verlo es partir de que todas las medidas no son sino casos
particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer
cuartil 75% percentil.
Para Datos No Agrupados
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:
- El primer cuartil:
Cuando n es par:
Cuando n es impar:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
Cuando n es par:
Cuando n es impar:
DECILES
Los deciles son ciertos números que dividen la sucesión de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto
de datos ordenados en diez partes iguales, son también un caso particular de los
percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil,
segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento académico.
Datos Agrupados
Para datos agrupados los deciles se calculan mediante la fórmula.
k= 1, 2,3,... 9
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra fórmula para calcular los deciles:
El cuarto decil, es aquel valor de la variable que supera al 40%, de las
observaciones y es superado por el 60% de las observaciones.
Cuando n es par:
Cuando n es impar:
PERCENTIL
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de
ubicación o clasificación de las personas cuando atienden características tales
como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en
cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99),
leídos primer percentil,..., percentil 99.
Datos Agrupados
Cuando los datos están agrupados en una tabla de frecuencias, se calculan
mediante la fórmula:
k= 1, 2,3,... 99
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante.
Cuando n es impar:
Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con
el percentil 50 y el tercer cuartil con el percentil 75.
SEMANA VI
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
MEDIDAS DE DISPERSIÓN
RANGO
DESVIACIÓN MEDIA
La desviación media o desviación promedio es la media aritmética de los
valores absolutos de las desviaciones respecto a la media aritmética.
PROPIEDADES
Guarda las mismas dimensiones que las observaciones. La suma
de valores absolutos es relativamente sencilla de calcular, pero esta simplicidad
tiene un inconveniente: Desde el punto de vista geométrico, la distancia que induce
la desviación media en el espacio de observaciones no es la natural (no permite
definir ángulos entre dos conjuntos de observaciones). Esto hace que sea muy
engorroso trabajar con ella a la hora de hacer inferencia a la población.
Cuando mayor sea el valor de la desviación media, mayor es la dispersión de los
datos. Sin embargo, no proporciona una relación matemática precisa entre su
magnitud y la posición de un dato dentro de una distribución.
La desviación media al tomar los valores absolutos mide una observación sin
mostrar si la misma está por encima o por debajo de la media aritmética.
MÉTODOS DE CÁLCULO
Para Datos No Agrupados
Se emplea la ecuación:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
Propiedades
- La varianza y desviación estándar (o cualquier otra medida de dispersión)
indican el grado en que están dispersos los datos en una distribución. A
mayor medida, mayor dispersión.
- La varianza es un número muy grande con respecto a las observaciones,
por lo que con frecuencia se vuelve difícil para trabajar.
- Debido a que las desviaciones son elevadas al cuadrado y la varianza
siempre se expresa en términos de los datos originales elevados al
cuadrado, se obtiene unidades de medida de los datos que no tiene sentido
o interpretación lógica. Por ejemplo, si se calcula la varianza de una
distribución de datos medidos en metros, segundos, dólares, etc., se
obtendrá una varianza mediada en metros cuadrados, segundos cuadrados,
dólares cuadrados, respectivamente, unidades de medida que no tienen
significado lógico respecto a los datos originales.
- Para solucionar las complicaciones que se tiene con la varianza, se halla la
raíz cuadrada de la misma, es decir, se calcula la desviación estándar, la
cual es un número pequeño expresado en unidades de los datos originales y
que tiene un significado lógico respeto a los mismos.
Para Datos No Agrupados
La varianza para una población se calcula con:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
SEMANA VII
MEDIDAS DE FORMA
ASIMETRIA
Una medida de forma de una distribución que permite identificar y describir la
manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se
hallen dentro de la distribución. Permite identificar las características de la
distribución de datos sin necesidad de generar el gráfico.
TIPOS DE ASIMETRÍA
La asimetría presenta las siguientes formas:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
MEDIDAS DE ASIMETRÍA
Coeficiente de Karl Pearson
Donde:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
= media aritmética.
Md = Mediana.
s = desviación típica o estándar.
Nota:
El Coeficiente de Pearson varía entre -3 y 3
Si As < 0 ? la distribución será asimétrica negativa.
Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.
Donde:
= Cuartil uno; = Cuartil dos = Mediana; = Cuartil tres.
Nota:
La Medida de Bowley varía entre -1 y 1
Si As < 0 ? la distribución será asimétrica negativa.
Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.
CURTOSIS
MEDIDAS DE CURTOSIS
Medida de Fisher
Para datos sin agrupar se emplea la siguiente fórmula:
1. PROBABILIDADES
1.1. CONCEPTOS BÁSICOS:
En nuestra vida cotidiana asociamos usualmente el concepto de Probabilidad a su
calificativo probable, considerando probables aquellos eventos en los que tenemos
un alto grado de creencia en su ocurrencia.
En esta línea, Probabilidad es un concepto asociado a la medida del azar. También
pensamos en el azar vinculado, fundamentalmente, con los juegos de azar, pero
desde esa óptica tan reducida se nos escapan otros muchísimos ejemplos de
fenómenos de la vida cotidiana o asociados a disciplinas de distintas ciencias donde
el azar juega un papel fundamental.
1.2. DEFINICIÓN:
Tenemos, por tanto, que probabilidad es la asignación que hacemos del grado de
creencia que tenemos sobre la ocurrencia de algo. Esta asignación, sin embargo,
debe ser coherente. Esta necesidad de que asignemos probabilidades
adecuadamente se va a plasmar en esta sección en tres reglas, conocidas como
axiomas, que debe cumplir cualquier reparto de probabilidades.
1.3. PROPIEDADES:
1.3.1. Definición clásica de la probabilidad:
Espacio muestral equiprobable: “todos los sucesos elementales tienes
igual probabilidad de ocurrir”.
En estas condiciones se define la probabilidad de suceso a como:
𝑁° 𝐶𝑎𝑠𝑜𝑠 𝐹𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎𝑙 𝑆𝑢𝑐𝑒𝑠𝑜 𝐴 𝐶 𝐹
𝑃(𝐴) = =
𝑁° 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠 𝑃𝑜𝑠𝑖𝑏𝑙𝑒𝑠 𝐶 𝑃
1.3.2. Diagramas del árbol:
Es un método para obtener los resultados posibles de un experimento
cuando este se produce en pocas etapas.
Cada paso del experimento se representa como una ramificación de un
árbol.
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
*Axioma 1
𝐴 ∈ 𝛽, 0 ≤ 𝑃(𝐴)
*Axioma 2
𝑃(𝐸) = 1
*Axioma 3
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
EJEMPLOS:
1) En una pareja, cada uno de los miembros posee genes para ojos castaños y
azules. Teniendo en cuenta que cada uno tiene la misma probabilidad de
aportar un gen para ojos castaños y ojos azules y que el gen para ojos
castaños es dominante, obtener la probabilidad de que un hijo nacido de esta
pareja tenga ojos castaños.
SOLUCIÓN:
SOLUCIÓN:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
SOLUCIÓN:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
SOLUCIÓN:
SOLUCIÓN:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
mismo conjunto en los casos que se pida realizar arreglos con todos o
alguna parte de sus elementos. Dichos arreglos, sin embargo, pueden ser
de dos tipos: cuando se permite el reemplazo (o repetición) y cuando no
se permite
𝐶𝐾𝑁 , 0 ≤ 𝑘 ≤ 𝑛
EJEMPLOS:
1) Se tiene todas las letras del alfabeto (27 en total). ¿Cuántas palabras se
pueden formar de manera que tenga 4 vocales y 3 consonantes?
SOLUCION:
27 𝑙𝑒𝑡𝑟𝑎𝑠 = 5 𝑣𝑜𝑐𝑎𝑙𝑒𝑠 + 22𝑐𝑜𝑛𝑠𝑜𝑛𝑎𝑛𝑡𝑒𝑠
Luego:
𝐶45 ∗ 𝐶322 ∗ 𝑃7 = 𝐶45 ∗ 𝐶322 ∗ 7! = 38,808.000
SOLUCION:
Elegimos 3 consonantes de las 7 que hay: 𝐶37
4
Elegimos 2 vocales de las 4 que hay: 𝐶2
𝐶37 ∗ 𝐶24 ∗ 5! = 25,200
SOLUCIÓN:
Con los datos anteriores y el uso de la regla de multiplicación, que indica el
total de arreglos de libros diferentes de cada tema, se obtiene:
8 ∗ 4 ∗ 7 = 224
SOLUCIÓN:
Se tienen en total diez computadoras, de las cuales existen cuatro, tres y tres
de cada tipo, por la fórmula 1, se tiene
10!
= 4200 (𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑎𝑟𝑟𝑒𝑔𝑙𝑜𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠)
4! 3! 3!
Donde:
EJEMPLOS:
P (B A) = 0,05
P (A) = 0,25
Luego,
Solución:
5 4
P N1 N 2 P N1 P N 2 / N1
14 13
9 8
P R1 R2 P ( R1 ) P R2 / R1
14 13
9
P ( R2 / R1 )
13
1 3 1 2 1
P ( P( B) P( A1 ) P( B / A1 ) P( A2 ) P( B / A2 )
2 5 2 5 2
Supongamos ahora que realizada la extracción, la bola resulta ser blanca y
queremos saber qué probabilidad hay de que la bola proceda de la urna nº1.
1 3
P( A1 ) P( B / A1 ) 2 5 3
P( Ai / B)
P( A1 ) P( B / A1 ) P( A2 ) P( B / A2 ) 1 3 1 2 5
2 5 2 5
Y
n
S
Z
T
2 /
Z n Y / tiene una distribución normal estándar. El teorema
7.3 nos dice que 2 n 1S 2 / 2 tiene una distribución 2 con
v n 1 grados de libertad y que Z y son independientes (ya que
2
Yy 2 los son). Por lo tanto, por la definición
n Y /
Z Y
T n
2 /v n 1S 2 / 2 n 1 S
tiene una distribución t con (n-1) grados de libertad.
FORMULAS:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
EJEMPLOS:
1) Se lanzan tres monedas y se cuenta el número de caras obtenidas.
Haz una tabla con las probabilidades.Calcula la esperanza matemática
y la desviación típica. Representa gráficamente las probabilidades
obtenidas.
Construimos la tabla
SOLUCIÓN:
SOLUCIÓN:
SOLUCIÓN:
1.8.1. BINOMIAL:
Sea X una v.a. discreta que toma los valores x = 0; 1;…; n, donde n es un número
natural conocido. Se dice que X sigue una distribución binomial de parámetros n
y p (y se nota X → B (n; p)) si su función masa es:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
1.8.2. POISSON:
Sea X una va. Discreta, que puede tomar los valores x = 0; 1; 2; … Se dice que X
sigue una distribución de Poisson de parámetro λ (y se nota X ! P (λ)) si su función
masa es:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
1.8.3. HIPERGEOMETRICA:
Este modelo presenta similitudes con el Binomial, pero sin la suposición de
independencia de éste último. Veámoslo:
Partimos de un conjunto formado por N individuos divididos en dos categorías
mutuamente excluyentes: A y Ac; de manera que N1 individuos pertenecen a
la categoría A y N2 individuos, a la categoría Ac. Por tanto, se cumple que:
N = N1 + N2
Propiedades:
1) Esperanza: E(X) = n N1 / N 2.
2) Varianza: V(X) = (n N1 N2 (N-n)) / (N2 (N-1) )
EJEMPLOS:
1. En una urna o recipiente hay un total de N objetos, entre los cuales hay una
cantidad a de objetos que son defectuosos, si se seleccionan de esta
urna n objetos al azar, y sin reemplazo, ¿cuál es la probabilidad de
obtener x objetos defectuosos?
Solución:
Luego;
donde:
p(x,n) = probabilidad de obtener x objetos defectuosos de entre n seleccionados
SOLUCIÓN:
N = 10 objetos en total
a = 3 objetos defectuosos
n = 4 objetos seleccionados en muestra
x = 2 objetos defectuosos deseados en la muestra
donde:
SOLUCIÓN:
a) N = 9+6 =15 total de tabletas
a = 6 tabletas de narcótico
n = 3 tabletas seleccionadas
x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas
de narcótico que se puede encontrar al seleccionar las 3 tabletas
p(viajero sea arrestado por posesión de narcóticos) = p(de que entre las 3 tabletas
seleccionadas haya 1 o más tabletas de narcótico)
p(el viajero sea arrestado por posesión de narcóticos) = 1 – p(de que entre las
tabletas seleccionadas no haya una sola de narcótico)
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
SOLUCIÓN:
a) N = 10 proyectiles en total
a = 7 proyectiles que explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el número
de proyectiles que explotan entre la muestra que se dispara
b) N = 10 proyectiles en total
a = 3 proyectiles que no explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2 o 3 proyectiles que no explotan
b) N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el número de identificaciones que pertenecen a
personas menores de edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA
=1-(0.367918+0.367918) = 0.26416
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA