Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TRABAJO FINAL DE
ESTADISTICA BASICA
INTEGRANTES:
Palomino Roman Karen Alejandra
Gomez Vela Almendra Ivonne
Quevedo Ríos Edu
DOCENTE:
Dr. Francisco Eduardo Rengifo Silva
CURSO:
Estadística básica
Pucallpa-Perú
2019
DEDICATORIA:
Capítulo II
2. DISTRIBUCIONES BINOMIALES DE FRECUENCIAS
2.1. Tipos de variable estadística bidimensional
2.2. Representación de la información mediante tablas bidimensionales
2.3. Distribuciones marginales
2.4. Frecuencias relativas bidimensionales
2.5. Propiedades de las frecuencias bidimensionales
2.6. Medidas estadísticas en una distribución bidimensional de
frecuencias
2.6.1. Medias y varianzas marginales para las variables X e Y
2.6.2. Covarianza
Capítulo III
3. NOCIONES DE PROBABILIDAD
3.1. Experimento
3.1.1. Experimento determinístico
3.1.2. Experimento aleatorio
3.1.3. Características de un experimento aleatorio
3.2. Espacio muestral
3.2.1. Espacio muestral discreto
3.2.2. Espacio muestral continuo
3.3. Eventos
3.3.1. Tipos de eventos
3.3.2. Operaciones con eventos
3.3.3. Eventos mutuamente excluyentes y colectivamente exhaustivos
3.3.4. Propiedades de las operaciones con eventos
3.4. Probabilidad
3.5. Tipos de probabilidad
3.5.1. Probabilidad clásica
3.5.2. Probabilidad de frecuencia relativa
3.5.3. Probabilidad subjetiva
3.6. Axiomas de probabilidad
3.7. Teoremas de los axiomas de probabilidad
3.8. Probabilidad condicional
3.9. Reglas de probabilidad
3.9.1. Probabilidad del producto
3.9.2. Probabilidad de la suma
Tablas de contingencia y tablas de probabilidad
3.10.1. Tablas de contingencia
3.10.2. Tablas de probabilidad
Teorema de Bayes
3.11.1. Partición de un espacio muestral
3.11.2. Probabilidad total
3.11.3. Teorema de bayes
3.10.
3.11.
Capítulo IV
4. DISTRIBUCIONES DE PROBABILIDAD IMPORTANTES
4.1. Distribuciones de probabilidad de tipo discreto
4.1.1. Distribución de Bernoulli
4.1.2. Distribución binomial
4.1.2.1. Uso de la tabla de la distribución binomial
4.1.3. Distribución de Poison
4.1.3.1. Distribución de poison como aproximación de la binomial
4.1.3.2. Uso de la tabla de la distribución de poison
4.2. Distribuciones de probabilidad de tipo continuo
4.2.1. Distribución normal
4.2.1.1. Uso de tablas de la distribución normal estándar
4.2.1.2. Propiedades para el cálculo de otras áreas en la distribución
normal
Estándar
4.2.1.3. Aplicaciones de la distribución normal estándar
4.2.1.4. Distribución t de student
4.2.1.5. Uso de tablas de la distribución t de student
4.2.2. Distribución chi cuadrado
4.2.2.1. Uso de la tabla de la distribución chi cuadrado
4.2.3. Propiedades de la distribución normal
4.2.3.1. La distribución normal estándar
Capítulo V
Capítulo VI
6. INTRODUCCION A LAS TECNICAS DE MUESTREO
6.1. Tipos de muestreo
6.1.1. Métodos de muestreo probabilístico
6.1.2. Métodos de muestreo no probabilístlco
6.2. Calculo del tamaño muestral
6.2.1. Para el muestreo aleatorio simple
6.2.2. Para el muestreo aleatorio sistemático
6.2.3. Para el muestreo aleatorio estratificado
6.2.4. Para el muestreo aleatorio por conglomerado
CAPITULO I
1. MEDIDAS DE RESUMEN
donde:
1.1.2. LA MEDIANA
La mediana es el valor medio de una secuencia ordenada de
datos. Si no hay empates, la mitad de las observaciones
serán menores y la otra mitad serán mayores. La mediana no
se ve afectada por ninguna observación extrema de una serie
de datos. Por tanto, siempre que esté presente una
observación extrema es apropiada usar la mediana en vez de
la media para describir una serie de datos.
Para calcular la mediana de una serie de datos recolectados
en su forma sin procesar, primero debemos poner los datos
en una clasificación ordenada. Después usamos la fórmula de
punto de posicionamiento:
1.1.3. LA MODA
Donde:
= media aritmética.
Md = Mediana.
s = desviación típica o estándar.
Nota:
El Coeficiente de Pearson varía entre -3 y 3
Si As < 0 ? la distribución será asimétrica negativa.
Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.
1.2.1. Cuartiles(Qn):
Ejemplos:
a) Dado el siguiente conjunto de datos: 2 ; 5 ; 9 ; 3 ; 13 ; 10 ; 11 ; 6 ; 7.
¿Cuál es el valor del tercer cuartil?
1° ordenamos los datos de menor a mayor:
2; 3; 5; 6; 7; 9; 10; 11; 13
n= 9
Q3 = 3 (9 /4)
Q3 = 6,75; En caso de ser un número decimal se aproxima al entero más
cercano superior , que sería 7. Este valor indica la posición del cuartil 3.
2; 3; 5; 6; 7; 9; 10; 11; 13
Respuesta: el valor del tercer cuartil sería 10
b) Dadas las siguientes tablas de datos. Calcule los cuartiles Q1,Q2,Q3
Respuesta:
Q1 = 5
Q2 = (5+7) / 2 = 6
Q3 = 7
1.2.2. Deciles:
en donde:
K = {1, 2, …, 99}
n es el número de datos. Si es decimal se aproxima al entero más
cercano superior.
Dónde:
Li es el límite inferior del intervalo donde se encuentra el
k% de los datos.
ai es la amplitud del intervalo donde se encuentra el k% de los datos.
fi es la frecuencia absoluta del intervalo donde se encuentra el k% de los
datos.
Fi-1 es la frecuencia acumulada anterior al intervalo donde se encuentra
el k% de los datos.
n es el total de datos.
- Medidas
- Medidas dimensionales
Q 3 – Q 1.
1.3.4. Varianza
En teoría de probabilidad, la varianza de una variable aleatoria es una
medida de dispersión definida como la esperanza del cuadrado de la
desviación de dicha variable respecto a su media.
Donde:
= media aritmética.
Md = Mediana.
Nota:
- Fórmula de la curtosis
Los diagramas de caja son una forma útil de graficar datos divididos en
cuatro cuartiles, cada uno con igual cantidad de valores. El diagrama de
caja no grafica frecuencia ni muestra las estadísticas individuales, pero en
ellos podemos ver claramente dónde se encuentra la mitad de los datos.
Es un buen diagrama para analizar la asimetría en los datos.
90, 94, 53, 68, 79, 84, 87, 72, 70, 69, 65, 89, 85, 83, 72
53 65 68 69 70 72 79 83 84 85 87 89 90 94
Paso 6: crea una recta real que contenga todos los datos.
- Valores atípicos
Los valores atípicos son aquellos mucho más grandes o mucho más
pequeños que el resto de los datos. Se representan con un punto en
cualquier extremo del diagrama. En nuestro ejemplo no hubo ningún valor
atípico; y aunque 53 parece ser mucho más pequeño que el resto, en
realidad no fue lo suficientemente pequeño.
(IQR)>Q3
(IQR) < Q1
Hay un valor cerca de 278.38, así que éste también es un valor atípico
CAPITULO II
Son 7 docentes solteras y 6 casadas del sexo femenino. De los estudiantes del
sexo masculino 9 son solteros y 2 son casados.
X f
i i.
x1 f1. x2 f 2. x3 f 3. ...... xn f n.
X i 1
n n
Y
j 1
j
j .j
y1 f.1 y2 f.2 y3 f.3 ...... ym f.m
Y
n n
MEDIAS CONDICIONALES
X i f ir
x1 f1r x2 f 2 r x3 f 3r ...... xn f nr
X /( y r ) i 1
f .r f .r
Y j f rj
y1 f r1 y 2 f r 2 y3 f r 3 ...... y m f rm
Y /( x r ) i 1
f r. f r.
2.6.2. Covarianza
(Lopez, 2018)La covarianza es el valor que refleja en qué cuantía dos variables
aleatorias varían de forma conjunta respecto a sus medias.
Nos permite saber cómo se comporta una variable en función de lo que
hace otra variable. Es decir, cuando X sube ¿Cómo se comporta Y? Así pues,
la covarianza puede tomar los siguientes valores:
Covarianza (X,Y) es menor que cero cuando “X” sube e “Y” baja. Hay
una relación negativa.
Covarianza (X,Y) es mayor que cero cuando “X” sube e “Y” sube. Hay una
relación positiva.
Covarianza (X,Y) es igual que cero cuando “X” sube e “Y” baja. No hay
relación existente entre las variables “X” e “Y”.
Cálculo de la covarianza
Propiedades de la covarianza
Cov (b+X, c+Y) = Cov(X,Y) sumar dos constantes cualesquiera a cada variable,
no afecta a la covarianza.
E(X·Y) = E(X)·E(Y)
CAPITULO III
3. NOCIONES DE PROBABILIDAD
3.1. Experimento
3.-puede ser repetido bajo las mismas condiciones una infinidad de veces.
Suceso seguro.
El suceso seguro es aquél que está formado por todos los resultados posibles
del espacio muestral (E), es decir aquél que se realiza siempre.
Suceso imposible.
Suceso elemental.
Suceso compuesto.
3.3. Eventos
Un evento se entiende como el acontecimiento de un hecho en proceso o
por venir. Se dice que es aleatorio, si no es posible determinarlo con
exactitud. En todo caso, será posible predecirlo con un nivel dado de
confianza. Al evento también se le denomina un suceso o un fenómeno.
Generalmente, se simula el evento por un conjunto de variables
relacionadas entre si. Por lo tanto, un evento está representado con una o
más variables vinculadas entre ellas. Si las variables (una o varias de
éstas) no son predecibles con exactitud se dice que el evento es aleatorio.
Generalmente las variables representan atributos y propiedades de los
entes que intervienen en el evento, y que pueden ser medidos.
Si se lanza una moneda dos veces, S = {cc, cs, sc, ss}, donde (c
representa "sale cara" y s, "sale cruz"), los sucesos elementales son {cc},
{cs}, {sc} y {ss}.
Unión:
La unión entre dos conjuntos A y B, de define como los elementos que están en
A, o están en B, se representa por (AUB)
Intersección:
Se representa con el símbolo ∩, se define como los elementos que están en A
y en B (A∩B), complemento.
Ω={1,2,3,4,5,6,7,8,9}
A={1,2,3,9,8}
B={2,5,4,6,7}
Hallar:
i) AUB
ii)A∩B
i)AUB={1,2,3,4,5,6,7,8,9}=Ω
3.4. Probabilidad
Axiomas de Kolmogórov:
Primer axioma:
0 £ p(A) ³ 1
Segundo Axioma:
p(d) = 1
Ejemplo: La probabilidad de sacar un número del 1 al 6 en un dado equilibrado
es "1".
Tercer Axioma:
Generalizando:
Ejemplo:
Nota: El suceso {1} es: "el resultado de tirar el dado es la cara 1", el suceso {1,
3} es: "el resultado de tirar el dado es la cara 1, o la 3", el suceso {1, 3, 5} es:
"el resultado de tirar el dado es una cara impar".
TEOREMAS
TEOREMA 1. Si f es un evento nulo o vacío, entonces la probabilidad de que
ocurra f debe ser cero.
p(f)=0
DEMOSTRACIÓN:
p(Ac)= 1 – p(A).
DEMOSTRACIÓN:
DEMOSTRACIÓN:
DEMOSTRACIÓN:
Si AÈB = (A \ B) È B, donde (A \ B) y B son eventos mutuamente excluyentes,
por lo que p(A È B) = p(A \ B) + p(B) y del teorema anterior tomamos que p(A \
B) = p(A) – p(AÇB), por tanto, p(AÈB) = p(A) + p(B) – p(AÇB). LQQD
No tiene por qué haber una relación causal o temporal entre A y B. A puede
preceder en el tiempo a B, sucederlo o pueden ocurrir
simultáneamente. A puede causar B, viceversa o pueden no tener relación
causal. Las relaciones causales o temporales son nociones que no
pertenecen al ámbito de la probabilidad. Pueden desempeñar un papel o
no dependiendo de la interpretación que se les dé a los eventos.
Probabilidad total
Sean A y B dos sucesos definidos en el experimento E, cada uno de los cuales puede
presentarse o no cada vez que se realiza el experimento. Plantee estos dos sucesos
en cada uno de los experimentos dados.
Hay situaciones en las que interesa calcular la probabilidad de sucesos que tienen
cierta información con respecto a un experimento. Dicha información reduce el
espacio muestra original a uno de sus subconjuntos. De esta forma la probabilidad de
un suceso será diferente si se tiene o no información adicional. Así por ejemplo, un
animal elegido de aquellos que están vacunados tendrá una probabilidad mayor de no
contraer la enfermedad que aquel seleccionado entre el conjunto total de animales.
Este tipo de probabilidad se denomina probabilidad condicional y se expresa:
Dado que:
probabilidad:
P (A ∩ B) = P (A)·P(B|A)
donde P(B|A) se lee como "la probabilidad de que ocurra B dado que ha ocurrido A".
Cuando los sucesos A y B son independientes:
P (A ∩ B) = P(A)·P(B)
Probabilidad:
P (A ó B) = P (A U B)
P (A U B) = P(A)+ P (B)
P (A ó B) = P(A) + P(B) - P (A y B)
P (A y B) = P (A ∩B)
Ejemplo
Se sortea un viaje a Roma entre los 120 mejores clientes de una agencia de
automóviles. De ellos, 65 son mujeres, 80 están casados y 45 son mujeres casadas.
Se pide:
2.Si del afortunado se sabe que es casado, ¿cuál será la probabilidad de que sea una
mujer?
La respuesta que nos da el teorema de Bayes es que esa información adicional hace
que la probabilidad sea ahora 0,595.
Vemos así que la información proporcionada por el análisis de sangre hace pasar, la
probabilidad inicial de padecer diabetes de 0,03, a 0,595.
Evidentemente si la prueba del análisis de sangre hubiese sido negativa, esta
información modificaría las probabilidades en sentido contrario. En este caso la
probabilidad de padecer diabetes se reduciría a 0,0016.
Espacio muestral
Definición
tal que
Ejemplo:
Ω={(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),...(6,6)} =
{1,2,3,4,5,6}x{1,2,3,4,5,6}
Ω'={2,3,4,...,12}
Para calcular la probabilidad tal como la definió Bayes en este tipo de sucesos,
necesitamos una fórmula. La fórmula se define matemáticamente como:
Donde B es el suceso sobre el que tenemos información previa y A(n) son los
distintos sucesos condicionados. En la parte del numerador tenemos la
probabilidad condicionada, y en la parte de abajo la probabilidad total. En
cualquier caso, aunque la fórmula parezca un poco abstracta, es muy sencilla.
Para demostrarlo, utilizaremos un ejemplo en el que en lugar de A(1), A(2) y
A(3), utilizaremos directamente A, B y C.
CAPITULO IV
Las probabilidades que se relacionan con cada uno de los valores que toma x
deben ser mayores o iguales a cero y menores o iguales a 1:
P (xi) < 1
E p (xi) = 1
En la siguiente tabla vemos los posibles resultados de lanzar dos veces una
moneda:
Propiedades:
Ejemplo
Tipificación de la variable
iii. Es simétrica con respecto a su media . Según esto, para este tipo de
variables existe una probabilidad de un 50% de observar un dato mayor
que la media, y un 50% de observar un dato menor.
comprendido en el intervalo .
Se utiliza para:
1. Probar que cada una de las muestras tiene una distribución normal.
Ejemplo
De un universo de 44,000 niños, a los que se les registró el peso, talla
e índice de masa corporal, se tomó una muestra de 56 adolescentes
(21 niñas y 35 niños), del subgrupo de niñas y niños de 14 años de
edad, para comparar las medias tomando exclusivamente el índice de
masa corporal (IMC).
Paso 2: en este caso se hace la prueba t-test aun sabiendo que una de
las muestras (los niños) no tiene normalidad.
= 357.040 + 490.552 / 54
= 847.592 / 54
=15.696
(iii) Error estándar de las diferencias de las medias
t= 0.925 / 1.094
t= 0.846
Paso 6: hipótesis:
1.6
muestras:
al 95%.
z = x¯ − µ σ/ √ n
Analizar
Estadísticos Descriptivos
Explorar
Analizar
Comparar medias
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población:
la hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que
se probará. Por lo general, la hipótesis nula es un enunciado de que "no hay
efecto" o "no hay diferencia". La hipótesis alternativa es el enunciado que se
desea poder concluir que es verdadero de acuerdo con la evidencia
proporcionada por los datos de la muestra.
Etapa 5.- Determinar el valor real del estadístico de prueba. Por ejemplo, al
probar un valor hipotético de la media poblacional, se toma una muestra
aleatoria y se determina el valor de la media muestral. Si el valor crítico que se
establece es un valor de Z, entonces se transforma la media muestral en un
valor de Z.
14. Con los resultados interprete una conclusión estadística para la solución
práctica.
En una población
En dos poblaciones
Ejercicio:
Estadísticos:
• Alfa = 0.05
𝑝̅1 𝑞1 𝑝̅2 𝑞2
𝑆𝑝1−𝑝2 = √ +
𝑛1 𝑛2
Donde
(𝑝̅1 − 𝑝̅2 )
𝒁=
𝑆𝑝1−𝑝2
Donde a raíz del resultado obtenido de este Z calculado
realizaremos el contraste para determinar si se rechaza o no la
hipótesis nula y se acepta o no la alternativa.
En donde:
Y es la variable a predecir;
a y b1X1 son parámetros desconocidos a estimar;
y e es el error que cometemos en la predicción de los pará-
metros.
No obstante, antes de proceder a la estimación de los parámetros, y
con ellos a la concreción de una ecuación predictiva, debemos
corroborar que, efectivamente, los datos sometidos a análisis se
adaptan a un modelo de regresión lineal. La lección la hemos
estructurado en los siguientes puntos:
1. Exposición de los estadísticos que nos permiten valoración de la
bondad de ajuste de los datos al modelo de regresión lineal
simple.
Supuestos clave
Existen tres supuestos que deben cumplirse para llevar a
cabo una regresión lineal, estos son:
Errores esféricos
Covarianza muestral=Cov(X,Y)=∑ni=1(xi−x¯¯¯)(yi−y¯¯¯)N−1
siendo x¯¯¯ e y¯¯¯ la media de cada variable y xi e yi el valor de las
variables para la observación i.
t=rN−2−−−−−√1−r2−−−−−√, df=N−2
Capítulo VI.
Por contra, cuando se sepa bien quiénes son los individuos que integran la
población, será posible, en principio, trabajar con censos.
Resumiendo, el siguiente cuadro recoge las circunstancias para las que resulta
más apropiado bien realizar censos o bien trabajar con muestras:
6.1. Tipos de muestreo:
Por ejemplo, si tienes una población de 100 personas, cada persona tendría
una probabilidad de 1 de 100 de ser seleccionado. El método de muestreo
probabilístico te ofrece la mejor oportunidad de crear una muestra
representativa de la población.
Número de inicio:
Intervalo:
Fácil de aplicar.
Los estratos suelen ser grupos homogéneos de individuos, que a su vez son
heterogéneos entre diferentes grupos. Por ejemplo, si en un estudio esperamos
encontrar un comportamiento muy diferente entre hombres y mujeres, puede
ser conveniente definir dos estratos, uno por cada sexo. Si la selección de
estos estratos es correcta (1) los hombres deberían comportarse de forma
parecida entre ellos, (2) las mujeres deberían comportarse de forma muy
similar entre ellas y (3) hombres y mujeres deberían mostrar comportamientos
dispares entre sí.
Esta técnica favorece los estratos que tienen menos peso en la población,
equiparándolos en importancia a los estratos más relevantes. Globalmente,
reduce la eficiencia de nuestra muestra (menor precisión en los resultados),
pero como contrapartida permite estudiar características particulares de cada
estrato con mayor precisión. En nuestro ejemplo, si queremos emitir alguna
afirmación específica sobre la población del estrato 3 (mayores de 44 años),
podremos hacerlo con menor nivel de error muestral si empleamos una
muestra de 333 unidades que si lo hacemos con una muestra de 227 (como
ocurría en el muestreo estratificado proporcional).
Muestreo no Probabilístico
Bola de Nieve
Para llevarlo a cabo se reúnen los datos de los pocos miembros de la población
objetivo que se puedan localizar y se les pide información necesaria para
ubicar a otros miembros que conozcan de esa población.
Muestreo Discrecional
A criterio del investigador los elementos son elegidos sobre lo que él cree que
pueden aportar al estudio.
El proceso
K=N/n
Ejemplo
¿Cómo podemos comparar esta técnica con otras vistas con anterioridad? Lo
bien o mal que va a funcionar esta técnica va a depender, de forma similar a
como ocurría en el muestreo estratificado, de la relación entre varianza dentro y
fuera de los conglomerados.
Nc = na (1 + (M-1) δ)