Documentos de Académico
Documentos de Profesional
Documentos de Cultura
M.Sc. en Estadística Aplicada, Ph. D. (c) en Estadística Matemática y Aplicada - Universidad de Granada
Facultades Fisicoquímicas
Estadística
Bucaramanga
2020
Índice
Introducción……………………………………………………………………………(1)
▪ Objetivos
▪ Resultados que se esperan obtener
Resultados y discusiones……………………………………………………….(3)
Conclusión………………………………………………………………………………..(4)
Introducción
La industria petrolera cada día está en busca exhaustiva de ingenieros con habilidades de
programación, de estadística y de optimización de problemas presentes en cualquier área.
Es importante hablar primeramente acerca de la teoría básica del muestreo, que es la base
de este proyecto, en donde se tendrá en cuenta dar resultados concisos y con el menor
margen de error posible.
De manera simple la podemos definir como la relación que hay entre una población y las
muestras tomadas de ella.
Si vamos más allá de lo que consiste este proyecto, podemos entender con gran veracidad
que la teoría del muestreo también es útil en muchos campos. Uno de los campos en donde
podemos usarla ampliamente es en la industria de Hidrocarburos ya que en esta se maneja
información muy valiosa, como, por ejemplo:
En base a esto, surge el teorema del límite central de una población. Este teorema nos dice
que, si seleccionamos una muestra de un determinado tamaño, la distribución muestral de
las medias de muestras es aproximadamente una distribución normal. ”no debemos
confundir muestra con población, son términos totalmente diferentes”
Objetivos
• Objetivos generales
ii. Confirmar por medio de las pruebas de hipótesis si los promedios de cada prueba
son iguales o diferentes entre tipo de IES.
iii. Diseñar una prueba de bondad de ajuste y una prueba de independencia para los
datos suministrados.
• Objetivos específicos
i. Utilizar el software, que en este caso usamos Rstudio e insertar los códigos
correctos para no tener errores en el procedimiento.
Resultados esperados
i. Se espera tener un muestreo adecuado, basado en los datos que queríamos sacar
de la población
iii. Como parte final esperamos principalmente cumplir con los objetivos generales de
forma concisa y precisa.
Marco de referencia
Inferencia Estadística:
Esta hace referencia directa a las estimaciones que, sobre una población se hacen a partir
de una muestra. Y para esto recurrimos a las pruebas de hipótesis
A. La distribución muestral
B. Estimación por intervalo
C. Prueba de una media
D. Prueba de una proporción
E. Prueba de diferencia de dos medias
F. Prueba de diferencia de dos proporciones
G. Pruebas de independencia
H. Prueba de bondad y ajuste
Muestreo
Es la técnica de selección de una muestra teniendo una población. En base a esto existen
varios tipos de muestreos que se mencionaran a continuación:
Error muestral
Fuente: https://slideplayer.es/slide/2840032/10/images/15/C%C3%A1lculo+del+Error+Muestral.jpg
Varianza poblacional
Fuente: https://www.wikihow.com/images_en/thumb/4/4f/Calculate_Variance_Step_10-ES.jpg/728px-
Calculate_Variance_Step_10-ES.jpg
Pruebas de hipótesis
Estas se definen como cualquier afirmación acerca de una población y sus parámetros.
cabe mencionar que una prueba de hipótesis consiste en contrastar dos hipótesis
estadísticas. esto involucra tomar alguna decisión acerca de las hipótesis. Ésta decisión
consiste en rechazar o no una hipótesis en favor de la otra.
La Media
Nota:
se calculo el tamaño de la muestra, pero se genero un error muy
grande al momento de generar graficas y al momento de hacer las
pruebas de hipótesis.
library(samplingbook)
universidades<-sp161718[,c(6,14,9)]
head(universidades)
library(samplingbook)
tamaño<-sample.size.prop(e=0.05, P = 0.5, N =
length(universidades$inst_nombre_institucion), level = 0.95)$n #
Vamos a usar P = 0.5
muestra2<-sample(1:length(universidades$inst_nombre_institucion),
size = tamaño, replace = FALSE)
mas.universidades<-universidades[muestra2,] # Tenemos la muestra2
head(mas.universidades)
ulb<-sp161718[sp161718$inst_nombre_institucion=="UNIVERSIDAD LIBRE-
BARRANQUILLA",]
> library(samplingbook)
> sample.size.prop(e=0.005, P = 0.4, N = nrow(ulb), level = 0.95)
sample.size.prop object: Sample size for proportion estimate
With finite population correction: N=2517, precision e=0.005 and
expected proportion P=0.4
Sample size needed: 2357
> muestra2<-sample(1:nrow(ulb), size = 381, replace = FALSE)
> m.ulb<-ulb[muestra1,]
> uam<-sp161718[sp161718$inst_nombre_institucion=="UNIVERSIDAD DE
ANTIOQUIA-MEDELLIN",]
>
> library(samplingbook)
> sample.size.prop(e=0.05, P = 0.5, N = nrow(uam), level = 0.95)
Conclusión
1. Este trabajo o proyecto nos mostro que la programar es una manera muy
rápida y sencilla si se tiene todos los conocimientos previos .
2. La sensibilidad del programa es fuerte. Concluimos que en Rstudio en
lenguaje de programación deber ser perfecto.