Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica 2
Estadistica 2
Dentro del estudio de la inferencia estadística, se describe como se puede tomar una
muestra aleatoria y a partir de esta muestra estimar el valor de un parámetro poblacional en
la cual se puede emplear el método de muestreo y el teorema del valor central lo que
permite explicar como a partir de una muestra se puede inferir algo acerca de una
población, lo cual nos lleva a definir y elaborar una distribución de muestreo de medias
muestrales que nos permite explicar el teorema del limite central y utilizar este teorema
para encontrar las probabilidades de obtener las distintas medias maestrales de una
población.
En este caso es necesario hacer una estimación puntual que es un valor que se usa para
estimar un valor poblacional. Pero una estimación puntual es un solo valor y se requiere un
intervalo de valores a esto se denomina intervalote confianza y se espera que dentro de este
intervalo se encuentre el parámetro poblacional buscado. También se utiliza una estimación
mediante un intervalo, el cual es un rango de valores en el que se espera se encuentre el
parámetro poblacional
Por último, siempre resulta práctico comprobar gráficamente los valores del modelo
predictivo (o teórico) con los valores experimentales con el objeto de cuantificar la bondad
del modelo predictivo y evaluar si el modelo se ajusta para todo el intervalo de valores. En
primer lugar, guardamos los datos del ajuste lineal (reg$fitted.values) y en segundo lugar lo
almacenarlos (con la variable Y_teor). Es decir: Obtener la ecuación de la recta o
correlación lineal entre el la concentración de Cr (variable independiente) y la
concentración de Ni (variable dependiente) a partir de los datos obtenidos en el Ejercicio 1
de las prácticas de Matriz de correlación y gráficos de dispersión. Este ejercicio se puede
realizar cambiando los encabezados Cr por X1 y Ni por Y y usar la sintaxis genérica
explicada anteriormente: Se ha estudiado el comportamiento frente a la cristalización de las
sales 10 rocas porosas utilizadas como material de construcción. La durabilidad de estas
rocas se ha estimado mediante la pérdida de masa después de cristalización de sales.
Además se caracterizaron diferentes propiedades de la roca, como la resistencia a la
compresión simple, la densidad de conjunto (o aparente), y la porosidad efectiva y el
tamaño medio de poro, ambas obtenidas con porosimetría de intrusión de mercurio.
El objetivo de este ejercicio es seleccionar el mejor modelo lineal múltiple para predecir la
durabilidad de las rocas (variable dependiente) en función de las otras variables
(independientes). Este ejemplo muestra cómo se pueden transformar variables
independientes para que tengan una influencia lineal sobre la variable dependiente (Datos
obtenidos en: Benavente et al., (2007): The influence of petrophysical properties on the salt
weathering of porous building rocks. Environ Geol 52:197–206).
Cuando la nube de puntos adopta una forma definida, se pueden aproximar sus puntos
mediante una línea curva en general, que llamamos curva de regresión. Sólo nos
ocuparemos del caso en el que la curva de regresión es una recta, llamada recta de
regresión. Nos centraremos entonces en calcular la ecuación de una recta que "mejor se
adapte" a una nube de puntos dada. En los ejemplos anteriores lo hemos hecho a ojo, ahora
lo haremos con un criterio más preciso. Para ello existen varios métodos, siendo el más
utilizado el de los mínimos cuadrados. Consiste en hacer mínima la suma de los cuadrados
de las diferencias entre los valores experimentales y los obtenidos mediante la recta. Por lo
tanto, si consideramos la Y=aX+b, mediríamos lo bien (o mal) que se ajusta a nuestros
puntos por medio de la cantidad Una recta que mejor se ajusta es una línea recta que es la
mejor aproximación del conjunto de datos dado. Es usada para estudiar la naturaleza de la
relación entre dos variables.
Una recta que mejor se ajusta puede ser determinada aproximadamente usando el método
visual al dibujar una línea recta en una gráfica de dispersión para que tanto el número de
puntos arriba de la recta y debajo de la recta sean casi iguales (y la línea pasa a tráves de
tantos puntos como sea posible).
INTERVALO DE CONFIANZA PARA LOS COEFICIENTES.
COEFICIENTE DE CORRELACIÓN.