Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Y
REGRESIÓN LINEAL
SANDRA HARO
Contenido
ESTADÍSTICA INFERENCIAL .................................................................................................................. 2
Muestreo Aleatorio ......................................................................................................................... 2
Error De Muestreo........................................................................................................................... 5
Estimación De Parámetros .............................................................................................................. 6
Errores Estándar .............................................................................................................................. 7
Prueba De Hipótesis Estadísticas..................................................................................................... 8
Intervalos De Confianza................................................................................................................... 8
Conclusión ........................................................................................................................................... 9
REGRESIÓN LINEAL ............................................................................................................................ 10
Modelo de regresión lineal simple. ............................................................................................... 11
Métodos de mínimos cuadrados ................................................................................................... 11
Inferencia en la regresión Lineal. .................................................................................................. 12
Diagnóstico del modelo análisis y residuos. .................................................................................. 12
Bibliografía ........................................................................................................................................ 14
1
ESTADÍSTICA INFERENCIAL
Muestreo Aleatorio
El muestreo probabilístico (o muestreo aleatorio) es la técnica de elección de
la muestra en la que los individuos son elegidos aleatoriamente y todos tienen
probabilidad positiva de formar parte de ella.
2
Muestreo aleatorio simple
En el muestreo aleatorio simple:
La variable elegida deberá ser significativa para el motivo u objetivo del estudio o
investigación.
3
de muestreo disponible. La elección de los elementos en cada estrato se realiza
mediante algún método de muestreo aleatorio simple o muestreo sistemático.
Suponemos que hay k estratos de tamaños N1, N2,…, Nk, de forma que:
En cada estrato se toman n1, n2,…, nk elementos para la muestra, de manera que se
toman en total n individuos, es decir:
Muestreo sistemático
El método de muestreo sistemático se utiliza en muestras ordenadas del 1 al N.
Consiste en lo siguiente:
4
Una vez seleccionados los conglomerados, el estudio se simplifica puesto que
hay menos individuos en el análisis. El investigador debe elegir si estudiar a todos los
sujetos de los conglomerados seleccionados o seleccionar una muestra mediante el
método de muestreo aleatorio simple o muestreo sistemático.
Error De Muestreo
Cuando se utilizan valores muestrales, o estadísticos para estimar valores
poblacionales, o parámetros, pueden ocurrir dos tipos generales de errores: el error
muestral y el error no muestral.
Cuando una muestra no es una copia exacta de la población; aún si se ha tenido gran
cuidado para asegurar que dos muestras del mismo tamaño sean representativas de
una cierta población, no esperaríamos que las dos sean idénticas en todos sus detalles.
El error muestral es un concepto importante que ayudará a entender mejor la
naturaleza de la estadística inferencial.
Los errores que surgen al tomar las muestras no pueden clasificarse como errores
muestrales y se denominan errores no muestrales.
5
La aleatorización se refiere a cualquier proceso de selección de una muestra de la
población en el que la selección es imparcial o no está sesgada; una muestra elegida
con procedimientos aleatorios se llama muestra aleatoria.
Los tipos más comunes de técnicas de muestreo aleatorios son el muestreo aleatorio
simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo
sistemático.
Si una muestra aleatoria se elige de tal forma que todos los elementos de la población
tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria
simple.
Estimación De Parámetros
En una población cuya distribución es conocida, pero desconocemos algún parámetro,
podemos estimar dicho parámetro a partir de una muestra representativa.
Un estimador es un valor que puede calcularse a partir de los datos muestrales y que
proporciona información sobre el valor del parámetro. Por ejemplo, la media muestral
es un estimador de la media poblacional, la proporción observada en la muestra es un
estimador de la proporción en la población.
Una estimación es puntual cuando se obtiene un sólo valor para el parámetro. Los
estimadores más probables en este caso son los estadísticos obtenidos en la muestra,
aunque es necesario cuantificar el riesgo que se asume al considerarlos. Recordemos
que la distribución muestral indica la distribución de los valores que tomará el
estimador al seleccionar distintas muestras de la población. Las dos medidas
fundamentales de esta distribución son la media que indica el valor promedio del
estimador y la desviación típica, también denominada error típico de estimación, que
indica la desviación promedio que podemos esperar entre el estimador y el valor del
parámetro.
Más útil es la estimación por intervalos en la que calculamos dos valores entre los que
se encontrará el parámetro, con un nivel de confianza fijado de antemano.
6
proceso con muchas muestras podríamos afirmar que el (1- a) % de los
intervalos así construidos contendría al verdadero valor del parámetro.
Errores Estándar
El error estándar (SE) de una estadística (generalmente una estimación de un
parámetro) es la desviación estándar de su distribución de muestreo o una estimación
de esa desviación estándar. Si la estadística es la media muestral, se denomina error
estándar de la media (SEM).
Valor exacto
Prácticamente esto nos dice que cuando se trata de estimar el valor de una media
poblacional, debido al factor , reducir el error en la estimación por un factor de
dos requiere adquirir cuatro veces más observaciones en la muestra; reducirlo por un
factor de diez requiere cien veces más observaciones.
Estimar
7
Rara vez se conoce la desviación estándar de la población muestreada. Por lo tanto,
el error estándar de la media generalmente se estima reemplazando con la
desviación estándar de la muestra:
Intervalos De Confianza
Los intervalos de confianza son un concepto estadístico que se utiliza para estimar la
media, la proporción o cualquier otro parámetro desconocido de una población a partir
de una muestra aleatoria.
8
El intervalo de confianza se utiliza cotidianamente para tomar decisiones informadas
basadas en la información disponible. Por ejemplo, si se está realizando una encuesta
sobre la opinión pública acerca de un tema específico, se puede utilizar un intervalo de
confianza para estimar la proporción de la población que tiene una determinada
opinión.
Sencillamente podemos decir que: los intervalos de confianza son una herramienta
esencial en la toma de decisiones informadas basadas en datos. Se utilizan en una
variedad de disciplinas, desde la medicina hasta las ciencias sociales y económicas,
para establecer la validez y fiabilidad de los datos de una muestra de una población
más grande.
Conclusión
Conocer de los temas antes ya mencionados, nos abre el conocimiento, para poder
relacionarlo con el campo de la ingeniería civil, porque podemos utilizarlas
inconscientemente, como otras personas utilizan esta rama de la estadística para
cosas personales y de usos cotidianos aquí podemos relacionar los temas antes vistos
en el área de la ingeniería civil.
9
2. Esquivación de parámetros y errores estándar:
En la ingeniería civil, los parámetros son medidas numéricas que describen las
características de los materiales y las estructuras, y los errores estándar son
estimaciones de la variabilidad de las mediciones basadas en las muestras
recolectadas. Los ingenieros civiles deben estar atentos a estos parámetros y
errores, ya que pueden tener un impacto significativo en la calidad y seguridad de los
proyectos de construcción.
Por ejemplo, los ingenieros civiles pueden utilizar la esquivación de parámetros para
ajustar los modelos matemáticos y los diseños de los edificios para adaptarse a las
condiciones ambientales y geológicas locales. Además, los errores estándar son útiles
para evaluar la precisión de las mediciones y las estimaciones, y pueden ser utilizados
para tomar decisiones informadas sobre los niveles de riesgo aceptables en la
construcción.
Además, los ingenieros civiles pueden utilizar los intervalos de confianza para estimar
la probabilidad de que la verdadera media o proporción de una población caiga dentro
de un rango específico. Esto es útil en la toma de decisiones informadas y para
garantizar que los proyectos de construcción sean seguros y viables desde el punto de
vista técnico y económico.
REGRESIÓN LINEAL
La regresión lineal es una técnica estadística que se utiliza para analizar la relación
entre dos variables continuas. Esta técnica se basa en la construcción de una línea
recta que mejor se ajusta a los datos, y que permite predecir el valor de una variable
en función del valor de la otra.
Entre los subtemas que pueden estar involucrados en la regresión lineal se encuentran
el análisis de la correlación entre las variables, la estimación de los coeficientes de
regresión, la prueba de hipótesis sobre los coeficientes, la evaluación de la calidad del
ajuste, la detección de valores atípicos y la selección de variables.
El uso cotidiano de la regresión lineal es muy amplio y se puede aplicar en diversas
áreas, como la economía, la medicina, la ingeniería, la psicología, la sociología, entre
otras. Por ejemplo, en el ámbito de la salud, se puede utilizar la regresión lineal para
10
analizar la relación entre el peso y la altura de los individuos y predecir el peso a
partir de la altura.
La regresión lineal es importante en diferentes áreas de estudio porque permite
entender la relación entre dos variables y predecir el valor de una variable a partir de
la otra. Además, esta técnica proporciona información útil para la toma de decisiones
y permite evaluar la eficacia de las intervenciones y los tratamientos.
11
patrones en los datos de mercado y la estimación de los precios de bienes inmuebles
en el mercado.
Ejemplos claros de los métodos de mínimos cuadrados en la vida cotidiana incluyen:
Análisis de precios y demanda: los métodos de mínimos cuadrados se utilizan para
determinar la relación entre el precio de un producto y la cantidad demandada por los
consumidores. Los minoristas pueden utilizar esta información para establecer precios
óptimos y maximizar las ganancias.
Predicción del tiempo: los meteorólogos utilizan los métodos de mínimos cuadrados
para ajustar los modelos climáticos a los datos históricos y predecir el clima futuro.
Evaluación de la inversión: los métodos de mínimos cuadrados se utilizan para evaluar
el rendimiento de las inversiones y pronosticar el rendimiento futuro de diferentes
tipos de activos.
Análisis de precios de bienes inmuebles: los métodos de mínimos cuadrados se utilizan
para analizar los precios del mercado inmobiliario y predecir los precios futuros de las
propiedades.
En resumen, los métodos de mínimos cuadrados son herramientas útiles en la
estadística y las matemáticas aplicadas que se utilizan en una variedad de aplicaciones
en la vida cotidiana, como la predicción de la demanda de productos, la evaluación de la
inversión y la estimación de precios de bienes inmuebles.
12
La probabilidad se utiliza en el diagnóstico del modelo de análisis y residuos de varias
maneras. A continuación, se presentan algunas técnicas comunes utilizadas en este
proceso:
Análisis de residuos: Los residuos son las diferencias entre los valores observados y
los valores predichos por el modelo. El análisis de residuos se utiliza para verificar si
los residuos exhiben propiedades deseadas, como independencia, homogeneidad de
varianzas y distribución normal. La probabilidad se utiliza para calcular gráficos de
probabilidad normal y realizar pruebas estadísticas para evaluar estas propiedades.
Conclusión
13
Bibliografía
Candia, R., & Caiozzi, G. (2005). Confidence intervals. Revista medica de Chile, 133(9),
1111–1115. https://doi.org/10.4067/s0034-98872005000900017
Cardona, D., Gonzalez-Rodriguez, J.-L., Rivera Lozano, M., & Cárdenas Vallejo, E.
(2013). Inferencia estadística módulo de regresión lineal simple.
https://repository.urosario.edu.co/handle/10336/10447
Molina, M. (2021). La distancia más corta. El método de los mínimos cuadrados. Revista
electrónica de AnestesiaR, 13(1). https://doi.org/10.30445/rear.v13i1.895
Ortega, C. (2021, marzo 11). ¿Qué es un error de muestreo? Definición, tipos, control
y reducción de errores. QuestionPro.
https://www.questionpro.com/blog/es/que-es-un-error-de-muestreo/
14