Estadistica Inferencial y Regresion Lineal

ESTADISTICA INFERENCIAL
Y
REGRESIÓN LINEAL
SANDRA HARO
Contenido
ESTADÍSTICA INFERENCIAL .................................................................................................................. 2
Muestreo Aleatorio ......................................................................................................................... 2
Error De Muestreo........................................................................................................................... 5
Estimación De Parámetros .............................................................................................................. 6
Errores Estándar .............................................................................................................................. 7
Prueba De Hipótesis Estadísticas..................................................................................................... 8
Intervalos De Confianza................................................................................................................... 8
Conclusión ........................................................................................................................................... 9
REGRESIÓN LINEAL ............................................................................................................................ 10
Modelo de regresión lineal simple. ............................................................................................... 11
Métodos de mínimos cuadrados ................................................................................................... 11
Inferencia en la regresión Lineal. .................................................................................................. 12
Diagnóstico del modelo análisis y residuos. .................................................................................. 12
Bibliografía ........................................................................................................................................ 14
1
ESTADÍSTICA INFERENCIAL
Muestreo Aleatorio
El muestreo probabilístico (o muestreo aleatorio) es la técnica de elección de
la muestra en la que los individuos son elegidos aleatoriamente y todos tienen
probabilidad positiva de formar parte de ella.
Las muestras seleccionadas por métodos de muestreo probabilístico son más

representativas que los métodos de muestreo no probabilístico, aunque no siempre es
posible seleccionar las muestra aleatoriamente.
Tipos de muestreo probabilístico

1. Muestreo aleatorio simple: todos los individuos tienen la misma
probabilidad de ser elegidos, 2) las observaciones se realizan con
reemplazamiento, de forma que la población es igual en todas las
extracciones.
2. Muestreo aleatorio estratificado: los individuos se dividen en grupos o
estratos. La muestra se elige escogiendo en cada estrato un número
representativo de individuos.
3. Muestreo aleatorio sistemático: se utiliza en muestras ordenadas. Consiste
en seleccionar al azar un elemento y a partir de él, incrementando un
intervalo fijo, seleccionar toda la muestra.
4. Muestreo aleatorio por conglomerados: la población está dividida en
conglomerados naturales (provincias, ciudades, etc.). Se seleccionan algunos
conglomerados y se toman en representación de toda la población.
Vamos a ver los tipos de muestreo no probabilístico uno a uno:
2
Muestreo aleatorio simple
En el muestreo aleatorio simple:
1. Todos los individuos tienen la misma probabilidad de ser seleccionados

2. Las observaciones se realizan con reemplazamiento, de forma que
la población es igual en todas las extracciones. En el caso de que se
renuncie, por azar, a volver a seleccionar en la muestra al mismo individuo,
estaremos en el caso de método aleatorio sin reemplazamiento.
Supongamos que queremos elegir una muestra de n individuos de
una población de N sujetos.
Cada elemento tiene probabilidad n/N de ser elegido en la muestra.
Muestreo estratificado
El muestreo estratificado es un tipo de muestreo probabilístico. Los individuos de
toda la población se dividen en grupos o estratos. Cada elemento pertenece a un único
estrato. La variable elegida para formar los estratos no debe permitir que un individuo
o elemento de la población pertenezca a más de uno de ellos.
La variable elegida deberá ser significativa para el motivo u objetivo del estudio o
investigación.
La muestra se elige escogiendo en cada estrato un número representativo de

individuos. El tamaño de la muestra se fijará mediante uno de los tipos
3
de muestreo disponible. La elección de los elementos en cada estrato se realiza
mediante algún método de muestreo aleatorio simple o muestreo sistemático.
Suponemos que hay k estratos de tamaños N1, N2,…, Nk, de forma que:
En cada estrato se toman n1, n2,…, nk elementos para la muestra, de manera que se
toman en total n individuos, es decir:
Muestreo sistemático
El método de muestreo sistemático se utiliza en muestras ordenadas del 1 al N.
Consiste en lo siguiente:
• Supongamos que tenemos una población de N individuos ordenados del 1 al N.

Queremos seleccionar una muestra de tamaño n.
• Sea k el entero más próximo a N/n.
• Escogemos al azar un número i entre 1 y k (utilizando los números aleatorios,
sacar una bola de un bombo, etc.).
• La muestra será el elemento i y los elementos i+k, i+2k, etc.. Es decir, el
elemento k y los elementos a intervalos fijos k hasta conseguir los n sujetos:
Muestreo por conglomerados

El método de muestreo por conglomerados se utiliza cuando la población está
agrupada en conglomerados naturales.
Si se supone que los conglomerados son muestra significativa de la variable que se

está estudiando, se puede seleccionar algunos conglomerados al azar (todos los
conglomerados deben tener las mismas probabilidades de ser seleccionados) y
utilizarlos en representación de la población.
4
Una vez seleccionados los conglomerados, el estudio se simplifica puesto que
hay menos individuos en el análisis. El investigador debe elegir si estudiar a todos los
sujetos de los conglomerados seleccionados o seleccionar una muestra mediante el
método de muestreo aleatorio simple o muestreo sistemático.
Error De Muestreo
Cuando se utilizan valores muestrales, o estadísticos para estimar valores
poblacionales, o parámetros, pueden ocurrir dos tipos generales de errores: el error
muestral y el error no muestral.
El error muestral se refiere a la variación natural existente entre muestras tomadas

de la misma población.
Cuando una muestra no es una copia exacta de la población; aún si se ha tenido gran
cuidado para asegurar que dos muestras del mismo tamaño sean representativas de
una cierta población, no esperaríamos que las dos sean idénticas en todos sus detalles.
El error muestral es un concepto importante que ayudará a entender mejor la
naturaleza de la estadística inferencial.
Los errores que surgen al tomar las muestras no pueden clasificarse como errores
muestrales y se denominan errores no muestrales.
El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere

a una tendencia sistemática inherente a un método de muestreo que da estimaciones
de un parámetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo
positivo) que el parámetro real.
El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorización.
5
La aleatorización se refiere a cualquier proceso de selección de una muestra de la
población en el que la selección es imparcial o no está sesgada; una muestra elegida
con procedimientos aleatorios se llama muestra aleatoria.
Los tipos más comunes de técnicas de muestreo aleatorios son el muestreo aleatorio
simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo
sistemático.
Si una muestra aleatoria se elige de tal forma que todos los elementos de la población
tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria
simple.
Estimación De Parámetros
En una población cuya distribución es conocida, pero desconocemos algún parámetro,
podemos estimar dicho parámetro a partir de una muestra representativa.
Un estimador es un valor que puede calcularse a partir de los datos muestrales y que
proporciona información sobre el valor del parámetro. Por ejemplo, la media muestral
es un estimador de la media poblacional, la proporción observada en la muestra es un
estimador de la proporción en la población.
Una estimación es puntual cuando se obtiene un sólo valor para el parámetro. Los
estimadores más probables en este caso son los estadísticos obtenidos en la muestra,
aunque es necesario cuantificar el riesgo que se asume al considerarlos. Recordemos
que la distribución muestral indica la distribución de los valores que tomará el
estimador al seleccionar distintas muestras de la población. Las dos medidas
fundamentales de esta distribución son la media que indica el valor promedio del
estimador y la desviación típica, también denominada error típico de estimación, que
indica la desviación promedio que podemos esperar entre el estimador y el valor del
parámetro.
Más útil es la estimación por intervalos en la que calculamos dos valores entre los que
se encontrará el parámetro, con un nivel de confianza fijado de antemano.
• Llamamos Intervalo de confianza al intervalo que, con un cierto nivel de

confianza, contiene al parámetro que se está estimando.
• Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga

al verdadero valor del parámetro. Se indica por 1- a y habitualmente se da en
porcentaje (1- a )100%. Hablamos de nivel de confianza y no de probabilidad ya
que, una vez extraída la muestra, el intervalo de confianza contendrá al
verdadero valor del parámetro o no, lo que sabemos es que si repitiésemos el
6
proceso con muchas muestras podríamos afirmar que el (1- a) % de los
intervalos así construidos contendría al verdadero valor del parámetro.
Errores Estándar
El error estándar (SE) de una estadística (generalmente una estimación de un
parámetro) es la desviación estándar de su distribución de muestreo o una estimación
de esa desviación estándar. Si la estadística es la media muestral, se denomina error
estándar de la media (SEM).
La distribución muestral de una media se genera mediante un muestreo repetido de la

misma población y el registro de las medias muestrales obtenidas. Esto forma una
distribución de diferentes medias, y esta distribución tiene su propia media y
varianza. Matemáticamente, la varianza de la distribución muestral obtenida es igual a
la varianza de la población dividida por el tamaño de la muestra. Esto se debe a que a
medida que aumenta el tamaño de la muestra, las medias muestrales se agrupan más
cerca de la media poblacional.
Por lo tanto, la relación entre el error estándar de la media y la desviación estándar

es tal que, para un tamaño de muestra dado, el error estándar de la media es igual a la
desviación estándar dividida por la raíz cuadrada del tamaño de la muestra. En otras
palabras, el error estándar de la media es una medida de la dispersión de las medias
muestrales alrededor de la media poblacional.
Error estándar de la media
Valor exacto
Si se toma una muestra de observaciones estadísticamente

independiente de una población estadística con una desviación estándar
de , entonces el valor medio calculado a partir de la muestra tendrá un error
estándar asociado en la media dado por:
Prácticamente esto nos dice que cuando se trata de estimar el valor de una media
poblacional, debido al factor , reducir el error en la estimación por un factor de
dos requiere adquirir cuatro veces más observaciones en la muestra; reducirlo por un
factor de diez requiere cien veces más observaciones.
Estimar
7
Rara vez se conoce la desviación estándar de la población muestreada. Por lo tanto,
el error estándar de la media generalmente se estima reemplazando con la
desviación estándar de la muestra:
Como este es solo un estimador del verdadero "error

estándar", es común ver otras notaciones aquí, como: o alternativamente.
Una fuente común de confusión ocurre cuando no se distingue claramente entre la

desviación estándar de la población ( ), la desviación estándar de la muestra ( ), la
desviación estándar de la media misma ( , que es el error estándar) y
el estimador de la desviación estándar de la media ( , que es la cantidad calculada
con más frecuencia, y también se suele llamar coloquialmente el error estándar).
Prueba De Hipótesis Estadísticas

Una hipótesis es un supuesto o afirmación que se hace respecto de una característica
de la población. A partir de hipótesis científicas se establecen hipótesis estadísticas
que pueden referirse al valor del/los parámetros de una población, a la distribución de
una variable estudiada, o a la relación entre dos o más variables, etc.
Hipótesis nula (H0): es el supuesto acerca de la población que debemos rechazar o no

rechazar sobre la base de la evidencia de la muestra. Es decir, es la hipótesis que se
establece como verdadera y que se pone a prueba.
Hipótesis alternativa (H1): es un supuesto que se hace respecto de la población en el

caso en que la H0 sea rechazada.
Una vez que se planteó la hipótesis nula debemos:
-Obtener los datos para validar o no esa hipótesis
-Seleccionar un estadístico que tenga una distribución de probabilidad definida bajo el

supuesto de que la Ho es verdadera
Si conocemos la distribución podremos asociar probabilidades a los eventos que

pudieran ocurrir bajo Ho verdadera: delimitar zonas de rechazo y no rechazo, y
definir la probabilidad de cometer un error al tomar la decisión.
Intervalos De Confianza
Los intervalos de confianza son un concepto estadístico que se utiliza para estimar la
media, la proporción o cualquier otro parámetro desconocido de una población a partir
de una muestra aleatoria.
8
El intervalo de confianza se utiliza cotidianamente para tomar decisiones informadas
basadas en la información disponible. Por ejemplo, si se está realizando una encuesta
sobre la opinión pública acerca de un tema específico, se puede utilizar un intervalo de
confianza para estimar la proporción de la población que tiene una determinada
opinión.
Otro ejemplo cotidiano es el uso de intervalos de confianza en la medicina. Los

ensayos clínicos se utilizan para comparar el efecto de un nuevo tratamiento con el
efecto de un tratamiento existente o ningún tratamiento. Un intervalo de confianza
permite a los investigadores evaluar si el nuevo tratamiento es más o menos efectivo
que el tratamiento existente.
Sencillamente podemos decir que: los intervalos de confianza son una herramienta
esencial en la toma de decisiones informadas basadas en datos. Se utilizan en una
variedad de disciplinas, desde la medicina hasta las ciencias sociales y económicas,
para establecer la validez y fiabilidad de los datos de una muestra de una población
más grande.
Conclusión
Conocer de los temas antes ya mencionados, nos abre el conocimiento, para poder
relacionarlo con el campo de la ingeniería civil, porque podemos utilizarlas
inconscientemente, como otras personas utilizan esta rama de la estadística para
cosas personales y de usos cotidianos aquí podemos relacionar los temas antes vistos
en el área de la ingeniería civil.
1. Muestreo aleatorio y error de muestreo:
En la ingeniería civil, el muestreo aleatorio se utiliza para evaluar la calidad de los

materiales de construcción, como el hormigón, las tuberías, los cables y otros
elementos estructurales del proyecto de construcción. Los ingenieros civiles pueden
recolectar muestras aleatorias de estos materiales y realizar pruebas para
determinar su resistencia, durabilidad y otros atributos clave que afectan la
seguridad y estabilidad del edificio.
El error de muestreo también es importante en la ingeniería civil, ya que puede

afectar la precisión de las estimaciones y las decisiones basadas en los análisis
estadísticos realizados en el campo. Por ejemplo, el error de muestreo puede ocurrir
cuando se toman muestras demasiado pequeñas o cuando se seleccionan de manera
sesgada. Los ingenieros civiles deben ser conscientes de estas posibilidades y tomar
medidas para minimizar el error de muestreo en sus proyectos.
9
2. Esquivación de parámetros y errores estándar:
En la ingeniería civil, los parámetros son medidas numéricas que describen las
características de los materiales y las estructuras, y los errores estándar son
estimaciones de la variabilidad de las mediciones basadas en las muestras
recolectadas. Los ingenieros civiles deben estar atentos a estos parámetros y
errores, ya que pueden tener un impacto significativo en la calidad y seguridad de los
proyectos de construcción.
Por ejemplo, los ingenieros civiles pueden utilizar la esquivación de parámetros para
ajustar los modelos matemáticos y los diseños de los edificios para adaptarse a las
condiciones ambientales y geológicas locales. Además, los errores estándar son útiles
para evaluar la precisión de las mediciones y las estimaciones, y pueden ser utilizados
para tomar decisiones informadas sobre los niveles de riesgo aceptables en la
construcción.
3. Prueba de hipótesis estadística e intervalos de confianza:
Los ingenieros civiles pueden utilizar la prueba de hipótesis estadística y los

intervalos de confianza para evaluar la precisión de las predicciones y estimaciones en
sus proyectos de construcción. Por ejemplo, pueden utilizar esta técnica para
determinar si una muestra de materiales de construcción cumple con ciertas
especificaciones de calidad o para evaluar si un diseño de edificio es seguro y estable.
Además, los ingenieros civiles pueden utilizar los intervalos de confianza para estimar
la probabilidad de que la verdadera media o proporción de una población caiga dentro
de un rango específico. Esto es útil en la toma de decisiones informadas y para
garantizar que los proyectos de construcción sean seguros y viables desde el punto de
vista técnico y económico.
REGRESIÓN LINEAL
La regresión lineal es una técnica estadística que se utiliza para analizar la relación
entre dos variables continuas. Esta técnica se basa en la construcción de una línea
recta que mejor se ajusta a los datos, y que permite predecir el valor de una variable
en función del valor de la otra.
Entre los subtemas que pueden estar involucrados en la regresión lineal se encuentran
el análisis de la correlación entre las variables, la estimación de los coeficientes de
regresión, la prueba de hipótesis sobre los coeficientes, la evaluación de la calidad del
ajuste, la detección de valores atípicos y la selección de variables.
El uso cotidiano de la regresión lineal es muy amplio y se puede aplicar en diversas
áreas, como la economía, la medicina, la ingeniería, la psicología, la sociología, entre
otras. Por ejemplo, en el ámbito de la salud, se puede utilizar la regresión lineal para
10
analizar la relación entre el peso y la altura de los individuos y predecir el peso a
partir de la altura.
La regresión lineal es importante en diferentes áreas de estudio porque permite
entender la relación entre dos variables y predecir el valor de una variable a partir de
la otra. Además, esta técnica proporciona información útil para la toma de decisiones
y permite evaluar la eficacia de las intervenciones y los tratamientos.
Modelo de regresión lineal simple.

El modelo de regresión lineal simple es una herramienta de la estadística que se utiliza
para analizar la relación entre dos variables: una variable dependiente y una variable
independiente. El objetivo del modelo es determinar si hay una relación lineal entre las
dos variables y, en ese caso, establecer una ecuación que pueda utilizarse para
predecir el valor de la variable dependiente a partir del valor de la variable
independiente.
En la vida cotidiana, la regresión lineal simple se utiliza en muchos campos, tales como
la economía, la psicología, la ingeniería, la biología y la medicina. Aquí se presentan
algunos ejemplos claros:
- En el campo de la economía, el modelo de regresión lineal simple se utiliza para
analizar la relación entre dos variables económicas, como el precio de un producto y la
cantidad demandada del mismo. El modelo puede ayudar a las empresas a comprender
cómo los cambios en el precio afectan a la demanda y, por lo tanto, a tomar decisiones
informadas sobre los precios.
- En psicología, el modelo de regresión lineal simple puede utilizarse para analizar la
relación entre dos variables, como el nivel de estrés y el rendimiento académico. Esto
puede ayudar a los psicólogos a entender cómo el estrés afecta a la cognición y a
desarrollar intervenciones efectivas para mejorar el rendimiento.
- En ingeniería, la regresión lineal simple a menudo se utiliza para analizar la relación
entre dos variables, como la cantidad de materiales utilizados en la construcción de un
edificio y los costos de construcción. Esto puede ayudar a los ingenieros a planificar y
presupuestar proyectos de construcción.
- En biología y medicina, el modelo de regresión lineal simple se utiliza a menudo para
analizar la relación entre dos variables, como el nivel de ejercicio y la salud
cardiovascular. Esto puede ayudar a los médicos a entender cómo el ejercicio afecta la
salud y a desarrollar planes de tratamiento efectivos para los pacientes.
Métodos de mínimos cuadrados

Los métodos de mínimos cuadrados son técnicas estadísticas utilizadas para encontrar
la mejor línea recta que se ajuste a un conjunto de datos. Se utilizan para minimizar la
suma de las diferencias al cuadrado entre cada punto de datos y la línea recta, lo que
reduce el error y proporciona una buena aproximación a la relación entre las variables.
En la vida cotidiana, los métodos de mínimos cuadrados se utilizan en una variedad de
aplicaciones, como la predicción de la demanda para un producto en función de su
precio, la evaluación de la efectividad de una campaña publicitaria, la identificación de
11
patrones en los datos de mercado y la estimación de los precios de bienes inmuebles
en el mercado.
Ejemplos claros de los métodos de mínimos cuadrados en la vida cotidiana incluyen:
Análisis de precios y demanda: los métodos de mínimos cuadrados se utilizan para
determinar la relación entre el precio de un producto y la cantidad demandada por los
consumidores. Los minoristas pueden utilizar esta información para establecer precios
óptimos y maximizar las ganancias.
Predicción del tiempo: los meteorólogos utilizan los métodos de mínimos cuadrados
para ajustar los modelos climáticos a los datos históricos y predecir el clima futuro.
Evaluación de la inversión: los métodos de mínimos cuadrados se utilizan para evaluar
el rendimiento de las inversiones y pronosticar el rendimiento futuro de diferentes
tipos de activos.
Análisis de precios de bienes inmuebles: los métodos de mínimos cuadrados se utilizan
para analizar los precios del mercado inmobiliario y predecir los precios futuros de las
propiedades.
En resumen, los métodos de mínimos cuadrados son herramientas útiles en la
estadística y las matemáticas aplicadas que se utilizan en una variedad de aplicaciones
en la vida cotidiana, como la predicción de la demanda de productos, la evaluación de la
inversión y la estimación de precios de bienes inmuebles.
Inferencia en la regresión Lineal.

La inferencia en la regresión lineal es una técnica estadística que se utiliza para
estimar y predecir valores futuros basados en la relación entre dos variables. Esta
técnica se utiliza en la vida cotidiana para hacer predicciones y tomar decisiones.
Un ejemplo claro de uso de la inferencia en la regresión lineal es en el campo de las

finanzas, donde se usa para predecir el comportamiento futuro de la bolsa de valores
al analizar la relación entre las variables como la tasa de interés, la inflación y el
desempeño de las compañías. Otro ejemplo en la vida cotidiana es la predicción de la
venta de productos al analizar la relación entre el precio y la demanda, mediante
análisis estadísticos y proyecciones se puede prever la cantidad vendida y ajustar la
producción y la publicidad de acuerdo con dichas predicciones.
Diagnóstico del modelo análisis y residuos.

El diagnóstico del modelo de análisis y residuos es una parte fundamental en la
inferencia estadística y en la modelización de datos. Permite evaluar la validez de las
suposiciones y condiciones necesarias para los modelos estadísticos utilizados, así
como identificar posibles problemas o errores en los resultados obtenidos. En este
contexto, la probabilidad juega un papel importante al proporcionar herramientas para
cuantificar la incertidumbre asociada a las estimaciones y conclusiones del modelo.
12
La probabilidad se utiliza en el diagnóstico del modelo de análisis y residuos de varias
maneras. A continuación, se presentan algunas técnicas comunes utilizadas en este
proceso:
Pruebas de bondad de ajuste: Estas pruebas se utilizan para evaluar si la distribución

del modelo estadístico ajustado se ajusta adecuadamente a los datos observados. La
prueba de Kolmogorov-Smirnov y la prueba de chi-cuadrado son ejemplos de pruebas
de bondad de ajuste que utilizan la probabilidad para calcular estadísticas de prueba y
p-valores.
Análisis de residuos: Los residuos son las diferencias entre los valores observados y
los valores predichos por el modelo. El análisis de residuos se utiliza para verificar si
los residuos exhiben propiedades deseadas, como independencia, homogeneidad de
varianzas y distribución normal. La probabilidad se utiliza para calcular gráficos de
probabilidad normal y realizar pruebas estadísticas para evaluar estas propiedades.
Intervalos de confianza y predicción: Los intervalos de confianza y predicción

proporcionan estimaciones de la incertidumbre asociada a las estimaciones del modelo
y a las predicciones futuras. Estos intervalos se basan en distribuciones de
probabilidad y permiten cuantificar la variabilidad esperada en los resultados.
Validación cruzada: La validación cruzada es una técnica utilizada para evaluar el

rendimiento predictivo de un modelo en datos no observados. Se basa en la división de
los datos en conjuntos de entrenamiento y prueba, y utiliza la probabilidad para
calcular métricas de rendimiento, como el error cuadrático medio o el coeficiente de
determinación.
Inferencia bayesiana: La inferencia bayesiana es un enfoque estadístico que utiliza la

probabilidad para actualizar las creencias sobre los parámetros del modelo a medida
que se recopila nueva evidencia. Se pueden utilizar técnicas como el muestreo de
Monte Carlo y el método de cadena de Markov para realizar inferencia bayesiana y
obtener estimaciones de distribuciones posteriores.
Conclusión
En resumen, la probabilidad desempeña un papel esencial en el diagnóstico del modelo

de análisis y residuos. Se utiliza para realizar pruebas de bondad de ajuste, analizar la
calidad de los residuos, calcular intervalos de confianza y predicción, evaluar el
rendimiento predictivo y realizar inferencia bayesiana. Estas técnicas permiten
evaluar la validez y la incertidumbre asociada a los resultados obtenidos, lo que
proporciona una base sólida para la interpretación y toma de decisiones basadas en el
modelo estadístico.
13
Bibliografía
Candia, R., & Caiozzi, G. (2005). Confidence intervals. Revista medica de Chile, 133(9),
1111–1115. https://doi.org/10.4067/s0034-98872005000900017
Cardona, D., Gonzalez-Rodriguez, J.-L., Rivera Lozano, M., & Cárdenas Vallejo, E.
(2013). Inferencia estadística módulo de regresión lineal simple.
https://repository.urosario.edu.co/handle/10336/10447
conceptos. (s/f). Www.uv.es. Recuperado el 19 de mayo de 2023, de

https://www.uv.es/ceaces/tex1t/3%20infemues/conceptos.htm
De la regresión lineal simple, 1. El Problema, & De la predicción, 3. Coeficiente de

Regresión 4. Coeficiente de Correlación Lineal 5. El Contraste de Regresión 6.
Inferencias Acerca de Los Parámetros 7. Inferencias Acerca.
(s/f). REGRESIÓN LINEAL SIMPLE. Usc.es. Recuperado el 19 de mayo de
2023, de http://eio.usc.es/eipc1/BASE/BASEMASTER/FORMULARIOS-PHP-
DPTO/MATERIALES/Mat_50140116_Regr_%20simple_2011_12.pdf
Error estándar. (2021, abril 9). Euclides. https://euclides.org/error-estandar/
Molina, M. (2021). La distancia más corta. El método de los mínimos cuadrados. Revista
electrónica de AnestesiaR, 13(1). https://doi.org/10.30445/rear.v13i1.895
Ortega, C. (2021, marzo 11). ¿Qué es un error de muestreo? Definición, tipos, control
y reducción de errores. QuestionPro.
https://www.questionpro.com/blog/es/que-es-un-error-de-muestreo/
Sulmont-PUCP, D. (s/f). Supuestos del Modelo de Regresión Lineal y Diagnóstico.

Amazonaws.com. Recuperado el 19 de mayo de 2023, de https://rstudio-pubs-
static.s3.amazonaws.com/740953_5b6d2acfe47b43b99a7d898d13ff9aec.htm
l
(S/f). Ocw.uv.es. Recuperado el 19 de mayo de 2023, de http://ocw.uv.es/ciencias-de-

la-salud/estadistica-estadistica-inferencial-en-psicologia/tema_3.pdf
14

Estadistica Inferencial y Regresion Lineal

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Inferencial y Regresion Lineal

Cargado por

Copyright:

Formatos disponibles

ESTADISTICA INFERENCIAL

Las muestras seleccionadas por métodos de muestreo probabilístico son más

Tipos de muestreo probabilístico

1. Todos los individuos tienen la misma probabilidad de ser seleccionados

La muestra se elige escogiendo en cada estrato un número representativo de

• Supongamos que tenemos una población de N individuos ordenados del 1 al N.

Muestreo por conglomerados

Si se supone que los conglomerados son muestra significativa de la variable que se

El error muestral se refiere a la variación natural existente entre muestras tomadas

El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere

El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorización.

• Llamamos Intervalo de confianza al intervalo que, con un cierto nivel de

• Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga

La distribución muestral de una media se genera mediante un muestreo repetido de la

Por lo tanto, la relación entre el error estándar de la media y la desviación estándar

Error estándar de la media

Si se toma una muestra de observaciones estadísticamente

estándar asociado en la media dado por:

Como este es solo un estimador del verdadero "error

Una fuente común de confusión ocurre cuando no se distingue claramente entre la

Prueba De Hipótesis Estadísticas

Hipótesis nula (H0): es el supuesto acerca de la población que debemos rechazar o no

Hipótesis alternativa (H1): es un supuesto que se hace respecto de la población en el

Una vez que se planteó la hipótesis nula debemos:

-Obtener los datos para validar o no esa hipótesis

-Seleccionar un estadístico que tenga una distribución de probabilidad definida bajo el

Si conocemos la distribución podremos asociar probabilidades a los eventos que

Otro ejemplo cotidiano es el uso de intervalos de confianza en la medicina. Los

1. Muestreo aleatorio y error de muestreo:

En la ingeniería civil, el muestreo aleatorio se utiliza para evaluar la calidad de los

El error de muestreo también es importante en la ingeniería civil, ya que puede

3. Prueba de hipótesis estadística e intervalos de confianza:

Los ingenieros civiles pueden utilizar la prueba de hipótesis estadística y los

Modelo de regresión lineal simple.

Métodos de mínimos cuadrados

Inferencia en la regresión Lineal.

Un ejemplo claro de uso de la inferencia en la regresión lineal es en el campo de las

Diagnóstico del modelo análisis y residuos.

Pruebas de bondad de ajuste: Estas pruebas se utilizan para evaluar si la distribución

Intervalos de confianza y predicción: Los intervalos de confianza y predicción

Validación cruzada: La validación cruzada es una técnica utilizada para evaluar el

Inferencia bayesiana: La inferencia bayesiana es un enfoque estadístico que utiliza la

En resumen, la probabilidad desempeña un papel esencial en el diagnóstico del modelo

conceptos. (s/f). Www.uv.es. Recuperado el 19 de mayo de 2023, de

De la regresión lineal simple, 1. El Problema, & De la predicción, 3. Coeficiente de

Error estándar. (2021, abril 9). Euclides. https://euclides.org/error-estandar/

Sulmont-PUCP, D. (s/f). Supuestos del Modelo de Regresión Lineal y Diagnóstico.

(S/f). Ocw.uv.es. Recuperado el 19 de mayo de 2023, de http://ocw.uv.es/ciencias-de-

También podría gustarte