Estadistica Enrique Mario

República Bolivariana de Venezuela
Ministerio del P. P. para la Educación Universitaria Ciencia y Tecnología
Instituto Universitario Politécnico "Santiago Mariño”
Extensión Maturín
PRUEBA DE HIPÓTESIS, REGRESIÓN Y CORRELACIÓN.

ÍNDICE
ÍNDICE..............................................................................................................................................ii
INTRODUCCIÓN............................................................................................................................iii
1. INVESTIGUE Y ANALICE CADA UNA DE LAS PRUEBAS DE HIPÓTESIS PARA
LA MEDIA, DOS MEDIAS, PROPORCIÓN Y DOS PROPORCIÓN...................................iv
2. INVESTIGUE Y ANALICE QUE SE ENTIENDE POR BONDAD DE AJUSTE.........vii
3. INVESTIGUE Y ANALICE QUE SE ENTIENDE POR TABLAS DE
CONTINGENCIA.......................................................................................................................vii
4. INVESTIGUE Y ANALICE CADA UNA DE LAS PRUEBAS DE HIPÓTESIS PARA
UNA Y DOS VARIANZAS........................................................................................................viii
5. INVESTIGUE Y ANALICE CUALES SON LOS PASOS DE LA PRUEBA DE
HIPÓTESIS..................................................................................................................................x
6. INVESTIGUE Y ANALICE LA CORRELACIÓN ENTRE LAS VARIABLES..............xiv
7. INVESTIGUE Y ANALICE EL DIAGRAMA DE DISPERSIÓN MEDIANTE UN
SISTEMA DE ILUSTRACIÓN..................................................................................................xv
8. INVESTIGUE Y ANALICE CADA UNO DE LOS COEFICIENTES DE
CORRELACIÓN LINEAL Y DE DETERMINACIÓN.............................................................xvi
9. INVESTIGUE Y ANALICE REGRESIÓN SIMPLE......................................................xvii
10. INVESTIGUE Y ANALICE REGRESIÓN MÚLTIPLE..............................................xvii
12. INVESTIGUE Y ANALICE REGRESIÓN....................................................................xx
13. INVESTIGUE Y ANALICE UN EJEMPLO DE REGRESIÓN Y EXPLIQUE..........xxi
14. INVESTIGUE Y ANALICE PREDICCIÓN................................................................xxiii
15. REALICE UN EJEMPLO DE PREDICCIÓN Y EXPLÍQUELO..............................xxiv
CONCLUSIÓN.............................................................................................................................xxvi
FUENTES BIBLIOGRÁFICAS..................................................................................................xxvii
ii
INTRODUCCIÓN
Las Hipótesis Estadísticas se basan en someter a prueba y expresar a las

hipótesis operacionales en forma de ecuaciones matemáticas. Es muy
importante realizar una prueba de hipótesis estadística a cualquier estudio
que se realice ya que esto nos ayuda a verificar si nuestra hipótesis esta en
lo correcto o se rechaza, para tener una mejor seguridad al presentar
resultados o un rumbo a nuestra investigación, ya que sugieren los pasos y
procedimientos que deben darse en la búsqueda del conocimiento.
Las pruebas de hipótesis estadísticas, también llamada de datos confirma el

análisis, se utiliza a menudo para decidir si los resultados experimentales
contienen suficiente información para poner en duda la sabiduría
convencional. Por ejemplo, en un momento se creyó que las personas de
ciertas razas o colores tenían menor inteligencia que los caucásicos. Una de
las hipótesis ha sido que la inteligencia no se basa en la raza o el color. Las
personas de diferentes razas, colores y culturas han tenido prueba de
inteligencia y se analizaron los datos. Prueba de hipótesis estadísticas se
muestra a continuación, que los resultados fueron estadísticamente
significativos que medidas similares de inteligencia entre las razas no son
sólo error muestral.
iii
1. INVESTIGUE Y ANALICE CADA UNA DE LAS PRUEBAS DE HIPÓTESIS
PARA LA MEDIA, DOS MEDIAS, PROPORCIÓN Y DOS PROPORCIÓN.
El propósito de la prueba de hipótesis es determinar si un valor propuesto

(hipotético) para un parámetro poblacional, por ejemplo para una media, debe
aceptarse como plausible con base en la evidencia muestral. En general el valor
de una media muestral difiere del valor de la media poblacional. Si el valor de un
estadístico muestral, como la media muestral es cercano al valor propuesto con
parámetro y solo difiere en una cantidad que resulta des esperarse debido al
muestreo aleatorio, entonces no se rechaza el valor hipotético. Si el estadístico
muestral difiere del valor propuesto en una cantidad que no es atribuible a la
casualidad, entonces se rechaza la hipótesis por no considerarse plausible.
PRUEBA DE HIPOTESIS PARA LA MEDIA
Se trata de probar una afirmación sobre parámetros de la población (media ;

varianza σ2 o proporción ) en base a datos de estadísticos de una muestra (X
media, s2 o p respectivamente):
En vez de estimar el valor de un parámetro, a veces se debe decidir si una

afirmación relativa a un parámetro es verdadera o falsa. Es decir, probar una
hipótesis relativa a un parámetro. Se realiza una prueba de hipótesis cuando se
desea probar una afirmación realizada acerca de un parámetro o parámetros de
una población.
PRUEBA DE HIPOTESIS PARA UNA PROPORCION
Cuando el objetivo del muestreo es evaluar la validez de una afirmación con

respecto a la proporción de una población, es adecuado utilizar una prueba de una
muestra. La metodología de prueba depende de si el número de observaciones de
la muestra es grande o pequeño. Las pruebas de grandes muestras de medias y
proporciones son bastante semejantes. De este modo, los valores estadísticos de
prueba miden la desviación de un valor estadístico de muestra a partir de un valor
propuesto. Y ambas pruebas se basan en la distribución normal estándar
iv
para valores críticos. Quizá la única diferencia real entre las ambas radica en la
forma corno se obtiene la desviación estándar de la distribución de muestreo.
Esta prueba comprende el cálculo del valor estadístico de prueba Z
Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una

tabla normal a un nivel de significación seleccionado.
Como ocurrió con la prueba de medias de una muestra, las pruebas de
proporciones pueden ser de una o dos colas.
v
La primera alternativa establece una prueba de cola derecha, la segunda,
izquierda y la tercera, una prueba de dos colas.
PRUEBAS DE HIPÓTESIS PARA DOS PROPORCIÓN.
El objetivo de una prueba de dos muestras es determinar si las dos muestras

independientes fueron tomadas de dos poblaciones, las cuales presentan la
misma proporción de elementos con determinada característica. La prueba se
concentra en la diferencia relativa (diferencia dividida entre la desviación estándar
de la distribución de muestreo) entre las dos proporciones muestrales. Diferencias
pequeñas denotan únicamente la variación casual producto del muestreo (se
acepta H0), en tanto que grandes diferencias significan lo contrario (se rechaza
H0). El valor estadístico de prueba (diferencia relativa) es comparado con un valor
tabular de la distribución normal, a fin de decidir si H0 es aceptada o rechazada.
Una vez más, esta prueba se asemeja considerablemente a la prueba de medias
de dos muestras.
La hipótesis nula en una prueba de dos muestras es
vi
EJEMPLO: Una muestra de 50 familias de una comunidad muestra que 10 de
ellas están viendo un programa especial de televisión sobre la economía nacional.
En una segunda comunidad 15 familias de una muestra aleatoria de 50 están
viendo el programa especial de televisión, a continuación se prueba la hipótesis de
que la proporción general de televidentes en las dos comunidades no difiere,
usando el nivel de significancia de 1%: 0 -2.57 -1.15 2.57
El valor calculado para , está en la región de aceptación de la hipótesis nula. Por

lo tanto no se puede rechazar la hipótesis de que no hay diferencia en la
proporción de televidentes en las dos comunidades.
2. INVESTIGUE Y ANALICE QUE SE ENTIENDE POR BONDAD DE

AJUSTE.
La bondad de ajuste de un modelo estadístico describe lo bien que se ajusta un

conjunto de observaciones. Las medidas de bondad en general resumen la
discrepancia entre los valores observados y los que valores esperados en el
modelo de estudio. Tales medidas se pueden emplear en el contraste de hipótesis,
e.g. el test de normalidad de los residuos, comprobar si dos muestras se obtienen
a partir de dos distribuciones idénticas, o si las frecuencias siguen una distribución
específica.
3. INVESTIGUE Y ANALICE QUE SE ENTIENDE POR TABLAS DE

CONTINGENCIA.
Una tabla de contingencia es una de las formas más comunes de resumir datos
categóricos. En general, el interés se centra en estudiar si existe alguna
asociación entre una variable fila y otra variable columna y/o calcular la intensidad
de dicha asociación.
vii
Sean X e Y dos variables categóricas con I y J categorías respectivamente. Un
sujeto puede venir clasificado en una de las I × J categorías, que es el número
posible de categorías que existe
4. INVESTIGUE Y ANALICE CADA UNA DE LAS PRUEBAS DE HIPÓTESIS

PARA UNA Y DOS VARIANZAS.
PRUEBA DE HIPOTESIS PARA UNA VARIANZA
Es un procedimiento para juzgar si una propiedad que se supone cumple una

población estadística es compatible con lo observado en una muestra de dicha
población en este caso la varianza, para ello formularemos dos Hipótesis (llamada
"Hipótesis Nula") y (llamada "Hipótesis Alternativa"), con ellas realizaremos una o
mas pruebas, para tratar de encontrar cual deberíamos rechazar. En este
procedimiento lo que buscamos es, mediante unos criterios de rechazo
preestablecidos, tratar de desmentir nuestra “Hipótesis Nula” por lo cual
tomaríamos la “Hipótesis alternativa”, de lo contrario no rechazaríamos nuestra
”Hipótesis Nula” y desecharíamos la ”Hipótesis alternativa”.
Cuando se analizan variables cuantitativas, a menudo es importante sacar

conclusiones en cuanto a la variabilidad así como al promedio de una
característica de interés. Por ejemplo, en el estudio de las llantas, el gerente de la
fábrica, probablemente se interesaría en determinar si la variabilidad en la
duración de las llantas está o no dentro de los límites aceptables antes de concluir
que el proceso funciona en forma correcta. En este caso, lo que interesaría sería
llegar a conclusiones acerca de la desviación estándar o a la varianza de la
población.
PRUEBA DE HIPOTESIS DE DOS VARIANZAS
En una forma análoga a las ya descritas para las medias y proporciones, también
interesa determinar si las dos poblaciones tienen o no la misma variabilidad.
Para poder comparar la igualdad de las varianzas de dos poblaciones

independientes, se ha ideado un procedimiento estadístico basado en la razón de
viii
las dos varianzas muestrales. Si los datos de cada población se suponen
distribuidos normalmente, entonces la razón S12/S22 sigue una distribución
llamada distribución F, que recibe el nombre en honor de R. A. Fisher. El valor
crítico de la distribución F depende de "dos" conjuntos de grados de libertad: los
grados de libertad en el numerador y en el denominador.
El estadísitico de la prueba para probar la razón entre las dos varianzas sería en
donde:
 n1 = tamaño de la muestra del grupo 1

 n2 = tamaño de la muestra del grupo 2
 n1 - 1 = grados de libertad en el grupo 1
 n2 - 1 = grados de libertad en el grupo 2
 S1 2= varianza de la muestra del grupo 1
 S2 2 = varianza de la muestra del grupo 2
Para probar la razón de las dos varianzas, se pueden emplear pruebas de una
cola o de dos colas, como se indica en la figura
Prueba de una hipótesis acerca de dos varianzas poblacionales: pruebas de una y

de dos colas.
Panel A, prueba de dos colas. Panel B, prueba de una cola. Panel C, prueba de
una cola
Al probar la razón de dos varianzas de la población, como ocurrió en el caso de la

varianza de una sola población, se debe estar alerta de que la prueba supone que
cada una de las dos poblaciones tiene distribución normal. Desafortunadamente,
esta prueba no es robusta para las desviaciones de esta suposición, sobre todo
cuando los tamaños de las muestras en los dos grupos no son iguales. Por tanto,
si las poblaciones no están más o menos, normalmente distribuidas, se puede
afectar de un modo muy serio la exactitud, del procedimiento.
ix
5. INVESTIGUE Y ANALICE CUALES SON LOS PASOS DE LA PRUEBA
DE HIPÓTESIS.
 Expresar la hipótesis nula
Cualquier investigación estadística implica la existencia de hipótesis o

afirmaciones acerca de las poblaciones que se estudian. La hipótesis nula (Ho)
se refiere siempre a un valor especificado del parámetro de población, no a
una estadística de muestra. La letra H significa hipótesis y el subíndice cero no
hay diferencia. Por lo general hay un "no" en la hipótesis nula que indica que
"no hay cambio" Podemos rechazar o aceptar Ho. La hipótesis nula es una
afirmación que no se rechaza a menos que los datos maestrales proporcionen
evidencia convincente de que es falsa. El planteamiento de la hipótesis nula
siempre contiene un signo de igualdad con respecto al valor especificado del
parámetro
 Expresar la hipótesis alternativa
La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis

nula. Es una afirmación que se acepta si los datos maestrales proporcionan
evidencia suficiente de que la hipótesis nula es falsa. Se le conoce también
como la hipótesis de investigación. El planteamiento de la hipótesis alternativa
nunca contiene un signo de igualdad con respecto al valor especificado.
 Especificar el nivel de significancia
Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando es

verdadera. Se le denota mediante la letra griega α, también es denominada
como nivel de riesgo, este término es más adecuado ya que se corre el riesgo
de rechazar la hipótesis nula, cuando en realidad es verdadera. Este nivel está
bajo el control de la persona que realiza la prueba.
Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de

significación indicará la probabilidad de no aceptarla, es decir, estén fuera de
x
área de aceptación. El nivel de confianza (1-α), indica la probabilidad de
aceptar la hipótesis planteada, cuando es verdadera en la población.
 Determinar el tamaño de la muestra
El tamaño muestral dependerá de decisiones estadísticas y no estadísticas,

pueden incluir por ejemplo la disponibilidad de los recursos, el presupuesto o el
equipo que estará en campo.
Antes de calcular el tamaño de la muestra necesitamos determinar varias cosas:
a) Tamaño de la población. Una población es una colección bien definida de

objetos o individuos que tienen características similares. Hablamos de dos
tipos: población objetivo, que suele tiene diversas características y también
es conocida como la población teórica. La población accesible es la
población sobre la que los investigadores aplicaran sus conclusiones.
b) Margen de error (intervalo de confianza). El margen de error es una
estadística que expresa la cantidad de error de muestreo aleatorio en los
resultados de una encuesta, es decir, es la medida estadística del número
de veces de cada 100 que se espera que los resultados se encuentren
dentro de un rango específico.
c) Nivel de confianza. Son intervalos aleatorios que se usan para acotar un
valor con una determinada probabilidad alta. Por ejemplo, un intervalo de
confianza de 95% significa que los resultados de una acción probablemente
cubrirán las expectativas el 95% de las veces.
d) La desviación estándar. Es un índice numérico de la dispersión de un
conjunto de datos (o población). Mientras mayor es la desviación estándar,
mayor es la dispersión de la población.
 Establecer los valores críticos que establecen las regiones de rechazo de

las de no rechazo.
Habiendo especificado la hipótesis nula, el nivel de significancia y la estadística

de prueba que se van a utilizar, se produce a establecer el o los valores críticos
xi
de estadística de prueba. Puede haber uno o más de esos valores,
dependiendo de si se va a realizar una prueba de uno o dos extremos.
Luego determinar el valor real de la estadística de prueba. Por ejemplo, al

probar un valor hipotético de la media poblacional, se toma una muestra
aleatoria y se determina el valor de la media muestral. Si el valor crítico que se
establece es un valor de z, entonces se transforma la media muestral en un
valor de z.
Tomar la decisión. Se compara el valor observado de la estadística muestral

con el valor (o valores) críticos de la estadística de prueba. Después se acepta
o se rechaza la hipótesis nula. Si se rechaza ésta, se acepta la alternativa; a su
vez, esta decisión tendrá efecto sobre otras decisiones de los administradores
operativos, como por ejemplo, mantener o no un estándar de desempeño o
cuál de dos estrategias de mercadotecnia utilizar.
 Determinar la prueba estadística.
La estadística de prueba puede ser la estadística muestral (el estimador no

segado del parámetro que se prueba) o una versión transformada de esa
estadística muestral. Por ejemplo, para probar el valor hipotético de una media
poblacional, se toma la media de una muestra aleatoria de esa distribución
normal, entonces es común que se transforme la media en un valor z el cual, a
su vez, sirve como estadística de prueba.
 Coleccionar los datos y calcular el valor de la muestra de la prueba

estadística apropiada.
Cuando se identifican los datos que se necesitan para responder a sus

preguntas y las fuentes secundarias de datos, es tiempo de determinar qué
datos, si alguno, necesita colectar. Estos se llaman datos primarios.
Se necesita mantener en mente que hay dos clases diferentes de datos que
puede colectar, cuantitativa y cualitativa. Dependiendo en la experiencia de sus
socios acerca de colección de datos, el tiempo para hacerlo y el nivel de
xii
fondos y otros recursos, que puede desear colectar únicamente datos
cuantitativos, únicamente datos cualitativos o una combinación de ambos, para
responder a las preguntas de su evaluación.
a) Datos cuantitativos son usualmente medidos y expresados por números

o porcentajes. Estos datos pueden responder a las preguntas de la
evaluación de, quién, qué, cuándo, y dónde.
b) Datos cualitativos, son usualmente medidos y expresados en forma de
palabras, conceptos, ideas, o categorías en lugar de números. Los datos
cualitativos se usan más para facilitar el entendimiento de un incidente
particular o fenómeno. Ellos responden a "cómo" o "por qué" algo está
ocurriendo.
El valor de la muestra es el número de sujetos que componen la muestra extraída

de una población, necesarios para que los datos obtenidos sean representativos
de la población. Sus principales objetivos son estimar un parámetro determinado
con el nivel de confianza deseado, detectar una determinada diferencia, si
realmente existe, entre los grupos de estudio con un mínimo de garantía y reducir
costes o aumentar la rapidez del estudio.
 Determinar si la prueba estadística ha sido en la zona de rechazo a una de

no rechazo.
La distribución apropiada de la prueba estadística se divide en dos regiones:

una región de rechazo y una de no rechazo. Si la prueba estadística cae en
esta última región no se puede rechazar la hipótesis nula y se llega a la
conclusión de que el proceso funciona correctamente.
Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el

valor crítico en la distribución estadística que divide la región del rechazo (en la
cual la hipótesis nula no se puede rechazar) de la región de rechazo. A hora
bien el valor crítico depende del tamaño de la región de rechazo.
 Determinar la decisión estadística.
xiii
En la práctica nos vemos obligados con frecuencia a tomar decisiones relativas a
una población sobre la base de información proveniente de muestras. Tales
decisiones se llaman decisiones estadísticas. Al intentar alcanzar una decisión, es
útil hacer hipótesis sobre la población implicada. Tales hipótesis, que pueden ser o
no cierto se llaman hipótesis estadísticas. Son, en general, enunciados a cerca de
las distribuciones de probabilidad de las poblaciones. En muchos casos
formulamos una hipótesis estadística con el único propósito de rechazarla o
invalidarla. Análogamente, si deseamos decidir si un procedimiento es mejor que
otro, formulamos la hipótesis de que no hay diferencia entre ellos. Tales hipótesis
se suelen llamar hipótesis nula y se denotan por Ho. Al contrario toda hipótesis
que difiera de una dada se llamará una hipótesis alternativa.
 Expresar la decisión estadística en términos del problema.
Los resultados se deben representar de una forma clara y objetiva, sin caer en
demasiados tecnicismos, para permitir a los responsables de la toma de
decisiones entenderlos y juzgarlos. De lo contrario, todo el esfuerzo no habrá
servido para nada. Se harán reflexiones sobre los resultados y se estudiará si son
relevantes en referencia a los objetivos propuestos.
6. INVESTIGUE Y ANALICE LA CORRELACIÓN ENTRE LAS VARIABLES.
La correlación entre dos variables se refiere al grado de parecido o variación

conjunta existente entre las mismas. En este apartado vamos a estudiar un tipo
particular de relación llamada lineal y se limita a considerar únicamente el caso de
dos variables cuantitativas (correlación simple).
Una relación lineal positiva entre dos variables X e Y significa que los valores de
las dos variables varían de forma parecida: los sujetos que puntúan alto en X
tienden a puntuar alto en Y y los que puntúan bajo en X tienden a puntuar bajo en
Y. Una relación lineal negativa significa que los valores de ambas variables varían
justamente el revés.
xiv
La forma más directa de formarse una primera idea sobre el tipo de relación
existente entre dos variables cuantitativas es a través de un Diagrama de
dispersión.
7. INVESTIGUE Y ANALICE EL DIAGRAMA DE DISPERSIÓN MEDIANTE

UN SISTEMA DE ILUSTRACIÓN.
El diagrama de dispersión permite analizar si existe algún tipo de relación entre

dos variables. Por ejemplo, puede ocurrir que dos variables estén relacionadas de
manera que al aumentar el valor de una, se incremente el de la otra. En este caso
hablaríamos de la existencia de una correlación positiva. También podría ocurrir
que al producirse una en un sentido, la otra derive en el sentido contrario; por
ejemplo, al aumentar el valor de la variable x, se reduzca el de la variable y.
Entonces, se estaría ante una correlación negativa. Si los valores de ambas
variable se revelan independientes entre sí, se afirmaría que no existe correlación.
El diagrama de dispersión es una herramienta gráfica que ayuda a identificar la

posible relación entre dos variables. Representa la relación entre dos variables de
forma gráfica, lo que hace más fácil visualizar e interpretar los datos.
xv
8. INVESTIGUE Y ANALICE CADA UNO DE LOS COEFICIENTES DE
CORRELACIÓN LINEAL Y DE DETERMINACIÓN.
Coeficiente de correlación lineal
La correlación, también conocida como coeficiente de correlación lineal (de

Pearson), es una medida de regresión que pretende cuantificar el grado de
variación conjunta entre dos variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, es decir, si se representan en un diagrama de dispersión los valores que
toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal
que el conjunto de puntos representados se aproxima a una recta.
De una forma menos coloquial, la podemos definir como el número que mide el
grado de intensidad y el sentido de la relación entre dos variables.
Siendo:
 Cov (x;y): la covarianza entre el valor “x” e “y”.

 σ(x): desviación típica de “x”.
 σ(y): desviación típica de “y”.
Coeficiente de determinación
El coeficiente de determinación, denominado R² y pronunciado R cuadrado, es

un estadístico usado en el contexto de un modelo estadístico cuyo principal
propósito es predecir futuros resultados o probar una hipótesis. El coeficiente
determina la calidad del modelo para replicar los resultados, y la proporción de
variación de los resultados que puede explicarse por el modelo
xvi
9. INVESTIGUE Y ANALICE REGRESIÓN SIMPLE.
Es una técnica estadística utilizada para estudiar la relación entre variables. A

menudo resulta de interés conocer el efecto que una o varias variables pueden
causar sobre otra, e incluso predecir en mayor o menor grado valores de una
variable a partir de otra. Por ejemplo, supongamos que queremos estudiar si la
altura de los padres influye significativamente en la de los hijos.
La regresión es el conjunto de técnicas usadas para explorar y cuantificar la

relación de dependencia entre una variable cuantitativa llamada variable
dependiente o respuesta y una o más variables independientes llamadas variables
predictoras.
El primer paso para determinar si puede existir o no dependencia/relación entre

variables es representando gráficamente los pares de valores observados
mediante una nube de puntos, lo que se conoce como diagrama de dispersión.
La ecuación de Regresión Simple permite hacer predicciones de una variable en

función de otra. El comportamiento es muy complejo, y hacer predicciones con
una sola variable predictora es demasiado simple. Mejoraríamos la posibilidad de
predicción (o explicación) del comportamiento si utilizamos más de una variable
predictora.
10. INVESTIGUE Y ANALICE REGRESIÓN MÚLTIPLE.
En la Regresión lineal múltiple modelizamos la relación entre una variable

dependiente y dos o más variables independientes mediante una función lineal,
una función que será, ahora, no una recta, como sucedía con la Regresión lineal
simple, sino un plano (si tenemos dos variables independientes) o un hiperplano
(si tenemos más de dos variables independientes).
En la Regresión lineal múltiple el punto de partida es el mismo que en la

Regresión lineal simple. Se pretende modelizar la relación entre unas variables
con la finalidad última de poder pronosticar una de ellas: la variable dependiente, a
xvii
partir del conocimientos de las otras: las variables independientes. En la
Regresión lineal múltiple se introducen nuevas variables independientes con la
finalidad de reducir la dispersión de la predicción, con la finalidad de disminuir el
residuo.
11. INVESTIGUE Y ANALICE CUALES SON CADA UNA DE LOS MÉTODOS

DE LOS MÍNIMOS CUADRADOS .
Es una técnica de análisis numérico enmarcada dentro de la optimización

matemática, en la que, dados un conjunto de pares ordenados: variable
independiente, variable dependiente, y una familia de funciones, se intenta
encontrar la función continua, dentro de dicha familia, que mejor se aproxime a los
datos.
El procedimiento mas objetivo para ajustar una recta a un conjunto

de datos presentados en un diagrama de dispersión se conoce como
"el método de los mínimos cuadrados". La recta resultante presenta dos
características importantes:
1. Es nula la suma de las desviaciones verticales de los puntos a partir de la recta
de ajuste
∑ (Y ｰ - Y) = 0.
2. Es mínima la suma de los cuadrados de dichas desviaciones. Ninguna otra
recta daría una suma menor de las desviaciones elevadas al cuadrado ∑ (Y ｰ - Y)²
→ 0 (mínima).
El procedimiento consiste entonces en minimizar los residuos al cuadrado Ci²
Re emplazando nos queda
xviii
La obtención de los valores de a y b que minimizan esta función es un problema
que se puede resolver recurriendo a la derivación parcial de la función en términos
de a y b: llamemos G a la función que se va a minimizar:

Tomemos las derivadas parciales de G respecto de a y b que son las incógnitas y
las igualamos a cero; de esta forma se obtienen dos ecuaciones llamadas
ecuaciones normales del modelo que pueden ser resueltas por cualquier método
ya sea igualación o matrices para obtener los valores de a y b.

Derivamos parcialmente la ecuación respecto de a
Primera ecuación normal

Derivamos parcialmente la ecuación respecto de b
xix
Segunda ecuación normal

Los valores de a y b se obtienen resolviendo el sistema de ecuaciones resultante.
Veamos el siguiente ejemplo:
En un estudio económico se desea saber la relación entre el nivel de instrucción
de las personas y el ingreso.
12. INVESTIGUE Y ANALICE REGRESIÓN.
Es un proceso estadístico para estimar las relaciones entre variables. Incluye

muchas técnicas para el modelado y análisis de diversas variables, cuando la
atención se centra en la relación entre una variable dependiente y una o más
variables independientes (o predictoras). Más específicamente, el análisis de
regresión ayuda a entender cómo el valor de la variable dependiente varía al
cambiar el valor de una de las variables independientes, manteniendo el valor de
las otras variables independientes fijas. Más comúnmente, el análisis de regresión
estima la esperanza condicional de la variable dependiente dadas las variables
independientes - es decir, el valor promedio de la variable dependiente cuando se
fijan las variables independientes. Con menor frecuencia, la atención se centra en
un cuantil, u otro parámetro de localización de la distribución condicional de la
variable dependiente dadas las variables independientes. En todos los casos, el
objetivo de la estimación es una función de las variables independientes llamada
la función de regresión. En el análisis de regresión, también es de interés
caracterizar la variación de la variable dependiente en torno a la función de
regresión, la cual puede ser descrita por una distribución de probabilidad.
xx
El análisis de regresión es ampliamente utilizado para la predicción y previsión,
donde su uso tiene superposición sustancial en el campo de aprendizaje
automático. El análisis de regresión se utiliza también para comprender cuales de
las variables independientes están relacionadas con la variable dependiente, y
explorar las formas de estas relaciones. En circunstancias limitadas, el análisis de
regresión puede utilizarse para inferir relaciones causales entre las variables
independientes y dependientes. Sin embargo, esto puede llevar a ilusiones o
relaciones falsas, por lo que se recomienda precaución,1 por ejemplo, la
correlación no implica causalidad.
13. INVESTIGUE Y ANALICE UN EJEMPLO DE REGRESIÓN Y EXPLIQUE.
La juguetería Gaby desea estimar mediante regresión lineal simple las ventas para
el mes de Julio de su nuevo carrito infantil "Mate". La información del
comportamiento de las ventas de todos sus almacenes de cadena se presenta en
el siguiente tabulado.
Mes Ventas
1 Enero 7000
2
9000
Febrero
3 Marzo 5000
4 Abril 11000
5 Mayo 10000
6 Junio 13000
El primer paso para encontrar el pronóstico del mes 7 consiste en hallar la
pendiente, para ello efectuamos los siguientes cálculos:
xxi
Luego, y dado que ya tenemos el valor de la pendiente b procedemos a calcular el
valor de a, para ello efectuamos los siguientes cálculos:
xxii
Ya por último, determinamos el pronóstico del mes 7, para ello efectuamos el
siguiente cálculo:
Podemos así determinar que el pronóstico de ventas para el período 7 es

equivalente a 13067 unidades.
14. INVESTIGUE Y ANALICE PREDICCIÓN.
Es el proceso de estimación en situaciones de incertidumbre, se refiere a la

estimación de series temporales o datos instantáneos. La predicción ha
evolucionado hacia la práctica del plan de demanda en el pronóstico diario de los
xxiii
negocios. La práctica del plan de demanda también se refiere al pronóstico de la
cadena de suministros.
Entonces tenemos que los pronósticos son procesos críticos y continuos que se
necesitan para obtener buenos resultados durante la planificación, de un proyecto.
Si los clasificamos respecto al tiempo que abarcan.
15. REALICE UN EJEMPLO DE PREDICCIÓN Y EXPLÍQUELO.
Supongamos que nos proponen comparar los métodos de producción de cierta

sustancia. Se realizan 16 mediciones y se calcula la diferencia de rendimiento
entre ambos métodos (el del primero menos el del segundo).
Suponemos que
donde la distribución a priori de µ es
Se puede observar que el intervalo de probabilidad 0.95 a priori es

que incluye todas las observaciones.
Como tenemos aplicando los resultados anteriores,

se tiene
xxiv
 Estimador puntual: el estimador puntual de la diferencia entre ambas
medidas es la media a posteriori, esto es
 Estimación por intervalos: el intervalo de probabilidad 0.95 es, ya que
Contraste de hipótesis: el contraste de hipótesis que se considera es:
Por tanto, se rechaza la hipótesis nula, esto es, el rendimiento del segundo es
mayor.
Predicción:
xxv
CONCLUSIÓN
Las pruebas de hipótesis como herramientas estadísticas son importantes porque

nos indican un camino a seguir al aceptar o desechar una hipótesis de manera
tentativa a favor de otra.
Por otro lado la regresión es una técnica estadística utilizada para simular la
relación existente entre dos o más variables. Por lo tanto se puede emplear para
construir un modelo que permita predecir el comportamiento de una variable dada.
La regresión es muy utilizada para interpretar situaciones reales, pero

comúnmente se hace de mala forma, por lo cual es necesario realizar una
selección adecuada de las variables que van a construir las ecuaciones de la
regresión, ya que tomar variables que no tengan relación en la práctica, nos
arrojará un modelo carente de sentido, es decir ilógico.
Otro tema importantes que muchas veces es frecuente que estudiemos sobre una
misma población los valores de dos variables estadísticas distintas, con el fin de
ver si existe alguna relación entre ellas, es decir, si los cambios en una de ellas
influyen en los valores de la otra. Si ocurre esto decimos que las variables están
correlacionadas o bien que hay correlación entre ellas.
xxvi
El análisis de regresión consiste en emplear métodos que permitan determinar la
mejor relación funcional entre dos o más variables concomitantes (o relacionadas).
El análisis de correlación estudia el grado de asociación de dos o más variables.
FUENTES BIBLIOGRÁFICAS
 cursos.aiu.edu
 healthpolicy.ucla.ed
 www.spentamexico.org
 www.docsity.com
 previa.uclm.es
 www.um.es
 /support.minitab.com/es
 www.ub.edu
xxvii

Estadistica Enrique Mario

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Enrique Mario

Cargado por

Copyright:

Formatos disponibles

República Bolivariana de Venezuela

Ministerio del P. P. para la Educación Universitaria Ciencia y Tecnología

Instituto Universitario Politécnico "Santiago Mariño”

PRUEBA DE HIPÓTESIS, REGRESIÓN Y CORRELACIÓN.

Las Hipótesis Estadísticas se basan en someter a prueba y expresar a las

Las pruebas de hipótesis estadísticas, también llamada de datos confirma el

El propósito de la prueba de hipótesis es determinar si un valor propuesto

PRUEBA DE HIPOTESIS PARA LA MEDIA

Se trata de probar una afirmación sobre parámetros de la población (media ;

En vez de estimar el valor de un parámetro, a veces se debe decidir si una

PRUEBA DE HIPOTESIS PARA UNA PROPORCION

Cuando el objetivo del muestreo es evaluar la validez de una afirmación con

Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una

PRUEBAS DE HIPÓTESIS PARA DOS PROPORCIÓN.

El objetivo de una prueba de dos muestras es determinar si las dos muestras

El valor calculado para , está en la región de aceptación de la hipótesis nula. Por

2. INVESTIGUE Y ANALICE QUE SE ENTIENDE POR BONDAD DE

La bondad de ajuste de un modelo estadístico describe lo bien que se ajusta un

3. INVESTIGUE Y ANALICE QUE SE ENTIENDE POR TABLAS DE

4. INVESTIGUE Y ANALICE CADA UNA DE LAS PRUEBAS DE HIPÓTESIS

PRUEBA DE HIPOTESIS PARA UNA VARIANZA

Es un procedimiento para juzgar si una propiedad que se supone cumple una

Cuando se analizan variables cuantitativas, a menudo es importante sacar

Para poder comparar la igualdad de las varianzas de dos poblaciones

 n1 = tamaño de la muestra del grupo 1

Prueba de una hipótesis acerca de dos varianzas poblacionales: pruebas de una y

Al probar la razón de dos varianzas de la población, como ocurrió en el caso de la

 Expresar la hipótesis nula

Cualquier investigación estadística implica la existencia de hipótesis o

 Expresar la hipótesis alternativa

La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis

 Especificar el nivel de significancia

Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando es

Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de

 Determinar el tamaño de la muestra

El tamaño muestral dependerá de decisiones estadísticas y no estadísticas,

Antes de calcular el tamaño de la muestra necesitamos determinar varias cosas:

a) Tamaño de la población. Una población es una colección bien definida de

 Establecer los valores críticos que establecen las regiones de rechazo de

Habiendo especificado la hipótesis nula, el nivel de significancia y la estadística

Luego determinar el valor real de la estadística de prueba. Por ejemplo, al

Tomar la decisión. Se compara el valor observado de la estadística muestral

 Determinar la prueba estadística.

La estadística de prueba puede ser la estadística muestral (el estimador no

 Coleccionar los datos y calcular el valor de la muestra de la prueba

Cuando se identifican los datos que se necesitan para responder a sus

a) Datos cuantitativos son usualmente medidos y expresados por números

El valor de la muestra es el número de sujetos que componen la muestra extraída

 Determinar si la prueba estadística ha sido en la zona de rechazo a una de

La distribución apropiada de la prueba estadística se divide en dos regiones:

Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el

 Determinar la decisión estadística.

 Expresar la decisión estadística en términos del problema.

6. INVESTIGUE Y ANALICE LA CORRELACIÓN ENTRE LAS VARIABLES.

La correlación entre dos variables se refiere al grado de parecido o variación

7. INVESTIGUE Y ANALICE EL DIAGRAMA DE DISPERSIÓN MEDIANTE

El diagrama de dispersión permite analizar si existe algún tipo de relación entre

El diagrama de dispersión es una herramienta gráfica que ayuda a identificar la

Coeficiente de correlación lineal

La correlación, también conocida como coeficiente de correlación lineal (de

 Cov (x;y): la covarianza entre el valor “x” e “y”.

El coeficiente de determinación, denominado R² y pronunciado R cuadrado, es

Es una técnica estadística utilizada para estudiar la relación entre variables. A