Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DEFINICION: La Estadística es una ciencia con base matemática referente a la recolección, análisis e
interpretación de datos, numéricos o no, a través del método científico con el fin de contribuir a tomar
decisiones racionales. En su origen, la estadística estuvo asociada a datos utilizados por el gobierno y
cuerpos administrativos, actualmente es aplicable en una amplia variedad de disciplinas
CONCEPTOS BASICOS:
- MUESTRA ESTUDIADA: Es el grupo de elementos en el que se recogen los datos y se realizan las
observaciones, debe ser un subconjunto representativo de la población, accesible y limitado.
- ESTADISTICO: Es una medida descriptiva que resume una característica de una muestra de la
población.
RAMAS DE LA ESTADISTICA
ESTADISTICA DESCRIPTIVA
- CENSO: Recuento de individuos que conforman una población estadística, definida como un
conjunto de elementos de referencia sobre el que se realizan las observaciones. Consiste en
obtener el numero total de individuos mediante diversas técnicas de recuento. Trabaja sobre la
población muestral.
- MUESTRA: Es el grupo de sujetos que se utilizaran como objeto de estudio en una investigación.
Estudiar muestras en lugar de poblaciones ahorra tiempo y costos, sirve cuando es inaccesible
estudiar la población completa, aumenta la calidad del estudio, reduce la heterogeneidad de una
población al indicar criterios de inclusión y exclusión.
TIPOS DE MUESTRAS
CUALITATIVAS: Aquellas que no son susceptibles ESCALA NOMINAL: Se utiliza cuando las
de medición numérica. Representan cualidades y categorías de una variable cualitativa no tienen
atributos que se expresan en categorías. naturalmente un orden establecido.
TABULACION DE DATOS
SERIE SIMPLE: Es un conjunto de pocos datos (generalmente n < 30 datos). Una forma adecuada de
representar y ordenar una serie simple es mediante el diagrama de tallo y hojas.
DIAGRAMA DE TALLO Y HOJAS: Cada número se divide en dos partes, una que llamaremos
"Tallo", formado por uno o más dígitos principales (cifras más significativas), ubicados a la izquierda del
número y la otra denominada "ramas u hojas”, resto de los números (cifras secundarias) ubicadas a la
derecha.
Objetivos: Representación visual de la información, descubrir un patrón de comportamiento de los
datos, identificar si hay valores extremos o datos anormales en la muestra.
DISTRIBUCIONES DE FRECUENCIA: Es una tabla de resumen en la que los datos se agrupan o
arreglan en clases o categorías ordenadas en forma numérica, establecidas de modo conveniente.
- Datos agrupados sin intervalos: se utiliza cuando la variable, sea discreta o continua, presenta
pocos valores diferentes entre sí, repetidos muchas veces cada uno.
- Datos agrupados en intervalos: se utiliza esta forma de distribución de frecuencias, cuando la variable,
sea discreta o continua, presenta muchos valores diferentes entre sí repetidos muchas veces.
-
REPRESENTACION GRAFICA
Variable cuantitativa:
El gráfico de barras adyacentes constituye el histograma de frecuencias absolutas, y la línea quebrada que
une los puntos medios de los lados superiores de los rectángulos es el polígono de frecuencias absolutas.
FRECUENCIAS RELATIVAS: Se utilizan para saber qué proporción o porcentaje de observaciones tiene
un determinado valor, o están comprendidas en un intervalo determinado, respecto al total de las observaciones
realizadas. Se simboliza ri y se obtiene dividiendo la frecuencia absoluta por n. ri= fi/ n
REPRESENTACION GRAFICA:
- En datos agrupado con intervalos: La representación gráfica es un diagrama con una línea curva
llamado polígono de frecuencias acumuladas u “ojiva”. Si se genera un gráfico con ambos tipos
de frecuencias acumulativas, el punto de intersección de las ojivas corresponde a la Mediana.
DIAGRAMA DE CAJA O BOXPLOTS: Es un gráfico que basado en cuartiles que suministra información
sobre la mediana, el cuartil Q1 y Q3, la existencia de valores atípicos y la simetría de la distribución.
Este diagrama se usa cuando se necesita la mayor información acerca de la distribución de los datos.
La ventaja que posee con respecto a los demás diagramas es que este grafico posee características como
centro y dispersión de los datos, y la principal desventaja que posee es que no presenta ninguna
información acerca de las frecuencias que presentan los datos.
MEDIDAS DESCRIPTIVAS
MEDIDAS DE TENDENCIA CENTRAL: Indican los valores centrales de la variable hacia los cuales tienden
a agruparse las observaciones. Comúnmente se los llama promedios.
MEDIANA: Aquel valor que divide Su aplicación se ve limitada ya que solo considera el orden
al conjunto en dos partes iguales, jerárquico de los datos y no alguna propiedad propia de los datos.
de forma que el numero de Los valores extremos no tienen efectos importantes sobre esta
valores mayor o igual a la Es de cálculo rápido e interpretación sencilla
mediana es igual al número de Calculable, aunque el intervalo inferior o superior no tenga limites
valores menores o igual a estos. Es difícil de utilizar en inferencia estadística.
MODA: Es el valor mas frecuente. No tiene sentido en muestras pequeñas en las que la aparición de
coincidencias en los valores es con gran frecuencia mas producto
del azar que de otra cosa.
Su cálculo es simple, pero es el estadístico de mayor varianza.
Puede no existir y cuando existe no es necesariamente única.
MEDIA GEOMETRICA: La media Se usa para promediar porcentajes, índices y cifras relativas
geométrica de un conjunto de n Se usa para determinar el incremento porcentual promedio en
números positivos se define ventas, producción o series económicas de un periodo a otro.
como la raíz enésima del El logaritmo de la media geométrica es igual a la media aritmética
producto de los n números. de los logaritmos de los valores de la variable.
Considera todos los valores de la distribución y es menos sensible
que la media aritmética a los valores extremos.
Es difícil de calcular e interpretar.
Otras medidas de posición: CUARTILES: Separa en cuatro partes iguales el conjunto ordenado
de observaciones, cada división se conoce como Cuartil.
QUINTILES: Separa en cinco partes iguales la población.
DECILES: Separan en diez partes iguales la población.
PERCENTILES: Separa en cien partes iguales la población
MEDIDAS DE DISPERSIÓN: Miden la cantidad de variación, desperdigamiento o diseminación de los
datos alrededor de los valores centrales.
COEFICIENTE DE VARIACIÓN: Es una medida de dispersión relativa de los datos que permite comparar
la dispersión o variabilidad de dos o más grupos y se calcula dividiendo la desviación típica muestral
por la media y multiplicando por 100.
DESVIACIÓN MEDIA: Es la media aritmética de las desviaciones absolutas de los valores de la variable
con respecto a la media.
MEDIDAS DE DISTRIBUCION: Describen la manera en que los datos tienden a reunirse de acuerdo con
la frecuencia con que se hallen dentro de la información.
TABLAS ESTADISTCIAS: Son más útiles que los gráficos cuando se desea obtener un valor exacto de los
hechos, ya que la gráfica solo aporta una aproximación del valor.
- Tablas para propósitos generales: Proporcionan información para referencia o uso general,
sirven como deposito de información. Incluyen información detallada.
- Tabla para propósitos especiales: Proporcionan información para una exposición particulares.
Debe ser diseñada de manera que un lector pueda dirigirse fácilmente a la tabla para
comparación, análisis o énfasis concerniente a la exposición particular.
Partes principales:
- Título: Es una descripción del contenido de a la tabla o del cuadro. Debe ser compacto y
completo.
- Concepto o columna matriz: Usualmente representan las clasificaciones de las cifras incluidas en
el cuerpo de la tabla. Pueden dividirse en subconceptos de ser necesario.
- Cuerpo: Es el contenido de los datos estadísticos que están arreglados de acuerdo a las
descripciones o clasificaciones de los encabezados y conceptos.
- Nota de encabezado: Se usan para explicar ciertos puntos relacionados con la tabla completa
que no han sido incluidos en el titulo ni en los encabezados ni en los conceptos.
- Nota de pie: Son usadas para clarificar algunas partes incluidas en la tabla que no son explicadas
en otras partes.
GRAFICOS: Proporcionan una apreciación integral del fenómeno en estudio y permite sacar
conclusiones a simple vista que difícilmente podrían extraerse de un cuadro estadístico.
Partes de un gráfico:
- Título: Es una descripción del contenido del gráfico. Debe ser compacto y completo.
- Escalas: Es la relación entre la unidad del dibujo y de la variable que desea representarse.
- Diagramas: Son los dibujos que se utilizan para representar gráficamente los datos estadísticos;
pueden ser líneas, barras, áreas geométricas, símbolos, mapas, etc.
- Fuente: La Fuente es una nota que indica de donde provienen los datos tomados como base para
construir la gráfica. Se colocará en la parte inferior de la gráfica.
TIPOS DE GRAFICOS:
Gráficos de LINEAS: Se utilizan para graficar la evolución de la variable a través del tiempo. En un
sistema de ejes coordenados se hace corresponder al eje de abscisas el tiempo y al eje de ordenadas se
hace corresponder la variable cuya evolución se estudia.
Gráfico de FAJAS: Este tipo de gráfico se utiliza para representar la evolución de un fenómeno y de sus
partes componentes. Una variante son las fajas porcentuales.
Gráficos de BARRAS O BASTONES: Se utilizan cuando se trata de representar atributos que no tienen
variación continua. Las barras son rectángulos, cuyo ancho es el mismo para todas las barras dibujadas,
mientras que la longitud de cada barra indica los datos representados. Hay espacios de igual amplitud
entre barras individuales, pudiendo ser esa amplitud desde la mitad del ancho de las barras hasta el
ancho mismo de las barras. Pueden ser verticales u horizontales, superpuestas, comparativas, etc.
- Las gráficas de barras son efectivas para enfatizar unos pocos ítems de una o dos series de
datos, mientras que las gráficas de líneas son preferibles para representar muchos ítems en una
o varias series de datos.
- Los gráficos de barras enfatizan las diferencias entre ítems individuales, pero los gráficos de
líneas enfatizan los cambios continuos o tendencia general entre los ítems.
- Las gráficas de barras son usadas frecuentemente para representar datos clasificados mediante
cualquier base, las gráficas de líneas se usan principalmente para representar datos clasificados
por tiempo, o sea, series de tiempo o series cronológicas.
- Se necesita más tiempo para dibujar barras en una gráfica de barras que para marcar puntos y
conectarlos mediante líneas rectas en una gráfica de líneas.
Gráficos de SILUETAS: Son especialmente útiles para representar las variaciones positivas y negativas
respecto de un valor fijo. Pueden ser verticales u horizontales.
Gráficos ANGULARES: Se utilizan en casos especiales para representar datos mensuales en el transcurso
de un año. Se construyen trazando una circunferencia cuyo radio es equivalente al promedio aritmético
de los valores observados, los cuales se representan gráficamente sobre 12 radios vectores
correspondientes a cada uno de los meses del año. Luego se unen los puntos obtenidos con una línea
quebrada.
Gráfico en Z: El gráfico en Z consiste en representar datos mensuales, conjuntamente con los datos
acumulados en el año y totales acumulados procedentes de años anteriores. Se necesitan dos escalas,
una para los datos mensuales y acumulados del año y otra para los acumulados totales. Se utiliza el
diagrama de líneas para representar cada ítem
NUMEROS INDICES: Es una cifra descriptiva del cambio en el volumen de un agregado dado con el
tiempo o de un lugar a otro. Los números índices relacionan una o varias variables de un periodo dado
con la misma variable o variables en otro periodo, llamado periodo base.
CLASIFICACIÓN:
INDICES UNIVEARIABLES: Su función principal es transformar las magnitudes absolutas de una variable
en un numero relativo, para facilitar la comparación de los cambios en la variable con el transcurso del
tiempo. Se los suele llamar precios relativos y cantidades relativas. La variación porcentual representa el
cambio registrado en una variable entre dos periodos en cifras porcentuales.
INDICES COMPUESTOS:
INDICES SIMPLES
ÍNDICES AGREGADOS: Un índice Considera a cada articulo como de igual importancia por lo que los
de precios agregado simple para artículos mas costosos tienen influencia excesiva.
el periodo n, es el cociente Carece de sentido cuando los precios están referidos a distintas
entre la suma de precios en unidades del producto.
dicho periodo y la suma de
precios en el periodo base,
expresado como un porcentaje.
PROMEDIOS DE RELATIVOS: Evitan la dificultad de estar influidos por las unidades en que se
Pueden ser aritmético o cotizan los precios o por el nivel absoluto de los precios individuales.
geométrico. Se construyen Al considerar todos los relativos igualmente importantes no son
calculando promedios de los significativos como medida de la forma en la cual los cambios en los
relativos de precios o de precios afectan grandes grupos de consumidores.
cantidades. Sufren la influencia excesiva de grandes aumentos en porcentaje de
los precios.
INDICES PONDERADOS: Una ponderación representa la importancia relativa del articulo con respecto
a los otros artículos incluidos en el cálculo. Los números índices mejoran sensiblemente cuando se
introducen en su construcción sistemas de ponderación apropiados.
ÍNDICE DE PONDERACION FIJA: Evitan los sesgamientos de precios inherentes en los índices de
Establecidas en un punto Laspeyres y Paasche, y permiten una comparación directa entre
particular en el tiempo o un periodo y otro de los movimientos de precios, además de las
desarrolladas como un promedio comparaciones entre cada periodo y la base. R
de varios periodos de tiempo.
ÍNDICE IDEAL DE FISHER: Mientras que el índice de Laspeyres tiende a dar mayor peso a los
Es el promedio geométrico entre artículos cuyos precios aumentaron y el Índice de Paasche tiende
el Índice de Laspeyres y el Índice a restar peso a los artículos cuyos pesos aumentaron; el Índice
de Paasche. ideal de Fisher corrige esas tendencias y logra un índice más real.
INDICES DE PROMEDIOS DE RELATIVOS: Se calculan de la misma manera que los índices promedios
simples de relativos, con la variante de que se introducen ponderaciones apropiadas. Las fórmulas son
idénticas a las de los índices agregados ponderados.
Cambio de base: Se debe procurar que el período base elegido sea lo más representativo posible, y no
muy alejado del período actual. Cuando dicho período base pierde representatividad con el tiempo, es
necesario cambiarlo por uno más reciente. Para obtener los números índices con el período base
cambiado, se utiliza el método de la regla proporcional, que consiste en: “dividir cada uno de los índices
anteriores por el índice correspondiente al nuevo período base, y multiplicando por 100”.
Empalme de índices: Cuando las ponderaciones de un número índice quedan inadecuadas, se puede
obtener otro índice con nuevas ponderaciones. Así se presenta el problema de empalmar las dos series
de números índices a partir del nuevo periodo base. Se debe establecer que la nueva serie de índices
tenga un valor de 100 en el período base nuevo deseado, y se compara con el valor correspondiente a la
serie de índices antigua para el mismo período. Se puede reconstruir la nueva serie de índices hacia
atrás en el tiempo, utilizando la ecuación de cambio de base.
- Poder adquisitivo del dinero: Se obtiene mediante la inversa del índice de precios al
consumidor. A medida que aumenta el IPC, disminuye el poder adquisitivo del dinero.
- Salario real: Para medir el poder de compra del salario en dinero puede deflacionarse mediante
el índice de precios al consumidor.
- Deflación estadística: Es un método mediante el cual los efectos de los cambios de precios en los
valores de vienes y servicios se eliminan empleando un índice adecuado de precios denominado
deflactor. La técnica de la deflación implica dividir los montos monetarios nominales por el IPC
elegido como deflactor adecuado
- Actualización de montos monetarios de un periodo anterior: Consiste en determinar un
coeficiente de actualización mediante el cociente entre el índice de precios del periodo actual y
el índice de precios vigente al momento de contraer la deuda, y ese coeficiente se multiplica por
el monto inicial de la deuda.
PROBABILIDAD
EXPERIMENTOS O FENOMENOS ALEATORIOS: Son los que pueden dar lugar a varios resultados, sin que
puede ser previsible enunciar con certeza cuál de estos va a ser observado en la realización del
experimento.
ESPACIO MUESTRAL: Es el conjunto formado por todos los posibles resultados de un experimento
aleatorio, es decir, es el conjunto de todos los puntos muestrales. Se designa S.
SUCESO ALEATORIO: Es un acontecimiento que ocurrirá o no, dependiendo del azar. Es un subconjunto
del espacio muestral. Cada uno de los subconjuntos del espacio muestral S es un suceso.
- Unión: Es el suceso formado por todos los elementos de A y todos los elementos de B.
- Intersección: Es el suceso formado por todos los elementos que son, a la vez, de A y de B.
DEFINICION DE PROBABILIDAD:
TEORÍA CLASICA - Definición de Laplace: En el caso de que todos los sucesos elementales del espacio
muestral E sean equiprobables, Laplace define la probabilidad del suceso A como el cociente entre el
numero de resultados favorables a que ocurra el suceso A en el experimento y el numero de resultados
posibles del experimento.
- Ley de no negatividad
- Ley de complementación
Sucesos independientes: Decimos que dos sucesos A y B son independientes entre sí si la ocurrencia de
uno de ellos no modifica la probabilidad del otro. Cuando la selección aleatoria es con reposición.
Sucesos dependientes: Decimos que dos sucesos A y B son dependientes entre sí si la ocurrencia de uno
de ellos modifica la probabilidad del otro. Cuando la selección aleatoria es sin reposición.
PROBABILIDAD TOTAL
SISTEMA COMPLETO DE SUCESOS: Una familia de sucesos que no se intersectan entre sí y que entre
todos ellos forman el suceso seguro.
TEOREMA DE LA PROBABILIDAD TOTAL: Sea un sistema completo de sucesos tales que la probabilidad
de cada uno de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las
probabilidades condicionales P(B/A), entonces la probabilidad del suceso B viene dada por la expresión:
TEOREMA DE BAYES: Sea un sistema completo de sucesos, tales que la probabilidad de cada uno de
ellos es distinta de cero, y sea B un suceso cualquiera del que se conocen las probabilidades
condicionales P(B/A), entonces la probabilidad P(A/B) viene dada por la expresión:
FUNCIÓN DE PROBABILIDAD: Asigna probabilidades a cada uno de los valores de la variable aleatoria
discreta, la suma de todas las probabilidades es igual a 1.
- VALOR ESPERADO DE UNA VARIABLE ALEATORIA: Es un promedio pesado de los resultados que
se esperan en el futuro, caracteriza la posición de la distribución de probabilidades y su fórmula
de cálculo depende del tipo de variable aleatoria.
DISTRIBUCION En cada prueba solo son posibles dos resultados, éxito y fracaso.
BINOMIAL Los resultados son independientes entre sí.
La probabilidad de un suceso A es constante.
DISTRIBUCION Cada prueba tiene más de dos posibles resultados mutuamente excluyentes.
MULTINOMIAL La distribución binomial es un caso particular de distribución multinomial.
DISTRIBUCION DE Cuenta éxitos que ocurren en un intervalo del espacio o del tiempo.
POISSON Probabilidad de éxito proporción al tamaño del espacio o del tiempo.
La suma de variables Poisson independientes es otra Poisson con media igual a
la suma de las medias.
La probabilidad de éxitos en una región del tiempo o del espacio tiende a cero a
medida que se reducen las dimensiones de la región en estudio.
Las variables Poisson típicas son variables en las que se cuentan sucesos raros.
FUNCION DE DENSIDAD: En la función de densidad la probabilidad viene dada por el área bajo la curva
cuyo valor es 1 y la probabilidad de sucesos puntuales es 0.
DISTRIBUCION NORMAL: Una variable es normal cuando se ajusta a la ley de los grandes números, es
decir, cuando sus valores son el resultado de medir reiteradamente una magnitud sobre la que influyen
infinitas causas de efecto infinitesimal. Esta distribución es usada frecuentemente en las aplicaciones
estadísticas debido a la frecuencia o normalidad con la que ciertos fenómenos tienden a parecerse en su
comportamiento a esta distribución. (Caracteres morfológicos, fisiológicos, psicológicos, etc.…)
Las variables normales tienen una función de densidad con forma de campana a la que se llama
Campana de Gauss. La curva normal cumple las siguientes propiedades:
DISTRIBUCION NORMAL TIPIFICADA (Z): Cualquiera que sea la variable X, se puede establecer una
correspondencia de sus valores con los de otra variable con distribución normal, media 0 y varianza 1, a
la que se llama variable normal tipificada o Z. La transformación de la variable X en la variable Z produce
el efecto de reducir Z a unidades en términos de desviaciones estándares alejadas de la media.
DISTRIBUCIONES MUESTRALES: Dada una población finita de tamaño N o infinita, si en ella se definen
variables, X, Y, …. Y se extraen muestras aleatorias de igual o distinto tamaño ni, las estadísticas
calculadas con las observaciones muestrales varían de una muestra a otra, por lo tanto, son variables
aleatorias con una determinada distribución de probabilidad.
DE LA DIFERENCIA DE Se consideran dos poblaciones distintas, en las cuales se define una variable
DOS MEDIAS con distribución normal y se extraen muestras aleatorias independientes de
tamaños n1 y n2, y se estiman los parámetros.
Se define una variable diferencia Δμ = μ1 – μ2 en la población, con las
observaciones muestrales con: Δx = X1 – X2.
INFERENCIA ESTADISTICA: La teoría clásica de la inferencia estadística se refiere a los métodos por los
cuales se selecciona una muestra aleatoria de una población, y basándose en las observaciones
muestrales se obtienen conclusiones con respecto a toda la población.
Tiene dos aspectos principales: Estimación de parámetros parámetros, puntual y por intervalos de
confianza, y prueba de hipotesis.
ESTIMACION PUNTUAL: Consiste en estimar el valor del parámetro desconocido con un solo numero
ESTIMADOR PUTUAL: Es una función de las observaciones muestrales, que no se debe incluir al
parámetro desconocido ni depender de él. Puede definírselo como una regla que indica como calcular la
estimación basándose en las observaciones muestrales y generalmente expresado mediante una
fórmula matemática.
INSESGABILIDAD DE Un estimador será tanto mas eficiente cuando menos varíe de muestra a
VARIANZA MINIMA muestra de una misma población. Dados dos estimadores insesgados de un
O EFICIENCIA parámetro uno es mas eficiente si su varianza es menor
TAMAÑO DE LA MUESTRA: Depende del nivel de confianza que se desee para los resultados y de la
amplitud del intervalo de confianza, es decir, del error máximo que se este dispuesto a admitir.
PRUEBA DE HIPOTESIS: Sirve para decidir si una afirmación relativa a un parámetro es verdadera o falsa.
Para llegar a una conclusión el tomador de decisiones querrá cerciorarse de que ha tomado la decisión
correcta, basada en la información que le brinda una muestra aleatoria extraída de la población de
interés. Para ello deberá probar hipotesis con respecto a los parámetros de interés.
ETAPAS DE UNA PRUEBA DE HIPOTESIS
- Prueba bilateral o de dos colas: Cuando el valor de un parámetro puede ser demasiado pequeño
o demasiado grande para algún fin especifico.
REALIZACION DE CALCULOS: Se calculan los valores del estadístico de prueba y su desviación estándar,
de tal manera que el estadístico de prueba estandarizado pueda compararse con el valor o los valores
críticos.
CONCLUSION: En esta etapa se debe interpretar la decisión tomada en la etapa anterior en términos del
problema particular que se intenta resolver mediante una prueba de hipotesis estadística. Es decir, se da
respuesta al problema.
En el estudio de la asociación entre variables hay dos aspectos distintos pero relacionados:
CLASIFICACION:
ESTIMACION POR ASOCIACION: Si puede establecerse una relación media entre las variables, en cierta
forma matemáticamente funcional, se puede estimar con mucha precisión, en promedio, el valor de una
de las variables sobre la base de la otra u otras.
DIAGRAMA DE DISPERSION DE LOS DATOS OBSERVADOS: Consiste en una representación grafica de los
pares ordenados en un sistema de coordenadas cartesianas, donde en el eje de abscisas se colocan los
valores de X y en el eje de ordenadas los valores de la variable Y.
ANALISIS DE REGRESION BIVARIABLE LINEAL: Una variable Y, dependiente, se relaciona con una
variable X, independiente, por la siguiente expresión.
Yi = (α + β Xi) + ε i
sistemática estocástica
SUPUESTOS BASICOS:
1- La variable independiente X toma valores fijados por el investigador y para cada valor existe una
subpoblación de valores Y con distribución normal.
2- El error εi es una variable aleatoria cuya distribución de probabilidades se supone que es normal.
3- La varianza condicional de Y dada por X se llama varianza de la regresión y es constante para
todo X e igual a la varianza del error.
4- La variable εi es independiente de xi, y de otra εj
En estas dos ecuaciones “y” y “y” indican el valor individual de Y y el valor calculado de Y,
respectivamente.
METODO DE MINIMOS CUADRADOS: Busca el mejor estimador insesgado lineal. Selecciona valores
para “a” y “b” que minimizan la suma de cuadrados de las diferencias entre los valores realmente
observados y los valores estimados. Esto significa que las estimaciones a y b proporcionan la ecuación
de la recta de regresión de Y sobre X, que “pasa más cerca de todos los puntos” del diagrama de
dispersión.
ANALISIS DE REGRESION LINEAL MULTIPLE: Se manejan datos que constan de mas de dos coordenadas
constituidas por n observaciones, r variables independientes y una variable dependiente.
SUPUESTOS BASICOS
VARIACIONES Cuando aparecen hechos o imprevistos que afecten las variables en estudios que no
RESIDUALES O se pueden prever, provocadas por factores externos y aleatorios.
IRREGULARES
ANALISIS DE LA TENDENCIA: Se puede hacer por método grafico o de mano alzada, trazando una línea
que ajuste la tendencia, pero resulta impreciso. También se puede hacer a través del método de las
medias móviles, calculando las medias y luego uniéndolas, aunque esto produce un suavizado de la
tendencia que no permite determinar una función matemática.