Resumen Teórico Estadistica Superior

TEORÍA
ESTADÍSTICA SUPERIOR
UNIDAD Nº 1
PRUEBA SOBRE LA MEDIA (1 MUESTRA): CON n≤30
FORMULACION DE FORMULA DISTRIBUCIÓN

HIPOTESIS
Puede ser:
1. BILATERAL:
H0: µ= µ0
H1: µ‡ µ0
2. UNILATERAL DE
EXTREMO
DERECHO:
H0: µ > µ0
Es simétrica.
UNILATERAL DE
Distribución t con gl= (n-1); donde
EXTREMO
gl= grados de libertad.
IZQUIERDO:
H1: µ < µ0
PRUEBA SOBRE LA MEDIA (1 MUESTRA): CON n>30
FORMULACION DE HIPOTESIS FORMULA DISTRIBUCIÓN

Puede ser: Es simétrica. Distribución Z
1. BILATERAL: normal.
H0: µ= µ0
H1: µ‡ µ0
2. UNILATERAL DE
EXTREMO DERECHO:
H0: µ > µ0
UNILATERAL DE
EXTREMO IZQUIERDO:
H1: µ < µ0
PRUEBA DE COMPARACION DE MEDIAS (2 MUESTRAS): MUESTRAS INDEPENDIENTES
CON n>30:
FORMULACION DE FORMULA DISTRIBUCION

HIPOTESIS
Puede ser:
1. BILATERAL:
H0: µ1= µ2
H1: µ1‡ µ2
2. UNILATERAL DE
Es
EXTREMO DERECHO:
simétrica. Distribución Z
H0: µ1 > µ2
normal.
UNILATERAL DE
EXTREMO
IZQUIERDO:
[1]
TEORÍA
H1: µ1< µ2
CON n≤ 30:

HIPOTESIS
Puede ser:
1. BILATERAL:
H0: µ1= µ2
H1: µ1‡ µ2
2. UNILATERAL
DE EXTREMO
Es simétrica.
DERECHO:
H0: µ1 > µ2
UNILATERAL
La 1º formula es para calcular el estadístico t Distribución
DE EXTREMO
(los subíndices x e y, pueden ser t con gl= (n1+n2-2).
IZQUIERDO:
reemplazados por 1 y 2, respectivamente, que
H1: µ1< µ2
indican las muestras).
La 2º formula es para calcular ∂, que se
necesita para la 1º formula (los subíndices x e
y, pueden ser reemplazados por 1 y 2,
respectivamente, que indican las muestras).
PRUEBA DE COMPARACION DE MEDIAS (2 MUESTRAS): MUESTRAS DEPENDIENTES O

APAREADAS

HIPOTESIS
Puede ser:
1. BILATERAL:
H0: µd= D0
H1: µd‡ D0
2. UNILATERAL DE
Es
EXTREMO DERECHO:
simétrica.
H0: µd > D0
Distribución t con gl= (n-1)
UNILATERAL DE
EXTREMO IZQUIERDO:
H1: µd< D0
PRUEBA SOBRE LA VARIANZA (CON UNA MUESTRA)

HIPOTESIS
Puede ser: Es asimétrica.
1. BILATERAL: Con gl= (n-1).
H0: ∂2= ∂20 DISTRIBUCIÓN CHI-CUADRADO.
H1: ∂2‡ ∂20
[2]
TEORÍA
2. UNILATERAL
DE EXTREMO
DERECHO:
H0: ∂2> ∂20
UNILATERAL
DE EXTREMO
IZQUIERDO:
H1: ∂2< ∂20
PRUEBA DE COMPARACION DE VARIANZAS (CON 2 MUESTRAS)

HIPOTESIS
Puede ser: Es asimétrica.
1. BILATERAL: Con gln= (n1-1) y gld= (n2-1)
H0: ∂21= ∂22 DISTRIBUCIÓN F.
H1: ∂21‡ ∂22
2. UNILATERAL DE
EXTREMO
DERECHO:
H0: ∂21> ∂22
UNILATERAL DE
EXTREMO
IZQUIERDO:
H1: ∂21< ∂22
PRUEBA CHI-CUADRADO DE BONDAD DE AJUSTE
FORMULACION FORMULA DISTRIBUCION

DE HIPOTESIS
Puede ser:
H0= la DISTRIBUCIÓN CHI-CUADRADO CON gl=
variable….tiene (k-p-1).
distribución….
H1= la
variable….no
tiene
distribución…
[3]
TEORÍA
ACLARACIONES Y ASPECTOS IMPORTANTES DE TODO LO EXPUESTO

ANTERIORMENTE:
1. La t de STUDENT es una distribución de probabilidades p/ variable aleatoria continua,

y esta tabulada en función del nivel de significación y de su único parámetro: los
GRADOS DE LIBERTAD. La forma de la distribución es bastante similar a la NORMAL
ESTANDAR, ya que es simétrica y con media 0. Los grados de libertad definen una flia
de curvas, y cuando los gl aumentan la t de student tiende a la normal estandarizada.
Los GRADOS DE LIBERTAD representan el nº de variables que se pueden elegir
libremente.
2. La DISTRIBUCIÓN CHI-CUADRADO con n-1 gl es una distribución definida solo p/

valores positivos. Viene tabulada en función del nivel de significancia y de los gl. De
acuerdo al valor de los gl tenemos una flia de curvas: cuando el valor del parámetro es
pequeño la distribución tiene asimetría positiva, pero a medida que los gl crecen la
distribución se va haciendo c/ vez más simétrica.
3. Una situación que se da frecuentemente en la práctica es la de disponer de una

muestra de observaciones de una variable aleatoria, y se debe comprobar si proviene
de una población con tal distribución. P/ resolver este tipo de problemas, es necesario
emplear alguna de las denominadas PRUEBA DE BONDAD DE AJUSTE. La misma
clasifica dentro de los métodos no parametricos: la prueba de
KOLMOGOROV-SMIRNOV. Se trata de un procedimiento que compara las
distribuciones de frecuencias acumuladas teóricas y observadas. Da buenos Rtdos
cuando las muestras son pequeñas y no se pueden aplicar otras metodologías. Su
principal inconveniente es que el estadístico de prueba empleado no tiene una
distribución conocida, lo que limita la precisión del método.
Cuando disponemos de un mayor nº de datos, conviene usar la denominada PRUEBA

CHI-CUADRADO DE BONDAD DE AJUSTE. Este procedimiento compara las
distribuciones de frecuencia observada (calculada a partir de los datos reales) y
esperada (calculada en base al modelo propuesto).
Si las discrepancias entre el modelo teórico y la realidad no son grandes, se asume

que el modelo representa adecuadamente el comportamiento de la variable
considerada.
Esta es una prueba de un solo extremo, específicamente una PRUEBA UNILATERAL

DERECHA, que se puede usar p/ verificar la distribución de variables discretas y
continuas.
El estadístico tiene distribución chi-cuadrado con (k-p-1) gl, donde k representa el nº de

valores que toma la variable (si es discreta) o el nº de intervalos en que se agrupan los
datos (si es continua), mientras que p es el nº de parámetros del modelo, generalmente
estimados en base a la muestra disponible.
El estadístico de prueba es muy sensible a los valores extremos (en las colas de la
distribución) por lo que es recomendable no trabajar con clases cuya frecuencia
esperada sea menor a 5. Cuando esto ocurre, se pueden agrupar clases contiguas.
Los Rtdos de la prueba no se ven afectados por el uso de intervalos o clases de

distinta amplitud.
[4]
TEORÍA
OBJETIVO: evaluar si una distribución de probabilidad en particular, como la

BINOMIAL, POISSON O NORMAL es la apropiada.
4. La DISTRIBUCIÓN F es una distribución de probabilidad p/ variable continua usada en

inferencia cuando se deben comparar varianzas. Esta distribución esta definida solo p/
valores positivos, y tiene 2 parámetros: los gl en el numerador y los gl en el
denominador. P/ valores bajos, la distribución tiene una fuerte asimetría positiva, pero a
medida que los gl crecen la curva se va haciendo c/ vez más simétrica.
5. MUESTRAS INDEPENDIENTES: son aquellas tomadas de 2 poblaciones diferentes.
6. MUESTRAS DEPENDIENTES: son aquellas cuyos valores están equiparados entre si,
o apareados.
7. PASOS P/ LA CONSTRUCCION DE UNA PRUEBA ESTADISTICA DE HIPÓTESIS :
● Formular las hipótesis nula y alternativa.
● Construir un estadístico que involucre al parámetro de interés y a su estimador.
● Identificar la distribución muestral del estadístico de la prueba.
● Encontrar los puntos críticos en función del nivel de significación elegido y el

tipo de contraste.
● Comparar el valor del estadístico con los puntos críticos y en función de ellos
aceptar o rechazar la hipótesis nula.
● Concluir en función de la situación problemática.
8. Una HIPÓTESIS ESTADISTICA es una proposición sobre los parámetros de un

modelo estadístico p/ la variable de rta. La hipótesis estadística que se somete a
prueba se conoce como HIPÓTESIS NULA.
Cuando la hipótesis nula se rechaza, entonces se concluye a favor de la hipótesis

alternativa. Tanto cuando no se rechaza la hipótesis nula como cuando se rechaza, es
posible cometer errores.
HIPÓTESIS NULA (H0): establece valores o relaciones p/ el o los parámetros de

interés.
HIPÓTESIS ALTERNATIVA (H 1): es una negación de la hipótesis nula.
[5]
TEORÍA
UNIDAD Nº 2
El ANALISIS DE CORRELACIÓN mide el grado de asociación que existe entre 2 variables.
La formula de la covarianza es:
Si la covarianza (COV o Cxy) es:
1. COV>0 indica que la relación lineal es positiva (+).
2. COV<0 indica que la relación lineal es negativa (-).
3. COV=0 indica que no hay relación.
La formula del coeficiente de correlación es:
Este coeficiente puede tomar valores entre -1 y 1:
1. Un r= 0 indica que no hay relación.
2. Un r= 1 indica una relación lineal exacta +.
3. Un r= -1 indica una relación lineal exacta -.
4. Un r >0 indica una relación lineal +.
5. Un r < 0 indica una relación lineal -.
Cuando r da un valor muy bajo, se plantea la necesidad de decidir h/ que punto se puede
pensar que el r no es significativamente ‡ 0, y por lo tanto que las variables no están
[6]
TEORÍA
relacionadas. Una forma de resolver esta cuestión es haciendo la siguientes PRUEBA DE

HIPÓTESIS SOBRE EL r:
FORMULACION DE FORMULA DISTRIBUCIÓN

HIPOTESIS
H0: P= 0
H1: P‡ 0
Es
simetrica.
Distribución t con gl= (n-2)
Tal prueba se aplica si n es pequeña.
Si no se rechaza H0, se estará comprobando que el r no es significativo, y por lo tanto no hay

relación entre las variables.
El ANALISIS DE REGRESION mide la relación que vincula a una variable dependiente con
una o varias variables independientes.
MÉTODO DE MÍNIMOS CUADRADOS: sus formulas son:
B también se puede calcular así: b= COV (x; y)/s2x
La verificación de la ecuación de estimación se puede hacer de estas 2 formas:
1. Examinando la grafica de los puntos de la muestra.
2. Calculando el error estándar de estimación (Se). Su formula es:
[7]
TEORÍA
Mientras más grande sea mayor será la dispersión de los puntos alrededor de la línea
de regresión.
Si es = a 0 indica que la ecuación de estimación es un estimador perfecto de la variable

dependiente (todos los puntos caerían sobre la línea de regresión).
Se mide a lo largo del eje Y y no perpendicularmente desde la línea de regresión.
El COEFICIENTE DE DETERMINACIÓN (R2) mide que tan bien X explica Y, esto es el grado
de asociación entre X e Y.
Su formula es:
Si es = a 1 indica ajuste perfecto.
Si es = a 0 indica que no hay ajuste.
Pendiente de la línea de regresión de la población, podemos usar el valor b p/ probar la

HIPÓTESIS RESPECTO AL VALOR DE B (PENDIENTE). De igual forma se usa el valor a p/
probar la HIPÓTESIS RESPECTO AL VALOR A (ORDENADA AL ORIGEN).
FORMULACION DE LA FORMULA DISTRIBUCIÓN

HIPOTESIS
P/ el valor b: P/ el valor b:
H0: β= 0 t= b/Sb
H1: β‡0 P/ el valor a:

Es simetrica.
P/ el valor a: t= a/ Sa
Distribución t con gl= n-2
H0: ∂= 0 S(b o a)= Se/√∑x2- n. x2 (la
ultima x es la media
H1: ∂‡0 aritmética)
Si no se rechaza H0 no hay RELACION DE CAUSALIDAD.
ACLARACIONES Y ASPECTOS IMPORTANTES DE TODO LO EXPUESTO

ANTERIORMENTE:
1. ANALISIS DE CORRELACIÓN: p/ explotar la posible vinculación entre 2 variables, el

1º paso consiste en dibujar el DIAGRAMA DE DISPERSION de los datos, que es un
grafico bidimensional en el cual se vuelcan los Rtdos de la observación conjunta de
ambas variables.
P/ determinar en FORMA ANALITICA el grado de asociación que existe entre las

variables, una alternativa es estudiar el grado de variación conjunta, o de
[8]
TEORÍA
COVARIACION, que existe entre las 2 variables. P/ ello se puede calcular una medida
analítica denominada COVARIANZA ENTRE X E Y. El signo de la covarianza indica el
tipo de asociación entre las 2 variables: un rtdo positivo indica covariación DIRECTA,
mientras que un valor negativo expresa covariación INVERSA. La magnitud de la
covarianza representa el grado de asociación entre x e y, a mayor valor de la
covarianza (en valor absoluto) mas fuerte es la asociación entre las 2 variables. Si la
covarianza es nula, significa que las variables no covarían (cuando una varia, la otra no
responde), es decir que son independientes entre si.
En términos prácticos, la covarianza es una cantidad difícil de interpretar. P/ salvar

estos inconvenientes se calcula una cantidad denominada COEFICIENTE DE
CORRELACIÓN.
2. La regresión y los análisis de correlación nos mostraran como determinar tanto la

naturaleza como la fuerza de una relación entre 2 variables.
3. REGRESION: proceso general de predecir una variable de otra.
4. REGRESION MÚLTIPLE: proceso mediante el cual se utilizan varias variables p/

predecir otra.
5. ANÁLISIS DE CORRELACIÓN: determina el grado en el que están relacionadas las

variables.
6. La regresión y los análisis de correlación se basan en la relación, o asociación, entre 2

o + variables.
7. Es importante considerar las relaciones encontradas por la regresión como relaciones

de asociación pero no necesariamente de causa y efecto. A menos que tenga razones
especificas p/ creer que los valores de la variable dependiente son ocasionados por los
valores de la variable independiente, no infiera causalidad de las relaciones que
encuentra mediante la regresión.
8. El análisis de correlación es la herramienta estadística que podemos usar p/ describir el

grado h/ el cual una variable esta linealmente relacionada con otra. Con frecuencia, el
análisis de correlación se usa junto con el análisis de regresión p/ medir que tan bien la
línea de regresión explica los cambios de la variable dependiente “Y”. Sin embargo, la
correlación también se puede usar sola p/ medir el grado de asociación entre 2
variables.
9. Los estadísticos han desarrollado 2 medidas p/ describir la correlación entre 2

variables: COEFICIENTE DE DETERMINACIÓN y COEFICIENTE DE
CORRELACIÓN.
10. COEFCIENTE DE DETERMINACIÓN: es la principal forma en que podemos medir la

extensión, o fuerza, de la asociación que existe entre 2 variables, X y Y.
Tal coeficiente se desarrolla de la relación entre 2 tipos de variación: la variación de los

valores Y en un conjunto de datos alrededor de:
● La línea de regresión ajustada.
● Su propia media.
[9]
TEORÍA
El término variación en estos 2 casos se usa en su sentido estadístico usual p/

significar la suma de un grupo de desviaciones cuadradas.
Tal coeficiente mide solo la fuerza de una relación lineal entre 2 variables.
11. COEFICIENTE DE CORRELACIÓN: indica la dirección de la relación entre las 2

variables X y Y.
12. PENDIENTE NEGATIVA, es decir b<0, relación INVERSA.

PENDIENTE POSITIVA, es decir b>0, relación DIRECTA.
Cuando la pendiente de la ecuación de estimación es POSITIVA, "r" es positiva; y
cuando la pendiente es NEGATIVA, "r" es NEGATIVA. Por tanto, el signo de "r" indica la
dirección de la relación entre las 2 variables X e Y:
● Si existe relación inversa, entonces "r" caerá entre 0 y -1.
● Si existe relación directa, entonces "r" será un valor en el intervalo de 0 y 1.
UNIDAD Nº 3
TENDENCIA SECULAR
Es el movimiento de la serie a largo plazo.
En un grafico seria:
P/ modelarla se usa el MÉTODO DE MÍNIMOS CUADRADOS.
Razones p/ el estudio de tendencias:
1. El estudio de tendencias seculares nos permite describir un patrón histórico.
2. El estudio de tendencias seculares nos permite proyectar patrones pasados o

tendencias, hacia el futuro.
3. En muchas situaciones, el estudio de la tendencia secular de una serie temporal nos

permite eliminar la componente de tendencia de una serie.
[10]
TEORÍA
Las tendencias pueden ser lineales o curvilíneas.
VARIACIÓN O FLUCTUACION CICLICA
Es la componente que tiende a oscilar por encima y por debajo de la línea de tendencia secular
en periodos mayores a un año.
El método p/ identificarla es el MÉTODO DE LOS RESIDUOS. Es decir, la variación cíclica se

mide con el MÉTODO DEL % DE TENDENCIA y el MÉTODO DEL RESIDUO CICLICO
RELATIVO. Sus formulas son:
RESIDUO CICLICO RELATIVO= (Y-Ŷ/Ŷ) x 100
% DE TENDENCIA= (Y/Ŷ) x 100
Donde: Y= valor real de la serie de tiempo; Ŷ= valor de tendencia estimado en el mismo punto
de la serie.
Describen solamente variaciones cíclicas pasadas y no p/ predecir variaciones cíclicas.
FLUCTUACION O VARIACION ESTACIONAL O TEMPORAL
Implica patrones de cambio en el lapso de un año que tienden a repetirse anualmente. Es

decir, se define como un movimiento repetitivo y predecible alrededor de la línea de tendencia
que se da en un año o en menos. Con el fin de detectar la variación temporal, los intervalos de
tiempo necesitan ser medidos en unidades pequeñas, como días, semanas, meses o
trimestres.
Se da en un año o menos.
Las razones principales p/ su estudio son:
1. Podemos establecer el patrón de cambios pasados.
2. Es útil proyectar los patrones pasados hacia el futuro.
[11]
TEORÍA
3. Ya que hemos establecido el patrón temporal que existe, podemos eliminar sus efectos
de la serie temporal.
Se usa el MÉTODO DE RAZON DE PROMEDIO MOVIL. Permite identificar la variación

estacional de una serie temporal.
Los índices estacionales o temporales se usan p/ eliminar de una serie temporal los efectos de
la estacionalidad. A este proceso se lo denomina DESESTACIONALIZACION O
DESTEMPORALIZACION DE UNA SERIE TEMPORAL.
Antes de que podamos identificar la componente de tendencia o la cíclica de una serie

temporal debemos eliminar la variación temporal.
VARIACION IRREGULAR
Ocurre cuando el valor de una variable es completamente impredecible, es decir, cambia de

manera aleatoria. Son los movimientos de la serie que no pueden ser explicados por los
factores de variación anteriores. Depende de factores aleatorios que no son fáciles de
representar. Esos factores tienen una incidencia determinante en el comportamiento de la serie.
Se presenta en intervalos cortos y sigue un patrón aleatorio.
Estos movimientos aleatorios, a través del tiempo, tienden a contrarrestarse entre si.
FAC
Significa FUNCION DE AUTOCORRELACION. Se refiere a la correlación que existe entre los

valores de una misma variable, considerada a diferentes intervalos.
Su valor refleja en que medida las observaciones actuales dependen de las anteriores.
El grafico p/ una serie CON TENDENCIA seria:
[12]
TEORÍA
El grafico p/ una serie CON ESTACIONALIDAD seria:
El grafico p/ una serie con una estructura totalmente ALEATORIA seria :
FDE
Significa FUNCION DE DENSIDAD ESPECTRAL. Es la transformación de la FAC.
El grafico p/ una serie CON TENDENCIA seria:
El grafico p/ una serie con FLUCTUACION ESTACIONAL seria:
El grafico p/ una serie completamente ALEATORIA:
[13]
TEORÍA
ACLARACIONES Y ASPECTOS IMPORTANTES DE LO EXPUESTO ANTERIORMENTE :
1. Cualquier secuencia de una variable medida a lo largo del tiempo, constituye una
SERIE TEMPORAL. Es decir, es una secuencia de observaciones medidas a lo largo
del tiempo (a intervalos regulares). Se usa p/ determinar patrones de comportamiento
de datos, en este caso, registrados cronológicamente. El conocimiento de esos
patrones permite explicar el comportamiento de la variable en el pasado y proyectarlo
al futuro, así se facilita la toma de decisiones.
2. El modelo clásico de serie de tiempo (es un modelo de descomposición en

componentes, que analiza los principales factores de variación temporal de la serie)
asume que la estructura de la serie es el rtdo de la superposición de los siguientes
FACTORES DE VARIACION:
● TENDENCIA SECULAR.
● VARIACION CICLICA.
● FLUCTUACION ESTACIONAL.
● VARIACION IRREGULAR O ALEATORIA.
3. Emplear el MODELO CLASICO DE ANALISIS DE SERIES, p/:
● Usar técnicas basadas en la regresión p/ estimar y pronosticar la tendencia de

una serie de tiempo.
● Establecer si la serie presenta algún tipo de tendencia o si tiene fluctuaciones

cíclicas o estacionales.
● Manejar la incertidumbre asociada a los acontecimientos futuros.
4. Cuando se observa una serie de tiempo con datos ANUALES, solo se toman en cuenta
los componentes de TENDENCIA SECULAR, CICLICA e IRREGULAR. Esto es porque
la variación ESTACIONAL pasa por un ciclo completo y regular c/ año y no afecta más
a un año que a otro.
5. El ANÁLISIS DE SERIES TEMPORALES es un método cuantitativo que utilizamos p/

determinar patrones en los datos recolectados a través del tiempo. Tal análisis se usa
p/ detectar patrones de cambios en la información estadística durante intervalos
regulares de tiempo. En consecuencia, el análisis de series temporales nos ayuda a
tener una visión con incertidumbre acerca del futuro.
[14]
TEORÍA
UNIDAD Nº 4
TIPOS DE VARIACIONES
CAUSAS COMUNES DE VARIACION CAUSAS ESPECIALES DE VARIACION
Si todo funciona normalmente, el proceso va Cuando sucede un problema puntual que

estar influenciado únicamente por estas tiene un fuerte impacto sobre el proceso se
causas. dice que están actuando tales causas.
No son tan fáciles de identificar y p/ lograr su Pueden ser eliminadas tomando acciones
disminución es necesario tomar acciones a locales.
nivel sistema que resultan más complejas y
costosas. Cuando ellas actúan se dice que el proceso
esta inestable.
Cuando actúan ellas solamente, el proceso
permanece estable.
[15]
TEORÍA
Los patrones comunes que indican PROCESOS FUERA DE CONTROL son:
1. Observaciones externas individuales.
2. Tendencias crecientes o decrecientes.
3. Saltos en el nivel alrededor del cual varían todas las observaciones.
4. Ciclos.
5. Atracción por los LC.
6. Atracción por la línea central.
DIAGRAMAS O CARTAS DE CONTROL
DIAGRAMAS DE CONTROL P/ LA MEDIA DIAGRAMAS DE CONTROL P/ LA

DISPERSION
De las 3 igualdades de c/ formula anterior, De las 3 igualdades de c/ formula anterior,

nosotros usamos la 2º. nosotros usamos la 2º.
X= ∑de las medias aritméticas/k
[16]
TEORÍA
SI ALGÚN LIMITE DA NEGATIVO SE COLOCA

0.
1º se analiza la carta R (dispersión) ya que si los R están inestables significa que la dispersión
esta fuera de control, y en este caso también la carta de la media.
Si las 2 cartas no muestran señales de inestabilidad significa que el proceso esta estable.
CARTAS DE CONTROL POR ATRIBUTOS O GRÁFICOS P O DE PROPORCION O % DE

PRODUCCION DEFECTUOSA
Los ATRIBUTOS toman valores no numéricos, y por lo tanto no es posible aplicar las cartas por
variables.
P= ∑P/K
En este caso sustituiremos los valores negativos del LCI por 0.
En este caso sustituiremos los valores mayores que 1 por 1.
ACLARACIONES Y ASPECTOS IMPORTANTES DE LO ANTERIOR EXPUESTO :
1. Se denominan CARACTERÍSTICAS DE CALIDAD, porque miden propiedades

relevantes del producto que condicionan su correcto desempeño.
2. En todo análisis subyace la siguiente idea: es fundamental estudiar la VARIABILIDAD

de la característica de calidad: determinar su patrón de comportamiento, calcular sus
principales propiedades, modelar su distribución, y conocer su evolución temporal.
3. Dentro del enfoque moderno de calidad, la REDUCCION DE LA VARIABILIDAD de los

procesos debe ser un objetivo permanente de los grupos de trabajo, no solo p/
[17]
TEORÍA
asegurar el cumplimiento de los requisitos del cliente, sino también p/ incorporar en la

mentalidad de trabajo la filosofía del mejoramiento continuo.
4. CONTROL DE CALIDAD: secuencia de tareas tendientes a garantizar que un producto

cumpla con las especificaciones del cliente.
5. No existe un procedimiento único que permita garantizar la calidad de un bien o de un

ss.
6. En el ENFOQUE MODERNO DE LA CALIDAD, es mejor prevenir que detectar los

problemas. Por ello se impone el control en las diferentes etapas de elaboración de un
producto, antes que la inspección de productos terminados.
7. CEP: CONTROL ESTADISTICO DE PROCESOS: es la aplicación de herramientas

estadísticas p/ el análisis y control de la variabilidad de un proceso.
8. Un punto fuera de alguno de los límites de control es la SEÑAL DE INESTABILIDAD

más contundente.
9. VENTAJAS FUNDAMENTALES DE LAS CARTAS DE CONTROL POR VARIABLES:
● Permiten identificar la acción de causas especiales de variación, inclusive

antes de encontrar puntos fuera de los límites de control.
● Los diagramas permiten hacer un seguimiento del proceso en el tiempo,

pudiéndose analizar la evolución de la media y de la dispersión.
● Constituye una herramienta que le permite al operador trabajar más tranquilo,

ya que le proporciona una evidencia concreta p/ saber si todo anda bien, y no
se ve obligado a tener que adivinar la ocurrencia de problemas en el proceso a
su cargo.
10. VENTAJAS FUNDAMENTALES DE LAS CARTAS DE CONTROL POR ATRIBUTOS:
● Su implementación generalmente resulta más económica que una por

variables, ya que se requieren mediciones menos sofisticadas.
● Su uso constituye un excelente medio de control p/ la gerencia, ya que de un

vistazo puede tomar conocimiento de la evolución de la calidad en un
determinado proceso.
11. PRINCIPAL DESVENTAJA DE LA CARTA DE CONTROL POR ATRIBUTOS: como

los atributos son datos no numéricos, su tratamiento es mucho más restringido que el
de una variable, y por lo tanto el análisis y las conclusiones son bastante menos
jugosas. Además, como se requiere trabajar con lotes relativamente grandes,
generalmente pasa mucho tiempo entre punto y punto, limitando la capacidad de
reacción en base a la información brindada por las cartas.
12. LIMITES DE CONTROL: valores utilizados en los diagramas de control p/ decidir en

forma grafica si el proceso esta estable o inestable.
[18]
TEORÍA
13. SEÑAL DE INESTABILIDAD: puntos fuera de los límites de control, o cualquier patrón
de comportamiento no aleatorio en los diagramas que indican la presencia de causas
especiales de variación.
14. La decisión entre emplear CARTAS POR VARIABLES O ATRIBUTOS, depende de la

importancia de la característica a controlar, y de los medios o recursos disponibles.
Siempre que sea posible es preferible usar el control por variables, ya que proporciona
mayor información sobre la evolución del proceso.
15. Las definiciones de CALIDAD varían de un contexto a otro; pero la mayoría de ellas
incluye estos conceptos: CONSISTENCIA, CONFIABILIDAD Y AUSENCIA DE
ERRORES O DEFECTOS.
UNIDAD Nº 5
Uno de los principales fines de todo trabajo de investigación consiste en describir las
características de la población objeto de estudio. P/ ello se deben realizar CENSOS. Estos
[19]
TEORÍA
resultan generalmente costosos y exigen movilizar gran cantidad de personas. El relevamiento

de la información es un proceso largo como así también el análisis de los datos resultantes.
Cuando no se puede contar con todos los elementos de una población, o en situaciones en las
cuales p/ obtener registros se debe destruir el material, se deberá tomar una MUESTRA. Con
los Rtdos de la misma, se hacen inferencias sobre el comportamiento de la población.
MUESTRA: es un subconjunto de elementos de la población. Es una parte de una población.
Sus PROPIEDADES son:
1. HOMOGENEIDAD: la muestra debe provenir de la misma población.
2. INDEPENDENCIA: las observaciones no deben estar mutuamente condicionada.
3. REPRESENTATIVIDAD: la muestra debe seleccionarse de manera tal que refleje la

población de origen.
MUESTREO ALEATORIO
La muestra que se elegí mediante un procedimiento que sigue reglas matemáticas de

probabilidad es considerada PROBABILISTICA o ALEATORIA.
Este tipo de muestreo se basa en un procedimiento que garantice que c/ elemento de la

población tenga la misma probabilidad de ser elegido p/ conformar la muestra.
MUESTREO NO ALEATORIO
Por el contrario si la muestra se conforma sin considerar dichas reglas es NO

PROBABILISTICA o NO ALEATORIA.
La elección de los sujetos depende de la decisión del investigador o grupo de encuestadores ya

que deben reunir ciertas características previamente determinadas de acuerdo a los objetivos
del trabajo.
La principal diferencia entre ambos es que en el MUESTREO ALEATORIO es posible calcular

el error muestral, mientras que en el MUESTREO NO ALEATORIO no.
MUESTREOS NO ALEATORIOS
MUESTREO MUESTREO MUESTREO MUESTREO MUESTREO MUESTREO

ACCESIBLE O POR CON CON CON ESTRATEGICO
POR CUOTAS VOLUNTARIOS EXPERTOS SUJETOS-T
CONVENIENCIA IPO (O
ESTUDIOS
DE CASOS)
Se basa en la Se buscan Se constituye Se usa Se usan en

elección de personas con personas mucho en estudios
personas de fácil que cumplan que tienen estudios motivacionales
localización por un % interés en cualitativos y que analizan
conocido de participar en un exploratorios actitudes y
la población. p/ generar
[20]
TEORÍA
parte del De esta proyecto de hipótesis más conductas del

investigador. forma se investigación. precisas o p/ consumidor.
preserva la buscar
Otro caso de característica Muy usado en elementos p/ Se reúne una
este muestreo es principal de diseños el diseño de serie de
elegir personas la población. experimentales cuestionarios. personas
en función de su p/ cs sociales y elegidas de
apariencia, Este tipo de en medicina. acuerdo a una
porque muestreo es característica
responden a una común en Los voluntarios específica.
imagen, de estudios de son
acuerdo al opinión. generalmente
objetivo del personas de
estudio. También se nivel educativo
usan en el superior o nivel
marco de un socio-profesiona
muestreo l alto.
probabilístico
como el
estratificado.
DIFERENCIAS ENTRE MUESTREO ALEATORIO Y NO ALEATORIO
ASPECTOS DIFERENCIALES MUESTREO NO MUESTREO ALEATORIO

ALEATORIO
CRITERIO DE SELECCIÓN Basado en el juicio Selección al azar.

DE LA MUESTRA personal.
PROBABILIDADES No se conocen las Todos los individuos tienen una

probabilidades de c/ probabilidad conocida de ser
individuo o elemento de incluidos en la muestra.
ser incluido en la muestra.
CARACTERÍSTICAS 1. Más rápido y 1. Requiere un análisis

económico. estadístico previo a su
implementación.
2. Es necesario
conocer la 2. Garantiza mayor
población en objetividad.
estudio.
ERROR DE MUESTREO O No puede determinarse. Es posible conocerlo.

ESTIMACION
[21]
TEORÍA
MÉTODOS DE MUESTREO ALEATORIO
ASPECTOS MUESTREO MUESTREO MUESTREO MUESTREO

ALEATORIO SISTEMATICO ESTRATIFICAD POR
SIMPLE O CONGLOMERA
DO
CONDICIONES 1. La 1. La 1. La 1. La
DE població població població població
APLICACIÓN n debe n debe n debe n debe
ser ser ser ser muy
homogén homogé heterogé grande.
ea. nea. nea con
grupos 2. La
2. Hay que 2. Hay que claramen variabilid
tener un tener un te ad dentro
listado listado diferenci de los
de los de los ados. clúster
elemento element debe ser
s de la os de la 2. La mayor
població població variabilid que la
n. n. ad entre variabilid
estratos ad entre
3. Los 3. Los debe ser los
elemento element mayor mismos.
s de la os de la que la
població població variabilid 3. Está
n deben n deben ad dentro especial
ser ser de los mente
fáciles de fáciles mismos. indicado
enumera de cuando
r. enumera los
r. elemento
s de la
4. No població
deben n están
existir muy
ciclos ni disperso
patrones s y
extraños resulta
en los costoso
datos diseñar
ordenad un
os. muestreo
[22]
TEORÍA
5. Debe que
aplicarse seleccion
cuando ando al
se tiene azar,
la implique
certeza viajes p/
de captar la
aleatorie informaci
dad en ón.
el orden
de los
element
os de la
població
n.
PROCEDIMIEN 1. Hacer 1. Hacer 1. Dividir a 1. Dividir la

TO BASICO una lista una lista la població
completa complet població n en
de la a de la n en grupos o
població població estratos clúster
n. n. internam (conglom
ente erado)
2. Asignar 2. Asignar homogén heterogé
un nº a c/ un nº a eos. neos
elemento c/ internam
de la element 2. Seleccio ente.
població o de la nar
n. població dentro de 2. Seleccio
n. c/ estrato nar al
3. Seleccio los azar que
nar al 3. Calcular elemento conglom
azar los el s que erados
elemento intervalo formaran constituir
s que de la án la
van a muestre muestra muestra.
constituir o k=N/n. de
la manera 3. Seleccio
muestra. 4. Determi nar
aleatoria
nar un dentro de
(aplicand
arranque c/ clúster
o el
aleatorio los
muestreo
(al azar) elemento
aleatorio
que s que
simple).
llamare formaran
mos a y la
que muestra
debe ser de
menor o manera
igual a k. aleatoria.
[23]
TEORÍA
5. Incorpor
ar a la
muestra
los
element
os.
CARACTERÍS 1. Todos los 1. Elegido 1. Se aplica 1. La

TICAS elemento aleatoria cuando unidad
s tienen mente el es de
la misma punto de necesari muestreo
probabili arranque o , en lugar
dad de , se conocer de ser un
ser muestre estimacio elemento
incluidos a a nes p/ de la
en la intervalo subconju població
muestra. s fijos de ntos de n, esta
orden, la constituid
2. Es el tiempo o població a por
más espacio. n, los varios de
simple cuales estos
desde el son elemento
punto de homogén s
vista eos agrupado
teórico internam s
pero no ente. naturalm
siempre ente. La
es el unidad
más de
eficiente muestreo
o de más es el
sencilla clúster o
aplicació el
n. conglom
erado.
VENTAJAS 1. Todos los 1. Permite 1. Permite 1. Permite

elemento la calcular calcular
s tienen generali el error el error
la misma zación. de de
probabili muestreo muestreo
dad de 2. Permite . .
ser calcular
incluidos el error 2. Reducció 2. Reducció
en la de n del n del
muestra. muestre costo al costo al
o. no tomar no tomar
2. Permite toda la toda la
calcular
[24]
TEORÍA
el error 3. Reducci població població

de ón del n. n.
muestreo costo al
. no tomar 3. Garantiz 3. Ahorra
toda la a mayor dinero
3. Permite població represent porque
la n. atividad permite
generaliz en la
ación. 4. Mayor poblacio concentr
facilidad nes ación de
4. Reducció en la heterogé los
n del obtenció neas. encuesta
costo al n de la dores en
no tomar muestra 4. Si los áreas
toda la con estratos próximas
població respecto son .
n. al internam
muestre ente
o homogén
aleatorio eos hace
simple. posible
una
5. Asegura muestra
una menor,
muestra con el
bien consiguie
repartida nte
a lo ahorro.
largo de
toda la
població
n.
DESVENTAJA 1. No 1. Si hay 1. Exige 1. Exige

S provee algún tratamien tratamien
un nº tipo de tos tos
suficiente periodici estadístic estadístic
de casos dad en os más os más
de la complejo complejo
grupos població s. s.
especiale n, el
s cuando muestre 2. Dificultad
la o es p/
població influido identifica
n es por él y r estratos
heterogé la homogén
nea. muestra eos.
no será
2. Puede 3. Costo
represen
haber más alto
tativa.
distorsio que el
muestreo
[25]
TEORÍA
nes en aleatorio
cuanto a simple y
su el
represent muestreo
atividad. por
conglom
3. Puede erados.
ser
inadecua 4. Su
do o impleme
imposible ntación
de requiere
aplicar más
cuando: tiempo.
no es
posible
numerar
todos los
elemento
s de la
població
n; la
població
n esta
formada
por
grupos
bien
diferenci
ados
entre si;
los
elemento
s de la
població
n están
muy
disperso
s
geográfic
amente y
resultaría
muy
costoso
aplicarlo.
ERRORES
1. ERROR DE MUESTREO: diferencia entre parámetro y estimador.
[26]
TEORÍA
2. ERROR NO MUESTRAL: debido a equivocaciones en la realización del muestreo.
3. ERROR MAXIMO DE ESTIMACION: tiene que ver con el intervalo de confianza p/ el

parámetro estimado.
UNIDAD Nº 6
La elección entre los diferentes métodos de recopilación de información depende de las
hipótesis de trabajo y de los objetivos de la investigación. En cualquiera de estos casos, se
debe ubicar la investigación en relación a marcos conceptuales previamente establecidos.
Mediante una ENCUESTA, se pueden hacer observaciones del comportamiento, actitudes u

opiniones de individuos en un determinado contexto. La ENCUESTA O SONDEO es uno de los
métodos más extendidos de investigación en cs sociales, principalmente en sondeos de opinión
y estudios de mercado.
TIPOS DE ENCUESTAS:
1. TELEFONICA.
2. POR CORREO.
3. PERSONALES.
Algunos de los ERRORES DE MUESTREO son:
1. Definición incorrecta de la población en estudio.
2. Muestra no representativa de la población.
3. Tamaño de muestra no adecuado.
Algunos de los ERRORES NO MUÉSTRALES son:
1. Cuestionario mal formulado o confuso.
2. Encuestador mal entrenado.
3. Incorrecta transcripción de los datos.
Los TIPOS DE CUESTIONARIOS pueden ser:
1. DE RTAS ESTRUCTURADAS: MÚLTIPLES CHOICE.
2. DE RTAS ABIERTAS.
3. DE RTAS SEMI-ESTRUCTURADAS: COMBINACION DE LAS ANTERIORES.
INFERENCIA SOBRE LA PROPORCION
Se analiza la variable PROPORCION o %. Así la proporción se define como: p= X/n= nº de

casos/tamaño de la muestra. X= es una variable con distribución binomial.
La prueba de hipótesis: H0: P= P0 versus H1: P‡ P0. Si no se rechaza la hipótesis nula, significa
que la proporción de la característica de interés no ha cambiado significativamente.
[27]
TEORÍA
INFERENCIA SOBRE LA DIFERENCIA DE PROPORCIONES
La prueba de hipótesis: H0: P1= P2 versus H1: P1‡ P2. Si no se rechaza la hipótesis nula,
significa que las proporciones de las características analizadas no cambian significativamente.
ANALISIS DE TABLAS DE CONTIGENCIA
OBJETIVOS:
1. Evaluar la independencia de 2 distribuciones multinomiales (prueba de independencia).
2. Comparar las distribuciones de probabilidad de una variable multinomial en distintos

grupos (prueba de homogeneidad de proporciones).
3. Probar hipótesis sobre la distribución de probabilidades de una variable discreta

multinomial (bondad de ajuste).
PRUEBA DE INDEPENDENCIA PRUEBA DE HOMOGENEIDAD DE

PROPORCIONES
Se aplica cuando se quiere determinar si 2 Se aplica cuando se quiere determinar si las

atributos categóricos presentan algún tipo de proporciones de las diferencias categóricas
asociación entre ellos. son las mismas p/ todas las poblaciones.
Se toma una muestra de una misma población Se toma una muestra de c/ población (i-filas) y
y se caracteriza al individuo s/ 2 criterios de se caracteriza al individuo s/ 2 o más criterios
clasificación dispuestos en i-filas y j-columnas. de clasificación dispuestos en j-columnas.
Los totales por filas y por columnas son Los totales por filas generalmente son fijos y
aleatorios, solo es fijo el total de individuos a por columnas son aleatorios.
estudiar.
H0: las poblaciones son homogéneas con
H0: los atributos son independientes. respecto a las categorías.
H1: están relacionados (son dependientes). H1: no son homogéneas.
El ESTADISTICO DE LAS PRUEBAS:
Este estadístico tiene DISTRIBUCIÓN CHI-CUADRADO con determinados gl.
ANALISIS MULTIVARIADO: ANALISIS DE CONGLOMERADOS
Constituyen técnicas o algoritmos computacionales que tienen por objeto la búsqueda de

grupos a partir de una matriz de datos multivariados.
[28]
TEORÍA
Se pueden agrupar individuos en función del valor de las p variables o variables en función de
su comportamiento a través de los n individuos.
El agrupamiento es tal que objetos dentro de un grupo son más parecidos entre si que aquellos
que pertenecen a grupos distintos.
MÉTODOS DE AGRUPAMIENTO: AGLOMERATIVOS:
1. Encadenamiento simple (los grupos se unen en función de la distancia entre los 2

miembros más próximos)
2. Encadenamiento completo (los grupos se unen en función de la distancia entre los 2

miembros más alejados)
3. Encadenamiento promedio (el agrupamiento se realiza en función de la distancia

promedio entre todos los pares de individuos de c/ grupo)
Una vez seleccionado el algoritmo de clasificación y la medida de distancia o similitud; se

puede construir una estructura de agrupamiento simple desde un grupo de datos complejos.
La visualización del rtdo de los agrupamientos jerárquicos se realiza mediante un diagrama de

árbol bidimensional, denominado DENDROGRAMA.
[29]

Resumen Teórico Estadistica Superior

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Resumen Teórico Estadistica Superior

Cargado por

Copyright:

Formatos disponibles

TEORÍA

FORMULACION DE FORMULA DISTRIBUCIÓN

PRUEBA SOBRE LA MEDIA (1 MUESTRA): CON n>30

FORMULACION DE HIPOTESIS FORMULA DISTRIBUCIÓN

PRUEBA DE COMPARACION DE MEDIAS (2 MUESTRAS): MUESTRAS INDEPENDIENTES

FORMULACION DE FORMULA DISTRIBUCION

FORMULACION DE FORMULA DISTRIBUCION

PRUEBA DE COMPARACION DE MEDIAS (2 MUESTRAS): MUESTRAS DEPENDIENTES O

FORMULACION DE FORMULA DISTRIBUCION

PRUEBA SOBRE LA VARIANZA (CON UNA MUESTRA)

FORMULACION DE FORMULA DISTRIBUCION

PRUEBA DE COMPARACION DE VARIANZAS (CON 2 MUESTRAS)

FORMULACION DE FORMULA DISTRIBUCION

PRUEBA CHI-CUADRADO DE BONDAD DE AJUSTE

FORMULACION FORMULA DISTRIBUCION

ACLARACIONES Y ASPECTOS IMPORTANTES DE TODO LO EXPUESTO

1. La t de STUDENT es una distribución de probabilidades p/ variable aleatoria continua,

2. La DISTRIBUCIÓN CHI-CUADRADO con n-1 gl es una distribución definida solo p/

3. Una situación que se da frecuentemente en la práctica es la de disponer de una

Cuando disponemos de un mayor nº de datos, conviene usar la denominada PRUEBA

Si las discrepancias entre el modelo teórico y la realidad no son grandes, se asume

Esta es una prueba de un solo extremo, específicamente una PRUEBA UNILATERAL

El estadístico tiene distribución chi-cuadrado con (k-p-1) gl, donde k representa el nº de

Los Rtdos de la prueba no se ven afectados por el uso de intervalos o clases de

OBJETIVO: evaluar si una distribución de probabilidad en particular, como la

4. La DISTRIBUCIÓN F es una distribución de probabilidad p/ variable continua usada en

5. MUESTRAS INDEPENDIENTES: son aquellas tomadas de 2 poblaciones diferentes.

7. PASOS P/ LA CONSTRUCCION DE UNA PRUEBA ESTADISTICA DE HIPÓTESIS :

● Formular las hipótesis nula y alternativa.

● Construir un estadístico que involucre al parámetro de interés y a su estimador.

● Identificar la distribución muestral del estadístico de la prueba.

● Encontrar los puntos críticos en función del nivel de significación elegido y el

● Concluir en función de la situación problemática.

8. Una HIPÓTESIS ESTADISTICA es una proposición sobre los parámetros de un

Cuando la hipótesis nula se rechaza, entonces se concluye a favor de la hipótesis

HIPÓTESIS NULA (H0): establece valores o relaciones p/ el o los parámetros de

HIPÓTESIS ALTERNATIVA (H 1): es una negación de la hipótesis nula.

La formula de la covarianza es:

Si la covarianza (COV o Cxy) es:

1. COV>0 indica que la relación lineal es positiva (+).

2. COV<0 indica que la relación lineal es negativa (-).

3. COV=0 indica que no hay relación.

La formula del coeficiente de correlación es:

Este coeficiente puede tomar valores entre -1 y 1:

1. Un r= 0 indica que no hay relación.

2. Un r= 1 indica una relación lineal exacta +.

3. Un r= -1 indica una relación lineal exacta -.

4. Un r >0 indica una relación lineal +.

5. Un r < 0 indica una relación lineal -.

relacionadas. Una forma de resolver esta cuestión es haciendo la siguientes PRUEBA DE

FORMULACION DE FORMULA DISTRIBUCIÓN

Distribución t con gl= (n-2)

Tal prueba se aplica si n es pequeña.

Si no se rechaza H0, se estará comprobando que el r no es significativo, y por lo tanto no hay

MÉTODO DE MÍNIMOS CUADRADOS: sus formulas son:

B también se puede calcular así: b= COV (x; y)/s2x

La verificación de la ecuación de estimación se puede hacer de estas 2 formas:

1. Examinando la grafica de los puntos de la muestra.

2. Calculando el error estándar de estimación (Se). Su formula es:

Si es = a 0 indica que la ecuación de estimación es un estimador perfecto de la variable

Se mide a lo largo del eje Y y no perpendicularmente desde la línea de regresión.

Si es = a 1 indica ajuste perfecto.