Estadística II

ESTADÍSTICA II
1. CORRELACIÓN LINEAL. REGRESIÓN

Correlación lineal. Bajo el concepto de correlación se recogen varios
procedimientos e indicadores estadísticos utilizados para determinar el grado de
asociación entre dos variables; el más sencillo de ellos es el de correlación lineal
que está basado en la comparación de la varianza asociada de dos variables
(covarianza) y las desviaciones estándar de cada uno a través del cálculo del
coeficiente r de Pearson.
Covarianza
La covarianza (cov(x,y)) de dos variables es un indicador de la relación entre ellas.
Este parámetro puede utilizarse para medir la relación entre dos variables solo si
están expresadas en la misma escala o unidad de medida.
Coeficiente de correlación de Pearson
La correlación o grado de asociación de dos variables se mide utilizando el
coeficiente de correlación de Pearson. Este coeficiente mide el grado de asociación
lineal entre dos variables. Se denota como r y su valor fluctúa en el intervalo [-1, 1].
Dónde:
sx: desviación estándar de la variable x.
sy: desviación estándar de la variable y.
Análisis del coeficiente de correlación
Según sea el valor del coeficiente de correlación (r) se tiene que:
si r es positivo, la relación lineal entre las variables es directa. Se dice que la
correlación es positiva.
si r es negativo, la relación lineal entre las variables es inversa. Se dice que la
correlación es negativa.
si r = 0, no existe relación lineal entre las variables, se dice que la correlación es
nula.
si r = 1, existe una relación de dependencia total directa entre las variables. Es decir,
si una de ellas aumenta (o disminuye), la otra aumenta (o disminuye) en igual
proporción.
si r = -1, existe una relación de dependencia total inversa entre las variables. Es
decir, si una de ellas aumenta (o disminuye), la otra disminuye(o aumentaen igual
proporción.
2. MUESTREO Y USO DE LAS FÓRMULAS DE ERROR ESTÁNDAR
El error estándar mide el error aleatorio en un dato estadístico informado: el tipo de
error causado por la variación aleatoria del muestreo al repetir una prueba en las
mismas condiciones. La incertidumbre es un concepto más amplio que incluye
componentes adicionales de error potencial además del error aleatorio. La norma
E2655 de ASTM, Guía para informar la incertidumbre de los resultados de pruebas
y Uso del término incertidumbre de la medición en métodos de prueba de ASTM,
describe el uso del concepto de incertidumbre tal como se lo aplica al resultado de
una prueba.
El error estándar de la media mide la diferencia que puede existir entre la media
verdadera y la estadística que se informa. En términos más generales, podemos
hablar del "error estándar de la estimación" cada vez que se informa una cantidad
estadística estimada. Cuando se calcula un dato estadístico único, es posible calcular
el error estándar de la estimación. En general, cuanto mayor sea el tamaño de la
muestra, menor será el error estándar de una cantidad estimada.
Para ver cómo funciona esto, analicemos una media muestral. A partir de una
muestra de tamaño n, se calculan la media muestral y la desviación estándar. En
realidad hay una media verdadera, μ, y una desviación estándar verdadera σ, y son
desconocidas. La muestra nos brinda las estimaciones y S. Si hiciéramos muestras
repetidamente de la población/proceso del cual se toma la muestra y calculáramos la
media muestral una y otra vez, la desviación estándar de la distribución de medias
sería el error estándar verdadero de la media. En teoría, esta es la Ecuación 1:
(1)
Debido a que solo tenemos una media estimada, y no conocemos los verdaderos σ,
solo podemos estimar el error estándar como:
(2)
El error en un resultado informado se llama error de muestreo, y se mide como
desviación absoluta del valor verdadero desconocido. Por lo tanto, para una media,
el error muestral puede considerarse como la desviación | - μ| . Alrededor del 68%
de las veces el error muestral tendrá como máximo el tamaño de un error estándar, y
en el 95% de los casos, el de 2 errores estándar. Esto puede expresarse más
concisamente de la siguiente manera:
(3)
(4)
De este modo, el usuario de una estadística obtiene una idea de la magnitud de la
diferencia que pudo haberse verificado en la práctica, la manera en que el tamaño de
la muestra afecta el posible error de una estimación y con qué probabilidad
aproximada (confianza). En este caso, estamos considerando un tamaño de muestra
de 20 o más y estamos usando la teoría de la distribución normal. Algunos lectores
también reconocerán en esto una cierta similitud con la construcción de un intervalo
de confianza para una media desconocida. En la norma E2586 de ASTM se tratan
los intervalos de confianza.
Ejemplos
Consideremos que en una muestra de tamaño n = 20 se determinó que la media
muestral y la desviación estándar eran 162 y 11,5 respectivamente. El error estándar
estimado de la media surge de la Ecuación 2: 11,5/4,47 = 2,57. De este modo, el
potencial de error en el resultado informado no es superior a ±2,57 (68% de
confianza) o no más de 2(2,57) = ±5,14 (a 95% de confianza).
Uno de los recursos estadísticos más utilizados es una proporción simple. Hay una
muestra de objetos de tamaño n, y se observa cada objeto para identificar la
ocurrencia de un atributo. Cada objeto tiene o no tiene el atributo. Esta es la
situación, por ejemplo, en los muestreos de control de calidad o en las encuestas de
opinión pública. La estadística, indicada , es la proporción en la muestra que tiene
ese atributo. La proporción verdadera y desconocida de todos los objetos es p. El
error estándar teórico de la estimación es:
(5)
En la práctica no conocemos nunca el valor verdadero de p, de modo que
reemplazamos la estadística y obtenemos una estimación del error estándar.
Utilizando la Ecuación 5, el error estándar estimado es:
(6)
Cuando esta técnica se utiliza en una encuesta política o una investigación de
mercado, la cantidad 2SE ( ) se menciona como margen de error de la encuesta.
Supongamos que en una muestra de n = 200 componentes de metal inspeccionados,
se clasificaron 23 como defectuosos. La estimación de la proporción defectuosa del
proceso es = 23/200 = 0,115 o 11,5%.
El error estándar de esta estimación, usando la Ecuación 6, es 0.0226 o 2,26%. En
caso de querer reclamar una confianza de aproximadamente 95% en el posible error
en el resultado, deberíamos informarlo utilizando dos errores estándar o como
11,5% ±4,52%. De todos modos, debería informarse al menos el error estándar
(2,26%) junto con la estimación.
En la E2586 de ASTM están disponibles las fórmulas de error estándar para varios
casos comunes. En la bibliografía sobre ciencias estadísticas pueden consultarse
otros casos y métodos.
3. SIGNIFICADO DE MEDIA , MEDIANA Y MODA
Media Aritmética: La media aritmética es la suma de todos los datos dividida entre
el número total de datos. Se calculan dependiendo de cómo vengan ordenados los
datos.
La media aritmética de un grupo de datos se calcula así:
Se debe multiplicar cada dato con su respectiva frecuencia, sumar todos estos
productos, y el resultado dividirlo por la suma de los datos.
Mediana: La mediana es el valor que ocupa el lugar central entre todos los valores
del conjunto de datos, cuando estos están ordenados en forma creciente o
decreciente.
La mediana se representa por Me.
Calculo de la mediana:
1° Ordenamos los datos de menor a mayor.
- La mediana de un conjunto con un número impar de datos es, una vez ordenados
los datos, el dato que ocupa el lugar central.
Moda: La moda de un conjunto de datos es el dato que más veces se repite, es decir,
aquel que tiene mayor frecuencia absoluta. Se denota por Mo. En caso de existir dos
valores de la variable que tengan la mayor frecuencia absoluta, habría dos modas. Si
no se repite ningún valor, no existe moda.
4. VERIFICACIÓN EXPERIMENTAL DE LA HIPÓTESIS
La rama de la ciencia −básica o aplicada− es cómo verificar hipótesis sobre un
determinado fenómeno real. Muchas veces, cuando se expone este tema al
estudiante en etapas tempranas de su formación científica, el llamado método de
razonamiento científico se simplifica en exceso y se presenta la verificación de
hipótesis en términos absolutos. En este esquema simplificado del método científico
se indica cómo teorizar sobre un determinado aspecto de la realidad más o menos de
la manera siguiente:
a) Se formula una teoría (o una hipótesis, o una ley) sobre el fenómeno de estudio.
b) Se diseña un experimento para tratar de corroborar esta teoría.
c) Si los resultados del experimento concuerdan con la teoría, ésta se
da provisionalmente como válida.
d) Si el experimento contradice la teoría, se vuelve al paso a), y se modifica la ley o
se elabora otra nueva, para que se ajuste a la realidad experimental.
e) Cualquier teoría relacionada con aspectos de la realidad es siempre provisional,
pendiente de ser revisada al entrar en conflicto con resultados de experimentos
posteriores.
Esta manera de proceder −como veremos, excesivamente simplista− se basa pues en
el hecho de asumir que en cualquier experimento se van a obtener resultados que
van a ser o bien totalmente contradictorios con la teoría (y, por tanto, deberá
abandonarse inmediatamente) o bien concordantes con la teoría (y, por tanto,
resulta razonable mantenerla).
Antes se ha calificado este método de validación como absoluto: si obviamos el
posible error experimental, la decisión que se tome no va a comportar error
alguno, ya que basta inspeccionar los resultados del experimento para aceptar o
rechazar la teoría.
Ha de quedar claro al lector que el esquema anterior no es el de un contraste
estadístico, y de hecho el desarrollo de este tema va a encargarse de revisarlo. En
los próximos apartados se expondrá, para empezar, una primera idea fundamental
en estadística: en cuanto se introduce un modelo de probabilidad para explicar un
fenómeno, emerge inevitablemente un error ya en la misma toma de decisión. En
otras palabras, el esquema anterior debe revisarse en los puntos c) y d).
Una vez expuesta estas cuestiones fundamentales en las primeras transparencias, se
entrará en el núcleo de este tema, que consiste en el desarrollo ya puramente técnico
del contraste estadístico de hipótesis.
5. ANÁLISIS DE VARIANZA
El análisis de la varianza es una colección de modelos estadísticos y sus
procedimientos asociados, en el cual la varianza está particionada en ciertos
componentes debidos a diferentes variables explicativas. El análisis de la varianza
parte de los conceptos de regresión lineal.
Concepto: El análisis de varianza de un factor sirve para comparar varios grupos en
una variable cuantitativa. Se trata, por tanto, de una generalización de la Prueba T
para dos muestras independientes al caso de diseños con más de dos muestras.
A la variable categórica (nominal u ordinal) que define los grupos que deseamos
comparar la llamamos independiente o factor y la representamos por VI. A la
variable cuantitativa (de intervalo o razón) en la que deseamos comparar los grupos
la llamamos dependiente y la representamos por VD.
Análisis de la varianza de un factor. De un factor, que es el caso más sencillo, la
idea básica del análisis de la varianza es comparar la variación total de un conjunto
de muestras y descomponerla como:
Análisis de la varianza de un factor
Dónde: es un número real relacionado con la varianza, que mide la variación debida
al "factor", "tratamiento" o tipo de situación estudiado. Es un número real
relacionado con la varianza, que mide la variación dentro de cada "factor",
"tratamiento" o tipo de situación.
6. PRINCIPALES ETAPAS DE LA INVESTIGACIÓN.

La investigación social es un proceso de producción de conocimiento científico,
acerca de la estructura, las transformaciones y cambios de la realidad social. Esto se
logra con la aplicación de categorías teóricas, estrategias y procedimientos.
Método científico: Es la manera de abordar un problema, de conocer y de acercarse

a la realidad, guiadas por principios o requisitos, por procedimientos y estrategias.
El proceso de construcción del conocimiento tiene las siguientes características:

- Reconoce los antecedentes, es decir que no parte de la nada.
- Requiere un capital de base: teórico y metodológico.
- Plantea inquietudes y respuestas.
- Reconoce que no existen normas únicas para aplicar a un problema.
- La investigación es dinámica.
- La investigación social se mueve del abstracto a lo concreto y viceversa.
- El proceso como tal sugiere pasos.
Etapas del proceso de investigación:

1- Planteamiento del problema: Objeto de estudio, objetivos y marco teórico.
2- Diseño metodológico
3- Recolección de la información
4- Ordenar, clasificar y sistematizar la información
5- Analizar: leer, interpretar, explicar y comprender los datos
6- Definir el plan operativo y las estrategias: - Qué hacer y cómo hacerlo?
- Definir los aspectos administrativos y el control del proyecto.
Planteamiento del problema :

“ Es la situación a la cual se le quiere encontrar respuesta o solución. Es decir, que
investigar es resolver problemas de investigación” .
Pasos del planteamiento del problema:

1- Identificar, delimitar y especificar el problema. Cuál es el vacío de
conocimiento?
2- Someter el problema al proceso de análisis, preguntar por: las circunstancias en

que aparece, los elementos que lo componen, la relación entre los elementos, las
explicaciones que se han dado y el modelo conceptual que lo puede explicar. Es
“ desmenuzar el problema “ .
3- Formular el problema: Qué se pretende estudiar?, Cuáles son los elementos

claves, las características y variables?
Diseño metodológico: Da cuenta de las siguientes preguntas:
- Qué información se requiere?
- Qué conceptos aparecen?
- Qué tipo de estudio hacer?
- Cuál instrumento utilizar?
- Cómo recolectar la información?
- Cómo se va a sistematizar y analizar la información?
- Qué estadísticos se pueden usar?
- Cómo analizar la información con el marco teórico propuesto?
Recolección de la información: Se deben seguir las siguientes etapas:

- Diseñar o adaptar un instrumento válido y confiable de recolección de la
información.
- Definir la población objeto (muestra)
- Realizar el trabajo de campo para aplicar los instrumentos
- Validar, codificar y sistematizar datos para analizar mediciones.

Estadística II

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística II

Cargado por

Copyright:

Formatos disponibles

ESTADÍSTICA II

1. CORRELACIÓN LINEAL. REGRESIÓN

6. PRINCIPALES ETAPAS DE LA INVESTIGACIÓN.

Método científico: Es la manera de abordar un problema, de conocer y de acercarse

El proceso de construcción del conocimiento tiene las siguientes características:

Etapas del proceso de investigación:

Planteamiento del problema :

Pasos del planteamiento del problema:

2- Someter el problema al proceso de análisis, preguntar por: las circunstancias en

3- Formular el problema: Qué se pretende estudiar?, Cuáles son los elementos

Recolección de la información: Se deben seguir las siguientes etapas:

También podría gustarte