Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(1)
Debido a que solo tenemos una media estimada, y no conocemos los verdaderos σ,
solo podemos estimar el error estándar como:
(2)
El error en un resultado informado se llama error de muestreo, y se mide como
desviación absoluta del valor verdadero desconocido. Por lo tanto, para una media,
el error muestral puede considerarse como la desviación | - μ| . Alrededor del 68%
de las veces el error muestral tendrá como máximo el tamaño de un error estándar, y
en el 95% de los casos, el de 2 errores estándar. Esto puede expresarse más
concisamente de la siguiente manera:
(3)
(4)
De este modo, el usuario de una estadística obtiene una idea de la magnitud de la
diferencia que pudo haberse verificado en la práctica, la manera en que el tamaño de
la muestra afecta el posible error de una estimación y con qué probabilidad
aproximada (confianza). En este caso, estamos considerando un tamaño de muestra
de 20 o más y estamos usando la teoría de la distribución normal. Algunos lectores
también reconocerán en esto una cierta similitud con la construcción de un intervalo
de confianza para una media desconocida. En la norma E2586 de ASTM se tratan
los intervalos de confianza.
Ejemplos
Consideremos que en una muestra de tamaño n = 20 se determinó que la media
muestral y la desviación estándar eran 162 y 11,5 respectivamente. El error estándar
estimado de la media surge de la Ecuación 2: 11,5/4,47 = 2,57. De este modo, el
potencial de error en el resultado informado no es superior a ±2,57 (68% de
confianza) o no más de 2(2,57) = ±5,14 (a 95% de confianza).
Uno de los recursos estadísticos más utilizados es una proporción simple. Hay una
muestra de objetos de tamaño n, y se observa cada objeto para identificar la
ocurrencia de un atributo. Cada objeto tiene o no tiene el atributo. Esta es la
situación, por ejemplo, en los muestreos de control de calidad o en las encuestas de
opinión pública. La estadística, indicada , es la proporción en la muestra que tiene
ese atributo. La proporción verdadera y desconocida de todos los objetos es p. El
error estándar teórico de la estimación es:
(5)
En la práctica no conocemos nunca el valor verdadero de p, de modo que
reemplazamos la estadística y obtenemos una estimación del error estándar.
Utilizando la Ecuación 5, el error estándar estimado es:
(6)
Cuando esta técnica se utiliza en una encuesta política o una investigación de
mercado, la cantidad 2SE ( ) se menciona como margen de error de la encuesta.
Supongamos que en una muestra de n = 200 componentes de metal inspeccionados,
se clasificaron 23 como defectuosos. La estimación de la proporción defectuosa del
proceso es = 23/200 = 0,115 o 11,5%.
El error estándar de esta estimación, usando la Ecuación 6, es 0.0226 o 2,26%. En
caso de querer reclamar una confianza de aproximadamente 95% en el posible error
en el resultado, deberíamos informarlo utilizando dos errores estándar o como
11,5% ±4,52%. De todos modos, debería informarse al menos el error estándar
(2,26%) junto con la estimación.
En la E2586 de ASTM están disponibles las fórmulas de error estándar para varios
casos comunes. En la bibliografía sobre ciencias estadísticas pueden consultarse
otros casos y métodos.
3. SIGNIFICADO DE MEDIA , MEDIANA Y MODA
Media Aritmética: La media aritmética es la suma de todos los datos dividida entre
el número total de datos. Se calculan dependiendo de cómo vengan ordenados los
datos.
La media aritmética de un grupo de datos se calcula así:
Se debe multiplicar cada dato con su respectiva frecuencia, sumar todos estos
productos, y el resultado dividirlo por la suma de los datos.
Mediana: La mediana es el valor que ocupa el lugar central entre todos los valores
del conjunto de datos, cuando estos están ordenados en forma creciente o
decreciente.
La mediana se representa por Me.
Calculo de la mediana:
1° Ordenamos los datos de menor a mayor.
- La mediana de un conjunto con un número impar de datos es, una vez ordenados
los datos, el dato que ocupa el lugar central.
Moda: La moda de un conjunto de datos es el dato que más veces se repite, es decir,
aquel que tiene mayor frecuencia absoluta. Se denota por Mo. En caso de existir dos
valores de la variable que tengan la mayor frecuencia absoluta, habría dos modas. Si
no se repite ningún valor, no existe moda.
4. VERIFICACIÓN EXPERIMENTAL DE LA HIPÓTESIS
La rama de la ciencia −básica o aplicada− es cómo verificar hipótesis sobre un
determinado fenómeno real. Muchas veces, cuando se expone este tema al
estudiante en etapas tempranas de su formación científica, el llamado método de
razonamiento científico se simplifica en exceso y se presenta la verificación de
hipótesis en términos absolutos. En este esquema simplificado del método científico
se indica cómo teorizar sobre un determinado aspecto de la realidad más o menos de
la manera siguiente:
a) Se formula una teoría (o una hipótesis, o una ley) sobre el fenómeno de estudio.
b) Se diseña un experimento para tratar de corroborar esta teoría.
c) Si los resultados del experimento concuerdan con la teoría, ésta se
da provisionalmente como válida.
d) Si el experimento contradice la teoría, se vuelve al paso a), y se modifica la ley o
se elabora otra nueva, para que se ajuste a la realidad experimental.
e) Cualquier teoría relacionada con aspectos de la realidad es siempre provisional,
pendiente de ser revisada al entrar en conflicto con resultados de experimentos
posteriores.
Esta manera de proceder −como veremos, excesivamente simplista− se basa pues en
el hecho de asumir que en cualquier experimento se van a obtener resultados que
van a ser o bien totalmente contradictorios con la teoría (y, por tanto, deberá
abandonarse inmediatamente) o bien concordantes con la teoría (y, por tanto,
resulta razonable mantenerla).
Antes se ha calificado este método de validación como absoluto: si obviamos el
posible error experimental, la decisión que se tome no va a comportar error
alguno, ya que basta inspeccionar los resultados del experimento para aceptar o
rechazar la teoría.
Ha de quedar claro al lector que el esquema anterior no es el de un contraste
estadístico, y de hecho el desarrollo de este tema va a encargarse de revisarlo. En
los próximos apartados se expondrá, para empezar, una primera idea fundamental
en estadística: en cuanto se introduce un modelo de probabilidad para explicar un
fenómeno, emerge inevitablemente un error ya en la misma toma de decisión. En
otras palabras, el esquema anterior debe revisarse en los puntos c) y d).
Una vez expuesta estas cuestiones fundamentales en las primeras transparencias, se
entrará en el núcleo de este tema, que consiste en el desarrollo ya puramente técnico
del contraste estadístico de hipótesis.
5. ANÁLISIS DE VARIANZA
El análisis de la varianza es una colección de modelos estadísticos y sus
procedimientos asociados, en el cual la varianza está particionada en ciertos
componentes debidos a diferentes variables explicativas. El análisis de la varianza
parte de los conceptos de regresión lineal.
Concepto: El análisis de varianza de un factor sirve para comparar varios grupos en
una variable cuantitativa. Se trata, por tanto, de una generalización de la Prueba T
para dos muestras independientes al caso de diseños con más de dos muestras.
A la variable categórica (nominal u ordinal) que define los grupos que deseamos
comparar la llamamos independiente o factor y la representamos por VI. A la
variable cuantitativa (de intervalo o razón) en la que deseamos comparar los grupos
la llamamos dependiente y la representamos por VD.
Análisis de la varianza de un factor. De un factor, que es el caso más sencillo, la
idea básica del análisis de la varianza es comparar la variación total de un conjunto
de muestras y descomponerla como:
Análisis de la varianza de un factor
Dónde: es un número real relacionado con la varianza, que mide la variación debida
al "factor", "tratamiento" o tipo de situación estudiado. Es un número real
relacionado con la varianza, que mide la variación dentro de cada "factor",
"tratamiento" o tipo de situación.