Está en la página 1de 14

REPÚBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD DE FALCÓN
FACULTAD DE CIENCIAS SOCIALES
CARRERA: Procesos Gerenciales
CÁTEDRA: Estadística II.
DOCENTE: PROF. Prof. Manuel Duarte

DISEÑO Y ANÁLISIS DE EXPERIMENTOS, Y ANÁLISIS DE LA VARIANZA

Autores:
Mujica Maira C.I: 15.982.774

Punto Fijo, abril 2023


INTRODUCCIÓN

Cuando hablamos de estadísticas se puede conseguir un campo de experimentos e


investigaciones muy llamativas, y los investigadores de todos las áreas de campos de
estudio se ven en la necesidad de pasar por estas áreas, por lo tanto a través de este trabajo
de diseño y análisis de experimentos, y análisis de la varianza e indagaremos un poco más
en el diseño de los experimentos, el análisis de las varianza, intervalos de confianza, y la
determinación del tamaño de la muestra para un experimento, cuando hablamos de
muestras, pruebas o experimentos nos referimos a una perspectiva más formal
experimental, con el fin de obtener resultados válidos y objetivos
1. INTRODUCCIÓN SOBRE EL DISEÑO DE EXPERIMENTOS.

Estos diseños de experimentos, son modelos clásicos estadísticos el cual su objetivo es


indagar si algunos elementos o factores determinados influyen en una variable de interés y,
si preexiste influencia de cierto factor para ponderar esa influencia. Por lo general, estos
experimentos se utilizan para estudiar y analizar el desenvolvimiento de los sistemas y de
los procesos (El proceso se puede visualizarse como la combinación de máquinas, métodos,
personas y algún otro recurso que convierten algún ingreso (comúnmente un material) en
una salida que posee varias respuestas de observación.

La metodología del diseño de experimentos está basada en la experimentación, es


consabido que, al repetir un experimento, en condiciones indistinguibles, los resultados
tienden a presentar alguna variabilidad. Si el experimento se realiza en un laboratorio en el
cual la mayoría de las causas de variabilidad están muy controladas, la falla o error
experimental será pequeño y habrá baja variación en los resultados del experimento. Pero si
lo experimentamos en procesos industriales o administrativos la variabilidad será mayor en
la gran mayoría de los casos. El objetivo del diseño de experimentos es determinar si
cuando se usa un determinado método o procedimiento se produce una mejora en el
proceso o no, por eso se debe experimentar empleando el tratamiento y no aplicándolo,
cuando la variabilidad experimental es grande, sólo se detectará la influencia del uso del
tratamiento cuando éste produzca grandes cambios en relación con el error de observación.

La metodología del diseño de experimentos analiza cómo variar las condiciones habituales
de realización de un proceso empírico para aumentar la probabilidad de detectar cambios
significativos en la respuesta; de esta forma se obtiene un mayor conocimiento del
comportamiento del proceso de interés. Para que la metodología de diseño de experimentos
sea eficaz es fundamental que el experimento esté bien diseñado
2. INTERVALOS DE CONFIANZA

Esta es una técnica que se utiliza en la inferencia estadística, lo que

Un intervalo de confianza es una técnica de estimación utilizada en inferencia


estadística que nos permite acotar uno o varios pares de valores, entre los cuales se hallará
la estimación puntual indagada o buscada (con una determinada probabilidad).

El intervalo de confianza nos permite calcular dos valores en relación a una media de
muestra (1 superior y 1 inferior). Estos valores demarcaran una categoría en la cual, con
una probabilidad determinada, se puede localizar el parámetro poblacional.

Intervalo de confianza = media +- margen de error

Cuando conocemos el verdadero parámetro poblacional, mayormente es algo bastante


complicado. Supongamos una población de 4 millones de personas. ¿Pidiéramos conocer el
gasto promedio en consumo por cada hogar de esa población? Posiblemente sí.
Sencillamente tenemos que formar una encuesta de todos los hogares involucrados y
calcular la media. Mas, sin embargo, poder continuar el proceso es tremendamente
laborioso y enredaría mucho el estudio.

Existen algunos factores de los que depende un intervalo de confianza

El cálculo de un intervalo de confianza depende principalmente de los siguientes factores:

• El tamaño de la muestra elegida: Dependerá de la cantidad de datos que se


utilizaron para el cálculo del valor muestral, este valor se acercará un poco más al
parámetro real poblacional.
• Nivel de confianza: El nivel de confianza nos indica el porcentaje de casos nuestra
apreciación acierta. Los niveles usuales son el 95% y el 99%.
• Margen de error de nuestra estimación: Este se denomina como alfa y nos
informa de la probabilidad que existe de que el valor poblacional esté fuera de
nuestro intervalo.
• Lo estimado en la muestra (media, varianza, diferencia de medias…): De esto va a
depender el estadístico pivote para el cálculo del intervalo.

Ejemplo de intervalo de confianza para la media, asumiendo normalidad y conocida la


desviación típica

El estadístico pivote utilizado para el cálculo sería el siguiente:

El intervalo resultante sería el siguiente:

Podemos observar como en el intervalo a la izquierda y derecha de la desigualdad esta la


cota inferior y superior proporcionalmente. Entonces la expresión nos indica, que la
probabilidad de que la media poblacional se sitúe entre esos valores es de 1-alfa (nivel de
confianza).
Intervalo de confianza (IC): Definición y propiedades

El intervalo de confianza relata la inestabilidad entre la medida obtenida en un estudio y la


medida real de la población (el valor real). Incumbe una categoría de valores, cuya
colocación es normal y en el cual se halla, con alta posibilidad, el valor real de una
determinada variable. Esta «alta probabilidad» se ha establecido por consenso en 95%. Así,
un intervalo de confianza de 95% nos indica que dentro del rango dado se encuentra
el valor real de un parámetro con 95% de certeza5-8.

Para comprenderlo utilizaremos un ejemplo clásico

Presumamos que poseemos una moneda, la cual puede o no estar balanceada. Entonces,
posteriormente a varios lanzamientos, la posibilidad que el resultado sea sello cambiara
desde 0 (todas las veces cara, lo que indica, una moneda balanceada) hasta 1 (todas las
veces sello, de nuevo balanceada), pasando por 0,5 (la mitad de las veces sello y las otras
caras, lo que equivale a una moneda no balanceada). Como no conocemos la verdadera
naturaleza de la moneda, vamos a experimentar con ella.

Iniciamos el experimento con 2 lanzamientos, uno es cara y el otro es sello. La probabilidad


de que el resultado sea sello fue 0,5, con lo que podríamos concluir que la moneda no está
balanceada, sin embargo, ¿con sólo 2 lanzamientos podemos concluir con total certeza que
esa es la naturaleza de la moneda? La respuesta es no, por lo tanto ¿cuál es el rango de
valores donde se encuentra el valor real? Dado que el azar pudo influir en este resultado,
uno acepta que el rango de valores reales posibles es amplio, incluso desde uno tan bajo
como 0 a uno tan alto como 1, por lo tanto, aún no estamos seguros de la naturaleza de
nuestra moneda.

Considerando lo anterior, ampliamos el experimento y realizamos 8 nuevos lanzamientos


(10 en total), resultando 5 caras y 5 sellos. Nuevamente el resultado es 0,5, sin embargo,
ahora intuitivamente nos percatamos que la verdadera naturaleza de la moneda se encuentra
en un rango menos amplio. Por ejemplo, es poco probable que después de 10 lanzamientos
9 sean sello, menos aún que todos lo sean, sin embargo, aún es factible que 8 ó 7 ó 6 sí lo
sean. Así, nuestro nuevo rango puede variar entre 0,2 y 0,8, pero con un alcance: todos
advertimos que, si bien 0,8 y 0,2 son posibles, los valores centrales (0,4 y 0,6) lo son más
aún, siendo 0,5 el más probable.

Decidimos seguir experimentando, realizando 90 nuevos lanzamientos (100 en total),


resultando 50 caras y 50 sellos. Nuevamente el resultado es 0,5, advirtiendo que cada vez es
más probable que la verdadera naturaleza de nuestra moneda es el de una no balanceada,
pero aún con un rango de variabilidad que podríamos estimar entre 0,4 y 0,6 (es decir, que
después de 100 lanzamientos, el resultado real varíe entre 40 y 60 sellos).

Realizamos 1.000 lanzamientos, resultando 500 sellos y 500 caras, con lo que estamos aún
más seguros que nuestra moneda no está balanceada (nuestro rango puede ser 0,45 a 0,55 o
menor).
El ejemplo anterior nos permite aclarar varios conceptos:

• La «verdadera naturaleza» de nuestra moneda (si está balanceada o no) corresponde


al valor real.

• El rango de valores reales posibles, es decir, el rango donde se encuentra la verdadera


naturaleza de nuestra moneda, corresponde al IC.

• El valor real más probable corresponde al estimador puntual del estudio, en este caso 0,5.

• Finalmente, advertimos la relación inversa entre la amplitud del IC y el tamaño muestral:


si consideramos que el número de lanzamientos representa el n de la muestra, observamos
que mientras más pequeño es el n más amplio es el IC. A mayor número de lanzamientos
(mayor n) más certeza tenemos que el resultado del experimento se acerca al valor real, por
lo tanto, el IC es más estrecho
Para llevar a la práctica el concepto vamos a recurrir al ejemplo utilizado en el artículo
anterior: la comparación de una nueva droga A versus una droga B en la prevención de
AVE en pacientes con antecedente de accidente isquémico transitorio (AIT) (Tabla 1)4.

Al analizar estos datos se obtiene una reducción absoluta del riesgo (RRA) de 4,2% con
95% de intervalo de confianza de 0,9% a 7,5%. Esto quiere decir que el valor real, es decir,
el resultante al aplicar la intervención a la población total de pacientes con AIT, está con
95% de probabilidad entre un RRA de 0,9% a 7,5%, siendo el valor más probable 4,2%. Si
aumentamos el n de la muestra a 20.000 obtendríamos nuevamente un RRA de 4,2%, pero
con un intervalo de confianza más estrecho, de 3,5% a 4,9% (Fórmula en apéndice 1).

3. DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA PARA UN


EXPERIMENTO.

El tamaño de la muestra variara dependiendo del caso que se va a analizar, estudiar o


reportar., A groso modo, se considera el objetivo de una investigación se puede dar;

1. Estimación de un parámetro. Se procura hacer inferencias a valores poblacionales


(medias, proporciones), desde los resultados en una muestra, ejemplo, porcentaje de
alumnos de pregrado con obesidad o el de estudiantes son aceptados para hacer una
residencia médica.
2. Contraste de hipótesis. Se tiene como intención contrastar si las medidas (medias,
proporciones) de las muestras son diferentes. Ejemplo, evaluar qué intervención educativa
consigue un mayor porcentaje de éxitos.1,2

El cálculo del tamaño de la muestra como una ecuación matemática

El cálculo del tamaño de la muestra no es una escueta operación aritmética que nos
suministre un valor. Es una función matemática, por eso el cambio de una variable,
obligatoriamente se acompaña del cambio de la otra preciada en la ecuación, esto nos
permite un mejor acercamiento al número que se pretende, ajustando a su vez el poder
estadístico con otros parámetros.

Se denota por: y = f(x)

Donde;

y = variable dependiente (atributo o característica cuyo cambio es el que interesa medir,


también se le denomina resultante o desenlace. En el cálculo del tamaño de la muestra, es el
número de participantes que se necesitan).

x = variable independiente (atributo o característica que explica o predice el cambio en la


variable dependiente. En el cálculo del tamaño de la muestra, un ejemplo es el poder
estadístico que se requiere y que el investigador fija con antelación).

f = función (es una colección de pares de valores ordenados, que pertenecen a diferentes
conjuntos. En el cálculo del tamaño de la muestra, los conjuntos se pueden ejemplificar con
el poder estadístico y el número muestral resultante).

f (x) = regla de correspondencia (expresa que para cada elemento de un conjunto se


relaciona solamente con un elemento de otro conjunto En el cálculo del tamaño de la
muestra, para un elemento del poder estadístico se relaciona solamente con un número
muestral).

Rigor en el cálculo del tamaño de muestra en ciencias

En las distintas áreas de la investigación científica se tiene que tener rigor metodológico,
así como para la elaboración del protocolo, como para desarrollar las distintas etapas de la
investigación. Con ese orden de ideas, es reivindicatorio la misma severidad para evaluar el
tamaño de la muestra en investigación en educación médica, esto aplicaria para los estudios
contenidos en el compás de la investigación en educación médica.6

¿En dónde se registra el desarrollo del cálculo del tamaño de la muestra?

Los sitios en donde se desglosa este proceso son: el protocolo de la investigación, en las
tesis de Maestrías y Doctorados en Ciencias Médicas y de la Salud, y en ocasiones en las de
licenciatura, lo que demuestra que se da como un valor entendido que se realizó con rigor
metodológico.

Aspectos básicos en el proceso de muestreo. De población a muestra y viceversa

Población (cantidad representada en las fórmulas como N), es el conjunto total de


elementos del que se puede seleccionar la muestra y está conformado por elementos
denominados unidades de muestreo o unidades muestrales, con cierta ubicación en espacio
y tiempo. Las unidades de muestreo pueden ser individuos, familias, universidades, grupos
de alumnos, profesores, etc. Una muestra (cantidad representada en las fórmulas como n),
no es más que un subconjunto de la población que se obtiene por un proceso o estrategia de
muestreo.4,7

El objetivo fundamental para seleccionar una muestra es hacer inferencias estadísticas


(estimaciones de uno o más parámetros acerca de una población de interés). Esta población
es la que se desea investigar y se le denomina población de interés, blanco, objeto o diana.
Para que la extrapolación (inferencia estadística) tenga validez, la muestra debe ser
representativa, y alude a que el estimador muestral de las variables de interés debe tener
una distribución similar a las de la población de dónde proviene.

Factores para la determinación del tamaño de la muestra

Los factores que determinan el tamaño de muestra, son de orden estadístico o logístico. El
logístico se encuentra con limite financieros, y la disponibilidad de participantes, el resto
son factores de orden estadístico que comentamos a continuación;

1. Hipótesis.

2. Error tipo I o error α.

3. Error tipo II o error β.

4. Poder estadístico.

5. Variabilidad.

6. Pérdidas en el seguimiento del estudio.

7. Relevancia del tamaño del efecto y significancia estadística.

4. PARA CADA UNO DE LOS PUNTOS ANTERIORES REALIZAR DOS


EJEMPLOS PRÁCTICOS

INTRODUCCIÓN PARA LOS DISEÑOS DE EXPERIMENTOS

Ejemplo 1.
Una compañía telefónica quiere conocer la influencia de varios elementos o factores en la
variable de la duración de una llamada por teléfono. Los factores que se toman en cuenta
son los siguientes: la hora en la que se hace la llamada; el día de semana que se ejecuta la
llamada; el área de la ciudad desde que se hace la llamada; el sexo de la persona del que
hace la llamada; el tipo de teléfono usado (público o privado) para realizar la llamada.

Ejemplo 2.
Una empresa de software está intrigada en estudiar la variable porcentaje en que se prensa
un fichero, al utilizar un programa de presión o compresión habiendo en cuenta el tipo de
programa utilizado y el tipo de fichero que se comprime. — Se pretende analizar el
rendimiento de los estudiantes en una materia y, para esto se necesita controlar varios
factores; El profesor que da la materia; la técnica de enseñanza; el sexo del estudiante.

ANÁLISIS DE LA VARIANZA. INTERVALOS DE CONFIANZA

Ejemplo de intervalo de confianza.

Se desea estimar la media del tiempo que un corredor emplea para completar una maratón.
Para ello se han cronometrado 10 maratones y se ha obtenido una media de 4 horas con una
desviación típica de 33 minutos (0,55 horas). Se desea obtener un intervalo al 95% de
confianza

Para obtener el intervalo, no tendríamos más que sustituir los datos en la fórmula del
intervalo.
El intervalo de confianza, sería la parte de la distribución que queda sombreada en azul.
Los 2 valores acotados por este serían los correspondientes a las 2 líneas de color rojo. La
línea central que parte la distribución en 2 sería el verdadero valor poblacional.

Es importante resaltar que en este caso, dado que la función de densidad de la distribución
N(0,1) nos da la probabilidad acumulada (desde la izquierda hasta el valor crítico), tenemos
que encontrar el valor que nos deja a la izquierda 0,975% (este es 1,96).
REFERENCIAS BIBLIOGRÁFICAS

Diseño y Análisis de Experimentos. Douglas C. Montgomery. Grupo Editorial


Iberoamerica. 2002.

Geroge E. P. Box, Willliam G. Hunter y J. Stuart Hunter. Estadística para investigadores.


Introducción al diseño y análisis de experimentos, análisis de datos y construcción
de modelos, Editorial Reverté, S.A.1989.

William G. Cochran y Gertrude M.cox . Diseños Experimentales. Editorial Trillas. 1980.

También podría gustarte