Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DE FRONTERA – SULLANA
ESTUDIO MONOGRÁFICO
ESTUDIANTE:
ROSALES RUIZ MILAGROS
CÁTEDRA:
METODOS ESTADISTICOS PARA LA INVESTIGACION
SULLANA - PERÚ
2018
Dedicatoria
Este trabajo está dedicado a nuestros queridos
padres, por brindarnos su apoyo incondicional día a
día y al docente por educarnos con esfuerzo y
entusiasmo, para lograr nuestros objetivos y
agradecerle por su dedicación.
INDICE
TEMA
TITULO i
DEDICATORIA ii
INDICE iii
I. INTRODUCCIÓN
II. MARCO TEORICO
III. CAPITULO I
IV. ANALISIS DE REGRESION
V. INTERVALO DE CONFIANZA
VI. DISEÑO DE ANALISIS EXPERIMENTAS
VII. DISEÑO DE EXPERIMENTOS CON UN SOLO FACTOR: EL ANÁLISIS
DE VARIANZA
VIII. CONTROL ESTADISTICO DE CALIDAD
IX. CONCLUSIONES
X. BIBLOGRAFIA
I. INTODUCCCION
Este presente trabajo se refiere al tema de estadística, que se puede definir es
la ciencia cuyo objetivo es reunir una información para facilitar al hombreen
el estudio de datos masivos de individuos, grupos, etc. El método y la
importancia de la estadística ya que se relaciona con el estudio de los procesos
cuyo resultado es más o menos imprescindibles con la finalidad de tener
conclusiones razonables. la estadística se ocupa de los métodos científico para
recolectar, resumir, organizar, presentar y analizar datos. La estadística
inferencial aporta las técnicas necesarias para extraer conclusiones sobre el
valor poblacional de un determinado parámetro a partir de la evaluación de
una muestra. Las conclusiones derivadas de este proceso inferencial siempre
estarán sujetas a error como consecuencia de la variabilidad aleatoria unida al
propio procedimiento de selección muestral.
Uno de los aspectos más relevantes de la Estadística es el análisis de la
relación o dependencia entre variables. Frecuentemente resulta de interés
conocer el efecto que una o varias variables pueden causar sobre otra, e incluso
predecir en mayor o menor grado valores en una variable a partir de otra. Por
ejemplo, supongamos que la altura de los padres influyen significativamente
en la de los hijos. Podríamos estar interesados en estimar la altura media de
los hijos cuyos padres presentan una determinada estatura.
Intervalos de confianza métodos que se usan para tomar decisiones sobre
poblaciones, a partir de los resultados de una muestra aleatoria escogida de
esa población. Para llegar a tomar decisiones estadísticas se debe partir de
afirmaciones o conjeturas con respecto a la población en el que estamos
interesados. Tales suposiciones, pueden ser verdaderas o no. Una conjetura
hecha sobre una población o sobre sus parámetros deberá ser sometida a
comprobación experimental con el propósito de saber si los resultados de una
muestra aleatoria extraída de esa población, contradicen o no tal conjetura.
En cualquier experimento, la variabilidad proveniente de un factor de ruido
puede afectar los resultados.
Un factor de ruido es un factor que probablemente tiene un efecto en la
respuesta pero que no nos interesa estudiar.
Si el factor de ruido es desconocido y no controlable, la soluciones la
aleatorización, que tiende a distribuirlos niveles y efectos de este factor entre
todas las factoras de ruido es conocido y no controlable, pero por lo menos
podemos medir su valor en cada corrida del experimento, entonces podemos
compensarlo usando análisis de con varianza.
Si el factor de ruido es conocido y controlable, se utilizan bloques para
eliminar su efecto en la comparación estadística.
II. MARCO TEORICO
Existen dos formas distintas pero relacionadas del estudio de la asociación entre
variables a partir de una muestra aleatoria. La primera forma, es determinar una
relación funcional de la variable dependiente Y con respecto a una o más variables
independientes con el fin de predecir valores de Y. Este método es el análisis de
regresión. La segunda forma de estudio de la asociación entre variables, es, medir el
grado de relación entre ellas, mediante un coeficiente o índice. A esta técnica se
denomina análisis de correlación.
. V. INTERVALO DE CONFIANZA
El proceso de inferencia es aquel mediante el cual se pretende estimar el valor de
un parámetro a partir del valor de un estadístico. Esta estimación puede ser puntual
o bien por intervalo. La mejor estimación puntual de un parámetro es simplemente
el valor del estadístico correspondiente, pero es poco informativa porque la
probabilidad de no dar con el valor correcto es muy elevada, es por eso que se
acostumbra a dar una estimación por intervalo, en el que se espera encontrar el
valor del parámetro con una elevada probabilidad. Esta estimación recibe el
nombre de estimación mediante intervalos de confianza.
La estimación por intervalos de confianza consiste en determinar un posible rango
de valores o intervalo (a; b), en el que, con una determinada probabilidad, sus
límites contendrán el valor del parámetro poblacional que andamos buscando.
Para cada muestra obtendremos un intervalo distinto que, para el X % de ellas,
contendrá el verdadero valor del parámetro. A este intervalo se le denomina
intervalo de confianza.
Evidentemente esta técnica no tiene por qué dar siempre un resultado correcto,
tal y como hemos comentado para algunas muestras el intervalo correspondiente
contendrá el verdadero valor del parámetro y para otras no. A la probabilidad de
que hayamos acertado al decir que el intervalo contiene al parámetro se la
denomina nivel de confianza (o simplemente confianza). También se denomina
nivel de significación a la probabilidad de errar en esta afirmación, es decir la
significación (probabilidad de errar.
Intervalo de confianza para la media poblacional.
ᶞ
√𝑛
que representa la desviación típica de la variable original y n es el tamaño de la muestra.
a la expresión anterior se le llama error estándar de la media. supongamos que tenemos
una variable cuantitativa cualquiera x, cuya media en la población es m y cuya desviación
típica (también en la población) es s. si se toman varias muestras de tamaño
suficientemente grande y llamamos x a la variable que guarda las medias
muestralesXXXX para cada una de las muestras, por el teorema central del límite tenemos
asegurado:
ᶞ
x~N(u )
√𝑛
ERROR ESTÁNDAR DE UN PORCENTAJE
En el caso de que la variable de interés sea una variable nominal no tiene sentido que nos
planteemos el error estándar de su media (de hecho, la media de una variable nominal no
tiene tampoco sentido) sino el de su porcentaje de individuos en cada uno de sus valores.
En este caso si P es el porcentaje de respuestas en ese valor su error estándar será:
𝑝(100 − 𝑝)
√
𝑛
En la expresión anterior se ha supuesto que la variable P está expresada en tantos por 100,
si estuviera expresada en tantos por uno (es decir P es un valor entre 0 y 1) únicamente
habríamos de cambiar en ella el valor 100 por 1 y la expresión seguiría siendo válida.
Supongamos que tenemos una variable categórica y que nos interesa estimar el porcentaje
de una de sus categorías en la población, al que llamamos P. Si tomamos varias muestras
de tamaño suficientemente grande (n) y en cada una de esas muestras obtenemos una
estimación del porcentaje de interés, si llamamos b P a la variable que guarda los
porcentajes de esas muestras, se cumple que esta variable aleatoria sigue la siguiente
distribución:
𝑃∗(100_1 )
p~N(P,√ 𝑛
4.2.3. DISEÑO Y ANALISIS DE EXPERIMENTOS
la Experimentación es concebida como el proceso de realización de un experimento; y el
Experimento, como un procedimiento que le permite al investigador, reproducir bajo
condiciones “controladas” un fenómeno real con el objetivo de obtener la información
necesaria para la contrastación objetiva de hipótesis relativas al efecto de factores
específicos de la producción.
Antes de realizar un experimento hay que planificarlo de tal manera que permita obtener
la información pertinente al problema bajo investigación, a esta etapa se le conoce como
diseño del experimento, y puede concebirse como la secuencia completa de pasos a
realizar para asegurar que se obtendrá la información necesaria para el contraste de la (s)
hipótesis planteada (s). 4.1. Principios básicos del diseño experimental. Existen tres
principios básicos inherentes a todo plan experimental, esenciales para los objetivos de la
investigación científica: la repetición, la aleatorización y el control local.
1. Repetición: Significa que cada tratamiento será efectuado más de una vez (habrá más
de una unidad experimental para cada tratamiento). Es necesario indicar que las medidas
repetidas en la misma unidad experimental no significan repeticiones sino submuestreo.
3. Control local: son las acciones que se realizan con el propósito de hacer más eficiente
el experimento, incrementando la sensibilidad de las pruebas de significancia al reducir
la magnitud del error experimental.
Necesidad del análisis estadístico.
Según Davies (1958), “un buen diseño experimental es aquel que proporciona la
información requerida con el mínimo esfuerzo experimental”. La información requerida
se refiere a que los datos permitan un análisis objetivo que conduzca a conclusiones
válidas con respecto al problema que se estudia, en cuanto al esfuerzo experimental se
entiende por el ahorro de tiempo, dinero, personal y material experimental.
4. Amplio rango de validez a las conclusiones: es deseable tratar de que las conclusiones
a las que se llegue, tengan un rango de validez lo más amplio posible. Repetir en el tiempo
y/o espacio un experimento ayuda para esto, los experimentos factoriales también son
útiles para este propósito.
Factor: es cada una de las variables independientes cuyo efecto se está interesado en
evaluar. Si un experimento consta de un solo factor se llama experimento simple, y si
incluye dos o más factores se llama experimento factorial. Tratamiento: en un
experimento simple es cada una de los valores que toma el factor y que van a ser incluidos
en el experimento. En un experimento factorial, los tratamientos son todas las
combinaciones posibles entre los niveles de los factores a estudiar. Cada tratamiento está
compuesto por la combinación de un nivel de cada factor, estando presentes todos los
tratamientos.
Unidad experimental: es la porción de material experimental a la cual se le aplica un
tratamiento en una repetición de un experimento. Puede ser: un número de surcos en una
parcela de terreno, un grupo de árboles, una planta, una hoja, un animal, un grupo de
animales, etc.
Análisis de Yates
La técnica fundamental consiste en repartir el total en componentes mediante sumas de
cuadrados. Esta técnica tuvo efectos secundarios en el modelo. Por ejemplo, demostramos
el modelo para un ANOVA simplificado con un tipo de tratamiento en diversos niveles.
𝑺𝑪𝒕𝒐𝒕𝒂𝒍 = 𝑺𝑪𝒆𝒓𝒓𝒐𝒓+𝑺𝑪𝒕𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔 Los grados de libertad se pueden repartir de
manera similar y especifican distribuciones χ² que describen las sumas asociadas de
cuadrados.
𝒈𝒍𝑻𝒐𝒕𝒂𝒍 = 𝒈𝒍𝑬𝒓𝒓𝒐𝒓+ 𝒈𝒍𝑻𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐𝒔
Diseño factorial 2k
Cuando en un experimento hay varios factores de interés, utilizamos el diseño
experimental factorial. En el experimento factorial, se analizarán todas las posibles
combinaciones de los niveles de los factores en cada réplica del experimento, para
estudiar el efecto conjunto de estos sobre una respuesta. Un experimento 2k proporciona
el menor número de ensayos con los cuales se pueden estudiar k factores en un diseño
factorial completo. Existen varios casos especiales del diseño factorial, pero el más
importante de todos ocurre cuando se tienen k factores, cada uno de ellos a dos niveles
(22 es el factorial más pequeña). Debido a que sólo hay dos niveles para cada factor,
asumimos que la respuesta es aproximadamente lineal en el rango de los niveles elegidos
de los factores. El efecto de un factor se define como el cambio en la respuesta que
produce un cambio en el nivel del factor.
Diseño 2k para k = 2 factores Este diseño, es el más sencillo de la serie. Consideramos
dos factores: A y B, cada uno a 2 niveles. Normalmente consideramos estos niveles como
los niveles alto y bajo del factor ojtet El diseño 22 puede ser representado
geométricamente como un cuadrado con 4 ensayos.
Para cualquier diseño 2k con n replicas, la estimación del efecto y de los cuadrados se
estiman de la siguiente forma:
Efecto = Contraste/n2K-1
SSx = [Contraste] 2/n2k Los efectos de interés en el diseño 22,
son los efectos principales de A y B y la interacción AB. Estimaremos cada uno de los
efectos de la siguiente forma: A = [a+ab-b-(1)]/2n B
= [b+ab-a-(1)]/2n AB = [ab+(1)-a-b]/2n
CONCLUSIONES
Se determinó como se puede aplicar control estadístico en la
calidad en el momento de su elaboración y fabricación de los
alimentos.
Conocer cada uno de los métodos que se puede utilizar
en el curso de métodos de estadística.
Bibliografía
MATEO LÓPEZ, L. J. (1991): Control estadístico de calidad. Mateo López, Luis Juan
(Autoeditor). Madrid