Está en la página 1de 13

ESTADISTICA II

DOCENTE: ING. OFMARA ESPINOSA RUIZ

ACTIVIDAD: INVESTIGACIÓN DE TEMAS

ALUMNO: MONROY DURAN VIANEY

ESPECILIDAD: INGENIERO AGRÓNOMO ZOOCTENISTA

GRADO Y GRUPO: 5.-B


INTRODUCCIÓN

El análisis de variables múltiples se usa cada vez más en medicina. Es una


técnica que analiza en forma simultánea varias variables que son sometidas a
investigación. La técnica a usar va a depender de si
las variables independientes y dependientes son nominales y/o numéricas.

2
INTRODUCCIÓN…………………………………………………………………………………………………………………….2

TEMA IV
ANÁLISIS DE DATOS DE DOS VARIABLES

4.1 Representación de datos de dos variables…………………………………………………………………4

4.2 Tabla de contingencias…………………………………………………………………………………………….…….4

4.3 Diagrama de dispersión……………………………………………………………………………………………….…5

4.4 Correlación lineal…………………………………………………………………………………………………………..…5

4.5 Diagrama de dispersión y análisis de correlación…………………………………………………..…6

4.6 Coeficiente de correlación…………………………………………………………………………………………..6

4.7 Regresión lineal………………………………………………………………………………………………………………7

4.8 Método de mínimos cuadrados……………………………………………………………………………………7

TEMA V
DISEÑO ESTADÍSTICO DE EXPERIMENTOS

5.1 Diseño completamente al azar……………………………………………………………………………………8

5.2 Diseño de bloques al azar……………………………………………………………………………………………9

5.3 Diseño de cuadro latino…………………………………………………………………………………….………..9

5.4 Diseño de parcelas divididas…………………………………………………………………………….………10

5.5 Diseño factorial con asignación al azar…………………………………………………………………..10

Conclusión……………………………………………………………………………………………………..………………………12

3
TEMA IV
ANÁLISIS DE DATOS DE DOS VARIABLES

4.1 REPRESENTACIÓN DE DATOS DE DOS VARIABLES

Estos datos constan de los valores de dos variables diferentes que se obtienen del
mismo elemento de la población.

Las variables cualitativas son aquellas que expresan características o cualidades, y no


pueden ser medidas con números. Por otro lado, las variables cuantitativas, son
aquellas que se expresan mediante un número, por tanto, se puede realizar
operaciones aritméticas con ellas

4.2 TABLA DE CONTINGENCIAS

Empleada para registrar y analizar la asociación entre dos o más variables.

Cuenta las observaciones por múltiples variables categóricas. Las filas y columnas de
las tabas corresponden a las variables categóricas.

La tabla de contingencia generalmente se realiza en datos categóricos, es decir que se


pueden dividir en grupos mutuamente excluyentes.

Un ejemplo de datos categóricos es la región de ventas de un producto. Típicamente,


la región se puede dividir en categorías como área geográfica (norte, sur, noreste,
oeste, etc.) o estado.

Es importante recordar que los datos categóricos no pueden pertenecer a más de una
categoría.

4
Uno de los principales usos de una tabla de contingencia es analizar la relación que
existe entre los datos, las cuales no son fáciles de identificar. Esto permite realizar
un estudio de mercado efectivo, examinando la información recolectada en una
encuesta.

4.3 DIAGRAMA DE DISPERSIÓN

Es una herramienta utilizada cuando se desea realizar un análisis gráfico de datos


bivariados, es decir, los que se refieren a dos conjuntos de datos. El resultado del
análisis puede mostrar que existe una relación entre una variable y la otra.

4.4 CORRELACIÓN LINEAL

La correlación lineal y la regresión lineal simple son métodos estadísticos que estudian
la relación lineal existente entre dos variables. ... A nivel experimental, la correlación
se suele emplear cuando ninguna de las variables se ha controlado, simplemente se han
medido ambas y se desea saber si están relacionadas.

5
4.5 DIAGRAMA DE DISPERSIÓN Y ANÁLISIS DE CORRELACIÓN

El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos


asociados de datos que aparecen en pares (por ejemplo, (x,y), uno de cada conjunto).
El diagrama muestra estos pares como una nube de puntos. Las relaciones entre los
conjuntos asociados de datos se infieren a partir de la forma de las nubes.

• Una relación positiva entre x y y significa que los valores crecientes de x están
asociados con los valores crecientes de y.

• Una relación negativa significa que los valores crecientes de x están asociados con
los valores decrecientes de y.

El diagrama de dispersión puede estudiar la relación entre:

• Dos factores o causas relacionadas con la calidad.

• Dos problemas de calidad.

• Un problema de calidad y su posible causa.

4.6 COEFICIENTE DE CORRELACIÓN

6
Una herramienta estadística elemental e importante para el estudio econométrico de
relaciones lineales bivariados que involucran el uso de datos de corte transversal o
series de tiempo. En particular, se analiza su relación con las denominadas
correlaciones espúreas o sin sentido.

El coeficiente de correlación es un estadístico que proporciona información sobre la


relación lineal existente entre dos variables cualesquiera. Básicamente, esta
información se refiere a dos características de la relación lineal: la dirección o
sentido y la cercanía o fuerza.

Es importante notar que el uso del coeficiente de correlación sólo tiene sentido si la
relación bivariada a analizar es del tipo lineal. Si ésta no fuera no lineal, el coeficiente
de correlación sólo indicaría la ausencia de una relación lineal más no la ausencia de
relación alguna. Debido a esto, muchas veces el coeficiente de correlación se define
de manera más general - como un instrumento estadístico que mide el grado de
asociación lineal entre dos variables.

4.7 REGRESIÓN LINEAL

El análisis de la regresión lineal se utiliza para predecir el valor de una variable según
el valor de otra. La variable que desea predecir se denomina variable dependiente. La
variable que está utilizando para predecir el valor de la otra variable se denomina
variable independiente. La regresión lineal es una técnica paramétrica de machine
learning. Con «paramétrica» queremos decir que incluso antes de mirar a los datos, ya
sabemos cuántos parámetros (o coeficientes) vamos a necesitar. Los mejores
coeficientes serán los que minimicen alguna medida de error.

7
4.8 MÉTODO DE MÍNIMOS CUADRADOS

Es un procedimiento de análisis numérico en la que, dados un conjunto de datos (pares


ordenados y familia de funciones), se intenta determinar la función continua que
mejor se aproxime a los datos (línea de regresión o la línea de mejor ajuste),
proporcionando una demostración visual de la relación entre los puntos de los mismos.
En su forma más simple, busca minimizar la suma de cuadrados de las diferencias
ordenadas (llamadas residuos) entre los puntos generados por la función y los
correspondientes datos.

Este método se utiliza comúnmente para analizar una serie de datos que se obtengan
de algún estudio, con el fin de expresar su comportamiento de manera lineal y así
minimizar los errores de la data tomada.

Su expresión general se basa en la ecuación de una recta y = mx + b. Donde m es la


pendiente y b el punto de corte, y vienen expresadas de la siguiente manera:

TEMA V DISEÑO ESTADÍSTICO DE EXPERIMENTOS

5.1 DISEÑO COMPLETAMENTE AL AZAR

8
El diseño completamente al azar es el más sencillo de los diseños de experimentos que
tratan de comparar dos o más tratamientos, puesto que sólo considera dos fuentes de
variabilidad: los tratamientos y el error aleatorio.

Es una prueba basada en el análisis de varianza, en donde la varianza total se


descompone n la varianza de los tratamientos y la varianza del error. Su objetivo es
determinar si existe diferencia significativa entre los tratamientos, para lo cual se
compara si la varianza del tratamiento contra la varianza del error y se determina si la
primera es suficientemente alta según la distribución F.

5.2 DISEÑO DE BLOQUES AL AZAR

Su objetivo es tener comparaciones precisas entre los tratamientos bajo estudios.


Utilizar bloques es una forma de reducir y controlar la varianza del error
experimental para tener mayor precisión.

Generalmente los criterios de bloqueo son:

-Proximidad (parcelas vecinas)

-Características físicas (edad, sexo, peso)

-Tiempo

-Manejo del experimento

5.3 DISEÑO DE CUADRO LATINO

Los diseños en cuadrados latinos son apropiados cuando es necesario controlar dos
fuentes de variabilidad. En dichos diseños el número de niveles del factor principal
tiene que coincidir con el número de niveles de las dos variables de bloque o factores
secundarios y además hay que suponer que no existe interacción entre ninguna pareja
de factores.

9
El procedimiento para construir un diseño en cuadrado latino es el siguiente:

1) Se elige aleatoriamente un cuadrado latino de los disponibles.

2) Se asigna aleatoriamente el orden de las filas y columnas.

3) Se asignan aleatoriamente los tres factores a las filas, columnas y letras,


respectivamente.

En resumen, podemos decir que un diseño en cuadrado latino tiene las siguientes
características:

1) Se controlan tres fuentes de variabilidad, un factor principal y dos factores de


bloque.

2) Cada uno de los factores tiene el mismo número de niveles, K.

3) Cada nivel del factor principal aparece una vez en cada fila y una vez en cada
columna.

4) No hay interacción entre los factores

5.4 DISEÑO DE PARCELAS DIVIDIDAS

Un diseño de parcelas divididas es un experimento diseñado que incluye al menos un


factor difícil de cambiar que es difícil de aleatorizar completamente debido a
limitaciones de tiempo o costo. En un experimento de parcelas divididas, los niveles del
factor difícil de cambiar se mantienen constantes durante varias corridas
experimentales, las cuales se tratan colectivamente como una parcela completa. Los
factores fáciles de cambiar se varían en estas corridas, y cada combinación se
considera una parcela subdividida dentro de la parcela completa. Usted debería
aleatorizar el orden en el que ejecuta las parcelas completas y las parcelas
subdivididas dentro de las parcelas completas.

Ejemplo:

Una panadería de gran escala diseña una nueva receta de brownie. Están
experimentando con dos niveles de chocolate y azúcar, utilizando dos temperaturas
diferentes de horneado. Sin embargo, para ahorrar tiempo, en lugar de hornear cada
bandeja por separado, deciden hornear más de una bandeja de brownies al mismo
tiempo. El ejemplo de los brownies incluye 2 parcelas completas a partir de las cuales
se crean dos réplicas (total de 4 parcelas completas). Cada parcela

10
completa contiene 4 parcelas subdivididas. La parcela completa está conformada por
todas las bandejas de brownies que se hornean a la misma temperatura. Las parcelas
subdivididas son cada bandeja individual de brownies.

5.5 DISEÑO FACTORIAL CON ASIGNACIÓN AL AZAR

El diseño factorial estudia la influencia simultánea de dos o más VI (factores) sobre


una, o más de una, VD. Cada factor puede tener dos o más valores (o niveles). Cada
tratamiento (o condición experimental) consiste en la combinación de los respectivos
valores de un factor con los del otro (u otros). Al analizar simultáneamente dos o más
factores en un solo experimento se puede estudiar: *El efecto de cada factor por
separado (como si se tratara de un diseño con una sola VI). *El efecto de la
combinación de los niveles de los diferentes factores sobre la VD. El experimento
factorial más sencillo consta de dos factores con dos niveles cada uno: Diseño
factorial AxB • A: número de niveles de un factor. • B: número de niveles del otro
factor. A medida que aumenta el número de factores y el número de niveles de cada
factor, aumenta el número de tratamientos y la dificultad para realizar, controlar e
interpretar el experimento.

¿Cuándo usar un diseño factorial? Un diseño factorial es utilizado generalmente por


los científicos que desean comprender el efecto de dos o más variables
independientes respecto de una única variable dependiente.

11
CONCLUSIÓN

En la actualidad la Estadística se ha constituido en una herramienta importante en los


procesos de investigación, puesto que permite planear la investigación, recolectar,
organizar, representar, interpretar y analizar la información referente a individuos u
observaciones de un fenómeno al cual se le estudian, es ,más que claro que la
estadística es una base de la vida diaria del ser humano dado que su uso es muy
marcado , un ejemplo de ello en la vida cotidiana de un agricultor puede ser de la
población y muestra en donde se puede tener una cierta cantidad de vacas, plantas,
etc la cual consideraremos como la población y asi mismo sacaremos una parte de ellos
dándole el nombre de muestra.

12
BIBLIOGRAFIA
https://www.monografias.com/docs/Representaci%C3%B3n-De-Datos-De-Dos-Variables

https://www.questionpro.com/blog/es/que-es-una-tabla-de-contingencia/

https://es.wikipedia.org/wiki/Diagrama_de_dispersi%C3%B3n

https://www.jmp.com/es_mx/statistics-knowledge-portal/exploratory-data-analysis/scatter-
plot.html

https://victoryepes.blogs.upv.es/2013/04/27/diseno-completamente-al-azar-y-
anova/#:~:text=El%20dise%C3%B1o%20completamente%20al%20azar,tratamientos%20y%20el%2
0error%20aleatorio.

http://ri.uaemex.mx/oca/view/20.500.11799/34302/1/secme-17390.pdf

13

También podría gustarte