Está en la página 1de 23

300046_33

ESTADÍSTICA DESCRIPTIVA (PARA AGRARIAS)

ELABORADO POR:
MONICA DANIELA DIAZ
300046_33

PRESENTADO AL TUTOR:

LUIS ALBERTO CACERES TORRES

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)

JULIO DE 2019
INTRODUCCIÓN

Por medio del siguiente trabajo se lleva a cabo la aplicación de conocimientos referentes
a la materia estadística descriptiva usados dentro del campo de agrarias para calcular la
calidad de una producción o las probabilidades de obtener los resultados que se quieren.

El análisis de la información nos permite tomar decisiones importantes, montar bases de


datos y procesar la información de manera eficiente con la herramienta tecnológica del
programa R
Objetivo general:

 Elaborar documento de aplicación de conceptos de probabilidad y estadística


descriptiva

Objetivos Específicos:

 Definir conceptos básicos de estadística, variables aleatorias y probabilidades y


modelos probabilísticos
 Implementar el programa R para obtener tablas de frecuencias relativas y
frecuencias relativas acumuladas
 Desarrollar ejercicios de los modelos probabilísticos en el programa R
 Aplicar conceptos y la herramienta R a un proyecto real basado en agronomia
DESARROLLO DEL TRABAJO

 VECTOR DE DATOS: Vector de datos: Los vectores son estructuras de datos


similares a los arreglos, pero más desarrollados, ya que entre otras cosas, crecen
y decrecen dinámicamente, según se necesite
 Matriz de datos: Es una estructura ordenada de filas y columnas
 Variable cuantitativa continua: son datos que pueden adoptar cualquier valor en
el marco de un determinado intervalo, como la estatura
 Variable cuantitativa discreta: son valores que están separados entre sí en la
escala. Dicho de otro modo: no existen otros valores entre los valores específicos
que la variable adquiere. La cantidad de mascotas que tiene una persona
 Variable cualitativa nominal: presenta modalidades no numéricas que no admiten
un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades:
soltero, casado, separado, divorciado y viudo.
 Variable cualitativa categórica: es una variable que puede tomar uno de un
número limitado, y por lo general fijo, de posibles valores, asignando a cada
unidad individual u otro tipo observación a un grupo en particular o categoría
nominal sobre la base de alguna característica cualitativa
 TABLA DE FRECUENCIAS: Es la manera de organizar los datos dentro de una
tabla. Esta organizada en columnas y filas donde las columnas contienen el valor
de la variable y en las columnas la frecuencia con que se repite.
 TABLA DE FRECUENCIAS DE VARIABLE CONTINUA: En estas tablas las
variables las vamos a encontrar como intervalos. En la siguiente grafica
encontramos un ejemplo de este tipo de tabla.
Ejemplo de tabla de frecuencia variable continua:
DEPARTAMENTO DE ECUACIONES DIFERENCIALES
Y ANÁLISIS NUMÉRICO, Universidad de Sevilla, área de análisis matemático recuperado de
https://www.google.com/url?q=http://departamento.us.es/edan/php/asig/GRAFAR/GFMA/Tema1.pdf&sa=D&source=hangouts&ust=
1550246150702000&usg=AFQjCNFdQNod426EJV1uqosJBPApBzEJ-g

La tabla nos muestra una muestra el peso de 500 personas de la universidad. Como
podemos observar en la primera columna usamos intervalos de peso para realizar el
estudio.

Intervalos: rangos de valores

ni: número de individuos totales de la muestra que pesan 45 kilos

fi (Frecuencia relativa): la probabilidad de encontrar un individuo con 45 kilos es de 0.002


es decir usando la fórmula de fi: 1/500 = 0.002 (proporción)

%: el dato anterior pero representado en porcentaje

Frecuencia absoluta: Número de individuos. Lo que participa un individuo de ese grupo


total de la muestra.

 Tabla de frecuencias de una variable discreta: estas tablas no contienen


intervalos. Solo manejan números reales en la primera columna o en la parte de
la variable
Con el ejemplo que observamos en el video:

DEPARTAMENTO DE ECUACIONES DIFERENCIALES


Y ANÁLISIS NUMÉRICO, Universidad de Sevilla, área de análisis matemático recuperado de
https://www.google.com/url?q=http://departamento.us.es/edan/php/asig/GRAFAR/GFMA/Tema1.pdf&sa=D&source=hang
outs&ust=1550246150702000&usg=AFQjCNFdQNod426EJV1uqosJBPApBzEJ-g

La tabla muestra el número de hermanos que tiene una muestra de 500 alumnos
varones de la Universidad. Comparándola con la tabla de frecuencia cuantitativa
continua, esta tabla maneja columnas como Frecuencia absoluta, frecuencia
relativa, porcentaje y frecuencia absoluta acumulada.
 Tablas de frecuencia variables cualitativas:
Para las tablas de frecuencia con
variable cualitativa el orden de la
clase no afecta el estudio que se
esté realizando.

 HISTOGRAMA: Son usadas para representar gráficamente las frecuencias de


variables continuas, porque son barras rectangulares que ocupan un rango o un
intervalo
 Grafico de barras: Son un conjunto de barras que representan un valor. Entre más
alto sea el valor, más larga será la longitud de las barras.
 Media muestral: Se usa para estimar la media muestral de una población. Su
formula esta dada por:

 Varianza muestral: es el cuadrado de la desviación estándar s2


 Defina Mediana: representa el valor de la variable de posición central en un
conjunto de datos ordenados
 Defina Moda: la moda es el valor con mayor frecuencia en una distribución de
datos.

Tema variable aleatorias y probabilidades


 Espacio muestral y con que letra se denota: Denotado con la letra griega omega
(Ω). Es el conjunto de todos los valores que potencialmente pueden asumir en un
estudio aleatorio
 Punto muestral: Se denomina punto muestral a cada uno de los posibles
resultados de un estudio aleatorio, es decir a cada elemento de Ω
 Evento muestral: Se llama evento a cualquier subconjunto de elementos de Ω
 En el caso de distribuciones de variables aleatorias cuando una variable es
continua y simétrica que modelo se usa.: Para una variable continua y de
distribución simétrica unimodal, es común el uso del modelo Normal

 ¿Para una variable de conteo no acotado que modelo se utiliza?: Para conteos no
acotados en el modelo Poisson
 ¿Para variables de proporciones que modelo se utiliza?: Para proporciones se
piensa en el modelo probabilístico Binomial
 Que variables tienen función de probabilidad y que variables tienen función de
densidad.

La función de distribución de probabilidad de una variable aleatoria discreta


La función de densidad de una variable aleatoria continúa denotada como f(.)

DISTRIBUCION NORMAL

 Qué tipo de histograma se seleccionar un modelo probabilístico para una variable


aleatoria continua cuando se tienen datos de esa variable

Para una variable aleatoria continua cuando se tienen datos de esa variable, resulta
recomendable graficar un histograma de frecuencias relativas y observar la forma del
mismo

 Que es la estandarización, cuál es su fórmula.

La estandarización que nos permite cualquier distribución normal a la distribución


normal estándar. La transformación, estandarización tiene la siguiente formula
DISTRIBUCIÓN BINOMIAL

 Qué tipo de conteos se trabajan con la distribución Binomial

Puede usarse para el cálculo de probabilidades de eventos provenientes de conteos


acotados.

 En la distribución binomial que es n y que es P.

Se supone que se realizan cierto número (n) de experimentos aleatorios y en cada


experimento se registra uno de dos resultados posibles, éxito o fracaso donde el éxito
tiene una cierta probabilidad (P) de ocurrencia

DISTRIBUCION DE POISSON

 Que tipos de conteos se trabaja con la distribución de Poisson.


En agronomía se usa para que tipo de conteos, les recuerdo los ácaros por ejemplo
se pueden trabajar con esta distribución
 Como se denota el único parámetro de esta distribución, a que es igual la media
y la varianza.
El único parámetro de la distribución Poisson es λ. La propiedad de esperanza igual
a varianza de la distribución Poisson implica que al aumentar el promedio de los
conteos, aumenta también su varianza. La varianza de una Poisson es función de la
media.

En el documento Word individual debe presentar un resumen de sus resultados


obtenidos que registre la tabla de frecuencias de la variable continua, los gráficos de
barras de la variable discreta y la cualitativa, respondiendo cuál es la media de la variable
continua, el intervalo de más alta frecuencia relativa en la variable continua, el máximo y
mínimo se su variable discreta y el valor de probabilidad de la variable cualitativa. Hasta
aquí es su trabajo individual desarrollo de los puntos 1 y 2 de la presente guía que
debe remitirlo en formato Word en el entorno de seguimiento y evaluación del
Aprendizaje
Para la elaboración de este proyecto definimos las siguientes variables:

 Poblacion total de Colombia desde 1960 hasta 2008 (cuantitativa discreta)


https://datos.bancomundial.org/pais/colombia?view=chart
 Emisiones de CO2 (toneladas métricas per cápita) (cuantitativa continua)
https://datos.bancomundial.org/indicador/EN.ATM.CO2E.PC?locations=CO&v
iew=chart
 Encuesta sobre hogares que reciclan (si-no) (cualitativa)
https://www.dane.gov.co/files/investigaciones/pib/ambientales/cuentas_ambie
ntales/cuentas-residuos/Bt-Cuenta-residuos-2016p.pdf

Calcular la media y desviación estándar de variable continuas y discreta, en caso de


variable cualitativa la probabilidad de éxito ejemplo si de 50 datos 40 son primera calidad
la probabilidad de éxito es 40/50 = 0.8.

Tabla de frecuencias para la variable continua:

Intervalo Ni Fi % Frec. Abs. Acumulada

1,02192720462751 < x < 1,200 4 0,08 8 4

1,201< x < 1,300 4 0,08 8 8


1,301 < x < 1,400 9 0,18 18 17

1,401 < x < 1,500 7 0,14 14 24

1,501 < x < 1,600 4 0,08 8 28

1,601 < x < 1,700 15 0,3 30 43

x > 1,701 7 0,14 14 50

50 1 100

El intervalo de más alta frecuencia relativa en la variable continua:

1524 < X < 1652

histograma para la variable continua


15
Frequency

10
5
0

1.01 1.14 1.27 1.40 1.52 1.65 1.78 1.91

Class limits

Tabla de frecuencias para la variable discreta

TOTAL HABITANTES Ni Fi % Frec. Abs. Acumulada


16057724 1 0,02 2 1
16567811 1 0,02 2 2
17092918 1 0,02 2 3
17629979 1 0,02 2 4
18175185 1 0,02 2 5
18725245 1 0,02 2 6
19279740 1 0,02 2 7
19837510 1 0,02 2 8
20393699 1 0,02 2 9
20942456 1 0,02 2 10
21480065 1 0,02 2 11
22003980 1 0,02 2 12
22516425 1 0,02 2 13
23024517 1 0,02 2 14
23538386 1 0,02 2 15
24065507 1 0,02 2 16
24608113 1 0,02 2 17
25164545 1 0,02 2 18
25733673 1 0,02 2 19
26312994 1 0,02 2 20
26900506 1 0,02 2 21
27496617 1 0,02 2 22
28101819 1 0,02 2 23
28714190 1 0,02 2 24
29331238 1 0,02 2 25
29951201 1 0,02 2 26
30572478 1 0,02 2 27
31195413 1 0,02 2 28
31822525 1 0,02 2 29
32457499 1 0,02 2 30
33102575 1 0,02 2 31
33758337 1 0,02 2 32
34422569 1 0,02 2 33
35091275 1 0,02 2 34
35758979 1 0,02 2 35
36421438 1 0,02 2 36
37076387 1 0,02 2 37
37723800 1 0,02 2 38
38364309 1 0,02 2 39
38999471 1 0,02 2 40
39629968 1 0,02 2 41
40255967 1 0,02 2 42
40875360 1 0,02 2 43
41483869 1 0,02 2 44
42075955 1 0,02 2 45
42647723 1 0,02 2 46
43200897 1 0,02 2 47
43737516 1 0,02 2 48
44254975 1 0,02 2 49
44750054 1 0,02 2 50
Gráfico de barras para la variable discreta

FRECUENCIAS RELATIVAS ACUMULADAS CONTEO


1.0
0.8
Frecuencias relativas

0.6
0.4
0.2
0.0

16057724 22003980 28101819 35091275 42075955

3. Archivo DATOS.CSV modificado con los datos recolectados


¿cuál es conteo de más alta probabilidad en caso de variable discreta?

En el ejemplo que se trabajo la base de datos contenia los datos de población total de
Colombia desde 1960 hasta 2008 y como en ningún año se repite el mismo numero de
habitantes podemos concluir que la probabilidad es la misma para todos los datos
almacenados.
1.0
0.8 Gráfico de barras CONTEO
Frecuencias absolutas

0.6
0.4
0.2
0.0

16057724 22003980 28101819 35091275 42075955

¿En el caso de la variable continua en la tabla de frecuencias cuál es el intervalo con


mayor frecuencia relativa?

[1.524,1.652) 16 0.32 32 40 80
15
Frequency

10
5
0

1.01 1.14 1.27 1.40 1.52 1.65 1.78 1.91

Class limits

El histograma nos permite evidenciar como el intervalo de 1.524,1.652 es el de mayor


frecuencia relativa
4. En este punto en grupo corran el código modelos y discutan en que variables lo pueden
aplicar en sus carreras, deben desarrollar un párrafo de síntesis

En el texto revisar el ejercicio de los híbridos de maíz y en el código MODELOS correr el


código para los datos registrados en este código que son los mismos del libro
Función de Densidad N(media.sigma)
0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Adicionalmente determinar la probabilidad de un valor entre 63 y 50 para el rendimiento,


también la probabilidad de un valor menor de 51 y un valor mayor a 50.
MODELO BINOMIAL
En el texto deben revisar en tema de modelo binomial el ejercicio de la germinación de
semillas de panicum correrlo con los datos del código MODELOS que son los mismos
del libro
Adicionalmente CON AYUDA DEL CÓDIGO determinar la probabilidad de germinar 6
semillas, por lo menos cuatro y a lo sumo 7.

Germinar 6:

Por lo menos cuatro:

A lo sumo 7.
CONCLUSIONES

Cuando existe la necesidad de realizar el estudio de la posibilidad que hay de que suceda
un evento o se cumple al azar, se debe contextualizar sobre las variables probabilísticas
y de los modelos probabilísticos que existen para la presentación de resultados.

El procesamiento de la información a través del problema R hace mucho más sencillo


poder analizar estas variables y hacer estudios más exactos llegando a conclusiones
acerca de la calidad de cosechas y demás.

El desarrollo de todas las actividades realizadas durante la materia amplio nuestros


conocimientos y mejora nuestra capacidad de análisis de la información y los datos
suministrados en diferentes estudios relacionados a nuestra carrera
BIBLIOGRAFIA

 Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en


problemas de agronomía. Recuperado de
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?docID=322177
5&query=bioestadistica

También podría gustarte