Está en la página 1de 26

FASE 2 – VARIABLES ESTADISITICAS

LESFLI FLATIANA CAMPOS

NELCY YISETH HOLGUIN

GERMÁN JAVIER CABALLERO CÁCERES

EDWIN GONZÁLEZ PATIÑO

GRUPO COLABORATIVO:

300046_31

TUTOR:

FRANCISCO JOSE MONTEALEGRE

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESCUELA DE CIENCIAS AGRICOLAS, PECUARIAS Y DEL MEDIO AMBIENTE

ZOOTECNIA

MARZO- 2020
INTRODUCCION

La estadística es la ciencia de recolectar describir e interpretar datos. Un objetivo en la


estadística es describir la población con base a una información obtenida mediante la
observación de relativamente pocos elementos individuales. Cuando se le da una solución
estadística a un problema, se desarrolla una secuencia de pasos que constituyen el del arte de la
investigación estadística a través de las variables continuas y discretas.

En el desarrollo de la presente actividad se pretende dar el concepto básico de variables


estadísticas para poder continuar con los conceptos teóricos- práctico y de esta forma dar
cumplimiento a la actividad mediante la utilización del programa R, basándonos en tres
secciones de variables (cuantitativas continuas, cuantitativas discretas y cualitativas) las cuales
nos muestran como por medio estadísticas podemos determinar una situación, interpretando los
resultados y analizando cada una de las gráficas.
OBJETIVOS

GENERAL

Interpretar los fundamentos teóricos de los tipos de variables estadísticas: cuantitativas y


cualitativas. Llevándolo a la parte práctica mediante el programa R, adquiriendo destrezas en el
manejo y procesamiento del programa en cuanto al desarrollo de gráficas y análisis de cada una
de las variables estadísticas planteadas.

ESPECÍFICOS.

 Reconocer el entorno de trabajo a través de las lecturas de los referentes bibliográficos


indicados para cada una de las preguntas orientadoras.

 Responder las preguntas orientadoras planteadas por el docente en el foro colaborativo


para poder comprender a fondo los conceptos básicos.

 Describir los diferentes gráficos de las variables cuantitativas continuas, cuantitativas


discretas y cualitativas.

 Conocer la forma de elaborar la tabla o un gráfico mediante la aplicación del programa R.

 Identificar los histogramas, diagrama de cajas y gráficos de barras, que tipo de variables
utiliza.
DESARROLLO

 VARIABLE ESTADISTICA

Es cada una de las características o cualidades que poseen los individuos de una población. La
podemos clasificar en dos ramas: las cualitativas y las cuantitativas.

 Cualitativas: son las que no se miden o expresan por número. Se miden mediante letras.

 cuantitativas: Son aquellas que adoptan valores numéricos (es decir, cifras). De este
modo se diferencian de las variables cualitativas, que expresan cualidades, atributos,
categorías o características.

 VARIABLE CUANTITATIVA CONTINUA

Son las que pueden asumir un número incontable de valores. Como por ejemplo el peso de las
bolsas de café de 200 gr, pues las maquinas no están bien calibradas y siempre van a haber
pequeños errores por lo cual esta bolsa podría tener 199,9897 gr O 201, 348513 gr. De esta
manera tendríamos una cantidad contable de valores. Así tendríamos una variable cuantitativa
continua.

 VARIABLE CUANTITATIVA DISCRETA

Son las que presentan un número contable de valores. Como por ejemplo el número de dedos que
tenemos en una mano. Puede haber 1, 2, 3, 4 o 5 dedos. Por eso es una cantidad contable de
valores.
 VARIABLE DISCRETA

Son variables numéricas que tienen un número contable de valores entre dos valores
cualesquiera. Una variable discreta siempre es numérica. Por ejemplo, el número de quejas de los
clientes o el número de fallas o defectos.

 VARIABLE CATEGÓRICA

Las variables categóricas contienen un número finito de categorías o grupos distintos. Los datos
categóricos pueden no tener un orden lógico. Por ejemplo, los predictores categóricos incluyen
sexo, tipo de material y método de pago.

 VARIABLE CUALITATIVA CATEGÓRICA

En estadística, una variable categórica es una variable que puede tomar uno de un número
limitado, y por lo general fijo, de posibles valores, asignando a cada unidad individual u otro tipo
observación a un grupo en particular o categoría nominal sobre la base de alguna característica
cualitativa.

 MEDIA POBLACIONAL

Es la suma de todos los valores observados de una población dividida entre el número de valores
de la población. Por ejemplo, una tienda deportiva tiene 10 empleados, el monto promedio de
comisiones que ganaron en el mes fueron de $ 100.000 pesos, este es el valor poblacional, puesto
que se considera a todos los empleados de la tienda deportiva.
 MEDIA MUESTRAL. Mostrar fórmula de cálculo

La distribución muestral de la media depende de varias circunstancias como la distribución de la


población de la que se extraen las muestras. La distribución de medidas muéstrales sigue el
modelo normal, con parámetros muy sigma.

𝜎2
𝜎2𝑥 =
𝑛

 VARIANZA POBLACIONAL

Es una técnica que se puede utilizar para decidir si las medias de dos o más poblaciones son
iguales. La prueba se basa en una muestra única obtenida a partir de cada población. El análisis
de varianza puede servir para determinar si las diferencias entre los valores medios de cada una
de las poblaciones, o si las diferencias entre los valores medios de la muestra son más indicativos
de una variabilidad de muestreo. Los datos para el análisis de varianza se obtienen tomando una
muestra de cada población y calculando la media muestral y la varianza en el caso de cada
muestra. Este problema se resuelve a partir del análisis exploratorio que proporciona los
diagramas de caja y el estadístico del contraste de Levene.

 VARIANZA MUESTRAL. Registrar fórmula de cálculo

Es la medida de las poblaciones a base de una muestra. La cantidad S2 se llama varianza


muestral y tiene un valor fundamental en el análisis estadístico, su interpretación es el promedio
de las desviaciones cuadráticas respecto de la media
 DESVIACIÓN ESTÁNDAR

Es un índice numérico de la dispersión de un conjunto de datos (o población). Mientras mayor es


la desviación estándar, mayor es la dispersión de la población. La desviación estándar es un
promedio de las desviaciones individuales de cada observación con respecto a la media de una
distribución. Así, la desviación estándar mide el grado de dispersión o variabilidad. En primer
lugar, midiendo la diferencia entre cada valor del conjunto de datos y la media del conjunto de
datos. Luego, sumando todas estas diferencias individuales para dar el total de todas las
diferencias. Por último, dividiendo el resultado por el número total de observaciones
(normalmente representado por la letra “n”) para llegar a un promedio de las distancias entre
cada observación individual y la media. Este promedio de las distancias es la desviación estándar
y de esta manera representa dispersión.

Obtenido de https://www.monografias.com/trabajos89/desviacionestandar/desviacion-
estandar.shtml

 MEDIANA

La mediana es la posición central que parte la distribución en dos, es decir, deja la misma
cantidad de valores a un lado que a otro. Para calcular la mediana es importante que los datos
estén ordenados de mayor a menor, o al contrario de menor a mayor.
 MODA

La moda estadística, es el valor más repetido del conjunto de datos. Es decir, el valor cuya
frecuencia relativa es mayor. En un conjunto puede haber más de una moda.

 CUARTILES

Son valores que dividen una muestra de datos en cuatro partes iguales. Utilizando cuartiles puede
evaluar rápidamente la dispersión y la tendencia central de un conjunto de datos, que son los
pasos iniciales importantes para comprender sus datos. Los cuartiles son valores calculados, no
observaciones en los datos. A menudo es necesario interpolar entre dos observaciones para
calcular un cuartil con exactitud.

 PERCENTILES

En estadística, un percentiles una medida de posición no central, utilizada para comparar datos
Consiste en un número de 0 a 100 que indica el. Porcentaje de datos que son igual o menor que
determinado valor

 REGLA DE STURGES ¿PARA QUÉ SIRVE?

Esta regla es muy utilizada cuando se quiere realizar un histograma de frecuencias ya que con
esta regla se calcula el número de clases (o intervalos) necesarios para representar fielmente los
datos.
K= 1 + log2(N)
Donde N es el número de muestras a representar y k el número óptimo de clases o intervalos.
 FRECUENCIA ABSOLUTA

Es una medida estadística que nos da información acerca de la cantidad de veces que se repite un
suceso al realizar un número determinado de experimentos aleatorios. Esta se representa
mediante las letras fi. La letra f se refiere a la palabra frecuencia y la letra i se refiere a la
realización i-ésima del experimento aleatorio.

La frecuencia absoluta es muy utilizada en estadística descriptiva y es útil para saber acerca de
las características de una población y/o muestra. Ésta se puede utilizar con variables cualitativas
o cuantitativas siempre que estas se puedan ordenar. La frecuencia absoluta se puede utilizar para
variables discretas (las variables se ordenan de menor a mayor) y para variables continuas (las
variables se ordenan de menor a mayor agrupadas por intervalos). La frecuencia absoluta se
utiliza para calcular la frecuencia relativa.

La suma de las frecuencias absolutas es igual al número total de datos de la muestra o población.

 FRECUENCIA RELATIVA

Es una medida estadística que se calcula como el cociente de la frecuencia absoluta de algún
valor de la población/muestra (fi) entre el total de valores que componen la población/muestra
(N).

Para calcular la frecuencia relativa antes es necesario calcular la frecuencia absoluta. Sin ella no
podríamos obtener la frecuencia relativa. La frecuencia relativa se representa con las letras hi y
su fórmula de cálculo es la siguiente:
 FRECUENCIA ABSOLUTA ACUMULADA

Es el resultado de ir sumando las frecuencias absolutas de las observaciones o valores de una


población o muestra. Esta se representa por las siglas Fi.

Para calcular la frecuencia absoluta acumulada, hay que calcular primero la frecuencia
absoluta (fi) de la población o muestra. Para ello, los datos se ordenan de menor a mayor y se
colocan en una tabla.

Una vez hecho esto, la frecuencia absoluta acumulada se obtiene de ir sumando las frecuencias
absolutas de una clase o grupo de la muestra con la anterior (primer grupo + segundo grupo,
primer grupo + segundo grupo + tercer grupo y así sucesivamente hasta llegar a acumular del
primer grupo al último).

 FRECUENCIA RELATIVA ACUMULADA

Es el resultado de ir sumando las frecuencias relativas de las observaciones o valores de una


población o muestra. Esta se representa por las siglas Hi.

Para calcular la frecuencia relativa acumulada, hay que calcular primero la frecuencia
absoluta (fi) y la frecuencia relativa (hi) de los valores de la población o muestra.

Para ello, los datos se ordenan de menor a mayor y se colocan en una tabla. Una vez hecho esto,
la frecuencia relativa acumulada se obtiene de ir sumando las frecuencias relativas de una clase o
grupo de la muestra con la anterior (primer grupo + segundo grupo, primer grupo + segundo
grupo + tercer grupo y así sucesivamente hasta llegar a acumular del primer grupo al último).
 TABLAS DE FRECUENCIA

La tabla de frecuencias (o distribución de frecuencias) es una tabla que muestra la distribución de


los datos mediante sus frecuencias. Se utiliza para variables cuantitativas o cualitativas ordinales.

La tabla de frecuencias es una herramienta que permite ordenar los datos de manera que se
presentan numéricamente las características de la distribución de un conjunto de datos o muestra.

 ¿CÓMO ES LA TABLA DE FRECUENCIAS DE UNA VARIABLE CONTINUA Y


DE UNA DISCRETA? ¿CUÁL TIENE INTERVALOS?

Las tablas de frecuencia de una variable continua toman un número infinito de valores en
cualquier intervalo dado. Habitualmente los intervalos se consideran cerrados a la izquierda y
abiertos a la derecha, se tiene 3 clases o intervalos para las variables: abiertas, cerradas y
semiabiertas.

Las tablas de frecuencia discreta solo pueden tomar un número infinito de valores. Siendo por lo
general estos valores los números naturales 1, 2,3. Un ejemplo son el número de estudiantes de
cierto grado. Cuando categorizamos variables discretas los límites de clase son idénticos a los
límites reales.

 BOXPLOT O DIAGRAMA DE CAJAS

Es un tipo de gráfico que muestra un resumen de una gran cantidad de datos en cinco medidas
descriptivas, además de intuir su morfología y simetría.

Este tipo de gráficos nos permite identificar valores atípicos y comparar distribuciones. Además
de conocer de una forma cómoda y rápida como el 50% de los valores centrales se distribuyen.
Los diagramas de caja son especialmente útiles cuando la distribución de una variable es
asimétrica o se aleja de la distribución normal.
 HISTOGRAMA. ¿En qué tipos de variables se usa?

Un histograma es una representación gráfica de datos agrupados mediante intervalos. Los datos
provienen de una variables cuantitativas continuas. Gracias a él puedes hacerte rápidamente una
idea de la distribución de los datos o muestra.

También cabe emplear variables cualitativas ordinales, siendo necesario que el número de datos
sea alto.
Un histograma es un conjunto de barras rectangulares verticales que su altura es proporcional a
las frecuencias absolutas de cada uno de los intervalos (también se pueden representar
las frecuencias relativas o frecuencias relativas porcentuales).

Los intervalos abarcan todo el conjunto sin cortarse, de manera que un elemento está solo en un
intervalo. La base de cada barra vertical es proporcional a la amplitud del intervalo.

 GRÁFICO DE BARRAS. En qué tipo de variables se usa?

Se usa cuando se pretende resaltara la representación de porcentajes de datos que componen un


total. Una gráfica de barras contiene barras verticales que representan valores numéricos,
generalmente usando una hoja de cálculo. Las gráficas de barras son una manera de representar
frecuencias; las frecuencias están asociadas con categorías. Una gráfica de barras se representa
de dos maneras: horizontal o vertical. El objetivo es poner una barra de largo (alto si es
horizontal) igual a la frecuencia. La grafica de barras sirve para comparar y tener una
representación gráfica de la diferencia de frecuencias o intensidad de la característica numérica
de interés.
Variable Variable
continua EDAD Discreta HERMANOS
Media (mean) 20.29333 2.2
Mediana
20 2
(median)
# de datos
15 15
(length)
Mínimo (min) 15 0
Máximo
25 5
(max)
Varianza (var) 7.182095
Desviación
2.679943 1.473577
stándar (SD)
Rango (range) 15 25 0 5

Cuantil 25% 18.8 1

Cuantil 50%
20 2
(mediana)

Cuantil 75% 22 3
VARIABLES CUANTITATIVAS CONTINUAS

 hay un ejemplo con la edad de 10 personas, la cual se maneja como variable continua,
porque esta puede asumir cualquier valor, por ejemplo: 10.5 años, equivalen a 10 años y
6 meses.

Histograma con Regla de Sturges variable edad


5
4
3
Frequency

2
1
0

16 18 20 22 24

edad

En el histograma observamos que los datos demuestran que las edades con mayor frecuencia son
las de personas que tienen entre los 19 y 21 años, también se evidencia una frecuencia alta entre
las edades de 21 y 23 años.
Histograma de la variable continua Edad

5
4
Frecuencia

3
2
1
0

14 16 18 20 22 24 26

edad

En este histograma observamos que en las edades de 18 a 20 años su frecuencia es de 5,


mientras que en las edades de 20 a 22 años su frecuencia es de 4, ahora bien en las edades de 22
a 24 años, al igual que en las edades de 16 a 18 años la frecuencia es de 2, y por último en las
edades de 24 a 26 y de 14 a 16 años su frecuencia es de 1.
Boxplot o diagrama de cajas variable continua

24
22
Edad (años)

20
18
16

En el diagrama podemos observar la siguiente información:

Puntaje más bajo =15%

Primer cuartil=19%

Puntaje de la mediana=20%

Tercer cuartil=22%

Puntaje más alto=26%


VARIABLES CUANTITATIVAS DISCRETAS

Boxplot o diagrama de cajas variable discreta


5
4
número de hermanos

3
2
1
0

En el diagrama podemos visualizar la siguiente información:

Puntaje más bajo= 0,2%

Primer cuartil=1%

Puntaje de la mediana=2%

Tercer cuartil= 3%

Puntaje más alto=5%


Diagrama de barras Frecuencia Absoluta

4
3
Frecuencias absolutas

2
1
0

0 1 2 3 4 5

Número de hermanos

En el diagrama de barras frecuencia absoluta numero de hermanos es bastante irregular,


observamos que 2 de cada 10 personas tienen 0 a 4 hermanos; 3 de cada 10 personas tienen de 1
a 3 hermanos; 4 de cada 10 personas tienen 2 hermanos y 5 cada de 10 personas tienen un
hermano.
Diagrama de barras Frecuencia relativa

0.25
0.20
Frecuencias relativas

0.15
0.10
0.05
0.00

0 1 2 3 4 5

Número de hermanos

En el diagrama de barras frecuencia relativa numero de hermanos, vemos que el número de


hermanos 2 es el que representa un mayor porcentaje con relación a los otros números de
hermanos; que el número 5 es el que presenta menor porcentaje. Igualmente podemos observar
que se presenta una diferencia del 7 % entre el número de hermanos 5 con relación al número de
hermanos de 0 a 4, al igual que entre el número de hermanos de 0 a 4 con relación al número de
hermanos de 1 a 3 y estos con relación al número de hermanos 2.

Diagrama de barras Frecuencias relativas acumuladas


1.0
0.8
Frecuencias relativas

0.6
0.4
0.2
0.0

0 1 2 3 4 5

Número de hermanos

En el diagrama podemos observar que la frecuencia relativa acumulada de numero de hermanos


es: 0 hermanos 10%, 1 hermano 35%, 2 hermanos 60%, 3 hermanos 80%, 4 hermanos 97% y 5
hermanos 100%.
Grafico de tarta de Hermanos

0
2

4
3

En el grafico obtenemos información como la cantidad de hermanos que tienen las 10 personas
encuestadas.

0 hermanos=10%

1 hermano=20%

2 hermanos =35%

3 hermanos =20%

4 hermanos =10%

5 hermanos =5%
VARIABLES CUALITATIVAS

Diagrama de barras frecuencias absolutas nivel de estudio de agricultores


5
4
Frecuencias absolutas

3
2
1
0

Sin estudios Estudios Secundarios

En el diagrama se puede observar que hay un menor número de personas sin estudio, también
qué número de personas con estudios primarios es el de mayor ascenso, el de estudios
secundarios desciende al igual que el de estudios superiores.
Diagrama de barras frecuencias relativas nivel de estudio de agricultores

0.35
0.30
0.25
Frecuencias relativas

0.20
0.15
0.10
0.05
0.00

Sin estudios Estudios Secundarios

En el diagrama de barras frecuencias relativas observamos que un 15% de las 10 personas


encuestadas no tienen estudios, mientras que el que representa un mayor porcentaje (35%) es el
de las personas con estudios primarios, seguido por las personas con estudios segundarios con un
porcentaje de 28% y seguido por el de estudios superiores con un porcentaje de 22%.
CONCLUSIONES

 El desarrollo de la presente actividad nos permitió cumplir con los objetivos planteados
inicialmente, siendo el principal propósito interpretar los fundamentos teóricos de los
tipos de variables estadísticas cuantitativas y cualitativas, la forma de procesamiento y el
desarrollo de las mismas para facilitar el manejo de las variables estadísticas.

 Gracias a la aplicación de dichos conceptos nos fue posible comprender todo lo


relacionado con el Programa R y llevar a cabo una serie de ejercicios con la finalidad de
responder las preguntas planteadas por el docente en el foro colaborativo para poder
comprender a fondo los conceptos básicos, logrando adquirir conocimientos
enriquecedores para llevarlos a cabo en el desarrollo de nuestra carrera profesional.

 La estadística es una ciencia matemática que se utiliza para describir, analizar e


interpretar ciertas características de un conjunto de individuos llamado población.
Cuando nos referimos a muestra y población hablamos de conceptos relativos pero
estrechamente ligados. Una población es un todo y una muestra es una fracción o
segmento de ese todo.

 Podemos dividir la estadística en dos ramas; la estadística descriptiva, que se dedica a los
métodos de recolección, descripción, visualización y resumen de datos originados a partir
de los fenómenos en estudio; y la estadística inferencial, que se dedica a la generación de
los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión.

 La estadística trata en primer lugar, de acumular la masa de datos numéricos


provenientes de la observación de multitud de fenómenos, procesándolos de forma
razonable.
REFERENCIAS BIBLIOGRÁFICAS

[1] Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en problemas de
agronomía, p. 257-292.

Recuperado de

http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?docID=3221775&query=bioes
tadistica

[2] Matus, R., Hernández, M., & García, E. (2010). Estadística.


Recuperado de:
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?ppg=1&docID=3187261&tm=
1519661894239

[3] Mecabot. (2017). El software R, una herramienta para implementar métodos


Numéricos.
Recuperado de:
http://mecabot-ula.org/tutoriales/r-project-metodos-
Numéricos/

[4] Mirás M & Rodríguez E. (20181).


Técnicas estadísticas con hoja de cálculo y R.
Recuperado de:
www.investigo.biblioteca.uvigo.es/xmlui/handle/11093/970
[5] Sáenz J. (2010).
Métodos estadísticos con R y R Commander.
Recuperado de:
https://cran.r-project.org/doc/contrib/Saez-Castillo-RRCmdrv21.pdf

[6] Deaza D. (2018).


OVI Variables cuantitativas.
Recuperado de:
http://hdl.handle.net/10596/23236

[7] (s.f.).
Obtenido de
https://drive.google.com/drive/folders/1D3aJ0cmjKuue2mHFQnlHIdSLIMQxJOFG?usp=sharin
g

También podría gustarte