Está en la página 1de 21

Universidad Nacional Abierta y a Distancia – UNAD

Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas


Curso: Catedra Unadista

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

Estadística Descriptiva
Grupo: 100105_176

Unidad 1 Conceptos preliminares y medidas de tendencia central


Caracterización de Variables

Presentado por:
ROBERTO JOSE SERRANO PEREZ
Código: 1114451738

Presentado a:
Tutor: Francisco Cabrera Diaz

Escuela De Ciencias Básicas e Ingeniería (Ingeniería en Sistemas)


CEAD Palmira
Febrero de 2018
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

INTRODUCCIÓN

Por medio de este documento, se pretende dar alcance a las competencias


adquiridas en el desarrollo de las actividades de la unidad presentada, con el fin
de aplicar, fortalecer nuestro campo laboral, personal y social.
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

OBJETIVOS

Objetivo General

 Relacionar nociones básicas, clasificar, tabular, presentar la información y


describir la problemática.

Objetivos Específicos

 Fortalecer conceptos básicos.


 Apropiarse de las etapas de una investigación estadística.
 Conocer sobre la caracterización de variables cualitativas.
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

Actividad a desarrollar – Roberto Jose Serrano Perez

Actividad Individual - Presentación de la información, diagramas


estadísticos.

En una encuesta se preguntó a 100 ejecutivos cual creían que era el


error más común de los candidatos durante las entrevistas de trabajo.
Los resultados fueron los siguientes:

Razón
Poco o malo conocimiento de la compañía 44
Sin preparación para discutir sus planes
profesionales 23
Escaso entusiasmo 16
Falta de contacto visual 5
Sin preparación para discutir sus habilidades
/experiencias 3
Otras razones 9

-Construya una gráfica de barras.

Grafico de barras encuesta


45
40
35
30
25
20
15
10
5
0
Poco o malo Sin Escaso Falta de Sin Otras razones
conocimiento preparación entusiasmo contacto preparación
de la para discutir visual para discutir
compañía sus planes sus
profesionales habilidades
/experiencias
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

-Construya un diagrama circular

Diagrama Circular
Poco o malo conocimiento de
la compañía
Sin preparación para discutir
9% sus planes profesionales
3%
5% Escaso entusiasmo
44%
16%
Falta de contacto visual

23% Sin preparación para discutir


sus habilidades /experiencias
Otras razones

- ¿A qué tipo de variable corresponden los datos?

Corresponde a la variable cuantitativa discreta.

- Mencione dos conclusiones a partir del gráfico.

Se puede observar que el error más común de los candidatos son el poco
conocimiento de la compañía.

Se determina de segundo lugar se encuentra que no cuentan con preparación


para discutir sus planes profesionales, no se proyectan a un futuro.
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

La siguiente tabla presenta el porcentaje de algodón en un material


utilizado para la fabricación de camisas para caballeros.

34,2 33,6 33,8 34,7 37,8 32,6 35,8 34,6


33,1 34,7 34,2 33,6 36,6 33,1 37,6 33,6
34,5 35,0 33,4 32,5 35,4 34,6 37,3 34,1
35,6 35,4 34,7 34,1 34,6 35,9 34,6 34,7
36,3 36,2 34,6 35,1 33,8 34,7 35,5 35,7
35,1 36,8 35,2 36,8 37,1 33,6 32,8 36,8
34,7 35,1 35,0 37,9 34,0 32,9 32,1 34,3
33,6 35,3 34,9 36,4 34,1 33,5 34,5 32,7

-Construya una tabla de distribución de frecuencias y un histograma de


frecuencias para los datos de contenido de algodón.

Se construye tabla de frecuencia junto con los parámetros.

Parámetros Redondeo
No datos 64
Valor Máximo 37,9
Valor Mínimo 32,1
Rango 5,8
Intervalo 7,014579313 7
Amplitud 0,826849301 1

DISTRIBUCION DE FRECUENCIAS PARA DATOS AGRUPADOS


Intervalos X fi Fi = 2do+ant (ni) fr = fi/N (Ni) Fr = Fi/N f% F%
No L. inferior L. superior M. de clase frec. Abs frec. Abs. Acum frec. Relativa frec. Relat. Acum frec. Porcent frec. Porcent. Acum
31,6 0
1 32,1 33,1 32,6 8 8 0,125 0,125 12,5 12,5
2 33,1 34,1 33,6 13 21 0,203125 0,328125 20,3125 32,8125
3 34,1 35,1 34,6 22 43 0,34375 0,671875 34,375 67,1875
4 35,1 36,1 35,6 9 52 0,140625 0,8125 14,0625 81,25
5 36,1 37,1 36,6 8 60 0,125 0,9375 12,5 93,75
6 37,1 38,1 37,6 4 64 0,0625 1 6,25 100
38,6 0

De la misma manera realizamos el Histograma de los datos contenidos. Marca


de clase y frecuencia absoluta.
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

HistoGrama
25

20

15

10

0
32.6 33.6 34.6 35.6 36.6 37.6

-Realizar un polígono de frecuencias

Se realiza el Polígono de frecuencia contenidos en los datos de frecuencia


absoluta.

Poligono de Frecuencias absolutas


25
22
20
Cantidad de Camisas

15
13
10
9
8 8
5
4

0 0 0
31.6 32.6 33.6 34.6 35.6 36.6 37.6 38.6
Porcentaje acumulado del algodon en la fabricacion de Camisas

-Mencione dos conclusiones a partir del gráfico.

Conclusión 1
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

Se puede establecer la mayor cantidad de camisas que se llegaron a fabricar en


cualquiera de los dos gráficos.

Conclusión 2

Podemos asociar el porcentaje acumulado en la fabricación de camisas, es decir


la cantidad de algodón

Considere la siguiente distribución de frecuencia, que proporciona el


ingreso anual bruto ajustado de Estados Unidos (Internal Revenue
Service, marzo 2017).

Frecuencia
Ingreso
(en
anual
millones -
(en miles de
Habitantes
Dólares)
)
0 – 24 60
25 – 49 33
50 – 74 20
75 – 99 6
100 – 124 4
125 – 149 2
150 – 174 1
175 – 199 1
Total 127
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

Construya un polígono de frecuencias para la variable ingreso anual.

60
Frecuencia (En millones)

33

20

6 4 2 1 1
0 – 24 25 – 49 50 – 74 75 – 99 100 – 124 125 – 149 150 – 174 175 – 199
Ingreso Anual (En miles de $)

Consigne dos conclusiones a partir del gráfico.

Conclusión 1

En el ingreso anual bruto ajustado de Estados Unidos Entre $0 y $24.000 se


obtuvo $60.000.000 esto corresponde aproximadamente al 42.24 % del total de
millones obtenidos.

Conclusión 2

El total de millones obtenidos de 52.75 % corresponden a $25.000 y $199.000


de ingreso anual bruto ajustado de Estados Unidos.

Actividad a desarrollar – Roberto Jose Serrano Perez

Actividad Individual - Regresión y correlación

1. El rendimiento del producto de un proceso químico está relacionado


con la temperatura de operación del proceso. Se desea establecer la
relación que existe entre la pureza (y) del oxígeno producido y el
porcentaje de hidrocarburo (x) que está presente en el condensador
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

principal en un proceso de destilación, de acuerdo con los siguientes


datos:

X
(% de
Hidro Y
carburos) (Pureza)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

Diagrama de Dispersión

Diagrama de Dispersion
102
100
98 Y = 14.497x * 74.283
96 𝑹𝟐 = 0.8774
Y = Pureza

94
92
90
88
86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
X = % de hidrocarburos

El porcentaje de hidrocarburos es directamente proporcional a la pureza, esto


quiere decir que entre mayor es el porcentaje de hidrocarburos mayor va a ser
la pureza.

La asociación de las variables es fuerte porque una variable depende de la otra,


en este caso la pureza depende del porcentaje de hidrocarburos, esto se puede
observar con el coeficiente de determinación 𝑹𝟐 que es 87.74%.

Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

El modelo lineal que predice el efecto de una variable sobre la otra es el


siguiente:

y = 14.947x + 74.283

El modelo es confiable porque el coeficiente de determinación 𝑹𝟐 es cercano a


1.

Determine el porcentaje de explicación del modelo y el grado de relación


de las dos variables.
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

Esta ecuación hace una buena estimación entre las variables debido a que el
coeficiente de determinación 𝑹𝟐 explica el 87.74% de la información y el valor
del coeficiente de correlación R confirma el grado de relación de la variable, que
es el 93.67%.

¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es


igual a 91,3?

𝑌 = 14.497𝑥 + 74.283
𝑋 = (𝑌 − 74.283)/14.947
𝑋 = (91.3 − 74.283)/14.947
𝑋 = 1.14

Cuando la pureza del oxígeno sea 91.3, el porcentaje de hidrocarburos será 1.14.

2. El número de libras de vapor (y) consumidas mensualmente por una


planta química, se relaciona con la temperatura ambiental promedio
(en o F). Para el año 2014, se registraron los siguientes valores de
temperatura y consumo anual.

Temperatura
Mes (oF) Consumo de vapor (Lb)
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

Realice el diagrama de dispersión y determine el tipo de asociación


entre las variables.

Diagrama de Dispersion
800
700
Y = 9.2087x * 6.3184
Consumo de vapor (Lb)

600
𝑹𝟐 = 0.9999
500
400
300
200
100
0
0 10 20 30 40 50 60 70 80
Temperatura (oF)

La temperatura es directamente proporcional al consumo de vapor, esto quiere


decir que entre mayor es la temperatura mayor va a ser el consumo de vapor.

La asociación de las variables es fuerte porque una variable depende de la otra,


en este caso el consumo de vapor depende de la temperatura, esto se puede
observar con el coeficiente de determinación 𝑹𝟐 que es 99.99%.

Ajuste un modelo matemático que permita predecir el efecto de una


variable sobre la otra. ¿Es confiable?

El mejor modelo que describe el sistema es la función lineal

𝑌 = 9.2087𝑥 − 6.3184

El modelo es muy confiable porque el coeficiente de determinación 𝑹𝟐 es


aproximadamente 1.

Determine el porcentaje de explicación del modelo y el grado de relación


de las dos variables.
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

Esta ecuación hace una buena estimación entre las variables debido a que el
coeficiente de determinación 𝑹𝟐 explica el 99.99% de la información y el valor
del coeficiente de correlación R confirma el grado de relación de la variable, que
es el 99.99%.

¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?

𝑌 = 9.2087 ∗ 70 − 6.3184
𝑌 = 638.29 𝑙𝑏

Cuando la temperatura sea 70 oF, el consumo de vapor será 638.29lb.

3. Los investigadores están estudiando la correlación entre la obesidad


y la respuesta individual al dolor. La obesidad se mide como
porcentaje sobre el peso ideal (x). La respuesta al dolor se mide
utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una
medida de sensación de punzada. Obsérvese que ambas, X e Y, son
variables aleatorias.

x (porcentaje de sobrepeso) y (umbral de reflejo de flexión nociceptiva)


89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

Realice el diagrama de dispersión y determine el tipo de asociación


entre las variables.

Diagrama de Dispersion
16
14
Y = 0.0629x 11.642
12 𝑹𝟐 = 0.1115
10
Axis Title

8
6
4
2
0
0 20 40 60 80 100
Axis Title

La asociación de las variables no existe, esto se puede observar con el coeficiente


de determinación 𝑹𝟐 que es 11.15%.

Ajuste un modelo matemático que permita predecir el efecto de una


variable sobre la otra. ¿Es confiable?

El modelo lineal que predice el efecto de una variable sobre la otra es el


siguiente:

𝑌 = 0.0629𝑥 + 11.642

El modelo no es muy confiable porque el coeficiente de determinación 𝑹𝟐 está


muy lejos de 1.

Determine el porcentaje de explicación del modelo y el grado de relación


de las dos variables.

Esta ecuación no hace una buena estimación entre las variables debido a que el
coeficiente de determinación 𝑹𝟐 explica el 11.15% de la información y el valor
del coeficiente de correlación R confirma el grado de relación de la variable, que
es el 33.39%
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un


porcentaje de sobrepeso, de 40?

𝒀 = −𝟎. 𝟎𝟔𝟐𝟗 ∗ 𝟒𝟎 + 𝟏𝟏. 𝟔𝟒𝟐


𝒀 = 𝟗. 𝟏𝟑

Cuando el porcentaje de sobrepeso sea 40, el umbral de reflejo de flexión


nociceptiva será 9.13.

4. Caracterización de variables:

A partir de la base de datos suministrada, cada estudiante debe elegir como


mínimo, una variable cualitativa distinta y caracterizarla; es decir:

Variable Escogida

Tipo de
Variable Variable
Optimismo Población Cualitativa

Tabla de Frecuencia

TABLA DE FRECUENCIA PARA LA VARIABLE OPTIMISMO POBLACION


Optimismo Población Frecuencia (F) Frecuencia Relativa (Fr) %
Buena 135 135/159 85%
Muy baja 6 6/159 4%
Regular 18 18/159 11%
159 100%
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

Diagrama Circular (Optimismo Población)

Diagrama Circular (Optimismo


Poblacion)

11%
4%
Buena 135 135/159
Muy baja 6 6/159
Regular 18 18/159
85%

Diagrama Gráficos de barras (Optimismo Población)

Grafico de Barras (Optimismo


Poblacion
90%
80%
85%
70%
60%
50%
40%
30%
20%
10% 4% 11%
0%
135/159 6/159 18/159
135 6 18
Buena Muy baja Regular

Moda: La moda es el dato que tiene mayor frecuencia, es decir, el dato que más
se repite, para esta variable. En este caso se puede discutir que la población
conserva un buen optimismo en el tema del empleo sobre pasando el 80%
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

Realizar una tabla de contingencias o de doble entrada, con dos


variables cualitativas.

Las variables cualitativas escogidas para realizar la tabla de contingencia son las
siguientes:

Presidente Optimismo Población

Tabla de Contingencia o doble entrada

Tabla de Frecuencia Absolutas


Presidentes
Total
Alvaro Uribe Juan Manuel Santos
Buena 74 61 135
Optimismo
Muy Baja 6 0 6
Poblacion
Regular 0 18 18
Total 80 79 159
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

CONCLUSIÓN

Como resultado de investigar y estudiar la documentación en el objeto de


aprendizaje, podemos concluir que el aprendizaje es constante, desde que
nacemos estamos rodeados de interrogantes que deben ser explicados de una
u otra manera. También en aprendizaje es lo que nos permite seguir día a día,
enfrentarnos a nuevos retos, lograr objetivos, ser mejores cada día.
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

BIBLIOGRAFÍA

Montero, J. M. (2007).Conceptos Generales Estadística descriptiva. Madrid:


Paraninfo. Página 3 - 16 Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100007&v=2.1&u=unad
&it=r&p=GVRL&sw=w&asid=0a7332df0d4700de0bd272caa41e1718

Montero, J. M. (2007). Características de Una Distribución de Frecuencias.


Statistical Descriptive. Cengage Learning Paraninfo, S.A. Página 4 – 10
Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052900008&v=2.1&u=unad
&it=r&p=GVRL&sw=w&asid=84a84913a25d9dfd21d0a0d3deb41dea

Pacheco, P. N., Vergara, S .C (2013).Universidad Nacional de Colombia.


Bogotá. Estadística Fundamental. Recuperado de
http://168.176.60.11/cursos/ciencias/1000012/un2/html/leccion1.html

García, J.E (2005).Análisis de Datos Unidimensionales.et al. Madrid:


Paraninfo. Página 26 -51 Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052300007&v=2.1&u=unad
&it=r&p=GVRL&sw=w&asid=03f8699ec7ccf10e8745c0ceb7b85bf1

Montero, J. M. (2007). Características de Una Distribución de Frecuencias.


Statistical Descriptive. Cengage Learning Paraninfo, S.A. Paginas 18-57.
Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad
&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0

Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto


Politécnico Nacional. Recuperado de:
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&do
cID=10436604&tm=1489456194304

Matus, R., Hernández, Martha, and García, E (2010). Estadística. México,


D.F., MX: Instituto Politécnico Nacional, (2010). ProQuest ebrary. Recuperado
de:

http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&do
cID=10365616&tm=1489456296586
Universidad Nacional Abierta y a Distancia – UNAD
Escuela: Ciencias Básicas Tecnología e Ingeniería Programa: Ingeniería de Sistemas
Curso: Catedra Unadista

Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y


estadística 1. Distrito Federal, MÉXICO: Grupo Editorial Patria. Recuperado de :

http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&do
cID=11230886&tm=1489456400673

También podría gustarte