Trabajo Final Word - Equipo 2 - Correciones

También podría gustarte

Está en la página 1de 15

UNIVERSIDAD AUTONOMA BENITO

JUAREZ DE OAXACA.

FACULTAD DE ECONOMIA.

“TRABAJO FINAL”
Participantes:
Ulises Clemente Acevedo 8294
Angel Johan Rodríguez Mandujano 5939
Francisco Rojas López 7193
Francisco Uriel Gurrión Vásquez 4237
José Manuel García Vásquez 1482

MESTRA: MARISOL SANTIAGO


ARANGO.

pág. 1
Índice

Introducción. ............................................................................................................ 3
Descripción de las variables. ................................................................................... 4
Tabla de distribución de Frecuencias ...................................................................... 5
Tallo y Hoja ............................................................................................................. 6
Histograma. ............................................................................................................. 7
Polígono de Frecuencias. ........................................................................................ 8
Medidas de Tendencia Central Datos no Agrupados. ........................................... 10
Medidas de Tendencia Central Datos Agrupados. ................................................ 12
Conclusión............................................................................................................. 15

pág. 2
Introducción.

En esta ocasión vamos a poner en práctica todo lo que la profesora nos ha venido

enseñando.

Para comenzar vamos a analizar el problema nuestro que dice: La agencia de viajes

Moore, que opera a nivel nacional, ofrece tarifas especiales a ciertas travesías por

el Caribe a personas de la tercera edad. El presidente de la agencia quiere

información adicional sobre las edades de las personas que viajan. Una muestra

aleatoria de 40 clientes que viajaron en un crucero el año pasado dio a conocer las

siguientes edades:

78 18 63 84 38 54 50 59 54 56 36 26 50 34 44
41 58 58 53 51 62 43 52 53 63 62 62 65 61 52
60 60 45 66 83 71 63 58 61 71

De este problema vamos a hacer una tabla de distribución de frecuencias, para

proporcionar información de las edades que van a viajar.

También realizaremos un Tallo y hoja.

Calcularemos la media y mediana de datos agrupados y no agrupados, esto para

saber el promedio de personas que van a ir al viaje.

La moda para determinar la edad de las personas que más van a ir al viaje.

pág. 3
Descripción de las variables.

Existen dos tipos de variables, la primero es la que obtenemos de datos de una

población cualitativa y la otra que es la que obtenemos de una población

cuantitativa., cuando la variable que estamos estudiando es numérica, se le

denomina Variable cualitativa o atributo, unos ejemplos de esta variable puede ser,

el color de piel el color de zapatos que tiene, el tipo de coche, marca de reloj, marca

de ropa, etc.

Cuando la variable que estemos estudiando se puede expresar de forma numérica,

se le denomina el nombre de Variable Cuantitativa, y la población se le conoce como

población cuantitativa, unos ejemplos de estas variables son: el saldo con el que

cuentas en tu tarjeta de crédito, el tiempo de duración de un motor, la velocidad de

una moto deportiva.

Otro punto importante es que las variables cuantitativas pueden llegar a hacer

discretas o continuas, qué quiere decir esto, las variables discretas pueden asumir

sólo ciertos valores y por lo general existen lo que se conocen como brechas o

huecos entre ellos. Las variables continuas son las que toman cualquier valor dentro

de un intervalo determinado.

En el caso de nuestra problemática el tipo de información que vamos a utilizar son

variables cuantitativas ya que estamos representando edades que es información

numérica y a su vez son variables discretas ya que no existen medios o decimales

entre ellas.

pág. 4
Tabla de distribución de Frecuencias.

Una distribución de frecuencias, es el agrupamiento de datos en categorías


mutuamente excluyentes, que indican el número de observaciones de cada
categoría. Para elaborar una tabla de distribución de frecuencias, se agrupan todos
los datos o numero de observaciones, para formar las clases.

Como primer paso lo que tenemos que hacer es elaborar las clases de nuestros
datos. Esto se hace contando el número de datos para así, tener que efectuar la
fórmula “2𝑘 ”, la cual tiene que pasar el número de datos para así cubrirlos todos. En
nuestro caso el número de datos es 40 y aplicando la formula nos da 6 clases, pero
en nuestro caso utilizaremos 7 para una presentación de los datos más
comprensible.

Ya teniendo el número de clases que ocuparemos lo que sigue es obtener el


intervalo de cada clase en la que van a ir distribuidos nuestros datos. El intervalo se
𝐻−𝐿
saca de la siguiente forma. 𝑖 ≥ Donde: H, es el valor más grande de nuestros
𝑘

datos; L, es el valor más pequeño y K es el número de clases. Quedaría así: 𝑖 ≥


83−18
dándonos un resultado de 9.28 pero se redondeará a 10.
7

Enseguida se van acomodando los datos y clases en una tabla para tenerlos de una
manera presentable. Las clases se pueden iniciar con el valor más pequeño para
tener un margen que cubra todos los datos. La frecuencia que es lo siguiente que
se debe hacer consiste en contar cuantas observaciones van en cada clase
respetando los intervalos. Cabe aclara que cada clase como ya se mencionó debe
ser mutuamente excluyente y no tener ningún dato que se repita teniendo diferentes
datos en cada clase.

Como siguiente paso es sacar la frecuencia acumulada que simplemente consiste


en ir sumando las frecuencias anteriores con la siguiente de forma que para la última
acumulación nos de el total de los datos.

pág. 5
En la Marca de Clase o que también es llamado como punto medio se calcula
sumando los limites de cada clase (límite inferior, límite superior), y se divide entre
de 2. Este paso es importante ya que nos servirá para sacar más medidas de
tendencia central más adelante.

Frecuencia
Frecuencia Marca de
Fracuencia Relativa
Relativa Clase
Clase Frecuencia Acumulada Acumulada
18 a 28 2 2 0.05 0.05 23
28 a 38 2 4 0.05 0.10 33
38 a 48 5 9 0.13 0.23 43
48 a 58 10 19 0.25 0.48 53
58 a 68 16 35 0.40 0.88 63
68 a 78 3 38 0.08 0.95 73
78 a 88 2 40 0.05 1.00 83
40 1.00

Tallo y Hoja

El tallo y hoja es una técnica estadística que se utiliza para mostrar un conjunto de
datos. Cada valor numérico que tenemos se divide en dos partes que serían las
decenas y unidades, las primeras ósea las decenas se toman como el tallo y digito
siguiente como las hojas. Los tallos se ubican a lo largo del eje vertical principal, y
las hojas de cada observación a lo largo del eje horizontal.

Para realizar el tallo y hoja lo que se debe de hacer es poner toda la unidad más
grande de los datos de lado izquierdo, ya sea decena, centena, millar, etc.
Claramente ordenados de menor a mayor. Ya que se colocó de esta forma lo que
sigue es analizar los datos y completar los números con las observaciones que hay,
en esto se debe tener especial cuidado ya que si en algún tallo que pusimos no llega
a haber ningún valor, no podemos poner cero ya que ahí si se contaría como un
valor. Un ejemplo de esto sería 3 | 0 que representa el valor de 30, para evitar estas
confusiones simplemente se deja vació ese tallo.

Y enseguida ya podemos realizar la tabla que a continuación se muestra como


queda.

pág. 6
Tallos Hojas
1 8
2 6
3 4 6 8
4 1 3 4 5
5 0 0 1 2 2 3 3 4 4 6 8 8 8 9
6 0 0 1 1 2 2 2 3 3 3 5 6
7 1 1 7
8 3 4

Histograma.
El Histograma es una grafica en la que las clases se marcan en el eje horizontal y
las frecuencias de clase en el eje vertical. Las frecuencias de clase están
representadas por las alturas de las barras, y estas se colocan adyacentes una a
otra.
“Libro Estadística para Administración y Economía”.

En nuestro histograma en la parte inferior, el eje horizontal, colocamos las edades


de las personas que van al viaje.
En el la eje vertical, pusimos las frecuencias que son el número de personas que
van al viaje.

pág. 7
Histograma del Número de Personas mayores que iran
18 al viaje.
16
16
Frecuencias/Número de personas

14

12
10
10

6 5

4 3
2 2 2
2

0
18 a 28 28 a 38 38 a 48 48 a 58 58 a 68 68 a 78 78 a 88
Edades de personas mayores que van al viaje.

Polígono de Frecuencias.

Un polígono de frecuencias en muy similar al Histograma. Está conformado por


segmentos de recta que unen a los puntos medios de clase y las frecuencias de
clase.

“Libro Estadística para Administración y Economía”.

pág. 8
Poligono del número de personas mayores que
18 iran al viaje.
Frecuencias/Número de personas 16
14
12
10
8
6
4
2
0
1 2 3 4 5 6 7
Edades de personas mayores que van al viaje.

Histograma y Polígono de Frecuencias.

Histograma y Poligono del número de perosnas


mayores que iran al viaje.
Frecuencias/Número de personas

18
16 16
14
12
10 10
8
6
4 5
2 3
2 2 2
0
18 a 28 28 a 38 38 a 48 48 a 58 58 a 68 68 a 78 78 a 88
Edades de personas mayores que van al viaje.

pág. 9
Medidas de Tendencia Central Datos no Agrupados.

Las medidas de tendencia central son un que resume un conjunto de datos que
señala el centro de los valores.
La primera medida de tendencia central a analizar para datos no agrupados es la
media aritmética. Esta medida se divide en dos “partes” por así decirlo; una que es
para todos los datos o una población y otra que es para solo una muestra de la
población. Las fórmulas de las dos son las siguientes.
Media poblacional.
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑀𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝜀𝑋
𝑀𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 = 𝜇 =
𝑁
Donde:
.𝜇 = Representa la media de la población.
N= número total de elementos de la población.
X= representa cualquier valor en particular.
.𝜖= indica la operación de sumar.
Pero como esta fórmula es para una población y nuestros datos son una muestra;
lo que haremos es utilizar la fórmula de la media muestral la cual es la siguiente.
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝜀𝑋
𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝒳 =
𝑛
Donde:
.𝒳 = Representa la media de la muestra.
n= número total de elementos de la población.
X= representa cualquier valor en particular.
.𝜖= indica la operación de sumar.

pág. 10
Datos no agrupados
n=40

En el caso de nuestros datos ocupando la fórmula de la media muestra nos daría el


siguiente resultado:

2218
𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝒳 =
40

Media aritmetica 55.43


55.43
Entonces la media muestral de las edades de las personas que fueron al viaje es
de 55.43.
La medida de tendencia central que sigue es la mediana, es muy fácil de obtener
ya que simplemente es ordenar los datos de mayor a menor o menor a mayor y
buscar el que se encuentra justo en medio, en dado caso que el número de datos
se par, se sumaran los dos datos centrales y se dividirán entre dos para así sacar
la mediana.

Mediana 58
58

La última medida de tendencia central para datos no agrupados es la moda, en


esta medida simplemente lo que hay que hacer es averiguar que dato se repite
más y ese será la moda, cabe aclarar que no solo hay una moda y puede haber
varias. En nuestro caso este dato sería nuestra moda.

Moda 63
63

pág. 11
Medidas de Tendencia Central Datos Agrupados.

Las medidas de tendencia central de datos agrupados o ya en una distribución de


frecuencias que es a lo que se refiere se hacen de una manera totalmente distinta
ya que en estas necesitaremos una tabla de distribución ya hecha que por lo
menos contenga las frecuencias, los puntos medio de clases y la frecuencia
acumulada
Para calcular la media en datos agrupados se necesita la frecuencia, marca de
clase, se calcula f(x) y se ocupa la formula que se ve en la tabla.

Media Aritmetica

Frecuencia Marca de
f(x)
Clase (f) Clase(x)
18 a 28 2 23 46
28 a 38 2 33 66
38 a 48 5 43 215
48 a 58 10 53 530
58 a 68 16 63 1008
68 a 78 3 73 219
78 a 88 2 83 166
40 2250
56.25

22 0
𝑋= 𝑋= = 2
𝑛 40

Como podemos observar lo que hay que hacer es multiplicar la frecuencia por el
punto medio de clase o marca de clase y de los resultados hacer una sumatoria de
ellos y estos dividirlos entre el número total de datos. Como podemos observar la
media aritmética de las edades de las personas que viajan es de 56.25.

La mediana es el valor que corresponde al punto medio de los valores después de


ordenarlos de menor a mayor, o de mayoría a menor. Cincuenta por ciento de las
observaciones son mayores que la mediana, y 50% son mayores de ella.

“Libro Estadística para Administración y Economía”.

pág. 12
La mediana para los datos agrupados se hace de forma totalmente diferente. Se
ocupa la siguiente fórmula:

Donde:

Entonces una vez sustituyendo los valores de la fórmula nos quedaría así:

Mediana
Fracuencia
Clase Frecuencia
Acumulada
18 a 28 2 2
28 a 38 2 4
38 a 48 5 9
48 a 58 10 19
58 a 68 16 35
68 a 78 3 38
78 a 88 2 40
40
40
𝑛 40 19
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 2 𝑖 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 28 8 22 10 =
10 = 48 28
10

L= limite inferior 28
n= numero
Como deobservar
podemos datos la mediana de las edades de las personas que40
viajan es
f= frecuencia de la clase que contiene la mediana 10
de
FA=58.28.
frecuencia acumulada que procede de la mediana 5
i= amplitud de la clase 10

Moda

pág. 13
Moda

Es el valor que se presenta más en una Distribución de Datos, pero para datos
agrupados la moda se obtiene viendo que clase tiene mas frecuencias y se toma
la marca de clase de esa clase. Igualmente, aquí puede haber más de una moda.

Moda

Marca de
Clase Frecuencia
Clase
18 a 28 2 23
28 a 38 2 33
38 a 48 5 43
48 a 58 10 53
58 a 68 16 63
68 a 78 3 73
78 a 88 2 83
40

Como podemos observar en nuestros datos solo tenemos un dato modal y este es
63.

pág. 14
Conclusión

Para este trabajo ocupamos mucho de los conocimientos que la profesora nos
proporciono y gracias a ellos se pudo hacer de mejor forma el trabajo con lo cual a
través de cada capítulo leído analizado y resumido por la profesora fuimos dándole
forma a nuestra situación desde que tipo de datos son hasta que clases ocupar etc.
y así demostrando los conocimientos aprendidos en clases nos fuimos dando
cuenta que ya por nuestra propia cuanta podíamos analizarlo y comprenderlo de tal
forma que se nos complicaba menos conforme a nuestra situación y que cada uno
tenía diferentes idas o formas de pensar pero luego coincidíamos con las ideas o
con los resultados de tal forma que sabias que todos estábamos en el mismo canal
de conocimiento adquirido día tras día en clases y la lectura de los capítulos que
repasamos todo el equipo para poder llevar de mejor forma nuestro proyecto y
nuestra situación y que cada calculo o cada suma de datos el equipo tenía que tener
los misma para a si saber que todos entendimos cada paso de nuestro proyecto con
respecto al número de clases o el intervalo o porque esa marca de clase el objetivo
es que nadie del equipo se perdiera conforme avanzábamos en el proyecto para
poder comprenderlo bien y no tener tantas dudas en general y también nos sirvió a
nosotros para reforzar lo aprendido. Pusimos el mayor esfuerzo en el trabajo y
reforzamos los conocimientos aprendidos.

pág. 15

También podría gustarte