Está en la página 1de 15

1

INSTITUTO TECNOLÓGICO DE OAXACA


Departamento de Ingenieria Eléctrica

Unidad: probabilidad y estadística


Tipo de entregable:
Tema: hoja de cálculo

Numero de control: 21160281

Estudiante:
José Manuel González Pérez

Docente:
Juan francisco caballirdo Ortiz

OAXACA DE JUÁREZ, OAXACA, 2 DE OCTUBRE DE 2021


2

PRIMERA PARTE: De la base de datos y muestra, identificar los siguientes


elementos:
a) Población
b) Muestra (mostrando los 30 elementos)
c) Tipo de datos
d) Escala de medición
e) Variables

Primeramente cuando se nos dio la hoja de cálculo con la que íbamos a trabajar se nos explicó cómo
se iba a elaborar este trabajo final del profesor Juan Francisco Caballirdo Ortiz, tendríamos que
identificar cada uno de los datos proporcionados en la hoja y se tendría que explicar cómo se obtuvo
dicho dato y de igual manera tendríamos que investigar lo que sería su definición.

a) población: La población estadística consiste en la recolección de un conjunto de


elementos o sujetos que gozan de características comunes, con el fin de estudiarlos y sacar
conclusiones específicas para determinar resultados. Según el tamaño de
la población estudiada, el resultado puede ser finito o infinito.

En la hoja de cálculo la población seria cantidad finita de números ya que solo de la hoja de cálculo
había 2500 datos estos referidos a Sueldos anuales (en pesos) por sexo,
Percibidos por ingenieros egresados del ITO en 2018

En esta imagen se muestra el total de datos que contenía la hoja de


cálculo y que este terminara siendo la población a estudiar y sacar sus
demás datos
3

b) Muestra: En estadística, una muestra es un subconjunto de casos o individuos de


una población. En diversas aplicaciones, interesa que una muestra sea representativa, y para
ello debe escogerse una técnica de muestra adecuada que produzca una muestra aleatoria
adecuada. También es un subconjunto de la población, y para ser representativa, debe tener
las mismas características de la población.

Las instrucciones del maestro juan francisco fueron que solo de los 2500 datos que es la
población total, solamente se eligieran 30 datos siendo esta la muestra del trabajo.

En esta imagen se puede ver la muestra que es equivalente a 30 datos.

Tipo de datos: los datos utilizados en este trabajo son discretos cuando sus valores son distintos y
separados. Es decir, cuando los datos sólo pueden tomar ciertos valores. Este tipo de datos no se
puede medir, pero se pueden contar. Básicamente representan información que se puede clasificar
como el dinero en este caso
4

Después de sacar la muestra del total de datos de la población el profesor nos dio una fórmula que
era (=ALEATORIO) esta nos daba a todos los datos de la hoja números aleatorios en decimales.
Por consiguiente nos dijo que copiáramos dichos números decimales aleatorios y pegáramos los
valores, ya que si no lo hacíamos, estos decimales aleatorios, siempre cambiaban y no permanecían
siendo los mismos por eso, esa indicación.
Ya hecho esto nos enumeramos la muestra (30 DATOS) y después en la misma hoja de cálculo nos
pidió que de la muestra elegida sacáramos el valor máximo y el valor mínimo
La fórmula para cada una de estas fue: para el valor máximo (=MAX(12:31)) y para el valor
mínimo (=MIN(A2:A31))

SEGUNDA PARTE: Presentación de los resultados obtenidos de las medidas de


tendencia central, describiendo el concepto de cada una de ellas.
a) Media
b) Mediana
c) Moda
d) Los tres cuartiles
e) El percentil 80

En esta segunda parte como bien se dicta teníamos que hallar las medidas de tendencia
central:
a) Moda: La moda es el valor que tiene mayor frecuencia absoluta. Se representa por M. Se
puede hallar la moda para variables cualitativas y cuantitativas.
Para hallar la moda el profesor nos dio una formula la cual era (=MODA(A2:A31)) pero en nuestro
caso no existía tal moda por que los datos proporcionados eran diferentes todos ósea que no se
repetía ningún dato por consiguiente en la hoja de cálculo nos marcaba error.

b) Media: La media estadística, promedio o media aritmética corresponde al valor que


obtendrían un conjunto de datos si todos ellos fuesen iguales o el valor que tendrían si la
suma de cada una de ellos se repartiera de forma equitativa, es decir, la media estadística
también se conoce como un reparto equitativo. 
Lo mismo para calcular la media se nos dio una fórmula para facilitar el trabajo la cual era
(=PROMEDIO(A2:A31)).
5

c) Mediana: La mediana es un estadístico de posición central que parte la distribución en


dos, es decir, deja la misma cantidad de valores a un lado que a otro. Para calcular la
mediana es importante que los datos estén ordenados de mayor a menor, o al contrario de
menor a mayor. Esto es, que tengan un orden.
Para poder calcular la mediana la formula fue (MEDIANA(A2:A31)).

d) Los 3 cuartiles: Los cuartiles son los tres valores que dividen al conjunto de datos
ordenados en cuatro partes porcentualmente iguales. Hay tres cuartiles denotados
usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. Estos equivalen al
25%, 50% y el 75% y que para obtener su posición utilizando formula escrita seria
QK=K(n+1)/4 siendo el número de datos impar, pero si el número de datos es par la
formula cambia a QK=Kn/4. Pero la formula dada por el docente para encontrar cada uno
de los valores de los cuartiles fueron: (CUARTIL(A2:A31,1)) siendo este para el 1er
cuartil, (=CUARTIL(A2:A31,2)) Y (CUARTIL(A2:A31,3) para los otros 2 cuartiles,
teniendo en cuenta como ya dije que el 2do cuartil equivale a la mediana.

e) Percentil 80: El percentil es una medida de posición usada en estadística que indica, una
vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se
encuentra un porcentaje dado de observaciones en un grupo. En nuestro caso nosotros
calculamos el percentil 85 y el percentil 50 que esta es igual a la mediana y al cuartil 2. La
fórmula para los percentiles fueron (=PERCENTIL(A2:A31,0.85) Y
(=PERCENTIL(A2:A31,0.5)).esto para los 2 percentiles que calculamos.

Tercera parte: Presentación de los resultados obtenidos de las medidas de


dispersión, describiendo el concepto de cada una de ellas.
a) Rango
b) Rango intercuartílico
c) Varianza
6

d) Desviación estándar
e) Coeficiente de variación

a) Rango: El Rango es el intervalo entre el valor máximo y el valor mínimo; por ello,


comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos,
cuanto mayor es el rango, aún más dispersos están los datos (sin considerar la afectación de
los valores extremos). El rango, también es llamado amplitud o recorrido de medida. Bueno
para sacar este valor ocupamos la formula (=MAX(A2:A31)-MIN(A2:A31)).

b) Rango Intercuartilico: El rango intercuartílico es una medida de variabilidad adecuada


cuando la medida de posición central empleada ha sido la mediana. Se define como la
diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1), es decir: RQ = Q3 - Q1. A la
mitad del rango intercuartil se le conoce como desviación cuartil (DQ), es afectada muy
poco por cuentas extremas.

c) Varianza: En teoría de probabilidad, la varianza o variancia  de una variable aleatoria es


una medida de dispersión definida como la esperanza del cuadrado de la desviación de
dicha variable respecto a su media. Su unidad de medida corresponde al cuadrado de la
unidad de medida de la variable: por ejemplo, si la variable mide una distancia en metros, la
varianza se expresa en metros al cuadrado. La varianza tiene como valor mínimo 0.
La desviación estándar (raíz cuadrada positiva de la varianza) es una medida de dispersión
alternativa, expresada en las mismas unidades que los datos de la variable objeto de estudio.
Se nos dio la formula (VAR(A2:A31)).

d) Desviación estándar: La desviación estándar es la medida de dispersión más común, que


indica qué tan dispersos están los datos con respecto a la media. Mientras mayor sea la
desviación estándar, mayor será la dispersión de los datos. Esta se calculó por medio de la
siguiente formula (=DESVEST(A2:A31)).
7

e) Coeficiente de variación: En estadística, cuando se desea hacer referencia a la relación


entre el tamaño de la media y la variabilidad de la variable, se utiliza el coeficiente de
variación (suele representarse por las siglas "C.V."). Su fórmula expresa la desviación
estándar como porcentaje de la media aritmética, mostrando una interpretación relativa del
grado de variabilidad, independiente de la escala de la variable, a diferencia de la
desviación típica o estándar. Por medio de la división de la desviación estándar / la media

Cuarta parte: Presentación de los resultados obtenidos de las medidas de forma,


describiendo el concepto de cada una de ellas.
a) Coeficiente de asimetría
b) Coeficiente de curtosis

para calcular estos 2 coeficientes nosotros no tuvimos que hacer nada ya que en la hoja de cálculo
venían contestados estos dos más sin embargo el profesor nos indicó que investigáramos lo que
estos 2 conceptos significaban para la estadística.

a) Coeficiente de asimetría: Las medidas de asimetría son indicadores que permiten


establecer el grado de simetría (o asimetría) que presenta una distribución de
probabilidad de una variable aleatoria sin tener que hacer su representación gráfica. Como
eje de simetría consideramos una recta paralela al eje de ordenadas que pasa por la media
de la distribución. Si una distribución es simétrica, existe el mismo número de valores a la
derecha que a la izquierda de la media, por tanto, el mismo número de desviaciones con
signo positivo que con signo negativo. Decimos que hay asimetría positiva (o a la derecha)
si la "cola" a la derecha de la media es más larga que la de la izquierda, es decir, si hay
valores más separados de la media a la derecha. Diremos que hay asimetría negativa (o a la
izquierda) si la "cola" a la izquierda de la media es más larga que la de la derecha, es decir,
si hay valores más separados de la media a la izquierda.

b) Coeficiente de curtosis: La curtosis de una variable estadística/aleatoria es una


característica de forma de su distribución de frecuencias/probabilidad. Según su concepción
clásica, una curtosis grande implica una mayor concentración de valores de la variable tanto
muy cerca de la media de la distribución (pico) como muy lejos de ella (colas), al tiempo
que existe una relativamente menor frecuencia de valores intermedios.
Quinta parte: Presentación de la tabla de distribución de frecuencias, describiendo
el concepto de cada parte de ella.
a) Clases
b) Intervalos de clase (límite superior e inferior)
c) Marca de clase
d) Frecuencias absolutas
e) Frecuencias acumuladas
f) Frecuencias relativas
8

g) Frecuencias relativas acumuladas.

a) Clase: Clase en estadística Una clase es un rango, grupo o intervalo de datos numéricos.


Por ejemplo si hablamos de edad en un grupo de clase y tienes alumnos de 15 a 17 años, 18
a 20 años, 21 a 23 años esos grupos o rangos son las clases en nuestro caso pues las clases
fueron dadas por pagos anuales.

b) Intervalos de clase: en nuestro caso los intervalos de clase se calculaban sumando desde
un principio el valor mínimo + el ancho de clase, y el ancho de clase al mismo tiempo se
encontraba dividiendo el rango/el número de clases, pero el número de clases se encontraba
por medio de la regla de sturges (1+3.322*LOG(número de datos)) y así se encontraba los
intervalos de clase eso fue todo lo que tuvimos que hacer esto no entraba en la investigación
pero lo puse como dato adicional para saber de dónde sale cada uno de los valores de la
clase, bueno nuestros intervalos como he mencionado habla sobre el pago anual en pesos
como se muestra a continuación:

Límite inferior Límite superior

Esta cantidad fue la Esta misma se


que le fui sumando encuentra dividiendo el
desde el valor mínimo rango entre el número
hasta llegar al valor de clases
máximo

Este número de clases se


calculaba por medio de la
regla de sturges.

c) Marca de clase: La marca de clase es el punto medio de cada intervalo. La marca de clase
es el valor que representa a todo el intervalo para el cálculo de algunos parámetros como la
media aritmética o la desviación típica. En este caso para evaluarlo nosotros tuvimos que
sumar el límite inferior más el límite superior todo esto dividido entre de 2.

Al sumar estos dos limites


inferior y superior y dividir
el resultado entre de 2 nos Esta formulita muestra
daba la marca de clase cómo se calcula la marca
de clase
9

d) Frecuencia de cada clase: se obtenía restando al valor de la frecuencia acumulada en


cada uno como se describe a continuación.
e) Frecuencias acumuladas: bueno para calcular esta tuvimos que sumar las frecuencias
absolutas de todos los valores inferiores o iguales al valor considerado. El profesor nos
había explicado que primero debíamos de sacar la frecuencia acumulada y ya después
sacáramos la frecuencia absoluta ya que ese era el método correcto para sacar cada una se
observan la imagen los 2 primeros números de la primera fila (2) son iguales, se debe a que
todavía no hay valores acumulados pero si a ese 2 le sumamos el 8 que le sigue en la
frecuencia absoluta nos dará como resultado en la frecuencia acumulada 10 ya que ahora si
está acumulando valores

Para calcular esta solo tuvimos


que ir restando valores en la Primero calculamos esta
frecuencia acumulada frecuencia acumulada
10-2=8, 16-6=10

f) Frecuencia relativa: se calcula como el cociente de la frecuencia absoluta de algún valor


de la población/muestra (fi) entre el total de valores que componen la población/muestra
(N). esta fue fácil de encontrar ya que solo tenemos que dividir la frecuencia absoluta de
cada clase entre el número de valores de la muestra en este caso 30. Después sumar cada
frecuencia relativa el resultado seria 1.0000.
10

g) Frecuencias relativas acumuladas: La frecuencia relativa acumulada en nuestro caso


es la suma del primer valor de la frecuencia relativa más su segundo y así consecutivamente
el resultado de esta operación se le volverá a sumar el siguiente valor del siguiente
resultado. Como se muestra.

Démonos cuenta de que este


valor es los mismos que el
primero de la frecuencia relativa
y que se le suma el siguiente de
la frecuencia relativa

Se repite lo mismo en el segundo


y así consecutivamente

Sexta parte: Presentación de las gráficas, describiendo en qué consiste cada una de ellas.
a) Histograma
b) Polígono de frecuencias
c) Gráfica circular (pastel)
d) Ojiva

a) Histograma: para elaborar esta grafica el profesor nos dio las instrucciones siguientes,
para esta grafica tendrán que seleccionar la marca de clase y la frecuencia absoluta, se irían
en la parte de insertar y seleccionaran un gráfico de barras, colocadas de manera vertical, y
se insertaría pero lo que estas graficas quieren dar a conocer son cuantas personas reciben
cierta cantidad de dinero aproximadamente como lo indica la gráfica.
En el eje x muestra los sueldos anuales en pesos y en el eje de la y muestra la cantidad de
personas de nuestra muestra en esta caso si lo sumamos el resultado de esta seria 30 ya que
es el número total de la muestra que nosotros elegimos.
11

b) Polígono de frecuencias: en este la instrucciones fueron las mismas que en el


histograma, utilizando lo mismo que sería la marca de clase y la frecuencia absoluta solo
cambia ya que el tipo de grafico es de líneas.

c) Grafica circular (pastel): para esta las instrucciones fueron distintas a las dos primeras
ya que en vez de seleccionar la marca de clase y la frecuencia absoluta, solo cambia que
envés de seleccionar la frecuencia absoluta seleccionaremos la frecuencia relativa, esto nos
quiere decir que tendremos un porcentaje para cada marca de clase siendo esta el punto
medio de cada intervalo. Y quedando así:
12

d) Ojiva: para elaborar este tipo de grafico seleccionamos la marca de clase y la frecuencia
relativa acumulada, esto nos da una recta levemente subiendo esto se debe a que la
frecuencia relativa acumulada es la suma de las frecuencias relativas y madamas empieza
desde el valor mínimo de la frecuencia relativa hasta el valor máximo de esta misma y esta
llega asta el 1000 ya que es ahí donde la frecuencia relativa acumulada llega

Séptima parte: Interpretación de resultados. Una vez obtenidos todas las medidas y
gráficas, se redactará una interpretación de la información de tal manera que se describan
las características de la muestra de acuerdo a los resultados estadísticos.
En este apartado tendremos que explicar cada concepto relacionado con nuestra hoja de
cálculo.
Población. La población en mi trabajo cuenta con hombres y mujeres estos en función
con el sueldo anual en pesos. Cuenta con más de 2000 datos
13

Muestra: la muestra en mi trabajo cuenta con 30 datos seleccionados de un total de la


población, esto porque así venía en el temario.
Tipo de datos: mi trabajo cuenta con datos continuos
Escala de medición: La escala es de intervalo ya que es cuantitativa en el sentido de
que se pueden cuantificar la diferencia entre dos valores. Puedes restar valores entre dos
variables y esto te ayuda a comprender la diferencia entre dos variables. Esta escala permite
calcular la media de las variables.
Variables: son cuantitativas por que Producen respuestas numéricas, o miden cantidades
en este caso de dinero.
Media: la media en mi hoja de trabajo muestra el promedio de dinero que hay anualmente
con 30 personas, estas siendo la muestra de una población total de más de 2000 datos.
Mediana: la mediana es el valor ubicado al medio del total de la muestra ordenda de
menor a mayor o viceversa en nuestro caso al tener un numero par de datos de la muestra
serian 2 valores tomados y divididos entre de dos y este muestra el valor medio de mi
trabajo.
Moda: en mi muestra no hay moda ya que no hay datos que se repitan todos son diferentes
no existe una moda.
Los 3 cuartiles: como ya sabemos los cuartiles dividen a la muestra en 3 partes 25%,
50% y 75% el cuartil 2 equivaliendo lo mismo a la mediana, esto quiere decir que toma
valores en esas posiciones se podría decir que el cuartil 2 equivale a la mitad de la
población tomando valores en esa parte, por eso es igual que la mediana entonces, los otros
2 cuartiles es lo mismo ya que toman valores en diferentes posiciones ubicados aprox. En
esos porcentajes que representa cada cuartil. Entonces se podría decir que el primer cuartil
nos da el 25% de los sueldos anuales y así con los otros 2.
El percentil 80: al igual que el cuartil solo que este divide la muestra en 100 partes y el
percentil 80 es aquel dato que se encuentra en esa posición, en el percentil 50 si nos damos
cuenta sería lo mismo que el cuartil 2 y por consiguiente igual que la mediana por eso
mismo se dice que son datos de posición.
Rango: el rango es una medida de dispersión, esta es la diferencia del valor máximo y el
valor mínimo el resultado muestra que tan dispersos están los datos en la muestra entre más
grande sea el rango mayor están dispersos los datos seleccionados.
Rango intercuartilico: pues este dice ser una medida de dispersión al igual que el
rango que resta el valor máximo menos el valor mínimo el rango intercuartilico resta el 3er
cuartil menos el 1er cuartil dándonos así el 50% de los datos centrales
Varianza: medida de dispersión central esta nos indica que tan cerca o lejos están los
datos de la media o promedio quiere decir que se relaciona con la media que tan
aproximados son los números de acuerdo a la media. Se calcula elevando al cuadrado la
desviación estándar.
Desviación estándar: está relacionada con la varianza ya que solo se le saca la raíz
cuadrada a la varianza, esto nos da a decir que, pero esta muestra que tan dispersos están
los datos respecto al valor promedio (media) en mi caso muestra que los datos están muy
dispersos ya que es un número muy grande y entre más grande sea el número mayor es la
dispersión.
14

Coeficiente de asimetría: lo que quiere a dar entender en mi caso es que es asimétrica


a la derecha ya que mi coeficiente de asimetría me dio positivo esto quiere decir que se
concentran más valores a la derecha de la media aritmética.
Coeficiente de curtousis: es platicurtica ya que es un número negativo esto quiere
decir que hay una baja concentración esto nos quiere decir que exactamente mis valores
están muy dispersos de la media ósea que están muy salteados los valores en pesos.
Clase: la clase es el número de intervalos de clase ósea cuantos intervalos existen en mi
muestra desde el valor mínimo hasta el valor máximo.
Intervalos de clase: esta muestra de que numero a que numero va a ser el intervalo de
mis datos que son los sueldos anuales de ingenieros egresados del ITO que empiezan desde
el sueldo mínimo y se le va sumando el ancho de la clase.
Marca de clase: la marca de clase muestra el sueldo medio entre un intervalo ósea que
sumados estos divididos entre de 2 y esa muestra el valor medio de un intervalo de clase.
Frecuencias de cada clase: este es como su nombre lo dice la frecuencia con que se
repiten datos de un intervalo ósea el número de veces que se repite un sueldo
aproximadamente dentro del intervalo.
Frecuencias acumuladas: este es la suma de cada frecuencia absoluta en mi caso
sería, la suma de las veces que se repite un valor en mi clase
Frecuencia relativa: ésta. Está relacionada con las veces que se repite un valor de
sueldo en un intervalo pero dividido entre el número de datos de la muestra, esto nos
enseña el porcentaje de número de veces que se repite este dato del intervalo
Frecuencia relativa acumulada: esta hace lo mismo que la frecuencia acumulada
pero lo hace con la frecuencia relativa sumando porcentajes de la frecuencia relativa esta
nos da un resultado del 100% ya que equivale a la totalidad de la muestra de los sueldos
pero dividida en porcentajes queriendo decir que cada intervalo tiene un porcentaje de
repetición.
Grafica de barra (histograma): este nos ayuda a saber el coeficiente de asimetría ya
que da sentido a la misma, en mi caso es asimétrico a la derecha ya que este coeficiente es
positivo y así marca que los valores se ubican hacia el lado contrario del mismo.
Polígono de frecuencias: este grafico de líneas que nosotros elaboramos nos ayuda a
saber qué tipo de curtosis experimenta la muestra de los 30 sueldos como ya he dicho su
cirrosis es platicurtica ya que son valores negativos esto quiere decir que hay una baja
concentración de datos conforme a la media.
Grafica circular (pastel): esta nos da los porcentajes de los pagos anuales en cada
intervalo.
Ojiva: está relacionada con la frecuencia relativa acumulada ya que al final todo nos tiene
que dar un 100% que es el total de la muestra.
Fuentes
1. +15 Libros de Estadística Gratis [PDF] | infolibros.org
2. http://biblioteca.udgvirtual.udg.mx/
3. Datos cuantitativos: Todo lo que necesitas saber para tu investigación
(tesisymasters.mx)
4. Wikipedia, la enciclopedia libre
5. (22) Curtosis para datos agrupados - YouTube
15

6. 🥇▷【 Coeficiente de curtosis - Estadísticas 】 (aulafacil.com)


7. ▷Libro de Probabilidad y Estadística para Ciencias e Ingenierías. Escrito
por Rosario Delgado de la Torre (deingenierias.com)
8. ▷LIBROS de ESTADÍSTICA y PROBABILIDADES [PDF] Para Ingenieros
(deingenierias.com)

También podría gustarte