Portafolio Estadistica YSG

Instituto Tecnológico de Los
Mochis
Portafolio
Materia:
Estadística.
Profesor:
Barreras Manzanares Faustino.
Alumna:
Soto Grijalva Yaremi.
Carrera:
Ing. Bioquímica.
Grupo:
T2M
Fecha:
14/09/22
índice
Introducción..................................................................................................................................... 1
1. Estadística descriptiva.......................................................................................................... 2
Variables ....................................................................................................................................... 2
1.2. Datos no agrupados. ......................................................................................................... 4
1.3. Datos agrupados ................................................................................................................ 5
Clases ............................................................................................................................................ 7
1.4. Medidas de tendencia central. ...................................................................................... 10
1.4.1. Medidas de tendencia central para datos no agrupados. ............................. 10
1.4.2. Medidas de tendencia central para datos agrupados. ................................... 11
1.5. Varianza y desviación estándar. .................................................................................. 13
1.6. Representaciones graficas. ........................................................................................... 15
1.6.1. GRÁFICAS DE LÍNEAS. .......................................................................................... 15
1.6.2. GRÁFICO DE LÍNEAS O HISTOGRAMAS. .......................................................... 18
1.6.3. GRÁFICAS CIRCULARES. ...................................................................................... 22
1.6.4. GRÁFICAS DE DISPERSIÓN.................................................................................. 23
1.6.5. GRÁFICAS DE BURBUJAS. ................................................................................... 24
1.6.6. PICTOGRAMAS. ........................................................................................................ 25
1.7. Conjuntos. .......................................................................................................................... 25
1.7.1. NOTACIÓN.................................................................................................................. 26
1.7.2. TIPOS DE CONJUNTOS .......................................................................................... 26
1.7.3. DIAGRAMAS DE VENN ........................................................................................... 27
1.7.4. OPERACIONES DE CONJUNTOS......................................................................... 28
Conclusión ..................................................................................................................................... 29
Bibliografía ..................................................................................................................................... 30
Introducción
Desde los comienzos de las distintas civilizaciones han existido formas sencillas de
estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en
pieles, rocas, palos de madera, huesos, para contar el número de personas,
animales o ciertas cosas. Desde que surgen los primeros estados (Babilonios (3000
a.C.), Egipcios (2200 a. C.)), se han recogido datos sobre sus habitantes con el
objetivo principal de recaudar impuestos y tributos, y reclutar a jóvenes para el
ejército.
Durante los siglos XVII y XVIII los estados europeos comienzan a realizar censos
de población y a recopilar de manera sistemática datos demográficos, sociales y
económicos. Por tanto, hasta el siglo XIX, la Estadística es una ciencia descriptiva
que utiliza medias y gráficos para sintetizar datos sociales y económicos. La
necesidad de estimar cantidades desconocidas a partir de muestras va
transformando paulatinamente la disciplina en una ciencia normativa para extraer
conclusiones de los datos, prever la evolución de las variables y guiar la toma de
decisiones en ambiente de incertidumbre; esta transformación es posible por la
incorporación del concepto de probabilidad.
La estadística es una ciencia que estudia la variabilidad, colección, organización,

análisis, interpretación, y presentación de los datos, así como el proceso aleatorio
que los genera siguiendo las leyes de la probabilidad.
1
1. Estadística descriptiva
Es la rama de las Matemáticas que recolecta, presenta y caracteriza un conjunto de
datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela,
temperatura en los meses de verano, etc.) con el fin de describir apropiadamente
las diversas características de ese conjunto.
Variables
Una variable estadística es el conjunto de valores que puede tomar cierta
característica de la población sobre la que se realiza el estudio estadístico y sobre
la que es posible su medición. Estas variables pueden ser: la edad, el peso, las
notas de un examen, los ingresos mensuales, las horas de sueño de un paciente en
una semana, el precio medio del alquiler en las viviendas de un barrio de una ciudad,
etc.
• Cualitativa (o categórica): son las variables que pueden tomar como valores
cualidades o categorías.
Ejemplos:
✓ Sexo (hombre, mujer)
✓ Salud (buena, regular, mala)
• Cuantitativas (o numérica): variables que toman valores numéricos.
Ejemplos:
✓ Número de casas (1, 2,…). Discreta.
✓ Edad (12.5, 24.3, 35;…). Continua.
2
Las variables cualitativas (o variables categóricas) se pueden clasificar según
sigan una jerarquía o un orden determinado.
Las variables cuantitativas se clasifican según el número de valores que puede

tomar la variable.
Cuando se estudia el comportamiento de una variable hay que distinguir los

siguientes conceptos:
• Individuo: cualquier elemento que porte información sobre el fenómeno que

se estudia. Así, si estudiamos la altura de los niños de una clase, cada
alumno es un individuo; si se estudia el precio de la vivienda, cada vivienda
es un individuo.
• Población: conjunto de todos los individuos (personas, objetos, animales,
etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo,
3
si se estudia el precio de la vivienda en una ciudad, la población será el total
de las viviendas de dicha ciudad.
• Muestra: subconjunto que seleccionado de una población. Por ejemplo, si se
estudia el precio de la vivienda de una ciudad, lo normal será no recoger
información sobre todas las viviendas de la ciudad.
Algunas áreas de la estadística son:
• Diseño: Planeamiento y desarrollo de investigaciones.

• Descripción: Resumen y exploración de datos.
• Inferencia: Hacer predicciones o generalizaciones acerca de características
de una población en base a la información de una muestra de la población.
1.2. Datos no agrupados.
Los datos no agrupados son el conjunto de datos que no se ha clasificado y se es

presentada en su forma de aparición en una tabla de datos donde cada valor se
representa de forma individual. Por lo general este conjunto comprende una
cantidad de elementos menor a 30 (n<30) con poca o nula repetición.
El tratamiento de estos datos sin agrupar. El manejo de estos datos es simple, se

recolectan los datos de la población de estudio y dichos datos se distribuyen en una
tabla de datos y se analizan sin necesidad de formar clases con ellos.
4
Estos datos al distribuirse en tabla de frecuencia donde cada dato mantiene su
propia identidad después que la distribución de frecuencia se ha elaborado.
Ejemplo: Edades de un grupo de personas:
10 12 13 13 13 13 13 14 15 15 16 16 17 17 18 18 18 20 20 20
Edad Frecuencia
10 1
11 0
12 1
13 5
14 1
15 2
16 2
17 2
18 3
19 0
20 3
Total 20
1.3. Datos agrupados
Los datos agrupados son como lo indica su nombre, una cantidad dada de datos
que puede clasificarse, ya sea por sus cualidades cualitativas o cuantitativas, y por
tal agruparse para su análisis.
Estos datos por lo general son agruparles cuando su población cuenta con alrededor
de 20 o más elementos que comparten una característica y caben dentro de una
categorización (repeticiones de un valor), pues permite un mejor manejo y análisis
más profundo de los mismos. Porque al emplear este método podemos manejarlos
por clases (una clase es una categoría en la que se agrupan los datos).
5
Por lo cual pueden organizarse o clasificarse de dos formas:
• Datos agrupados en frecuencia.

• Datos agrupados en intervalos.
Los datos agrupados en frecuencia son los que se distribuyen u organizan en una
tabla de frecuencia (La frecuencia es igual al número de veces en que se repite
cada valor en una serie de datos.), así, Por medio de ella, es fácil identificar la
cantidad de respuestas repetidas.
Los datos agrupados por intervalos son los que se organizan dentro de un rango
y se delimita su amplitud por límites establecidos. Así, por medio de esta, es fácil
identificar la cantidad de elementos en un determinado rango de valores.
Su fin es resumir la información mediante el uso de tablas que organizan sus

elementos y agrupan sus valores para ser presentados numérica o gráficamente.
Esto implica: ordenar, clasificar y expresar los en una tabla de frecuencias o
intervalos.
Cuando la cantidad de posibles respuestas es grande -digamos más de 10- es

necesario trabajar la información de una manera simplificada; para ello, lo que se
acostumbra es dividir el espectro de valores posibles en intervalos, llamados clases
que luego se registran en una tabla de frecuencias conocida como distribución de
frecuencias agrupadas. Así, en vez de usar cada uno de los valores individuales
como categorías, se trabaja con rangos de valores, de modo que se trabaja con una
distribución más compacta, que permitirá que los comportamientos y tendencias
puedan visualizarse mejor.
Ejemplo:
Estaturas de 40 alumnos.
6
Clases
• Rango de valores. Ordena los datos e identifica el valor máximo y mínimo.

Con ellos vamos a determinar el rango. Como puedes ver, el valor mínimo es
1.51 m, el valor máximo es 1.99 m. El rango es: 1.99 - 1.51=0.48 m
• Número de clases. Cada uno de los intervalos de valores que utilizaremos
en la distribución de frecuencias agrupadas se llama clase. Es una costumbre
muy frecuente dividir el rango de valores en 10 clases como máximo, pues
con más clases, el trabajo puede ser muy laborioso y con menos clases se
puede perder precisión. Cuando el número de datos no es muy grande
(digamos a lo más 150), una manera de determinar el número de clases es
usando la siguiente fórmula:
Donde n es el número de datos. Así que aplicando la fórmula a nuestro

ejercicio tenemos √40 = 6.3 ≈ 6, esto es 6 clases.
• Ancho de clase. Todos los intervalos o clases deben tener el mismo ancho
y no deben superponerse, de manera que cada dato caiga dentro de
solamente una clase. Para darnos una primera idea del ancho de clase
dividiremos el rango entre el número de clases:
Este resultado indica que el ancho de cada clase deberá ser de 8 cm. Sin
embargo, siempre que sea posible resulta práctico usar números que sean
múltiplos de 5 por ello, en nuestro caso elegiremos un ancho de clase de 10
cm. Si esto no es posible, elige un número que resulte conveniente para
lograr que todos los datos sean cubiertos por las clases.
• Límites de clases. Una vez que hemos definido el número de clases y su
ancho, podemos empezar a construir la tabla con la distribución de
frecuencias. tendremos tantos renglones como clases y una que indique los
7
valores que componen cada intervalo. Podemos también colocar dos
columnas adicionales: una que indique específicamente cuál es el límite
inferior y otra para el límite superior. Para establecer los límites de cada
intervalo observamos el valor del dato mínimo que es 1.51 cm y damos un
pequeño margen previo por lo que elegimos como inicio del primer intervalo
1.45 m, y como el ancho es de 10 cm, este intervalo abarcará de 1.45 a 1.54
m, el segundo abarcará de 1.55 m a 1.64 m y así sucesivamente.
• Marcas de clase. Antes de proceder a obtener las frecuencias de cada

intervalo calcularemos la marca de clase, que es el valor central de cada
intervalo, y que se utiliza como valor representativo, al calcular la media y la
desviación estándar en las distribuciones agrupadas.
Para calcular la marca de clase, sólo hay que sumar los límites superior e
inferior del intervalo y dividir el resultado entre 2.
• Obtención de las frecuencias absolutas. De la lista de datos, obtenemos
cuántos de ellos hay dentro de cada clase, esta es la frecuencia absoluta de
8
los datos. Colocamos esta información en una columna adicional en la tabla.
Al terminar, es importante sumar todas las frecuencias para verificar que el
total sea igual al número de datos.
• Cálculo de la frecuencia relativa y de la frecuencia relativa acumulada.
Agregamos dos nuevas columnas, una con la frecuencia relativa que se
obtiene al dividir la frecuencia absoluta entre el total de los datos y redondear
3/40 = 0.08; 11/40 = 0.28; etc.
Después, multiplicamos por 100 para obtener porcentajes y así la
presentamos en la tabla 0.08 × 100 = 8%; 0.28 × 100 = 28%, etc. En cada
renglón se calcula de la misma manera.
Para obtener la frecuencia relativa acumulada, vamos a ir sumando cada una
de las celdas de frecuencia relativa con la anterior -salvo la primera- en este
ejemplo tenemos para la primera celda 8%, para la segunda sumamos 8% +
28% = 36%, la siguiente celda será 36% + 23% = 59% y así sucesivamente,
en la última clase debes asegurarte de tener 100%.
Tabla de distribución de frecuencias

# de Intervalo P.M Frecuencia Frecuencia Frecuencia Frecuencia
clase absoluta acumulada relativa relativa
acumulada
1 1.45- 1.495 3 3 8% 8%
1.54
2 1.55- 1.595 11 14 28% 36%
1.64
3 1.65- 1.695 9 23 23% 59%
1.74
4 1.75- 1.795 7 30 18% 76%
1.84
5 1.85- 1.895 9 39 23% 97%
1.94
9
6 1.95- 1.995 1 40 3% 100%
2.04
Suma 40 100%
1.4. Medidas de tendencia central.
Son medidas estadísticas que se usan para describir cómo se puede resumir la
localización de los datos. Ubican e identifican el punto alrededor del cual se centran
los datos. Las más utilizadas son: la media, la mediana y la moda.
1.4.1. Medidas de tendencia central para datos no agrupados.
• La media aritmética, también conocida como promedio y denotada como X,

se calcula de la siguiente forma: X = (x1 + x2 + x3 + ….. xn) / n
Donde x1, x2, …. xn, son los datos y n es el total de ellos. En notación de
sumatoria se tiene:
• La mediana es el valor que aparece en el medio de una sucesión ordenada

de datos, así que, para obtenerla, es preciso ordenar los datos, antes que
nada. Si el número de observaciones es impar, no hay problema en encontrar
el punto medio del conjunto, pero si tenemos número par de datos, se buscan
los dos datos centrales y se los promedia.
• La moda es el valor más común que se observa en el conjunto de datos. No
siempre existe, puesto que es posible que ningún valor se repita con mayor
frecuencia que otro. También pudiera haber dos datos con igual frecuencia,
en cuyo caso se habla de una distribución bi-modal.
10
A diferencia de las dos medidas anteriores, la moda se puede usar con datos
cualitativos.
Ejemplo:
Supongamos que se quiere determinar la media aritmética, la mediana y la moda

en el ejemplo propuesto al comienzo: las edades de 20 empleados de una cafetería:
24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20
La media se calcula simplemente sumando todos los valores y dividiendo entre n =

20, que es el número total de datos. De esta manera:
X = (24 + 20 + 22 + 19 + 18 + 27+ 25 + 19 + 27 + 18 + 21 + 22 + 23 + 21+ 19 + 22

+ 27+ 29 + 23+ 20) / 20 = 22.3 años
Para hallar la mediana es necesario ordenar primero el conjunto de datos:
18, 18, 19, 19, 19, 20, 20, 21, 21, 22, 22, 22, 23, 23, 24, 25, 27, 27, 27, 29
Como es un número par de datos, se toman los dos datos centrales, resaltados en
negrita, y se promedian. Debido a que ambos son 22, la mediana es de 22 años.
Por último, la moda es el dato que más se repite o aquel cuya frecuencia es mayor,
siendo este 22 años.
1.4.2. Medidas de tendencia central para datos agrupados.
• MEDIA: Si en una tabla de distribución de frecuencia, con clases, los puntos

medios son: y las respectivas frecuencias son , la
media aritmética se calcula de la siguiente manera:
Donde el número total de observaciones es
11
• MEDIANA: Cuando los datos se encuentran agrupados en una distribución
de frecuencia no se conocen los datos originales, por lo tanto, es necesario
estimar la mediana mediante los siguientes pasos:
✓ Calcular el valor
✓ Localizar el intervalo de clase donde se encuentra la mediana
(intervalo mediano). Esto se hace encontrando el primer intervalo de
clase donde la frecuencia acumulada es igual o mayor que

Aplicando la siguiente fórmula con los valores del intervalo mediano:
Donde:
= Límite inferior de la clase de donde se encuentra la mediana.
N= Total de frecuencias.
= Frecuencia acumulada anterior a la clase mediana.
= Frecuencia del intervalo mediano.
= amplitud del intervalo de clase.
• MODA: Es el valor que representa la mayor frecuencia absoluta. En tablas
de frecuencias con datos agrupados, se habla de intervalo modal.
Si todos los intervalos tienen la misma amplitud, la moda se calcula por
medio de:
Donde:
= Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia
absoluta).
= Frecuencia absoluta del intervalo modal.
= Frecuencia absoluta del intervalo anterior al modal.
= Frecuencia absoluta del intervalo posterior al modal.
= Amplitud de los intervalos.
12
Ejemplo:
1.5. Varianza y desviación estándar.
La varianza se denota como s y se calcula mediante la expresión:
Entonces para interpretar acertadamente los resultados, se define la desviación

estándar como la raíz cuadrada de la varianza, o también la cuasi-desviación
estándar, que es la raíz cuadrada de la cuasivarianza:
13
Ejemplo:
Encontrar media, mediana, moda, rango, varianza, desviación estándar y sesgo

para los resultados de un examen de coeficiente intelectual realizado a 20 alumnos
de una universidad:
119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124,
112, 112, 106
Ordenaremos los datos, ya que será necesario para encontrar la mediana.
106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 112, 119, 119,
124, 124, 124
Y los pondremos en una tabla como sigue, para facilitar los cálculos. La segunda
columna titulada “Acumulado” es la suma del dato correspondiente más el anterior.
Esta columna ayudará a encontrar fácilmente la media, dividiendo el último

acumulado entre el número total de datos, como se ve al final de la columna de
“Acumulado”:
X = 112.9
14
La mediana es el promedio de los datos centrales resaltados en rojo: el número 10
y el número 11. Como son iguales, la mediana es 112.
Por último, la moda es el valor que más se repite y es 112, con 7 repeticiones.
En cuanto a las medidas de dispersión, el rango es:
124-106 = 18.
La varianza se obtiene dividiendo el resultado final de la columna derecha entre n:
s = 668.6/20 = 33.42
En este caso, la desviación estándar es la raíz cuadrada de la varianza: √33.42 =

5.8
Por su parte, los valores de la cuasivarianza y la cuasi desviación estándar son:
sc=668.6/19 = 35.2
Cuasi-desviación estándar = √35.2 = 5.9
Por último, el sesgo es ligeramente hacia la derecha, ya que la media 112.9 es

mayor que la mediana 112.
1.6. Representaciones graficas.
Una gráfica es la representación de datos, generalmente numéricos, mediante

líneas, superficies o símbolos, para ver la relación que esos datos guardan entre sí.
Sirven para analizar el comportamiento de un proceso, o un conjunto de elementos
o signos que permiten la interpretación de un fenómeno. Las gráficas se pueden
agrupar en cinco tipos:
1.6.1. GRÁFICAS DE LÍNEAS.
• Gráfica simple de líneas: Muestran la relación entre dos variables

cuantitativas. En el eje horizontal (x) se gráfica la variable independiente en
15
el eje vertical (y). Las marcas de los cuadrantes en los ejes marcan las
unidades de medida; las escalas en los ejes pueden ser lineales, logarítmicas
o ambas. Cuando los datos se relacionan entre sí, es decir, cuando podemos
decir que existe cierta continuidad entre las observaciones (como por ejemplo
el crecimiento poblacional, la evolución del peso o estatura de una persona
a través del tiempo, el desempeño académico de un estudiante a lo largo de
su instrucción escolar, las variaciones presentadas en la medición realizada
en algún experimento cada segundo o minuto) se pueden utilizar las gráficas
de líneas, que consisten en una serie de puntos trazados en las
intersecciones de las marcas de clase y las frecuencias de cada una,
uniéndose consecutivamente con líneas.
Ejemplo:
Aquí se muestra el comportamiento de los promedios escolares finales de
dos alumnos (Daniel y Blanca) a lo largo de cinco observaciones anuales:
• Polígono de frecuencias: En el polígono de frecuencias se añaden dos

clases con frecuencias cero: una antes de la primera clase con datos y otra
después de la última. El resultado es que se "sujeta" la línea por ambos
extremos al eje horizontal y lo que podría ser una línea separada del eje se
convierte, junto con éste, en un polígono.
16
Ejemplo: El siguiente polígono de frecuencias muestra los goles anotados
por un delantero en un equipo de fútbol en las temporadas de 2000 a 2007:
Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se

obtiene de aplicar parcialmente la misma técnica a una distribución
acumulativa y de igual manera que éstas, existen las ojivas mayor que y las
ojivas menor que.
La diferencia fundamental entre las ojivas y los polígonos de frecuencias es
que en el eje horizontal (x) en lugar de colocar las marcas de clase se colocan
las fronteras de clase. Para el caso de la ojiva mayor que es la frontera menor
y para la ojiva menor que, la mayor. Los dos casos posibles son:
✓ Caso 1. Para la ojiva mayor que, el extremo izquierdo de la ojiva no
se "amarra" al eje x.
Ejemplo: De un grupo de 30 estudiantes, 20 acreditaron la materia de
Estadística y Probabilidad y se agruparon sus calificaciones desde 6
hasta 10 en intervalos de 0.5. Se obtuvo la frecuencia acumulada
hasta el intervalo de clase mayor de 9.5. De la gráfica de ojiva mayor
puede verse que el 30% de los estudiantes sacaron 9 o más de
calificación.
17
✓ Caso 2. Para la ojiva menor que, el extremo derecho no se “amarra”
al eje x.
Ejemplo: Se tomaron las estaturas de 50 estudiantes en un grupo del
plantel 8 de la ENP y se agruparon por intervalos de 5 centímetros,
iniciando en 1.45m y terminando en 1.90m. Se obtuvo la frecuencia
acumulada hasta el intervalo de clase menor de 1.90m. De la gráfica
de ojiva menor puede verse que el 90% de los estudiantes miden
menos de 1.80 metros.
1.6.2. GRÁFICO DE LÍNEAS O HISTOGRAMAS.
Se emplea cuando la variable independiente es categórica. Cada barra sólida, ya

sea vertical u horizontal representa un tipo de dato. Cuando es necesario
representar divisiones de datos se utiliza una gráfica de barras subdivididas. Los
18
histogramas no muestran frecuencias acumuladas, son preferibles para el
tratamiento de datos cuantitativos y la barra con mayor altura representa la mayor
frecuencia. La sumatoria de las alturas de las columnas equivale al 100% de los
datos.
• Barras verticales: En el eje horizontal (o de las abscisas) se representan los

intervalos de los datos, marcándose de manera continua las fronteras entre
cada uno de éstos. De esta manera, el histograma está compuesto por
rectángulos, cuyo número coincide con la cantidad de intervalos
considerados, el ancho de la base de cada uno de esos rectángulos es la
misma siempre y coincide con las fronteras de los intervalos, y la altura
corresponde a la frecuencia de cada intervalo. En este tipo de gráficas es
recomendable:
✓ El empleo de sombreado o colores facilita la diferenciación de las
barras.
✓ El punto cero se indica en el eje de ordenadas y se deben establecer
las unidades en los ejes.
✓ La longitud de los ejes debe ser suficiente para acomodar la extensión
de la barra.
Ejemplo: La gráfica siguiente representa el número de campeonatos de
fútbol que han ganado los países en las 18 ediciones desde 1930 hasta 2006:
19
• Barras horizontales: Se parecen mucho a las gráficas de columnas, con la
salvedad importante de que la función de los ejes se intercambia y el eje
horizontal queda destinado a las frecuencias y el eje vertical a las clases.
Es muy común que este tipo de gráficos se utilicen para ilustrar el tamaño de
una población dividida en estratos como, por ejemplo, son sus edades.
Ejemplo: La siguiente gráfica presenta la distribución de las edades de los
236 niños que estudian en una escuela primaria:
• Gráficas de columnas bidimensionales: se pide que sus bases sean del

mismo ancho y sus alturas equivalentes con las frecuencias. Para este tipo,
a diferencia del histograma, no es necesario tener una escala horizontal
continua, por lo que los rectángulos (o barras) no tienen que aparecer juntas
entre sí.
Otra observación pertinente es que se pueden representar en la misma
gráfica, utilizando las mismas escalas horizontales y verticales, varios datos
correspondientes a las mismas variables producto de varias observaciones.
Esto produce una gráfica con varias series, correspondiendo cada una de
ellas a cada observación de la muestra (o población), y teniéndose una
gráfica compuesta. Es conveniente que cada serie de datos (u
observaciones) sean coloreados de igual manera entre sí, pero distinta de
las demás.
20
Ejemplo: La gráfica siguiente muestra el comportamiento de los minutos de
retraso que acumularon tres trabajadores de una tienda durante cuatro
semanas. Las series están coloreadas con diferente color para mostrar el
comportamiento tanto individual, como de cada uno de los trabajadores con
respecto a los demás.
• Gráficas de columnas tridimensionales: Existe la posibilidad, y si los

recursos lo permiten, de representar gráficos compuestos de una manera
"tridimensional", es decir, con gráficos que posean no sólo dos ejes, sino tres;
y en los que los rectángulos son sustituidos por prismas de base rectangular
(ocasionalmente el software en el mercado permite utilizar prismas cuya base
son polígonos regulares de más de cuatro lados, pirámides o cilindros).
Ejemplo: En la gráfica se puede apreciar el número de medallas que han
ganado cinco países en las ediciones de los Juegos Panamericanos de 1999
a 2007:
21
1.6.3. GRÁFICAS CIRCULARES.
Denominadas también gráfica de pastel, se utilizan para mostrar porcentajes y

proporciones. El número de elementos comparados dentro de un gráfico circular, no
deben ser más de 7, ordenando los segmentos de mayor a menor, iniciando con el
más amplio a partir de las 12 como en un reloj. Una manera sencilla de diferenciar
los segmentos es sombreándolos con colores contrastantes.
Este tipo de gráficas es muy útil cuando lo que se desea es resaltar las proporciones
que representan algunos subconjuntos con respecto al total, es decir, cuando se
está usando una escala categórica.
Ejemplo:
La siguiente gráfica ilustra los gustos musicales de un grupo de jóvenes de la

Facultad de Contaduría:
De hecho, si se desea resaltar una de las categorías que se presentan, es válido

tomar esa "rebanada" de la gráfica y separarla de las demás:
22
1.6.4. GRÁFICAS DE DISPERSIÓN.
Una gráfica de dispersión tiene dos ejes de valores, mostrando un conjunto de datos
numéricos en el eje x y otro en el eje y. Combina estos valores en puntos de datos
únicos y los muestra en intervalos uniformes o agrupaciones. Los gráficos de
dispersión se utilizan normalmente para mostrar y comparar valores numéricos,
como datos científicos, estadísticos y de ingeniería. Este tipo de gráficas se usan
cuando:
• Desea cambiar la escala del eje horizontal.

• Desea convertir dicho eje en una escala logarítmica.
• Los espacios entre los valores del eje horizontal no son uniformes.
• Hay muchos puntos de datos en el eje horizontal.
Ejemplo: La siguiente gráfica de dispersión compara temperaturas en un día en la

Ciudad de México. En el eje de horizontal mide la hora de medición y el eje vertical
mide las temperaturas previstas y las temperaturas reales.
23
1.6.5. GRÁFICAS DE BURBUJAS.
Un tipo de gráfico similar a las gráficas de dispersión son las gráficas de burbujas,
en las cuales se presenta la dispersión de las observaciones de la misma forma
pero se le añade la posibilidad de visualizar otra variable representada en el tamaño
del punto, pues éstos se convierten en círculos (burbujas) con radios proporcionales
a las magnitudes que representan.
Ejemplo: La gráfica siguiente se puede apreciar el volumen de ventas y el número

de productos de siete artículos (A-1 a A-7) en una fábrica. Además, se puede ver
fácilmente la participación o cuota de mercado de cada artículo a través del tamaño
de cada burbuja, que corresponde a la cifra que está después de cada coma:
24
1.6.6. PICTOGRAMAS.
Son gráficos con dibujos alusivos al carácter que se está estudiando y cuyo tamaño
es proporcional a las frecuencias que representan. Se emplean para representar
diferencias cuantitativas simples entre grupos. Los símbolos utilizados para
representar valores idénticos deben ser de igual dimensión.
Actualmente muchos medios masivos de comunicación utilizan gráficos para ilustrar

resultados de alguna investigación. Regularmente se utilizan dibujos llamativos para
captar el interés del público.
Ejemplo: El pictograma siguiente representa la población de los Estados Unidos de

1930 a 1990 (cada figura representa a dos millones de habitantes).
1.7. Conjuntos.
De acuerdo a Spiegel, un conjunto es una colección de objetos llamados miembros

o elementos del conjunto. Algunos sinónimos de conjunto son: clase, grupo y
colección.
Para Marques, un conjunto es un agregado o colección de objetos de cualquier

naturaleza con características bien definidas de manera que se puedan distinguir
25
todos sus elementos. A los objetos que lo componen se les llama elementos del
conjunto.
1.7.1. NOTACIÓN
Un conjunto se denota con una letra mayúscula A, B, C y el elemento por una letra
minúscula a, b.
A los elementos se les encierra entre llaves ( {} ) y se separan por comas ( , ).
Ejemplos:
• El conjunto D cuyos elementos son los números que aparecen al lanzar
un dado. D = {1, 2, 3, 4, 5, 6}
• El conjunto de días de la semana. S = {Lunes, Martes, Miércoles, Jueves,
Viernes, Sábado, Domingo}
• El conjunto de las vocales. V = {a, e, i, o, u}
• El conjunto de los enteros positivos menores que 10. P = {1, 2, 3, 4, 5, 6, 7,
8, 9}
1.7.2. TIPOS DE CONJUNTOS
Según la cantidad de elementos que tenga un conjunto, éstos se pueden clasificar

de la siguiente manera:
• Conjuntos Finitos: Son los que tienen un número conocido de elementos.
Ejemplos:
✓ El conjunto de números que aparecen al lanzar un dado.
✓ El conjunto de días de la semana.
✓ El conjunto de las vocales.
✓ El conjunto de los enteros positivos menores que 10.
• Conjuntos Infinitos: Son lo que tienen un número ilimitado de elementos.
Ejemplos:
✓ El conjunto de los números reales.
26
✓ El conjunto de los números reales entre 2 y 5.
• Conjunto universal: Es el conjunto de todos los elementos considerados en
un problema o situación dada.
Ejemplos:
✓ Si solo se desea trabajar con los números reales positivos, el conjunto
universal será U = R+ = (0, +∞)
✓ Si se quiere trabajar con los números que aparecen en un dado, el
conjunto universal será U = {1, 2, 3, 4, 5, 6}
• Conjunto vacío: Un conjunto que no tiene elementos y se denota por ∅ ó { }
Ejemplos:
✓ El conjunto A = {x ∈ ! / !!+ 1 = 0} es un conjunto vacío porque no hay
ningún número real que satisfaga !!+ 1 = 0.
✓ El conjunto de los meses del año con 27 días.
1.7.3. DIAGRAMAS DE VENN
Cualquier figura geométrica cerrada (círculos, rectángulos, triángulos, óvalos, etc)

sirve para representar gráficamente las operaciones entre conjuntos, estos
gráficos son llamados Diagramas de Venn. Normalmente, al conjunto universal se

le representa con un rectángulo y los conjuntos con un círculo o elipse, tal y como
se muestra en la siguiente figura:
Los diagramas de Venn en ningún momento constituyen una prueba matemática;

sin embargo, permiten tener una visión intuitiva de la relación que puede existir entre
los conjuntos.
27
1.7.4. OPERACIONES DE CONJUNTOS
• Unión: El conjunto de todos los elementos que pertenecen a A o a B, o tanto

a A como a B, se llama la unión de A y B y se escribe A ∪ B. (Área
sombreada).
• Intersección: El conjunto de todos los elementos que pertenecen

simultáneamente a A y B se llama la intersección de A y B y se escribe A ∩
B. (Área sombreada).
• Diferencia: El conjunto que consiste en todos los elementos de A que no

pertenecen a B se llama la diferencia de A y B y se escribe A – B. (Área
sombreada).
• Complemento: Son todos los conjuntos no en A y se escribe A’. (Área

sombreada).
28
Conclusión
En la actualidad la Estadística se ha constituido en una herramienta importante en

los procesos de investigación, puesto que permite planear la investigación,
recolectar, organizar, representar, interpretar y analizar la información referente a
individuos u observaciones de un fenómeno al cual se le estudian característica en
común, en una población o en una muestra.
El análisis permite describir comportamientos de la información, obtener

conclusiones y dar recomendaciones para la toma de decisiones. Algunos
fenómenos presentan características aleatorias, por lo tanto, es conveniente
estudiar la posibilidad de ocurrencia de eventos relacionados con dicho fenómeno,
a esa posibilidad se le denominara probabilidad. Con su estudio, se analiza los
resultados de los fenómenos o experimentos aleatorios y con ellos es posible tomar
decisiones en presencia de incertidumbre. En cada uno de los experimentos el
interés es asociar números a los resultados de esos experimentos y estos son los
valores para las variables aleatorias; con ellas se construyen los modelos
necesarios para estudiar las situaciones estadísticas con las distribuciones de
probabilidad.
29
Bibliografía
Alluka. (08 de julio de 2012). aprendiendo con Alluka. Obtenido de

https://shadowsover.blogspot.com/2012/07/datos-agrupados-y-no-
agrupados_8296.html
Becerra Espinosa, J. M. (s.f.). ESTADÍSTICA DESCRIPTIVA. Obtenido de

http://132.248.164.227/publicaciones/docs/apuntes_matematicas/34.%20Es
tadistica%20Descriptiva.pdf
Berenson. (1985). Estadística para administración y economía.
Canavos. (1988). Probabilidad y Estadística: Aplicaciones y métodos.
Devore. (2012). Probability and Statistics for Engineering and Science. 8th. Edition.
Garcia Perez, C. (s.f.). Teoria de conjuntos. Obtenido de

https://repository.uaeh.edu.mx/bitstream/bitstream/handle/123456789/1488
6/LECT107.pdf?sequence=1&isAllowed=y
Gonzales, E. (12 de diciembre de 2021). Docz. Obtenido de

https://www.udocz.com/apuntes/280932/ejercicios-de-medidas-de-
tendencia-central-para-datos-agrupados
Hagamos matematicas . (s.f.). Obtenido de

https://hagamosmatematicas.wordpress.com/estadistica-descriptiva/grado-
once-2/
Levin. (1988). Estadística para Administradores. 2da. Edición.
Orellana , L. (2001). ESTADÍSTICA DESCRIPTIVA. Obtenido de

https://www.dm.uba.ar/materias/estadistica_Q/2011/1/modulo%20descriptiv
a.pdf
UNAM. (s.f.). Obtenido de

http://uapas1.bunam.unam.mx/matematicas/datos_agrupados/
30
Universidad Nacional Autonoma de Mexico. (s.f.). Obtenido de
http://prepa8.unam.mx/academia/colegios/matematicas/paginacolmate/appl
ets/matematicas_V/Applets_Geogebra/medmedmod.html#:~:text=MEDIDA
S%20DE%20TENDENCIA%20CENTRAL%20PARA,la%20mediana%20y%
20la%20moda.
universo formulas . (s.f.). Obtenido de

https://www.universoformulas.com/estadistica/descriptiva/variables-
estadisticas/
Walpole. (2007). Probabilidad y Estadística para Ingeniería y Ciencias.
Zapata, E. (s.f.). lidefer. Obtenido de https://www.lifeder.com/datos-no-agrupados/
31

Portafolio Estadistica YSG

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Portafolio Estadistica YSG

Cargado por

Copyright:

Formatos disponibles

Instituto Tecnológico de Los

La estadística es una ciencia que estudia la variabilidad, colección, organización,

Las variables cuantitativas se clasifican según el número de valores que puede

Cuando se estudia el comportamiento de una variable hay que distinguir los

• Individuo: cualquier elemento que porte información sobre el fenómeno que

Algunas áreas de la estadística son:

• Diseño: Planeamiento y desarrollo de investigaciones.

1.2. Datos no agrupados.

Los datos no agrupados son el conjunto de datos que no se ha clasificado y se es

El tratamiento de estos datos sin agrupar. El manejo de estos datos es simple, se

Ejemplo: Edades de un grupo de personas:

1.3. Datos agrupados

• Datos agrupados en frecuencia.

Su fin es resumir la información mediante el uso de tablas que organizan sus

Cuando la cantidad de posibles respuestas es grande -digamos más de 10- es

• Rango de valores. Ordena los datos e identifica el valor máximo y mínimo.

Donde n es el número de datos. Así que aplicando la fórmula a nuestro

• Marcas de clase. Antes de proceder a obtener las frecuencias de cada

Tabla de distribución de frecuencias

1.4. Medidas de tendencia central.

1.4.1. Medidas de tendencia central para datos no agrupados.

• La media aritmética, también conocida como promedio y denotada como X,

• La mediana es el valor que aparece en el medio de una sucesión ordenada

Supongamos que se quiere determinar la media aritmética, la mediana y la moda

La media se calcula simplemente sumando todos los valores y dividiendo entre n =

X = (24 + 20 + 22 + 19 + 18 + 27+ 25 + 19 + 27 + 18 + 21 + 22 + 23 + 21+ 19 + 22

Para hallar la mediana es necesario ordenar primero el conjunto de datos:

1.4.2. Medidas de tendencia central para datos agrupados.

• MEDIA: Si en una tabla de distribución de frecuencia, con clases, los puntos

Donde el número total de observaciones es

clase donde la frecuencia acumulada es igual o mayor que

1.5. Varianza y desviación estándar.

La varianza se denota como s y se calcula mediante la expresión:

Entonces para interpretar acertadamente los resultados, se define la desviación

Encontrar media, mediana, moda, rango, varianza, desviación estándar y sesgo

Ordenaremos los datos, ya que será necesario para encontrar la mediana.

Esta columna ayudará a encontrar fácilmente la media, dividiendo el último

En cuanto a las medidas de dispersión, el rango es:

La varianza se obtiene dividiendo el resultado final de la columna derecha entre n:

En este caso, la desviación estándar es la raíz cuadrada de la varianza: √33.42 =

Por su parte, los valores de la cuasivarianza y la cuasi desviación estándar son:

Cuasi-desviación estándar = √35.2 = 5.9

Por último, el sesgo es ligeramente hacia la derecha, ya que la media 112.9 es

1.6. Representaciones graficas.

Una gráfica es la representación de datos, generalmente numéricos, mediante

1.6.1. GRÁFICAS DE LÍNEAS.

• Gráfica simple de líneas: Muestran la relación entre dos variables

• Polígono de frecuencias: En el polígono de frecuencias se añaden dos

Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se

1.6.2. GRÁFICO DE LÍNEAS O HISTOGRAMAS.

Se emplea cuando la variable independiente es categórica. Cada barra sólida, ya

• Barras verticales: En el eje horizontal (o de las abscisas) se representan los

• Gráficas de columnas bidimensionales: se pide que sus bases sean del

• Gráficas de columnas tridimensionales: Existe la posibilidad, y si los

Denominadas también gráfica de pastel, se utilizan para mostrar porcentajes y

La siguiente gráfica ilustra los gustos musicales de un grupo de jóvenes de la

De hecho, si se desea resaltar una de las categorías que se presentan, es válido

• Desea cambiar la escala del eje horizontal.

Ejemplo: La siguiente gráfica de dispersión compara temperaturas en un día en la

Ejemplo: La gráfica siguiente se puede apreciar el volumen de ventas y el número

Actualmente muchos medios masivos de comunicación utilizan gráficos para ilustrar

Ejemplo: El pictograma siguiente representa la población de los Estados Unidos de

De acuerdo a Spiegel, un conjunto es una colección de objetos llamados miembros