Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Portafolio Estadistica YSG
Portafolio Estadistica YSG
Mochis
Portafolio
Materia:
Estadística.
Profesor:
Barreras Manzanares Faustino.
Alumna:
Soto Grijalva Yaremi.
Carrera:
Ing. Bioquímica.
Grupo:
T2M
Fecha:
14/09/22
índice
Introducción..................................................................................................................................... 1
1. Estadística descriptiva.......................................................................................................... 2
Variables ....................................................................................................................................... 2
1.2. Datos no agrupados. ......................................................................................................... 4
1.3. Datos agrupados ................................................................................................................ 5
Clases ............................................................................................................................................ 7
1.4. Medidas de tendencia central. ...................................................................................... 10
1.4.1. Medidas de tendencia central para datos no agrupados. ............................. 10
1.4.2. Medidas de tendencia central para datos agrupados. ................................... 11
1.5. Varianza y desviación estándar. .................................................................................. 13
1.6. Representaciones graficas. ........................................................................................... 15
1.6.1. GRÁFICAS DE LÍNEAS. .......................................................................................... 15
1.6.2. GRÁFICO DE LÍNEAS O HISTOGRAMAS. .......................................................... 18
1.6.3. GRÁFICAS CIRCULARES. ...................................................................................... 22
1.6.4. GRÁFICAS DE DISPERSIÓN.................................................................................. 23
1.6.5. GRÁFICAS DE BURBUJAS. ................................................................................... 24
1.6.6. PICTOGRAMAS. ........................................................................................................ 25
1.7. Conjuntos. .......................................................................................................................... 25
1.7.1. NOTACIÓN.................................................................................................................. 26
1.7.2. TIPOS DE CONJUNTOS .......................................................................................... 26
1.7.3. DIAGRAMAS DE VENN ........................................................................................... 27
1.7.4. OPERACIONES DE CONJUNTOS......................................................................... 28
Conclusión ..................................................................................................................................... 29
Bibliografía ..................................................................................................................................... 30
Introducción
Desde los comienzos de las distintas civilizaciones han existido formas sencillas de
estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en
pieles, rocas, palos de madera, huesos, para contar el número de personas,
animales o ciertas cosas. Desde que surgen los primeros estados (Babilonios (3000
a.C.), Egipcios (2200 a. C.)), se han recogido datos sobre sus habitantes con el
objetivo principal de recaudar impuestos y tributos, y reclutar a jóvenes para el
ejército.
Durante los siglos XVII y XVIII los estados europeos comienzan a realizar censos
de población y a recopilar de manera sistemática datos demográficos, sociales y
económicos. Por tanto, hasta el siglo XIX, la Estadística es una ciencia descriptiva
que utiliza medias y gráficos para sintetizar datos sociales y económicos. La
necesidad de estimar cantidades desconocidas a partir de muestras va
transformando paulatinamente la disciplina en una ciencia normativa para extraer
conclusiones de los datos, prever la evolución de las variables y guiar la toma de
decisiones en ambiente de incertidumbre; esta transformación es posible por la
incorporación del concepto de probabilidad.
1
1. Estadística descriptiva
Es la rama de las Matemáticas que recolecta, presenta y caracteriza un conjunto de
datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela,
temperatura en los meses de verano, etc.) con el fin de describir apropiadamente
las diversas características de ese conjunto.
Variables
Una variable estadística es el conjunto de valores que puede tomar cierta
característica de la población sobre la que se realiza el estudio estadístico y sobre
la que es posible su medición. Estas variables pueden ser: la edad, el peso, las
notas de un examen, los ingresos mensuales, las horas de sueño de un paciente en
una semana, el precio medio del alquiler en las viviendas de un barrio de una ciudad,
etc.
• Cualitativa (o categórica): son las variables que pueden tomar como valores
cualidades o categorías.
Ejemplos:
✓ Sexo (hombre, mujer)
✓ Salud (buena, regular, mala)
• Cuantitativas (o numérica): variables que toman valores numéricos.
Ejemplos:
✓ Número de casas (1, 2,…). Discreta.
✓ Edad (12.5, 24.3, 35;…). Continua.
2
Las variables cualitativas (o variables categóricas) se pueden clasificar según
sigan una jerarquía o un orden determinado.
3
si se estudia el precio de la vivienda en una ciudad, la población será el total
de las viviendas de dicha ciudad.
• Muestra: subconjunto que seleccionado de una población. Por ejemplo, si se
estudia el precio de la vivienda de una ciudad, lo normal será no recoger
información sobre todas las viviendas de la ciudad.
4
Estos datos al distribuirse en tabla de frecuencia donde cada dato mantiene su
propia identidad después que la distribución de frecuencia se ha elaborado.
10 12 13 13 13 13 13 14 15 15 16 16 17 17 18 18 18 20 20 20
Edad Frecuencia
10 1
11 0
12 1
13 5
14 1
15 2
16 2
17 2
18 3
19 0
20 3
Total 20
Los datos agrupados son como lo indica su nombre, una cantidad dada de datos
que puede clasificarse, ya sea por sus cualidades cualitativas o cuantitativas, y por
tal agruparse para su análisis.
Estos datos por lo general son agruparles cuando su población cuenta con alrededor
de 20 o más elementos que comparten una característica y caben dentro de una
categorización (repeticiones de un valor), pues permite un mejor manejo y análisis
más profundo de los mismos. Porque al emplear este método podemos manejarlos
por clases (una clase es una categoría en la que se agrupan los datos).
5
Por lo cual pueden organizarse o clasificarse de dos formas:
Los datos agrupados en frecuencia son los que se distribuyen u organizan en una
tabla de frecuencia (La frecuencia es igual al número de veces en que se repite
cada valor en una serie de datos.), así, Por medio de ella, es fácil identificar la
cantidad de respuestas repetidas.
Los datos agrupados por intervalos son los que se organizan dentro de un rango
y se delimita su amplitud por límites establecidos. Así, por medio de esta, es fácil
identificar la cantidad de elementos en un determinado rango de valores.
Ejemplo:
Estaturas de 40 alumnos.
6
Clases
Este resultado indica que el ancho de cada clase deberá ser de 8 cm. Sin
embargo, siempre que sea posible resulta práctico usar números que sean
múltiplos de 5 por ello, en nuestro caso elegiremos un ancho de clase de 10
cm. Si esto no es posible, elige un número que resulte conveniente para
lograr que todos los datos sean cubiertos por las clases.
• Límites de clases. Una vez que hemos definido el número de clases y su
ancho, podemos empezar a construir la tabla con la distribución de
frecuencias. tendremos tantos renglones como clases y una que indique los
7
valores que componen cada intervalo. Podemos también colocar dos
columnas adicionales: una que indique específicamente cuál es el límite
inferior y otra para el límite superior. Para establecer los límites de cada
intervalo observamos el valor del dato mínimo que es 1.51 cm y damos un
pequeño margen previo por lo que elegimos como inicio del primer intervalo
1.45 m, y como el ancho es de 10 cm, este intervalo abarcará de 1.45 a 1.54
m, el segundo abarcará de 1.55 m a 1.64 m y así sucesivamente.
8
los datos. Colocamos esta información en una columna adicional en la tabla.
Al terminar, es importante sumar todas las frecuencias para verificar que el
total sea igual al número de datos.
• Cálculo de la frecuencia relativa y de la frecuencia relativa acumulada.
Agregamos dos nuevas columnas, una con la frecuencia relativa que se
obtiene al dividir la frecuencia absoluta entre el total de los datos y redondear
3/40 = 0.08; 11/40 = 0.28; etc.
Después, multiplicamos por 100 para obtener porcentajes y así la
presentamos en la tabla 0.08 × 100 = 8%; 0.28 × 100 = 28%, etc. En cada
renglón se calcula de la misma manera.
Para obtener la frecuencia relativa acumulada, vamos a ir sumando cada una
de las celdas de frecuencia relativa con la anterior -salvo la primera- en este
ejemplo tenemos para la primera celda 8%, para la segunda sumamos 8% +
28% = 36%, la siguiente celda será 36% + 23% = 59% y así sucesivamente,
en la última clase debes asegurarte de tener 100%.
9
6 1.95- 1.995 1 40 3% 100%
2.04
Suma 40 100%
Son medidas estadísticas que se usan para describir cómo se puede resumir la
localización de los datos. Ubican e identifican el punto alrededor del cual se centran
los datos. Las más utilizadas son: la media, la mediana y la moda.
10
A diferencia de las dos medidas anteriores, la moda se puede usar con datos
cualitativos.
Ejemplo:
24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20
18, 18, 19, 19, 19, 20, 20, 21, 21, 22, 22, 22, 23, 23, 24, 25, 27, 27, 27, 29
Como es un número par de datos, se toman los dos datos centrales, resaltados en
negrita, y se promedian. Debido a que ambos son 22, la mediana es de 22 años.
Por último, la moda es el dato que más se repite o aquel cuya frecuencia es mayor,
siendo este 22 años.
11
• MEDIANA: Cuando los datos se encuentran agrupados en una distribución
de frecuencia no se conocen los datos originales, por lo tanto, es necesario
estimar la mediana mediante los siguientes pasos:
✓ Calcular el valor
✓ Localizar el intervalo de clase donde se encuentra la mediana
(intervalo mediano). Esto se hace encontrando el primer intervalo de
Donde:
= Límite inferior de la clase de donde se encuentra la mediana.
N= Total de frecuencias.
= Frecuencia acumulada anterior a la clase mediana.
= Frecuencia del intervalo mediano.
= amplitud del intervalo de clase.
• MODA: Es el valor que representa la mayor frecuencia absoluta. En tablas
de frecuencias con datos agrupados, se habla de intervalo modal.
Si todos los intervalos tienen la misma amplitud, la moda se calcula por
medio de:
Donde:
= Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia
absoluta).
= Frecuencia absoluta del intervalo modal.
= Frecuencia absoluta del intervalo anterior al modal.
= Frecuencia absoluta del intervalo posterior al modal.
= Amplitud de los intervalos.
12
Ejemplo:
13
Ejemplo:
119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124,
112, 112, 106
106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 112, 119, 119,
124, 124, 124
Y los pondremos en una tabla como sigue, para facilitar los cálculos. La segunda
columna titulada “Acumulado” es la suma del dato correspondiente más el anterior.
X = 112.9
14
La mediana es el promedio de los datos centrales resaltados en rojo: el número 10
y el número 11. Como son iguales, la mediana es 112.
Por último, la moda es el valor que más se repite y es 112, con 7 repeticiones.
124-106 = 18.
s = 668.6/20 = 33.42
sc=668.6/19 = 35.2
15
el eje vertical (y). Las marcas de los cuadrantes en los ejes marcan las
unidades de medida; las escalas en los ejes pueden ser lineales, logarítmicas
o ambas. Cuando los datos se relacionan entre sí, es decir, cuando podemos
decir que existe cierta continuidad entre las observaciones (como por ejemplo
el crecimiento poblacional, la evolución del peso o estatura de una persona
a través del tiempo, el desempeño académico de un estudiante a lo largo de
su instrucción escolar, las variaciones presentadas en la medición realizada
en algún experimento cada segundo o minuto) se pueden utilizar las gráficas
de líneas, que consisten en una serie de puntos trazados en las
intersecciones de las marcas de clase y las frecuencias de cada una,
uniéndose consecutivamente con líneas.
Ejemplo:
Aquí se muestra el comportamiento de los promedios escolares finales de
dos alumnos (Daniel y Blanca) a lo largo de cinco observaciones anuales:
16
Ejemplo: El siguiente polígono de frecuencias muestra los goles anotados
por un delantero en un equipo de fútbol en las temporadas de 2000 a 2007:
17
✓ Caso 2. Para la ojiva menor que, el extremo derecho no se “amarra”
al eje x.
Ejemplo: Se tomaron las estaturas de 50 estudiantes en un grupo del
plantel 8 de la ENP y se agruparon por intervalos de 5 centímetros,
iniciando en 1.45m y terminando en 1.90m. Se obtuvo la frecuencia
acumulada hasta el intervalo de clase menor de 1.90m. De la gráfica
de ojiva menor puede verse que el 90% de los estudiantes miden
menos de 1.80 metros.
18
histogramas no muestran frecuencias acumuladas, son preferibles para el
tratamiento de datos cuantitativos y la barra con mayor altura representa la mayor
frecuencia. La sumatoria de las alturas de las columnas equivale al 100% de los
datos.
19
• Barras horizontales: Se parecen mucho a las gráficas de columnas, con la
salvedad importante de que la función de los ejes se intercambia y el eje
horizontal queda destinado a las frecuencias y el eje vertical a las clases.
Es muy común que este tipo de gráficos se utilicen para ilustrar el tamaño de
una población dividida en estratos como, por ejemplo, son sus edades.
Ejemplo: La siguiente gráfica presenta la distribución de las edades de los
236 niños que estudian en una escuela primaria:
20
Ejemplo: La gráfica siguiente muestra el comportamiento de los minutos de
retraso que acumularon tres trabajadores de una tienda durante cuatro
semanas. Las series están coloreadas con diferente color para mostrar el
comportamiento tanto individual, como de cada uno de los trabajadores con
respecto a los demás.
21
1.6.3. GRÁFICAS CIRCULARES.
Este tipo de gráficas es muy útil cuando lo que se desea es resaltar las proporciones
que representan algunos subconjuntos con respecto al total, es decir, cuando se
está usando una escala categórica.
Ejemplo:
22
1.6.4. GRÁFICAS DE DISPERSIÓN.
Una gráfica de dispersión tiene dos ejes de valores, mostrando un conjunto de datos
numéricos en el eje x y otro en el eje y. Combina estos valores en puntos de datos
únicos y los muestra en intervalos uniformes o agrupaciones. Los gráficos de
dispersión se utilizan normalmente para mostrar y comparar valores numéricos,
como datos científicos, estadísticos y de ingeniería. Este tipo de gráficas se usan
cuando:
23
1.6.5. GRÁFICAS DE BURBUJAS.
Un tipo de gráfico similar a las gráficas de dispersión son las gráficas de burbujas,
en las cuales se presenta la dispersión de las observaciones de la misma forma
pero se le añade la posibilidad de visualizar otra variable representada en el tamaño
del punto, pues éstos se convierten en círculos (burbujas) con radios proporcionales
a las magnitudes que representan.
24
1.6.6. PICTOGRAMAS.
Son gráficos con dibujos alusivos al carácter que se está estudiando y cuyo tamaño
es proporcional a las frecuencias que representan. Se emplean para representar
diferencias cuantitativas simples entre grupos. Los símbolos utilizados para
representar valores idénticos deben ser de igual dimensión.
1.7. Conjuntos.
25
todos sus elementos. A los objetos que lo componen se les llama elementos del
conjunto.
1.7.1. NOTACIÓN
Un conjunto se denota con una letra mayúscula A, B, C y el elemento por una letra
minúscula a, b.
A los elementos se les encierra entre llaves ( {} ) y se separan por comas ( , ).
Ejemplos:
• El conjunto D cuyos elementos son los números que aparecen al lanzar
un dado. D = {1, 2, 3, 4, 5, 6}
• El conjunto de días de la semana. S = {Lunes, Martes, Miércoles, Jueves,
Viernes, Sábado, Domingo}
• El conjunto de las vocales. V = {a, e, i, o, u}
• El conjunto de los enteros positivos menores que 10. P = {1, 2, 3, 4, 5, 6, 7,
8, 9}
26
✓ El conjunto de los números reales entre 2 y 5.
• Conjunto universal: Es el conjunto de todos los elementos considerados en
un problema o situación dada.
Ejemplos:
✓ Si solo se desea trabajar con los números reales positivos, el conjunto
universal será U = R+ = (0, +∞)
✓ Si se quiere trabajar con los números que aparecen en un dado, el
conjunto universal será U = {1, 2, 3, 4, 5, 6}
• Conjunto vacío: Un conjunto que no tiene elementos y se denota por ∅ ó { }
Ejemplos:
✓ El conjunto A = {x ∈ ! / !!+ 1 = 0} es un conjunto vacío porque no hay
ningún número real que satisfaga !!+ 1 = 0.
✓ El conjunto de los meses del año con 27 días.
27
1.7.4. OPERACIONES DE CONJUNTOS
28
Conclusión
29
Bibliografía
Devore. (2012). Probability and Statistics for Engineering and Science. 8th. Edition.
30
Universidad Nacional Autonoma de Mexico. (s.f.). Obtenido de
http://prepa8.unam.mx/academia/colegios/matematicas/paginacolmate/appl
ets/matematicas_V/Applets_Geogebra/medmedmod.html#:~:text=MEDIDA
S%20DE%20TENDENCIA%20CENTRAL%20PARA,la%20mediana%20y%
20la%20moda.
31