Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GRADO Y GRUPO:
3 “A” Matutino
MATERIA:
PIVA 2
PROFESOR:
Roberto Fernández Ulin.
La estadística es una poderosa herramienta que nos permite dar sentido y significado a
los datos que nos rodean en un mundo cada vez más orientado hacia la recopilación
masiva de información. Ya sea en la toma de decisiones empresariales, la investigación
científica, la planificación gubernamental o la comprensión de patrones sociales, la
estadística se ha convertido en un pilar fundamental en nuestra búsqueda de
conocimiento y comprensión.
Para dictar las afirmaciones anteriores, sobre mucho, poco, alto, bajo, muy variable o
poco variable necesitamos variables de medidas. Esto es, necesitamos cuantificarlas,
ofrecer un número. Con esto en mente, podríamos utilizar los gramos o los kilogramos
como unidad de medida para saber el peso de tantas cajas de tomates como
consideremos. Una vez pesemos treinta cajas, sabremos cuales pesan más, cuales
pesan menos, que cuantía es la que más se repite o si existe mucha disparidad entre los
pesos de las diferentes cajas.
Con esta idea nace la estadística descriptiva, con la de recoger datos, almacenarlos,
realizar tablas o incluso gráficos que nos ofrezcan información sobre un determinado
asunto. Adicionalmente, nos ofrecen medidas que resumen la información de una gran
cantidad de datos.
Teniendo claro a lo que nos referimos con el concepto de inferir, una de las dudas
fundamentales recae en el hecho de elegir una muestra en lugar de una población.
También podríamos, por ejemplo, decir que el beneficio de una empresa ha sido de
22.300 dólares el último año. En este caso, la variable sería el beneficio y estaría medido
en dólares. Ambas variables son del tipo cuantitativo (se expresan con un número)
Claro que no todas las variables estadísticas son iguales y, por supuesto, no todas se
pueden (en principio) expresar en forma de número. Así, otra variable que podríamos
encontrarnos es el color de ojos de una persona. Por ejemplo, Juan tiene los ojos verdes
y Andrés los tiene azules. La variable sería el color de ojos y sería una variable cualitativa.
Es decir, no se expresa con número.
En estadística, los datos cualitativos son un tipo de datos que representan cualidades o
características. Es decir, los datos cualitativos no son cuantitativos (o numéricos), sino
que solo pueden tomar el valor de una cualidad o una característica. Por ejemplo, el
género de un grupo de personas son datos cualitativos porque solo pueden ser palabras
(hombre o mujer), pero no tienen valores numéricos.
En estadística, los datos cuantitativos son datos numéricos. Es decir, los datos
cuantitativos son un tipo de datos que están formados únicamente por números.
Por ejemplo, la estatura de un grupo de personas son datos cuantitativos porque todos
los valores son números (1,75 m, 1,63 m, 1,89 m…).
Los datos cuantitativos también se llaman datos numéricos, ya que todos sus valores son
números.
os datos cuantitativos consisten en cualquier información cuantificable que pueda
utilizarse para realizar cálculos matemáticos y análisis estadísticos, de forma que puedan
tomarse decisiones en la vida real basadas en estas derivaciones matemáticas.
Todo lo que se puede medir y contar, decimos que se puede cuantificar. El concepto
“datos cuantitativos” hace referencia precisamente a eso, a la información tangible, la que
es obtenida mediante algún método de investigación.
La manera de cuantificar los datos obtenidos en nuestro estudio nos dará la pauta de
hacia qué rumbo dirigirse, de ahí la importancia de su correcto análisis para poder
demostrar si estamos en lo correcto o no, en la hipótesis planteada.
En la actualidad las encuestas online son la mejor solución para la obtención de datos
cuantitativos, ya que así puedes llegar a más personas en menos tiempo y además,
asegurar resultados más honestos para un posterior análisis.
Cuantitativos discretos
Una variable discreta es aquella que puede asumir un número contable de valores.
Mientras que una variable continua es aquella que puede asumir un número incontable
de valores. Tanto las variables discretas, como las continuas, son variables estadísticas
cuantitativas.
Los datos discretos son aquellos que sólo pueden tomar valores determinados. Se trata
de datos que se pueden contar y que tienen un número limitado de valores. Suelen
presentarse en forma de números enteros.
Que son datos que no se pueden dividir; es distinto y solo puede ocurrir en ciertos valores.
Por ejemplo, los instrumentos y los cupcakes son datos discretos en este escenario
porque Madison no puede comprar la mitad de un instrumento ni vender la mitad de un
cup cake. El valor de los cupcakes y los instrumentos son valores distintos.
Cuantitativos continuos
Los datos continuos son datos que se pueden dividir infinitamente; no tiene ninguna
distinción de valor. La cantidad de tiempo que se tarda en vender los cupcakes es un
ejemplo de datos continuos. Puede recordar esto recordando que el tiempo en sí es
continuo y sin fin. Además, puede dividir el tiempo infinitamente. Hay siglos, décadas,
años, meses, semanas, días, horas, minutos, segundos, milisegundos, microsegundos,
nanosegundos, etc.
Ejemplos:
Medir la altura de una persona. Puedes medir la altura en metros, centímetros y hasta
dar una medida en milímetros, es decir, los datos son continuos.
Edad (puedes definir una edad en años, meses y hasta días)
Para facilitar el análisis de datos cuantitativos, en ocasiones algunos expertos en
investigación deciden, ya sea por iniciativa o por convención, agrupar los datos en
categorías según sus valores, por lo que podrán ser encontrados dentro de ciertos
rangos, o bajo un umbral determinado.
Población Infinita
Datos cualitativos: Pues bien, estos datos son los relativos a las "cualidades", este tipo
de información relacionada con los adjetivos. Por ejemplo, si te pidieran que describieras
tu más reciente experiencia de compra en un importante punto de venta, es posible utilizar
los términos rápido, práctico, agradable, caro o inútil. Todos estos son ejemplos de la
información cualitativa.
Tipos de muestreo
Se dividen en dos grupos, el probabilístico y el no probabilístico.
Muestreo probabilístico
Es el método más recomendable si se está haciendo una investigación cuantitativa
porque todos los componentes de la población tienen la misma posibilidad de ser
seleccionados para la muestra. Se divide en:
Este procedimiento se realiza a través del cálculo del intervalo que regirá la selección de
los componentes de la muestra
Por ejemplo, si la población son 500 personas(N), la muestra 100(m): N/m realizamos la
división reemplazando la fórmula 500/100 es igual a 5; este número será el intervalo para
la selección de cada unidad muestral.
Este tipo de muestreo se usa en particular cuando no se dispone de una lista detallada y
enumerada de cada una de las unidades que conforman la población y resulta muy
complejo elaborarla. Se denomina conglomerado porque la población es agrupada en
conjuntos, manzanos, bloques, áreas, zonas, etc. No es lo mismo que el estratificado
porque en este procedimiento se agrupa según las variables a estudiar y se puede
identificar exactamente a la población.
En este tipo de muestreo, todas las unidades que componen la población no tienen la
misma posibilidad de ser seleccionada "también es conocido como muestreo por
conveniencia, no es aleatorio, razón por la que se desconoce la probabilidad de selección
de cada unidad o elemento de la población". (PINEDA et al 1994: 119) Se dividen en tres
grupos:
datos agrupados
En estadística, los datos agrupados son aquellos datos que se agrupan en intervalos. Es
decir, los datos agrupados son datos que se juntan en intervalos para poder estudiarlos
de manera conjunta.
Datos no agrupados
Los datos no agrupados son aquellos que no han recibido ningún tratamiento o
clasificación luego de ser recolectados. Es decir, no se ha separado a los datos por
grupos bajo ningún criterio.
En simple, los datos no agrupados son los que se presentan tal cual han sido recogidos,
mostrándose el listado de la información obtenida.
Por ejemplo, el intervalo [30,35) es una clase en la que se agrupan todos los valores
desde el 30 (incluido) hasta el 35 (no incluido). Por lo tanto, en estadística las clases son
los grupos en los que se divide un conjunto de datos.
Límites de la clase
Los límites de la clase son los valores que delimitan el grupo, es decir, son el valor mínimo
y el valor máximo que forman el intervalo de la clase. Por lo tanto, cualquier clase posee
un límite inferior y un límite superior. Por ejemplo, la clase [40,50) tiene como límite inferior
y límite superior 40 y 50 respectivamente.
En general, el límite inferior se incluye en la clase, mientras que el límite superior no
pertenece a la clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior y el límite inferior de la
clase. Así que la amplitud de una clase se calcula restando el límite superior menos el
límite inferior.
Marca de la clase
La marca de la clase es el punto medio del los límites de la clase. De modo que para
sacar la marca de clase se deben sumar sus dos límites y luego dividir entre dos.
Por ejemplo, la marca del intervalo de clase [40,50) es 45, pues es el punto que está
entremedio de sus dos límites.
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un valor en un conjunto de
datos. Es decir, la frecuencia absoluta es la cantidad de veces que se repite un resultado.
Por ejemplo, si en una encuesta se pregunta a varios individuos cuál es su color favorito
y cuatro personas han contestado el color verde, significa que la frecuencia absoluta del
color verde es 4.
Por lo tanto, la suma de las frecuencias absolutas de todos los valores es igual al número
total de datos de la muestra estadística.
Frecuencia relativa
La frecuencia relativa es una medida que indica el número de veces que aparece un valor
en una muestra de datos en forma de proporción o porcentaje. En concreto, la frecuencia
relativa es igual a la frecuencia absoluta dividido por el número total de datos.
.La frecuencia relativa es igual a la frecuencia absoluta partido por el número total de
datos, por lo tanto, para calcular la frecuencia relativa primero se debe hallar la frecuencia
absoluta y luego dividir entre el número total de observaciones.
Donde:
F: es la frecuencia absoluta.
1.Construir una tabla de frecuencias con todos los valores diferentes de la muestra
estadística.
3.A partir de las frecuencias absolutas, determinar la frecuencia relativa de cada valor.
Hallar la frecuencia relativa acumulada de cada valor, que se calcula sumando la
frecuencia relativa del propio valor más las frecuencias relativas de todos los valores
menores.
Frecuencia porcentual
Por ejemplo, si en una muestra de 50 datos un valor está repetido 10 veces, la frecuencia
porcentual de dicho valor es del 20% (10/50=0,2→20%).
Construir una tabla de frecuencias con todos los valores diferentes de la muestra
estadística.
2.A partir de las frecuencias absolutas, determinar la frecuencia relativa de cada valor.
Los histogramas sirven para representar gráficamente variables continuas, como por
ejemplo el peso de una muestra estadística. Además, un histograma permite visualizar
rápidamente la forma que tiene una distribución.
2.Representar los valores de las frecuencias de los intervalos en el eje vertical del
histograma.
3.Para cada intervalo, dibujar una barra rectangular con una altura equivalente a la
frecuencia del intervalo. Ten en cuenta que las barras de dos intervalos consecutivos
deben tocarse.
Para representar un histograma debemos seguir los pasos explicados arriba. Es decir,
primero dividimos el eje horizontal en partes equivalentes a los intervalos de los datos,
luego graduamos la escala del eje vertical y, finalmente, representamos cada intervalo
mediante una columna de altura igual a su frecuencia absoluta.
Polígono de frecuencias
Un polígono de frecuencias es un tipo de gráfico estadístico en el que se representa el
conjunto de datos mediante puntos y se unen con líneas.
1.Dibujar el eje horizontal y el eje vertical del polígono de frecuencias y hacer la escala
para luego poder representar los datos en el gráfico.
Por lo tanto, la ojiva sirve para saber el número de datos que se encuentran por debajo
de un valor determinado
Vista la definición de ojiva en estadística, vamos a ver cómo se hace este tipo de
diagrama.
2.Representar el eje horizontal y el eje vertical del gráfico. En general, el eje horizontal
corresponde a los límites de los intervalos y el eje vertical a las frecuencias acumuladas.
4.Unir los puntos consecutivos del gráfico mediante una línea para formar la ojiva.
Pareto
Un diagrama de Pareto es un ejemplo especial de diagrama de barras. En el diagrama
de Pareto las barras se ordenan por conteos de frecuencia, del más alto al más bajo.
Estos diagramas se usan a menudo para identificar áreas en las que centrarse primero
en mejora de procesos.
Los diagramas de Pareto reflejan los conteos ordenados de frecuencia de valores de los
distintos niveles de una variable categórica o nominal. Estos diagramas se basan en la
regla del 80/20. Esta regla sostiene que aproximadamente el 80 % de los problemas se
derivan del 20 % de las causas. Esta regla también se conoce como del «puñado esencial
y la multitud trivial». De nuevo, la idea es que podemos centrarnos en unas pocas causas
fundamentales en la raíz de los problemas e ignorar muchas otras triviales. La figura 1 es
un ejemplo de diagrama de Pareto.
Pastel
Una gráfica de pastel o gráfica circular es un tipo de representación para el análisis de datos
estadísticos. Tiene la forma de un disco dividido en sectores, cuyas áreas son proporcionales a
los porcentajes de los distintos componentes de la población estadística.
Cada valor del carácter estudiado corresponde a un sector. Las medidas de los ángulos de los
sectores son proporcionales a los números representados (o a las frecuencias asociadas). La
representación de números negativos es imposible con este tipo de diagrama.
El nombre de esta gráfica se lo da su aspecto: Un pastel circular que ha sido cortado en varias
rebanadas.
Los gráficos circulares son una buena forma de mostrar gráficamente una distribución de
frecuencias. En un gráfico circular, la frecuencia o el porcentaje se representa tanto visual como
numéricamente, por lo que suele ser rápida de entender para los lectores.
Usa una gráfica de pastel o circular si tu audiencia tiene una idea general de la relación de las
partes y el todo de los datos y no es tan importante comparar los tamaños de las rebanadas.
También puedes usar una gráfica circular para transmitir que un segmento del total es
relativamente pequeño o grande
Barras
3.Representar en cada valor del eje X una barra vertical con una altura de su
frecuencia.
Ten en cuenta que las barras deben tener todas el mismo ancho y el mismo espacio de
separación entre ellas.
Tallo y Hoja
En un diagrama de tallo y hoja cada dato está separado por la hoja, que es su último
dígito, y el tallo, que son las cifras restantes. De modo que en un diagrama de tallo y hoja
se pone cada hoja en la línea de su tallo correspondiente.
Para hacer un diagrama de tallo y hoja se deben seguir los siguientes pasos:
2.Si es necesario, redondear los números hasta que tengan el número de cifras
deseadas
.
3.Decidir en qué cifra se hará el corte entre el tallo y la hoja, es decir, determinar
cuántas cifras serán las hojas. Normalmente, se hace que la hoja sea solamente el
último dígito de cada dato.
La distribución de frecuencias de los datos del ejemplo muestra que la actitud mayoritaria
de los individuos del grupo estudiado es indiferente.
Generalmente las tablas incluyen varías columnas con las frecuencias relativas (son el
número de ocurrencias dividido por el total de datos, y se simbolizan “fr” o “p i “),
frecuencias acumuladas (la frecuencia acumulada es el total de frecuencias de los
valores iguales o inferiores al de referencia, y se simbolizan “f a ” o “n a “. No obstante la
frecuencia acumulada también es definida incluyendo al valor de referencia), frecuencias
acumuladas relativas (la frecuencia acumulada relativa es el total de frecuencias relativas
de los valores iguales o inferiores al de referencia, y se simbolizan “f r ” o “p a “)
Medidas de tendencia central, localización y dispersión
Tendencia central
Media
es el promedio de todos los datos de la muestra. Para calcular la media se deben sumar
todos los valores y luego dividir entre el número total de datos. Por lo tanto, la fórmula de
la media es la siguiente:
Ejemplo:
Un alumno ha sacado las siguientes notas en un curso escolar: en matemáticas un 9, en
lengua un 7, en historia un 6, en economía un 8 y en ciencia un 7,5. ¿Cuál es la media
de todas sus notas?
Para hallar la media aritmética tenemos que sumar todas las notas y luego dividir entre
el número total de asignaturas del curso, que es 5. Por lo tanto, aplicamos la fórmula de
la media aritmética:
Mediana
es el valor del medio de todos los datos ordenados de menor a mayor. La mediana es el
valor del medio de todos los datos ordenados de menor a mayor. Es decir, la mediana
divide todo el conjunto de datos ordenados en dos partes iguales.
Si el número total de datos es impar, la mediana será el valor que está justo en el medio
de los datos. Es decir, el valor que está en la posición (n+1)/2 de los datos ordenados.
Si el número total de datos es par, la mediana será la media de los dos datos que están
en el centro. Esto es, la media aritmética de los valores que están en la posiciones n/2 y
n/2+1 de los datos ordenados
Ejemplo de la mediana
Lo primero que debemos hacer antes de realizar ningún cálculo es ordenar los datos, por
lo que ponemos los números de menor a mayor.
1\2\3\4\4\4\5\6\7\8\8
En este caso tenemos 11 observaciones, así que el número total de datos es impar. Por
lo tanto, aplicamos la siguiente fórmula para calcular la posición de la mediana:
De manera que la mediana será aquel dato que está en la sexta posición, que en este
caso corresponde al valor 4
Moda
es el valor que más se repite del conjunto de datos. En estadística, la moda es el valor
del conjunto de datos que tiene una mayor frecuencia absoluta, es decir, la moda es el
valor que más se repite de un conjunto de datos.
Por lo tanto, para calcular la moda de un conjunto de datos estadísticos basta con
contar el número de veces que aparece cada dato en la muestra, y el dato más repetido
será la moda.
Se pueden distinguir tres tipos de modas según el número de valores que están más
repetidos:
Moda unimodal: solo hay un valor con el máximo número de repeticiones. Por ejemplo,
[1, 4, 2, 4, 5, 3].
Moda multimodal: tres o más valores tienen el mismo número máximo de repeticiones.
Por ejemplo, [3, 3, 4, 1, 3, 4, 2, 1, 4, 5, 2, 1].
Ejemplo de la moda:
¿Cuál es la moda del siguiente conjunto de datos?
5\4\9\7\2\3\9\6\5\2\5
Los números están desordenados, así que primero que haremos será ordenarlos. Este
paso no es obligatorio, pero te ayudará a encontrar la moda más fácilmente.
2\2\3\4\5\5\5\6\7\9\9
Los números 2 y 9 aparecen dos veces, pero el número 5 está repetido tres veces. Por
lo tanto, la moda de la serie de datos es el número 5.
Mo=5
Localización
Podemos decir que los Cuantiles son unas medidas de posición que dividen a la
distribución en un cierto número de partes de manera que en cada una de ellas
hay el mismo de valores de la variable.
Existe un valor en cual coinciden los cuartiles, los deciles y percentiles es cuando
son iguales a la Mediana y así veremos:
Cuartiles
Cuartiles: Los cuartiles son los tres valores que dividen al conjunto de datos
ordenados en cuatro partes porcentualmente iguales.
El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de
los datos, es decir aquel valor de la variable que supera al 75% y es superado
por el 25% de las observaciones.
Deciles
Deciles: Los deciles son ciertos números que dividen la sucesión de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de
datos ordenados en diez partes iguales, son también un caso particular de los percentiles,
ya que podemos definir Decil como “percentil cuyo valor que indica su proporción es un
múltiplo de diez. Percentil 10 es el primer decil, percentil 20 el segundo decil, etc”.
El primer decil D1: indica que sólo existe un 10% de probabilidad de que el valor de la
variable esté por debajo de esa cifra.
Quinto decil D5 o denominado también “Caso Base”: indica que existe igualmente un 50%
de probabilidad de que el valor esté por encima como por debajo de esa cifra. Representa
la Mediana de la distribución.
Percentiles
Los percentiles son, tal vez, las medidas más utilizadas
para propósitos de ubicación o clasificación de las personas cuando atienden
características tales como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados
en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en
cien partes iguales el conjunto de datos ordenados. Sencillamente Percentil es el
valor del recorrido de una variable, bajo el cual se encuentra una proporción
determinada de la población.
percentil:
Dispersión
Medidas de dispersión
Rango
Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor
más elevado y el valor más bajo.
El rango indica la longitud del intervalo en el que se hallan todos los datos de la
distribución. El rango es una medida de dispersión importante, aunque insuficiente para
valorar convenientemente la variabilidad de los datos.
Ejemplo.
Calcular el rango de las siguientes edades (en años) de alumnos del grupo 470-A de la
prepa 8 de la UNAM que son de excelencia académica: y . 18
Solución.
Desviación estándar
La desviación estándar es la medida de dispersión más común, que indica qué tan
dispersos están los datos con respecto a la media. Mientras mayor sea la desviación
estándar, mayor será la dispersión de los datos. Se denota por medio de s.
Una desviación estándar grande indica que los puntos están lejos de la media, y una
desviación pequeña indica que los datos están agrupados cerca de la media.
Ejemplo.
Este valor se interpreta como que la media de las diferencias cuadráticas de los
siete datos con respecto a su media aritmética es alta, esto significa que las edades son
muy dispersas.
Desviación media
La desviación media es una medida que se utiliza para entender qué tanto se alejan los datos
de un conjunto promedio.
Es una medida que nos ayuda a entender cuánto varían los datos de un conjunto promedio. Si
la desviación es grande, significa que los datos están muy dispersos o variados, mientras que si
es pequeña, significa que los datos están muy cercanos entre sí.
Conclusión
La estadística es una disciplina matemática que desempeña un papel fundamental en la
comprensión y el análisis de datos en una amplia variedad de campos, desde la
investigación científica hasta la toma de decisiones empresariales y la planificación
gubernamental. A lo largo de esta investigación, hemos explorado en detalle los
conceptos, fórmulas y procesos de cálculo que constituyen los cimientos de esta ciencia.
Una vez que comprendimos cómo recopilar datos adecuadamente, avanzamos hacia la
creación de distribuciones de frecuencias y su representación gráfica. Aprendimos a
organizar datos en clases, calcular límites de clase, amplitudes y marcas de clase, y cómo
calcular las frecuencias absolutas, relativas, relativas porcentuales y acumuladas para
obtener una visión completa de la distribución de datos.
Exploramos las medidas de tendencia central, localización y dispersión, que nos permiten
comprender mejor la tendencia central de los datos, su dispersión y su posición relativa.
Estas medidas, como la media, la mediana y la desviación estándar, se han revelado
como herramientas esenciales para analizar y resumir datos de manera significativa.
Estos conocimientos no solo son valiosos para los estadísticos y analistas de datos, sino
que también son esenciales para cualquier persona que desee tomar decisiones
informadas basadas en la información cuantitativa. La estadística nos brinda las
herramientas necesarias para explorar y entender el mundo que nos rodea, y su
aplicación se extiende a prácticamente todos los campos de la vida moderna.
Esperamos que esta investigación haya servido como una guía exhaustiva y práctica para
aquellos que buscan comprender y aplicar los principios estadísticos en sus respectivos
campos y proyectos, y que inspire una mayor exploración y aplicación
de esta poderosa disciplina.
Fuentes bibliográficas
Ortega, C. (2023, April 8). Desviación media: Qué es, fórmula y cómo calcularla.
QuestionPro. https://www.questionpro.com/blog/es/desviacion-media/
Ortega, C. (2023, April 8). Desviación media: Qué es, fórmula y cómo calcularla.
QuestionPro. https://www.questionpro.com/blog/es/desviacion-media/
Ortega, C. (2022, 19 abril). Gráfica de pastel: qué es, características y cuándo utilizarla.
https://tudashboard.com/grafica-de-pastel/