MODULO I
PONDERACION 20%
CONCEPTOS BASICOS, TABULACIONES Y PRESENTACION DE DATOS
OBJ 01-02
La estadística consiste en métodos, procedimientos y fórmulas que permiten recolectar
información para luego analizarla y extraer de ella conclusiones relevantes. Se puede
decir que es la Ciencia de los Datos y que su principal objetivo es mejorar la comprensión
de los hechos a partir de la información disponible.
El origen de la palabra estadística se suele atribuir al economista Gottfried Achenwall
(prusiano, 1719-1772) que entendía la estadística como “ciencia de las cosas que
pertenecen al Estado”.
¿Para qué sirve la estadística?
En general, la estadística se utiliza para analizar los datos de uno o varios bloques de
información, procesarlos matemáticamente, y obtener resultados para realizar distintas
acciones de acuerdo a los mismos. Se pueden destacar dos funciones:
Descripción de los datos: esta función se refiere a la representación de unos
resultados de manera gráfica, facilitando su comprensión.
Procesamiento de los datos: convierte el análisis teórico de los datos en un
elemento práctico a la hora de proponer acciones que pueden ser puestas en
ejecución en la realidad.
En el ámbito empresarial, se utiliza para obtener un amplio panorama de la situación
actual de los procesos que se estén llevando a cabo, de manera que se puedan realizar
cambios a partir de la administración de los mismos. Además, permite descubrir las
relaciones de causa y efecto entre los distintos componentes de un proceso productivo
o financiero y, en la ejecución del mismo, reconocer anormalidades y fluctuaciones.
Origen e historia de la estadística
La historia de la estadística data desde antes del 3.000 antes de Cristo. Nace con el
objetivo de recolectar información que necesitaba el Estado, por ejemplo, sobre la
agricultura y el comercio.
En la antigua Asiria y en Egipto se tiene evidencia de la recolección de datos estadísticos.
Asimismo, en Roma se recogían datos demográficos de los habitantes del imperio, como
aquellos de natalidad y mortalidad. Esto, con el propósito de tomar mejores decisiones
desde el gobierno.
Posteriormente, durante la Edad Media, la estadística no tuvo grandes avances. Sin
embargo, en la Edad Moderna se elaboraría el primer censo estadístico moderno y la
primera tabla de probabilidades de edades, ambos sucesos en el siglo XVII. Luego, hacia
el siglo XX, se comenzaron a incorporar herramientas matemáticas provenientes de la
teoría de la probabilidad a la estadística. Esto, principalmente por los aportes de
Kolmogorov y Borel.
Objetivos de la estadística
El principal objetivo de la estadística es recopilar datos y procesarlos para que la
información suministrada, a través de una investigación, se pueda aplicar en
soluciones, decisiones y otras acciones de manera práctica. Entre otros de sus
objetivos, se pueden mencionar:
Suministrar información para la toma de decisiones.
Reducir posibles desperdicios o gastos en distintos procesos.
Cuantificar un fenómeno para conocer su situación actual mediante la recolección
diaria, semanal o mensual de datos.
Verificar el cumplimiento de objetivos.
Cuantificar las características de un fenómeno obteniendo el promedio
determinando el comportamiento de una población.
Determinar la variabilidad que presenta un fenómeno a través del tiempo mediante
la observación continua sobre el mismo.
Determinar las causas que originan un fenómeno.
Comparar dos o más grupos de datos para determinar la existencia de una
relación entre dos o más características de una misma clase
Realizar pronósticos o proyecciones sobre el comportamiento de una población
determinada.
Extender las conclusiones obtenidas a partir del análisis de una muestra a toda
una población.
Facilitar la implementación de herramientas que determinan la validez y la
confiabilidad de los resultados.
Facilitar la interpretación y comprensión de los estudios.
Elementos de la estadística
A continuación se definen algunos de los elementos más empleados en estadística:
Población. Es el conjunto de todos los posibles elementos que intervienen en un
experimento o en un estudio. La hay de dos tipos
o Población finita. Es aquella que indica que es posible alcanzarse o
sobrepasarse al contar. Es aquella que posee o incluye un número limitado
de medidas y observaciones.
o Población infinita. Es infinita si se incluye un gran conjunto de medidas y
observaciones que no pueden alcanzarse en el conteo. Son poblaciones
infinitas porque hipotéticamente no existe límite en cuanto al número de
observaciones que cada uno de ellos puede generar.
Muestra. Un conjunto de medidas u observaciones tomadas a partir de una
población dada. Es un subconjunto de la población.
Muestra representativa. Un subconjunto representativo seleccionado de una
población de la cual se obtuvo.
Muestreo. Al estudio de la muestra representativa.
Censo. Al estudio completo de la población.
Parámetro. Lo constituyen las características medibles en una población
completa. Se le asigna un símbolo representado por una letra griega.
Estadístico o estadígrafo. Es la medida de una característica relativa a una
muestra. La mayoría de los estadísticos muestrales se encuentran por medio de
una fórmula y suelen asignárseles nombres simbólicos que son letras latinas.
Datos estadísticos (Variables). Los datos son agrupaciones de cualquier
número de observaciones relacionadas. Para que se considere un dato estadístico
debe tener 2 características: a) Que sean comparables entre sí. b) Que tengan
alguna relación.
Variable. Una característica que asume valores. Clases de datos:
o Variable cuantitativa o escalar. Será una variable cuando pueda asumir
sus resultados en medidas numéricas.
o Variable cuantitativa discreta. Es aquella que puede asumir solo ciertos
valores, números enteros. Ejemplo: El número de estudiantes (1,2,3,4)
o Variable cuantitativa continua. Es aquella que teóricamente puede tomar
cualquier valor en una escala de medidas, ya sea entero o fraccionario.
Ejemplo, Estatura: 1.90 m
o Variables cualitativas nominales. Cuando no es posible hacer medidas
numéricas, son susceptibles de clasificación. Ejemplo: Color de autos: rojo,
verde, azul.
Experimento. Es una actividad planificada, cuyos resultados producen un
conjunto de datos. Es el proceso mediante el cual una observación o medición es
registrada. Ejemplo: ¿Cuál será la preferencia del consumidor ante dos marcas
de refresco con similares características en un ambiente armónico y sin
publicidad?
TIPOS DE ESTADÍSTICA
Los tipos de estadística se puede subdividir en dos grandes ramas: descriptiva e
inferencial.
Estadística descriptiva: Se refiere a los métodos de recolección, organización, resumen
y presentación de un conjunto de datos. Se trata principalmente de describir las
características fundamentales de los datos y para ellos se suelen utilizar indicadores,
gráficos y tablas.
Ejemplo
Un docente de educación primaria desea conocer cuántos de los alumnos del curso que
dirige saben cómo hacer operaciones aritméticas con el ábaco. Realizó una prueba a
todos los estudiantes con la cual midió su grado de conocimientos en el uso de esta
herramienta, así obtuvo datos que pudo representar en tablas y gráficos, además de
calcular algunos indicadores con los cuales pudo apreciar que solo un 50% de sus
discípulos contaba con los conocimientos requeridos para empezar el curso, por lo cual
concluyó que lo mejor era impartir unas clases iniciales de nivelación para que todos
estén en capacidad de aprovechar las lecciones.
Estadística inferencial: Se trata de un paso más allá de la mera descripción. Se refiere
a los métodos utilizados para poder hacer predicciones, generalizaciones y obtener
conclusiones a partir de los datos analizados teniendo en cuenta el grado de
incertidumbre existente.
EJEMPLO Un fabricante de colchones quiere conocer los hábitos de sueño de sus
posibles clientes, para lo cual decide realizar una encuesta. Inicialmente establece una
muestra de consumidores con el perfil requerido y procede a aplicarla, obteniendo así un
conjunto de datos que le permiten inferir que una gran mayoría de usuarios prefieren los
colchones blandos así que, para satisfacer al mercado, decide que empleará espumas
de este tipo en la producción.
La estadística inferencial se subdivide a su vez en dos grandes tipos: estadística
paramétrica y no paramétrica.
Estadística paramétrica: Se caracteriza porque asume que los datos tienen una
determinada distribución o se especifican determinados parámetros que deberían
cumplirse. Así por ejemplo, en un análisis paramétrico podemos trabajar bajo el supuesto
de que la población se distribuye como una Normal (hay que justificar nuestro supuesto)
y luego sacar conclusiones bajo el supuesto que esta condición se cumple.
Estadística no paramétrica: En ella no es posible asumir ningún tipo de distribución
subyacente en los datos ni tampoco un parámetro específico. Un ejemplo de este tipo de
análisis es la prueba binomial.
CARACTERÍSTICAS DE LA ESTADÍSTICA
La estadística se caracteriza, principalmente, por su análisis matemático, al emplear
fórmulas aritméticas con el fin de representar, numéricamente, ciertas características
pertenecientes a unos datos, facilitando la interpretación de las mismas mediante
diversos gráficos.
Explica grandes bloques de información a partir de una porción de ellos.
Es aplicable a todos los ámbitos de la vida humana.
Proporciona métodos de investigación para observar y reunir toda la información
necesaria en un estudio.
Es de carácter inferencial, debido a que facilita la definición de proyecciones a
mediano y largo plazo.
Precisión en las conclusiones y resultados.
Su índole es tanto teórica como práctica, pues a partir del análisis se pueden
ejecutar ciertas acciones sobre el objeto de estudio.
Por los métodos que proporciona para representar gráficamente datos numéricos,
es altamente divulgativa.
IMPORTANCIA DE LA ESTADÍSTICA
La importancia de la estadística radica en que facilita el tratamiento de grandes
bloques de información a partir del análisis de solo una parte de ellos, sin necesidad
de recurrir al estudio de la totalidad de los elementos, lo que reduce la dificultad del
análisis y ahorra tiempo.
Asimismo, brinda seguridad y precisión en los resultados y en la definición de
conclusiones. En aquellos ámbitos donde se requiere un elevado nivel
de rigurosidad de la información, destaca la estadística como fuente primordial de
datos. Su importancia se extiende tanto para evitar gastos innecesarios hasta para
proteger vidas.
Por último, permite tener un mayor control tanto de la situación presente como de
las futuras, dando lugar a establecer rutas de acción de manera oportuna, aplicando las
modificaciones que sean necesarias en el momento correcto.
ÁREAS Y CAMPOS DE APLICACIÓN DE LA ESTADÍSTICA
Como método científico, la estadística es aplicable a una gran variedad de sectores en
donde sea necesario analizar datos cuantitativos y cualitativos conjuntamente. Por una
parte, su carácter teórico le permite ser utilizada en el campo académico en la
enseñanza
Una de las áreas en que destaca su implementación es en el ámbito empresarial, tanto
por la capacidad que brinda a los grupos de estudio de validar los resultados de la
empresa al instante como por proporcionar un espacio de tiempo para crear soluciones
oportunas de acuerdo a los pronósticos obtenidos a partir de su aplicación. En este caso,
es una herramienta útil en:
Procesos productivos: al aplicar indicadores clave de rendimiento y
compararlos, es necesario implementar el método estadístico para evaluar la
calidad y efectividad de los procesos de producción, con el fin de descartar,
modificar o mejorar aquellos que afecten directamente la productividad de una
empresa.
Finanzas: el análisis estadístico permite llevar un control y un registro de las
distintas áreas financieras de una empresa, como el presupuesto, los gastos y las
inversiones, de manera que se observe el comportamiento de las mismas y tomar
las decisiones correctas y precisas.
Contabilidad: en la optimización de gastos e identificación del estado de las
cuentas de una empresa, la estadística permite determinar posibles mejoras y
soluciones para implementar en el contexto de la contabilidad.
Capital humano: el área de recursos humanos debe llevar a cabo un constante
estudio sobre el entorno laboral y la tendencia con que se presentan ciertos
aspectos que afectan la calidad de trabajo.
Mercadeo: las encuestas son una herramienta estadística aplicada en esta área
para evaluar la demanda y su posible tendencia a bajar o subir, de manera que
se puedan proponer nuevos productos.
FASES Y ETAPAS DEL MÉTODO ESTADÍSTICO
Como todo proceso investigativo, el método estadístico conlleva unas etapas que se
deben seguir para su correcta implementación. Estas etapas son:
1. Recopilación de datos: en esta fase, se identifica la población a analizar y se
determina qué porción o muestra de la misma se va a estudiar. Se emplean
diversos métodos de recopilación de datos como las encuestas.
2. Análisis matemático de los datos: una vez los datos han sido recopilados, se
aplican las diversas fórmulas matemáticas para representar, describir y resumir la
información de manera numérica.
3. Descripción y representación de la información: los resultados obtenidos a
partir de los distintos cálculos realizados se organizan a través de gráficos y tablas
para facilitar la comprensión de los mismos.
4. Análisis comparativo y conclusiones: por último, el grupo de investigación se
reúne para comparar y analizar los resultados, para sacar conclusiones y evaluar
las posibles medidas o acciones que se puedan aplicar a la situación o fenómeno
estudiado.
Ejemplos de estadística
Para ilustrar de mejor manera el concepto de la estadística y su aplicación en un contexto
real, te explicamos el siguiente ejemplo:
El área creativa de una empresa de zapatos ha propuesto lanzar una nueva colección
para la nueva temporada de invierno. Para estudiar su rentabilidad, se realiza su
correspondiente análisis de mercado.
1. Se recopila la información del público objetivo, es decir, se analiza la demanda y
la oferta en el mercado de este tipo de productos, las tendencias y estilos
utilizados y más gustados por los clientes, entre otros aspectos que permiten
obtener un panorama de la viabilidad del producto en el mercado actual.
2. Se realizan diversos cálculos para resumir la información recopilada, por ejemplo,
un análisis porcentual de las muestras o la frecuencia con que las personas
compran este estilo de zapatos.
3. Se organiza la información mediante gráficos y tablas:
4.
4. Por último, se definen las conclusiones a partir de los resultados. En este caso, es
más rentable lanzar una colección de zapatos enfocado en los hombres, ya que
es el público que tiende a comprar más este estilo.
La estadística, como parte fundamental de todo campo investigativo, requiere de
saberla implementar correctamente y conocer todos los elementos involucrados en su
aplicación. Ahora que sabes todo lo necesario para realizar análisis estadísticos en tus
estudios, puedes optimizar todas las áreas y aspectos de tu trabajo y tener más
seguridad y control sobre las distintas situaciones que se puedan presentar.
MATRIZ DE DATOS
Una matriz de datos es un instrumento en el que se encuentran colocados una serie de
elementos, los cuales pueden tratarse de distintos objetos matemáticos. No obstante, lo
habitual es que se utilicen números.
Dentro de la matriz de datos, cada observación se corresponderá a la intersección de
una fila con una columna. Así, tendremos un ordenamiento donde podremos apreciar,
por ejemplo, las características de una muestra o de una población estadística.
Cabe señalar que, para armar una matriz, primero se debe efectuar una recolección de
datos, proceso a través del cual los investigadores capturan información. Esto se realiza
mediante técnicas como entrevistas, encuestas, focus group y otros.
La matriz de datos ideal debe ser:
Única (no siempre es posible, pero debe intentarse).
Consistente.
Rectangular (todas las casillas deberían estar llenas)
Las columnas son Variables.
Las filas son Observaciones.
No debe tener variables obtenidas a partir de cálculos con otras variables de la matriz.
ELEMENTOS DE UNA MATRIZ DE DATOS
Los elementos de una matriz de datos son los siguientes:
Variables: Son las características de una muestra o población. Pueden
ser cuantitativas, y ser expresadas en números (como la altura o el ingreso
mensual), o cualitativas, que indican una calidad, como la profesión o el estado
civil. En este último caso, se puede asignar un número a cada categoría. Por
ejemplo, 1 si su profesión es abogado y 2 si es economista.
Casos: Se encuentran en las filas. Son los elementos indivisibles que forman
parte del grupo sujeto a investigación. Sobre cada caso, se analizarán las
variables pertinentes del estudio. Los casos pueden ser individuos, familias,
grupos u otro, y todo ello depende de cómo esté estructurado el trabajo
estadístico.
Valores: Es el objeto matemático que corresponde a la coincidencia de una
variable y un caso. Por ejemplo, la variable puede ser la edad y el caso la persona
Romina Villegas, siendo el valor 36, pues la mujer en cuestión tiene 36 años.
UTILIDAD DE LA MATRIZ DE DATOS
La utilidad de la matriz de datos radica en que, a partir de ella, se puede efectuar un
análisis sobre un problema o un fenómeno. Esto, en el ámbito privado o de gobierno,
para el planeamiento de políticas públicas, por ejemplo.
La matriz de datos puede analizarse tomando cada variable o columna, observando
cómo varía a largo de todos los casos. De igual forma, puede analizarse cada caso, para
evaluar las diferentes características por cada unidad indivisible del análisis.
DISTRIBUCIÓN DE FRECUENCIAS
En estadística, se le llama distribución de frecuencias a la agrupación de datos en
categorías mutuamente excluyentes que indican el número de observaciones en cada
categoría.1 Esto proporciona un valor añadido a la agrupación de datos. La distribución
de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el
número existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas
en forma de tablas.
Una distribución de frecuencias es un formato tabular en la que se organizan los datos
en clases, es decir, en grupos de valores que describen una característica de los [datos]
y muestra el número de observaciones del conjunto de datos que caen en cada una de
las clases.
La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En principio,
en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de
datos junto con el número de veces que aparece, es decir, su Frecuencia. Se puede
complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica
la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se
distinguen por otra parte la frecuencia simple y la frecuencia acumulada.
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de
tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
Frecuencia Simple (fi)
La frecuencia simple es el número de veces que aparece un determinado valor reportado
en un estudio estadístico. Se representa por fi. La suma de las frecuencias simple es
igual al número total de datos, que se representa por N. Para indicar resumidamente
estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.
Σ fi = N (número total de datos de la distribución)
Frecuencia Relativa Porcentual (fr%)
La frecuencia relativa porcentual es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos. Se puede expresar en tantos por ciento y
se representa por fi. La suma de las frecuencias relativas es igual a 100.
Frecuencia Acumulada (fac)
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado. Se representa por fac.
Frecuencia Relativa Acumulada Porcentual (frac%)
La frecuencia relativa acumulada porcentual es el cociente entre la frecuencia acumulada
de un determinado valor y el número total de datos expresada en tantos por ciento.
Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las
variables toman un número grande de valores o la variable es continua. Se agrupan los
valores en intervalos que tengan la misma amplitud denominados clases. A cada clase
se le asigna su frecuencia correspondiente.
Límites de la clase. Cada clase está delimitada por el límite inferior de la clase y el límite
superior de la clase.
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. La
marca de clase es el punto medio de cada intervalo y es el valor que representa a todo
el intervalo para el cálculo de algunos parámetros.
REGLAS GENERALES PARA FORMAS DISTRIBUCIONES DE FRECUENCIAS
PARA DATOS AGRUPADOS EN INTERVALOS
Cuando los datos contienen una gran cantidad de elementos, para facilitar los cálculos
es necesario agruparlos, a estos grupos se los llama intervalos o clases. Un intervalo es
una serie de números incluidos entre dos extremos, así por ejemplo, el intervalo 40 – 45
está formado por 40, 41, 42, 43, 44 y 45, siendo 40 el límite inferior, 45 el límite superior,
39,5 límite real inferior (límite inferior disminuido en 5 décimas) y 40,5 el límite real
superior (límite superior aumentado en 5 décimas).
Las reglas generales para formas distribuciones de frecuencias para datos agrupados en
intervalos son:
1) Calcule el Recorrido Verdadero (Rv).- También se llama rango o amplitud total. Es
la diferencia entre el valor mayor y el menor de los datos.
2) Seleccione el Número Aproximado de Intervalos de Clase (ni).- No debe ser
menor de 5 y mayor de 12, ya que un número mayor o menor de clases podría oscurecer
el comportamiento de los datos. Para calcular la amplitud de los intervalos el valor del
número de intervalos se ofrecerá como dato del eejercicio.
3) Calcule la Amplitud del Intervalo (i).- Se obtiene dividiendo el Recorrido Verdadero
(Rv) entre el Número Aproximado de Intervalos de Clase (ni):
Se procede a calcular la Amplitud la Aproximada del Intervalo (≈)
i ≈ Rv / ni
Pudiendo resultar el valor de i de diferentes formas, esto quiere decir que no sea exacto
o un numero expresado decimales, que sea entero par o un entero impar. Para efectos
de nuestro curso estableceremos un criterio para poder decidir el valor de la amplitud del
intervalo definitivo el cual nos permita construir los intervalos de clases. Por ejemplo:
Si una distribución de 40 datos el valor mayor es 41 y el menor es 20 se tiene:
Calculando el Rango se obtiene:
Rv = Vmax – Vmin = 41 -20 = 21 (si la variable es discreta)
Rv = Vmax – Vmin + S = 41 -20 + 1 = 22 (si la variable es continua)
Siendo Vmax el valor máximo de los valores reportados, Vmin el valor mínimo de los
valores reportados y S la sensibilidad del conjunto de los datos.
Para este ejemplo supondremos que Número Aproximado de Intervalos de Clase (ni) es
seis, (ni = 6)
Calculando, se obtiene:
i ≈ Rv / ni ≈ 22 / 6 ≈ 3,67
Para determinar el valor final de la amplitud del intervalo aplicaremos e siguiente criterio
(que llamaremos Regla de Oro):
1. Si el valor calculado de i es un numero decimal, tomaremos el número impar más
cercano a él.
2. Si el valor calculado de i es un numero entero par, tomaremos el menor número impar
cercano a él.
3. Si el valor calculado de i es un numero entero impar, entonces el valor de i es igual al
mismo valor calculado.
Aplicando la Regla de Oro para el ejemplo, al valor calculado de i, tenemos que es un
numero decimal y al aplicar el primer criterio, se obtiene que: i = 3
4) Forme los Intervalos de Clase agregando i-1 al límite inferior de cada clase,
comenzando por el Xmín del rango.
5) Se realiza el Conteo de Datos que cae dentro de cada clase (frecuencia absoluta)
6) Calcule el Punto Medio para cada Clase (Xi).- Es el valor del Punto Medio de cada
clase, se obtiene sumando los límites superior (Lim. Sup) e inferior (Lim. Inf.) del intervalo
y dividiendo ésta suma entre 2
Xi = (Lim. Sup. + Lim. Inf. ) / 2
7) Calcule las Frecuencias.
EJEMPLO ILUSTRATIVO
¿Cómo se elabora una Tabla de Distribución de Frecuencias para Datos
Agrupados?
Por lo general una tabla de frecuencias con datos agrupados se realiza cuando la
cantidad de datos es grande y/o la variable es continua. Básicamente consiste en
agrupar los datos en intervalos de una misma amplitud, denominados clases. A cada
clase se le asignan valores de cada tipo de frecuencias.
Consultamos a 50 personas sobre cuál era su edad y obtuvimos los siguientes
resultados:
38 – 15 – 10 – 12 – 62 – 46 – 25 – 56 – 27 – 24 – 23 – 21 – 20 – 25 –
38 – 27 – 48 – 35 – 50 – 65 – 59 – 58 – 47 – 42 – 37 – 35 – 32 – 40 –
28 – 14 – 12 – 24 – 66 – 73 – 72 – 70 – 68 – 65 – 54 – 48 – 34 – 33 –
21 – 19 – 61 – 59 – 47 – 46 – 30 – 30
Paso 1: Identificar el valor máximo y mínimo
38 – 15 – 10 – 12 – 62 – 46 – 25 – 56 – 27 – 24 – 23 – 21 – 20 – 25 – 38 – 27 – 48 – 35
– 50 – 65 – 59 – 58 – 47 – 42 – 37 – 35 – 32 – 40 – 28 – 14 – 12 – 24 – 66 – 73 – 72 –
70 – 68 – 65 – 54 – 48 – 34 – 33 – 21 – 19 – 61 – 59 – 47 – 46 – 30 – 30
Paso 2: Calcular el Rango
Obtener el rango de edades en que se encuentran los encuestados, sólo basta con
determinar la diferencia que hay entre el más joven y el más adulto:
Paso 3: Calcular la cantidad de Intervalos
A los intervalos también se les conoce como clases. Simplemente son las
“categorías” en las cuales vamos a encasillar a nuestros encuestados.
Hay varias formas de calcular cuántos intervalos debemos utilizar.
Vamos a analizar un par:
Para ambas formas de calcular la cantidad de intervalos a utilizar, el valor
de n corresponde a la cantidad de datos que tenemos para analizar. En este caso
son 50 datos.
Con la primera forma tendríamos que redondear el resultado, ya que los intervalos
corresponde a cantidades enteras (no puedes tener un intervalo y medio… o un
intervalo y alguito… debes aproximar como NORMALMENTE lo harías).
La segunda forma se conoce como Regla de Sturges, y el resultado obtenido lo
debes aproximar por ARRIBA, es decir, al entero siguiente (por ejemplo si te da 5.1 lo
debes aproximar a 6 y no a 5). Para nuestro ejemplo:
Por ambas formas obtuvimos que debemos utilizar 7 intervalos.
Paso 4: Calcular la Amplitud de los Intervalos
Ya sabemos el Rango de edad en la que se mueven nuestros encuestados…. y
sabemos entre cuántos intervalos hay que REPARTIR las categorías… Así se calcula
la amplitud:
Paso 5: Construcción de los intervalos
El primer intervalo viene con límite inferior igual al valor mínimo de los datos, en este
caso 10 años. Súmale el valor de la amplitud, es decir, 9 años, y obtendrás el límite
superior de 19 años. Eso nos daría el primer intervalo:
Ojo! Fíjate bien, se utiliza corchete para el dato que SE INCLUYE… y se
utiliza paréntesis para el dato que NO SE INCLUYE. Eso significa que los datos de 10
años se cuentan pero los de 19 NO.
El 19 se cuenta en el siguiente intervalo y allí vendría siendo el límite inferior. Súmale
el valor de la amplitud, es decir, 9 años, y obtendrás el límite superior de 28 años. Eso
nos daría el segundo intervalo:
El uso del corchete implica que SÍ vamos a contar acá el 19 pero el paréntesis indica
que NO vamos a incluir a los de 28 años. Ese se incluye en el siguiente.
Si te fijas bien, el último intervalo debe finalizar en el valor máximo, es decir, 73 años.
Lógicamente ese último intervalo debe concluir con corchetes para no dejar por fuera el
dato de 73 años.
Paso 6: Cálculo de la Marca de Clase de cada intervalo
La marca de clase simplemente es el punto medio que hay en cada intervalo. Lo que
debes hacer es sumar límite inferior y superior de cada intervalo y dividir el resultado
entre 2. Así:
Paso 7: Determinar la Frecuencia Absoluta de cada intervalo
La frecuencia absoluta sólo consiste en CONTAR la cantidad de datos que caen en
cada intervalo. Se representa con la f minúscula y un subíndice (número chiquito abajo)
que indica el intervalo en el cual está ubicada la frecuencia absoluta (fi).
Veamos cuántos datos caen en el primer intervalo de [10 – 19)
Si te fijas bien, NO estamos contando los datos de 19 años… esos se cuentan en el
siguiente intervalo. Para el primer intervalo tenemos 5 datos, esa será su frecuencia
absoluta, su CONTEO. Estas son las frecuencias absolutas de los 7 intervalos:
Evidentemente la sumatoria de todas las frecuencias absolutas debe arrojar el número
de datos que tenemos, en este caso 50.
Paso 8: Determinar la Frecuencia Absoluta Acumulada de cada intervalo
No te compliques, ACUMULAR es SUMAR todo lo que llevo hasta el momento.
La Frecuencia Absoluta Acumulada (Fi) de cada intervalo consiste en sumar todas las
frecuencias absolutas de los intervalos anteriores y el actual. Para diferenciar su símbolo
de la frecuencia absoluta, simplemente utiliza la F mayúscula.
La primer frecuencia absoluta acumulada es la misma primer frecuencia absoluta
porque recién estamos empezando… no hay nada que acumular todavía.
La segunda frecuencia absoluta acumulada vale 16 porque debemos sumar 5+11
porque son las frecuencias absolutas que llevamos hasta ahora para ACUMULAR.
La tercer frecuencia absoluta acumulada vale 24 porque debemos sumar 5+11+8
porque son las frecuencias absolutas que llevamos hasta ahora para ACUMULAR.
Cuando llegues al último intervalo, deberás obtener un ACUMULADO igual
al TOTAL de datos, en este caso 50:
Paso 9: Determinar la Frecuencia Relativa de cada intervalo
La palabra RELATIVA nos indica que vamos a RELACIONAR cada Frecuencia
Absoluta con su Total… y en matemáticas cuando te dicen relacionar algo con algo…
es DIVIDIR ese algo con ese algo.
La Frecuencia Relativa (fr) de cada intervalo consiste en dividir la Frecuencia Absoluta
de es mismo intervalo entre el Total de datos.
De la tabla construida hasta ahora, podemos observar que la frecuencia relativa se
puede expresar en decimal o en porcentaje, y que la suma de todas las frecuencias
relativas debe dar el 100%.
Paso 10: Determinar la Frecuencia Relativa Acumulada de cada intervalo
Vuelve y juega lo acumulado… no te compliques, ACUMULAR es SUMAR todo lo que
llevo hasta el momento.
La Frecuencia Relativa Acumulada (Fr) de cada intervalo consiste en sumar todas las
frecuencias relativas de los intervalos anteriores y el actual. Para diferenciar su símbolo
de la frecuencia relativa, simplemente utiliza la F mayúscula.
La segunda frecuencia relativa acumulada vale 0.32 porque debemos sumar 0.1+0.22
porque son las frecuencias relativas que llevamos hasta ahora para ACUMULAR.
QUÉ SON LOS ATRIBUTOS EN ESTADÍSTICA?
Son el tipo de variables que, como su nombre lo indica, expresan distintas cualidades,
características o modalidad. Cada modalidad que se presenta se denomina atributo o
categoría, y la medición consiste en una clasificación de dichos atributos.
¿QUÉ SON LOS ATRIBUTOS GEOGRÁFICOS?
Atributo geográfico. Es un atributo que representa información referente a una
característica geográfica del objeto al que pertenece (posición, extensión, etc.). Es un
subconjunto no vacío y posiblemente infinito del espacio geográfico.
¿QUÉ SIGNIFICA UNA REPRESENTACIÓN GRÁFICA?
Resultado de imagen para representación grafica
Una gráfica es la representación en unos ejes de coordenadas de los pares ordenados
de una tabla. Las gráficas describen relaciones entre dos variables. Una vez realizada la
gráfica podemos estudiarla, analizarla y extraer conclusiones.
partes sobre los elementos de un gráfico
Título del gráfico.
Área de trazado.
Leyenda.
Títulos de eje.
Etiquetas del eje.
Marcas de graduación.
Líneas de cuadrícula.
Diagrama de barras
Un diagrama de barras es un tipo de gráfico estadístico que se utiliza para representar
gráficamente variables discretas. En un diagrama de barras se representa en el eje X
cada valor de la variable de estudio, y para cada uno se dibuja una barra rectangular con
una altura proporcional a su frecuencia.
Un diagrama de barras puede ser vertical, si tiene las barras representadas
verticalmente, u horizontal, cuando tiene las barras dibujadas horizontalmente.
ejemplo de diagrama de barras
En estadística, el diagrama de barras sirve para comparar la cantidad de veces que se
repiten los datos. Principalmente, se usa para analizar la frecuencia de los datos en una
muestra de una variable cualitativa. Este tipo de gráfico estadístico también se puede
llamar gráfico de barras o gráfico de columnas.
Histograma
Un histograma es tipo de diagrama estadístico en el que se representa un conjunto de
datos estadísticos mediante barras rectangulares, de manera que cada barra del
histograma es proporcional a su frecuencia correspondiente.
Los histogramas sirven para representar gráficamente variables continuas, como por
ejemplo la altura de una muestra estadística. Además, un histograma permite visualizar
rápidamente la forma que tiene una distribución.
Cada barra de un histograma de frecuencias tiene una anchura proporcional a la amplitud
del intervalo y una altura proporcional a la frecuencia del intervalo.
La diferencia entre un diagrama de barras y un histograma (el tipo de gráfico estadístico
anterior) es la clase de variable que representan. Un diagrama de barras sirve para
representar gráficamente una variable cualitativa discreta, en cambio, un histograma se
utiliza para representar variables cuantitativas continuas.
POLÍGONO DE FRECUENCIAS
Un polígono de frecuencias es un tipo de gráfica estadística en la que se representa
un conjunto de datos mediante puntos y se unen con líneas.
En estadística, el polígono de frecuencias en general se usa para representar una serie
temporal, ya que este tipo de diagramas son muy útiles para analizar la evolución de los
datos.
Gráfica de áreas
En una gráfica de áreas se representan los datos mediante puntos unidos con líneas
rectas y se colorea el área que queda bajo la gráfica.
Por lo tanto, una gráfica de áreas es como un polígono de frecuencias pero, además, se
pinta el área que tiene por debajo.
Una ventaja de este tipo de gráfico estadístico es que permite representar varias series
de datos en un solo diagrama, lo que facilita la comparación entre ellas y conocer el valor
total.
Diagrama de Pareto
El diagrama de Pareto es un tipo de gráfico estadístico que combina el histograma y el
polígono de frecuencias. En un diagrama de Pareto se representa un conjunto de datos
de manera descendente y mediante barras, por otro lado, se añaden a la gráfica los
porcentajes acumulados utilizando un polígono de frecuencias.
en estadística, este tipo de diagrama se utiliza para analizar un problema y determinar
sus principales causas. Además, una de sus características es que permite visualizar las
frecuencias absolutas y los porcentajes acumulados simultáneamente, lo que ayuda a
analizar y a identificar las causas más importantes del problema.
Diagrama de puntos
Un diagrama de puntos es un gráfico que se utiliza para representar datos en forma de
puntos a lo largo de una recta numérica. Por lo tanto, el diagrama de puntos sirve para
identificar la localización y la variabilidad de los datos.
Los diagramas de puntos son muy parecidos a los histogramas, ya que ambos sirven
para ver qué datos se repiten con más frecuencia. Pero la diferencia entre un diagrama
de puntos y un histograma está en el número de datos, ya que los diagramas de puntos
son más útiles para representar conjuntos de datos pequeños y, en cambio, los
histogramas son mejores para representar conjuntos de datos grandes.
Diagrama de dispersión
El diagrama de dispersión es un tipo de diagrama estadístico en el que se representa
gráficamente un conjunto de datos de dos variables en dos ejes de coordenadas
cartesianas.
Por lo tanto, los diagramas de dispersión sirven para analizar la relación entre dos
variables estadísticas.
Los diagramas de dispersión reciben varios nombres diferentes, tales como diagrama
de correlación o nube de puntos.
Cabe destacar que el diagrama de dispersión se considera como una de las
herramientas básicas de control de calidad, junto con el diagrama de Pareto, el
diagrama de causa-efecto, el diagrama de flujo, etc.
Diagrama de sectores
Un diagrama de sectores, o gráfico de sectores, es un tipo de diagrama estadístico
en el que se representan los datos mediante un círculo dividido en sectores, de manera
que el ángulo de cada sector es proporcional a su frecuencia correspondiente.
Por lo tanto, cuanto mayor sea la frecuencia de un valor, más grande será su sector
correspondiente en el diagrama.
Los diagramas de sectores sirven para analizar de manera visual la frecuencia de cada
valor. En estadística, este tipo de gráficos se emplean principalmente para representar
variables cualitativas.
Gráfico de anillos
Tal y como indica su nombre, un gráfico de anillos es un tipo de gráfico estadístico que
tiene forma de anillo. En concreto, un gráfico de anillos sirve para representar los
porcentajes de un conjunto de datos, de manera que la parte del anillo que ocupa cada
valor es proporcional a su frecuencia.
Por lo tanto, cuanto más grande sea un valor, mayor será la porción que ocupe del gráfico
de anillos.
En estadística, los gráficos de anillos son especialmente útiles para representar
gráficamente datos cualitativos, también se usan para graficar porcentajes de manera
visual y atractiva.
Ojiva
En estadística, la ojiva es la gráfica acumulativa de una serie de datos. Es decir, la ojiva
es un gráfico que muestra la frecuencia acumulada asociada de un conjunto de datos.
De manera que la ojiva sirve para saber el número de datos que se encuentran por
debajo de un valor determinado.
En las ojivas solo se pueden representar variables cuantitativas, este tipo de diagrama
estadístico no es útil para variables cualitativas.
Pirámide de población
Una pirámide de población, también llamada pirámide demográfica, es una
representación gráfica de la estructura de una población. En concreto, una pirámide de
población sirve para analizar la proporción de la población según la edad y el género.
Normalmente, las pirámides de población se hacen de países, pero lógicamente se
puede realizar una pirámide de población de cualquier territorio como una ciudad, un
pueblo, una provincia, etc.
Diagrama de caja y bigotes
El diagrama de caja y bigotes, también llamado diagrama de caja o boxplot, es un
gráfico que representa un conjunto de datos estadísticos de manera visual utilizando los
cuartiles.
La principal característica del diagrama de caja y bigotes es que permite visualizar
rápidamente la dispersión de una serie de datos, ya que indica los cuartiles, la mediana,
los valores extremos y los valores atípicos de los datos.
Los diagramas de cajas y bigotes son muy útiles para comparar variables numéricas. Sin
embargo, no es adecuado para representar variables categóricas.
Gráfico radial
Un gráfico radial, también conocido como diagrama de araña, es un tipo de gráfico
estadístico en el que se representan diversas variables. Es decir, en estadística el gráfico
radial sirve para comparar los valores de diferentes variables.
Además, la principal ventaja del gráfico radial es que es muy visual, lo que permite hacer
una comparación entre las variables de manera fácil y rápida.
El gráfico radial recibe muchos nombres distintos como gráfico de red, gráfico
polar o gráfico de estrella.
Diagrama de tallo y hoja
El diagrama de tallo y hoja es un tipo de diagrama estadístico en el que se representa
un conjunto de datos cuantitativos.
En un diagrama de tallo y hoja cada dato está separado por la hoja, que es su último
dígito, y el tallo, que son las cifras restantes. De modo que en un diagrama de tallo y
hoja se pone cada hoja en la línea de su tallo correspondiente.
De esta forma, los diagramas de tallos y hojas permiten representar gráficamente un
conjunto de datos estadísticos y, además, ayudan a visualizar la forma de la distribución.
Diagrama de árbol
Un diagrama de árbol, también conocido como árbol de probabilidad, es una
representación gráfica de todos los posibles resultados de un experimento junto con sus
probabilidades.
De modo que un diagrama de árbol sirve para representar gráficamente todos los
posibles resultados de un espacio muestral y calcular sus probabilidades.
Un diagrama de árbol se hace de manera que cada resultado (nudo) se ramifica en
nuevos posibles resultados (ramas) hasta llegar a los resultados finales.
Pictograma
En estadística, un pictograma es un tipo de gráfico en el que se representan los datos
mediante dibujos. Es decir, un pictograma es un diagrama en el que se utilizan dibujos
en lugar de barras para representar las frecuencias de los datos.
Por lo tanto, un pictograma sirve para representar gráficamente un conjunto de datos
estadísticos de manera visual.
los pictogramas se utilizan para la representación de variables cualitativas o discretas.
Cartograma
Un cartograma es un tipo de gráfico estadístico en el que se representa un conjunto de
datos en un mapa utilizando diferentes colores. Es decir, un cartograma es un diagrama
que muestra los datos asociados a cada área geográfica.
Por ejemplo, se ha representado gráficamente en un cartograma el número de habitantes
de todos los países de África. Como puedes observar, cada color corresponde a un
número de habitantes, en concreto, cuanto más oscuro sea el color, significa que más
población tiene ese país.
Por lo tanto, en estadística los cartogramas sirven para representar gráficamente un
conjunto de datos asociados a zonas geográficas.
ACTIVIDADES DE EVALUACION PARA EL MODULO I
1. Realizar una línea de tiempo del origen de la Estadística. Valor 5%
2. Realizar una tabla de frecuencia de las edades de la sección de contaduría. Valor
5%
3. Realizar ejemplos de todos los tipos de graficas Valor 10%
Fecha de entrega final de actividades el día 29/04/2023 sin prorroga