Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La estadística se define como la ciencia de reunir datos, analizarlos, presentarlos e interpretarlos. Especialmente
en los negocios y en la economía.
✓ Los analistas financieros emplean una diversidad de información estadística como guía para sus
recomendaciones de inversión.
<https://compite.com.co/informe/informe-nacional-de-competitividad-2011-2012/sistema-financiero/>
✓ Los economistas suelen hacer pronósticos acerca del futuro de la economía o sobre algunos aspectos de la
misma. < https://andigraf.com.co/boletin-trimestral-economico-marzo-2019-2/>
DATOS
Son hechos, informaciones y cifras que se recogen, analizan y resumen para su presentación e interpretación. A
todos los datos reunidos para un determinado estudio se les llama conjunto de datos.
https://es.slideshare.net/Jorgeja123/tema-4descripcion-de-conjuntos-de-datos-9735613
ELEMENTOS
Son las entidades de las que se obtienen los datos. Si se estudia el fenómeno de deserción estudiantil de las
universidades públicas de Colombia , las unidades o elementos son cada una de las Universidades del País.
VARIABLE
Una variable es una cualidad que puede cambiar y cuya variación es susceptible de adoptar diferentes valores, los
cuales pueden medirse u observarse, es decir, es una característica de los elementos que son de interés.
Las variables que con frecuencia se utilizan en economía representando precios, beneficios, ingreso, costos,
consumo, inversión, importaciones, exportaciones, etc. Puesto que cada variable puede asumir distintos valores,
debe estar representada por un símbolo o una letra.
Variable Cualitativa
Hay muchos casos en donde no es posible hacer medidas numéricas. Muchas variables son susceptibles solamente
de clasificación, por ejemplo, la variable "estado civil" puede recibir los valores de soltero, casado, divorciado,
viudo y, tal vez, todos los demás. También se pueden asumir valores de orden como primero, segundo, tercero,
etcétera.
✓ Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de
orden. Ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y
viudo.
✓ Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden.
Ejemplos: La nota en un examen: Insuficiente, Aceptable, sobresaliente y excelente.
Variable Cuantitativa
Cuando los valores que puede asumir sean los resultados de medidas numéricas. Ejemplos, la estatura, el peso, la
temperatura, etcétera.
✓ La variable cuantitativa discreta otorga cifras que se encuentran separadas en escalas, es decir que no
poseen valores entre ellas, sino que el resultado comprende un valor exacto. Edad, Número de hijos, etc
✓ La variable cuantitativa continua, por otro lado, puede otorgar un valor de cualquier intervalo o medición,
es decir que puede haber otros valores en medio de dos exactos. Generalmente estos son representados por
valores decimales, por lo cual la cifra será mucho más específica. Peso, Estatura. etc.
La recolección de datos requiere alguna de las siguientes escalas de medición: nominal, ordinal, de intervalo o de
razón.
Escala Nominal
Cuando el dato de una variable es una etiqueta o un nombre que identifica un atributo de un elemento. El sexo de
una persona es un dato nominal no numérico y el número de seguro social de una persona es un dato nominal
numérico.
Por ejemplo, supongamos que se realiza esta pregunta: “¿Podrías seleccionar el grado de incomodidad de tu
enfermedad?”
1. Leve
2. Moderado
3. Severo
En este ejemplo en particular, 1 = leve, 2 = Moderado y 3 = Severo. Aquí los números simplemente son utilizados
como etiquetas y no tienen ni un solo valor.
Escala ordinal
Los datos muestran las propiedades de los datos nominales y además tiene sentido el orden o jerarquía de los datos.
Las medidas pequeño, mediano y grande para dar el tamaño de un objeto son datos ordinales no numéricos.
1. Totalmente satisfecho
2. Satisfecho
3. Neutral
4. Insatisfecho
5. Totalmente insatisfecho
Escala de Intervalo
Los datos tienen las características de los datos ordinales y el intervalo entre valores se expresa en términos de una
unidad de medición fija. Los datos de intervalo siempre son numéricos. Las mediciones de temperatura son datos
de intervalo. Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad, establecer un
orden dentro de sus valores y medir la distancia existente entre cada valor de la escala. Las variables de intervalo
carecen de un cero absoluto. La temperatura no tiene cero absoluto porque 0° no es ausencia de temperatura, el
coeficiente intelectual, académicas.
Escala de razón
Una variable tiene una escala de razón si los datos tienen todas las propiedades de los datos de intervalo y la
proporción entre dos valores tiene significado, además cuentan con un cero absoluto; es decir, el valor cero (0)
representa la ausencia total de medida. Variables como distancia, altura, peso y tiempo usan la escala de razón en
la medición.
✓ Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los
alumnos de una clase).
✓ Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo:
edad y altura de los alumnos de una clase).
✓ Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad,
altura y peso de los alumnos de una clase).
ACTIVIDAD: Envié al foro de la unidad 5 ejemplos diferentes de cada una de las variables anteriores
FUENTES DE DATOS
Los datos se obtienen de fuentes ya existentes o por medio de encuestas y estudios experimentales realizados con
objeto de recolectar nuevos datos.
ESTADISTICA DESCRIPTIVA
La mayor parte de la información estadística que se encuentra en periódicos, revistas, informes de empresas y otras
publicaciones consta de datos que se resumen y presentan en una forma fácil de leer y de entender. A estos
resúmenes de datos, que pueden ser tabulares, gráficos o numéricos se les conoce como estadística descriptiva.
ESTADISTICA INFERENCIAL
En muchas situaciones se requiere información acerca de grupos grandes de elementos (individuos, empresas,
votantes, hogares, productos, clientes, etc.). Pero, debido al tiempo, costo y a otras consideraciones, sólo es posible
recolectar los datos de una pequeña parte de este grupo. Al grupo grande de elementos en un determinado estudio
se le llama población y al grupo pequeño muestra.
POBLACIÓN
MUESTRA
Al proceso de efectuar un estudio para recolectar datos de una muestra se le llama encuesta muestral. Una de las
principales contribuciones de la estadística es emplear datos de una muestra para hacer estimaciones y probar
hipótesis acerca de las características de una población mediante un proceso al que se le conoce como inferencia
estadística. Al proceso de realizar un estudio para recolectar datos de toda una población se le llama censo.
1. DISTRIBUCIONES DE FRECUENCIA
Las distribuciones de frecuencias son tablas en las que se disponen las modalidades de la variable por filas. En las
columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en
frecuencias es facilitar la obtención de la información que contienen los datos.
TIPOS DE FRECUENCIA
Se encuestan 20 Jóvenes universitarios y se obtienen los Se encuestan 20 Jóvenes universitarios y se obtienen los
siguientes datos sobre su preferencia de bebidas. siguientes datos sobre su niveles de estudios.
Datos (xi) f. absol f. relat fr. %
Coca Cola Datos (xi) f. abs f. abs acum fr. relativa
Postobón Pregrado
Pony Malta Maestría
Mister tee Doctorado
Otras Post doctorado
Total Total
Una distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos,
asignando a cada dato su frecuencia correspondiente.
EJEMPLO
Durante el mes de julio, en una ciudad se han registrado las siguientes 31 temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el
recuento y en la tercera anotamos la frecuencia absoluta, la frecuencia relativa y la frecuencia porcentual.
𝒇𝒊
∑𝑖=𝑛
𝑖=1 𝑓𝑖 = 𝑁 = 31 𝒇𝒓 = → 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎
𝑵
𝑫𝒂𝒕𝒐𝒔(𝒙𝒊 ) 𝒇𝒂𝒃𝒔𝒐𝒍 (𝒇𝒊) 𝒇𝒂𝒃𝒔 𝒂𝒄𝒖𝒎 𝒇𝒓𝒆𝒍𝒂𝒕𝒊 (fr) 𝒇𝒓𝒆𝒍𝒂𝒕𝒊 𝑨𝒄𝒖𝒎 𝒇𝒑𝒐𝒓𝒄𝒆𝒏𝒕𝒖𝒂𝒍
(frac)
27 1 1 1 0.032x100 = 3.2
= 0.032
31
28 2 3 0.097 9.7
29 6
30 7
31 8
32 3
33 3
34 1
Total 31
Esta tabla de frecuencias tiene una variable cuantitativa continua.
Ver Excel.
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número
grande de valores o la variable es cuantitativa continua.
Se agrupan los valores en intervalos [a, b) que tengan la misma amplitud denominados clases de forma. A cada
clase se le asigna su frecuencia correspondiente.
Cada clase está delimitada por el límite inferior de la clase (a) y el límite superior de la clase (b).
̅𝒊 )
1.7.3 Marca de clase ( 𝒙
La marca de clase es el punto medio de cada intervalo [a, b) y es el valor que representa a todo el intervalo para el
cálculo de algunos parámetros como la media, la moda, la mediana y la desviación estándar.
Se aplica para el cálculo del número de intervalos en que se dividen las observaciones
1.7.5 Rango ( R )
Es diferencia entre el Máximo valor y el mínimo valor: 𝑀𝑎𝑥𝑖𝑚𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 − 𝑀𝑖𝑛𝑖𝑚𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
𝑹𝒂𝒏𝒈𝒐 𝑹
𝑨𝒎𝒑𝒍𝒊𝒕𝒖𝒅 𝒅𝒆𝒍 𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 = → 𝑨=
𝑵𝒓𝒐 𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐𝒔 𝑲
EJEMPLO
Individuo Nivel Individuo Nivel Individuo Nivel Individuo Nivel Individuo Nivel
1 10.6 8 12.2 15 11.8 22 12.3 29 12.3
2 12.5 9 10.8 16 12.7 23 12 30 10.2
3 11.1 10 16.5 17 11.4 24 12.5 31 11.1
4 9.2 11 15.0 18 9.3 25 9.7 32 11.3
5 11.5 12 10.3 19 8.6 26 12.5 33 14.9
6 9.9 13 12.4 20 8.5 27 11.6 34 7.8
7 11.9 14 9.1 21 10.1 28 12.4
Aplicamos la fórmula de Sturges para determinar el número de intervalos en que se dividen las observaciones,
obtenemos:
𝒙𝒇 − 𝒙𝒊 16.5 − 7.8
𝑨= = = 1.5
𝑲 6
Parece, por tanto, razonable tomar como amplitud 1.5, obteniendo como intervalos en los que clasificar los datos
[7.5 - 9.0), [9.0 - 10.5), [10.5 - 12.0), [12.0 - 13.5), [13.5 - 15.0), [15.0 - 16.5]
Los datos agrupados en los intervalos obtenidos, proporcionan las cuatro siguientes distribuciones de frecuencias:
2. GRAFICAS ESTADISTICAS
Las diferentes ciencias de la actualidad trabajan con volúmenes de datos muy grandes. En general a las personas les
es difícil imaginar los datos “crudos” de forma correcta. Por este motivo se utiliza ayuda gráfica para facilitar la
comprensión de los datos y resultados obtenidos de una investigación, aunque también se utilizan por el mismo
motivo en ambientes empresariales.
Un diagrama de barras es una gráfica para representar los datos cualitativos de una distribución de frecuencia,
de frecuencia relativa o de frecuencia porcentual. En uno de los ejes de la gráfica (por lo general en el horizontal),
se especifican las etiquetas empleadas para las clases (categorías). Para el otro eje de la gráfica (el vertical) se usa
una escala para frecuencia, frecuencia relativa o frecuencia porcentual.
Etiquetas (Categorías)
2.3 HISTOGRAMA
Es una presentación gráfica usual para datos cuantitativos. Esta gráfica se hace con datos previamente resumidos
mediante una distribución de frecuencia, de frecuencia relativa o de frecuencia porcentual. Un histograma se
construye colocando la variable de interés en el eje horizontal y la frecuencia, la frecuencia relativa o la frecuencia
porcentual en el eje vertical.
EJEMPLO
Uno de los más sencillos resúmenes gráficos de datos son las gráficas de puntos. En el eje horizontal se presenta el
intervalo de los datos. Cada dato se representa por un punto colocado sobre este eje.
La figura siguiente es la gráfica de puntos de los datos referidos a los días de las auditorías realizadas a 20 clientes
de una empresa de contadores públicos: 12,15,20,22,14,14,15,27,21,18,19,18,22,33,16,18,17,23,28,13.
2.5 OJIVA
La gráfica de una distribución acumulada, llamada ojiva, es una gráfica
que muestra los valores de los datos en el eje horizontal y las frecuencias
acumuladas, las frecuencias relativas acumuladas o las frecuencias
porcentuales acumuladas en el eje vertical. En la figura se muestra una
ojiva correspondiente a las frecuencias acumuladas de las duraciones de
las auditorías.
El cálculo de la media, la varianza y la desviación estándar solo aplica para las variables cuantitativas discretas y
continuas.
̅)
3.1 MEDIA ARITMÉTICA ( 𝒙
La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos
𝒙𝟏 + 𝒙𝟐 +. . … … . + 𝒙𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊
̅=
𝒙 ̅=
,𝒙
𝑵 𝑵
EJEMPLO
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Halle el peso medio.
𝒙𝟏 + 𝒙𝟐 +. . … … . + 𝒙𝒏 𝟖𝟒 + 𝟗𝟏 + 𝟕𝟐 + 𝟔𝟖 + 𝟖𝟕 + 𝟕𝟖
̅=
𝒙 = =
𝑵 𝟔
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:
𝑳𝒊𝒎𝒊𝒏𝒇𝒆 + 𝑳𝒊𝒎𝒔𝒖𝒑𝒆𝒓𝒊𝒐𝒓
𝒙̅𝒊 =
𝟐
̅̅̅𝒇
𝒙𝟏 𝟏 + ̅̅̅𝒇
𝒙𝟐 𝟐 + ̅̅̅𝒇
𝒙𝟑 𝟑 + ⋯ + ̅̅̅𝒇
𝒙𝒏 𝒏 ∑𝒏𝒊=𝟏 𝒙̅𝒊 𝒇𝒊
̅=
𝒙 → 𝒙
̅=
𝑵 𝑵
EJEMPLO
En una encuesta realizada en un inquilinato a 31 personas se obtuvieron los siguientes datos de sus edades que están
ubicados en la siguiente tabla de distribución de frecuencias en forma de datos agrupados.
Edad(xi) ̅𝒊 )
Marca de clase (𝒙 Frec. Absoluta (𝒇𝒊 ) Frec. Relat. Frec. Abs acum (𝒙̅𝒊 )(𝒇𝒊 ) ̅)
Media (𝒙
[0,10) (0 + 10) 3 3 / 3 1 =0 . 0 3 5x3 =15
=5
2 9 67
[ 1 0 , 20 ) (10+20)/2=15 6 9 15x6 = 90
[ 2 0 , 30 ) 7
[ 3 0 , 40 ) 12
[ 4 0 , 50 ) 3
Total 31
𝑳𝒊𝒎𝒊𝒏𝒇𝒆 + 𝑳𝒊𝒎𝒔𝒖𝒑𝒆𝒓𝒊𝒐𝒓 𝟎 + 𝟏𝟎 𝟏𝟎 + 𝟐𝟎
𝒙̅𝒊 = → ̅̅̅
𝒙𝟏 = = 𝟓, ̅̅̅
𝒙𝟐 = = 𝟏𝟓
𝟐 𝟐 𝟐
̅̅̅̅
𝒙𝟏 𝑓1 + ̅̅̅̅
𝒙𝟐 𝑓2 + ̅̅̅̅
𝒙𝟑 𝑓3 + ⋯ + ̅̅̅̅
𝒙𝒏 𝑓𝑛 5𝑥3 + 15𝑥6 + 25𝑥7 + 35𝑥12 + 45𝑥3 835
̅=
𝒙 = = = 26.94
𝑁 31 31
3.2 MODA
La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo. Se puede hallar la moda para
variables cualitativas y cuantitativas.
✓ Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la
distribución es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 (Mo = 1, 5, 9)
✓ cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
✓ Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos
puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8 La moda es Mo = 4
En la pregunta hecha a 54 personas ¿Cuál es su mascota favorita? Se obtienen los siguientes datos
Mascota No de Respuestas
Gato 14
Tortuga 5
Pez 15
Perro 22
Pájaro 9
4. MEDIDAS DE DISPERSION
4.1 RANGO
Es un valor numérico que indica la diferencia entre el valor máximo y el valor mínimo de una muestra o población
https://economipedia.com/definiciones/rango-estadistica.html
4.2. VARIANZA
Sirve para identificar a la media de las desviaciones cuadráticas de una variable de carácter aleatorio,
considerando el valor medio de ésta. Es una medida de dispersión que representa la variabilidad de una serie de
datos respecto de la media.
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución
estadística.
̅)𝟐 + (𝒙𝟐 − 𝒙
(𝒙𝟏 − 𝒙 ̅)𝟐 + (𝒙𝟑 − 𝒙
̅)𝟐 + ⋯ … … … . . +(𝒙𝒏 − 𝒙
̅)𝟐 ∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅)𝟐
𝝈𝟐 = =
𝑵 𝑵
La desviación estándar o desviación típica es una medida que ofrece información sobre la dispersión media de una
variable. La desviación estándar es siempre mayor o igual que cero. La desviación estándar es la raiz cuadrada de
la varianza.
El coeficiente de variación, también denominado coeficiente de variación de Pearson, es una medida estadística que
nos informa acerca de la dispersión relativa de un conjunto de datos. Su cálculo se obtiene de dividir la desviación
típica entre el valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para su mejor
comprensión.
𝑪𝑽 =
µ
EJEMPLO
Las medidas de las alturas de algunos perros hasta los hombros en
milímetros son: 600, 470, 170, 430 y 300.
Calcule la media, la varianza y la desviación estándar para datos no
agrupados.
𝟔𝟎𝟎+𝟒𝟕𝟎+𝟏𝟕𝟎+𝟒𝟑𝟎+𝟑𝟎𝟎 𝟏𝟗𝟕𝟎
̅=
𝒙 = = 𝟑𝟗𝟒
𝟓 𝟓
La varianza es
(𝟔𝟎𝟎 − 𝟑𝟗𝟒)𝟐 + (𝟒𝟕𝟎 − 𝟑𝟗𝟒)𝟐 + (𝟏𝟕𝟎 − 𝟑𝟗𝟒)𝟐 + (𝟒𝟑𝟎 − 𝟑𝟗𝟒)𝟐 + (𝟑𝟎𝟎 − 𝟑𝟗𝟒)𝟐
𝝈𝟐 = = 𝟐𝟏. 𝟕𝟎𝟒
𝟓
(𝟐𝟎𝟔)𝟐 + (𝟕𝟔)𝟐 + (−𝟐𝟐𝟒)𝟐 + (𝟑𝟔)𝟐 + (−𝟗𝟒)𝟐
𝝈𝟐 = = 𝟐𝟏. 𝟕𝟎𝟒
𝟓
La desviación estándar es
𝟏𝟒𝟕
El coeficiente de variación: 𝑪𝑽 = = =
µ 𝟑𝟗𝟒
𝑥1 − 𝑥̅ )2 𝑓1 + (̅̅̅
(̅̅̅ 𝑥2 − 𝑥̅ )2 𝑓2 + (̅̅̅
𝑥3 − 𝑥̅ )2 𝑓3 +. . . … + (̅̅̅
𝑥𝑛 − 𝑥̅ )2 𝑓𝑛 ∑𝒏𝒊=𝟏(̅̅̅ ̅)𝟐 𝒇𝒊
𝒙𝒊 − 𝒙
𝜎2 = , 𝝈𝟐 =
𝑁 𝑵
𝒙̅𝒊 𝑒𝑠 𝑙𝑎 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑦 𝒙 ̅ 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎
ACTIVIDAD
[40-50) 45 9
[50-60) 8
[60-70) 4
[70-80) 2
Total 42
BIBLIOGRAFIA
Estadística para administración y economía. David R. Anderson University of Cincinnati, Dennis J. Sweeney University of Cincinnati
Thomas A. Williams Rochester Institute of Technology /10a. Edición.
Estadística Descriptiva. Salvador Monroy Saldivar. Primera Edición 2008. Instituto Politécnico de México.
WEBGRAFIA
https://www.youtube.com/watch?v=bKK0kXzwpgs
https://www.youtube.com/watch?v=CmSZwmoGnJY&t=79s
http://www.disfrutalasmatematicas.com/datos/desviacion-estandar.html
https://definicion.de/varianza/
http://www.vitutor.com/estadistica/descriptiva/a_3.html
https://www.portaleducativo.net/octavo-basico/792/Media-moda-y-mediana-para-datos-agrupados
http://www.monografias.com/trabajos89/desviacion-estandar/desviacion estandar.shtml#ixzz4qjhHvKdB
https://sites.google.com/site/tallerdebioestadistica/estadistica-descriptiva/1-3-escalas-de-medicion-escala-nominal-ordinal-de-intervalo-y-
de-razon
https://azsalud.com/ciencia/tipos-de-graficas
https://economipedia.com/definiciones/desviacion-tipica.html
https://www.uv.es/webgid/Descriptiva/3_distribucin_de_frecuencias.
https://www.questionpro.com/blog/es/escala-nominal/
Documento seleccionado y organizado por el profesor de matemáticas UIS-IPRED Esp. Ernesto Lozano.