Está en la página 1de 56

Tecnológico Nacional de México.

Campus Tapachula.

Ingeniería en sistemas computacionales.

Probabilidad y estadística.
Clave grupal: AEF1052-ISC2D.

Tema 1: Estadística descriptiva.


Actividad: Resumen y paráfrasis del tema 1.

Alumno:
Sanchez Hernandez Owen Emmanuel.
Numero de control: 21510440.

Catedrático:
Renato Gilberto De León Pascacio.

Tapachula, Chiapas, 25 de febrero de 2022.

1
Índice:
Introducción………………………………………………………………………4,5
Capitulo (2): Distribución de frecuencias……………………………………6
Fila de datos…………………………………………………………………………6
Ordenaciones……………………………………………………………………7,8
Distribuciones de frecuencias………………………………………………………8,9
Intervalos de clase y límites de clase……………………………………………10
Tamaño o anchura de un intervalo de clase………………………………………11
Marca de clase…………………………………………………………………………11
Reglas generales para formar distribuciones de frecuencia………………………12
Histogramas y polígonos de frecuencias…………………………………………12,13
Distribuciones de frecuencias relativas……………………………………………13,14
Distribuciones de frecuencias acumuladas y ojivas……………………………14,15
Distribuciones de frecuencias relativas acumuladas y ojivas de porcentajes……
15,16,17.
Curvas de frecuencia y ojivas suavizadas …………………………………………17
Tipos de curvas frecuencias…………………………………………………………17
Capitulo (3): Media, mediana, moda y otras medidas de tendencia central……
18
Notación de índices………………………………………………………………18,19
Notación de suma…………………………………………………………………19
Promedios o medidas de tendencia……………………………………………20,21
Media aritmética…………………………………………………………………21,22
Media aritmética ponderada…………………………………………………22,23,24
Propiedades de la media aritmética……………………………………………24,25,26
Calculo de la media aritmética para datos agrupados………………………26,27,28
Mediana……………………………………………………………………………29,30
La moda………………………………………………………………………………30,31
Relación empírica entre media, mediana y moda……………………………31,32

2
La media geométrica G………………………………………………………32,33
La media armónica H………………………………………………………33,34,35
Relación entre las medidas aritmética, geométrica y armónica……………35,36
Media cuadrática…………………………………………………………………36,37
Cuartiles, deciles y percentiles……………………………………………37,38,39,40
Capitulo (4): La desviación típica y otras medidas de dispersión……………40
Dispersión o variación…………………………………………………………40,41
Rango……………………………………………………………………41,42,43
Desviación media…………………………………………………………………44,45
Rango semi-intercuartil……………………………………………………………46
Rango percentil…………………………………………………………………46,47
La desviación típica en estadística……………………………………………47,48
La varianza……………………………………………………………………………48,49
Métodos cortos para calcular la desviación típica…………………………49,50,51
Comprobación de charlier…………………………………………………………51
Corrección de shepoard para la varianza………………………………………51,52
Relaciones empíricas entre las medidas de dispersión …………………………52
Dispersion absoluta y relativa: Coeficiente de variación………………………52,53
Variables tipificadas: Unidades estándar……………………………………………53
Bibliografías……………………………………………………………………………53
Paráfrasis………………………………………………………………54,55,56

3
Introducción:
Filas de datos:
Una fila de datos consiste en datos recogidos que no han sido organizados
numéricamente, por ejemplo, las alturas de 100 estudiantes por letra alfabética.
es un conjunto de datos usualmente presentado en forma tabular. Cada columna
representa un variable en particular. Cada fila corresponde a un miembro dado del
conjunto de datos en cuestión. Alista valores para cada variable, tal como la altura
o el peso de un objeto. Cada valor se conoce como un dato. Cada conjunto de
datos puede incluir datos para uno o más miembros, correspondiendo al número
de filas.

Además, lo ya mencionado es solo una pequeña prueba de el contenido de este


extenso, un poco largo y muy pero muy largo, pero representa puntos muy
importantes de la probabilidad y estadística descriptiva.
Otro pequeño bocado o prueba de lo que se viene es:
Las distribuciones de frecuencias son tablas en que se dispone las modalidades
de la variable por filas. En las columnas se dispone el número de ocurrencias por
cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es
facilitar la obtención de la información que contienen los datos.

Intervalos de Clase:
Son los intervalos en los que se agrupan y ordenan los valores observados. Cada
uno de estos intervalos está delimitado (acotado) por dos valores extremos que les
llamamos límites. Dónde: K=Número de intervalos el cual siempre debe ser un
número entero.
Polígonos de frecuencias
Son diagramas de línea que se obtienen al unir los puntos medios del lado
superior de cada rectángulo del histograma correspondiente. ... Recuerda que el
histograma y el polígono de frecuencias son gráficos que se utilizan para
representar distribuciones de frecuencias para datos agrupados.
En estadística, una ojiva es un gráfico que muestra la curva de una función de
distribución acumulativa dibujada a mano o en software de computadora. ... Este

4
es un tipo de gráfico de frecuencia y también se denomina polígono de frecuencia
acumulada.

La estadística descriptiva es, junto con la inferencia estadística o estadística


inferencial, una de las dos grandes ramas de la estadística. Su propio nombre lo
indica, trata de describir algo. Pero no describirlo de cualquiera forma, sino de
manera cuantitativa. Pensemos en el peso de una caja de verduras, en la altura de
una persona o en la cantidad de dinero que gana una empresa. 

 Medidas de tendencia central: Denominadas así porque ofrecen


información sobre el centro de conjunto de datos. Por ejemplo, la media es
una medida de tendencia o posición central ya que el promedio nos ofrece
un valor centrado del conjunto de datos. ¿Dónde podríamos decir que se
encuentra el punto medio? En el centro, en la mitad aproximadamente. Otro
ejemplo de medida de tendencia central es la mediana.
 Medidas de dispersión: También son conocidas como medidas de
variabilidad. Por ejemplo, la desviación típica es una medida de variabilidad
ya que nos dice si los valores de un conjunto de datos son muy dispares o
no. Dos ejemplos más sobre medidas de dispersión podrían ser la varianza
y el rango estadístico.

La estadística descriptiva es aplicable en casi todas las áreas donde se


recopilan datos cuantitativos. Puede brindar información acerca de
productos, procesos o diversos aspectos del sistema de gestión de la
calidad, como también en el ámbito de la dirección y organización de
personas, la logística, etc.

5
Capítulo 2)
Distribuciones de frecuencias.

 Filas de datos:
Una fila de datos consiste en datos recogidos que no han sido organizados
numéricamente, por ejemplo, las alturas de 100 estudiantes por letra alfabética.
es un conjunto de datos usualmente presentado en forma tabular. Cada columna
representa un variable en particular. Cada fila corresponde a un miembro dado del
conjunto de datos en cuestión. Alista valores para cada variable, tal como la altura
o el peso de un objeto. Cada valor se conoce como un dato. Cada conjunto de
datos puede incluir datos para uno o más miembros, correspondiendo al número
de filas.

Un conjunto de datos tiene varias características que definen su estructura y


propiedades. Estos incluyen el número y tipos de atributos o variables y las
medidas estadísticas que los puede aplicar tales como deviación estándar y
curtosis.[1]

En el caso más sencillo, existe tan solo un variable, y luego el conjunto de datos
consiste de una columna singular de variables, frecuentemente representado
como una lista. A pesar de su nombre, un conjunto de datos uní variado no es un
conjunto matemático en el sentido matemático común, dado que un valor dado
puede repetir múltiples veces. Normalmente la orden no es importante, y luego la
colección de los valores puede ser considerado como un multiconjunto en lugar de
una lista ordenada.

Los valores pueden ser números, tales como números reales o números enteros,
por ejemplo, representando la altura de una persona en centímetros, pero también
puede ser datos nominales (i.e., no consistiendo de valores numéricos), por
ejemplo, representando el grupo étnico de una persona. Mas generalmente, los
valores pueden ser de todos los tipos descritos como una medición. Para cada

6
variable, los valores normalmente serán todos del mismo tipo. Sin embargo,
pueden existir "valores perdidos", que deben ser indicados de alguna manera.

En la estadística, los conjuntos de datos usualmente provienen de observaciones


actuales obtenidos a través de muestreo, una población estadística, y cada fila
corresponde a observaciones sobre un elemento de esta población. Conjuntos de
datos pueden ser generados a través de algoritmos para el fin de comprobar
ciertos tipos de software. Algún software estadístico moderno tales como SPSS
presentarán sus conjuntos de datos de una manera clásica.

 Ordenaciones:

Una ordenación es un conjunto de datos numéricos en orden creciente o


decreciente. La diferencia entre mayor y el menor se llama rango de ese conjunto
de datos.
La ordenación organiza los datos en orden alfabético o numérico ascendente o
descendente. ... Puede ordenar los elementos de una tabla de referencias
cruzadas en orden ascendente o descendente basándose en una etiqueta o en un
valor numérico.
La ordenación organiza los datos en orden alfabético o numérico ascendente o
descendente. Por ejemplo, puede ordenar una columna que enumere los valores
de las ventas de un producto en orden descendente para ordenar las ventas del
producto de la más alta a la más baja.
Se les conoce también como permutaciones sin repetición. El número de
ordenaciones de n objetos es el número de formas en los que pueden acomodarse
esos objetos en términos de orden: Como ves, las ordenaciones de n objetos
corresponden a la factorial de n.
Existen dos maneras de ordenar o combinar resultados de eventos dependientes.
Las permutaciones son agrupaciones en las que importa el orden de los objetos.
Las combinaciones son agrupaciones en las que el contenido importa, pero el
orden no.

Ordenación de listas

7
Puede ordenar los elementos de un informe de lista en orden ascendente o
descendente en función de un valor alfabético o numérico como, por ejemplo,
nombre de empleado o ingresos.
Ordenación de tablas de referencias cruzadas
Puede ordenar los elementos de una tabla de referencias cruzadas en orden
ascendente o descendente basándose en una etiqueta o en un valor numérico.
Ordenación de gráficos
Puede ordenar los elementos de un gráfico en orden ascendente o descendente
en función de un valor numérico o una etiqueta, como ingresos o nombre de
empleado.
Eliminar ordenaciones con el botón Ordenar
Puede utilizar el botón Ordenar de la barra de herramientas o del menú contextual
para eliminar ordenaciones de listas, tablas de referencias cruzadas y gráficos.
Eliminar ordenaciones mediante la barra de información
Puede utilizar la barra de información para eliminar ordenaciones de listas, tablas
de referencias cruzadas y gráficos.

 Distribución de frecuencias:

Las distribuciones de frecuencias son tablas en que se dispone las modalidades


de la variable por filas. En las columnas se dispone el número de ocurrencias por
cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es
facilitar la obtención de la información que contienen los datos.

Quieren conocer si un grupo de individuos está a favor o en contra de la exhibición


de imágenes violentas por televisión, para lo cual han recogido los siguientes
datos:

8
La inspección de los datos originales no permite responder fácilmente a
cuestiones como cuál es la actitud mayoritaria del grupo, y resulta bastante más
difícil determinar la magnitud de la diferencia de actitud entre hombres y mujeres.
Podemos hacernos mejor idea si disponemos en una tabla los valores de la
variable acompañados del número de veces (la frecuencia) que aparece cada
valor:

X: Símbolo genérico de la variable.


f: Frecuencia (también se simboliza como ni).

Alturas de 100 estudiantes:

Altura (in) Número de


estudiantes

60-62 5
63-65 18
66-68 42
69-71 27
72-74 8

Total 100

9
 Intervalos de clase y límites de clase:

El símbolo que define una clase, como el 60–62 se llama intervalo de clase. A los
números 60 y 62 se les conoce como límites de clase; el número más pequeño
(60) es el límite inferior de clase, mientras que el número más grande (62) es el
límite superior de clase. ... TAMAÑO O AMPLITUD DE UN INTERVALO DE
CLASE.
Intervalos de Clase: Son los intervalos en los que se agrupan y ordenan los
valores observados. Cada uno de estos intervalos está delimitado (acotado) por
dos valores extremos que les llamamos límites. Dónde: K=Número
de intervalos el cual siempre debe ser un número entero.
La marca de clase es el punto medio de cada intervalo (en este caso: 2; 5,5; 7,5 y
9,5). ... El intervalo se suele utilizar cuando el número de valores distintos que
puede adoptar una variable es muy elevado, de modo que se recurre a la
agrupación de esos valores para simplificar los cálculos.

Cada clase está delimitada por el límite inferior de la clase y el límite superior de la
clase. En una distribución de frecuencias agrupadas el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en
el siguiente intervalo.
Los límites de clase superior o inferior establecidos en una distribución o tabla de
frecuencias, nos indican las cotas o fronteras de cada clase en la distribución y
pueden ser reales u ordinarias.

 Fronteras de clase:
En la práctica, las fronteras de clase se obtienen promediando los límites superior
e inferior de un intervalo de clase. ... El tamaño o la amplitud de un intervalo de
clase es la diferencia entre las fronteras de clase inferior y superior y se le conoce
como amplitud, tamaño o longitud de clase. A veces se usan las fronteras de clase
como símbolos para la clase.
Si se miden estaturas con exactitud de 1 pulg., en teoría el intervalo de clase 60–
62 incluye todas las medidas desde 59.5000 hasta 62.5000 pulg. Estos números,

10
indicados brevemente por los números exactos 59.5 y 62.5 se llaman fronteras de
clase o limites verdaderos de clase; el número menor (59.5) es la frontera inferior
de clase y el número mayor (62.5), la frontera superior de clase.

En la práctica, las fronteras de clase se obtienen promediando los límites superior


e inferior de un intervalo de clase. Algunas veces se emplean las fronteras para
simbolizar clases. Por ejemplo, las clases en la primera columna de la tabla 2–1 se
podrían indicar mediante 59.5–62.5, 62.5–65.5, etcétera.

 Tamaño o anchura de un intervalo de clase.

El tamaño o anchura de un intervalo de clase es la diferencia entre los límites


reales de clase que lo forman y se conoce como anchura de clase, tamaño de
clase o longitud de clase. ... En tal caso, c es igual a la diferencia entre dos
sucesivos límites de clase inferiores o superiores.
¿Cómo se calcula el tamaño de los intervalos?
El tamaño de clase se obtiene al dividir el rango entre el número de clases, y se
representa con la letra c. E) Elaboración de intervalos. superior (LS).
Cada intervalo se forma sumando al límite inferior (LI) un número menos que
el tamaño de clase para obtener el límite superior (LS).
¿Qué es el ancho de un intervalo en estadística?
El número de mediciones que quedan dentro del intervalo se llama frecuencia del
intervalo y se denota por. La diferencia entre el extremo mayor y el extremo menor
del intervalo se llama longitud o ancho del intervalo.
¿Cómo se determina el ancho de clase?
Dividir el rango entre el número de clases, para hallar el ancho de clase.

 Marca de clase.

La marca de clase es el punto medio del intervalo de clase y se obtiene


promediando los limites inferior y superior de clase.
La marca de clase se denomina también punto medio de la clase.

11
La marca de clase, es el punto medio del intervalo de la clase, se denota por Su
valor es obtenido al promediar los extremos del intervalo. La marca de clase es el
valor central que representa una clase. Se obtiene al sumar los límites del
intervalo y dividir este valor entre dos.
¿Cuáles son las marcas de clase?
La marca de clase es el punto medio de cada intervalo.
La marca de clase es el valor que representa a todo el intervalo para
el cálculo de algunos parámetros como la media aritmética o la desviación típica.

 Reglas generales para formar distribuciones de frecuencias.

 Determinar el mayor y menor de todos los datos, hallando así el rango


(diferencia entre ambos)
 Dividir el rango en un número adecuado de intervalos de clase del mismo
tamaño. Se suelen tomar entre 50 y 20 intervalos de clase, según los datos.
Los intervalos de clase se eligen también de modo tal que las marcas de
clase (o puntos medios) coincidan con datos realmente observados. Ello
tiende a disminuir el llamado error de agrupamiento que se produce en
análisis ulteriores. No obstante, las fronteras de clase no deberían coincidir
con datos realmente observados.
 Determinar el número de observaciones que caen dentro de cada intervalo
de clase; esto es, hallar las frecuencias de clase. Esto se logra mejor con
una hoja de recuentos.

 Histogramas y polígonos de frecuencias.

Polígonos de frecuencias

Son diagramas de línea que se obtienen al unir los puntos medios del lado
superior de cada rectángulo del histograma correspondiente. ... Recuerda que el

12
histograma y el polígono de frecuencias son gráficos que se utilizan para
representar distribuciones de frecuencias para datos agrupados.
Para completar el polígono, se tiene en cuenta un punto en la marca de clase del
intervalo que esta al inicio y otro punto en la marca de clase del intervalo final del
histograma, ambos con frecuencia 000.
El gráfico generado es un polígono, ya que está formado por segmentos rectos
consecutivos.
Recuerda que el histograma y el polígono de frecuencias son gráficos que se
utilizan para representar distribuciones de frecuencias para datos agrupados.

Un histograma es una representación gráfica de una variable en forma de barras,


teniendo en cuenta que la superficie de cada barra es proporcional a la frecuencia
de los valores representados. Un histograma nos permite ver cómo se distribuyen
los valores de la variable en estudio.

Pasos para construir un Histograma


Partimos de una tabla de frecuencias con datos agrupados y se siguen los
siguientes pasos:

1.En el eje horizontal (X), colocamos los límites de clase.

2.En el eje vertical (Y), colocamos las frecuencias.

3.Dibujamos las barras de cada clase, teniendo en cuenta que la altura de cada
barra es igual a la frecuencia.

 Distribuciones de frecuencias relativas.

Una distribución de frecuencia relativa describe los porcentajes del número total
de observaciones correspondiente a cada categoría. Una distribución de
frecuencia relativa no nos indica cuál es el número de observaciones en cada
categoría, sino cuál es el porcentaje de observaciones en cada categoría.
13
¿Cómo se hace una distribución de frecuencia relativa?
Para construir la tabla de frecuencias, sigue los siguientes pasos:
1. Halla el número total de elementos en el estudio (n).
2. Establece las categorías (Xi). ...
3. Halla las frecuencias absolutas (ni).
4. Halla las frecuencias absolutas acumuladas (Ni).
5. Halla las frecuencias relativas (fi).

 Distribuciones de frecuencias acumuladas y ojivas.

En estadística, una ojiva es un gráfico que muestra la curva de una función de


distribución acumulativa dibujada a mano o en software de computadora. ... Este
es un tipo de gráfico de frecuencia y también se denomina polígono de frecuencia
acumulada.
Una ojiva se construye sobre un sistema de ejes perpendiculares. Colocamos en
el eje horizontal los límites de los intervalos de clase determinados previamente.
En base a cada uno de estos valores límite, determinamos la ordenada de la altura
igual a la frecuencia acumulada correspondiente a este valor. Uniendo por
segmentos de línea los puntos sucesivos así determinados, obtenemos una línea
llamada ojiva. Normalmente colocamos la frecuencia acumulada en el eje vertical
izquierdo y el porcentaje de frecuencia acumulada en el eje vertical derecho.
Las ojivas son especialmente útiles para estimar los percentiles en una
distribución. Por ejemplo, podemos conocer el punto central para que el 50% de
las observaciones estén por debajo de este punto y el 50% por encima. Para
hacer esto, dibujamos una línea desde el punto del 50% en el eje de porcentaje
hasta que se cruza con la curva. Luego proyectamos verticalmente la intersección
en el eje horizontal. La última intersección nos da el valor deseado. El polígono de
frecuencia y la ojiva se usan para comparar dos conjuntos estadísticos cuyo
número podría ser diferente.

¿Qué es la distribución de frecuencia acumulada?


La frecuencia acumulada es el resultado de sumar sucesivamente
las frecuencias absolutas o relativas, desde el menor al mayor de sus valores.

14
Para calcular la frecuencia acumulada hay que ordenar los datos de menor a
mayor. Para un cálculo más sencillo y una imagen más visual, estos se colocan en
una tabla.
La frecuencia acumulada es el resultado de sumar sucesivamente las frecuencias
absolutas o relativas, desde el menor al mayor de sus valores.

Para calcular la frecuencia acumulada hay que ordenar los datos de menor a
mayor. Para un cálculo más sencillo y una imagen más visual, estos se colocan en
una tabla. Tras tener los datos ordenados y tabulados, la frecuencia acumulada se
obtiene simplemente de ir sumando una clase o grupo de la muestra con la
anterior (primer grupo + segundo grupo, primer grupo + segundo grupo + tercer
grupo y así sucesivamente hasta llegar a acumular del primer grupo al último).

 Distribuciones de frecuencias relativas acumuladas y ojivas de


porcentajes.

¿Qué es una distribución de frecuencia relativa acumulada u ojiva porcentual?


Distribuciones de frecuencia relativa.

La frecuencia relativa de una clase es la frecuencia de la clase dividida por el total


de frecuencias de todas las clases y se expresa generalmente como porcentaje.
Por ejemplo, la frecuencia relativa de la clase 66 – 68 de la Tabla 1 es 42/100 = 42
%.

La frecuencia relativa de una clase es la frecuencia de la clase dividida por el total


de frecuencias de todas las clases y se expresa generalmente como porcentaje.
Por ejemplo, la frecuencia relativa de la clase 66 – 68 de la Tabla 1 es 42/100 = 42
%. La suma de las frecuencias relativas de todas las clases es evidentemente 1 o
100 %.

15
Si las frecuencias en la anterior tabla de frecuencias se sustituyen por las
correspondientes frecuencias relativas, la tabla resultante se llama distribución de
frecuencias relativas, distribución porcentual o tabla de frecuencias relativas.

Las representaciones gráficas de distribuciones de frecuencia relativa pueden


obtenerse del histograma o del polígono de frecuencias, sin más que cambiar la
escala vertical de frecuencia a frecuencia relativa, conservándose exactamente el
mismo diagrama. Los gráficos que resultan se llaman histogramas de frecuencias
relativas o histogramas porcentuales y polígonos de frecuencias relativas o
polígonos porcentuales, respectivamente.

¿Qué es la distribución de porcentajes?


Una tabla de distribución de frecuencias relativas o distribución porcentual se
obtiene al sustituir las frecuencias relativas por las frecuencias de las clases. ...
Especifica el rango de datos de la tabla y Excel creará una tabla dinámica vacía
con sus campos disponibles.

DISTRIBUCIONES DE FRECUENCIA RELATIVA.

La frecuencia relativa de una clase es la frecuencia de la clase dividida por el total


de frecuencias de todas las clases. El resultado se expresa generalmente como
porcentaje. La suma de las frecuencias relativas de todas las clases es 1 o 100%.
Una tabla de distribución de frecuencias relativas o distribución porcentual se
obtiene al sustituir las frecuencias relativas por las frecuencias de las clases. Las
gráficas no cambian.

En la parte vertical de los ejes de coordenadas únicamente pondríamos las


frecuencias relativas. Los gráficos que resultan se llaman histogramas de
frecuencias relativas o histogramas porcentuales y polígonos de frecuencias
relativas o polígonos porcentuales.

DISTRIBUCIONES DE FRECUENCIA ACUMULADA.

Una distribución de frecuencias acumulada está diseñada para mostrar el número


o porcentaje de elementos que son menores que cierto valor especifico o iguales a

16
éste. Las distribuciones se pueden convertir fácilmente a distribuciones
acumuladas mediante sumas sucesivas de frecuencias de clase, es decir la
frecuencia total de todos los valores menores que el límite real superior de clase.

 Curvas de frecuencia y ojivas suavizadas.

Por esta razón una curva de frecuencias se conoce como un polígono


de frecuencias suavizado. De una forma análoga las ojivas
suavizadas provienen de la suavización de los polígonos
de frecuencias acumuladas u ojivas. Normalmente es más sencillo suavizar
una ojiva que un polígono de frecuencias.

¿Qué es una curva de frecuencia u ojiva suavizada?


En estadística, una ojiva es un gráfico que muestra la curva de una función de
distribución acumulativa dibujada a mano o en software de computadora. Los
puntos trazados son el límite de la clase superior y la frecuencia acumulativa
correspondiente.

Las curvas de Distribución de Frecuencia permiten examinar los Estadísticas de


Tendencia Central, estas se grafican en una curva de distribución de frecuencia,
donde en el eje horizontal se colocan las puntuaciones de izquierda a derecha,
desde la más baja hasta la más alta respectivamente.

Curva suavizada: Aproxima mediante la línea curva los vértices del histograma:
La curva suavizada tiene por finalidad visualizar la forma de la distribución
eliminando la variación ocasionada por los datos particulares con que se trabaja.

 Tipos de curvas de frecuencias.

17
 Las curvas de frecuencias de simétricas o en forma de campana, se
caracterizan porque las observaciones equidistantes del máximo central
tienen la misma frecuencia. Ejemplo importante es la curva normal.
 En las curvas de frecuencia poco asimétricas, o sesgadas, la cola de la
curva a un lado del máximo central es más larga que al otro lado. Si la cola
mayor está a la derecha, la curva se dice asimétrica a la derecha o de
asimetría positiva. En caso contrario, se dice asimétrica a la izquierda o de
asimetría negativa.
 En una curva en forma de J o de J invertida, hay un máximo en un extremo.
 Una curva de frecuencia en forma de U tiene máximos en ambos extremos.
 Una curva de frecuencia bimodal tiene dos máximos.
 Una curva de frecuencia multimodal tiene más de dos máximos.

Capítulo 3)

Media, mediana, Moda y otras medidas de tendencia central.

 NOTACIÓN DE ÍNDICES:

Un número índice es una medida estadística que permite estudiar las


fluctuaciones o variaciones de una (o más) magnitud(es) en relación al tiempo o al
espacio. Los índices más habituales son los que realizan las comparaciones en el
tiempo, por lo que, como veremos más adelante, los números índices son en
realidad series temporales.

Los números índices vienen de la necesidad de conocer en profundidad la


magnitud de un fenómeno y poder realizar comparaciones del mismo en distintos
territorios o a lo largo del tiempo. Una forma inicial de resolver el problema es
referir cada situación a la anterior, pero esto no hace viable la posibilidad de
comparaciones significativas, al menos directamente, salvo en lo concerniente a
dos de ellas inmediatas. Por esto es más conveniente escoger una situación

18
determinada como punto de referencia inicial, para remitir a ella todas las demás
observaciones, esta situación se denomina situación base y las comparaciones
que se realizan vienen establecidas a través de un número índice. Los números
índices, o simplemente índices, proporcionan comparaciones entre datos
correspondientes a diferentes situaciones, escalonadas con arreglo a algún criterio
conocido (por ejemplo, por el transcurso del tiempo).

Propiedades:

Uno de los problemas de mayor importancia a la hora de elaborar un número


índice es el conseguir que este sea adecuadamente representativo, para ello es
preciso que el índice cumpla ciertas propiedades de carácter matemático y reúna
ciertos requisitos en su definición:
1. Identidad. Cuando el período base y el de comparación coinciden, el índice
debe ser igual a uno.
2. Inversión. Si en un índice se invierten los períodos base y de comparación,
el índice toma el valor recíproco al anterior.
3. Circular. Si se multiplica el índice de un período Z con relación a un período
Y por el índice de Y con relación a X, el producto ha de ser el índice de Z
con relación a X.
4. Existencia. El índice ha de tomar valores reales y finitos para cualquier valor
de la variable observada.
5. Proporcionalidad. El índice elaborado sobre unos determinados valores de
una variable ha de ser proporcional al índice correspondiente a los valores
de esa variable multiplicados por un mismo número K.
6. Variación proporcional. Si los valores de la variable varían en una cierta
cuantía, el índice varía proporcionalmente.
7. Inalterabilidad. Si se introduce una nueva modalidad en el índice complejo,
de tal manera que el valor de este coincide con el del índice simple de
aquella, el índice complejo no varía.
8. Homogeneidad. El valor de un índice no ha de ser afectado por
modificaciones de las unidades de medida.

 Notación de suma:
El sumatorio (también conocido como operación de suma, notación sigma o
símbolo suma) es una notación matemática que permite representar sumas de

19
varios sumandos, n o incluso infinitos sumandos, evitando el empleo de los puntos
suspensivos o de una explícita notación de paso al límite. La notación se expresa
con la letra griega sigma mayúscula Σ.
La notación de Einstein simplemente omite la escritura del símbolo de suma, ya
que, si un índice aparece sin definición, se sobreentiende que lo que se representa
es la suma de los elementos al variar el índice. Se debe notar que, aunque el
término sumatorio se refiere a un operador matemático útil para expresar cierto
tipo de suma, no sustituye este término a la palabra suma.
Los operadores de suma son útiles para expresar sumas de forma analítica; esto
es, representar todos y cada uno de los sumandos
en forma general mediante el «i-ésimo» sumando. Así, para representar la fórmula
para hallar la media aritmética de n números

Una serie puede ser representada en una forma compacta, llamada sumatoria o
notación sigma. La letra griega mayúscula, es usada para representar la suma. La
serie 4 + 8 + 12 + 16 + 20 + 24 puede expresarse como. La expresión se lee como
la suma de 4 n como n va desde 1 a 6.

¿Cómo se utiliza la notación sumatoria?


La sumatoria o sumatorio (llamada también notación sigma) es una operación matemática
que se emplea para calcular la suma de muchos o infinitos sumandos. Expresión que se
lee: " sumatoria de Xi, donde i toma los valores desde 1 hasta n ". i es el valor inicial,
llamado límite inferior.
¿Qué significa ∑ en física?

La mayúscula Σ se usa como símbolo para: Sumatorio.

 Promedios o medidas de tendencia central:

Las medidas de tendencia central son medidas estadísticas que pretenden resumir
en un solo valor a un conjunto de valores. Representan un centro en torno al cual
se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central
más utilizadas son: media, mediana y moda.
Un promedio es un valor típico o representativo de un conjunto de datos. Como
tales valores suelen situarse hacia el centro del conjunto de datos ordenados por
magnitud, los promedios se conocen como medidas de tendencia central.

20
Se definen varios tipos, siendo los más comunes la media aritmética, la mediana,
la moda, la media geométrica y la media armónica. Cada una tiene ventajas y
desventajas, según los datos y el objetivo perseguido.
¿Qué es una media central?
La medida de tendencia central (moda, media y mediana), parámetro de tendencia
central o medida de centralización es un número ubicado hacia el centro de la
distribución de los valores de una serie de observaciones (medidas), en la que se
encuentra ubicado el conjunto de los datos.

medidas de tendencia central:


Se calcula sumando todas las observaciones de una serie de datos y luego
dividiendo el total entre el número de elementos involucrados.

 media aritmética:

¿Qué es la media aritmética?


La media aritmética es un tipo de media que otorga la misma ponderación a todos
los valores. Existen muchos tipos de media y la más conocida es la media
aritmética. ... La media aritmética es lo que se conoce como media al uso.
Sumamos todos los valores y lo dividimos entre la cantidad de observaciones.
¿Qué es la media aritmética en estadística y cómo se calcula?
La media aritmética es el valor que se obtiene al sumar todos los datos que
tenemos y dividir el resultado entre el número total de esos datos.
 La media aritmética es un tipo de media que otorga la misma ponderación a
todos los valores.

En este tipo de artículo veremos la definición, la explicación y el símbolo de


la media aritmética.

La media aritmética es lo que se conoce como media al uso. Sumamos


todos los valores y lo dividimos entre la cantidad de observaciones. Por
ejemplo, imaginemos que queremos saber a cuantos trozos de pizza
tocamos. Hay 10 trozos y somos 5 personas. Si lo repartimos a partes
iguales, el resultado será de 2 trozos por persona. Sin darnos cuenta,
acabamos de calcular una media aritmética.

21
Lo hacemos cada día constantemente y sin ser conscientes de ello. Otro
ejemplo, tengo 2 horas para realizar tres ejercicios de estadística. Así pues,
dado que en total tengo disponibles 120 minutos, dedicaré en promedio 40
minutos a cada ejercicio. Puede que le dediquemos 60 minutos a uno y 30
minutos a cada uno de los otros dos, sin embargo, nuestra cabeza lo suele
calcular de este modo.

Cómo calcular la media aritmética:


Para calcular la media aritmética es necesario realizar la suma del número
de valores de los que queremos conocer su media. Por ejemplo, si
queremos repartir caramelos entre los alumnos de una clase de forma
equitativa, en primer lugar, calcularemos cuantos caramelos tenemos en
total.
Posteriormente, debemos de saber entre cuantos alumnos se van a repartir,
para poder calcular la media aritmética. El número de caramelos lo
dividiremos entre el número de alumnos y obtendremos cuántos caramelos
tendremos que darle a cada uno de ellos para que se repartan de forma
igualitaria.

la fórmula se lee tal que así: Sumatorio desde 1 hasta N de la variable x


dividido entre N. Adicionalmente, podríamos añadir un comentario que
indicase: con i entre 1 y N. Vamos a ver ahora, qué significa todo esto.

 Media aritmética ponderada:

¿Qué es la media aritmética ponderada?

La media ponderada (MP) es una medida de centralización. ... La media


ponderada tiene numerosas aplicaciones, por ejemplo, la nota de una
asignatura donde el examen final tiene un peso mayor al de un trabajo. O
en el cálculo del IPC (Índice de Precios de Consumo).

¿Qué es la media aritmética ponderada y cómo se calcula?

La media ponderada o media aritmética ponderada es una media de


centralización que da una importancia distinta a cada uno de los valores
sobre los que se calcula la media. En una media ponderada cada valor se
multiplica por un peso, y el total es dividido por la suma de los pesos.

22
La media ponderada es un tipo de media que otorga diferentes pesos a los
distintos valores sobre los que se calcula.

Una de las medias más utilizadas por su versatilidad es la media


ponderada. Se diferencia de la media aritmética en que no les da la misma
importancia a todos los valores. De hecho, como veremos más tarde, en
realidad la media aritmética es una media ponderada en la que todos los
valores son igual de importantes.

La media ponderada se hace muy útil, por ejemplo, para calcular notas de
una asignatura. Queremos tener en cuenta para valorar la nota final que un
alumno haya realizado los ejercicios, los trabajos y haya participado en
clase. Claro que, no podemos darle la misma importancia que al examen
final. En el examen final debe mostrar que, efectivamente, ha adquirido los
conocimientos. Un profesor de matemáticas podría, por ejemplo, indicar
que la nota del examen tiene una ponderación del 70%, la realización de
ejercicios un 20% y la participación en clase un 10%.

Para cada uno de los casos anteriores, tendremos una nota distinta. Por
ejemplo, en el examen un 8,5, en los ejercicios un 7,3 y en la participación
en clase un 9,3. ¿Cómo calculamos la media si tenemos valores diferentes,
con diferentes porcentajes? Para ello se utiliza la media ponderada.

La segunda parte de la fórmula se lee tal que así: Sumatorio desde 1 hasta
N de x sub i por el peso de x sub i. Vamos a desarrollar todo esto de forma
mucho más sencilla:

 Sumatorio: El sumatorio nos indica que debemos sumar un conjunto de


valores desde el primero, hasta el N. Así, si existen 10 valores, deberemos
sumar el primero, el segundo, el tercero, …, y el décimo. En este caso, es
una suma de productos. Por tanto, lo que deberemos hacer es sumar el
resultado de los productos.
 N: Representa el número total de observaciones. Por ejemplo, si la nota de
nuestra asignatura depende de tres factores (examen, ejercicios y
participación) N valdrá tres.
 x: La variable X es sobre la que calculamos la media ponderada. Siguiendo
el ejemplo de la nota final de la asignatura, X sería la nota en número de
cada parte.
 i: Representa la posición de cada observación. En este ejemplo, podríamos
ponerle un número a cada factor al examen el 1, a los ejercicios un 2 y a la

23
participación un 3. De manera que x1 es la nota del examen, x2 la nota de
los ejercicios y x3 la nota de la participación en clase.
 Por último, a diferencia de la media aritmética aparece el valor P. La P es
de porcentaje, peso o ponderación. Cualquiera de las tres palabras es
equivalente en estos casos. Será el peso otorgado a cada una de las
partes, examen 70%, ejercicios 20% y participación un 10%. Hemos de
recordar, no obstante que debemos expresar los porcentajes en tanto por
uno.

 Propiedades de la media aritmética:

1. La suma de las desviaciones de todas las puntuaciones de una


distribución respecto a la media de la misma igual a cero. 2. ... Si a
todos los valores de la variable se les suma un mismo número, la
media aritmética queda aumentada en dicho número.

Observaciones sobre la media aritmética:

1. La media se puede hallar sólo para variables cuantitativas.

2. La media es independiente de las amplitudes de los intervalos.

3. La media es muy sensible a las puntuaciones extremas. Si


tenemos una distribución con los siguientes pesos:

65 kg, 69kg, 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg. La media es
igual a 74 kg, que es una medida de centralización poco
representativa de la distribución.

4. La media no se puede calcular si hay un intervalo con una


amplitud indeterminada.

La medida de tendencia central más utilizada en Estadísticas y en


todos los campos de la vida cotidiana es la media aritmética. Se ha
popularizado tanto que el vocablo se ha incorporado al lenguaje
habitual sin perder su significado estadístico formal.

24
La media aritmética se define como la suma de todos los datos
dividida entre el número total de los mismos. Como habitualmente
dispondremos de una tabla de datos con sus correspondientes
frecuencias absolutas, aplicaremos:

Propiedades de la media aritmética:

 La media aritmética no suele ser un valor propio de la


variable. Si la media de un conjunto de exámenes es 6, puede
que en ninguno de los exámenes se haya obtenido una nota
exacta de 6.

Es muy sensible a cambios y valores extremos en los datos.

 Se comporta de forma natural en relación a las operaciones


aritméticas suma y producto por un escalar, es decir, si a
todos los datos de una distribución se les suma una misma
cantidad, la media resultante sería la anterior más dicha
cantidad. Si multiplicamos (o dividimos) todos los datos de
una distribución por una cantidad distinta de cero, la media
resultante sería la anterior multiplicada (respectivamente
dividida) por dicha cantidad.

El hecho de que la media aritmética sea muy sensible, cambie


mucho, frente a valore extremos de los datos es algo que constituye
un problema en tanto que lo que se pretende en última instancia es
que con el valor de la media aritmética se representen de la forma
más acertada posible todos los datos de la distribución estadística.
En algunas competiciones deportivas y en algunos eventos
importantes como por ejemplo la gimnasia artística, rítmica, saltos de
trampolín, carreras de coches y motos, para el cálculo de la media
aritmética no se utilizan todos los datos, sino que algunos se anulan
o modifican. Por ejemplo, en las notas que emiten los distintos
miembros de un tribunal en un examen de oposición, lo que en
realidad se utiliza como nota final del ejercicio del opositor es una
especie de media mejorada o recortada. Esta medida consiste en
eliminar (recortar) los datos extremos, es decir el valor más alto y el

25
más bajo y calcular después la media aritmética del resto de datos o
de los nuevos datos actualizados.

Media o promedio Windsor

Otra variante de la media aritmética que se suele utilizar para evitar


el excesivo protagonismo de los datos extremos consiste en sustituir
los datos extremos superior e inferior por sus inmediatos anteriores.
Posteriormente se calcula la media aritmética de todos los datos así
actualizados.

En el caso anterior se tendría: 7, 6, 6, 5, 10, 8 y 5. La nota más


elevada es 10 y se actualiza a 8. La nota más pequeña es 5 y se
actualiza a 5.

Calculamos ahora la media aritmética de las notas resultantes: 7, 6,


6, 5, 8, 8 y 5
Calificación final del ejercicio oral es 6,42857.
Media aritmética en el caso continuo

Para el caso de variable continua, solamente tenemos que sustituir xi


por sí siendo ésta última la marca de clase de cada intervalo; es
decir el punto medio o valor central del mismo. Por abuso de
lenguaje se suele utilizar indistintamente también para variables
continuas el símbolo xi para las marcas de clase.

 Calculo de la media aritmética para datos agrupados:

Para obtener la Media aritmética en datos agrupados en intervalos


se debe: a) Multiplicar la marca de clase por su frecuencia absoluta
en cada intervalo, luego dividir la suma obtenida por el total de datos.
b) Sumar cada variable y dividir esta suma por el total de datos.

26
Salario medio de los 70 trabajadores de la empresa
P&R.

X F F*X

$ 255.00 8 $ 2040.00
265.00 10 2650.00
275.00 16 4400.00
285.00 15 4275.00
295.00 10 2950.00
310.00 8 2480.00
350.00 3 1050.00

N=70 ∑ fx = $19,845.00

X=
∑ fx = $ 19,845.00 = $283.50
N 70

27
Salario medio de los 65 trabajadores de la empresa P&R.

X F*X
F

$ 255.00 8 $ 2040.00
265.00 10 2650.00
275.00 16 4400.00
285.00 14 3990.00
295.00 10 2950.00
310.00 5 1525.00
350.00 2 630.00

N= 65

∑ fx = $18,185.00

X = ∑N
fx $ 18,185.00
= =$ 27,976.92
65

28
 Mediana:
La mediana de un conjunto de números ordenados en magnitud es o el valor
central o la media de los dos valores centrales.
La mediana es un estadístico de posición central que parte la distribución en dos,
es decir, deja la misma cantidad de valores a un lado que a otro.
Para calcular la mediana es importante que los datos estén ordenados de mayor a
menor, o al contrario de menor a mayor. Esto es, que tengan un orden.

Imaginemos ahora que tenemos los siguientes números:


1,2,4,2,5,9,8,9.
Si los ordenamos tendríamos lo siguiente:

1,2,2,4,6,8,9,9.

En este caso, la cantidad de observaciones es par. Por tanto, de tener en cuenta


las consideraciones para el número de observaciones par. La fórmula nos indica lo
siguiente:

Mediana = 8+1 / 2 = 4,5

Claro que pensaréis, ¿cuál es la posición 4,5? O está en la posición 4 o está en la


posición 5, pero la 4,5 no existe. Lo que haremos será una media de los valores
que están en la posición 4 y 5. Esos números son el 4 y el 6. La media entre estos
dos números es 5 [ (4+6) / 2].
El valor de la mediana, por tanto, sería 5. El número 5 (nos lo imaginamos) dejaría
al lado izquierdo (1, 2, 2 y 4) la misma cantidad de observaciones que al lado
derecho (6, 8, 9 y 9).
Imaginemos que tenemos los siguientes datos:
2,4,12,6,8,14,16,10,18.
En primer lugar, los ordenamos de menor a mayor con lo que tendríamos lo
siguiente:

29
2,4,6,8,10,12,14,16,18.

Pues bien, el valor de la mediana, como indica la fórmula, es aquel que deje la
misma cantidad de valores tanto a un lado como a otro. ¿Cuántas observaciones
tenemos? 9 observaciones. Calculamos la posición con la fórmula de la mediana
correspondiente.
Mediana = 9+1 / 2 = 5

¿Qué quiere decir este 5? Nos dice que el valor de la mediana, se encuentra en la
observación cuya posición es la quinta.
Por lo tanto, la mediana de esta sería de datos sería el número 10, ya que está en
la posición quinta. Además, podemos comprobar cómo tanto a la izquierda del 5
hay 4 valores (2, 4, 6 y 8) y a la derecha del 10 hay otros 4 valores (12, 14, 16 y
18).

 La moda:

La moda de un conjunto de números es el valor que ocurre con mayor frecuencia;


es decir, el valor mas frecuente. La moda puede no existir, e incluso no ser única
encaso existir.
¿Qué es la moda en estadística?
La moda estadística de un conjunto de datos, se define como el número que está
representado más veces dentro de esos datos, es decir, aquel número que
presenta una mayor frecuencia absoluta dentro de la muestra.
Tipos de Moda Estadística
Podemos distinguir distintos tipos de moda estadística, en función del número
de números que se repitan una misma cantidad de veces, siendo ese número
de repeticiones, el máximo del conjunto. Dicho así parece algo complicado, pero
es un término mucho más simple de lo que pueda parecer.
Vamos a entenderlo mucho mejor con los siguientes ejemplos:
 MODA UNIMODAL: cuando el máximo número de repeticiones se da para
un solo número.
o Ejemplo conjunto de datos: [ 3, 5, 5, 6, 8]

30
o La moda del conjunto es 5 porque se repite en dos ocasiones,
mientras que el resto de números se repiten únicamente una vez.

MODA BIMODAL: cuando el máximo número de repeticiones se da para


dos números.
Ejemplo conjunto de datos: [ 3, 5, 5, 6, 8, 8]
La moda del conjunto sería 5 y 8 porque ambos números se repiten en dos
ocasiones, mientras que el resto de números se repiten únicamente una
vez.

MODA MULTIMODAL: cuando el máximo número de repeticiones se da


para tres o más números.
Ejemplo conjunto de datos: [ 3, 3, 5, 5, 6, 8, 8]
La moda del conjunto en este caso serían tres números, porque los tres se
repiten el mismo número de veces: 3, 5, 8.

 Relación empírica entre media, mediana y moda:


La primera relación entre estas medidas es que pertenecen a las medidas de tendencia
central, las cuales son valores numéricos que tienden a localizar, en algún sentido,
la parte central de un conjunto de datos. A menudo el término promedio se asocia
a estas mediciones. Cada una de las diferentes medidas de tendencia central
pueden recibir el nombre de valor promedio. (Sánchez, Inzunza Cazarez, & Ávila
Antuna, 2015)
COMPARACION ENTRE LA MEDIA ARITMÉTICA, LA MEDIANA Y LA MODA.
La media, de un conjunto finito de números, es igual a la suma de todos sus
valores dividida entre
el número de sumandos. Se puede hallar la media para variables cuantitativas.
¿Con qué otros nombres se le conoce?
• Media aritmética.
• Centro de gravedad.
• Promedio
• Media muestral (Cuando el conjunto es una muestra aleatoria)

31
¿Para qué nos sirve? Por ejemplo, si en una habitación hay tres personas,
La media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el
dinero de los
tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una
forma de
resumir la...

Las medidas de tendencia central se pueden clasificar en:


• medida de magnitud – media,
• medida de posición – mediana
• medida de frecuencia - la moda

En las curvas de frecuencias unimodales que son ligeramente sesgadas


(asimétricas), se tiene la relación empírica siguiente:
𝑚𝑒𝑑𝑖𝑎 − 𝑚𝑜𝑑𝑎 = 3 𝑚𝑒𝑑𝑖𝑎 − 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
En una distribución simétrica el valor de la media
aritmética, la mediana y la moda coinciden. (Murray R.
& J. Stephens, 2009)
En una distribución simétrica el valor de la media aritmética, la mediana y la moda
coinciden. (Murray R.& J. Stephens, 2009)
La media, mediana y moda son medidas de tendencia central, las cuales reciben
el nombre de valor promedio. Por lo tanto, estas mediciones son conocidas
comúnmente como promedios, y cada uno presenta una perspectiva diferente
sobre los valores que representan. Pero cada promedio es considerado válido,
correcto e informativo.

 La media geométrica G:

La media geométrica es un tipo de media que se calcula como la raíz del producto


de un conjunto de números estrictamente positivos.

32
La media geométrica se calcula como un producto conjunto. Es decir, que todos
los valores se multiplican entre sí. De modo que, si uno de ellos fuera cero, el
producto total sería cero. Por ello, debemos siempre tener en cuenta que a la hora
de calcular la media geométrica necesitamos números que sean únicamente
positivos.
Uno de sus principales usos es para calcular medias sobre porcentajes, pues su
cálculo ofrece unos resultados más adaptados a la realidad.

Donde:

 N: Se trata del número total de observaciones. Por ejemplo, si tenemos el


crecimiento de los beneficios de una empresa durante 4 periodos, N será 4.
 x: La variable X es sobre la que calculamos la media geométrica. Siguiendo
el ejemplo anterior, el crecimiento de los beneficios estará expresado en
porcentaje y será la variable X.
 i: Representa la posición de cada observación. En este ejemplo, podríamos
ponerle un número cada periodo. Un 1, al periodo 1, un 2 al periodo 2, etc.
De manera que x1 es el crecimiento de los beneficios en el periodo 1, x 2 el
crecimiento de los beneficios en el periodo 2, x 3 el crecimiento de los
beneficios en el periodo 3 y x4 el crecimiento de los beneficios en el periodo
4.

Como ya hemos indicado este tipo de media es adecuada para calcular variables
en porcentaje o índices. Una de sus principales ventajas es que es menos
sensible a valores extremos (muy grandes o muy pequeños) que podrían alterar la
media de una muestra estadística. Por el contrario, su principal desventaja es
que no puede utilizarse con números negativos.

 La media armónica H:
La media armónica (designada usualmente mediante H) de una cantidad finita de
números es igual al recíproco, o inverso, de la media aritmética de los recíprocos
de dichos valores y es recomendada para promediar velocidades.

La media armónica es igual al número de elementos de un grupo de cifras entre la


suma de los inversos de cada una de estas cifras.

33
En otras palabras, la media armónica es una medida estadística recíproca a la
media aritmética, que es la suma de un conjunto de valores entre el número de
observaciones.

Cabe destacar que N es el número de elementos sobre los cuales se calcula la


media.

Este tipo de media suele utilizarse, principalmente, en velocidades, tiempos, o en


el área de la electrónica. Sin embargo, su uso no está muy extendido en otras
disciplinas.
Debemos tener en cuenta que esta presenta ciertas desventajas, como que no
puede calcularse si una de las observaciones es igual a cero. Es decir, ninguno de
los elementos puede ser nulo.

Asimismo, resulta interesante señalar que tiene menos sensibilidad o presenta un


menor impacto ante números altos, sucediendo lo opuesto con valores pequeños.
Esto es porque el inverso de 100, por ejemplo, es 0,001, pero el de 5 es 0,2. Así,
cuanto más grande sea una observación, menos influirá en el resultado, y lo
contrario sucederá si la observación se acerca a cero.
La media armónica (H ó Mh) es una medida o estadígrafo de tendencia central
similar al promedio o media aritmética; salvo por que se construye a partir de los
valores recíprocos de la variable. ... La media armónica se calcula a partir del valor
inverso de la sumatoria del inverso de los valores de la variable.
De donde:
MH: media armónica;
n: número de datos; y
yi: cada valor observado correspondiente a la variable de interés.
A diferencia de la media aritmética que resulta altamente sensible a los valores
extremos inferiores o superiores y requiere de distribuciones más o menos
simétricas; la media armónica muestra menos
sensibilidad a los valores altos y mantiene su representatividad en distribuciones
asimétricas o discontinuas.
Esta medida utiliza todos los datos de la distribución y se emplea para promediar
variaciones con respecto a la misma variable; como pueden ser la productividad,
el precio, el tiempo, la velocidad, el rendimiento, etc.

34
El caso de la estimación de los costos que implica la generación de una señal de
televisión especial
con pauta federal, la media armónica resulta idónea para establecer un costo
promedio en virtud de:
mostrar un rango muy amplio entre las ofertas (diferencia entre los precios más
bajos y más altos);
el reducido número de propuestas de cotización para el trabajo solicitado; y la
variabilidad y asimetría entre los montos que presentan las ofertas.

 Relación entre las medias aritmética, geométrica y armónica:

En general, la media aritmética es mayor que la media geométrica y ésta, a su


vez, es mayor que la media harmónica. ... Por ejemplo, si tuviéramos los cinco
números 1, 1, 1, 1 y 11, su media aritmética es 3, pero la media harmónica es
55/42, un número más cercano a uno que la media aritmética.

¿Cuál es la relación entre la media aritmética geométrica y armonice?


La media armónica se define como el recíproco de la media aritmética. ... Su
interpretación geométrica es la siguiente: dado un segmento de longitud, la
media armónica es la longitud del cateto mayor de un triángulo rectángulo que
mide y cuya hipotenusa es la media geométrica.

MEDIA ARITMÉTICA:
También denominada promedio, es la que se utiliza principalmente y se define
como la suma de los valores de todas las observaciones divididas por el número
total de datos. La expresión para calcular la media aritmética es:

MEDIA GEOMÉTRICA:
La media geométrica de un conjunto de   observaciones es la raíz enésima de su
producto. El cálculo de la media geométrica exige que todas las observaciones
sean positivas:

35
MEDIA ARMÓNICA
 La media armónica se define como el recíproco de la media aritmética. Esto es:

 Media cuadrática (MQ):

¿Qué es la media cuadrática ejemplos?

La media cuadrática o RMS (Root Mean Square) de un conjunto de valores (X 1,


X2…, XN) es una medida de posición central. Esta se define como la raíz cuadrada
del promedio de los elementos al cuadrado. ... Por ejemplo, para calcular
la media de errores de medida.
En matemáticas, la media cuadrática, valor cuadrático medio, raíz de la media
cuadrática o RMS (del inglés root mean square) es una medida estadística de la
magnitud de una cantidad variable. Puede calcularse para una serie de valores
discretos o para una función matemática de variable continua. El nombre deriva
del hecho de que es la raíz cuadrada de la media aritmética de los cuadrados de
los valores.
A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo,
en los errores de medida. En tal caso se puede estar interesado en obtener un
promedio que no recoja los efectos del signo. Este problema se resuelve,
mediante la denominada media cuadrática. Consiste en elevar al cuadrado todas
las observaciones (así los signos negativos desaparecen), en obtener después su
media aritmética y en extraer, finalmente, la raíz cuadrada de dicha media para
volver a la unidad de medida original. La desviación estándar es una media
cuadrática.

La media cuadrática es muy útil para calcular la media de variables que toman
valores negativos y positivos. Se suele utilizar cuando el símbolo de la variable no
es importante y lo que interesa es el valor absoluto del elemento. Por ejemplo,
para calcular la media de errores de medida.

36
Una aplicación clásica de la media cuadrática es la determinación del valor
eficaz de un parámetro sinusoidal en electricidad, en corriente alterna (tensión en
voltios o intensidad en amperios).

¿Cómo se calcula la media cuadrática?


Consiste en elevar al cuadrado todas las observaciones (así los signos negativos
desaparecen), en obtener después su media aritmética y en extraer, finalmente,
la raíz cuadrada de dicha media para volver a la unidad de medida original. La
desviación estándar es una media cuadrática.

 Cuartiles, Deciles y Percentiles:

Cuartil
¿Qué es el cuartil?
El cuartil es cada uno de los tres valores que pueden dividir un grupo de números,
ordenados de menor a mayor, en cuatro partes iguales. En otras palabras,
cada cuartil determina la separación entre uno y otro subgrupo, dentro de un
conjunto de valores.

El cuartil es cada uno de los tres valores que pueden dividir un grupo de números,
ordenados de menor a mayor, en cuatro partes iguales.
Aquellos datos menores a Q1 representan el 25% de los datos, los que están
debajo de Q2 son el 50%, mientras que aquellos menores a Q3 son el 75%.

El concepto de cuartil es propio de la estadística descriptiva y es de gran utilidad


para el análisis de datos.

Conviene señalar que Q2 coincide con la mediana, que es un dato estadístico que
divide el conjunto de valores en dos partes iguales o simétricas.
Otro punto a tener en cuenta es que el cuartil es un tipo de cuantil. Este es un
punto o valor que permite distribuir un grupo de datos en intervalos idénticos.

37
Deciles
¿Qué son los deciles?
Los Deciles (D) son puntuaciones que dividen la distribución en diez partes.
El Decil 9 (D9), por ejemplo, es la puntuación que deja por bajo las nueve décimas
partes de la distribución.
¿Cuántos deciles existen?
Los deciles son los nueve valores que dividen una serie de datos ordenados en
diez partes iguales.
Un decil, en estadística descriptiva, es uno de los nueve valores que dividen, en
diez partes iguales, un grupo de datos ordenados.
El decil, por tanto, no es más que un tipo de cuantil, o una serie de particiones que
se llevan a cabo en los datos de una muestra o población.
Además, estos deben ir ordenados de menor a mayor. De esta forma, el decil
también irá en ese mismo orden.
¿Cómo se calcula el decil?
El decil, como cualquier otro cuantil, puede calcularse para datos agrupados o no
agrupados. Para los primeros, existen ciertas fórmulas que podemos encontrar en
manuales de estadística básica. Para los segundos, el proceso es relativamente
más sencillo, sobre todo si disponemos de una hoja de cálculo. En el ejemplo
veremos esto con algo más de detalle.
Debemos decir que, en el caso de datos no agrupados, se utiliza una expresión
matemática para situar el valor de dicho decil. Esta es relativamente sencilla, ya
que se basa en que las nueve partes de la distribución tienen el mismo tamaño.
Por tanto, lo que se hace es utilizar el valor concreto si obtenemos un número
entero, o un promedio, si el número tiene decimales.
Características del decil
Los deciles tienen una serie de características, como las que mostramos a
continuación:
 Como estadísticos de posición, son útiles para conocer qué lugar ocupan
los datos en una distribución. Así, el decil 8 es el límite superior de los datos
que representan el 80% del total.
 Por otro lado, permiten conocer cuáles de ellos se sitúan en los niveles más
altos (>90%) y en los más bajos (<10%).

38
 Son muy frecuentes en comparaciones económicas, como niveles de
renta, salarios o ingresos.
 Además, junto a los cuartiles, quintiles o percentiles, son los cuantiles más
utilizados en estadística descriptiva.

Percentiles
¿Qué son los percentiles y cuál es su utilidad?
Un percentil es una medida estadística para comparar resultados, nos permite
saber cómo está situado un valor en función de una muestra. Si hablamos de
bebés, nos permitiría comparar los datos de nuestro bebé con otros de sus
mismas características. Estas características son la edad y el sexo.
El percentil es una medida estadística de posición, que divide la distribución
ordenada de los datos en cien partes iguales.
Esta medida de posición no central aporta información sobre el porcentaje de
observaciones de una variable, ordenados de menor a mayor, que se sitúan por
debajo del valor de este.
De esta forma, el percentil 20 (P20) sería el valor de la variable, situado este en el
límite de los 20 primeros.

¿Cómo se calcula el percentil?


Como todos los cuantiles, el percentil se puede calcular para datos agrupados o
no. Para los primeros, existen fórmulas algo complejas que podemos encontrar en
manuales de estadística. Para los segundos, lo más fácil es utilizar una hoja de
cálculo.
Característica del percentil
Veamos algunas de las características más relevantes del percentil.
 En primer lugar, es similar a otras medidas de posición no central. Por
tanto, nos informa sobre la posición de un dato respecto a otros.
 Por otro lado, en muchas situaciones aporta información más detallada que
otros. Por ejemplo, algunos índices de impacto de revistas científicas
utilizan este en lugar del cuartil.
 Además, es de mucha utilidad para agrupar una gran cantidad de datos.
Cuando trabajamos con muchos casos, los otros cuantiles pueden arrojar
grupos demasiado numerosos y difíciles de interpretar.

39
 Sin embargo, tiene un inconveniente relacionado con lo anterior. No es útil
para muestras con pocos casos, ya que los grupos serían demasiado
pequeños. Por eso, en estas circunstancias se recomiendan otros como el
cuartil o el decil.

Capitulo 4)

La desviación típica y otras medidas de dispersión

 dispersión o variación:

La dispersión o variación de los datos intenta dar una idea de cuan


esparcidos se encuentran éstos. Hay varias medidas de tal dispersión,
siendo las más comunes el rango, la desviación media, el rango semi -
intercuartil, el rango percentil 10-90 y la desviación típica.

La dispersión estadística es el grado en que una distribución de datos se


aleja, o se acerca, en valor absoluto a la media aritmética, como
estadístico de posición central.
Por tanto, las medidas de dispersión van a acompañar siempre a esa media
o promedio.

La dispersión estadística es el grado en que una distribución de datos se


aleja, o se acerca, en valor absoluto a la media aritmética, como estadístico
de posición central. De esta forma, estarían informando de la variabilidad o
dispersión de los datos en relación a ella.

Importancia de la dispersión estadística


Cuando queremos llevar a cabo un análisis descriptivo, en primer lugar
calculamos las medidas resumen de posición. Las más habituales son la
media, mediana, moda o cuartiles, deciles, quintiles o percentiles. Además,
necesitamos saber la dispersión estadística.

Las medidas de dispersión aportan información muy relevante. Si la


dispersión es muy elevada afecta a la media y esta deja de ser
representativa del grupo como medida resumen. Por eso, normalmente
ambos datos van juntos.

40
Medidas de dispersión estadística
Existen diversas medidas de dispersión que permiten su medición. Veamos
un resumen de las más relevantes. Las hemos analizado con mas detalle
aquí.

Rango: No es más que la diferencia entre el menor y el mayor valor de la


distribución.
Desviación media: Sería el equivalente al promedio de las diferentes
desviaciones de cada dato respecto a la media.
Varianza y desviación típica: Son las medidas de dispersión más conocidas.
Suele utilizarse la segunda que es más fácil de calcular (raíz de la varianza)
y de interpretar. Se expresan en valores absolutos.
Coeficiente de variación: En este caso, se calcula con la desviación típica y
la media, y sirve para comparar, ya que se expresa en valores relativos (%).

 Rango:

¿Qué es el rango en estadística?

El rango es un valor numérico que sirve para manifestar la diferencia entre


el valor máximo y el valor mínimo de una muestra poblacional en
Estadística. A través del rango se puede observar la dispersión total en una
muestra en concreto.

En estadística se utilizan diferentes parámetros que son de gran utilidad


para conocer cómo se comportan y evolucionan diferentes muestras, sobre
todo en el caso de muestras poblaciones. Este es el caso del rango, un
parámetro estadístico muy utilizado en finanzas y estudios demográficos
que resultará de gran utilidad para conocer el tamaño de la variación de una
muestra.

Este parámetro estadístico es especialmente utilizado en finanzas, ya que


resulta de gran utilidad para observar el tamaño que podría adquirir una
variación.

Así pues, el rango es un concepto verdaderamente útil para medir la


dispersión sencilla, es decir, para observar de una manera sencilla, rápida e
ilustrativa cuál es la variabilidad de los datos de una muestra en concreto,
ya que el rango muestra la extensión del intervalo en que se encuentran
estos datos.

41
Cómo calcular el rango: su fórmula y ejemplo

Para calcular el rango se ha de utilizar la siguiente fórmula:


R = Máxx – Mínx
Donde:

 R es el rango.
 Máx es el valor máximo, el dato más alto, de la muestra concreta.
 Mín es el valor mínimo, el dato más bajo, de la muestra concreta.
 X es la variable sobre la que se pretende calcular el rango.

Para poder calcular correctamente el rango es necesario que los datos o


valores sean ordenados, bien de mayor a menor, bien de menor a mayor.
De esta forma, tendremos claro cuál es el valor mínimo y cuál es el valor
máximo y aplicar la fórmula resultará mucho más sencillo.

Pongamos un ejemplo para ilustrar toda esta información y poder aplicar la


fórmula anterior. Imaginemos que se mide la estatura de 25 alumnos
varones de una clase de universidad. El estudiante con mayor estatura
mide 1,93 metros, mientras que el alumno con una estatura menor mide
1,67 metros. Ahora hemos de aplicar la fórmula anterior:

R = Máxx – Mínx
R = 1,93 – 1,67 = 0,26 m
R = 0,26 metros

¿Cómo debemos interpretar este resultado? Es muy sencillo: esto quiere


decir que la variación máxima de estatura entre el alumno más bajo y el
alumno más alto es de 26 centímetros, de forma que las estaturas del resto
de los alumnos se situarán dentro de este rango cuya longitud es de 26
centímetros.
El rango es la medida a través de la cual podemos conocer cómo de
dispersos están los datos. Así, gracias al rango podemos conocer cómo de
homogénea es la muestra en concreto, de forma que, cuanto menor sea el
valor del rango, más homogeneidad habrá en la muestra en cuestión, ya
que los datos estarán más cercanos entre sí y la dispersión será menor. Por
ejemplo, y siguiendo con el ejemplo de los 25 alumnos, la muestra será
más heterogénea cuanto mayor sea el rango. Sin embargo, entre el alumno
más bajo y el alumno más alto solo hay 26 centímetros de diferencia, por lo
que podemos concluir que se trata de una muestra bastante homogénea.

42
Ventajas y desventajas del rango:

La utilización de esta medida estadística cuenta con una serie de ventajas.


Son las siguientes:

 Es sencillo y rápido y de calcular, ya que se trata de una simple resta


entre dos valores.

 Cuenta con las mismas unidades que los datos con los que se trabaja.
Esto es: si queremos calcular el rango de alturas en una clase, el rango
tendría el metro o el centímetro como unidad de medidas. Sin embargo, si
quisiéramos calcular el rango de los microchips que fabrica al mes una
empresa, el rango adquiere como unidad de medida la propia unidad.

 Debido a las dos anteriores ventajas, cualquier persona podría interpretar


los datos, ya que se trata de un concepto muy sencillo de interpretar.

No obstante, aunque las ventajas son importantes, el rango también


cuenta con una serie de inconvenientes. Son los siguientes:

 Es un valor que solo indica en qué intervalo se encuentran los datos,


pero no cómo estos se distribuyen. Así, y siguiendo con el ejemplo de
los estudiantes, puede ser que, siendo el mismo rango el mismo, la mayoría
de estudiantes midan 1,90 metros o que, por el contrario, midan 1,70
metros. En ambos casos el rango sería el mismo, pero la distribución de los
datos sería muy diferente.
 El rango solo usa los valores extremos e ignora el resto de datos,
perdiéndose la mayor parte de información relativa a una muestra.
 El rango nunca disminuye, de forma que, como mucho, podría
aumentar o quedarse igual al incluir más valores o aumentar la
muestra.
 Para obtener información realmente fiable sobre la muestra, es
necesario complementar el rango con otras medidas de
dispersión como la desviación estándar o la varianza, entre otras. En
cualquier caso, es muy útil en muestras pequeñas.
Sin duda, el rango es una buena medida de dispersión que es muy
utilizada, sobre todo en muestras pequeñas. Por ello, es importante
conocerla y saber calcularla, aunque no se ha de perder de vista que es
necesario que sea complementada con otras medidas de dispersión.

43
 Desviación media:

¿Qué indica la desviación media?


Qué significa desviación media en Matemáticas.

La desviación respecto a la media es la diferencia entre cada valor


de la variable estadística y la media aritmética. La desviación media
es la media aritmética de los valores absolutos de las desviaciones
respecto a la media.

En estadística la desviación absoluta promedio o,


sencillamente desviación media o promedio de un conjunto de
datos es la media de las desviaciones absolutas y es un resumen de
la dispersión estadística.1 Se expresa, de acuerdo a esta fórmula:

La desviación respecto a la media es la diferencia entre cada valor


de la variable estadística y la media aritmética.

Di = x - x

La desviación media es la media aritmética de los valores absolutos


de las desviaciones respecto a la media.

La desviación media se representa por Explicaciones y ejemplos de


desviación media – 1

Ejemplo

44
Calcular la desviación media de la distribución:
9, 3, 8, 8, 9, 8, 9, 18

Ejemplo
Calcular la desviación media de la distribución:

datos agrupados.
X U F FU

61 -2 5 -10
64 -1 18 -18
67 0 42 0
70 1 27 27
73 2 8 16

N = 100 ∑ fu=15

15
X = A+¿ ¿) c = 67 + ( 100 )(3) = 45

67.45 in
 Rango semi-Intercuartil:

El rango semi-intercuartil es un medio de la diferencia entre el primer y


tercer cuartiles. Es la mitad de la distancia requerida para cubrir la mitad de
las cuentas. El rango semi-intercuartil es afectado muy poco por cuentas
extremas. Esto lo hace una buena medida de dispersión para distribuciones
sesgadas.
¿Qué es el rango intercuartil y cómo se interpreta?

El rango intercuartil (IQR) es la distancia entre el primer cuartil (Q1) y el


tercer cuartil (Q3). El 50% de los datos está dentro de este rango. Para
estos datos ordenados, el rango intercuartil es 8 (17.5–9.5 = 8). Es decir, el
50% intermedio de los datos está entre 9.5 and 17.5.
El rango intercuartil es la distancia entre el primer y tercer cuartiles . Es algunas
veces llamada la dispersión H y es una medida estable de desembolso. Se obtiene
al evaluar Q  3 – Q  1.

El rango semi-intercuartil es un medio de la diferencia entre el primer y tercer


cuartiles. Es la mitad de la distancia requerida para cubrir la mitad de las
cuentas. El rango semi-intercuartil es muy poco afectado por cuentas
extremas. Esto lo hace una buena medida de dispersión para
distribuciones sesgadas. Se obtiene evaluando.

 El rango percentil:

Devuelve el rango de un valor en un conjunto de datos como un porcentaje del


conjunto de datos. Esta función le permite evaluar la posición relativa de un valor
en un conjunto de datos.
Consideremos el siguiente ejemplo: Un psicólogo hace el seguimiento de un
estudiante de Bachillerato que ha obtenido un 5 en los exámenes de Matemáticas
(M) e Historia (H). Las puntuaciones obtenidas por los estudiantes de los dos
grupos son:

46
El estudiante ha quedado muy bien en Matemáticas, y mal en Historia en relación
a los resultados obtenidos por el resto del grupo, pero la puntuación directa (el 5)
es la misma en ambos exámenes. En conclusión, las puntuaciones directas NO
miden de manera adecuada de la posición de los datos en relación al grupo. Por
tanto, es preciso considerar un procedimiento que sí lo haga.
Si en lugar de operar con las puntuaciones directas obtenemos el porcentaje de
puntuaciones con valores inferiores vemos que el estudiante ha obtenido una
puntuación en Matemática que deja por bajo el 80% de las puntuaciones de
Matemáticas, y en Historia el 10% de Historia. De esta forma sí podemos
comparar el rendimiento del estudiante en los dos exámenes, y se
denomina Rango Percentil de una puntuación x el porcentaje de datos con
valores inferiores a x.
Cálculo
Fórmula de cálculo:

 la desviación típica en estadística:

¿Qué significa la desviación típica en estadística?

La desviación típica es la desviación media de una variable respecto de


su media aritmética, adquiriendo siempre unos valores que son iguales o
mayores que 0. ... - La desviación, es decir, la separación que existe entre
cualquier valor de la serie y la media aritmética de todos los datos de dicha
serie.

En todo caso, para entender este concepto a la perfección es necesario


llevar a cabo el análisis de 2 conceptos fundamentales. Son los siguientes:

1.- La media aritmética de la serie de los datos utilizados.

2.- La desviación, es decir, la separación que existe entre cualquier valor de


la serie y la media aritmética de todos los datos de dicha serie.

Así, una vez analizados ambos conceptos, la desviación típica se calcula de


forma muy parecida a la media, si bien es cierto que en el cálculo de la
desviación típica se toman como valores las desviaciones. Aunque el
razonamiento resulta bastante lógico, lo cierto es que existe un fallo que se
solucionan a través de los diferentes cálculos de la desviación típica.

47
Existen dos fórmulas para calcular la desviación típica. Son las
siguientes:

1.- La raíz cuadrada de la varianza: en este caso, hemos de realizar la raíz


cuadrada de la fórmula de la varianza para poder calcular la desviación
típica, es decir, la raíz cuadrada de la media de los cuadrados de las
puntuaciones de la desviación.

2.- La suma de las desviaciones y dividir entre el total de observaciones:


esta segunda fórmula es más intuitiva, de forma que se ha de realizar la
suma de todas las desviaciones en valor absoluto y, a continuación, dividir
entre el total de observaciones.

PROPIEDADES DE LA DESVIACIÓN TÍPICA

La desviación típica tiene una serie de propiedades. Son las siguientes:


1.- La desviación típica siempre adquiere valores iguales o mayores que
cero, adquiriendo un valor igual a 0 cuando las variables o datos utilizados
son iguales.
2.- Cuando a todos los valores de la variable se le suma un número, la
desviación típica permanece igual y no varía absolutamente nada.
3.- Cuando todos los valores de la variable son multiplicados por un mismo
número, la desviación típica también quedará multiplicada por ese mismo
número.
4.- Si existieran varias distribuciones con la misma media aritmética y
fuésemos conocedores de sus respectivas desviaciones típicas, se podría
calcular a partir de estos datos la desviación típica total.

 La varianza

¿Qué es y para qué sirve la varianza?

La varianza es una medida de dispersión que representa la variabilidad de


una serie de datos respecto a su media. Formalmente se calcula como la
suma de los residuos al cuadrado divididos entre el total de observaciones.

¿Qué es la varianza en estadística?

La Varianza es una medida de dispersión que se utiliza para representar la


variabilidad de un conjunto de datos respecto de la media aritmética de los

48
mismo. Así, se calcula como la suma de los residuos elevados al cuadrado
y divididos entre el total de observaciones.

¿PARA QUÉ SE USA LA VARIANZA?

Es una medida de dispersión ampliamente utilizada en los sectores de la


economía y las finanzas, interpretándose como el riesgo de que el
rendimiento de algún procedimiento en concreto sea distinto del
rendimiento esperado de dicho procedimiento.

La varianza, junto con la desviación estándar -ambas medidas muy


relacionadas entre sí- son las medidas de dispersión de datos por
excelencia, sobre todo en el mundo de las finanzas.

¿CÓMO SE CALCULA LA VARIANZA?

En primer lugar, es necesario indicar que la unidad de medida de la


varianza es la misma unidad de medida de los datos utilizados para
calcularla. Así, si los datos introducidos en la fórmula utilizan los metros
como unidad de medida, la varianza se expresará también en metros. En
cualquier caso, se ha de tener en cuenta que la varianza adquiere siempre
valores iguales o mayores a 0, siendo matemáticamente imposible que
adquiera valores inferiores a 0, pues los datos introducidos se elevan al
cuadrado.

 Métodos cortos para calcular la desviación típica:

Fórmulas para calcular la desviación típica


La primera es elevando al cuadrado las desviaciones, dividir entre el
número total de observaciones y por último hacer la raíz cuadrada para
deshacer el elevado al cuadrado, tal que:

Alternativamente existiría otra forma de calcularla. Sería haciendo un


promedio de la suma de los valores absolutos de las desviaciones. Es decir,
aplicar la siguiente fórmula:

49
Sin embargo, esta fórmula no es una alternativa de la desviación típica pues arroja
diferentes resultados. En realidad, la fórmula anterior es la desviación respecto de
la media. La desviación estándar o típica y la desviación respecto de la media
tienen similitudes, pero no son lo mismo. A esta última forma se le conoce como
desviación media.

 Propiedades de la desviacion típica:

La desviación típica siempre adquiere valores iguales o mayores que cero,


adquiriendo un valor igual a 0 cuando las variables o datos utilizados son
iguales. 2. - Cuando a todos los valores de la variable se le suma un
número, la desviación típica permanece igual y no varía absolutamente
nada.

¿Cuáles son las características de la desviación estándar?

La desviación estándar es un índice numérico de la dispersión de un


conjunto de datos (o población). Mientras mayor es la desviación estándar,
mayor es la dispersión de la población. La desviación estándar es un
promedio de las desviaciones individuales de cada observación con
respecto a la media de una distribución.

En todo caso, para entender este concepto a la perfección es necesario


llevar a cabo el análisis de 2 conceptos fundamentales. Son los siguientes:

1.- La media aritmética de la serie de los datos utilizados.

2.- La desviación, es decir, la separación que existe entre cualquier valor de


la serie y la media aritmética de todos los datos de dicha serie.

50
Así, una vez analizados ambos conceptos, la desviación típica se calcula de
forma muy parecida a la media, si bien es cierto que en el cálculo de la
desviación típica se toman como valores las desviaciones. Aunque el
razonamiento resulta bastante lógico, lo cierto es que existe un fallo que se
solucionan a través de los diferentes cálculos de la desviación típica.

 Comprobacion de Charlier:

¿Cuáles son las medidas de variabilidad?


En estadística, las medidas de dispersión (también llamadas variabilidad,
dispersión o propagación) es el grado en que una distribución se estira o se
comprime. Ejemplos comunes de medidas de dispersión estadística son la
varianza, la desviación estándar y el rango intercuartil.

¿Qué representa la varianza?


La Varianza es una medida de dispersión que se utiliza para representar la
variabilidad de un conjunto de datos respecto de la media aritmética de los
mismo. Así, se calcula como la suma de los residuos elevados al cuadrado
y divididos entre el total de observaciones.

 Corrección shepoard para la varianza:

La corrección introducida se conoce como CORRECCION DE SHEPOARD. Se utiliza en


distribuciones continuas donde las colas "colas" van gradualmente a cero en ambas
direcciones. Los estadísticos difieren en lo que se refiere a cuándo y si debe aplicarse la
corrección Shepard.

El cálculo de la desviacion típica es algo erróneo como resultado del agrupamiento de


datos en clases (error de agrupamiento). Para corregirlo, se usa la fórmula.

51
2
c
Varianza corregida = varianza de los datos agrupados --
12
Donde c es la anchura del intervalo de clase. La corrección c 2/12 (que se resta) se
llama corrección de sheppard.
Se usa para distribuciones de variables continuas donde las (colas) van hacia cero
en ambas direcciones.

 relaciones empíricas entre las medidas de dispersión:

Para distribuciones poco sesgadas, se tienen las fórmulas empíricas.


4
Desviación media = 5 (desviación típica)
2
Rango semi-intercuartil = 3 (desviacion media)
Son consecuencia de que para la distribución normal la desviación media y el
rango semi-intercuartil son iguales, respectivamente, a 0.7979 y 0.6745 veces la
desviación típica.

 Dispersión absoluta y relativa:


Coeficiente de variación.
La variación o dispersión real, tal como se determina de la desviación típica u otra
medida dispersión, se llama la dispersión absoluta. Sin embargo, una dispersión (o
variación) de 10 pulgadas (in) en la medida de 1000 pies es muy diferente de esa
misma dispersión al medir una distancia de 20 pies.
Una medida de este efecto la da la dispersión relativa, a saber.

dispersión absoluta .
Dispersión relativa =
promedio .

Si la dispersión absoluta es la desviación típica s y el promedio es la media X ,


entonces la dispersión relativa se llama el coeficiente de variación, o coeficiente de
dispersión; se denotará por V y se define como:

s
Coeficiente de variación (V) = X

52
Y se expresa en general en forma de porcentaje. Nótese el coeficiente de
variación es independiente de las unidades usadas. Por esa razón es útil al
comparar distribuciones con unidades diferentes. Una desventaja del coeficiente
de variación es que pierde su utilidad cuando X es próxima a cero.

 Variables tipificadas:
Unidades estándar.

La variable que mide la desviación de la medida en unidades de la desviación


típica se llama una variable tipificada, es adimensional (independiente de las
unidades usadas) y viene dada por
X− X
Z=
S
Si las desviaciones de la medida se dan en unidades de desviacion típica, se
dicen expresadas en unidades estándar, o recuentos estándar. Son de gran valor
al comparar distribuciones.

 Bibliografías:

Bibliografía
economipedia. (s.f.). economipedia.com. Obtenido de https://economipedia.com/:
https://economipedia.com/definiciones/desviacion-tipica.html

sdelsol. (s.f.). sdelsol.com. Obtenido de https://www.sdelsol.com/:


https://www.sdelsol.com/glosario/desviacion-tipica/

Spiegel., M. r. (s.f.). file:///C:/Users/User/Downloads/Estadistica-Murray. Obtenido de


file:///C:/Users/User/Downloads/Estadistica-MurraySpiegel.pdf:
file:///C:/Users/User/Downloads/Estadistica-Murray%20Spiegel.pdf

superprof. (s.f.). superprof.es. Obtenido de www.superprof.es/:


https://www.superprof.es/diccionario/matematicas/estadistica/desviacion-media.html

varsitytutors. (s.f.). varsitytutors.com/hotmath/hotmath. Obtenido de


https://www.varsitytutors.com/:
https://www.varsitytutors.com/hotmath/hotmath_help/spanish/topics/
interquartile#:~:text=El%20rango%20semi-intercuartil%20es,de%20dispersi%C3%B3n%

53
 Paráfrasis:

La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las
observaciones, para poder hacer comparaciones y sacar conclusiones.
 
Conceptos de Estadística
Población:
Una población es el conjunto de todos los elementos a los que se somete a un estudio
estadístico.
Individuo:
Un individuo o unidad estadística es cada uno de los elementos que componen la
población.
Muestra:
Una muestra es un conjunto representativo de la población de referencia, el número de
individuos de una muestra es menor que el de la población.
Muestreo
El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción
reducida y representativa de la población.
Valor:
Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio
estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.
Dato:
Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si
lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.
La Probabilidad y la Estadística Descriptiva proveen las herramientas y
modelos necesarios para organizar, describir y representar matemática y
gráficamente la información disponible, dimensionar la incertidumbre de esta
información y convertirla en predicciones o pronósticos.

54
En otras palabras; la Probabilidad y la Estadística Descriptiva constituyen el marco
matemático para predecir el futuro modelando la experiencia y son la base
fundamental del Análisis de Riesgo y la Administración de la Incertidumbre.

La estadística descriptiva es una disciplina que se encarga de recoger, almacenar,


ordenar, realizar tablas o gráficos y calcular parámetros básicos sobre el conjunto
de datos.
La estadística descriptiva es, junto con la inferencia estadística o estadística
inferencial, una de las dos grandes ramas de la estadística. Su propio nombre lo
indica, trata de describir algo. Pero no describirlo de cualquiera forma, sino de
manera cuantitativa. Pensemos en el peso de una caja de verduras, en la altura de
una persona o en la cantidad de dinero que gana una empresa. De estas variables
podríamos decir muchas cosas. Por ejemplo, podríamos indicar que esta o aquella
caja de tomates pesan mucho o pesan menos que otras. Siguiendo con otro
ejemplo, podríamos decir que el ingreso de una empresa varía mucho a lo largo
del tiempo o que una persona tiene una altura promedio.

Para dictar las afirmaciones anteriores, sobre mucho, poco, alto, bajo, muy
variable o poco variable necesitamos variables de medidas. Esto es, necesitamos
cuantificarlas, ofrecer un número. Con esto en mente, podríamos utilizar los
gramos o los kilogramos como unidad de medida para saber el peso de tantas
cajas de tomates como consideremos. Una vez pesemos treinta cajas, sabremos
cuales pesan más, cuales pesan menos, que cuantía es la que más se repite o si
existe mucha disparidad entre los pesos de las diferentes cajas.

Con esta idea nace la estadística descriptiva, con la de recoger datos,


almacenarlos, realizar tablas o incluso gráficos que nos ofrezcan información
sobre un determinado asunto. Adicionalmente, nos ofrecen medidas que resumen
la información de una gran cantidad de datos.
Parámetros estadísticos básicos
Con el objetivo de resumir la información, se idearon diversas fórmulas que
ofrecían medidas de un determinado tipo. Así, están aquellas que nos ofrecen
información sobre el centro, otras sobre la dispersión o variabilidad y otras sobre la
posición de un valor.
 Medidas de tendencia central: Denominadas así porque ofrecen
información sobre el centro de conjunto de datos. Por ejemplo, la media es
una medida de tendencia o posición central ya que el promedio nos ofrece
un valor centrado del conjunto de datos. ¿Dónde podríamos decir que se

55
encuentra el punto medio? En el centro, en la mitad aproximadamente. Otro
ejemplo de medida de tendencia central es la mediana.
 Medidas de dispersión: También son conocidas como medidas de
variabilidad. Por ejemplo, la desviación típica es una medida de variabilidad
ya que nos dice si los valores de un conjunto de datos son muy dispares o
no. Dos ejemplos más sobre medidas de dispersión podrían ser la varianza
y el rango estadístico.
 Medidas de posición: No son las más conocidas, pero se utilizan
frecuentemente. Un ejemplo de ello, se encuentra en los percentiles o los
deciles. Cuando un dato en concreto se encuentra en el percentil 90, quiere
decir que por debajo de ese dato se encuentran el 90% de datos. Existen
otras medidas de posición como los cuartiles o algunas variantes como el
primer cuartil.
Distribución de frecuencias
También es interesante ver cómo se distribuyen las frecuencias. Para
ello, existen ciertos conceptos que debemos conocer:
 Frecuencia absoluta: Es el número total de veces que se repite una
observación. En ocasiones las observaciones se pueden presentar en
intervalos.
 Frecuencia relativa: Es el número en porcentaje que se repite una
observación o un conjunto de ellas.
 Frecuencia acumulada: Puede ser relativa acumulada o absoluta
acumulada. Indica la cantidad acumulada hasta cierta observación.

JESÚS le dijo: Amarás al señor tu DIOS con todo tú corazón, con toda tú
alma, y con toda tú mente.
Este es el primero y grande mandamiento.
Y el segundo es semejante: Amarás a tu prójimo como a ti mismo.
San mateo 22:37 BENDICIONES Y DIOS TE AMA UN MONTON.
AMÉN.

56

También podría gustarte