Está en la página 1de 12

Sumatoria y propiedades

La sumatoria, que también se puede conocer bajo el nombre de


sumatorio, operación de suma, notación sigma o símbolo suma, es un
término utilizado en matemáticas para realizar varias operaciones. En
términos simples podemos decir que la sumatoria o sumatorio se utiliza
en casos en los que queremos evitar usar en las sumas demasiados
sumandos. Esto es lo que se conoce como sumandos infinitos, lo común
es usar los puntos suspensivos y también se puede aplicar la sumatoria.
La suma del producto de una constante por una variable, es igual a
k veces la sumatoria de la variable.

La sumatoria hasta N de una constante, es igual a N veces la


constante.

La sumatoria de una suma es igual a la suma de las sumatorias de


cada término.

La sumatoria de un producto no es igual al producto de las


sumatorias de cada término.

La sumatoria de los cuadrados de los valores de una variable no es


igual a la sumatoria de la variable elevado al cuadrado.
Media aritmética, mediana y moda

Cuando se tiene un grupo de observaciones, se desea describirlo a


través de un solo número. Para tal fin, no se usa el valor más elevado ni
el valor más pequeño como único representante, ya que solo representan
los extremos. Una de las propiedades más sobresalientes de la
distribución de datos es su tendencia a acumularse hacia el centro de la
misma. Esta característica se denomina tendencia central. Las medidas
de tendencia central más usuales son la media aritmética, la mediana y
la moda.

Media: La media es el promedio de una serie de datos numéricos y


se calcula como la suma de la serie de valores dividida por el número
total de valores. La fórmula promedio es:

Formula media aritmética


Las características de la media aritmética son:

o Es una medida totalmente numérica, lo que significa que solo


puede calcularse en datos de características cuantitativas.
o En su cálculo se toman en cuenta todos los valores de la variable.
o La media aritmética es altamente afectada por valores extremos.
o No puede ser calculada en distribuciones de frecuencia que tengan
clases abiertas.

Propiedades de la media aritmética


o La media aritmética no suele ser un valor propio de la variable. Si
la media de un conjunto de exámenes es 6, puede que en ninguno
de los exámenes se haya obtenido una nota exacta de 6.
o Es muy sensible a cambios y valores extremos en los datos.
o Se comporta de forma natural en relación a las operaciones
aritméticas suma y producto por un escalar, es decir, si a todos los
datos de una distribución se les suma una misma cantidad, la
media resultante sería la anterior más dicha cantidad. Si
multiplicamos (o dividimos) todos los datos de una distribución
por una cantidad distinta de cero, la media resultante sería la
anterior multiplicada (respectivamente dividida) por dicha
cantidad.

Mediana: la mediana es el punto central de una serie de datos


ordenados de forma ascendente o descendente. De acuerdo al número
de casos o datos, hay dos formas para calcular la mediana: para número
impar y para número par.
Numero impar de datos ordenados de menor a mayor o de mayor a
menor: la mediana es el valor que queda justo al centro.

LAS Características de la mediana SON:

o En su cálculo no se incluyen todos los valores de la variable


o La mediana no es afectada por valores extremos.
o Puede ser calculada en distribuciones de frecuencia con clases
abiertas.

Propiedades de la mediana
o La Mediana no tiene propiedades que le permite intervenir en
desarrollos algebraicos como la media aritmética, sin embargo,
posee propiedades que ponen en evidencia ciertas cualidades de
un conjunto de datos, lo cual no ocurre con la media aritmética
que promedia todos los valores y suprime sus individualidades. En
cambio, la mediana destaca los valores individuales.
o Tiene la ventaja de no estar afectada por las observaciones
extremas, ya que no depende de los valores que toma la variable,
sino del orden de las mismas.
o Para el cálculo de la mediana interesa que los valores estén
ordenados de menor a mayor.
o Su aplicación se ve limitada, ya que solo considera el orden
jerárquico de los datos y no alguna propiedad propia de los datos,
como en el caso de la media aritmética.

Moda: La moda es el valor de una serie de datos que aparece con más
frecuencia. Se obtiene fácilmente de una clasificación ordenada. A
diferencia de la media aritmética, la moda no se ve afectada por la
ocurrencia de los valores extremos.

Propiedades de la moda

o Cálculo sencillo.
o Interpretación muy clara.
o Al depender sólo de las frecuencias, puede calcularse para
variables cualitativas. Es por ello el parámetro más utilizado
cuando al resumir una población no es posible realizar otros
cálculos, por ejemplo, cuando se enumeran en medios
periodísticos las características más frecuentes de determinado
sector social. Esto se conoce informalmente como "retrato robot".
Cuartiles, deciles y percentiles
Los Cuantiles (cuartiles, deciles, percentiles) son medidas de
localización, su función es informar del valor de la variable que ocupará
la posición (en tanto por cien) que nos interese respecto de todo el
conjunto de variables. Podemos decir que los Cuantiles son unas
medidas de posición que dividen a la distribución en un cierto número
de partes de manera que en cada una de ellas hay el mismo de valores de
la variable.
Cuartiles: Los cuartiles son los tres valores que dividen al conjunto
de datos ordenados en cuatro partes porcentualmente iguales. Hay tres
cuartiles denotados usualmente Q1, Q2, Q3:
El primer cuartil Q1, es el menor valor que es mayor que una
cuarta parte de los datos; es decir, aquel valor de la variable que supera
25% de las observaciones y es superado por el 75% de las observaciones
El segundo cuartil Q2, (coincide, es idéntico o similar a la
mediana, Q2 = Md), es el menor valor que es mayor que la mitad de los
datos, es decir el 50% de las observaciones son mayores que la mediana y
el 50% son menores.
El tercer cuartil Q3, es el menor valor que es mayor que tres
cuartas partes de los datos, es decir aquel valor de la variable que supera
al 75% y es superado por el 25% de las observaciones.

Deciles: Los deciles son ciertos números que dividen la sucesión


de datos ordenados en diez partes porcentualmente iguales. Son los
nueve valores que dividen al conjunto de datos ordenados en diez partes
iguales, son también un caso particular de los percentiles, ya que
podemos definir Decil como “percentil cuyo valor que indica su
proporción es un múltiplo de diez. Percentil 10 es el primer decil,
percentil 20 el segundo decil, etc.”
El primer decil D1: indica que sólo existe un 10% de probabilidad
de que el valor de la variable esté por debajo de esa cifra.
Quinto decil D5 o denominado también “Caso Base”: indica que
existe igualmente un 50% de probabilidad de que el valor esté por
encima como por debajo de esa cifra. Representa la Mediana de la
distribución.

Percentiles o centiles: Los percentiles son, tal vez, las medidas más
utilizadas para propósitos de ubicación o clasificación de las personas
cuando atienden características tales como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de
datos ordenados en cien partes porcentualmente iguales. Estos son los
99 valores que dividen en cien partes iguales el conjunto de datos
ordenados. Sencillamente Percentil es el valor del recorrido de una
variable, bajo el cual se encuentra una proporción determinada de la
población.
Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil
99, muestran la variable que deja detrás una frecuencia acumulada igual
al valor del percentil:
Primer percentil, que supera al uno por ciento de los valores y es
superado por el noventa y nueve por ciento restante.
El 60 percentil, es aquel valor de la variable que supera al 60% de
las observaciones y es superado por el 40% de las observaciones.
El percentil 99 supera 99% de los datos y es superado a su vez por
el 1% restante.

Población: Es el conjunto de todos los elementos que cumplen


ciertas propiedades y entre los cuales se desea estudiar un determinado
fenómeno (pueden ser hogares, número de tornillos producidos por una
fábrica en un año, lanzamientos de una moneda, etc.). Llamamos
población estadística o universo al conjunto de referencia sobre el cual
van a recaer las observaciones.
Muestra aleatoria simple: en la que todos los componentes o
unidades de la población tienen la misma oportunidad de ser
seleccionados.
Parámetro: Característica de una población, resumida para su
estudio. Se considera como un valor verdadero de la característica
estudiada.
Estadístico: Es una cantidad numérica calculada sobre la muestra
que resume su información sobre algún aspecto. Se usa para aproximar
un parámetro.

Muestreo, tipos de muestro y el error muestral

El muestreo es una herramienta de investigación que tiene como


objetivo seleccionar una muestra que sea representativa de la población
que está siendo parte del estudio.
Se pueden distinguir dos tipos de muestreo que son
fundamentales en la estadística y su respectiva clasificación:
o Muestreo aleatorio o probabilístico
Este tipo de muestreo es uno de los más utilizados en las
investigaciones. Se comprende que aquí todos los sujetos o elementos de
la población pueden pasar a formar parte de la muestra, pues tienen la
misma probabilidad de ser escogidos.
Dentro de los muestreos probabilísticos podemos encontrar los
siguientes tipos:

o Muestreo aleatorio simple:


En este método de muestreo lo principales es tener una idea clara de
cuantos sujetos serán necesarios para completar el tamaño de la muestra
que se va a investigar, pues este consiste en que a cada sujeto de la
población se le debe asignar un número, para que posteriormente
mediante algún sorteo, o generando números aleatorios con ayuda de
rifas o algún ordenador se logre dar a conocer los números de los sujetos
seleccionados que serán tomados como muestra.

o Muestreo sistemático:
Pues en este método como en el primero, los sujetos que conforman a
la población son enumerados, pero en lugar de dar a conocer los que
serán incluidos mediante el azar en este caso incluyen otra técnica.
Posteriormente de que son enumerados, los investigadores dividen el
total de la población que se presenta entre el total de sujetos que
requieren para la muestra; para después elegir a uno de los primeros de
estos sujetos al azar (ya enumerados) y posteriormente se va sumando
de una forma secuencial o constante el mismo valor para elegir a los
sujetos requeridos.

o Muestreo estratificado:
Mediante este método de investigación, los investigadores dividen a
la población en grupos o estratos que tengan relación o compartan
características similares y posteriormente se selecciona al azar o
aleatoriamente a los sujetos finales de los grupos o estratos formados.
Este método es utilizado para cuando los investigadores pretenden que
dentro de la muestra se encuentren incluidos todos los grupos de interés
que puedan representar significancia para la investigación.

o Muestreo no aleatorio o no probabilístico


Mediante esta técnica de muestreo, en comparación del muestreo
probabilístico las muestras no se recogen por medio de procesos donde a
los sujetos se les brinden las mismas posibilidades de ser seleccionados.
Dentro de esta técnica existen cuatro tipos de muestreos:

o Muestreo por cuotas:


Mediante este método los investigadores se encargan de incluir en la
muestra solo a un grupo determinado de sujetos que cumplen con
ciertos requisitos o condiciones específicas.

o Muestreo intencional o de conveniencia:


Mediante este método, el investigador se encarga de elegir de
acuerdo a sus propios criterios o alcances a los sujetos que formaran
parte de la muestra.

o Muestreo por bola de nieve:


En este método se hace contacto con algún sujeto en específico y este
se encargará de buscar a otros sujetos o nuevos participantes
consecutivamente. Haciéndolo de esta forma hasta cumplir con el
tamaño de muestra o cantidad de sujetos que se necesitan.

o Muestreo discrecional:
Mediante este método, se aplica una técnica parecida a la del método
intencional, pues el investigador recluta a los sujetos según sus criterios;
pero en este caso, los busca de acuerdo a lo que piensen que estos
sujetos puedan aportar a la investigación.
Error muestral: El error muestral se refiere a la variación natural
existente entre muestras tomadas de la misma población.
Cuando una muestra no es una copia exacta de la población; aún si
se ha tenido gran cuidado para asegurar que dos muestras del mismo
tamaño sean representativas de una cierta población, no esperaríamos
que las dos sean idénticas en todos sus detalles.
La generación de números aleatorios: Un número aleatorio es
aquel obtenido al azar, es decir, que todo número tenga la misma
probabilidad de ser elegido y que la elección de uno no dependa de la
elección del otro. El ejemplo clásico más utilizado para generarlos es el
lanzamiento repetitivo de una moneda o dado ideal no trucado.
Distribución muestral: En estadística, la distribución muestral es
lo que resulta de considerar todas las muestras posibles que pueden ser
tomadas de una población. Su estudio permite calcular la probabilidad
que se tiene, dada una sola muestra, de acercarse al parámetro de la
población. Mediante la distribución muestral se puede estimar el error
para un tamaño de muestra dado.

Teorema central del limite

El teorema central del límite es uno de los resultados


fundamentales de la estadística. Este teorema nos dice que si una
muestra es lo bastante grande (generalmente cuando el tamaño
muestral (n) supera los 30), sea cual sea la distribución de la media
muestral, seguirá aproximadamente una distribución normal. Es decir,
dada cualquier variable aleatoria, si extraemos muestras de tamaño n
(n>30) y calculamos los promedios muestrales, dichos promedios
seguirán una distribución normal. Además, la media será la misma que
la de la variable de interés, y la desviación estándar de la media muestral
será aproximadamente el error estándar.
Un caso concreto del teorema central del límite es la distribución
binomial. A partir de n=30, la distribución binomial se comporta
estadísticamente como una normal, por lo que podemos aplicar los tests
estadísticos apropiados para esta distribución.
La importancia del teorema central del límite radica en que
mediante un conjunto de teoremas, se desvela las razones por las cuales,
en muchos campos de aplicación, se encuentran en todo momento
distribuciones normales o casi normales.

Distribuciones muestrales

o Distribución muestral de la varianza:


Si se extrae una muestra aleatoria de tamaño n de una población
normal con media µ y varianzaσ2, y se calcula la varianza muestral, se
obtiene el valor del estadístico s2 que se utilizará para conocer la σ2,
mediante una variable aleatoria chi cuadrado con “n-1” grados de
libertad. Formalizando con el siguiente teorema: sis2es la varianza de
una muestra aleatoria de tamaño “n” que se toma de una población
normal que tiene varianzaσ2, entonces el estadístico:

Tiene una distribución chi cuadrado con v=n -1, grados de libertad.


o Distribución muestral de la proporción:
Cuando se requiere investigar la proporción de algún atributo en una
muestra (variables cualitativas), la distribución muestral de
proporciones es la adecuada para dar respuesta a dichas situaciones.
Esta distribución se genera de igual manera que la distribución muestral
de medias, a excepción de que al extraer las muestras de la población, se
calcula el estadístico proporción (p=x/n en donde "x" es el número de
éxitos u observaciones de interés y "n" el tamaño de la muestra), en lugar
del estadístico promedio. La fórmula que se utilizará para el cálculo de
probabilidad en una distribución muestral de proporciones, está basada
en la aproximación de la distribución normal a la binomial. Esta fórmula
servirá para calcular la probabilidad del comportamiento de la
proporción en la muestra.

En caso de que sea una población finita:

También podría gustarte