Está en la página 1de 8

c c

Es la medida de posición central más utilizada, la más conocida y la más sencilla de


calcular, debido principalmente a que sus ecuaciones se prestan para el manejo
algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su
sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado
grandes o pequeños. La media se define como la suma de todos los valores
observados, dividido por el número total de observaciones.

   

Cuando los valores repre sentan una población la ecuación se define como:

rees
  


Donde (m) representa la media, (N) representa el tamaño de la población y (Xi)


representa cada uno de los valores de la población. Ya que en la mayoría de los casos
se trabajan con muestras de la población todas las ecuaciones que se presenten a
continuación serán representativas para las muestras. La media aritmética para una
muestra esta determinada como

   

Donde (X) representa la Media para la muestra, (n) el tamaño de la muestra y (Xi)
representa cada uno de los valores observados. Esta fórmula únicamente es aplicable
si los datos se encuentran desagrupados; en caso contrario debemos calcular la media
mediante la multiplicación de los diferentes valores por la frecu encia con que se
encuentren dentro de la información; es decir,

   

Donde (Yi) representa el punto medio de cada observación, (ni) es la frecuencia o


número de observaciones en cada clase y (n) es el tamaño de la muestra siendo igual
a la suma de las frecuencias de cada clase.

Para entender mejor este concepto vamos a suponer que hemos tomado la edad de 5
personas al azar cuyos resultados fueron (22, 33, 35, 38 y 41). Para facilitar su
interpretación se han generado tres rangos de edad los cuales se han establecido de
21 a 30 años, de 31 a 40 años y de 41 a 50 años. Si nos fijamos en estos rangos
notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de
la organización de estos datos se representan en la tabla [5 -1].
r  

Si aplicamos la fórmula para valores agrupados obtendríamos que la media es igual a

Lo que nos indicaría que el promedio de edad de los encuestados es de 35 años. Si ha


estos mismos resultados le aplicamos la ecuación para datos desa grupados (Ecuación
5-3), tomando como referencia cada uno de los valores individuales, obtendríamos que
la media es igual a

Lo que nos indicaría que el promedio de edad para los datos desagrupados es de 34
años aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde
parcialmente la exactitud de los cálculos, principalmente al aumentar el número de
datos.

c
En estadística, la  es el valor con una mayor frecuencia en una distribución de

datos.

Hablaremos de una distribución bimoda l de los datos cuando encontremos dos modas,
es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución
trimodal de los dat os es en la que encontramos tres modas. Si todas las variables
tienen la misma frecuencia diremos que no hay moda.

El
 c  es el de mayor frecuencia absoluta. Cuando tratamos con datos
agrupados antes de definir la moda, se ha de definir el inte rvalo modal.
La a, ando los datos st n agrupados, s un punto ue di ide al intervalo odal
en dos partes de la forma p p, siendo la amplitud del intervalo, ue verifi uen

ue:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los

intervalos anterior posterior, respectivamente, al intervalo modal.

‘ cc c  c

Para obtener la moda en datos agrupados se usa la siguiente f rmula:

onde:

L i  = Límite inferior de la clase modal.


D  = es la frecuencia absoluta inmediatamente inferior a la clase modal.
D = es la frecuencia absoluta inmediatamente posterior a la clase modal.
i = intervalo.

  c

Encontrar la estatura modal de un grupo ue se encuentra distribuido de la siguiente


forma:

Entre . ay estudiante
Entre . y . ay , estudiantes
Entre . y . ay estudiantes
Entre . y . ay , estudiantes.
Entre . y . ay estudiantes.
Entre . y .6 ay estudiantes.
Entre .6 y .7 ay estudiantes.
Entre .7 y . ay estudiantes.

lase modal = .6 y .7 es la ue tiene frecuencia absoluta más alta,

Li = .6 = = i= .

oda = .6 + / * . = .67


c

Sus principales propiedades son:

R álculo sencillo.
R Interpretaci n muy clara.
R Al depender sólo de las frecuencias, puede calcularse paravariables
cualitativas. Es por ello el parámetro más utili ado cuando al resumir una
población no es posible reali ar otros cálculos, por ejemplo, cuando se
enumeran en medios periodísticos las características más frecuentes de
determinado sector social. Esto se conoce informalmente como "retrato robot".

 



c

R Su valor es independiente de la mayor parte de los datos, lo ue la ace muy


sensible a variaciones muestrales. Por otra parte, en variables agrupadas en
intervalos, su valor depende excesivamente del número de intervalos y de su
amplitud.
R sa muy pocas observaciones, de tal modo ue grandes variaciones en los
datos fuera de la moda, no afectan en modo alguno a su valor.
R o siempre se sitúa acia el centro de la distribución.
R Puede aber más de una moda en el caso en ue dos o más valores de la
variable presenten la misma frecuencia distribuciones bimodales o
multimodales).

˜˜ c
En estadística se llama sesgo de un estimador a la diferencia entre su esperanza
matemática y el valor del parámetro ue estima. n estimador cuyo sesgo es nulo se
llama insesgado o centrado.

En notación matemática, dada una muestra y un estimador


del parámetro muestral ș, el sesgo es

El no tener sesgo es una propiedad deseable de los estimadores. na propiedad


relacionada con sta es la de la consistencia: un estimador puede tener un sesgo pero
el tamaño de ste converger a cero conforme crece el tamaño muestral.

ada la importancia de la falta de sesgo, en ocasiones, en lugar de estimadores


naturales se utilizan otros corregidos para eliminar el sesgo. Así ocurre, por ejemplo,
con la varianza muestral.
Ô ˜˜c
Esta medida determina el grado de concentración que presentan los valores en la
región central de la distribución. Por medio del Ô iit  Ôt i , podemos
identificar si existe una gran concentración de valores ( 
t ti ), una
concentración normal (  ti ) ó una baja concentración ( l ti ti ).

r 


Para calcular el coeficiente de Curtosis se utiliza la ecuación:

   

Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, ( ) la
media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta fórmula
se interpretan:

R g2 0)  l  itib ió   ti ëc Al igual que en la asimetría es


bastante difícil encontrar un coeficiente de Curtosis de cero (0), por lo que se
suelen aceptar los valores cercanos (± 0.5 aprox.).
R (g2 > 0) l itib ió 
t ti
R (g2 < 0) l itib iól ti ti

Cuando la distribución de los datos cuenta con un coeficiente de asimetría (g1 ±0.5)
y un coeficiente de Curtosis de (g2 ±0.5), se le denomina Curva Normal. Este criterio
es de suma importancia ya que para la mayoría de los procedimientos de la estadística
de inferencia se requiere que los datos se distribuyan normalmente.

La principal ventaja de la distribución normal radica en el supuesto que el 95% de los


valores se encuentra dentro de una distancia de dos desviaciones estándar de la
media aritmética (Fi g.5-3); es decir, si tomamos la media y le sumamos dos veces la
desviación y después le restamos a la media dos desviaciones, el 95% de los casos se
encontraría dentro del rango que compongan estos valores.

r  
Desde luego, los conceptos vistos hasta aquí, son sólo una pequeña introducción a las
principales medidas de Estadística Descriptiva; es de gran importancia que los lectores
profundicen en estos temas ya que la principal dificultad del paquete SPSS radica en
el desconocimiento de los conceptos estadísticos.

Las definiciones plasmadas en este capítulo han sido extraídas de los libros
t ti 
  iit   escrito por l t de la editorial   ill y
el libro t ti t escrito por Ôi  t editorial  it  ( t  
i ió ). No necesariamente tienes que guiarte por estos libros ya que en las librerías
encontraras una gran variedad de textos que pueden ser de bastante utilidad en la
introducción a esta ciencia

 ˜ 
un 
   es una representación gráfica de una variable en forma de barras,
donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. En el eje vertical se representan las frecuencias, y en el eje horizo ntal
los valores de las variables, normalmente señalando las marcas de clase, es decir, la
mitad del intervalo en el que están agrupados los datos.

Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de
la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores
continuos. En los casos en los que los datos son cualitativos (no -numéricos), como
sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores .

Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que
en ciencias naturales y exactas. Y permite la comparación de los resultados de un
proceso.


c c
   c

R Diagramas de barras simples


Representa la frecuencia simple (absoluta o relativa) mediante la altura de la
barra la cual es proporcional a la frecuencia simple de la categoría que
representa.
R Diagramas de barras compuesta
Se usa para representar la información de una tabla de doble entrada o sea a
partir de dos variables, las cuales se representan así; la altura de la barra
representa la frecuencia simple de las modalidades o categorías de la variable
y esta altura es proporcional a la frecuencia simple de cada modalidad.
R Diagramas de barra s agrupadas
Se usa para representar la información de una tabla de doble entrada o sea a
partir de dos variables, el cual es representado mediante un conjunto de barras
como se clasifican respecto a las diferentes modalidades.
R Polígono de frecuencias
Es un gráfico de líneas que se usa para presentar las frecuencias absolutas de
los valores de una distribución en el cual la altura del punto asociado a un valor
de las variables es proporcional a la frecuencia de dicho valor.
R Ojiva porcentual
Es un gráfico acumulativo, el cual es muy útil cuando se quiere representar el
rango porcentual de cada valor en una distribución de frecuencias.

En los gráficos las barras se encuentran juntas y en la tabla los números poseen en el
primer miembro un corchete y en el segun do un parentesis, por ejemplo: [10 -20)

Ô  
 c c c
   c

R  c

Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.

R  c

Obtener los números de clases, existen varios criterios para determinar el número de
clases (o barras) -por ejemplo la regla de Sturgess -. Sin embargo ninguno de ellos es
exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cómo
estén los datos y cuántos sean. Un criterio usado frecuentemente es que el número de
clases debe ser aproximadamente a la raíz cuadrada del número de datos. Por
ejemplo, la raíz cuadrada de 30 ( número de artículos) es mayor que cinco, por lo que
se seleccionan seis clases.

R  c

Establecer la longitud de clase: es igual al rango dividido por el número de clases.

R  c

Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los
datos en relación al resultado del PASO 2 en intervalos igu ales.

R  c

Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se
hace un gráfico de barras, las bases de las barras son los intervalos de clases y altura
son la frecuencia de las clases. Si se unen los puntos medios de la base superior de
los rectángulos se obtiene el polígono de frecuencias.

El histograma de una imagen representa la frecuencia relativa de los niveles de gris de


la imagen. Las técnicas de modificación del histograma de una imagen son útiles para
aumentar el contraste de imágenes con histogramas muy concentrados.

Sea u una imagen de tamaño NxN, la función de distribución del histograma es: r(l)
(N 
ixl (i,j)t l (i,j) < l) / N2

, un 
   es una representación gráfica de una variable en forma de barra s,
donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. En el eje vertical se representan las frecuencias, y en el eje horizontal
los valores de las variables, normalmente señalando las marcas de clase, es decir, la
mitad del intervalo en el que están agrupados los datos.

c !c

La ojiva es una gráfica asociada a la distribución de frecuencias, es decir, que en ella


se permite ver cuántas obs ervaciones se encuentran por encima o debajo de ciertos
valores, en lugar de solo exhibir los números asignados a cada intervalo.

La ojiva apropiada para información que presente frecuencias mayores que el dato
que se está comparando tendrá una pendiente n egativa (hacia abajo y a la derecha) y
en cambio la que se asigna a valores menores, tendrá una pendiente positiva. Una
gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar
parcialmente la misma técnica a una distribución acumulativa y de igual manera que
éstas, existen las ojivas mayor que y las ojivas menor que.

Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias
(y por esto la aplicación de la técnica es parcial):

Un extremo de la ojiva no se ³amarra´ al eje horizontal, para la ojiva mayor que sucede
con el extremo izquierdo; para la ojiva menor que, con el derecho.

En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de
clase. Para el caso de la ojiva ma yor que es la frontera menor; para la ojiva menor
que, la mayor.

Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la


menor que, utilizando los datos que se usaron para ejemplificar el histograma:

La ojiva mayor que (izquierd a) se le denomina de esta manera porque viendo el punto
que está sobre la frontera de clase ³4:00Ǝ se ven las visitas que se realizaron en una
hora mayor que las 4:00 horas (en cuestiones temporales se diría, sin errores de
gramática: después de las 4:00). De forma análoga, en la ojiva menor que la
frecuencia que se representa en cada frontera de clase son el número de
observaciones menores que la frontera señalada (en caso de tiempos sería el número
de observaciones antes de la hora que señala la frontera) .

Si se utiliza una distribución porcentual acumulativa entonces se obtiene una ojiva


(mayor que o menor que según sea el caso) cuyo eje vertical tiene una c c cc c

cc

También podría gustarte