Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cuando los valores repre sentan una población la ecuación se define como:
rees
Donde (X) representa la Media para la muestra, (n) el tamaño de la muestra y (Xi)
representa cada uno de los valores observados. Esta fórmula únicamente es aplicable
si los datos se encuentran desagrupados; en caso contrario debemos calcular la media
mediante la multiplicación de los diferentes valores por la frecu encia con que se
encuentren dentro de la información; es decir,
Para entender mejor este concepto vamos a suponer que hemos tomado la edad de 5
personas al azar cuyos resultados fueron (22, 33, 35, 38 y 41). Para facilitar su
interpretación se han generado tres rangos de edad los cuales se han establecido de
21 a 30 años, de 31 a 40 años y de 41 a 50 años. Si nos fijamos en estos rangos
notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de
la organización de estos datos se representan en la tabla [5 -1].
r
Lo que nos indicaría que el promedio de edad para los datos desagrupados es de 34
años aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde
parcialmente la exactitud de los cálculos, principalmente al aumentar el número de
datos.
c
En estadística, la es el valor con una mayor frecuencia en una distribución de
datos.
Hablaremos de una distribución bimoda l de los datos cuando encontremos dos modas,
es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución
trimodal de los dat os es en la que encontramos tres modas. Si todas las variables
tienen la misma frecuencia diremos que no hay moda.
El
c es el de mayor frecuencia absoluta. Cuando tratamos con datos
agrupados antes de definir la moda, se ha de definir el inte rvalo modal.
La a, ando los datos st n agrupados, s un punto ue di ide al intervalo odal
en dos partes de la forma p p, siendo la amplitud del intervalo, ue verifi uen
ue:
Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los
cc c c
onde:
c
Entre . ay estudiante
Entre . y . ay , estudiantes
Entre . y . ay estudiantes
Entre . y . ay , estudiantes.
Entre . y . ay estudiantes.
Entre . y .6 ay estudiantes.
Entre .6 y .7 ay estudiantes.
Entre .7 y . ay estudiantes.
Li = .6 = = i= .
oda = .6 + / * . = .67
c
R álculo sencillo.
R Interpretaci n muy clara.
R Al depender sólo de las frecuencias, puede calcularse paravariables
cualitativas. Es por ello el parámetro más utili ado cuando al resumir una
población no es posible reali ar otros cálculos, por ejemplo, cuando se
enumeran en medios periodísticos las características más frecuentes de
determinado sector social. Esto se conoce informalmente como "retrato robot".
c
c
En estadística se llama sesgo de un estimador a la diferencia entre su esperanza
matemática y el valor del parámetro ue estima. n estimador cuyo sesgo es nulo se
llama insesgado o centrado.
r
Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, ( ) la
media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta fórmula
se interpretan:
Cuando la distribución de los datos cuenta con un coeficiente de asimetría (g1 ±0.5)
y un coeficiente de Curtosis de (g2 ±0.5), se le denomina Curva Normal. Este criterio
es de suma importancia ya que para la mayoría de los procedimientos de la estadística
de inferencia se requiere que los datos se distribuyan normalmente.
r
Desde luego, los conceptos vistos hasta aquí, son sólo una pequeña introducción a las
principales medidas de Estadística Descriptiva; es de gran importancia que los lectores
profundicen en estos temas ya que la principal dificultad del paquete SPSS radica en
el desconocimiento de los conceptos estadísticos.
Las definiciones plasmadas en este capítulo han sido extraídas de los libros
t
ti
iit
escrito por l
t de la editorial
ill y
el libro t
ti
t escrito por Ôi
t editorial it (t
iió ). No necesariamente tienes que guiarte por estos libros ya que en las librerías
encontraras una gran variedad de textos que pueden ser de bastante utilidad en la
introducción a esta ciencia
un
es una representación gráfica de una variable en forma de barras,
donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. En el eje vertical se representan las frecuencias, y en el eje horizo ntal
los valores de las variables, normalmente señalando las marcas de clase, es decir, la
mitad del intervalo en el que están agrupados los datos.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de
la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores
continuos. En los casos en los que los datos son cualitativos (no -numéricos), como
sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores .
Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que
en ciencias naturales y exactas. Y permite la comparación de los resultados de un
proceso.
c
c
c
En los gráficos las barras se encuentran juntas y en la tabla los números poseen en el
primer miembro un corchete y en el segun do un parentesis, por ejemplo: [10 -20)
Ô
c
cc
c
R c
Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.
R c
Obtener los números de clases, existen varios criterios para determinar el número de
clases (o barras) -por ejemplo la regla de Sturgess -. Sin embargo ninguno de ellos es
exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cómo
estén los datos y cuántos sean. Un criterio usado frecuentemente es que el número de
clases debe ser aproximadamente a la raíz cuadrada del número de datos. Por
ejemplo, la raíz cuadrada de 30 ( número de artículos) es mayor que cinco, por lo que
se seleccionan seis clases.
R c
R c
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los
datos en relación al resultado del PASO 2 en intervalos igu ales.
R c
Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se
hace un gráfico de barras, las bases de las barras son los intervalos de clases y altura
son la frecuencia de las clases. Si se unen los puntos medios de la base superior de
los rectángulos se obtiene el polígono de frecuencias.
Sea u una imagen de tamaño NxN, la función de distribución del histograma es: r(l)
(N
ixl (i,j)t
l (i,j) < l) / N2
, un
es una representación gráfica de una variable en forma de barra s,
donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. En el eje vertical se representan las frecuencias, y en el eje horizontal
los valores de las variables, normalmente señalando las marcas de clase, es decir, la
mitad del intervalo en el que están agrupados los datos.
c !c
La ojiva apropiada para información que presente frecuencias mayores que el dato
que se está comparando tendrá una pendiente n egativa (hacia abajo y a la derecha) y
en cambio la que se asigna a valores menores, tendrá una pendiente positiva. Una
gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar
parcialmente la misma técnica a una distribución acumulativa y de igual manera que
éstas, existen las ojivas mayor que y las ojivas menor que.
Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias
(y por esto la aplicación de la técnica es parcial):
Un extremo de la ojiva no se ³amarra´ al eje horizontal, para la ojiva mayor que sucede
con el extremo izquierdo; para la ojiva menor que, con el derecho.
En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de
clase. Para el caso de la ojiva ma yor que es la frontera menor; para la ojiva menor
que, la mayor.
La ojiva mayor que (izquierd a) se le denomina de esta manera porque viendo el punto
que está sobre la frontera de clase ³4:00Ǝ se ven las visitas que se realizaron en una
hora mayor que las 4:00 horas (en cuestiones temporales se diría, sin errores de
gramática: después de las 4:00). De forma análoga, en la ojiva menor que la
frecuencia que se representa en cada frontera de clase son el número de
observaciones menores que la frontera señalada (en caso de tiempos sería el número
de observaciones antes de la hora que señala la frontera) .