Está en la página 1de 77

Anlisis de Datos

Definiciones
Estadstica:
Definiciones
Estadstica
"La estadstica estudia el comportamiento de los fenmenos llamados de
colectivo. Est caracterizada por una informacin acerca de un colectivo o colectivo. Est caracterizada por una informacin acerca de un colectivo o
universo, lo que constituye su objeto material; un modo propio de razonamiento,
el mtodo estadstico, lo que constituye su objeto formal y unas previsiones de
cara al futuro, lo que implica un ambiente de incertidumbre, que constituyen su
objeto o causa final." (Cabri, 1994).
"Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de
propiciar la toma de decisiones ms eficaz".
Definiciones
Tipos de Estadstica
Descriptiva Inferencial
A B
Definiciones
Tipos de Estadstica
Descriptiva Inferencial Descriptiva Inferencial
Consiste sobre todo en la
presentacin de datos en forma de
tablas y grficas. Esta comprende
cualquier actividad relacionada con
los datos y est diseada para
resumir o describir los mismos sin
factores pertinentes adicionales; esto
es, sin intentar inferir nada que vaya
ms all de los datos, como tales.
Se deriva de muestras, de
observaciones hechas slo acerca de
una parte de un conjunto numeroso
de elementos y esto implica que su
anlisis requiere de generalizaciones
que van ms all de los datos. La
Estadstica Inferencial investiga o
analiza una poblacin partiendo de
una muestra tomada.
Conceptos Bsicos
de Inferencia Estadstica
Mecanismos de
seleccin
x1
x2
x3
x1
Poblacin
Muestra Aleatoria
Parmetro
Estimador
seleccin
x3
x5
x4
. . .
x2
x3
x1
x
N
Poblacin
El conjunto de todos los elementos de inters, esta definicin no es exclusiva de
seres humanos. Una poblacin debe definirse claramente en el tiempo y en el
espacio.
Ejemplos Ejemplos
Todos los lotes de caa de azcar del sector 1 sembrados durante el mes
septiembre del ingenio mi dulcecito.
Todos los posibles compradores empresariales potenciales de azcar
refinadas en los E.U. para el mes de diciembre del 2012.
Los estudiantes de probabilidad y estadstica de la UAO
para el primer semestre del ao 2013.
Muestra
Porcin o parte de la poblacin de inters. Un subconjunto de
la poblacin.
Ejemplo: Cuando se prepara sopa para 100 personas, la olla es mucho ms grande
que la utilizada para preparar sopa para 5 personas, sin embargo si deseamos
estimar si la sopa tiene sal, con una sola cucharada es suficiente para darse cuenta estimar si la sopa tiene sal, con una sola cucharada es suficiente para darse cuenta
si tiene sal o no. Observe que el tamao de la poblacin no influyo en el tamao de
la muestra.
Elementos necesarios para seleccionar una muestra:
Costo
Tiempo
Medicin que destruye el elemento
Facilidad de consecucin de la informacin
Es ms til tomar una muestra que una poblacin por la
homogeneidad de la variable, cuando hacer fcilmente a toda
una poblacin.
Muestra Aleatoria
Se considera aleatoria siempre y cuando cada observacin,
medicin o individuo de la poblacin tenga la misma
probabilidad de ser seleccionado.
Parmetro
Es una cantidad numrica calculada sobre una
poblacin
Mecanismos de
x2
Poblacin
Muestra Aleatoria
Parmetro
Estimador
Mecanismos de
seleccin
x1
x2
x3
x5
x4
. . .
x2
x3
x1
x
N
Estimador o Estadstico
Es una cantidad numrica calculada sobre una muestra
Mecanismos de
x2
Poblacin
Muestra Aleatoria
Parmetro
Estimador
Mecanismos de
seleccin
x1
x2
x3
x5
x4
. . .
x2
x3
x1
x
N
Variable
Es la caracterstica de la muestra o poblacin que se
est estudiando. Los datos son el producto de su
medicin sobre los elementos o sujetos de estudio.
1. La edad
2. Color de ojos
3. Nombre de bebidas favoritas
4. Sexo
5. Ingresos
Conceptos Bsicos
de Inferencia Estadstica
Parmetro Media = $860
Variable
Estadstico
810 670 1030
990 600
Media=$820
Parmetro vs estadstico
15
10
5
Poblacin Poblacin
Parmetro
se refiere a la poblacin
4.4 4.2 4.0 3.8 3.6 3.4 3.2 3.0
5
0
Muestra Muestra
se refiere a la poblacin
4.4 4.2 4.0 3.8 3.6 3.4 3.2 3.0
5
0
5
0
Estadstico
se refiere a la Muestra
x
Ejercicio
Una empresa comercializadora del servicio de energa
elctrica de una ciudad esta interesada en determinar el
nivel socioeconmico de sus clientes, adems de nivel socioeconmico de sus clientes, adems de
identificar posibles fraudes y la imagen que tiene la
empresa con respecto al servicio que presta. Para ello
decide recolectar una informacin en forma aleatoria a 50
hogares de la ciudad durante el mes agosto del ao en
curso.
Ejercicio
Cul es la poblacin bajo estudio?
Cul es el elemento de inters?
La anterior informacin corresponde a una poblacin o a
una muestra?
Qu caractersticas deben ser observadas en los
elementos de inters?
Lectura: Historia de una barra de chocolate
Cul es la materia prima de la estadstica?
Cul es su razn de ser?
cules son de las tcnicas o herramientas estadstica
utilizadas?
En que etapas del proceso son utilizadas?
Variable
Tipo de variables
Cualitativa Cuantitativa
Discreta Continua
Variables
Variables Cualitativas o Atributos: Este tipo de variables
representan una cualidad o atributo que clasifica a cada caso en una
de varias categoras. Pueden ser dicotmicas o politmicas. de varias categoras. Pueden ser dicotmicas o politmicas.
(ejemplos: el gnero, profesin, estado civil, etc.).
Variables Cuantitativas (por ejemplo la edad, la altura, el
peso, etc.).
Variables
A su vez las variables cuantitativas se puede dividir en dos
subclases:
Cuantitativas discretas. Aquellas a las que se les puede
asociar un nmero entero, es decir, aquellas que por su

asociar un nmero entero, es decir, aquellas que por su


naturaleza no admiten un fraccionamiento de la unidad, por
ejemplo nmero de hermanos, pginas de un libro, etc.
Cuantitativas continuas: Aquellas que no se pueden expresar
mediante un nmero entero, es decir, aquellas que por su
naturaleza admiten que entre dos valores de la variable pueda
tomar cualquier valor intermedio, por ejemplo
peso, estaturas, medidas de longitud, etc.
168 169
168.4 168.8
Variables
Escalas de medicin
de variables
Nominal Ordinal Intervalo Razn
Se utilizan nombres para establecer categoras de una variable.
Para distinguir las categoras se utilizan letras, smbolos e incluso
nmeros los cuales nicamente designan una relacin de equivalencia.
Las tcnicas estadsticas que se pueden utilizar con variables de escala
nominal son la moda y las frecuencias.
Esta escala permite adems de
clasificar generar un orden, es decir,
establecer una secuencia lgica que
mide la intensidad del atributo o el
ordenamiento jerrquico del mismo
Ejemplo 1.
Estrato socioeconmico:
Estrato (1)
Estrato (2)
Estrato (3)
Estrato (4)
Existe una diferencia entre
los estratos.
Esta escala mide las variables de manera numrica.
Permite clasificar (nominal) y ordenar (ordinal) y los intervalos son iguales
Es posible conocer las distancias numricas o grados que separan unas de
otras.
Ejemplo: La temperatura; una persona que en un examen de matemticas que
obtiene una puntuacin de cero no significa que carezca de conocimientos; Nivel
de aceite en el motor de un automvil medido con una vara graduada; fechas;
coordenadas; puntos kilomtricos.
Esta escala posee las propiedades anteriores como clasificar, Esta escala posee las propiedades anteriores como clasificar,
ordenar y los intervalos son iguales. Existe el cero absoluto o
verdadero, si un objeto que se est midiendo tiene el valor
cero, ese objeto no posee la propiedad o atributo que se est
midiendo.
En esta escala las propiedades aritmticas de multiplicacin y divisin adquieren
significado.
Por ejemplo el ingreso por ventas: Una medida de cero indica que no se ha vendido
nada, ayer vend el doble que hoy, el ingreso por ventas se divide entre el personal.
Ejercicio
Cules variables son cualitativas y cuales son
cuantitativas?
Qu tipo de medicin son las variables?
Ejercicio
Estrato: Es el estrato socioeconmico de acuerdo a la ubicacin de la vivienda,
determinado por la oficina de planeacin municipal ( Estrato 1 a Estrato 6).
No de personas por hogar: No de personas que habitan la vivienda. No de personas por hogar: No de personas que habitan la vivienda.
Consumo mensual en KW-h: Corresponde al consumo realizado en el mes
anterior.
Cocina con Gas: Si o No ( si la vivienda tiene estufa de gas natural o propano
y lo utiliza para cocinar ) o no posee.
No de Electrodomsticos en el hogar: No de electrodomsticos que tiene la
vivienda: lavadoras, neveras equipos de sonido entre otros.
Ejercicio
Genero de la persona que responde la encuesta: F Femenino M Masculino.
Calificacin del servicio: 1 Malo 2 Deficiente 3 Indiferente 4 Bueno 5
Excelente
Ingreso familiar (en Miles de $): corresponde a la suma de los ingresos
mensuales de los habitantes de la vivienda
Organizacin de los datos
Una distribucin de frecuencias: es un arreglo de los datos que
permite expresar la frecuencia de ocurrencias de las
observaciones en cada una de las clases, mostrando el patrn de
la distribucin de manera ms significativa.
Ordenar
Agrupar
Resumir
Para qu se Para qu se
construyen las construyen las
tablas de tablas de
frecuencias ? frecuencias ?
Ejemplo
Las estaturas (en centmetros) de los socios de un club juvenil
son las siguientes
128 138 143 128 128
INTERVALOS
f
128 138 143 128 128
128 128 148 141 144
129 141 134 146 132
132 136 144 136 144
129 144 141 148 129
134 146 134 143 143
INTERVALOS
f
i
[126 -130)
8
[130 -134)
2
[134 -138)
5
[138 -142)
4
[142 -146)
7
[146 -150)
4
30
Tabla de frecuencia
INTERVALOS
f
i
[126 -130) 8
F
i
fr
i
FR
i
8
0,27 0,27
[130 -134) 5
[134 -138) 3
[138 -142) 3
[142 -146) 9
[146 -150) 2
30
0,27 0,27
13
0,17 0,43
16
0,10 0,53
19
0,10 0,63
28
0,30 0,93
30
0,07 1,00
1
1. Definir los intervalos de clase:
Para definir la cantidad de intervalos de clase (k), se puede
usar:
La regla de Sturges: k = 1 + 3.3log(n)
Organizacin de los datos
La regla de Sturges: k = 1 + 3.3log(n)
k = n
2
k
> n
En nuestro ejemplo el nmero de intervalos es:
K = 1 + 3.3 log30 = 1+3.3(1.477121255) = 1+ 4.874500141
= 5.874500141.
Es importante anotar que
siempre se aproximar al entero
mayor siguiente, es decir, por
exceso. En nuestro ejemplo 6.
2. Calcular la amplitud del intervalo.
El rango: Valor mximo Valor mnimo
En nuestro ejemplo el es igual: Rango=148-128=20
Organizacin de los datos
En nuestro ejemplo el es igual: Rango=148-128=20
K=?
Amplitud que denominaremos con la letra a = Rango/K
En nuestro ejemplo
333 . 3
6
20
= = a
Al igual que el nmero de
intervalos se aproximar al
entero mayor siguiente en
nuestro caso ser 4
Ejemplo
3. Calculo del lmite inferior :
2
) )( ( Rango a k
o Valormnim L
i

=
126 2 128
2
20 ) 4 )( 6 (
128 = =

=
i
L
2
o Valormnim L
i
=
Nuestro ejemplo ser:
Tabla de frecuencia
Nmero de intervalos INTERVALOS
1 [126 -130)
2 [130 -134) 2 [130 -134)
3 [134 -138)
4 [138 -142)
5 [142 -146)
6 [146 -150)
Construccin de la tabla de frecuencia:
Punto medio o Marca de clase= (Li+Ls)/2
Frecuencia absoluta de la clase (f
i
)
Organizacin de los datos
Clase/
Intervalo
Pto.
Medio
f
i
F
i
fr
i
FR
i
Frecuencia acumulada de la clase (F
i
)
Frecuencia relativa de la clase (fr
i
): fr
i
= f
i
/n
Frecuencia relativa acumulada de la clase (FR
i
)
INTERVALOS
f
i
[126 -130) 8
F
i
fr
i
FR
i
8 8/30 8/30
Tabla de frecuencia
[130 -134) 5
[134 -138) 3
[138 -142) 3
[142 -146) 9
[146 -150) 2
30
13 5/30 13/30
16 3/30 16/30
19 3/30 19/30
28 9/30 28/30
30 2/30 30/30
1
Los grficos permiten visualizar en forma global y rpida
el comportamiento de los datos.
Para datos cuantitativos agrupados en clases,
Representacin grfica de los datos
Para datos cuantitativos agrupados en clases,
comnmente se utilizan tres grficos:
Histogramas.
Polgono de frecuencias.
Ojiva o Polgono de frecuencias acumuladas
Histograma
Representacin grfica de los datos
Histograma
Representacin grfica de los datos
Histograma y Polgono de Frecuencias
Ojiva
Representacin grfica de los datos
Ojiva
Concepto de distribucin
Fuente: DICCIONARIO DE LA LENGUA ESPAOLA - Vigsima segunda edicin Real Academia Espaola
Funcin emprica de distribucin
acumulativa
Funcin emprica de densidad
) ( fr relativa Frecuencia
) ( int
) (
*
a ervalo Amplitud
fr relativa Frecuencia
f
i
i
=
Funcin emprica de distribucin
acumulativa
Funcin emprica de densidad
Histograma
0,27
0,07
0,17
0,13
0,23
0,13
0
0,05
0,1
0,15
0,2
0,25
0,3
[126 -130) [130 -134) [134 -138) [138 -142) [142 -146) [146 -150)
Histograma
fri

L x para 0
Funcin emprica de distribucin acumulativa
Funcin emprica de distribucin
acumulativa

= +

=
> < <

k
i i i i L
o
L x para
k i L x L para L x f F
L x para
x F
i
1
... 2 , 1 ) (
0
) (
*
) (
1
Ejemplo del uso de la funcin emprica
de distribucin acumulativa
Marca de
Tabla de frecuencia de las estaturas (en centmetros) de los socios de un club
juvenil.
Intervalo (k=6) clase fi Fi fri Fri
[126 -130) 128 8 8 0,27 0,27
[130 -134) 132 2 10 0,07 0,33
[134 -138) 136 5 15 0,17 0,50
[138 -142) 140 4 19 0,13 0,63
[142 -146) 144 7 26 0,23 0,87
[146 -150) 148 4 30 0,13 1,00
Total 30 1,00
Ejemplo del uso de la funcin emprica
de distribucin acumulativa
1. Qu porcentaje de los socios del club juvenil tienen estaturas menores a 139
centmetros?
2. Qu porcentaje de los socios del club juvenil tienen estaturas mayores a 139
centmetros? centmetros?
3. Qu porcentaje de los socios del club juvenil tienen estaturas entre 132 y 136
centmetros?
4. Qu porcentaje de los socios del club juvenil tienen estaturas entre 140 y 147
centmetros?
5. A partir de qu valor el 70% de los socios del club juvenil tiene una estatura menor a l?
6. A partir de qu valor el 35% de los socios del club juvenil tiene una estatura mayor a l?
Otras representaciones grficas de
los datos
Los grficos permiten visualizar en forma global y rpida
el comportamiento de los datos.
Para datos cualitativos se usan: Para datos cualitativos se usan:
Curvas
Barras
Sectores
55%
39%
40%
60%
Categoras de Afiliacin
Barras
Otras representaciones grficas de
los datos
6%
0%
20%
A B C
120
102
62
22
5
6
0
20
40
60
80
100
120
140
Volantes Perifoneo Cajeros Amigos Radio Otro
Medios de Comunicacin
Barras
2.870.585 2.874.762
2.960.423
390.000
410.000
430.000
3.000.000
3.200.000
Otras representaciones grficas de
los datos
302.446 346.306 392.571 408.288
2.753.208
250.000
270.000
290.000
310.000
330.000
350.000
370.000
2.000.000
2.200.000
2.400.000
2.600.000
2.800.000
2006 2007 2008 2009
C
l
i
e
n
t
e
s
Aos
M
i
l
e
s

d
e

$

CLIENTES ventas
Sectores, torta o circular
PAC
100
11%
Otras representaciones grficas de
los datos
Comercio
1.327
62%
Servicios
591
27%
Industria
239
11%
Empresas por Actividad Econmica
POS
823
89%
Medidas de tendencia central
Corresponden a valores que generalmente se ubican en la parte
central de un conjunto de datos.
Forma como los datos pueden condensarse en un solo valor Forma como los datos pueden condensarse en un solo valor
central alrededor del cual todos los datos mustrales se
distribuyen.
Las medidas de tendencia central ms importantes son:
Media Aritmtica
Mediana.
Moda.
Media Aritmtica
Es la suma de todas las observaciones dividida entre el nmero total
de observaciones.
Expresada de forma ms intuitiva, podemos decir que la media Expresada de forma ms intuitiva, podemos decir que la media
aritmtica es la cantidad total de la variable distribuida a partes
iguales entre cada observacin.
Por ejemplo, si en una habitacin hay tres personas, la media de
dinero que tienen en sus bolsillos sera el resultado de tomar todo el
dinero de los tres y dividirlo a partes iguales entre cada uno de
ellos. Es decir, la media es una forma de resumir la informacin de
una distribucin (dinero en el bolsillo) suponiendo que cada
observacin (persona) tendra la misma cantidad de la variable.
Clculo de la media aritmtica
Para datos no agrupados:
n
x
X
n
i
i
=
=
1
n
X =
n
f m
X
k
i
i i
=
=
1
Donde: m
i
: punto medio de la clase i
f
i
: frecuencia absoluta de la clase i
k: cantidad de clases
Para datos agrupados:
Introduccin a las propiedades
de la Media Aritmtica
Desviacin:
La desviacin nos indica una separacin o alejamiento de un dato con respecto a
un cierto nmero de referencia.
Si tenemos que:
A = Valor de referencia
X
i
= Cualquier dato
d
i
= (X
i
A) la desviacin
Introduccin a las propiedades
de la Media Aritmtica
Ejemplo:
Sobre la edades de un grupo particular.
Xi A = 50 Xi A = Media
Valor de Valor de la Valor de Valor de la
Diferencia Datos
Valor de
referencia
Valor de la
diferencia Diferencia Datos
Valor de
referencia
Valor de la
diferencia
d1 64 50 14 d1 64 54 10
d2 65 50 15 d2 65 54 11
d3 53 50 3 d3 53 54 -1
d4 49 50 -1 d4 49 54 -5
d5 46 50 -4 d5 46 54 -8
d6 52 50 2 d6 52 54 -2
d7 43 50 -7 d7 43 54 -11
d8 55 50 5 d8 55 54 1
d9 20 50 -30 d9 20 54 -34
d10 93 50 43 d10 93 54 39
Suma 40 Suma 0
Propiedades:
La suma de las desviaciones de los datos con respecto
a la media aritmtica siempre es igual a cero.
Propiedades de la Media
Aritmtica
a la media aritmtica siempre es igual a cero.
Si a cada uno de los datos se le suma (o resta) una
cantidad A, la nueva media aritmtica ser igual a la
media ms o menos el valor de A.
Propiedades:
Si todos los datos son iguales a C una constante, la
media es igual a la constante.
Propiedades de la Media
Aritmtica
media es igual a la constante.
Si todas las observaciones x
i
se multiplican por una
constante C, la nueva media resulta multiplicado por
la misma constante.
El tiempo que demoran 10 personas para ser atendidos
en una oficina de servicio al cliente en minutos es:
12, 15, 10, 9, 13, 20, 28, 17, 7, 23
Propiedades de la Media
Aritmtica
12, 15, 10, 9, 13, 20, 28, 17, 7, 23
cul es el tiempo promedio que tomaron las 10
personas para ser atendidas?
Si el tiempo segn protocolos de la Superintendencia
Bancaria se debe expresar en horas. Recalcule la
media para ser atendidas las 10 personas.
Propiedades:
Propiedad 5
Propiedades de la Media
Aritmtica
Propiedad 6
Ejercicio
Una compaa constructora resuelve estudiar en un concreto su resistencia a la
comprensin, con el objeto de hacer un control de calidad. Para ello se tomaron
10 cilindros de prueba de acuerdo con las normas establecidas. Los resultados en
kg/cm
2
de presin obtenidos al cabo de 28 das de curado fueron: 295, 282,
221, 240, 328, 191, 275, 253, 259, 206
a. Cul es el promedio muestral de resistencia de los cilindros de concreto?
b. Si se entera que el equipo de medicin de resistencia tiene un error
sistemtico, en el sentido que muestra una lectura superior en 5kg/cm
2
al
verdadero valor, entonces calcule nuevamente la media aritmtica.
c. Si se aumentan la muestra con 5 cilindros ms que se prueban con los
siguientes resultados: 232, 256, 287, 228, 295. Calcule la nueva media.
Propiedades, ventajas y desventajas de la
media
Ventajas:
Emplea en su clculo toda la informacin disponible.
Se expresa en las mismas unidades que la variable en Se expresa en las mismas unidades que la variable en
estudio.
Es el centro de gravedad de toda la distribucin,
representando a todos los valores observados.
Es un valor nico.
Ventajas y desventajas de la media
Ventajas:
Se trata de un concepto familiar para la mayora de
las personas. las personas.
Es til para llevar a cabo procedimientos estadsticos
como la comparacin de medias de varios conjuntos
de datos.
Desventajas:
Se ve adversamente afectada por valores
extremos, perdiendo representatividad.
Ventajas y desventajas de la media
No se puede calcular para datos cualitativos.
Mediana
Es el valor que ocupa la posicin central de un
conjunto de observaciones, una vez que han sido
ordenados en forma ascendente o descendente. ordenados en forma ascendente o descendente.
Divide al conjunto de datos en dos partes iguales.
Clculo de la mediana
Para datos no agrupados:
Si n es impar: posicin donde se ubica la mediana
es igual a (n+1)/2. es igual a (n+1)/2.
Si n es par: (n+1)/2 no es entero, por lo tanto la
mediana ser igual al promedio de las dos
posiciones centrales.
Mediana Ejemplo
Los siguientes datos corresponden a las edades de 14
personas seleccionadas al azar, entre cierta clase de
empleados de la poblacin objetivo de un estudio.
Localizar la mediana.
25 38 29 42 39 54 23
33 45 45 26 34 30 31
Mediana Ejemplo (cont.)
Paso 1: Ordenar los valores del mnimo valor al mximo
Dato 23 25 26 29 30 31 33 Dato 23 25 26 29 30 31 33
Posicin 1 2 3 4 5 6 7
Dato 34 38 39 42 45 45 54
Posicin 8 9 10 11 12 13 14
7.5
Mediana
Mediana Ejemplo (cont.)
Paso 1: Ordenar los valores del mnimo valor al mximo
Dato 23 25 26 29 30 31 33
Mediana
Dato 23 25 26 29 30 31 33
Posicin 1 2 3 4 5 6 7
Dato 34 38 39 42 45 45
Posicin 8 9 10 11 12 13
Clculo de la mediana
Datos agrupados: Clase mediana es la que contiene a la
observacin que ocupa la posicin n/2.
Funcin emprica de distribucin acumulativa

= < +

m
i i i i L
o
L x para
m i L x L para L x f F
L x para
x F
i
1
... 2 , 1 ) (
0
) (
1 1
*
) (
1
Ventajas y desventajas de la mediana
Ventajas:
Fcil de calcular si el nmero de observaciones no es muy
grande.
No se ve influenciada por valores extremos, ya que solo influyen No se ve influenciada por valores extremos, ya que solo influyen
los valores centrales.
Fcil de entender.
Se puede calcular para cualquier tipos de datos cuantitativos.
Es la medida de tendencia central ms representativa en el caso
de variables que solo admiten la escala ordinal.
Ventajas y desventajas de la mediana
Desventajas:
No utiliza en su clculo toda la informacin disponible.
No pondera cada valor por el nmero de veces que se ha
repetido.
Hay que ordenar los datos antes de determinarla.
Moda
Observacin o clase que tiene la mayor frecuencia en
un conjunto de observaciones.
Un conjunto de datos puede ser unimodal, bimodal o Un conjunto de datos puede ser unimodal, bimodal o
multimodal.
Es la nica medida de tendencia central que se puede
determinar para datos de tipo cualitativo.
Por ejemplo, en la muestra: 2, 3, 1, 1, 1, 4, 3, 1, 5, 1,
5, 2, Cul es la moda?
Clculo de la moda
Para datos no agrupados: es simplemente la observacin
que ms se repite.
Para datos agrupados:

Cm Lim Mo
2 1
1
+

+ =
Donde: Lim: lmite inferior de la clase modal.

1
: diferencia entre f
i
de la clase modal y la anterior.

2
: diferencia entre f
i
de la clase modal y la posterior.
Cm: amplitud de la clase modal (clase de mayor frecuencia).
Ventajas y desventajas de la moda
Ventajas:
No requiere clculos.
Puede usarse para datos tanto cuantitativos como
cualitativos.
Fcil de interpretar.
No se ve influenciada por valores extremos.
Ventajas y desventajas de la moda
Desventajas:
Para conjuntos pequeos de datos su valor no tiene casi utilidad,
si es que de hecho existe. Solo tiene significado en el caso de
una gran cantidad de datos. una gran cantidad de datos.
No utiliza toda la informacin disponible.
No siempre existe, si los datos no se repiten.
Difcil de interpretar si los datos tiene 3 o ms modas.
Relacin entre la media, la mediana y la
moda
Cuando los datos son sesgados es mejor emplear la Md

También podría gustarte