Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Conceptos Estadsticos:
X 1, X 2 , , X n ))para
Estimador: funcin matemtica (aplicada a una muestra (
X 1, X 2 , . , X n
predecir(estimar) el valor de un parmetro, ^ = ).
f
Estadsticos descriptivos:
Media aritmtica
Definicin: es una medida de tendencia central que se obtiene por la suma de todas las
puntuaciones de un grupo de datos dividida por el nmero de datos.
xi
X = i=1
N
x i ni
X = i=1
N
Dnde:
ni es la frecuencia de datos
xi y N = ni . Si los datos estn agrupados
i=1
xi ci
en clases de frecuencia, tenemos que la expresin anterior cambiamos por
que es el punto medio de la clase o intervalo y tenemos k intervalos.
Mediana
Definicin: la mediana es una medida de tendencia central, que divide en dos partes
iguales a un conjunto de datos previamente ordenados. Es la puntuacin del dato que
deja por encima y por debajo de s el 50% de los casos.
X 1 , X 2 ,. . . , X n
Sean los datos de una muestra ordenada creciente y designando la
~
mediana como X , se distinguen dos casos:
Si n es impar la mediana se define como:
~
X= X (n+ 1)
2
(n+1)
Donde 2 representa la posicin del valor que se encuentra a la mitad del
conjunto de datos.
X
n
( 2 + X n +1 )
2
2
~
X=
X
n
( 2 + X n +1 )
Donde 2 representa las posiciones de los valores que se
2
encuentran a la mitad del conjunto de datos.
Desviacin estndar de una muestra:
n
1
S= ( X i X )2
n i=1
( x i X )2
S 2= i=1
N
( x i X )2 ni
S 2= i=1
N
x i por
tenemos los datos agrupados en intervalos, en la expresin anterior cambiamos
Definicin: el coeficiente de variacin es lo que nos permite evitar estos problemas, pues
elimina la dimencionalidad de las variables y tiene en cuenta la proporcin existente entre
medias y desviacin tpica.
Se define como
S
CV = 100
|X |
Donde
El anlisis de varianza (Anova) es una tcnica utilizada para el anlisis de datos de los
diseos experimentales. Este anlisis se utiliza cuando se quieren contrastar ms de dos
medias y es una extensin de la prueba t de student para diferencia de dos medias. A la
variable categrica que define los grupos se le llama Variable Independiente (VI), y a la
variable cuantitativa en donde se har la comparacin de grupos se le llama Variable
Dependiente (VD).
Para poner a prueba dicha hiptesis de igualdad de medias, se tiene que obtener un
estadstico F de Snedecor para comparar el parecido que existe entre las medias que se
estn comprobando. La ecuacin para obtener el estadstico F es la siguiente:
MSA
F=
MSE
Donde MSA es cuadrado medio entre grupo y el MSE es el cuadrado medio dentro de
grupos.
Que existe entre las medias de cada grupo, mientras que el MSE tambin es una
estimacin de la varianza poblacional, pero esta se basa en la variabilidad que existe
dentro de cada grupo.
H 1 ).
MSA
F=
MSE
de establecer los tipos de consulta que presentan mayor y menor tiempo de espera y,
tambin identificar el mayor y el menor tiempo de consulta que reciben los usuarios;
adems de verificar cuales de los subprocesos despus de consulta presentan el mayor y
menor tiempo de espera.
Tablas de contingencia:
Consideremos una poblacin (o una muestra) compuesta por N individuos sobre los que
se pretende analizar simultneamente dos atributos o factores (variables cuantitativas).
A 1 , , A h , y por B 1 , , B k , las h y k modalidades del factor A y del
Designemos por
nij
factor B respectivamente, y por el nmero de individuos que presentan a la vez las
A ,B
B1 B2 . .. Bj . .. Bk ni .
A1 n11 n12 . .. n1 j . .. n1 k n1
A2 n21 n22 . .. n2 j . .. n2 k n2
: : : : : : :
Ai ni 1 ni 2 . .. nij . .. nik ni
: : : : : : :
Ah nh 1 nh 2 . .. nhj ... nhk nh
n .j n .1 n .2 . .. n .j ... n .k n ..
2
Prueba de Chi Cuadrada ( x )
Requisitos:
Muestras independientes
Las variables son cualitativas o categricas
Las mediciones de la variable estn en escala Nominal
Las categoras de cada una de las variables son mutuamente excluyentes.
2
El valor del estadstico X se podr aproximar por una distribucin Chi-
cuadrado cuando el tamao muestral n sea grande(n<30), y todas las frecuencias
esperadas sean iguales o mayores a 5 (en ocasiones debemos agrupar varias
categoras a fin de que se cumpla este requisito.)
Las observaciones son obtenidas mediante muestreo aleatorio a partir de una
poblacin particionada en categoras.
el test exacto de Fisher permite analizar si dos variables dicotmicas estn asociadas
cuando la muestra a estudiar es demasiado pequea y no se cumple las condiciones
necesarias para que la aplicacin del test X2 sea adecuada. Lleva el nombre de su
inventor Ronal Fisher, y es una clase de pruebas de pruebas exactas, llamadas as
porque el significado de la desviacin de la hiptesis nula se puede calcular con exactitud,
en lugar de basarse en una aproximacin que se hace exactamente en el limite el tamao
de la muestra crece hasta el infinito, como otros anlisis estadsticos.
Analisis Cluster
Concepto: el termino anlisis cluster se utiliza para definir una serie de tcnicas,
fundamentalmente algoritmos, que tienen por objeto la bsqueda de grupos similares de
individuos o de variables que se van agrupando en conglomerados. Dada una muestra de
individuos o de variables que se van agrupando en conglomerados. Dada una muestra de
individuos, da cada uno de los cuales se dispone de una serie de observaciones, el
anlisis cluster sirve para clasificarlos en grupos lo ms homogneos posible en base a
las variables observadas. Los individuos que clasificados en el mismo grupo sern tan
similares como sea posible.
Existen dos grandes tipos de anlisis de clusters: aquellos que asignan los casos a
grupos diferenciados que el propio anlisis configura, sin que unos dependan de otros, se
conocen como no jerrquicos, y aquellos que configuran grupos con estructura
arborescente, de forma que clusters de niveles ms bajos van siendo englobados en
otros de niveles superiores, se denomina jerrquicos.
Anlisis discriminante:
El anlisis discriminante es una tcnica estadstica que permite asignar o clasificar nuevos
individuos dentro de grupos previamente reconocidos o definidos. El anlisis discriminante
se conoce en ocasiones como anlisis de la clasificacin, ya que su objetivo fundamental
es producir una regla o un esquema de clasificacin que permita a un investigados
predecir la poblacin a la que es ms probable que tenga que pertenecer una nueva
observacin (supuestas conocidas varias poblaciones a las que puedan pertenecer las
observaciones).
El anlisis parte de una tabla de datos de n individuos en que se han medido p variables
cuantitativas independientes o explicativas como perfil de cada uno de ellos. Una
variable cualitativa adicional (independiente o clasificativa), con dos (o ms) categoras,
ha definido por otros medios el grupo a que cada individuo pertenece. A partir de esta
variable cualitativa se obtendr un modelo matemtico discriminante contra el cual ser
contrastado el perfil de un nuevo individuo cuyo grupo se desconoce para, en funcin de
un resultado numrico, ser asignado al grupo ms probable. Cuanto mejor sea la
informacin de partida ms fiable ser el resultado de asignaciones posteriores.
Escalado multidimensional:
inicial. Cuando p>2 , las variables pueden ordenarse en importancia y suelen hacerse
Se trata de un ndice de consistencia interna que toma valores ente 0 y 1 y que sirve para
comprobar si el instrumento que se est evaluando recopila informacin defectuosa y por
tanto nos llevara a conclusiones equivocadas o si se tratara de un instrumento fiable que
hace mediciones estables y consistentes.
[S
]
2
k
= 1 2 i
k1 ST
Dnde:
K: el nmero de tems
2
S T : Varianza dela suma de los tems