Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica Aplicada A La Cs Sociales PDF
Estadistica Aplicada A La Cs Sociales PDF
www.cisolog.com
Frmulas y apuntes de
Estadstica aplicada
a las ciencias sociales
Mayo 2013
El contenido de este documento realizado por
Rubn Crespo se encuentra bajo una Licencia Rubn Crespo
Creative Commons: Atribucin-NoComercial-
SinDerivadas 3.0 Unported. cisolog@cisolog.com
NotaPrevia
Lafinalidaddeestedocumentoesofrecerunaherramientadeapoyotantopara
elprofesionalcomoparaelestudiantequehaasimiladolosconocimientosbsicos
de estadstica aplicada a las ciencias sociales, de manera que cuando realice
prcticasdeinvestigacinsocialdondeserequiereelusodelaestadstica,pueda
disponer de un material de consulta que concentra las principales frmulas y
elementos tericos tiles para resolver la mayora de los problemas que se le
planteen. Por tanto, el contenido de este documento, al no disponer de
explicaciones precisas y exposicin de ejemplos, no es conveniente para el
aprendizaje de la estadstica enfocada a la investigacin social. Para ello se
recomiendalalecturaycomprensindelcitadomanual.Sibienhayotrosmuchos
manuales cuyo aprendizaje serviran para entender las formulas y apuntes
tericos que se compilan aqu, en este documento los contenidos se han
estructuradoenelmismoordenquelosmanualessealadosmsarriba.
Lamayoradelastablasygrficossondeelaboracinpropia,exceptounparde
ellosquesehanextradodelprimermanual,ascomolastablasdelosanexosque
sepuedenencontraralfinaldeldocumento.
RubnCrespo
Mayo,2013
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
ndice
VARIANZA.................................................................................................................................................... 9
DESVIACIN ESTNDAR (O TPICA) ................................................................................................................... 9
VARIANZA PARA DATOS AGRUPADOS ................................................................................................................. 9
DESVIACIN ESTNDAR (O TPICA) PARA DATOS AGRUPADOS ................................................................................ 9
COEFICIENTE DE VARIACIN (PARA COMPARAR EL GRADO DE DISPERSIN ENTRE VARIAS DISTRIBUCIONES) ...................... 9
VALORES DE Z .............................................................................................................................................. 9
EL TEOREMA DE CHEBYSHEV ......................................................................................................................... 10
1 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
EXPERIMENTO BINOMIAL.............................................................................................................................. 16
FORMA GENERAL DE LA DISTRIBUCIN BINOMIAL ............................................................................................. 16
TRINGULO DE TARTAGLIA (O DE PASCAL) ....................................................................................................... 17
VALOR ESPERADO EN LA DISTRIBUCIN BINOMIAL ............................................................................................. 18
2 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
ERRORES TPICOS Y FRMULAS DEL TAMAOS MUESTRAL PARA LOS ESTADSTICOS DE LA MEDIA Y DE
LA PROPORCIN (POBLACIONES INFINITAS) ........................................................................................ 26
POBLACIONES ...................................................................................................................................... 27
POBLACIONES FINITAS.................................................................................................................................. 27
FACTOR DE CORRECCIN PARA POBLACIONES FINITAS ........................................................................................ 27
POBLACIONES INFINITAS ............................................................................................................................... 28
ERRORES TPICOS Y FRMULAS DEL TAMAOS MUESTRAL PARA LOS ESTADSTICOS DE LA MEDIA Y DE
LA PROPORCIN (POBLACIONES FINITAS) ........................................................................................... 28
MARCO..................................................................................................................................................... 28
ESTRATOS .................................................................................................................................................. 29
DESCOMPOSICIN ESQUEMTICA DE UNA POBLACIN EN ESTRATOS ...................................................................... 30
ELEMENTOS DEL MUESTREO ESTRATIFICADO ..................................................................................................... 30
VARIANZA DE LA POBLACIN ESTRATIFICADA .................................................................................................... 30
PROCEDIMIENTOS DE AFIJACIN .................................................................................................................... 31
3 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
DIFERENCIAS DE ESTADSTICOS............................................................................................................ 36
COMPARACIN DE MEDIAS............................................................................................................................ 42
COMPARACIN DE PROPORCIONES ................................................................................................................. 42
4 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
LA COVARIANZA.......................................................................................................................................... 44
INTERPRETACIN DE LA COVARIANZA .............................................................................................................. 45
ERRORES O RESIDUOS................................................................................................................................... 45
ECUACIN DE LA RECTA DE REGRESIN ............................................................................................................ 45
FRMULAS DE AJUSTE DE LA RECTA DE REGRESIN ............................................................................................. 46
COEFICIENTE DE CORRELACIN DE PEARSON .................................................................................................. 46
INTERPRETACIN DEL VALOR DE .................................................................................................................. 46
COEFICIENTE DE DETERMINACIN ............................................................................................................. 47
JI-CUADRADO .............................................................................................................................. 52
5 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Frmulas y apuntes de
Estadstica aplicada a las Ciencias Sociales
Ventajas Inconvenientes
Propiedades Ejemplos
6 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Distribuciones de Frecuencias
ni frecuencias absoluta
N = n1 + n2 + n3 + + ni N Nmero de casos de la poblacin
Variable:
Ejemplos:
Distancia de 3 hasta 4 de 2,5 hasta 4,4999 [2,5 4,5[
Edad de 3 hasta 4 de 3 hasta 4,4999 [3 5[
Marca de clase
7 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
1
A partir de los lmites reales
Mediana
Li Lmite Inferior
Ci Amplitud del Intervalo Ci = Lsup Linf
Cuartiles
Q2 = Me
Q4 = Lsup = Valor Mximo de la Poblacin/Muestra
Deciles
Centiles
Moda
Clculo de Percentiles
1
Ejemplo: si para la variable edad de una muestra quisiramos agregar los datos en diferentes grupos de edades,
en el caso del grupo de 25 a 29 aos el lmite inferior es 25, y el lmite superior es 30 [25 30[. Por tanto, la marca
de clase para ese grupo de edad es 27,5 aos.
8 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Medidas de Dispersin
Varianza
Frmula Alternativa
Frmula Alternativa
Valores de Z
Nos indica a cuntas desviaciones estndar
est cualquier valor ( ) de la Media ( ).
Los valores de los utilizamos para localizar de manera relativa cada valor en la distribucin
en la que se encuentra, permitiendo la comparacin entre valores de distribuciones distintas.
Se establece en cada distribucin la distancia de cualquier valor a la media ( ) y se mide esta
distancia en unidades de desviacin tpica o estndar ( ).
9 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
El Teorema de Chebyshev
Media Geomtrica
10 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Tipos de Grfico
DIAGRAMA DE BARRAS
DIAGRAMA DE SECTORES
HISTOGRAMA
S = b x h h = S/b
POLGONO DE FRECUENCIAS
OJIVA
Anlisis y Comparacin de
Distribuciones
DIAGRAMA DE CAJAS
Distribucin conjunta de
DIAGRAMA DE DISPERSIN
dos variables
11 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
0 P (S) 1
Suceso Elemental Unidad Muestral
Suceso Complementario
Permutacin Variaciones
Combinaciones
12 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Tipos de Sucesos
Simultneos son, o no, mutuamente excluyentes.
Sucesivos/Secuenciales Observar si el anterior condiciona al posterior
o Elemental
o Compuesto
unin ( ) / o [Simultneo]
interseccin ( ) / y [Secuencial]
Si y no estn condicionados:
Regla de Laplace
13 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Suceso Seguro
Discretas
Continuas
Valor Esperado
14 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Igual que toda distribucin, la de probabilidad puede ser discreta o continua, segn sea el
espacio muestral del experimento que la define, es decir, segn sea el conjunto de valores que
puede tomar la variable: el conjunto de resultados posibles del experimento.
En el campo de la investigacin social podemos trabajar con distribuciones empricas, viendo
cmo se distribuyen los datos en una poblacin o en una muestra. Pero cuando trabajamos
con una muestra lo que pretendemos es saber hasta qu punto la distribucin de una variable
que obtenemos en la muestra se corresponde con la distribucin real de la variable en la
poblacin. Para ello necesitamos hacer uso de una distribucin intermedia entre la de la
muestra y la de la poblacin: la distribucin muestral, que es una distribucin terica. Al
calcular el valor esperado en una muestra que hemos supuesto, al trabajar con variables
numricas (no nominales), todas las medidas de todas las muestras posibles (de un
determinado tamao), la distribucin de estas medias constituye la distribucin muestral, que
no hay que confundir con la distribucin emprica de los datos de una muestra, ni con la
distribucin real de los datos de la poblacin.
Cuando realizamos el muestreo, automticamente las distribuciones de frecuencias relativas
de los datos de una poblacin o de una muestra se convierten en una distribucin de
probabilidad.
Por tanto, hay que subrayar la diferencia entre la distribucin emprica (de los datos de la
muestra o de la poblacin) y la distribucin terica que generan las medias de todas las
muestras que podemos extraer de la poblacin investigada en el caso de variables de tipo
cuantitativo.
Las distribuciones tericas son referencia obligada para constrastar distribuciones empricas
observadas en muestras y poder conocer la validez de los datos observados en stas, ya que
nos indicarn hasta qu punto los datos se corresponden con los de la poblacin de donde
extraemos las muestras.
15 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Distribucin Uniforme
Funcin de Densidad
La funcin de densidad se aplica para calcular la probabilidad que toma un intervalo dentro de
distribuciones continuas. Se utilizan reas para conocer la probabilidad de un intervalo de
valores.
Distribucin Binomial
p probabilidad de xito
q probabilidad de fracaso
Experimento Binomial
Para cada nmero de sucesos que fijemos (n) y para cada probabilidad de xito (p) en cada uno
de estos sucesos tendremos una distribucin binomial distinta. Cada distribucin binomial es
determinada por estos dos parmetros: n y p.
N de xitos Probabilidad
(x) p(x)
16 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
n-1
Esta distribucin se describe por los trminos del desarrollo del binomio de Newton .
Los coeficientes de cada trmino
corresponden con una de las lneas del tringulo de Tartaglia o de Pascal.
17 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Distribucin Normal
18 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Los valores de los utilizamos para localizar de manera relativa cada valor en la distribucin
en la que se encuentra, permitiendo la comparacin entre valores de distribuciones distintas.
Se establece en cada distribucin la distancia de cualquier valor a la media ( ) y se mide esta
distancia en unidades de desviacin tpica o estndar ( ).
19 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
20 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Distribucin t de Student
La distribucin de Stundent nos sirve para hacer inferencias sobre la media poblacional a
partir de la media de la muestra cuando se desconoce la desviacin tpica de la poblacin. La
distribucin de Student es una distribucin asociada a la normal. Se puede decir que es una
distribucin normal corregida.
Hay una distribucin t distinta para cada tamao muestral . En este caso se habla de los
Grados de Libertad, que sern siempre , y que estn asociados a l clculo de la
desviacin tpica de la muestra.
Grados de Libertad de la Distribucin t de Student:
21 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Uniforme
b = mximo
a = mnimo
Binominal
= nmero de casos
= probabilidad de xito
Normal
Normal Estndar 0 1
de Student
= grados de libertad
Error
Representatividad de la Muestra
Confianza
Estratificado
Afijacin
Uniforme
Proporcional
Neyman (proporcional a la Varianza)
Por Conglomerados
22 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Parmetros y Estadsticos
Parmetro Estadstico
Con el estadstico vamos buscando el parmetro
Error y Sesgo
Error Estadstico
Errores No Estadsticos
Procede de defectos en los instrumentos de medida y de las condiciones en las que se
establece la medida, as como de otro conjunto de errores en la transmisin de datos. Este
tipo de errores se pueden (y deben) ser evitados. Entre los errores no estadsticos se
encuentra el sesgo:
Sesgo
Desviacin sistemtica de nuestras observaciones respecto a lo que estamos
midiendo. En investigacin mediante muestras el sesgo se produce al obtener
muestra que no se adecan a la poblacin, es decir, por el desfase que existe
entre la poblacin objetivo y la poblacin de la que obtenemos la muestra.
23 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Error Estadstico
Es la medida de la distancia entre el valor del estadstico obtenido en la muestra y el valor del
parmetro en la poblacin.
Nivel de Confianza
Es la probabilidad que existe de que esa distancia, o error estadstico, no sea mayor que la
preestablecida.
Relaciones:
24 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
La distribucin muestral de las medias de una poblacin grande con media y desviacin
tpica se aproxima, segn aumenta , a una distribucin normal con media y desviacin
tpica
Nivel de Confianza
95%
95,45%
99%
99,7%
25 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Fuente: Camarero Rioja, Luis et al. 2010. Estadstica para la investigacin social. Ibergarceta. p. 220.
Parmetro Estadstico
Media: Media:
MEDIA
Varianza: Varianza:
Proporcin/Probabilidad Proporcin/Probabilidad
PROPORCIN
Complementario Complementario
Errores Tpicos y Frmulas del Tamaos Muestral para los estadsticos de la Media y
de la Proporcin (Poblaciones Infinitas)
Media Proporcin*
Parmetro
Error Tpico
Error Estndar
La distribucin se considera
como la Normal cuando:
Tamao Muestral
26 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Fuente: Camarero Rioja, Luis et al. 2010. Estadstica para la investigacin social. Ibergarceta. p. 222.
Poblaciones
Poblaciones Finitas
En investigacin social casi siempre nos referimos a poblaciones finitas. Por tanto las
formulas anteriores aplicadas a poblaciones finitas deben incorporar el factor de
correccin para poblaciones finitas:
27 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Poblaciones Infinitas
Una poblacin infinita es un conjunto de elementos que no pueden definirse mediante
enumeracin. Cuando la relacin entre y ( ) es grande, se desprecia el factor
de correccin para poblaciones finitas:
Errores Tpicos y Frmulas del Tamaos Muestral para los estadsticos de la Media y
de la Proporcin (Poblaciones Finitas)
Media Proporcin*
Parmetro
Error Tpico
Error Estndar
La distribucin se considera
como la Normal cuando:
Tamao Muestral
Diseo de Muestras
Marco
El registro fsico de los elementos de la poblacin se denomina marco. En algunos casos es un
listado para seleccionar elementos de una poblacin. En la mayora de las ocasiones no pude
obtenerse un marco completo y actualizado de la poblacin, o la elaboracin es costosa o
presenta problemas de manipulado.
28 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Procedimiento de Muestreo
Dadas las dificultades de realizar muestras aleatorias simples, en las que todos los elementos
de una poblacin tienen la misma probabilidad de ser seleccionados, se recurre a distintos
sistemas de muestreo que tienen en cuenta lo que ya conocemos sobre la poblacin a
investigar. Al incorporar informacin existente podremos realizar diseos muestrales ms
eficientes, esto es, obtendremos la misma informacin con menor coste que si usramos
mtodos aleatorios puros. Adems, al incorporar informacin existente, podremos mejorar la
representatividad de la muestra.
a. Muestreo Aleatorio
Estratificado
Afijacin
Uniforme
Proporcional
Neyman (proporcional a la Varianza)
Por Conglomerados
Muestreo Estratificado
Estratos
Son subconjuntos o grupos del universo, de forma que todos los elementos pertenecen a uno
de los grupos y slo a uno.
Diseo Uniforme: deseamos conocer resultados para cada uno de los estratos.
Para la aplicacin del diseo estratificado se necesita definir los diferentes estratos y disponer
de informaciones que nos permitan estimar las varianzas en cada uno de ellos.
29 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Nmero de estratos
Poblacin en el estrato
Poblacin
Proporcin de la poblacin en el estrato
o peso del estrato
30 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Procedimientos de Afijacin
Nmero de entrevistas en el estrato una vez establecido el valor de
Coeficiente de Ponderacin
31 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
El diseo estratificado mejora la aplicacin del muestreo respecto al muestreo aleatorio, pero
no resuelve de forma efectiva la cuestin de la obtencin del marco. Si no tenemos un listado
del universo, es difcil tener un listado para sus estratos. El diseo por conglomerados resuelve
de forma prctica estas cuestiones y permite reducir los costes y tiempo de ejecucin.
Los conglomerados son tambin subconjuntos de la poblacin. La diferencia es que mientras
los estratos se construyen buscando homogeneidad entre sus elementos, en los
conglomerados se definen los grupos buscando que los elementos en su interior sean lo ms
diversos posibles. Una vez definidos los conglomerados, se hace una muestra de ellos y se
investiga nicamente los que han sido seleccionados. De hecho, se trata de una tcnica de
seleccin, no de unidades sino de grupos de unidades y en general se compone de varias
etapas.
Conglomerado Unidad Colectiva
32 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Aunque los diseos derivados del muestreo aleatorio (estratos y conglomerados) permiten la
obtencin de datos representativos de la poblacin, as como la inferencia de los resultados
obtenidos mediante muestras al conjunto del universo bajo criterios conocidos de error,
resultan todava procedimientos costosos. En algunos casos, cuando la investigacin se refiere
a opiniones, pueden emplearse otros procedimientos para obtener muestras representativas.
La principal tcnica alternativa es el muestreo por cuotas. Se trata de, en vez de confiar al azar
la seleccin de las unidades, desarrollar un procedimiento de seleccin que reproduzca con la
mxima fidelidad posible la propia estructura de la poblacin. No obstante, para el muestreo
por cuotas es necesario tener un conocimiento preciso sobre la poblacin, pues sera la nica
forma vlida de reproducir una miniatura de la poblacin a estudiar.
Gracias, por ejemplo, a los censos podemos conocer algunas variables como la edad, sexo y
nivel de estudios. De forma conjunta, estas tres variables estn muy relacionadas con las
opiniones polticas y con las actitudes. Siempre que tengamos un conocimiento amplio de la
distribucin de variables que estn relacionadas con las caractersticas a investigar, podremos
utilizar el muestreo por cuotas.
2. Utilizar el sistema de barrido cuotas: una vez asignadas las entrevistas, a cada
entrevistador se le proporciona unas rutas que debe realizar buscando los perfiles a
investigar.
Muestreo Mixto
33 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Cuasivarianza Muestral
Cuasidesviacin Muestral
Media Proporcin
34 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Inferencia Estadstica
; ;
Error Estadstico
MEDIA
PROPORCIN
Notas
Cuasidesviacin
35 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Diferencias de Estadsticos
En el campo de la investigacin social es frecuente el uso de estadsticos compuestos que
resultan de la combinacin de estadsticos. Puede interesarnos conocer la diferencia de
medias de los salarios de hombres y mujeres, o la razn entre dos cantidades que han sido
obtenidas mediante una muestra: por ejemplo, si en una encuesta se ha preguntado por el
nmero de horas trabajadas y el salario, podemos calcular la razn entre la media de horas
trabajadas y el salario medio, de donde se obtendr un estadstico nuevos que ser el cociente
entre dos estadsticos que ya disponamos en la muestra.
Cuando producimos nuevos estadsticos a partir de las combinaciones de otros estadsticos
tenemos dos situaciones diferentes:
2. Que sean muestras relacionadas entre s. Esta situacin tiene distintos orgines. En
unos casos, sobre la misma unidad muestral tomamos medidas repetidas en el tiempo,
como sucede en los estudios de panel (se realiza la misma pregunta a la misma
persona en fechas diferentes y se comparan). En otros casos, sobre la misma unidad
muestral medimos caractersticas o variables distintas pero que estn relacionadas
entre s. Por ejemplo, se pregunta a una persona, por ejemplo, sobre su valoracin del
presidente del gobierno y tambin del lder de la oposicin. Para calcular un
estadstico de diferencia entre ambas valoraciones tenemos que tener en cuenta que
existe relacin entre las repuestas. Seguramente quien valore alto al presidente del
gobierno, lo haga bajo sobre el lder de la oposicin.
36 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Error Tpico
37 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Test de significacin
Los test de significacin son pruebas que se realizan para contrastar la informacin emprica
con la terica. Para ello se fija un umbral de corte a partir del cual los valores obtenidos en la
muestra emprica se consideran poco probables. Si el resultado obtenido est al lado del
umbral de corte donde los resultados se consideran probables, decimos que est dentro de la
zona de aceptacin de la hiptesis nula, pero si, por el contrario, el resultado cae del lado del
umbral de corte donde se considera poco probable, decimos que entra dentro de la zona de
rechazo de la hiptesis nula.
Hiptesis Nula
En estadsticas la hiptesis nula es la hiptesis de partida (tambin denominada
hiptesis inicial) que considera las diferencias no significativas. La hiptesis nula puede
ser rechazada o no rechazada, pero no podemos probarla, salvo que estudiemos todos los
elementos de la poblacin y la mayora de las veces eso no es posible.
Un resultado puede ser estadsticamente significativo aunque la diferencia sea muy pequea y
pueda parecer que no tiene importancia; por esta razn en los tets de significacin se debe
indicar el efecto de la talla estadstica, esto es, el tamao de la muestra. En muestras de
tamao grande pequeas diferencias pueden ser consideradas a travs de los test como
significativas.
38 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Pruebas de hiptesis
La evidencia que se necesita para aceptar que un acontecimiento se ha producido por azar es
el nivel de significacin (n.s. / significante level en ingls) o el valor crtico . Si el valor es
pequeo, entonces debe rechazarse la hiptesis nula , es falsa o inusual.
Segn los trabajos de Neyman y Pearson, el planteamiento requiere tanto de la hiptesis nula
como de una hiptesis alternativa , que deben ser definidas e investigadas
mediante repeticin de procedimientos de muestreo; si no, se corre el riesgo de rechazar un
resultado que cae fuera de la zona de aceptacin y, sin embargo, ser verdadero. Es el valor
crtico el que nos da la probabilidad de equivocarnos al rechazar ese valor.
Cuando se realizan pruebas de hiptesis existen dos tipos de errores que se pueden cometer:
verdadera falsa
39 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
p valor
Es la probabilidad de obtener un resultado al menos tan extremo como el que realmente se ha
obtenido en el experimento o en una muestra (valor del estadstico calculado), suponiendo
que la hiptesis nula es cierta. Es fundamental tener en cuenta que el est basado en
la aceptacin de la hiptesis de partida (o hiptesis nula). A su vez, es la probabilidad de
equivocarnos al aceptar que las diferencias (entre valor emprico y valor terico) son
significativas. Cuanto ms pequea sea esta probabilidad ms seguro se est de no
equivocarse.
40 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
2. Calcular el estadstico.
3. Comparar el estadstico (en valores de o de Student) con el umbral fijado (tambin
en valores de o de Student) para el valor crtico .
4. Resultado:
Hiptesis alternativa
41 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Hiptesis alternativa
Clculo en valor de
Comparacin de medias
Comparacin de proporciones
Proporcin Conjunta
42 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
= Total de observaciones .
4. Grados de Libertad
Grados de libertad total Grados de libertad entre grupos
Tambin:
5. Estimacin de la varianza
43 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Distribucin de Snedecor
La distribucin de Snedecor es una distribucin de probabilidad asociada a la normal no
simtrica:
La regresin tiene por objeto definir una funcin matemtica que se ajuste lo mejor posible a
los datos observados. Cuando se realiza sobre la relacin de dos variables mediante el ajuste
de una lnea recta, hablamos de regresin lineal simple, y la manera ms habitual e idnea de
representarla es sobre los diagramas de dispersin.
La Covarianza
En una distribucin bivariada contamos con una medida de dispersin que tiene en cuenta las
dos variables a la vez. Para ello es necesario hacer uso de la Covarianza, que se obtiene del
producto de las diferencias de e a sus medias.
Covarianza
44 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Interpretacin de la Covarianza
El valor de la covarianza nos informa de la existencia (o no) de dependencia lineal entre las
variables. Si no hay relacin lineal entre las dos variables, la covarianza ser igual a
Errores o residuos
Los errores o residuos son la diferencia entre los valores reales y los de la recta ajustada a los
datos. Por cada valor de tenemos dos valores de , el de la ecuacin y el real observado. La
suma de los residuos sirve para evaluar el ajuste final.
45 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Covarianza Varianza de
Una vez se han calculado los parmetros de la funcin de la recta de regresin lineal, la
correlacin sirve para cuantificar la bondad del ajuste de la recta a la nube de puntos.
46 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Coeficiente de determinacin
Coeficiente de determinacin
47 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Tablas de contingencia
Las tablas de contingencia sirven para comparar grupos y observar cmo se distribuye una
variable en el seno de otra variable. Para ver cmo se agrupa la poblacin simultneamente en
dos variables, se realiza un cruce de variables y obtenemos una tabla de contingencia. 2
Anlisis Bivariable
La relacin entre dos variables se establece con el esquema explicativo: la distribucin de una
variable es explicada por la distribucin de otra variable. En otras palabras, una variable es
2
Es importante destacar la diferencia entre variables de registro y variables de anlisis. Las variables
de registro son las variables originales que se emplean para registra la informacin, que suelen
presentarse con mucho detalle (asimiladas a trminos abstractos o administrativos de registro) y sirven
como punto de partida para la investigacin. Las variables de anlisis son las variables construidas con
pertinencia emprica y/o terica para el anlisis sociolgico.
48 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
determinada por otra. Por tanto, tenemos variable independiente y variable dependiente. Los
cambios de la variable independiente explican los de la dependiente.
Desde el enfoque matemtico, cualquiera de las dos variables puestas en relacin puede
ejercer indistintamente el papel de independiente como de dependiente. Pero desde el
enfoque emprico, estos papeles se definen contrastando que una de las variables es
antecedente (temporalmente) de la otra o presenta ms estabilidad temporal o se considera
ms bsica; y esta ser la variable independiente. Podra darse el caso que dos variables en
relacin terica no tengan ninguna relacin de dependencia, y por consiguiente ambas
variables seran independientes.
Regla de Zeisel
Para el anlisis de la relacin de dos variables en una tabla de contingencia se calculan los
porcentajes en la direccin de la variable independiente y se comparan en la direccin de
la variable dependiente.
Como regla general colocamos los datos de la variable independiente en las filas. Segn De
Miguel (1997): La mejor disposicin es la de porcentajes horizontales porque el ojo humano
compara mejor las relaciones de arriba abajo 3. Por tanto, conviene por sistema emplear esta
regla en todos los casos, calcular los porcentajes en la direccin horizontal y comparar las
relaciones entre ambas variables en la direccin vertical.
3
De Migel, A. 1997. Manual del perfecto socilogo, Madrid, Espasa, p. 67.
49 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
La introduccin de una tercera variable puede alterar las supuestas relaciones halladas en la
tabla de contingencia de dos variables, de manera que la relacin bivariable anterior se
desvanezca. A esta tercera variable la llamamos variable de control, y se introduce
segmentando los datos del cruce de las dos variables anteriores en funcin de esta tercera
variable.
Paradoja de Simpson
Una asociacin entre dos variables desaparece o cambia de sentido cuando los datos son
desagregados por grupos, esto es, cuando se controla el efecto de una tercera variable.
50 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
En los modelos donde una tercera variable altera una determinada relacin entre dos
variables, existen dos casos en la forma en que acta la tercera variable:
La interaccin entre tres variables se puede resumir en una tabla, pero la forma ms ptima de
analizar las relaciones entre las tres variables es segmentando la poblacin entre los valores de
una de las variables, la que se considere ms bsica o primordial. De esta manera se puede
observar cmo se comporta las otras dos variables en cada una de las categoras (o valores) de
la primera.
En muchas ocasiones resulta interesante dualizar (o dicotomizar) las variables que se cruzan.
La visibilidad de las confrontaciones duales facilita el anlisis.
51 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Ji-cuadrado
Se podra decir que las frecuencias esperadas en cada una de las casillas de una tabla de
contingencia son aquellas que cabe esperar en el caso de que no exista relacin entre las
variables, esto es, independencia estadstica o probabilstica entre las variables. Dos variables
son independientes estadsticamente si la probabilidad de que nos aparezca una categora
de una variable no depende de la distribucin de probabilidad de la otra variable.
Clculo de residuos
Los residuos son las diferencias entre las frecuencias observadas y las esperadas en cada celda.
Los residuos son errores del muestreo aleatorio.
Residuo
52 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Para poder comparar las distancias entre las frecuencias observadas y las esperadas dentro
de cada celda, se ha de estandarizar estas distancias.
Residuos Estandarizados
de cada celda
53 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
de una tabla concreta no vale para comparar otras tablas distintas. Para ello existen
otros coeficientes de contingencia: V de Cramer, Coeficiente de contingencia o .
54 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
55 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Fuente: Camarero Rioja, L. et al. 2010. Estadstica para la investigacin social. Ibergarceta
56 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Fuente: Camarero Rioja, L. et al. 2010. Estadstica para la investigacin social. Ibergarceta
57 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Fuente: Almazn, A. et al. 2011. Anlisis estadstico para la investigacin social. Ibergarceta
58 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Fuente: Almazn, A. et al. 2011. Anlisis estadstico para la investigacin social. Ibergarceta
59 cisolog.com
Frmulas y apuntes de Estadstica aplicada a las Ciencias Sociales Rubn Crespo
Fuente: Almazn, A. et al. 2011. Anlisis estadstico para la investigacin social. Ibergarceta
60 cisolog.com