Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MATERIAL DE ESTUDIO
GUIA DE TRABAJOS
PRACTICOS
Bibliografía complementaria
INTRODUCCIÓN TEÓRICA
importante destacar que para que las conclusiones sean válidas, se debe tratar que
la muestra sea representativa de la población.
Campos de estudio
En la actualidad se aplica en las ciencias sociales como en política y psicología, en
las ciencias naturales (física, química, metereológicas) en la industria (producción y
control de calidad) en la administración industrial (Recursos humanos, materiales,
tiempos y movimientos etc.), en la economía, en las finanzas (inversiones, bolsas de
valores) en la agricultura (periodo de siembra, calendario de lluvia) en el comercio,
en la educación, en la medicina, y en cualquier planificación experimental o de
investigación que necesite rigor científico objetivo en su estudio y en la toma de
decisiones.
2. Población y muestra
3. TIPOS DE MUESTREO
Las muestras pueden ser elegidas mediante diversas técnicas o procedimientos.
Estas técnicas se clasifican según como sean elegidos los individuos. Se dividen en
dos grandes grupos:
3.1. MUESTREO PROBABILÍSTICO (o muestreo aleatorio)
Es un proceso de selección de individuos o unidad de análisis de manera que cada
sujeto tiene probabilidad positiva e independiente de ser seleccionado. Dentro del
muestro probabilístico se tiene:
3.1.1. Muestreo aleatorio simple:
Todos los individuos tienen la misma probabilidad de ser seleccionados. Las
observaciones se realizan con reemplazamiento, de forma que la población es igual
en todas las extracciones. En el caso de que se renuncie, por azar, a volver a
seleccionar en la muestra al mismo individuo, estaremos en el caso de método
aleatorio sin reemplazamiento. Supongamos que queremos elegir
una muestra de n individuos de una población de N sujetos: cada elemento tiene
probabilidad n/N de ser elegido en la muestra.
Cuándo utilizarlo:
El método de muestreo aleatorio simple debe utilizarse cuando los individuos de
la población son homogéneos respecto a las características a estudiar (es decir, a
priori no sabemos si los resultados van a ser muy diferentes por causa de otras
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
En cada estrato se toman n1, n2,…, nk elementos para la muestra, de manera que se
toman en total n individuos, es decir:
El número de individuos de cada estrato se puede
elegir mediante los siguientes criterios:
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
Cuándo utilizarlo:
Se utiliza el método de muestreo estratificado cuando los elementos se dividen en
estratos y estos estratos pueden ser diferenciales para la variable que se está
estudiando.
Por ejemplo, supongamos que hacen una encuesta para las elecciones en Argentina
y se sabe que el candidato del PRO tiene mayor influencia en las mujeres que el
candidato del FRENTE RENOVADOR. La muestra de la encuesta debería
estratificarse en hombres y mujeres, puesto que sabemos que la variable género
influye en la votación.
En las encuestas conocemos datos como la edad, sexo, nivel socioeconómico.
Conviene que la muestre tenga una composición proporcional a los individuos de
cada estrato.
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
Ejemplo: Suponemos que queremos saber la opinión sobre un profesor de una clase
de 60 personas. Dichas personas están ordenadas por orden alfabético en la lista de
alumnos de clase. Para realizar la encuesta, seleccionamos a 12 personas. Por lo
4. VARIABLES
Una variable es una característica de interés que se puede observar y medir en cada
una de las unidades de análisis de la muestra o población. Esta característica debe
tener una variabilidad mínima conocida o no.
Ejemplo: Si la unidad de análisis es cada persona de una población, las variables
pueden ser: el ingreso de cada persona, el sexo, la edad, el grado de educación, el
tipo de vivienda, etc.
Continua: Los valores son generados a partir de una medición. Pueden tomar
cualquier valor dentro de un intervalo. Ej. Peso, estatura, sueldos.
Discreta: Los valores son generados a partir de la acción de contar. Solo toma
valores enteros. Ej. N° de hijos de una familia, n° de alumnos de un curso.
Nominal: son cualidades sin orden. Ej. Estado civil, preferencia por
una marca, sexo, lugar de residencia.
Ordinal: son cualidades que representan un orden y jerarquía. Ej.
Nivel educacional, días de la semana, calidad de la atención, nivel
socioeconómico.
Escala Nominal: Es el tipo más limitado de medición que puede tener una variable.
Se emplea para hacer referencia a los datos que sólo pueden clasificarse en
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
Escala Ordinal: Esta escala presenta diferentes niveles de medida entre sus
categorías, una mayor que otra, de tal forma que todas tienen diferente valor
subjetivo. Si utiliza símbolos, éstos quedan ordenados de acuerdo al grado de la
categoría de la variable. Ejemplo:
Calidad del
servicio de salud
Muy bueno 1
Bueno 2
Malo 3
Escala de razón: Es el nivel de medición más alto. Esta escala tiene todas las
características que presenta la escala de intervalo, es decir, las categorías se
especifican con números.
Su gran diferencia con respecto a la escala de intervalo es, por un
lado, que en la escala de razón el punto cero sí es significativo, y por otro, el
cociente o razón entre dos números de la escala también lo es.
Ejemplo: La variable gasto diario en transporte de un alumno de la universidad, en
esta escala el 0 significa que no hizo gastos y se puede decir si un alumno gasta el
doble o la mitad de otro.
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
Las escalas están íntimamente relacionadas con el tipo de variable, indicando las
posibilidades de medición de cada una. Esto se puede ver en el siguiente gráfico:
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
INTRODUCCIÓN TEÓRICA
Sexo 1 femenino
2 masculino
Femenino 86 0,57 57
masculino 64 0,43 43
n (Total) 150 1,00 100
Aclaración: el subíndice “i” indica cada una de las frecuencias absolutas que
corresponden a cada valor de la variable.
La columna que sigue simbolizada por “fr” es la frecuencia relativa, se calcula con la
siguiente fórmula:
𝑓𝑖
𝑓𝑟 =
𝑛
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
En este caso la sumatoria de todas las fi tendría que ser igual a 150. Se coloca esta
suma en la última fila de las fi.
Sexo
43% Femenino
57%
masculino
Otro gráfico que se puede elaborar es el circular o de torta, que también es muy
utilizado para las variables cualitativas, generalmente se indica en él las frecuencias
relativas porcentuales.
simple vista que en el estudio de esta variable, hay más personas de sexo femenino
que masculino en la muestra analizada.
Número de
personas en
f fr fr% =fr*100
la
vivienda
1 4 0,03 3
2 10 0,07 7
3 13 0,09 9
4 41 0,27 27
5 24 0,16 16
6 26 0,17 17
7 32 0,21 21
n (total) 150 1,00 100
Generalmente los valores de las variables cuantitativas no suelen ser tan pocos
como en la tabla anterior. Y se complica más si la variable es cuantitativa continua,
ya que es casi imposible que dos valores sean iguales y tendríamos tantos valores
como personas encuestadas (ejemplo si se le preguntara la altura de cada una). Para
ello se utiliza la tabla de frecuencias con valores agrupados en clases o intervalos.
La tabla anterior podría escribirse:
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
Número de
personas en
fi xi fr fr% =fr*100
la
vivienda
1-2 4 1,5 0,03 3 Valores ≥ 1
Amplitud
2-3 10 2,5 0,07 7 y<2
=1
3-4 13 3,5 0,09 9
4-5 41 4,5 0,27 27
5-6 24 5,5 0,16 16
6-7 26 6,5 0,17 17
7-8 31 7,5 0,21 21
n (total) 150 1,00 100
Vemos también que hay una amplitud de intervalo, es decir la distancia que existe
entre un intervalo y otro, en este ejemplo la amplitud es de 1 unidad. Se calcula como
la diferencia entre un límite inferior y otro consecutivo.
El gráfico que se utiliza en este caso de variables cuantitativas con datos agrupados
es el histograma:
En este gráfico las barras “se tocan” indicando los intervalos de clases.
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
Bibliografía:
Johnson, R. y Kuby, P. (2012). Estadística Elemental. 11ª Ed. Cengage Learning. Mexico
DF
Perez Tejada, H. E. (2008). Estadística para las Ciencias Sociales, del comportamiento.
3°ed. Cengage Learning. Mexico DF.
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
INTRODUCCIÓN TEÓRICA
Media aritmética
∑ 𝑥𝑖
𝑥̅ =
𝑛
Donde xi representa a cada uno de los datos observados en la muestra y el
símbolo ∑ indica la sumatoria de todos esos valores (desde i hasta n).
Mediana:
Al tomar los dos valores del medio, quedan un valor (el 2) hacia la izquierda, y un
valor (el 4) hacia la derecha. En este caso la mediana, que simbolizamos con “Me”
coincidió en valor con la media, no es necesario que lo haga. Si tuviéramos una
cantidad impar de valores encontraríamos un valor solo que dejaría hacia un lado y
otro la misma cantidad de observaciones y no calcularíamos el promedio.
Moda o Modo
El Modo o moda que simbolizamos como “Mo” es el valor que más se repite dentro
de la muestra, en nuestro ejemplo: 2, 3, 4, 4
Media:
Número de
personas en
fi xi fr fr% = fr*100 fi * xi
la
vivienda
1-2 4 1,5 0,03 3 6 4 x 1,5 = 6
2-3 10 2,5 0,07 7 25
3-4 13 3,5 0,09 9 45,5
4-5 41 4,5 0,27 27 184,5
5-6 24 5,5 0,16 16 132
6-7 26 6,5 0,17 17 169
7-8 31 7,5 0,21 21 232,5
n (total) 150 1,00 100 794,5
Cuando tenemos los datos agrupados, veremos que ya no podemos trabajar con los
valores del intervalo (límite inferior y superior) para ello habíamos calculado la marca
de clase xi. Este valor de ahora en más representa a cada intervalo o clase. Entonces
para calcular la media usaremos este valor y su correspondiente frecuencia absoluta.
En esta tabla agregamos una columna a la derecha donde calcularemos los
productos entre fi y xi. Luego realizamos la suma de esos valores y lo dividimos por
la cantidad de datos n, en símbolos matemáticos sería:
Mediana
Número de
personas en
fi xi fr fr% = fr*100 fi * xi Fi
la
vivienda
1-2 4 1,5 0,03 3 6 4
2-3 10 2,5 0,07 7 25 14
3-4 13 3,5 0,09 9 45,5 27
4-5 41 4,5 0,27 27 184,5 68
5-6 24 5,5 0,16 16 132 92
6-7 26 6,5 0,17 17 169 118
Debe ser
7-8 32 7,5 0,21 21 240 150 igual a n
n (total) 150 1,00 100 802
Primero se escribe en la primera fila de las Fi el primer valor de fi (el 4 en el ejemplo)
luego en las siguientes filas se van sumando consecutivamente cada valor de fi
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
Una vez completada esta columna, nos servirá para ubicar a la mediana. Sabemos
que la Me se ubica en la mitad de la cantidad de la muestra. Si dividimos por 2 el
valor de n, en este caso: 150/2= 75, en la ubicación 75 tendría que estar el valor de
la Mediana. Si observamos la tabla el valor que se ubica en la posición 75 lo
encontraremos en las frecuencias acumuladas Fi, buscamos al intervalo que
contenga por primera vez este valor, vemos que es el que contiene hasta la posición
92, ya que el anterior solo contiene hasta la ubicación 68. Elegimos el valor 92 y
observamos qué valor de xi lo representa, vemos que es 5,5 personas en la vivienda,
entonces este valor es la Mediana aproximada. También podemos decir que la
Mediana se encuentra en el intervalo que corresponde al valor de Fi elegido; en este
caso sería el intervalo 5-6.
Moda
Femenino 86 0,57 57
masculino 64 0,43 43
n (Total) 150 1,00 100
Asimetría
𝑥ҧ = 𝑀𝑒 Simétrica
4. Al hacer click sobre “Análisis de Datos” se abre una ficha, buscar “estadística
descriptiva”:
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
Datos cargados
Tildar
Tildar
Bibliografía:
Johnson, R. y Kuby, P. (2012). Estadística Elemental. 11ª Ed. Cengage Learning. Mexico DF
Spiegel, M. R. Estadística. (1991). Editorial McGraw-Hill. España.
Pérez-Tejeda, H. (2008). Estadística para las ciencias sociales, del comportamiento y de la
salud. Cengage learning. México.
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
INTRODUCCIÓN TEÓRICA
La historia de la probabilidad comienza con los juegos de azar (siglo XVII) con los
primeros cálculos sobre la probabilidad de ganar una partida. Pero la idea de
probabilidad no solo está ligada a los juegos sino al azar mismo de los sucesos como
encuestas, censos, votaciones. Actualmente se la considera una ciencia aplicable a
todo conocimiento humano aportando la incertidumbre, indispensable y necesaria
para tomar decisiones en cualquier ámbito.
Tienen Cant. de
casa propia ciudadanos
(fi)
SI 12
NO 18
Total 30
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
Escritos de esta manera nos recuerda a la tabla de frecuencias, donde vemos las
frecuencias absolutas de los ciudadanos que tienen casa propia y los que no.
Podemos también agregar la frecuencia relativa y la relativa porcentual:
Tienen Cant. de h h%
casa propia ciudadanos
(fi)
SI 12 0,4 40
NO 18 0,6 60
Total 30 1 100
Y decimos que en la muestra el 40% de los ciudadanos tienen casa propia. También
podemos decir que en esta muestra de 30 ciudadanos es más probable que haya
personas sin casa propia (ya que el porcentaje de los que no son propietarios es
mayor). Esta noción de probabilidad está relacionada con la frecuencia relativa, ya
que podemos definir a la probabilidad como:
𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑓𝑖
𝑝= =
𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 𝑛
La probabilidad (p) es la relación entre los casos favorables (frecuencia absoluta fi)
y los casos posibles (total de la muestra n). Esta probabilidad se llama “a posteriori”
o “frecuencial” ya que se relaciona con la frecuencia relativa antes calculada. Esta
frecuencia se calcula luego de ocurrido el hecho o experimentación, por eso se llama
“a posteriori”.
p= 1/6 = 0,1667
Es decir hay un caso favorable (el dado tiene una cara con un 2) entre 6 posibles (el
dado tiene 6 caras en total). Esta probabilidad se puede calcular antes de realizar el
hecho ya que se sabe de anticipado el caso favorable y los posibles.
Este tipo de probabilidad solo se calcula como una anticipación al hecho, veamos
otro ejemplo: cuál es la probabilidad de que una mujer embarazada tengo un hijo
varón?, biológicamente podrá tener dos tipos de sexo, por lo que la probabilidad es
de 0,5 para cada uno. Pero si calculamos la probabilidad frecuencial de que nazcan
mujeres o varones (es decir luego de que hayan nacido), esta probabilidad puede
ser distinta.
0≥p≤1
P(AóB)= p(A)+p(B)
p(AóB)= o,4+o,6= 1
Se aplica en situaciones donde los sucesos solo tienen dos posibles resultados: uno
llamado éxito y otro fracaso. Por ejemplo un paciente puede ser varón o mujer, puede
aprobar o no un examen, puede tener conducta agresiva o no. Es muy común la
respuesta SI-NO, todas ellas pueden ser analizadas como distribución binomial. La
probabilidad de éxito la simbolizamos como p y la de fracaso con la letra q. Como
son sucesos excluyentes, sabemos que: p+q=1. Y podemos calcular la probabilidad
de que un hecho ocurra x veces en n pruebas de la siguiente manera:
Calculamos 𝐶62 en la calculadora científica, con la tecla 𝐶𝑛𝑟 y luego las demás
potencias y productos, lo tecleamos todo en la calculadora:
La curva de distribución normal es una gráfica de una función matemática que nos
sirve de modelo, cuyo eje horizontal corresponde a los valores de la variable
estandarizada z:
Bibliografía:
Johnson, R. y Kuby, P. (2012). Estadística Elemental. 11ª Ed. Cengage
Learning. Mexico DF
Spiegel, M. R. Estadística. (1991). Editorial McGraw-Hill. España.
Pérez-Tejeda, H. (2008). Estadística para las ciencias sociales, del
comportamiento y de la salud. Cengage learning. México.
https://calculadorasonline.com/calculadora-de-distribucion-nomal-campana-de-gauss/
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
Temas: Estudio conjunto de dos o más variables. Relación entre variables. Valores
directos y valores teóricos de las variables. Correlación de variables. Cruzamiento
de variables. Coeficiente de correlación de Pearson. Covarianza. Relación entre
variables ordinales. Relación entre variables nominales. Relación entre variables
dicotómicas.
INTRODUCCIÓN TEÓRICA
En las Ciencias Sociales es importante buscar relaciones entre dos o más variables:
si realizamos una encuesta por ejemplo del nivel de alfabetización de una ciudad y
además preguntamos su nivel socioeconomico, si trabaja o no, si si tiene casa propia,
si tiene hijos, etc. Y luego si alguna de estas variables influye en la alfabetización.
Todo el análisis previo que realizamos de una variable a la vez nos sirve para estudiar
estas relaciones. Lo que buscamos son explicaciones de algo que observamos:
necesitamos explicar de qué manera se relacionan y si es que existe esa relación
entre dos variables (también se pueden relacionar entre más cantidad, pero solo
estudiaremos relaciones bivariadas).
En este tipo de estudio no nos interesa las relaciones causales donde se observa
una secuencia cronológica y se distingue un fenómeno antes que el otro. Solo
buscamos relaciones entre dos variables observadas sin preguntar su cronología.
Al comparar las frecuencias, si las esperadas son muy similares a las observadas se
podría decir que las variables son independientes, no tienen relación. Para medir la
distancia que existe entre ellas de forma objetiva se utiliza una operación matemática
con los valores que hemos calculado, cuyo resultado nos da un puntaje llamado chi
cuadrado, en símbolos matemáticos:
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
2
(𝟖𝟎−𝟕𝟎)𝟐 (𝟑𝟎−𝟒𝟎)𝟐 (𝟕𝟎−𝟓𝟕)𝟐 (𝟐𝟎−𝟑𝟑)𝟐 (𝟒𝟎−𝟔𝟑)𝟐 (𝟔𝟎−𝟑𝟔)𝟐
X = + + + + + = 36,41
𝟕𝟎 𝟒𝟎 𝟓𝟕 𝟑𝟑 𝟔𝟑 𝟑𝟔
f-1= 3-1= 2
c-1= 2-1= 1
Ahora nos fijamos cuál de los dos resultados es el menor, sería el 1 correspondiente
a c-1, reemplazamos ahora en la fórmula anterior:
36,41
𝑉 = √300∗1= 0,35
También se puede realizar una prueba de chi cuadrado de forma on line, ver en
bibliografía.
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
Las variables cuantitativas también puedes ser tratadas con la metodología anterior
si se representan sus valores en forma de intervalos, pero de esta manera se pierde
mucha información. Para no agrupar los valores y representarlos de una manera
gráfica sencilla se utilizan los diagramas de dispersión. Lo vemos a través de un
ejemplo:
kw utilizados (en
Salario (en miles de $)
cientos)
80 6
20 1
40 4
70 6
30 3
60 5
De esta manera ya podemos observar que existe un tipo de relación entre las
variables, podemos decir que a medida que aumenta el salario también lo hacen los
kw gastados. Hay una relación creciente entre ambas (también llamada relación
directa o positiva). Además podemos observar que los puntos se acomodan como si
estuvieran en una línea recta imaginaria, esto es porque la relación es lineal. Hay
otros tipos de relaciones no lineales pero no es objetivo de nuestro estudio.
Ahora nos interesa saber la intensidad de esta relación lineal, como lo hicimos para
las variables cualitativas, para ello calculamos el coeficiente de correlación de
UCES -LICENCIATURA EN CIENCIAS POLITICAS Y SOCIALES ESTADISTICA SOCIAL
Pearson (r). Este coeficiente puede tomar valores entre -1 y 1, dependiendo del tipo
de relación entre las variables, veamos algunas representaciones:
Ejemplos de diagramas de dispersión y recta de regresión lineal con distintos valores de coeficiente r
Este cálculo se puede hacer de forma manual (ya hemos visto cada término de la
fórmula en la primera parte de estadística descriptiva). Pero a no preocuparse que
también se puede realizar con calculadora (ver bibliografía al final, videos
explicativos de uso de calculadora). Y aún más sencillo si utilizamos el software Excel
tanto en una tablet como en un celular.
𝑟 = √0,9178 = 0,96
Cuando una variable opera como antecedente y la otra como consecuente, es decir
una relacion de causa-efecto, la variable antecedente o variable explicativa (o
tambien llamada independiente) se coloca en el eje horizontal y la variable
consecuente en el vertical (o tambien llamada variable dependiente). En este caso
ocuparemos el coeficiente R2 o coeficiente de determinación para ver el porcentaje
de variación que puede ser explicado por la variable independiente.
Para completar el estudio de este tipo de variables, nos interesa saber la ecuación
que modela los valores de kw usados con los valores de salario. En el gráfico
obtenido en Excel de nuestro ejemplo observamos que nos da la ecuacion de una
recta:
De nuevo aclaramos todo este analisis se puede dar si sabemos que el salario puede
ser una variable explicativa de los kw consumidos. Tambien aclaramos que los
valores de la pendiente y la ordenada al origen se pueden determinar por el método
de mínimos cuadrados (no mostrado, ya que no es el alcance de nuestro estudio) y
con calculadora (ver el video de la bibliografía).
Bibliografía:
Johnson, R. y Kuby, P. (2012). Estadística Elemental. 11ª Ed. Cengage Learning. Mexico DF
Spiegel, M. R. Estadística. (1991). Editorial McGraw-Hill. España.
Pérez-Tejeda, H. (2008). Estadística para las ciencias sociales, del comportamiento y de la
salud. Cengage learning. México.
Videos explicativos:
https://youtu.be/l85tUR7LFyg
https://youtu.be/4cQe6J7RzAI