Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La palabra Estadística deriva de la voz latina status que en el latín medieval significaba “estado
político”. La Estadística se configura a lo largo de los siglos como una serie de herramientas que
pretendían dar respuesta a necesidades y problemas provenientes de la Ciencia, del Estado o de
ambos. Mayormente para censos.
Los modelos estadísticos nacen de la Matemática, pero esto no debe asustar a nadie, puesto que
lo que hay que saber muy bien en Estadística son los fundamentos lógicos, los razonamientos y
los modelos estadísticos que subyacen a los cálculos.
Por Estadística entendemos los métodos científicos por medio de los cuales podemos recolectar,
organizar, resumir, presentar y analizar datos numéricos relativos a un conjunto de individuos u
observaciones y que nos permiten extraer conclusiones válidas y efectuar decisiones lógicas,
basadas en dichos análisis.
Asimismo, puede definirse como la ciencia que tiene por objetivo realizar inferencias basadas en
datos, para lo cual proporciona técnicas de recolección, resumen y presentación de éstos, como
así también permite cuantificar el error cometido en dicho proceso de inferencia. La Estadística
brinda los procedimientos para obtener y resumir información en la toma de decisiones.
Utilizamos la Estadística para estudiar aquellos fenómenos en los que tenemos una gran cantidad
de observaciones y cuya aparición se rige por leyes del azar o aleatorias. La aplicación de la
Estadística tiene lugar porque los fenómenos de algunas ciencias no se dan siempre iguales entre
sí exactamente, sino que presentan variaciones. Estas pequeñas diferencias son debidas a una
serie de causas tan numerosas y complejas que no podemos determinarlas por separado y que
las incluimos dentro del nombre común de azar.
Cuando se quiere estudiar una característica de un grupo, este grupo en total es la población, por
ej.: habitantes de la ciudad de Rosario. Generalmente si la población es muy grande, no se puede
estudiar a todos los individuos y se toma a un subgrupo que se denomina muestra, por ej.:
habitantes de cinco barrios de la ciudad de Rosario. La poblacion puede ser finita o infinita.
Si estudiamos una característica de un grupo, sea en una población o en una muestra y lo
describimos sin sacar de ello conclusiones, estamos en la etapa de la Estadística Descriptiva.
Si estudiamos en una muestra una característica cualquiera e infermos, a partir de los resultados
obtenidos en la muestra, conclusiones sobre la población correspondiente, estamos haciendo
Estadística Inferencial y como estas inferencias no pueden ser exactamente ciertas aplicamos el
lenguaje probabilístico para sacar las conclusiones.
OPERACIONALIZACIÓN:
El paso de una variable teórica a indicadores empíricos verificables y medibles e ítems o
equivalentes se denomina operacionalización. La operacionalización se fundamenta en la
definición conceptual y operacional de la variable. En el proceso de medición lo más lógico es
transitar de la variable a sus dimensiones o componentes, luego a los indicadores y finalmente a
los ítems o reactivos y sus categorías. Por ejemplo, la variable síndrome de burnout se define
conceptualmente como un estado de agotamiento físico, emocional y mental que está vinculado
con el ámbito laboral. Es una variable multidimensional; una de sus dimensiones es el cansancio
emocional. Puede operacionalizarse a partir de indicadores empíricos en ítems en nuestro
instrumento de medición. De este modo le preguntaremos a lxs participantes de nuestra
investigación si se sienten emocionalmente agotados por su trabajo, si se sienten frustrados en su
trabajo, si trabajar en atención al público les produce estrés
CODIFICACIÓN;
Codificar los datos significa asignarles un valor numérico o símbolo que los represente. Es decir, a
las categorías (opciones de respuesta o valores) de cada ítem o variable se les asignan valores
numéricos o signos que tienen un significado. La codificación es necesaria para analizar
cuantitativamente los datos (aplicar análisis estadístico). A veces se utilizan letras o símbolos en
lugar de números (*, A, Z). Asimismo, es muy importante indicar el nivel de medición de cada ítem
y, por ende, el de las variables, porque es parte de la codificación y dependiendo de dicho nivel se
selecciona uno u otro tipo de análisis estadístico. De esta forma, es necesario hacer una relación
de variables, ítems y niveles de medición.
NIVELES DE MEDICIÓN:
Existen cuatro niveles de medición ampliamente conocidos:
- CUALITATIVAS:
● Nivel de medición nominal: en este nivel hay dos o más categorías del ítem o la variable.
Las categorías no tienen orden ni jerarquía. Lo que se mide (por ej., objeto, persona) se
coloca en una u otra categoría, lo cual indica tan sólo diferencias respecto de una o más
características. Ninguna de las categorías implica mayor jerarquía que la otra. Las
categorías únicamente reflejan diferencias en la variable. No hay orden de mayor a menor.
Los números utilizados en este nivel de medición tienen una función puramente de
clasificación y no se pueden manipular de manera aritmética. Las variables nominales
pueden incluir dos categorías (dicotómicas), por ej. tipo de escuela a la que se asiste
(privada-pública); o bien, tres o más categorías (categóricas), por ej. nacionalidad
(argentina, chilena, uruguaya).
● Nivel de medición ordinal: en este nivel hay varias categorías, pero además mantienen un
orden de mayor a menor. Las etiquetas o los símbolos de las categorías sí indican
jerarquía. Sin embargo, las categorías no están ubicadas a intervalos iguales (no hay un
intervalo común). Por ej., la variable posición jerárquica en una empresa. En este caso, el
presidente (10) es más que el vicepresidente (9); éste, más que el director general (8); a su
vez este último, más que el gerente (7) y así sucesivamente; pero no se precisa en cada
caso cuánto más. Tampoco pueden utilizarse las operaciones aritméticas básicas: no
podríamos decir que 4 (empleado A) + 5 (jefe) = 9 (vicepresidente), ni que 10 (presidente)
÷ 5 (jefe) = 2 (empleado C). Sería absurdo, no tiene sentido. Otros ejemplos pueden ser: el
nivel educativo; el nivel socioeconómico.
- CUANTITATIVAS:
● Discretas: aquellas la cual la unidad de medida no es divisible, solo numeros enteros. Ej;
cantidad de hijos (3 hijos, no 2 y medio)
● Continuas: aquellas que pueden asumir cualquier valor dentro de los numeros reales, es
decir que puede tener decimales. Ej; el peso, la altura se puede expresar en decimales
1.67 cm o 56, 8 kg.
● Dicotomicas: solo puede tener dos valores. Ej; come carne? si/no.
● Nivel de medición por intervalos: pueden ser discretas o continuas. además del orden o la
jerarquía entre categorías, se establecen intervalos iguales en la medición. Las distancias
entre categorías son las mismas a lo largo de toda la escala, por lo que hay un intervalo
constante, una unidad de medida. En este nivel de medición el cero (0) es arbitrario, no es
real, ya que se asigna arbitrariamente a una categoría el valor de cero y a partir de ésta se
construye la escala. Por ejemplo: temperatura, que puede medirse en grados centígrados y
Fahrenheit: el cero es arbitrario, pues no implica que en realidad haya cero (ninguna)
temperatura (incluso en ambas escalas el cero es diferente). Cabe agregar que diversas
mediciones en ciencias sociales no son verdaderamente de intervalo (por ejemplo, escalas
de actitudes, pruebas de inteligencia y de otros tipos); pero para algunxs autores se
acercan a este nivel y se suele tratarlas como si fueran mediciones de intervalo. Esto se
hace porque este nivel de medición permite utilizar las operaciones aritméticas básicas y
diversos métodos estadísticos, que de otro modo no se utilizarían. Aunque algunxs
investigadores no están de acuerdo con suponer tales mediciones como si fueran de
intervalo.
● Nivel de medición de razón: pueden ser discretas o continuas. En este nivel, además de
tenerse todas las características del nivel de intervalos (unidad de medida común,
intervalos iguales entre las categorías y aplicación de operaciones aritméticas básicas y
sus derivaciones), el cero es real y absoluto (no es arbitrario). Cero absoluto implica que
hay un punto en la escala donde está ausente o no existe la propiedad medida. Por
ejemplo: peso, altura, número de hijxs, ingresos en una unidad monetaria (alguien puede
tener cero ingresos), consumo de un medicamento específico, etc.
Para seleccionar una muestra (n), lo primero que hay que hacer es definir la unidad de muestreo o
unidad de análisis, es decir ¿qué o quiénes serán medidos?: individuos, objetos, sucesos o
colectividades de estudio (casos o elementos). Una vez definida la unidad de muestreo o unidad
de análisis se delimita la población (N), teniendo en cuenta que sus elementos deben compartir
características de contenido, lugar y tiempo.
Llamamos población o universo (N) al conjunto de todos los casos que concuerdan con
determinadas especificaciones, por ej.: adolescentes de la ciudad de Rosario. Los valores
estadísticos que se obtienen estudiando poblaciones completas se denominan parámetros.
PARÁMETROS Y ESTADÍSTICOS
La estadística permite la estimación confiable de parámetros de una población gracias al
conocimiento de los estadísticos obtenidos de una muestra, siempre que la muestra sea
representativa de la población.
MUESTREOS PROBABILÍSTICOS
● Muestreo aleatorio simple: una muestra aleatoria simple es seleccionada de tal manera
que cada elemento (unidad de análisis) en la población tiene que tener la misma
probabilidad de ser seleccionado. Por ejemplo, numerando todos los elementos muestrales
de la población, del uno al número N. Después se hacen fichas o papeles, uno por cada
elemento, se revuelven en una caja y se van sacando n número de fichas, según el
tamaño de la muestra. Los números elegidos al azar conformarán la muestra.
● Muestreo aleatorio sistemático: consiste en extraer elementos de una población mediante
una regla previamente creada, que se aplica sistemáticamente hasta obtener el total
definido. La regla se define del siguiente modo: se divide el número total de unidades de
análisis presentes en la población (N) por el número de unidades que deberá contener la
muestra (n), obteniéndose el número a aplicar (k). Se elige el primer elemento (caso) al
azar y, a partir de él, se aplica la regla. Por ejemplo: 60 (N)/12 (n) = 5 (k), “Se elige un
sujeto cada 5 personas, de una población de 60 sujetos, para conformar una muestra de
12 sujetos”.
● Muestreo aleatorio estratificado: se divide a la población en un determinado número de
estratos (grupos) con el fin de asegurarse que en la muestra final todos puedan estar
representados. Cada estrato es internamente homogéneo y externamente heterogéneo.
Por ej., religión (católicos, judíos, protestantes, etc.). La muestra se conforma a partir de la
selección de n unidades de cada estrato, cada estrato funciona de modo independiente,
pudiendo aplicarse al interior del mismo un muestreo aleatorio simple o sistemático; no hay
necesidad de que cada estrato tenga la misma cantidad de unidades.
MUESTREOS NO PROBABILÍSTICOS
● Muestreo por conveniencia o disponibilidad: quien investiga selecciona directa e
intencionadamente a los individuos de la población. El caso más frecuente de este
muestreo es utilizar como muestra a los individuos a los que se tiene fácil acceso. Por
ejemplo, lxs profesores universitarixs emplean con mucha frecuencia a sus propixs
alumnxs.
● Muestreo intencional: se caracteriza por un esfuerzo deliberado de obtener
representatividad mediante la inclusión de individuos supuestamente típicos. Es un
muestreo frecuentemente utilizado cuando se hacen estudios con poblaciones minoritarias
(sectas, determinados tipos de enfermos, etc.) y es muy frecuente también en sondeos
pre-electorales.
● Muestreo bola de nieve: se localiza a algunos individuos con características deseadas, los
cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra de tamaño
suficiente. Luego de observar al primer sujeto, quien investiga le pide ayuda para contactar
a otras personas que tengan un rasgo de interés similar.
¿CUÁL ELEGIR?
Elegir entre una muestra probabilística o una no probabilística depende del planteamiento del
problema, las hipótesis, el diseño y el alcance de la investigación. Ya sea que se trate de un tipo
de muestreo u otro, lo importante es elegir a los casos adecuados, de acuerdo con el
planteamiento del problema y lograr el acceso a ellos.
MATRIZ DE DATOS
Una vez que los datos se han codificado, transferido a una matriz, guardado en un archivo y
“limpiado” los errores, el/la investigador/a está en condiciones de comenzar a analizarlos mediante
la Estadística.
ESTADÍSTICA DESCRIPTIVA
Lo primero que se realiza con los datos es describir los valores o las puntuaciones obtenidas para
cada variable en la muestra bajo estudio, a partir de una serie de medidas numéricas
(estadísticos), tablas y gráficos, a saber:
● Distribuciones de frecuencias
● Medidas de tendencia central
● Medidas de dispersión de los datos
● Medidas de posición no central
● Medidas de forma
DISTRIBUCIÓN DE FRECUENCIAS
Es un conjunto de puntuaciones respecto de una
variable, ordenadas en sus respectivas
categorías y presentadas en una tabla. Por
ejemplo:
MEDIA
Es el promedio aritmético de una distribución, es la suma de todos los valores dividida entre el
número de casos. Es una medida solamente aplicable a mediciones por intervalos o de razón. En
ocasiones se acepta para variables ordinales. Carece de sentido para variables medidas en un
nivel nominal. Resulta sensible a valores extremos.
MEDIANA
Es el valor que divide la distribución por la mitad, refleja la posición intermedia de la distribución
ordenada de menor a mayor, parte a la
distribución en dos mitades. Es una medida
de tendencia central propia de los niveles de
medición ordinal, por intervalos y de razón.
Es particularmente útil cuando hay valores
extremos en la distribución, no es sensible a éstos.
MODA
Es la categoría o puntuación que ocurre con
mayor frecuencia. Se utiliza con cualquier nivel de
medición. Si varios valores comparten la mayor
frecuencia, cada uno es una moda.
ESTADÍSTICA DESCRIPTIVA II: MEDIDAS DE DISPERSIÓN, DE POSICIÓN NO CENTRAL Y
DE FORMA
MEDIDAS DE DISPERSIÓN
Las medidas de la variabilidad indican la dispersión de los datos en la escala de medición de la
variable considerada. Las medidas de tendencia central son valores en una distribución y las
medidas de la variabilidad son intervalos que designan distancias o un número de unidades en la
escala de medición. Las medidas de dispersión más utilizadas son:
● Rango
● Desviación estándar
● Varianza
VARIANZA: Es la desviación estándar elevada al cuadrado. La varianza siempre será mayor que
cero. Cuanto más se aproxima la varianza a cero, más concentrados están los valores alrededor
de la media. A mayor varianza, mayor dispersión. Con fines descriptivos se utiliza
preferentemente la desviación estándar.
MEDIDAS DE FORMA: Las medidas de forma nos permiten comprobar la forma que presenta la
distribución de los datos, es decir, la forma en que se separan o aglomeran los valores de acuerdo
a su representación gráfica. Sus principales medidas son:
Asimetría y Curtosis.
Estas estadísticas se usan para conocer cuánto se parece una distribución a la distribución teórica
llamada curva normal o campana de Gauss. La asimetría y la curtosis requieren al menos un nivel
de medición por intervalos. CAMPANA DE GAUSS:
ASIMETRÍA: Es una estadística necesaria para conocer cuánto se parece nuestra distribución a
una distribución teórica llamada curva normal y constituye un indicador del lado de la curva donde
se agrupan las frecuencias:
● Si es cero (asimetría = 0), la curva o distribución es simétrica.
● Cuando es positiva, quiere decir
que hay más valores agrupados
hacia la izquierda de la curva (por
debajo de la media).
● Cuando es negativa, significa que
los valores tienden a agruparse
hacia la derecha de la curva (por
encima de la media).