Herramientas Cuantitativas

HERRAMIENTAS CUANTITATIVAS
Las herramientas se dividen en dos, estas son las cualitativas y las cuantitativas,
una va ligada a la otra de cierta forma, las herramientas cuantitativas se encargan
de analizar los números, y en contraparte las cualitativas van mas allá de el
análisis numérico, buscan mas la calidad de las cosas, calidad y que los datos
sean verídicos, analizan los textos, las palabras y se puede hace por medio de
videos, voz, sonido etc.
Uno de los objetivos principales de esta materia de Herramientas Cuantitativas es

conocer los instrumentos y cosa interesante que ayuden buscar, pero sobretodo a
aplicar las herramientas para la elaboración de un proyecto, en donde se
identifique el problema desde la base, desde donde surge tal o cual problema en
cuestión.
Las herramientas cuantitativas son aquellas que nos permiten indagar de una
manera más verídica o científica, o bien, como su nombre lo dice de manera más
numérica los datos implícitos en nuestro proyecto de investigación.
1. Estadística descriptiva.
La estadística como ciencia se encarga de recopilar, e interpretar datos que en el

futuro servirán para proyectar posibles problemáticas futuras, consiguiendo según
estos datos, la solución más viable y rápida.
El objetivo básico de la estadística es hacer inferencia acerca de una población

con base a la información contenida en una muestra, ¿qué significa esto?
Inferir significa inducir una cosa de otra, llevar consigo, conducir a un resultado.
Es decir se pretende establecer inferencia acerca de una población, entendiendo a

la población como un conjunto de individuos, organismos o entes inanimados de
los cuales queremos conocer alguna o algunas características para que nos
ayuden a tomar una decisión u obtener alguna conclusión de suma importancia, y
nada sabemos sobre la distribución, existencia, ubicación, valor de esta o estas
características que nos interesa saber.
Ejemplo: Que estamos interesados si nuestra población juvenil consume o no

droga. Con mayor precisión, necesitamos saber en la actualidad qué fracción de
nuestra población consume drogas, entendiendo que el consumo de drogas lo
tenemos tipificado en alguna escala o nivel. De manera que nuestro objetivo es
saber con toda la exactitud posible, que fracción de toda nuestra población juvenil
consume droga.
Por razones materiales, de recursos humanos, de imposibilidad física y en

definitiva de costos, no podemos efectuar una encuesta a toda la población.
Necesitamos entonces hacer una consulta a un gran número de jóvenes, donde

este número será concomitante con la eliminación de las barreras que impiden
consultar a toda la población juvenil. Definido este número de jóvenes a los
cuales, mediante técnicas de consulta adecuadas, se entenderá como una
muestra de la población en estudio. Sobre esta muestra haremos análisis
estadístico para poder inferir qué fracción de jóvenes de la población juvenil
consume drogas.
1.1. Conceptos generales.
La Estadística es mucho más que sólo números apilados y gráficas bonitas. Es

una ciencia con tanta antigüedad como la escritura, y es por sí misma auxiliar de
todas las demás ciencias.
Minguez, define la Estadística como “La ciencia que tiene por objeto aplicar las
leyes de la cantidad a los hechos sociales para medir su intensidad, deducir las
leyes que los rigen y hacer su predicción próxima”.
Los estudiantes confunden comúnmente los demás términos asociados con las
Estadísticas, una confusión que es conveniente aclarar debido a que esta palabra
tiene tres significados: la palabra estadística, en primer término se usa para
referirse a la información estadística; también se utiliza para referirse al conjunto
de técnicas y métodos que se utilizan para analizar la información estadística; y el
término estadístico, en singular y en masculino, se refiere a una medida derivada
de una muestra, entonces, en relación a lo descrito anteriormente, la estadística
descriptiva, trata de la tabulación de datos, su presentación en forma gráfica o
ilustrativa y el cálculo de medidas descriptivas.
VARIABLES
Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo

se llama variable estadística.
Variables cualitativas:
Son las variables que expresan distintas cualidades, características o modalidad.

Cada modalidad que se presenta se denomina atributo o categoría y la medición
consiste en una clasificación de dichos atributos. Las variables cualitativas pueden
ser ordinales y nominales.
Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos
valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden
adquirir tres o más valores.
Dentro de ellas podemos distinguir:
Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados

siguiendo una escala establecida, aunque no es necesario que el intervalo entre
mediciones sea uniforme, por ejemplo, leve, moderado, grave
Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos
a un criterio de orden como por ejemplo los colores o el lugar de residencia.
Variables cuantitativas
Son las variables que se expresan mediante cantidades numéricas. Las variables
cuantitativas además pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la

escala de valores que puede tomar. Estas separaciones o interrupciones indican la
ausencia de valores entre los distintos valores específicos que la variable pueda
asumir. Un ejemplo es el número de hijos.
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un

intervalo especificado de valores. Por ejemplo el peso o la altura, que solamente
limitado por la precisión del aparato medidor, en teoría permiten que siempre
exista un valor entre dos cualesquiera.
Según la influencia que asignemos a unas variables sobre otras, podrán ser:
Variables independientes
Son las que el investigador escoge para establecer agrupaciones en el estudio,

clasificando intrínsecamente a los casos del mismo. Un tipo especial son las
variables de confusión, que modifican al resto de las variables independientes y
que de no tenerse en cuenta adecuadamente pueden alterar los resultados por
medio de un sesgo.
Variables dependientes
Son las variables de respuesta que se observan en el estudio y que podrían estar
influenciadas por los valores de las variables independientes.
PRESENTACION DE DATOS.
Medidas de posición.
La moda.
La medida modal nos indica el valor que más veces se repite dentro de los datos;
es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces se
repite es el número 2 quien seria la moda de los datos. Es posible que en algunas
ocasiones se presente dos valores con la mayor frecuencia, lo cual se denomina
Bimodal o en otros casos más de dos valores, lo que se conoce como multimodal.
La mediana.
Con esta medida podemos identificar el valor que se encuentra en el centro de los
datos, es decir, nos permite conocer el valor que se encuentra exactamente en la
mitad del conjunto de datos después que las observaciones se han ubicado en
serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran
por debajo de este valor y la otra mitad por encima del mismo. Para determinar la
posición de la mediana se utiliza la fórmula
En conclusión la mediana nos indica el valor que separa los datos en dos
fracciones iguales con el cincuenta por ciento de los datos cada una. Para las
muestras que cuentan con un número impar de observaciones o datos, la mediana
dará como resultado una de las posiciones de la serie ordenada; mientras que
para las muestras con un número par de observaciones se debe promediar los
valores de las dos posiciones centrales.
La media.
Es la medida de posición central más utilizada, la más conocida y la más sencilla

de calcular, debido principalmente a que sus ecuaciones se prestan para el
manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica
en su sensibilidad al cambio de uno de sus valores o a los valores extremos
demasiado grandes o pequeños. La media se define como la suma de todos los
valores observados, dividido por el número total de observaciones.
En conclusión las Medidas de tendencia central, nos permiten identificar los
valores más representativos de los datos, de acuerdo a la manera como se
tienden a concentrar. La Media nos indica el promedio de los datos; es decir, nos
informa el valor que obtendría cada uno de los individuos si se distribuyeran los
valores en partes iguales. La Mediana por el contrario nos informa el valor que
separa los datos en dos partes iguales, cada una de las cuales cuenta con el
cincuenta por ciento de los datos. Por último la Moda nos indica el valor que más
se repite dentro de los datos.
Medidas de dispersión.
Estudia la distribución de los valores de la serie, analizando si estos se encuentran

más o menos concentrados, o más o menos dispersos.
Existen diversas medidas de dispersión, entre las más utilizadas podemos

destacar las siguientes:
1.- Rango: mide la amplitud de los valores de la muestra y se calcula por

diferencia entre el valor más elevado y el valor más bajo.
2.- Varianza: Mide la distancia existente entre los valores de la serie y la

media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor
y la media, multiplicadas por el número de veces que se ha repetido cada valor. El
sumatorio obtenido se divide por el tamaño de la muestra.
3.- Desviación típica: Se calcula como raíz cuadrada de la varianza.
4.- Coeficiente de varización de Pearson: se calcula como cociente entre la

desviación típica y la media.
Representaciones graficas.
3.- MUESTREO EN ESTADISTICA

En estadística se conoce como muestreo a la técnica para la selección de una
muestra a partir de una población.
Al elegir una muestra se espera conseguir que sus propiedades sean

extrapolables a la población. Este proceso permite ahorrar recursos, y a la vez
obtener resultados parecidos a los que se alcanzarían si se realizase un estudio
de toda la población.
Cabe mencionar que para que el muestreo sea válido y se pueda realizar un
estudio adecuado (que consienta no solo hacer estimaciones de la población sino
estimar también los márgenes de error correspondientes a dichas estimaciones),
debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de
que el resultado sea una muestra representativa, pero sí podemos actuar de
manera que esta condición se alcance con una probabilidad alta.
En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la

población, se puede extraer dos o más muestras de la misma población. Al
conjunto de muestras que se pueden obtener de la población se denomina
espacio muestral. La variable que asocia a cada muestra su probabilidad de
extracción, sigue la llamada distribución muestral.
3.1 Técnicas de muestreo
Existen dos métodos para seleccionar muestras de poblaciones: el muestreo no

aleatorio o de juicio y el muestreo aleatorio (que incorpora el azar como recurso en
el proceso de selección). Cuando este último cumple con la condición de que
todos los elementos de la población tienen alguna oportunidad de ser escogidos
en la muestra, si la probabilidad correspondiente a cada sujeto de la población es
conocida de antemano, recibe el nombre de muestreo probabilístico. Una muestra
seleccionada por muestreo de juicio puede basarse en la experiencia de alguien
con la población. Algunas veces una muestra de juicio se usa como guía o
muestra tentativa para decidir cómo tomar una muestra aleatoria más adelante.
3.2 Muestreo probabilístico
Forman parte de este tipo de muestreo todos aquellos métodos para los que
puede calcularse la probabilidad de extracción de cualquiera de las muestras
posibles. Este conjunto de técnicas de muestreo es el más aconsejable, aunque
en ocasiones no es posible optar por él. En este caso se habla de muestras
probabilísticas, pues no es en rigor correcto hablar de muestras representativas
dado que, al no conocer las características de la población, no es posible tener
certeza de que tal característica se haya conseguido.
3.2.1 Sin reposición de los elementos
Cada elemento extraído se descarta para la subsiguiente extracción. Por ejemplo,

si se extrae una muestra de una "población" de bombillas para estimar la vida
media de las bombillas que la integran, no será posible medir más que una vez la
bombilla seleccionada.
3.2.2 Con reposición de los elementos
Las observaciones se realizan con reemplazamiento de los individuos, de forma

que la población es idéntica en todas las extracciones. En poblaciones muy
grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo
puede considerarse sin reposición aunque, realmente, no lo sea.
3.2.3 Con reposición múltiple
En poblaciones muy grandes, la probabilidad de repetir una extracción es tan

pequeña que el muestreo puede considerarse sin reposición. Cada elemento
extraído se descarta para la subsiguiente extracción.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la

extracción de números aleatorios mediante ordenadores, calculadoras o tablas
construidas al efecto.
3.3 Muestreo estratificado

Consiste en la división previa de la población de estudio en grupos o clases que se
suponen homogéneos con respecto a alguna característica de las que se van a
estudiar. A cada uno de estos estratos se le asignaría una cuota que determinaría
el número de miembros del mismo que compondrán la muestra. Dentro de cada
estrato se suele usar la técnica de muestreo sistemático, una de las técnicas de
selección más usadas en la práctica.
Según la cantidad de elementos de la muestra que se han de elegir de cada uno

de los estratos, existen dos técnicas de muestreo estratificado:
3.3.1 Asignación proporcional
El tamaño de la muestra dentro de cada estrato es proporcional al tamaño del

estrato dentro de la población.
3.3.2 Asignación óptima
La muestra recogerá más individuos de aquellos estratos que tengan más

variabilidad. Para ello es necesario un conocimiento previo de la población.
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por
separado las opiniones de hombres y mujeres pues se estima que, dentro de cada
uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está
compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra
que contenga también esos mismos porcentajes de hombres y mujeres.
Para una descripción general del muestreo estratificado y los métodos de

inferencia asociados con este procedimiento, suponemos que la población está
dividida en h sub poblaciones o estratos de tamaños conocidos N1, N2,..., Nh tal
que las unidades en cada estrato sean homogéneas respecto a la característica
en cuestión. La media y la varianza desconocidas para el i-ésimo estrato son
denotadas por mi y si2, respectivamente.
3.4 Muestreo sistemático
Se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse

en el tiempo. Primero hay que identificar las unidades y relacionarlas con el
calendario (cuando proceda). Luego hay que calcular una constante, que se
denomina coeficiente de elevación K= N/n; donde N es el tamaño del universo y n
el tamaño de la muestra. Determinar en qué fecha se producirá la primera
extracción, para ello hay que elegir al azar un número entre 1 y K; de ahí en
adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es
conveniente tener en cuenta la periodicidad del fenómeno.
Esto quiere decir que si tenemos un determinado número de personas que es la

población (N) y queremos escoger de esa población un número más pequeño el
cual es la muestra (n), dividimos el número de la población por el número de la
muestra que queremos tomar y el resultado de esta operación será el intervalo,
entonces escogemos un número al azar desde uno hasta el número del intervalo,
y a partir de este número escogemos los demás siguiendo el orden del intervalo.
3.5 Muestreo por estadios múltiples
Esta técnica es la única opción cuando no se dispone de lista completa de la

población de referencia o bien cuando por medio de la técnica de muestreo simple
o estratificado se obtiene una muestra con unidades distribuidas de tal forma que
resultan de difícil acceso. En el muestreo a estadios múltiples se subdivide la
población en varios niveles ordenados que se extraen sucesivamente por medio
de un procedimiento de embudo. El muestreo se desarrolla en varias fases o
extracciones sucesivas para cada nivel.
Por ejemplo, si tenemos que construir una muestra de profesores de primaria en
un país determinado, éstos pueden subdividirse en unidades primarias
representadas por circunscripciones didácticas y unidades secundarias que serían
los propios profesores. En primer lugar extraemos una muestra de las unidades
primarias (para lo cual debemos tener la lista completa de estas unidades) y en
segundo lugar extraemos aleatoriamente una muestra de unidades secundarias de
cada una de las primarias seleccionadas en la primera extracción.
3.6 Muestreo por conglomerados
Técnica similar al muestreo por estadios múltiples, se utiliza cuando la población

se encuentra dividida, de manera natural, en grupos que se supone que contienen
toda la variabilidad de la población, es decir, la representan fielmente respecto a la
característica a elegir, pueden seleccionarse sólo algunos de estos grupos o
conglomerados para la realización del estudio.
Dentro de los grupos seleccionados se ubicarán las unidades elementales, por

ejemplo, las personas a encuestar, y podría aplicársele el instrumento de medición
a todas las unidades, es decir, los miembros del grupo, o sólo se le podría aplicar
a algunos de ellos, seleccionados al azar. Este método tiene la ventaja de
simplificar la recogida de información muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos

individuos para integrar la muestra, el diseño se llama muestreo bietápico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer

método funciona mejor cuanto más homogénea es la población respecto del
estrato, aunque más diferentes son éstos entre sí. En el segundo, ocurre lo
contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben
ser muy parecidos entre sí.
3.7 Muestreo de juicio
Aquél para el que no puede calcularse la probabilidad de extracción de una

determinada muestra. Se busca seleccionar a individuos que se juzga de
antemano tienen un conocimiento profundo del tema bajo estudio, por lo tanto, se
considera que la información aportada por esas personas es vital para la toma de
decisiones.
3.8 Muestreo por cuotas
Es la técnica más difundida sobre todo en estudios de mercado y sondeos de

opinión. En primer lugar es necesario dividir la población de referencia en varios
estratos definidos por algunas variables de distribución conocida (como el género
o la edad). Posteriormente se calcula el peso proporcional de cada estrato, es
decir, la parte proporcional de población que representan. Finalmente se multiplica
cada peso por el tamaño de n de la muestra para determinar la cuota precisa en
cada estrato. Se diferencia del muestreo estratificado en que una vez determinada
la cuota, el investigador es libre de elegir a los sujetos de la muestra dentro de
cada estrato.
3.9 Muestreo de bola de nieve
Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas

pero en contacto entre sí. Consiste en identificar sujetos que se incluirán en la
muestra a partir de los propios entrevistados. Partiendo de una pequeña cantidad
de individuos que cumplen los requisitos necesarios estos sirven como
localizadores de otros con características análogas.
3.10 Muestreo subjetivo por decisión razonada
En este caso las unidades de la muestra se eligen en función de algunas de sus

características de manera racional y no casual. Una variante de esta técnica es el
muestreo compensado o equilibrado, en el que se seleccionan las unidades de tal
forma que la media de la muestra para determinadas variables se acerque a la
media de la población.
PRESENTACION DE DATOS
TABLAS Y GRÁFICOS
La presentación de los datos es fundamental en un trabajo de investigación.

A veces en una tabla está lo principal que se obtuvo en una investigación y
ustedes deben tratar de entenderla, entonces vean como este caballero dice que
muchas veces es el cerebro de un artículo.
“La presentación de los datos en cuadros es a menudo el corazón, o mejor aún, el

cerebro de un artículo científico.”
Peter Morgan.
La presentación de los datos en un trabajo de investigación o en un artículo
la pueden encontrar en tablas y gráficos, como también puede aparecer en el texto
escrito. La mayoría de los investigadores cuando escriben un artículo científico
colocan en el texto lo fundamental y hacen referencia en tablas y gráficos. Ustedes
deben tratar de no ser redundantes, o sea no repetir. Lo que esté en tablas o
gráficos no debiera estar nuevamente representado en el trabajo.
Representación de datos:
• En el texto
• En tablas
• En gráficos
• Nunca presentar los datos en más de una forma.
Las tablas, en primer lugar, son la forma de ordenar los datos en filas y
columnas, eso es una tabla en resumidas cuentas y es la forma de representar de
forma ordenada los resultados de un trabajo para que las personas puedan
entender de mejor forma. Cuando uno hace una investigación epidemiológica o un
estudio de casos controles o una investigación de cualquier ámbito y ve muchas
muestras y muchos pacientes, no tienen para que publicar todo lo que encontraron
en cada uno de los pacientes o en cada una de las muestras que analizaron,
tienen que resumir eso y esa forma de resumir y ordenar las cosas es
presentándola en tablas y en gráficos.
Las tablas estadísticas sirven para presentar en forma ordenada los datos
numéricos obtenidos en algún estudio.
¿Cuándo hacer tablas?
• Las tablas van a presentar los datos que sean más representativos, no tiene
para que representar todo.
• Para mostrar datos que indican cambios importantes.
No hacer tablas cuando....
• Cuando la cosa sea muy uniforme, vale decir todos los pacientes tienen el
mismo resultado, o sea los datos son idénticos o repetitivos.
• Cuando es más fácil decir una cosa en palabras que hacer una tabla.
• Si los resultados no son significativos. Uno usa los resúmenes de las

observaciones y los hace es cuando hay diferencias significativas y si no
las hay no es necesario hacer tablas.
La tabla debe tener título y unas rayitas para que la gente entienda mejor, unas
rayas horizontales que permitan definir donde está el encabezado y donde está
separando los totales del contenido principal de la tabla.
En esta tabla debe estar el título y si hay una abreviatura debe ser explicada.
Acá tenemos por ejemplo, la distribución de pacientes con Síndrome de Sjögren

primario y secundario. El INE todo el mundo sabe lo que es, así que esa
abreviatura no tiene para que explicarla.
Al hacer una tabla siga algunas etapas.
Principales etapas en la construcción de una tabla:
1. Van a poner el propósito que tiene una tabla.

2. Debe tener un título, un encabezado. Cuando en un trabajo se usan
muchas tablas deben ir numeradas, en algunas partes le piden que las
numere con números romanos y en otras partes con números arábigos,
tiene que seguir las indicaciones de los editores cuando uno va a publicar
un articulo.
Ej.: Tabla 1. Distribución de pacientes...
3. Asigne las escalas de clasificación de las filas y de las columnas, que es lo

que va a colocar. La variable dependiente va a estar en las columnas (eso
es una norma).
4. Coloque los datos obtenidos y complete a veces con porcentajes,

especialmente en las variables que son nominales u ordinales. En caso de
variables intervalares generalmente siempre debe estar el n, el promedio y
la desviación estándar.
Defina el propósito de la tabla.
Eso es determine como va a clasificar las observaciones que va a colocar

en una tabla. Hoy en día con la ayuda de los computadores y los software
estadísticos cuando uno ya tiene los datos ingresados al computador, el software
como por ejemplo el SPCS o el Syntax o el Excel, usted fácilmente puede hacer
una tabla y usted la copia y la pega a su documento en Word pero tiene que tener
el concepto claro. Al ordenar los datos se le hará más fácil elaborar la tabla.
Además una vez que tenga sus datos en la tabla eso simplifica después entender
que análisis estadístico habría que hacer sobre esos datos.
Definir los propósitos de la tabla ayuda a determinar los criterios de

clasificación de las tablas y el sentido en que deben analizarse los datos.
De acuerdo a los propósitos se distinguen:

• Tablas de distribución de frecuencias: el material se clasifica de acuerdo a
un sólo criterio.
• Tablas de asociación: en la cual se desea mostrar la asociación entre dos o

más variables en las unidades de observación.
El título.
El título debe decir por lo menos lo que hay adentro de la tabla. Qué es lo
que está presentando adentro de esa tabla. Como se clasificaron los datos.
Generalmente, muchas veces uno no tiene ni que explicar porque se entiende
fácilmente lo que quiere decir esa tabla. (Ej.: Si usted pone hombres, mujeres, no
tiene para que decir “clasifiqué esta tabla de acuerdo al género”, ¿para qué?)
Usted mira y entiende. Donde se registraron los datos y cuando se registraron los
datos, a veces es necesario en la tabla que aparezca en el título cuando esa tabla
se presenta de forma aislada, como por ejemplo en un congreso. (Lo de donde y
cuando eso lo va encontrar en la sección de materiales y métodos, entonces no
siempre es necesario que esté ahí en el título pero si hay una variación en la
recopilación de los datos es bueno que esté ahí, en el título).
El título debe especificar:
• Qué presenta.
• Cómo se clasifican las unidades de observación.
• Dónde fueron registrados los datos.
Casos especiales.
A veces hay casos especiales:

Tablas con pocos datos, títulos muy cortos, a veces hay secuencias de tablas que
están relacionadas una con otra, entonces no hay para qué estar repitiendo todos
los títulos si son la continuación una de otra, lo hay que hacer es ir siguiendo el
orden para entenderlas. Al pie de la tabla es necesario colocar generalmente las
abreviaturas, pueden también poner algo acerca del origen de los datos, el
análisis estadístico que se hizo o la significancia estadística generalmente con una
letra más pequeña y cualquier cosa que deba ser aclarada porque haya una
inconsistencia en los datos dentro de esa tabla, por ejemplo los totales a veces
puede que no coincidan y tiene que explicar porque no lo hacen (Ej.: un paciente
que se retiró del estudio o algún paciente que presenta más de una característica,
entonces puede estar en varias categorías asignadas.)
Asigne las escalas de clasificación a las filas y columnas.
La primera columna generalmente es la definición, por ejemplo si es un estudio

por género, entonces están hombre y mujer definidos en la primera columna. A
estos hombres y mujeres usted les midió la presión sistólica, el valor de la presión
va a estar al lado derecho de cada género. A veces puede que tenga más de un
criterio de clasificación, entonces usted tiene género hombre y mujeres y dice
hombre menores de 20 años y hombres mayores de 20 años, ahí además
subdivide, por lo tanto tiene un mayor número de grupos en la primera columna y
los puede ir subdividiendo. Y eso le va ir complicando las cosas, pero es necesario
hacerlo, algunas veces por el objetivo que puede tener un estudio. Lo más sencillo
es que tenga un solo criterio de clasificación pero también puede haber más de un
criterio para clasificar los datos en esa tabla.
Un criterio de clasificación:
• Primera columna.
Más de un criterio de clasificación:

• Escala con mayor número de grupos en la primera columna.
Dos escalas de clasificación, una se refiere a los antecedentes y la otra a las

consecuencias:
• Antecedentes en la columna a la izquierda.
• Consecuencias en la fila superior.
Con más de dos criterios de clasificación comienza a enredarse la tabla, se

dificulta la lectura de esa tabla. Pueden ser útiles a veces como tablas de
referencia como algunas tablas que publica el Instituto Nacional de Estadísticas
(INE) en ellas ve la tabla de población de Chile, está por ejemplo la región,
comuna y dentro de las comunas puede que esté agrupada por hombre y mujeres,
entonces se va subdividiendo, son tablas largas y más complicadas y también se
pueden estar dividiendo las columnas por grupos de edades. Entonces esas tablas
le sirven como tablas de trabajo, para buscar información, pero son un poco más
enredadas.
Tablas de más de dos criterios de clasificación:
• Presentan dificultades de lectura y debieran evitarse como tablas de

presentación en publicaciones.
• Son útiles como tablas de referencia para colocarlas en anexos de trabajos.
• Sirven como tablas de trabajo para resumir todos los datos y poder extraer
de ellas tablas más sencillas.
Totales marginales.
Al colocar los datos muchas veces es necesario poner los totales. Los totales en
una tabla pueden estar en las filas, en las comunas o ambos y es bueno estar
revisando que coincidan esos totales. Generalmente esos totales se obtienen por
la suma de la horizontal y vertical. Si esos totales no se obtuvieron así, por la
suma y no coincide con los valores reales debe decir porqué.
Porcentajes.
Puede colocar porcentajes de acuerdo al total de la columna o de la fila y muchas

veces en las variables nominales y ordinales es necesario que coloque los
porcentajes porque a la persona le queda como más fácil entender. (Es más fácil
entender 5% que 1 de 20). No use porcentajes cuando tiene muy pocos datos. Por
ejemplo, estudió una enfermedad muy rara y encontró que de 5 pacientes sólo
había 1 mujer, no tiene para qué calcular el porcentaje porque la mayoría de los
humanos pueden darse cuenta que ese 1 de 5 es el 20%, no se usa en tan pocas
observaciones para tal característica.
Tablas de contingencia 2 X 2
RESFRÍA
DEPORTE SI NO Total
SI 16 20 36
NO 14 30 44
Total 30 50 80
Pueden poner en las columnas la variable dependiente si se resfrían, aquí
también se evaluó si hacen deporte o no... Cada observación tiene una
característica. A partir de estos datos puede sacar porcentajes, el porcentaje de la
columna es el que interesa.
Cuando tenemos estas tablas de 2 x 2, cada uno de los cuadrados aquí

adentro de la tabla la vamos a llamar CELDA (en inglés cell) y se usa una letra
para denominarla, la a, b, c y d. Entonces la suma de las columnas es sencilla.
Estas tablas pueden utilizarlas en la evaluación de test de diagnóstico, por ejemplo
se hace un test para ver si los pacientes tienen SIDA y puede obtener falsos
positivos (se hace el test y dice que tiene la condición cuando en la realidad no la
tiene) y falsos negativos (el gallo fue a una fiesta anoche y se contagió el SIDA y
va en la mañana a hacerse el examen y le sale negativo aunque se acaba de
contagiar). Entonces cuando tenemos una condición existe la posibilidad de tener
una verdad positiva, una verdad negativa, falsos positivos y falsos positivos.
Lo otro que puede haber que la persona no tenga le enfermedad y lo lógico

es que el test le diga que no tiene la enfermedad lo que sería una verdad negativa.
(Se desprende que la verdad positiva vendría siendo cuando el test le indica que
sí tiene la enfermedad y en realidad sí la padece).
En odontología se utiliza mucho este tipo de tablas para realizar los test de
sensibilidad y especificidad que es basado en estas tablas que se usan en
diagnóstico donde le den falsos negativos o falsos positivos o verdaderos
negativos o verdaderos positivos. La sensibilidad es la proporción de sujetos con
la enfermedad que tiene el test positivo o sea la sensibilidad de un test se obtiene
al dividir los verdaderos positivos por la suma de esa columna a + c. (Hay que ver
la tabla que describe el profesor) Y la especificidad de un test es la proporción de
sujetos sin la enfermedad y que tienen el test negativo o sea la especificidad de un
test es dividir la b, los verdaderos negativos por el total de esa columna b / b + d.
Por ejemplo si una mamá tiene úlcera en el estómago y se busca si los hijos
tienen el germen, en caso de que no lo tengan, el estudio presentará una
sensibilidad baja y la especificidad va a ser alta por ejemplo si la mamá no tiene el
germen lo más probable es que los niños tampoco presenten el helicobacter pilori.
Eso de sensibilidad y especificidad se usa mucho en tablas de diagnóstico

en la que uno quiera evaluar la capacidad de un test para detectar las personas
que pueden presentar la infección, o sea que pueden dar positivo o que pueden
dar negativo en un examen determinado y eso se puede dar en cualquier examen
que se aplique en medicina u odontología. Eso es para evaluar si tiene la
condición o no la tiene. Una variable nominal.
En una variable intervalar, en las cuales por ejemplo hemos medido un

promedio, tenemos que presentar los datos así, un título, el grupo femenino, el
masculino, el n, el promedio la desviación estándar. Y generalmente al pie de la
tabla esto se compara con test estadístico que ustedes verán en quinto año.
¿Cómo hacer gráficos de todo esto?
Generalmente a las personas les queda todo mucho más claro cuando ven
un gráfico y estos gráficos pueden ser la parte medular de la presentación o de un
artículo científico. Es una lata cuando uno lee un artículo científico o ve un trabajo
y se encuentra con puros números y tablas, es más entretenido verlos
representados en gráficos porque uno puede apreciar cómo se relacionan los
datos o cual es la tendencia que existe.
El gráfico es la representación en el plano de datos numéricos, con el fin de
obtener una impresión visual conjunta que facilita la comprensión del material
presentado.
El objetivo de la mayoría de los gráficos es presentar distribuciones de

frecuencia o asociaciones entre dos o más variables investigadas.
Un gráfico es la representación en el plano de datos numéricos y existen muchos

software que permiten hacer estos gráficos. De estos hay distintos tipos. Y deben
tener algunas características. No se hacen al lote. Tiene que aprender a usar el
Excel.
• Debe ser sencillo y auto explicativo, ojalá con poca cantidad de elementos
lo suficiente para entender, cómodo a la vista.
• Representar fielmente los hechos.
• No impresionar con colores extremadamente llamativos ni falsear la

realidad
• Ni modificando las escalas
• Ni utilizar los gráficos tridimensionales.
• Evitar colores que molestan a la vista por ejemplo con color morado sobre
un fondo negro o colores muy chillones.
• Cuando hace cajas se rellena con color pero no con rayas y si las ocupa
prefiera las oblicuas (esto lo saben muy bien las mujeres porque si es
chica y se pone un traje de rayas generalmente se ve más chica o una
gorda que usa traje de rayas horizontales se ve más gorda y más baja).
• Tiene que hacerlo agradable a la vista.
• Se recomienda que tenga una proporción de 1 es a 1,5 entre la longitud de

los ejes (sección áurea).
• En las barras, las categorías de una misma variable deben ir del mismo
color, no hay que abusar con los colores y la cantidad de categorías.
• Debe ser limpio. Generalmente sea cual sea la especialidad que siga no
tiene para que poner una abuelita con una sonrisa a menos que ese
grafico lo vaya a llevar a un jardín infantil (al Jardín infantil Pipiripao, allá
lleven esos gráficos para entusiasmar a los niños) pero si lo va a
presentar en una tesis o congreso no se usa que ponga muelitas con
rositas, es absurdo.
• El gráfico debe ser limpio, de trazos netos, los títulos con letra clara y
leyendas ubicadas en lugares adecuados.
En resumen sería deseable que un grafico tuviera o permitiese según

Gnanadesikan, hindú:
• Que tenga capacidad descriptiva.
• Que tenga una capacidad de versatilidad.
• Que permita ver la orientación de los datos.
• Que sirva para posibles comparaciones internas.
• Que permita focalizar la atención.
• Que permita autocrítica de posibles presunciones.
• Que permita la adaptabilidad para grandes volúmenes de datos.

Eso es fundamental.
Como hacer un gráfico.
Primero debe ordenar los datos y dependiendo de como vaya a ser el gráfico es
como tendrá que ordenar los datos.
• Defina los objetivos
• Elija el tipo de gráfico
• Y lo construye.
BARRAS SIMPLES
 Presentan la distribución de frecuencias de variables nominales, ordinales e

intervalares discretas.
 Cada categoría se representa por una barra: su largo indica frecuencia,

promedio (en la intervalar), porcentaje de casos u otro.
 Cada barra lleva un título; si es largo (barras transversales), y si es corto

(barras verticales).
 El orden de las barras está dado por su longitud o por la secuencia más
lógica de las categorías (alfabético, por regiones de Chile, etc.)
 Evitar colocar títulos, números o claves, sobre o dentro de las barras.
Rápidamente ve donde hay más y con que frecuencia se da con respecto a las
otras.
BARRAS AGRUPADAS
 Muestran la relación de dos o más variables nominales, ordinales e

intervalares discretas.
 Se dibujan grupos de barras que son subdivisiones de una clasificación más

general.
 Las barras de cada grupo deben tener rayados diferentes para cada
subdivisión, con una leyenda.
 Se clasifica primero por la variable con más categorías, a menos que se

pierda claridad en la demostración de los hechos o no se cumpla con el
objetivo real del gráfico.
BARRAS SUBDIVIDIDAS
Una barra que la subdivide para indicar la importancia que tiene una categoría en
cuento a su porcentaje.
 Ilustran la composición proporcional de distintas categorías.
 El largo representa el 100%
 Se indica cuando en algunas categorías el 100 ó 0% de las unidades

pertenece a uno de los subgrupos. (En un gráfico de barras agrupadas, se
presenta el problema de no tener frecuencia para una de las barras).
 Cuando se tienen más de tres subdivisiones por barra se dificulta la

comparación.
SECTORIALES
El gráfico de torta.
 Se utilizan para los mismos casos que los gráficos de barras,

fundamentalmente para variables nominales u ordinales.
 Cada frecuencia o proporción debe ser expresada como porcentaje del total
del gráfico o porción de la torta (360º), determinando el ángulo que limita el
sector que representa la categoría correspondiente, el ángulo relacionado
con el tamaño de ese grupo.
 Cada sector debe ser identificado.
 Colocar el número de observaciones y la frecuencia en porcentaje,

adyacente a cada categoría.
 Ordenado de mayor a menor para facilitar su entendimiento partiendo

idealmente desde las 3.15 siguiendo o en contra de las agujas del reloj. (En
Excel este ordenamiento no se puede hacer.)
HISTOGRAMAS
 Presentan la distribución de frecuencias de variables intervalares continuas.
 Tenemos un rango de valores que se van a representar por una serie de

rectángulos.
 Consisten en una serie de rectángulos o barras adyacentes, cuyas

superficies representan la frecuencia de cada categoría.
 Cuando los intervalos son iguales, las barras tienen el mismo ancho y su
altura corresponde a la frecuencia observada en el intervalo.
 Este gráfico le permitirá la obtención de una campana de Gausse para
saber si hay una distribución normal de los valores o no. Puede que se de
un sesgo, o sea que los datos se acumulen en un solo lado del gráfico.
 Cuando los intervalos son desiguales, las barras tienen diferente ancho. Se
ajusta al ancho de los intervalos, Histograma Ajustado.
LINEAL
 Le permiten ver la relación entre variables intervalares continuas.
 Tenemos un eje X y un eje Y.
 En el eje X tenemos la variable independiente y en el eje Y la variable

dependiente.
 Y ambos generalmente debieran partir de 0. (Por ejemplo si va a medir la

presión no necesita partir de 0, hay software que tienen esta opción.)
 Tiene que tener pares de observaciones o sea debe tener un valor para el
eje X y l eje Y.
 La computadora se va a encargar de hacerle la línea, si no tiene

computador y lo va a hacer a mano tiene que encontrar la ecuación que
define la relación entre ambas variables.
PLOTS DE DISPERSIÓN
 Gráficos de dispersión y correlación, no se representa sólo una línea sino

que se presentan una serie de valores.
 Tenemos variable dependiente e independiente.
 Pares de observaciones, un valor para el eje X y un valor para el eje Y.
 Los ejes deben tener la misma longitud y cada eje debe estar identificado.
 Los puntos generalmente no se unen, tenemos como una nube de valores

pero en el computador podemos obtener como se relacionan esos valores.
 Cada punto es un individuo y al sumarlos obtenemos una nube.
DE CAJAS O DE BOX PLOTS
Fue inventado en la década del 70’ pero cada vez es más utilizado porque es muy
informativo.
 Se basa en una caja que tiene una línea al medio de ella que representa la
mediana y que sirve para variables intervalares. O sea aquellas variables
donde uno ha podido sacar promedio y desviación estándar.
 Las líneas perpendiculares que van a ver en relación a la caja significa

dispersión de los valores pero para un cierto rango y los valores que están
muy alejados de la distribución normal los marca con un asterisco (*) y los
muy alejados los va a marcar con un cero (0).
 Rápidamente con un grafico sencillo que consiste en una caja y dos bigotes
ve la distribución de las observaciones.
 Bigotes son los palitos al medio de la caja, las patitas, en inglés es whisker.
 Si no aparece un círculo o un asterisco quiere decir que tiene una

distribución normal.
 Es un gráfico sencillo, limpio, auto explicativo y permite darse cuenta

rápidamente como se distribuye una variable intervalar.
 Rápidamente ve la mediana, donde está el 50% de los valores que es el
largo de la caja (determinado por sus bisagras), el 25% de los valores
superiores y el 25% de los valores inferiores con los bigotes.
Muchas veces se ponen varias cajas en un mismo gráfico es para comparar como
es la distribución entre grupos.
 Si las cajas están a muy diferentes alturas probablemente cuando se hagan

los test estadísticos va a encontrar diferencias significativas entre los
grupos.
 Si hay varios individuos que aparecen con un 0 es probable que la

distribución no sea normal
 Y si la mediana no aparece en la mitad de la caja quiere decir que tampoco

hay distribución normal en esos valores.
¿Cómo elegir un gráfico?
Depende de la variable.
 Si es nominal u ordinal puede hacer un gráfico de barras o un sectorial.
 Si es intervalar puede hacer un gráfico de box plots o histograma
Si se quiere ver las relaciones.
 Entre variables intervalares puede utilizar los plots de dispersión o el grafico

de líneas.
 Entre variables nominales u ordinales puede utilizar gráficos de barras

pareadas o agrupadas
 Relación de una parte de la información respecto al total: gráficos
sectoriales o barras subdivididas.
 Variación conjunta de dos variables continuas: plots o gráficos lineales.
Conclusión
Algunas cuestiones que han hecho necesario repensar el papel que el paradigma
cuantitativo ha tenido sobre las ciencias sociales son las que se presentan a
continuación:
La filosofía empírico -positivista impregna a los planteamientos estructural

-funcionalistas norteamericanos. Desde ésta perspectiva las investigaciones se
orientan hacia la acumulación de datos que por si mismos llegan a resultar
insuficientes e incapaces de dar una explicación acabada de la educación y sus
conflictos.
La crítica popperiana se presenta demoledora respecto al estatus de cientificidad

de las ciencias sociales ya que gran parte de sus enunciados no son, a juicio de
este autor, verificables empíricamente. Este tipo de enunciados (al igual que los de
las otras ciencias) son en su mayoría de carácter conjetural -hipotético y siempre
están sujetos a revisión. Ante la perdida del estatus de cientificidad las ciencias
sociales quedan como un conjunto de conocimientos conceptuales y
especulativos, mezcla de saber e ideología.
Uno de los factores que ha obstaculizado el avance de perspectivas integrales de

investigación son los supuestos (nada desdeñables) de orden ideológico y
epistemológico que subyacen en las propuestas metodológicas. El paradigma
cuantitativo se recrea en el dato. La finalidad de este tipo de estudios tiene un
carácter pragmático - utilitario. El hombre y su entorno se identifican a partir de lo
mensurable. Todos aquellos aspectos que escapan a ésta última condición son
anulados o relegados. Cuestiones tales como la ética, la política o los valores son
considerados intrascendentes. Una perspectiva de éste tipo difícilmente puede
llegar a cubrir la complejidad de los fenómenos sociales. Las posiciones
irreconciliables, tienden a limitar y encasillar la perspectiva del análisis.
La investigación social se enfrenta a un objeto de estudio sumamente azaroso.

Las relaciones entre los hombres pueden resultar impredecibles en virtud de la
multiplicidad de los rasgos y de los factores que interviene en las situaciones
sociales. La libertad y el cambio constante inherentes al ser humano y a su
sociedad constituyen severos obstáculos para la explicación de los hechos.
Las investigaciones basadas en el método científico basado modelos

cuantitativistas han resultado insuficientes para orientar la acción en un mundo
pragmático. Cada vez resultan más evidentes los límites de los métodos
cuantitativos para captar aspectos esenciales de la realidad social sin los que
resulta difícil intervenir en ella.
El límite del alcance de los métodos cuantitativos se encuentra cuando se

abordan, en el ámbito educativo, cuestiones subjetivas, intersubjetivas o
psicológicas.

Herramientas Cuantitativas

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Herramientas Cuantitativas

Cargado por

Copyright:

Formatos disponibles

HERRAMIENTAS CUANTITATIVAS

Uno de los objetivos principales de esta materia de Herramientas Cuantitativas es

La estadística como ciencia se encarga de recopilar, e interpretar datos que en el

El objetivo básico de la estadística es hacer inferencia acerca de una población

Es decir se pretende establecer inferencia acerca de una población, entendiendo a

Ejemplo: Que estamos interesados si nuestra población juvenil consume o no

Por razones materiales, de recursos humanos, de imposibilidad física y en

Necesitamos entonces hacer una consulta a un gran número de jóvenes, donde

1.1. Conceptos generales.

La Estadística es mucho más que sólo números apilados y gráficas bonitas. Es

Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo

Son las variables que expresan distintas cualidades, características o modalidad.

Dentro de ellas podemos distinguir:

Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados

Variable discreta: Es la variable que presenta separaciones o interrupciones en la

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un

Son las que el investigador escoge para establecer agrupaciones en el estudio,

Es la medida de posición central más utilizada, la más conocida y la más sencilla

Estudia la distribución de los valores de la serie, analizando si estos se encuentran

Existen diversas medidas de dispersión, entre las más utilizadas podemos

1.- Rango: mide la amplitud de los valores de la muestra y se calcula por

2.- Varianza: Mide la distancia existente entre los valores de la serie y la

3.- Desviación típica: Se calcula como raíz cuadrada de la varianza.

4.- Coeficiente de varización de Pearson: se calcula como cociente entre la

3.- MUESTREO EN ESTADISTICA

Al elegir una muestra se espera conseguir que sus propiedades sean

En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la

3.1 Técnicas de muestreo

Existen dos métodos para seleccionar muestras de poblaciones: el muestreo no

3.2.1 Sin reposición de los elementos

Cada elemento extraído se descarta para la subsiguiente extracción. Por ejemplo,

3.2.2 Con reposición de los elementos

Las observaciones se realizan con reemplazamiento de los individuos, de forma

3.2.3 Con reposición múltiple

En poblaciones muy grandes, la probabilidad de repetir una extracción es tan

Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la

3.3 Muestreo estratificado

Según la cantidad de elementos de la muestra que se han de elegir de cada uno

3.3.1 Asignación proporcional

El tamaño de la muestra dentro de cada estrato es proporcional al tamaño del

3.3.2 Asignación óptima

La muestra recogerá más individuos de aquellos estratos que tengan más

Para una descripción general del muestreo estratificado y los métodos de

Se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse

Esto quiere decir que si tenemos un determinado número de personas que es la

3.5 Muestreo por estadios múltiples

Esta técnica es la única opción cuando no se dispone de lista completa de la

3.6 Muestreo por conglomerados

Técnica similar al muestreo por estadios múltiples, se utiliza cuando la población

Dentro de los grupos seleccionados se ubicarán las unidades elementales, por

Cuando, dentro de cada conglomerado seleccionado, se extraen algunos

Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer

Aquél para el que no puede calcularse la probabilidad de extracción de una

3.8 Muestreo por cuotas

Es la técnica más difundida sobre todo en estudios de mercado y sondeos de

3.9 Muestreo de bola de nieve

Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas

3.10 Muestreo subjetivo por decisión razonada

En este caso las unidades de la muestra se eligen en función de algunas de sus

La presentación de los datos es fundamental en un trabajo de investigación.

“La presentación de los datos en cuadros es a menudo el corazón, o mejor aún, el

• Nunca presentar los datos en más de una forma.

• Para mostrar datos que indican cambios importantes.