Está en la página 1de 21

Estadística

MILTON NARVÁEZ C., MBA


Creo que la falta de pensamiento estadístico “
es la principal deficiencia intelectual de "Las cifras no mienten, pero los
nuestras universidades, el periodismo y la mentirosos también usan cifras"
cultura intelectual. Anónimo.
Steven Pinker
Proceso de investigación
Planteamiento Métodos y Presentación y
de la técnicas de discusión de
Investigación Investigación los resultados

… construir … llenar y procesar … interpretar


matrices de matrices de datos matrices de
datos … … datos …

s y
e
a tron as …
Libro de … p uctur
Modelos estr
Código teóricos
… describir el objeto y
… construcción … regularidades
rechazar o aceptar
del objeto … del objeto …
hipótesis …
MATRIZ DE
DATOS
MILTON NARVÁEZ C., MBA
Datos
Datos proviene del término latino «datum» que significa “lo dado”.
“ …el dato es el resultado de un proceso de elaboración, es decir, el dato hay
que construirlo” (Javier Gil Flores. 1994. Análisis de Datos Cualitativos. Aplicaciones
a la Investigación Educativa, Barcelona, Edit. PPU, Cap. 1).
Los datos son las medidas extraída de la realidad que es registrada en algún
soporte físico o simbólico, que implica una elaboración conceptual y además que
se pueda expresar a través de alguna forma de lenguaje. Tiene los siguientes
componentes:
o Una elaboración conceptual.
o Un contenido informativo.
o Un registro en algún soporte físico.
o La expresión de los mismos en alguna forma de lenguaje numérico o no.
Dimensiones del dato
Variable ¿Qué?

Unidad de ¿Quién?
DATO análisis

Valor ¿Cómo?

Galtung; J. (1966): Teoría y Método de la Investigación Social., Eudeba, Buenos Aires (Tomo I. Cap. 1. Pág. 1)
Variables
«En otros términos, el significado completo de la palabra "variable", tal
como es usada en ciencias sociales, contiene no sólo la connotación de
"aspecto" o "dimensión" de un fenómeno, sino también la propiedad
de estos aspectos o dimensiones de asumir diferentes valores» (Korn,
1984)

También se puede significar como:


o Un concepto acerca de algún aspecto y/o magnitud de un elemento
o unidad de análisis capaz de asumir diferentes cualidades y/o
valores
o Atributo o cualidad que presentan los individuos o los hechos
sociales susceptible de ser observado y medido de alguna forma

FRANCIS KORN (1984): Conceptos y Variables en la Investigación Social, Nueva Visión. Buenos Aires. (Cap. 1).
Unidades de análisis
Son los elementos menores y no divisibles que componen el universo de estudio
de una investigación, sobre los cuales se estudia el comportamiento de las
variables.
Se establecen de manera previa a la etapa de recolección de datos, por ende, su
definición forma parte del marco teórico., esas se pueden clasificar en:
o Objetos o seres vivos (no humanos) existentes.
o Individuos como seres sociales.
o Determinados productos de la acción humana, tanto de tipo material como
inmaterial (por ejemplo, ideas, representaciones valorativas, normas),
o Colectivos sociales o grupos: a saber desde conglomerados pequeños y
efímeros hasta grandes colectividades organizadas con inclusión de las
sociedades globales. cuando las unidades son colectivos sociales, se distingue
entre unidades de análisis y unidades de observación

RENATE MAYNTZ; KURT HOLM Y PETER HUBNER (1988): Introducción a los métodos de la sociología empírica . Alianza Editorial. Madrid. (Cap. 1.
Pág. 16)
Valor
«Un Valor o categoría es una de las diferentes posiciones o alternativas que
presenta la variable y adopta alguna unidad de análisis y se puede expresar
cualitativamente a través de una clasificación por ausencia y presencia, por
jerarquía u orden o sino cuantitativamente, es decir, a través de magnitudes.»

También se puede significar como:


o Nivel lógico más bajo de la investigación, no requieren ser numéricos (en el
sentido de corresponder al conjunto de los números naturales, reales o
racionales).
o Los valores deben estar previamente definidos por las variables.
o Los valores deben ser coherentes con las unidades a las cuales se aplican y
conceptualmente los valores de una misma variable en dos unidades de
análisis distintas son diferentes.

FRANCIS KORN (1984): Conceptos y Variables en la Investigación Social, Nueva Visión. Buenos Aires. (Cap. 1).
Dato y la investigación
Conceptualización y
Variable operacionalización de las
variables en estudio

Unidad de
DATO análisis
Poblaciones de
estudio y muestreo

Técnicas de captación de
Valor datos y escala de medida
del dato

Galtung; J. (1966): Teoría y Método de la Investigación Social., Eudeba, Buenos Aires (Tomo I. Cap. 1. Pág. 1)
Matriz de datos
Es una estructura rectangular m x n donde en el orden de la columnas
de ubican las variables (v1, v2, …, vm), en el orden de las filas se ubican
las unidades de análisis (i1, i2,…, in) y en la intercepción columna y fila el
valor (xij); donde i= 1, 2,… n y j= 1, 2,…, m.
Matriz de datos
La MATRIZ DE DATOS es un modo de ordenar los datos de manera que sea
particularmente visible la estructura tripartita de los datos.
Los datos se arreglan de tal forma que las variables (v1, v2, …, vm), se ubican en las
columnas y las unidades de análisis (i1, i2,…, in) en las filas:
o Si se desea conocer todas las características de una unidad específica se recorre
toda la fila.
o Si se desea conocer como se distribuyen las unidades en las distintos valores de
una variable, se recorre la columna.
Las celdas están formadas por las intersecciones de las filas y las columnas y contienen
los valores (v) donde :
o Cada valor es la respuesta de la i-ésima unidad en la j-ésima variable.
o La falta de valor (de un valor de los predeterminados) en una celda es
denominado “sin datos” o “missing values”.
Finalidad de la matriz de datos
Es una forma de sistematizar la información recogida de la realidad para investigar un
problema y tratar de obtener conocimiento científico que intente explicar dicho
problema a través del método de investigación científica.
Investigar es: crear, llenar y analizar matrices de datos
o Crear: las define la elaboración conceptual que el investigador
construya sobre su objeto de estudio
o Llenar: mediante la implementación de las técnicas de
recolección de datos.
o Analizar: obtener un conocimiento que describa, explique y
prediga, probabilísticamente, el comportamiento de los
hechos tal como lo observamos y/o experimentamos en la
realidad.
Cualidades de la matriz de datos
Comparabillidad: cada combinación de Unidad de Análisis/Variable debe tener sentido, esto es,
debe ser verdadero o falso que dicha combinación brinde un determinado Valor. Por ejemplo, si
las unidades son personas y una variable es la tasa de analfabetismo, entonces cualquier
combinación no será ni verdadera ni falsa, simplemente no tiene sentido.
Principio de clasificación: el sistema de categorías de una variable debe cumplir con tres
requisitos lógicos:
1. Ser exhaustivo en el sentido que ninguna unidad quede fuera del sistema de categorías
2. Ser excluyente, de manera que cada unidad asuma un valor y sólo uno en cada variable.
3. Tener el mismo criterio clasificatorio (variable), es decir el sistema de categorías de una
variable debe responder a una sola idea.
Integridad: se refiere al trabajo empírico de llenar la matriz y dice simplemente esto: no dejar
ninguna celda vacía pues debe existir empíricamente un valor para cada x ij. Lo que antecede
significa que haya que “inventar” los datos para aquellos casos donde se obtiene “no
respuesta/no sabe/no contesta” pues el análisis de los patrones y estructuras de los datos
desconocidos (missing date) ofrece también importantes pistas para la investigación.

Galtung; J. (1966): Teoría y Método de la Investigación Social., Eudeba, Buenos Aires (Tomo I. Cap. 1. Pág. 1)
Puesta a punto de la matriz de
datos: Datos redundantes
Datos Redundantes.
Algunas veces en el proceso de medición se consideran más resultados
que los reglamentados oficialmente. Cuando los datos pueden
considerarse redundantes, generalmente se opta por:
o Si todos los datos tienen igual validez, seleccionar de forma
aleatoria los datos que integraran la data, o
o En caso contrario, los datos a escoger se hará sobre la base de
criterio de experto.
Puesta a punto de la matriz de
datos: Datos desconocidos
Admisibilidad máxima: 5% de datos desconocidos para cada variable
Principio de ignorabilidad fuerte: los valores desconocidos no deben
atribuirse a ningún problema sistemático en la generación del dato, se
manifiesta en la falta de datos en bloques y se debe a:
o Problemas de conceptualización.
o Deficiente fiabilidad dado por la interpretación de las preguntas del
cuestionario.
o Fallas en el levantamiento de los datos por errores de medición en
algún segmento de la población.
Principio de ignorabilidad débil: Se supone que la variable sea exhaustiva
y que cumpla con el principio de trata de clasificación de la matriz, lo
cual implica que las opciones residuales (“otros” o valores fuera de la
escala) no superen el 20% de las respuestas en las escalas ordinales, de
intervalo y razones.
Puesta a punto de la matriz de
datos: Datos desconocidos
Imputación de datos: Se puede emplear cuando:
La ausencia de información para una variable tiene una frecuencia importante
(mayor al 10%,).
No se presenta ningún patrón de regularidad para un conjunto específico de
unidades (se distribuyen aleatoriamente en la matriz de datos)
La imputación opera lógicamente:
Identificando un patrón de regularidad para las unidades que sí dieron
respuestas a esa variable «Principio de intrapolación de datos».
Identificado dicho patrón mediante un modelo estadístico, se le asigna el valor
a las unidades que carecen de información.
Se requiere un modelo estadísticamente satisfactorio, es decir con un “buen
ajuste” a los datos.
Puesta a punto de la matriz de
datos
Datos perdidos
Realizar un análisis de patrones de datos perdidos y sobre esos resultados proceder con la
solución más apropiada a partir de:
La teoría, es posible que en algunos estudios se puedan estimar datos a partir de un gran
conocimiento del fenómeno que ha sido sistematizado teóricamente.
La media, aquí se tendría que analizar la conveniencia de tomar la media de la variable, la
media del caso o la media de todos los datos. La desventaja de ese proceder es que casi
siempre se afecta la relación con otras variable o casos y puede cambiar, en algunas
ocasiones, los resultados.
Estimación a partir del diseño de experimento, a partir del modelo lineal que define cada
observación realizadas sobre un diseño de experimento, se construyen estimadores de
datos perdidos que consideran todos los factores en estudio.
Estimación a partir de la regresión, éste proceder tiene una creciente popularidad y no es
más que la predicción del dato perdido a partir de la relación funcional que enlazan las
variables en estudio. En este caso debemos tener en consideración que la relación
funcional sea representativa del fenómeno en estudio y que el dato a estimar esté en el
rango de las variables que sirvieron para establecer la relación funcional.
Puesta a punto de la matriz de
datos: Datos desconocidos
Razón sistemática teóricamente sustantiva: Se manifiesta en la ausencia de
información se concentra en muchas variables para un mismo conjunto de unidades,
se puede suponer que se debe a:
Se supone que las unidades que carecen de información en varias o en todas las
variables conforman una situación de “rechazo” del cuestionario, que puede ser
parcial o total.
El rechazo puede ser el resultado de un evento circunstancial que afectó a una sub-
población de encuestados.
Puede ser el resultado de un mal encuestador.
Puede ser el resultado de una encuesta que no consideró formulaciones específicas
para poblaciones particulares (por ejemplo, traducciones apropiadas).
Puede ser el resultado de una toma de postura política frente a la investigación en d e
curso.
ce
r
Cuando se trabaja integrando información secundaria producida para distintos o
p
países, puede ser el resultado de falta de análisis en algunos países debido a
condiciones estructurales (por ejemplo, el subdesarrollo).
N o
Puesta a punto de la matriz de
datos: Datos desconocidos
Cuando hay una razón sistemática teóricamente sustantiva se dice
que NO PROCEDE por:
Se supone que las unidades que carecen de información en varias o
en todas las variables conforman una situación de “rechazo” del
cuestionario, que puede ser parcial o total.
Conduce a un sesgo en todos los estadísticos calculados y en todas
las estimaciones poblaciones realizadas.
Se supone que las unidades comparten un mismo conjunto de
atributos., que puede ser directamente proporcionado por las
variables de control que se disponen en la misma matriz de datos.
Se debe detectar la causa del rechazo para corregir la técnica y los
procedimientos para su aplicación.
Puesta a punto de la matriz de
datos: Datos fuera de rango
Datos fuera de rango (Outliers).
Datos observados con valores muy altos o muy bajos si consideramos la variable
y/o la unidad de análisis al cual pertenecen, los que despiertan sospecha sobre
su objetividad.
Proceder:
Revisar las características del fenómeno en estudio y si ese dato es una
expresión propia de la realidad objetiva, en ese caso se admite.
En caso contrario, se puede optar por:
o Eliminar el dato y pasaría a ser dato desconocido y se obraría según lo
antes visto.
o Se estima puntualmente el dato según criterios teóricos, tendencia central,
regresiones y/o diseño de experimento.
Deberes
CONSTRUCCIÓN DE LA MATRIZ DE
DATOS
• Construir la matriz de datos de su
investigación e implementarla en el
SPSS
• Valorar sus cualidades
ELABORA ENSAYO
• Elaborar un ensayo sobre el
documento: “Lineamientos
generales para elaborar un diseño
estadístico aplicable a una
investigación cuantitativa en
Ciencias Sociales” (http://
ocw.uned.ac.cr/eduCommons/direc
cion-de-extension-universitaria/pro
grama-de-desarrollo-gerencial/tuto
rias/anexo-1
)

También podría gustarte