Está en la página 1de 50

Tema:

PROCESAMIENTO Y ANÁLISIS DE LA
INFORMACIÓN
Asignatura:
TESIS I
Docente:

LILIANA LAM FLORES

www.usanpedro.edu.pe
Maestría https://platinium.usanpedro.edu.pe
en Administración de Empresas y Negocios
¿Los datos recogidos por sí solos
aportan resultado a la
investigación?

¿Es necesario procesarlos e


interpretarlos?
PROCESAMIENTO DE LA INFORMACIÓN

Reducir la información es la fase


preparatoria para poder categorizar y
analizar la información

• Asignar un número a cada respuesta. Un atributo corresponde a


un valor específico en una variable, por ejemplo:
• Pregunta: ¿Usted estudia? SI NO
• Podemos asignar un número “1” si responde “SI” y un número
Codificación “2” si responde “NO”

• Documento que describe la localización de las variables y los


códigos asignados a los atributos que las componen, su función
es guiar el proceso de codificación e interpretar los datos
durante el análisis.
Libro de códigos • El libro de códigos puede ser representado en una tabla
diseñada por el propio investigador.
ANÁLISIS DE LA INFOMACIÓN

 Después que se obtuvo y se organizó la


información, se requiere analizar su utilidad para
los objetivos de la investigación
 La tarea del investigador se simplifica cuando se
analiza la información, si es que se encuentra
correctamente estructurada y organizada.

 El objetivo primordial de la encuesta es obtener


información cuantificable; al concluir la codificación de
las respuestas, conviene representarlas de manera
gráfica, para facilitar su análisis.
 El procesamiento de datos recopilados mediante
encuestas es más laborioso, ya que es necesario acudir a
la estadística; en este sentido, los datos pueden ser
analizados a partir de dos enfoques:
Cuantitativo Cualitativo
• En este caso, el análisis • Aquí el objetivo es
se centra en los números describir y evaluar las
arrojados para cada respuestas
respuesta, esto cuando generalizadas, con el
se ha realizado la objetivo de explicarlas,
codificación comprobar la hipótesis y
obtener conclusiones.

• Por lo general, las investigaciones requieren


ambos enfoques de análisis.
• El procesamiento de datos implica el
análisis de cada información recabada
¿Qué procedimiento se sigue para analizar
cuantitativamente los datos?

Una vez que los datos se han codificado,


transferido a una matriz, guardado en
un archivo y “limpiado” de errores, el
investigador procede a analizarlos.

En la actualidad, el análisis cuantitativo


de los datos se lleva a cabo por
computadora u ordenador.
Seleccionar un
Una vez que estamos seguros que
programa de análisis no hay errores en la matriz,
procedemos a realizar el análisis
estadístico.

SPSS® o PASW Statistics

Minitab

SAS (Sistema de Análisis Estadístico)


Statistical Package for the Social
Sciences SPSS® o PASW Statistics

SPSS/PASW contiene las dos


partes citadas que se denominan:
• Vista de variables (para
definiciones de las variables y
consecuentemente, de los
datos)
• Vista de los datos (matriz de
datos)
También, en la página de SPSS se
puede “bajar” o “descargar” a la
computadora una demostración
del programa por un tiempo
limitado.
Minitab

• Incluye un considerable
número de pruebas
estadísticas, y cuenta con un
tutorial para aprender a
utilizarlo y practicar; además,
es muy sencillo de manejar
• Para comenzar a utilizar
Minitab, se abre una sesión (la
cual es definida con nombre y
fecha), y se abre una matriz u
hoja de trabajo (worksheet) (en
la parte superior de la pantalla
aparece la sesión y en la parte
inferior se presenta la matriz)
SAS (Sistema de Análisis
Estadístico)

• Es un paquete muy completo para


computadoras personales que
contiene una variedad
considerable de pruebas
estadísticas.
• En el CD se incluye un programa
(software) sencillo que se titula
STATS, con los análisis bivariados
más elementales para comenzar a
practicar y comprender las
pruebas básicas.
ESCALAS DE MEDICIÓN

Para realizar un correcto análisis de los datos es fundamental conocer de


antemano el tipo de medida de la variable, ya que para cada una de ellas
se utiliza diferentes estadísticos.
La clasificación más convencional de las escalas de medida las divide en
cuatro grupos denominados Nominal, Ordinal, Intervalo y Razón
ESCALAS DE MEDICIÓN
En función de la escala elegida decidiremos su codificación, tratamiento informático y estadístico .
NOMINAL

• Si los datos son etiquetas o


categorías que se usan para
definir un atributo de un
elemento .
• Pudiendo ser numérico y no
numéricos
ESCALAS DE MEDICIÓN

ORDINAL

• Si los datos pueden utilizarse


para jerarquizar u ordenar las
observaciones.
• Informan sobre un monto o
posición (mayor que, antes que)
PERO NO INFORMAN LA
DISTANCIA ENTRE DICHOS
MONTOS O POSICIÓN
• Los datos pueden ser numéricos
o no numéricos
• Los números se asignan a los objetos para indicar la
extensión relativa de una característica que posee.
• Por esta escala es posible determinar cuándo un objeto tiene más o
menos característica que otro pero no te dice cuánto más con
exactitud.
• Los números siempre se presentan de menor a mayor

Cuántas veces a la semana toma usted refresco de sabor?

• Menos de tres veces a la semana


• De tres a cinco veces
• Seis o siete veces
• Más de siete veces
Nominal Ordinal
INTERVALO

• Los datos tienen que ser valores numéricos


• Son variables NUMÉRICAS cuyos valores
representan MAGNITUDES y la DISTANCIA
entre los números de su escala

Con este tipo de variables podemos realizar :


• COMPARACIONES DE
IGUALDAD/DESIGUALDAD,
• Establecer un orden dentro de sus valores y
• Medir la distancia existente entre cada valor de
la escala

Las variables de intervalo CARECEN DE UN CERO


ABSOLUTO, es decir, el cero representa una característica
de la categoría. No indica ausencia de la variable. Por lo
que operaciones como la multiplicación y la división no son
realizables
Veamos un ejemplo: la diferencia de temperatura entre
una habitación a 22 grados centígrados y otra a 26 es la
misma que la existente entre dos a 33 y 37 grados
centígrados, respectivamente.

22 26 33 37

Sin embargo, la razón entre los números de la


escala no es necesariamente la misma que la
existente entre las cantidades del atributo.
Ejemplo: una habitación a 20 grados no está el
doble caliente que otra a 10. Ello se debe a que el
cero de la escala no expresa el valor nulo o
ausencia de atributo.
ESCALAS DE MEDICIÓN

RAZÓN

• El Cero representa la ausencia


de la característica
• Se ordena de acuerdo con la
cantidad que la característica
posee
• Los datos tienen que ser
NUMÉRICOS
Las variables de razón poseen las mismas características de las
variables de intervalo, con la diferencia que cuentan con un cero
absoluto; es decir, el valor cero (0) representa la ausencia total de
medida, por lo que se puede realizar cualquier
operación Aritmética (Suma, Resta, Multiplicación y División)
y Lógica (Comparación y ordenamiento).

Este tipo de variables permiten el nivel más alto de medición. Las


variables altura, peso, distancia o el salario, son algunos ejemplos de
este tipo de escala de medida.
ANÁLISIS DESCRIPTIVOS DE
ACUERDO AL NIVEL DE MEDIDA

No todos los Cada uno de los tipos


procedimientos de medida posee
estadísticos son ciertas características,
realmente útiles las cuales debemos
para la totalidad de tener en cuenta en el
los niveles de momento de realizar
medida un análisis descriptivo

CATEGÓRICAS

ESCALA
(Intervalo-razón)
Tipo de pregunta de investigación
(descriptiva, de diferencia de grupos,
correlacional o causal)

Para elegir un Número de variables involucradas


método estadístico,
se considera: Nivel de medición de las variables o tipo
de datos

Comparación de grupos, si son muestras


independientes o correlacionadas

Tipos de análisis estadísticos

Análisis paramétricos

Análisis no paramétricos
EL ANÁLISIS
se realiza tomando en cuenta los niveles de medición de las variables
y mediante la estadística, que puede ser

INFERENCIAL
DESCRIPTIVA

Su concepto
básico 1. ESTIMAR PARÁMETROS

DISTRIBUCIÓN DE
FRECUENCIA

2.. PROBAR HIPÓTESIS


Esta distribución puede realizarse con las
variables medidas desde el nivel
NOMINAL HASTA EL DE RAZÓN
La estadística descriptiva utiliza

DIVERSAS MEDIDAS para realizar


la descripción de un fenómeno

ESTADÍGRAFOS PARAMÉTROS
Cuando se Cuando se
trabaja trabaja

Poblaciones
Muestras
completas
Estas medidas se pueden presentar en
DISTRIBUCIONES
Unidimensionales,
Bidimensionales o
pluridimensionales
La diferencia radica en que el parámetro se calcula
con todos los datos de la población, mientras que
el estadígrafo usa los datos de una muestra para
estimar lo real.
DISTRIBUCIÓN DE LOS DATOS (POBLACIÓN)

ANALISIS
ANALISIS NO
PARAMÉTRICO
PARAMÉTRICO

son útiles cuando no se cumple el La distribución de la variable


supuesto de normalidad y el tamaño dependiente es normal : el universo
de la muestra es pequeño. tiene una distribución normal

Las variables son generalmente discretas y Cuando 2 o + poblaciones son


categóricas; se utiliza para evaluar hipótesis estudiadas estas tienen una varianza
de asociación entre dos variables, para su homogénea; es decir las poblaciones
cálculo se utilizan tablas de contingencia. en cuestión tienen una dispersión
similar en sus distribuciones

Chi cuadrada • Coef. Correlac. Pearson y regresión


lineal
• Prueba t student
1.Posición 3.Asimetría

ESTADÍGRAFOS

2. Dispersión 4.Curtosis
1.ESTADÍGRAFOS media aritmética
DE POSICIÓN
mediana

En un conjunto de datos, las medidas


de posición indican el lugar o posición
Moda o modo
relativa de un valor de la variable, a la
cual tienden la mayoría de datos
Cuartiles
Se acostumbran llamar de TENDENCIA
CENTRAL porque en un buen número de las
distribuciones de datos se concentran sus
Decíles
valores en el centro, pero no es lo general, ellas
pueden colocarse en cualquier punto del
dominio de la variable. Percentiles
Cálculo de la mediana en datos no
La mediana agrupados:

Número impar de observaciones.


EJEMPLO: En un listado ordenado de
En un conjunto ordenado de pulsaciones por minuto de 15 estudiantes: 62
datos (de mayor a menor o 64 65 66 68 70 71 71 72 72 80 80 80 80 83
viceversa) es el valor que divide La mediana corresponde al valor 71 que ocupa
el conjunto de valores en 2
el puesto N. 8; es decir divide en 2 la
partes iguales.
No es afectada tan
distribución.
drásticamente por los valores Número par de observaciones: la mediana es
extremos. igual al promedio aritmético de los dos valores
centrales de la distribución, es decir la suma
de los dos valores dividido por dos.
Ejemplo: En un listado ordenado de
pulsaciones por minuto de 14 estudiantes 62
64 65 66 68 70 71 72 72 80 80 80 80 83
La mediana corresponde a= 71 + 72 /2 = 71.5
Cálculo de la mediana en datos no
La moda agrupados:

Número impar de observaciones.


Es el valor de la variable que se EJEMPLO: En un listado ordenado de
presenta con mayor frecuencia pulsaciones por minuto de 15 estudiantes: 62
Util en variables cualitativas 64 65 66 68 70 71 71 72 72 80 80 80 80 83
La mediana corresponde al valor 71 que ocupa
el puesto N. 8; es decir divide en 2 la
VENTAJA
Se puede considerar la mejor medida
distribución.
de tendencia central ya que indica el Número par de observaciones: la mediana es
punto de mayor concentración de igual al promedio aritmético de los dos valores
datos. En una distribución asimétrica,
la Moda es la medida más centrales de la distribución, es decir la suma
representativa del grupo y si son muy de los dos valores dividido por dos.
diferentes la media aritmética y la
Moda es preferible utilizar esta Ejemplo: En un listado ordenado de
última. pulsaciones por minuto de 14 estudiantes 62
En series polimodales (varias
64 65 66 68 70 71 72 72 80 80 80 80 83
modas), la moda permite dividir la La mediana corresponde a= 71 + 72 /2 = 71.5
distribución con fines de
estratificación.
Media
Aritmética
Es un único valor de la variable
que se obtiene de sumar todos
los valores de la serie y dividir por
el total de ellos. Es el estadígrafo
de posición más conocido.

VENTAJAS
• la media aritmética es muy
estable en el muestreo.
• es altamente sensible a
cualquier cambio en la
distribución
2.ESTADÍGRAFOS DE DISPERSIÓN O
VARIABILIDAD

describen como se agrupan o Además SIRVEN PARA EL CÁLCULO DEL


dispersan los datos alrededor de TAMAÑO DE MUESTRA, a menor
un promedio. variabilidad menos tamaño de muestra
requerido

Los estadígrafos de
Permiten conocer si el promedio representa dispersión o variabilidad
adecuadamente la distribución considerada, tienen sentido sólo
cuando menor sea la dispersión más acompañando las
representativos será el promedio, la mediana o medidas de posición o
la moda de tendencia central

Miden el grado de homogeneidad de los datos; Varianza


cuando los datos son iguales las medidas de Rango
dispersión son iguales a cero; cuando existe
mucha heterogeneidad las medidas de Desviación coeficiente de
dispersión serán grandes. Estándar variación
relativa.
¿Con qué porcentaje de confianza el investigador
generaliza, para suponer que tal cercanía es real y no
por un error de muestreo?

Existen dos niveles convenidos

a) El nivel de significancia b) El nivel de significancia


de 0.05, el cual implica que de 0.01, el cual implica que
el investigador tiene 95% de el investigador tiene 99%
seguridad para generalizar en su favor y 1% en contra
sin equivocarse y sólo 5% (0.99 y 0.01 = 1.00) para
en contra. En términos de generalizar sin temor.
probabilidad, 0.95 y 0.05,
respectivamente; ambos
suman la unidad.
¿Cuáles son las pruebas estadísticas paramétricas
más utilizadas?

Coeficiente de correlación de Pearson y regresión lineal:

Definición: Es una prueba estadística para


analizar la relación entre dos variables medidas
en un nivel por intervalos o de razón.

Hipótesis a probar: correlacional, del tipo de


“a mayor X, mayor Y ”, “a mayor X, menor Y
”, “altos valores en X están asociados con altos
valores en Y ”, “altos valores en X se asocian
con bajos valores de Y

Variables: dos. La prueba en sí no considera


a una como independiente y a otra como
dependiente, ya que no evalúa la causalidad
Regresión lineal:

Definición: Modelo Procedimiento e


Hipótesis:
estadístico para estimar el correlacionales y
interpretación: la
efecto de una variable causales. regresión lineal se
sobre otra. Está asociado determina con base en
con el coeficiente r de Variables: dos. Una se el diagrama de
Pearson. Brinda la considera como dispersión. Éste consiste
oportunidad de predecir independiente y otra en una gráfica donde se
las puntuaciones de una como dependiente. Pero, relacionan las
variable tomando las para poder hacerlo, debe
tenerse un sólido sustento puntuaciones de una
puntuaciones de la otra muestra en dos
variable. teórico.
variables.
Prueba T

Variables: la
comparación se
Definición: Es realiza sobre una
Hipótesis: de
una prueba variable
diferencia entre dos
estadística para (regularmente y de
grupos. La hipótesis
manera teórica:
evaluar si dos de investigación
dependiente). Si hay
grupos difieren propone que los
diferentes variables,
entre sí de manera grupos difieren de
se efectuarán varias
significativa manera significativa
pruebas t (una por
entre sí y la
respecto a sus hipótesis nula
cada par de
medias en una variables), y la
plantea que los
variable razón que motiva la
grupos no difieren
creación de los
Se simboliza: t significativamente
grupos puede ser
una variable
independiente.
Prueba de contraste de la diferencia de proporciones

Definición: Es una prueba


estadística para analizar si dos Nivel de medición de la variable de
proporciones o porcentajes difieren comparación: cualquier nivel,
significativamente entre sí. incluso por intervalos o razón, pero
siempre expresados en proporciones
o porcentajes.

Hipótesis: de diferencia de
proporciones en dos grupos

Se colocan el número de casos y el


porcentaje obtenido para cada grupo
Variable: la comparación se realiza y se calcula. No se necesita de
sobre una variable. Si hay varias, se fórmulas y tablas
efectuará una prueba de diferencia
de proporciones por variable
Análisis de varianza unidireccional (ANOVA en un
sentido o oneway)

Definición: Prueba estadística Hipótesis: de diferencia entre más


para analizar si más de dos grupos de dos grupos. La hipótesis de
difieren significativamente entre sí; investigación propone que los
se usa para tres, cuatro o más grupos difieren significativamente
grupos. Aunque con dos grupos se entre sí y la hipótesis nula propone
puede utilizar también. que los grupos no difieren
significativamente.

Variables: una variable


independiente y una variable Nivel de medición de las
dependiente variables: La variable
independiente es categórica y la
dependiente es por intervalos o
razón.
Otros métodos estadísticos
¿Cuáles son las pruebas estadísticas no
paramétricas más utilizadas?

La chi cuadrada o X2

Es una prueba estadística para


evaluar hipótesis acerca de la relación
entre dos variables categóricas.
Procedimiento: Se calcula por
medio de una tabla de
contingencia o tabulación
Hipótesis por probar: cruzada, que es un cuadro de dos
correlacionales dimensiones y cada dimensión
contiene una variable. A su vez,
cada variable se subdivide en dos
o más categorías.
Nivel de medición de las variables:
nominal u ordinal (o intervalos o
razón reducidos a ordinales).

También podría gustarte