Está en la página 1de 114

Ps. Mg.

Víctor Cabrera Vistoso

El diseño de la
investigación



Con las hipótesis definidas se concibe la manera práctica
de responder a las preguntas. Se hace el diseño, (plan o
estrategia) de la investigación. Hay investigación
experimental y no experimental.
El experimento requiere la manipulación de una acción
para analizar sus posibles efectos.
La variable independiente se manipula, la dependiente se
mide para ver si varía o no.
Si se expone a un grupo a la presencia de la variable
independiente y al otro no, el primero se llama grupo
experimental y el segundo grupo de control.

Diseño
Experimental

Un experimento aplica un estímulo a un individuo o
grupo de individuos y ve el efecto de ese estímulo en
alguna(s) variable(s) del comportamiento de estos. La
observación se puede realizar en condiciones de mayor
o menor control.

Se deduce que un estímulo afectó cuando observamos
diferencias en las variables que serían supuestamente
las afectadas entre un grupo al que se le administró
dicho estímulo y uno al que no se le administró, siendo
ambos iguales en todo excepto en esto último.

La asignación al azar es el método preferible para lograr
que los grupos del experimento sean comparables.

Lograr la validez interna (mantener equivalentes a los grupos controlando la fuente de invalidez)es el objetivo metodológico y principal de todo experimento. Una vez que se consigue se busca la validez externa o sea la posibilidad de generalizar los resultados a la población no experimental.    Validez Interna y Externa  Los grupos que se comparen deben ser iguales en todo menos en el estímulo experimental. Se debe controlar la influencia de otras variables extrañas en las variables dependientes. (Purificación de la relación X--Y) La validez interna refiere a la confianza que tenemos sobre los resultados. Elimina explicaciones rivales. .

Inestabilidad:poca o nula confiabilidad en la mediciones.Fuentes de Invalidez   Fuentes que invalidan internamente el experimento:  Historia: eventos que ocurren durante el experimento y afectan la variable dependiente.     . Maduración: procesos internos de los participantes por el paso del tiempo que afectan resultados (Cansancio). Instrumentación o cambios en los instrumentos de medición o en los observadores participantes. Inestabilidad: Administración de pruebas que afectan las puntuaciones de pruebas subsecuentes.

     Fuentes de Invalidez  La regresión estadística o valores extremos en una prueba que tienden al promedio en otras mediciones. La selección que al elegir sujetos genera grupos no equiparables. Otras Interacciones entre las fuentes de invalidación. . La mortalidad experimental al perder participantes entre los grupos que se comparan. Interacción entre selección y maduración. maduración que hace que la selección de origen a diferentes tasas de maduración.

 Con un solo grupo no hay certeza que resultados se deban al estímulo experimental o a otras razones. entrevistadores. La técnica de emparejamiento no es la ideal.etc). etc).  Los grupos debe ser equivalentes durante todo el experimento (instrucciones. edad. .  Los grupos (no los individuos) deben ser inicialmente equivalentes (sexo.El Control y la Validez   El control y la validez interna se logra con: 1) Varios grupos de comparación. La equivalencia inicial se logra asignando sujetos al azar. (2 mínimo) y 2) Equivalencia de los grupos en todo excepto la manipulación de las variables independientes.Los instrumentos de medición deben ser iguales y aplicados de la misma manera.

estímulo. condición experimental O = Una medición a los sujetos de un grupo .= Ausencia de estímulo RG1 Asignación Azar sujetos Grupo 1  O Medición Previa X O Administración Estímulo Medición Posterior .     Simbología en el Diseño  R = asignación al azar G = grupos de sujetos X = Tratamiento.

Pre Experimento        El pre-experimento tiene un grado de control mínimo. Si se hace una pre-prueba se agrega un punto de referencia = G O1 X O2 No son adecuados para establecer relaciones entre variables y puede ser para prueba piloto (explorar).  . No controla las fuentes de invalidez interna. no se explica como se afecta) No hay control previo del nivel de la variable dependiente ni grupo de comparación. Aplica tratamiento y luego una medición para observar el nivel del grupo en la variable = G X O No hay manipulación de la variable independiente (no hay niveles de ella.

Suele usarse la prueba estadística “t” para grupos correlacionados. Si no hay grupo de control se llama diseño con grupos aleatorizados y post prueba unicamente= RG1 X O1 Diseño con pre-prueba-post prueba y grupo de control RG1 O1 X1 O2 RG2 O3 X2 O4 RG3 O5 O6  En este caso O1. X1 un video didactico . X2 lecura de folleto y O2 04 y 06 el conocimiento sobre el mismo tema anterior.Otros Diseños    Diseño con post prueba y grupo de control RG1 X O1 RG2 O2 Si O1=O2 no hubo efecto significativo del tratamiento experimental. O3 y O5 puede ser el conocimiento sobre un tema. .

o que sólo uno o ninguno tenga efectos etc. O1 vs 02 d) el puntaje ganancia de los grupos entre sí. c) el puntaje ganancia de cada grupo ej. . b) post-pruebas entre sí.Las Comparaciones    RG1 O1 X1 O2 RG2 O3 X2 O4 RG3 O5 O6 Las posibles comparaciones son: a) Pre-pruebas entre sí. Esto puede dar por ejemplo efectos de los tratamientos experimentales pero diferentes.

 Igual para analizar el puntaje ganancia de cada grupo O1 vs O2 y O3 vsO4 Análisis de varianza (ANOVA) para grupos relacionados si se comparan simultáneamente las cuatro pruebas.Pruebas Estadísticas   Para comparar entre pre-pruebas y entre las dos post pruebas se usa la prueba “t” para grupos correlacionados. Cuando se quiere analizar efectos en el largo plazo se adoptan diseños con varias post pruebas. (Diseños de series de tiempo o cronológicas que toman de un individuo u otro ente muchas observaciones)   .

Los diseños factoriales manipulan dos o más variables independientes e incluyen dos o más niveles de presencia en cada una de las variables independientes. independientes Un ejemplo de diseño factorial de 2 X 2 sería método de enseñanza (tradicional oral y por video) y sexo (masculinofemenino).    Estudios Factoriales  Los experimentos pueden incorporar más de una sola variable independiente. Permiten evaluar los efectos de cada variable independiente sobre la dependiente por separado y los efectos de las variables independientes conjuntamente. .

Hay fuentes de invalidez: El efecto de interacción entre pruebas (sujetos son afectados en su reacción a la variable experimental por la pre prueba). La artificialidad de las condiciones experimentales que vuelven atípica la experiencia.Validez Externa        La validez externa refiere a que tan generalizables son los resultados a otros sujetos. Imposibilidad de replicar los experimentos en otras condiciones. Errores de selección que al elegir personas con ciertas características el tratamiento produzca un efecto que no se daría en otras personas sin esas características. . La interferencia de tratamientos múltiples si no tienen efectos reversibles.

La diferencia es el grado en que el ambiente es natural para los sujetos.Estudio de Campo     En el experimento el efecto (la variancia) de las variables independientes influyentes posibles no pertinentes al problema se mantiene reducida en un mínimo. El estudio de campo se hace en una situación realista en la que una o más variables independientes son manipuladas por el experimentador en condiciones tan controladas como lo permite la situación. Los experimentos tienen más control que los estudios de campo pero estos tienen más validez externa. .

habitantes de una zona de la ciudad) = G X O (falta la R junto a la G de la asignación aleatoria de sujetos) Alcanzan validez interna en la medida en que demuestran la equivalencia inicial de los grupos participantes y la equivalencia en el proceso de experimentación. los pre-experimentos son exploratorios y descriptivos y los cuasi-experimentos son correlacionales aunque pueden llegar a ser explicativos. Los experimentos verdaderos constituyen estudios explicativos. .   CuasiExperimentos  En los cuasi experimentos no se asignan los sujetos a grupos experimentales sino que se trabaja con grupos intactos (formados aparte del experimento ej.

G1 X O1 G2 O2 Se evalúa la obediencia o apego al tratamiento. Se toman dos grupos de pacientes. Si el resultado es O1>O2 deducimos que la hipótesis fue confirmada. . No hay certeza si grupos no son inicialmente equivalentes.EJEMPLO      Hipótesis: “Los pacientes que reciban mayor retroalimentación de sus médicos de cómo se están comportando en el tratamiento prescrito. obedecerán más a dicho tratamiento”. Un grupo recibe retroalimentación sobre su conducta en el tratamiento (G1) y el otro grupo no (G2). Pero podría ser que la mayor sensibilidad de G1 se deba a que lee más sobre su problema.

Aplicar pre-pruebas. Reclutar sujetos del experimento (o cuasi-experimento) Seleccionar diseño apropiado para muestras. Seleccionar la muestra de personas. Elegir niveles de manipulación de var. los tratamientos y las post-pruebas. dividirlos al azar o analizar propiedades de grupos intactos. objetivos y preguntas de investigación. . independientes y convertir concepto en operaciones prácticas (tratamiento experimental) Desarrollar instrumento para medir las variables dependientes. hipótesis. Planear actividad de los sujetos.Pasos Comunes a Seguir          Decidir las variables independientes y dependientes.

No hay estímulos a los cuales se expongan los sujetos del estudio. No experimental: Ver las reacciones de esa persona cuando llega enojada.     Investigación no Experimental  Se realiza sin manipular variables y sin asignación al azar. Los sujetos ya pertenecían a un grupo dado. No se construye ninguna situación sino que se observan situaciones existentes no provocadas intencionalmente Es investigación sistemática y empírica en la que las variables independientes no se manipulan porque ya han sucedido. . Se observan fenómenos tal y como se dan en su contexto natural para después analizarlos. Experimento: Hacer enojar intencionalmente a una persona para ver sus reacciones.

Investigar el número de empleados. (relación entre urbanización y analfabetismo para ver que variables mediatizan esa relación. Se dividen en descriptivos y correlacionales/causales. Nivel de empleo en 3 ciudades) Los correlacionales/causales describen relaciones entre dos o más variables ej.) . Ej. Los descriptivos indagan los valores de una o más variables (Ej.     Diseños Transeccionales  Los Diseños no experimentales se clasifican en transeccionales (ver el nivel de una variable o la relación entre varias en un punto del tiempo) y longitudinales (como evolucionan o cambian variables o sus relaciones) Los transeccionales o transversales recolectan datos en un sólo momento. desempleados y subempleados en un momento dado.

. Actitudes hacia el aborto en Argentinos nacidos en 1983. Los de grupos analizan cambios en sub-poblaciones. correlacionales y causales.Diseños Longitudinales        Los diseños longitudinales juntan datos a través del tiempo en períodos especificados. Los de panel similares a los anteriores pero el mismo grupo de sujeto es medido en todos los momentos. de evolución de grupo (cohort) y diseños panel. Ej. Ej. cambio de actitud hacia el aborto anualmente por 10 años. Por ej. como evolucionan los niveles de empleo durante cinco años en una ciudad. infieren sobre al cambio. Hipótesis son de diferencia de grupos. sus determinantes y consecuencias. Los de tendencia analizan cambios en el tiempo en variables o sus relaciones en una población. Son:de tendencia. analizar la evolución de enfermos de cancer de mama cada 6 meses en 2 años. Ej.

Las variables independientes son realistas y genera más validez externa .Experimental Vs No experimental      Mayor control Manipula variables Se replican facilmente Las variables independientes son menos realistas     Menor control No manipula variables Observan lo dado.

Resumen Diseño No Experimental


La investigación no experimental no manipula
variables, se basa en realidades que ya ocurrieron sin
intervención del investigador.
Es un enfoque retrospectivo. Observa variables en su
contexto natural.
Estudia variables en un momento del tiempo en forma
descriptiva o correlacional/causal o las estudia a lo
largo del tiempo en tendencias y evolución dentro de
grupos.
El tipo de diseño a elegir está condicionado por el
problema, el contexto, el tipo de estudio y las
hipótesis.

RESUMEN SEGUNDA PARTE

La investigación puede ser experimental o no
experimental. En el primer caso se manipula la variable
independiente y se mide la dependiente controlando
las fuentes de invalidez. La validez interna refiere a la
confianza en los resultados y la externa a su posible
generalización. Cuando la manipulación es de varias
variables independientes de varios niveles cada uno el
estudio es factorial. El pre-experimento no manipula la
variable independiente. El cuasi-experimento utiliza
grupos intactos. El diseño no experimental observa
escenarios existentes no provocados intencionalmente.
Pueden ser transeccionales que a su vez se dividen en
descriptivos y correlacionales/causales o longitudinales
de tendencia, de evolución de grupo y diseño panel.




Selección de la
Muestra

La muestra es un sub-grupo de la población.
Hay que definir la unidad de ánálisis o quienes van a ser
medidos (personas, organizaciones, periódicos etc.)
Luego se definen las características de la población o
parámetros muestrales en contenido, lugar y tiempo (ej
enfermos de cáncer de la ciudad X sin tratamiento).
Hay muestras probabilísticas y no probabilísticas.
En la probabilística todos los elementos de la población
tienen la misma posibilidad de ser elegidos. En la
segunda, la elección de elementos depende del
investigador .
Que tipo de muestra se elige depende de los objetivos
del estudio, del esquema de investigación y de la
contribución que se piensa hacer.

Los valores muestrales serán parecidos a los de la población La precisión de dichos estimados depende del error en el muestreo.     Muestra Probabilística  En la muestra probabilística puede medirse el tamaño del error en la predicción. . Es esencial en diseños por encuestas que buscan estimaciones de variables medidas con instrumentos de medición y analizados con pruebas estadísticas. El principal objetivo de una muestra probabilística es reducir al mínimo este error llamado error estándar que dependerá del número de elementos muestreados.

2) Se ajusta la muestra provisional (n”) si se conoce el tamaño de la población (N) de forma tal que n = n”/ 1+n”/N Luego se decide como y de donde seleccionar los sujetos de la muestra del tamaño n .   Tamaño de la Muestra  Se establece el error estándar (ej. La varianza de la población es el cuadrado del error estándar y la varianza de la muestra S = p (1-p).05 o 0.0. El tamaño de la muestra se determina en dos pasos : 1) Se saca el tamaño provisional de la muestra dividiendo la varianza de la muestra/varianza de la población.01) o sea se sugiere que de 100 casos 95 o 99 veces el estimado sea correcto y que su valor se sitúe en un intervalo de confianza que comprenda el valor del parámetro poblacional.

Aumenta precisión en la muestra pues se usan diferentes tamaños de muestra para cada estrato a fin de reducir la varianza de cada unidad de la media muestral. Unidad de análisis indica quienes serán medidos. niños en colegios).Muestra Estratificada y Por Racimo      La muestra es estratificada si se la divide en estratos o categorías en que se divide la población y que son relevantes para los objetivos del estudio.La unidad muestral el racimo por el cual se llega a la unidad de análisis  . El muestreo por racimos se hace cuando las unidades de análisis se encuentran encerradas en determinados lugares físicos o geográficos (ej. Se divide a la población en sub poblaciones (estratos) y se selecciona una muestra para cada estrato.

sea existentes o construidos ad hoc. mapas) . tabla de números random o elección sistemática) para asegurar que cada elemento tenga la misma probabilidad de ser elegido. Todo procedimiento de selección depende de listados. Listados pueden ser la guía telefónica. Cuando no hay listas se usan otros marcos con descripciones del material (archivos.Selección Aleatoria Muestra Probabilística      Los elementos de una muestra probabilística siempre se eligen aleatoriamente (ej. lista de escuelas oficiales etc.

Muestras no Probabilísticas (dirigidas)      Las muestras no probabilísticas (dirigidas) dependen del criterio del investigador para la elección de los sujetos u objetos de estudio. Los elementos no tienen la misma posibilidad de ser elegidos. No se puede calcular con precisión el error estándar (nivel de confianza con que se hace una estimación). Selecciona casos típicos con la esperanza que sean representativos (para muestra basta un botón). 3) muestras de sujetos tipo o estudios de casos (estudios cualitativos y motivacionales) y 4) muestreo por cuotas (estudios de opinión y mercadotecnia). Las muestras dirigidas son válidas en cuanto a que un determinado diseño de investigación así lo requiere. Es informal y un poco arbitraria.  . pero los resultados no son generalizables a una población sino apenas a la muestra en sí o muestras similares. Pueden ser 1) muestras con sujetos voluntarios 2) muestras de expertos (estudios exploratorios).

 Normalidad y Probabilidad  límite sugiere que El teorema central del una muestra de más de cien casos. .  Distinguir normalidad de probabilidad.  La normalidad es necesaria para efectuar pruebas estadísticas (inferenciales).  Lo segundo es requisito indispensable para hacer inferencias correctas sobre una población. será una muestra con una distribución normal en sus características.

Hay que seleccionar primero un instrumento de medición o desarrollar uno válido y confiable. Preparar las mediciones obtenidas o sea codificar los datos.    Recolección de Datos  Seleccionado el diseño apropiado y la muestra adecuada al problema e hipótesis el próximo paso es recolectar los datos sobre las variables seleccionadas. Aplicar el instrumento en la medición. .

Por eso es mejor definir medición como la vinculación de conceptos abstractos con indicadores empíricos. consecuencia o producto) de acuerdo con reglas.Medición de Conceptos Abstractos      Medir significa asignar números a objetos (cosas que pueden verse o tocarse) y eventos (resultado. PBI. Esto se hace con un plan organizado para clasificar y cuantificar los datos disponibles (indicadores) en términos del concepto que el investigador tiene en mente . credibilidad). disonancia cognitiva. En ciencias sociales varios de los fenómenos que son medidos no pueden caracterizarse como objetos o eventos porque son muy abstractos para ello (ej. alienación.

motivación) pero hay que acercarse lo más posible a la representación fiel de las variables a observar. Es imposible representar fielmente ciertas variables (ej. Los registros del instrumento de medición representan valores observables de conceptos abstractos. . No hay medición perfecta.Valores Observables de Conceptos Abstractos       El centro de atención es la respuesta observable. El interés se sitúa en el concepto subyacente no observable que es representado por la respuesta. Un instrumento adecuado es el que registra los datos observables que representan bien los conceptos o variables que el investigador tiene en mente.

Confiabilidad y Validez del Instrumento      La confiabilidad del instrumento significa que su aplicación repetida al mismo sujeto u objeto produce iguales resultados. La validez refiere al grado en que un instrumento realmente mide la variable que se pretende medir (ej. con el criterio y con el constructo. La validez refiere a evidencia relacionada con el contenido. si se quiere medir inteligencia que mida inteligencia y no memoria) La validez responde a la pregunta ¿ Se esta midiendo lo que se cree que está midiendo?. .

Una prueba de conocimiento sobre canciones de los Beatles no tendrá validez si sólo incluye canciones de un par de sus discos o una prueba de operaciones aritméticas no tendrá validez de contenido si sólo incluye problemas de resta y excluye la suma. El instrumento debe contener representados a todos los ítems del dominio de contenido de las variables a medir.   La Validez de Contenido  La validez de contenido del instrumento de medición refiere al dominio específico de contenido de lo que se mide. .

Es un estándar. mostrando la exactitud con que el examen predice que tan bien un grupo de pilotos puede operar un aeroplano.    La Validez de Criterio  La validez de criterio establece la validez de un instrumento de medición comparándola con algún criterio externo. Por ej. Si el criterio se fija en el presente se habla de validez concurrente (preferencias del electorado por partidos contendientes unos días antes de la elección). un exámen sobre manejo de aviones. Si el criterio se fija en el futuro se habla de validez predictiva (resultados de una prueba de capacidad administrativa de gerentes comparandolos con los resultados del futuro desempeño) .

Ej. Teoría (investigaciones hechas) encontraron que A correlaciona positivamente con B.C y D y negativamente con W. Ej.Validez de Constructo (Concepto)     La validez de constructo (concepto) refiere al grado en que una medición se relaciona consistentemente con otras mediciones de acuerdo con hipótesis derivadas teóricamente referidas a los conceptos medidos. 3) Interpretar la evidencia empírica de acuerdo con el nivel en que clarifica la validez de concepto de una medición en particular. Al medir motivación laboral se mide persistencia (tiempo adicional que trabaja alguien al terminar su horario.  . Hay que especificar 1) Una relación teórica entre conceptos desde el marco teórico.C.D y negativamente con los resultados de W. 2) Correlacionar ambos conceptos y analizar la correlación. La validez de constructo se vincula con la teoría. Si el instrumento mide realmente A sus resultados deben correlacionarse positivamente con los resultados obtenidos en las mediciones de B.

en la puerta de calle con ruido etc. criterio y constructo) Mayor la validez.) 5) aspectos mecánicos (no comprender instrucciones. grupos y tiempos distintos 3) su falta de adaptación a las personas a las que se aplica (ej. mayor la aproximación de la representación a la variable que se pretende medir. Los instrumentos pueden ser afectados en su confiabilidad y validez por 1) la improvisación 2) el desarrollo en culturas.    Validez y Confiabilidad  La validez total del instrumento de medición se hace sobre la base de los tres tipos de evidencia (contenido. no se lee bien lo que dice etc. no empatía por lenguaje elevado para niños) 4) por las condiciones en que se aplica el instrumento (cuestionario largo. . Un instrumento puede ser confiable pero no válido cuando genera resultados consistentes pero no mide lo que se pretende. tedioso. falta de espacio para contestar.

el instrumento se considera confiable. Método de mitades: Se aplica una sóla medición pero se dividen en dos los items. El error se mide calculando la confiabilidad y la validez. Si la correlación de los resultados de las diferentes aplicaciones es altamente positiva. Los valores deben correlacionar fuerte Coeficientes de cronbach y coeficiente KR-20 . Método de formas alternativas o paralelas: aplica versiones equivalentes del instrumento (no el mismo). La correlación debe ser significativamente positiva. Los procedimientos utilizados para medir la confiabilidad son Medida de Estabilidad aplica un mismo instrumento dos o mas veces a un mismo grupo después de cierto período. El coeficiente de confiabilidad puedo oscilar entre 0 y 1.       Cálculo de la Confiabilidad  La medición se conceptualiza: X = t + e donde X son los valores observados t son los valores verdaderos y e es el grado de error de la medición.

se correlacionan las puntuaciones entre sí y se hacen estimaciones estadísticas para ver si la muestra es representativa. . Se seleccionan los items y una muestra probabilística de ellos. Se consulta luego investigadores familiarizados con la variable para ver si el universo es exhaustivo. Se administran los items.       Cálculo de la Validez  Para revisar la validez de contenido hay que mirar primero como usaron otros investigadores la variable. Sobre esa base se elabora un universo de items posibles para medir la variable y sus dimensiones. La validez de criterio se estima correlacionando su medición con el criterio La validez de constructo se hace mediante programas estadísticos de análisis de factores.

Ej. Ej. facilidad de administración. veces que medición resultó exitosa Elegir el instrumento favorecido y adaptarlo al contexto propio Indicar nivel de medición de cada variable: 1) Nominal: sin jerarquía ej. su confiabilidad.2) Ordinal: hay categorías y jerarquía.escala de 0 a 10. sujetos a los que se aplicó. masculino 1 y femenino 0 . 4) Medición de razón (el cero de la escala es real o sea no existe la propiedad. sexo m o f.     Construcción del Instrumento  Listar las variables. Nivel medición afecta prueba estadística seleccionada Indicar codificación de datos (valor númerico que los represente). Revisar su definición conceptual y comprender su significadoRevisar como han sido definidas operacionalmente las variables Comparar instrumentos. mayor puntaje a una profesión que a otra. Puede incluir variables dicotómicas ej escuela publica o privada a la asiste. 3) Medición por intérvalos: Hay jerarquía entre categorías e intérvalos iguales en la medición ej. validez.

desde una actitud muy desfavorable hasta una actitud muy favorable) Suponiendo una encuesta con 8 afirmaciones y 5 opciones cada una con un valor de 1 a 5. Cada frase tiene un puntaje y se suman sus valores por lo que se trata de una escala aditiva. La escala de Likert presenta items en forma de afirmaciones o juicios (ej.). la DGI informa bien a los contribuyentes) ante los cuales se pide la reacción de los sujetos (muy de acuerdo. la DGI). El número de juicios debe ser el mismo para todas las afirmaciones.  .Instrumentos Disponibles : Escala de Likert       Escalas para medir actitudes que tienen dirección (positiva o negativa) e intensidad (alta o baja). Todas las afirmaciones (items) miden la actitud hacia un único concepto subyacente (ej. de acuerdo. La escala de Likert se aplica autoadministradamente o por entrevista. el mínimo posible es 8 y el máximo 40. (Ej. Cada afirmación tiene el mismo peso en la escala. Si se miden actitudes hacia varios objetos se requiere una escala por cada objeto. en desacuerdo etc.

Para codificar preguntas abiertas se selecciona un determinado número de cuestionarios por muestreo. regular. bastante. Se observa la frecuencia con que aparece cada respuesta. se le da un título . Los resultados pueden ordenarse en una tabla Los cuestionarios son un conjunto de preguntas cerradas (o con respuestas delimitadas) o abiertas respecto de las variables a medir. caro-barato Entre cada par de adjetivos se presentan opciones ej. muy. se eligen las que tienen mayor frecuencia (patrones generales). La escala final se califica igual a la de Likert sumando las puntuaciones obtenidas. fuerte-débil. bastante y muy) y el sujeto elige la que refleja su actitud.se clasifican en temas o rubros de acuerdo a un criterio lógico.Diferencial SemánticoCuestionarios       El diferencial semántico califica al objeto de actitud en un conjunto de adjetivos bipolares ej. justo-injusto.

analizar la personalidad de alguien evaluando sus escritos. develar diferencias en el mismo. sistemática y cuantitativa. Sirve para conocer actitudes de un grupo mediante análisis de sus discursos. identificar intenciones. valores etc Se hace codificando las características relevantes del contenido del mensaje.   Análisis de Contenido  Es una técnica para analizar la comunicación de una manera objetiva. describir tendencias en el contenido de la comunicación. medir la claridad de los mensajes. comparar mensajes. mensajes ocultos. reflejar actitudes. . para eso hay que definir el universo. revelar centros de interés. las unidades de análisis y las categorías de análisis. auditar el contenido.

Unidades de Análisis.  . intereses) de receptores (a quien va dirigido) físicas (sección y página de prensa.Universo. en contra. conservador.) de valores (creencias. Pueden ser palabras. de dirección (a favor. el tema. mutuamente excluyentes. libro) el personaje. el item (programa. Ej. las medidas de espacio tiempo. un discurso puede ser optimista. derivarse del marco teórico y de una evaluación de la situación. etc. Las unidades de análisis constituyen segmentos del contenido de los mensajes. pesimista. Las categorías pueden ser de asuntos (el tópico). horario en TV etc. y Categorías      El Universo puede ser la obra de un autor. liberal. Las categorías son las casillas o cajones en las cuales son clasificadas las unidades de análisis. Un personaje puede ser bueno o malo.) Las categorías deben ser exhaustivas. nacionalista. las emisiones de un noticiario televisivo durante un mes etc.

Pasos en el Análisis de contenido            Definir el universo y sacar una muestra representativa Definir las unidades de análisis Definir las categorías que presenten a las variables Seleccionar las personas que codificarán Elaborar hojas de codificación Entrenar a los codificadores Calcular confiabilidad de los codificadores Codificar y contar las frecuencias de repetición de las categorías. Obtener totales para cada categoría Realizar los análisis estadísticos apropiados .

     Observació n  Es el registro sistemático. Puede ser participante o no. La ventaja es que son técnicas de medición no obstructivas. se elige el medio de observación. extraer una muestra.(Las subcategorías pueden ser escalas del tipo likert o diferencial semántico). se elaboran las hojas codificadoras. definir las unidades de observación y las categorías de observación. Se codifica. Se selecciona a los observadores. válido y confiable de comportamientos o conductas manifiestas. Se debe definir el universo de eventos o conductas a observar. se entrenan los codificadores y se calcula su confiabilidad. Es una forma de observación del contenido de comunicaciones. aceptan material no estructurado y puede trabajar grandes volúmenes de datos. se obtienen los totales y se hacen los análisis .

Se reúne a un grupo de personas y se trabaja con éste en relación a las variables de la investigación.      Sesiones en Profundidad  Las sesiones en profundidad son otro método de recolectar datos. Se elabora el reporte de sesión. Se detectan ese tipo de personas y se las invita a las sesión. Se define el tipo de personas. Se lleva a cabo la reunión creando clima de confianza (rapport). Se codifica y se hace el análisis correspondiente .

Hay muestras estratificadas y por racimos. Cuando se miden conceptos abstractos. el análisis de contenido. estos se vinculan con indicadores empíricos. Cuando es probabilística. no así en la muestra dirigida. y otros como las pruebas estandarizadas y los archivos. se puede medir el error en la predicción.Resumen Tercera Parte  La selección de la muestra depende de los objetivos y el tipo de investigación. las sesiones en profundidad. La recolección de datos se hace con instrumentos que deben ser confiables y válidos. la observación. La validez debe ser de contenido. semántica diferencial) los cuestionarios. . Entre los instrumentos disponibles están las escalas (Likert. de criterio y de concepto.

pruebas no paramétricas. . Se busca describir los datos y luego relacionar las variables. Los análisis dependen de tres factores: el nivel de medición de las variables (nominal. razones y tasas. cálculos y razonamientos de estadística inferencial. Los principales análisis son: estadística descriptiva para las variables tomadas individualmente. pruebas paramétricas.por intérvalos). puntuaciones “Z”.     Análisis de los Datos  Con los datos codificados en una matriz se analizan. análisis multivariados.ordinal. Las distribuciones pueden presentarse en histogramas o gráficas. Luego se pueden agregar las frecuencias relativas (porcentajes de casos en cada categoría) y las acumuladas (lo que se va acumulando en cada categoría) que también pueden expresarse en porcentajes. la formulación de las hipótesis y el interés del investigador. Para describir cada variable se distribuyen las frecuencias o sea se establece el conjunto de puntuaciones ordenadas en sus respectivas categorías.

se saca el punto medio de cada intérvalo. La moda (categoría más frecuente) va con cualquier nivel de medición La mediana (distribuye la distribución por la mitad) se usa con mediciones ordinales. No tiene sentido con variables nominales porque no tienen jerarquía. Es útil cuando hay valores extremos en la distribución. ya que no es sensible a estos. Son la moda. por intérvalo y de razón. La media es el promedio aritmético de una distribución y se aplica a mediciones por intérvalos o de razón. Se suman los resultados y se lo divide por el número total de frecuencias. Para calcular la media en una distribución de frecuencias.Medidas de Tendencia Central       Las medidas de tendencia central son puntos en una distribución. El nivel de medición de la variable determina cuál es la medida de tendencia apropiada. se lo multiplica por la frecuencia que le corresponde.  . Es sensible a valores extremos. No tiene sentido en variables medidas en nivel nominal u ordinal. No hay noción de encima o debajo. la mediana y la media.

Se expresa en unidades originales de medición de la distribución. Mayor la dispersión de los datos alrededor de la media mayor la desviación estándar. El desvio estándar es el promedio de desviación de las puntuaciones con respecto a la media. mayor la dispersión de los datos en una distribución. designan distancias o un número de unidades en la escala de medición. Se interpreta en relación a la media. A esa división se le saca raíz cuadrada. la desviación estándar y la varianza.    Medidas de Variabilidad  Indican dispersión de los datos en la escala de medición y responden a la pregunta: ¿dónde están diseminados los valores obtenidos? Las medidas de tendencia central son valores en una distribución y las medidas de variabilidad son intérvalos. Mayor el rango. Son el rango. Se calcula sumando todos los cuadrados de la desviación de cada puntuación respecto a la media dividida por el número total de puntuaciones. Se calcula puntuación mayor menos puntuación menor. El rango es la diferencia entre la puntuación mayor y la menor. .

Se suman los valores y se divide el total por el número de frecuencias. . Se multiplica la columna de puntos medios multiplicados por sus frecuencias por los puntos medios (fx2).X2) La desviación estádar se interpreta como “cuanto se desvía en promedio de la media un conjunto de puntuaciones” Sólo se usa en variables medidas por intérvalos o de razón. Se eleva esa media al cuadrado. Se le resta el promedio al cuadrado y al resultado se le saca raíz cuadrada. Las medidas de tendencia central y las de variabilidad se interpretan en conjunto no aisladamente. S= Raiz cuadrada de ((la sumatoria de fx2/N) .     Medidas de Variabilidad  Para datos agrupados en una distribución de frecuencias se obtiene la media con la fórmula de datos agrupados. La varianza es el desvío estándar elevado al cuadrado.

Las frecuencias y las estadísticas descriptivas son para cada variable. La asimetría es una estadística para conocer cuánto se parece la distribución a una distribución teórica llamada “curva normal”. Si es negativa es más plana. La curtosis es un indicador de lo plana o “picuda” que es una curva. Cuando es cero significa que se trata de una curva normal. . habrá más valores agrupados hacia la izquierda de la curva o por debajo de la media.     Asimetría y Curtosis  La asimetría y la curtosis son otras medidas de estadística descriptiva para analizar la distribución de frecuencias en términos de probabilidad y visualizar su grado de dispersión. y si es positiva a la derecha o por encima de la media. Requieren medición por intérvalo. Si es positiva. Constituye un indicador del lado de la curva donde se agrupan las frecuencias. Si es positiva la curva es más levantada o picuda.

     Puntuacion es Z  Las puntuaciones Z son las transformaciones de los valores obtenidos para analizar su distancia respecto a la media en unidades de desviación estándar (s). (Son un elemento descriptivo adicional) Indica la dirección y grado en que un valor individual obtenido se aleja de la media en una escala de unidades de desviación estándar. La distribucion Z tiene media cero (0) y una desviación estándar de 1. La estandarización permite comparar puntuaciones de dos distribuciones diferentes (por ejemplo una distribución obtenida en una preprueba y en una postprueba) o mediciones de distintas pruebas o escalas aplicadas a los mismos sujetos.60 / 10 = -1 o sea el valor 50 está a un desvío por debajo de la media de la distribución. Z = X -X media/s ej. si el valor es 50 y la media 60 y el desvio estandar 10 resulta que Z = 50 . . Es el método usado comúnmente para estandarizar la escala de una variable medida en un nivel por intervalos.

generalmente 100 o 1000 Por ej. (Número de nacidos vivos en el país/ número de habitantes en el país) X 1000 . frecuencias o eventos de una categoría y el número total de observaciones multiplicada por un múltiplo de 10.   Tasas y Razones  Una razón es la relación entre dos categorías por ej. masculino (60)/femenino(30) = 2 Una tasa es la relación entre el número de casos.

Para entender la prueba de hipótesis hay que revisar el concepto de distribución muestral y el de nivel de significancia. Una hipótesis en el contexto de la estadística inferencial es una proposición respecto a uno o varios parámetros.Inferencia: De la Muestra al Universo     La investigación pretende generalizar los resultados de la muestra al universo. Si es congruente se retiene como un valor aceptable del parámetro. La estadística inferencial se usa para probar hipótesis y estimar parámetros. La prueba de hipótesis determina si la hipótesis es congruente con los datos obtenidos en la muestra. .

y una varianza igual a la varianza de la población dividida por el tamaño de muestra. 512 y luego se sacan varias muestras de ese tamaño.Distribución Muestral   Una distribución muestral es un conjunto de valores sobre una estadística calculada de todas las muestras posibles de determinado tamaño. (Si está cerca podremos tener una estimación precisa de la media poblacional que es prácticamente el mismo que el de la distribución muestral. Se saca el tamaño representativo de la muestra ej.  La cuestión es que han cerca está nuestra media de la distribución muestral . Con las medias extraídas de las medias se hace una distribución de las medias. Comúnmente se saca una sola muestra.  El teorema central del límite especifica que la distribución muestral tiene una media igual a la de la población. .

Nivel de Significancia (Valor de certeza fijado a priori)      La probabilidad de que un evento ocurra oscila entre 0 y 1. Hay dos niveles convenidos 0. Para probar hipótesis inferenciales respecto a la media. si es baja no. Cualquier área entre dos puntos de la distribución corresponderá a la probabilidad de la distribución.Aplicando el concepto de probabilidad a la distribución muestral podemos tomar el área de esta como 1.5 o sea que hay 95 % de seguridad para generalizar sin equivocarse y sólo 5 % en contra o 0.1 o 99% de seguridad  . El nivel de significancia o nivel alfa es un nivel de la probabilidad de equivocarse y se fija antes de probar hipótesis inferenciales. La estadística de la muestra obtenida se analiza sobre que porcentaje tiene de confianza en que dicho valor se acerque al valor de la distribución muestral (valor del parámetro de la población). Si es alta se generalizará a la población. el investigador debe evaluar si es alta o baja la probabilidad de que la media de la muestra esté cerca de la media de la distribución muestral.

Representa áreas de riesgo o confianza en la distribución muestral. La distribución muestral es una distribución de valores Z.Distribución Muestral y Nivel de Significancia       El nivel de significancia se expresa en términos de probabilidad (0.05 y 0. El área de riesgo es tomada como el área de rechazo de la hipótesis y el área de confianza como el área de aceptación de la misma.01) y la distribución muestral se expresa como probabilidad (el área total de ésta es 1). El nivel de significancia se toma como un área bajo la distribución muestral. Los valores Z son distancias que indican áreas bajo la distribución normal (áreas de probabilidad). La hipótesis es sobre el parámetro poblacional .

. Estimar desvío estándar de la distribución muestral de la media mediante la fórmula s / raíz cuadrada de n donde s es el desvío estándar de la muestra y n el tamaño de la muestra. Transformar la media de la muestra en una puntuación Z Buscar en la tabla bajo la curva normal aquella puntuación Z que deje 2.96 Comparar la media de la muestra transformada a valor Z con el valor 1.Procedimiento         Sobre bases firmes (revisión literatura e información disponible) establecer una hipótesis sobre el parámetro poblacional.05) Recolectar datos en una muestra representativa. (Ej. si es menor aceptar la hipótesis y si es mayor rechazarla.5 % por encima de ella que es 1.0.96. Definir el nivel de significancia.

96) (0.El Intervalo de Confianza     Otro procedimiento inferencial es construir un intervalo donde se localiza un parámetro.(0.96 si 0. Si la probabilidad es 0.99 = 2. si Z 0. Esto requiere un nivel de confianza que es al intervalo de confianza lo que el nivel de significancia es a la prueba de hipótesis.0679 entonces 2.133) = la  .(puntuación Z X Desvío estándar de la distribución muestral) Ej. Se usa la tabla de áreas bajo la curva normal.9 +. y se selecciona el valor Z del nivel de confianza seleccionada.95 = 1.9 y el desvío 0.9 +.58 Si la media es 2.95 tenemos un 95 % de probabilidad a favor de que el parámetro se localice en el intervalo estimado contra 5 % de elegir un intervalo equivocado. se busca un intervalo donde se ubique dicha media. En vez de probar una hipótesis sobre la media poblacional. Luego se aplica la fórmula: Intervalo de confianza = estadística de la muestra +.(1.0679 = 2. Estos niveles de confianza se expresan en unidades de desviación estándar. Es una probabilidad dada de que un parámetro esté en un intervalo.

falsa (error tipo II o error beta) Rechazar una H. selección de las pruebas estadísticas aporpiadas y mayor conocimiento de la población. (decisión correcta) Rechazar una Hipótesis falsa (decisión correcta) Aceptar una H.       Errores al Realizar Inferencias  Los resultados posibles al probar hipótesis son: Aceptar una Hipótesis verdadera. inspección cuidadosa de los datos. verdadera (error tipo I o error alfa) Los dos errores son indeseables y su posibilidad se reduce mediante: Muestras representavas probabilísticas. .

Análisis Paramétricos   Los supuestos para los análisis paramétricos son: 1) La distribución poblacional de la variable dependiente es normal 2) El nivel de medición de la variable dependiente es por intérvalo o razón 3) Cuando dos o mas poblaciones son estudiadas. tienen una varianza homogenea (dispersión similar en sus distribuciones)  Las pruebas estadísticas paramétricas más usadas son 1) El coeficiente de correlación de Pearson y la regresión lineal 2) La prueba “t” 3) La prueba de contraste de la diferencia de proporciones 4) El análisis de varianza unidireccional (ANOVA) 5) El análisis de varianza factorial (ANOVA) 6) El análisis de covarianza (ANCOVA) .

Si s es menor de 0.081 Se acepta H nula pues r no es significativo ya que 0.05 prob.     Correlació n  Analiza relación entre dos variables medidas en un nivel por intervalos o de razón. R = 0. Se simboliza “r”. El coeficiente varía de -1 (correlación negativa perfecta) a +1 (positiva perfecta) siendo 0 la falta de correlación Se indica si el coeficiente es o no significativo de la siguiente manera s= 0.214 y s = 0. El r se calcula a partir de los valores obtenidos en una muestra en dos variables.05 (95 % de confianza que correlación sea verdadera y 5 % de probabilidad de error). Se relacionan valores de una variable con valores de otra en los mismos sujetos. Relaciona dos variables sin considerar una como independiente y otra como dependiente pues no evalúa la causalidad.05 es significativo al nivel de 0. Es una hipótesis correlacional del tipo “a mayor X mayor Y” o “ a mayor X menor Y”.de error menor a 0. (Simboliza p <0.05) Ej.05 que es el nivel mínimo para aceptar H . Cuando se lo eleva al cuadrado (r2) el resultado indica la varianza de factores comunes.001 significancia .081 es mayor que 0.

Ej. Son dos variables a una se la considera independiente y a otra dependiente.2 + 0. La regresión lineal se determina con base en el diagrama de dispersión Conociendo la línea y la tendencia se puede predecir los valores de una variable conociendo los de la otra variable. El nivel de medición es por intervalo o razón. a =1.8  . Regresión lineal no es útil con relaciones curvilíneas donde tendencia varía.Regresión Lineal         Estima el efecto de una variable sobre otra. Está asociado con el coeficiente “r” Se expresa Y = a + bX donde Y es un valor de la variable dependiente que se desea predecir.2 b= 0. primero es ascendente y luego descendente o viceversa.8 x 7 = 6. a es la ordenada en el origen y b la pendiente. Para eso hay que tener un sólido sustento teórico. La Hipótesis son correlacionales y causales.8 ¿a un valor de 7 en lógica que valor corresponde en historia? Y = 1.

Simboliza “t” La H propone que los grupos difieren significativamente entre sí y la H nula propone que los grupos no difieren significativamente. La medición es por intervalos o razón. Si hay diferentes variables se efectuarán varias pruebas “t” una para cada variable.Prueba “t”       Prueba para evaluar si dos grupos difieren entre sí de manera significativa respecto a sus medias. Esto indica que valor podemos esperar de “t” dependiendo del tamaño de los grupos que se comparan. La comparación se realiza sobre una variable. Para saber si valor de “t” es significativo se calculan los grados de libertad(número de maneras en que datos pueden variar libremente). la distribución “t” de student se acerca más a una distribución normal y si los grados de libertad exceden los 120 la distribución normal es usada como aproximación adecuada de la distribución “t”  . Mayor los grados de libertad que se tengan.

Prueba “t”      La fórmula de “t” es la diferencia entre las medias de los dos grupos divididos por el error estándar de la distribución muestral de la diferencia entre medias. Gl = (N1+N2)-2 Calculados el valor de “t” y los grados de libertad se elige el nivel de significancia y se compara el valor obtenido contra el valor que le correspondería en la tabla respectiva. Se comparan las medias y varianzas de una preprueba con una postprueba en dos momentos diferentes. Si es menor se acepta la H0 En la tabla se busca niveles de confianza como columnas y los grados de libertad como filas o renglones. Si el valor calculado es igual o mayor al que aparece en la tabla se acepta Hi (investigación). Ej. Se acepta la Hi.645. Los grados de libertad se calculan sumando los dos valores del tamaño de los grupos que se comparan menos dos.05 el valor de tabla será para más de 200 grados de libertad 1. N1=128 N2=119 gl=245 Si “t” = 6.  .698 para un nivel de confianza de 0.

0.55 = 0. Si es igual o mayor se acepta la Hi si es menor se rechaza.Prueba de Diferencia de Proporciones         Prueba sobre una variable para analizar si dos proporciones difieren significativamente entre sí.45 x 0. se compara con el valor Z de la distribución normal que corresponde al valor de confianza elegido.52) / 301) = 1.05 = 1.0. Se aplica la formula.48 x 0.55) / 410 )+ ((0. el % de liberales en la ciudad X es mayor que la la ciudad Y % en X = 55 % para N = 410 .45 .48 / la raíz cuadrada de ((0. % en Y = 48 % para N = 301 Los % se transforman en proporciones y se calculan q1 y q2 o sea q1 = 1.48 = 0. La variable se mide en intérvalos o razón expresada en proporciones o porcentajes.55 .96.56 Como z calculada es menor al nivel alfa expresada en valor Z 1.96 Z por lo tanto z = 0.52 Con a= 0. se rechaza la Hi y se acepta la Ho  . q2 = 1 -0. Ej.

La Hi propone que los grupos difieren significativamente entre sí y la Ho propone que los grupos no difieren significativamente. sea categórica significa que se pueden formar grupos diferentes ej. ind. Hay una variable independiente (categoría) y una dependiente (por intérvalos o razón) Que la var. . El análisis de varianza unidireccional produce un valor conocido coo “F” basada en una distribución muestral “F” Compara variaciones de dos fuentes entre los grupos y dentro de los grupos.Análisis de       Varianza Unidireccional Analiza si más de dos grupos difieren  significativamente en cuanto a sus medias y varianzas (La prueba “t” se usa para dos grupos) La Hipótesis es de diferencia entre los grupos. Religión o nivel socioeconómico o antigüedad en la empresa.

c y la otro por d.e. Ej. Esas diferencias son medidas en términos de la varianza.y.f. La razón “F” indica si las diferencias entre grupos son mayores que las diferencias intra grupo. Se espera que los integrantes de una clínica se parezcan más entre sí (por ej.     Varianza Unidireccional  Si los grupos difieren entre sí. Se espera homogeneidad intra clínica y heterogeneidad inter clínicas. en su comportamiento referido a internación o cirugías) que a los miembros de otra clínica. Que pasa si los comportamientos de la clínica A se parecen más a los de otra clínica que a los integrantes de la suya propia?.C la primera esta integrada por los médicos x.b. (dispersión sobre la media calculada en desviaciones elevadas al cuadrado) . Quiere decir que no hay diferencia entre las clínicas.B.z la otra por a. hay 3 clínicas A. sus valores variarán más de lo que puedan variar las puntuaciones entre integrantes de un mismo grupo.

La media cuadrática entre grupos se obtiene calculando la media de los valores de todos los grupos (media total). Después se obtiene la desviación de la media de cada grupo respecto a la media total y se eleva al cuadrado cada desviación. después se suman. se suma esa fuente de variación y se combina para obtner una media de la varianza intra grupal tomando en cuenta los grados de libertad totales  . La media cuadrática dentro de los grupos se saca primero midiendo el desvío de cada puntuación respecto a la media de su grupo.Razón F = Razón entre Varianzas (división de medias cuadráticas)     La razón F es una razón de varianzas o sea divide a la media cuadrática entre los grupos (numerador) por la media cuadrática dentro de los grupos (denominador) F= mceg/mcdg La media cuadrática implica un promedio de varianzas elevadas al cuadrado. Finalmente se sopesa el número de individuos de cada grupo y la media cuadrática se obtiene con base en los grados de libertad inter grupales.

Varianza Unidireccional ( F Significativa)        Media cuadrática entre grupos = Suma de cuadrados entre grupos / grados de libertad entre grupos Grados de lib.15 como F calculado es menor se rechaza Hi y se acepta Ho o sea los grupos no difiere entre sí.01). Se acepta la Hi y se rechaza la Ho Se elige un valor alfa o probabilidad (0. Si es menor a ese nivel es significativo. entre grupos = K -1 donde K es el número de grupos La media cuadrática dentro de los grupos = suma de los cuadrados intragrupo / grados de libertad intragrupos Grados de lib. si F = 1.intragrupos = N .K donde N es tamaño de la muestra.05 o 0. la suma individuos de todos los grupos y K es el número de grupos Cuando F es significativa (valor igual o mayor al de la tabla) =grupos difieren significativamente entre sí.12 y el valor en tabla es 3. Ej. Ver tabla.  .

Evalúa los efectos por separado de cada variable independiente y los efectos conjuntos de dos o más variables independientes.. la similitud en valores. Sirve para diseños experimentales factoriales Ej. Extiende análisis de varianza unidireccional. . Incluye más de una variable. la atracción física y la retroalimentación positiva son factores que inciden en la satisfacción sobre la relación de parejas de novios que tienen entre 24 y 32 años.      Análisis Factorial de Varianza  Analiza el efecto de dos o más variables independientes sobre una variable dependiente. La variable dependiente está medida en intervalos y las independientes en cualquier nivel pero expresadas de manera categórica.

A las variables independientes cuantitativas continuas cuya influencia se remueve y controla se les denomina “covariables” Aquí el análisis de covarianza se concibe como un ajuste en la variable dependiente respecto a diferencias en la covariable y luego como una evaluación de la relación entre variables independientes categóricas y los valores ajustados de la variable dependiente. La perspectiva experimental se centra en las diferencias observadas en la variable dependiente a través de las categorías de la(s)variable (s) independiente(s). ( Se intenta controlar la influencia de otras variables independientes que no sean categóricas. . Purifica la relación entre las variables independientes y la dependiente controlando el efecto de las independientes no categóricas o continuas).    Análisis de Covarianza  Analiza la relación entre una variable dependiente y dos o mas independientes eliminando y controlando el efecto de al menos una de estas independientes Hay tres perspectivas para el análisis de covarianza.

La influencia que se remueve es la de las variables independientes categóricas. Primero se controla efecto de estas variables y después se analiza el efecto “purificado” de las covariables. El análisis de covarianza elimina influencias no deseadas sobre la variable dependiente. Elimina los efectos de variables que confunden o distorsionan la interpretación de resultados en estudios no experimentales La razón F es una razón de varianzas . En la perspectiva de regresión tanto las variables independientes categóricas como las covariables resultan de interés.     Análisis de Covarianza  La perspectiva de interés por la covariable analiza la relación entre la variable dependiente y la covariable (variable cuantitativa continua).






Análisis de
Covarianza

Ej. Los trabajadores que reciban retroalimentación verbal
(X1)sobre el desempeño mantendrán un nivel mayor de
productividad que los trabajadores que reciban
retroalimentación por escrito (X2) y que los trabajadores que no
reciban ningún tipo de retroalimentación (X3).
Hi X1 > X2 >X3
Se sabe que la motivación puede contaminar los resultados.
Diferencias iniciales de motivación pueden invalidar el estudio.
Se decide controlar el efecto de la motivación que se convierte
en covariable.
El análisis de covarianza quita a la variabilidad de la
dependiente lo que se debe a la covariable.
El ajuste se hace sobre la base de la correlación entre la
covariable y la dependiente.
Realizado el análisis de covarianza se evalúa si “F” es o no
significativa . Cuando F es significativa se acepta la Hi






Análisis de
Covarianza

Si el resultado fuera
G1 = 35 G2 = 36 G3 = 38
Los grados de libertad (Gl) entre = K -1 = 3-1 = 2
Gl Intra = N-K = 109 (recordar que N es el tamaño de la
muestra y K el número de grupos)
F= 1.70
Se compara el valor de la tabla que a =.05 es igual a
3.07, siendo la razón F encontrada 1.70 es menor a
este valor.
Se rechaza la Hi y se acepta la Ho






Análisis No
Paramétricos

No requieren distribución normal
Las variables pueden no estar medidas en un nivel por
intervalos o de razón. Pueden analizar datos nominales u
ordinales.
Las variables deben ser categóricas.
Las pruebas más usadas son
1) La Ji cuadrada (x2)
2) Los coeficientes de correlación e independencia para
tabulaciones cruzadas y
3) Los coeficientes de correlación por rangos ordenados de
Spearman y Kendall.

Los datos por intérvalos o razón deben ser resumidos a una cuantas categorías discretas. A su vez cada variable se subdivide en dos o más categorías). Prueba hipótesis correlacionales. .La X2        Es una prueba para evaluar hipótesis acerca de la relación entre dos variables categóricas. Se calcula por medio de una tabla de contingencia o tabulación cruzada. (Tabla de dos dimensiones donde cada dimensión contiene una variable. Si hay variables medidas a intervalos o razón se deben reducir a ordinales. No considera relaciones causales Involucra 2 variables medidas en forma nominal u ordinal.

Tabla de Contingencia de la X2  Candidato A Masc. Voto Candidato B . Sexo Femen.

. 2 (una variable de dos categorías) x 2 (otra var. En la tabla de contingencia se anotan las frecuencias observadas en la muestra de la investigación. Por ej. En esencia la x2 es una comparación entre la tabla de frecuencias observadas y la denominada tabla de frecuencias esperadas.si en vez de sexo fueran los partidos políticos y hubiera tres. Posteriormente se calculan las frecuencias esperadas para cada celda.con dos categorías) Si tabla fuera 2 x 3 serían 2 variables con 1de ellas de 3 categorías. la cual constituye la tabla que esperaríamos encontrar si las variables fueran estadísticamente independientes o no estuvieran relacionadas. La x2 parte del supuesto de “no relación entre variables” y se evalúa si esto es cierto o no analizando si sus frecuencias obsrvadas son diferentes de lo que pudiera esperarse en asusencia de correlación. es una tabla de 2 x 2 donde cada dígito significa una variable y el valor de éste indica el número de categorías de la variable.Tabla de Contingencia de la X2        El ej.

4 . la tabla que resultado en la investigación debe ser muy diferente respecto a la tabla de frecuencias esperadas. La tabla de frecuencia esperada de cada celda se calcula mediante la siguiente fórmula aplicada a la tabla de frecuencias observadas: fe = (Total o marginal de renglón) x (total o marginal de columna) N (número total de frecuencias observadas) En un ej. 2 x 3 donde haya dos zonas de votantes y 3 partidos la frecuencia observada sería:  Zona Total norte sur A 180 100 280 Partidos B 190 280 470 C 170 120 290 Total540 540 500 1040 La (fe) para la primera celda será= (280 x 540) / 1040 = 145.Cálculo de Frecuencias    Si hay relación.

Cálculo de Frecuencias    La tabla de frecuencias esperada sería: 145.4 134. Esto significa que se calcula para cada celda la diferencia entre la frecuencia observada y la esperada y se eleva esa diferencia al cuadrado para luego dividir ese resultado por la frecuencia esperada.6 280 244 226 470 150.6 139.4 290 540 500 1040 Obtenidas las frecuencias esperadas se aplica la siguiente fórmula de X2 = Sumatoria de (0-E)2 / E donde 0 es la frecuencia observada en cada celda y E es la frecuencia esperada de cada celda.  . Finalmente se suman esos resultados y la sumatoria es el valor de la X2 obtenida.

6 1197.4 -19.36 2.Cálculo de la X2  Celda 0 E 0-E (0-E)2 (0E)2 /E Zona norte partido A 180 145.36 2.4 34.4 2959.23 Zona norte partido B 190 244.36 2.33?  Al igual que t y F la X2 proviene de una distribución muestral (identificados por los grados de libertad).6 1197.80 Zona Sur partido C 120 139.4 -54.11 Zona norte partido C 170 150.33  ¿Que quiere decir 47.16 8.69 Zona Sur partido B 280 226 54 2916 12. Por eso para saber si X2 es o no significativo se deben calcular los grados de libertad.6 -34.4 376.16 8. .6 19.4 376.50 Zona Sur partido A 100 134.70 __________________________________________________________ X2= 47.

991.33) por lo tanto X2 resulta significativa . Si nuestro valor calculado de X2 (47.33) es igual o superior al de la tab la.05 es 5. El valor calculado es muy superior (47.     Los Grados de Libertad  GL = (r-1)(c-1) donde r es el número de renglones de la tabla de contingencia y c el número de columnas o sea GL = (3-1) (2-1) = 2 Luego se acude a los grados de libertad de la tabla de X2. eligiendo nuestro nivel de confianza (0.05 o 0. En el ejemplo el valor que requerimos empatar o superar al nivel de 0. decimos que las variables están relacionadas (x2 fue significativa).01).

Por lo tanto se rechaza la Hi y se acepta la nula. Hay relación entre la variable canal de televisión nacional y la variable emisión de programas prosociales.05 se necesita un valor mínimo de 9. No hay relación entre las variables .277 y para que sea significativa a 0.01 con cuatro grados de libertad. neutrales y antisociales Resultados X2 = 7. se necesita un valor mínimo de 13.Otro Ejemplo      H I = Los tres canales de TV a nivel nacional difieren en la cantidad de programas prosociales. neutrales y antisociales que difunden.95 Gl = 4 Para que X2 sea significativa a 0.488.

Tau-b de Kendall.Coeficientes de Correlación e Independencia para Tabulaciones cruzadas.    Además de la X2 existen otros coeficientes para evaluar si las variables incluídas en la tabla de contingencia o tabulación cruzadas están correlacionadas. Lambda. Las diferencias tienen que ver con el tamaño de las tablas de contingencia y el nivel de medición de las variables . Gamma. Eta. D de Somers.(Pearson. de Cramer.

c) % en relación al total marginal del renglón. . En una tabulación cruzada puede haber tres tipos de porcentajes respecto a cada celda:    a) % en relación al total de frecuencias observadas (N) b) % en relación al total marginal de la columna. son útiles para describir conjuntamente a dos o más variables.Otros Usos de las Tablas de Contingencia     Las tablas de contingencia además de servir para calcular la X2 y otros coeficientes. Esto se efectúa convirtiendo las frecuencias observadas en frecuencias relativas o porcentajes.

Ejemplo  Suponga un ejemplo dedos variables sexo y preferencia por el conductor a y b con las siguientes frecuencias observadas sexo M F Preferencia A 25 25 50 por conductor B 40 10 50  65 35 100 .

10 % son mujeres que prefieren al conductor B.Observaciones del Ejemplo    Una cuarta parte de la muestra está constituída porhombres que prefieren al conductor A. Estas frecuencias relativas se basan en las frecuencias observadas pero no tienen nada que ver con las frecuencias esperadas. . Más del 60 % de los hombres prefieren a B Etc.

Coeficientes y Correlación por rangos ordenados de Spearman y Kendall      Los coeficientes rho de Spearman simbolizado como rs y tau de Kendall simbolizado como t son medidas de correlación para variables en un nivel de medición ordinal de tal modo que los individuos u objetos de la muestra puedan ordenarse por rangos(jerarquías) Por ejemplo tenemos las variables preferencia por el sabor y atractivo del envase y pedimos a personas que evalúen 10 bebidas y los ordenen del 1 al 10 Los coeficientes varían de -1 a +1 o sea de correlación negativa perfecta a correlación positiva perfecta. El de Spearman parece una aproximación cercana al coeficiente r de Pearson cuando los datgos son continuos (no caracterizados por un número considerable de empares en cada rango) . El de Kendall es más significativo cuando los datos tienen un número considerable de rangos empatados.

las var. El R2 (coeficiente de correlación elevado al cuadrado) nos indica el porcentaje de variación de la dependiente debida a las independientes. El valor alfa (a) es una cosntante de regresión para el conjunto de valores obtenidos. Sirve para predecir el valor de una variable dependiente conociendo el valor y la influencia de las variables independientes incluídas en el análisis. El valor Beta (B) inidca el peso o influencia que tiene cada variable independiente sobre la dependiente. conjunto El coeficiente varía de 0 a 1. independientes explicarán en mayor medida la variación de la variable dependiente.Análisis Multivariado:1) Regresión       Estos métodos analizan la relación entre varias variables independientes y al menos una dependiente (medida por intérvalos) La regresión múltiple analiza el efecto de dos o más variables independientes sobre una dependiente. y mayor su valor. El coeficiente de correlación múltiple (R) señala la correlación entre la variable dependiente y todas las demás variables independientes tomadas en conjunto.  .

Más se acerque un coeficiente “path” a cero menor efecto tendrá. Cuantifica efectos.2) Análisis Lineal de Patrones. Analiza la magnitud de la influencia (directa o indirecta) de unas variables sobre otras. Es un modelo causal. (Path Análisis)        El análisis lineal de patrones (path análisis) representa interrelaciones entre variables a partir de regresiones. . Son coeficientes de regresión estandarizados. Los coeficientes de path representan la fuerza de las relaciones entre las variables.

reciprocidad económica en la relación. Es un método para determinar el número y naturaleza de conceptos (constructos) subyacentes en un conjunto de mediciones. Var. conflicto. Se miden por intérvalos. frecuencia de la relación. etc. (Los factores “hacen” el concepto o atributo) Los factores se obtienen de las variables originales y deben interpretarse de acuerdo con estas. Se midieron las variables coordinación. También proporciona la varianza explicada . Ej. Así se descubre una estructura de factores. Analizar los factores que determinan la relación entre los vendedores y los compradores industriales en una ciudad.       3)Análisis de Factores  Explica un fenómeno complejo en función de unas cuantas variables. Los coeficientes si son altos se dicen que cargan ese factor y si tienen valores bajos en otros no los cargan. Un constructo es un atributo para explicar un fenómeno Se generan “variables artificiales” denominadas factores que representan atributos.

El interés no es sólo si los grupos definidos por las variables independientes difieren en las var. (variables artificiales generadas a partir de los datos). canónicas sino la naturaleza de éstas. dependientes (Regresión era varias ind y una depend). Se consideran las diferencias entre variables canónicas. Se miran las cargas de los coeficientes de correlación entre una variable dependiente y una variable canónica. .Análisis Multivariado de Varianza (MANOVA)       Analiza la relación entre dos o más variables independientes y dos o más variables dependientes. Las variables canónicas representan conceptos y están compuesta de variables dependientes. Si la carga es alta y positiva significa que altos valores en la dependiente están asociados con altos valores en la variable canónica.

74.70.Análisis Multivariado de Varianza (MANOVA)    Ej.dependiente motivación intrínseca = 0. dep.48 y calidad . calidad. atribuciones internas.90 para atribuciones internas 0. Las variables dependientes. eficiencia=0. 2) atribución de causalidad externa 3) desempeño laboral. Supongamos que los coeficientes de correlación para la variable canónica motivación intrínseca sean los siguientes con la var. motivación intrínseca. Para la canónica desempeño laboral la var. las variables canónicas pueden ser 1) motivación intrínseca. productividad.  .57 Se puede inferir que la variable canónica en cada caso representa esos conceptos de las variables dependientes. atribuciones externas. productividad = 0. se infiere que la variable canónica representa un concepto quei nvolucra a la creatividad. Otro ej.86 y para sentimientos de éxito del trabajo 0. eficiencia. sentimientos de éxito en el trabajo. Una variable dependiente sobre innovación y creatividad y correlaciona con una variable canónica.

Análisis Multivariado de Varianza (MANOVA)     Luego se miran las puntuaciones de las variables independientes por ej. Si los valores son altos en motivación intrínseca para los ejecutivos y no para los obreros entonces eso implica que los ejecutivos tienen mayor peso en la canónica motivación intrínseca medida por las variables dependientes mencionadas La Hi en el MANOVA postula que las medias en la variable canónica (motivación intrínseca.) difieren entre sí. Esto indica que hay por lo menos una variable canónica significativa y se presentan diferencias entre los grupos de la variable independiente en esta variable canónica. La Ho postula que dichas medias serán iguales Se calculan diversas estadísticas para evaluar ambas hipótesis y si resultan significativas a un nivel de confianza se acepta la Hi de diferencias de medias. los grupos ejecutivos. obreros. secretarias etc. empleados. secretarias. etc.) de los grupos o categorías de la variable independiente (ejecutivos.  .

Las medidas de variabilidad son el rango. Los análisis que pueden realizarse son descriptivos para cada variable. códigos. Las medidas de tendencia central son la moda. El tipo de análisis o pruebas estadísticas a realizar depende del nivel de medición de las variables. (diferencia entre máximo y mínimo).      Resumen Análisis de Datos  Se usa la tabla o matriz de datos. frecuencias absolutas. variable (distribución de frecuencias. las hipótesis y el interés del investigador. Las distribuciones de frecuencias pueden presentarse gráficamente. pruebas no paramétricas y análisis multivariados. . medidas de tendencia central y medidas de variabilidad) la transformación a valores Z. la mediana y la media. pruebas paramétricas. multivariados Las distribuciones de frecuencia contienen las categorías. razones y tasas. la desviación estándar y la varianza. cálculos de estadística inferencial. (N de casos) frecuencias relativas (%) y frecuencias acumuladas (absolutas o relativas).

y una tasa es la relación entre el número de casos de una categoría y el numero total de casos.      Resumen Análisis de Datos  Otras estadísticas descriptivas útiles son la asimetría y la curtosis. La estadística inferencial es para efectuar generalizaciones de la muestra a la población.01 .05 y 0. Su media es cero y su desviación estándar es uno. multiplicada por un múltiplo de 10. La curva o distribución normal es un modelo teórico útil. Los niveles más comunes en ciencias socialeds son los del 0. Se usa para probar hipótesis y estimar parámetros. Se basa en el concepto de distribución muestral. Una razón es la relación entre dos categorías. Las puntuaciones Z son transformaciones de los valores obtenidos a unidades de desviación estándar. El nivel de significancia y el intérvalo de confianza son niveles de probabilidad de cometer un error o equivocarse en la prueba de hipótesis o la estimación de parámetros.

unidireccional con una variable independiente y factorial con dos o más variables independientes para hipótesis de diferencia de grupos/causal y Análisis de covarianza (ANCOVA) (correlacional/causal).        Resumen Análisis de Datos  Las pruebas paramétricas más usadas son: El coeficiente de correlación de Pearson (hipótesis correlacional) La regresión lineal (correlacional/causal) La prueba “t” (diferencia de grupos) El contraste de diferencia de proporciones (dif. En todas las pruebas paramétricas las variables están medidas en un nivel por intérvalos o razón.de grupos) El análisis de varianza (ANOVA) unidireccional y factorial. .

     Resumen Análisis de Datos  Las pruebas no paramétricas más usadas son: La prueba de X2 (diferencia de grupos para establecer correlación) Coeficientes de correlación e independencia para tabulaciones cruzadas (correlacional) Coeficientes Spearman y Kendall (correlacional) Las pruebas no paramétricas se usan con variables nominales u ordinales y no requieren distribución normal .

Resumen Análisis de Datos    Los análisis multivariados más usados son: Regresión múltiple (1 dependiente intervalo o razón y 2 o más independientes con cualquier nivel de medición) para hipótesis correlacional/causal X1 X2 Y X3 Análisis lineal path para varias variables de cualquier nivel de medición en una secuencia causal para hipótesis correlacional/causal X W L Y Z N H  .

Resumen Análisis de Datos  Análisis de factores para varias variables de intérvalo o razón e hipótesis de correlación causal X1 X2 Xk  Análisis multivariado de varianza (MANOVA) y correlación canónica para varias independientes y varias dependientes en intérvalos o razón) X1 Y1 X2 Y2 Xk Yk  .

 Resumen Análisis de Datos Análisis discriminante para varias  independientes (intérvalos o razón) y una dependiente (nominal u ordinal) X1 X2 Xk Y .

Informe Final   Comunica que se hizo.  Hay que distinguir usuarios académicos de no académicos. que resultados y conclusiones se obtuvieron. índice. ni biliografía) . como. resultados.  Si no es académico va portada. resumen. conclusiones y apéndices. procedimientos. (no hay marco teórico. introducción. método.

Bibliografía. Marco teórico. diseño. instrumentos de medición usados (descripción precisa. preguntas de investigación. contexto. Método (Hipótesis. afiliación institucional.) Introducción (problema. manipulación experimental).(Comprensible. sus definiciones y limitaciones). resultados más importantes y conclusiones en 75 a 175 palabras.Informe Final Académico           Portada (título. análisis) Conclusiones y Recomendaciones. autor. universo. sencillo. validez y variables medidas). variables. metodología. justificación. sujetos. Apéndices. muestra.  . Resultados (datos. objetivos. informativo y preciso. materiales. fecha y patrocinador) Indice Resumen (planteo problema. procedimiento de selección. Procedimiento (instrucciones. confiabilidad.

 ESTUDIO DE CASOS. .  LA INVESTIGACION NATURALISTICA.  INVESTIGACION – ACCION.  INVESTIGACION ETNOGRAFICA. ESTUDIOS CUALITATIVOS INVESTIGACION  PARTICIPATIVA.

FASE DE ORIENTACION: COMIENZA CON EL ESTUDIO DE LOS ANTECEDENTES QUE PUEDEN EXISTIR SOBRE LA SITUACION A ESTUDIAR DOCUMENTOS. INFORMES.  SOBRE ESTA BASE DE CONOCIMIENTO.  LA IDEA PRINCIPAL DE ESTA FASE ES LA DE OBTENER SUFICIENTE INFORMACION QUE PERMITA ESTABLECER LO QUE ES IMPORTANTE SEGUIR ESTUDIANDO EN DETALLE. ETC. NO DIRIGIDA. SE INICIA EL CONTACTO CON LAS PERSONAS DEL ESTUDIO DE UNA MANERA MUY ABIERTA. . FASES DE LA INVESTIGACION CUALITATIVA   A.1. (PUEDE TOMAR DIAS O MESES).

 B. SE ELABORAN PROTOCOLOS DE ENTREVISTAS Y DE OBSERVACION PARA OBTENER LA INFORMACION EN PROFUNDIDAD DE AQUELLOS ASPECTOS QUE DE ACUERDO CON LO YA ANALIZADO RESULTAN SER LO MAS IMPORTANTE.  . FASE DE EXPLORACION FOCALIZADA: DEBE INICIARSE UNA VEZ QUE LA INFORMACION RECOGIDA EN LA PRIMERA FASE HA SIDO ANALIZADA.

CORREGIRLO. PARA AUMENTARLO.  . TODO ESTO CON EL FIN DE AUMENTAR SU CREDIBILIDAD. ETC. C. FASE DE CONTROL: SE APOYA EN LOS CONOCIMIENTOS LOGRADOS EN LA FASE B Y CONSISTE EN ESCRIBIR UN INFORME PRELIMINAR QUE ES SOMETIDO A EXAMEN DE LAS PERSONAS QUE PROPORCIONARON INFORMACION.

ES DECIR. ES DECIR. EL DISEÑO SE CARACTERIZA POR SER EMERGENTE. . ES MODIFICABLE.DISEÑO METODOLOGICO EN ESTUDIOS CUALITATIVOS   EN ESTOS ESTUDIOS. MODIFICABLE EN LA MARCHA DE LA INVESTIGACION.

FUENTES DE DATOS   LAS PRINCIPALES SON LA PERSONAS. PASADAS O PRESENTES. ESTO CONFORMA A SU VEZ LA CULTURA DE UN PUEBLO. LA QUE PUEDE EXPRESARSE A TRAVES DE UNA CANTDAD DE RELATOS DE SUS VIVENCIAS COTIDIANS. CADA UNA DE ELLAS POSEE UNA EXPERIENCIA DE VIDA QUE FORMA PARTE DE SU HISTORIA. .