Está en la página 1de 53

CAPITULO I LA INVESTIGACION ESTADISTICA

1.1 ETAPAS DE LA INVESTIGACION ESTADISTICA.La organizacin del campo de investigacin consiste en disponer de todas las operaciones necesarias para su realizacin. Lanzarse a investigar sin una preparacin adecuada puede demandar luego ms tiempo que el efectivamente es necesario. En una investigacin bien preparada, ni hay apresuramiento ni entretenimiento innecesario en las tareas preliminares, que, en algunos de los casos presuponen costos muy elevados con relacin a los beneficios o resultados obtenidos Contrariamente a lo que se suele afirmar con mucha frecuencia, el trabajo cientfico, la ciencia o la investigacin no avanzan por la formulacin de la hiptesis sino, fundamentalmente, por el planteamiento de problemas. Como sealan algunos autores, el problema, dicho con ms precisin, la formulacin del problema es el primer paso del procedimiento de investigacin. El trabajo cientfico consiste, fundamentalmente, en formular problemas y tratar del resolverlo. Consecuentemente, el trabajo de investigacin comienza con la formulacin del problema y se extiende por una serie de fases hasta encontrar respuestas (que puede ser vlida o no) al problema planteado. Enfrentar o confrontar uno o varios problemas no basta; de lo que se trata es de plantear y formular correctamente el problema. En efecto, todo problema debe estar bien formulado; sta es la regla de oro de comienzo de todo proceso de investigacin. Una cuestin planteada de manera general o demasiado banal es inaccesible al trabajo cientfico. Hay un camino a recorrer entre vislumbrar el problema y formularlo correctamente. Una buena formulacin del problema implica siempre la delimitacin del campo de investigacin, es decir, establece claramente los lmites de tiempo y espacio dentro de los cuales se realizar la investigacin. Todos los fenmenos, hechos y problemas se dan en el espacio y tiempo, ah que, cuando un fenmeno, hecho o problema a estudiar es claro y delimitado, las probabilidades y el investigador de no perderse en la investigacin tienden a ser mayores. 1.1 PLANIFICACIN DEL PROBLEMA.Viene a constituir la determinacin de lo que se pretende investigar y su finalidad, esto nos permite delimitar el campo de la investigacin: a.- fase exploratoria Ninguna investigacin parte de cero, de ah que, cuando un investigador o un equipo emprende un estudio, deba consultar e informarse sobre lo ya investigado sobre el tema y realizar un primer contacto con el problema a estudiar. Existe, pues, una tarea de bsqueda de referencias, consulta bibliogrficas y acercamiento preliminar a la realidad objeto de estudio. Esto es lo que suele denominarse fase exploratoria, cuyo propsito es de permitir al investigador familiarizarse e interiorizarse con parte de los conocimientos existentes dentro del campo mbito que es objeto de investigacin. b.- Consulta y recopilacin documental

Consiste en ponerse en contacto con esa parte de la realidad que se ha de investigar y en la que se ha de actuar, a travs de lo que otros vieron o estudiaron en ella. Los documentos son hechos o rastros de algo que ha pasado, de ah que, como testimonios que proporcionan informacin y datos o cifras constituyen un tipo de material til para la investigacin social. Clases de documentos:

Existe una amplia variedad de documentos disponibles que facilitan informacin con vistas a la realizacin de un programa de trabajo social:

Fuente histricas Fuentes estadsticas (locales, regionales, nacionales e internacionales). Informes y estudios Memorias y anuarios Documentos oficiales Archivos privados Documentos personales Prensa (diarios peridicos, semanarios, revistas, boletines, etc) documentacin indirecta (obras literarias o ensayos etc.)

1.2 DISEO DE LA INVESTIGACIN Una vez delimitados los objetos de la investigacin, hay que dar un paso ms y ver cmo organizar el conjunto de operaciones bsicas que permiten llevar adelante el proceso de investigacin, nos estamos refiriendo al diseo de la investigacin. En metodologa de la investigacin que es donde nosotros lo aplicamos, el trmino diseo sirve para designar: El esbozo, el esquema, el prototipo o modelo que indica el conjunto de decisiones, pasos y actividades a realizar para guiar el curso de una investigacin: Segn esta definicin, el diseo de la investigacin incluye, una serie de pasos del marco terico:

Constitucin del equipo de investigacin Coordinacin de tareas Eleccin de los instrumentos metodolgicos Organizacin del material de consulta y de investigacin Eleccin de la muestra Esquema presupuestario-administrativo a.-Requisitos especiales segn la ndole de la investigacin:

Adems de la preparacin que acabamos de mencionar, en algunos casos se requiere una especializacin profesional de acuerdo con la ndole del estudio o investigacin que se realiza. Una encuesta sobre la alimentacin seria apropiado encomendarla a nutricionistas o dietistas; los agrnomos podran llevar a cabo con ms eficiencia, una encuesta sobre produccin rural, y as segn los casos. En la prctica, resulta difcil hallar este personal especializado en nmero suficiente y se utiliza entonces el tipo de encuestador de que es posible disponer en el momento en que se necesita.

b.- Coordinacin de tareas y diagramas del proceso general de investigacin No es lo mismo la coordinacin de tareas que el diagrama del proceso general de investigacin. Incluimos implicadas ambas cosas puesto que no hay mejor sistema para coordinar tareas que utilizar un diagrama que indique las diferentes fases del proceso general de investigacin. c.- Eleccin de los instrumentos metodolgicos: Una vez organizada la investigacin y el equipo que ha de realizarla, es necesario proceder a la eleccin de los instrumentos metodolgicos. Los mtodos y tcnicas a utilizar "armas metodolgicas" como se le ha llamado dependen en cada caso concreto de una serie de factores como:

la naturaleza del fenmeno al estudiar el objetivo de la investigacin los recursos financieros disponibles el equipo humano que realizar la investigacin la cooperacin que se espera obtener del publico

Hablar de la seleccin de mtodos y tcnicas presupone que consideramos que el investigador no debe plantear la cuestin qu puedo estudiar con las tcnicas que poseo? sino que, por lo contrario, frente a los problemas concretos, debe buscar los mtodos y tcnicas adecuadas. d.- Organizacin del material de consulta: Buena parte del conocimiento humano puede hallarse en los libros, documentos, microfilmas, revistas, peridicos monumentos, etc., de lo que es posible disponer en bibliotecas, centro de documentacin, bancos de datos, o en las fuentes. Ningn investigador comienza desde cero: lo que debe saber es donde recurrir para obtener documentacin e informacin que necesita consultar para emprender la investigacin que debe realizar. Al hablar de organizacin del material, se hace referencia a dos tareas diferentes pero complementarias: Clasificacin del material que hay que consultar para realizar una investigacin. Ordenacin del material: informaciones diversas y datos recogidos durante la misma investigacin. e.- Redaccin del informe: Si una investigacin no se plasma por escrito muy poco sentido tiene lo realizado. Ya que no se comunica con nadie y no sirve para nada. La ltima etapa consiste en redactar un informe con los resultados de la investigacin, los datos en que se apoya y, de ordinario, tambin los mtodos y tcnicas utilizados adems de los antecedentes tericos que han servido como marco referencial del problema.

1.3 RECOLECCION DE LOS DATOS:

Una vez que seleccionamos el diseo de investigacin y las muestras adecuada de acuerdo con nuestro problema de estudio e hiptesis, la siguiente etapa consiste en recolectar los datos pertinentes sobre las variables involucradas en la investigacin. Para esta tarea de recopilacin, existen numerosos procedimientos, variables conformes a las circunstancias concretas de la ndole de la investigacin. En lneas generales existen las siguientes tcnicas de recopilacin de datos:

La observacin La entrevista El cuestionario Las escalas de actitudes y de opiniones los test la sociometra la recopilacin documental la semntica diferencial el anlisis de contenido

Recolectar los datos implica tres actividades estrechamente vinculadas entre si:

Seleccionar un instrumento de medicin disponibles en el estudio del comportamiento o desarrollar uno (el instrumento de recoleccin de los datos) este debe ser vlido y confiable, de lo contrario no podemos basarnos en sus resultados. Aplicar ese instrumento de medicin. es decir obtener las observaciones y mediciones de las variables que son de inters de nuestro estudio (medir variable) Preparar las mediciones obtenidas para que puedan analizarse correctamente (a esta actividad se le denomina codificacin de los datos). a.- Datos primarios y datos secundarios

Por su naturaleza los datos pueden dividirse en dos grandes grupos, segn su procedencia en:

datos primarios datos secundarios -Los datos primarios

son aquellos que se obtienen directamente de la realidad misma, sin subir ningn proceso de elaboracin previa. En otras palabras son los que el investigador o sus auxiliares recogen por si mismo en contacto con la realidad. -Los datos secundarios Son registro escrito que proceden tambin de un contacto con la prctica, pero que ya han sido recogidos y muchas veces procesados por otros investigadores.

1.4 TRATAMIENTO ESTADISTICO DE LOS DATOS Los datos recogidos mediante algunos de los procedimientos indicados procedentemente, deben ser elaborados y clasificados con arreglo a ciertos criterios de sistematizacin, para

proceder luego al recuento de los mismos conforme al sistema ms adecuado o factible. Se procede luego al tratamiento estadstico matemtico de los datos. a.-Clasificacin de los datos: codificacin y tabulacin La masa de datos disponibles es de poca utilidad si no se procede a la elaboracin de los mismos de acuerdo a los objetivo de la investigacin. Para realizar a estas tareas debemos conocer cuatro cuestiones fundamentales: criterio de clasificacin

En estadstica la clasificacin u agrupacin de datos debe estar referida a cada variable, objeto de estudio y presentarlo conjuntamente. Esta tarea de clasificacin de los datos supone en primer lugar haber establecido la unidad estadstica o hecho elemental a estudiar. Se sobreentiende que esto se realiz adecuadamente al determinar el objetivo de la investigacin en la tarea preliminar. Conforme a la determinacin de la unidad estadstica y a la ndole de los datos recopilados, s establecern los caracteres o propiedades que se deban tener en cuenta en la clasificacin y que pueden ser: Cuantitativos: cuando las caractersticas son susceptibles de medidas, es decir cuando pueden expresarse en nmeros (produccin, ingresos, nmeros de hijos, etc.) Cualitativos: cuando se trata de cualidades como la nacionalidad, estado civil, profesin etc. o sea que tiene propiedades que solo pueden ser consideraras a nivel nominal, ya que no son susceptible medidas. Desde otro punto de vista los caracteres pueden ser continuos o discontinuo
o o

una variable es continua cuando los valores posibles son ilimitados por ejemplo el peso o la talla (hay diferentes valores ante dos puntos de intervalo) es discontinua discreta cuando los valores son determinados y enteros, como podr ser el nmero de hijos de una familia.

Cuando se trata de caracteres cuantitativos no es posible considerar los valores en sus diferencias muy pequea; es necesario agrupar los datos ... este trabajo en el lenguaje estadstico, se denomina constitucin de clase Si se presenta el caso de una variable discontinua, como los valores estn bien determinados, de ordinario necesarios efectuar la agrupacin de clases. o Frecuencia absoluta y frecuencia relativa

Si los valores de la variable se repiten ciertos nmero de veces, estas repeticiones agrupadas constituyen una frecuencia de cada clase por lo tanto en estadstica frecuencia es el nmero de veces que se presenta una modalidad de una caracterstica cuantitativa cualitativa. Se distingue en las frecuencias absolutas y en la frecuencia relativa, pero cuando se habla de frecuencias sin calificativos, se entiende que son frecuencias absolutas. o
o

Reglas para la formacin de tablas de frecuencia.

Determinacin del rango o sea de la diferencia del rango y el menor de los datos observados. esto sirve como frecuencia para el clculo de intervalo de clase.

Determinar el nmero de intervalo de clase y su tamao. conocido el rango de distribucin hay que dividir este en un numero adecuado de intervalo de clase; en lo posible todos los intervalo deben de tomar el mismo tamao. en este punto lo recomendable es no tomar un nmero muy bajo de intervalo, ni un nmero excesivo de ellos (en general ni inferior de 5 mayor de 20). Hallar el nmero de observaciones correspondiente a cada valor: realizadas las operaciones anteriores, se procede a hallar las frecuencias de cada clase: es una tarea de conteo. b.- Codificacin

Es una operacin que se realiza previa a tabulacin, pero en funcin de esta. Consiste en asegurar un nmero co-relativo a cada una de la categora que comprende el cuestionario o documento de observacin. En otras palabras: se trata de cada respuesta del cuestionario o cada dimensin de los cuadro de observacin, sean traducida y representadas por indicaciones numricas (cdigos) que facilitan la tabulacin. De lo dicho resulta claro que la finalidad de la codificacin es la facilitar la agrupacin de datos, hechos o respuestas. Existen dos formas principales de codificacin: una para la tabulacin manual y otra es para la tabulacin mecnica o electrnica.
o

Operaciones de tabulacin

Estas operaciones pueden realizarse en dos sistemas diferentes: Manual y electrnica, aunque tambin existe una forma semi-mecanica
o

La tabulacin

Consiste en resumir todas las operaciones anteriores, recogiendo los valores parciales, totales o acumulados mediante la lectura de posicin y el acopio de cantidades correspondientes. El mtodo electrogrfico que va adquiriendo cada vez mayor difusin, permite mecanizar las operaciones de: perforacin, verificacin con solo hacer raya sobre la misma ficha. Para el recuento mecnico se utilizan los tipos de maquinas como: perforadora, verificadora, clasificadora y tabuladora. La reduccin de los datos: La labor estadstica consiste en la reduccin de los datos, mediante procedimientos de sntesis que resumen y simplifican los datos en una expresin nica, segn valores y atributos iguales, lo cual permite el conocimiento eficaz y rpido de un numero estadstico. Esta simplificacin reduccin debe efectuarse teniendo en cuenta los criterios opuestos
o o

Que sean por lo menos numerosos posible (presentacin simple) Pero que no den una representacin errnea de los mltiples caracteres del conjunto (identificacin segura)

Los principales procedimientos para la reduccin de los datos son los siguientes.

c.- Determinacin de parmetros de posicin


o o o

Media Mediana Moda d.- Determinacin de parmetros medidas de posicin

o o o o o o o

Intervalo de variacin Desviacin media Desviacin estndar Obtencin de razones, proporciones y porcentajes Elaboracin de nmeros ndices Elaboracin de series cronolgicas Correlacin y regresin etc.

1.4 ANLISIS E INTERPRETACIN DE LOS DATOS: En esta fase, cuando se realiza el tratamiento estadstico-matemtico de toda la masa de los datos clasificados y tabulados. esto conduce su primer lugar a la formacin de lo que se llama finding. Que consiste en afirmaciones sobre propiedades estadstica de los datos. Sin embargo, el anlisis no puede quedar reducido a una operacin contable, de obtencin de promedio, medias, ndices, medida de asociacin etc. Los datos en s mismos tienen limitada importancia por eso "es necesario hacerlos hablar", esto es encontrarse significado precisamente en eso consiste la esencia del anlisis o interpretacin de los datos. El propsito del anlisis es resumir y comprar las observaciones llevadas a cabo en forma a tal que sea posible materializar los resultados de la investigacin con el fin de proporcionar respuesta a las interrogantes de la investigacin, sea a los problemas formulados. el objetivo de la interpretacin en cambio es buscar un significado ms amplio a las respuestas mediantes su trabazn con otros conocimientos disponibles; generalizaciones, leyes, teoras etc. se trata de poner los datos en una perspectiva de contextos de relaciones mutuas etc., que permitan profundizar la compresin de "que est pasando" en este punto hay que referirse a las leyes y teoras que existen para explicar y entender. Cabe advertir que tanto el anlisis como la interpretacin tienen mucho trabajo artesanal, por lo cual esta fase no puede reducirse a una simple operacin estadsticamatemtica en esta labor adems de la lgica interviene la "imaginacin sociolgica". Ambas tareas e interpretacin son la culminacin de todo proceso de investigacin. las fases precedentes tienen sentido y se ordenan en funcin de estas dos ultimas

CAPITULO II TECNICAS ESTADISTICAS 2.1. LA OBSERVACIN Es una tcnica que consiste en observar atentamente el fenmeno, hecho o caso, tomar informacin y registrarla para su posterior anlisis. La observacin es un elemento fundamental de todo proceso investigativo; en ella se apoya el investigador para obtener el mayor numero de datos. Gran parte del acervo de conocimientos que constituye la ciencia a sido lograda mediante la observacin. Existen dos clases de observacin: la Observacin no cientfica y la observacin cientfica. La diferencia bsica entre una y otra esta en la intencionalidad: observar cientficamente significa observar con un objetivo claro, definido y preciso: el investigador sabe qu es lo que desea observar y para qu quiere hacerlo, lo cual implica que debe preparar cuidadosamente la observacin. Observar no cientficamente significa observar sin intencin, sin objetivo definido y por tanto, sin preparacin previa. Pasos Que Debe Tener La Observacin a. Determinar el objeto, situacin, caso, etc (que se va a observar) b. Determinar los objetivos de la observacin (para qu se va a observar) c. Determinar la forma con que se van a registrar los datos d. Observar cuidadosa y crticamente e. Registrar los datos observados f. Analizar e interpretar los datos g. Elaborar conclusiones h. Elaborar el informe de observacin (este paso puede omitirse si en la investigacin se emplean tambin otras tcnicas, en cuyo caso el informe incluye los resultados obtenidos en todo el proceso investigativo) Recursos Auxiliares De La Observacin Fichas Rcords Anecdticos Grabaciones Fotografas Listas de chequeo de Datos Escalas, etc. Modalidades Que Puede Tener La Observacin Cientfica La Observacin cientfica puede ser: Directa o Indirecta Participante o no Participante Estructurada o no Estructurada De campo o de Laboratorio Individual o de Equipo

Observacin Directa y la Indirecta Es directa cuando el investigador se pone en contacto personalmente con el hecho o fenmeno que trata de investigar. Es indirecta cuando el investigador entra en conocimiento del hecho o fenmeno observando a travs de las observaciones realizadas anteriormente por otra persona. Tal ocurre cuando nos valemos de libros, revistas, informes, grabaciones, fotografas, etc., relacionadas con lo que estamos investigando, los cuales han sido conseguidos o elaborados por personas que observaron antes lo mismo que nosotros. Observacin Participante y no Participante La observacin es participante cuando para obtener los datos el investigador se incluye en el grupo, hecho o fenmeno observado, para conseguir la informacin "desde adentro". Observacin participante es aquella e la cual se recoge la informacin desde afuera, sin intervenir para nada en el grupo social, hecho o fenmeno investigado. Obviamente, La gran mayora de las observaciones son no participantes. Observacin Estructurada y No Estructurada Observacin no Estructurada llamada tambin simple o libre, es la que se realiza sin la ayuda de elementos tcnicos especiales. Observacin estructurada es en cambio, la que se realiza con la ayuda de elementos tcnicos apropiados, tales como: fichas, cuadros, tablas, etc, por lo cual se los la denomina observacin sistemtica. Observacin de Campo y de Laboratorio La observacin de campo es el recurso principal de la observacin descriptiva; se realiza en los lugares donde ocurren los hechos o fenmenos investigados. La investigacin social y la educativa recurren en gran medida a esta modalidad. La observacin de laboratorio se entiende de dos maneras: por un lado, es la que se realiza en lugares pre-establecidos para el efecto tales como los museos, archivos, bibliotecas y, naturalmente los laboratorios; por otro lado, tambin es investigacin de laboratorio la que se realiza con grupos humanos previamente determinados, para observar sus comportamientos y actitudes. Observacin Individual Y De Equipo Observacin Individual es la que hace una sola persona, sea porque es parte de una investigacin igualmente individual, o porque, dentro de un grupo, se le ha encargado de una parte de la observacin para que la realice sola. Observacin de Equipo o de grupo es, en cambio, la que se realiza por parte de varias personas que integran un equipo o grupo de trabajo que efecta una misma investigacin puede realizarse de varias maneras: a. Cada individuo observa una parte o aspecto de todo b. Todos observan lo mismo para cotejar luego sus datos (esto permite superar las operaciones subjetivas de cada una) c. Todos asisten, pero algunos realizan otras tareas o aplican otras tcnicas.

2.2 LA ENTREVISTA Es una tcnica para obtener datos que consisten en un dilogo entre dos personas: El entrevistador "investigador" y el entrevistado; se realiza con el fin de obtener informacin de parte de este, que es, por lo general, una persona entendida en la materia de la investigacin. La entrevista es una tcnica antigua, pues ha sido utilizada desde hace mucho en psicologa y, desde su notable desarrollo, en sociologa y en educacin. De hecho, en estas ciencias, la entrevista constituye una tcnica indispensable porque permite obtener datos que de otro modo seran muy difcil conseguir. Empleo De La Entrevista a. Cuando se considera necesario que exista interaccin y dilogo entre el investigador y la persona. b. Cuando la poblacin o universo es pequeo y manejable. Condiciones Que Debe Reunir El Entrevistador a. Debe demostrar seguridad en si mismo. b. Debe ponerse a nivel del entrevistado; esto puede esto puede conseguirse con una buena preparacin previa del entrevistado en el tema que va a tratar con el entrevistado. c. Debe ser sensible para captar los problemas que pudieren suscitarse. d. Comprender los intereses del entrevistado. e. Debe despojarse de prejuicios y, en los posible de cualquier influencia emptica.

2.3. LA ENCUESTA La encuesta es una tcnica destinada a obtener datos de varias personas cuyas opiniones impersonales interesan al investigador. Para ello, a diferencia de la entrevista, se utiliza un listado de preguntas escritas que se entregan a los sujetos, a fin de que las contesten igualmente por escrito. Ese listado se denomina cuestionario. Es impersonal porque el cuestionario no lleve el nombre ni otra identificacin de la persona que lo responde, ya que no interesan esos datos. Es una tcnica que se puede aplicar a sectores ms amplios del universo, de manera mucho ms econmica que mediante entrevistas. Varios autores llaman cuestionario a la tcnica misma. Los mismos u otros, unen en un mismo concepto a la entrevista y al cuestionario, denominndolo encuesta, debido a que en los dos casos se trata de obtener datos de personas que tienen alguna relacin con el problema que es materia de investigacin. Riesgos que conlleva la aplicacin de cuestionarios

a. La falta de sinceridad en las respuestas (deseo de causar una buena impresin o de disfrazar la realidad). b. La tendencia a decir "si" a todo. c. La sospecha de que la informacin puede revertirse en contra del encuestado, de alguna manera. d. La falta de comprensin de las preguntas o de algunas palabras. e. La influencia de la simpata o la antipata tanto con respecto al investigador como con respecto al asunto que se investiga. Tipos de preguntas que pueden plantearse El investigador debe seleccionar las preguntas ms convenientes, de acuerdo con la naturaleza de la investigacin y, sobre todo, considerando el nivel de educacin de las personas que se van a responder el cuestionario. 1. Clasificacin de acuerdo con su forma: 1. Preguntas abiertas 2. Preguntas cerradas 1. Preguntas dicotmicas 2. Preguntas de seleccin mltiple 1. En abanico 2. De estimacin 2. Clasificacin de acuerdo con el fondo: 1. Preguntas de hecho 2. Preguntas de accin 3. Preguntas de intencin 4. Preguntas de opinin 5. Preguntas ndices o preguntas test

2.4. EL FICHAJE El fichaje es una tcnica auxiliar de todas las dems tcnicas empleada en investigacin cientfica; consiste en registrar los datos que se van obteniendo en los instrumentos llamados fichas, las cuales, debidamente elaboradas y ordenadas contienen la mayor

parte de la informacin que se recopila en una investigacin por lo cual constituye un valioso auxiliar en esa tarea, al ahorra mucho tiempo, espacio y dinero.

2.5. EL TEST Es una tcnica derivada de la entrevista y la encuesta tiene como objeto lograr informacin sobre rasgos definidos de la personalidad, la conducta o determinados comportamientos y caractersticas individuales o colectivas de la persona (inteligencia, inters, actitudes, aptitudes, rendimiento, memoria, manipulacin, etc.). A travs de preguntas, actividades, manipulaciones, etc., que son observadas y evaluadas por el investigador. Se han creado y desarrollado millones de tesis que se ajustan a la necesidad u objetivos del investigador. Son muy utilizados en Psicologa (es especialmente la Psicologa Experimental) en Ciencias Sociales, en educacin; Actualmente gozan de popularidad por su aplicacin en ramas novedosas de las Ciencias Sociales, como las "Relaciones Humanas" y la Psicologa de consumo cotidiano que utiliza revistas y peridicos para aplicarlos. Los Test constituyen un recurso propio de la evaluacin cientfica. Caractersticas de un buen Test No existe el Test perfecto; no ha sido creado todava y probablemente no lo sea nunca. a. Debe ser vlido, o sea investigar aquello que pretende y no otra cosa. "si se trata de un test destinado a investigar el coeficiente intelectual de un grupo de personas". b. Debe ser confiable, es decir ofrecer consistencia en sus resultados; stos deben ser los mismos siempre que se los aplique en idnticas condiciones quien quiera que lo haga. El ndice de confiabilidad es lo que dan mayor o menor confianza al investigador acerca del uso de un determinado test. Existen tablas aceptadas universalmente sobre esos ndices y ella nos hacen conocer que ningn test alcanza in ndice de confiabilidad del 100%. c. Debe ser objetivo, evitando todo riesgo de interpretacin subjetiva del investigador. La Objetividad es requisito indispensable para la confiabilidad. d. Debe ser sencillo y claro escrito en lenguaje de fcil compresin para los investigadores. e. Debe ser econmico, tanto en tiempo como en dinero y esfuerzo. f. Debe ser interesante, para motivar el inters de los investigadores

CAPITULO III VALIDACION Y CONFIABILIDAD DE LOS INSTRUMENTOS. Elaborar un cuestionario como instrumento de recoleccin de datos lleva necesariamente a controlar la confiabilidad y validez de los mismos. Estas dos condiciones son cruciales, porque si las herramientas de recoleccin usadas son defectuosas, hay que olvidarse del xito de la investigacin, dado que el tratamiento estadstico no conseguir el milagro de transformar datos de mala calidad en buenos resultados. Validez.- Grado en que el instrumento mide lo que se pretende medir Confiabilidad.- Confianza que se concede a los datos, est relacionada a la estabilidad y/o constancia El instrumento debe tener un grado aceptable de validez y confiabilidad. La validez debe referirse a que el instrumento mida lo que se dice medir y no otra cosa. La confiabilidad implica que el instrumento repite los mismos resultados cuando se repite en las mismas circunstancias. La confiabilidad nos dice que tan consistentes exactos y estables son los resultados alcanzados al aplicar el instrumento. Se puede aplicar el mismo instrumento a los mismos sujetos en ocasiones diferentes y luego medir el grado de correlacin que existe entre los resultados de las dos aplicaciones a mayor correlacin mayor grado de confiabilidad.

La confiabilidad por medio del coeficiente alfa de Cronbach implica aplicar la prueba una vez y luego se mide la consistencia de la respuesta del sujeto con respecto a los tems del instrumento. a.- Coeficiente de correlacin de PEARSON.El coeficiente de correlacin de PEARSON se expresa con la letra r e indica la fuerza de la asociacin. El valor de r vara entre -1 y +1, un valor de cero (0) indica que no existe una relacin entre los dos puntajes, mientras que un valor cercano a -1 o a +1 indica una relacin muy cercana. Un valor positivo indica que las personas con puntaje alto en una primera aplicacin de la escala tambin puntuaran alto durante la segunda aplicacin. Una confiabilidad negativa indica un error en el clculo o una terrible inconsistencia de la escala. Los tems cuyos coeficientes de correlacin tem-total arrojan valores menores a 0.35 deben ser desechados o reformulados, correlaciones a partir de 0.35 a mas son estadsticamente significativas, dado que una baja correlacin entre el tem y el puntaje total puede deberse a diferentes causas, ya sea de mala redaccin del tem o que el mismo no sirve para medir lo que se desea medir. La depuracin de los tems tiene como consecuencia aumentar el coeficiente de fiabilidad del instrumento.
rxy ( N XY
2 2

X. Y)
2 2

N. x. ( X) . N. y . ( Y)

b.- Coeficiente de Cronbach.- La confiabilidad del instrumento se estima a travs del coeficiente de Cronbach . L a ventaja de este coeficiente reside en que se requiere de una sola administracin del instrumento de medicin. Puede tomar valores entre 0 y 1 donde 0 significa confiabilidad nula y 1 representa la confiabilidad total. Este es un ndice para medir la confiabilidad del tipo de consistencia interna de una escala es decir, para evaluar la magnitud en que los tems de un instrumento estn correlacionados. En otras palabras| el alfa de Cronbach es el promedio de las correlaciones entre los tems que hacen parte de un instrumento. Tambin se puede concebir este coeficiente como la medida en la cual algn instrumento, concepto o factor medido est presente en cada tem. Generalmente un grupo de tems que explora un factor comn muestra un elevado valor de alfa de Cronbach. El valor mnimo aceptable para el coeficiente de alfa Cronbach es 0.7 por debajo de ese valor la consistencia interna de la escala utilizada es baja. Por su parte, el valor mximo esperado es 0.9 por encima de este valor se considera que hay redundancia o duplicacin. Varios tems estn midiendo exactamente el mismo instrumento, por lo tanto los tems redundantes deben eliminarse. Usualmente se prefieren valores de alfa entre 0.8 y 0.9 Valores <0.5 nivel de fiabilidad no aceptable Valores entre <0.5-0.6> nivel pobre Valores entre <0.6 0.7> nivel dbil Valores entre <0.7 0.8> nivel aceptable Valores entre <0.8 0.9 > nivel bueno

Valores > 0.9 redundancia de tems Es necesario tener en cuenta que el valor de alfa es afectado directamente por el nmero de tems que componen una escala. A medida que se incrementa el nmero de tems se aumenta la varianza sistemticamente colocada en el numerador, de tal suerte que se obtiene el valor sobrestimado de la consistencia de la escala. El coeficiente de de alfa Cronbach es ms fidedigno cuando se calcula a una escala de 20 tems o menos. El proceso de validacin de una escala es un proceso largo y costoso. El coeficiente es la forma ms sencilla y conocida para medir la consistencia interna. El coeficiente de fiabilidad es afectado por la heterogeneidad de los individuos que contestan la prueba; cuanto ms heterogneo es el grupo de encuestados, mayor es el coeficiente de fiabilidad. As entonces, este coeficiente no es una propiedad exclusiva del instrumento en s, sino que es del instrumento para un determinado grupo de personas en una determinada situacin. El coeficiente de cronbach puede ser calculado: a.- Varianza de los tems

2 . si k . 1 2 k 1 . st

Donde: K= Numero de tems


si
st
2

=varianza de cada tem

= varianza del puntaje total b.- La matriz de correlacin de los tems (correlacin de Pearson entre todos los tems, todos contra todos, de a pares)

N. Pr 1 Pr . ( N 1)

Donde: N= numero de tems Pr= promedio de las correlaciones entre los tems EJEMPLO.- Se tiene un cuestionario para evaluar la aceptacin de la asignatura de mtodos y tcnicas estadsticas de EPG de la UANCV, con tres preguntas y se desea saber si los datos que se obtienen a partir de esta herramienta son confiables. Para evaluar la fiabilidad de este cuestionario, este ltimo se aplico a 10 estudiantes elegidos de manera aleatoria de la poblacin. Emplear el clculo del coeficiente de Cronbach 1.- El curso de mtodos y tcnicas para la investigacin ha respondido a sus expectativas? a.- Muy poco b.- Poco c.- Regular d.- Aceptable e.- Muy aceptable

2.- El docente conoce el tema? a.- Muy poco b.- Poco c.- Regular d.- Aceptable e.- Muy aceptable 3.- Se ha desarrollado de acuerdo a lo programado en el silabo? a.- Muy poco b.- Poco c.- Regular d.- Aceptable e.- Muy aceptable Estudiantes tem 1 tem 2 tem 3 1 4 2 4 2 2 2 3 3 3 2 2 4 2 2 2 5 2 1 3 6 1 1 3 7 2 3 4 8 3 3 4 9 4 3 3 10 1 1 1 Total 24 20 29 Promedio 2.4 2 2.9 Varianza 1.156 0.667 0.989 La varianza se calcula mediante:
s
2

Total 10 7 7 6 6 5 9 10 10 3 73 7.3 5.789

2 . ( X X)

Calculando el alfa de Cronbach: K= 3


si
st
2

= 1.156

0.667

0.989

= 5.789 Reemplazando
3 3

1.156 0.667 0.989 . 1 1 5.789

0.771
Este resultado demuestra que el instrumento se encuentra validado

EJEMPLO.- Se tiene un cuestionario para evaluar la aceptacin de la asignatura de mtodos y tcnicas estadsticas de EPG de la UANCV, con tres preguntas y se desea saber si los datos que se obtienen a partir de esta herramienta son confiables. Para evaluar la fiabilidad de este cuestionario, este ltimo se aplico a 10 estudiantes elegidos de manera aleatoria de la poblacin. Emplear el clculo del coeficiente de correlacin de Pearson . Estudiantes 1 2 3 4 5 6 7 8 9 10 Total Item 1 X 4 2 3 2 2 1 2 3 4 1 24 Item 2 Y 2 2 2 2 1 1 3 3 3 1 20 XY 8 4 6 4 2 1 6 9 12 1 53
X
2

16 4 9 4 4 1 4 9 16 1 68

4 4 4 4 1 1 9 9 9 1 46

a.- Hallando la primera correlacin


rxy ( N XY
2 2

X. Y)
2 2

N. x. ( X) . N. y . ( Y)
rxy

( 10) . ( 53) ( 24) . ( 20)


2 2

( 10) . ( 68) 24 . ( 10) . ( 46) ( 20)

rxy

50 78.99

rxy 0.663
B.-Hallando la segunda correlacin Estudiantes 1 2 3 4 5 6 7 Item 1 X 4 2 3 2 2 1 2 Item 3 Y 4 3 2 2 3 3 4 XY 16 6 6 4 6 3 8
X
2

16 4 9 4 4 1 4

16 9 4 4 9 9 16

8 9 10 Total

3 4 1 24

4 3 1 29

12 12 1 74

9 16 1 68

16 9 1 93

rxy

10. ( 74) ( 24) . ( 29)


2 2

( 10) . ( 68) ( 24) . ( 10) . ( 93) ( 29)

rxy 0.457

c. Hallando la tercera correlacin Estudiantes 1 2 3 4 5 6 7 8 9 10 Total Item 2 X 2 2 2 2 1 1 3 3 3 1 20 Item 3 Y 4 3 2 2 3 3 4 4 3 1 29 XY 8 6 4 4 3 3 12 12 9 1 62


X
2

4 4 4 4 1 1 9 9 9 1 46

16 9 4 4 9 9 16 16 9 1 93

rxy

10. ( 62) ( 20) . ( 29)


2 2

( 10) . ( 46) ( 20) . ( 10) . ( 93) ( 29)

rxy 0.547

Luego: La matriz de correlacin de los tems ser:

N. Pr 1 Pr . ( N 1)

Donde: N=10
Pr 0.633 0.457 0.547 3 0.5456

Calculo de alfa:

( 3) . ( 0.5456) 1 ( 0.5456) ( 10 1)

0.771

El valor es idntico al obtenido con el coeficiente de cronbach, pero este es mas tedioso en su resolucin Ambos valores nos demuestran que el instrumento esta validado.

CAPITULO IV ESTADIGRAFOS MS EMPLEADOS


4.1 MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central nos permiten determinar la posicin de un valor respecto a un conjunto de datos el cual consideramos como representativo para el total de las observaciones Dentro de ellas tenemos: 4.1.1 MEDIA ARITMETICA
X x1 x2 x3 ....... xn . x N N

a.- Media aritmtica simple:

si los nmeros se presentan en frecuencias la media aritmtica ser :


X f1 . x1 f2 . x2 f3 x3 . ....... fn . xn . fx N N

b.- Media aritmtica ponderada:

w1 . x1 w2 . x2 w3 . f3 ........ wn . fn N

. fx f

c.- Media aritmtica con datos agrupados:

Donde: f = frecuencia de clase x = marca de clase 4.1.2 MEDIANA a.- Mediana simple:
xn xn 2 2
xn 2 1

i.- Cuando el nmero de datos es par:

Me

ii.- Cuando el numero de datos es impar :


N Me Lri 2

Me

b.- Mediana con datos agrupados:


Donde:

fmediana

( f)i . c

Lri = Limite real inferior de la clase de la mediana N = numero total de frecuencias

= Suma parcial de las frecuencias de todas las clases por debajo de la clase de la mediana = Frecuencia de la mediana C = tamao o magnitud del intervalo de la clase de la mediana 4.1.3 MODA a.- Moda Simple: viene dado por el valor que ms se repite
Mo Lri
1 1 2

( f)i

fmediana

. c

b.- Moda con datos agrupados: Donde : Lri = limite real inferior

= Exceso de la frecuencia modal sobre la frecuencia de la clase contigua inferior = Exceso de la frecuencia modal sobre la frecuencia de la clase contigua superior C = tamao o magnitud del intervalo de la clase modal
2

4.1.4 MEDIA GEOMETRICA

. x1 . x2 . x3 ..........x n

N 1 x1 1 x2 1 x3 1 ........ xn

4.1.5 MEDIA ARMONICA

4.1.6 MEDIA CUADRATICA

RMS

2 2 2 2 x1 . x2 . x3 ......... xn

4.1.7 RELACION MEDIA, MEDIANA Y MODA: Viene dada por: Moda = Media 3(Media Mediana)
4.2 CUANTILES: a.- Cuartiles .- Vienen a representar a los datos divididos en 4 parte iguales y vienen representados por Q1 , Q2 , Q3 y se le denomina : primer cuartil , segundo cuartil, tercer cuartil b.- Deciles.- Vienen a representar a los datos divididos en 10 partes y se representan por : D1 , D2 , D3 , D4 ,D5.D9 c.- Percentiles.- Vienen a representar a los datos divididos en 100 partes iguales y se les representa por : P1 , P2 , P3 , ..P99 De acuerdo a esto se tiene: P10 0 D1 D2 P20 Q1 D3 D4 P30 P40 P50 Q2 D5 P60 D6 P70 Q3 D7 D8 D9 P80 P90 100

P Lri

d.- Calculo de percentiles con datos agrupados: Donde: Lri = Limite real inferior r = Percentil buscado entre 100 N = Sumatoria de frecuencias P = Percentil

r. N f1 . C f

= Suma de frecuencias de las clases anteriores a la clase del percentil f = Frecuencia de las clases anteriores a la clase del percentil c = Tamao o amplitud del intervalo de clase

( f)i

4.3 ESTADIGRAFOS DE DISPERSION ASIMETRIA Y APUNTAMIENTO Son aquellos que nos determinan como se agrupan o se dispersan los datos alrededor de un promedio
MD

. xi X N

4.3.1 DESVIACION MEDIA: Donde: X = media aritmtica


xi

= Valor de un dato
2 . xi X

4.3.2 DESVIACIN TPICA O ESTNDAR:


2

4.3.3. VARIANZA

2 . xi X 2 N

4.4 DISTRIBUCIONES PROBABILISTICAS DISCRETAS Y CONTINUAS DISTRIBUCIONES PROBABILISTICAS DISCRETAS


a.- Distribuciones de probabilidad.- Son todos los valores posibles que resultan de un experimento aleatorio junto con la probabilidad asociada a cada valor. b.- variable aleatoria.- Corresponde a una caracterizacin cualitativa de los resultados que constituyen un espacio muestral - Variable aleatoria discreta.- Cuando los valores que asume se pueden contar y pueden organizarse en una secuencia igual a los nmeros enteros positivos - Variable aleatoria continua.- Puede asumir cualquier valor dentro de un intervalo estas variables admiten fracciones Modelo de probabilidad de variable aleatoria discreta: - Modelo de Bernoulli - Modelo Binomial - Modelo de Poisson - Modelo esponencial - Modelo Multinomial Modelos de probabilidad de variable aleatoria contina Modelo normal Standarizado

4.4.1 PROBABILIDADES

Concepto.- Puede ser interpretado como algo indefinible pero utilizado para expresar de algn modo un grado de creencia que uno tiene de la ocurrencia de un suceso . Se puede hablar de posibilidades y de probabilidades. Posibilidad: Nro de defectuosos / Nro de sanos Probabilidad: Nro de defectuosos / Nro de casos posibles Espacio muestral: Se le conoce como el conjunto de soluciones posibles , todo experimento tiene un espacio muestral
N e
n

Donde: N = Espacio muestral n = Numero de casos posibles e = Numero de alternativas 4.4.2 COMBINACIONES Determina el nmero de subgrupos que se pueden formar con los n elementos de una muestra no interesando el orden.

n! C( n , r) . r! ( n r) !

Donde: n = elementos de la muestra r = grupos 4.4.3 PERMUTACIONES Calcula las posibles agrupaciones que se pueden establecer con todos los elementos de un grupo en donde interesa el orden de los elementos

n! P( n , r) ( n r) !

Donde: n = elementos de la muestra r = grupos 4.4.5 DISTRIBUCION BINOMIAL Se emplea cuando se trata de una variable (enteros) se dice binomial porque hay dos posibilidades XITO o FRACASO. p = Probabilidad de xito q = Probabilidad de fracaso
x n x . P( x ) C( n , p . q x)

Donde:

x = numero de xitos n = total de eventos Ejemplo.- Determinar la probabilidad de obtener 2 caras al lanzar 4 monedas Solucin: P(x=2) = ? n= 4 x=2 p = 0.5 q = 0.5
P( x ) C( n
x)

p q

4 2 (4 2)

( 0.5) ( 0.5)

37.5

Ejercicio.- En una facultad la probabilidad de que un alumno apruebe el semestre es del 80 % si se considera 8 alumnos cual es la probabilidad de que : a.- 2 ganen (pasen o aprueben) b.- 2 pierdan (desaprueben) c.- Por los menos dos pierdan (aprueben) VARIABLE ALEATORIA CONTINUA 4.4.6 DISTRIBUCION NORMAL.- Corresponde a una distribucin de variable aleatoria continua, donde:
2 z

2 . e . 2

Donde : N = numero de datos


= Desviacin Estndar de la distribucin

p. q binomial = n .

e = base de logaritmo natural = media de la distribucin binomial = np Variante estadstica:


Z X

Donde : Z = variable aleatoria de la distribucin normal X = media de la muestra = media de la poblacin Cuando el numero n de experimentos es grande se hace difcil y tedioso el calculo de la probabilidad mediante el teorema del binomio. Para facilitar el calculo y agilizar las operaciones utilizamos la distribucin normal

4.5 PRUEBA DE HIPOTESIS LIMITES DE CONFIANZA La inferencia estadstica comprende dos partes principales a.- estimacin de parmetros b.- prueba de hiptesis La inferencia estadstica esta basada en el supuesto de que tomaremos muchas muestras todas con igual probabilidad PRUEBA DE HIPOTESIS.- Llamada tambin prueba de significacin y tiene por objeto principal evaluar suposiciones acerca de valores estadsticos de la poblacin denominados parmetros. La suposicin puede ser verdadera o falsa HIPOTESIS ESTADISTICA: Es un supuesto acerca de u parmetro o valor estadstico de una poblacin TIPO DE ERROR Existen dos posibles decisiones: aceptar o rechazar l hiptesis

DECISIONES ACEPTAR RECHAZAR

VERDADERA DECISIN CORRECTA ERROR TIPO I

FALSA ERROR TIPO II DECISION CORRECTA

HIPOTESIS NULA Y ALTERNATIVA a.- hiptesis nula.- es aquella por medio de la cual se hace una afirmacin sobre un parmetro que se va a constatar con el resultado muestral Ejemplo.- Cuando un fabricante dice que sus bateras tienen una duracin de 5,000 horas es una hiptesis nula pues es la que se quiere probar b.- Hiptesis alternativa.- es aquella que difiere de la hiptesis nula es decir ofrece una alternativa afirmando que la hiptesis nula es falsa TEORIA DE LA MUESTRAS PEQUENAS Distribucin t Student.- En problemas referentes a la prueba de hiptesis cuando se conoce la desviacin tpica poblacional no importa que el tamao de la muestra sea grande o pequeo. se dice que es una muestra grande si el numero de unidades es mayor que 30 y es pequea si es menor de 30 En el caso que se desconozca la desviacin tpica poblacional se le podr reemplazar por la desviacin tpica muestral , siempre que la muestra sea grande Cuando n es mayor a 30 (muestra grande) La desviacin tpica se simboliza por s y se considera como un buen estimador de la desviacin tpica poblacional debido a que existe una mayor probabilidad de que los valores extremos que toma la variable quedan

incluidos en el calculo de la varianza realizad en la muestra tal como ocurre al obtener la varianza poblacional. Siendo s
s
2 . xi X

Si es menor o igual a 30 la desviacin tpica se simboliza por cuando no se ha efectuado ninguna correccin Se considera que es menor de debido a la poca posibilidad de que se incluyan valores extremos de la variable poblacional en la muestra. A pesar de las correcciones que se le pueden hacer a las desviaciones tpicas no es efectiva en todas las muestras por tal razn la distribucin de todos los medios muestrales no tienen un comportamiento similar a la distribucin normal, a esta distribucin se le conoce como distribucin t de student

v 2 2

t Y C. 1 v

Grados de libertad : V=n1 DISTRIBUCION DE MEDIAS MUESTRALES Cuando el problema de la desviacin tpica muestral y el tamao de la muestra es menor o igual a 0 se considera que esta sin corregir, debemos proceder a corregir para ser aplicada la distribucin t student

Donde: s = Desviacin tpica corregida = desviacin tpica sin corregir n = numero de observaciones Tambin se le corrige directamente:

OTRAS PRUEBAS DE HIPOTESIS PRUEBAS DE MUESTRAS APAREADAS.- Su aplicacin es de importancia en problemas que comprenden datos ANTES Y DESPUES como aquellos casos en que se desea comprobar si se producen cambios de actitud
d di n

Media aritmtica de las diferencias :


d i xi yi

Diferencia para cada par de observaciones n= tamao de muestra

Desviacin tpica de observaciones apareadas:

sd

2 . di d

Variable estadstica t
sd sd n

Error Standard

PRUEBA DE CHI CUADRADO La distribucin normal se utiliza en todos aquellos casos en que el experimento ofrece dos resultados posibles, cuando se presentan mas de dos resultados debe aplicarse la prueba j cuadrado Por definicin chi cuadrado es la suma de las fracciones que tienen por numerador el cuadrado de la diferencia entre las frecuencias reales u observadas y las frecuencias esperadas o teoras y por denominador la frecuencia esperada

= frecuencia observada o real = frecuencia terica o esperada La curva constituye una excelente aproximacin a la distribucin J- cuadrada esta dada por la ecuacin:

v 2 2

2 x 2

. y c. x e

Donde: v= numero de grados de libertad c= constante que depende de v elegida Esta distribucin es semejante ala distribucin t en cuanto al hecho de que para muestras menores a 30 unidades no es normal pero a medida que se aumenta el tamao de la muestra va ajustndose a la normal por la cual habr tambin una distribucin para cada tamao de muestra PROBLEMA. A continuacin se exponen datos referidos a puntajes obtenidos por 100 trabajadores en un proceso de evaluacin interna en una determinada empresa:
77 62 76 72 72 51 67 70 71 73 68 57 83 77 63 79 71 76 58 66 52 64 72 80 75 87 84 56 74 71 89 75 57 82 66 74 88 82 69 65 95 87 68 71 81 69 54 70 82 70 56 71 74 63 83 70 60 67 57 68 70 78 52 61 86 85 63 64 65 73 69 86 73 68 68 68 68 68 68 68 78 72 77 73 61 79 62 61 81 77 73 58 90 68 74 76 78 58 67 84

a. Elaborar una tabla de distribucin de frecuencias, contenga: intervalo de clase, marca de clase, frecuencia, frecuencia acumulada ascendente y descendente, frecuencia relativa y frecuencia porcentual b. Elaborar una tabla de distribucin de frecuencias, contenga: intervalo de clase, marca de clase, frecuencia, frecuencia acumulada ascendente y descendente, frecuencia relativa y frecuencia porcentual c. Graficar un histograma de frecuencias y polgono de frecuencias d. Encontrar las siguientes medidas de tendencia central: Media aritmtica, mediana y moda.

CAPITULO V UNIVERSO Y MUESTRA 5.1 UNIVERSO Universo es el conjunto total de personas, grupos, instituciones, hechos, fenmenos o cosas que son objeto de investigacin. Tambin se le llama poblacin. Determinar el universo de investigacin es muy importante, porque es el objeto que se estudia y las conclusiones a que se lleguen se referirn bsicamente a l. La informacin que se ha de recoger, asimismo, ser del universo y nada ms que de l. Dejarlo impreciso es restar confiabilidad a toda la investigacin. 5.2 MUESTRA Cuando el universo es muy numeroso, resulta difcil o imposible trabajar con todo el. La muestra como es sabido, no es el universo sino una representacin en pequeo de l, entonces se acude al uso de la muestra que se puede definir como la parte representativa de todo el universo. Cmo conocer las preferencias polticas de 22 millones de electores esparcidos en todo el territorio nacional? Es prcticamente imposible. Es necesario acudir al anlisis de una muestra, cuya determinacin, para que tenga validez cientfica, da lugar a un proceso de muestreo matemtico-estadstico. 5.2.1.- El muestreo aleatorio o probabilstico.Consiste en elegir al azar una muestra representativa del universo. Tiene varias formas: - El muestreo aleatorio simple.- En el que cada elemento del universo tiene la misma probabilidad de ser escogido directamente como parte de la muestra. - El muestreo estratificado.- que consiste en dividir el universo en estratos y de cada uno de ellos se elige al azar una parte proporcional de la muestra. - El muestreo por reas o superficie.- en el que el espacio en el que se asienta el universo se le divide en reas y de cada una de ellas se elige al azar parte de la muestra. 5.2.2.- El muestreo no aleatorio La eleccin de la muestra no depende del azar, sino de la intencin del investigador. Adopta varias formas - Muestreo por cuotas proporcionales. En este caso, se divide el universo en categoras y se seala una cuota proporcional a su magnitud para formar parte de la muestra. La eleccin la realiza el investigador segn su parecer.

- Muestreo razonado o intencionado. Su tcnica consiste en que el investigador escoge, intencionalmente y no al azar, algunas categoras que el considera tpicas o representativas del fenmeno a estudiar. 5.2.3.- Condiciones de la muestra. a.- Que comprenda parte del universo y no su totalidad. Esa parte, segn varios autores, puede oscilar entre el 5 y 20 por ciento del universo total. El mayor o menor porcentaje depende del grado de variabilidad del universo. Cuando el universo, es muy dinmico o cambiante, el porcentaje debe subir, y al revs. b.- Que no haya distorsin en su eleccin. En este sentido, el muestreo aleatorio es ms confiable que el no aleatorio. Este se puede prestar a manipulaciones conscientes o inconscientes. Todo depende de la destreza y honestidad del investigador. c.- Que sea representativa del universo, es decir, que las distintas variedades y matices del universo estn presentes proporcionalmente en la muestra. La similitud con una torta, presentada por los estadsticos, en este sentido, ayuda a clarificar esta condicin, Se supone que la torta esta elaborada por capas horizontales sobrepuestas, cada una de un sabor especial. Una pequea tajada vertical es una muestra representativa de toda la torta ya que contiene todos los sabores. 5.2.4.- Error muestral.Existe una divergencia notoria entre los valores estadsticos obtenidos de la muestra y los derivados del universo, a esta divergencia se les conocen como error muestral
4 0 0

3 0 0

2 0 0

1 0 0

1 0

1 0

FORMULAS DEL ERROR MUESTRAL:


2 . p. q

MUESTRAS INFINITAS:

MUESTRAS FINITAS:

2 . p. q. N n n N 1

Donde: N = Tamao de la poblacin

n = Tamao de la muestra = Desviacin Estndar ESTUDIO DE LOS FACTORES DEL ERROR MUESTRAL: El error muestral segn las formulas expuestas depende de los siguientes factores: a.- La amplitud del universo, finito o infinito (mayores a 100,000) b.- El tamao n de la muestra (mas tamao, menos error) c.- Nivel de confianza adoptado d.- La desviacin tpica Ejemplo.- En una encuesta realizada respecto a una muestra de 5056 familias ha resultado que un 45 % de ellas tiene TV. El universo es de 50,000 familias, el nivel de confianza es de 3 y p se estimo previamente en 55 % Solucin: N = 50,000 n = 5060 p = 55 q= 45 =3
2. 2 p. q. N n 3 . 44. 55 . 50000 5056 e n N 1 5056 50000 1 e 1.98

El resultado obtenido indica que a un nivel de confianza del 99.7 % que el porcentaje de personas que tienen TV en el universo este comprendido entre 45 +/- 1.98 Problema Nro 2 .- En una poblacin de 300,000 habitantes en la que p = 50, se trabaja con una muestra de 7815 elementos al nivel de confianza del 95,5 % . Encontrar el error muestral. Solucin.N= 300,000 n = 7815 =2 p = 50 q = 50

2 2 . p. q 2 . 50. 50 e n 7815 e 1.13

INTERPRETACION: El resultado obtenido indica que hay una probabilidad del 95.5 % (nivel de confianza o significacin) que el universo este comprendido entre 50 +/1.13

5.2.5 Tamao de muestras.- El tamao de la muestra y tambin el calculo depende de los 4 factores o elementos siguientes: a.- La amplitud del universo, finito o infinito (mayores a 100,000) b.- El error de estimacin c.- Nivel de confianza adoptado d.- La desviacin tpica Las formulas para hallar el tamao de la muestra se deducen matemticamente despejando n en las formulas:
n
2. p. q

Muestras infinitas:
n

2 . N. p. q

Muestras infinitas: Donde:

2 2 . e . ( N 1) p. q

e = error muestral n = tamao de muestra N = tamao de la poblacin = desviacin p , q = probabilidad de xitos o fracasos Ejemplo.- Se ha proyectado realizar un estudio sociolgico general de una ciudad que segn el ltimo censo realizado tiene 650,000 habitantes mayores de 16 aos. Hallar el tamao de la muestra a obtener al efecto, teniendo en cuenta que se pretende trabajar a un nivel de confianza del 99.7 % y con un margen de error del 4 % Solucin: n=? N = 650,000 =3 e=4 p = 50 q = 50
n
2. p. q 9. 50. 50 n 2 2 e e e 1406

INTERPRETACION.- La muestra debe ser de 1406 habitantes mayores de 16 aos a un nivel de confianza del 99.7 % y un margen de error del 4 %

EJEMPLO NRO 2.- Una empresade fabricacion de electrodomesticos a encargado a una casa de investigacion de mercados realizar un estudio sobre las condiciones del mercado de maquinas de afeitar electricas en una regionen la que segun el censo , el numero de varones mayores de 15 aos es de 200,000 , segun un sondeo previo realizado , se afeitan con maquina electrica un 80 % de dicha poblacion . Determinar el tamao de la muestra teniendo en cuenta que se quiere trabajar a un nivel de confianza del 95.5 5 y con unmargen de error muestral del 3 % SOLUCION N = 200,000 p = 80 2. 2 p. q 2 . 80. 20 q = 20 n 711 2 2 =2 E 3 E=3 INTERPRETACION.- La muestra debe ser de 7111 para estar seguros con una probabilidad del 95 .5 % que los resultados de la muestra son validos dentro del margen de error del 3 % para el universo EJEMPLO NRO 3.- Se pretende realizar un estudio de actitudes hacia la experiencia prematrimonial de los estudiates de una universidad que cuenta con una poblacion estuiantil de 10,000 estudiantes. Hallar el tamao de la muestra suponiendo que se piensa trabajar a un nivel de confianza del 95.5 % y con un margen de error del 2 %, SOLUCION N = 10,000 2. 2 =2 N. p. q 2 . 10, 000. 50. 50 n 2, 0000 E=2 2. 2 2. . . . . 2 ( 10 , 000 1 ) 4 50 50 E ( N 1 ) p q p = 50 q = 50 INTERPRETACION.- La muestra debe ser de 2,000 para estar seguros con una probabilidad del 95 .5 % que los resultados de la muestra son validos dentro del margen de error del 2 % para el universo EJEMPLO NRO 4.- El primer curso de la facultad de ciencias politicas y so ciologia tiene 1,000 miembros de los cuales 500 se orientan a sociologia y el resto a politicas. Hallar cuantos elementos debe tener la muestra en una investigacion sobre aspiraciones profesi onales de dicho curso , al nivel de confianza del 95.5 % , y con un error permitido del 4 % SOLUCION
2. 2 N. p. q 2 . 50. 50. 1000 N = 1,000 n 384 2 2 2 2 =2 . ( 1000 1 ) 2 . 50. 50 E. ( N 1) p. q 2 . E=4 p = 50 q = 50

INTERPRETACION: A un nivel de confianza del 95.5 % y con un error muestral del 4 % el nmero de muestras a tomar deber ser de 384

CAPITULO VI GRAFICOS ESTADISTICOS 6.1 Generalidades.- Los grficos son medios popularizados y a menudo los ms convenientes para presentar datos, se emplean para tener una representacin visual de la totalidad de la informacin. Los grficos estadsticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fcilmente los hechos esenciales y compararlos con otros. 6.2 Tipos de grficos estadsticos Barras Lneas Circulares reas Cartogramas Mixtos Histogramas

6.3 Otros Dispersograma Pictogramas 6.4 Grficos de barras verticales Representan valores usando trazos verticales, aislados o no unos de otros, segn la variable a graficar sea discreta o continua. Pueden usarse para representar: o una serie o dos o ms series (tambin llamado de barras comparativas)

6.5 Grficos de barras horizontales Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categora son muy extensos.

o para una serie o para dos o ms series

6.6 Grficos de barras proporcionales Se usan cuando lo que se busca es resaltar la representacin de los porcentajes de los datos que componen un total. Las barras pueden ser: o Verticales o Horizontales

6.7 Grficos de barras comparativas Se utilizan para comparar dos o ms series, para comparar valores entre categoras. Las barras pueden ser: o Verticales o horizontales

6.7 Grficos de barras apiladas Se usan para mostrar las relaciones entre dos o ms series con el total. Las barras pueden ser: o verticales o horizontales

6.8 Grficos de lneas En este tipo de grfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre s. Se pueden usar para representar: o una serie o dos o ms series

Estos grficos se utilizan para representar valores con grandes incrementos entre s.

6.9 Grficos circulares Estos grficos nos permiten ver la distribucin interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, segn lo que se desee destacar. Se pueden ser: o En dos dimensiones o en tres dimensiones

6.9 Grficos de reas En estos tipos de grficos se busca mostrar la tendencia de la informacin generalmente en un perodo de tiempo. Pueden ser:

o o o o

Para representar una serie para representar dos o ms series en dos dimensiones en tres dimensiones.

6.10 Cartogramas Estos tipos de grficos se utilizan para mostrar datos sobre una base geogrfica. La densidad de datos se puede marcar por crculos, sombreado, rayado o color.

6.11 Grficos Mixtos En estos tipos de grficos se representan dos o ms series de datos, cada una con un tipo diferente de grfico. Son grficos ms vistosos y se usan para resaltar las diferencias entre las series. Pueden ser: o en dos dimensiones o en tres dimensiones.

6.12 Histogramas Estos tipos de grficos se utilizan para representa distribuciones de frecuencias. Algn software especfico para estadstica grafican la curva de gauss superpuesta con el histograma.

6.13 Otros grficos En esta categora se encuentran la mayora de los grficos utilizados en publicidad. Se los complementa con un dibujo que est relacionado con el origen de la informacin a mostrar. Son grficos llamativos, atraen la atencin del lector.

Dispersograma Los dispersogramas


Son grficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso.

6.14 Pictogramas Los pictogramas son grficos similares a los grficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos. Es comn ver grficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el nico fin de hacer ms vistoso el grfico, estos tipos de grficos no constituyen un pictograma. Pueden ser: o En dos dimensiones o En tres dimensiones.

Cada tipo de grfico se diferencia de los dems por la clase de marcas de datos que utiliza. Por ejemplo, el grfico de columnas utiliza columnas como marcas de datos; el de crculos, utiliza crculos; etc. El motivo de que haya tantos tipos de grficos diferentes no es solamente esttico. Cada uno de los tipos de grficos est especialmente indicado para representar los datos de una manera distinta. Por lo tanto, si quieres obtener la mxima eficacia al crear tus grficos y presentar tus datos de la mejor manera posible debes tener esto muy en cuenta; que cada tipo de grafico esta destinado para una labor especifica.

CAPITULO VII PRUEBAS DE HIPOTESIS La inferencia estadstica comprende dos partes principales a.- La estimacin de parmetros b.- prueba de hiptesis La inferencia estadstica est basada en el supuesto de que tomaremos muchas muestras todas con igual probabilidad 7.1 Prueba de hiptesis.- Llamada tambin prueba de significacin y tiene como objetivo principal evaluar suposiciones acerca de valores estadsticos de la poblacin denominados parmetros. 7.2 Hiptesis estadstica.- Es un supuesto acerca de un parmetro o valor estadstico de una poblacin 7.3 Tipo de error.- Existen dos posibles decisiones: aceptar o rechazar la hiptesis DECISIONES Aceptar Rechazar VERDADERA Decisin correcta Error tipo I FALSA Error tipo II Decisin correcta

7.4 Hiptesis nula y alternativa.a.- Hiptesis nula.- Es aquella por medio de la cual se hace una afirmacin sobre un parmetro que se va a constatar con el resultado muestral Ejemplo Cuando un fabricante dice que sus bateras tienen una duracin de 5000 horas es hiptesis nula pues es lo que se quiere probar b.- Hiptesis alternativa.- Es aquella que difiere de la hiptesis nula es decir ofrece una alternativa afirmando que la hiptesis nula es falsa Con respecto al ejemplo anterior se puede afirmar que: a.- El producto tiene una duracin superior (unilateral a la derecha) docima unilateral a la derecha

b.- El fabricante a exagerado la duracin del producto (unilateral a la izquierda)

Docima unilateral a la izquierda

c.- La duracin no es sealada (prueba bilateral) docima bilateral

ZA = zona de aceptacin RC = regin critica = nivel de significacin Z = variable aleatoria de la distribucin normal NIVEL DE SIGNIFICACION Mxima probabilidad de que se especifique con el fin de cometer el mnimo error TIPO I El nivel de significacin es generalmente del 1 % a 5 % a.- 1 % : resultado altamente significativo b.- 5 % : resultado significativo c.- 10 % resultado poco significativo Procedimiento a seguir: a.- Formular la hiptesis nula y la alternativa b.- Seleccionar el nivel de significacin c.- Conocer o estimar la varianza d.- Determinar la tecnica y la prueba estadistica e.- Determinar los valores crticos y sus regiones de rechazo f.- Calcular los datos mustrales EJEMPLO.- Muchos aos de experiencia en un examen de ingreso a la Universidad de ingles arroja una calificacin promedio de 64 con una desviacin estndar de 8. Todos los estudiantes de cierta ciudad de la cual existen 64, han obtenido una calificacin promedio de 68 Puede tenerse la certeza de que los estudiantes de esta ciudad son superiores en ingles?

SOLUCION =64 Ho: Ha:


z

=8 =64

n= 64

=68

=0.05

68 64 x z 8
n

Empleando la formula:

64

z 4

Respuesta.- Se ubica en la zona de rechazo ( 4 > 1.64 ) por lo tanto puede tenerse la certeza a un nivel de significacin del 5 % que los estudiantes son superiores

COEFICIENTE DE CORRELACIN LINEAL DE PEARSON


1.1- Introduccin Antes de introducirnos en el modelo de regresin lineal, que hace referencia a la naturaleza de la relacin entre distintas variables, pasaremos a exponer el estadstico utilizado para medir la magnitud de la relacin (supuestamente lineal) entre dichas variables. Tiene sentido darle un tratamiento aparte por su importancia y las continuas referencias que ofreceremos a lo largo de este texto. Comenzaremos su desarrollo, por razones de simplicidad, para el caso particular de dos variables. 1.2.- Coeficiente de correlacin lineal de Pearson El coeficiente de correlacin de Pearson, pensado para variables cuantitativas (escala mnima de intervalo), es un ndice que mide el grado de covariacin entre distintas variables relacionadas linealmente. Advirtase que decimos "variables relacionadas linealmente". Esto significa que puede haber variables fuertemente relacionadas, pero

no de forma lineal, en cuyo caso no proceder a aplicarse la correlacin de Pearson. Por ejemplo, la relacin entre la ansiedad y el rendimiento tiene forma de U invertida; igualmente, si relacionamos poblacin y tiempo la relacin ser de forma exponencial. En estos casos (y en otros muchos) no es conveniente utilizar la correlacin de Pearson. Insistimos en este punto, que parece olvidarse con cierta frecuencia. El coeficiente de correlacin de Pearson es un ndice de fcil ejecucin e, igualmente, de fcil interpretacin. Digamos, en primera instancia, que sus valores absolutos oscilan entre 0 y 1. Esto es, si tenemos dos variables X e Y, y definimos el coeficiente de correlacin de Pearson entre estas dos variables como rxy entonces:
0 rxy 1

Hemos especificado los trminos "valores absolutos" ya que en realidad si se contempla el signo el coeficiente de correlacin de Pearson oscila entre 1 y +1. No obstante ha de indicarse que la magnitud de la relacin viene especificada por el valor numrico del coeficiente, reflejando el signo la direccin de tal valor. En este sentido, tan fuerte es una relacin de +1 como de -1. En el primer caso la relacin es perfecta positiva y en el segundo perfecta negativa. Pasamos a continuacin a desarrollar algo ms estos conceptos. Decimos que la correlacin entre dos variables X e Y es perfecta positiva cuando exactamente en la medida que aumenta una de ellas aumenta la otra. Esto sucede cuando la relacin entre ambas variables es funcionalmente exacta. Difcilmente ocurrir en psicologa, pero es frecuente en los ciencias fsicas donde los fenmenos se ajustan a leyes conocidas, Por ejemplo, la relacin entre espacio y tiempo para un mvil que se desplaza a velocidad constante. Grficamente la relacin ser del tipo:

Se dice que la relacin es perfecta negativa cuando exactamente en la medida que aumenta una variable disminuye la otra. Igual que en el caso anterior esto sucede para relaciones funcionales exactas, propio de las ciencias fsicas. Por ejemplo, la relacin entre presin y volumen se ajusta a este caso. El grfico que muestra la relacin sera del tipo:

En los fenmenos humanos, fuertemente cargados de componentes aleatorios, no suelen ser posible establecer relaciones funcionales exactas. Dado un cierto valor en la variable X no encontraremos uno y solo un nico valor en la variable Y. Por ejemplo, si relacionamos horas de estudio con el rendimiento acadmico obtendremos mayor rendimiento a mayor inteligencia, pero ser prcticamente imposible saber con exactitud la puntuacin que obtendr un sujeto para unas horas determinadas. Dado un cierto nmero de personas con un mismo nmero de horas, por ejemplo 10, no todos obtendrn exactamente la misma puntuacin en rendimiento. Unos obtendrn ms o menos en funcin de otras variables, tales como motivacin o personalidad. Si relacionsemos ambas variables dada una muestra de sujetos tendramos un grfico de las siguientes caractersticas:

Se observa que para un mismo valor en inteligencia existen diferentes posibles valores en rendimiento. Se trata de una correlacin positiva pero no perfecta. Este conjunto de puntos, denominado diagrama de dispersin o nube de puntos tiene inters como primera toma de contacto para conocer la naturaleza de la relacin entre dos variables. Si tal nube es alargada -apunta a una recta- y ascendente como es el caso que nos ocupa,

es susceptible de aplicarse el coeficiente lineal de Pearson. El grosor de la nube da una cierta idea de la magnitud de la correlacin; cuanto ms estrecha menor ser el margen de variacin en Y para los valores de X, y por tanto, ms acertado los pronsticos, lo que implica una mayor correlacin. Si la nube de puntos es alargada y descendente nos encontramos con una correlacin negativa. Supongamos, en este sentido, que relacionsemos la cantidad de alcohol ingerida y el grado de memorizacin ante determinados estmulos. Obtendramos un grfico como el siguiente:

Se observa que a mayor cantidad de alcohol ingerida menor material recordado. Igual que anteriormente no puede establecerse con exactitud el grado de memorizacin en funcin del alcohol ingerido, aunque queda claro la tendencia existente. Por ltimo, si la nube de puntos adopta una configuracin ms o menos redondeada de tal forma que no pueda especificarse ningn tipo de relacin, nos encontramos con una correlacin nula. Supongamos que relacionsemos peso con inteligencia. Obtendramos el siguiente grfico

Se observa que las personas con poco peso obtienen en inteligencia tanto puntuaciones bajas como medias o altas. Lo mismo sucede con personas de peso alto. No puede establecerse, pues, ningn tipo de relacin. Ambas variables son independientes entre s; la variacin de una de ellas no influye para nada en la variacin de la otra. Ejemplo 1.1.- Tengamos las siguientes puntuaciones en las variables X (inteligencia) e Y (rendimiento acadmico):

Calcular el coeficiente de correlacin de Pearson: a) en puntuaciones directas, b) puntuaciones diferenciales y c) puntuaciones estandarizadas. Solucin Antes de calcular el coeficiente de correlacin de Pearson hemos de comprobar si existe una tendencia lineal en la relacin. Aunque ms adelante ofreceremos procedimientos analticos que permitan verificar con exactitud la Hiptesis de linealidad, por el momento, recurriremos a procedimientos grficos, que en una primera instancia, pueden resultar suficientes:

Se observa la existencia de una cierta tendencia lineal en la relacin. Podemos, en consecuencia, proceder a calcular el coeficiente de correlacin de Pearson. a) Puntuaciones directas. Configuremos la siguiente tabla:

De donde:

Aplicando (1.9):

b) Puntuaciones diferenciales o centradas Hagamos las siguientes transformaciones:

Apliquemos (1.10):

c) Puntuaciones estandarizadas Hagamos las oportunas transformaciones:

Y configuremos la siguiente tabla:

Apliquemos la formula (1.5):

1.4.- Significacin del coeficiente de correlacin Una vez calculado el valor del coeficiente de correlacin interesa determinar si tal valor obtenido muestra que las variables X e Y estn relacionadas en realidad o tan solo presentan dicha relacin como consecuencia del azar. En otras palabras, nos preguntamos por la significacin de dicho coeficiente de correlacin. Un coeficiente de correlacin se dice que es significativo si se puede afirmar, con una cierta probabilidad, que es diferente de cero. Ms estrictamente, en trminos estadsticos, preguntarse por la significacin de un cierto coeficiente de correlacin no es otra cosa que preguntarse por la probabilidad de que tal coeficiente proceda de una poblacin cuyo valor sea de cero. A este respecto, como siempre, tendremos dos hiptesis posibles: H0: = 0_ xy r El coeficiente de correlacin obtenido procede de una poblacin cuya correlacin es cero ( ) . H1 : = 0_ xy r El coeficiente de correlacin obtenido procede de una poblacin cuyo coeficiente de correlacin es distinto de cero ( ). Desde el supuesto de la Hiptesis nula se demuestra que la distribucin muestral de correlaciones procedentes de una poblacin caracterizada por una correlacin igual a cero ( ),sigue una ley de Student con N-2 grados de libertad, de media el valor poblacional y desviacin tipo:

En consecuencia, dado un cierto coeficiente de correlacin rxy obtenido en una determinada muestra se trata de comprobar si dicho coeficiente es posible que se encuentre dentro de la distribucin muestral especificada por la Hiptesis nula. A efectos prcticos, se calcula el nmero de desviaciones tipo que se encuentra el coeficiente obtenido del centro de la distribucin, segn la frmula conocida:

Ejemplo 1.2.- Determinar la significacin del coeficiente de correlacin del ejemplo 1.1. Solucin: Apliquemos:

El valor marcado con una elipse:

Comparamos el valor t obtenido con el de las tablas: 4.21 > 2.306 Rechazamos la Hiptesis nula con un riesgo (mximo) de equivocarnos de 0.05. La correlacin obtenida no procede de una poblacin caracterizada por una correlacin de cero. Concluimos, pues, que ambas variables estn relacionadas. 1.5.- Interpretacin del coeficiente de correlacin. Como se ha indicado el coeficiente de correlacin de Pearson es un ndice cuyos valores absolutos oscilan entre 0 y 1. Cuanto ms cerca de 1 mayor ser la correlacin, y menor cuanto ms cerca de cero. Pero como interpretar un coeficiente determinado? Qu significa un coeficiente de 0.6?. Es alto o bajo?. No puede darse una respuesta precisa. Depende en gran parte de la naturaleza de la investigacin. Por ejemplo, una correlacin de 0.6 sera baja si se trata de la fiabilidad de un cierto test, pero sin embargo, sera alta si estamos hablando de su validez. No obstante, intentaremos abordar el tema desde dos perspectivas distintas. Por un lado, ya ha sido tratado desde la perspectiva de la significacin estadstica mencionada en el apartado anterior. Desde este enfoque una correlacin es efectiva si puede afirmarse que es distinta de cero. Pero ha de decirse que una correlacin significativa no necesariamente ha de ser una correlacin fuerte; simplemente es una correlacin diferente de cero. O en otros trminos, es una correlacin que es poco probable que proceda de una poblacin cuya correlacin es cero. Tan solo se est diciendo que se ha obtenido "algo" y que ese "algo" es (probablemente) ms que "nada". La significacin de rxy depende en gran medida del tamao de la muestra, tal como puede observarse en

(1.12); una correlacin de 0.01 puede ser significativa en una muestra suficientemente grande y otra de 0.9 no serlo en una muestra pequea. Aqu se cumple la ley de los grandes nmeros; tendencias dbiles son muy improbables, desde la Hiptesis nula, en grandes masas de datos, mientras que tendencias fuertes pueden ser relativamente probables en un tamao pequeo de muestra. Ms inters tiene la interpretacin del coeficiente de correlacin en trminos de proporcin de variabilidad compartida o explicada, donde se ofrece una idea ms cabal de la magnitud de la relacin. Nos referimos al coeficiente de determinacin. Dicho coeficiente se define como el cuadrado del coeficiente de correlacin; esto es, dada dos variable X e Y, hace referencia a xy , y se entiende como una proporcin de variabilidades (lo demostraremos ms adelante). Por ejemplo, si la correlacin entre inteligencia y rendimiento acadmico es de 0.8, significa que es la proporcin de varianza compartida entre ambas variables. Puede interpretarse como que un 64% del rendimiento acadmico es debido a la inteligencia -variabilidad explicada-, o bien, y esto es ms exacto si hemos de ser estrictos, que inteligencia y rendimiento acadmico comparten un 64% de elementos, o lo que es lo mismo, tanto la inteligencia como el rendimiento ponen en juego un 64% de habilidades comunes.
r
2