Está en la página 1de 30

RESUMEN ESTADISTICA:

Grasso: Introducción a la estadística


Estadística inferencial:
Existe en la estadística un método que se denomina “prueba de hipótesis”, que se orienta a ver la verosimilitud o
plausibilidad de un determinado conjunto de hipótesis, es decir, procedimientos que mediante hipótesis se pueden
derivar de un determinado fenómeno o problema.
ej: el déficit alimentario en la infancia conduce un retardo en su actividad cognitiva.
A partir de la estadística inferencial nos permite saber cuál hipótesis se ve más compatible con los datos disponibles.

Por otra parte la estadística inferencial se parte de la experiencia, donde se extrae las observaciones pertinentes.Esto nos
permite el uso de técnicas de muestreo y de procedimientos para generalizar a partir de una muestra con cierto margen
conocido de confianza.

muestreo aleatorio: elegir sujetos de estudio al azar.

Nos provee de conceptos para estudiar el problema del número de observaciones necesarias para garantizar el menor
margen de error.
Para que las deducciones y las comparaciones sean válidas, los dos grupos deben ser comparables (mujeres de 16 a 18
años embarazadas), en la cual existen diferencias pero los rasgos base se mantienen.

OM
STEVENS: medir es el asignar objetos y números a objetos y acontecimientos de acuerdo con ciertas leyes.
escala nominal: ​urbano, rural,casado,soltero,sordo,mudo etc.La escala nominal representa la asignación de numerales
menos restringida. Los numerales se utilizan solo como etiquetas, y palabras y letras servirían también.
escala ordinal: ​malo,regular,bueno,muy bueno,excelente. Van en un “orden”. Los números en las escalas ordinales
designan un orden específico en el conjunto analizado pero no expresan la magnitud absoluta de ningún atributo, ni el
.C
valor de las diferencias.La escala ordinal surge de la operación de ordenación de rangos. La inteligencia, por ejemplo, es
útilmente evaluada en escalas ordinales, las cuales intentan aproximarse a escalas intervalares, y no es necesario definir
que significa un puntaje cero de inteligencia. Las escalas de razón son aquellas ampliamente encontradas en física y sólo
DD

son posibles cuando existen operaciones para determinar todas las cuatro relaciones: igualdad, ordenación de rangos,
igualdad de intervalos e igualdad de razones. Una vez que la escala es erigida, sus valores numéricos pueden ser
transformados (como pulgadas a centímetros) sólo al multiplicar cada valor por una constante. Un cero absoluto siempre
está involucrado, incluso aunque el valor cero en algunas escalas (por ejemplo, temperatura absoluta) puede que nunca se
LA

genere. Todos los tipos de mediciones estadísticas son aplicables a las escalas de razón
escala intervalar: ​temperatura medida por el termómetro. El 0 es parte de la escala, por el no significa ausencia, el 0 es el
punto de origen aceptado y fijado, por eso se dice que es arbitrario. Por ejemplo, en fundamentos, la campana de Gauss
en un determinado test de inteligencia. Aca tenemos categorías diferentes, orden y distancias iguales numéricas que
FI

corresponden a distancias iguales empíricas en las variables que se desea medir,aunque el origen de la escala es arbitrario.
Como el CI (cociente intelectual).
escala proporcional, de razón o cociente: ​cantidad de errores de escritura en un dictado, cantidad de errores en la
resolución de un problema de razonamiento, tiempos de reacción,kilogramos,etc.


nivel de medición designan expresan orden distancias valores absolutos origen de la


medición

proporcional X X X X Absoluto

intervalar X X X arbitrario

ordinal X X arbitrario

nominal X

Hernández Sampieri:​ Introducción a la estadística en ciencias sociales y del comportamiento.


El enfoque cuantitativo tiene las siguientes características:
Usa la recolección de datos para probar hipótesis, con base en la medición numérica y el análisis estadístico, para
establecer patrones de comportamiento y probar teorías.
Que el investigador realiza los siguientes pasos:
a) Plantea un problema de estudio delimitado y concreto. Sus preguntas de investigación versan sobre cuestiones
específicas _
b) Una vez planteado el problema de estudio, revisa 10 que se han investigado anteriormente. A esta actividad se le
conoce como la revisión de la literatura.

Este archivo fue descargado de https://filadd.com


c) Sobre la base de la revisión de la literatura construye un marco teórico (La teoría que habrá de guiar su estudio). If) De
esta teoría deriva hipótesis (cuestiones que va a probar si son ciertas 0 no). e) Somete a prueba las hipótesis mediante el
empleo de los diseños de investigación apropiados. Si los resultados corroboran las hipótesis 0 son congruentes con éstas,
se aporta evidencia en su favor. Si se refutan, se descartan Enfoque cuantitativo Usa la recolección de datos para probar
hipótesis, con base en la medición numérica y el análisis estadístico, para establecer patrones de comportamiento y
probar teorías. en busca de mejores explicaciones y nuevas hipótesis. Al apoyar las hipótesis se genera confianza en la
teoría que las sustenta. Si no es así, se descartan las hipótesis y, eventualmente, la teoría.
i) Para obtener tales resultados el investigador recolecta datos numéricos de los objetos, fenómenos 0 participantes, que
estudia y analiza mediante procedimientos estadísticos. De este conjunto de pasos, denominado proceso de investigación
cuantitativo, se derivan otras características del enfoque cuantitativo que se precisan a continuación:

● En una investigación cuantitativa se pretende generalizar los resultados encontrados en un grupo (muestra) a una
colectividad mayor (universo 0 población). También se busca que los estudios efectuados puedan replicarse.
● La búsqueda cuantitativa ocurre en la realidad externa al individuo. Esto nos conduce a una explicación sobre cómo
se concibe la realidad con esta aproximación a la investigación.
● Hay dos realidades: la primera consiste en las creencias, presuposiciones y experiencias subjetivas de las personas.
Estas llegan a variar: desde ser muy vagas 0 generales (intuiciones) hasta ser creencias bien organizadas y
desarrolladas lógicamente a través de teorías formales. La segunda realidad es objetiva e independiente de las
creencias que tengamos sobre ella (la autoestima, una ley, los mensajes televisivos, una presa, el SIDA, etc.,

OM
ocurren, es decir, constituyen realidades en forma independiente de 10 que pensemos de ellas) .
● Desde luego, en el enfoque cuantitativo, 10 subjetivo existe y posee un valor para los investigadores; pero de
alguna manera este enfoque se aboca a demostrar que tan bien se adecua a la realidad objetiva.
● Cuando las investigaciones creíbles establezcan que la realidad objetiva es diferente de nuestras creencias, éstas
deben modificarse 0 adaptarse a tal realidad.
.C
● En el caso de las ciencias sociales, el enfoque cuantitativo parte de que el mundo "social" es intrínsecamente
cognoscible y todos podemos estar de acuerdo con la naturaleza de la realidad social.
● si coincide la realidad externa social objetiva, con las creencias subjetivas del investigador, se procede con dicha
DD

investigación, y si no es así, se revisan y modifican esas creencias.


EI ​enfoque cualitativo​, a veces referido como investigación naturalista, fenomenológica, interpretativa 0 etnográfica, es
una especie de "paraguas" en el cual se incluye una variedad de concepciones, visiones, técnicas y estudios no
cuantitativos (Grinnell, 1997).' Sus características más relevantes son:
LA

★ Utiliza la recolección de datos sin medición numérica para descubrir 0 afinar preguntas de investigación en el
proceso de interpretación.
★ EI investigador plantea un problema, pero no sigue un proceso claramente definido. Sus planteamientos no son tan
específicos como en el enfoque cuantitativo.
FI

★ Se utiliza primero para descubrir y refinar preguntas de investigación (Grinnell, 1997). 3. Bajo la bÚsqueda
cualitativa, en lugar de iniciar con una teoría particular y luego "voltear" al mundo empírico para confirmar si esta
es apoyada por los hechos, el investigador comienza examinando el mundo social y en este proceso desarrolla una
teoría coherente con 10 que observa qué ocurre -con frecuencia denominada teoría fundamentada


★ Dicho de otra forma, las investigaciones cualitativas se fundamentan más en un proceso inductivo (explorar y
describir, y luego generar perspectivas teóricas). Van de particular a general.
★ Los datos cualitativos como descripciones detalladas de situaciones, eventos, personas, interacciones, conductas
observadas y sus manifestaciones.
★ Por lo expresado en los párrafos anteriores, el investigador cualitativo utiliza técnicas para recolectar datos como
la observación no estructurada, entrevistas abiertas, revisión de documentos, discusión en grupo, evaluación de
experiencias personales, registro de historias de vida, interacción e introspección con grupos 0 comunidades.
★ EI enfoque cualitativo evalúa el desarrollo natural de los sucesos, es decir, no hay manipulación ni estimulación con
respecto a la realidad.
★ Postula que la "realidad" se define a través de las interpretaciones de los participantes en la investigación respecto
de sus propias realidades.
★ EI enfoque cualitativo puede definirse como un conjunto de prácticas interpretativas que hacen al mundo visible,
10 transforman y convierten en una serie de representaciones en forma de observaciones, anotaciones,
grabaciones y documentos. Es naturalista (porque estudia a los objetos y seres vivos en sus contextos 0 ambientes
naturales) e interpretativo (pues intenta encontrar sentido a los fenómenos en términos de los significados que las
personas les otorguen).
★ Se tiene en cuenta el concepto de Patrón cultural (Colby, 1996), que parte de la premisa de que toda cultura 0
sistema social tiene un modo Único para entender situaciones y eventos.
★ El investigador es parte de ese objeto de estudio, está sumergido en el.}
★ Sigue una perspectiva holística (los fenómenos se conciben como un "todo" y no como partes) e individual.

Este archivo fue descargado de https://filadd.com


★ Mantiene una doble perspectiva: analiza los aspectos explícitos, conscientes y manifiestos, así como aquellos
implícitos, inconscientes y subyacentes. En este sentido, la realidad subjetiva en sí misma es objeto de estudio.
★ El enfoque cualitativo busca principalmente "dispersión 0 expansión" de los datos e información, mientras que el
enfoque cuantitativo pretende intencionalmente "acotar" la información (medir con precisión las variables del
estudio, tener "foco.

Percepciones de Ia realidad
Cuantitativo: Las minorías étnicas comparten experiencias similares dentro del sistema público de asistencia social.
Tales experiencias pueden ser descritas "objetivamente", esto es, que una sola realidad existe en el entomo de
cualquier persona.
Cualitativo: Las experiencias individuales y la del grupo "técnico'' dentro del sistema público de asistencia social
son huecas. Tales experiencias sólo pueden ser descritas "subjetivamente", esto es, que una realidad única y
singular existe dentro de cada persona.
Formas de conocimiento
Cuantitativo La experiencia de las minorías étnicas dentro de los servicios públicos de asistencia social puede ser
conocida al examinar partes específicas de las experiencias individuales y agregarlas al amillsis. Es necesario
descubrir los principios y reglas que regulan tal experiencia.
Cualitativo La experiencia de las minorías étnicas dentro de los servicios públicos de asistencia social puede ser
conocida al capturar las experiencias individuales completas de las personas. Las partes específicas de sus

OM
experiencias son consideradas en relación a las demás partes y a toda la experiencia. La fuente de conocimiento
está integrada por las historias experimentadas por cada participante.

Papel del investigador​ y de 10. participantes, y Ia relación entre ambos


Cuantitativo Durante el estudio, los investigadores se sustraen de sus valores y creencias relacionadas con las
.C
minorías y los servicios públicos de asistencia social. Los participantes proporcionan datos al investigador, los cuales
son previamente definidos por "éste, quien los selecciona, organiza y analiza. EL investigador no les atribuye a los
datos ill a los participantes un significado personal.
DD

Cualitativo Cualquier valor 0 creencia que posea el investigador sobre las minorías étnicas 0 los servicios públicos
de asistencia social influirá en el proceso de investigación. EI investigador aprende de los participantes, y la
interacción es constante.
Aplicaciones
LA

Cuantitativo Los resultados del estudio son generalizables a la población de la cual fue extraída la muestra. Tales
resultados nos indican en porcentajes y promedios como han sido las experiencias de las minorías étnicas en los
servicios públicos de asistencia social. Por ejemplo: el promedio de espera para ser atendidos, el porcentaje de
personas satisfechas e insatisfechas con la atención, freeuencia de visita, datos por género, edad, ocupación,
FI

etcétera. También podemos relacionar variables (tales como la rapidez en la atención y satisfacción respecto al
servicio).
Cualitativo Los resultados nos relatan las historias y experiencias individuales de miembros de las minorías étnicas al
asistir a los servicios públicos de asistencia social. Cada experiencia provee de un entendimiento del significado de acudir a


dichos servicios. EI contexto de cada persona es clave para entender sus historias. Los resultados no pueden generalizarse
a la población en un sentido predictivo probabilístico.
Por ejemplo, podemos comprender el caso de una mujer viuda de 80 años que vive una profunda soledad. Para ella
acudir a los servicios es la manera fundamental de comunicarse con personas de su misma edad. Entenderemos su
experiencia, historia de vida y contexto, así como las de otros individuos.

Investigación​ Se define como un conjunto de procesos sistemáticos y empíricos que se aplican al estudio de un fenómeno.
STEVENS:
Escala Operaciones empíricas básicas Estructura matemática de grupo Estadísticos
permitidos(invariantes) NOMINAL Determinación de igualdad Grupo de permutación x’ = f(x) f(x) significa cualquier
sustitución uno-a-uno Número de casos Modo Correlación de contingencia
ORDINAL Determinación de mayor o menor Grupo isotónico x’ = f(x) f(x) significa cualquier monotónicamente creciente
Mediana Percentiles
INTERVALAR Determinación de igualdad de intervalos o diferencias Grupo lineal general x’ = ax + b Media Desviación
estándar Correlación de orden de rango Coeficiente de variación
RAZÓN Determinación de igualdad de razones Grupo de similitud x’ = ax Coeficiente de variación

CONSTRUCTOS PSICOLÓGICOS Y VARIABLES: ​Nuria Cortada de kohan

Los conceptos de estrés,ansiedad,depresión,superyó, etc. Son entidades teóricas, existen porque una teoría las
fundamento, y se denominan ​constructos o conceptos no observacionales.

Este archivo fue descargado de https://filadd.com


Una definición es constitutiva cuando define un constructo por otro.
Una definición operacional es un constructo que refiere a las operaciones mediante las cuales un investigador
determina la presencia o ausencia de un determinado fenómeno. Ej : los puntajes para medir las escalas de inteligencia.

Existen además variables extrañas:


❖ Variables controladas: por el diseño de investigación, como la edad y el sexo, en la cual se pueden elegir personas
de la misma edad y sexo.
❖ Variables perturbadoras: cuando se analiza una variable independiente más sin saberlo. Como por ejemplo el
aprendizaje de un determinado idioma con un método específico para una persona que ya conoce ese idioma.
❖ variables aleatorizadas: son variables en las que se encuentran errores aleatorios. Como la incapacidad de medir la
inteligencia.
La dimensión ética en la aplicación de estadistica en psicologia:
❏ En este sentido la Estadística sería la ciencia que permite ocultar las diferencias individuales a través de los valores
promedio.
❏ La deontología, como parte de la Ética trata del conjunto de deberes relacionados con el ejercicio de una
determinada profesión.
❏ ​Principios Fundamentales de las Estadísticas Oficiales​:
1) La estadística le provee de información al estado. Con este fin, los organismos oficiales de estadística han de
compilar y facilitar en forma imparcial estadísticas oficiales de comprobada utilidad práctica para que los

OM
ciudadanos puedan ejercer su derecho a la información pública.
2) Hay consideraciones específicas acerca de los métodos y procedimientos para la reunión, el procesamiento,
el almacenamiento y la presentación de los datos estadísticos.
3) Conforme a normas científicas sobre las fuentes, métodos y procedimientos de la estadística.
4) Los organismos de estadística tienen derecho a formular observaciones sobre interpretaciones erróneas y la
.C
utilización indebida de las estadísticas.
5) Los datos para fines estadísticos pueden obtenerse de todo tipo de fuentes, ya sea encuestas estadísticas o
registros administrativos.
DD

6) Los datos individuales que reúnan los organismos de estadística para la compilación estadística, se refieran a
personas naturales o jurídicas, deben ser estrictamente confidenciales y utilizarse exclusivamente para fines
estadísticos.
7) Se han de dar a conocer al público las leyes, reglamentos y medidas que rigen la operación de los sistemas
LA

estadísticos.
Como profesionales Psicólogos tenemos que defender el derecho a que la población esté debidamente
informada en forma clara y accesible. Que los datos presentados sean confiables, de fácil lectura y
entendimiento.
FI

-Rechazar cualquier preferencia por parte de los investigadores o proveedores de datos que pueda
predeterminar o influir en los análisis / resultados.
- -Cumplir con los requisitos de confidencialidad de recopilación, publicación y difusión de datos y cualquier
restricción sobre su uso establecido por el proveedor de datos (en la medida en que lo exija la ley)


--Proteger la privacidad y confidencialidad de los sujetos de investigación y los datos que los conciernen, ya
sea obtenidos directamente de los sujetos, otras personas o registros existentes.Así como también evitar
estigmatizaciones de los sujetos analizados.
ARÓN, A & ARON, E “ ESTADÍSTICA PARA LA PSICOLOGÍA” CAPÍTULO 1
ESTADÍSTICA DESCRIPTIVA
En esta rama de la psicología que está orientada a la recolección de datos, se utilizan a modo de resumen y para facilitar el
análisis, las tablas de frecuencia, porque muestra con qué frecuencia una fenomenos ocurre.
Esta tabla muestra la frecuencia de valores de una determinada variable.
Una VARIABLE es una característica que puede tener diferentes valores. Como por ejemplo masculino,femenino, trans,no
binario, clase social, nivel de estrés, etc.
Cada persona analizado presenta un número o valor observado. Es el valor de la persona con respecto a la variable.
VALOR OBSERVADO: valor de una determinada persona en una determinada variable.
variables cuantitativas o variables numéricas.
También hay intervalos, los valores representan cantidades iguales de lo que se mide;, cuando el valor no es absoluto sino
que es relativo. Se denomina variable ordinal Por ejemplo 3,5
variable nominal: donde las variables son nombres o categorías, ej: casado,soltero,madre, padre, etc.
Estas distintas variables corresponden a distintos niveles de medición.
❖ A veces existen tantos valores posibles que es difícil reflejarlos en una tabla de frecuencias; en el último ejemplo
sucedía algo así. La solución a este problema consiste en formar grupos de valores que incluyan todos aquellos
valores que se encuentran comprendidos dentro de un determinado intervalo. (TABLA DE FRECUENCIAS
AGRUPADAS POR INTERVALOS DE CLASE) hay que instalar el tamaño del intervalo y los límites del mismo.

Este archivo fue descargado de https://filadd.com


❖ Una manera de graficar la información de una tabla de frecuencias es con un gráfico de barras especial denominado
histograma. En un histograma, la altura de cada barra representa la frecuencia que le corresponde al intervalo de
acuerdo con la tabla de frecuencias.

❖ - ejemplo.
❖ p ​ olígono de frecuencias​, es básicamente la versión del histograma representado con un gráfico de Eneas. En lugar
de barras, la frecuencia de cada intervalo se indica a través de la altura de una línea que se desliza por la página,
creando una especie de contorno de montañas. se realiza con dos categorías por:variable y: frecuencia
❖ FORMAS DE DISTRIBUCIÓN DE FRECUENCIAS: el patrón conforme al cual las frecuencias se dispersan o
“distribuyen”.
❖ Un aspecto importante relacionado con la forma de una distribución de frecuencias es el hecho de que la figura
presente un solo punto máximo principal.
❖ Este tipo de distribución se denomina unimodal. Una distribución con dos puntos elevados prácticamente iguales es

OM
una distribución bimodal. Cualquier distribución con dos o más puntos elevados se denomina multimodal,2
Finalmente, una distribución en la que todos los valores presentan prácticamente la misma frecuencia se denomina
rectangular.
❖ Es decir, la mayoría de las distribuciones son prácticamente simétricas ​(si las doblamos por la mitad, las dos mitades
serían iguales).
.C
❖ Las distribuciones que claramente no son simétricas se denominan asimétricas.
❖ El lado con menor cantidad de casos (el lado que parece una cola) es el lado al que nos referimos para nombrar la
dirección de la asimetría.
DD

❖ Una distribución asimétrica hacia la derecha se denomina también positivamente asimétrica. Una distribución
asimétrica hacia la izquierda se denomina también negativamente asimétrica.
DISTRIBUCIONES NORMALES Y CURTICAS:
Es suficiente destacar que la curva normal es unimodal y simétrica.
LA

El término curtosis se refiere al grado en el que la forma de una distribución difiere de la curva normal, principalmente con
respecto al hecho de que las colas sean más espesas o delgadas que las de la curva normal.

Los psicólogos utilizan procedimientos de estadística descriptiva para describir, es decir, para resumir y hacer fácilmente
FI

comprensibles un grupo de números obtenidos a partir de una investigación.


Una tabla de frecuencias organiza los números en una tabla en la que cada uno de los valores posibles aparecen en una
lista a lo largo del margen izquierdo, ordenado de mayor a menor, junto con la cantidad de observaciones que
corresponden a cada valor.


Cortada de Kohan “diseño estadístico”, capítulo 3


Cuando los datos obtenidos son sobre variables cualitativas que solo poseen la información correspondiente a escalas
nominales u ordinales, es importante establecer comparaciones entre las distintas clases o categorías. Para eso existen
algunas operaciones sencillas que suelen resultar muy útiles. Como proporciones, los porcentajes y las razones.
En los porcentajes hay 2 reglas muy importantes:
1) siempre hay que informar sobre el número de casos usado para la proporción o porcentaje.
2) no debe calcularse ningún porcentaje cuando la n total de casos es menor que 50.
Las razón de un número a respecto de otro b se define como el cociente a/b ej: las tasas de crecimiento.
También existen los números índice, que mide los cambios de una variable o de un grupo de variables, respecto del
tiempo. Por ejemplo, edad mental y edad cronológica, el número de índice sería COCIENTE INTELECTUAL.
REPRESENTACIONES GRÁFICAS:
1) GRÁFICOS DE BARRA O COLUMNA.

2) GRÁFICO SECTORIAL O PASTEL

Este archivo fue descargado de https://filadd.com


3) PICTOGRAMAS
Variables discretas: ej: número de hijos, cantidad de familias.
4) gráficos de barras
Variables continuas (se ordenan por rangos, ya que los datos numéricos son numerosos. Los gráficos para este tipo de
variables son histograma de Pearson, polígono de frecuencia).
5) distribución de frecuencias acumuladas: existen situaciones en las que es conveniente conocer la cantidad de
valores “mayores que” o “menores que” de un determinado valor. Se forma un curva en forma de s denominada
Ojiva de Galton
6) En cambio la curva de Lorenz es cuando empieza plana y luego asciende.

Hernandez Sampieri “metodologia de la investigacion” capitulo 10


OM
.C
DD
LA

Las frecuencias relativas son los porcentajes de casos de cada categoría, y las frecuencias acumuladas son las que se van
acumulando en cada categoría, desde la más baja a la más alta.
ESTADÍSTICA INFERENCIAL:
En esta rama de la estadística se intenta generalizar los resultados obtenidos en la muestra a la población o universo.
FI

Una hipótesis en este contexto es una proporción respecto de uno o varios parámetros, y lo que hace el investigador a
partir de la prueba de hipótesis, es ver si dicha hipótesis es congruente con los datos obtenidos en la muestra.
RAZONES Y TAZAS:


Una razón es la relación entre 2 categorías. Por ejemplo:


categorías frecuencia absoluta
masculino 60
femenino 30
La razón de hombres a mujeres es de 60/30=2, es decir, por cada 2 hombres hay una mujer.
Una tasa es la relación entre el número de casos, frecuencias o eventos de una categoría y el número total de
observaciones, multiplicada por un múltiplo de 10 generalmente 100 o mil.
fórmula:
​número de nacidos vivos en una ciudad ​x mil : 33.3… por ej entonces----- hay 33.3 nacidos vivos por cada mil habitantes
en la ciudad
número de habitante en la ciudad
La confiabilidad de un instrumento de medición se refiere al grado en que su aplicación repetida al mismo sujeto u objeto
produce resultados iguales.
La validez, en términos generales, se refiere al grado en que un instrumento realmente mide la variable que pretende
medir. Por ejemplo, un instrumento válido para medir la inteligencia debe medir la inteligencia y no la memoria.

Johnson y Kuby “estadística elemental” capítulo 2


Gráficas de pastel (gráficas circulares) y ​gráficas de barras ​Gráficas que se usan para resumir datos cualitativos, atributos o
categóricos. Las gráficas de pastel (gráficas circulares) muestran la cantidad de datos que pertenecen a cada categoría
como una parte proporcional de un círculo. Las gráficas de barras muestran la cantidad de datos que pertenecen a cada
categoría como un área rectangular de tamaño proporcional.

Este archivo fue descargado de https://filadd.com


Diagrama de Pareto Gráfica de barra con las barras ordenadas de la categoría más numerosa a la categoría menos
numerosa. Incluye una gráfica de línea que muestra los porcentajes acumulados y conteos de las barras.

DATOS CUANTITATIVOS
Distribución Patrón de variabilidad que muestran los datos de una variable. La distribución muestra la frecuencia de cada
valor de la variable.
Gráfica de puntos: Describe los datos de una muestra al representar cada valor de datos con un punto colocado a lo largo
de una escala. Esta escala puede ser horizontal o vertical. La frecuencia de los valores se representa a lo largo de la otra
escala.
DISTRIBUCIONES DE FRECUENCIA E HISTOGRAMAS:
Distribución de frecuencias Listado, con frecuencia expresado en forma de tabla, que relaciona los valores de una variable
con su frecuencia.
Puede haber una distribución de frecuencias no agrupadas, porque cada valor es independiente, en cambio cuando los

OM
datos son numerosos y se hace difícil el manejo de los mismos, se agrupan los valores en un conjunto de clases y se
denomina distribución de frecuencias agrupadas.
Histograma Gráfica de barras que representa una distribución de frecuencias de una variable cuantitativa. Un histograma
se constituye con los siguientes componentes: 1. Un título, que identifica la población o muestra de interés. 2. Una escala
vertical, que identifica las frecuencias en las diversas clases. 3. Una escala horizontal, que identifica a la variable x. Los
valores para los límites de clase o puntos medios de clase pueden etiquetarse a lo largo del eje x. Usa cualquier método de
.C
etiquetado de ejes que represente mejor la variable.
Características principales:
DD

❖ Se representan todas las categorías.


❖ Las columnas son de igual ancho, por intervalos de categorías iguales.
❖ no se pierden intervalos por estar vacíos.
❖ Las columnas son proporcionales a la frecuencia acumulada representada. y esta se suma para dar el área total de
una unidad.
LA

❖ Muestra una variable separada.



Asimismo existe lo que se llama FRECUENCIA RELATIVA, y designa la medida proporcional de la frecuencia por cada
ocurrencia, se basa en dividir la frecuencia por el total de las observaciones. Se puede representar como fracción decimal
FI

o PORCENTAJE. Hay 50 calificaciones, y la frecuencia de 55-65 es 7, por lo que se divide 50/7=0.14 o 14%.


Simétrico: Ambos lados de esta distribución son idénticos (las


mitades son imágenes especulares). Normal: Una distribución simétrica que se amontona en torno a la media y se
dispersa en los extremos. (Propiedades adicionales se discuten más adelante.) ​Uniforme (rectangular) Cada valor aparece
con igual frecuencia. Una cola se prolonga más que la otra. La dirección de asimetría está en el lado de la cola más larga.
Forma de J No hay cola al lado de la clase con la frecuencia más alta. ​Las dos clases más pobladas están separadas por una
o más clases. Con frecuencia, esta situación implica que se muestre dos poblaciones.
Gráficos de Barras=

Este archivo fue descargado de https://filadd.com


……………………………………………………………………………………………………………………………………………………
………………………………………………...
La moda es el valor que aparece con mayor frecuencia, la clase modal es la clase con la frecuencia más alta, una
distribución bimodal tiene 2 clases con frecuencia muy alta.
La frecuencia acumulada para una clase dada es la suma de la frecuencia para dicha clase y la frecuencia de todas las
clases de valores menores.
MEDIDAS DE DISPERSIÓN:
RANGO​ Diferencia entre el valor más alto y el valor más bajo.
DESVIACIÓN DE LA MEDIA ​una desviación de la media, es x -​ x, ​es la diferencia entre el valor x y la media​ x
0= media += x mas grande​ x​ -= x menor que​ x
desviación estándar:
Regla empírica Si una variable tiene distribución normal, entonces: 1) dentro de 1 desviación estándar de la media, habrá

OM
aproximadamente 68% de los datos; 2) dentro de 2 desviaciones estándar de la media, habrá aproximadamente 95% de
los datos; y 3) dentro de 3 desviaciones estándar de la media, habrá aproximadamente 99.7% de los datos. (Esta regla se
aplica específicamente a una distribución normal [con forma de campana], pero se aplica con frecuencia como una guía
interpretativa a cualquier distribución montada.)
.C
UNIDAD 4: Teoría de la probabilidad. Modelos binomial y normal
Garret, H “estadística en psicología y educación”. Capítulo 5
La probabilidad de un determinado acontecimiento se define como la frecuencia esperada de presentación de ese
DD

acontecimiento, entre otros de la misma índole.


La probabilidad se puede establecer matemáticamente como una razón.
cociente de probabilidad: ​resultado deseado
total de los resultados
LA

Si hay N factores independientes siendo idéntica la probabilidad de presencia o ausencia de cada uno, las probabilidades
“compuestas” de distintas combinaciones se expresan por el desarrollo del BINOMIO P+Q . Esto se implementa cuando
hay mayores casos independientes. Tiene que ser posible la ocurrencia de p & q y la no ocurrencia de p o q puesto que la
probabilidad tiene que tener como requisito p+q:1
FI

La curva normal o campana de Gauss demuestra con un alto grado de exactitud la frecuencia de ciertos hechos, esta es
simétrica y logró brindar resultados para distintos objetivos:
★ estadística biológicas: la relación entre nacimientos femeninos y masculinos en una comunidad determinada.
★ datos antropométricos: talla, peso.


★ datos sociales y económicos: índices de natalidad, nacimientos, sueldos, etc.


★ mediciones psicológicas: mediante test de inteligencia estandarizados.
★ errores de observación: medida de altura, velocidad de movimiento.

Asimetría: ​se dice que una distribución es asimétrica o sesgada cuando la media , moda y mediana caen en puntos
distintos.
Se dice que está sesgada negativamente a la izquierda cuando los puntajes se acumulan hacia el extremo alto de la escala
(hacia el derecho). Y al revés se denomina asimetría positiva.

Este archivo fue descargado de https://filadd.com


AS:​ 3(MEDIA-MEDIANA)
S
Curtosis​: Alude a la elevación o el aplastamiento de una distribución de frecuencias comparada con la normal. Más
puntiaguda se denomina LEPTOCÚRTICA, o más aplanada PLATICÚRTICA, también la curva normal denominada
MESOCURTICA.

Cu: ​ Q
P90-P10
0.263=curva normal
+0.263= platicúrtica
-0.263= leptocurtica
Estadística Descriptiva: Coolican capitulo 13

OM
Tendencia normal: Se refiere al valor, dentro de un grupo de valores, que es el más típico o la puntuación alrededor de la
cual se agrupan la mayoría de los demás. En un lenguaje normal, se conoce simplemente como “promedio”.
Dispersión: esta es una medición de qué tan cerca o tan lejos tienden a variar el resto de los valores alrededor de este
valor central o típico.
La​ Media​ como medida de tendencia central no es apta para valores extremos.
ventajas: ​Es la medida estadística más utilizada para los parámetros poblacionales.
.C
desventajas: ​Tiene alta sensibilidad, y esto puede ser contradictorio.
DD

La ​mediana ​no se afecta por valores extremos en una dirección, y por ello es mejor que la media con datos sesgados.
ventajas: Es más fácil de calcular que la media. (con grupos pequeños y sin valores iguales). No se afecta por valores
extremos en una dirección, y por ello es mejor que la media con datos sesgados. Se puede obtener cuando se desconocen
los valores extremos.
desventajas: ​No considera el valor exacto de cada unidad, no se puede utilizar en estimaciones de parámetros de
LA

población.Puede no ser representativa cuando son pocos valores.

La ​moda​ es da menos certeza que las anteriores, pero no se ve alterada por valores extremos.
ventajas: ​Muestra el valor más importante de un conjunto, no se afecta por valores extremos en una dirección, se puede
FI

obtener cuando se desconocen los valores extremos, es más informativa que la media cuando la distribución tiene forma
de U.
desventajas: ​No se considera el valor exacto de cada unidad, no se puede emplear en estimaciones de parámetros de


población, no es útil para conjunto pequeños de valores,no se puede estimar con certeza cuando los datos se agrupan en
intervalos de clase.
Intervalo: ​La media es la medida más sensible, pero solo debe utilizarse cuando los datos son de nivel de medición de
intervalo. De otro modo, la media se calcula sobre números que no representan cantidades iguales y la media es
engañosa.
Ordinal​: Si los datos no son de nivel intervalo, pero se pueden ordenar , entonces la mediana es la medición de tendencia
central apropiada.
Nominal:​ Si los datos están en categorías separadas discretamente, entonces se puede utilizar la moda.
La moda puede utilizarse con datos de nivel ordinal y de intervalo.
La mediana puede utilizarse con datos de nivel intervalo.

Una puntuación Z es el número de desviaciones estándar que un valor particular se aleja de la media.
la fórmula es: Z= x -​ x
………….
s
Glosario:
❏ Promedio: Término en lenguaje común para la tendencia central.
❏ Tendencia central: término formal para cualquier medida de valor típico o medio de un grupo.
❏ Intervalo de clase: Categorías en las que se divide una escala de datos continuos con el fin de resumir frecuencias.
❏ Dispersión: Término técnico para cualquier medida de la variación o distribución de los datos de una muestra o
población.

Este archivo fue descargado de https://filadd.com


❏ Bimodal: distribución con dos picos de frecuencia prominente, está SESGADA.
❏ Frecuencia acumulativa:De Distribución que muestra el total de números por encima o por debajo de cada intervalo
de clase.
❏ Sesgo negativo: Distribución no simétrica en relación con el centro vertical y que contiene mucho más valores bajos
que altos relativos a la moda.
❏ Sesgo positivo: Distribución no simétrica en relación con el centro vertical y que contiene muchos más valores altos
que bajos relativos a la moda.
❏ Polígono de frecuencia: Gráfica que muestra sólo los picos de intervalos de clase.
❏ Histograma: Gráfica que contiene el conjunto completo de datos continuos divididos en intervalos proporcionales.
❏ Desviación media: medida de dispersión: media de todas las desviaciones absolutas.
❏ Ojiva: Gráfica que muestra frecuencias acumulativas
➔ ​Rango semiintercuartílico: Distancia entre el primer y el tercer cuartil en una distribución continua.
➔ Valor Estándar: Sinónimo de puntuación Z.
➔ Varianza: Medida de Dispersión: el cuadrado de la desviación estándar.
➔ Puntuación Estándar: Medida de desviación individual: número de desviaciones estándar a la que está una
puntuación particular de la media de su muestra.

Distribución probabilística: Es un modelo teórico matemático basado en distribuciones empíricas. Es un patrón del modo
de distribución de las funciones teóricas de una variable aleatoria. Muestra la forma en la que se espera que los datos

OM
empíricos observados se distribuyen.

Modelo de distribución probabilística condiciones necesarias unidad de medida

curva normal • Variable cuantitativa continua • puntaje Z


Muestra grande (gran cantidad de
.C
casos) • Curva simétrica • Curtosis
media
DD

t student • Variable cuantitativa continua • puntaje t


Muestra chica (pocos casos) • Curtosis
leptocúrtica

binomial • Variable cuantitativa discreta • (p,q)


LA

Muestra grande

chi cuadrado • Variable cualitativa • Muestra


grande
Distribución probabilística normal​: la curva normal posee una función que se representa gráficamente con una curva
FI

continua que se define por su media aritmética y su desvío estándar. No hay una única curva normal sino infinitas. Muchos
de los fenómenos de las ciencias humanas se distribuyen como la curva normal dado que se tratan de variables aleatorias
continuas que al graficarlas se observa la forma típica de la campana de Gauss.


La distribución probabilística normal se usa como patrón para el análisis de datos obtenidos en las distribuciones
empíricas muestrales de observaciones concretas, brinda una aproximación teórica a la probabilidad de que se presente
un cierto valor de variable en estudio.
Proporciona el porcentaje de casos esperables hasta un cierto valor de variable. Brindó una manera de comparar los
rendimientos individuales en relación al rendimiento promedio del grupo.
Características de la distribución curva normal: 1. Es simétrica respecto al punto medio del eje horizontal, su forma
característica es de campana de Gauss
2. El punto por el que es simétrica es el punto por el que pasan tanto la media como la mediana y la moda (unimodal y
simétrica)
3. Las asíntotas nunca tocan el eje horizontal
4. Se sabe qué área se encuentra bajo la curva entre el punto medio y el punto en el que cae la desviación estándar
5. Presenta un trazado continuo, no como el polígono de frecuencia. Se concibe como representando la distribución de
infinitos casos en una variable continua

Concepto de normalidad estadística: se dice que alguien tiene un rendimiento estadísticamente normal si su puntuación
está entre la media y un valor de desvío estándar sea negativo o positivo, viéndolo desde el punto de vista de la escala de
percentiles estaría entre el percentil 16 y el percentil 86 (68,26% central de los casos).

Este archivo fue descargado de https://filadd.com


La curva normal tiene 6 aplicaciones:

1. Compara el rendimiento individual con respecto del grupo al cual un individuo pertenece
2. Compara el rendimiento de un mismo sujeto a varias pruebas diferentes
3. Averigua la probabilidad de ocurrencia de un determinado evento o el porcentaje de casos esperables de ser
observados por debajo de un puntaje o entre dos puntajes determinados
4. Averigua hasta qué puntuación o entre que puntuaciones se encuentra con cierta probabilidad de ocurrencia de un
evento o cierto puntaje
5. Clasifica o divide un grupo en sus grupos a los que se les puede asignar categorías diagnósticas
6. Se aplica en el campo de la estadística inferencial para la estimación de parámetros y en la prueba de hipótesis.
Modelo binomial​: Una distribución binomial es una distribución de probabilidad discreta que describe el número de éxitos
al realizar experimentos independientes entre sí, acerca de una variable aleatoria.
Las propiedades de este tipo de distribución son:
• Cada ensayo debe tener sólo dos posibles resultados.
• La probabilidad de éxito ha de ser constante, esta probabilidad es representada con la letra p.
• La probabilidad de fracasos también ha de ser constante, esta probabilidad se representa mediante q = 1 – p (esta
ecuación nos ayuda a saber alguna de estas constantes si tenemos información sobre la otra).
• El resultado de cada experimento debe ser independiente a la anterior, por esta misma razón lo que ocurra en cada

OM
experimento no afectará al siguiente.
• Los sucesos deben ser mutuamente excluyentes, o sea que no se puedan dar los dos al mismo tiempo.
• qué sucesos son colectivamente exhaustivos lo cual quiere decir que al menos uno de los dos ha de ocurrir. Si no sale
cara sale cruz. Con respecto a la fórmula, no es el número de ensayos, x es el número de éxitos, p es la probabilidad de
éxito y q es la probabilidad de fracaso.
.C
puntuaciones Z:
Puntuaciones z: es la transformación de una observación que describe mejor al lugar que es observación ocupa en la
distribución. indica a qué cantidad de desvío estándar por encima de la media se encuentra dicha observación en el caso
DD

de ser positivo o bien por debajo de la media si es negativo.


Puntuación z como patrones de comparación generalizados: otra ventaja de la puntuación z es que, convirtiendo las
observaciones de variables completamente diferentes en puntuaciones z, podemos compararlas entre sí.
Con la puntuación z la media siempre es igual a 0 y el desvío estándar es siempre igual a 1.
LA

Si queremos convertir una puntuación bruta en una puntuación z debemos calcular el desvío (restar la media a la
puntuación bruta) y calcular la puntuación z (dividir el desvío por el desvío estándar)
Para convertir una puntuación z de puntuación bruta debemos calcular el desvío (multiplica la puntuación z por el desvío
estándar.
FI

El desvío estándar de una distribución de puntuaciones z siempre es exactamente 1. Las puntuaciones z se denominan a
ese es puntuación estándar debido a que representan valores estándares para la media y el desvío estándar. También se
debe a que las puntuaciones z brindan una especie de escala de medición estándar para cualquier variable. Andar) y
calcular la puntuación bruta (sumar la media al desvío).


Desviación semi intercuartil​: se trata de la mitad de la distancia que hay entre los cuartiles 1 y 3, se simboliza Q. Se
corresponde con la mediana. Esta medida tiene en cuenta sólo aquellos dos valores que delimitan al 50% central de los
casos de la distribución, lo cual puede llegar a ser una desventaja. Q= (C3 – C1) / 2. Su ventaja es que es representativo del
grupo central de valores, además de que es sencillo de calcular. Su desventaja es que no considera valores extremos y que
es inexacto cuando se trata de intervalos largos de clase.

C) Desvío estándar​: es la raíz cuadrada de la varianza, para calcular la primera es necesario calcular la varianza y luego
sacar su raíz cuadrada. El desvío estándar es el promedio de las diferencias entre las observaciones y la media. Es la
medida de variabilidad más utilizada, es la que preferimos utilizar cuándo utilizamos la media aritmética como medida de
tendencia central. Se trata de la raíz cuadrada del promedio de los desvíos en la media elevados al cuadrado. El desvío
estándar nos dice cuánto se alejan, en promedio, todas las observaciones de la distribución correcta a la media aritmética.
Para esta medida de variabilidad valen las mismas consideraciones que hicimos con respecto a la media aritmética. Se
simboliza S.
Dos propiedades del S:
1) Si al valor de cada observación de la muestra se le suma o se le resta una constante el desvío estándar permanecerá
igual, en cambio, si a esos valores se los multiplica o se los divide por una constante el desvío estándar quedará
modificado de la misma manera.

Este archivo fue descargado de https://filadd.com


2) El desvío estándar puede emplearse también como una unidad de medida a la hora de comparar distribuciones de
variables que están expresadas en unidades diferentes o que provienen de muestras distintas. Cuando mayor es la
dispersión de los datos alrededor de la media, mayor es la desviación estándar

UNIDAD 5: Correlacion y regresion

OM
Coolican “metodos de investigacion y estadistica en Psicologia”. capítulo 18
La correlación es la medición del grado en el que pares de valores relacionados en dos variables tienden a cambiar juntos.
También proporciona una medición del grado en el que pueden predecirse los valores de una determinada variable, a
partir de los valores de la otra variable.
Si una variable se incrementa con la otra, la correlación es positiva +1.
.C
Si una variable desciende con otra, la correlación es negativa -1.
Si hay ausencia de correlación, se muestra un valor cercano a 0.
Coeficiente de correlacion de Pearson:
DD

basados en la varianza de dos conjuntos de puntuaciones, es allí cuando aparecen desviaciones grandes.
​El coeficiente de correlación de Pearson es una prueba que mide la relación estadística entre dos variables continuas. Si la
asociación entre los elementos no es lineal, entonces el coeficiente no se encuentra representado adecuadamente.
LA

¿Cómo interpretar el coeficiente de correlación de Pearson?


FI


Interpretación del valor del índice de correlación

1. Si r = 1: ​Correlación​ positiva perfecta. ...


2. Si 0 < r < 1: Refleja que se da una ​correlación​ positiva.
3. Si r = 0: En este caso no hay una relación lineal. ...
4. Si -1 < r < 0: Indica que existe una ​correlación​ negativa.

correlación positiva perfecta: asciende hacia la derecha.


correlación negativa perfecta: asciende hacia la izquierda.

Este archivo fue descargado de https://filadd.com


Correlación de Rango de Spearman​: obtiene el rango de los valores de cada variable y una fórmula especial de caso utiliza
diferencias entre estos pares de rangos. El caso general es calcular la r de Pearson en los pares de rangos y esto se hace
cuando existen rangos igualados.
Diagrama de dispersión: puede demostrar la fuerza de la correlación y si la relación tiene alguna propiedad peculiar.
Muestra la dispersión de los pares.
Los usos comunes de la correlación en psicología son:
1. Evaluación de la confiabilidad de las escalas, pruebas y cuestionarios.
2. Análisis factorial.
3. estudios gemelos.
4. en regresión múltiple.
El cálculo de la correlación entre 2 variables es una medida descriptiva. Medimos la cercanía entre 2 variables. Evaluar la
correlación para la significación es deductivo.
La fuerza de la relación entre 2 variables es el grado en el cual una variable tiende a ser alta si la otra lo es o al revés.
La cifra que se llega para expresar esa relación es el COEFICIENTE DE CORRELACIÓN.
SIGNIFICACIÓN Y COEFICIENTES DE CORRELACIÓN:
Si la fuerza de correlación es +1, osea perfecta, esto no significa que el coeficiente de correlación sea significativo, hay que
tener en cuenta la probabilidad,​ número de resultados esperados, ​si la probabilidad es de​ 1 ​entonces es de 0.167.
número de resultados posibles 6
Esto no es suficientemente bajo para ser significativo. Requerimos un valor menor que 0.05.

OM
.C
VARIANZA ESTIMADA O COEFICIENTE DE DETERMINACIÓN:
Un coeficiente bajo puede decirnos entre 2 variables son significativas, aunque conectadas con debilidades. Por otro lado,
el coeficiente de correlación no es una escala de razón. Una correlación de 0.6 no es el doble de “buena” o predictiva de
DD

una de 0.3.
Una manera de convertir estas cifras a una escala de razón es elevar al cuadrado el valor del coeficiente, es decir, obtener
r°(2). Se denomina Varianza Estimada.
Cualquier grupo de puntuaciones tiene una variación dentro de sí, lo que conocemos como varianza. Tiene ambas
LA

puntuaciones . Nuestro resultado para dos grupos, de un ejemplo, fue de 0.93, si lo elevamos al cuadrado daría como
resultado 0.86. Se dice ahora que el 86% de la variación en y se puede predecir en la variación de x. El otro 14% se
considerará por errores aleatorios de ejecución o alguna diferencia entre la prueba nueva y la anterior. La estimación de la
varianza se hace utilizando el COEFICIENTE DE DETERMINACIÓN. Este valor es r°(2) x100, el cual es simplemente el valor
FI

r°(2), expresado anteriormente como porcentaje.


Si analizamos un caso desde la Regresión Múltiple, es posible sumar el poder de predicción de varias variables y entonces
obtener una combinación mucho mejor de variables predecibles. Por ejemplo en la predicción de la agresión de un niño a
sí mismo, también se tendrá en cuenta la cantidad de programas violentos de televisión que se ven, actitud de los padres


hacia la agresión física, el comportamiento de los hermanos y demás.

Diagrama de dispersión: puede demostrar la fuerza de la correlación y si la relación tiene alguna propiedad peculiar.
Muestra la dispersión de los pares.
Los usos comunes de la correlación en psicología son:
5. Investigación Ex post Facto: ejemplo: cantidad de cigarros fumados y nivel de ansiedad, actitudes ante el sexismo, y
ante el racismo, locus del control y estrés experimentado ante el trabajo.
6. Evaluación de la confiabilidad de las escalas, pruebas y cuestionarios. Se utiliza más comúnmente en el test retest,
donde se evalúan 50 personas y después esas mismas personas luego de 6 meses. Y posteriormente se realiza una
correlación entre 2 grupos de puntuaciones.
7. Análisis factorial. Este utiliza una matriz de todas las correlaciones posibles entre varias pruebas, realizadas por los
mismos individuos.
8. estudios gemelos. estimaciones de heredabilidad y CI heredado.
9. en regresión múltiple.
El cálculo de la correlación entre 2 variables es una medida descriptiva. Medimos la cercanía entre 2 variables. Evaluar la
correlación para la significación es deductivo.
La fuerza de la relación entre 2 variables es el grado en el cual una variable tiende a ser alta si la otra lo es o al revés.
La cifra que se llega para expresar esa relación es el COEFICIENTE DE CORRELACIÓN.
Glosario:
● significación: medición de sí una correlación tendió a ocurrir al azar o no.

Este archivo fue descargado de https://filadd.com


● coeficiente de determinación: Porcentaje de variación en una variable predecible desde otra, utilizando el
coeficiente de correlación entre ellas.

Rectas de Regresión:

Pero ​¿qué utilidad tiene la recta de regresión?

En la tabla de valores de la variable talla - peso, solamente nos dan los valores de un determinado número de personas (10
en este caso): las personas de las que se conocen dichos valores. Mediante la recta de regresión podríamos obtener de
manera aproximada el peso de una persona de la que conociéramos la talla, en una población semejante a aquella de la
que se ha obtenido la muestra.

Si observamos la gráfica anterior, podríamos suponer por ejemplo que una persona de 185 cm pesaría algo más de 80 kg.

De manera más precisa, si conocemos la expresión de la recta de regresión, se pueden calcular valores para la variable y,
conocidos los de x, como si se tratara de una función.

OM
.C
y= bx +a
DD

El principal propósito del análisis de  correlación  lineal  ​es medir la fuerza de una relación lineal entre dos variables.
Examina algunos diagramas de dispersión que demuestren diferentes relaciones entre entrada, o variables
independientes, x y salida o variables dependientes, y. Si, conforme no hay desplazamiento definido en los valores de y ,
se dice que no hay correlación, o no hay relación entre x y y. Si, conforme x aumenta, hay un desplazamiento en los
LA

valores de y, entonces existe una correlación. La correlación es positiva cuando y tiende a aumentar, y negativa cuando y
tiende a disminuir. Si los pares ordenados (x, y) tienden a seguir una trayectoria en línea recta, existe una correlación
lineal.
FI

El coeficiente de correlación lineal es la medida numérica de la fuerza de la relación lineal entre 2 variables. El coeficiente
refleja el efecto que un cambio en la variable tiene sobre la otra.

EL ​análisis de regresión encuentra la ecuación de la recta que mejor describe la relación entre dos variables. Un


uso de esta ecuación es realizar predicciones. Las predicciones se usan regularmente, por ejemplo, para predecir el éxito
que un estudiante tendrá en la universidad con base en los resultados del bachillerato y para predecir la distancia
requerida para frenar un automóvil con base en su rapidez. Por lo general, el valor exacto de y no es predecible y
comúnmente uno está satisfecho si las predicciones son razonablemente cercanas.Rentar un automóvil con base en su
rapidez.

La relación entre dos variables será una expresión algebraica que describa la relación matemática entre x y y. He aquí
algunos ejemplos de varias posibles relaciones, llamados modelos o ecuaciones de predicción:

Lineal (línea recta): y = b0 + b1 x


Cuadrático: y = a + bx + cx2
Exponencial: y = a(bx )
Logarítmico: y = a logb x.

Cuando los datos bivariados parecen caer a lo largo de una línea recta sobre el diagrama de dispersión, sugieren una
relación lineal. Pero esto no es prueba de causa y efecto. Claramente, si un jugador de básquetbol comete muchas faltas,
no anotará más puntos. Los jugadores con problemas de faltas “montan el pino” sin posibilidad de anotar. También parece
razonable que, mientras más tiempo de juego tengan, más puntos anotarán y más faltas cometerán. Por tanto, existirá
una correlación positiva y una regresión positiva entre estas dos variables. Aquí el tiempo es una variable oculta.

Este archivo fue descargado de https://filadd.com


Grasso “introducción a la estadística en Ciencias sociales y del comportamiento ``. Capítulo 14
Análisis de la Varianza:
Esto se implementa para la posibilidad de aislar los efectos de una variable dada de aquellos producidos por diferencias
que podrían existir entre los individuos.
Se denominan tratamientos a las condiciones de cada uno de los grupos, en que se separó la muestra, en lo que hace a la
variable independiente.
La idea es la de separar la varianza total de la muestra en dos componentes aditivos: una de ellas debida a los efectos de
la variable independiente y otra en la que se contemplan los efectos debido al resto de las variables que no se consideran
en el modelo.
Cuando se tienen datos de escalas intervalares o proporcionales, los procedimientos de análisis de las relaciones entre
variables permiten:
1. determinar la existencia o no de correlación.
2. medir el grado de correlación cuando esta existe.}
3. Precisar la “forma” de la relación.
4. Resumir el conjunto original de datos, de los que parte el análisis, en una expresión matemática simple.
5. Estimar el valor de una variable a partir del valor correspondiente de la otra.
 
Grasso “introducción a la estadística en psicología y Cs. sociales” capítulo 7 

OM
El estudio de la correlación entre variables se limitará, en este curso, el caso de dos variables, la más simple, la relación
bivariable es la base para el desarrollo de los procedimientos multivariables, utilizados en las ciencias sociales y psicología.
Una de las variables lleva el nombre de variable “independiente”, (X), es aquellas que el investigador de algún modo
“controla”. También puede decirse que es aquella que en el contexto del planteo del problema (consideraciones teóricas
en que se basa el experimento), aparece como causa o explicación de los valores de la otra variable. O es aquella a partir
.C
de la cual se puede estimar el valor de la otra.
Por otro lado la variable dependiente o Y, es la que el investigador no controla directamente, aparece como efecto o
consecuencia de la independiente o como fenómeno a explicar. Es también aquella cuyos valores interesa anticipar a
DD

partir del conocimiento de la otra.


A veces no es posible distinguir una variable independiente y otra dependiente, como por ejemplo cuando se
correlacionan 2 rasgos de personalidad. En ese caso cualquiera se puede llamar X .
LA

DIAGRAMAS DE DISPERSIÓN:
❖ Para dibujarlo se recurre al sistema de coordenadas cartesianas. En el eje horizontal se consignan los valores de la
variable independiente (X) y en el eje vertical, los de la dependiente (Y).
❖ Una relación es lineal cuando una variación de un valor determinado en X le corresponde siempre una variación de
FI

un valor determinado en Y.
❖ Si es una línea diagonal hacia la derecha, se denomina RELACIÓN LINEAL DIRECTA (PERFECTA).
❖ Si es ascendente hacia la derecha pero no recta es NO LINEAL DIRECTA.
❖ Si es una línea diagonal hacia la izquierda es RELACIÓN LINEAL INVERSA .


❖ Si es línea diagonal hacia la izquierda pero no recta es NO LINEAL INVERSA.


❖ Ejemplo: variable independiente: edad, madurez - variable dependiente: errores.
❖ Ecuación de una recta: Y=mX + K. Donde X e Y representan las variables, myn representan los valores constantes
que dependen de cada relación específica.

RECTA Y ECUACIÓN DE REGRESIÓN:

Si consideramos viable un modelo lineal, se tratara de ajustar una recta a la nube de puntos. Obviamente la recta no podrá
pasar por todos los puntos pero puede pensarse que pase tan cerca como sea posible de cada uno de ellos.
La recta que mejor se adapte o ajuste a los puntos dejará algunos por debajo y otros por arriba. Y se llamará recta de
regresión minimo cuadratica.

Este archivo fue descargado de https://filadd.com


La ecuación de la regresión expresa cual es la relación entre las variables X e Y. Nos dice que la relación es lineal y nos da
su forma precisa, al especificar cuales son exactamente los valores de M y K. También podemos decir que con esta
ecuación resumimos los datos. Así como también nos permite calcular o estimar el valor de Y (variable dependiente) que
corresponde a un valor X cualquiera de la variable independiente.
La ecuación de regresión permite estimar el valor Y no solo para los valores X realmente observados en el estudio, lo que
es de un interés relativo, sino también el que corresponderá a otros valores X que no son observados en esa oportunidad.

Debe subrayarse que la existencia de una relación estadística entre 2 variables no implica una relación causal entre ellas. Si
entre 2 variables hay relación causal, habrá también relación estadística, pero no a la inversa.
Ficha de cátedra chi cuadrado: 

Dos sucesos son independientes si la probabilidad de que suceda uno no afecta a la probabilidad de que suceda el otro,
(p - a )= p (a)p(b)
La prueba Chi cuadrado es una prueba no paramétrica que se usa para varias cosas pero que acá vamos a estudiar como
prueba de independencia.
Sería: ¿las dos variables están asociadas?¿puedo decir que son independientes? ¿la probabilidad de que una tome cierto
valor ¿tiene que ver con la probabilidad de que la otra adquiera cierto otro valor?

OM
.C
DD
LA
FI


​ ruebas no paramétricas​ son aquellas que se encargan de analizar datos que no tienen una distribución
Las p
particular y se basan en una hipótesis, pero los datos no están organizados de forma normal. Aunque tienen
algunas limitaciones, cuentan con resultados estadísticos ordenados que facilitan su comprensión.

​ ruebas paramétricas​, en cambio, se basan en las leyes de distribución normal para analizar los
Las p
elementos de una muestra. Generalmente, solo se aplican a variables numéricas y para su análisis debe
mantener una población grande, ya que permite que el cálculo sea más exacto.

Este archivo fue descargado de https://filadd.com


Tenemos 2 variables cualitativas y queremos ver si están asociadas. Nuestras hipótesis son:
● Hipótesis Nula (HO): las variables son independientes entre sí.
● Hipótesis alternativa (H1): las variables están asociadas entre sí.
Lo que hacemos es rechazar la hipótesis nula para aceptar la alternativa. Recordemos que si no rechazamos la hipótesis
nula NO SIGNIFICA QUE LA ACEPTEMOS.
La hipótesis nula no se acepta: se rechaza o no se rechaza. Y si no se rechaza es solamente que no tenemos evidencia
suficiente para rechazarla, pero no significa que la estemos aceptando. (y esto vale para todas las pruebas estadísticas)

¿qué significa esto?

OM
Es la suma de los valores esperados menos los observados, elevando al cuadrado,dividido por los valores esperados.
Los valores observados son los de la tabla de doble entrada que vimos más arriba.
Son los valores observados en la muestra, en nuestros datos.
Los valores esperados son los que esperamos ver si las dos variables fueran independientes.
La ​definición de independencia: si dos eventos son independientes, entonces la probabilidad de que se den juntos es igual al
.C
producto de las probabilidades. ​p(AnB)=p(A) P(b).
Si por ejemplo tengo 2 probabilidades multiplicó la N (cantidad de gente por la probabilidad de pertenecer al grupo que ve
una aplicación de photoshop y por la probabilidad de querer realizarse un cirugía estética.
DD

Para sacar la probabilidad esperada hay que cada celda(35) multiplicarlo por el total de la columna(38) que le corresponde
dividido por el total (70)

ver aplicación :si ver aplicación:no total


LA

cirugía estética :si 8 (19) 30 38

cirugía estética no 27 5 32
FI

total 35 35 70

El total 35 y el total 38 de arriba son los dos marginales que se multiplican (total fila y total columna) y el total 70 es el que
se divide. Entre paréntesis aparece la ​frecuencia esperada de personas que ven la aplicación y se realizan una cirugía


estética, si es que las dos variable fueran independientes.


Vemos que la frecuencia esperada es bastante distinta a la observada.
Ahora si se calcula el estadístico CHI CUADRADO. Para cada celda hacemos la resta entre el observado y el esperado y
elevamos el resultado al cuadrado. Luego lo dividimos por el esperado y sumamos todo.
Lo siguiente es solo un ejemplo resumido.

observado esperado obs-esp (obs -esp)°2 ((obs-esp)°2 )/ e

8 19 -11 121 63684

30 19 11 121 63684

total 127.368

Este archivo fue descargado de https://filadd.com


El estadístico chi cuadrado nos dio 127.368.
El paso siguiente es ver si el VALOR P es menor o no al nivel de significación.
El valor P es la probabilidad de ver un valor tan extremo como el que estamos observando si la hipótesis nula es cierta. Por
ejemplo, en nuestro ejemplo. el p valor nos da la probabilidad de ver un valor del estadístico chi cuadrado tan grande
como 27368 si la hipótesis nula es cierta.
La pregunta que nos responde este valor es ¿qué probabilidad hay de ver un valor así de grande del estadístico chi
cuadrado si las variables son independientes. ?
Si el valor p es menor a 0.05 entonces se rechaza la hipótesis nula de independencia.
LA HIPÓTESIS NULA NUNCA SE ACEPTA, SINO QUE SE RECHAZA O NO SE RECHAZA.
La prueba chi cuadrado es una prueba no parametrica, no necesita reconoce ciertos parametros como sexo y edad, y no
necesita entonces una media,desvio estandar, sino que solo necesit reconocer la distribucion de los datos.

Resumen de los pasos a seguir para el cálculo estadístico de chi cuadrado:


1) Encontrar las frecuencias observadas,reales, de cada categoría.
2) Determinar las frecuencias esperadas para cada categoría.
3) Calcular las frecuencias observadas menos las esperadas para cada categoría
4) Elevar al cuadrado las diferencias de cada categoría

OM
5) Dividir cada diferencia cuadrática por la frecuencia esperada para cada categoría.
6) Sumar los resultados del paso 5 de todas las categorías.
7) Si es menor que 0.05 entonces se rechaza la hipótesis nula, sino, no se rechaza.
El 0.05 es el nivel de significación.
La situación de ausencia de relación entre las variables en una tabla de contingencia se denomina INDEPENDENCIA.
.C
Grados de libertad:

Gl = (n° columnas-1)(n° filas -1)


DD

Las pruebas chi-cuadrado son pruebas de hipótesis para variables nominales. El chi-cuadrado mide el grado de
discrepancia entre frecuencias esperadas y observadas de varios niveles o categorías.
La prueba de chi-cuadrado de BONDAD DE AJUSTE se utiliza para probar la hipótesis de que una distribución de
frecuencias de dos o más categorías de una variable nominal coincide con una distribución esperada. (las distribuciones
LA

esperadas se basan en una teoría, o en una observación de otro estudio o circunstancia.


La prueba de chi cuadrado de independencia se utiliza para probar la hipótesis sobre la relación entre 2 variables
nominales, es decir, si el esquema de repetición de los participantes en la categoría de una variable tiene el mismo patrón
proporcional dentro de cada una de las categorías de otra variable.
FI

Pardo. A y San Martín.R ANÁLISIS DE DATOS EN PSICOLOGÍA II 


CAPÍTULO 3 


Tabla de frecuencias:
Una tabla o distribución de frecuencias es una forma particular de ordenar los datos basada en los valores concretos que
adopta una variable categórica y en el número de veces que se repite cada valor. El objetivo de una tabla de frecuencias es
organizar la información y también resumirla.
La primera columna de la tabla recoge los tres valores de la variable. La segunda columna muestra las frecuencias
absolutas , es decir, el número de veces que se repite cada valor.La tercera columna contiene las frecuencias relativas, las
cuales se obtienen dividiendo las correspondientes frecuencias absolutas entre el número total de casos.
Estas frecuencias indican la proporción de veces que se repite cada valor (también se les llama proporciones).
Multiplicando por 100 las frecuencias relativas definidas anteriormente, se obtienen las frecuencias porcentuales (%).
Estas frecuencias indican el porcentaje de veces que se repite cada valor. Puesto que la información que ofrecen las
frecuencias relativas y las porcentuales es idéntica, no es necesario incluir ambas en una misma tabla de frecuencias.
Esta variable es categórica, al igual que el tabaquismo; pero, a diferencia de ésta, el nivel de estudios es una variable
ordinal (sus categorías están cuantitativamente ordenadas). En estos casos es posible calcular un tipo particular de
frecuencias llamadas ​acumuladas. (por ejemplo frecuencias relativas acumuladas; 0.01,0.05,0.08 etc, se van sumando
cada valor mas el anterior).
La frecuencia absoluta acumulada recoge el número de veces que se repite un valor más cualquier otro inferior a él. La
frecuencia relativa acumulada se obtiene dividiendo la frecuencia absoluta acumulada entre el número total de casos Y la
frecuencia porcentual acumulada (%) se obtiene multiplicando por 100 la frecuencia relativa acumulada (%).
Las frecuencias absolutas constituyen el punto de referencia de una tabla de frecuencias: todas las demás frecuencias se
calculan a partir de las absolutas.

Este archivo fue descargado de https://filadd.com


La tabla de frecuencias no conviene para variables cuantitativas.
A pesar de su aparente simplicidad, una tabla o distribución de frecuencias contiene casi toda la información que encierra
una variable categórica. Ofrece información útil sobre tres aspectos importantes. En primer lugar, indica qué valores toma
la variable representada.
En segundo lugar, informa sobre qué valores son más frecuentes o se repiten más y qué valores son menos frecuentes o
se repiten menos (por ejemplo, algo más de la mitad de los sujetos no fuma; un uno por ciento de los sujetos no tiene
estudios, etc.).
Por último, en el caso de variables categóricas ordinales, las frecuencias acumuladas indican cuántos sujetos alcanzan un
determinado valor o están por encima de él (por ejemplo, aproximadamente el 60% de los sujetos no pasa de estudios
obligatorios, es decir, secundarios).
Por tanto, de las tres propiedades o características a las que conviene prestar atención para describir apropiadamente una
variable (centro, dispersión y forma de la distribución), una tabla de frecuencias ofrece información precisa sobre dos de
ellas: el centro y la forma de la distribución.
La dispersión (grado de concentración o alejamiento de los valores en torno al centro de la distribución), la información de
una tabla de frecuencias es poco precisa. Sabemos que la dispersión es mínima o nula cuando todas las frecuencias están
concentradas en un mismo valor y máxima cuando están repartidas homogéneamente por todos ellos.

Las ​variables dicotómicas son variables categóricas que toman sólo dos valores: acierto-error,verdadero-falso,
recuperados-no recuperados, a favor-en contra, funciona-no funciona, etc.Muchas de estas variables se obtienen

OM
registrando la presencia-ausencia de algún evento (por ejemplo, la presencia-ausencia de un tratamiento, o de un
síntoma); otras muchas se obtienen dicotomizado variables cuantitativas (por ejemplo, aprobados-suspensos,
hipertensos-no hipertensos, etc.).
La distribución binomial ​permite conocer la probabilidad asociada al número de éxitos (o de fracasos) obtenidos en un
conjunto de ensayos de Bernoulli, es decir, la probabilidad de obtener un determinado número de caras en un conjunto
.C
de lanzamientos de una moneda,un determinado número de aciertos en un conjunto de respuestas, un determinado
número de recuperaciones en un conjunto de pacientes tratados, etc. Por tanto, la distribución binomial sirve para
trabajar con variables dicotómicas.
DD

En general, una hipótesis estadística surge a partir de una hipótesis científica. Pero entre una hipótesis científica y una
hipótesis estadística no existe una correspondencia exacta. La primera proporciona bases para la formulación de la
segunda, pero no son la misma cosa. Mientras una hipótesis científica se refiere a algún aspecto de la realidad, una
LA

hipótesis estadística refiere a algún aspecto de una distribución de probabilidad. Por otro lado, tenemos que tener en
cuenta que hay varias formas de representar una hipótesis científica en una hipótesis estadística. Una vez determinada la
hipótesis estadística a partir de la hipótesis científica se pasa al contraste de hipótesis.
El contraste de hipótesis se basa en dos hipótesis: una hipótesis alternativa o H1, y una hipótesis nula o H0. La H1 es la
FI

negación a la H0. Suelen plantearse como hipótesis rivales.


La regla de decisión​: es el criterio que vamos a utilizar para decidir si la hipótesis nula planteada debe ser o no ser
rechazada. Este criterio se basa en la partición de la distribución muestral del estadístico de contraste en dos zonas
mutuamente exclusivas: la zona de rechazo y la zona de aceptación.


La primera, también llamada zona crítica, es el área de la distribución muestral que corresponde a los valores estadísticos
de contraste que se encuentran tan alejados de la afirmación establecida en H0 que es poco probable que ocurran su H0
es verdadera.
La zona de aceptación es el área de distribución muestral que corresponde a los valores del estadístico de contraste
próximos a la afirmación establecida por H0. Es, por tanto, el área correspondiente a los valores estadísticos de contraste
que es probable que ocurran si H0 es aceptada.
La decisión: planteada la hipótesis, formulados los supuestos, definido el estadístico de contraste y su distribución
muestral, y establecidas las reglas de decisión, el paso siguiente consiste en obtener una muestra aleatoria de tamaño n,
calcular el estadístico de contraste y tomar una decisión.
Tal decisión siempre se toma respecto a H0. Cuando decidimos mantener una hipótesis nula, queremos significar con ello
que consideramos que esa hipótesis es compatible con los datos. Si decidimos rechazarla, queremos significar con ello que
consideramos probado que esa hipótesis es falsa. La razón por la que esto es así es doble.
Por un lado, raramente es posible afirmar que H1 no es verdadera, las desviaciones pequeñas de H0 forman parte de H1.
Por esta razón, cuando mantenemos H0, de alguna manera también mantenemos algunos valores de H1.
Llamamos error de tipo I al que se comete cuando se decide rechazar H0 que en realidad es verdadera, y es un valor
conocido.
Llamamos error del tipo II al que se comete cuando se decide mantener una H0 cuando en realidad es falsa, y es un valor
desconocido.
CAPÍTULO 4: 

Este archivo fue descargado de https://filadd.com


★ Organizar y resumir (es decir, describir) los valores de una ​variable cuantitativa ​requiere utilizar herramientas algo
más sofisticadas. Pero sigue siendo necesario prestar atención a tres propiedades básicas:centro,dispersión y forma
de la distribución.
★ Los estadísticos diseñados para identificar el centro de una variable suelen agruparse bajo la denominación de
medidas de
★ tendencia central. Los estadísticos que permiten cuantificar el grado de dispersión(alejamiento) de las
puntuaciones respecto de su centro suelen agruparse bajo la denominación de medidas de dispersión, aunque
también pueden encontrarse con la denominación de medidas de variación o de variabilidad . Y los estadísticos que
sirven para describir la
★ La forma de la distribución suelen prestar atención a dos características:asimetría y curtosis.
★ El objetivo es el de ubicar a los sujetos individualmente considerados en la posición relativa que ocupan respecto
del resto de sujetos de su grupo: los cuantiles.
★ La desviación media y la desviación media absoluta, las desviaciones se toman en valor absoluto y su suma se
divide por el número de puntuaciones para obtener la desviación promedio.
★ La media de las desviaciones recoge la idea de dispersión respecto del valor central (la media)y representa el
promedio del conjunto de distancias a la media.
★ La varianza es el promedio de las desviaciones cuadráticas de la media,es decir, el promedio de las desviaciones de
la media elevadas al cuadrado. Se trata, por tanto,de una media de cuadrados (o, como suele denominarse en
algunos contextos, una media cuadrática).

OM
★ Se dice que un estadístico es ​resistente cuando es poco sensible a la presencia de anomalías en los datos. Esta
propiedad es particularmente útil cuando se trabaja con distribuciones asimétricas, es decir, con distribuciones que
contienen casos muy alejados del centro por uno de los dos extremos de la distribución.
★ La media aprovecha las propiedades cuantitativas (de intervalo o razón) de los datos. La mediana, sin embargo, sólo
aprovecha sus propiedades ordinales.
.C
★ El grado de parecido entre estos estadísticos depende, básicamente, de la forma de la distribución de la variable: si
la distribución es simétrica, todos los estadísticos toman el mismo valor;la diferencia entre ellos va aumentando
conforme aumenta el grado de asimetría.
DD

★ La media aritmética utiliza las propiedades cuantitativas de los datos y se basa en una ponderación uniforme de
todos ellos. Esto la convierte en un estadístico muy sensible (poco resistente) a la presencia de asimetría en la
distribución de los datos
★ la forma de la distribución,además de ayudar a elegir entre estadísticos, es útil por sí misma: permite obtener una
LA

visión rápida de las características de la variable, detectar valores anómalos (valores que no se parecen al resto),
advertir inconsistencias en los datos (valores que se repiten demasiado o valores que no aparecen), etc. Por tanto,
conocer la forma de una distribución tiene un interés comparable al de identificar su centro o cuantificar su
dispersión.
La ​asimetría s​e refiere a la forma en que los datos se distribuyen por encima y por debajo del centro. En una
FI


distribución simétrica, las distribuciones a cada lado del centro tienen la misma forma (una es espejo de la otra). La
simetría se rompe cuando existen casos que se alejan del centro más por uno de los extremos que por el otro.
Cuando los casos más alejados del centro se encuentran en la zona alta de la distribución, decimos que existe


asimetría positiva; cuando se encuentran en la zona baja,asimetría negativa.


★ La Curtosis ​de una distribución se refiere a su grado de apuntamiento. Esta característica se valora por
comparación con una distribución teórica llamada curva normal que se estudia en el siguiente capítulo. Esta
distribución teórica se toma como referente de curtosis media.La curtosis expresa el grado en que una distribución
acumula casos en sus colas en comparación con los casos que acumulan las colas de una curva normal con la misma
media y con la misma desviación típica. El concepto de curtosis es algo confuso (de esta confusión no se libran
muchos manuales de estadística y de análisis de datos). Una distribución leptocúrtica es más puntiaguda que la
curva normal y, además, acumula más casos que ésta en sus colas.Una distribución platicúrtica es más aplastada
que la curva normal y, además, acumula menos casos que ésta en sus colas. A la curva normal (referente de
curtosis media) se le llama mesocúrtica.
CAPÍTULO 11: “Inferencia con una variable categórica y otra cuantitativa” 

Trabajar simultáneamente con una variable categórica y una cuantitativa significa, por lo general, trabajar con una
variable que define grupos (la categórica) y una variable en la cual se desea comparar los grupos (la cuantitativa). Si la
variable categórica tiene sólo dos categorías y, por tanto, define sólo dos grupos, lo habitual es compararlos mediante la
prueba T de Student p​ara muestras independientes ; si la variable categórica tiene más de dos categorías y, por tanto,
define más de dos grupos, lo habitual es compararlos mediante el análisis de varianza de un factor.

Este archivo fue descargado de https://filadd.com


La prueba T de Student para muestras independientes, o contraste sobre dos medias independientes 2, es una técnica de
análisis frecuentemente utilizada para analizar datos. ​Sirve para averiguar si dos grupos difieren en alguna variable
cuantitativa de interés. ​Es decir, sirve, por ejemplo, para comparar en una variable cuantitativa un grupo experimental y
un grupo control, o dos tratamientos, o dos colectivos distintos (hombres y mujeres; fumadores y no fumadores; etc.

El objetivo del análisis es el de contrastar la hipótesis de que las medias poblacionales son iguales.
Lo habitual es, más bien, que las varianzas poblacionales sean, al igual que las medias, desconocidas; en cuyo caso el error
típico de la distribución muestral de Y _ 1Y _ 2 (el denominador de la ecuación,será igualmente desconocido y habrá que
estimarlo.
ASUMIENDO VARIANZAS IGUALES:
Si se asume que las varianzas poblacionales son iguales (es decir, ), sólo será necesario estimar un parámetro. Y como cada
una tiene un estimador del parámetro, la mejor opción sería combinarlos.
NO ASUMIENDO VARIANZAS IGUALES:
Si no puede asumirse que las varianzas poblacionales son iguales, no tiene sentido realizar una única estimación de las
mismas a partir de la combinación ponderada de los dos estimadores disponibles ( y ). Lo razonable será, más bien, utilizar
cada uno de ellos como estimador de la varianza de su propia población.

Grasso, L “Introducción a la estadística en ciencias sociales y del comportamiento”.


Capítulo 10

OM
El valor que toma un índice (un porcentaje o media), en una población se denomina valor paramétrico o parámetro. Este
debe diferenciarse del valor estadístico, que es el valor que toma un índice en una muestra de población.
Por ej el porcentaje de analfabetos sería el parámetro, pero si extraemos una muestra representativa de toda esa
población y observamos el porcentaje de analfabetos, se denomina valor estadístico.
Los valores paramétricos se pueden conocer en su completud, cuando se analiza toda una población. Como por ejemplo
.C
los censos de población y vivienda, donde se observa toda la población entonces puede calcularse un índice con el valor
que corresponde a cada miembro de la población.
En psicología o en las ciencias sociales no se conocen precisamente los valores paramétricos. Por lo tanto se tratará de
DD

estimarlos a través de muestras. La operación consistente en utilizar los resultados en muestras de una población para
estimar el valor paramétrico que caracteriza a esa población objeto de estudio en la estadística inferencial. Llamado
ESTIMACION DE PARAMETROS.
Esto último se trata del estudio de los límites y posibilidades de la inferencia de los valores poblacionales, (o sea
LA

paramétricos) de interés, a partir de muestras aleatorias de la población.


Los parámetros se representan con letras del alfabeto griego y los valores estadísticos con letras del alfabeto latino.
A una media calculada en una muestra se la representa con la letra M (media estadística), una media calculada en una
población (valor paramétrico) y se representa con la letra griega u ; llamada MU.
FI

Índice Valor estadístico (calculado Valor paramétrico La letra griega se llama:


en una muestra)


Media M u mu

Proporción P n pi

Desvío Estándar S o sigma

Coeficiente de correlacion R p rho


de Pearson

Este archivo fue descargado de https://filadd.com


El valor de un índice calculado en una muestra nunca o raramente coincide con el valor paramétrico que caracteriza a la
población representada por la Muestra. En cambio si la muestra es aleatoria y ha sido bien seleccionada si. Por lo tanto se
emplea el valor estadístico (m,p,r), para estimar el correspondiente parámetro(u,n,p).
Se llama variable aleatoria a una cuyo valores o categorías resultan de un experimento aleatorio. Cuyos resultados
dependen de una previa selección al azar. Un evento es un resultado posible de un experimento aleatorio. Los valores o
categorías de una variable aleatoria son o corresponden a eventos que resultan de un experimento aleatorio.
Ejemplo: el lanzamiento de una moneda.
Si se tira una moneda 2 veces y sale 2 veces cara (CC), entonces los valores de la variable aleatoria son 2 caras, siendo
estas la caras obtenidas en una lanzada.
La variable “puntaje obtenido al tirar un dado” es una variable aleatoria numéricamente valorada, pues sus categorías se
designan con valores numéricos. Y estos resultan de un experimento aleatorio.
¿Cuál sería la probabilidad de que salga … ?
x Probabilidades o frecuencias relativas
2 1/4
1 1/2
0 1/4
3 ( de obtener la misma cara) ⅛
DISTRIBUCIÓN MUESTRAL:

OM
el SIGMA O LA (O´) ES LA DESVIACIÓN ESTÁNDAR (MEDIDA DE DISPERSIÓN DE LOS DATOS RESPECTO DEL MEDIO).
La estadística enseña que si de una población con media igual a (media) y desviación estándar igual Ó, se extraen
muestras aleatorias de tamaño N, las medias de esas muestras se distribuyen en forma normal, la media de esas medias
será igual a la desviación estándar de esas medias será igual a:

Ó m= ​O
.C
(raíz de n) 👉cuando N tiende al infinito
DD
LA
FI


La distribución de muestreo de las medias, como la de cualquier estadístico es una distribución teórica ideal, y conocida.

Debe distinguirse de la distribución paramétrica o poblacional de una variable, que es una distribución real , a menudo
desconocida y algunas cuyas características o parámetros queremos estimar. Se tiene por otro lado que la distribución
muestral de una variable, que es la distribución que se observa en una muestra de población y por lo tanto es real, y
conocida.

Estimación de la media paramétrica (con muestras grandes)

Cuando efectuamos una estimación puntual, nos contentamos con respuestas aproximadas: muy probable, próximo, con
pequeña diferencia. En cambio si queremos hacerlo con mayor precisión entonces podemos hacer una estimación por
intervalo. Por lo que la conclusión sería que un valor está en el intervalo 4-7, siendo los límites…. etc.

Intervalo de confianza: se centra en el valor estadística de la muestra, y que con ciertas probabilidad
especificable(probabilidad de confianza) , contiene el valor del parámetro que se desea conocer.

Es conveniente que N sea grande, por encima de 120, para alcanzar estimaciones de intervalo suficientemente precisas.

CAPÍTULO 11: 

Este archivo fue descargado de https://filadd.com


PRUEBA DE HIPÓTESIS EN LAS CIENCIAS DE CONDUCTA:

Tenemos en principio 2 hipotesis, en una se afirma que la media es de 180, y la otra que la media es diferente de 180.
Estas hipótesis se oponen entre sí.

A una de las hipótesis la llamaremos hipótesis nula ​que se simboliza con ​(Ho)​. Esta representa un punto de vista o
creencia generalmente aceptada acerca de una cuestión en un momento dado.

A la otra hipótesis la llamaremos ​hipótesis alternativa (H1), ​generalmente esta hipótesis se opone a lo comúnmente
aceptado acerca de una cuestión, y refleja la creencia o esperanza del investigador,quien desea mejorar el conocimiento
del fenómeno que está en estudio.

Por lo general la segunda representa aquella concepción del fenómeno que el investigador quería demostrar y la primera
la esperanza íntima del investigador.

Las pruebas de hipótesis y las llamadas pruebas de significación estadística, que son procedimientos específicos para
someter a prueba ciertas hipótesis, se centran en la hipótesis nula. En base a los resultados de la prueba se decidirá la
aceptación o el rechazo de la hipótesis nula. La segunda opción implica rechazar la hipótesis nula, y dejar como verosímil
y de acuerdo a la información disponible, la hipótesis alternativa.

Las hipótesis son exactas cuando especifican un valor determinado para un parámetro, en el caso del ejemplo la hipótesis

OM
nula es exacta, ya que marca que la media es 180. La Ho es siempre exacta. La prueba de hipótesis siempre se entra en la
Ho y los modelos matemáticos que se utilizan en la prueba de hipótesis describen aquello que debería observarse en una
muestra si fuera verdadera la hipótesis nula ho Ho. Para poder hacer esta descripción es necesario que la Ho proponga un
valor exacto para el parámetro que propone la prueba.

La H1 (hipótesis alternativa) puede ser exacta o inexacta. En el ejemplo , la H1 es inexacta ya que afirma que es diferente
.C
a 180, sin especificar ningún valor determinado. La H1 sería exacta si propusiera para un cierto valor determinado, como
por ejemplo 210.
DD

En este caso la hipótesis alternativa es bidireccional ya que puede ser mayor o menor que 180, si fuera solo mayor sería
unidireccional.

Realizar una prueba de hipótesis consiste en efectuar una serie de operaciones para decidir acerca de la verosimilitud de
LA

dos hipótesis, opuestas o alternativas, que se centra en el examen de la hipótesis nula.

Si el resultado es fácilmente observable aceptamos la hipótesis nula, y el resultado es improbablemente observado de ser
cierta la hipótesis nula, entonces se busca la hipótesis alternativa.
FI

Necesitamos conocer cuáles serían los resultados posibles de un experimento si fuera cierta la hipótesis nula y también
necesitamos saber cual es la posibilidad de verificarse de cada uno de esos resultados posibles del experimento si fuera
cierta la hipótesis nula ho Ho. Dicho de otra manera, necesitamos saber cuál va a saber la distribución del muestreo
estadístico si la hipótesis nula fuera cierta.


ZONA DE ACEPTACIÓN: de Ho como el conjunto de resultados posibles de un experimento que tiene una relativamente
alta probabilidad de beneficiarse de Ho ser cierta.

ZONA DE RECHAZO: de Ho al conjunto de los resultados de un experimento que tiene escasa probabilidad de verificarse
si fuera cierta Ho.

El valor que separa la zona de aceptación de Ho y la zona de rechazo de Ho es el punto crítico.

Error en la prueba de hipótesis:

Error de tipo I (ETL): el que se define como rechazar una Ho que en realidad es verdadera.

Error de tipo II : Siendo la Ho falsa, se acepta como verdadera.

La probabilidad de cometer un error de tipo I es la probabilidad de observar un resultado en la zona de rechazo de Ho


siendo esta verdadera, esto se denomina NIVEL DE SIGNIFICACIÓN y se simboliza con la letra alfa. Este el investigador lo
sabe previamente a la prueba de hipótesis, y se fija.

“pasos” en la realización de una prueba de hipótesis:


1. formulación de la hipótesis.

Este archivo fue descargado de https://filadd.com


2. Formulación de la hipótesis en términos estadísticos
“el promedio de los resultados en la prueba es diferente del tradicionalmente aceptado (que es 180), entonces la
H1 será u# 180, y la Ho sera u=180.
3. si es unidireccional o bidireccional. En este caso es bidireccional.
4. si es unidireccional la prueba será de 1 extremo y si es bidireccional será de 2 extremos.
5. elección de la prueba estadística que se realizará prueba de hipótesis sobre la media paramétrica.
6. Elección del nivel de significación: es la probabilidad de cometer un error de tipo I, rechazar una Ho que en realidad
es verdadera, y aceptar, entonces, una Ho que en realidad es falsa. Generalmente se selecciona entre .05 y .01
7. Determinar los puntos críticos: si la prueba es de dos extremos, y a=0.5, entonces los puntos críticos serán Z: 1.96 y
Z: -1.96.

8. Cálculo del error estándar.


9. Determinación de la zona donde se encuentra ese resultado. Hay que convertir la media, por ejemplo 192 en
puntaje Z y ver si se encuentra entre 1.96 y -1.96.
10. Decisión a favor o en contra de Ho. Si el resultado se encuentra en la zona de rechazo, se rechaza y si no se acepta o
no se rechaza la Ho.
CAPÍTULO 12 : “Pruebas de significación​ ​y distribución t” 

OM
❖ Si las hipótesis implican una comparación entre medias y se tienen muestras pequeñas, se recurre a la distribución
T STUDENT, como también cuando se trata de una hipótesis acerca de una media paramétrica y se dispone de una
muestra pequeña o cuando se trata de una hipótesis acerca del valor del coeficiente de Pearson o el de Spearman
en la población.
❖ Con la expresión T Student se define una familia de distribuciones teóricas que permiten de hipótesis de diferentes
tipos cuando las muestras son pequeñas, el estadístico T es semejante al puntaje Z.
.C
❖ La distribución T es unimodal y simétrica, con media igual 0. Es semejante a una distribución normal pero más
aplanada y alargada. Se habla de una familia de distribuciones o una familia de Curvas, porque la forma precisa
DD

depende del número de casos, o dicho de otra manera, depende de los grados de libertad de la prueba.
❖ La expresión “grados de libertad” se refiere al número de valores de una serie estadística que pueden variar
libremente después de que se han impuesto ciertas restricciones a la serie de datos, se calcula N-1. Es decir número
de casos menos 1.
❖ Algunas aplicaciones de la distribución T student:
LA

1. La distribución T puede tomarse como modelo para describir la distribución de los resultados posibles de un
experimento (suponiendo cierta hipótesis nula) en varias pruebas de significación estadística. Las siguientes son
algunas.
a) Prueba de hipótesis sobre el valor de una media paramétrica con muestras pequeñas. para realizarse esta
FI

prueba debe aceptarse que la variable en estudio se distribuye en forma normal, o por lo menos unimodal y
simétrica, en la población.
b) Prueba de hipótesis sobre diferencias entre medias con muestras pequeñas, donde se definen dos grupos,


por un lado un grupo experimental y por el otro un grupo de control.


En una prueba de diferencias entre medias, el problema estriba en decidir si una eventual diferencia entre
las medias de la muestra, se explica solo por el factor azar, o si por el contrario, la diferencia observada no
puede explicarse si no es suponiendo que además del azar, ha ejercido influencia algún otro factor, como
puede ser el tratamiento experimental que es diferente en cada grupo. La hipótesis nula implica lo primero o
sea que la diferencia registrada fácilmente podría observarse si se extrajeran al azar dos muestras de la
misma población.
Hablamos de dos o más muestras independientes cuando son seleccionadas en forma aleatoria, de dos o más
poblaciones (por ejemplo, una de comunidades urbanas y otra de comunidades rurales), cuando a partir de un grupo
integro, asignamos al azar cada miembro de ese grupo a un tratamiento diferente.
Muestras correlacionadas son aquellas en las cuales un mismo grupo es analizado en dos ( o más) condiciones diferentes),
y cada sujeto es su propio control.

Unidad 7: “Teoría de las muestras” 


Grasso​: Nociones sobre el muestreo La estadística inferencial estudia un conjunto de procedimientos para extender las
conclusiones que se obtienen en una muestra a la población general que es objeto de interés. Por razones de tiempo y
costos operativos, la mayor parte de las veces no es posible estudiar la población completa. Por esto debemos estudiar las
variables en una muestra representativa de la población.

Este archivo fue descargado de https://filadd.com


Podríamos definir el muestreo como un procedimiento mediante el cual se selecciona de un conjunto determinado
llamado población, un subconjunto que recibe el nombre de muestra, con el objeto de llegar al conocimiento de
determinadas características de los elementos de la población mediante a la observación y generalización de las
correspondientes a los elementos de la muestra.
Si extraemos una muestra de una población muy homogénea la muestra representará convenientemente la población de
la cual procede. Ver unos casos en que la población no sé homogénea es cuando verdaderamente interesa el
procedimiento para seleccionar una muestra que represente lo mejor posible a la población.

Definiciones importantes:
Población: es un conjunto de objetos, sujetos o elementos con características determinadas.

Elemento: es cada miembro de la población. Todo elemento de una población posee las características en base a las cuales
se ha definido la población.
Muestra: qué es un subconjunto de la población, una parte extraída con objeto de obtener información sobre la totalidad
de esta. El requisito principal que debe reunir una muestra es la representatividad, que los resultados que se obtengan de
la misma concuerden con los que se hubiesen obtenido de haber sometido observación toda la población completa. La
representatividad es relativa ya que una muestra no se puede clasificar como enteramente representativa o enteramente
no representativa de la población de donde ha sido extraída.
​Unidad de muestreo y marco de referencia​: la unidad de muestreo puede ser un elemento de la población, como ocurre

OM
con el muestreo aleatorio simple, a un subconjunto de la población que incluye más de un elemento. El marco de
referencia es el registro o listado de las unidades de referencia que sirve como base para determinar cuáles unidades
integrarán la muestra.
Muestreo probabilístico o aleatorio​: no se conocen suficientemente las características de la población o no se conocen las
características de la población en los aspectos que interesan en el estudio o en los que están relacionados con ellos. Por
.C
eso, el procedimiento que otorga mayores garantías de representatividad de la muestra es su conformación al azar. En
este tipo de muestreo cada elemento de la población tiene una probabilidad conocida y no nula de ser seleccionada.
TIPOS DE MUESTREO:
DD

1) Muestreo aleatorio:
A) Muestreo aleatorio simple: ​todos los miembros de la población deben haber tenido la misma probabilidad de
ser incluidos en la muestra, la inclusión de un miembro no ha sido influenciada por la de otro miembro. Para
realizar un muestreo de este tipo es necesario contar con el listado de registro de todos los elementos que
LA

componen la población para utilizarlo como marco de referencia. De este listado se extraen al azar algunos
elementos de la población, tanto como el número de casos que se desea para la muestra.
Las ventajas son que está libre de sesgos que se pueden introducir por el uso de ponderaciones incorrectas en las
unidades muestrales. No supone conocimiento previo de ninguna de las características de la población que será
FI

estudiada.
Las desventajas son que requiere de un listado completo de todas las unidades que componen la población, lo cual
demanda mucho tiempo y trabajo.
La condición fundamental para realizar un muestreo aleatorio simple es disponer de un correcto marco de


referencia. Pero debemos tener en cuenta que no siempre se dispone de tal marco.
También debemos tener en cuenta que cuando usted dispone de un marco de referencia con un cuidado especial
ahora tendrá que asegurarse que realmente estén registrados todos los miembros de la población y que cada uno
esté registrado solamente una vez.

B) Muestreo sistemático​: es frecuentemente utilizado Por qué es más fácil de aplicar y además es económico. Consiste en
tomar cada unidad K-ésima de muestreo después de un arranque aleatorio, de la lista de 1 a N unidades de muestreo de la
población total. En la imagen K=3. Este tipo de muestreo requiere disponer de un listado completo de todos los miembros
de una población. Esto nos asegura que para la elección se ha consultado y recorrido todo el listado completo. La
desventaja es desde el punto de vista estrictamente estadístico, no es probabilístico ya que puede resultar de los sesgos
propios del listado que utilizamos. La ventaja es que es un método económico.

Este archivo fue descargado de https://filadd.com


C) Muestreo estratificado: consiste en dividir la población completa de unidades de muestreo en subpoblaciones que se
denominan estratos. Luego, dentro de cada estrato se selecciona una muestra aleatoria de las unidades de muestreo que
forman ese estrato.
Para formar los estratos primero hay que conocer los tamaños de los estratos de la población conforme a ciertas variables.
Esto trae limitaciones ya que a menudo el conocimiento de las variables en la población no es del todo adecuado para
realizar una estratificación correcta.

OM
Como se dijo anteriormente, se extrae una muestra aleatoria de cada estrato independientemente. Dicha extracción
puede realizarse proporcionalmente al número de casos de cada estrato o no.
Es posible estratificar proporcionalmente según varias variables a la vez y es fácil comprender que cuanto mayor sea el
número de variables de estratificación mayor la garantía de representatividad de la muestra.
Por otro lado, en el muestreo estratificado no proporcional se emplean deliberadamente fracciones de muestreo
diferentes en distintos estratos.
.C
DD
LA

Desventajas​: supone el conocimiento previo de las características de la población a partir de las cuales se estratifica; son
FI

de costos más elevados, también conlleva una dificultad en la determinación de estratos homogéneos.
Ventajas​: asegura muestra representante, estimaciones más precisas, mejor conocimiento de grupos pequeños.
D) Muestreo por conglomerados​: este muestreo consiste en la extracción aleatoria de grupos de elementos o
combinados. se aplica generalmente por la falta de una lista de los elementos de la población y debido al elevado costo de


construir una lista. para obtener una muestra de este tipo se vio a la población en grupos de elementos, luego se
seleccionan entre estos aleatoriamente y los elementos que componen los conglomerados elegidos forman todos parte de
la muestra. Hay dos grandes diferencias entre el muestreo por conglomerados y el muestreo estratificado. En el muestreo
estratificado se sigue un criterio definido sobre la base del conocimiento previo de la variable en estudio, mientras que en
el de conglomerados no se sigue un criterio sustantivo. La segunda diferencia es que el muestreo estratificado es un
muestreo de elementos y el de conglomerados no.

E) Muestreo plurietápico​: la característica principal de este tipo de muestreo es que se realiza una selección aleatoria en
cada una de las varias etapas. Las unidades de muestreo son diferentes en cada una de ellas y consecuentemente los
marcos también lo son. Este tipo de muestreo es comúnmente realizado cuando no se dispone una lista de los elementos
que son objeto de estudio, pero pueden localizarse mediante otras unidades de muestreo.

Este archivo fue descargado de https://filadd.com


2) MUESTREOS NO ALEATORIOS:
Los muestreos no aleatorios no ofrecen garantías de representatividad de una población, en algunos casos son
utilizables dado que no se desvirtúan los fines perseguidos o bien porque los sujetos que integran tal muestra
satisfacen ciertas condiciones suficientes para el estudio. El problema está en que tanto los resultados obtenidos en
esta muestra de esta clase pueden ser generalizados a alguna población.
A) Muestreo accidental​: la muestra se conforma con aquellos sujetos de la población a los que es más fácil acceder. Es
común que para conformar muestras accidentales se tomen conjuntos intactos o grupos de sujetos que se han reunido o
conformado con anterioridad a la investigación y sin que nada haya tenido que ver en esto el investigador. Un ejemplo es
cuando se toma como muestra al alumnado de cierta asignatura para realizar algún experimento u observación.

OM
B) ​Muestreo intencional o por conveniencia​: también llamado muestreo de juicio, se basa en la elección de un
.C
subconjunto de elementos que el investigador subjetivamente considera representativos de la población. este tipo de
muestreo es poco utilizado de las ciencias de la conducta y requiere una considerable experiencia previa con la población
DD

que es objeto de interés, sin el conocimiento de la misma no es aconsejable intentarlo.


LA
FI

C) ​Muestreo por cuotas​: se usa normalmente en encuestas de opinión pública y estudios de mercado. El investigador
identifica cuotas en función de determinadas variables demográficas. Luego instruye a encuestadores para que completen
dichas cuotas. Puede confundirse con el muestreo demográfico, pero a diferencia de éste, en el muestreo por cuotas hay
más selectividad por parte de los encuestadores, tomarán como muestra a personas que les resulten más cómodas o que


cumplan con determinados requisitos.

Error de muestreo​: La estimación es un proceso mediante el cual se obtienen estimaciones que se aproximan al valor del
parámetro poblacional, partiendo de la información proveniente de una muestra. Cuando se hacen dichas estimaciones,
se supone que la media de la población es la misma que la media de la muestra. Debido a que siempre la media de la
muestra será un poco distinta que la de la población, la diferencia se conoce como error de muestreo.

Esta diferencia entre la media de la Muestra y la media de la Población es conocida como Error de Muestreo. Este se
estima utilizando la varianza de la muestra. Por lo tanto, si la media tiene una alta desviación estándar, se deduce que la
muestra también tiene un alto error del proceso de muestreo. La exactitud de esta estimación depende del tamaño de la
muestra. Hay que tener en cuenta que, a menor tamaño de muestra, menor posibilidad de error de muestreo. Lo que el
investigador debe hacer es minimizar el error del proceso de muestreo. Esto se puede lograr con un muestreo
probabilístico adecuado y no sesgado y mediante el uso de un gran tamaño de la muestra.

Este archivo fue descargado de https://filadd.com


 
Estimación  de  parámetros​: El objeto de realizar estudios a través de muestras es conocer algo acerca de una población,
aquella de la cual ha sido extraída la muestra. El valor que toma un índice en una población se denomina valor
paramétrico o parámetro. Este debe diferenciarse del valor estadístico, que es el valor que toma un índice en una muestra
de una población.
Los valores paramétricos pueden conocerse con precisión a través de estudios donde se observa toda la población. En un
censo, como los de población y vivienda, se observa toda la población y entonces puede calcularse un índice tomando en
cuenta el valor que corresponde a cada miembro de la población en la variable estudiada.

Los censos y estadísticas regulares atienden siempre a solo algunas variables. Se intentará estimar las otras variables a
través de muestras. Esto consiste en utilizar los resultados en muestras de una población para estimar el valor
paramétrico que caracteriza a esa población objeto de estudio.
Dato: los valores estadísticos se representan con letras del alfabeto latino mientras que los parámetros se representan con
letras griegas. También debemos saber que el valor de un índice nunca o muy raramente coincidirá con el valor
paramétrico que caracteriza a la población representada por la muestra.

Conceptos probabilísticos​: se llama variable aleatoria a cuyos valores o categorías resultan de un experimento aleatorio.
Un experimento aleatorio puede entenderse como una operación cuyos resultados (eventos) dependen del azar. Ej: lanzar
una moneda, esta situación puede resultar en dos eventos, que salga cara o que salga cruz. Lo mismo ocurre con el

OM
experimento del lanzamiento de un dado. En el primer ejemplo, si lanzamos dos monedas, la probabilidad de que salgan
dos caras es de 1/4 ya que hay 4 posibles resultados o eventos (cara cara, cara cruz, cruz cruz, cruz cara), o sea una
probabilidad de un 25%, y la probabilidad de que salga solamente una cara, sin importar el orden es de 2/4, o sea un 50%.

BARANGER:
.C
Tamaño de la muestra​: determinar el tamaño del cuadro peruana muestra una elección crucial, por todas las
consecuencias negativas que puede producir una equivocación. No obstante, no es frecuente que el tamaño de una
muestra se determine en función de los recursos disponibles.
DD

Todas las muestras pueden clasificarse en dos grandes categorías según el tipo de hipótesis que se pretende poner en
prueba.
Puede tratarse de una hipótesis generalización (a partir de los datos muestrales se pretende inferir) o de una hipótesis
sustantiva (se desea comprobar la existencia determinada relación entre ciertas variables). en el primer caso los criterios
LA

pertinentes a tener en cuenta serán los habituales para cualquier tipo de inferencia estadística, en el segundo, pueden
resumirse en unas breves reglas muy sencillas de comprender.
Muestras para verificar hipótesis generalización: Existen procedimientos estadísticos que nos permiten estimar la
probabilidad de que un determinado valor muestral no difiera sustancialmente del parámetro que se hubiera obtenido de
FI

haber realizado un censo.


El tamaño requerido para una muestra es una función directa de tres factores:
• Nivel de confianza requerido


• Margen de error
• Variabilidad
En síntesis, cuanto mayores sean nuestras exigencias respecto al grado de confiabilidad y de precisión de nuestros
resultados, mayor habrá de ser el tamaño de la muestra.
Muestras para someter a prueba hipótesis sustantiva:
Si el objetivo de nuestra investigación es primordialmente analítico antes que descriptivo, no estaremos tan interesados
en la generalización como en la simple comprobación de la existencia de relaciones específicas entre las variables.
El tamaño se basará en enriquecimientos demandados que nos permitan determinar la existencia de relaciones entre el
conjunto de las unidades incluidas en la muestra.
Las preguntas a formularse para determinar el tamaño de la muestra tienen que ver con el número de variables que se
pretenden analizar simultáneamente y con el número de valores de cada una de esas variables.
Datazo​: Galtung presenta una tabla de número mínimo de unidades para el análisis de un promedio de 10 casos por
celda. Dicha tabla nos muestra que por ejemplo para estudiar la relación entre 3 variables dicotómicas se requiere un
mínimo de 200 casos para contar con un promedio de 10 observaciones por celdas.

Principales tipos de muestras:


​Muestras no probabilísticas​: No hay modo alguno de valorar estadísticamente los resultados obtenidos a partir de la
muestra.

Este archivo fue descargado de https://filadd.com


Muestras accidentales o casuales​: consiste simplemente en tomar los casos que caen bajo la mano continuando el proceso
hasta que se alcanza un cierto tamaño de muestra. En este caso no existe modo alguno de evaluar los sesgos introducidos
por el modo de selección de las unidades, sólo cabrá esperar que la equivocación no sea demasiado grande. ​Muestra por
cuota​s: se busca garantizar la selección de elementos pertenecientes a los diferentes estratos que conforman la población
y que dichos elementos pueden ser tenidos en cuenta en las mismas proporciones en que ocurren en esa población. En
todos los casos, la técnica supone sostener alguna hipótesis acerca de las cuales son las variables relevantes, las que serán
utilizadas para dividir la muestra en estratos. el muestreo por cuotas requiere anticiparse a las diferencias que pueden
presentar los elementos de los distintos estratos respecto al valor que exhibirán en la variable a investigar, de modo tal de
seleccionar una muestra que representa adecuadamente a la población, esto quiere decir, que funcione como una réplica
de la población en cuanto a las variables que se juzgan relevantes.

Las muestras por cuotas son mucho más eficientes que las muestras accidentales simples. De allí que su uso sea muy
frecuente en sondeos electorales, así como en la investigación de mercado en general. Sin embargo, el muestreo por
cuota sigue siendo en esencia un procedimiento incidental en el que cada estrato de la muestra es una muestra accidental
del correspondiente extracto de la población.
En particular, la libertad otorgada a los entrevistadores puede dar lugar a muestras sesgadas. Estos son proclives a
encuestar a las personas que tengan más a mano (amigos o conocidos) y a descartar personas que no se encuentren en su
domicilio cuando los visitan.
Muestras probabilísticas: 

OM
Muestra al azar simple​: ​es el ejemplo más sencillo de un procedimiento de muestreo probabilístico. En la muestra todos
los elementos de la población tienen la misma probabilidad de resultar, y todas las combinaciones de elementos de para
un tamaño dado de la muestra presenta también la misma probabilidad de selección.

El requisito imprescindible para seleccionar una muestra al azar simple es disponer de un listado de todos los elementos
.C
que componen la población. A cada una de las unidades se les asigna un número. Luego recurriendo a una tabla de
números al azar se extraerán una cantidad necesaria de números correspondientes a las unidades que integrarán la
muestra.
DD

En la práctica, este procedimiento se torna por demás engorroso al trabajar con poblaciones grandes. En poblaciones
pequeñas puede conducir a una representación absolutamente insuficiente de los estratos de menor peso relativo a la
población. Es por esto que en estas condiciones suelen optar otros diseños muestrales libres de estas desventajas.  
 
LA

 
Muestra sistemática​: sí delante de un procedimiento de muestreo que a todos los efectos prácticos presentará la misma
pulir tú dices que el muestreo al azar simple. Aquí también se requiere como condición indispensable contar con el listado
FI

de todas las unidades, las que deberán ser numeradas correlativamente.


Conociendo el número de elementos que componen la población y habiendo determinado el número de casos necesarios
para la muestra, se puede establecer la fracción de muestreo dividiendo el primer número por el segundo.
Luego se selecciona un solo número al azar, que corresponderá a la primera unidad seleccionada, y a este número se le


sumará la fracción de muestreo obteniendo así la segunda unidad y así sucesivamente hasta completar la muestra.
La condición para utilizar este procedimiento es que la numeración de las unidades en la lista no responde a ningún orden
en particular.
En determinadas circunstancias, sin embargo, la existencia de un orden puede resultar ventajosa pudiendo ponerse al
servicio de la investigación.
Muestra estratificada​: en el diseño más simple de muestra estratificada, la única diferencia con respecto a la muestra por
cuotas es el hecho de que la selección de las unidades se realiza al azar. Esta no es una diferencia menor puesto que
obtenemos una muestra apta para realizar cualquier tipo de inferencia estadística. Pero conceptualmente ambos tipos de
muestras son muy similares, así como la muestra por cuotas consiste en una serie de muestra casuales tomadas cada una
dentro de un estrato diferente, así una muestra estratificada se compone de varias muestras al azar simple seleccionada
dentro de otros tantos estratos.
Dividir la población en estratos es útil en la medida en que los estratos sean internamente homogéneos y externamente
heterogéneos en cuanto a las variables de nuestro interés. si se cuenta con una estimación previa acerca de la variabilidad
del parámetro dentro de cada estrato, entonces el modo más eficiente de muestrear es aquel en el que el número de
casos seleccionados sea proporcional a esa variabilidad.
Muestras por conglomerados y etapas múltiples​: si en la muestra estratificada se seleccionan los casos dentro de cada
estrato, asegurando así que todos los estratos están representados, en este otro tipo de muestra se selecciona entre los
conglomerados. Correlativamente cómo se busca en los estratos la homogeneidad interna, para los conglomerados
cuanto más heterogéneo sean mejor será el resultado. Dividida toda la población en conglomerados, se seleccionará al
azar un cierto número de estos dentro de los cuales se entrevistará a todas las unidades de análisis.

Este archivo fue descargado de https://filadd.com


A menudo la técnica por conglomerados se integra en diseños de muestra de etapas múltiples, esto es, muestras que
suponen la definición de unidades de muestreo en diferentes niveles. Las muestras por conglomerados en etapas
múltiples son muy ventajosas desde el punto de vista económico, en el sentido que con igual cantidad de recursos es
posible realizar mayor número de encuestas. Sin embargo, hay que tener en cuenta que con estas técnicas el grado de
error aumenta.

GARCÍA FERRANDO: “ESTADÍSTICA APLICADA A LAS CS SOCIALES” 


● Aspectos generales del muestreo en la investigación sociológica: La teoría del muestreo es un estudio de las
relaciones existentes entre una población y una muestra extraída de esa población. tiene gran interés porque
permite estimar cantidades desconocidas de la población llamados parámetros poblacionales, a partir del
conocimiento de las correspondientes cantidades muestrales llamados estadísticos muestrales.
● En la inferencia estadística el interés estriba en estudiar una muestra y hacer inferencias acerca de la población de
la cual se tomó. La deducción y el cálculo de la probabilidad son los fundamentos del muestreo, que hace posible
estimar valores poblacionales (parámetros) a partir de valores muestrales (estadísticos).
● Denominaremos población o universo a un conjunto de unidades que comparten alguna característica que nosotros
deseamos estudiar. Las unidades pueden ser por ejemplo personas o familias.
● Condiciones de las muestras Una muestra de simplemente una parte representativa de un conjunto, población o
universo, muchas características deben reproducir en pequeño lo más exactamente posible.
● Puede definirse las muestras como una parte de un conjunto o población debidamente elegido, que se somete a

OM
observación con el propósito de obtener resultados válidos también para el universo total investigado.
● Las muestras tienen un fundamento matemático estadístico que consiste en que, obtenidos de una muestra,
elegida correctamente y en la proporción adecuada, unos determinados resultados, se puede realizar la inferencia
o generalización basándose matemáticamente en que dichos resultados son válidos para el universo del que se ha
extraído la muestra.
.C
● Al elegir una muestra debe decidirse con cuidado la incógnita de qué se desea resolver. debe decirse qué tipo de
muestra se va a utilizar y qué tratamiento estadístico se va a dar a los datos, en función de la investigación que se
haya planteado.
DD

● Errores muestrales: El error de muestreo es la diferencia entre un estadístico y su parámetro correspondiente.


● Hay dos tipos de errores muestrales:
● Errores de sesgos o sistemáticos: la muestra no representa a la población. La muestra ha sido elegida con sesgo o
parcialidad. Provienen por el método aplicado para elegir la muestra.
● Errores aleatorios: se deben al azar, son debidos a la casualidad y no a la parcialidad. Su cuantía puede ser
LA

estimada, aplicando las leyes de la probabilidad.


● Cuando la muestra está seleccionada por métodos estadísticos de muestreo, se denomina error de muestreo a la
discrepancia entre el valor muestral y el poblacional debida exclusivamente a la variabilidad de la muestra como
FI

variable aleatoria. En este sentido, más específico que el anterior, el error muestral está relacionado con la
desviación típica muestral y constituye la pieza básica para el diseño de un plan de muestreo y la evaluación de la
calidad de las estimaciones. El resto de posibles errores muestrales no vinculados con la variabilidad probabilística
se suelen englobar bajo el nombre de errores no muestrales, como pueden ser los asociados con la falta de


representatividad de la muestra, la no respuesta, con un marco poblacional incompleto, con sesgos de selección de
los individuos muestreados, con deficiencias en los cuestionarios, etc.
● Lo más frecuente en la práctica es que el verdadero valor poblacional sea desconocido, por lo que las definiciones
dadas para el error no son operativas. Por ello, en la mayoría de los casos, el término error muestral hace
referencia a las diferencias debidas a la variación entre muestras.

Este archivo fue descargado de https://filadd.com

También podría gustarte