Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Por otra parte la estadística inferencial se parte de la experiencia, donde se extrae las observaciones pertinentes.Esto nos
permite el uso de técnicas de muestreo y de procedimientos para generalizar a partir de una muestra con cierto margen
conocido de confianza.
Nos provee de conceptos para estudiar el problema del número de observaciones necesarias para garantizar el menor
margen de error.
Para que las deducciones y las comparaciones sean válidas, los dos grupos deben ser comparables (mujeres de 16 a 18
años embarazadas), en la cual existen diferencias pero los rasgos base se mantienen.
OM
STEVENS: medir es el asignar objetos y números a objetos y acontecimientos de acuerdo con ciertas leyes.
escala nominal: urbano, rural,casado,soltero,sordo,mudo etc.La escala nominal representa la asignación de numerales
menos restringida. Los numerales se utilizan solo como etiquetas, y palabras y letras servirían también.
escala ordinal: malo,regular,bueno,muy bueno,excelente. Van en un “orden”. Los números en las escalas ordinales
designan un orden específico en el conjunto analizado pero no expresan la magnitud absoluta de ningún atributo, ni el
.C
valor de las diferencias.La escala ordinal surge de la operación de ordenación de rangos. La inteligencia, por ejemplo, es
útilmente evaluada en escalas ordinales, las cuales intentan aproximarse a escalas intervalares, y no es necesario definir
que significa un puntaje cero de inteligencia. Las escalas de razón son aquellas ampliamente encontradas en física y sólo
DD
son posibles cuando existen operaciones para determinar todas las cuatro relaciones: igualdad, ordenación de rangos,
igualdad de intervalos e igualdad de razones. Una vez que la escala es erigida, sus valores numéricos pueden ser
transformados (como pulgadas a centímetros) sólo al multiplicar cada valor por una constante. Un cero absoluto siempre
está involucrado, incluso aunque el valor cero en algunas escalas (por ejemplo, temperatura absoluta) puede que nunca se
LA
genere. Todos los tipos de mediciones estadísticas son aplicables a las escalas de razón
escala intervalar: temperatura medida por el termómetro. El 0 es parte de la escala, por el no significa ausencia, el 0 es el
punto de origen aceptado y fijado, por eso se dice que es arbitrario. Por ejemplo, en fundamentos, la campana de Gauss
en un determinado test de inteligencia. Aca tenemos categorías diferentes, orden y distancias iguales numéricas que
FI
corresponden a distancias iguales empíricas en las variables que se desea medir,aunque el origen de la escala es arbitrario.
Como el CI (cociente intelectual).
escala proporcional, de razón o cociente: cantidad de errores de escritura en un dictado, cantidad de errores en la
resolución de un problema de razonamiento, tiempos de reacción,kilogramos,etc.
proporcional X X X X Absoluto
intervalar X X X arbitrario
ordinal X X arbitrario
nominal X
● En una investigación cuantitativa se pretende generalizar los resultados encontrados en un grupo (muestra) a una
colectividad mayor (universo 0 población). También se busca que los estudios efectuados puedan replicarse.
● La búsqueda cuantitativa ocurre en la realidad externa al individuo. Esto nos conduce a una explicación sobre cómo
se concibe la realidad con esta aproximación a la investigación.
● Hay dos realidades: la primera consiste en las creencias, presuposiciones y experiencias subjetivas de las personas.
Estas llegan a variar: desde ser muy vagas 0 generales (intuiciones) hasta ser creencias bien organizadas y
desarrolladas lógicamente a través de teorías formales. La segunda realidad es objetiva e independiente de las
creencias que tengamos sobre ella (la autoestima, una ley, los mensajes televisivos, una presa, el SIDA, etc.,
OM
ocurren, es decir, constituyen realidades en forma independiente de 10 que pensemos de ellas) .
● Desde luego, en el enfoque cuantitativo, 10 subjetivo existe y posee un valor para los investigadores; pero de
alguna manera este enfoque se aboca a demostrar que tan bien se adecua a la realidad objetiva.
● Cuando las investigaciones creíbles establezcan que la realidad objetiva es diferente de nuestras creencias, éstas
deben modificarse 0 adaptarse a tal realidad.
.C
● En el caso de las ciencias sociales, el enfoque cuantitativo parte de que el mundo "social" es intrínsecamente
cognoscible y todos podemos estar de acuerdo con la naturaleza de la realidad social.
● si coincide la realidad externa social objetiva, con las creencias subjetivas del investigador, se procede con dicha
DD
★ Utiliza la recolección de datos sin medición numérica para descubrir 0 afinar preguntas de investigación en el
proceso de interpretación.
★ EI investigador plantea un problema, pero no sigue un proceso claramente definido. Sus planteamientos no son tan
específicos como en el enfoque cuantitativo.
FI
★ Se utiliza primero para descubrir y refinar preguntas de investigación (Grinnell, 1997). 3. Bajo la bÚsqueda
cualitativa, en lugar de iniciar con una teoría particular y luego "voltear" al mundo empírico para confirmar si esta
es apoyada por los hechos, el investigador comienza examinando el mundo social y en este proceso desarrolla una
teoría coherente con 10 que observa qué ocurre -con frecuencia denominada teoría fundamentada
★ Dicho de otra forma, las investigaciones cualitativas se fundamentan más en un proceso inductivo (explorar y
describir, y luego generar perspectivas teóricas). Van de particular a general.
★ Los datos cualitativos como descripciones detalladas de situaciones, eventos, personas, interacciones, conductas
observadas y sus manifestaciones.
★ Por lo expresado en los párrafos anteriores, el investigador cualitativo utiliza técnicas para recolectar datos como
la observación no estructurada, entrevistas abiertas, revisión de documentos, discusión en grupo, evaluación de
experiencias personales, registro de historias de vida, interacción e introspección con grupos 0 comunidades.
★ EI enfoque cualitativo evalúa el desarrollo natural de los sucesos, es decir, no hay manipulación ni estimulación con
respecto a la realidad.
★ Postula que la "realidad" se define a través de las interpretaciones de los participantes en la investigación respecto
de sus propias realidades.
★ EI enfoque cualitativo puede definirse como un conjunto de prácticas interpretativas que hacen al mundo visible,
10 transforman y convierten en una serie de representaciones en forma de observaciones, anotaciones,
grabaciones y documentos. Es naturalista (porque estudia a los objetos y seres vivos en sus contextos 0 ambientes
naturales) e interpretativo (pues intenta encontrar sentido a los fenómenos en términos de los significados que las
personas les otorguen).
★ Se tiene en cuenta el concepto de Patrón cultural (Colby, 1996), que parte de la premisa de que toda cultura 0
sistema social tiene un modo Único para entender situaciones y eventos.
★ El investigador es parte de ese objeto de estudio, está sumergido en el.}
★ Sigue una perspectiva holística (los fenómenos se conciben como un "todo" y no como partes) e individual.
Percepciones de Ia realidad
Cuantitativo: Las minorías étnicas comparten experiencias similares dentro del sistema público de asistencia social.
Tales experiencias pueden ser descritas "objetivamente", esto es, que una sola realidad existe en el entomo de
cualquier persona.
Cualitativo: Las experiencias individuales y la del grupo "técnico'' dentro del sistema público de asistencia social
son huecas. Tales experiencias sólo pueden ser descritas "subjetivamente", esto es, que una realidad única y
singular existe dentro de cada persona.
Formas de conocimiento
Cuantitativo La experiencia de las minorías étnicas dentro de los servicios públicos de asistencia social puede ser
conocida al examinar partes específicas de las experiencias individuales y agregarlas al amillsis. Es necesario
descubrir los principios y reglas que regulan tal experiencia.
Cualitativo La experiencia de las minorías étnicas dentro de los servicios públicos de asistencia social puede ser
conocida al capturar las experiencias individuales completas de las personas. Las partes específicas de sus
OM
experiencias son consideradas en relación a las demás partes y a toda la experiencia. La fuente de conocimiento
está integrada por las historias experimentadas por cada participante.
Cualitativo Cualquier valor 0 creencia que posea el investigador sobre las minorías étnicas 0 los servicios públicos
de asistencia social influirá en el proceso de investigación. EI investigador aprende de los participantes, y la
interacción es constante.
Aplicaciones
LA
Cuantitativo Los resultados del estudio son generalizables a la población de la cual fue extraída la muestra. Tales
resultados nos indican en porcentajes y promedios como han sido las experiencias de las minorías étnicas en los
servicios públicos de asistencia social. Por ejemplo: el promedio de espera para ser atendidos, el porcentaje de
personas satisfechas e insatisfechas con la atención, freeuencia de visita, datos por género, edad, ocupación,
FI
etcétera. También podemos relacionar variables (tales como la rapidez en la atención y satisfacción respecto al
servicio).
Cualitativo Los resultados nos relatan las historias y experiencias individuales de miembros de las minorías étnicas al
asistir a los servicios públicos de asistencia social. Cada experiencia provee de un entendimiento del significado de acudir a
dichos servicios. EI contexto de cada persona es clave para entender sus historias. Los resultados no pueden generalizarse
a la población en un sentido predictivo probabilístico.
Por ejemplo, podemos comprender el caso de una mujer viuda de 80 años que vive una profunda soledad. Para ella
acudir a los servicios es la manera fundamental de comunicarse con personas de su misma edad. Entenderemos su
experiencia, historia de vida y contexto, así como las de otros individuos.
Investigación Se define como un conjunto de procesos sistemáticos y empíricos que se aplican al estudio de un fenómeno.
STEVENS:
Escala Operaciones empíricas básicas Estructura matemática de grupo Estadísticos
permitidos(invariantes) NOMINAL Determinación de igualdad Grupo de permutación x’ = f(x) f(x) significa cualquier
sustitución uno-a-uno Número de casos Modo Correlación de contingencia
ORDINAL Determinación de mayor o menor Grupo isotónico x’ = f(x) f(x) significa cualquier monotónicamente creciente
Mediana Percentiles
INTERVALAR Determinación de igualdad de intervalos o diferencias Grupo lineal general x’ = ax + b Media Desviación
estándar Correlación de orden de rango Coeficiente de variación
RAZÓN Determinación de igualdad de razones Grupo de similitud x’ = ax Coeficiente de variación
Los conceptos de estrés,ansiedad,depresión,superyó, etc. Son entidades teóricas, existen porque una teoría las
fundamento, y se denominan constructos o conceptos no observacionales.
OM
ciudadanos puedan ejercer su derecho a la información pública.
2) Hay consideraciones específicas acerca de los métodos y procedimientos para la reunión, el procesamiento,
el almacenamiento y la presentación de los datos estadísticos.
3) Conforme a normas científicas sobre las fuentes, métodos y procedimientos de la estadística.
4) Los organismos de estadística tienen derecho a formular observaciones sobre interpretaciones erróneas y la
.C
utilización indebida de las estadísticas.
5) Los datos para fines estadísticos pueden obtenerse de todo tipo de fuentes, ya sea encuestas estadísticas o
registros administrativos.
DD
6) Los datos individuales que reúnan los organismos de estadística para la compilación estadística, se refieran a
personas naturales o jurídicas, deben ser estrictamente confidenciales y utilizarse exclusivamente para fines
estadísticos.
7) Se han de dar a conocer al público las leyes, reglamentos y medidas que rigen la operación de los sistemas
LA
estadísticos.
Como profesionales Psicólogos tenemos que defender el derecho a que la población esté debidamente
informada en forma clara y accesible. Que los datos presentados sean confiables, de fácil lectura y
entendimiento.
FI
-Rechazar cualquier preferencia por parte de los investigadores o proveedores de datos que pueda
predeterminar o influir en los análisis / resultados.
- -Cumplir con los requisitos de confidencialidad de recopilación, publicación y difusión de datos y cualquier
restricción sobre su uso establecido por el proveedor de datos (en la medida en que lo exija la ley)
--Proteger la privacidad y confidencialidad de los sujetos de investigación y los datos que los conciernen, ya
sea obtenidos directamente de los sujetos, otras personas o registros existentes.Así como también evitar
estigmatizaciones de los sujetos analizados.
ARÓN, A & ARON, E “ ESTADÍSTICA PARA LA PSICOLOGÍA” CAPÍTULO 1
ESTADÍSTICA DESCRIPTIVA
En esta rama de la psicología que está orientada a la recolección de datos, se utilizan a modo de resumen y para facilitar el
análisis, las tablas de frecuencia, porque muestra con qué frecuencia una fenomenos ocurre.
Esta tabla muestra la frecuencia de valores de una determinada variable.
Una VARIABLE es una característica que puede tener diferentes valores. Como por ejemplo masculino,femenino, trans,no
binario, clase social, nivel de estrés, etc.
Cada persona analizado presenta un número o valor observado. Es el valor de la persona con respecto a la variable.
VALOR OBSERVADO: valor de una determinada persona en una determinada variable.
variables cuantitativas o variables numéricas.
También hay intervalos, los valores representan cantidades iguales de lo que se mide;, cuando el valor no es absoluto sino
que es relativo. Se denomina variable ordinal Por ejemplo 3,5
variable nominal: donde las variables son nombres o categorías, ej: casado,soltero,madre, padre, etc.
Estas distintas variables corresponden a distintos niveles de medición.
❖ A veces existen tantos valores posibles que es difícil reflejarlos en una tabla de frecuencias; en el último ejemplo
sucedía algo así. La solución a este problema consiste en formar grupos de valores que incluyan todos aquellos
valores que se encuentran comprendidos dentro de un determinado intervalo. (TABLA DE FRECUENCIAS
AGRUPADAS POR INTERVALOS DE CLASE) hay que instalar el tamaño del intervalo y los límites del mismo.
❖ - ejemplo.
❖ p olígono de frecuencias, es básicamente la versión del histograma representado con un gráfico de Eneas. En lugar
de barras, la frecuencia de cada intervalo se indica a través de la altura de una línea que se desliza por la página,
creando una especie de contorno de montañas. se realiza con dos categorías por:variable y: frecuencia
❖ FORMAS DE DISTRIBUCIÓN DE FRECUENCIAS: el patrón conforme al cual las frecuencias se dispersan o
“distribuyen”.
❖ Un aspecto importante relacionado con la forma de una distribución de frecuencias es el hecho de que la figura
presente un solo punto máximo principal.
❖ Este tipo de distribución se denomina unimodal. Una distribución con dos puntos elevados prácticamente iguales es
OM
una distribución bimodal. Cualquier distribución con dos o más puntos elevados se denomina multimodal,2
Finalmente, una distribución en la que todos los valores presentan prácticamente la misma frecuencia se denomina
rectangular.
❖ Es decir, la mayoría de las distribuciones son prácticamente simétricas (si las doblamos por la mitad, las dos mitades
serían iguales).
.C
❖ Las distribuciones que claramente no son simétricas se denominan asimétricas.
❖ El lado con menor cantidad de casos (el lado que parece una cola) es el lado al que nos referimos para nombrar la
dirección de la asimetría.
DD
❖ Una distribución asimétrica hacia la derecha se denomina también positivamente asimétrica. Una distribución
asimétrica hacia la izquierda se denomina también negativamente asimétrica.
DISTRIBUCIONES NORMALES Y CURTICAS:
Es suficiente destacar que la curva normal es unimodal y simétrica.
LA
El término curtosis se refiere al grado en el que la forma de una distribución difiere de la curva normal, principalmente con
respecto al hecho de que las colas sean más espesas o delgadas que las de la curva normal.
Los psicólogos utilizan procedimientos de estadística descriptiva para describir, es decir, para resumir y hacer fácilmente
FI
Las frecuencias relativas son los porcentajes de casos de cada categoría, y las frecuencias acumuladas son las que se van
acumulando en cada categoría, desde la más baja a la más alta.
ESTADÍSTICA INFERENCIAL:
En esta rama de la estadística se intenta generalizar los resultados obtenidos en la muestra a la población o universo.
FI
Una hipótesis en este contexto es una proporción respecto de uno o varios parámetros, y lo que hace el investigador a
partir de la prueba de hipótesis, es ver si dicha hipótesis es congruente con los datos obtenidos en la muestra.
RAZONES Y TAZAS:
DATOS CUANTITATIVOS
Distribución Patrón de variabilidad que muestran los datos de una variable. La distribución muestra la frecuencia de cada
valor de la variable.
Gráfica de puntos: Describe los datos de una muestra al representar cada valor de datos con un punto colocado a lo largo
de una escala. Esta escala puede ser horizontal o vertical. La frecuencia de los valores se representa a lo largo de la otra
escala.
DISTRIBUCIONES DE FRECUENCIA E HISTOGRAMAS:
Distribución de frecuencias Listado, con frecuencia expresado en forma de tabla, que relaciona los valores de una variable
con su frecuencia.
Puede haber una distribución de frecuencias no agrupadas, porque cada valor es independiente, en cambio cuando los
OM
datos son numerosos y se hace difícil el manejo de los mismos, se agrupan los valores en un conjunto de clases y se
denomina distribución de frecuencias agrupadas.
Histograma Gráfica de barras que representa una distribución de frecuencias de una variable cuantitativa. Un histograma
se constituye con los siguientes componentes: 1. Un título, que identifica la población o muestra de interés. 2. Una escala
vertical, que identifica las frecuencias en las diversas clases. 3. Una escala horizontal, que identifica a la variable x. Los
valores para los límites de clase o puntos medios de clase pueden etiquetarse a lo largo del eje x. Usa cualquier método de
.C
etiquetado de ejes que represente mejor la variable.
Características principales:
DD
o PORCENTAJE. Hay 50 calificaciones, y la frecuencia de 55-65 es 7, por lo que se divide 50/7=0.14 o 14%.
OM
aproximadamente 68% de los datos; 2) dentro de 2 desviaciones estándar de la media, habrá aproximadamente 95% de
los datos; y 3) dentro de 3 desviaciones estándar de la media, habrá aproximadamente 99.7% de los datos. (Esta regla se
aplica específicamente a una distribución normal [con forma de campana], pero se aplica con frecuencia como una guía
interpretativa a cualquier distribución montada.)
.C
UNIDAD 4: Teoría de la probabilidad. Modelos binomial y normal
Garret, H “estadística en psicología y educación”. Capítulo 5
La probabilidad de un determinado acontecimiento se define como la frecuencia esperada de presentación de ese
DD
Si hay N factores independientes siendo idéntica la probabilidad de presencia o ausencia de cada uno, las probabilidades
“compuestas” de distintas combinaciones se expresan por el desarrollo del BINOMIO P+Q . Esto se implementa cuando
hay mayores casos independientes. Tiene que ser posible la ocurrencia de p & q y la no ocurrencia de p o q puesto que la
probabilidad tiene que tener como requisito p+q:1
FI
La curva normal o campana de Gauss demuestra con un alto grado de exactitud la frecuencia de ciertos hechos, esta es
simétrica y logró brindar resultados para distintos objetivos:
★ estadística biológicas: la relación entre nacimientos femeninos y masculinos en una comunidad determinada.
★ datos antropométricos: talla, peso.
Asimetría: se dice que una distribución es asimétrica o sesgada cuando la media , moda y mediana caen en puntos
distintos.
Se dice que está sesgada negativamente a la izquierda cuando los puntajes se acumulan hacia el extremo alto de la escala
(hacia el derecho). Y al revés se denomina asimetría positiva.
Cu: Q
P90-P10
0.263=curva normal
+0.263= platicúrtica
-0.263= leptocurtica
Estadística Descriptiva: Coolican capitulo 13
OM
Tendencia normal: Se refiere al valor, dentro de un grupo de valores, que es el más típico o la puntuación alrededor de la
cual se agrupan la mayoría de los demás. En un lenguaje normal, se conoce simplemente como “promedio”.
Dispersión: esta es una medición de qué tan cerca o tan lejos tienden a variar el resto de los valores alrededor de este
valor central o típico.
La Media como medida de tendencia central no es apta para valores extremos.
ventajas: Es la medida estadística más utilizada para los parámetros poblacionales.
.C
desventajas: Tiene alta sensibilidad, y esto puede ser contradictorio.
DD
La mediana no se afecta por valores extremos en una dirección, y por ello es mejor que la media con datos sesgados.
ventajas: Es más fácil de calcular que la media. (con grupos pequeños y sin valores iguales). No se afecta por valores
extremos en una dirección, y por ello es mejor que la media con datos sesgados. Se puede obtener cuando se desconocen
los valores extremos.
desventajas: No considera el valor exacto de cada unidad, no se puede utilizar en estimaciones de parámetros de
LA
La moda es da menos certeza que las anteriores, pero no se ve alterada por valores extremos.
ventajas: Muestra el valor más importante de un conjunto, no se afecta por valores extremos en una dirección, se puede
FI
obtener cuando se desconocen los valores extremos, es más informativa que la media cuando la distribución tiene forma
de U.
desventajas: No se considera el valor exacto de cada unidad, no se puede emplear en estimaciones de parámetros de
población, no es útil para conjunto pequeños de valores,no se puede estimar con certeza cuando los datos se agrupan en
intervalos de clase.
Intervalo: La media es la medida más sensible, pero solo debe utilizarse cuando los datos son de nivel de medición de
intervalo. De otro modo, la media se calcula sobre números que no representan cantidades iguales y la media es
engañosa.
Ordinal: Si los datos no son de nivel intervalo, pero se pueden ordenar , entonces la mediana es la medición de tendencia
central apropiada.
Nominal: Si los datos están en categorías separadas discretamente, entonces se puede utilizar la moda.
La moda puede utilizarse con datos de nivel ordinal y de intervalo.
La mediana puede utilizarse con datos de nivel intervalo.
Una puntuación Z es el número de desviaciones estándar que un valor particular se aleja de la media.
la fórmula es: Z= x - x
………….
s
Glosario:
❏ Promedio: Término en lenguaje común para la tendencia central.
❏ Tendencia central: término formal para cualquier medida de valor típico o medio de un grupo.
❏ Intervalo de clase: Categorías en las que se divide una escala de datos continuos con el fin de resumir frecuencias.
❏ Dispersión: Término técnico para cualquier medida de la variación o distribución de los datos de una muestra o
población.
Distribución probabilística: Es un modelo teórico matemático basado en distribuciones empíricas. Es un patrón del modo
de distribución de las funciones teóricas de una variable aleatoria. Muestra la forma en la que se espera que los datos
OM
empíricos observados se distribuyen.
Muestra grande
continua que se define por su media aritmética y su desvío estándar. No hay una única curva normal sino infinitas. Muchos
de los fenómenos de las ciencias humanas se distribuyen como la curva normal dado que se tratan de variables aleatorias
continuas que al graficarlas se observa la forma típica de la campana de Gauss.
La distribución probabilística normal se usa como patrón para el análisis de datos obtenidos en las distribuciones
empíricas muestrales de observaciones concretas, brinda una aproximación teórica a la probabilidad de que se presente
un cierto valor de variable en estudio.
Proporciona el porcentaje de casos esperables hasta un cierto valor de variable. Brindó una manera de comparar los
rendimientos individuales en relación al rendimiento promedio del grupo.
Características de la distribución curva normal: 1. Es simétrica respecto al punto medio del eje horizontal, su forma
característica es de campana de Gauss
2. El punto por el que es simétrica es el punto por el que pasan tanto la media como la mediana y la moda (unimodal y
simétrica)
3. Las asíntotas nunca tocan el eje horizontal
4. Se sabe qué área se encuentra bajo la curva entre el punto medio y el punto en el que cae la desviación estándar
5. Presenta un trazado continuo, no como el polígono de frecuencia. Se concibe como representando la distribución de
infinitos casos en una variable continua
Concepto de normalidad estadística: se dice que alguien tiene un rendimiento estadísticamente normal si su puntuación
está entre la media y un valor de desvío estándar sea negativo o positivo, viéndolo desde el punto de vista de la escala de
percentiles estaría entre el percentil 16 y el percentil 86 (68,26% central de los casos).
1. Compara el rendimiento individual con respecto del grupo al cual un individuo pertenece
2. Compara el rendimiento de un mismo sujeto a varias pruebas diferentes
3. Averigua la probabilidad de ocurrencia de un determinado evento o el porcentaje de casos esperables de ser
observados por debajo de un puntaje o entre dos puntajes determinados
4. Averigua hasta qué puntuación o entre que puntuaciones se encuentra con cierta probabilidad de ocurrencia de un
evento o cierto puntaje
5. Clasifica o divide un grupo en sus grupos a los que se les puede asignar categorías diagnósticas
6. Se aplica en el campo de la estadística inferencial para la estimación de parámetros y en la prueba de hipótesis.
Modelo binomial: Una distribución binomial es una distribución de probabilidad discreta que describe el número de éxitos
al realizar experimentos independientes entre sí, acerca de una variable aleatoria.
Las propiedades de este tipo de distribución son:
• Cada ensayo debe tener sólo dos posibles resultados.
• La probabilidad de éxito ha de ser constante, esta probabilidad es representada con la letra p.
• La probabilidad de fracasos también ha de ser constante, esta probabilidad se representa mediante q = 1 – p (esta
ecuación nos ayuda a saber alguna de estas constantes si tenemos información sobre la otra).
• El resultado de cada experimento debe ser independiente a la anterior, por esta misma razón lo que ocurra en cada
OM
experimento no afectará al siguiente.
• Los sucesos deben ser mutuamente excluyentes, o sea que no se puedan dar los dos al mismo tiempo.
• qué sucesos son colectivamente exhaustivos lo cual quiere decir que al menos uno de los dos ha de ocurrir. Si no sale
cara sale cruz. Con respecto a la fórmula, no es el número de ensayos, x es el número de éxitos, p es la probabilidad de
éxito y q es la probabilidad de fracaso.
.C
puntuaciones Z:
Puntuaciones z: es la transformación de una observación que describe mejor al lugar que es observación ocupa en la
distribución. indica a qué cantidad de desvío estándar por encima de la media se encuentra dicha observación en el caso
DD
Si queremos convertir una puntuación bruta en una puntuación z debemos calcular el desvío (restar la media a la
puntuación bruta) y calcular la puntuación z (dividir el desvío por el desvío estándar)
Para convertir una puntuación z de puntuación bruta debemos calcular el desvío (multiplica la puntuación z por el desvío
estándar.
FI
El desvío estándar de una distribución de puntuaciones z siempre es exactamente 1. Las puntuaciones z se denominan a
ese es puntuación estándar debido a que representan valores estándares para la media y el desvío estándar. También se
debe a que las puntuaciones z brindan una especie de escala de medición estándar para cualquier variable. Andar) y
calcular la puntuación bruta (sumar la media al desvío).
Desviación semi intercuartil: se trata de la mitad de la distancia que hay entre los cuartiles 1 y 3, se simboliza Q. Se
corresponde con la mediana. Esta medida tiene en cuenta sólo aquellos dos valores que delimitan al 50% central de los
casos de la distribución, lo cual puede llegar a ser una desventaja. Q= (C3 – C1) / 2. Su ventaja es que es representativo del
grupo central de valores, además de que es sencillo de calcular. Su desventaja es que no considera valores extremos y que
es inexacto cuando se trata de intervalos largos de clase.
C) Desvío estándar: es la raíz cuadrada de la varianza, para calcular la primera es necesario calcular la varianza y luego
sacar su raíz cuadrada. El desvío estándar es el promedio de las diferencias entre las observaciones y la media. Es la
medida de variabilidad más utilizada, es la que preferimos utilizar cuándo utilizamos la media aritmética como medida de
tendencia central. Se trata de la raíz cuadrada del promedio de los desvíos en la media elevados al cuadrado. El desvío
estándar nos dice cuánto se alejan, en promedio, todas las observaciones de la distribución correcta a la media aritmética.
Para esta medida de variabilidad valen las mismas consideraciones que hicimos con respecto a la media aritmética. Se
simboliza S.
Dos propiedades del S:
1) Si al valor de cada observación de la muestra se le suma o se le resta una constante el desvío estándar permanecerá
igual, en cambio, si a esos valores se los multiplica o se los divide por una constante el desvío estándar quedará
modificado de la misma manera.
OM
Coolican “metodos de investigacion y estadistica en Psicologia”. capítulo 18
La correlación es la medición del grado en el que pares de valores relacionados en dos variables tienden a cambiar juntos.
También proporciona una medición del grado en el que pueden predecirse los valores de una determinada variable, a
partir de los valores de la otra variable.
Si una variable se incrementa con la otra, la correlación es positiva +1.
.C
Si una variable desciende con otra, la correlación es negativa -1.
Si hay ausencia de correlación, se muestra un valor cercano a 0.
Coeficiente de correlacion de Pearson:
DD
basados en la varianza de dos conjuntos de puntuaciones, es allí cuando aparecen desviaciones grandes.
El coeficiente de correlación de Pearson es una prueba que mide la relación estadística entre dos variables continuas. Si la
asociación entre los elementos no es lineal, entonces el coeficiente no se encuentra representado adecuadamente.
LA
OM
.C
VARIANZA ESTIMADA O COEFICIENTE DE DETERMINACIÓN:
Un coeficiente bajo puede decirnos entre 2 variables son significativas, aunque conectadas con debilidades. Por otro lado,
el coeficiente de correlación no es una escala de razón. Una correlación de 0.6 no es el doble de “buena” o predictiva de
DD
una de 0.3.
Una manera de convertir estas cifras a una escala de razón es elevar al cuadrado el valor del coeficiente, es decir, obtener
r°(2). Se denomina Varianza Estimada.
Cualquier grupo de puntuaciones tiene una variación dentro de sí, lo que conocemos como varianza. Tiene ambas
LA
puntuaciones . Nuestro resultado para dos grupos, de un ejemplo, fue de 0.93, si lo elevamos al cuadrado daría como
resultado 0.86. Se dice ahora que el 86% de la variación en y se puede predecir en la variación de x. El otro 14% se
considerará por errores aleatorios de ejecución o alguna diferencia entre la prueba nueva y la anterior. La estimación de la
varianza se hace utilizando el COEFICIENTE DE DETERMINACIÓN. Este valor es r°(2) x100, el cual es simplemente el valor
FI
Diagrama de dispersión: puede demostrar la fuerza de la correlación y si la relación tiene alguna propiedad peculiar.
Muestra la dispersión de los pares.
Los usos comunes de la correlación en psicología son:
5. Investigación Ex post Facto: ejemplo: cantidad de cigarros fumados y nivel de ansiedad, actitudes ante el sexismo, y
ante el racismo, locus del control y estrés experimentado ante el trabajo.
6. Evaluación de la confiabilidad de las escalas, pruebas y cuestionarios. Se utiliza más comúnmente en el test retest,
donde se evalúan 50 personas y después esas mismas personas luego de 6 meses. Y posteriormente se realiza una
correlación entre 2 grupos de puntuaciones.
7. Análisis factorial. Este utiliza una matriz de todas las correlaciones posibles entre varias pruebas, realizadas por los
mismos individuos.
8. estudios gemelos. estimaciones de heredabilidad y CI heredado.
9. en regresión múltiple.
El cálculo de la correlación entre 2 variables es una medida descriptiva. Medimos la cercanía entre 2 variables. Evaluar la
correlación para la significación es deductivo.
La fuerza de la relación entre 2 variables es el grado en el cual una variable tiende a ser alta si la otra lo es o al revés.
La cifra que se llega para expresar esa relación es el COEFICIENTE DE CORRELACIÓN.
Glosario:
● significación: medición de sí una correlación tendió a ocurrir al azar o no.
Rectas de Regresión:
En la tabla de valores de la variable talla - peso, solamente nos dan los valores de un determinado número de personas (10
en este caso): las personas de las que se conocen dichos valores. Mediante la recta de regresión podríamos obtener de
manera aproximada el peso de una persona de la que conociéramos la talla, en una población semejante a aquella de la
que se ha obtenido la muestra.
Si observamos la gráfica anterior, podríamos suponer por ejemplo que una persona de 185 cm pesaría algo más de 80 kg.
De manera más precisa, si conocemos la expresión de la recta de regresión, se pueden calcular valores para la variable y,
conocidos los de x, como si se tratara de una función.
OM
.C
y= bx +a
DD
El principal propósito del análisis de correlación lineal es medir la fuerza de una relación lineal entre dos variables.
Examina algunos diagramas de dispersión que demuestren diferentes relaciones entre entrada, o variables
independientes, x y salida o variables dependientes, y. Si, conforme no hay desplazamiento definido en los valores de y ,
se dice que no hay correlación, o no hay relación entre x y y. Si, conforme x aumenta, hay un desplazamiento en los
LA
valores de y, entonces existe una correlación. La correlación es positiva cuando y tiende a aumentar, y negativa cuando y
tiende a disminuir. Si los pares ordenados (x, y) tienden a seguir una trayectoria en línea recta, existe una correlación
lineal.
FI
El coeficiente de correlación lineal es la medida numérica de la fuerza de la relación lineal entre 2 variables. El coeficiente
refleja el efecto que un cambio en la variable tiene sobre la otra.
EL análisis de regresión encuentra la ecuación de la recta que mejor describe la relación entre dos variables. Un
uso de esta ecuación es realizar predicciones. Las predicciones se usan regularmente, por ejemplo, para predecir el éxito
que un estudiante tendrá en la universidad con base en los resultados del bachillerato y para predecir la distancia
requerida para frenar un automóvil con base en su rapidez. Por lo general, el valor exacto de y no es predecible y
comúnmente uno está satisfecho si las predicciones son razonablemente cercanas.Rentar un automóvil con base en su
rapidez.
La relación entre dos variables será una expresión algebraica que describa la relación matemática entre x y y. He aquí
algunos ejemplos de varias posibles relaciones, llamados modelos o ecuaciones de predicción:
Cuando los datos bivariados parecen caer a lo largo de una línea recta sobre el diagrama de dispersión, sugieren una
relación lineal. Pero esto no es prueba de causa y efecto. Claramente, si un jugador de básquetbol comete muchas faltas,
no anotará más puntos. Los jugadores con problemas de faltas “montan el pino” sin posibilidad de anotar. También parece
razonable que, mientras más tiempo de juego tengan, más puntos anotarán y más faltas cometerán. Por tanto, existirá
una correlación positiva y una regresión positiva entre estas dos variables. Aquí el tiempo es una variable oculta.
OM
El estudio de la correlación entre variables se limitará, en este curso, el caso de dos variables, la más simple, la relación
bivariable es la base para el desarrollo de los procedimientos multivariables, utilizados en las ciencias sociales y psicología.
Una de las variables lleva el nombre de variable “independiente”, (X), es aquellas que el investigador de algún modo
“controla”. También puede decirse que es aquella que en el contexto del planteo del problema (consideraciones teóricas
en que se basa el experimento), aparece como causa o explicación de los valores de la otra variable. O es aquella a partir
.C
de la cual se puede estimar el valor de la otra.
Por otro lado la variable dependiente o Y, es la que el investigador no controla directamente, aparece como efecto o
consecuencia de la independiente o como fenómeno a explicar. Es también aquella cuyos valores interesa anticipar a
DD
DIAGRAMAS DE DISPERSIÓN:
❖ Para dibujarlo se recurre al sistema de coordenadas cartesianas. En el eje horizontal se consignan los valores de la
variable independiente (X) y en el eje vertical, los de la dependiente (Y).
❖ Una relación es lineal cuando una variación de un valor determinado en X le corresponde siempre una variación de
FI
un valor determinado en Y.
❖ Si es una línea diagonal hacia la derecha, se denomina RELACIÓN LINEAL DIRECTA (PERFECTA).
❖ Si es ascendente hacia la derecha pero no recta es NO LINEAL DIRECTA.
❖ Si es una línea diagonal hacia la izquierda es RELACIÓN LINEAL INVERSA .
Si consideramos viable un modelo lineal, se tratara de ajustar una recta a la nube de puntos. Obviamente la recta no podrá
pasar por todos los puntos pero puede pensarse que pase tan cerca como sea posible de cada uno de ellos.
La recta que mejor se adapte o ajuste a los puntos dejará algunos por debajo y otros por arriba. Y se llamará recta de
regresión minimo cuadratica.
Debe subrayarse que la existencia de una relación estadística entre 2 variables no implica una relación causal entre ellas. Si
entre 2 variables hay relación causal, habrá también relación estadística, pero no a la inversa.
Ficha de cátedra chi cuadrado:
Dos sucesos son independientes si la probabilidad de que suceda uno no afecta a la probabilidad de que suceda el otro,
(p - a )= p (a)p(b)
La prueba Chi cuadrado es una prueba no paramétrica que se usa para varias cosas pero que acá vamos a estudiar como
prueba de independencia.
Sería: ¿las dos variables están asociadas?¿puedo decir que son independientes? ¿la probabilidad de que una tome cierto
valor ¿tiene que ver con la probabilidad de que la otra adquiera cierto otro valor?
OM
.C
DD
LA
FI
ruebas no paramétricas son aquellas que se encargan de analizar datos que no tienen una distribución
Las p
particular y se basan en una hipótesis, pero los datos no están organizados de forma normal. Aunque tienen
algunas limitaciones, cuentan con resultados estadísticos ordenados que facilitan su comprensión.
ruebas paramétricas, en cambio, se basan en las leyes de distribución normal para analizar los
Las p
elementos de una muestra. Generalmente, solo se aplican a variables numéricas y para su análisis debe
mantener una población grande, ya que permite que el cálculo sea más exacto.
OM
Es la suma de los valores esperados menos los observados, elevando al cuadrado,dividido por los valores esperados.
Los valores observados son los de la tabla de doble entrada que vimos más arriba.
Son los valores observados en la muestra, en nuestros datos.
Los valores esperados son los que esperamos ver si las dos variables fueran independientes.
La definición de independencia: si dos eventos son independientes, entonces la probabilidad de que se den juntos es igual al
.C
producto de las probabilidades. p(AnB)=p(A) P(b).
Si por ejemplo tengo 2 probabilidades multiplicó la N (cantidad de gente por la probabilidad de pertenecer al grupo que ve
una aplicación de photoshop y por la probabilidad de querer realizarse un cirugía estética.
DD
Para sacar la probabilidad esperada hay que cada celda(35) multiplicarlo por el total de la columna(38) que le corresponde
dividido por el total (70)
cirugía estética no 27 5 32
FI
total 35 35 70
El total 35 y el total 38 de arriba son los dos marginales que se multiplican (total fila y total columna) y el total 70 es el que
se divide. Entre paréntesis aparece la frecuencia esperada de personas que ven la aplicación y se realizan una cirugía
30 19 11 121 63684
total 127.368
OM
5) Dividir cada diferencia cuadrática por la frecuencia esperada para cada categoría.
6) Sumar los resultados del paso 5 de todas las categorías.
7) Si es menor que 0.05 entonces se rechaza la hipótesis nula, sino, no se rechaza.
El 0.05 es el nivel de significación.
La situación de ausencia de relación entre las variables en una tabla de contingencia se denomina INDEPENDENCIA.
.C
Grados de libertad:
Las pruebas chi-cuadrado son pruebas de hipótesis para variables nominales. El chi-cuadrado mide el grado de
discrepancia entre frecuencias esperadas y observadas de varios niveles o categorías.
La prueba de chi-cuadrado de BONDAD DE AJUSTE se utiliza para probar la hipótesis de que una distribución de
frecuencias de dos o más categorías de una variable nominal coincide con una distribución esperada. (las distribuciones
LA
Tabla de frecuencias:
Una tabla o distribución de frecuencias es una forma particular de ordenar los datos basada en los valores concretos que
adopta una variable categórica y en el número de veces que se repite cada valor. El objetivo de una tabla de frecuencias es
organizar la información y también resumirla.
La primera columna de la tabla recoge los tres valores de la variable. La segunda columna muestra las frecuencias
absolutas , es decir, el número de veces que se repite cada valor.La tercera columna contiene las frecuencias relativas, las
cuales se obtienen dividiendo las correspondientes frecuencias absolutas entre el número total de casos.
Estas frecuencias indican la proporción de veces que se repite cada valor (también se les llama proporciones).
Multiplicando por 100 las frecuencias relativas definidas anteriormente, se obtienen las frecuencias porcentuales (%).
Estas frecuencias indican el porcentaje de veces que se repite cada valor. Puesto que la información que ofrecen las
frecuencias relativas y las porcentuales es idéntica, no es necesario incluir ambas en una misma tabla de frecuencias.
Esta variable es categórica, al igual que el tabaquismo; pero, a diferencia de ésta, el nivel de estudios es una variable
ordinal (sus categorías están cuantitativamente ordenadas). En estos casos es posible calcular un tipo particular de
frecuencias llamadas acumuladas. (por ejemplo frecuencias relativas acumuladas; 0.01,0.05,0.08 etc, se van sumando
cada valor mas el anterior).
La frecuencia absoluta acumulada recoge el número de veces que se repite un valor más cualquier otro inferior a él. La
frecuencia relativa acumulada se obtiene dividiendo la frecuencia absoluta acumulada entre el número total de casos Y la
frecuencia porcentual acumulada (%) se obtiene multiplicando por 100 la frecuencia relativa acumulada (%).
Las frecuencias absolutas constituyen el punto de referencia de una tabla de frecuencias: todas las demás frecuencias se
calculan a partir de las absolutas.
Las variables dicotómicas son variables categóricas que toman sólo dos valores: acierto-error,verdadero-falso,
recuperados-no recuperados, a favor-en contra, funciona-no funciona, etc.Muchas de estas variables se obtienen
OM
registrando la presencia-ausencia de algún evento (por ejemplo, la presencia-ausencia de un tratamiento, o de un
síntoma); otras muchas se obtienen dicotomizado variables cuantitativas (por ejemplo, aprobados-suspensos,
hipertensos-no hipertensos, etc.).
La distribución binomial permite conocer la probabilidad asociada al número de éxitos (o de fracasos) obtenidos en un
conjunto de ensayos de Bernoulli, es decir, la probabilidad de obtener un determinado número de caras en un conjunto
.C
de lanzamientos de una moneda,un determinado número de aciertos en un conjunto de respuestas, un determinado
número de recuperaciones en un conjunto de pacientes tratados, etc. Por tanto, la distribución binomial sirve para
trabajar con variables dicotómicas.
DD
En general, una hipótesis estadística surge a partir de una hipótesis científica. Pero entre una hipótesis científica y una
hipótesis estadística no existe una correspondencia exacta. La primera proporciona bases para la formulación de la
segunda, pero no son la misma cosa. Mientras una hipótesis científica se refiere a algún aspecto de la realidad, una
LA
hipótesis estadística refiere a algún aspecto de una distribución de probabilidad. Por otro lado, tenemos que tener en
cuenta que hay varias formas de representar una hipótesis científica en una hipótesis estadística. Una vez determinada la
hipótesis estadística a partir de la hipótesis científica se pasa al contraste de hipótesis.
El contraste de hipótesis se basa en dos hipótesis: una hipótesis alternativa o H1, y una hipótesis nula o H0. La H1 es la
FI
La primera, también llamada zona crítica, es el área de la distribución muestral que corresponde a los valores estadísticos
de contraste que se encuentran tan alejados de la afirmación establecida en H0 que es poco probable que ocurran su H0
es verdadera.
La zona de aceptación es el área de distribución muestral que corresponde a los valores del estadístico de contraste
próximos a la afirmación establecida por H0. Es, por tanto, el área correspondiente a los valores estadísticos de contraste
que es probable que ocurran si H0 es aceptada.
La decisión: planteada la hipótesis, formulados los supuestos, definido el estadístico de contraste y su distribución
muestral, y establecidas las reglas de decisión, el paso siguiente consiste en obtener una muestra aleatoria de tamaño n,
calcular el estadístico de contraste y tomar una decisión.
Tal decisión siempre se toma respecto a H0. Cuando decidimos mantener una hipótesis nula, queremos significar con ello
que consideramos que esa hipótesis es compatible con los datos. Si decidimos rechazarla, queremos significar con ello que
consideramos probado que esa hipótesis es falsa. La razón por la que esto es así es doble.
Por un lado, raramente es posible afirmar que H1 no es verdadera, las desviaciones pequeñas de H0 forman parte de H1.
Por esta razón, cuando mantenemos H0, de alguna manera también mantenemos algunos valores de H1.
Llamamos error de tipo I al que se comete cuando se decide rechazar H0 que en realidad es verdadera, y es un valor
conocido.
Llamamos error del tipo II al que se comete cuando se decide mantener una H0 cuando en realidad es falsa, y es un valor
desconocido.
CAPÍTULO 4:
OM
★ Se dice que un estadístico es resistente cuando es poco sensible a la presencia de anomalías en los datos. Esta
propiedad es particularmente útil cuando se trabaja con distribuciones asimétricas, es decir, con distribuciones que
contienen casos muy alejados del centro por uno de los dos extremos de la distribución.
★ La media aprovecha las propiedades cuantitativas (de intervalo o razón) de los datos. La mediana, sin embargo, sólo
aprovecha sus propiedades ordinales.
.C
★ El grado de parecido entre estos estadísticos depende, básicamente, de la forma de la distribución de la variable: si
la distribución es simétrica, todos los estadísticos toman el mismo valor;la diferencia entre ellos va aumentando
conforme aumenta el grado de asimetría.
DD
★ La media aritmética utiliza las propiedades cuantitativas de los datos y se basa en una ponderación uniforme de
todos ellos. Esto la convierte en un estadístico muy sensible (poco resistente) a la presencia de asimetría en la
distribución de los datos
★ la forma de la distribución,además de ayudar a elegir entre estadísticos, es útil por sí misma: permite obtener una
LA
visión rápida de las características de la variable, detectar valores anómalos (valores que no se parecen al resto),
advertir inconsistencias en los datos (valores que se repiten demasiado o valores que no aparecen), etc. Por tanto,
conocer la forma de una distribución tiene un interés comparable al de identificar su centro o cuantificar su
dispersión.
La asimetría se refiere a la forma en que los datos se distribuyen por encima y por debajo del centro. En una
FI
★
distribución simétrica, las distribuciones a cada lado del centro tienen la misma forma (una es espejo de la otra). La
simetría se rompe cuando existen casos que se alejan del centro más por uno de los extremos que por el otro.
Cuando los casos más alejados del centro se encuentran en la zona alta de la distribución, decimos que existe
Trabajar simultáneamente con una variable categórica y una cuantitativa significa, por lo general, trabajar con una
variable que define grupos (la categórica) y una variable en la cual se desea comparar los grupos (la cuantitativa). Si la
variable categórica tiene sólo dos categorías y, por tanto, define sólo dos grupos, lo habitual es compararlos mediante la
prueba T de Student para muestras independientes ; si la variable categórica tiene más de dos categorías y, por tanto,
define más de dos grupos, lo habitual es compararlos mediante el análisis de varianza de un factor.
El objetivo del análisis es el de contrastar la hipótesis de que las medias poblacionales son iguales.
Lo habitual es, más bien, que las varianzas poblacionales sean, al igual que las medias, desconocidas; en cuyo caso el error
típico de la distribución muestral de Y _ 1Y _ 2 (el denominador de la ecuación,será igualmente desconocido y habrá que
estimarlo.
ASUMIENDO VARIANZAS IGUALES:
Si se asume que las varianzas poblacionales son iguales (es decir, ), sólo será necesario estimar un parámetro. Y como cada
una tiene un estimador del parámetro, la mejor opción sería combinarlos.
NO ASUMIENDO VARIANZAS IGUALES:
Si no puede asumirse que las varianzas poblacionales son iguales, no tiene sentido realizar una única estimación de las
mismas a partir de la combinación ponderada de los dos estimadores disponibles ( y ). Lo razonable será, más bien, utilizar
cada uno de ellos como estimador de la varianza de su propia población.
OM
El valor que toma un índice (un porcentaje o media), en una población se denomina valor paramétrico o parámetro. Este
debe diferenciarse del valor estadístico, que es el valor que toma un índice en una muestra de población.
Por ej el porcentaje de analfabetos sería el parámetro, pero si extraemos una muestra representativa de toda esa
población y observamos el porcentaje de analfabetos, se denomina valor estadístico.
Los valores paramétricos se pueden conocer en su completud, cuando se analiza toda una población. Como por ejemplo
.C
los censos de población y vivienda, donde se observa toda la población entonces puede calcularse un índice con el valor
que corresponde a cada miembro de la población.
En psicología o en las ciencias sociales no se conocen precisamente los valores paramétricos. Por lo tanto se tratará de
DD
estimarlos a través de muestras. La operación consistente en utilizar los resultados en muestras de una población para
estimar el valor paramétrico que caracteriza a esa población objeto de estudio en la estadística inferencial. Llamado
ESTIMACION DE PARAMETROS.
Esto último se trata del estudio de los límites y posibilidades de la inferencia de los valores poblacionales, (o sea
LA
Media M u mu
Proporción P n pi
OM
el SIGMA O LA (O´) ES LA DESVIACIÓN ESTÁNDAR (MEDIDA DE DISPERSIÓN DE LOS DATOS RESPECTO DEL MEDIO).
La estadística enseña que si de una población con media igual a (media) y desviación estándar igual Ó, se extraen
muestras aleatorias de tamaño N, las medias de esas muestras se distribuyen en forma normal, la media de esas medias
será igual a la desviación estándar de esas medias será igual a:
Ó m= O
.C
(raíz de n) 👉cuando N tiende al infinito
DD
LA
FI
La distribución de muestreo de las medias, como la de cualquier estadístico es una distribución teórica ideal, y conocida.
Debe distinguirse de la distribución paramétrica o poblacional de una variable, que es una distribución real , a menudo
desconocida y algunas cuyas características o parámetros queremos estimar. Se tiene por otro lado que la distribución
muestral de una variable, que es la distribución que se observa en una muestra de población y por lo tanto es real, y
conocida.
Cuando efectuamos una estimación puntual, nos contentamos con respuestas aproximadas: muy probable, próximo, con
pequeña diferencia. En cambio si queremos hacerlo con mayor precisión entonces podemos hacer una estimación por
intervalo. Por lo que la conclusión sería que un valor está en el intervalo 4-7, siendo los límites…. etc.
Intervalo de confianza: se centra en el valor estadística de la muestra, y que con ciertas probabilidad
especificable(probabilidad de confianza) , contiene el valor del parámetro que se desea conocer.
Es conveniente que N sea grande, por encima de 120, para alcanzar estimaciones de intervalo suficientemente precisas.
CAPÍTULO 11:
Tenemos en principio 2 hipotesis, en una se afirma que la media es de 180, y la otra que la media es diferente de 180.
Estas hipótesis se oponen entre sí.
A una de las hipótesis la llamaremos hipótesis nula que se simboliza con (Ho). Esta representa un punto de vista o
creencia generalmente aceptada acerca de una cuestión en un momento dado.
A la otra hipótesis la llamaremos hipótesis alternativa (H1), generalmente esta hipótesis se opone a lo comúnmente
aceptado acerca de una cuestión, y refleja la creencia o esperanza del investigador,quien desea mejorar el conocimiento
del fenómeno que está en estudio.
Por lo general la segunda representa aquella concepción del fenómeno que el investigador quería demostrar y la primera
la esperanza íntima del investigador.
Las pruebas de hipótesis y las llamadas pruebas de significación estadística, que son procedimientos específicos para
someter a prueba ciertas hipótesis, se centran en la hipótesis nula. En base a los resultados de la prueba se decidirá la
aceptación o el rechazo de la hipótesis nula. La segunda opción implica rechazar la hipótesis nula, y dejar como verosímil
y de acuerdo a la información disponible, la hipótesis alternativa.
Las hipótesis son exactas cuando especifican un valor determinado para un parámetro, en el caso del ejemplo la hipótesis
OM
nula es exacta, ya que marca que la media es 180. La Ho es siempre exacta. La prueba de hipótesis siempre se entra en la
Ho y los modelos matemáticos que se utilizan en la prueba de hipótesis describen aquello que debería observarse en una
muestra si fuera verdadera la hipótesis nula ho Ho. Para poder hacer esta descripción es necesario que la Ho proponga un
valor exacto para el parámetro que propone la prueba.
La H1 (hipótesis alternativa) puede ser exacta o inexacta. En el ejemplo , la H1 es inexacta ya que afirma que es diferente
.C
a 180, sin especificar ningún valor determinado. La H1 sería exacta si propusiera para un cierto valor determinado, como
por ejemplo 210.
DD
En este caso la hipótesis alternativa es bidireccional ya que puede ser mayor o menor que 180, si fuera solo mayor sería
unidireccional.
Realizar una prueba de hipótesis consiste en efectuar una serie de operaciones para decidir acerca de la verosimilitud de
LA
Si el resultado es fácilmente observable aceptamos la hipótesis nula, y el resultado es improbablemente observado de ser
cierta la hipótesis nula, entonces se busca la hipótesis alternativa.
FI
Necesitamos conocer cuáles serían los resultados posibles de un experimento si fuera cierta la hipótesis nula y también
necesitamos saber cual es la posibilidad de verificarse de cada uno de esos resultados posibles del experimento si fuera
cierta la hipótesis nula ho Ho. Dicho de otra manera, necesitamos saber cuál va a saber la distribución del muestreo
estadístico si la hipótesis nula fuera cierta.
ZONA DE ACEPTACIÓN: de Ho como el conjunto de resultados posibles de un experimento que tiene una relativamente
alta probabilidad de beneficiarse de Ho ser cierta.
ZONA DE RECHAZO: de Ho al conjunto de los resultados de un experimento que tiene escasa probabilidad de verificarse
si fuera cierta Ho.
Error de tipo I (ETL): el que se define como rechazar una Ho que en realidad es verdadera.
OM
❖ Si las hipótesis implican una comparación entre medias y se tienen muestras pequeñas, se recurre a la distribución
T STUDENT, como también cuando se trata de una hipótesis acerca de una media paramétrica y se dispone de una
muestra pequeña o cuando se trata de una hipótesis acerca del valor del coeficiente de Pearson o el de Spearman
en la población.
❖ Con la expresión T Student se define una familia de distribuciones teóricas que permiten de hipótesis de diferentes
tipos cuando las muestras son pequeñas, el estadístico T es semejante al puntaje Z.
.C
❖ La distribución T es unimodal y simétrica, con media igual 0. Es semejante a una distribución normal pero más
aplanada y alargada. Se habla de una familia de distribuciones o una familia de Curvas, porque la forma precisa
DD
depende del número de casos, o dicho de otra manera, depende de los grados de libertad de la prueba.
❖ La expresión “grados de libertad” se refiere al número de valores de una serie estadística que pueden variar
libremente después de que se han impuesto ciertas restricciones a la serie de datos, se calcula N-1. Es decir número
de casos menos 1.
❖ Algunas aplicaciones de la distribución T student:
LA
1. La distribución T puede tomarse como modelo para describir la distribución de los resultados posibles de un
experimento (suponiendo cierta hipótesis nula) en varias pruebas de significación estadística. Las siguientes son
algunas.
a) Prueba de hipótesis sobre el valor de una media paramétrica con muestras pequeñas. para realizarse esta
FI
prueba debe aceptarse que la variable en estudio se distribuye en forma normal, o por lo menos unimodal y
simétrica, en la población.
b) Prueba de hipótesis sobre diferencias entre medias con muestras pequeñas, donde se definen dos grupos,
Definiciones importantes:
Población: es un conjunto de objetos, sujetos o elementos con características determinadas.
Elemento: es cada miembro de la población. Todo elemento de una población posee las características en base a las cuales
se ha definido la población.
Muestra: qué es un subconjunto de la población, una parte extraída con objeto de obtener información sobre la totalidad
de esta. El requisito principal que debe reunir una muestra es la representatividad, que los resultados que se obtengan de
la misma concuerden con los que se hubiesen obtenido de haber sometido observación toda la población completa. La
representatividad es relativa ya que una muestra no se puede clasificar como enteramente representativa o enteramente
no representativa de la población de donde ha sido extraída.
Unidad de muestreo y marco de referencia: la unidad de muestreo puede ser un elemento de la población, como ocurre
OM
con el muestreo aleatorio simple, a un subconjunto de la población que incluye más de un elemento. El marco de
referencia es el registro o listado de las unidades de referencia que sirve como base para determinar cuáles unidades
integrarán la muestra.
Muestreo probabilístico o aleatorio: no se conocen suficientemente las características de la población o no se conocen las
características de la población en los aspectos que interesan en el estudio o en los que están relacionados con ellos. Por
.C
eso, el procedimiento que otorga mayores garantías de representatividad de la muestra es su conformación al azar. En
este tipo de muestreo cada elemento de la población tiene una probabilidad conocida y no nula de ser seleccionada.
TIPOS DE MUESTREO:
DD
1) Muestreo aleatorio:
A) Muestreo aleatorio simple: todos los miembros de la población deben haber tenido la misma probabilidad de
ser incluidos en la muestra, la inclusión de un miembro no ha sido influenciada por la de otro miembro. Para
realizar un muestreo de este tipo es necesario contar con el listado de registro de todos los elementos que
LA
componen la población para utilizarlo como marco de referencia. De este listado se extraen al azar algunos
elementos de la población, tanto como el número de casos que se desea para la muestra.
Las ventajas son que está libre de sesgos que se pueden introducir por el uso de ponderaciones incorrectas en las
unidades muestrales. No supone conocimiento previo de ninguna de las características de la población que será
FI
estudiada.
Las desventajas son que requiere de un listado completo de todas las unidades que componen la población, lo cual
demanda mucho tiempo y trabajo.
La condición fundamental para realizar un muestreo aleatorio simple es disponer de un correcto marco de
referencia. Pero debemos tener en cuenta que no siempre se dispone de tal marco.
También debemos tener en cuenta que cuando usted dispone de un marco de referencia con un cuidado especial
ahora tendrá que asegurarse que realmente estén registrados todos los miembros de la población y que cada uno
esté registrado solamente una vez.
B) Muestreo sistemático: es frecuentemente utilizado Por qué es más fácil de aplicar y además es económico. Consiste en
tomar cada unidad K-ésima de muestreo después de un arranque aleatorio, de la lista de 1 a N unidades de muestreo de la
población total. En la imagen K=3. Este tipo de muestreo requiere disponer de un listado completo de todos los miembros
de una población. Esto nos asegura que para la elección se ha consultado y recorrido todo el listado completo. La
desventaja es desde el punto de vista estrictamente estadístico, no es probabilístico ya que puede resultar de los sesgos
propios del listado que utilizamos. La ventaja es que es un método económico.
OM
Como se dijo anteriormente, se extrae una muestra aleatoria de cada estrato independientemente. Dicha extracción
puede realizarse proporcionalmente al número de casos de cada estrato o no.
Es posible estratificar proporcionalmente según varias variables a la vez y es fácil comprender que cuanto mayor sea el
número de variables de estratificación mayor la garantía de representatividad de la muestra.
Por otro lado, en el muestreo estratificado no proporcional se emplean deliberadamente fracciones de muestreo
diferentes en distintos estratos.
.C
DD
LA
Desventajas: supone el conocimiento previo de las características de la población a partir de las cuales se estratifica; son
FI
de costos más elevados, también conlleva una dificultad en la determinación de estratos homogéneos.
Ventajas: asegura muestra representante, estimaciones más precisas, mejor conocimiento de grupos pequeños.
D) Muestreo por conglomerados: este muestreo consiste en la extracción aleatoria de grupos de elementos o
combinados. se aplica generalmente por la falta de una lista de los elementos de la población y debido al elevado costo de
construir una lista. para obtener una muestra de este tipo se vio a la población en grupos de elementos, luego se
seleccionan entre estos aleatoriamente y los elementos que componen los conglomerados elegidos forman todos parte de
la muestra. Hay dos grandes diferencias entre el muestreo por conglomerados y el muestreo estratificado. En el muestreo
estratificado se sigue un criterio definido sobre la base del conocimiento previo de la variable en estudio, mientras que en
el de conglomerados no se sigue un criterio sustantivo. La segunda diferencia es que el muestreo estratificado es un
muestreo de elementos y el de conglomerados no.
E) Muestreo plurietápico: la característica principal de este tipo de muestreo es que se realiza una selección aleatoria en
cada una de las varias etapas. Las unidades de muestreo son diferentes en cada una de ellas y consecuentemente los
marcos también lo son. Este tipo de muestreo es comúnmente realizado cuando no se dispone una lista de los elementos
que son objeto de estudio, pero pueden localizarse mediante otras unidades de muestreo.
OM
B) Muestreo intencional o por conveniencia: también llamado muestreo de juicio, se basa en la elección de un
.C
subconjunto de elementos que el investigador subjetivamente considera representativos de la población. este tipo de
muestreo es poco utilizado de las ciencias de la conducta y requiere una considerable experiencia previa con la población
DD
C) Muestreo por cuotas: se usa normalmente en encuestas de opinión pública y estudios de mercado. El investigador
identifica cuotas en función de determinadas variables demográficas. Luego instruye a encuestadores para que completen
dichas cuotas. Puede confundirse con el muestreo demográfico, pero a diferencia de éste, en el muestreo por cuotas hay
más selectividad por parte de los encuestadores, tomarán como muestra a personas que les resulten más cómodas o que
Error de muestreo: La estimación es un proceso mediante el cual se obtienen estimaciones que se aproximan al valor del
parámetro poblacional, partiendo de la información proveniente de una muestra. Cuando se hacen dichas estimaciones,
se supone que la media de la población es la misma que la media de la muestra. Debido a que siempre la media de la
muestra será un poco distinta que la de la población, la diferencia se conoce como error de muestreo.
Esta diferencia entre la media de la Muestra y la media de la Población es conocida como Error de Muestreo. Este se
estima utilizando la varianza de la muestra. Por lo tanto, si la media tiene una alta desviación estándar, se deduce que la
muestra también tiene un alto error del proceso de muestreo. La exactitud de esta estimación depende del tamaño de la
muestra. Hay que tener en cuenta que, a menor tamaño de muestra, menor posibilidad de error de muestreo. Lo que el
investigador debe hacer es minimizar el error del proceso de muestreo. Esto se puede lograr con un muestreo
probabilístico adecuado y no sesgado y mediante el uso de un gran tamaño de la muestra.
Los censos y estadísticas regulares atienden siempre a solo algunas variables. Se intentará estimar las otras variables a
través de muestras. Esto consiste en utilizar los resultados en muestras de una población para estimar el valor
paramétrico que caracteriza a esa población objeto de estudio.
Dato: los valores estadísticos se representan con letras del alfabeto latino mientras que los parámetros se representan con
letras griegas. También debemos saber que el valor de un índice nunca o muy raramente coincidirá con el valor
paramétrico que caracteriza a la población representada por la muestra.
Conceptos probabilísticos: se llama variable aleatoria a cuyos valores o categorías resultan de un experimento aleatorio.
Un experimento aleatorio puede entenderse como una operación cuyos resultados (eventos) dependen del azar. Ej: lanzar
una moneda, esta situación puede resultar en dos eventos, que salga cara o que salga cruz. Lo mismo ocurre con el
OM
experimento del lanzamiento de un dado. En el primer ejemplo, si lanzamos dos monedas, la probabilidad de que salgan
dos caras es de 1/4 ya que hay 4 posibles resultados o eventos (cara cara, cara cruz, cruz cruz, cruz cara), o sea una
probabilidad de un 25%, y la probabilidad de que salga solamente una cara, sin importar el orden es de 2/4, o sea un 50%.
BARANGER:
.C
Tamaño de la muestra: determinar el tamaño del cuadro peruana muestra una elección crucial, por todas las
consecuencias negativas que puede producir una equivocación. No obstante, no es frecuente que el tamaño de una
muestra se determine en función de los recursos disponibles.
DD
Todas las muestras pueden clasificarse en dos grandes categorías según el tipo de hipótesis que se pretende poner en
prueba.
Puede tratarse de una hipótesis generalización (a partir de los datos muestrales se pretende inferir) o de una hipótesis
sustantiva (se desea comprobar la existencia determinada relación entre ciertas variables). en el primer caso los criterios
LA
pertinentes a tener en cuenta serán los habituales para cualquier tipo de inferencia estadística, en el segundo, pueden
resumirse en unas breves reglas muy sencillas de comprender.
Muestras para verificar hipótesis generalización: Existen procedimientos estadísticos que nos permiten estimar la
probabilidad de que un determinado valor muestral no difiera sustancialmente del parámetro que se hubiera obtenido de
FI
• Margen de error
• Variabilidad
En síntesis, cuanto mayores sean nuestras exigencias respecto al grado de confiabilidad y de precisión de nuestros
resultados, mayor habrá de ser el tamaño de la muestra.
Muestras para someter a prueba hipótesis sustantiva:
Si el objetivo de nuestra investigación es primordialmente analítico antes que descriptivo, no estaremos tan interesados
en la generalización como en la simple comprobación de la existencia de relaciones específicas entre las variables.
El tamaño se basará en enriquecimientos demandados que nos permitan determinar la existencia de relaciones entre el
conjunto de las unidades incluidas en la muestra.
Las preguntas a formularse para determinar el tamaño de la muestra tienen que ver con el número de variables que se
pretenden analizar simultáneamente y con el número de valores de cada una de esas variables.
Datazo: Galtung presenta una tabla de número mínimo de unidades para el análisis de un promedio de 10 casos por
celda. Dicha tabla nos muestra que por ejemplo para estudiar la relación entre 3 variables dicotómicas se requiere un
mínimo de 200 casos para contar con un promedio de 10 observaciones por celdas.
Las muestras por cuotas son mucho más eficientes que las muestras accidentales simples. De allí que su uso sea muy
frecuente en sondeos electorales, así como en la investigación de mercado en general. Sin embargo, el muestreo por
cuota sigue siendo en esencia un procedimiento incidental en el que cada estrato de la muestra es una muestra accidental
del correspondiente extracto de la población.
En particular, la libertad otorgada a los entrevistadores puede dar lugar a muestras sesgadas. Estos son proclives a
encuestar a las personas que tengan más a mano (amigos o conocidos) y a descartar personas que no se encuentren en su
domicilio cuando los visitan.
Muestras probabilísticas:
OM
Muestra al azar simple: es el ejemplo más sencillo de un procedimiento de muestreo probabilístico. En la muestra todos
los elementos de la población tienen la misma probabilidad de resultar, y todas las combinaciones de elementos de para
un tamaño dado de la muestra presenta también la misma probabilidad de selección.
El requisito imprescindible para seleccionar una muestra al azar simple es disponer de un listado de todos los elementos
.C
que componen la población. A cada una de las unidades se les asigna un número. Luego recurriendo a una tabla de
números al azar se extraerán una cantidad necesaria de números correspondientes a las unidades que integrarán la
muestra.
DD
En la práctica, este procedimiento se torna por demás engorroso al trabajar con poblaciones grandes. En poblaciones
pequeñas puede conducir a una representación absolutamente insuficiente de los estratos de menor peso relativo a la
población. Es por esto que en estas condiciones suelen optar otros diseños muestrales libres de estas desventajas.
LA
Muestra sistemática: sí delante de un procedimiento de muestreo que a todos los efectos prácticos presentará la misma
pulir tú dices que el muestreo al azar simple. Aquí también se requiere como condición indispensable contar con el listado
FI
sumará la fracción de muestreo obteniendo así la segunda unidad y así sucesivamente hasta completar la muestra.
La condición para utilizar este procedimiento es que la numeración de las unidades en la lista no responde a ningún orden
en particular.
En determinadas circunstancias, sin embargo, la existencia de un orden puede resultar ventajosa pudiendo ponerse al
servicio de la investigación.
Muestra estratificada: en el diseño más simple de muestra estratificada, la única diferencia con respecto a la muestra por
cuotas es el hecho de que la selección de las unidades se realiza al azar. Esta no es una diferencia menor puesto que
obtenemos una muestra apta para realizar cualquier tipo de inferencia estadística. Pero conceptualmente ambos tipos de
muestras son muy similares, así como la muestra por cuotas consiste en una serie de muestra casuales tomadas cada una
dentro de un estrato diferente, así una muestra estratificada se compone de varias muestras al azar simple seleccionada
dentro de otros tantos estratos.
Dividir la población en estratos es útil en la medida en que los estratos sean internamente homogéneos y externamente
heterogéneos en cuanto a las variables de nuestro interés. si se cuenta con una estimación previa acerca de la variabilidad
del parámetro dentro de cada estrato, entonces el modo más eficiente de muestrear es aquel en el que el número de
casos seleccionados sea proporcional a esa variabilidad.
Muestras por conglomerados y etapas múltiples: si en la muestra estratificada se seleccionan los casos dentro de cada
estrato, asegurando así que todos los estratos están representados, en este otro tipo de muestra se selecciona entre los
conglomerados. Correlativamente cómo se busca en los estratos la homogeneidad interna, para los conglomerados
cuanto más heterogéneo sean mejor será el resultado. Dividida toda la población en conglomerados, se seleccionará al
azar un cierto número de estos dentro de los cuales se entrevistará a todas las unidades de análisis.
OM
observación con el propósito de obtener resultados válidos también para el universo total investigado.
● Las muestras tienen un fundamento matemático estadístico que consiste en que, obtenidos de una muestra,
elegida correctamente y en la proporción adecuada, unos determinados resultados, se puede realizar la inferencia
o generalización basándose matemáticamente en que dichos resultados son válidos para el universo del que se ha
extraído la muestra.
.C
● Al elegir una muestra debe decidirse con cuidado la incógnita de qué se desea resolver. debe decirse qué tipo de
muestra se va a utilizar y qué tratamiento estadístico se va a dar a los datos, en función de la investigación que se
haya planteado.
DD
variable aleatoria. En este sentido, más específico que el anterior, el error muestral está relacionado con la
desviación típica muestral y constituye la pieza básica para el diseño de un plan de muestreo y la evaluación de la
calidad de las estimaciones. El resto de posibles errores muestrales no vinculados con la variabilidad probabilística
se suelen englobar bajo el nombre de errores no muestrales, como pueden ser los asociados con la falta de
representatividad de la muestra, la no respuesta, con un marco poblacional incompleto, con sesgos de selección de
los individuos muestreados, con deficiencias en los cuestionarios, etc.
● Lo más frecuente en la práctica es que el verdadero valor poblacional sea desconocido, por lo que las definiciones
dadas para el error no son operativas. Por ello, en la mayoría de los casos, el término error muestral hace
referencia a las diferencias debidas a la variación entre muestras.