Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introducción
En este bloque nos enfocaremos en el desarrollo de los métodos y/o la pruebas estadísticas
paramétricas, según el tipo de estudio o investigación que se desea realizar.
Las pruebas estadísticas paramétricas implican una estimación de los parámetros de la población
con base en muestras estadísticas, mismas que tienen que repercutir en sus resultados en base
al tamaño de la muestra, por lo que entre más grande sea la muestra más exacta será la
estimación, y viceversa, cuando presentamos tamaños de muestras muy pequeños, tenderá a la
distorsión de los resultados.
Para este bloque analizaremos algunos métodos como la distribución normal, la T y la F con sus
comparaciones de varianzas y medias, así como el análisis de varianzas y de las medias, y por
último la prueba R de Pearson, las cuales nos permitirán analizar sus ventajas en cuanto a su
poder de eficiencia, la sensibilidad de los datos seleccionados y su robustez en la estimación de
probabilidades exactas. Sin embargo cabe hacer notar que también debemos no dejar de lado las
desventajas que se tienen en la utilización de las pruebas estadísticas paramétricas, ya que el
cálculo es más difícil y no todos los datos pueden ser valuados en este tipo de métodos, haciendo
el uso de las pruebas no paramétricas en cuanto sean necesarios.
Temario
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
Objetivo por bloque:
Emplear bases teóricas, características y funciones de cada una de las pruebas paramétricas
dentro de la estadística, tales como; el análisis y comparación de varianzas que le permitan
solucionar problemas en el desarrollo de muestras psicológicas.
Puede por ejemplo demostrarse que cuando se realiza un experimento aleatorio, este se conforma
por una serie de ensayos independientes, en el cual, cada uno de ellos da resultados de una
observación aleatoria en particular, representando estas, como un promedio total de los n
ensayos, los cuales tienden hacia una distribución con una función de densidad de probabilidad
similar a la ecuación de función de densidad de probabilidad normal, representada como:
−𝒛𝟐
𝟏
𝐥𝐢𝐦 𝑷(𝒛 < 𝒁 < 𝒛 + ∆𝒛) = 𝒆 𝟐 )
𝒏→∞ √𝟐𝝅
Por ejemplo, cuando hablamos del error laboral de una persona, podemos considerar diferentes
observaciones, las cuales dependen de diferentes cambios como el clima, el estrés, el ambiente
laboral, problemas familiares o de salud y muchísimos otros más que pueden afectar en su
rendimiento laboral, los cuales podemos definir que sus errores son independientes a los factores
anteriormente mencionados, pero con la misma probabilidad de ser positivos o negativos,
entonces se puede demostrar que el error total tiene una distribución normal
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
La variable aleatoria X con función de densidad de probabilidad
−(𝒙−𝝁)𝟐
𝟏
𝒇𝒙 (𝒙; 𝝁, 𝝈) = 𝒆 𝟐𝝈𝟐 -<x<
√𝟐𝝅𝝈
La cual tiene una distribución normal con parámetros µ donde - < µ < y > 0.
Así mismo
E(X) = µ y v(x) = 2
La deducción de la media y la varianza son términos que se utilizarán para este subtema por ello
revisa el siguiente material.
Da clic en la siguiente imagen para profundizar en las medidas de tendencia central y la varianza
que estaremos utilizando.
* Media Aritmética
Media * Media Aritmética
Ponderada
Mediana
Varianza
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
Media Aritmética:
𝑿𝟏 + 𝑿𝟐 + 𝑿𝟑 + ⋯ + 𝑿𝑵 ∑𝑵
𝒋=𝟐 𝑿𝒋 ∑𝑿
̅=
𝑿 = =
𝑵 𝑩 𝑵
X= (9+3+11+15+10)/5= 9.6
Es muy similar a la media, sin embargo esta medida está relacionada con el peso, la cual se
representa como W, y para este caso se representa como:
𝒘𝟏 𝑿𝟏 + 𝒘𝟐 𝑿𝟐 + ⋯ + 𝒘𝒌 𝑿𝑵 ∑ 𝒘𝑿
̅=
𝑿 =
𝒘𝟏 + 𝒘𝟏 + ⋯ + 𝒘𝒌 ∑𝒘
Mediana:
Clasifiquemos en números impares y pares el grupo de datos representados, por lo que para los
impares, se toma la media como el valor que está al centro, por ejemplo:
Para el caso de un conjunto de números que en total sean pares, entonces se toman los dos
valores centrales y se obtiene el promedio de ellos para así hacer la representación de la media,
por ejemplo:
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
La varianza:
La raíz cuadrada de 2 que viene siendo , denota la desviación estándar poblacional. Cuando la
población es finita y está formada por N valores, la varianza poblacional puede entonces definirse
como:
𝒘𝟏 𝑿𝟏 + 𝒘𝟐 𝑿𝟐 + ⋯ + 𝒘𝒌 𝑿𝑵 ∑ 𝒘𝑿
̅=
𝑿 =
𝒘𝟏 + 𝒘𝟏 + ⋯ + 𝒘𝒌 ∑𝒘
-------------
una curva simétrica en forma de campana, donde el valor de µ determina el centro de la función
Si X es la variable aleatoria normal con E(X) = µ y V(X) = 2, entonces la variable aleatoria está
representada matemáticamente como:
Z=(X-µ)⁄
Es una variable aleatoria normal con E(Z)=0 y V(Z)=1. Esto es, Z es una variable aleatoria normal
estándar (Montgomery & Runger, 1996).
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
El resultado para la media y la varianza de Z, puede obtenerse de manera directa con la teoría
mostrada anteriormente. La creación de una variable aleatoria nueva con esta transformación se
le conoce como estandarización. La variable Z entonces representa la distancia de X a partir de su
media en términos de desviaciones estándar.
Φ( k ) = P ( z ≤ k )
Para ello es necesario hacer uso de la tabla de valor de K, donde las unidades y décimas se buscan
en la columna izquierda y las centésimas en la fila superior.
Se dice con los test de Inteligencia IQ se han diseñado para analizar el comportamiento humano
y también se sabe que los resultados obtenidos, pueden mostrar una distribución arbitraria, por
lo que cualquier prueba con la suficiente cantidad de preguntas permitirá un buen resultado de la
investigación, la cual permitirá mostrar una distribución normal.
Supongamos que el IQ de los Mexicanos está normalmente distribuida, con un promedio µ= 100
Como X1 = 93 y X2 = 108
De aquí que:
P(z≤.5)-[1-p(z≤.4)] =
Por lo que el valor de P se multiplica por la población estudiada, para obtener el resultado.
Es decir que de las mil personas, solo 347 de ellas tienen un coeficiente IQ de 100.
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
Distribución F.
̅̅̅2 - ̅̅̅
2
forma similar la distribución muestral de la diferencia de varianzas (𝑆 1 𝑆2 − ). Cabe mencionar
2
𝑆
que la distribución es bastante complicada, por lo que se utiliza el estadístico 1⁄ 2 , , ya que un
𝑆 2
cociente grande o pequeño indicaría una fuerza grande, mientras que un cociente casi igual a 1
correspondería a una diferencia pequeña. La distribución muestral en dicho caso se puede calcular
y se le conoce como distribución de F, llamada así en honor de R. A. Fisher. (Spiegel & Stephens,
2002)
respectivamente y sus varianzas son 12 y 22 , por lo que su representación matemática quedaría
como:
𝑺̂𝟐𝟏 𝑵𝟏 𝑺𝟐𝟏
⁄ 𝟐 ⁄
(𝑵𝟏 −𝟏)𝟐𝟏 ̂𝟐 = 𝑵𝟏 𝑺𝟐𝟏 𝑵𝟐 𝑺𝟐𝟐
𝑭= 𝟏
= 𝑵 𝑺𝟐 donde 𝑺𝟏 y 𝑺̂
𝟐
𝟐𝟏 =
𝑺̂𝟐𝟐 𝟐 𝟐
⁄
𝑵𝟏 −𝟏 𝑵𝟐 −𝟏
⁄ 𝟐
𝟐
(𝑵𝟐 −𝟏)𝟐𝟐
𝑪𝑭(𝟏⁄𝟐)−𝟏
𝒀=
(𝟏 𝑭 + 𝟐 )(𝟏+𝟐)⁄𝟐
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
Donde C es una constante dependiente de 1 y 2 tal que el área total bajo la curva es 1. La
curva, suele variar considerablemente para distintos valores de 1 y 2, y se muestra gráficamente
a continuación:
Recuerda que para la resolución de problemas, en los que se desarrollará la investigación, basada
en la distribución F de Ficher, será necesario, como anteriormente lo manejamos, hacer uso de
las tablas de distribución, la cual, para este tema, las encontrarán dentro de las lecturas base de
este bloque.
https://www.youtube.com/watch?v=4uzowtesHds
Existen diferentes tipos de estudio en el análisis de varianza, como lo son: La clasificación simple
o de un solo factor y para dos factores, dos factores con réplica, sin embargo, cuando se utiliza la
técnica anova se deben cumplir los siguientes supuestos:
Los elementos de los diversos subgrupos deben seleccionarse mediante el muestreo aleatorio, a
partir de poblaciones normalmente distribuidas.
Los resultados de un experimento de un factor suelen presentarse en una tabla con a renglones y
b columnas, como se indica en la siguiente tabla:
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
Donde Xjk denota el j-ésimo renglón y en la k-ésima columna, donde j = 1, 2, …, a y K = 1, 2, …,
b. Por ejemplo si tenemos a X34 se refiere a la cuarta medición del tercer tratamiento.
𝟏
̅̅̅
𝑿𝒋 = ∑𝒃𝒌=𝟏 𝑿𝒋𝒌 siendo j = 1, 2, …, a
𝒃
El punto en 𝑋̅𝑗 se utiliza para señalar que el índice k ha sido sumado. Los valores 𝑋̅𝑗 se denominan
medias grupales, por algunos autores lo podemos encontrar como medias de tratamiento o medias
de fila. La gran media o media total es la media de todas las mediciones en todos los grupos y se
denota por 𝑋̅ :
𝟏
̅=
𝑿 ∑𝒂𝒋=𝟏 ∑𝒃𝒌=𝟏. 𝑿𝒋𝒌
𝒂𝒃
Para profundizar en el tema revisemos el siguiente video:
https://www.youtube.com/watch?v=WVM_jZSCSzE
3.4 Distribución T.
Para poder obtener un buen resultado en cuanto a las investigaciones, siempre es aconsejable
trabajar con muestras de un tamaño grande, por grande debemos entender a mayores de 30
observaciones, y una desviación estándar conocida regularmente. Es bien sabido por todos los
investigadores que en la realidad existen problemas en donde ni el tamaño de la muestra es tan
grande, ni tampoco es posible conocer el valor de la desviación estándar poblacional.
Favorablemente, existe una distribución que se utiliza en estos casos, es decir, para muestras
pequeñas y se le conoce en estadística como "distribución t de Student". A este tipo de teorías en
las que se adecuan tamaños de muestras pequeñas, algunos autores las llaman Teoría de muestras
pequeñas o teoría exacta del muestreo.
Los principios de la distribución t se localizan con labores realizadas por W.S. Gossett (1876-
1937), quien era empleado de la cervecería Guinness Brewery en Dublín, Irlanda, y necesitaba
una distribución que pudiera ser utilizada con muestras pequeñas, en la cual, esta empresa no
consentía que los empleados publicaran resultados de investigaciones con su propio nombre. De
modo que Gossett adoptó el seudónimo de Student para publicar los resultados de sus
descubrimientos de investigación (1908).
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
A Gossett le interesaba el comportamiento exacto de la expresión, donde se define el estadístico
como:
Para este caso en especial es de suma importancia, en particular, la distribución que es menos
alta y más extendida que la distribución normal.
https://www.youtube.com/watch?v=cnrpYAsM9kI
La prueba R de Pearson está dedicada al estudio entre dos variables medidas en un nivel por
intervalos o de razón y está representada con el símbolo r.
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
Para este tipo de pruebas, el estudio no considera a las variables como independiente y la otra
como dependiente entre ambas, porque no evalúa la causa, sino la relación mutua, a la que llama
correlación.
+1.00 a -1.00
Es importante hacer notar que cuando estas cantidades, pasan por el cero, corresponde a ausencia
de correlación. En el caso de los primeros dan a entender que existe una correlación directamente
proporcional e inversamente proporcional, respectivamente.
• +1 ó -1 = Correlación perfecta.
Donde:
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
Cuando tenemos un fenómeno en el que las observaciones se miden según una escala de intervalo,
se puede realizar este procedimiento estadístico, teniendo en cuenta que el fenómeno debe ser
lineal.
Al igual que las otras pruebas paramétricas, la varianza de las variables X y Y deben guardar
homogeneidad.
1. Ordenar los valores de la variable dependiente (Y) con respecto a los valores de la
variable independiente (X).
6. Aplicar la ecuación.
Revisa el siguiente video, para poder analizar un ejemplo que nos ayude a comprender a detalle
el tema:
https://www.youtube.com/watch?v=JtXeZE7p_LU
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.
Referencias Bibliográficas.
Douglas C., y George C., (1996), Probabilidad y estadística aplicadas a la ingeniería. México:
McGraw-Hill, Primera edición.
Gossett, W., (2003), Biografía de William Sealy Gosset, Consultado el 25 de enero de 2016.
Disponible en: http://www-history.mcs.st-andrews.ac.uk/Biographies/Gosset.html
Luceño, A., & González, F., (2004), Métodos Estadísticos para medir, describir y controlar la
variabilidad. España: Universidad de Cantabria, ISBN 84-8102-375-2
Ronald E., Raymond H. y Sharon L., (1998), Probabilidad y estadística aplicadas para ingeniería.
México: Prentice Hall.
Mendenhall, W., (1997), Probabilidad y estadística para ingeniería y ciencia. México: Prentice
Hall,
Material compilado con fines académicos, se prohíbe su reproducción total o parcial sin la autorización de cada autor.