Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2009
Estadstica General
Doc. Ing. Hernn Vega Meja
INTRODUCCIN
La estadstica, ciencia que da soporte a la investigacin cientfica desde el ordenamiento
de datos hasta el desarrollo de las diferentes tcnicas como los diseos experimentales que el
estudiante como el profesional de Ciencias Agrarias requiere para su desarrollo acadmico como
para la investigacin, se hace necesario el conocimiento de software que hagan censillo el
desarrollo y su aplicabilidad para el desarrollo de la investigacin, necesaria para encontrar
alternativas para el incremento de la produccin y la productividad agropecuaria de nuestra
Regin.
Actualmente el hombre en todas las actividades humanas se esta valiendo de la
investigacin cientfica para arrancar los secretos a la naturaleza, a fin de ponerlos al servicio del
bienestar humano. Los pases que estn actualmente a la cabeza del mundo dedican mucha
atencin e invierten cada ao mayores sumas de dinero para estos trabajos, porque reconocen que
es la punta de lanza en el avance tcnico y econmico, y a ello se deben los gigantescos progresos
alcanzados en los ltimos tiempos.
El Ing. Jos Calzada, en su Libro Mtodos estadsticos para la investigacin manifiesta
que el personal que se dedica a experimentacin debe reunir condiciones especiales que no son
requeridas en otras actividades; siendo las bsicas e indispensables vocacin e inquietud por el
estudio.
En el presente ciclo acadmico 2009-I, presentamos a los alumnos del curso de
Experimentacin Agrcola I y a toda la comunidad Santiaguina el presente Manual de
Estadstica General con aplicacin del Software estadstico MINITAB (validas en sus
versiones 13.0 y 14.0) dando nfasis a la estadstica descriptiva y a los diseos experimentales;
Software estadstico ampliamente utilizado para la enseanza de la estadstica aplicada e
investigaciones por la UNA La Molina. La primera parte del documento nos muestra el entorno
del MINITAB para su fcil aplicacin.
El Profesor
Estadstica General
Doc. Ing. Hernn Vega Meja
Barra de Mens
Barra de
Herramientas
VENTANA
SESSION
VENTANA
WORKSHEET
Barra de
Estado
Ventana Sesin
En esta ventana aparecern todos los resultados a los procedimientos efectuados con
excepcin de los grficos.
Ventana Worksheet
En est ventana se ingresarn los datos que se quieran procesar. Es similar a una hoja de
clculo organizada en columnas (C1, C2,) y filas numeradas.
LA BARRA DE MENS
La Barra de Mens de MINITAB contiene 9 entradas: File, Edit, Manip, Calc, Stat,
Graph, Editor, Window y Help, cada una de las cuales tienen varias opciones. Si al lado de la
opcin aparece el smbolo entonces ( ), al elegir esta opcin aparecer un sub men de
alternativas. Si la opcin termina en tres puntos ( ) entonces aparece una Ventana de Dilogo.
3
Estadstica General
Doc. Ing. Hernn Vega Meja
El Men File
ste men contiene mayormente opciones que sirven para manipular las hojas de trabajo
y para guardar e imprimir el contenido de las ventanas de MINITAB. A continuacin se muestra
las opciones de ste men
Las ltimas hojas de trabajo o proyectos que se han usado aparecen al final del men File y
pueden ser activados si se selecciona con el Mouse.
El Men File Contiene las Siguientes Opciones
Accin
New
Abre un nuevo proyecto o nueva hoja de trabajo
Open Project
Abre un nuevo proyecto que ya fue guardado
Save Project
Guarda un Proyecto
Save Project As
Guarda un proyecto con otro nombre
Project Description
Edita una descripcin del proyecto
Open Worksheet
Abre una hoja de trabajo que ya fue guardada
Query Database(ODBC)
Llama a los datos guardados en una Base de Datos
Save Current Worksheet
Guarda una hoja de trabajo
Save Current Worksheet As Guarda una hoja de trabajo con otro nombre
Close Worksheet
Cierra una hoja de trabajo
Open Graph
Abre una grfica de MINITAB
Save Worksheet As (*)
Guarda el contenido de una hoja de trabajo
Other Files
Llama datos en otro tipo de archivos
Print Worksheet (*)
Imprime el contenido de una hoja de trabajo
Print Setup
Cambia la configuracin de la impresora
Exit
Sale de MINITAB
(*) estas dos opciones cambian cuando la ventana session o una ventana de grfica est activa
Opcin
Estadstica General
Doc. Ing. Hernn Vega Meja
El Men Edit
ste men contiene opciones que permiten editar el contenido de las celdas de las columnas del
Worksheet o el contenido de la ventana Session. Cuando se hacen grficas, en el Men Edit
aparece la opcin Copy Graph que permite enviar la grfica al Clipboard para luego ser
exportada a un procesador de palabras, tal como Word o WordPerfect. La figura nos muestra las
opciones de ste men cuando la ventana Worksheet est activa.
Opcin
Clear Cells
Delete Cells
Copy Cells
Cut Cells
Paste Cells
Paste Link
Links
Select all Cells
Edit Last Dialog
Command Line Editor
Preferences
Estadstica General
Doc. Ing. Hernn Vega Meja
Men Manip
ste men contiene opciones para manipular todo el contenido de las columnas de una hoja de
trabajo. En la siguiente figura se muestran las opciones del men Manip y las alternativas que
hay para la opcin Change Data Type.
Opcin
Subset Worksheet
Split Worksheet
Merge Worksheets
Copy Columns
Unstack Columns
Snack
Transpose Columns
Sort
Rank
Delete Rows
Erase Variables
Concatenate
Code
Change Data Type
Display Data
Estadstica General
Doc. Ing. Hernn Vega Meja
Men Calc
Contiene opciones para hacer operaciones aritmticas con las columnas de la hoja de trabajo,
tambin es posible obtener al azar un conjunto de datos con una distribucin predeterminada y
calcular probabilidades y percentiles de las distribuciones ms conocidas. La ltima entrada del
men Calc es Matrices, la cual permite hacer operaciones con matrices. A continuacin se
muestran las opciones de ste men y las alternativas de la opcin Probability Distributions.
Estadstica General
Doc. Ing. Hernn Vega Meja
Men Stat
ste men contiene opciones que permite llevar a cabo la mayora de los procedimientos
estadsticos. La siguiente figura nos muestra las opciones de ste men y el sub men de la
Opcin Tables.
Opciones de Stat
Opcin
Accin
Incluye clculo de medias estadsticas, pruebas de hiptesis acerca de
la media poblacional, de proporciones, de diferencia de medias y de
Basic Statistics
proporciones, clculo de la correlacin, as como pruebas de
Normalidad para un conjunto de datos.
Incluye anlisis de regresin simple y mltiple, los mtodos para elegir
Regresin
el mejor modelo de regresin. Tambin el plot de los puntos observados
y la lnea de regresin que se ajusta a ellos
Anova
Hace el anlisis de varianza de diseos experimentales bsicos
DOE
Analiza diseos experimentales avanzados
Control Charts
Grficas de control de calidad
Quality Tools
Ms grficas de control de calidad
Reability/Survival
Incluye los mtodos de anlisis de supervivencia y de confiabilidad
Incluye los mtodos estadsticos multivariados: Componentes Principales,
Multivariate
Anlisis Factorial, Anlisis Discriminante
Times Series
Analiza datos en series de tiempo
Tables
Ordena datos en forma tabular y analiza tablas de contingencia
Incluye los mtodos estadsticos no paramtricos, los que no requieren
Noparametrics
la suposicin de Normalidad
Incluye los mtodos del Anlisis Exploratorio de datos:"stem-and-leaf"
EDA
"boxplots", etc
Power and Sample Size Calcula la potencia y el tamao de muestra para varias pruebas estadsticas
Estadstica General
Doc. Ing. Hernn Vega Meja
Men Graph
ste men contiene opciones que permiten hacer una gran variedad de grficas estadsticas desde
histogramas hasta grficas tridimensionales. A continuacin se muestran las opciones de ste
men y las opciones de la opcin Character Graphs.
Opcin
Layout
Plot
Times Series Plot
Chart
Histogram
Boxplot
Matriz Plot
Draftsman Plot
Contour Plot
3D Plot
3D Wireflame Plot
3D Surface Plot
Dotplot
Pie Chart
Marginal Plot
Probability Plot
Stem-and-Leaf
Character Graphs
Opciones de Graph
Accin
Empieza y termina el arreglo de grficas mltiples en una misma pgina
Hace diagrama de puntos y grficas lineales
Hace grficas para datos en series de tiempo
Hace grficas de barras para datos cualitativos
Hace un histograma
Hace un "Boxplot"
Hace un plot en forma matricial para mostrar la relacin entre varias variables
Hace un plot matricial 2 por 2
Hace un plot de contorno
Hace plot en 3 dimensiones
Grafica una superficie en 3 dimensiones usando grids
Grafica una superficie en 3 dimensiones
Hace un grfico de puntos de alta resolucin
Hace grficas circulares
Hace un diagrama de puntos acompaado de histogramas, boxplots o dotplots
de las variables X y Y
Hace plots de probabilidad
Hace un "Stem-and-Leaf" de un conjunto de datos
Hace varios tipos de grficas en modo texto
Estadstica General
Doc. Ing. Hernn Vega Meja
Men Editor
ste men contiene opciones que permiten editar el contenido de las ventanas de session y
worksheet. En particular se puede insertar comentarios en los resultados que aparecen en
session. Tambin se puede elegir el tipo de letra en que ellos aparecern. Las opciones del men
dependen de la ventana que est activa.
Cuando la ventana worksheet est activada entonces hay opciones que permiten editar el
contenido de las celdas de la hoja de trabajo. A continuacin se muestran las opciones de ste
men.
Opcin
Next Command
Previous Command
Enable Command Language
Make Output Editable
Find
Replace
Select Fonts
Apply I/O Fonts
Apply Title Fonts
Apply Comment Fonts
Men Window
El men Window contiene opciones que permiten organizar las ventanas de MINITAB,
ste men aparece en todo programa hecho para windows. A continuacin se muestran las
opciones de ste men.
10
Opcin
Cascade
Tile
Minimize All
Restore Icons
Arrange Icons
Refresh
Hide Toolbar
Hide Status Bar
Manage Graphs
Close All Graphs
Set Graphs Zize/Location
Manage Worksheets
Estadstica General
Doc. Ing. Hernn Vega Meja
Men Help
ste men contiene opciones que dan ayuda acerca del uso de los comandos de
MINITAB. A continuacin se muestran las opciones de ste men.
11
Opcin
Help
Search Help
How to use Help
StatGuide
Search the StatGuide
How to use the StatGuide
Tutorials
Search Tutorials
Session Command Help
Search Session Command
Help
Minitab on the Web
About Minitab
Estadstica General
Doc. Ing. Hernn Vega Meja
INGRESO DE DATOS
Para ingresar un conjunto de datos correctamente, se deber hacer corresponder a cada
columna con una variable y a cada fila con una observacin o unidad elemental.
Ntese que entre los encabezados de columnas y la primera fila existe una fila libre. En esta fila
se podrn colocar nombres a las variables con las que trabajando. De no colocar un nombre, el
software asignar por defecto los nombres C1, C2,consecutivamente.
Los datos que se presentan a continuacin corresponden a un estudio de cuarenta muestras de
suelos, realizado en el valle de Casma.
12
Estadstica General
Doc. Ing. Hernn Vega Meja
Muestra
PH
Humedad
% de Arcilla
Clase Contextual
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
7.85
7.65
7.60
8.00
8.20
7.80
7.70
7.25
8.40
8.20
7.50
7.70
8.00
8.40
8.10
7.95
7.75
8.00
7.50
7.20
8.00
7.80
8.10
8.00
8.20
8.30
8.30
9.25
9.15
8.10
8.30
8.20
8.35
8.75
8.80
8.85
7.85
8.05
8.20
8.40
2.10
3.30
4.80
3.00
1.80
16.90
2.40
2.90
2.20
3.00
2.96
4.60
4.00
3.90
5.50
5.90
15.60
2.90
3.10
19.60
18.50
16.80
12.60
10.10
10.50
12.10
9.10
12.90
13.60
16.50
5.50
15.50
12.90
5.90
3.40
2.70
12.90
10.20
4.30
3.60
1
2
4
2
1
14
1
1
1
1
1
2
2
1
4
4
4
1
1
12
16
26
12
8
11
8
6
14
8
8
4
12
12
5
2
2
8
8
4
2
arena
arena
arena franca
arena
arena
franco limoso
arena
arena
arena
arena
arena
arena
arena
arena
arena
arena
franco arenoso
arena
arena
franco arenoso
franco
franco
franco arenoso
franco arenoso
franco arenoso
franco arenoso
franco arenoso
franco arenoso
franco arenoso
franco arenoso
franco arenoso
franco arenoso
franco arenoso
franco arenoso
arena
arena
franco arenoso
franco arenoso
arena
arena
13
Estadstica General
Doc. Ing. Hernn Vega Meja
14
Estadstica General
Doc. Ing. Hernn Vega Meja
Count CumCnt
10
10
7
17
6
23
1
24
1
25
6
31
1
32
4
36
2
38
1
39
1
40
40
Percent CumPct
25.00 25.00
17.50 42.50
15.00 57.50
2.50 60.00
2.50 62.50
15.00 77.50
2.50 80.00
10.00 90.00
5.00 95.00
2.50 97.50
2.50 100.00
15
Estadstica General
Doc. Ing. Hernn Vega Meja
Interpretacin:
Count, representa la frecuencia absoluta. Por ejemplo el porcentaje de arcilla que ms predomina
es el 1.
CumCnt, representa la frecuencia absoluta acumulada. Por ejemplo 39 de las 40 muestras tienen
un porcentaje de arcilla menor o igual que 16.
Percent, representa la frecuencia relativa porcentual. Por ejemplo, slo 2.50 % de los porcentajes
de arcillas de las muestras es de 26.
CumPct, representa la frecuencia relativa porcentual acumulada. Por ejemplo, el 97.50 % de
porcentaje de arcilla son menor o igual a 16.
Histograma
Un histograma es una representacin grfica que separa los datos en un nmero de
intervalos (llamados bins) en el eje X y para cada intervalo dibuja una barra cuya altura
corresponde por default al nmero de observaciones (o frecuencia) en el intervalo. Las
observaciones que se encuentran en los lmites del intervalo son asignados en el intervalo a la
derecha.
Para el ejemplo utilizaremos la variable PH. Para construir un histograma elegimos la opcin
Histograma... del men Graph... donde debemos elegir la variable o variables de las cuales se
generar el histograma (se genera una grfica por variable), para lo cual la seleccionamos del
lado izquierdo y damos clic sobre el botn de Select; en ese momento aparecer en el rea de
Graph variable.
16
Estadstica General
Doc. Ing. Hernn Vega Meja
Si se quieres poner ttulos se elige Title, o para notas al pie Footnote, para poner los
valores de la frecuencia absoluta encima de cada barra se elige Data Labels.
Oprimiendo OK se obtiene el histograma deseado. Minitab elige automticamente el
nmero de intervalos de clase, si se desea cambiar el nmero de intervalos de clase, se debe
oprimir el botn Options y entrar el nmero de intervalos. Adems se puede ingresar los puntos
medios de los intervalos de clase que se desean, al igual que el tipo de frecuencia para la altura de
las barras. Por otro lado se puede obtener un Histograma horizontal, eligiendo Transpose X and
Y en Options.
Una vez seleccionadas todas las opciones para histograma se da clic en OK y aparecer la
ventana Histogram:
17
Estadstica General
Doc. Ing. Hernn Vega Meja
18
Estadstica General
Doc. Ing. Hernn Vega Meja
Grficas Circulares
Este tipo de grfica se usa cuando se requiere tener una idea de la contribucin de cada valor de
la variable al total. Para obtener grficas circulares se usa la opcin Pie Chart del Men Graph.
La ventana de dilogo de Pie Chart que se muestra a continuacin. La grfica nos permitir ver
como se distribuyen las clases contextuales.
En sta ventana pasamos la variable que queremos que nos salga la grfica como se indica en la
figura. Luego pulsamos la opcin
19
Estadstica General
Doc. Ing. Hernn Vega Meja
20
Estadstica General
Doc. Ing. Hernn Vega Meja
Se trata de la combinacin de dos tcnicas, una para graficar y otra para clasificar.
Representa los datos de una muestra mediante el empleo de los dgitos que
constituyen los valores de los datos. Cada dato numrico se divide en dos partes:
el (los) dgito (s) principal (es) se convierte (n) en el TALLO. Y el (los) dgito(s)
posterior(es) se convierten en la HOJA.
Los Tallos se escriben a lo largo del eje principal, y por cada porcin de datos se
escribe una hoja para demostrar la distribucin de los datos.
Una ventaja de los diagramas de tallos y hojas es que presentan ms informacin que los
histogramas, ya que se conservan los valores iniciales de los datos.
Para elaborarla se debe:
Estadstica General
Doc. Ing. Hernn Vega Meja
7
7
7
7
8
8
8
8
8
9
9
N = 40
22
55
66777
88889
000000111
222223333
444
7
88
1
2
Diagrama de Cajas
Es un grfico que, al igual que el histograma y el diagrama de tallos y hojas da
informacin sobre la tendencia central, variabilidad, simetra y valores discordantes u outliers de
una distribucin. Los lmites de la caja estn dados por el primer y tercer cuartil de los datos. La
lnea que divide la caja en dos, corresponde a la mediana.
El diagrama de cajas no aporta afirmacin sobre las frecuencias, como s lo hacen el
histograma y el diagrama de tallos y hojas, pero es muy til para comparar las distribuciones de
dos o ms conjunto de datos.
Ahora se realizar un diagrama de cajas para las variables Humedad. Siga los siguientes pasos:
Haga clic en el men Stat, coloque el cursor sobre la opcin EDA y luego haga clic en la
opcin Boxplot
Seleccione las variables Humedad en el cuadro correspondiente a Y (measurement).
Estadstica General
Doc. Ing. Hernn Vega Meja
Estadstica General
Doc. Ing. Hernn Vega Meja
MODA
Es el valor que se repite con mayor frecuencia en la muestra. La moda puede aplicarse tanto a
datos cuantitativos como cualitativos.
MEDIDAS DE VARIABILIDAD
Las medidas de variabilidad o de dispersin, permiten conocer el grado de homogeneidad o
heterogeneidad de un conjunto de datos.
EL RANGO
Es la diferencia entre el mayor y el menor valor de la muestra. Mientras mayor sea el rango existe
mayor variabilidad. Es una medida inestable pues cambia de valor rpidamente al pasar de una
muestra a otra, se ve afectada por valores extremos y no mide la variacin de los datos
intermedios.
LA VARIANZA
Es una medida que da una idea del grado de concentracin de los datos con respecto a la media.
Es el promedio de las desviaciones al cuadrado de los datos con respecto a la media.
DESVIACIN ESTNDAR
Es la raz cuadrada positiva de la varianza y tiene la ventaja que est en las mismas unidades de
medida que los datos. Se usa para comparar la variabilidad de dos grupos.
COEFICIENTE DE VARIACIN
Es una medida de variacin relativa pues no tiene unidades. Se calcula dividiendo la desviacin
estndar entre la media. Se usa para comparar 2 o ms conjuntos de datos, con diferentes
unidades de medida o con valores muy diferentes para sus medias.
EJEMPLO: Para calcular medidas estadsticas de tendencia central y de variabilidad para un
conjunto de datos realizamos lo siguiente.
Escoger el men Stat, luego ir a Basic Statistics y a la opcin Display Descriptive Statistics para
calcular las medias estadsticas de la variable PH del ejemplo anterior.
Luego nos aparece lo siguiente:
En el que pasamos la variable que deseamos analizar, en este caso la variable PH, y luego
pulsamos la opcin
y nos muestra la siguiente ventana
24
Estadstica General
Doc. Ing. Hernn Vega Meja
25
Estadstica General
Doc. Ing. Hernn Vega Meja
Donde:
N: Representa el nmero de datos.
Mean: Es la media muestral, y en nuestro ejemplo nos da una media del 8.0925 de PH
Median: Es la mediana, en nuestro ejemplo nos da 8.0750 de PH
TrMean: Es la media ponderada del 5%, en nuestro ejemplo nos da 8.0792 de PH
StDev: Es la desviacin estndar, en nuestro ejemplo nos da 0.4509
SE Mean: Es el error estndar de la media muestral, o sea S n
Y los valores restantes representan el Mnimo, el Mximo y los Cuartiles superior (Q3) e
inferior (Q1) de cada variable.
26
Estadstica General
Doc. Ing. Hernn Vega Meja
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIN BINOMIAL: Un experimento es llamado de Bernoulli si satisface las
siguientes caractersticas:
a. En cada repeticin puede ocurrir slo de dos maneras, una de ellas es llamada xito y la
otra Fracaso.
b. La probabilidad de xito, representada por p debe permanecer constante cuando el
experimento es repetido muchas veces.
c. Las repeticiones de los experimentos deben ser independientes entre s.
En MINITAB se pueden calcular la funcin de probabilidad (Probability), la funcin de
distribucin acumulada (Cumulative Probability) y los percentiles (Inverse Cumulative
Probability) de la Distribucin Binomial para cualquier valor de n y p. Para esto hay que seguir
la secuencia Calc, Probability y Distributions, Binomial.
Ejemplo:
a) Expresar en una tabla de valores la funcin de probabilidad y la funcin de distribucin
acumulada de la variable aleatoria X: Nmero de preguntas bien contestadas por un
estudiante que responde al azar un examen tipo seleccin mltiple que consiste de 10
preguntas, cada una con 4 alternativas de las cuales slo una es correcta.
b) Usar la tabla anterior para calcular la probabilidad de que el estudiante:
-
Solucin:
a) Primero hay que poner en una columna que podemos llamarla X, todos los valores
posibles de la variable. La ventana de dilogo para el clculo de probabilidad acumulada
(similar es para calcular la probabilidad) y los resultados son como siguen:
27
Estadstica General
Doc. Ing. Hernn Vega Meja
28
Estadstica General
Doc. Ing. Hernn Vega Meja
29
Estadstica General
Doc. Ing. Hernn Vega Meja
( x )2
2
Donde:
La media y la desviacin estndar
30
Estadstica General
Doc. Ing. Hernn Vega Meja
Para hallar los percentiles se elige Inverse Cumulative Probability y se selecciona Alpha en
Input Column y z(alpha) en Optional Storage.
31
Estadstica General
Doc. Ing. Hernn Vega Meja
32
Estadstica General
Doc. Ing. Hernn Vega Meja
En este caso vamos a ver la forma bsica de detectar normalidad, la cual es a travs de Plot de
Normalidad. El Plot de Normalidad consiste de un diagrama de puntos donde en el eje vertical
se considera los escores normales y en el eje horizontal los valores de la variable. Si los puntos
caen cerca de una lnea, entonces se dice que hay Normalidad. En MINITAB ste plot es
obtenido siguiendo la secuencia Graph, Probability Plot.
Ejemplo: Usar un plot de Normalidad para verificar si la siguiente muestra proviene de una
poblacin Normal.
3.1 0.9 2.8 4.3 0.6 1.4 5.8 9.9 6.3 10.4 0 11.5
33
Estadstica General
Doc. Ing. Hernn Vega Meja
Interpretacin: En el eje horizontal aparecen los escores normales y en el eje vertical las
probabilidades acumuladas de dichos escores. Los puntos caen cerca de la lnea y todos caen
dentro de las bandas de confianza, luego se puede concluir que la poblacin de donde proviene la
muestra es Normal.
34
Estadstica General
Doc. Ing. Hernn Vega Meja
REGRESIN LINEAL
1. Regresin Lineal Simple: Supongamos que tenemos datos de dos variables cuantitativas
continuas X e Y, las cuales se relacionan siguiendo una tendencia lineal significa que los
puntos estn dispuestos alrededor de una lnea recta, desvindose por una cantidad aleatoria e
de la misma. Si adems asumimos que se trata de predecir el comportamiento de Y usando X,
entonces el modelo de regresin lineal simple es de la forma.
Y = + X +
Donde:
Y es la llamada la variable de respuesta o dependiente
X es la llamada la variable previctoria o independiente
i= 1
ei2 =
i= 1
( yi xi ) 2
Usando tcnicas de clculo diferencial para minimizar una funcin de dos variables y
se obtienen
S xy
y = y x
S xx
S xx =
i= 1
xi2
( x i ) 2
i= 1
S yy =
i= 1
yi2
( y i ) 2
i= 1
S xy =
i= 1
xi y i
i= 1
i= 1
( xi )( yi )
n
Estadstica General
Doc. Ing. Hernn Vega Meja
Ejemplo: Se desea hallar una lnea de Regresin que permita predecir el precio de una chacra
(Y) basndose en el rea de la misma (X). Se recolectaron 15 datos:
36
Estadstica General
Doc. Ing. Hernn Vega Meja
que aparecen en el anlisis de regresin y que posteriormente se pueden usar, por ejemplo en
el anlisis de residuales.
37
Estadstica General
Doc. Ing. Hernn Vega Meja
/ 2, n 2 ) s
1 ( x 0 x) 2
+
n
S xx
Por otro lado muchas veces estamos interesados en estimar solamente un valor de Y
correspondiente a un valor dado X0. El estimado puntual ser el mismo Y, y usando
propiedades de Y0-Y0 se obtiene que un intervalo de confianza de (1- )% para el valor
predicho de Y dado que X=X0 es de la forma:
Y0 t (1
/ 2, n 2 ) s 1 +
1 ( x 0 x) 2
+
n
S xx
Es mas riesgoso hacer predicciones para un solo valor que para un valor medio, por esta razn
el intervalo de prediccin de Y es mas ancho que el intervalo de confianza para el valor
medio.
El botn
confianza, la siguiente ventana trata de hacer estas predicciones para el ejemplo anterior
cuando la chacra tiene un rea de 3500 pies cuadrados.
38
Estadstica General
Doc. Ing. Hernn Vega Meja
Interpretacin: Hay un 95% de confianza de que el valor medio de todas las chacras de 3500
pies cuadrado de rea caiga entre 184,536 y 231,461.
Hay un 95% de confianza de que el valor de una chacra de 3500 pies cuadrados caiga entre
169,518 y 246,479.
As mismo, la opcin Fitted Line Plot del men de Regression permite hallar bandas de
confianza tanto para el valor predicho como para el valor medio de las Y. Con las bandas de
confianza se pueden tener intervalos de confianzas para cualquier valor dado de X. Para el
presente ejemplo se obtiene:
39
Estadstica General
Doc. Ing. Hernn Vega Meja
40
Estadstica General
Doc. Ing. Hernn Vega Meja
Notar que las bandas de confianza son anchas en los extremos y angostas en el centro. En
realidad las bandas se angostan cuando los valores de X que se toman estn cerca del
promedio x .
41
Estadstica General
Doc. Ing. Hernn Vega Meja
DISTRIBUCIONES MUESTRALES
Uno de los objetivos de la estadstica es saber a cerca del comportamiento de parmetros
poblacionales tales como: la media ( ), la varianza ( 2 ) o la proporcin ( ). Para ello se extrae
una muestra aleatoria de la poblacin y se calcula el valor de un estadstico correspondiente, por
ejemplo la media muestral ( x ), la varianza muestral ( s 2 ) o la proporcin muestral ( p ). El valor
del estadstico es aleatorio porque depende de los elementos elegidos en la muestra seleccionada
y por lo tanto el estadstico tiene una distribucin de probabilidad la cual es llamada la
Distribucin Muestral del Estadstico.
1. Distribucin de la Media Muestral cuando la Poblacin es Normal
Si se extraen muestras aleatorias de tamao n de una poblacin infinita que tiene media
poblacional y varianza 2 , entonces sea cual sea la distribucin de la poblacin se tiene que:
-
se extraen
muestras aleatorias de tamao n, entonces la media muestral se comporta como una variable
aleatoria normal con media igual a la media poblacional y con varianza igual a la varianza
poblacional dividida por el tamao de la muestra, siempre que n sea grande. Lo importante de
este resultado es que es independiente de la forma de la distribucin de la poblacin. Es decir,
x N ( ,
42
Estadstica General
Doc. Ing. Hernn Vega Meja
( N n)
al
( N 1)
error estndar de la media muestral. Pero en la prctica ste factor es omitido a menos que la
muestra sea lo suficientemente grande comparada con la poblacin, por lo menos un 5% de
ella.
En MINITAB se puede tratar de corroborar el Teorema del Lmite Central a travs de un
proceso de simulacin.
Ejemplo: Considerar una poblacin consistente de 3, 4, 6, 8, 10, 11, 12, 15, 20. Primero
calculamos la media y desviacin estndar de dicha poblacin.
43
Estadstica General
Doc. Ing. Hernn Vega Meja
44
Estadstica General
Doc. Ing. Hernn Vega Meja
Tercero, calculamos las medias de todas esas muestras usando la opcin Calc, Row
Statistics y tratamos de ver grficamente al menos si hay acercamiento a Normalidad. As
mismo se debe de observar que la media de todas stas medias debera de estar cerca de
y la varianza cerca de
45
Estadstica General
Doc. Ing. Hernn Vega Meja
Luego para hallar la media de todas las medias seguimos los siguientes pasos: Stat, Basic
Statistics, Display Descriptive Statistics, y nos da los siguientes resultados. Tambin
podemos graficar presionando la opcin
46
Estadstica General
Doc. Ing. Hernn Vega Meja
Luego nos aparecer la siguiente ventana en el que escogemos la opcin marcada con el
aspa.
47
Estadstica General
Doc. Ing. Hernn Vega Meja
5.42
=
= 2.71 .
n
2
Bibliografa:
48
Estadstica General
Doc. Ing. Hernn Vega Meja
INDICE
Introduccin ..... 1
Inicio de una Sesin en MINITAB ...... 2
La Barra de Mens ....... 2
Men File ... 3
El Men Edit . 4
El Men Manip .. 5
El Men Calc . 6
El Men Stat .. 7
El Men Graph .. 8
El Men Editor .. 9
El Men Window .. 9
El Men Help .. 10
Ingreso de Datos .... 11
Guardando los datos ....... 13
Abriendo un Archivo de Datos ........... 13
Estadstica Descriptiva ... 14
Organizacin de Datos Cuantitativos ... 14
Tabla de Frecuencias ...... 14
Histogramas .... 15
Presentacin de Datos Cualitativos ..... 17
Grficas de Barras... 17
Grficas Circulares ..... 18
Grfica de Stem-and-Leaf (tallos y hojas) ...... 20
Diagrama de Cajas ...... 21
Medidas de Tendencia Central ....... 22
Media Aritmtica ...... 22
Mediana ........ 23
Moda ..... 23
Medidas de Variabilidad ........... 23
El Rango ........ 23
La Varianza ....... 23
Desviacin Estndar ...... 23
Coeficiente de Variacin ........23
Distribuciones de Probabilidad ....26
Distribucin Binomial .......... 26
Distribucin Normal ......... 29
Cotejando si hay Normalidad ......... 31
Regresin Lineal ......... 33
Regresin Lineal Simple ....... 33
Interpretacin de los Coeficientes de Regresin ........... 37
Distribuciones Muestrales ....... 41
Distribucin de la Media Muestral cuando la Poblacin es Normal ......... 41
El Teorema de Lmite Central ........41
49