Está en la página 1de 131

Esta obra esta bajo una licencia reconocimiento-no comercial 2.

5 Colombia de
creativecommons. Para ver una copia de esta licencia, visite
http://creativecommons.org/licenses/by/2.5/co/ o envi una carta a
creative commons, 171second street, suite 30 San Francisco, California
94105, USA

ANALISIS ESTADISTICO EN
MATLAB

Autores:
CRISTIAN GERARDO GIL SANCHEZ
MILLER GIOVANNY FRANCO LEMUS
Director Unidad Informtica:
Tutor Investigacin:
Coordinadores:

Henry Martnez Sarmiento


lvaro Enrique Palacios
Mara Alejandra Enrquez
Leydi Diana Rincn

Coordinador Servicios Web:

Daniel Alejandro Ardila

Analista de Infraestructura
y Comunicaciones:

Adelaida Amaya

Analista de Sistemas de
Informacin:

lvaro Palacios Villamil

Lder de Gestin de
Recurso Humano:

Islena del Pilar Gonzlez

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
BOGOT D.C.
FEBRERO 2005

ANALISIS ESTADISTICO EN
MATLAB
Director Unidad Informtica:

Henry Martnez Sarmiento

Tutor Investigacin: Maria Alejandra Enrquez G.

Auxiliares de Investigacin:
Adriana Lucia Castelblanco
Alexis de Jess Moros
Andrs Ricardo Romero
Brayan Ricardo Rojas
Carlos Hernn Porras
Catherine Cruz Pinzn
Cristian Gerardo Gil
Daniel Alejandro Melo
Diana Patricia Garca
Diego Fernando Rubio
Edwin Montao
German David Riveros
Guillermo Alberto Ariza
Hctor Javier Corts
Leydy Johana Poveda

Liliana Paola Rincn


Luis Alfonso Nieto
Luz Karina Ramos
Maria Teresa Mayorga
Martha Rubiela Guevara
Miller Giovanny Franco
Nubia Yolima Cucarian
Rafael Leonardo Saavedra
Sandra Liliana Barrios
Sandra Milena Cardenas
Sandra Mnica Bautista
Sonia Janeth Ramrez
Yaneth Adriana Can
Juan Felipe Rincn
Leidy Viviana Avils

Este trabajo es resultado del esfuerzo de todo el equipo


perteneciente a la Unidad de Informtica.

Se prohbe la reproduccin parcial o total de este


documento, por cualquier tipo de mtodo fotomecnico y/o
electrnico, sin previa autorizacin de la Universidad
Nacional de Colombia.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
BOGOT D.C.
DICIEMBRE 2005

ANALISIS ESTADISTICO EN MATLAB

TABLA DE CONTENIDO
TABLA DE CONTENIDO ................................................................................................................ 3
1.

RESUMEN ................................................................................................................................ 5

2.

ABSTRACT .............................................................................................................................. 5

3.

INTRODUCCIN.................................................................................................................. 7

Objetivo ............................................................................................................................................... 7
Justificacin .......................................................................................................................................... 7
4.

STATISTICS TOOLBOX ................................................................................................... 8

Estructura de funciones .................................................................................................................... 9


5.

MANEJO DEL TOOLBOX ESTADISTICO ............................................................. 10

Estadstica Descriptiva ................................................................................................................... 11

6.

5.1.1.

Medidas de localizacin ............................................................................ 11

5.1.2.

Medidas de dispersin ............................................................................... 17

5.1.3.

Grupos de datos ............................................................................................ 29

GRFICAS EN TOOLBOX ESTADSTICO........................................................... 37

Introduccin ..................................................................................................................................... 38
Principales Funciones Utilizadas En Matlab Para Grficas ...................................................... 38
7.

PROBABILIDAD ................................................................................................................ 63

Distribuciones De Probabilidad Discretas................................................................................. 63


7.1.1.

Distribucin Binomial ................................................................................. 63

7.1.2.

Distribucin Poisson.................................................................................... 68

7.1.3.

Distribucin Hipergeometrica ............................................................... 74

Distribuciones De Probabilidad Continuas ............................................................................... 80


7.1.4.

Distribucin Normal .................................................................................... 80


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
3

ANALISIS ESTADISTICO EN MATLAB


7.1.5.

Distribucin Exponencial ......................................................................... 95

7.1.6.

Distribucin Gamma ................................................................................. 103

7.1.7.

Distribucin Chi-Cuadrado

7.1.8.

Distribucin Beta ........................................................................................ 117

...................................................... 111
2

ANEXO 1 .......................................................................................................................................... 120


INNOVACIONES DE MATLAB 7 ................................................................................................ 120
NUEVAS CARACTERISTICAS .................................................................................................. 120
EDITOR AND DEBUGGER ....................................................................................................... 124
GRFICAS ...................................................................................................................................... 126

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
4

ANALISIS ESTADISTICO EN MATLAB


1. RESUMEN

Matlab es un software aplicativo que permite su utilizacin en diferentes


reas del conocimiento, adems permite la posibilidad de utilizar
Toolbox

especializados

que

facilitan

el

trabajo

aumentan

la

funcionalidad del programa, tal como es el caso del Toolbox estadstico


en el cual enfocamos este trabajo de investigacin.

En el presente trabajo se pretenden dar a conocer algunas de las


funciones bsicas manejadas en el Toolbox estadstico, con el propsito
de utilizar en la mayor medida posible, las herramientas proporcionadas
por el software y adecuarlas a las necesidades presentes en el rea
estadstica, complementando de esta forma las caractersticas bsicas
del Software, con las presentadas en investigaciones anteriores, la
presente investigacin y las posibles investigaciones futuras en el
programa.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
5

ANALISIS ESTADISTICO EN MATLAB

2. ABSTRACT

Matlab is applicative software that allows using in different areas of the


knowledge, in addition allows the possibility of using specialized Toolbox
that they facilitate the work and they increase the functionality of the
program, it is the case of the statistical Toolbox in which we focused this
work of investigation.
This work tried to present some basic functions handled in the statistical
Toolbox, in order to use in the greater possible measurement, the tools
provided by software and to adapt them to the present necessities in
the statistical area, complementing the Softwares basic characteristics,
with the presented ones in previous investigations, the present
investigation and the future investigations possible in the program.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
6

ANALISIS ESTADISTICO EN MATLAB


3. INTRODUCCIN

Objetivo
Este trabajo se desarrolla con el objeto de continuar la investigacin que
se viene realizando en la UIFCE con miras a ampliar el campo de
aplicacin del programa MATLAB a las ciencias econmicas, en este caso
con un nfasis estadstico, disponible en un paquete especfico Statistics

Toolbox-

Teniendo

en

cuenta

lo

mencionado

con

anterioridad, se considera de gran importancia avanzar en este sentido


para llegar a consolidar un nivel adecuado en la aplicacin de este
software que garantice la ptima utilidad del mismo.
De esta forma se busca desarrollar con esta investigacin un manual
relacionado con el uso especfico del paquete estadstico de MATLAB, de
tal manera que el mismo se encuentre disponible para los usuarios de la
UIFCE con conocimientos estadsticos bsicos que quieran encontrar una
aplicabilidad suficiente del software.

Justificacin
Durante el desarrollo de las carreras de la facultad de ciencias
econmicas

se

destaca

la

gran

importancia

del

manejo

el

procesamiento de datos de tal forma que nos permitan establecer


conclusiones fiables que se acerquen en gran medida a las situaciones
reales, es por esta razn que se considera de gran

importancia

establecer

MATLAB

un

uso

adecuado

de

un

software,

como

especficamente del Statistics Toolbox, que facilite este proceso de


anlisis de datos y adems

permita complementar un proceso de

conocimiento en el rea de la estadstica.


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
7

ANALISIS ESTADISTICO EN MATLAB


4. STATISTICS TOOLBOX

El paquete estadstico de MATLAB ha sido desarrollado para proveer


ayuda a cualquier tipo de rea, desde las finanzas hasta la ingeniera,
con herramientas interactivas capaces de establecer anlisis detallados
de datos, adems viene acompaado de una completa serie de
funciones

para

desarrollar

desde

las

ms

bsicas

aplicaciones

estadsticas hasta un completo diseo y proceso de cualquier anlisis


estadstico.
Este paquete provee dos completas categoras para este uso:
-

Una estructura de funciones.

Herramientas de diseo interactivo.

Este paquete es de gran funcionalidad puesto que permite combinar


poderosas funciones estadsticas con interfaces grficas interactivas,
que han de generar un ambiente ideal para un completo montaje
estadstico.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
8

ANALISIS ESTADISTICO EN MATLAB

Estructura de funciones
MATLAB acompaa cada paquete de funciones con una completa gua de
ayuda disponible en diferentes temas especficos, que se muestran a
continuacin. Las funciones que MATLAB incluye en este paquete las
agrupa dentro de las siguientes reas:

Estadstica descriptiva

30

Control de procesos estadsticos

Estadstica multivariada

25

Regresin no Lineal

10

Grficos estadsticos

26

Diseo de Experimentos

12

Distribuciones de probabilidad

138 Tcnicas de rbol de decisin

Pruebas de distribucin

Pruebas No Paramtricas

Modelos Lineales

27

Modelos Hidden Harkov

Importar/exportar archivos

Demostraciones

Pruebas de hiptesis

Utilidades

Es importante destacar como en MATLAB es posible acceder al cdigo


fuente de las funciones predeterminadas (*.m), y amplia este capacidad
hasta el punto en el cual se puede crear y/o personalizar cualquier tipo
de funcin, ajustndolas a necesidades especificas.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
9

ANALISIS ESTADISTICO EN MATLAB


Diseo interactivo - Interfaz Grafica de Usuario
Adems de la posibilidad de disear cualquier interfaz para un anlisis
especifico, MATLAB viene acompaado de opciones predefinidas muy
tiles, una de estas es The Distribution Fitting Tool (Herramienta
apropiada para las distribuciones) una herramienta de gran utilidad que
permite

observar

el

comportamiento

de

16

diferentes

tipos

de

distribuciones de probabilidad con la opcin de combinar distintas


condiciones para cada una de ellas.

INVESTIGACIN
Se ha planeado la investigacin de tal manera que su resultado pueda
acompaar un proceso acadmico, en el cual se establezca una
interrelacin entre la estadstica y las ciencias econmicas, es de esta
manera como sin olvidar la gran funcionalidad de este paquete de
herramientas, la investigacin se va a enfocar en tres ejes temticos,
que se consideran de primera importancia para iniciar un estudio tan
extenso.

5. MANEJO DEL TOOLBOX ESTADISTICO

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
10

ANALISIS ESTADISTICO EN MATLAB


En esta seccin se explicar el uso de las funciones de ms utilidad del
toolbox estadstico, con ejemplos bsicos y tiles donde se destaquen la
aplicabilidad de cada una de ellas.

Estadstica Descriptiva

5.1.1.

Medidas de localizacin

Mean ()

Descripcin

Calcula la media aritmtica de determinados valores.

Sintaxis

mean (a)
-

Si a es un vector, calcula la media de los valores.


Si a es una matriz, calcula la media de cada

columna.
mean (a, dim)
-

Ejemplo

Devuelve los valores medios de la


dimensin especificada de la matriz a.
La dimensin predefinida es 1.

a = [1:10]
Media = mean (a)
Media = 5.5000

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
11

ANALISIS ESTADISTICO EN MATLAB

m_columnas = mean (b)


m_columnas =

[5.0000

% media por columnas


5.2500

4.0000]

m_filas = mean (b, 2) % media por filas


m_filas = [2
6
5
6]
Nota

nanmean()

Calcula la media ignorando aquellos datos perdidos.

Descripcin

Geomean ()

Descripcin

Calcula la media geomtrica de determinados valores.

Sintaxis

geomean (a)
-

Al igual que la funcin anterior, si a es un vector,


calcula la media de los valores.
Si a es una matriz, calcula la media de cada

columna.

Ejemplo

a = [1:10]
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
12

ANALISIS ESTADISTICO EN MATLAB


m_geometrica = geomean (a)
m_geometrica = 4.5287
Media aritmtica > Media geomtrica

Nota

mean (x) > geomean(x)

Harmmean ()

Descripcin

Calcula la media armnica de determinados valores, en


este caso representada por H, es igual al recproco de una
cantidad finita de nmeros, o inverso, de la media
aritmtica de los recprocos de dichos nmeros

Sintaxis

harmmean (a)
- Su parmetro funciona de la misma manera que para
la media geomtrica (mean).

Ejemplo

a = [1:10]
m_armonica = harmmean (a)

m_armonica = 3.4142

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
13

ANALISIS ESTADISTICO EN MATLAB

Trimmean ()
Calcula la media ajustada de una muestra determinada,
es decir excluye los y/2 percentiles mas bajos como los
mas altos, muy til cuando encontramos datos atpicos en
la muestra.

Descripcin

Sintaxis

trimmean (a, y)
-

Ejemplo

El parmetro a funciona de la misma manera que


las funciones anteriores, donde a es la muestra.
Mientras y representa el numero de percentiles
que se quieren obviar en los extremos.

a = [1:10]

%a = [1 2 3 4 5 6 7 8 9 10]

y = 20
m_ajustada = trimmean (a, y)
%Por el parmetro y la muestra que se calcula
es a = [2 3 4 5 6 7 8 9]
m_ajustada = 5.5000
%En este caso la media ajustada es igual a la media aritmtica
por las caractersticas de la muestra.

b = [1 2 3 7 5 6 4 5 6 8 9 1]
z = 10
m_ajustada = trimmean (b, z)
m_ajustada = 5.5000

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
14

ANALISIS ESTADISTICO EN MATLAB

Max (); Min ()

Descripcin

Devuelve los valores extremos de una determinada


muestra.

Sintaxis

max(a); min(a)
-

Si a es un vector, retorna el valor


mximo/mnimo.
Si a es una matriz, retorna mximo/mnimo de
cada columna.

max(a,[],dim); min(a[],2)
-

Ejemplo

Si a es una matriz, retorna mximo/mnimo segn


dim ya especificada, cuando dim = 2 devuelve los
valores extremos para las filas.

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
%Devuelve los valores extremos por cada columna.
mx = max(b)
mx = [8

mi = min(b)
6]

mi = [1

1]

%Devuelve los valores extremos por cada fila.


mxf = max(b,[],2)

mif = min(b,[],2)

mxf = [

mif = [

3
7

9
Nota

nanmax() ; nanmin ()
Descripcin

Devuelve los valores extremos de una determinada


muestra ignorando aquellos datos perdidos.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
15

ANALISIS ESTADISTICO EN MATLAB

Median ()

Descripcin

Calcula la mediana de una muestra (matriz) especifica.

Sintaxis

median (a)
-

Si a es un vector, retorna la mediana de los


valores.
Si a es una matriz, retorna la mediana de cada

columna.

median (a, dim)


-

Ejemplo

Devuelve los valores medios de la


dimensin especificada.
La dimensin predefinida es 1.

a = [1:10]
Mediana = median (a)

Mediana = 5.5000

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

mediana_col = median (b)


mediana_col =

5.5000

% mediana por columnas


5.0000

4.5000]

mediana_fil = median (b, 2) % mediana por filas


mediana_fil = [2
6
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
16

ANALISIS ESTADISTICO EN MATLAB


5
8]

Nota

nanmedian()

5.1.2.

Descripcin

Calcula la mediana ignorando aquellos datos perdidos.

Medidas de dispersin

Std ()

Descripcin

Devuelve la desviacin estndar de una matriz o muestra


especfica.

Desviacin estndar Corregida

Sintaxis

Desviacin estndar sin Corregir

std (a)
-

Si a es un vector, retorna la desviacin estndar


corregida de los valores.
Si a es una matriz, retorna la desviacin estndar
corregida de los valores por columnas.

std (a, flag)


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
17

ANALISIS ESTADISTICO EN MATLAB


-

Cuando flag = 0, std (a,0) se comporta de la


misma manera como std (a)

Cuando flag = 1, std (a, 1) devuelve la


desviacin estndar sin corregir, y el segundo
momento de la muestra

std (a, flag, dim)


-

Ejemplo

obtenemos la desviacin estndar de la dimensin


determinada.
Cuando dim = 0 obtenemos la desviacin
estndar de las columnas.
Si dim = 1 se genera la desviacin estndar de las
filas.

a = [1:10]
Des_std = std (a) % desviacin estndar corregida
Des_std = 3.0277

Dstd = std (a, 1)% desviacin estndar sin corregir


Dstd = 2.8723

% segundo momento

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

dstd_col= std (b)% desviacin estndar por columnas


dstd_col =

3.1623

2.8723

2.4495]

dstd_fil = std (b,0,2)% desviacin estndar por


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
18

filas

ANALISIS ESTADISTICO EN MATLAB


dstd_fil = [1.0000
1.0000
1.0000
4.3589 ]
Nota

nanstd()
perdidos.

Calcula

Descripcin

la desviacin estndar ignorando aquellos datos

Var ()
Descripcin

Calcula la varianza de una muestra especfica, es igual al


cuadro de la desviacin estndar corregida.

Sintaxis

var (a)
-

Si a es un vector, retorna la varianza corregida de


los valores.
Si a es una matriz, retorna la varianza corregida
de cada
columna.

var (a,1)
-

Ejemplo

Si a es un vector, retorna la varianza sin corregir


de los valores, mientras si a es una matriz,
retorna la varianza sin corregir de cada columna.

a = [1:10]
Varz = var (a) % desviacin estndar corregida
Varz = 9.1667

Recordemos que: std(a) = 3.0277.


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
19

ANALISIS ESTADISTICO EN MATLAB


[ std(x) ]2= (3.0277) 2 = 9.167

var(x)

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

varc = var(b) % varianza por columnas


varc = [ 10.0000

8.2500

6.0000 ]

varf = var(b,1) % varianza por filas


varf = [ 7.5000

6.1875

Varianza corregida:

Nota

Varianza sin corregir:

nanvar()

Descripcin

4.5000 ]
[ std(x) ] 2= var(x)

[ std(x,1) ] 2 = var(x,1)

Calcula la varianza ignorando aquellos datos perdidos.

Range ()

Descripcin

Devuelve el rango de una determinada serie de datos, es


decir calcula la diferencia entre el dato mximo y el dato
mnimo.

Sintaxis

range (a)
-

Si a es un vector, calcula el rango del mismo.


Si a es una matriz, calcula el rango de cada
columna.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
20

ANALISIS ESTADISTICO EN MATLAB


Ejemplo

a = [1:10]
rango = range (a)

rango = 9

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
ran = range (b)
ran = [ 7

5]

Iqr ()
Calcula el rango intercuartil de una muestra especifica, es
decir, la diferencia entre el percentil 75 y el 25.

Descripcin

Sintaxis

iqr (a)
-

Ejemplo

Si a es un vector, calcula el rango intercuartil del


mismo.
Si a es una matriz, calcula el rango intercuartil de
cada columna.

a = [1:10]
R_ intercuartil = iqr (a)

R_ intercuartil = 5

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
R_ intercuartil = iqr (a)
R_ intercuartil = [ 5.0000

3.5000

4.0000 ]

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
21

ANALISIS ESTADISTICO EN MATLAB

Prctile ()

Descripcin

Calcula el valor de un percentil determinado en el


intervalo de [0 100] en una muestra especifica.

Sintaxis

prctile (a, p)
-

p, corresponde al percentil que se busca, puede

ser un vector o escalar


a, es la muestra que se analiza, puede ser
vector o matriz.

Prctile (a , p)

Vector

Escalar

Calcula el percentil p de la muestra a.

Matriz

Escalar

Genera un vector con los percentiles p por


cada columna de la matriz a.

Vector

Vector

Genera un vector con los percentiles que


contiene p de la muestra a.

Matriz

Vector

Genera una matriz en la cual cada columna


corresponde a los percentiles especificados en
p de cada columna de la matriz a

Nota

Ejemplo

Percentil 50 = Mediana

a = [1:10]
b = [25 50 75]
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
22

ANALISIS ESTADISTICO EN MATLAB


percentiles = prctile (a,b)
percentiles = [ 3.0000

5.5000

8.0000 ]

c = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
d = [25 50 75]
percent = prctile (c,d)
percent = [ 2.5000
5.5000
7.5000

3.5000
5.0000
7.0000

2.0000
4.5000
6.0000 ]

Quantile ()

Descripcin

Calcula el valor de un quantiles de una muestra


especifica, aunque su resultado es muy similar al de la
funcin anterior prctile() - .

Sintaxis

quantile (a, p, dim)


-

Nota

p, corresponde al quantil que se busca, puede


ser un vector o escalar y se encuentra entre el
rango [0 1] .
a, es la muestra que se analiza, puede ser
vector o matriz.
Su comportamiento hasta este punto es igual a la
funcin prctile().
Sin embargo el parmetro dim es muy til ya que
nos permite buscar quantiles en otras dimensione.
dim=1, por columnas, dim=2, por filas

Prctile( x , 50) = quantile (x, .50) = mediana


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
23

ANALISIS ESTADISTICO EN MATLAB

Ejemplo

a = [1:10]
Q5 = quantile(a, .5) %Igual a la mediana
Q5 = 5.5000
Resume = quantile(a,[.025 .25 .50 .75 .975]

Resume = [1.0000 3.0000 5.5000 8.0000 10.0000 ]


b = magic(3)
b = [8

2]

MedianaC = quantile(b,.5,1) %Mediana por columnas


MedianaC = [ 4

6]

MedianaF = quantile(b,.5,1) %Mediana por filas


MedianaF = [

6
5
4

Skewness ()

Descripcin

Calcula la oblicuidad de una determinada muestra,

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
24

ANALISIS ESTADISTICO EN MATLAB

Sintaxis

skewness (a)
-

Si a es un vector, calcula la oblicuidad de los


valores.
Si a es una matriz, calcula la oblicuidad de cada
columna.

Ejemplo

X = randn([5 4])
%genera una matriz aleatoria con distribucin normal
X = [ 0.2944

0.8580

-0.3999

0.6686

-1.3362

1.2540

0.6900

1.1908

0.7143

-1.5937

0.8156

-1.2025

1.6236

-1.4410

0.7119

-0.0198

-0.6918

0.5711

1.2902

-0.1567 ]

obl = skewness (X)


%En este caso la oblicuidad se acerca a cero
obl = [ -0.0040 -0.3136 -0.8865 -0.2652 ]
Nota

La oblicuidad (obl.) es una medida de asimetra de las muestras con distribucin normal, se mide a
partir de la media.
Si obl. < 0, entonces la mayora de los datos se encuentran a la izquierda de la media;
. Si obl.> 0, entonces la mayora de los datos se encuentran a la derecha de la media; y
Si obl. = 0, entonces la muestra corresponde a una distribucin normal con perfecta simetra.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
25

ANALISIS ESTADISTICO EN MATLAB

kurtosis ()

Descripcin

Calcula la curtosis, removiendo los valores perdidos.

Sintaxis

kurtosis (a)
-

Cuando a es un vector, calcula la curtosis de los


elementos del mismo.
Cuando a es una matriz, calcula la curtosis para
cada columna.

kurtosis (a, flag)


- Especifica si se quiere corregir la diagonal (flag = 0)
o no (flag = 1, por defecto).

a = [1 5 9; 2 6 10; 3 7 11; 4 8 12]

Ejemplo

k=kurtosis (a)
k= [1.6400

1.6400

1.6400]

tabulate ()

Descripcin

Devuelve una tabla con las frecuencias absolutas y


relativas de una muestra.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
26

ANALISIS ESTADISTICO EN MATLAB


Sintaxis

tabulate (a)
-

Ejemplo

El parmetro a representa la muestra, y solo


puede ser un vector.

a = [4 1 4 4 2 3 4 3 1 2]
tabla = tabulate (a)

tabla =
Value

Count

Percent

20.00%

20.00%

20.00%

40.00%

mad ()

Descripcin

Desviacin absoluta media o mediana de una muestra.

Sintaxis

mad (a,flag,dim)
Si flag = 0 :
-

Si a es un vector, calcula la desviacin absoluta


media de los valores.
Si a es una matriz, calcula la desviacin absoluta
media de cada columna.

Si flag = 1:
-

Si a es un vector, calcula la desviacin absoluta


mediana de los valores.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
27

ANALISIS ESTADISTICO EN MATLAB


-

Si a es una matriz, calcula la desviacin absoluta


medina de cada columna.

- dim se usa para determinar la dimensin en la


cual se quiere calcular.(dim = 0, por defecto,
columnas, dim=1 por filas)

Ejemplo

a = [1:10]
DesvAbs = mad(a)
DesvAbs = 2.5000

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
dac = mad(b)

% desviacin media por columnas

dac =[ 2.5000

1.8750

2.0000 ]

daf = mad(b,0,1)% desviacin media por filas


daf =[ *

*]

Nota

Para una distribucin normal 'mad ()' es menos eficiente que la desviacin estndar 'std()' como medida de dispersin.

moment ()
Descripcin

Devuelve los momentos centrales de cualquier orden (k).

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
28

ANALISIS ESTADISTICO EN MATLAB

Sintaxis

moment(a, order, dim)


-

Ejemplo

Calcula el momento central de a segn el entero


positivo order.
SI a es un vector, calcula el momento central por
cada columna.
dim especifica la dimensin con la cual se
calcularan los momentos centrales.

a = [1:10]
DesvAbs = mad(a)
DesvAbs = 2.5000

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
dac = mad(b)

% desviacin media por columnas

dac =[ 2.5000

1.8750

2.0000 ]

daf = mad(b,0,1)% desviacin media por filas


daf =[ *

5.1.3.

*]

Grupos de datos

cov()

Descripcin

Devuelve una matriz de covarianza.


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
29

ANALISIS ESTADISTICO EN MATLAB

Sintaxis

cov (a)
-

Proceso

Cuando a es un vector, devuelve un valor con la


varianza del mismo.
Cuando a es una matriz, cada columna es una
observacin y cada columna una variable.

El algoritmo para cov () es:

[n,p] = size(X);
X = X - ones(n,1) * mean(X);
Y = X'*X/(n-1);

Ejemplo

a = [1:10]
Covarianza = cov(a)
Covarianza = 9.1667

b = [1 2 3; 7 5 6; 4 5 6]
Covarianza = cov (b)
Covarianza =[ 9.0000

4.5000

4.5000

4.5000

3.0000

3.0000

4.5000

3.0000

3.0000 ]

corr()

Descripcin

Devuelve una matriz de correlacin linear.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
30

ANALISIS ESTADISTICO EN MATLAB


Sintaxis

RHO = corr(a)
-

a debe ser una matriz, y devuelve un matriz de


correlacion entre columnas.

RHO = corr(a,b)
-

Genera una matriz de correlacin entre las dos


matrices, las dimensiones
iguales a las de b.

de

deben

ser

RHO = corr(...,'param1', val1, 'param2',val2,...)


-

Especifica mas parmetros para determinar la


Correlacin.

Parmetros

Valores

Descripcin

'type'

'Pearson'

Calcula el coeficiente de correlacin


lineal de 'Pearson'.

(por defecto)

Para los valores-P usa la distribucin


T-Student

'rows'

'Kendall'

Calcula Kendall's tau, otra medida de


correlacin.

'Spearman'

Calcula la correlacin de 'Spearman'.

'all'

Calcula usando todas las filas as


contengas valores perdidos.

(por defecto)
'complete'

Calcula las filas que no tengan valores


perdidos.

'pairwise'

Calcula RHO[i,j] usando las filas que


no tengan valores perdidos en las
columnas j e i .

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
31

ANALISIS ESTADISTICO EN MATLAB


'tail'

'ne'

Correlacin no es cero

(por defecto)
'gt'

Correlacin es mayor que cero

'lt'

Correlacin es menor que cero


(Cola La hiptesis alternativa contraria
a la que deseamos comprobar.)

Ejemplo

a = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
Rho = corr(a)
Rho =[

1.0000

0.8808

-0.1291

0.8808

1.0000

-0.4264

-0.1291

-0.4264

1.0000 ]

b=[1 2 3; 4 5 6; 7 8 9; 10 11 12]
RHO = corr(a)
RHO = [ 1 1 1
111
111]

corrcoef()

Descripcin

Devuelve una matriz con los coeficientes de


correlacin, en el cual las filas son observaciones y las
columnas son variables .
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
32

ANALISIS ESTADISTICO EN MATLAB

Sintaxis

R = corrcoef (a)
-

a debe ser una matriz.

[R,P]= corrcoef (a)


- Devuelve adems una matriz con los valores p
usados en las pruebas de hiptesis.

[R,P,RLO,RUP]=corrcoef(...)
- Adems devuelve RLO y RUP que son los lmites de
determinado intervalo a 95% de confianza.
[...]=corrcoef(...,'param1',val1,'param2',val2,...)
-Parmetros adicionales
Parmetros Descripcin
'alpha'

Un numero entre 0 y 1 usado para especificar el nivel de


confianza de 100*(1-alpha)%
Ejemplo. Cuando alpha es 0.05, el intervalo de confianza esta a
95%

'rows'

Los valores se determinan de la misma manera que para corr().

crosstab()

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
33

ANALISIS ESTADISTICO EN MATLAB


Descripcin

Genera una matriz con tabulacin-cruzada entre


diferentes vectores.

Sintaxis

crosstab (col1 ,col2)


-

Se genera una matriz donde el elemento (i,j)


corresponde a la cuenta de todas las
observaciones donde col1=i y col2 =j.

Ejemplo

a=[1

10 ]

%Cdigo de diez estudiantes


b=[2

3.5 2.5 3

2]

%Nota para los diez estudiantes respectivamente


tabla = crosstab(a,b)
tabla =

Puede interpretarse como:

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
34

ANALISIS ESTADISTICO EN MATLAB


Nota

2.5

3.5

10

Alumno

grpstats ()

Descripcin

Devuelve un resumen estadstico por grupo.

Sintaxis

grpstats (a, group)


-

Genera la media de cada columna de a por grupo,


el vector group define como se agruparan los
datos.

grpstats (a, group, alpha)


-

Genera un diagrama de las medias frente a un


ndice 100(1 - alpha) % de intervalo de confianza
por cada media.

grpstats (a, group, whichstats)


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
35

ANALISIS ESTADISTICO EN MATLAB


-

En este caso whichstats corresponde a otros estadsticos


que podemos calcular dentro de los siguientes:

'mean'

Promedio

'sem'

Error estndar

'numel'

Cuenta, del nmero de elementos.

'gname'

Nombre del grupo

'std'

Desviacin Estndar

'var'

Varianza

'meanci'

Intervalo de confianza al 95%

'predci'

Intervalo de prediccin a un 95% para una nueva observacin

bootstr ()

Descripcin

Permite
efectuar
caractersticas.

el

Bootstrap

con

determinadas

Nota

El Bootstrap es una metodologa estadstica que a tenido gran aplicacin en los ltimos aos, y
consiste en obtener nuevas muestras con caractersticas similares a una primera muestra real (raz),
y partir de los estadsticos de todas las muestras generadas establecer conclusiones mas precisas.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
36

ANALISIS ESTADISTICO EN MATLAB

bootstr (nboot, fboot,d1,d2,)

Sintaxis

Ejemplo

nboot, es el numero de muestras que queremos


generar.
fboot, es la funcin que se quiere aplicar a las
muestras.
d1, d2, . , son las muestras raz.

X = [1:5] %Muestra raz


B1 = bootstr(3,size,a)
B1 = [

B2 = bootstr(3,mean,a)
B2 = [

2.6000
2.2000
3.8000

6. GRFICAS EN TOOLBOX ESTADSTICO

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
37

ANALISIS ESTADISTICO EN MATLAB

Introduccin
El Toolbox estadstico de MATLAB, proporciona grandes facilidades en lo
relacionado con grficas, situacin que permite automatizar y agilizar el
manejo y procesamiento de las mismas. Para ello dispone de una serie
de funciones que permiten modificar dentro de la figura los parmetros
que afectan el resultado de la misma. En el presente informe se
pretende dar a conocer algunas de estas ventajas con una ayuda que
permita una fcil utilizacin las funciones predefinidas para el programa.

Las grficas estadsticas en las que basaremos el presente trabajo sern


algunas en las cuales se manejen las funciones de distribucin bsicas,
de tal manera que se adecue a las necesidades de los estudiantes de la
facultad de ciencias econmicas, dando principal nfasis en funciones de
distribucin como la T, Chi-cuadrado, F, Binomial, Poisson, entre otras.

Principales Funciones Utilizadas En Matlab Para Grficas


Existen una serie de criterios generales para seleccionar grficas de tipo
estadstico, criterios que corresponden a las posibilidades y
caractersticas que poseen las grficas en el TOOLOBOX ESTADISTICO.
Algunas de las caractersticas de mayor importancia se encuentran
relacionadas con el entendimiento de las grficas, como bien es
expresado en la siguiente frase toda grafica debe explicarse por si
misma, por tanto debe llevar un titulo claro, la fuente de donde fueron
obtenidos los datos, rangos de escalas y leyendas o notas
explicatorios1. Las grficas en matlab permiten la posibilidad de
adecuarlas de tal forma que sean completamente entendibles para los
usuarios, por medio de las diferentes posibilidades existentes para
insertar en las graficas.

En el men insertar, Matlab permite la posibilidad de agregar a la


grfica etiquetas de diferentes tipos, de igual forma es posible colocar al
interior de la misma formas y cuadros, estas opciones proporcionadas
por el programa permiten responder a las caractersticas bsicas para
graficas, y adems colocar algunos elementos adicionales que dan un
toque personal y mejor entendimiento de las mismas.
1

Ciro Martnez Bencardino, ESTADISTICA

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
38

ANALISIS ESTADISTICO EN MATLAB

Para conocer algunas de las posibilidades de las grficas en el Toolbox,


presentaremos algunas de las funciones relacionadas con graficas de
tipo estadstico en el programa. Las siguientes son las funciones bsicas
de mayor importancia, relacionadas con los estudios de tipo estadstico:

RANDTOOL
Esta funcin permite generar de forma interactiva nmeros al azar
mostrando los resultados grficos por medio de un histograma. Instala
un interfaz grfico que permite indagar los efectos al realizar cambios
en los parmetros que afectan la funcin que se desee graficar.
Algunas caractersticas de la interfaz (VER FIGURA 1)

La interfaz que se abre con la funcin, permite fijar valores de


parmetro para la distribucin y para cambiar sus lmites superiores e
inferiores en la generacin de datos aleatorios.
Permite dibujar otra muestra con la misma distribucin, con el mismo
tamao y los parmetros, al igual que generar la grafica de otro tipo de
distribucin con los parmetros seleccionados en primera instancia.
Permite exportar la muestra actual al workspace, para ello proporciona
la opcin exportar la cual permite ver los datos aleatorios que generaron
la grafica y en general trabajar con estos como si hubiesen sido creados
en el command window.
Trae una barra de mens completa que permite realizar modificaciones
a las caractersticas de la grafica, compuesta por bastantes opciones
que permitirn adecuar la grafica a nuestros requerimientos y de igual
forma obtener todo tipo de informacin relacionado con la grafica
generada con datos aleatorios.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
39

Barra de mens

ANALISIS ESTADISTICO EN MATLAB

TAMAO DE LA
MUESTRA

FUNCIONES
DISTRIBUCION

DE

Limite superior e
inferior de los
datos
generados.

Valor
parmetro

del

Exportar datos al
workspace
FIGURA 1

DISTTOOL
Esta funcin permite generar de forma interactiva
diagramas de
diferentes distribuciones de probabilidad. La interfaz generada por esta
funcin permite escoger entre dos tipos de diagramas, el de cdf
(genera una funcin distribucin acumulativa elegida) o el de pdf
(Funcin de densidad de probabilidad para una distribucin especificada)
y al igual que la funcin presentada con anterioridad permite realizar
modificaciones a los parmetros relacionados con las caractersticas de
la misma interfaz generada.

Algunas caractersticas de la interfaz (VER FIGURA 2)


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
40

ANALISIS ESTADISTICO EN MATLAB


La interfaz que se abre con la funcin, permite fijar valores de
parmetro para la distribucin y para cambiar sus lmites superiores
e inferiores en la generacin de datos aleatorios.
En la interfaz se tiene la posibilidad de conocer los valores de X
correspondientes a un nivel de probabilidad, o viceversa. Estos
valores pueden ser modificados de acuerdo a nuestras necesidades y
varan automticamente en la interfaz generada con esta funcin.
Permite la posibilidad de generar un sin numero de grficos, teniendo
en cuenta los 20 tipos de distribucin existentes, y las dos
posibilidades de funciones que se pueden generar para cada tipo de
distribucin.

TIPO
DE
FUNCION

FUNCIONES
DISTRIBUCION

DE

FUNCION
CDF O PDF
VALOR
DE
LA FUNCION

VALOR DE X

Limite superior
e inferior de los
datos
generados.

Valor del parmetro

FIGURA 2

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
41

TIPO

ANALISIS ESTADISTICO EN MATLAB

Lsline
Descripcin

Esta funcin genera la lnea de ajuste de los mnimos


cuadrados de una funcin predeterminada.
Sintaxis

lsline
x = lsline
Ejemplo

Se puede generar un vector x con cualquier tipo de


caractersticas (en este caso un vector que contiene 20
datos aleatorios con distribucin normal), en este caso
utilizamos la funcin randn;
X = randn (20,1)
Graficamos la funcin y pedimos que nos seale los
valores al interior de la grfica.
plot (X,+)

Por ltimo utilizamos la funcin lsline para que nos


genere la lnea de tendencia de los valores graficados.
lsline (ver FIGURA 3).

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
42

ANALISIS ESTADISTICO EN MATLAB


2
1.5
1

Lnea de tendencia

0.5

Generada por la funcin

0
-0.5
-1
-1.5
-2
-2.5

10

12

14

16

18

20

FIGURA 3

Cdfplot
Descripcin

Este comando permite ver la grfica de una funcin de


distribucin acumulativa emprica para datos en un
solo vector X. El cdf emprico se define como la
proporcin de valores de X menor o igual a x. Este
diagrama, al igual que los generados por hist y
normplot, es til para examinar la distribucin de una
muestra de datos.
Sintaxis

cdfplot (X)
h = cdfplot(X)
[h, stats] = cdfplot(X)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
43

ANALISIS ESTADISTICO EN MATLAB


Ejemplo

En primer lugar generaremos un vector con media: 0,


desviacin estndar: 1; con dimensiones m: 20 y n: 1.
Para
ello
utilizaremos
la
funcin
normrnd
estableciendo
los
parmetros
anteriormente
mencionados, as: x = normrnd (0,1,50,1);
Posteriormente utilizamos la funcin objetivo del
ejemplo de la siguiente forma: cdfplot (x) (VER
FIGURA 4)
Y por ultimo le pedimos que nos muestre el h y los
estadsticos bsicos [h,stats] = cdfplot(X), as:

stats

values

min:

-1.7613

max:

2.7922

mean:

-0.1579

median:

-0.3096

std:

0.9138

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
44

ANALISIS ESTADISTICO EN MATLAB


Empirical CDF
1
0.9
0.8
0.7

F(x)

0.6
0.5
0.4
0.3
0.2
0.1
0
-2

-1.5

-1

-0.5

0.5

1.5

2.5

FIGURA 4

Boxplot
Descripcin

Diagrama de caja de una muestra de los datos

Sintaxis

- Boxplot(X): produce un diagrama de caja y de bigotes para cada


columna de la matriz X. La caja tiene lneas en el cuartl
superior, en el punto medio, y en el cuartl inferior de la
caja.
Los bigotes son lneas que extienden de cada extremo de la caja
para mostrar la extensin de los datos que se encuentran fuera de los
limites de la caja. Los mas (+) son datos con valores ms all de los
extremos de los bigotes. Si no hay datos fuera de los bigotes, un
punto se coloca en el bigote inferior
-

boxplot (X,G): produce un diagrama de caja y bigotes para un vector


X, agrupado por G. G es un grupo de variables definidas
por un vector, una matriz o un conjunto de celdas
variables. G tambin puede ser un conjunto de variables
(tales como {G1 G2 G3} agrupando los valores en X por
cada combinacin de grupo de variables.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
45

ANALISIS ESTADISTICO EN MATLAB


-

boxplot (...,'Param1', val1, 'Param2', val2,...): parmetros opcionales


especficos, tales como los descritos en el siguiente
cuadro:

Parameter
Name

Parameter Values

'notch'

'on' para incluir los cortes en la caja (por defecto es


'off')

'symbol'

Smbolo para usar fuera del limite del grafico (por


defecto es r+')

'orientation'

Orientacin del diagrama 'vertical' (por defecto) o


'horizontal'

'whisker'

Mxima extensin de los bigotes en unidades de


rango de intercuartl (por defecto 1.5)

'labels'

Etiquetas para la secuencia de columnas (se usa


solamente cuando X es una matriz, y la etiqueta
por defecto es el numero de la columna).

En un boxplot con cortes, dichos cortes representan un buen estimador


de la incertidumbre, en la comparacin de las medianas de cada caja
graficada. Cuando los cortes no se traslapan indican que las medianas de
los dos grupos difieren con un 5 por ciento de nivel de significancia.

Ejemplo

Los siguientes comandos generan un diagrama de boxplot usando


una base de datos existente en el programa y que permite su
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
46

ANALISIS ESTADISTICO EN MATLAB


utilizacin para la explicacin de varias funciones. Los siguientes
comandos crean un boxplot de la aceleracin relacionada con el
ao de fabricacin de los carros.
load carsmall
boxplot (Acceleration, Model_Year)

Boxplot Acelaracion VS Modelo del carro


24
22
20

Values

18
16
14
12
10
8
70

76

82

En este ejemplo podemos ver un diagrama de caja para la aceleracin


de los vehculos de acuerdo con el ao de fabricacin, y podemos
evaluar algunas de las caractersticas que evidencia la figura, tales como
la diferencia entre medianas y los datos que se encuentra fuera de los
lmites del diagrama de caja.

Este ejemplo produce los diagramas de la caja para los datos de la


muestra, y acepta el defecto 1,5 * IQR para la longitud de las
barbas.

X1 = normrnd(6,1,60,1); % normrnd genera datos aleatorios con


distribucin normal
X2 = normrnd(4,2,60,1);
x = [X1 X2];
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
47

ANALISIS ESTADISTICO EN MATLAB


boxplot(x, 1)
Boxplot para dos funciones con Dn normal
9
8
7

Values

6
5
4
3
2
1
0
1

2
Column Number

La diferencia entre los puntos medios de las dos columnas de x es


aproximadamente 1. Puesto que los cortes en el boxplot no se
traslapan, se puede concluir, con un nivel de significancia del 95%, que
las medianas de las dos muestras difieren.
Este diagrama tiene varios elementos grficos:

Las lneas ms bajas y superiores de la "caja" son el 25 y 75 por


ciento de la muestra. La distancia entre la tapa y fondo de la caja
es el rango de interquartile.

La lnea en el centro de la caja es el punto medio de la muestra. Si


el punto medio no se centra en la caja, sa es una indicacin de la
oblicuidad.

Las " barbas" son lneas que extienden sobre y debajo de la caja.
Demuestran el grado del resto de la muestra (a menos que hay
afloramientos). No si se asume que ningn afloramiento, el
mximo de la muestra es la tapa de la barba superior. El mnimo
de la muestra es el fondo de la barba ms baja. Por defecto, los
datos que se encuentran por fuera de los bigotes son ms de 1,5
veces la gama interquartile que se encuentran fuera de los lmites
de la caja.

El signo de ms en la tapa del diagrama es una indicacin de un


afloramiento en los datos. Este punto pudo ser el resultado de un
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
48

ANALISIS ESTADISTICO EN MATLAB


error de la entrada de datos, de una medida pobre, o de un
cambio en el sistema que gener datos de forma errnea.

Las cortes en la caja son un intervalo grfico de la confianza sobre


el punto medio de una muestra. Los diagramas de la caja no
tienen cortes por defecto.

Qqplot
Descripcin

Un diagrama del quantile-quantile es til para determinarse


si dos muestras vienen de la misma distribucin (si est
distribuido normalmente o no).

Sintaxis

qqplot(X) muestra una grafica de quantil-quantil para una


muestra de datos de X en relacin a una distribucin terica
normal. Si la distribucin de X es normal, la grafica ser
lineal.

- qqplot(X, Y) muestra una grafica de quantil-quantil para


dos muestras de datos si las muestra vienen de la misma
distribucin, la grfica ser lineal. Para una matriz X y Y,
qqplot muestra lneas separadas para cada pareja de
columnas, adems la grfica contiene la muestra de datos
mostrando los mismos por medio de signos (+).
- qqplot () este tipo de grfico es usado para especificar los
cuartiles en el vector pvec.
Ejemplos

1.

El ejemplo demuestra un diagrama del quantile-quantile-quantile


de dos muestras de una distribucin de Poisson.

x = poissrnd (15, 140,1); y = poissrnd (10, 80,1); qqplot(x, y););

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
49

ANALISIS ESTADISTICO EN MATLAB


QQPLOT para comparar dos dstribuciones Poisson
20
18
16

Y Quantiles

14
12
10
8
6
4
2
0

10

12

14

16
18
X Quantiles

20

22

24

26

Aunque los parmetros y los tamaos de muestra son diferentes, la


relacin de lnea recta demuestra que las dos muestras vienen de una
misma distribucin.
2. El ejemplo debajo de demostraciones qu sucede cuando las
distribuciones subyacentes no son iguales.
x = normrnd(10,1,50,1); y = weibrnd(4,0.5,50,1); qqplot(x, y);
QQPLT Para distribuciones diferentes
0.8
0.7
0.6

Y Quantiles

0.5
0.4
0.3
0.2
0.1
0
-0.1
-0.2

7.5

8.5

9.5
10
X Quantiles

10.5

11

11.5

12

Estas muestras no son claramente de la misma distribucin.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
50

ANALISIS ESTADISTICO EN MATLAB


Para determinar la validez de un procedimiento estadstico que dependa
de que las dos muestras vienen de la misma distribucin (ej. ANOVA),
un diagrama linear del quantile-quantile-quantile debe ser suficiente.

Gname
Descripcin

Etiqueta los puntos trazados con el respectivo nombre o


nmero, segn el caso. Los datos que se ingresan para
utilizar a funcin deben ser datos que se encuentren
relacionados con un nombre especfico, es decir que cada
punto al interior de la grafica corresponda a un nombre en
especial. Si se pulsa una vez un punto al interior de la grfica,
automticamente el grafico muestra el nombre al que
corresponde el punto seleccionado.
De forma alternativa si se desea conocer el nombre de
diferentes puntos se puede arrastrar el Mouse creando un
rectngulo que mostrara el nombre de cada uno de los puntos
que se encuentran al interior del mismo. Con el botn
derecho del Mouse se puede quitar la etiqueta colocada sobre
la grfica. el gname sin discusiones etiqueta cada caja con su
nmero del caso. Se puede utilizar el gname para etiquetar
diagramas creados por funciones tales como plot, Scatter,
gscatter, plotmatrix, entre otras.

Sintaxis

gname() permite conocer la procedencia de los datos con solo


presionar el botn derecho del Mouse para grficas realizadas
de
forma
previa.
h = gname(cases, line_handle)

Ejemplo

Este ejemplo utiliza informacin de ciudades estadounidenses


con el objetivo de revisar la relacin entre gastos e ingresos,
y utilizando el comando gname para verificar a que ciudad
corresponde cada punto.
Load cities
gastos = ratings(:,1);
ingresos= ratings (:,4);
plot(Gastos, Ingresos,'+')
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
51

ANALISIS ESTADISTICO EN MATLAB


gname(names)
4

x 10

3
Los Angeles, Long Beach, CA
2

Philadelphia, PA-NJ

0
1000

2000

3000

4000

5000

6000

7000

8000

9000

Para ver la procedencia de cualquier punto del grafico basta con dar clic
sobre alguno de ellos.

Refline
Descripcin

Agregue una lnea de referencia a la grfica actual.

Sintaxis

refline(slope, intercept)
- agrega una lnea de referencia con la
pendiente y a intercepcin teniendo en
cuenta las condiciones actuales
refline(slope)
- agrega la lnea de referencia al grfico, y
utilizando nicamente la pendiente.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
52

ANALISIS ESTADISTICO EN MATLAB


h = refline(slope, intercept)

Ejemplo

Para este ejemplo creamos un vector Y, creando diferentes lneas de


referencia en la grafica de acuerdo a condiciones especificas.

Y = [1.2 5.2 1.9 4.5 4.0 3.2 3.9 1.9 2.6 2.4 2.8]';

plot (y,'+')

refline(1,3)

refline(0.5,3)

refline(2,3)

refline(0,2)
REFLINE
14

12

10

2
1

10

11

Gscatter
Diagrama de la dispersin del grupo
Sintaxis

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
53

ANALISIS ESTADISTICO EN MATLAB


gscatter(x,y,g)
gscatter(x,y,g,'clr','sym',siz)
gscatter(x,y,g,'clr','sym',siz,'doleg')
gscatter(x,y,g,'clr','sym',siz,'doleg','xnam','ynam')
h = gscatter(...)
Descripcin
- gscatter(x, y, g)

Crea un diagrama de la dispersin de x y y, en el cual X y Y


son los vectores con el mismo tamao y g es un grupo de
variables definidas por un vector, una matriz o un conjunto
de celdas variables. G tambin puede ser un conjunto de
variables (tales como {G1 G2 G3} agrupando los valores en
X por cada combinacin de grupo de variables.
Los puntos con el mismo valor de g se colocan en el mismo
grupo, y aparecen en el grfico con el mismo marcador y
color.
- gscatter(x, y, g, ' clr ', ' sym ', siz)
Esta funcin permite crear el diagrama de dispersin y
especificar el color, el tipo del marcador, y el tamao para
cada grupo. ' clr ' es un conjunto de colores reconocidos por
la funcin plot.sym ' son una serie de smbolos reconocidos
por el comando plot, con el smbolo por defecto de '.'. siz es
un vector de tamaos, con el defecto determinado por '
defaultlinemarkersize ' caracterstico. Si no se especifican las
caractersticas deseadas, gscatter establece los valores
necesarios para el entendimiento de la grfica.
- gscatter(x, y, g, ' clr ', ' sym ', siz, ' doleg ') controla si la
leyenda es mostrada en el grfico ('doleg' = 'on', por
defecto) o no ('doleg' = 'off').
- gscatter(x, y, g, ' clr ', ' sym ', siz, ' doleg ', 'xnam',
'ynam ') especifica el nombre para utilizar en las etiquetas
del eje X y el eje Y. Si las etiquetas par x y Y son omitidas,
por defecto se coloca en el grfico el nombre de las
variables.

Ejemplo

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
54

ANALISIS ESTADISTICO EN MATLAB


El siguiente ejercicio consistir en realizar un diagrama de
dispersin para dos grupos el de salud y el de condiciones
econmicas agrupndolas por medio de la informacin de la
columna group. Para ello se deben ingresar los siguientes
comandos:
Load discrim % carga tablas con informacin predefinida que
se encuentra en el programa
scatter(ratings(:,3),ratings(:,9),group,'rk','.*')
DIAGRAMA DE DISPERSION
10000
1
2

CONDICION ECONOMICA

9000

8000

7000

6000

5000

4000

3000

1000

2000

3000

4000
SALUD

5000

6000

7000

8000

Hist
Descripcin

Grafico de histograma

Sintaxis

- hist(y)
Grafica un histograma con diez barras para los valores
contenidos en el vector y. las barras estn igualmente
espaciados entre el valor mnimo y mximo que toma la
variable.
- hist(y, nb)
Las letras nb representan el nmero de barras que
queremos sean colocados en el grfico final.
- hist(y, x)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
55

ANALISIS ESTADISTICO EN MATLAB


Grafica un histograma usando el numero de barras que
contiene el vector x.
- [n,x] = hist(y...) no realiza el grfico de histograma,
pero retorna los vectores n y x, que contienen la
frecuencia y la localizacin de las barras de tal forma
que bar(x,n) grafica el histograma.
Ejemplos

1. Con los siguientes comandos se genera un histograma


con diez divisiones.
y = normrnd(0,0.5,500,1)
genera datos aleatorios.

%la

funcin

normrnd

Hist (y)
HISTOGRAMA
150

100

50

0
-1.5

-1

-0.5

0.5

1.5

2. Los siguientes comandos generan un histograma, en el


cual se utiliza una variable x, para elegir el nmero de
barras contenidas en el grfico y elegir los valores del eje x.
y= normrnd(0,1,1500,1);
x= -4.5:0.7:4.5;
hist(y,x)

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
56

ANALISIS ESTADISTICO EN MATLAB


HISTOGRAMA 2
200
180
160
140
120
100
80
60
40
20
0
-5

-4

-3

-2

-1

Errorbar
Descripcin

Sintaxis

Grafica las barras de error a lo largo de una curva.

- errorbar(X,Y,L,U,symbol)
Grafica X versus Y con un largo especifico de las barras de
errores determinado por L(i)+U(i) que representan los
puntos superiores e inferiores del grfico. X, Y, L, y U deben
ser de la misma longitud. Si X, Y, L, y U son matrices, cada
columna produce una lnea por separado. Las barras de
error estn graficadas a distancia de U(i) en la parte
superior y L(i) en la parte inferior de los puntos en (X,Y). El
smbolo (symbol) es una forma de controlar el tipo de lnea,
el smbolo del grfico y el color de las barras de error.
- errorbar(X,Y,L)
Grafica X versus Y con barras de errores simtricas en
relacin a Y
- errorbar(Y,L)
Grafica Y con barras de error [Y-L Y+L].

Nota

La funcin errorbar hace parte del lenguaje estndar de MATLAB


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
57

ANALISIS ESTADISTICO EN MATLAB


Ejemplo

Con los comandos siguientes genere los vectores necesarios


para realizar la grafica de errorbar.
X =[1 2 3;6 5 4 ; 9 8 7];
Y =[5 4 9; 5 4 8 ; 1 8 6];
U =[3 6 7; 7 9 1; 8 9 2];
L =[2 8 6;7 9 5; 3 4 6]
errorbar (X, Y, L, U,'s')
ERRORBAR
20

15

10

-5

10

Ecdfhist
Propsito

Crea el histograma de salida de una distribucin ecdf


Sintaxis

- n = ecdfhist (f, x)
Toma un vector f, de valores una
distribucin acumulativa (cdf) y un
evaluacin de los puntos de la
devuelve un vector n que contiene
altos del histograma para 10 barras
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
58

funcin de
vector de
funcin, y
los puntos
igualmente

ANALISIS ESTADISTICO EN MATLAB


espaciadas. La funcin computa las barras de
mayor altura desde el incremento en la funcin
emprica (cdf), y las normaliza de tal forma que el
rea del histograma sea igual a 1. A diferencia el
comando hist genera barras que representan la
frecuencia en la muestra.
- n = ecdfhist(f, x, m)
En este caso m es un nmero escalar y
representa el numero de barras que deseamos
aparezcan en el grfico. n = ecdfhist(f, x, c)
- n = ecdfhist(f, x, c)
En este caso c es un vector, que permite centrar
las barras especficamente en c.
- [n, c] = ecdfhist(...)
Devuelve la posicin de las barras centradas en c.
- ecdfhist(...)
Sin argumentos produce un histograma de barras
de los resultados.
Ejemplo

El cdigo siguiente genera tiempos de error aleatorios y


tiempos censurados , comparando la emprica pdf con una
pdf que se conoce que es verdadera.
y = exprnd(10,50,1); % random failure times
d = exprnd(20,50,1); % drop-out times
t = min(y,d);
% observe the minimum of these
times
censored = (y>d); % observe whether the subject
failed
% Calculate the empirical cdf and plot a histogram
from it
[f,x] = ecdf(t,'censoring',censored);
ecdfhist(f,x);
% Superimpose a plot of the known true pdf
hold on;
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
59

ANALISIS ESTADISTICO EN MATLAB


xx = 0:.1:max(t); yy = exp(-xx/10)/10; plot(xx,yy,'g');
hold off;2
ECDFHIST
0.1
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0

10

15

20

25

GPLOTMATRIX
Descripcin

Matriz diagramas de dispersin por grupo.

Sintaxis

-gplotmatrix(x,y,g)
Esta funcin crea una matriz de grficos de dispersin.
Cada conjunto de ejes en la figura del resultado
contiene un diagrama de dispersin de una columna de
x contra una de y. Todos los grficos estn agrupados
por la variable g.
X y Y son matrices con el mismo nmero de filas. Si x
tiene p columnas y q filas la figura contiene una matriz
p * q de diagramas de dispersin. G es una variable
para agrupar que puede ser vector, una matriz o un
conjunto de celdas variables. G debe tener la misma
cantidad de filas que X y Y.

Tomado de MATLAB \ ESTATISTICS Toolbox\ HELP \ ecdfhist

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
60

ANALISIS ESTADISTICO EN MATLAB

- gplotmatrix(x,y,g,'clr','sym',siz)
Permite especificar el color, el tipo del marcador, y el
tamao para cada grupo. ' clr ' es un
conjunto de
colores reconocidos por la funcin plot.sym ' son una
serie de smbolos reconocidos por el comando plot, con
el smbolo por defecto de '.'. siz es un vector de
tamaos, con el defecto determinado por '
defaultlinemarkersize ' caracterstico. Si no se
especifican las caractersticas deseadas, gscatter
establece los valores necesarios para el entendimiento
de la grfica.
- gplotmatrix(x,y,g,'clr','sym',siz,'doleg')
Permite controlar si una leyenda est exhibida en el
grfico (' doleg '=' on 'el defecto) o no (' doleg '=' off ')
-gplotmatrix(x,y,g,'clr' 'sym',siz,'doleg','dispopt')
Controla que aparezca alo largo de la diagonal del
grfico de la matriz de x versus x permitiendo a los
valores nulos salir en la diagonal en blanco, 'hist'(por
defecto) en la grfica de histogramas, o 'variable' para
graficar los nombres de las variables.
- gplotmatrix(x,y,g,'clr','sym',siz,...
'doleg','dispopt','xnam','ynam')
Especifica los nombres en las columnas en X y Y. Estos
nombres son usados para etiquetar los ejes. 'xnam' y
'ynam ' deben ser celdas contenidas por caracteres,
con una fila para cada columna de X y Y,
respectivamente.

Ejemplo

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
61

ANALISIS ESTADISTICO EN MATLAB


Con los comandos siguientes es posible realizar diagramas
de dispersin de las diferentes categoras que aparecen al
cargar los datos que aparecen en discrim. Los datos se
pueden agrupar por el cdigo del tamao de la ciudad.

load discrim
gplotmatrix(ratings(:, 2:5), ratings(:, 6:), group) %
en este caso lo que hacemos es seleccionar los datos
que deseemos sean graficados de acuerdo a la
informacin contenida en la matriz ratings.

transportation

8000

education

gplotmatrix(ratings(:,2:4),ratings(:,5:8),group,
'rk','.*'
,
[]
,
'on'
,
'',categories(2:4,:)
,categories(5:8,:))
%para
mayor
entendimiento
Colocamos en el grfico marcadores, colores y lo
necesario para dar mas comprensibilidad

3500
3000
2500
2000 x 104

1
2

6000

arts

4000
2000

4
2

recreation

0
4000
2000
0.5

1.5
housing

0
4

x 10

2000 4000 6000 8000500 10001500 20002500


health
crime

El grfico generado por esta funcin genera la posibilidad de combinar


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
62

ANALISIS ESTADISTICO EN MATLAB


diferentes anlisis en un solo grfico, lo que puede ahorrar tiempo y dar
mayor orden las diferentes grficas de dispersin que muestra.

7. PROBABILIDAD

Distribuciones De Probabilidad Discretas


7.1.1.

Distribucin Binomial

Recordemos como la distribucin binomial responde a una muestra de n


eventos independientes, en los cuales solo es posible obtener dos
resultados.

Para este caso la funcin de densidad de probabilidad es:

n x 1 x
y f x n, p p q , x 0,1, ,...n
x
Donde: x = [0 n] ,

p = [0 1] , q = 1- p

n!
n

x x!n x !

Binofit ()

Descripcin

Estimacin del parmetro (x) o intervalos de confianza


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
63

ANALISIS ESTADISTICO EN MATLAB


para datos de tipo binomial. (Solo dos posibilidades)

Sintaxis

p = binofit (a, n)
-

Devuelve la mxima probabilidad estimada para a


suceso en n oportunidades.
a es una vector, entonces se devuelve un p(i) por
cada a(i).
Cuando n tambin es un vector de la misma
dimensin que a se calcula un p(i) para cada a(i)
segn n(i).

[p, nc] = binofit (a, n, alpha)


-

Ejemplo

Devuelve la mxima probabilidad estimada para a


suceso en n oportunidades a un nivel de confianza
de 100(1-alpha)%.
Por defecto el nivel de confianza es 95%, por
ejemplo si queremos un nivel de confianza de
90% el valor de alpha debe ser 0.1.

p = binofit (2,5)

%Probabilidad de 2/5

p = 0.4000

a = [2 4 6 8]

%Probabilidad de a/8

p1 = binofit (a, 8)
p1 = [0.2500

0.5000

a = [2 4 6 8]

0.7500

1.0000]

%Probabilidad de a/n

n = [4 8 12 16]
p1 = binofit (a, n)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
64

ANALISIS ESTADISTICO EN MATLAB


p1 = [0.5000

0.5000

0.5000

0.5000]

Binocdf ()

Descripcin

Funcin binomial de distribucin acumulada.

n
y F x n, p p i q 1i , i 0,1, ,...n
i 0 x
x

Sintaxis

p = binocdf (x, n, p)
-

Ejemplo

Devuelve el valor de la funcin binomial de


distribucin acumulada para estos parmetros.
x, n y p, pueden ser un vector o una matriz, sin
embargo deben tener las dimensiones iguales.

p = binocdf (3, 4 ,0.6)


p = 0.8704

Binopdf ()

Descripcin

Funcin binomial de densidad de probabilidad.

n
y f x n, p p x q 1 x , x 0,1, ,...n
x
Sintaxis

p = binopdf (x, n, p)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
65

ANALISIS ESTADISTICO EN MATLAB


-

Ejemplo

Devuelve el valor de la funcin binomial de


densidad de probabilidad para estos parmetros.
x, n y p, pueden ser un vector o una matriz, sin
embargo deben tener las dimensiones iguales.

p = binopdf (3, 4 ,0.6)


p = 0.3456

Binoinv ()

Descripcin

Funcin binomial de densidad de probabilidad inversa.


(Es la inversa de binocdf)

Sintaxis

x = binoinv (y, n, p)
-

Ejemplo

Devuelve el valor de la funcin binomial inversa


para estos parmetros.
y, n y p, pueden ser un vector o una matriz, sin
embargo deben tener las dimensiones iguales.

p = binopdf (2, 4 ,0.6)


p = 0.3456

x = binoinv (0.3456, 4 ,0.6)


x=2

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
66

ANALISIS ESTADISTICO EN MATLAB


Si la probabilidad de lanzar una moneda y obtener cara
frente a obtener sello es de 50-50, Cual seria un rango
razonable de xitos (cara) en 120 intentos?

Rango = [0.05 0.95]


Intentos = 120
P_Exito = 0.5

%Probabilidad exito

exitos = binoinv(Rango, Intentos, P_Exito)


exitos = [

51

69 ]

Binornd ()

Descripcin

Genera una seria de nmeros aleatorios a partir de una


funcin binomial y unos parmetros definidos.

Sintaxis

x = binornd (n, p)
-

Ejemplo

n y p, pueden ser un vector o una matriz, sin


embargo deben tener las dimensiones iguales

n = [10 20 30]
x = binornd (n ,0.6)
x = [ 8 8 17 ]

%Primera serie obtenida

x = [ 6 11 16

%Segunda serie obtenida

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
67

ANALISIS ESTADISTICO EN MATLAB

Binostat ()

Descripcin

Sintaxis

Calcula la media y la varianza para una seria con


distribucin binomial.

[m , v] = binostat (n, p)
-

Ejemplo

n y p, pueden ser un vector o una matriz, sin


embargo deben tener las dimensiones iguales

[m , v] = binostat (4 , 0.6)
m = 2.4000
v = 0.9600

%Media
%Varianza

Nota

Para una distribucin binomial:

7.1.2.

- La media es:

med = np

- La varianza es:

var = npq , q=1p

Distribucin Poisson

La distribucin Poisson es adecuada para eventos que involucren una


cantidad determinada de casos en un tiempo, distancia o rea
determinada, solo es necesario un parmetro que sea entero nonegativo, y el cual se considera como la media.

Para este caso la funcin de densidad de probabilidad es:


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
68

ANALISIS ESTADISTICO EN MATLAB

y f x

x
x!

e , x 0,1,...

poissfit ()

Descripcin

Estimacin del parmetro (x) o intervalos de confianza


para datos que se acomoden a las condiciones de una
Poisson.
n

1
xi
n i1
Sintaxis

[lambda, linter] = poissfit (x, alpha)


Genera el parmetro lambda ( ) a partir de la
muestra x.
linter, muestra un intervalo con 100(1 - alpha)%
de confianza, sino se especifica este parmetro el
intervalo por defecto es de 95%.

Ejemplo

c = magic(3)
c=[8

2 ]

[d , intervalo ] = poissfit(c)
%Parmetro e intervalo al 90%
d=[5

5]

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
69

ANALISIS ESTADISTICO EN MATLAB


intervalo = [ 2.7985
8.2467

2.7985

2.7985

8.2467

8.2467 ]

a = [1:10 ; 2:2:20]
a = [1
2

2
6

3
8

4
10

12 14

7
16

18

10
20 ]

b = poissfit (a)
b = [1.5 3.0 4.5 6.0 7.5 9.0 10.5 12.0 13.5 15.0]

Poisscdf ()

Descripcin

Funcin de distribucin poisson acumulada.

p F x e

Sintaxis

floor( x )

i 0

i!

p = poisscdf (x, lambda)


-

Calcula el valor de la sumatoria de los valores


Poisson para los respectivos parmetros, donde x
puede ser un vector o una matriz, sin embargo
lambda debe ser positivo.

Ejemplo

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
70

ANALISIS ESTADISTICO EN MATLAB


Supongamos que en cierta rea el nmero X de tornados observados
durante un ao, tiene una distribucin de Poisson con = 8, entonces
cual es la probabilidad de obtener:
a. A lo mucho 5 tornados?
P(X5) entonces a = poisscdf(5 , 8) = 0.1912
b. Entre 6 y 9 tornados?
P(6X9) entonces b

= poisscdf(9 ,8)- poisscdf(6 ,8)


= 0.7166 - 0.3134
= 0.4032

Poisspdf ()

Descripcin

Funcin Poisson de densidad de probabilidad.

y f x

Sintaxis

x
x!

e , x 0,1,...

p = poisspdf (x, lambda)


-

Calcula el valor de densidad Poisson para un


punto respectivo, donde x puede ser un vector o
una matriz, sin embargo lambda debe ser
positivo.

Ejemplo

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
71

ANALISIS ESTADISTICO EN MATLAB


Supongamos que en cierta rea el nmero X de
tornados observados durante un ao, tiene una
distribucin de Poisson con = 8, entonces cual es la
probabilidad de obtener:
a. exactamente 5 tornados ?
P(X=5) entonces a = poisspdf (5 , 8) = 0.0916

Poissinv ()

Descripcin

Funcin Poisson de densidad de probabilidad inversa.


(Es la inversa de poisscdf)

Sintaxis

x = poissinv (p, lambda)


-

Devuelve el valor de la funcin Poisson inversa


mas aproximado para estos parmetros.
p, y lambda, pueden ser un vector o una matriz,
sin embargo deben tener las dimensiones iguales.

Ejemplo

Supongamos que en cierta rea el nmero X de tornados


observados durante un ao, tiene una distribucin de
Poisson con = 8; La afirmacin de es falsa o verdadera :
a. La probabilidad de obtener a lo mas 5 tornados es
0.1912.
P(X5) = 0.1912 ?
X = poissinv (0.1912 , 8) = 5
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
72

ANALISIS ESTADISTICO EN MATLAB


Entonces la afirmacin es verdadera.
b. La probabilidad de obtener a lo mas 9 tornados es 0.812.
P(X9) = 0.812 ?
X = poissinv (0.812 , 8) = 10
La afirmacin es falsa, porque la probabilidad de 0.812 es
de
esperar 10 tornados

Poissrnd ()

Descripcin

Genera una seria de nmeros aleatorios a partir de una


funcin Poisson y unos parmetros definidos.

Sintaxis

x = poissrnd (lambda, n, p)
-

Ejemplo

Genera X con media aproximada a lambda, puede


ser un vector o una matriz segn las dimensiones
del parmetro.
n y p, Sern las dimensiones de x.

x = poissrnd (5 , 6 ,1)
x = [2
7
8
3
5
4]
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
73

ANALISIS ESTADISTICO EN MATLAB


Media = mean (x)
Media = 4.8333

Poisstat ()

Descripcin

Sintaxis

Calcula la media y la varianza para una seria con


distribucin Poisson.

[m , v] = poisstat (lambda)
-

Ejemplo

n y p, pueden ser un vector o una matriz, sin


embargo deben tener las dimensiones iguales

[m , v] = binostat (8)
m = 8.0000
v = 8.0000

%Media
%Varianza

Nota

Para una distribucin Poisson:

7.1.3.

La

- La media es:

med =

- La varianza es:

var =

Distribucin Hipergeometrica

distribucin

hipergeomtrica

es

adecuada

para

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
74

determinar

ANALISIS ESTADISTICO EN MATLAB


probabilidad de que ocurra en un evento en las siguientes condiciones:
la cantidad total de la poblacin (M) y de la cual escogemos una
muestra determinada (n) de donde se conoce un numero determinado
de fracasos y exitos.

Para este caso la funcin de densidad de probabilidad es:

K M K

x n x

y f x M , K , n
M

n
hygecdf ()

Descripcin

Funcin de distribucin hipergeomtrica acumulada.

y f x M , K , n
x

i 0

Sintaxis

K M K

i n i
M

n

h = hygecdf (x,M,n,K)
-

Calcula el valor de la sumatoria de los valores


para la distribucin hipergeomtrica para los
respectivos parmetros, donde x,M,n,k pueden
ser un vector o una matriz.

Ejemplo

Se tienen 100 microchips, y se sabe que 20 de estos estn


daados. Cul es la probabilidad de sacar entre 0 y 3
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
75

ANALISIS ESTADISTICO EN MATLAB


microchips daados de una
microchips que escogemos?

muestra

aleatoria

de

10

p = hygecdf(3,100,20,10)
p = 0.8904

Hygepdf ()

Descripcin

Funcin hipergeomtrica de densidad de probabilidad.

K M K

x n x

y f x M , K , n
M

n
Sintaxis

p = hygepdf (x,M,n,K)
-

Calcula el valor para la distribucin


hipergeomtrica para los respectivos parmetros,
donde x,M,n,k pueden ser un vector o una matriz.
Donde M,n,k deben ser enteros positivos.

Ejemplo

Se tienen 100 microchips, y se sabe que 20 de estos estn


daados. Cul es la probabilidad de sacar entre 0 y 5
microchips respectivamente daados de una muestra
aleatoria de 10 microchips que escogemos?

p2 = hygepdf(0:3,100,20,10)
p2 = [

0.0951

0.2679

0.3182

0.2092 ]

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
76

ANALISIS ESTADISTICO EN MATLAB


suma = sum(p2)
suma =

0.8904

% Como se ve la suma de las probabilidades individuales


corresponde a la probabilidad acumulad calculada en el
ejemplo anterior (p = 0.8904)

Hygeinv ()

Descripcin

Funcin Hipergeomtrica de densidad


inversa.
(Es la inversa de hygecdf)

Sintaxis

X = hygeinv (P,M,K,N)

de

probabilidad

- Devuelve el valor de la funcin Hipergeomtrica


inversa mas aproximado para estos parmetros.
- p puede ser observada como la probabilidad al
evaluar la funcin hipergeomtrica con los
parmetros x, m, k, n.

Ejemplo

Se tienen 100 microchips, y se sabe que 20 de estos estn


daados. Obtengo una muestra aleatoria de 10 microchips
de los cuales se desea saber cual es el nmero mximo de
microchips daados cuando se aceptan el 90% de error?
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
77

ANALISIS ESTADISTICO EN MATLAB

y = hygeinv(0.9,100,20,10)
y=4

Si embargo si retomamos el primer ejemplo de esta seccin


obtendremos que:

p = hygecdf(3,100,20,10)
p = 0.8904

x = hygeinv(p,100,20,10) = hygeinv(0.8904,100,20,10)
x=3

Hygernd ()

Descripcin

Genera una seria de nmeros aleatorios a partir de una


funcin hipergeomtrica y unos parmetros definidos.

Sintaxis

x = hygernd (M,K,N, f,c)


-

Genera valores que se aproximen a una


distribucin hipergeomtrica con parmetros M, K
y N, pueden ser un vector o una matriz sin
embargo de las misma dimensiones.
Los parmetros f y c son opcionales y permiten
generan un matriz aleatoria de dimensiones (ffilas, c - columnas) con las especificaciones
previas.

x = hygernd (M,K,N,v)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
78

ANALISIS ESTADISTICO EN MATLAB


-

Ejemplo

Genera valores aleatorios en una matriz con


dimensiones v x v.

x = hygernd(1000,40,50)
x=2

x = hygernd(1000,40,50,2,3)
X=[3

2
3]

hygestat ()

Descripcin

Sintaxis

Calcula la media y la varianza para una seria con


distribucin Hipergeometrica.

[m , v] = hygestat (M,K,N)
-

Ejemplo

M, K y N, pueden ser un vector o una matriz, sin


embargo deben tener las dimensiones iguales, y
determinan los parmetros de la distribucin que
se usa.

[m , v] = hygestat (8)
[m,v] = hygestat(10,1,9)
m = [ 0.9000 ]

%Media

v = [ 0.0900 ]

%Varianza

[m,v] = hygestat(10,3,9)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
79

ANALISIS ESTADISTICO EN MATLAB


m = [ 2.7000 ]

%Media

v = [ 0.2100 ]

%Varianza

Nota

Para una distribucin Hipergeometrica: - La media es:

med =

NK
M

K M K M N
var = N

M M M 1

- La varianza es:

Distribuciones De Probabilidad Continuas

7.1.4.

Distribucin Normal

La distribucin Gaussiana o comnmente conocida como Normal por que


la mayora de las variables continas se ajustan a este tipo de
distribucin, esta en funcin de dos parmetros: la media y la
desviacin estndar.

X ~ N , 2

La funcin de densidad de probabilidad para la normal es:

y f x ,

1
e
2

x 2
2 2

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
80

ANALISIS ESTADISTICO EN MATLAB


La distribucin normal estndar tiene una media

( 0) y la desviacin estndar. ( 1)

normcdf ()

Descripcin

Funcin de distribucin normal acumulada.


t 2

1
y f x ,
2
Sintaxis

2 2

dt

p = normcdf (x,mu,sigma)
-

Calcula el valor de la integral para la distribucin


normal con los respectivos parmetros, donde
x,mu,sigma pueden ser un vector o una matriz.
sigma debe ser positivo.

[p, plo, pup] = normcdf (x,mu,sigma,pcov, alpha)


-

Calcula el valor de un intervalo de confianza con


los parmetros estimados, donde pcov es la
covarianza estimada, y alpha especifica la
confianza 100(1-alpha)%.
Plo (PLow) Especifica el limite inferior.
Pup (PUp) Especifica el limite superior.

Ejemplo

La funcin normcdf puede ser usada de la misma


manera que una tabla de distribucin normal estndar
en la cual especificamos la media y la desviacin
estndar como:
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
81

ANALISIS ESTADISTICO EN MATLAB

1.

mu = 0; sigma=1;
X = normcdf(0, mu, sigma)
X = 0.5000
Y = normcdf(-1, mu, sigma)
Y = 0.1587
Z = normcdf(1, mu, sigma)
Z = 0.8413

Podemos generar una completa tabla de la distribucin


normal estndar usando el siguiente cdigo:

mu = 0; sigma=1;z=(-3:0.1:3);
X = normcdf(z, mu, sigma);
Tabla = [z ; X]

Normpdf ()

Descripcin

Funcin normal de densidad de probabilidad.

y f x ,

Sintaxis

1
e
2

x 2
2 2

p = normpdf (x,mu,sigma)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
82

ANALISIS ESTADISTICO EN MATLAB


-

Calcula el valor de la funcin para la distribucin


normal con los respectivos parmetros, donde
x,mu,sigma pueden ser un vector o una matriz.
sigma debe ser positivo.

Ejemplo

a = [-3:0.01:3];
p = normpdf(a,0,1);

% Funcin para una normal estndar

plot(a ,p)

% Grafica la probabilidad para cada


punto de la funcin normal estndar

0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-3

-2

-1

norminv ()

Descripcin

Funcin Normal de densidad de probabilidad inversa. (Es


inversa de normcdf)

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
83

la

ANALISIS ESTADISTICO EN MATLAB


Sintaxis

X = norminv(P, mu, sigma)


- Devuelve el valor de la funcin Normal inversa mas
aproximado para estos parmetros.
- P es interpretada como la probabilidad al evaluar
la funcin normal con los parmetros mu y sigma
(debe ser positivo).
- Como P es una probabilidad debe estar dentro del
intervalo [0 1].

Ejemplo

Encuentre un intervalo que contenga el 95% de los valores


de una distribucin normal estndar.

x = norminv([0.025 0.975],0,1)

% Intervalo para 95%

x=[

% Mas Compacto y
simtrico.

-1.9600

1.9600 ]

Ntese que el intervalo anterior no es el nico que contiene


el 95% de los elementos de una distribucin de este tipo,
por ejemplo:

xx = norminv([0.01 0.96],0,1)
xx = [

-2.3263

% Intervalo para 95%

1.7507 ]

Este intervalo tambin contiene el 95% de los datos de una


distribucin normal estndar sin embargo no es tan
compacto.

A partir de la informacin anterior, los intervalos para 90% y


99% serian:
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
84

ANALISIS ESTADISTICO EN MATLAB

X1 = norminv([0.05 0.95],0,1)
X1 = [ -1.6449

1.6449 ]

X2 = norminv([0.005 0.995],0,1)
X2 = [ -2.5758

% Intervalo para 90%

% Intervalo para 99%

2.5758 ]

Normrnd ()

Descripcin

Genera una seria de nmeros aleatorios a partir de una


funcin normal y unos parmetros definidos.

Sintaxis

x = normrnd (mu, sigma , f, c)


-

Genera valores que se aproximen a una


distribucin normal con parmetros mu y sigma,
pueden ser un vector o una matriz sin embargo
de las misma dimensiones.
Los parmetros f y c son opcionales y permiten
generan un matriz aleatoria de dimensiones (ffilas, c - columnas) con las especificaciones
previas.

x = normrnd (mu, sigma,v)


-

Ejemplo

Genera valores aleatorios en una matriz con


dimensiones v x v.

x = normrnd(0,1,3)
% Con una distribucin normal estndar
x = [ 0.1326

-1.5804

-1.0246

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
85

ANALISIS ESTADISTICO EN MATLAB


1.5929

-0.0787

1.0184

-0.6817

-1.2344
0.2888 ]

x = normrnd(0,1,2,5)
% Con una distribucin normal estndar
x = [ 1.0378
-0.3898

-1.3813

0.3155

1.5532

0.7079

1.9574

0.5045

1.8645

-0.3398 ]

x = normrnd(5,0.5,1,5)
% Con una distribucin normal de media igual a 5 y
desviacin estndar igual a 0.5
x = [ 4.7535

5.2310

4.8395

5.6183

4.6844 ]

Normstat ()

Descripcin

Sintaxis

Calcula la media y la varianza para una seria con


distribucin Normal.

[m , v] = normstat (mu, sigma)


-

Mu y sigma, pueden ser un vector o una matriz,


sin embargo deben tener las dimensiones iguales,
y determinan los parmetro de la distribucin que
se usa.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
86

ANALISIS ESTADISTICO EN MATLAB


[m , v] = normstat (0,1)

Ejemplo

m=[0]
v=[1]

n = 1:3

m= [ 1 2 ; 3 4]

n = [1 2 3]

m=[1

4 ]

[m,v] = normstat(n , n)
m= [1
v= [1

2
4

3 ]

[m,v] = normstat(m, m)

9 ]

m=[1

v=[1
9

4]

4
16 ]

Nota

Para una distribucin Normal:

- La media es:

med =

- La varianza es:

var = 2

Normfit ()

Descripcin

Devuelve una estimacin de los parmetros e intervalos de


confianza para una muestra con distribucin normal.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
87

ANALISIS ESTADISTICO EN MATLAB


Sintaxis

[mu , sigma] = normfit (muestra)


-

Retorna la estimacin de la media ( ) y la


desviacin estndar ( ) para muestra, la cual
puede es una matriz.

[mu,sigma,muint,sigmaint] = normfit(muestra, alpha)


-

Retorna la estimacin de la media ( ) y la


desviacin estndar ( ) para muestra, la cual
puede es una matriz. Adems de generar
intervalos a un nivel de confianza alpha para cada
parmetro.
muint y sigmaint, son matrices en las cuales la
primera fila corresponde al intervalo del limite
inferior y la segunda fila corresponde a un
intervalo para el limite superior de la estimacin
del parmetro respectivo.
Si no se incluye el argumento alpha en la funcin
se toma el nivel alpha por defecto que es 0.05, es
decir un nivel de confianza de 95%. Pero si lo
incluimos alpha, el nivel de confianza ser 100(1 alpha) %.

Ejemplo

En este ejemplo tenemos una muestra aleatoria con 10


elementos, con media ()= 15 y desviacin estndar ( )
= 2.
muestra = normrnd(15,2,10,1)
muestra =

15.9710
14.9900
14.4476

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
88

ANALISIS ESTADISTICO EN MATLAB


17.5529
18.7268
13.9549
15.2068
13.3847
16.3609
10.2708

[mu,sigma,muint,sigmaint] = normfit(muestra)

mu =

15.0866

sigma =

2.3462

muint =

13.4083
16.7650

sigmaint = 1.6138
4.2832

En este caso los valores mu y sigma corresponden a la


media y la desviacin estndar de la muestra, sin embargo
ntese que los valores reales se encuentran dentro de los
intervalo respectivos.

Normplot()

Descripcin

Genera un grafico de distribucin normal para una prueba


grafica.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
89

ANALISIS ESTADISTICO EN MATLAB

Sintaxis

normplot (muestra)
-

Devuelve el grafico de la muestra ubicando cada


elemento como +, junto con una lnea que
representa el primer y el tercer cuartil, til para
identificar la linealidad de la muestra.
Entre mas normal se comporte la muestra mas
lineal debe ser, sobreponindose sobre la lnea de
referencia.

Ejemplo

muestra = normrnd(0,1,10,2)
muestra =

0.8115

-0.6547

0.6363

-1.0807

1.3101

-0.0477

0.3271

0.3793

-0.6730

-0.3304

-0.1493

-0.4999

-2.4490

-0.0360

0.4733

-0.1748

0.1169

-0.9573

-0.5911

1.2925

normplot(muestra)

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
90

ANALISIS ESTADISTICO EN MATLAB


Normal Probability Plot

0.95

0.90

Probability

0.75

0.50

0.25

0.10

0.05

-2.5

-2

-1.5

-1

-0.5
Data

0.5

x = normrnd(0,1,50,1);
Normal Probability Plot
0.99
0.98
0.95
0.90

Probability

0.75

0.50

0.25

0.10
0.05
0.02
0.01
-2

-1.5

-1

-0.5

0.5

1.5

Data

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
91

ANALISIS ESTADISTICO EN MATLAB

normspec()

Descripcin

Sintaxis

Genera un grafico de densidad para una distribucin normal.

p = normspec (limites, mu, sigma)


-

Devuelve el grafico junto con la probabilidad p,


correspondiente al rea de inters, es decir, la
ubicada dentro de los limites definidos en el
vector que lleva el mismo nombre.
Dentro del vector limites al menos uno de los
valores debe ser real, no se acepta que el
intervalo vaya desde infinito a infinito.
Error: limites = [-Inf Inf]

Mu y sigma, corresponden a los parmetros


propios de cada muestra.

Ejemplo

Tenemos una distribucin normal estndar,


deseamos saber cuanta probabilidad existe:
a. antes de 0.5
a = normspec([-Inf 0.5],0,1)
a = 0.6915

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
92

ANALISIS ESTADISTICO EN MATLAB


Probability Less than Upper Bound is 0.69146
0.4

0.35

0.3

Density

0.25

0.2

0.15

0.1

0.05

0
-4

-3

-2

-1

0
Critical Value

a. despus de - 0.3
b = normspec([-0.3 Inf],0,1)
b= 0.6179

Probability Greater than Lower Bound is 0.61791


0.4

0.35

0.3

Density

0.25

0.2

0.15

0.1

0.05

0
-4

-3

-2

-1

0
Critical Value

b. entre - 0.3 y 0.5


c = normspec([-0.3 0.5],0,1)
c = 0.3094

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
93

ANALISIS ESTADISTICO EN MATLAB


Probability Between Limits is 0.30937
0.4
0.35
0.3

Density

0.25
0.2
0.15
0.1
0.05
0
-4

-3

-2

-1

0
Critical Value

Suponga que un productor de cereal desea saber: cual es


el porcentaje de cajas de cereal con ms de 10 onzas ?.
Suponemos que el contenido de las cajas tiene una
distribucin normal con media en 11.5 onzas y una
desviacin estndar de 1.25 onzas.

P = normspec([10 Inf],11.5,1.25)
P = 0.89849

Probability Greater than Lower Bound is 0.88493


0.35

0.3

0.25

Density

0.2

0.15

0.1

0.05

10

11
12
Critical Value

13

14

15

16

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
94

ANALISIS ESTADISTICO EN MATLAB

7.1.5.

Distribucin Exponencial

La distribucin Exponencial es un caso especfico de la distribucin


gamma (con a=1), y es la siguiente:
x

1
1
y f x a, b a
x a 1e b e b
b ( a )
b
Donde

es la funcin Gamma.

La distribucin exponencial es especial para modelar


recurrentes durante un intervalo de tiempo determinado.

La distribucin exponencial acumulada es:

y f x

e , donde es la media observada.

Expcdf ()

Descripcin

Funcin de distribucin exponencial acumulada.


t
x

y F x
0

e dt 1 e

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
95

eventos

ANALISIS ESTADISTICO EN MATLAB

Sintaxis

p = expcdf (x,mu)
-

Calcula el valor de la integral para la distribucin


exponencial con los respectivos parmetros,
donde x,mu pueden ser un vector o una matriz.
mu debe ser positivo.
P ser el resultado correspondiente a una
probabilidad de que una observacin de una
distribucin exponencial se ubicara dentro del
intervalo [0 x].

[p, plo, pup] = normcdf (x,mu,sigma,pcov, alpha)


-

Calcula el valor de un intervalo de confianza con


los parmetros estimados, donde pcov es la
varianza del estimado mu, y alpha especifica la
confianza 100(1-alpha)%.
Plo (PLow) Especifica el limite inferior.
Pup (PUp) Especifica el limite superior.

Ejemplo

En una lnea de atencin al cliente el tiempo de espera(X) entre


la llamada y la atencin de la misma tiene una distribucin
exponencial con un tiempo esperado de 5 segundos. Cual es
la probabilidad de que el tiempo de espera:
a. sea a lo sumo 10 segundos?
P(X10)

p = expcdf(10,5)

p = 0.8647
b. sea Mayor de 10 segundos?
P(X>10) = 1 - P(X10)

p = 1 expcdf(10,5)

p = 0.1353
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
96

ANALISIS ESTADISTICO EN MATLAB


c. Se encuentre entre 5 y 10 segundos?
P(5>X>10) = P(X10) - P(X5)
P= expcdf(10,5) - expcdf(5,5)
p = 0.8647 - 0.6321
p = 0.2325

Exppdf ()

Descripcin

Funcin exponencial de densidad de probabilidad.

y f x
Sintaxis

p = exppdf (x,mu)
-

Calcula el valor de la funcin para la distribucin


normal con los respectivos parmetros, donde
x,mu pueden ser un vector o una matriz. mu debe
ser positivo.

Ejemplo

Retomando el ejemplo anterior tenemos que:


En una lnea de atencin al cliente el tiempo de espera(X)
entre la llamada y la atencin de la misma tiene una
distribucin exponencial con un tiempo esperado de 5
segundos. Cual es la probabilidad de que el tiempo de
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
97

ANALISIS ESTADISTICO EN MATLAB


espera:
a. sea 10 segundos?
P(X=10) p = exppdf (10,5) = 0.0271
b. sea 5 segundos?
P(X=5) p = exppdf(5,5) = 0.0736
c. sea 3 segundos?
P(X=3) p = exppdf(3,5) = 0.1098

Si deseamos ver la grafica completa de nuestra distribucin


exponencial tenemos que:
a = [0:0.01:30];
y = exppdf(a,5);
plot (a,y)

Y se generar una grafica como la siguiente:


0.2
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0

10

15

20

25

30

Expinv ()
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
98

ANALISIS ESTADISTICO EN MATLAB

Descripcin

Funcin Exponencial de densidad de probabilidad inversa.


(Es la inversa de expcdf)

Sintaxis

X = expinv(P, mu)
- Devuelve el valor de la funcin Exponencial inversa
mas aproximado para estos parmetros.
- Como P es una probabilidad debe estar dentro del
intervalo [0 1]. mu debe ser positivo.

Ejemplo

Retomando, en una lnea de atencin al cliente el tiempo de


espera(X) entre la llamada y la atencin de la misma tiene
una distribucin exponencial con un tiempo esperado de 5
segundos.
Con una probabilidad P, a cuantas llamadas se aproxima?
a. P = 0.9
X = expinv(0.9, 5) =

11.5129

b. P = 0.8
X = expinv(0.8, 5) =

8.0472

c. P = 0.5
X = expinv(0.5, 5) =

3.4657

d. P = 0.8647
%Como en el ejemplo anterior vimos que esta era la
probabilidad para a lo sumo recibir 10 llamadas.
X = expinv(0.8647, 5) =

10.0013

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
99

ANALISIS ESTADISTICO EN MATLAB

exprnd ()

Descripcin

Genera una seria de nmeros aleatorios a partir de una


distribucin exponencial y unos parmetros definidos.

Sintaxis

x = exprnd (mu, f, c)
-

Genera valores que se aproximen a una


distribucin exponencial con parmetros mu
Los parmetros f y c son opcionales y permiten
generan un matriz aleatoria de dimensiones (ffilas, c - columnas) con las especificaciones
previas.

x = normrnd (mu, v)
-

Genera valores aleatorios en una matriz con


dimensiones v x v.

Ejemplo

x = exprnd(2.5,1,5) % Muestra aleatoria de 1 fila y 5


columnas a partir de distribucin exponencial de
= 2.5
x = 2.0259

1.2136

0.5832

0.2035

0.7588

x = exprnd(3,3) % Muestra aleatoria de 3x3 a partir de


distribucin exponencial de = 3
x=

[0.3373
8.5476

0.6205

4.7871

13.8574

4.8475

3.1250 5.9222 1.5136 ]


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
100

ANALISIS ESTADISTICO EN MATLAB

Expstat ()

Descripcin

Sintaxis

Calcula la media y la varianza para una serie con


distribucin Exponencial.

[m , v] = expstat (mu)

- Mu, puede ser un vector o una matriz, sin


embargo debe ser positivo.

Ejemplo

[m , v] = expstat ([1:5])
m=[1 2 3
v=[1 4 9

5 ]

16 25 ]

Nota

Para una distribucin Exponencial:

- La media es:

med =

- La varianza es:

var = 2

expfit ()

Descripcin

Devuelve una estimacin de los parmetros e intervalos de


confianza para una muestra con distribucin exponencial.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
101

ANALISIS ESTADISTICO EN MATLAB

Sintaxis

[mu] = normfit (muestra)


-

Retorna la estimacin del parmetro ( -media


valor esperado) para muestra, la cual puede es
una matriz.

[mu,muint] = normfit(muestra, alpha)


-

Retorna la estimacin de la media ( ) para


muestra, la cual puede es una matriz. Adems de
generar intervalos a un nivel de confianza alpha
para cada parmetro.
muint, es un vector en el cual la primera fila
corresponde al limite inferior y la segunda fila
corresponde al limite superior de un intervalo de
estimacin del parmetro respectivo.
Si no se incluye el argumento alpha en la funcin
se toma el nivel alpha por defecto que es 0.05, es
decir un nivel de confianza de 95%. Pero si lo
incluimos alpha, el nivel de confianza ser 100(1 alpha) %.

Ejemplo

En este ejemplo tenemos una muestra aleatoria con 10


elementos, con media ()= 5.
muestra = exprnd(5,10,1)
muestra = 2.4272
1.1664
0.4071
1.5177
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
102

ANALISIS ESTADISTICO EN MATLAB


8.6788
4.5106
0.3335
0.4338
4.4547
0.5622

[mu,muint] = expfit(muestra)

mu = 2.4492
muint =

1.4335
5.1074

En este caso el valor mu y corresponde a la media de la


muestra, sin embargo, aunque dista mucho del parmetro
original este se encuentre en el intervalo.

7.1.6.

Distribucin Gamma

La distribucin Gamma es una familia de curvas que dependen de dos


parmetros, a partir de esta obtenemos otras distribuciones como la
exponencial o la Chi-cuadrado. La funcin de densidad gamma esta
definida como:
x

1
y f x a, b a
x a 1e b
b ( a )

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
103

ANALISIS ESTADISTICO EN MATLAB


Donde

es la funcin Gamma.

gamcdf ()

Descripcin

Funcin de distribucin gamma acumulada.

p f x a, b

Sintaxis

t
b

1
a 1
t
e dt
a

b ( a ) 0

p = gamcdf (x,a,b)
-

Calcula el valor de la integral para la distribucin


normal con los respectivos parmetros, donde
x,a,b pueden ser un vector o una matriz. a y b
deben ser positivos.

Ejemplo

P1 = gamcdf(10,1,5)= 0.8647 %Como vemos la gamma con


a = 1,
P2 = expcdf(10,5)= 0.8647

es la exponencial.

Suponga que el tiempo de supervivencia en minutos de un


ratn de laboratorio, que ha ingerido cierta clase de veneno
tiene una distribucin gamma con a = 5 y b = 7. Cual es la
probabilidad de que el ratn sobreviva:

a. menos de 30 minutos?
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
104

ANALISIS ESTADISTICO EN MATLAB


P(X30) P = gamcdf(30,5,7) = 0.4268
b. mas de 60 minutos?
P(X>60) = 1 P(X60) P = 1 - gamcdf(60,5,7) = 1
- 0.9287
= 0.0713
c. entre 30 y 60 minutos?
P(30<X<60) = P(X60) - P(X30)
P = gamcdf(60,5,7) - gamcdf(30,5,7)= 0.9287 0.4268
= 0.5019

gampdf ()

Descripcin

Funcin gamma de densidad de probabilidad.


x

1
y f x a, b a
x a 1e b
b ( a )
Sintaxis

p = gampdf (x,a,b)
-

Calcula el valor para la distribucin gamma con


los respectivos parmetros, donde x,a,b pueden
ser un vector o una matriz.
a y b deben ser positivos, mientras x debe estar
en el intervalo [0 ].

Ejemplo

Vamos a graficar la funcin completa para cada punto del


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
105

ANALISIS ESTADISTICO EN MATLAB


ejemplo anterior.
Suponga que el tiempo de supervivencia en minutos de un
ratn de laboratorio, que ha ingerido cierta clase de veneno
tiene una distribucin gamma con a = 5 y b = 7.

X =[0:0.1:100];
P = gampdf(X,5,7);
plot(X,P)
0.03

0.025

0.02

0.015

0.01

0.005

10

20

30

40

50

60

70

80

90

100

gaminv ()

Descripcin

Funcin Gamma de densidad de probabilidad inversa. (Es


inversa de gamcdf)

Sintaxis

X = gaminv(P, mu, sigma)


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
106

la

ANALISIS ESTADISTICO EN MATLAB


- Devuelve el valor de la funcin Gamma inversa mas
aproximado para estos parmetros.
- P es interpretada como la probabilidad al evaluar
la funcin gamma con los parmetros a y b
(deben ser positivo).
- Como P es una probabilidad debe estar dentro del
intervalo [0 1].

Ejemplo

Suponga que el tiempo de supervivencia en minutos de un


ratn de laboratorio, que ha ingerido cierta clase de veneno
tiene una distribucin gamma con a = 5 y b = 7.Con una
probabilidad de P cuantos minutos aproximadamente pueden
sobrevivir:
a. P = 0.3?
X = gaminv(0.3,5,7) = 25.4353
b. P = 0.5?
X = gaminv(0.5,5,7) = 32.6964
c. P = 0.9?
X = gaminv(0.9,5,7) = 55.9551
d. P = 0.4268?
%Comprobamos la respuesta obtenida en el ejemplo de
gamcdf.
X = gaminv(0.4268,5,7) = 30

gamrnd ()
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
107

ANALISIS ESTADISTICO EN MATLAB

Descripcin

Genera una seria de nmeros aleatorios a partir de una


funcin gamma y unos parmetros definidos.

Sintaxis

x = gamrnd (a, b , f, c)
-

Genera valores que se aproximen a una


distribucin gamma con parmetros a y b, pueden
ser un vector o una matriz sin embargo de las
misma dimensiones.
Los parmetros f y c son opcionales y permiten
generan un matriz aleatoria de dimensiones (ffilas, c - columnas) con las especificaciones
previas.

x = gamrnd (a, b ,v)


-

Ejemplo

Genera valores aleatorios en una matriz con


dimensiones v x v.

x = gamrnd(5,7,3)
% Genera una matriz de 3x3 con a=5 y b=7.
x = [26.5524

37.2128

54.1503

13.3987

18.2161

32.1009

34.5988

54.1874

37.8700]

x = gamrnd(3,2,2,4)
% Genera una matriz de 2x4 con a=3 y b=2.
x = [ 5.0270
3.0506

6.3538
2.0514

8.0230

12.5873

3.3780
8.6550]

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
108

ANALISIS ESTADISTICO EN MATLAB

Gamstat ()

Descripcin

Calcula la media y la varianza para una seria con


distribucin gamma.

[m , v] = gamstat (a,b)

Sintaxis

Ejemplo

a y b, pueden ser un vector o una matriz y


determinan los parmetros de la distribucin que
se usa.

[m , v] = gamstat (3, 2)
m=[6]
v = [ 12 ]

[m,v]= gamstat([3 5 8 9],2)


m=[6

10

16

18 ]

v = [ 12

20

32

36 ]

Nota

Para una distribucin Gamma: - La media es:


- La varianza es:

med = ab
var = ab2

Gamfit ()
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
109

ANALISIS ESTADISTICO EN MATLAB

Descripcin

Sintaxis

Devuelve una estimacin de los parmetros e intervalos de


confianza para una muestra con distribucin gamma.

[parmetros] = gamfit (muestra)


-

Retorna la estimacin de los parmetros(a y b)


para esta distribucin segn muestra, la cual
puede es una matriz.

[parmetros, intervalos] = gamfit(muestra, alpha)


-

Retorna la estimacin de la media ( ) y la


desviacin estndar ( ) para muestra, la cual
puede es una matriz. Adems de generar
intervalos a un nivel de confianza alpha para cada
parmetro.
intervalos, es una matriz en las cuales la primera
fila corresponde al limite inferior y la segunda fila
corresponde a al limite superior de la estimacin
del parmetro respectivo.
Si no se incluye el argumento alpha en la funcin
se toma el nivel alpha por defecto que es 0.05, es
decir un nivel de confianza de 95%. Pero si lo
incluimos alpha, el nivel de confianza ser 100(1 alpha) %.

Ejemplo

En este ejemplo tenemos una muestra aleatoria con 10


elementos, con a = 3 y b = 5.

muestra = gamrnd(3,5,10,1)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
110

ANALISIS ESTADISTICO EN MATLAB


muestra =

6.4338
28.5470
7.7809
18.1332
15.2054
7.1337
2.3030
12.8559
6.6668
19.0060

[parmetros, intervalos] = gamfit(muestra)


parmetros = [ 2.5314
intervalos = [ 1.1090
5.7782

4.9010 ]
1.9676

12.2078 ]

En este caso los valores a y b corresponden a una estimacin a


partir de la muestra, sin embargo ntese que los valores reales se
encuentran dentro de los intervalo respectivos.

7.1.7.

Distribucin Chi-Cuadrado

La distribucin Chi-Cuadrado es un caso especfico de la distribucin


gamma (con b=2), y es la siguiente:
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
111

ANALISIS ESTADISTICO EN MATLAB

1
1
y f x a, b a
x a 1e b a
x a 1e 2
b ( a )
2 ( a )
Donde

es la funcin Gamma y se incluye v que representa los

grados de libertad. a 2 .Entonces tenemos que la distribucin ChiCuadrado acumulada es:


v

v 2

x 2 e x2
y f x v v
2 2 ( v 2 )
chi2cdf ()

Descripcin

Funcin de distribucin Chi-Cuadrado acumulada.

v2

t 2 e t 2
y F x v v
dt
2
v
0 2 ( 2 )
Sintaxis

p = chi2cdf (x,v)
-

Calcula el valor de la integral para la distribucin


Chi-cuadrado con los respectivos parmetros,
donde x,v pueden ser un vector o una matriz. v
son los grados de libertad y junto con x deben ser
positivo.
P ser el resultado correspondiente a una
probabilidad de que una observacin de una

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
112

ANALISIS ESTADISTICO EN MATLAB


distribucin exponencial se ubicara dentro del
intervalo [0 x].
Ejemplo

P1 = chi2cdf (10,8)
0.7350

%Como vemos la distribucin Chi se P1 =


comporta de la misma manera que

P2 = gamcdf (10,4,2)
0.7350

una gamma con parmetros a=v/2 es


decir 4 y b=2.

p2 =

chi2pdf ()

Descripcin

Funcin Chi-cuadrado de densidad de probabilidad.


v 2

x 2 e x2
y f x v v
2 2 ( v 2 )
Sintaxis

p = exppdf (x,v)
-

Calcula el valor de la funcin para la distribucin


normal con los respectivos parmetros, donde
x,mu pueden ser un vector o una matriz. v son los
grados de libertad y junto con x deben ser
positivo.

Ejemplo

x = (0:0.1:50);

%Parmetros

v1 = 4; v2 = 8; v3 = 16;v4 = 32; %Grados de libertad


p1 = chi2pdf(x,v1);

%Primera Funcin Color AZUL

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
113

ANALISIS ESTADISTICO EN MATLAB


p2 = chi2pdf(x,v2);

%Segunda Funcin Color VERDE

p3 = chi2pdf(x,v3);

%Tercera Funcin Color ROJA

p4 = chi2pdf(x,v4);

%Cuarta Funcin Color CYAN

plot(x,p1, x,p2, x,p3,x,p4)

0.2

0.18

0.16

0.14

0.12

0.1

0.08

0.06

0.04

0.02

10

15

20

25

30

35

40

45

50

chi2inv ()

Descripcin

Funcin chi-cuadrado de densidad de probabilidad inversa.


(Es la inversa de chi2cdf)

Sintaxis

X = chi2inv(P, v)
- Devuelve el valor de la funcin chi-cuadrado
inversa mas aproximado para estos parmetros.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
114

ANALISIS ESTADISTICO EN MATLAB


-

Como P es una probabilidad debe estar dentro del


intervalo [0 1]. v debe ser positivo.

Ejemplo

Con esta funcin podemos comprobar el resultado obtenido en el


ejemplo de chi2cdf. ( P1 = chi2cdf (10,8)=0.7350 ) Entonces:

X1=chi2inv(0.735,8)
X1=10.0004

Supongamos que tenemos una muestra con distribucin Chi-cuadrado


y 5 grados de libertad. Qu valor excedera al 90% de la muestra?

x = chi2inv(0.95,5)
x = 11.0705

Entonces solo se observaran


oportunidad del 5%.

valores

mayores

de

11

con

chi2rnd ()

Descripcin

Genera una seria de nmeros aleatorios a partir de una


distribucin Chi-cuadrado y unos parmetros definidos.

Sintaxis

x = chi2rnd (v, f, c)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
115

una

ANALISIS ESTADISTICO EN MATLAB


-

Genera valores que se aproximen a una


distribucin exponencial con parmetro v.
Los parmetros f y c son opcionales y permiten
generan un matriz aleatoria de dimensiones (ffilas, c - columnas) con las especificaciones
previas.

x = normrnd (mu, v)
-

Genera valores aleatorios en una matriz con


dimensiones v x v.

Ejemplo

x = chi2rnd(10,4,2) % Muestra aleatoria de 4 fila y 2


columnas a partir de distribucin Chicuadrado de v = 10
x=[

10.1084

22.3001

8.5497

8.7564

12.8334

9.8343

7.0153

14.7426 ]

x = chi2rnd(10,3) % Muestra aleatoria de 3x3 a partir de distribucin


Chi-cuadrado de v = 10

x = [ 7.5864

10.6322

3.8282

5.2046

9.8854

15.4715
9.1717

15.4821

10.8200

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
116

ANALISIS ESTADISTICO EN MATLAB

chi2stat ()

Descripcin

Sintaxis

Calcula la media y la varianza para una serie con


distribucin Chi-cuadrado.

[m , v] = chi2stat (V)

- v, puede ser un vector o una matriz, sin embargo


debe ser positivo.

Ejemplo

[m,v] = chi2stat([1:5])

m=[1 2 3 4 5]
v = [ 2 4 6 8 10]

Nota

Para una distribucin Chi-cuadrado:

7.1.8.

- La media es:

med = v

- La varianza es:

var = 2v

Distribucin Beta

La distribucin Beta es una familia de curvas que se encuentran dentro


del intervalo (0 1], esta funcin de densidad beta esta definida como:
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
117

ANALISIS ESTADISTICO EN MATLAB

y f x a, b

1
b 1
x a 1 1 x I 0,1 x
B ( a , b)

I ( 0,1) x significa que el valor de x se ubicara dentro del intervalo (0 1).


Donde

B.

es la funcin Beta.

Ba, b t a 1 1 t dt
b 1

Donde

a b
a b

es la funcin Gamma.

betacdf ()

Descripcin

Funcin de distribucin beta acumulada.


x

1
b 1
a 1

y f x a, b
t
1

t
dt

B ( a , b) 0
Sintaxis

p = betacdf (x,a,b)
-

Calcula el valor de la integral para la distribucin


normal con los respectivos parmetros, donde
x,a,b pueden ser un vector o una matriz. a y b
deben ser positivos, mientras x debe estar en el
intervalo [0 1].

Ejemplo

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
118

ANALISIS ESTADISTICO EN MATLAB

x = [0:0.1:1];
p=betacdf(x,5,4)

0
0.0004
0.0104
0.0580
0.9437 0.9950 1.0000

0.1737

0.3633

0.5941 0.8059

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
119

ANALISIS ESTADISTICO EN MATLAB

ANEXO 1
INNOVACIONES DE MATLAB 7

MATLAB es un software muy utilizado en diferentes reas en las que


resulta aplicable el lenguaje matemtico, debido a este importante
factor y a que es necesario innovar y mejorar las condiciones de trabajo,
el software ha tenido una serie de modificaciones que permiten trabajar
en un escenario que se adecua a las necesidades para este tipo de
programas. Teniendo en cuenta lo anterior es de vital importancia tener
conocimiento de estas nuevas caractersticas; para ello hemos tomado
algunas de ellas con el objetivo que los usuarios del presente informe, al
igual que nosotros como sus creadores, tengamos la posibilidad de
conocer las facilidades presentadas por el programa y encontremos la
mejor forma de aplicarlas a las labores especificas que realizamos.

NUEVAS CARACTERISTICAS
1. El desktop en MATLAB 7 ha sido rediseado para tener una
mayor funcionalidad y sensibilidad que facilite el entendimiento y
agilidad para llevar a cabo diferentes operaciones. Las nuevas
caractersticas del desktop permiten trabajar en diferentes
documentos al interior de MATLAB de forma simultnea, adems
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
120

ANALISIS ESTADISTICO EN MATLAB


de la posibilidad de guardar customs layout y definir shortcuts
que facilitan el uso de los comandos.

2. En MATLAB 7 podemos crear algunas variables de de diferentes


caractersticas simplemente llamando las mismas con la funcin
create, cuando presionamos Tab despus de escribir el comando
se despliega una lista de todos los posibles comandos y funciones
y variables que comienzan con caracteres de este tipo (create).

3. Una de las grandes ventajas del MATLAB 7 es que permite la


realizacin de grficos desde la ventana del workspace, en la cual
con un simple click en el icono (

) que aparece esta ventana

podemos escoger el tipo de grfica que deseamos realizar con la


variable seleccionada.

4. Permite la posibilidad de ver las grficas realizadas al interior del


desktop y no en una ventana aparte como lo realiza por defecto,
para ello basta con presionar en la parte superior derecha de la
ventana de figuras en la flecha dirigida hacia la parte de abajo( ),
esta nueva caracterstica aplica para otras ventanas, por ejemplo
la ventana del Editor.

5. Se tiene la posibilidad de

trabajar con diferentes documentos

como arrays, m-files, figuras y otros,

en una misma ventana,

para ello debemos guardar y aplicar la opcin desktop layouts que


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
121

ANALISIS ESTADISTICO EN MATLAB


se encuentra dentro del desktop de la barra de mens, en la cual
utilizando la opcin de large documents Windows (grfica 1).

GRAFICA 1

6. Despus de habilitar la opcin mencionada con anterioridad, el


programa permite adems manipular la forma en la cual se
muestran los archivos, funciones o dems en la respectiva
ventana, es decir la cantidad de archivos que queremos que nos
muestre en la misma (ver grfica 2). Esta nueva caracterstica de
MATLAB 7 facilita el trabajo, dndonos la oportunidad de un mejor
entorno de trabajo que agilice el trabajo en el programa.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
122

ANALISIS ESTADISTICO EN MATLAB

GRAFICA 2

7. Es posible en este modo abrir y editar cell arrays y estructuras


desde

el

workspace,

para

diferentes

tipos

de

informacin

almacenada, desde la ventana del array editor es posible modificar


los datos, al igual que graficar la totalidad o parte de los datos a
parte de ellos con un simple clic en el icono (

).

8. Otras de las grandes ventajas que presenta MATLAB 7 es la


relacionada con la creacin de shortcuts, que permiten usar de
manera cmoda y gil algunos de los comandos ejecutados en el
programa, para ello basta con seleccionar en el desktop la opcin
de shortcuts toolbar y arrastrar con el Mouse hasta

la parte

superior derecha en frente de los shortcuts que aparecen por


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
123

ANALISIS ESTADISTICO EN MATLAB


defecto

algn

comando

existente

en

el

Comand History,

automticamente nos pide una etiqueta y despus de guardar el


mismo comando que llevamos se ejecuta de forma gil dando un
solo clic sobre el nombre que le hallamos colocado

EDITOR AND DEBUGGER

9. Para revisar los M-files MATLAB 7 ofrece gran facilidad, basta con
abrir el archivo desde el current directory y dirigirse a la opcin
cell de la barra de mens y habilitar el cell mode; en el editor
las celdas aparecen separadas por doble comentario (%%),
adems es posible ejecutar y avanzar a la otra celda con un solo
clic en el icono (

), lo que realiza este botn es ejecutar las

celdas y avanzar a la siguiente que encuentre basndose en los


dos %%, esta nueva caracterstica agiliza el trabajo y la revisin
de los M-files que en ocasiones pueden llegar a ser muy extensos.

10.

En MATLAB 7 es posible de forma automtica pasar o

publicar el M-code a formato HTML, WORD,

u otros formatos a

documentos de trabajo o a partes de los mismos, con un solo clic


(

11.

).

El editor ahora identifica otros lenguajes importantes como

c/ c++, html, and Java Code. Basta nicamente con dirigirse al

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
124

ANALISIS ESTADISTICO EN MATLAB


curren directory que ya reconoce este tipo de archivos y al dar clic
derecho, escoger la opcin de abrir texto.

12.

Condicional breakpoints: En primer lugar se debe escoger la

opcin disable cell mode en el men cell (ver grfica 3),


despus de esto es posible colocar breakpoints dando clic en el
icono que posee el programa para desarrollar esta tarea (

). Esta

posibilidad nos permite trabajar y evaluar nuestros M-files hasta el


punto de quiebre definido lo que facilita la deteccin de posibles
errores, y el establecimiento de condiciones que debe cumplir el
archivos en este punto.

GRAFICA 3

13.

Otra de las nuevas ventajas de MATLAB 7 es la de colocar

bloques completos de comentarios, para ello basta

es posible

colocar bloques de comentarios colocando simplemente el smbolo


porcentaje (%), acompaado de un corchete abierto; el bloque de
comentarios se cierra de la misma forma como se abri y cerrando
el corchete correspondiente. Esta nueva caracterstica agiliza el
trabajo en el programa y permite la posibilidad de escribir grandes
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
125

ANALISIS ESTADISTICO EN MATLAB


cantidades de ayudas en el M-file que pueden orientar mejor la
posterior revisin de los mismos.

GRFICAS
14.

MATLAB 7 tiene bastantes innovaciones en este aspecto, y

en su mayora son enfocadas a incrementar el manejo de las


grficas por medio de iconos y disminuir en alguna medida la
programacin necesaria para la realizacin, y principalmente la
modificacin de las mismas. Cuando abrimos un archivo tenemos
la posibilidad de valuar puntos especficos simplemente dando clic
en

el

icono

data

automticamente

el

cursor

),

valor

de

las

el

cursos

variables

en

nos

indica

el

punto

seleccionado dentro de la grfica. Si queremos que nos muestre


en una ventana aparte el valor de las variables en el punto
especifico simplemente damos clic derecho y escogemos la opcin
Display Style y en esta damos clic en Window Incide Figure.
(ver grfica 4)

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
126

ANALISIS ESTADISTICO EN MATLAB

FIGURA 4

15.

Otra de las innovaciones presentadas por MATLAB 7 es la

posibilidad de realizar anotaciones al interior de las grficas, para


ello basta con pulsar en la flecha que aparece en la barra de
herramientas del dibujo (

), y seleccionando la opcin

Insert

Text Arrow (ver grfica 5) podemos colocar al interior del grafico


la

flecha

que

deseamos,

el

programa

por

defecto

coloca

anotaciones correspondientes a la grfica en general y no al punto


que se esta sealando.

16.

Tambin es posible agregar otros pequeos grficos como

rectngulos, elipses, cuadros de texto simplemente escogiendo la


opcin insertar y seleccionando lo que deseamos insertar en la
grfica. Existe tambin la posibilidad de modificar las propiedades
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
127

ANALISIS ESTADISTICO EN MATLAB


de las imgenes realizadas simplemente dando doble clic en el
objeto que deseamos modificar; automticamente el programa
nos muestra en cuadro en el cual aparecen las propiedades del
objeto seleccionado y en el cual podemos modificar a nuestro
parecer.(ver grfica 5)

GRAFICA 5

17.

Es posible crear y modificar grficas interactivamente con un

solo clic en el icono show plot tools (

), esta opcin

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
128

ANALISIS ESTADISTICO EN MATLAB


automticamente permite modificar algunas de las propiedades de
la

grfica,

adems

de

trabajar

interactivamente

con

otras

variables o grficas ya creadas, de una manera sencilla y prctica.


Para esto debemos

arrastrar las mismas hacia la grfica ya

creada, o cuadrante vaco. De esta forma tenemos la posibilidad


de comparar las grficas y cambiar propiedades de las grficas al
mismo tiempo.
Para

agregar

grficas

en

otros

cuadrantes

trabajar

simultneamente en varias grficas nos a la ventana de Figure


Palette (figura 5) y creamos la cantidad de cuadrantes que
queremos que nos muestre en la ventana, automticamente nos
aparece en la ventana el numero de cuadrantes que hallamos
seleccionado (por ejemplo en una fila y dos columnas).

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
129

ANALISIS ESTADISTICO EN MATLAB

GRAFICA 6

18.

Desde el panel mencionado en el punto anterior es posible

acceder a las anotaciones del mismo, para ello nos dirigimos al


icono(

) que aparece

en la barra de herramientas, cuando

habilitamos esta opcin se genera la posibilidad de generar el


cdigo-M que dio origen a las grficas creada de una manera
rpida, para ello vamos a la barra de mens y en File
escogemos la opcin Genrate M-File, y de forma automtica nos
muestra en el Editor los comandos que se deberan utilizar para la
creacin de esta grfica, la cual es posible de almacenar como
cualquier otro archivo-M.

Despus de revisar algunas de las nuevas caractersticas del


UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
130

ANALISIS ESTADISTICO EN MATLAB


programa en esta versin, hemos encontrado que las ventajas e
innovaciones en lo relacionado con las grficas son en las que mas
se trabaja, y que las mismas permiten trabajar en una forma
mucho ms rpida que permite agilizar y optimizar las actividades
en el programa.
van

Sin embargo todas las innovaciones realizadas

encaminadas

mejorar

el

entorno

del

contribuyen a la optimizacin de tareas en el mismo.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
131

programa

También podría gustarte