Está en la página 1de 18

1

DEPARTAMENTO DE INGENIERA
AGROINDUSTRIAL





ESTADSTICA BSICA APLICADA A CASOS EN
LA AGROINDUSTRIA CON USO DE R
(Protocolo de investigacin)

PRESENTAN:
JOS LUIS JURADO ZURITA
TALINA GUERRERO RAMREZ


ASESORA:
DRA. MA. CARMEN YBARRA
MONCADA

Chapingo Mxico. Junio 2013.
1

I. INTRODUCCIN
Durante los ltimos aos la estadstica aplicada ha ganado mucha importancia en el
mundo de la investigacin, probablemente debido a la gran potencia de clculo de los
ordenadores y en concreto a los diferentes paquetes estadsticos.

Paralelamente, los paquetes estadsticos tambin se han adaptado a las nuevas necesidades,
de manera que ahora ya no se habla de "paquetes estadsticos", trmino demasiado
concreto, sino de softwares especializados. Por ejemplo, SAS inicialmente significaba
"Statistical Analysis System", pero a medida que este programa iba incorporando nuevas
aplicaciones la mayora de las cuales no eran propiamente estadsticas, SAS pas a
convertirse en una sola palabra (Cochran, 1957).

Actualmente, los diferentes mdulos de SAS hacen que ste sea un software de
los que se llaman como "de inicio a fin". Permite crear grficos, trabajar como una hoja de
clculo, compilar programas en lenguaje C, incluye herramientas para construir interfases
para la www, herramientas para tratar el Datawarehouse o para explorar datos con la
filosofa del Datamining, etctera.

El software estadstico R aporta un entorno de trabajo orientado a resolver problemas de
estadstica. A estos sistemas se les denomina a veces PSE, (Problem Solving
Environments), como Matlab, Mathematica, etctera. Es de uso libre en el dominio pblico
y resulta del esfuerzo cooperativo de personas e instituciones acadmicas relevantes
relacionadas con la estadstica y la computacin en todo el mundo.
Este software permite trabajar con una ventana de interaccin con usuario, R
Console, que ofrece posibilidades para gestionar archivos en disco, guardar resultados, etc.
Trabaja con un lenguaje de programacin, y variables con diversos tipos (numricas,
cualitativas-factor, lgicas, caracter), y estructuras (escalar, vector, matriz, data.frame,
lista), con constantes y con llamadas a funciones. El lenguaje utiliza elementos clsicos de
programacin, con funciones, instrucciones, expresiones aritmticas, lgicas, estructuras
for, if, etc. Se puede trabajar tanto en modo programa, con un conjunto de instrucciones,
2

como en modo de comandos interactivos. Ofrece un entorno bsico interactivo a travs de
una ventana de dilogo llamada R Console, y otro paquete, R Commander, que ofrece ms
interactividad en sus mens para las aplicaciones estadsticas (Paradis, 2002).
R proporciona todas las herramientas estadsticas necesarias para analizar la
informacin generada en la agroindustria, optimizando los costos de operacin que muchas
veces la micro, pequea y mediana agroindustria presenta como principal problema y no
logran consolidarse en el mercado, sin embargo existe poca informacin de la aplicacin de
R en la agroindustria, motivo por el cual se presenta dicha investigacin.















3

II. REVISIN BIBLIOGRFICA

Un paquete estadstico es un programa informtico que est especialmente diseado para
resolver problemas en el rea de la estadstica, o bien est programado para resolver
problemas de esta rea. Existen muchos programas que no son especialmente estadsticos
pero que pueden hacer algunos clculos aplicables en estadstica aplicada. Estos programas
han impulsado y siguen impulsando enormemente la labor de los investigadores que desean
utilizar la estadstica como apoyo en su trabajo (Robinson, 2010).
Los paquetes ms sencillos tienen interfaz por ventanas, lo que implica facilidad de uso y
aprendizaje, pero un mayor encorsetamiento a la hora de hacer clculos que el programa no
tenga predefinidos. Los programas ms complejos suelen tener la necesidad de conocer su
lenguaje de programacin, pero suelen ser mucho ms flexibles al poderse incluir en ellos
funciones, tests o contrastes que no traen instalados por definicin (Murrell, 2005).
Las variables a tener en cuenta para comparar adecuadamente un paquete con otro son:
El costo (de la licencia)

El nivel de sofisticacin del usuario: idealmente tener conocimientos de estadstica
y de programacin y tamao del conjunto de los datos: las computadoras modernas
permiten manipular eficientemente conjuntos de datos cada vez ms extensos (grado
de intensidad computacional): con tcnicas de re-muestreo o de validacin cruzada,
ciertos tests exactos, importantes porque la gran parte de las tcnicas bayesianas
exigen una enorme capacidad de clculo. Sin embargo, Minitab, Stata y gran parte
de los paquetes gratuitos carecen de un verdadero lenguaje de programacin que
resulte eficiente. Otros s cuentan con l: SAS realiza cierto nmero de
manipulaciones no elementales en su data sep as como construir programas
relativamente complejos usando su sistema de macros y gran nmero de
operaciones matriciales.

Ergonoma: es el aspecto del que tal vez encarezcan determinados paquetes
estadsticos: la posibilidad de contar con ayudas interactivas o tutoriales; de
4

representar grficamente datos con un golpe de ratn y de exportar automticamente
los resultados a formato .html .pdf.
Debido a las diferencias existentes entre los paquetes estadsticos, mencionaremos
individualmente las ventajas y desventajas de algunos de ellos, considerando especialmente
los paquetes ms conocidos como SAS y SPSS, pero de muchos otros solo se
mencionar su existencia.

SAS, Statistical Analysis System (SAS Institute Inc., Cary, NC)
El software SAS reporta varias ventajas:
Comprende amplios procedimientos estadsticos (mtodos multivariados, regresin
mltiple con posibilidades diagnsticas, anlisis de supervivencia con riesgos
proporcionales y regresin logstica) y permite clculos exactos para tablas r x c
y contiene potentes posibilidades grficas.
Todos los procedimientos pueden emplearse con una sola ejecucin.
Los resultados pueden guardarse como archivos y usarse como entradas para futuras
ejecuciones.( SAS Institute, 2013)

R es un entorno especialmente diseado para el tratamiento de datos, clculo y
desarrollo grfico. Permite trabajar con facilidad con vectores y matrices y ofrece diversas
herramientas para el anlisis de datos.
El lenguaje de programacin R forma parte del proyecto GNU1 y puede verse como
una implementacin alternativa del lenguaje S, desarrollado en AT&T Bell Laboratories.
Se presenta como un software libre, donde el trmino software libre se refiere a la libertad
de los usuarios para ejecutar, copiar, distribuir, estudiar, cambiar y mejorar el software
(Febrero et al., 2008).
Se trata de un lenguaje creado especficamente para la visualizacin y exploracin
de datos as como para su uso en modelizacin y programacin estadstica. En la web
(http://www.r-project.org/index.html) se encuentra disponible toda la informacin acerca de
R. La instalacin de R se realiza a travs de la CRAN (Comprehensive R Archive
Network). Adems, R es un entorno en el que se han ido incorporando diversas tcnicas
estadsticas. Algunas de ellas se encuentran en la base de R, pero otras muchas estn
5

disponibles como paquetes (packages). Estos paquetes estn disponibles en la web
(http://cran.au.r-project.org/) (Febrero et al., 2008).
En resumen, R proporciona un entorno de trabajo especialmente preparado para el
anlisis estadstico de datos. Sus principales caractersticas son las siguientes: R
proporciona un lenguaje de programacin propio, basado en el lenguaje S, que a su vez
tiene muchos elementos del lenguaje C. Sin embargo, la semntica es muy distinta a la de
este ltimo. Esto es porque R permite ejecuciones de comandos en lnea (compilacin y
ejecucin unidas en un mismo paso), lo cual hace que su semntica est ms prxima a la
de un lenguaje de programacin funcional, por eso tiene objetos y funciones especficos
para el tratamiento de datos (Murrell, 2005).
R, es software libre, tiene tal capacidad que permite la descarga de libreras, con
implementaciones concretas de funciones, grficas, mtodos estadsticos y algoritmos.
Las aplicaciones del software R permiten desarrollar metodologas repetibles,
orienta en la manipulacin de datos y anlisis de los recursos naturales, es una herramienta
de ayuda para resolver problemas de anlisis forestal (Robinson y Hamann, 2010).
Dado que R ofrece una amplia gama de posibilidades, es til para el principiante
adquirir algunas nociones y conceptos y as avanzar progresivamente.
R tiene una naturaleza doble de programa y lenguaje de programacin y es considerado
como un dialecto del lenguaje S creado por los Laboratorios AT&T Bell. S est disponible
como el programa S-PLUS comercializado por Insightful. Existen diferencias importantes
en el diseo de R y S: aquellos interesados en averiguar ms sobre este tema pueden leer el
artculo publicado por Ihaka & Gentleman (1996) o las Preguntas Ms Frecuentes en R, que
tambin se distribuyen con el programa.
R se distribuye gratuitamente bajo los trminos de la GNU General Public Licence;
su desarrollo y distribucin son llevados a cabo por varios estadsticos conocidos como el
Grupo Nuclear de Desarrollo de R.
R posee muchas funciones para anlisis estadsticos y grficos; estos ltimos pueden
ser visualizados de manera inmediata en su propia ventana y ser guardados en varios
formatos (jpg, png, bmp, ps, pdf, emf, pictex, xfig; los formatos disponibles dependen del
sistema operativo), (Maindonald, 2008).
6

Con R los resultados de anlisis estadsticos se muestran en la pantalla, y algunos
resultados intermedios (como valores P-, coeficientes de regresin, residuales, etc.) se
pueden guardar, exportar a un archivo, o ser utilizados en anlisis posteriores.
El lenguaje de R permite al usuario, por ejemplo, programar bucles (loops en
ingls) para analizar conjuntos sucesivos de datos. Tambin es posible combinar en un solo
programa diferentes funciones estadsticas para realizar anlisis ms complejos. Los
usuarios de R tienen a su disponibilidad un gran nmero de programas escritos para S
disponibles en la red; la mayora de stos pueden ser utilizados directamente con R.
Al principio, R puede parecer demasiado complejo para el no-especialista; esto no
es cierto necesariamente. De hecho, una de las caractersticas ms sobresalientes de R es su
enorme flexibilidad. En la siguiente figura podemos observar el funcionamiento del sistema
operativo de R.
Figura 1. Esquema bsico del funcionamiento de R (Berenson, 2003).

Mientras que programas ms clsicos muestran directamente los resultados de un
anlisis, R guarda estos resultados como un objeto, de tal manera que se puede hacer un
anlisis sin necesidad de mostrar su resultado inmediatamente. Esto puede ser un poco
extrao para el usuario, pero esta caracterstica suele ser muy til. De hecho, el usuario
puede extraer solo aquella parte de los resultados que le interesa
De hecho, cuando se utiliza R por primera vez, es muy til tener una idea general de
cmo funciona y eso es precisamente lo que vamos a hacer ahora. Como primera medida,
veremos brevemente como funciona R. Posteriormente, describir el operador asignar el
cual permite crear objetos en R, miraremos como manejar estos objetos en memoria, y
7

finalmente veremos cmo usar la ayuda en lnea, la cual a diferencia de las ayudas en otros
programas estadsticos, es bastante til e intuitiva.
R es un lenguaje Orientado a Objetos: bajo este complejo trmino se esconde la
simplicidad y flexibilidad de R. El hecho que R es un lenguaje de programacin puede
desaminar a muchos usuarios que piensan que no tienen alma de programadores. Esto no
es necesariamente cierto por dos razones. Primero R es un lenguaje interpretado (como
Java) y no compilado (como C, C++, Fortran, Pascal, etc.), lo cual significa que los
comandos escritos en el teclado son ejecutados directamente sin necesidad de construir
ejecutables (Berenson, 2003).
Como segunda medida, la sintaxis de R es muy simple e intuitiva. Por ejemplo, una
regresin lineal se puede ejecutar con el comando lm(y x). Para que una funcin sea
ejecutada en R debe estar siempre acompaada de parntesis, inclusive en el caso que no
haya nada dentro de los mismos (v.g. ls()). Si se escribe el nombre de la funcin sin los
parntesis, R mostrar el contenido (cdigo) mismo de la funcin (Dalgaard, 2008).
En este documento, se escribirn los nombres de las funciones con parntesis para
distinguirlas de otros objetos, a menos que se indique lo contrario en el texto.
Orientado a Objetos significa que las variables, datos, funciones, resultados, etc., se
guardan en la memoria activa del computador en forma de objetos con un nombre
especfico. El usuario puede modificar o manipular estos objetos con operadores
(aritmticos, lgicos, y comparativos) y funciones (que a su vez son objetos).
El uso y funcionamiento de los operadores es relativamente intuitivo, los detalles se
muestran ms adelante. Una funcin en R se puede representar como en la figura 2.


Figura 2. Representacin de la delineacin de una funcin en R (Aliaga, 1999).

Los argumentos pueden ser objetos (datos, frmulas, expresiones, . . . ), algunos
de los cuales pueden ser definidos por defecto en la funcin; sin embargo estos argumentos
8

pueden ser modificados por el usuario con opciones. Una funcin en R puede carecer
totalmente de argumentos, ya sea porque todos estn definidos por defecto (y sus valores
modificados con opciones), o porque la funcin realmente no tiene argumentos (Dalgaard,
2008).
Objetos
R trabaja con objetos los cuales tienen nombre y contenido, pero tambin atributos
que especifican el tipo de datos representados por el objeto. Para entender la utilidad de
estos atributos, consideremos una variable que toma los valores 1, 2, o 3: tal variable podra
ser un nmero entero (por ejemplo, el nmero de huevos en un nido), o el cdigo de una
variable categrica (por ejemplo, el sexo de los individuos en una poblacin de crustceos:
macho, hembra, o hermafrodita), (Muenchen, 2008).
Es claro que los resultados de un anlisis estadstico de esta variable no ser el
mismo en ambos casos: con R, los atributos del objeto proporcionan la informacin
necesaria. En general, y hablando un poco ms tcnicamente, la accin de una funcin
sobre un objeto depende de los atributos de este ltimo.
Todo objeto tiene dos atributos intrnsecos: tipo y longitud. El tipo se refiere a la
clase bsica de los elementos en el objeto; existen cuatro tipos principales: numrico,
carcter, complejo, y lgico (FALSE [Falso] or TRUE [Verdadero]). Existen otros tipos,
pero no representan datos como tal (por ejemplo funciones o expresiones). La longitud es
simplemente el nmero de elementos en el objeto. Para ver el tipo y la longitud de un
objeto se pueden usar las funciones mode y length, respectivamente (Gentleman, 2008).
El cuadro 1 resume los tipos de objetos y los datos que se representan en R.

Tabla 1. Tipos de objetos y los datos que se representan en R.

9

Fuente: (Sarkar, 2002)
Un vector es una variable con el significado comnmente asumido; un factor es una
variable categrica; un arreglo es una tabla de dimensin k, y una matriz es un caso
particular de un arreglo donde k = 2. Conviene notar que los elementos en un arreglo o una
matriz son del mismo tipo. Un data.frame (marco o base de datos) es una tabla
compuesta de uno o ms vectores y/o factores de la misma longitud, pero que pueden ser de
diferentes tipos. Un ts es una serie temporal, y como tal contiene atributos adicionales
tales como frecuencia y fechas. Finalmente, una lista puede contener cualquier tipo de
objeto, incluyendo otras listas (Chatfield, 2003).
Leyendo datos desde un archivo
R utiliza el directorio de trabajo para leer y escribir archivos. Para saber cul es este
directorio puede utilizar el comando getwd() (get working directory) Para cambiar el
directorio de trabajo, se utiliza la funcin setwd(); por ejemplo, setwd(C:/data) o
setwd(/home/paradis/R).
R puede leer datos guardados como archivos de texto (ASCII) con las siguientes
funciones: read.table (con sus variantes, ver abajo), scan y read.fwf. R tambin puede leer
archivos en otros formatos (Excel, SAS, SPSS), y acceder a bases de datos tipo SQL, pero
las funciones necesarias no estn incluidas en el paquete base. Aunque esta funcionalidad
es muy til para el usuario avanzado, nos restringiremos a describir las funciones para leer
archivos en formato ASCII nicamente (Dalgaard, 2008).
La funcin read.table crea un marco de datos (data.frame) y constituye la manera
ms usual de leer datos en forma tabular. Por ejemplo si tenemos un archivo de nombre
data.dat.
Vector. La funcin vector, que tiene dos argumentos mode y length, crea un vector
cuyos elementos pueden ser de tipo numrico, lgico o carcter dependiendo del argumento
especificado en mode (0, FALSE o respectivamente). Las siguientes funciones tienen
exactamente el mismo efecto y tienen un solo argumento (la longitud del vector):
numeric(), logical(), y character().
Factor. Un factor incluye no solo los valores correspondientes a una variable
categrica, pero tambin los diferentes niveles posibles de esta variable (inclusive si estn
presentes en los datos).
10

Matriz. Una matriz es realmente un vector con un atributo adicional (dim) el cual a
su vez es un vector numrico de longitud 2, que define el nmero de filas y columnas de la
matriz. Una matriz se puede crear con la funcin matrix.

Operadores
El cuadro nmero 2 presenta los operadores en R.
Cuadro 2. Los operadores principales en R.

Los operadores aritmticos y comparativos actan en dos elementos (x + y, a <b).
Los operadores aritmticos actan sobre variables de tipo numrico o complejo, pero
tambin lgico; en este caso los valores lgicos son forzados a valores numricos. Los
operadores comparativos pueden actuar sobre cualquier tipo devolviendo uno o varios
valores lgicos ( Chatfield, 2003).
Los operadores lgicos pueden actuar sobre uno (!) o dos objetos de tipo lgico, y
pueden devolver uno (o varios) valores lgicos. Los operadores Y y O existen en dos
formas: uno sencillo donde cada operador acta sobre cada elemento del objeto y devuelve
un nmero de valores lgicos igual al nmero de comparaciones realizadas; otro doble
donde cada operador acta solamente sobre el primer elemento del objeto (Arriaga et al.,
2008).
El editor de datos.
Es posible utilizar un editor grfico similar a una hoja de clculo para editar un
objeto numrico. Por ejemplo, si X es una matriz, el comando data.entry(X) abrir un editor
grfico que le permitir cambiar los valores en la matriz o adicionar nuevas columnas y/o
filas (Dalgaard, 2008).
11

Los detalles del uso del editor de datos dependen del sistema operativo (no est an
implementado en todas las plataformas).
Haciendo grficas en R.
R ofrece una increble variedad de grficos. Para darse una idea, escriba el comando
demo (graphics).
No nos es posible detallar aqu todas las posibilidades de R en trminos de
generacin de grficas. Cada funcin grfica en R tiene un enorme nmero de opciones
permitiendo una gran flexibilidad en la produccin de grficos y el uso de cualquier otro
paquete grfico palidece en comparacin. El modus operandi de las funciones grficas es
sustancialmente diferente del esquema esbozado al principio de este documento.
Particularmente, el resultado de una funcin grfica no puede ser asignado a un objeto sino
que es enviado a un dispositivo grfico. Un dispositivo grfico es una ventana grfica o un
archivo (Dalgaard, 2008).
Existen dos tipos de funciones grficas: las funciones de traficacin de alto nivel
que crean una nueva grfica y las funciones de traficacin de bajo nivel que agregan
elementos a una grfica ya existente. Las grficas se producen con respecto a parmetros
grficos que estn definidos por defecto y pueden ser modificados con la funcin par
(Faraway, 2004).













12

III. JUSTIFICACIN Y ANTECEDENTES.

Justificacin.

En la agroindustria se generan datos que resultado de las interacciones que esta tiene
con su entorno, estos datos provienen de diversas reas, algunas de ellas son el rea de
calidad, de investigacin de mercados y de la eficiencia de los procesos de transformacin;
el control que existe sobre el desarrollo de sus actividades es indispensable para tener un
adecuado registro.

Una vez que se ha recopilado estos datos se procede a analizarlos, para ello la
estadstica es una herramienta de anlisis fundamental, y con ayuda de esta y en base a lo
observado en la agroindustria, permite a los encargados de la direccin de la empresa,
detectar puntos de mejora y debilidades dentro y fuera de ella.

En la pequea y mediana industria, la falta de recursos econmicos dificulta el
anlisis de los datos particulares de la agroindustria, pues adems de que se necesita una
instruccin bsica en nociones estadsticas, el acceso a un software que ayudase al anlisis
estadstico es costoso.

Utilizar un paquete estadstico como R es favorable pues no hay una inversin
monetaria, para utilizarlo de forma adecuada es necesario utilizar un software que
proporcione la forma en que se pueden realizar el estudio de casos particulares en la
agroindustria.








13

Antecedentes
Utilizamos el sistema R para anlisis estadstico. Se inici en la dcada de 1990
como un proyecto de Ross Ihaka y Robert Gentleman en la Universidad de Auckland
(Nueva Zelanda). El sistema R implementa un lenguaje de S, desarrollada en el AT & T
Bell Laboratories por Rick Becker, John Chambers, y Allan Wilks, que es la base para el
sistema S-PLUS comercial. De ello se desarrolla S en su estrecha vinculacin entre el
anlisis de datos y grficos. Las versiones de R estn disponibles, sin costo alguno, para las
versiones de 32 bits de Microsoft Windows, de Linux y otros sistemas Unix, y para
Macintosh (Maindonald & Brau, 2010).
Est disponible a travs de la integral R Archive Network (CRAN). Ir a
http://cran.r-project.org/. El modelo de desarrollo utilizado para R ha demostrado ser muy
eficaz en altos niveles de conocimientos de computacin para la mejora continua, para
identificar y corregir errores, y para responder rpidamente a las cambiantes necesidades y
los intereses de la comunidad estadstica. Supervisin de la "base de R" es manejado por el
Equipo Central R, cuyos miembros son ampliamente establecido internacionalmente. Se
hace uso de cdigo, correccin de errores, y la documentacin de la comunidad de usuarios
de R es amplia. Especialmente importante es el gran nmero de paquetes que la base de
complemento R tiene, y que cualquiera es libre de contribuir. Una vez instalados, estos se
unen a la perfeccin en el sistema de base. (Maindonald & Brau, 2010).
Muchos de los anlisis que ofrece R, hace 20 aos, no estaba disponible en cualquiera de
los paquetes estadsticos estndar. Se han producido cambios desafiantes y emocionantes de
la metodologa que normalmente se encuentra en los cursos de estadstica hace 15 o 20
aos. En el desarrollo actual de R, las prioridades han sido: la visin de una buena
capacidad de manipulacin de datos, grficos flexibles y de alta calidad, la prestacin de los
mtodos de anlisis de datos que son a la vez interesantes y adecuadas para toda la gama de
aplicaciones de rea demandas, la integracin sin fisuras de los diferentes componentes de
R, y la prestacin de interfaces a otros sistemas (editores, bases de datos, la web, etc.) que
los usuarios de R pueden requerir. Facilidad de uso es importante, pero no a expensas de la
potencia, flexibilidad, y controles contra respuestas que son potencialmente engaosas
(Maindonald & Brau, 2010).

14

IV. PROBLEMA, HIPTESIS, OBJETIVOS Y METODOLOGA
Problema
El costo para darle confiabilidad estadstica a una investigacin es elevado, esto se debe a
que los anlisis de datos se realizan con el uso de paquetes estadsticos costosos, lo cual
representa un obstculo econmico importante para las micro, pequeas y medianas
empresas agroindustriales.
Reducir los costos del anlisis estadstico de datos obtenidos en la micro, pequea y
mediana agroindustria, puede generar soluciones basadas en referencias estadsticas
confiables.
Hiptesis
La herramienta del software generado en R proporciona resultados confiables que nos
permitirn tomar decisiones estadsticamente fundamentadas para casos de problemas
agroindustriales.
Objetivo general
Desarrollar un software para herramientas estadsticas bsicas usando R aplicado a
casos particulares de la agroindustria.
Objetivos particulares
Aplicar el software desarrollado a problemas de la agroindustria.
Generar un ambiente de anlisis estadstico bsico y fcil de entender.
Demostrar la importancia del uso de R para anlisis estadsticos de forma gratuita.
Generalizar el software para cualquier usuario.
Brindar confiabilidad en el anlisis de los datos.





15

MATERIALES Y MTODOS
El objetivo de esta tesis, es generar un software en R Project para diseos experimentales
particulares en algunos problemas enfocados a la agroindustria y que sirvan como
herramienta de decisin en el manejo de los datos. El planteamiento del problema se
desarrolla con paquetes y comandos propios de R.
La metodologa consiste en dos etapas: creacin del software y generalizacin de este. La
primera etapa consiste, en crear el software con la rutina adecuada en cada caso, ste debe
ser preciso en las estadsticas de prueba y en el diseo experimental. Los datos analizados
corresponden a investigaciones en otras tesis.
En la segunda etapa se procede a elaborar el procedimiento para que cualquier usuario
pueda hacer uso del software con datos propios de su investigacin.
Se espera que el software sea una alternativa que muestre al usuario su confiabilidad en el
anlisis de los datos, pero tambin su flexibilidad en la ejecucin de sus comandos.

V. CRONOGRAMA DE ACTIVIDADES

CRONOGRAMA DE ACTIVIDADES
SEMESTRE 6 7 8 9
AO
2013
2014
MESES E F M A M J J A S O N D E F M A M J J A S O N D
REVISIN DE LITERATURA
ESTRUCTURACIN DEL
PROTOCOLO
PRIMERA ETAPA
SEGUNDA ETAPA
ANLISIS Y REDACCIN
REVISIN Y CORRECCIONES
PRESENTACIN DE RESULTADOS

VI. PRESUESTO Y FINANCIAMIENTO
Presupuesto

16

Financiamiento


VII. BIBLIOGRAFA
1. Aliaga, M y Gunderson, B (1999) Interactive Statistics (3 Edition) Prentice Hall.
2. Arriaga Goez, A; Fernndez Palacin, F; Lopez Snchez, M; Muoz Mrquez, M;
Prez Plaza, S y Snchez Navas, A. (2008) Estadstica Bsica con R y R
Commander Universidad de Cdiz, Servicio de Publicaciones.
http://knuth.uca.es/ebrcmdr.
3. Berenson, M y Levine, D (2003) Estadstica Bsica en Administracin. Conceptos y
Aplicaciones 6 Edicin Prentice Hall.
4. Chambers, J. M. 2007. Software for Data Analysis: Programming with R. Springer.
5. Chatfield, C. 2003a. The Analysis of Time Series: An Introduction, 6th edn.
Chapman and Hall.
6. Cochran, W. G. and Cox, G. M. 1957. Experimental Designs, 2nd edn. John Wiley.
7. Dalgaard, P. 2008. Introductory Statistics with R, 2nd edn. Springer. USA.
8. Faraway, J. J. 2004. Linear Models with R. Chapman and Hall/CRC.
9. Faraway, J. J. 2006. Extending the Linear Model with R. Generalized Linear, Mixed
Effects and Nonparametric Regression Models. Chapman and Hall/CRC.
10. Gentleman, R. 2008. R Programming for Bioinformatics. Chapman and Hall/CRC.
11. Maindonald, J. H. 1984. Statistical Computation. John Wiley. USA.
12. Maindonald, J. H. 1992. Statistical design, analysis and presentation issues. New
Zealand Journal of Agricultural Research Pp. 41.
13. Maindonald, J. H. 2008. Using R for data analysis and graphics.
http://wwwmaths.anu.edu.au/~johnm/r/usingR.pdf . consultado el da 05 de junio de
2013.
14. Muenchen, R. A. 2008. R for SAS and SPSS Users. Springer.
15. Murrell, P. 2005. R Graphics. Chapman and Hall/CRC.
http://www.stat.auckland.ac.nz/~paul/RGraphics/rgraphics.html
16. R Development Core Team. 2009a. An introduction to R. The most recent version
is available from CRAN sites. http://cran.r-project.org consultado el da 10 de junio
de 2013.
17

17. R Development Core Team. 2009b. R: A language and environment for statistical
computing. RFoundation for Statistical Computing, Vienna, Austria. http://www.R-
project.org consultado el da 12 de junio de 2013.
18. R Development Core Team. 2009c. R Language Definition. Available from CRAN
sites.
19. Robinson, A., Hamann, J. 2010. Forest Analytics with R. Springer Science and
Business Media, LLC, NY, USA. 355.
20. Sarkar, D. 2002. Lattice. R News 2(2): 1923.
21. Spector, P. 2008. Data Manipulation with R. Springer. USA.
22. Paradis, Emmanuel. (2002). R para Principiantes. Consultado el 14 de marzo de
2009, disponible en http://cran.r-project.org/doc/contrib/rdebuts_es.pdf
23. R Development Core Team. (2009). R: A language and environment for statistical computing
[R Foundation for Statistical Computing]. Vienna, Austria. Consultado el 14 de mayo de 2013,
en http://www.R-project.org

También podría gustarte