Documentos de Académico
Documentos de Profesional
Documentos de Cultura
BMDP es uno de los paquetes de software estadísticos más antiguos. El primer manual
para BMDP Biomedical Computers Programs se publicó en 1961.
En 1975 pasó a denominarse BMDP. Cubre un amplio abanico de métodos
estadísticos pero su capacidad para manejar datos es limitada.
Desventajas. Sus programas se ejecutan por separado: solo puede accederse a uno de
ellos en cada ejecución.
Los resultados de cada programa se pueden guardar en un archivo de BMDP y utilizarse
como entrada en otros programas.
Calest
CalEst es un paquete de Estadística y Probabilidad, es tanto didáctico como
operativo. CalEst cuenta con una interface amigable que le permitirá obtener cálculos y
gráficas rápidamente, fáciles de interpretar. Además, le permite interactuar con diversas
distribuciones de probabilidad (densidad y acumulada). Asimismo, incluye diversos
tutoriales que permiten experimentar diversos aspectos de estadística y probabilidad.
CalEst fue desarrollado en CONTECK por los científicos Jorge Dominguez y Axel
Dominguez.
Epidat
Epidat es un proyecto no lucrativo que se inició a principios de los años 90, en la Dirección
Xeral de Saúde Pública (actualmente Dirección Xeral de Innovación e Xestión da Saúde
Pública) de la Xunta de Galicia. Consiste en el desarrollo y difusión de un programa de
libre distribución para el análisis estadístico y epidemiológico de datos.
El desarrollo de las primeras versiones de Epidat se integró en el marco de un convenio de
colaboración firmado por la Organización Panamericana de la Salud (OPS) y la Consellería
de Sanidade de la Xunta de Galicia; en la actualidad la OPS presta su apoyo institucional
al proyecto y la Universidad CES de Colombia se ha sumado desde 2012 como organismo
auspiciador.
Módulos:
Módulos:
Ajustes
Muestras
2.0 Junio de 1997
Concordancia
Tablas
Pruebas diagnósticas
Inferencias
Priorización
2.1 Junio de 1998 Traducción al gallego, catalán, portugués e inglés
Módulos:
Ajuste de tasas
Demografía
Muestreo
Distribuciones de probabilidad
3.0 Marzo de 2004 Pruebas diagnósticas
Concordancia y consistencia
Tablas de contingencia
Inferencia sobre parámetros
Análisis bayesiano
Vigilancia en salud pública
Metaanálisis
Jerarquización
3.1 Enero 2006 Corrección de errores y traducción al gallego, portugués e inglés
Programado en Java
Análisis descriptivo
Muestreo
Concordancia y consistencia
Ajuste de tasas
Demografía
Estimación de la mortalidad atribuida
Distribuciones de probabilidad
Análisis bayesiano (09/07/2012)
Medición de desigualdades en salud
Epidat 3.1[editar]
Epidat 3.1
En esta versión del programa pueden destacarse tres características básicas: un entorno
que sigue los estándares de Windows, la incorporación de técnicas específicas que no se
encuentran habitualmente en este tipo de programas y un enfoque expositivo en las
ayudas, concebidas con el afán de facilitar la comprensión no sólo de las reglas de
explotación del programa sino también de la esencia conceptual de las técnicas que
contiene.
Epidat 4.0[editar]
Epidat 4.0
Entre las características de la nueva versión del programa cabe destacar dos de las más
relevantes:
El lenguaje de programación empleado fue Java, lo que le otorga una gran versatilidad
y permite su funcionamiento en diferentes sistemas operativos
(Windows, Linux, Macintosh).
Presenta una articulación modular que facilita las actualizaciones del programa, de
forma que a partir de un entorno general se pueden añadir o modificar los distintos
módulos de la aplicación, de forma independiente.
El resto de características de esta nueva versión se concentra en los tres elementos
distintivos del programa, que son el entorno, el contenido y la ayuda. El contenido de
Epidat 4.0 se estructuró en los 19 módulos siguientes:
Disponibilidad
Módulo
1. Análisis descriptivo No Sí
3. Muestreo Sí Sí
6. Concordancia y consistencia Sí Sí
8. Ajuste de tasas Sí Sí
9. Demografía Sí Sí
EViews
EViews es un paquete estadístico para Microsoft Windows, usado principalmente
para análisis econométrico. Ha sido desarrollado por Quantitative Micro Software (QMS).
La primera versión, 1.0 salió al mercado en marzo de 1994, reemplazando al MicroTSP. La
versión más actualizada del EViews es la 8 que fue lanzada en Junio de 2013.
EViews combina la tecnología de hoja de cálculo con tareas tradicionales encontradas en
software estadístico tradicional, empleando una interfaz de usuario gráfica. Estas
características se combinan con un poderoso lenguaje de programación.
EViews puede ser empleado para análisis estadístico general, pero es especialmente útil
para realizar análisis econométrico, como modelos de corte transversal, datos en panel y
estimación y predicción con modelos de series de tiempo. Entre los tipos de archivo con
los que es compatible destacan el Excel, SPSS, SAS, Stata, RATS, y TSP.
GNU Octave
Octave o GNU Octave es un programa libre para realizar cálculos numéricos. Como indica
su nombre es parte de proyecto GNU. Es considerado el equivalente libre de MATLAB.
Entre varias características que comparten se puede destacar que ambos ofrecen
un intérpretepermitiendo ejecutar órdenes en modo interactivo. Nótese que Octave no es
un sistema de álgebra computacional como podría ser Maxima, sino que usa un lenguaje
que está orientado al análisis numérico.
El proyecto fue creado alrededor del año 1988 pero con una finalidad diferente: ser
utilizado en un curso de diseño de reactores químicos. Posteriormente en el año 1992, se
decide extenderlo y comienza su desarrollo a cargo de John W. Eaton.1 La primera
versión alpha fue lanzada el 4 de enero de 1993. Un año más tarde, el 17 de
febrero de 1994 aparece la versión 1.0.
El nombre surge de Octave Levenspiel, profesor de unos de los autores conocido por sus
buenas aproximaciones por medio de cálculos mentales a problemas numéricos en
ingeniería química.
JHepWork
JHepWork es un marco de trabajo gratuito de análisis de datos para científicos, ingenieros
y estudiantes escrito en Java. El programa está diseñado para áreas de gráficas científicas
interactivas en 2D y 3D y contiene bibliotecas numéricas científicas implementadas en
Java para funciones matemáticas, números aleatorios, análisis estadístico, ajuste de
curvas de regresión y otras actividades de minería de datos. jHepWork se basa en un
lenguaje de programación de alto nivel, Jython (Pythonimplementado en Java), pero puede
utilizarse también codificación Javapara llamar a bibliotecas jHepWork numéricas y
gráficas.
jHepWork es un intento de crear un entorno de análisis de datos
usandopaquetes de código abierto con una interfaz de usuario coherente y para crear una
herramienta competitiva a los programas comerciales. La idea detrás del proyecto es la
incorporación de código abierto paquetes de software matemático y numérico con interfaz
de usuario de tipo gráfico en un programa coherente en el cual la interfaz de usuario
principal se basa en clases de nombre corto llamado Java/Python. Esto es necesario para
construir un ambiente de análisis utilizando el concepto de secuencias de comandos de
Java. Un ejemplo típico se muestra más adelante.
HepWork funciona en cualquier plataforma (Windows, Macintosh, Linux, etc) donde se
pueda instalar Máquina virtual Java. Las secuencias de comandos (scripts) y el código de
Java (en el caso de la programación Java) se puede ejecutar tanto en un editor de interfaz
gráfica de usuario de jHepWork como en programas por lotes. Las bibliotecas gráficas de
jHepWork se pueden utilizar para crear applets. Todas las gráficas (o "lienzos") utilizadas
para la representación de datos pueden ser embebidos en navegadores web.
jHepWork se puede utilizar en todo lugar donde el análisis de grandes volúmenes de datos
numéricos, de minería de datos,análisis de datos estadísticos y matemáticos son
esenciales. El programa puede ser utilizado en ciencias naturales,ingeniería, y modelado y
análisis de mercados financieros, entre otros. jHepWork es considerado entre los cinco
mejores paquetes de software de minería de datos libre y código abierto.1 Hay varios
comentarios (reseñas) más sobre jHepWork disponibles.2 3 Si bien el programa entra en la
categoría de software de código abierto, no es completamente libre para uso comercial
(ver más abajo).
Características[editar]
Los nodos implementan distintos tipos de acciones que pueden ejecutarse sobre una tabla
de datos:
LISREL
LISREL (acrónimo de linear structural relations), es un programa usado en análisis de
ecuaciones estructurales. Fue desarrollado en los años setenta por Karl Jöreskog y Dag
Sörbom, profesores ambos de la Universidad de Upsala, Suecia. Su versión más reciente
es la 8.8 de agosto de 2009.
LISREL está principalmente basado en comandos, aunque las versiones más recientes
han incorporado una interfaz gráfica. Lo distribuye la empresa SSI (Scientific Software
International).
Minitab
Minitab es un programa de computadora diseñado para ejecutar funciones estadísticas
básicas y avanzadas. Combina lo amigable del uso de Microsoft Excel con la capacidad de
ejecución de análisis estadísticos. En 1972, instructores del programa de análisis
estadísticos de la Universidad Estatal de Pensilvania (Pennsylvania State University)
desarrollaron MINITAB como una versión ligera de OMNITAB, un programa de análisis
estadístico del Instituto Nacional de Estándares y Tecnología (NIST) de los Estados
Unidos. Como versión completa en el 2006 cuesta $1195 USD, pero una versión para
estudiantes y académicos se ofrece como complemento de algunos libros de texto.
Minitab es frecuentemente usado con la implantación la metodología de mejora de
procesos Seis Sigma.
Paquete estadístico
Un paquete estadístico es un programa informático que está especialmente diseñado
para resolver problemas en el área de la estadística, o bien está programado para resolver
problemas de esta área. Existen muchos programas que no son especialmente
estadísticos pero que pueden hacer algunos cálculos aplicables en estadística aplicada.
Estos programas han impulsado y siguen impulsando enormemente la labor de los
investigadores que desean utilizar la estadística como apoyo en su trabajo.
Los paquetes más sencillos tienen interfaz por ventanas, lo que implica facilidad de uso y
aprendizaje pero un mayor encorsetamiento a la hora de hacer cálculos que el programa
no tenga predefinidos. Los programas más complejos suelen tener la necesidad de
conocer su lenguaje de programación, pero suelen ser mucho más flexibles al poderse
incluir en ellos funciones, tests o contrastes que no traen instalados por definición.
Ventajas[editar]
La potencia de cálculo de un ordenador puede ayudar a un investigador a realizar cientos
o miles de contrastes de hipótesis en un tiempo muy reducido. Asimismo puede calcular
decenas de modelos de regresión en un tiempo muy corto y después quedarse con el más
apropiado de ellos. En problemas de investigación de operaciones un programa estadístico
es capaz de realizar miles de iteraciones por segundo de un algoritmo en el que una
persona tardaría varios minutos en cada una de ellas. Asimismo, es capaz de elegir entre
miles de resultados posibles cuál de todos ellos es el óptimo. Básicamente, lo que
permiten es resolver problemas de estadística aplicada por fuerza bruta o por probar miles
de combinaciones para quedarse finalmente con la que se crea que es la mejor para el uso
Inconvenientes[editar]
En los programas más complejos se necesita tener conocimientos de programación, así
como para realizar los cálculos más laboriosos. Por ejemplo si se desea realizar una
operación dada a una columna concreta, lo más frecuente es que se pueda hacer esto por
ventanas, sin embargo, si deseamos hacer esto mismo para todas las columnas de
nuestro documento, que pueden ser centenares, es posible que necesitemos programar
un bucle en la sintaxis del programa.
Otro inconveniente está en que en estadística a menudo nos pueden salir resultados
contradictorios entre tests distintos. Un programa informático se dará cuenta de ello y nos
avisará de algún modo, pero tendrá que ser el usuario el que decida a cuál de los test
hacer caso, y esto en ocasiones es complejo, sobre todo si no se está familiarizado a
fondo con la estadística o se tiene poca experiencia.
R (lenguaje de programación)
R es un lenguaje y entorno de programación para análisis estadístico y gráfico.
Se trata de un proyecto de software libre, resultado de la implementaciónGNU del
premiado lenguaje S. R y S-Plus -versión comercial de S- son, probablemente, los dos
lenguajes más utilizados en investigación por la comunidad estadística, siendo además
muy populares en el campo de lainvestigación biomédica, la bioinformática y
las matemáticas financieras. A esto contribuye la posibilidad de cargar diferentes
bibliotecas o paquetes con finalidades específicas de cálculo o gráfico.
R se distribuye bajo la licencia GNU GPL y está disponible para los sistemas
operativos Windows, Macintosh, Unix y GNU/Linux.
RapidMiner
RapidMiner (anteriormente, YALE, Yet Another Learning Environment) es un programa
informático para el análisis y minería de datos. Permite el desarrollo de procesos de
análisis de datos mediante el encadenamiento de operadores a través de un entorno
gráfico. Se usa en investigación educación, capacitación, creación rápida de prototipos y
en aplicaciones empresariales. En una encuesta realizada por KDnuggets, un periódico de
minería de datos, RapidMiner ocupó el segundo lugar en herramientas de analítica y de
minería de datos utilizadas para proyectos reales en 20091 y fue el primero en 2010.2
La versión inicial fue desarrollada por el departamento de inteligencia artificial de
la Universidad de Dortmund en 2001. Se distribuye bajo licencia AGPL y está hospedado
en SourceForge desde el 2004.
RapidMiner proporciona más de 500 operadores orientados al análisis de datos,
incluyendo los necesarios para realizar operaciones de entrada y salida, preprocesamiento
de datos y visualización. También permite utilizar los algoritmos incluidos en Weka.
RKWard
RKWard es una interfaz gráfica para el lenguaje de programación R. Ha sido desarrollado
como una herramienta que transparentemente combina el potencial de R con la facilidad
de uso de otros paquetes estadísticoscomerciales sin perder acceso a los beneficios del
trabajo por línea de comandos o con guiones.
Características[editar]
Sistema de complementos[editar]
Gracias a su sistema de complementos RKWard amplía constantemente el número de
funciones a las cuales se puede acceder sin necesidad de escribir el código directamente.
Estos componentes permiten que, a partir de una interfaz gráfica de usuario, se generen
instrucciones en R para las operaciones estadísticas más usuales o complejas. De esta
manera, incluso sin tener conocimientos profundos sobre el lenguaje es posible realizar
análisis de datos avanzados o gráficas elaboradas. Los resultados de las computaciones
son formateados y presentados como HTML, haciendo posible, con un sólo clic y arrastre,
exportar tablas y gráficos hacia, por ejemplo, suites ofimáticas.
Interfaz[editar]
RKWard pretende ser de fácil uso, tanto para personas con profundos conocimientos de R,
como para usuarios que, si bien cuentan con experiencia en estadística, no están
familiarizados con el lenguaje. El diseño de la aplicación ofrece la posibilidad de utilizar las
herramientas gráficas así como también ignorar muchas de ellas y usar el programa
como entorno de desarrollo integrado.
Incluye un visor del espacio de trabajo, donde se tiene acceso a los paquetes, funciones y
variables cargados por R o importados de otras fuentes. Cuenta además con visor de
archivos, y ventanas de edición de conjuntos de datos, visualización del contenido de las
variables, ayuda, bitácora de comandos y la salida HTML.
Gestión de paquetes[editar]
La gestión de paquetes de R es realizada a través de un diálogo de configuración que
permite, sea de forma automática (porque un complemento lo requiere) o de forma
manual, instalar nuevos paquetes desde los repositorios oficiales del proyecto, actualizar
los existentes, eliminarlos o cargarlos/descargarlos del espacio de trabajo.
Índice
Características[editar]
Posee una sintaxis inspirada en la de PL/I, lenguaje en el que se implementó el primer
intérprete.
El lenguaje SAS opera principalmente sobre tablas de datos: puede leerlas, transformarlas,
combinarlas, resumirlas, crear informes a partir de ellas, etc. El núcleo del lenguaje
(conocido habitualmente como SAS Base) incluye:
Pasos data que permiten realizar operaciones sobre las filas de un conjunto de datos.
Procedimientos de manipulación de datos que permiten ordenar tablas, enlazarlas, etc.
Un intérprete de SQL.
Un superlenguaje de macros.
Módulos adicionales[editar]
Las dos empresas que comercializan intérpretes de lenguaje SAS han desarrollado
módulos adicionales que enriquecen la capacidad del lenguaje para, especialmente,
analizar datos.
Desarrollados por SAS Institute[editar]
SAS Institute comercializa paquetes de procedimientos adicionales para el análisis
estadístico de los datos, tales como:
SPSS
SPSS es un programa estadístico informático muy usado en las ciencias sociales y las
empresas de investigación de mercado. Originalmente SPSS fue creado como el acrónimo
de Statistical Package for the Social Sciencesaunque también se ha referido como
"Statistical Product and Service Solutions" (Pardo, A., & Ruiz, M.A., 2002, p. 3). Sin
embargo, en la actualidad la parte SPSS del nombre completo del software (IBM SPSS) no
es acrónimo de nada.1
Es uno de los programas estadísticos más conocidos teniendo en cuenta su capacidad
para trabajar con grandes bases de datos y un sencillo interface para la mayoría de los
análisis. En la versión 12 de SPSS se podían realizar análisis con 2 millones de registros y
250.000 variables. El programa consiste en un módulo base y módulos anexos que se han
ido actualizando constantemente con nuevos procedimientos estadísticos. Cada uno de
estos módulos se compra por separado.
Por ejemplo SPSS puede ser utilizado para evaluar cuestiones educativas.
Actualmente, compite no sólo con softwares licenciados como lo son
SAS,MATLAB, Statistica, Stata, sino también con software de código abierto y libre, de los
cuales el más destacado es el Lenguaje R. Recientemente ha sido desarrollado un
paquete libre llamado PSPP, con una interfaz llamadaPSPPire que ha sido compilada para
diversos sistemas operativos como Linux, además de versiones para Windows y OS X.
Este último paquete pretende ser un clon de código abierto que emule todas las
posibilidades del SPSS.
Stata
Stata es un paquete de software estadístico creado en 1985 por StataCorp. Es utilizado
principalmente por instituciones académicas y empresariales dedicadas a la investigación,
especialmente en economía, sociología,ciencias políticas, biomedicina y epidemiología.
Stata permite, entre otras funcionalidades, la gestión de datos, el análisis estadístico, el
trazado de gráficos y las simulaciones.
El tipo de archivos que utiliza son
Statistica
Statistica (aunque la marca está registrada como STATISTICA, en mayúsculas) es
un paquete estadístico usado en investigación, minería de datos y en el ámbito
empresarial. Lo creó StatSoft, empresa que lo desarrolla y mantiene.
StatSoft nació en 1984 de un acuerdo entre un grupo de profesores universitarios y
científicos. Sus primeros productos fueron los programasPsychoStat-2 y PsychoStat-3.
Después desarrolló Statistical Supplement for Lotus 1-2-3, un complemento para las hojas
de cálculo de Lotus. Finalmente, en 1991, lanzó al mercado la primera versión de
STATISTICA para MS-DOS.
Actualmente compite con otros paquetes estadísticos tanto propietarios
(SPSS, SAS, Matlab o Stata) como libres (R).
Interfaz y funcionamiento[editar]
Libros de trabajo[editar]
Los libros de trabajo son el tipo de documento predefinido para gestionar la entrada y
salida de datos. En ellos se almacenan varios tipos de documentos, tales hojas de cálculo
de STATISTICA, gráficos, o documentos de Microsoft Word oExcel. Desde el punto de
vista técnico, estos libros de trabajo son contenedores ActiveX que pueden incluir gran
cantidad de documentos. Estos documentos se organizan en nodos que adoptan una
estructura de árbol y que son creados por defecto al iniciar un nuevo análisis.
Cada libro de trabajo contiene dos paneles: un explorador con una estructura de árbol para
facilitar la navegación y un visor de documentos.
Hojas de cálculo[editar]
Las hojas de cálculo usan la tecnología de tablas multimedia y permiten gestionar tanto la
entrada de datos numéricos como su salida. La forma básica de de la hoja de cálculo es
una simple tabla bidimensional que puede contener un número prácticamente ilimitado de
casos (filas), y de variables (columnas). Cada celda puede contener un número
virtualmente ilimitado de caracteres. También pueden insertarse ficheros de sonido, vídeo,
gráficos, animaciones o informes que pueden ser insertados como objetos o puede
adjuntarse a cualquier documento compatible con la tecnología ActiveX.
Informes[editar]
Los informes son la forma clásica de manejar las salidaa. En ellos cada objeto (p. ej: una
hoja de cálculos de STATISTICA o un gráfico), se muestra en un documento de texto
similar a los habituales de Word. Estos objetos pueden activarse, editarse y colocarse en
el lugar deseado. Los informes se guardan en formato .srt, que es la extensión de StatSoft
del formato RTF de Microsoft, aunque incluyen además un índice con estructura de árbol.
Los informes pueden exportarse también al formato RTF estándar.
Gráficos[editar]
Los documentos gráficos pueden ser creados de diversas formas en STATISTICA,
disponen de herramientas de personalización y pueden contener enlaces a otros
documentos compatibles. Al igual que otros documentos de STATISTICA, los gráficos son
contenedores ActiveX, lo que los hace compatibles con gran variedad de documentos
como dibujos de Visio, ilustraciones de Adobe, hojas de cálculo Excel, etc.
Macros[editar]
El lenguaje de programación Visual Basic está integrado en STATISTICA. Esto permite la
programación de gran cantidad de funciones. Además, análisis y gráficos pueden grabarse
como macros de Visual Basic y ser ejecutados, editados y usados posteriormente desde
otras aplicaciones. Las macros de STATISTICA pueden ser guardadas en diversos
formatos dependiendo del uso al que se les vaya a destinar.
El programa trae por defecto una serie de ejemplos, a los que se puede acceder una vez
instalado.
Weka (Waikato Environment for Knowledge Analysis, en español «entorno para análisis
del conocimiento de la Universidad de Waikato») es una plataforma de software para
el aprendizaje automático y laminería de datos escrito en Java y desarrollado en
la Universidad de Waikato. Weka es software libre distribuido bajo la licencia GNU-GPL.
Descripción[editar]
Carencias de Weka[editar]
Un área importante que actualmente no cubren los algoritmos incluidos en Weka es
el modelado de secuencias
WinBUGS
WinBUGS
Desarrollador
Información general
Licencia Freeware
Idiomas Inglés
En español No