Está en la página 1de 15

BMDP

BMDP es uno de los paquetes de software estadísticos más antiguos. El primer manual
para BMDP Biomedical Computers Programs se publicó en 1961.
En 1975 pasó a denominarse BMDP. Cubre un amplio abanico de métodos
estadísticos pero su capacidad para manejar datos es limitada.
Desventajas. Sus programas se ejecutan por separado: solo puede accederse a uno de
ellos en cada ejecución.
Los resultados de cada programa se pueden guardar en un archivo de BMDP y utilizarse
como entrada en otros programas.

Calest
CalEst es un paquete de Estadística y Probabilidad, es tanto didáctico como
operativo. CalEst cuenta con una interface amigable que le permitirá obtener cálculos y
gráficas rápidamente, fáciles de interpretar. Además, le permite interactuar con diversas
distribuciones de probabilidad (densidad y acumulada). Asimismo, incluye diversos
tutoriales que permiten experimentar diversos aspectos de estadística y probabilidad.
CalEst fue desarrollado en CONTECK por los científicos Jorge Dominguez y Axel
Dominguez.

Epidat
Epidat es un proyecto no lucrativo que se inició a principios de los años 90, en la Dirección
Xeral de Saúde Pública (actualmente Dirección Xeral de Innovación e Xestión da Saúde
Pública) de la Xunta de Galicia. Consiste en el desarrollo y difusión de un programa de
libre distribución para el análisis estadístico y epidemiológico de datos.
El desarrollo de las primeras versiones de Epidat se integró en el marco de un convenio de
colaboración firmado por la Organización Panamericana de la Salud (OPS) y la Consellería
de Sanidade de la Xunta de Galicia; en la actualidad la OPS presta su apoyo institucional
al proyecto y la Universidad CES de Colombia se ha sumado desde 2012 como organismo
auspiciador.

Evolución del proyecto[editar]

Versión Lanzamiento Descripción

Sistema operativo: MS-DOS

Módulos:

1.0 Diciembre de 1994


 Ajustes
 Muestras
 Concordancia
 Tablas
 Contrastes
Sistema operativo: Windows

Módulos:

 Ajustes
 Muestras
2.0 Junio de 1997
 Concordancia
 Tablas
 Pruebas diagnósticas
 Inferencias
 Priorización
2.1 Junio de 1998 Traducción al gallego, catalán, portugués e inglés

Sistema operativo: Windows 98

Módulos:

 Ajuste de tasas
 Demografía
 Muestreo
 Distribuciones de probabilidad
3.0 Marzo de 2004  Pruebas diagnósticas
 Concordancia y consistencia
 Tablas de contingencia
 Inferencia sobre parámetros
 Análisis bayesiano
 Vigilancia en salud pública
 Metaanálisis
 Jerarquización
3.1 Enero 2006 Corrección de errores y traducción al gallego, portugués e inglés

Programado en Java

Aplicación modular y multiplataforma


Módulos:
4.0 Abril de 2011

 Análisis descriptivo
 Muestreo
 Concordancia y consistencia
 Ajuste de tasas
 Demografía
 Estimación de la mortalidad atribuida
 Distribuciones de probabilidad
 Análisis bayesiano (09/07/2012)
 Medición de desigualdades en salud

Características del programa[editar]


En la actualidad están disponibles para su uso las versiones 3.1 y 4.0. La coexistencia de
ambas versiones se debe a que aún no se ha completado la incorporación de todos los
contenidos de la versión 3.1 a la 4.0.

Epidat 3.1[editar]

Epidat 3.1

En esta versión del programa pueden destacarse tres características básicas: un entorno
que sigue los estándares de Windows, la incorporación de técnicas específicas que no se
encuentran habitualmente en este tipo de programas y un enfoque expositivo en las
ayudas, concebidas con el afán de facilitar la comprensión no sólo de las reglas de
explotación del programa sino también de la esencia conceptual de las técnicas que
contiene.
Epidat 4.0[editar]

Epidat 4.0

Entre las características de la nueva versión del programa cabe destacar dos de las más
relevantes:

 El lenguaje de programación empleado fue Java, lo que le otorga una gran versatilidad
y permite su funcionamiento en diferentes sistemas operativos
(Windows, Linux, Macintosh).
 Presenta una articulación modular que facilita las actualizaciones del programa, de
forma que a partir de un entorno general se pueden añadir o modificar los distintos
módulos de la aplicación, de forma independiente.
El resto de características de esta nueva versión se concentra en los tres elementos
distintivos del programa, que son el entorno, el contenido y la ayuda. El contenido de
Epidat 4.0 se estructuró en los 19 módulos siguientes:
Disponibilidad

Módulo

Versión 3.1 Versión 4.0

1. Análisis descriptivo No Sí

2. Depuración e imputación de datos No En desarrollo

3. Muestreo Sí Sí

4. Inferencia sobre parámetros Sí En desarrollo

5. Tablas de contingencia Sí En desarrollo

6. Concordancia y consistencia Sí Sí

7. Pruebas diagnósticas Sí En desarrollo

8. Ajuste de tasas Sí Sí

9. Demografía Sí Sí

10. Estimación de la mortalidad atribuida No Sí

11. Regresión logística No* En desarrollo

12. Análisis de supervivencia No En desarrollo

13. Distribuciones de probabilidad Sí Sí


14. Análisis bayesiano Sí Sí

15. Meta-análisis Sí En desarrollo

16. Vigilancia en salud pública Sí En desarrollo

17. Índices de desarrollo o privación No** En desarrollo

18. Medición de desigualdades en salud No** Sí

19. Métodos de evaluación económica No En desarrollo

EViews
EViews es un paquete estadístico para Microsoft Windows, usado principalmente
para análisis econométrico. Ha sido desarrollado por Quantitative Micro Software (QMS).
La primera versión, 1.0 salió al mercado en marzo de 1994, reemplazando al MicroTSP. La
versión más actualizada del EViews es la 8 que fue lanzada en Junio de 2013.
EViews combina la tecnología de hoja de cálculo con tareas tradicionales encontradas en
software estadístico tradicional, empleando una interfaz de usuario gráfica. Estas
características se combinan con un poderoso lenguaje de programación.
EViews puede ser empleado para análisis estadístico general, pero es especialmente útil
para realizar análisis econométrico, como modelos de corte transversal, datos en panel y
estimación y predicción con modelos de series de tiempo. Entre los tipos de archivo con
los que es compatible destacan el Excel, SPSS, SAS, Stata, RATS, y TSP.

GNU Octave
Octave o GNU Octave es un programa libre para realizar cálculos numéricos. Como indica
su nombre es parte de proyecto GNU. Es considerado el equivalente libre de MATLAB.
Entre varias características que comparten se puede destacar que ambos ofrecen
un intérpretepermitiendo ejecutar órdenes en modo interactivo. Nótese que Octave no es
un sistema de álgebra computacional como podría ser Maxima, sino que usa un lenguaje
que está orientado al análisis numérico.
El proyecto fue creado alrededor del año 1988 pero con una finalidad diferente: ser
utilizado en un curso de diseño de reactores químicos. Posteriormente en el año 1992, se
decide extenderlo y comienza su desarrollo a cargo de John W. Eaton.1 La primera
versión alpha fue lanzada el 4 de enero de 1993. Un año más tarde, el 17 de
febrero de 1994 aparece la versión 1.0.
El nombre surge de Octave Levenspiel, profesor de unos de los autores conocido por sus
buenas aproximaciones por medio de cálculos mentales a problemas numéricos en
ingeniería química.

JHepWork
JHepWork es un marco de trabajo gratuito de análisis de datos para científicos, ingenieros
y estudiantes escrito en Java. El programa está diseñado para áreas de gráficas científicas
interactivas en 2D y 3D y contiene bibliotecas numéricas científicas implementadas en
Java para funciones matemáticas, números aleatorios, análisis estadístico, ajuste de
curvas de regresión y otras actividades de minería de datos. jHepWork se basa en un
lenguaje de programación de alto nivel, Jython (Pythonimplementado en Java), pero puede
utilizarse también codificación Javapara llamar a bibliotecas jHepWork numéricas y
gráficas.
jHepWork es un intento de crear un entorno de análisis de datos
usandopaquetes de código abierto con una interfaz de usuario coherente y para crear una
herramienta competitiva a los programas comerciales. La idea detrás del proyecto es la
incorporación de código abierto paquetes de software matemático y numérico con interfaz
de usuario de tipo gráfico en un programa coherente en el cual la interfaz de usuario
principal se basa en clases de nombre corto llamado Java/Python. Esto es necesario para
construir un ambiente de análisis utilizando el concepto de secuencias de comandos de
Java. Un ejemplo típico se muestra más adelante.
HepWork funciona en cualquier plataforma (Windows, Macintosh, Linux, etc) donde se
pueda instalar Máquina virtual Java. Las secuencias de comandos (scripts) y el código de
Java (en el caso de la programación Java) se puede ejecutar tanto en un editor de interfaz
gráfica de usuario de jHepWork como en programas por lotes. Las bibliotecas gráficas de
jHepWork se pueden utilizar para crear applets. Todas las gráficas (o "lienzos") utilizadas
para la representación de datos pueden ser embebidos en navegadores web.
jHepWork se puede utilizar en todo lugar donde el análisis de grandes volúmenes de datos
numéricos, de minería de datos,análisis de datos estadísticos y matemáticos son
esenciales. El programa puede ser utilizado en ciencias naturales,ingeniería, y modelado y
análisis de mercados financieros, entre otros. jHepWork es considerado entre los cinco
mejores paquetes de software de minería de datos libre y código abierto.1 Hay varios
comentarios (reseñas) más sobre jHepWork disponibles.2 3 Si bien el programa entra en la
categoría de software de código abierto, no es completamente libre para uso comercial
(ver más abajo).

Julia (lenguaje de programación)


Julia es un lenguaje de programación dinámico, de alto nivel y alto rendimiento para
cálculos científicos y técnicos con una sintaxis similar a la de otros entornos de
computación similares.
Dispone de un compilador avanzado, mecanismos para la ejecución en paralelo y una
extensa biblioteca de funciones matemáticas. La biblioteca, desarrollada
fundamentalmente en Julia, también contiene código desarrollado en C o Fortran.2

Julia (lenguaje de programación)


Julia es un lenguaje de programación dinámico, de alto nivel y alto rendimiento para
cálculos científicos y técnicos con una sintaxis similar a la de otros entornos de
computación similares.
Dispone de un compilador avanzado, mecanismos para la ejecución en paralelo y una
extensa biblioteca de funciones matemáticas. La biblioteca, desarrollada
fundamentalmente en Julia, también contiene código desarrollado en C o Fortran.2

Características[editar]

KNIME está desarrollado sobre la plataforma Eclipse y programado, esencialmente,


en java. Está concebido como una herramienta gráfica y dispone de una serie de nodos
(que encapsulan distintos tipos de algoritmos) y flechas (que representan flujos de datos)
que se despliegan y combinan de manera gráfica e interactiva.

Los nodos implementan distintos tipos de acciones que pueden ejecutarse sobre una tabla
de datos:

 Manipulación de filas, columnas, etc., como muestreos, transformaciones,


agrupaciones, etc.
 Visualización (histogramas, etc.).
 Creación de modelos estadísticos y de minería de datos, como árboles de decisión,
máquinas de vector soporte, regresiones, etc.
 Validación de modelos, como curvas ROC, etc.
 Scoring o aplicación de dichos modelos sobre conjuntos nuevos de datos.
 Creación de informes a medida gracias a su integración con BIRT.

El carácter abierto de la herramienta hace posible su extensión mediante la creación de


nuevos nodos que implementen algoritmos a la medida del usuario. Además, existe la
posibilidad de utilizar de llamar directa y transparentemente a Weka y o de incorporar de
manera sencilla código desarrollado en R o python/jython.

KNIME integra diversos componentes para aprendizaje automático y minería de datos a


través de su concepto de fraccionamiento de datos (data pipelining) modular. La interfaz
gráfica de usuario permite el montaje fácil y rápido de nodos para preprocesamiento de
datos (ETL: extracción, transformación, carga), para el análisis de datos y modelado y
visualización. KNIME es desde 2006 utilizado en la investigación farmacéutica,1 pero
también se utiliza en otras áreas, como: análisis de datos de cliente de CRM, inteligencia
de negocio y análisis de datos financieros.

LISREL
LISREL (acrónimo de linear structural relations), es un programa usado en análisis de
ecuaciones estructurales. Fue desarrollado en los años setenta por Karl Jöreskog y Dag
Sörbom, profesores ambos de la Universidad de Upsala, Suecia. Su versión más reciente
es la 8.8 de agosto de 2009.
LISREL está principalmente basado en comandos, aunque las versiones más recientes
han incorporado una interfaz gráfica. Lo distribuye la empresa SSI (Scientific Software
International).

Minitab
Minitab es un programa de computadora diseñado para ejecutar funciones estadísticas
básicas y avanzadas. Combina lo amigable del uso de Microsoft Excel con la capacidad de
ejecución de análisis estadísticos. En 1972, instructores del programa de análisis
estadísticos de la Universidad Estatal de Pensilvania (Pennsylvania State University)
desarrollaron MINITAB como una versión ligera de OMNITAB, un programa de análisis
estadístico del Instituto Nacional de Estándares y Tecnología (NIST) de los Estados
Unidos. Como versión completa en el 2006 cuesta $1195 USD, pero una versión para
estudiantes y académicos se ofrece como complemento de algunos libros de texto.
Minitab es frecuentemente usado con la implantación la metodología de mejora de
procesos Seis Sigma.

Orange (aprendizaje automático)


Orange es un programa informático para realizar minería de datos yanálisis
predictivo desarrollado en la facultad de informática de laUniversidad de Ljubljana. Consta
de una serie de componentes desarrollados en C++ que implementan algoritmos de
minería de datos, así como operaciones de preprocesamiento y representación gráfica de
datos.
Los componentes de Orange pueden ser manipulados desde programas desarrollados
en Python o a través de un entorno gráfico.
Se distribuye bajo licencia GPL.

Paquete estadístico
Un paquete estadístico es un programa informático que está especialmente diseñado
para resolver problemas en el área de la estadística, o bien está programado para resolver
problemas de esta área. Existen muchos programas que no son especialmente
estadísticos pero que pueden hacer algunos cálculos aplicables en estadística aplicada.
Estos programas han impulsado y siguen impulsando enormemente la labor de los
investigadores que desean utilizar la estadística como apoyo en su trabajo.
Los paquetes más sencillos tienen interfaz por ventanas, lo que implica facilidad de uso y
aprendizaje pero un mayor encorsetamiento a la hora de hacer cálculos que el programa
no tenga predefinidos. Los programas más complejos suelen tener la necesidad de
conocer su lenguaje de programación, pero suelen ser mucho más flexibles al poderse
incluir en ellos funciones, tests o contrastes que no traen instalados por definición.

Ventajas[editar]
La potencia de cálculo de un ordenador puede ayudar a un investigador a realizar cientos
o miles de contrastes de hipótesis en un tiempo muy reducido. Asimismo puede calcular
decenas de modelos de regresión en un tiempo muy corto y después quedarse con el más
apropiado de ellos. En problemas de investigación de operaciones un programa estadístico
es capaz de realizar miles de iteraciones por segundo de un algoritmo en el que una
persona tardaría varios minutos en cada una de ellas. Asimismo, es capaz de elegir entre
miles de resultados posibles cuál de todos ellos es el óptimo. Básicamente, lo que
permiten es resolver problemas de estadística aplicada por fuerza bruta o por probar miles
de combinaciones para quedarse finalmente con la que se crea que es la mejor para el uso

Inconvenientes[editar]
En los programas más complejos se necesita tener conocimientos de programación, así
como para realizar los cálculos más laboriosos. Por ejemplo si se desea realizar una
operación dada a una columna concreta, lo más frecuente es que se pueda hacer esto por
ventanas, sin embargo, si deseamos hacer esto mismo para todas las columnas de
nuestro documento, que pueden ser centenares, es posible que necesitemos programar
un bucle en la sintaxis del programa.
Otro inconveniente está en que en estadística a menudo nos pueden salir resultados
contradictorios entre tests distintos. Un programa informático se dará cuenta de ello y nos
avisará de algún modo, pero tendrá que ser el usuario el que decida a cuál de los test
hacer caso, y esto en ocasiones es complejo, sobre todo si no se está familiarizado a
fondo con la estadística o se tiene poca experiencia.
R (lenguaje de programación)
R es un lenguaje y entorno de programación para análisis estadístico y gráfico.
Se trata de un proyecto de software libre, resultado de la implementaciónGNU del
premiado lenguaje S. R y S-Plus -versión comercial de S- son, probablemente, los dos
lenguajes más utilizados en investigación por la comunidad estadística, siendo además
muy populares en el campo de lainvestigación biomédica, la bioinformática y
las matemáticas financieras. A esto contribuye la posibilidad de cargar diferentes
bibliotecas o paquetes con finalidades específicas de cálculo o gráfico.
R se distribuye bajo la licencia GNU GPL y está disponible para los sistemas
operativos Windows, Macintosh, Unix y GNU/Linux.

RapidMiner
RapidMiner (anteriormente, YALE, Yet Another Learning Environment) es un programa
informático para el análisis y minería de datos. Permite el desarrollo de procesos de
análisis de datos mediante el encadenamiento de operadores a través de un entorno
gráfico. Se usa en investigación educación, capacitación, creación rápida de prototipos y
en aplicaciones empresariales. En una encuesta realizada por KDnuggets, un periódico de
minería de datos, RapidMiner ocupó el segundo lugar en herramientas de analítica y de
minería de datos utilizadas para proyectos reales en 20091 y fue el primero en 2010.2
La versión inicial fue desarrollada por el departamento de inteligencia artificial de
la Universidad de Dortmund en 2001. Se distribuye bajo licencia AGPL y está hospedado
en SourceForge desde el 2004.
RapidMiner proporciona más de 500 operadores orientados al análisis de datos,
incluyendo los necesarios para realizar operaciones de entrada y salida, preprocesamiento
de datos y visualización. También permite utilizar los algoritmos incluidos en Weka.

RKWard
RKWard es una interfaz gráfica para el lenguaje de programación R. Ha sido desarrollado
como una herramienta que transparentemente combina el potencial de R con la facilidad
de uso de otros paquetes estadísticoscomerciales sin perder acceso a los beneficios del
trabajo por línea de comandos o con guiones.

Características[editar]

RKWard está escrito en C++ y utiliza las bibliotecas libres KDE/Qt.

Sistema de complementos[editar]
Gracias a su sistema de complementos RKWard amplía constantemente el número de
funciones a las cuales se puede acceder sin necesidad de escribir el código directamente.
Estos componentes permiten que, a partir de una interfaz gráfica de usuario, se generen
instrucciones en R para las operaciones estadísticas más usuales o complejas. De esta
manera, incluso sin tener conocimientos profundos sobre el lenguaje es posible realizar
análisis de datos avanzados o gráficas elaboradas. Los resultados de las computaciones
son formateados y presentados como HTML, haciendo posible, con un sólo clic y arrastre,
exportar tablas y gráficos hacia, por ejemplo, suites ofimáticas.
Interfaz[editar]
RKWard pretende ser de fácil uso, tanto para personas con profundos conocimientos de R,
como para usuarios que, si bien cuentan con experiencia en estadística, no están
familiarizados con el lenguaje. El diseño de la aplicación ofrece la posibilidad de utilizar las
herramientas gráficas así como también ignorar muchas de ellas y usar el programa
como entorno de desarrollo integrado.

Incluye un visor del espacio de trabajo, donde se tiene acceso a los paquetes, funciones y
variables cargados por R o importados de otras fuentes. Cuenta además con visor de
archivos, y ventanas de edición de conjuntos de datos, visualización del contenido de las
variables, ayuda, bitácora de comandos y la salida HTML.

Igualmente ofrece componentes que ayudan en la edición de código y ejecución directa de


órdenes, como la ventana de guiones y la consola de R, donde se pueden introducir
comandos o programas completos como se haría en la interfaz de texto original de R, con
ayudas adicionales como coloreado de sintaxis documentación de funciones mientras se
escribe, y con la característica de captura de gráficas o diálogos emergentes producidos
ofreciendo opciones adicionales de manipulación, guardado y exportación de estos.

Gestión de paquetes[editar]
La gestión de paquetes de R es realizada a través de un diálogo de configuración que
permite, sea de forma automática (porque un complemento lo requiere) o de forma
manual, instalar nuevos paquetes desde los repositorios oficiales del proyecto, actualizar
los existentes, eliminarlos o cargarlos/descargarlos del espacio de trabajo.

SAS (lenguaje de programación)


SAS es un lenguaje de programación desarrollado por SAS Institute a finales de los años
sesenta. Existen dos intérpretes de dicho lenguaje: uno desarrollado por SAS Institute y
otro por la empresa World Programming.

Índice

Características[editar]
Posee una sintaxis inspirada en la de PL/I, lenguaje en el que se implementó el primer
intérprete.
El lenguaje SAS opera principalmente sobre tablas de datos: puede leerlas, transformarlas,
combinarlas, resumirlas, crear informes a partir de ellas, etc. El núcleo del lenguaje
(conocido habitualmente como SAS Base) incluye:

 Pasos data que permiten realizar operaciones sobre las filas de un conjunto de datos.
 Procedimientos de manipulación de datos que permiten ordenar tablas, enlazarlas, etc.
 Un intérprete de SQL.
 Un superlenguaje de macros.
Módulos adicionales[editar]
Las dos empresas que comercializan intérpretes de lenguaje SAS han desarrollado
módulos adicionales que enriquecen la capacidad del lenguaje para, especialmente,
analizar datos.
Desarrollados por SAS Institute[editar]
SAS Institute comercializa paquetes de procedimientos adicionales para el análisis
estadístico de los datos, tales como:

 SAS/IML, módulo que implementa un lenguaje alternativo similar a Octave, Matlab o R.


 SAS/STAT, un módulo con procedimientos para realizar determinados análisis
estadísticos (regresiones, etc.)
 SAS/ETS para el análisis estadístico de series temporales
 SAS/OR para la resolución de problemas de investigación operativa
 SAS/GRAPH para generar gráficos
Además, SAS Institute ha desarrollado aplicaciones interfaces tales como SAS Enterprise
Guide, SAS Data Integration Studio, SAS Enterprise Miner y otras que generan código
SAS para aplicaciones específicas: ETL, minería de datos, etc.
Desarrollados por World Programming[editar]
World Programming también ha implementado módulos adicionales que añaden al núcleo
del lenguaje la capacidad para realizar determinados análisis estadísticos
(significativamente menos que SAS Institute), conectarse con determinadas fuentes de
datos (ODBC, Oracle, etc.), etc.

SPSS
SPSS es un programa estadístico informático muy usado en las ciencias sociales y las
empresas de investigación de mercado. Originalmente SPSS fue creado como el acrónimo
de Statistical Package for the Social Sciencesaunque también se ha referido como
"Statistical Product and Service Solutions" (Pardo, A., & Ruiz, M.A., 2002, p. 3). Sin
embargo, en la actualidad la parte SPSS del nombre completo del software (IBM SPSS) no
es acrónimo de nada.1
Es uno de los programas estadísticos más conocidos teniendo en cuenta su capacidad
para trabajar con grandes bases de datos y un sencillo interface para la mayoría de los
análisis. En la versión 12 de SPSS se podían realizar análisis con 2 millones de registros y
250.000 variables. El programa consiste en un módulo base y módulos anexos que se han
ido actualizando constantemente con nuevos procedimientos estadísticos. Cada uno de
estos módulos se compra por separado.
Por ejemplo SPSS puede ser utilizado para evaluar cuestiones educativas.
Actualmente, compite no sólo con softwares licenciados como lo son
SAS,MATLAB, Statistica, Stata, sino también con software de código abierto y libre, de los
cuales el más destacado es el Lenguaje R. Recientemente ha sido desarrollado un
paquete libre llamado PSPP, con una interfaz llamadaPSPPire que ha sido compilada para
diversos sistemas operativos como Linux, además de versiones para Windows y OS X.
Este último paquete pretende ser un clon de código abierto que emule todas las
posibilidades del SPSS.

Stata
Stata es un paquete de software estadístico creado en 1985 por StataCorp. Es utilizado
principalmente por instituciones académicas y empresariales dedicadas a la investigación,
especialmente en economía, sociología,ciencias políticas, biomedicina y epidemiología.
Stata permite, entre otras funcionalidades, la gestión de datos, el análisis estadístico, el
trazado de gráficos y las simulaciones.
El tipo de archivos que utiliza son

 dta archivos de datos


 do archivos de comandos
 ado programas
 hlp archivos de ayuda
 gph gráficos
 dct archivos diccionarios
 smcl archivos log
El nombre Stata es una "palabra baúl" que combina las palabras statistics (estadística)
y data (datos); no es un acrónimo y por lo tanto no debe ser escrito en mayúsculas (es
decir, no es "STATA" si no "Stata").1

Statistica
Statistica (aunque la marca está registrada como STATISTICA, en mayúsculas) es
un paquete estadístico usado en investigación, minería de datos y en el ámbito
empresarial. Lo creó StatSoft, empresa que lo desarrolla y mantiene.
StatSoft nació en 1984 de un acuerdo entre un grupo de profesores universitarios y
científicos. Sus primeros productos fueron los programasPsychoStat-2 y PsychoStat-3.
Después desarrolló Statistical Supplement for Lotus 1-2-3, un complemento para las hojas
de cálculo de Lotus. Finalmente, en 1991, lanzó al mercado la primera versión de
STATISTICA para MS-DOS.
Actualmente compite con otros paquetes estadísticos tanto propietarios
(SPSS, SAS, Matlab o Stata) como libres (R).

Interfaz y funcionamiento[editar]

STATISTICA dispone de un sistema propio de archivos. Los ficheros, (o libros de trabajo,


traducción del inglés WorkBooks, tienen extensión .sta.

Libros de trabajo[editar]
Los libros de trabajo son el tipo de documento predefinido para gestionar la entrada y
salida de datos. En ellos se almacenan varios tipos de documentos, tales hojas de cálculo
de STATISTICA, gráficos, o documentos de Microsoft Word oExcel. Desde el punto de
vista técnico, estos libros de trabajo son contenedores ActiveX que pueden incluir gran
cantidad de documentos. Estos documentos se organizan en nodos que adoptan una
estructura de árbol y que son creados por defecto al iniciar un nuevo análisis.

Cada libro de trabajo contiene dos paneles: un explorador con una estructura de árbol para
facilitar la navegación y un visor de documentos.
Hojas de cálculo[editar]
Las hojas de cálculo usan la tecnología de tablas multimedia y permiten gestionar tanto la
entrada de datos numéricos como su salida. La forma básica de de la hoja de cálculo es
una simple tabla bidimensional que puede contener un número prácticamente ilimitado de
casos (filas), y de variables (columnas). Cada celda puede contener un número
virtualmente ilimitado de caracteres. También pueden insertarse ficheros de sonido, vídeo,
gráficos, animaciones o informes que pueden ser insertados como objetos o puede
adjuntarse a cualquier documento compatible con la tecnología ActiveX.

Informes[editar]
Los informes son la forma clásica de manejar las salidaa. En ellos cada objeto (p. ej: una
hoja de cálculos de STATISTICA o un gráfico), se muestra en un documento de texto
similar a los habituales de Word. Estos objetos pueden activarse, editarse y colocarse en
el lugar deseado. Los informes se guardan en formato .srt, que es la extensión de StatSoft
del formato RTF de Microsoft, aunque incluyen además un índice con estructura de árbol.
Los informes pueden exportarse también al formato RTF estándar.

Gráficos[editar]
Los documentos gráficos pueden ser creados de diversas formas en STATISTICA,
disponen de herramientas de personalización y pueden contener enlaces a otros
documentos compatibles. Al igual que otros documentos de STATISTICA, los gráficos son
contenedores ActiveX, lo que los hace compatibles con gran variedad de documentos
como dibujos de Visio, ilustraciones de Adobe, hojas de cálculo Excel, etc.

Macros[editar]
El lenguaje de programación Visual Basic está integrado en STATISTICA. Esto permite la
programación de gran cantidad de funciones. Además, análisis y gráficos pueden grabarse
como macros de Visual Basic y ser ejecutados, editados y usados posteriormente desde
otras aplicaciones. Las macros de STATISTICA pueden ser guardadas en diversos
formatos dependiendo del uso al que se les vaya a destinar.

El programa trae por defecto una serie de ejemplos, a los que se puede acceder una vez
instalado.

Weka (aprendizaje automático)


Para otros usos de este término, véase Weka (desambiguación).

Weka (Waikato Environment for Knowledge Analysis, en español «entorno para análisis
del conocimiento de la Universidad de Waikato») es una plataforma de software para
el aprendizaje automático y laminería de datos escrito en Java y desarrollado en
la Universidad de Waikato. Weka es software libre distribuido bajo la licencia GNU-GPL.
Descripción[editar]

El paquete Weka4 contiene una colección de herramientas de visualización


y algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de
usuario para acceder fácilmente a sus funcionalidades. La versión original de Weka fue
un front-end en TCL/TK para modelar algoritmos implementados en otros lenguajes de
programación, más unas utilidades para preprocesamiento de datos desarrolladas en C
para hacer experimentos de aprendizaje automático. Esta versión original se diseñó
inicialmente como herramienta para analizar datos procedentes del dominio de
la agricultura,5 6pero la versión más reciente basada en Java (WEKA 3), que empezó a
desarrollarse en 1997, se utiliza en muchas y muy diferentes áreas, en particular con
finalidades docentes y de investigación.

Razones a favor de Weka[editar]


Los puntos fuertes de Weka son:

 Está disponible libremente bajo la licencia pública general de GNU.


 Es muy portable porque está completamente implementado en Java y puede correr en
casi cualquier plataforma.
 Contiene una extensa colección de técnicas para preprocesamiento de datos y
modelado.
 Es fácil de utilizar por un principiante gracias a su interfaz gráfica de usuario.

Weka soporta varias tareas estándar de minería de datos, especialmente,


preprocesamiento de datos, clustering,clasificación, regresión, visualización, y selección.
Todas las técnicas de Weka se fundamentan en la asunción de que los datos están
disponibles en un fichero plano (flat file) o una relación, en la que cada registro de datos
está descrito por un número fijo de atributos (normalmente numéricos o nominales, aunque
también se soportan otros tipos). Weka también proporciona acceso a bases de
datos vía SQL gracias a la conexión JDBC (Java Database Connectivity) y puede procesar
el resultado devuelto por una consulta hecha a la base de datos. No puede realizar minería
de datos multi-relacional, pero existen aplicaciones que pueden convertir una colección de
tablas relacionadas de una base de datos en una única tabla que ya puede ser procesada
con Weka.7

Carencias de Weka[editar]
Un área importante que actualmente no cubren los algoritmos incluidos en Weka es
el modelado de secuencias
WinBUGS

WinBUGS es un software estadístico para análisis bayesiano usando los llamados


métodos MCMC (Markov chain Monte Carlo).
Está basado en el proyecto BUGS (Bayesian inference Using GibbsSampling), iniciado en
1989. Corre sobre Windows, aunque es posible ejecutarlo sobre Linux usando Wine.1
Lo desarrolla un grupo de investigadores del MRC, Unidad deBioestadística, Cambridge y
el Imperial College School of Medicine de Londres.

WinBUGS

Desarrollador

The BUGS Project

Información general

Lanzamiento inicial 1997

Última versión estable 1.4.3


6 de agosto de 2007; hace 7 años

Género Software de análisis estadístico

Sistema operativo Windows

Licencia Freeware

Idiomas Inglés

En español No

También podría gustarte