Está en la página 1de 8

Los paquetes estadísticos son programas específicamente diseñados para

el análisis estadístico de datos, son la evolución natural de las librerías de


rutinas matemáticas pensadas inicialmente para ser utilizadas desde
lenguajes de programación como Fortran y C.

Estas conjunto de rutinas y subprogramas con el tiempo se fueron


perfeccionado, de forma que empezaron a funcionar de forma conjunta,
agrupándose en subprogramas cada vez más completos y enfocados a
realizar análisis concretos, por ejemplo en vez de utilizar una rutina para
calcular los coeficientes de regresión, otra subrutina para calcular los
residuos, después invocar a un procedimiento gráfico para representar el
gráfico de los residuos al cuadrado versus predicciones ... etc, estas se
fueron agrupando en forma de subprogramas para realizar análisis de
cada vez más completos, suministrando toda la información
habitualmente demandada por el analista.

Con la evolución de los computadores, se empezó a suministrar un marco


común desde donde llamar a todos estos subprogramas de una forma
simplificada. Posteriormente se les añadió una interfaz de usuario, que
permite utilizar estos paquetes sin tener que aprenderse el lenguaje de
programación correspondiente. Aunque la gran mayoría de estos
paquetes fueron desarrollados para mainframes, con el tiempo la potencia
de los computadores personales fue creciendo y actualmente casi todos
estos paquetes tienen su correspondiente versión para PC.

El coste de estos paquetes de análisis estadístico de datos suele ser


elevado, si bien hay que señalar que actualmente existen algunos
paquetes de libre distribución, como R.
Los puntos más importantes de los paquetes estadísticos son los
siguientes:

 El número de análisis que realizan y profundidad de los mismos.

 El nivel de conocimiento requerido por el analista.

 El volumen de datos que son capaces de tratar.

 La ergonomía de uso.

 La facilidad de programación.

Si consideramos los paquetes SPSS, SAS, BMDP y R, el más completo


de ellos es el SAS, seguido del SPSS, quedando en último lugar el
BMDP. Sin embargo si se considera el grado de conocimientos del
analista para sacarle el rendimiento a estos paquetes, el que menos
conocimientos requiere es el SPSS, seguido del SAS y el BMDP
quedando en último lugar el R.

Tanto el SPSS y el SAS son capaces de tratar grandes conjuntos de datos,


encontrándose la limitación únicamente en la potencia del computador
que los acoge, el numero de variables que pueden tratar el SPSS y SAS
es del orden de 300,000 y la longitud del fichero prácticamente ilimitada.

Si consideramos la ergonomía de uso, que puede ser un factor


determinante, el mas sencillo de manejar es el SPSS, seguido por el SAS
y el BMDP, en cambio el R requiere tanto conocimientos de
programación así como profundos conocimientos de estadística.

La posibilidad de programar nuestros propios análisis se encuentra


limitada por la potencia del lenguaje de programación de estos paquetes,
es donde el R se destaca claramente de los demás, permitiendo incluso la
incrustación de rutinas hechas en otros lenguajes, el SAS permite
manipulaciones no triviales de datos en su data step, incluso permite
manipulaciones matriciales, pero en general es complicado el acceso
desde programación a los valores de los análisis con el realizados. El
SPSS posee un lenguaje de programación sencillo pero poco potente y no
permite el acceso a los valores de los análisis.
Un programa estadístico es un producto de software que sirve para
realizar tareas estadísticas; y lo que se espera de él que lea los datos,
reciba órdenes  y ejecute el análisis de los mismos.  Los paquetes
estadísticos actuales superan  esas mínimas  de manera que permiten:

a)   Crear nuevas variables

b)   Seleccionar variables y sujetos

c)   Reconocer y generar datos en ASCII

d)   Añadir las variables creadas al archivo en uso

e)   Varios formatos de integración programa-usuario

f)     Controlar aspectos del entorno de trabajo

Dentro de los paquetes estadísticos más utilizados están:

SAS, BMDP, SPSS, SYSTAT, STATISTICA, STATA y, últimamente


están, MINITAB, S-PLUS, EVIEWS, STAT-GRAPHICS y MATLAB.
También se pueden encontrar: R, Past, Open Stat, Genstat Discovery
Editión

SPSS (Statistical Package for The Social Sciences o Paquete


Estadistico para la Ciencias Sociales):

     Este programa, desarrollado en la Universidad de Chicago, es uno de


los más difundidos, Hernández, Fernández y Batista, p: 410.

      Es un paquete Estadístico, de uso general, que integra procedimientos


estadísticos y gráficos iteractivos de alta resolución, de tal manera que
sirve de apoyo al análisis de datos. Es útil entre otros aspectos  para
realizar análisis exploratorio desde el punto de vista gráfico, de igual
manera se utiliza para realizar análisis estadístico simple y/o avanzado.
El programa sirve para profundizar en temas como: Métodos
Cuantitativos, Métodos de Investigación, Segmentación de Mercados,
Finanzas, Inferencia Estadística, Análisis Multivariado, Pronósticos con
series de Tiempo, Métodos Multivariados y otros más.

SAS (Statistical Analysis System)

      Comprende amplias posibilidades de procedimientos estadísticos


(métodos multivariados, regresión múltiple con posibilidades
diagnósticas, análisis de supervivencia con riesgos proporcionales y
regresión logística) y permite cálculos exactos para tablas r x c y
contiene potentes posibilidades gráficas.

· Todos los procedimientos pueden emplearse de una sola ejecución


· Los resultados pueden guardarse como archivos y usarse como
entradas para futuras ejecuciones.
· Es particularmente útil en la gestión de datos y en la redacción de
informes
· Algunos procedimientos tienen varias opciones por lo cual debe
examinarse cuidadosamente el manual antes de seleccionar la
opción deseada.
· SAS ofrece la mayor flexibilidad para personalizar el manejo y
análisis de datos, sin embargo su principal inconveniente es que no
resulta fácil aprender a usarlo.

   BMDP

      Es el más antiguo de los paquetes. El primer manual para BMD


Biomedical Computers Programs se publicó en 1961.En 1975 pasó a
denominarse BMDP. Cubre un amplio abanico de métodos estadísticos
pero su capacidad para manejar datos es limitada, dentro de sus
desventajas se puede mencionar: Sus programas se ejecutan por
separado, solo puede accederse a uno de ellos en cada ejecución.   

  Los resultados de cada programa se pueden guardar en un archivo de


BMDP y utilizarse como entrada en otros programas.

 Diferencias entre los dos Grandes SAS y SPSS:

             1)    Precio
       El precio de SPSS es mucho menor que el del programa SAS, en
torno a la mitad del precio.
            2) Rentabilidad
Recomendable para PYMES (hasta 500 trabajadores), SPSS es la mejor
solución. Para grandes empresas (más de 500 empleados) o aquellas que
puedan permitirse un fuerte desembolso sin necesidad de retorno a corto
plazo, SAS es más rentable que SPSS, ya que permite ejecutar mayor
número de procedimientos estadísticos y operativos.

            3)   Facilidad
          El manejo de SPSS es mucho más sencillo que el de SAS. El
interfaz estilo hoja de cálculo de SPSS y su posibilidad de abrir ventanas
muy comprensivas le convierten en un feo adversario para SAS. No
obstante, SAS, una vez conocido el manejo de su lenguaje de
programación, es más divertido que SPSS.

          4)  Formación

La dependencia absoluta del lenguaje de programación por parte de SAS


le hace muy vulnerable ante necesidades repentinas, ya que obliga a la
Empresa a costear caros programas de formación, con el fin de permitir
que su personal le saque el máximo provecho. SPSS, sin embargo, al ser
mucho más fácil, no encadena al usuario a largos procesos formativos,
sino que, en un tiempo mucho más corto que SAS, puede realizar
complejos procedimientos de análisis sin esfuerzo.

       5)   Robustez
      La dependencia absoluta de Windows por parte de SPSS le hace muy
vulnerable ante "caídas" del sistema, normalmente provocadas por
acciones ilícitas del usuario. El programa SAS, por su parte, al tener su
propio sistema operativo, toma la iniciativa del sistema, una vez
arrancado, no permitiendo que una acción no autorizada por parte del
usuario paralice el trabajo del operario.

También podría gustarte