El Sistema Sas. - Instituto Nacional De Estadistica.

Preview only show first 6 pages with water mark for full document please download

Transcript

ESTADISTICA ESPAÑOLA núm. 1 14, 1987, págs. 203 a^06 C RI TICA D E PRO G RAMAS D E ORD E NADOR EI siste m a SAS por PEDRO DIAZ Instituto Nacio^al de Estadistica EI Sistema SAS ha ido evolucionando desde un sistema estadístico con una gran flexibilidad para la lectura de datos a un lenguaje más general que permite su utilización en campos muy alejados de aquel para el que inicialmente se desarrolló, convirtiéndose por tanto en una herramienta que puede cubrir gran parte de las necesidades de programación de usuarios tanto informáticos como no informáticos de un centro de cálculo. En la presente nota doy una visión general del SAS haciendo especial énfasis en aquellos aspectos del sistema que lo diferencian de otros paquetes estríctamente estadísticos. A lo largo de ella me refiero a la versión SAS 5.1 b, última que ha sido comercializada. EL .SA S CO Mt^ PA Q LIE TE ES TA DI S TI CO SAS realiza todas las funciones típicas de un paquete estadístico integrado moderno. A saber: - Lectura de datos. Es aquí donde está la mayor capacidad de este sistema ya que el módulo de lectura de datos puede programarse de forma muy flexible aceptando una inmensa variedad de formatas de entrada y de organizaciones de ficheros (VSAM, ISAM, secuencial). Esta programación puede efectuarse de forma que parte de los datos de entrada determinen el formato de los registros subsiguientes. - Transformación de dutos de entrada. Una vez leídos, los datos pueden ser transformados mediante operaciones algebraícas o las funciones matemáticas rnás usuales que el sistema tiene incorporadas. ^ oa ESTADISTI(^A ESPA!^i(7L,A C'reaci^^n de ..Jlchervs de jormalc^ rnternv. Los datos leídos y transformados pueden ser almacenados en flcheros SAS en forma de tabla variables/observaciones. Estas son leídas por el sistema en posteriores ejecuciones de forma rápida y pueden combinarse para generar nuevas conjuntos de datos. Ejecución de procedirnientvs estadísticos. Existe una amplia gama de procedimientos que operan sobre las tablas variables/observaciones introducidas en el sistema. Estos procedimienios cubren to^das las áreas de la estadística tanto descriptiva como inferencial. En muchos casos, el resultado de un procedimiento puede ser utilizado como entrada para otro procedimiento subsiguiente. Producción de salidas. Es posible producir tablas o gráficos o partir de los datos introducidos y transformados. El usuario puede, mediante el manejo de distintas opciones, llegar a obtener salidas de un alto nivel de calidad. L'L SAS C'OMO LL'NG UAJE GENERAL Como ya he dicho antes, el SAS ha evolucionado hacia un lenguaje que puede ser utilizado para f nes no estadísticos. Las lineas de desarrollo que tiene actualmente abiertas el fabricante indican que esta tendencia se irá consolidando en el futuro. Las componentes básicas que permiten esta nueva función de SAS son: el mcídulv de lectura de clatvs. Este módulo admite expresiones matemáticas, instrucciones de transferencia de control y bloques del tipo DO... END e IF... THEN... ELSE. Combinando dichas instrucciones con la flexibilidad en la lectura de ficheros mencionada anteriorrnente se pueden generar programas con un elevado nivel de estructuración. El len,^uaje matrrcial. Este permite manipular matrices completas como entidades individuales. Las operaciones más usuales entre matrices pueden ser así programadas mediante instrucciones senci l las. ^'1 lenguaje de 11^lacrcas. Mediante él se pueden escribir bloques de instrucciones SAS con campos variables que son sustituidos durante la ejecución del programa. Algunc^s prcacedrrnient^s espc=ciales. Tales como los de utilidad que permiten realizar funciones del Sistema Qperativo, los de ordenación de datos, los de tabulación, etcétera... C:'R[TICA DE PROGRAMAS DE ORDENAI^UR 205 L+DS MDD U'LO.S 1?EL S.9 S La gran diversificación que ha experimentado el sistema ha aconsejado al fabrícante dividirla en distintos módulos que pueden ser adquiridos separadarnente. Los más ímportantes san: SASIBASIC, SAS/STATISTICS. Estos contienen los elementos básicos del sistema (en particular el módulo de lectura de datos, el lenguaje de Macros, los procedin^ientos estadísticos y especiales). SASIETS. C'onjunto de procedimientos econométricos y de análisis y predicción de series de tiempo. SAS/OR. Contiene procedímientos de investigación operativa (programacián lineal, análisis de caminos criticos, etcétera...) SASIQC. Contiene procedimientos de control de calidad estadístico. SAS/IML. Este es el módulo del lenguaje matrical. SAS/GRAPH. Permite la obtención de gráficos en color sobre una gran variedad de d1spOSIt1VOS. SAS/AF. Herramienta que facilíta el desarrallo de aplicaciones interactivas en SAS mediante la creación de menús. SAS/FSP. Permite la introducción, edición y consulta de datos medíante pantallas. Incluye también una hoja electránica y tratamiento de texto. Asimismo existen otros módulos que permiten conectar SAS con diversas bases de datos comerciales (DB2, SQL, DL/I). Estos módulos contienen procedimentos que permiten extraer conjuntos de datos de díchas bases e introducirlos en SAS como f cheros internos y viceversa. EL PC- SA S' Recientemente ha sído lanzada al mercado una versión de SAS para PC's bajo el sístema operativo DC^S. Esta versión, escrita en lenguaje C, contiene de momento los módulos BASIC, STAT, IML, aunque muy próximamente se espera incorporar AF, FSP y GRAPH. El SAS Institute proyecta usar el lenguaje C como la base para todos sus desarrollos futuros. Así la próxíma versión sobre «mainframes» (SAS 6), estará también escrita en dicho lenguaje. El objetivo a medio plazo es que todas las versiones de SAS para los distintos ordenadores sean idénticas salvo un mádulo de interfase que dependerá del ordenador y sistema operativo sobre el que se quiere implernentar. ^ob ESTADI5TICA ESPAÑOLA C}esde el punto de vista sintáctico, no hay diferencias entre el SAS para ordenadores grandes y PC-SAS. Por tanto, un programa escrito para un PC puede ejecutarse en un mainfrase y viceversa. Esto ofrece obviarnente grandes ventajas con respecto a la formación de los usuarios, desarrollo e intercambio de programas... Por otra parte, los ficheros internos de SAS pueden ser facilmente transferidos mediante utilidades a través de una línea que conecte a un PC con el correspondiente "host". COMENTA^IDS ^'INALES La evolución de SAS hacia un lenguaje de propósito general es altamente positiva ya que puede permitir su utilización en una parte importante de las aplicaciones de un centro de cálculo de una oficina estadística con el correspondiente ahorro en tiempo de desarrolio de dichas aplicaciones. Además, con la llegada del PC-SAS, se abre plenamente a los usuarios finales Ia posíbi lidad de usar este sistema. De consolidarse ambas tendencias, SAS puede convertirse en un producto que, soportado por un Centro de Información, satisfaga en gr2n rnedida las necesidades de programación de los usuarios informáticos y no informáticos. Una situación ideal sería aquella en que los usuarios, conectados al ordenador central a través de ordenadores personales, pudieran usar PC-SAS en modo local para realizar ejecuciones cortas y pruebas y el "host" para los casos que utilizaran gran volumen de datos o necesitaran un largo tiempo de ejecución. La compatibilidad sintáctica del SAS en los modos local y rernoto facilitaría grandemente esta flexibilidad de uso. Sin embargo, esta evolución de SAS no deja de tener sus contrapartidas. Por una parte un cierto abandono, por parte del fabricante, de nuevos desarrollos de procedimientos estadísticos. Por otra parte una progresiva complicación en el lenguaje de SAS que puede desanimar de su aprendizaje a usuarios con reducida formación informática. Finalmente, existe aún poca experiencia en el uso de PC-SAS, en particular en la eficiencia con que este paquete usa los recursos del ordenador personal (espacio en disco, memoria, tiempo de proceso). El papel que juega SAS en una organización estadística, en la que coexisten usuarios fínales y anaiistas informáticos, dependerá en gran medida de cómo se vayan resolviendo las cuestiones planteadas en este párrafo. REViSTA ESTADISTICA ESPAÑOLA IN^'ORhrIACíON PAR.A LC?S AUTORES Envia de originales Los originales deben enviarse al Director de la Revista, INE, Paseo de la Castellana, 183. 28071 Madrid. Deben estar redactados en castellano y no haber sido publicados o estar en proceso de publicación en otro lugar. Se enviarán 4 copias del trabajo y Ia revista acusará siempre su recibo. PRESENTACION DE LOS MANUSCRIT'OS Estructura La primera página debe incluir exclusivamente el título del artículo y el nombre, dirección completa y teléfono del autor. En el caso de varios autores se indicará a quién debe dirigirse la correspondenc'ra, La segunda página contendrá únicamente el título y resumen del trabajo de un máximo de 100 palabras, seguida de 3 a 6 palabras clave y la clasificación AMS del artículo. EI texto del artículo cornenzará en la tercera página. La última página del original contendrá en inglés el título del artíeulo, un resumen del mismo bajo el epígrafe Summary y las palabras clave. EI manuscrito debe mecanog,rafiarse a doble espacio. (^ráficos Todos los diagrarnas o gráficos se numerarán sucesivamente y se indicará su posición en el texto con el nombre de figura. Se colocarán al final del manuscrito y deberán ser de la calidad necesaria para su reproducción. Referencia E1 sistema de referencia a seguir es el oficial del International Statistical Institute. Los autores se citarán en el texto por su nombre, seguido de la fecha de publicación; ejemplo: Box (198b), y las referencias se situarán en orden alfabético al final del texto, com^ sigue: a) b) Lihr©s: Weisberg, S. (1985}. Applied Linear Regressi©n, New York: V^íley. Artlculos: Mahalanobis, F. c. (1950). Why Statistics`? Sankhya, l0, 195-228. Trabajos en nhras colectivas: Box, G. E. P. (1953 ). An Apology for Ecumenism c) in Statistics. Scientific Inference, Úata Analysis anci Robutsness, Ed. C. E. P, , Leonard, T. y Wu, C'. F., pp. 51-84. New York: Academic-Press. Fvaluación t!e los or^ginales L.os originales serán sometidos a un proceso de evaluación garantizando el anonimato tanto del autor como de los evaluadores. E1 objetivo de la revista es que el autor reciba información sobre el resultado de la evaluación en un plazo máximo de tres meses. Pruebas y separatas Aceptado el artículo y antes de su publicacic5n definitiva, el autor o autores recibirá 2 juegos de pruebas para correcciones, uno de los cuales deberá devolver corregido a la 1?evista en un plazo de una semana desde su recepcián. Una vez publicado, recibirá 25 separatas de su trabajo. Los posibles costes de impresión derivados de cualquier modificacián de la versián final aceptada del manuscrito o de retraso en la correccic^n de pruebas serán a cargo del autor o autores del mismo.