2.1 Foundation SAS
正如上一章所提及的,我们大部分人首先接触的、日常使用的都是Windows平台下的SAS视窗管理系统DMS。我们通过DMS与Foundation SAS进行交互,从而完成我们的工作。
→2.1.1 Foundation SAS的构成
在Windows下可以看到SASHOME安装目录下有SASFoundation文件夹,里面包含了诸如ACCESS、BASE、GRAPH等诸多组件。正如第一章所提及的,其实整个Foundation就是由Base SAS、数据管理与访问、用户界面、报告与绘图、分析、可视化与发现、商业解决方案、应用开发以及网络应用等组件构成的(见图2-1)。
图2-1 Foundation SAS的组件
概括而言,Foundation SAS提供了以下功能:
● 管理SAS任务的图形用户界面,如DMS、EG、SAS Studio等
● 高度灵活、可扩展的编程语言,即SAS语言
● 丰富的内置SAS过程
● Windows、UNIX以及z/OS(OS/390)的多平台运行
● 几乎任何数据源的访问,如DB2、Oracle、SYBASE、Teradata、SAP以及微软的Excel
● 几乎所有主流的字符编码
→2.1.2 Base SAS
Base SAS是Foundation SAS的核心,是运行SAS必备模块,由DATA步、PROC步、MACRO、DATA步调试器、ODS以及SAS窗口环境组成。
● DATA步:是由用于操作管理数据的编程语言组成的,SAS编程优势的集中体现之一就是DATA步编程。
● PROC步(SAS Procedures):是数据处理、统计分析与结果呈现的工具。BASE SAS里的SAS过程有限,欲完成特定的处理和任务,需要加载特定模块,如SAS/STAT、SAS/ETS、SAS/IML等。
● 宏(Macro Facility):宏的本质是文本替换,它可扩展和定制SAS程序,完成重复、复杂的任务。
● DATA步调试器:追踪DATA步执行情况,便于查找DATA步的运行错误。
● 输出传递系统(Output Delivery System, ODS):将SAS输出以易访问的格式输出,如列表输出(LISTING)、HTML输出、富文本输出(RTF)、PDF输出以及以数据集形式输出等。
● SAS窗口环境:开发测试SAS程序的环境,最为广泛的是SAS视窗管理系统(DMS)。
DATA步、PROC步和MACRO是SAS程序的三大核心。通常我们说写SAS程序就是:在DMS的高级程序编辑器里编写SAS的DATA步、PROC步以及宏。不过,在写SAS程序之前,我们先熟悉下SAS处理数据的流程。