当运行程序以后SAS系统会产生SAS数据集………………………………………( C ) A. DATA B. NULL C. DATA1 D.程序错误
5.INPUT语句一般用来指定数据的读入方式,可以读取各种类型的数据包括字符型,现有如下的一段程序: DATA ONE;
INPUT NAME $ SCORE; CARDS; Wanglin 85 Zhang dong-feng 90 ;
那么在第二个观测中读取到的NAME 为……………………………………………(B) A. Zhang dong-feng B. Zhang C. Zhang do D. Zhang dong 6.假设变量X的值为5,有如下程序 IF X<5 THEN X=X+3; ELSE X=X-2;
则执行程序以后变量X的值为………………………………………………………( B) A. 5 B.3 C.8 D. 程序错误 7.DATA TEST; DO I=1 TO 3; PUT I= ; END; RUN;
程序结果在LOG窗口输出形式为……………………………………………………( A ) A. I=1 I=2 I=3 B.I=2 I=3 I=4 C. 不显示 D. I=3 I=2 I=1 8.假设变量X1=-10.253 X2=-5 则
[SIGN(X1)+ABS(X2)]/INT(X1)的运算结果为………………………………………( B) A.-4 B.-0.4 C. 4 D.0.575
9.逻辑运算[(5<1)|(4<>2)]&(7>2)的结果为:……………………………………( 1 )
10.以下几个统计量在UNIVARIATE过程中能求得到得而在MEANS过程中无法求得的是………………………………………………………………………………………( B ) A. mean B. var C. Q1 D.range
SAS程序执行过程的窗口
为:…………………………………………………………………PGM窗口
11.SAS系统主要完成以数据为中心的四大功能,其中能够将Excel、Lotus、DBF、TXT等数据转化成SAS数据集属于…………………………… (数据管理功能 )
12. SAS数据集是关系型结构,分成两部分:描述部分和 。……… (数据部分)
13.每一个SAS数据集都是采用两级命名法,第一级为库标记名,第二级为数据集名,两者用“.”隔开。在默认的情况下库标记为…………………………………………( Work) 14.假设变量X的值为5,有如下程序 IF X THEN Y=X; ELSE Y=X-2;
则执行程序以后变量Y的值为………………………………………………………( A ) A. 5 B.3 C.8 D. 程序错误 15.假设变量X1=9 X2=5.752 则
MOD[X1,INT(X2)]/SIGN(X2)的运算结果为…………………………………………( C ) A.-4 B. 0.4 C. 4 D.-0.4
16.对于数值资料的描述性统计量,一般来说分成两种类型:一种是反映中心趋势;一种是反映离散和变异趋势,下列统计量中不是反映中心趋势的是……………( B ) A. 分位数 B.全距(极差) C .众数 D. 中位数 17. proc gplot data=tz;
symbol i=none v=star; plot w * h; run;
以上程序是用gplot过程绘制散点图的程序,结果显示在Graphic窗口中其中横轴和纵轴分别18.建立新的数据库的命令各式为…………………………………(LIBNAME 库名‘路径’) 19.根据下面这段程序 DATA PARTS;
INPUT NAME $ PARTA PARTB X1-X5; TEST=PARTA+PARTB; DROP PARTA PARTB; CARDS;
Zhangsan 25 45 1 2 3 4 5 Lihua 27 53 5 4 3 2 1 ; Run;
所建立的数据集PARTS包含几个变量…………………………………………( A ) A. 7 B. 8 C .9 D. 6
20 INPUT语句一般用来指定数据的读入方式,可以读取各种类型的数据包括字符型,现有如下的一段程序: DATA ONE;
INPUT NAME $ SCORE; CARDS;
Wanglin 85 Zhandong 90 ;
那么在所建立的数据集ONE的记录为……………………………………………( A )
为…………………………………………………………………………………… ( h,w)
A. Wanglin 85 B. Zhandong 90 C. Zhandong 90 D.空表 Wanglin 85
21. .对定量资料的常用统计指标主要有:一种是反应集中趋势的位置度量;一种是反映离散和变异趋势的编译度量,另一种是反应接近正态分布程度分布度量,下列统计量中不是位置度量的是……………………( D )
A. 中位数 B.均值 C .众数 D. 方差 二、填空
1.SAS系统是由三十多个专用程序模块组成的大型集成应用软件系统,主要四大部分构成: SAS数据库部分、 SAS分析核心 、 SAS开发及呈现工具 和其他,其中能提供SAS数据库管理功能的模块是BASE模块。 2.SAS系统中一般用于删除变量的语句是drop语句 它的语句格式是 drop 变量名列表 ;一般来说要保留的变量比较少时用 keep 语句,当要删除的变量比较少时用 keep语句。
3.对于SAS数据集的排序一般是通过 sort 过程来实现的,当要对数据集进行降序排列时要在变量前加上 descending 。
4.SAS中线性回归分析是通过 reg 过程来实现的,当调用此过程时,语句的后面至少有一个 model 语句;在MODEL语句选项中进行残差分析的命令是 R 。
5.SAS(Statistical Analysis System)系统意为统计分析系统,该系统于19年由北卡罗莱纳州立大学开始研制,现在已经形成了模块化、集成化的应用软件,具有完备的数据 数据访问 、 数据管理、 数据分析 和 数据呈现 功能。
6.一般SAS程序分成两部分 数据步和 过程步,在 数据步中可以建立SAS数据集,并实现对SAS数据集的常规操作;在 过程步中可以实现对数据的统计描述和运算。 7.在SAS系统可以通过调用 corr过程来计算变量的相关系数。
8.有一组名为YONGER.TXT的纯文本文件存放在’c:\\sas’目录中,内容如下:
1 M 32 95.5 14.0 53.5 49. 2 M 35 92.0 13.0 52.0 41.61 3 M 33 .0 12.5 53.5 35.81 4 F 30 91.0 11.0 48.0 35.39 5 F 33 91.0 11.5 47.0 44.98 6 F 35 92.4 10.8 49.0 37.42
以XL为名字建立路径为“d:\est”的数据库,在此数据库建立名称为YOU的SAS数据集并且数据来源于yonger.txt中,最后在新建的数据集中将性别是M的记录另建为名为MALE的SAS数据集中。按照上述要求完成下列程序:
Libname XL ’D:\\TEST’; DATA XL.YOU;
infile ’c:\\YONGER.TXT’; INPUT ID X1 $ X2 X3 X4 X5 X6; DATA XL.MALE; SET xl.you ;
IF X1=’M’ THEN output ; RUN;’
9.下图是某班级计算机考试成绩的盒形图
据此可知考试的平均成绩为 84.17 ,中位数为 ,上下四分位数分别为 94 ;和 76 。 三、编程题
1.有一大批糖果,现在从中随机的抽取16袋,称得重量如下:
506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496
设每袋糖果都是近似得服从正态分布,求总体均值的置信水平为0.95的置信区间。 data tg; input x @@; cards;
506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 ;
proc means data=tg clm (alpha=0.05可以不写,系统默认); var x; run;
2. 假定初生婴儿的体重服从正态分布,随机的抽去12名新生婴儿,测其体重为;
3100 2520 3000 3000 3600 3160 3560 3320 2880 2600 3400 20
试用SAS给出新生儿的体重方差的置信区间(置信度为95%)。 data weight; input tz @@; cards;
3100 2520 3000 3000 3600 3160 3560 3320 2880 2600 3400 20 ;
proc means data=weight; output out=ls css=ss n=n; data tci; set ls; df= n-1;
xlchi=cinv(0.025,df); xuchi=cinv(0.975,df); lchi=ss/xlchi; uchi=ss/xuchi; proc print data=tci; var xlchi xuchi lchi uchi; run;
3. 某车间用一台包装机包装葡萄糖,包的袋装糖中是一个随机变量,它服从正态分布,当机器正常运转时候,其均值是0.5公斤,标准差为0.015公斤。某日开工后为了检验包装机是否正常工作。随机的抽取它所包装的糖9袋,称得重量为(公斤):
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512
问机器是否正常工作?(data bz; input x @@; cards;
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 ;
proc means ; var x;
output out=ls mean=xm n=n; data test; set ls; mu=0.5; sigma=0.015;
u=sqrt(n)*abs(xm-mu)/sigma ; p=2*(1-probnorm(u)); if p>0.05 then index=0; else index=1;
proc print data=test; var u p index; run;
当程序运行结果INDEX=0时表示命题不成立,反之命题成立。
4. 有6名儿童的健康资料已经WORD编写成名为CHILD.TXT的纯文本文件存放在’c:\\sas’目录中,内容如下:
1 M 32 95.5 14.0 53.5 49. 2 M 35 92.0 13.0 52.0 41.61 3 M 33 .0 12.5 53.5 35.81 4 F 30 91.0 11.0 48.0 35.39 5 F 33 91.0 11.5 47.0 44.98 6 F 35 92.4 10.8 49.0 37.42
这7列数据对应编号,性别,月龄,身高,体重,胸围和心象面积的观测值。以XL为名建立路径为“d:\est”的数据库,在此数据库建立名称为CHILD的SAS数据集并且数据来源于CHILD.TXT中,最后在新建的数据集中将性别是M的记录另建为名为MALE的SAS数据集中。 LIBNAME XL 'D:\\TEST';
(即检验均值是否为0.5公斤)(用SAS编程运算) 0.05)
DATA XL.CHILD;
INFILE 'c:\\CHILD.TXT';
INPUT ID X1 $ X2 X3 X4 X5 X6; DATA XL.MALE; SET XL.CHILD;
IF X1='M' THEN OUTPUT; RUN;
5.设某工厂一个车间生产的纽扣。其直径据经验服从N(,),其中=5.2,为了判断其均值的置信
2区间,现在抽去容量为100的样本得到子样均值data ci; xbar=26.56; sigma=5.2; n=100;
u=probit(0.975); delta=u*sigma/sqrt(n); lcl=xbar-delta; ucl=xbar+delta; proc print data=ci; var lcl xbar ucl; run;
X=26.56,求均值的95%,的置信区间。 6. 对某一台包装机一段时间内生产的糖果抽取了10个样本进行观测,结果如下:
20.53 20.69 19.45 19.36 19.00 20.10 20.95 19.86 19.41 19.35
已知这台机器生产的糖果的重量服从N(,),其中=20求的水平为95%的置信区间。用SAS编程将计算出的置信上限和下限分别赋值到名为CI的数据集中,并将结果打印到OUTPUT窗口中。 data tg; input x @@; y=(x-20)**2; cards;
20.53 20.69 19.45 19.36 19.00 20.10 20.95 19.86 19.41 19.35 ;
proc means data=tg; var y;
output out=temp mean=Ym n=n; data ci; set temp ; df=n;
xlchi=cinv(0.025,df); xuchi=cinv(0.975,df); lchi=df*Ym/xuchi;
22uchi=df*Ym/xlchi; proc print data=ci; var lchi uchi; run; 或: data tg; input x @@; cards;
20.53 20.69 19.45 19.36 19.00 20.10 20.95 19.86 19.41 19.35 ;
proc means data=tg; var x;
output out=temp css=Ym n=n; data ci; set temp ; df=n;
xlchi=cinv(0.025,df); xuchi=cinv(0.975,df); lchi=Ym/xuchi; uchi=Ym/xlchi; proc print data=ci; var lchi uchi; run;
7.运用SAS编程完成以下问题:8名健康成年男子血液第一小时末红细胞沉降率(mm)分别为3,9,8,6,5,5,5,7和4,用SAS编程计算其均数和标准差。
data a;
input x @@;
cards;
3 9 8 6 5 5 5 7 4
;
run; run;
8.下表为某邮购服务部的部分顾客记录
姓名 性别 地区 日期 金额 章文 男 华东 19960320 1099
王国铭 男 华东 19960519 39 童子敏 女 华北 19960105 986
刘念新 男 东北 19971001 3581 李思今 女 华北 19970404 659 关昭 女 东北 19961105 358 赵霞 女 东北 19980906 2010
①用数据步把此数据输入到SAS 数据集;②编程找出上题中男性顾客购买金额超过1000 的哪些人;③ 把
proc means data=a;
上题数据拆分为包含姓名、性别、地区的一个数据集和包含姓名、日期、金额的一个数据集;④用MERGE 和BY 合并上一步拆开的两个数据集。 ①data record;
input xm $ xb $ dq $ yyyymmdd8 cost; cards;
章文 男 华东 19960320 1099 王国铭 男 华东 19960519 39 童子敏 女 华北 19960105 986 刘念新 男 东北 19971001 3581 ; run; (2)data m;
set record;
if xb='男' and cost >1000 then output; run; (3)data x;
set record ;
keep xm $ xb $ dq $ ; run; data y; set record;
keep xm $ yyyymmdd8 cost; run;
(4) proc sort data=x;
by xm; run;
proc sort data=y; by xm; run; data xy; merge x y; by xm ; run;
9.对120个炉钢中的Si的含量进行检验,得到数据如下:
0.86 0.78 0.83 0.84 0.77 0.84 0.81 0.84 0.81 0.81 0.80 0.81 0.79 0.74 0.82 0.78 0.82 0.78 0.81 0.80 0.81 0.74 0.87 0.78 0.82 0.75 0.78 0.79 0.80 0.85 0.81 0.78 0.87 0.74 0.81 0.71 0.77 0.88 0.78 0.82 0.77 0.76 0.78 0.85 0.77 0.73 0.77 0.78 0.77 0.81 0.71 0.79 0.95 0.77 0.78 0.78 0.81 0.81 0.79 0.87 0.80 0.83 0.77 0.65 0.76 0. 0.82 0.78 0.80 0.75 0.82 0.82 0.84 0.80 0.79 0.80 0.90 0.77 0.82 0.81 0.79 0.75 0.82 0.83 0.79 0.90 0.86 0.80 0.76 0.85 0.78 0.81 0.83 0.77 0.75 0.78 0.82 0.82 0.78 0.84 0.73 0.85 0.83 0.84 0.81 0.82 0.81 0.85 0.83 0.84 0. 0.82 0.81 0.85 0.86 0.84 0.82 0.78 0.82 0.78
应用MEANS过程运算给出这组数据的描述统计量,样本均值,样本方差,标准差,标准误差;极差,变异系数,偏度系数,峰度系数等。将所得结果赋值给名为M的数据集。 proc means data=si; var x;
output out=result mean=x1 var=x2 std=x3 stderr=x4 range=x5 cv=x6 skewness=x7 kurtosis=x8; run;
10.用UNIVARIATE过程计算上题的63.1%和35.2%分位点.,并将所得值赋值给P数据集。 proc univariate data=gang; var x;
output out=p pctlpts=65.4 32.1 pctlpre=P65_4 P32_1; run;
11.利用画图程序画出上题的频数直方图和累计频数直方图,以及它们的对应的百分比图。 proc gchart data=gang; vbar x/type=percent; vbar x/type=cpercent; run;
12.某种元件的寿命X(以小时计)服从正态分布N(如下:
159 280 101 212 224 379 179 2 222 362 168 250 149 260 485 170
问是否有理由认为元件的平均寿命大于225(小时)。(置信水平为0.05) data yj; input x @@; cards;
159 280 101 212 224 379 179 2 222 362 168 250 149 260 485 170 ;
proc means ; var x;
output out=ls mean=xm css=ss n=n; data test; set ls; mu=225; s=sqrt(ss);
tt=sqrt(n)*(xm-mu)/s; ta=tinv(0.05,n-1); if tt>=ta then index=0; else index=1;
proc print data=test; var index;
,2),,2未知。现在测得16只元件的寿命
run;
13.为了研究某种食品的营养价值,用大白鼠做实验,得到大白鼠的进食量X(克)和增加体重Y(克)之间的数据入下表:
动物编号 进食量X(克) 增加体重量Y(克) 1 820 165 2 780 158 3 720 130 4 867 180 5 690 134 6 787 167 7 934 186 8 679 145 9 639 120 10 820 158 运用REG过程作直线回归分析。
data mouse; input x y; cards; 820 165 780 158 720 130 867 180 690 134 787 167 934 186 679 145 639 120 820 158 ; run;
Proc reg data=mouse; Var x y; Model y=x; Run;
14.用SAS 数据步列出10000 以下的素数,写出程序。 见作业
15.某克山病区测得11例克山病患者和13名健康人的血磷值(mmol/L)如下表所示,试求两组的平均血磷值和标准差。 患者组 健康组 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 0. 0. 0. 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.58 1.87 title ‘克山病案例’; data p9; do g= 1 to 2; input n ; do i= 1 to n; input x @@; output ; end; end;
cards; 11
0.84 1.05 1.20 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 13
0. 0. 0. 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.58 1.87 ;
proc means; var x; by g;
output out=M mean=junzhi std=bicha; run;
16.40名麻疹易感儿接种麻疹疫苗后一个月,血凝抑制抗体滴度见下表,计算平均滴度。 抗体滴度 频数 1:4 1 1:32 2 1:256 4 抗体滴度 频数 1:8 5 1: 7 1:512 5 抗体滴度 频数 1:16 6 1:128 10 data ex2; input x f@@; y=log(x); cards;
4 1 32 2 256 4 8 5 7 512 5 16 6 128 10 ;
proc means; var y; freq f;
output out=ex2_1 mean=junzhi; data ex2_2; set ex2_1; g=exp(junzhi); proc print label; var g;
label g=\"geometric mean value(g)\"; run;
17.简述如何将一个文件名为fox.xls文件导入成相同名字SAS数据集。
答:在程序窗口中启动File菜单,选“Import”,这时出现一个选择文件类型的画面,选中标准文件格式(Standard file format),并单击向下箭头打开一个下拉列表,从中选文件格式(例如:“Excel 5 or 7 Spreadsheets(*.xls)”),按Next 钮继续,出现一个选择文件名的画面,可以在文本框中直接输入Excel 文件的全路径名,或按Browse 钮从目录中选取文件。继续后出现选择目标位置的画面,这是要求输入一个结果数据集的名字和数据库位置,数据库已选WORK 我们可以不变,在数据集名处输入fox,按Finish 钮可以生成数据集WORK.fox。 一、SAS系统组成
SAS系统是由三十多个专用程序模块组成的大型集成应用软件系统,有四大部分构成: 1.SAS数据库部分
主要由BASE模块提供常见的数据库管理功能,所有其他模块必须与之结合起来使用。
2.SAS分析核心是SAS系统的灵魂,具有对数据进行分析与决策的功能,这部分主要有STAT、QC、ETS、IML、INSIGHT等模块。 3.SAS开发及呈现工具
主要有AF、EIS、GRAPH模块提供便捷的面向对象的开发工具。
4.SAS分布处理模式及数据仓库设计
主要有ACCESS、CONNECT、SHAPE、WA模块。 二、SAS系统的基本功能
SAS系统主要完成以数据为中心的四大功能。 1.数据管理功能
SAS系统可手工输入数据值,然后把数据组成SAS数据集;它能够方便地将流行的数据格式,如excel、lotus、dbf、txt等转换为SAS数据集。SAS系统提供完备的SAS语句和函数用于数据加工处理,并具有对数据进行编辑、整理、连接和更新等功能。 2.基础统计计算功能
计算简单的描述统计量;对数据进行标准化处理、编程、计算有关统计量;生成并分析列联表;计算概率分布函数、分位数及产生随机数。 3.报表生成和图形显示功能
绘制二维、三维的基本的统计量,如直方图、散点图、曲线图等。4.统计分析功能
SAS的核心功能。提供包括方差分析、相关与回归分析、属性数据分析、判别与聚类分析等统计分析过程。
三、SAS系统的模块组成
与统计分析和数据管理有关的SAS主要常用模块及功能为: 1.BASE模块
进行数据管理和数据加工、处理。 2.Stat模块
完整的统计分析模块,可对数据 进行单因素、多因素分析。 3.Graph模块
可完成多种绘图功能 4.Insight模块 进行数据探索性分析 5.Iml模块
提供功能强大的矩阵运算,用户 可根据需要编写程序,完成特定的矩阵运算。 用“分析家”计算统计量 1)启动“分析家”
选择主菜单“Solutions(解决方案)”→“Analysis(分析)”→“Analyst(分析家)”,打开“分析家”窗口。
选择主菜单“File(文件)”→“按SAS名称打开”,打开“选择成员”对话框,选择数据集。 2)通过Summary Statistics菜单计算描述性统计量
选择主菜单“Statistics(统计)”→“Descriptive(描述性统计)”→“Summary Statistics(汇总统计量)”,打开“Summary Statistics”对话框,选择变量列表中分析变量,单击“Analysis”按钮,选定分析变量
单击“Statistics”按钮,打开“Summary Statistics:Statistics”对话框。对话框中列出可以计算的所有统计量。
3) 通过Distributions菜单计算描述性统计量
选择主菜单“Statistics(统计)”→“Descriptive(描述性统计)”→“Distributions(分布)”,打开“Distributions”对话框,选择变量列表中的分析变量,单击“Analysis”按钮。单击“OK”按钮,即可得到关于分析变量的矩统计量和基本统计测度。 用INSIGHT计算统计量 1)在INSIGHT中打开数据集
在菜单中选择“Solution(解决方案)”→“Analysis(分析)”→“Interactive Data Analysis(交互式数据分析)”,打开“SAS/INSIGHT Open”对话框,在对话框中选择数据集,单击“Open(打开)”按钮,即可在INSIGHT中打开数据窗口
2)选择菜单“Analyze(分析)”→“Distribution (Y)(分布)”,打开“Distribution (Y)”对话框。在
数据集的变量列表中,选择分析变量X、分组变量Y。(注意:分组变量就是那种可以区别不同种类的变量,例如地区编号、科目、组号等等,而分析变量一般是需要分析的数据,例如成绩,身高书目) 3)单击“Output(输出)”按钮,在打开的对话框中包含描述性统计量选项。
4) 选择选项矩统计量和分位数,取消默认的选项:“Box Plot/Mosaic Plot”和“Histogram/Bar Chart”,单击“OK”按钮,即可得到变量按分组的各种矩统计量(Moments)和分位数(Quantiles) *描述性统计选项:Moments 矩统计量 Quantiles分位数 Basic Confidence Intervals 基本置信区间
Tests for Location 位置检验 Frequency Counts 频数统计 Robust Measures of Scale 尺度的稳健估计 Tests for Normality 正态性检验 第117第1题
(1)proc print data=sasuser.business noobs label;
var company nation industry employs sales profits; label company='公司' nation='国家' industry='部门' employs='雇员数' sales='销售额' profits='利润'; run;
(2)proc sort data=sasuser.business;
by nation industry descending sales;
run;
proc print data=sasuser.business ;
var company sales profits; run;
如果按国家为单位求总和,程序为:
sum sales;
proc sort data=sasuser.business;
by nation;
run;
proc print data=sasuser.business ;
by nation; run;
sum sales;
(3) proc tabulate data=sasuser.business;
class nation industry;
var sales;
table (nation 'all'='总计'),(industry all)*sales*('sum'='总计') ; run;
1.某研究所应用放射免疫疗法测定了84例病人病毒抗体浓度,数据如下:
抗体浓度 1 病人数 程序为: data ex2; input x f@@; y=log(x); cards;
2.5 10 40 160 0
14 18 22 12 6
12
label nation='国家' industry='部门' sales='销售额';
试求其平均抗体浓度?(这里平均指几何平均: 个正数 的几何平均数为 )
1 12 2.5 14 10 18 40 22 160 12 0 6 ;
proc means; var y; freq f;
output out=ex2_1 mean=junzhi; data ex2_2; set ex2_1; g=exp(junzhi); proc print label; var g;
label g=\"geometric mean value(g)\"; run;
对24个炉钢中的Si的含量进行检验,得到数据如下:
0.86 0.78 0.83 0.84 0.77 0.84 0.81 0.84 0.81 0.81 0.80 0.81 0.79 0.74 0.82 0.78 0.82 0.78 0.81 0.80 0.81 0.74 0.87 0.78
(1)用UNIVARIATE 过程计算这组数据的的四分位距,65.4%和32.1分位数,将这些结果赋值给名为result的数据集。
(2)利用画图程序画出样本的频数直方图。 程序为: (1) data gang; input x @@; cards;
0.86 0.78 0.83 0.84 0.77 0.84 0.81 0.84 0.81 0.81 0.80 0.81 0.79 0.74 0.82 0.78 0.82 0.78 0.81 0.80 0.81 0.74 0.87 0.78 ; run;
proc univariate data=gang; var x;
output out=result qrange=q pctlpts=65.4 32.1 pctlpre=P65_4 P32_1 mean=m var=v range=r; run;
proc print data=result; run; (2)
proc gchart data=gang; vbar x/type=percent; vbar x/type=cpercent; run; p118第6题 data f_dis;
do x=-1 to 10 by 0.1; y1=pdf(\"f\ y2=pdf(\"f\ y3=pdf(\"f\ y4=pdf(\"f\
y5=pdf(\"f\ y6=pdf(\"f\ output; end; run;
proc gplot data=f_dis;
symbol1 color=red i=join v=none line=1; symbol2 color=blue i=join v=none line=2; symbol3 color=yellow i=join v=none line=3; symbol4 color=black i=join v=none line=4; symbol5 color=green i=join v=none line=5; symbol6 color=grey i=join v=none line=6;
plot y1*x=1 y2*x=2 y3*x=3 y4*x=4 y5*x=5 y6*x=6/overlay; run;
1.逻辑运算[(5<1)|(4<>2)]&(7>2)的结果为:…………………………………… (A ) A. 1 B.0 C.-1 D.其他 2. data ; x=0; y=sin(x);
put\"sin function value of \" x \" is \"y; run;
以上程序运行之后在LOG窗口得到的结论是……………………………………… ( D ) A. 1 0
B. sin function value of x is 0 C. sin function value of x is y D. sin function value of 0 is 0 3. 如下一段SAS程序: DATA a; X=3;
IF X>5 THEN DO; Y=X*10; PUT X= Y= ; END;
PUT \" X= \" X; RUN;
当运行程序可以在LOG 窗口中看到…………………………………………………( C ) A.X=3 Y=30 X=3 B. X=3 Y=30 C. X=3 D.程序错误 4. 假设变量X的值为5,有如下程序 IF X<5 THEN X=X+3; ELSE X=X-2;
则执行程序以后变量X的值为………………………………………………………( B) A. 5 B.3 C.8 D. 程序错误
5编程输出sin0.5, 分别等于多少,请把结果保留6位小数,并把结果分别显示在LOG窗口,OUTPUT窗口和保存在C:\\USER目录下,文件名为tmp.out 在output窗口显示:
data;
x=0.5;
y=sin(x);
z=y*y;
file print;
put 'Sine function value of sin(x)' x 12.6 'is ' y 10.6; run; 在LOG窗口显示:
put 'Sine function value of sin(x)^2' x 10.6 'is ' y 10.6;
data;
x=0.5;
y=sin(x);
z=y*y;
put 'Sine function value of sin(x)' x 12.6 'is ' y 10.6; run;
保存在C:\,"p":{"h":13.5,"w":33.727,"x":199.29,"y":460.258,"z":22},"ps":null,"t":"word目录下
put 'Sine function value of sin(x)^2' x 10.6 'is ' y 10.6;
data;
x=0.5; z=y*y;
y=sin(x);
file “C:\\USER\\TMP.OUT”;
put 'Sine function value of sin(x)' x 12.6 'is ' y 10.6; run;
2.2.3 分支结构
请用if条件then语句编程:
1. 如果x>0,则输出x为正数,且将x加倍并显示其值; 2. 如果x>0,则输出x为正数,为负将x取绝对值;
3. 如果年龄小于等于12岁,显示少年,大于12岁小于35 显示青年,大于35岁小于45岁中年,否则出错。
put 'Sine function value of sin(x)^2' x 10.6 'is ' y 10.6;
1.IF x>0 THEN DO;
PUT ' X为正数';
x = 2*x;
PUT x=;
END;
2.IF x>=0 THEN x=2*x; 3.SELECT;
WHEN(age<=12) put '少年'; WHEN(age<35) put '青年'; OTHERWISE put '中老年';
ELSE x = -x;
END; 2.2.4循环结构 编程:
1. 写出5、10、15、20、……、95的平方表;如果平方大于5000就停止循环。、
data;
DO i = 5 TO 95;
j = i**2;
put i 3. j 5.;
if j>5000 then leave; run;
2. 判断2333是不是素数。
END;
data;
x=2333;
i=3;
DO WHILE (mod(x,i) ^= 0);
i=i+2;
END;
if i else put x '是素数'; data twotest; input id test1 test2 @@; difft=test1-test2; 1 93 98 2 88 74 3 67 4 88 92 5 67 83 6 90 7 83 74 8 94 97 9 96 10 55 81 11 88 83 12 91 94 13 85 14 70 78 15 90 96 16 90 93 17 94 81 18 67 81 19 87 93 20 83 91 cards; ; run; proc univariate data= twotest; var difft; run; P158 第5题 data enzyme; input group $ level @@; cards; d 0.2 d 10.4 d 0.3 d 10.9 d 0.4 d 11.3 d 1.1 d 12.4 d 2.0 d 16.2 d 2.1 d 17.6 d 3.3 d 18.9 d 3.8 d 20.7 d 4.5 d 24.0 d 4.8 d 25.4 d 4.9 d 40.0 d 5.0 d 42.2 d 5.3 d 50.0 d 7.5 d 60.0 d 9.8 n 0.2 n 5.4 n 0.3 n 5.7 n 0.4 n 5.8 n 0.7 n 7.5 n 1.2 n 8.7 n 1.5 n 8.8 n 1.5 n 9.1 n 1.9 n 10.3 n 2.0 n 15.6 n 2.4 n 16.1 n 2.5 n 16.5 n 2.8 n 16.7 n 3.6 n 20.0 n 4.8 n 20.7 n 4.8 n 33.0 ; run; 为了确保是否可以使用两样本 t检验,对 level 进行正态性检验。 proc univariate data=enzyme normal; class group; var level; run; 首选 Shapiro-Wilk 检验,可以看到两总体正态性的 p值很小,所以在 0.05 水平下拒绝原假设,即认为 level 分布是非正态的。 这样,只能进行两总体参数检验 proc npar1way data=enzyme wilcoxon; class group; var level; run; t检验p值大于0.05,即在0.05水平下,不能拒绝原假设,即不能否认两次考试难度相同 看到Wilcoxon检验中用正态近似得到Prob > |Z|的p值为0.1096,结果不显著,就可以为两组人的酶水平在0.05水平下无显著差异。 P158 第7题 data naitest; input norm high @@; difft=norm-high; cards; 14.7 12.1 14.0 10.9 12.9 13.1 16.2 14.5 10.2 9.6 12.4 11.2 12.0 9.8 14.8 13.7 11.8 12.0 9.7 9.1 ; run; proc univariate data=naitestn; var difft; run; 运行结果: Table 40Tests for Location: Mu0=0TestsforLocation:Mu0=0 Test Student's t Sign Signed Rank P159 第13题 proc reg data=sasuser.fitness; var oxygen age weight runtime rstpulse runpulse maxpulse; model oxygen=age weight runtime rstpulse runpulse maxpulse; run; model oxygen=age weight runtime rstpulse runpulse maxpulse / selection=cp; run; model oxygen=age runtime runpulse maxpulse; run; quit; 注:用CP统计量筛选进行优化。 P160 第7题 data return; do temp=1 to 3; do pres=1 to 4; do r=1 to 2; input return @@; output; end; end; end; cards; 52 57 42 45 41 45 48 45 50 52 47 45 47 48 53 30 t M S Statistic 3.56511 3 24.5 p Value Pr > |t| Pr >= |M| Pr >= |S| 0.0061 0.1094 0.0078 即使使用功效低的符号秩检验,在0.05的水平下拒绝原假设,即两种方法有显著差异。 63 58 59 57 60 58 59 ; run; proc anova data=littlelu.return; class temp pres; model return=temp pres temp*pres; run; 只有温度的Pr>F小于0.05,故只有温度对收率影响显著。 P160第18题 data crime; input nation $ guilty $ numcell; cards; black yes 17 black no 149 white yes 19 white no 141 ; proc freq data=crime; tables guilty*nation / nopct norow nocol chisq expected; weight numcell; run; 不显著,所以没有关系 因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- oldu.cn 版权所有 浙ICP备2024123271号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务