Entries Tagged 'S:R&S-PLUS' ↓

(又一次)狭路相逢(?): SAS和R

我有个担心,SAS在国内甚至都没有兴起过,但在校生可能就不愿学它,或者没机会学它了。所以我业余生活的一块,就是在国内R用户最密集的社区,“统计之都”(cos.name),低调低调鼓吹SAS

要声明一下,我对R印象也非常好,身边很多朋友用R,大多在高校,也有在职的。我个人机器里装了R,也用R自学过些数据挖掘,但用得都不够深入,自然是没有底气评价它如何如何,我关注R的行业新闻要多于R本身。不过想身边这么多聪明的大脑都用R,凭他们的品味,R一定不错。关于SAS和R,我的主要意思是,为了找工作的便利,学点SAS吧,又不是什么水火不容。想,有这么多也不笨的大脑,这么多也受人尊重的公司,不用说,SAS也是不赖的东西。

在R面前提SAS,我的语气一般会很谦虚。为什么?因为SAS跟R相比,是太不对称了。现在SAS系统9.2,代码量是1600万行,跟R比赢了是胜之不武,输了就很没面子。所以在“虚拟的”R与SAS之争中,R用户天然占优势地位。

现在SAS用户有一个直接与R用户沟通的机会,“第四届中国R语言会议”,2011年5月28日~29日,人民大学,现在有18个话题:

1    赵毅    R与.NET混合编程及其在化学计量学中的应用
2    李青龙    R与VBA混合编程
3    王洪月    SAS Interation With R
4    胡江堂    R vs SAS

5    颜林林    R的高级编程技巧及Rcpp的介绍
6    李舰    R与高性能运算
7    张金龙    系统发育比较方法方面
8    张雯    R对物种的进化关系进行分析
9    曹宗富    基于R Bioconductor进行生物芯片数据分析
10    曹飞    R在生物信息学中的应用
11    卢一鸣    Lasso算法在高通量生物数据处理中的应用
12    李欣海    R在生物统计教学方面的应用
13    肖嘉敏    基于R的网络用户行为研究
14    祝迎春    R在择偶上的应用
15    邓一硕    R在计量金融的应用
16    林伟林    R在套利中的应用
17    李颖    R相关书籍的出版
18    张伟平    MCMC方法在R中的实现

到时我会把这场“虚拟的”R与SAS之争直接带到会场。王洪月是我的前同事,来自SAS中国研发中心,我很期待他关于SAS 9.2中跟R交互的内容,这才是最积极的正面举动。

又,看现在收到的话题,刨去3、4两个关于SAS的,总结一下,生物信息和social network这块,还真是很火啊:

R与其他语言交互,包括.net、VBA和C++: 1、2、5,

高性能运算:6,这对SAS来说,也是很火的话题

生物:8、9、10、11、12

SNS:13、14

金融:15、16

算法:18,MCMC

其他:17

S语言:棕皮书、蓝皮书、白皮书和绿皮书

S语言由AT&T的贝尔实验室的Rick Becker和John Chambers于上世纪八十年代初期所创,1976年被认为是S诞生的年份。几年后Allan Wilks成为这个研发组织的核心成员,所以提到S,我们都是把这三个科学家并举。有趣的是,S的发展过程中,每一个重要版本都伴随有一个著名的皮书,如棕皮书、蓝皮书、白皮书、绿皮书之类。这东西就是圈内的一种乐趣了,就相当于提起语言/分析哲学家维特根斯坦,我们就津津乐道起他著名的《棕色笔记本》、《蓝色笔记本》之类的哲学笔记。

1984年,S语言正逐渐被人接受,第一本参考手册就被称为棕皮书(Brown Book),就是由Becker和Chambers合著的S: An Interactive Enviroment for Data Analysis and Graphics (Published by Wadsworth &Brooks/Cole, Pacific Grove, CA,1984)。

1988年,S语言的编程方式有多处变化,最重要的是其中的宏(macro)被函数概念(function)替代,蓝皮书(Blue Book)于是面世,它由Becker、Chambers、Wilks合著:The New S Language (Published by Wadsworth &Brooks/Cole, Pacific Grove, CA,1988)。

接下来的几年,更多的函数被嵌入S语言,并且也引入了面对对象的程序设计方式,白皮书(White Book)记载了这些变化,它由Becker和T.J Hastie编著:Statistical Models in S (Published by Wadsworth &Brooks/Cole, Pacific Grove, CA,1992)。

1998年,S的第四版问世,面向对象的构造方式已经成为S语言的基础,这个革命性的变化体现在Chambers的Programming with Data: A Guide to the S Language (Published by Springer-Verlag, New York, 1998),这就是S发展史上最著名的绿皮书(Green Book)。

Technorati Tags: , , , , , , ,