Entries Tagged '胡说' ↓
January 4th, 2010 — SAS, 人物, 统计备忘录, 胡说
把以前在space写的文字都导入到这个新博客里了。
这新得白花花扎眼的一年,还想多写些关于SAS程序员本身的文字,关于这个职业,它依托的行业环境等等。SAS程序员在国内还不是一个很兴盛的职业。
还会有关于SAS本身的文字,关于SAS语言,SAS公司,关于它的创始人等等。最近我对SAS的创始人Tony Barr比较感兴趣。
技术本身,这个跟饭碗相关,除了SAS技术,很多笔墨可能会停留在CDISC上面。当然还会有自个兴之所至的其他文字,才年初呢,啥都没定。作为跟“统计之都”的约定,所有跟统计相关的文字,我会首先发布到“统计之都”,然后在自个的博客做个备份:
http://cos.name/author/hujiangtang/
April 2nd, 2008 — 胡说
好些日子没能更新这个博客,转一个我生活博客里的好玩东西,关于“男女不均衡和希尔伯特的旅馆”:
********************************************************************
看一个大龄相亲的报道。不均衡的几千万男性同胞,是祖国和人民的一大关注热点。有好事者提议,比如,现在的30岁男,俯视下一代,找个20岁女,到下一辈的30岁男,如法炮制,也找20岁女下手,如果循环往复,神州大地就不存在男女比例不平衡的问题了。咋一听,还以为到了希尔伯特的旅馆。
说,有个人去投宿,但那家旅馆已经满员了,意思是,比如,这家旅馆有很多层,每层就一个房间,每个房间都住了一位客人,是为满员。但旅馆老板有办法,让这个投宿的客人安心入住。首先,他就把这个客人安排在第一层,把原先住在第一层的客人安排到第二层,把原先在第二层的客人安排在第三层,就这么一直挪过去。记住,刚才我们说这家旅馆有很多层,很多的意思是,你总有办法把客人一层一层往上挪,这样,那位原先以为住不到店的客人也就能安排好了。这家旅馆就叫做“希尔伯特的旅馆”,希尔伯特是一个数学家的名字。
理解希尔伯特的旅馆,可以举个例子,比如,有两个无穷可数的数列,一是自然数列,二是偶数数列。无穷是说,这个自然数列从1、2、3、4、5、6、7、8、……等等一直持续下去,这个偶数数列2、4、6、8、…… 也是一直持续下去,可数是说,虽然上面两个数列是无穷的,但是你有兴致,却可以掰着手指头一二三四地跟着数下去。不可数的,比如在数轴上分布得密密麻麻的实数数列,一会是1.1,一会是1.111111111111111111111111111111111111,就叫人没法跟着数了。
扯远了,还是刚才两个无穷数列
A: 1、2、3、4、5、6、7、8、……
B: 2、4、6、8、……
如果有像A数列展示一样多的旅客,而只有B数列一样多的房间,看着似乎就有一半的人住不了店了(每个房间只能住一个人)。——如果你真的这么想,就要想想上面的希尔伯特旅馆,看看如何有办法让A数列多的人住进B数列多的房间:
A: 1、2、3、4、5、6、7、8、……
B: 2、4、6、8、10、12、14、16……
方案是这样的,想像一下客人全部以自然数列编号,房间都是偶数号,就让编号为1的客人住在B中编号为2的房间,客人2住4号房间,客人3住6号房间,这么一个个数过去,所有的客人都能住上店了。上面的事实有一个惊人的结论,即A数列和B数列,在某种计数下,竟然是一一对应的。一一对应,自然每个客人就都有自己的房间了。说“某种计数”,是按上面的匹配程序走,不是我们一般说的个数。
扯更远了,希尔伯特的旅馆是没问题的。接下来我是想驳斥上面说的循环往复解决男女不平衡问题,那纯粹是扯淡,跟希尔伯特的旅馆,只是有些似是而非的联系。我要睡了(我已发现此命题的一个真正奇妙的证明,但是这页边空白太小,写不下这个证明。……)
February 26th, 2008 — 胡说
January 14th, 2008 — 胡说
这样子的整理,本该是07年末的事,以后也这样随手摆出来了:
************************“技止于此”文章目录,从2007年3月15到2008年1月14************************
46- SAS和蒙特卡罗模拟(2):随机数基础
45- SAS Tips &Tricks:按组求累加值
44- SAS和蒙特卡罗模拟(1):开篇
43- SAS程序员必备的十大技巧
42- Excel债券计算函数
41- 金融随机过程:备忘录
40- Paul Wilmott’s Books on Quantitative Finance
39- BNF标记法:简介
38- SQL——在Oracle SQL*Plus里工作(1):基础篇
37- 常见数据挖掘错误:识别和纠正(译稿)
36- SAS Base 金融函数
35- 答客问:SAS对列求和
34- SAS备忘录:format和informat
33- Ryszard Michalski
32- How to pronounce SAS ?
31- 概率、信息和熵
30- 三个有名的决策树算法和它们的叶子
29- 提升指数、提升表和提升图
28- SAS Macro的面对对象解释-一个附会
27- SAS学习笔记(4):Editing and Debugging SAS Programs
26- 数据采集策略:数据挖掘与统计学的一个区别
25- SAS学习笔记(3):Referencing Files and Setting Options
24- 计算股票的贝塔值β
23- KDNuggets调查2007:数据挖掘方法论
22- SAS学习笔记(2):Using the Programming Workspace
21- 神经网络:学习笔记(1):神经元
20- SAS学习笔记(1):Basic Concepts
19- SAS学习笔记:开篇
18- KDnuggets调查:数据挖掘方法和工具
17- 备忘录之主成分分析
16- 下载yahoo finance和雅虎财经数据
15- S语言:棕皮书、蓝皮书、白皮书和绿皮书
14- 一款像模像样的数据挖掘软件—AlphaMiner
13- 最大熵模型:读书笔记
12- SAS Logistic回归:一个完整例子
11- 三个有名的决策树算法:CHAID、CART和C4.5
10- 数据挖掘——我们能从股市数据得出什么,以及一些算法
9- Windows下运用Linux工具(一):G++/Cyguns
8- 一组常用的SAS快捷键和命令(一):入门阶段
7- Excel-备忘录
6- 在UltraEdit中配置Java编译器
5- 推荐书:朱世武老师的《SAS编程技术与金融数据处理》
4- 决策树的构造——一个手工例子
3- 几个有名的数据挖掘与机器学习的练习数据集(一)
2- 数据挖掘入门书:Roiger&Geatz《数据挖掘教程》清华版2003
1- 写在前面——我要经营的技术博客
***************************************************************************************************
March 15th, 2007 — 胡说
一直在Windows Live Spaces下写博客。因为跟MSN连着,又在QQ签名档挂出来,多是让分散四方的朋友知道些我的生活状态,就记些每日喜乐、平常见闻。我高中念文科,大学念经济学,这么一下来好朋友的背景多是文史哲或是经管类。我行路崎岖,又转学软件工程,学一行爱一行,手头不免常有些跟专业有关的问题想记下来。这些东西要大规模在我那个Space出现,恐怕我大半朋友要觉着索然无味了。
一开始想在CSDN开我的技术博客,是看了几期《程序员》杂志,又在里面转了几圈。这个社区的技术氛围是没得说的。不过稍微试了一下,更新起来不是很方便,一直用Windows Live Writer(Beta)和Performancing写我的Live Space,但这个CSDN好像不太好使,所以这个所谓技术博客也在Windows Live Spaces落户了,想法是以前那个仍旧记事。用Windows Live Spaces做技术博客,只是图个更新方便。
看看我博客的副标题,那个注释格式,多数人能认出来是C言语风格的。我没学过C,看中的是SAS语言也能用这个格式,而SAS就是我所认为的“技术”,我的饭碗了。在这里我想写一些我对机器学习、数据挖掘、数据仓库、金融建模等领域的一些看法以及SAS、SPSS、Weka、Matlab、Mathematica等工具的应用。看到底能走多远了。按着惯例,说说我写博客的原则:
1. 除非是公众人物,或者得到授权,我的博客不会出现真名,以及他们的联系方式;
2. 如果是转载或翻译的文章,我一定会注明出处,而且尽量详细;
3. 即使是原创文章,如果得到帮助,我也会尽量注明从哪些文章哪些书籍得到灵感。