从来没有天才在大学崛起,但有很多天才确实倒在大学里。这句话是对全世界大学都有效的。Bill Gates,Steve Jobs,我不想举例子了。
中国的大学更是如此。参加过高等教育的人,都一致地认为,中国教育没希望了。大学是个象牙塔,看起来很美,实际上里面很黑很黑暗。正如山寨机一样,看起来声光电俱全,只不过是个Showcase而已。
对于中国大学的深入理解,可以颠覆你的很多根深蒂固的思想。看过这一些,相信你会坚信,没有什么思想是不能改变的。

为人师表
教授是什么?答曰,叫兽。
人的社会性,使得我们定义一个人应该借助于他做过的事情以及他对于社会做出的贡献和对于其他人的影响。现在大学教授在做什么?实际上是在外面扯皮吃饭喝酒做演示拉项目和经费(为了吃饭,无可厚非)回到学校把项目交给学生去做出来,然后不停地拷贝demo和截图,出去找下一个项目,然后说自己做过很多类似的,你看这是我们的成熟系统,全国很多地方都在用哦。
有一类教授学生比较多,为了不让学生出去实习(如果你是周扒皮,肯定不希望长工跑别人家干活),为了自己能够学习专业知识(不是热衷于科学,而是为了出去谈项目更有谈资),就给学生一些文章,或者给关键字让学生自己找文章,都是先进的国际性论文,让学生看论文,做PPT,最后讲给他听。美其名曰:培养学生演讲能力。在这个过程中学生走进了一个痛苦的循环,以为自己在学一些东西,实际上只是沦为了老师的读书工具而已。

白道?黑道?行走在法律的边缘
只要挣钱,我们什么都做。别人做过的,没有任何技术含量的,没有任何创新点的东西,只要有关系,能拿到经费,一律照做不误。什么创新点,统统不在乎。
与教授们为伍,不禁为其左右逢源技术惊叹不已,变魔术是他们的看家本领。政府工作报告,总理说提高学生待遇,国家拿出更多地钱给学生。对策是,学校将原来分几个地方给的钱统一成一笔钱,导师每招一个研究生每年给学校1000元,学校分成10个月,发给学生,加上学校和国家补贴每个月300,发到学生手里每个月400元。That’s it, nothing more。对比才有效果。改革之前的上一届研究生,同吃同住同劳动,拿几份钱,每个月大概640元。240元/人,去哪里了?听说国家还为此多拨出了资金?
教授们常做的一件事情是,洗钱。每隔几个月,学生的卡里面会多出莫名地巨款,一两千的样子。当学生都在窃喜的时候,会出现一个博士(博士日常不多的工作之一),通知学生,某某老师借我们的帐户转账,请大家取出来交给我。学生多半失望一小段时间就忘却了。
实际上这是日常性的洗钱事件。我不敢妄自猜测钱的来源,只是希望这不要是国家用于科研的资金。往最好处想,这只是一种避税行为,而不是洗钱行为。

倒置的激励机制
正常智商的中国人,我问你,在大学里表现最好的研究生应当获得什么奖励?
你一定认为,这个学生一定会获得超多的奖学金,然后获得导师直接推荐进入著名公司工作。
天方夜谭。实际上,最好的学生的下场只能是,没有实习机会,不能发表论文,也没有奖学金,甚至按期毕业都是最终幻想。
因为,学生都是民工。当一个工人工作异常刻苦,成果突出的时候,你会放他离开?当然不会,叫兽又不是傻子。因此千方百计挽留这个学生,干得越多,下场越惨。奖学金只给论文多的学生,工程做得再多,都是重新发明轮子的工作,没有创新,论文自然没希望,奖学金想也不要想。
最终的下场,就是签下城下之盟,直升博士去了。你也许觉得博士不错啊。其实又是干5年活儿而已。你也许说,博士不是3年毕业嘛。还是那句话,你愿意放长工提前回家?不半夜鸡叫就不错了。

动力?
不管是怎么进入这个贼船,多少有自己的动力。
在实验室的学生,为什么要干活呢?其实,越是对自己有责任感的人,才更会干活。不是为了不能毕业,而是不想荒废掉这些年。很多学长毕业离开了,临走认真地留下一句话:千万不要给实验室干活,越陷越深。
给一个干活的理由吧。
因为你是共产党员。
嘿嘿,共产党员也要吃饭啊,21世纪生活在大学的共产党员难道就要饿死?

环境说明
我们项目中使用了一个Web Service,返回List对象,在SOAP中即构成了XML格式字符串返回客户端。
客户端使用WebServiceSoapClient类调用Web Methods。
使用的开发环境是Visual Studio 2008,.NET Framework 3.0,部署在Windows Server 2003上。全部采用英文版。

问题说明
某个返回List的Web Method,一向工作正常。某日在数据库添加了一条记录之后,开始出现Exception。Visual Studio 2008调试报错:
A first chance exception of type ‘System.ServiceModel.CommunicationException’ occurred in mscorlib.dll

然后我们分析认为,是这条记录格式有问题,我们把原记录中“BLACKMAGIC”字符串改成“BLACKMAGIC2”,问题依旧;改成“BLACKMAGI”,问题不见了…
于是第一次就这样了。

过几天又插入一堆记录,CommunicationException又出现了。这一次我试图调整List中包含元素的个数,发现134个可以,而135个不行。猜测Web Service返回的XML字符串有长度限制。本地调试,手动保存了134个和135个返回的XML文件,查看大小,134条记录的文件大小,著名的81,920 bytes给了我重要的猜测证据。

经过一番Google,翻了几个网站,整理得到的解决方案如下:
之前我们使用简单的WebServiceSoapClient构造,会导致81,920 bytes是Web Service XML返回值的最大大小限制:

[code=’c#’]
WebServiceSoapClient proxy = new ITS.ServiceReference.WebServiceSoapClient();
[/code]

使用另一种构造函数并设置返回消息最大值:

[code=’c#’]
System.ServiceModel.BasicHttpBinding binding = new System.ServiceModel.BasicHttpBinding();
binding.MaxReceivedMessageSize = int.MaxValue;
System.ServiceModel.EndpointAddress address = new System.ServiceModel.EndpointAddress(“http://serveraddress/webservicename.asmx”);
WebServiceSoapClient proxy = new ITS.ServiceReference.WebServiceSoapClient(binding, address);
[/code]

则问题解决。原来第一次去掉一个字符,刚刚好够81,920 bytes。

先看一篇瘾科技的《小姜杂谈:PB 的挑战》

[singlepic=15462]

什么是 PB?抱歉,各位苹科科的爱好者们,我说的不是 PowerBook;抱歉,各位化学爱好者们,我说的也不是铅。这里想说的是 PetaByte (也就是 1000 TB,或 1,000,000 GB)的纪元来临时的挑战。1 PB 的纪元?现在就想这个做啥?毕竟现在硬盘主流连 1TB 都还不到不是吗?从数据储存的角度来看,这样说是没错,七月号的 Wired 杂志上举了几个很生动的例子告诉我们,其实要用光 1000TB 的容量还蛮困难的:

  • 现在出去买一台玩家级的新电脑,容量大约是 1TB(或者,小姜库存的*哔*片也大约这个数)。
  • 每周上传到社交网站 Facebook 上的照片总量是 20TB。
  • 哈柏太空望远镜从发射以来产生的总数据量大约是 120TB
  • 大型强子碰撞器每周产生的数据量大约是 330TB。
  • 美国国家气候中心所以收集下来的资料总量约是 460TB。
  • Youtube 上所有的影片的总量约是 530TB(比想象中小?)。
  • Ancestry.com(一个家族追根数据库)加上内附的 1790-2000 人口普查数据大约是 600 TB。

看吧!PB 的事还是留给后代子孙去烦恼好了,看起来要一次用掉 1PB 还早呢!是啦,要变出 1PB 的数据看起来是有困难,但从数据处理的角度来说,1PB 只是 Google 服务器每 72 分钟处理的数据量而已。虽然从数据储存的角度来看,我们还处在 TB 时代,但已经有很多预兆告诉我们,下一个量级单位带来的会是完全不同的一组新挑战。小姜在后面想了五个可能:

PB 时代的第一大挑战是什么?就是数据的过滤。就算人类已经有产生 PB 级数据量的能力,但事实是我们并没有把这些数据全部有效地存取的技术。因此选择哪些数据更有价值,就成为了很重要的课题。之前就有提过的大型强子碰撞器, 事实上因为是在观测为时非常短的现象,因此每秒大约要拍下十亿张的照片,才能确保不漏掉什么重要的事情。如果全部的数据都要保留的话,每秒钟就必须储存 10PB 左右的数据 — 也就是说每秒钟会塞满 10,000 颗 1TB 容量的硬盘。这是一个靠现有技术绝对不可能办到的事情,所以必须靠硬件和软件的过滤,找出每秒大约 100 个值得关注的事。即使如此,一年仍将产生约 15PB 的数据,或 15,000 颗 1TB 的硬盘,藏在这些数据里头的,有黑洞、异次元、平行宇宙,还有两三个诺贝尔奖吧?

第二个挑战,是资料的分析。 分析和过滤不一样,过滤是试图减少数据量,但分析却是变出更多的资料来。一个例子是选举结果的预测 — 一个仔细想想并没有意义,但无论候选人、选举人还是媒体都乐此不疲的游戏。美国在 2004 年时,候选人 Howard Dean 收集了 100GB 的资料来分析,当时被认为是一个很恐怖的大数据库。今年的总统选举,Catalist 公司收集了一个 15TB 的超大数据库,详细分析每个人的性别、婚姻、年龄、种族、收入等各种资料,并且从中获得判断一个人会投给共和党还是民主党的重要信息。依照同样的比例增加 下去,下一次美国总统选举时的资料量和分析结果肯定会达到数 PB 之谱,届时对数据探勘、分析所需的运算资源的要求会非常可怕,或许非要用 Cloud Computing 的方式才能运算的地步。嘿嘿,或许到时候预测系统都比你自已清楚你会投给谁…

第三个挑战,是数据的呈现。 这是一个比较抽象的关念,举个例子来说好了,目前的数码相机分辨率都高达 10mp 或更多,但一般人用的屏幕就算是最常见的高档屏幕分辨率(1920×1200)事实上才 2.3mp 而已。那多的那些资料不就可惜了?Wikipedia 现在就有点这种感觉,很多很好的文章和内容因为不容易取得,很难发挥它应有的真正价值。

第四个挑战,是数据的传输。 之前在网络上看过一个很有趣的问题:将 1PB 的资料从美国西岸送到中国,是用传输的快,还是用帆船把整个服务器运过去快?一点简单的数学告诉我们,要在合理的时间范围内把数据传完…就假设三个月 好了。要在三个月内把 1PB 的数据传完,传输送率要大约 1Gb/s 才行。这个数字不是特别的不可能(学术单位间常常有这么大量数据来往),但绝对不是一般民众能负担得起的。以目前的技术来说,如果你要传 1PB 的超高画质*哔*片给在美国的朋友的话,绝对是用海运的比较快…

最后,第五个挑战,是数据的搜寻。 拜 Google 大神所赐,这或许是我们最不须要要担心的一环了。但 Google 的强大也仅限于公开的网络而已,自已电脑上的档案要能分类清楚依然是很困难的一件事。Windows Vista 本来想要加入的 WinFS 档案系统和随之而来的关连式档案架构似乎带来了一线曙光,但最后我们还是被卡在树状结构的 NTFS 里。当个人电脑数据量也到 1PB 的时候,嗯,真难想象到时候会是个怎么样的恶梦。

个人电脑容量跨越 1GB 门坎是多久以前?好像差不多是十年前左右,所以如果发展方向不变的话,再十年我们就会进入全面 PB 的时代。但在那之前,就们就已经有够多要担心的事了:在上面的五个问题当中,小姜最担心的是数据的传输,因为传输频宽的建立要时间和金钱的投入。要能够顺 利地提升到下一个阶段,现在就要开始做准备啰!

信息技术或者说计算机技术在发展过程当中遇到了若干个瓶颈,我之前在《SMP in Linux》一文中提到过这些瓶颈以及解决方法。现在看起来,CPU多核和众核已经成了趋势,在Intel的驱动下普及应该不会有太大问题,硬盘也开始以难以置信的速度迅速扩张,希捷一年出货硬盘1.83亿块, 每秒钟近6块。看起来,网络速度已经成最近相当一段时间内的最大瓶颈。正如小姜提到的,1PB的资料从美国西岸送到中国,是用传输的快,还是用帆船把整个服务器运过去快?这个问题现实中我真的是天天面对着。
我的DreamHost硬盘很大很大,2TB大,而传输速度实在不敢恭维,在中国,我需要先把数据传到一个骨干网服务器上,然后挂着传到美国的服务器。即便这样,一个月我也只传了几十GB数据而已。
纵然技术迅速发展,无良的ISP依然收着难以置信的价格,甚至奥运村也不放过。与美国日本韩国相比,我们的宽带速度甚至连人家小灵通上网速度都不如。
我有一个梦想,睡在凉爽的骨干机房里,享用着100MB直接连接到骨干网的网速,该有多爽~

大家通常使用的32bit Windows系统最大内存限制基本均为4GB,64bit的Vista Ultimate则最高使用到128GB。但在服务器领域,这样的规模显然是不够的。虽然Windows Server 2008 32bit标准版内存限制同为4GB,但到了数据中心版,32bit系统也能够达到64GB。至于64bit,Windows Server 2008标准版支持32GB,数据中心板更是达到惊人的2TB。早期的Windows Server 2003也能通过更新支持2TB内存。
市面上拥有2TB内存的系统并不多,但微软的Windows Server性能优化团队肯定要有一台。一位微软工程师近期在博客上探讨Windows内存支持问题时,就贴出了这样一张震撼截图:64处理器核心+2TB内存的Windows Server系统。

[singlepic=15461]

去年在MSRA曾经见到过几台8核32GB内存的Server,存储都是TB级别。这一台似乎更牛一些~
我的梦啊。当年还疑惑,这么大内存是怎么插上去的?还曾经问过几个微软员工,他们也都不清楚。研究生一年让我知道了这个问题…

虽然相隔千里,虽然擦肩也无缘相见,但是闭上眼睛还是可以见到你~
Day Dream这种东西是会上瘾的。

[singlepic=15460]