今天寻找一个写好的MD5加密类想做个文件校验工具,在Google里搜索“MD5”看到的第一个搜索结果让我震惊:

[singlepic=18209]

这是一个提供在线MD5破解的网站!
虽然当年的山东大学副教授王小云冲上国际密码大会的讲坛公布了对对MD5、HAVAL-128、MD4和RIPEMD的破解成果后,MD5已经被认为是不安全的。不过据王小云原始算法,破解MD5至少也要比较好的计算机计算几个小时能够找出一个碰撞而已。注意,碰撞,而不是破解。用碰撞密码可以一样实现登陆,但是知道破解,就意味着拿到密码明文。相比所有人的密码多少都有那么一点点意义在里面,被人知道你使用的密码的含义和规律是多么可怕的一件事情!
这个网站,提供在线MD5破解的查询,简单说,就是已知一些密码的MD5,然后把密码和MD5一起存起来,供人查询。当人们提交的MD5足够多,或者达到覆盖大部分有含义字符串后,就达到了比较好的破解效果。

本站4T硬盘已经上线,共有MD5记录457,354,352,282条,宇宙第一,且还在不断增长中,已包含12位及12位以下数字、8位字母、全部7 位及以下字母加数字等组合,并针对国内用户做了大量优化,例如已经包含所有手机号码、全国部分大中城市固定电话号码、百家姓、常用拼音等大量组合,另加入了大型网站真实会员密码数据100万条。本站数据量大,查询速度快,同时支持16位及32位密码查询。通过对10万会员的真实动网论坛样本数据的测试,本站对于动网论坛密码的命中率达到83%。全国独此一家。另感谢一热心网友给本站奉上数百万条数据库原始密码样本,大大提高了命中率!

我来说说为什么震惊。

隐患及应用情景

网络管理员要求第一要政治过硬,他能看到很多东西,设计为人类不该看到的,但是他要禁得住这份诱惑,坐怀不乱…
但是不是每个网络管理员都是这样的人。首先我们可以相信,大型商业网站的网络管理员,在公司制度的限制下,是政治合格的。
但是在我们的生活中还是大量地用到了MD5,比如国内大部分论坛至少是Discuz和动网,这两家都采用MD5加密。论坛是如此之多,甚至不可能没有人不使用基于MD5的论坛等。一旦你的论坛注册信息出现在一个政治不可靠的网络管理员面前,问题就出现了。如果你的密码比较弱,他是可以通过在线破解查询到明文的。注意,是明文。因为找到碰撞并不是什么大事,他本身已经是网络管理员,不需要明文也能把你密码改掉,看到你在这个站的信息。
比如说,我看到123456的MD5是e10adc3949ba59abbe56e057f20f883e,于是我忍不住拿e10adc3949ba59abbe56e057f20f883e在同济网数据库里用户表里搜了一下,发现有5293个用户的密码是123456…P.S. 同济网总计233959个用户,2.2%的经典懒人。
问题是你还可能留下一个真实邮箱,或者没留下真实邮箱,但是用了“主号”当作用户名注册,这样很容易Google到你的邮箱。
虽然邮箱服务可能使用非MD5加密的形式,这样拿MD5的碰撞去登陆自然失败,问题是他拿到的是明文,这样任何加密都会失败。
一旦邮箱被攻破…基本上你在互联网的身份就已经被盗用了(告诉我你邮箱里没东西,我只能说你是土人了)。
这自然是一个严重的安全隐患吧!

个人密码的Best Practices

一个人至少有两组密码。银行卡6位数字密码那是没办法,网络上使用的密码肯定是另外一组。懒人是如此之多,以至于同一个密码到处用的人太多太多。最好的密码策略是使用分级密码,一个人应当设计至少五组密码。按照密码等级介绍如下:

  • 公用银行卡密码:对的,公用,比如这张卡你和家人一起用,这是最简单的,有意义的6位数字密码。建议用电话号码变换一下(如第二位到第七位,或第三位到第五位重复两遍),这样大家都清楚,密级也不算太低。
  • 私有银行卡密码:私房钱之类的,只有自己知道的密码。因为是6位数字,密级高不了。
  • 公共论坛注册密码:要有一定复杂度的,注册的时候尽量不用真实邮箱,必须要验证的时候用一个非主要邮箱。
  • 工作计算机密码:为什么工作计算机要单独设置密码呢?因为总有的时候,当你不在计算机旁边时,有急事发生,这时候你必须授权另外一个人打开你的计算机获取一些资料,这时候就要口述密码。建议这个密码等级不能太低(Windows域要求字母数字和符号),但是也容易记忆,而且便于口述,且与等级最高的密码生成规律不同。这样授权结束后,你可以继续按照这个密码的生成规律再生成一个新的密码即可。
  • 支付宝密码:这个密码需要一定复杂度,因为直接和钱相关。在极少的情况,这个密码也要授权给别人的。可以按照工作计算机密码等级去设置。
  • 信息中心密码:最高级的密码,这个密码管理你的个人信息中心,如QQ、主Email和个人计算机。这个密码的泄露,基本就完蛋了,别人可以伪装成你,这个问题就大了…

论坛和Email还在使用同样密码的孩子们,快改密码吧。

前几天Google黑板报上出现了一篇介绍新产品的帖子,《看图新体验,贴图新选择:谷歌看图、谷歌贴图论坛插件发布》。按理说,Google发布新产品咱都得去捧捧场,看看有啥新想法不是。进去一看大惊:谷歌看图(Google Viewer)和谷歌贴图(Google Uploader)居然标称:谷歌看图支持Discuz! 6.0及其以上各个语言及编码版本。

[singlepic=18208]

Google啊,Google是做平台的,目的是和微软一样一统天下,你们都用我的,我说了算。这下怎么和Discuz搞起来了?
决定学习一门技术的时候主要有两个考量,第一个是是否很快上手,比如有C基础的人接下来学C++、C#和JavaScript以及PHP都是正常的事情,学Ruby就费点劲。第二个是有没有前途,现在相信没人去学ASP(非ASP.NET)和Foxpro了吧,没前途不是。当然这个事情也不是绝对的,全靠命。参加这篇文章:《Windows Azure使COBOL焕发新机》
其实还有一个重要因素,说出来有点崇洋媚外嫌疑,就是这个东西是谁推出的,基本上国外公司推出的平台会好一些。咱都是中国人,中国人怎么做事情在学校咱都看得清楚,忽悠人是必然的,中国产品说10估计也就只能信其5。外国人比较纯洁,至少人家觉得欺骗别人是比较大的错误吧。所以平时我用的东西都是国外品牌,而且我从来不用百度(除了搜盗版MP3的时候…中国人嘛)。
说说Discuz怎么了。Discuz的确是我见过的最好的论坛程序,并且开源且免费。要命的是Discuz年年一个大版本号,5.0,6.0,7.0,更要命的是每个大版本都互相不兼容啊!辛辛苦苦为前一个版本开发的模板和插件,换了新的大版本号,就要做不小的修改。
真搞不懂Google为什么会去趟这滩浑水。还是因为谷歌不等于Google?

此番人民币升值,稳固了Godaddy作为我的主要域名注册商的位置…
虽然我很厌恶Godaddy一副典型老牌美国电子商务网站乱七八糟的排版,但是价格说明一切。
11月初的某天,忽然就被GFW了。好郁闷,中间注册了两个域名都是用VPN注册的,也不知道这样子用的https是不是还是安全的。
今天忽然发现Godaddy被解禁了啊。其实我是不反对GFW的,毕竟屏蔽些敏感网站对国内形势有帮助,尤其是在这样一个普遍教育程度不高的国家。只是,因为拿不到奥运冠军名字的cn域名就去屏蔽GFW,或者因为NotePad++的作者说了那么几句话,就去屏蔽SourceForge,无疑是杀鸡取卵的自杀行为,屏蔽SourceForge,这不就等于屏蔽中国IT产业吗?
Anyway,看到一个域名没被注册,很适合GFW:NAINAI.DE

天黑黑
孙燕姿

我的小时候,吵闹任性时候
我的外婆,总会唱歌哄我
夏天的午后,老老的歌安慰我,那首歌好像这样唱的
天黑黑,欲落雨,天黑黑,黑黑
离开小时候,有了自己的生活
新鲜的歌,新鲜的念头
任性和冲动,无法控制的时候
我忘记还有这样的歌
天黑黑,欲落雨,天黑黑,黑黑
我爱上让我奋不顾身的一个人
我以为这就是我所追求的世界
然而横冲直撞,被误解被骗
是否成人的世界背后,总有残缺
我走在每天必须面对的分岔路
我怀念过去单纯美好的小幸福
爱总是让人哭,让人觉得不满足
天空很大却看不清楚,好孤独

<好喜欢这一段钢琴>

我爱上让我奋不顾身的一个人
我以为这就是我所追求的世界
然而横冲直撞,被误解被骗
是否成人的世界背后,总有残缺
我走在每天必须面对的分岔路
我怀念过去单纯美好的小幸福
爱总是让人哭,让人觉得不满足
天空很大却看不清楚,好孤独

天黑的时候,我又想起那首歌
突然期待下起安静的雨
原来外婆的道理早就唱给我听
下起雨也要勇敢前进
我相信一切都会平息
我现在好想回家去
天黑黑,欲落雨,天黑黑,黑黑

网络管理员应当具备什么样的素质?
最近的见闻真的是令人难忘,其实什么素质的人都可以做网络管理员的…
包括连“端口映射”都不知道的人。
Microsoft MVP要求解答问题的时候要热情,真的不知道见到这种不是在一个层次上的人的时候,是否要热情地帮人家先补补计算机网络课呢?
其实我是挺耐心的一个人,唉…
忙起来之后,真的没时间在我评估我可以5分钟解决的事情上消耗30倍以上的时间。对不住了。

最近几日做了几件看起来疯狂的行动:把同济网在美国DreamHost做个备份。按照计划,每个月还要更新一下数据。这里可是说海量数据…
所谓海量,同济网论坛有附件合计5GB,数据库导出之后是3.78GB,其中单个posts表就2.2GB。
且不说导入的过程何其漫长,这个从中国到美国的数据传输,就需要画上一番脑筋。
Anyway,我搞定了,副产品是,给大家介绍一下在Linux上怎么压缩解压缩常见文件类型。

1. Windows -> Linux

Windows平台上估计大家都用Winrar了。Winrar可以压缩zip(不能超过2GB)和rar格式。

.zip

解压:unzip FileName.zip
压缩:zip FileName.zip DirName

.rar

解压:rar x FileName.rar
压缩:rar a FileName.rar DirName

2. Linux -> Windows

.tar

解包:tar xvf FileName.tar
打包:tar cvf FileName.tar DirName

.gz

解压1:gunzip FileName.gz
解压2:gzip -d FileName.gz
压缩:gzip FileName

.tar.gz和.tgz

解压:tar zxvf FileName.tar.gz
压缩:tar zcvf FileName.tar.gz DirName

.bz2

解压1:bzip2 -d FileName.bz2
解压2:bunzip2 FileName.bz2
压缩: bzip2 -z FileName

.tar.bz2

解压:tar jxvf FileName.tar.bz2
压缩:tar jcvf FileName.tar.bz2 DirName

.bz

解压1:bzip2 -d FileName.bz
解压2:bunzip2 FileName.bz
压缩:未知

.tar.bz

解压:tar jxvf FileName.tar.bz
压缩:未知

.Z

解压:uncompress FileName.Z
压缩:compress FileName

.tar.Z

解压:tar Zxvf FileName.tar.Z
压缩:tar Zcvf FileName.tar.Z DirName

参考:

http://soft.zdnet.com.cn/software_zone/2007/1009/542973.shtml

最近真的非常忙。按照脑子里的存储序序列化下看看吧。
开题报告,这个东西很有激情。本来写了一个基于LDAP和Active Directory的计算集群管理的东西,打算大干一场写点系统,做一个有用的东西出来,无奈实在没什么理论深度,虽然开题报告几千字老早就写好了,不过总是感觉没什么意思。于是乎某天晚上,也不是晚上,白天,在做一个Rsync算法的研究(http://www.redmine.net/projects/show/rsynctest),晚上的时候在洗衣服,脑子里就开始想啊,白天做的这个算法还是挺有意思的,将来能写成个工具自己用,蛮好的。于是又想,既然是个算法,为何不基于它写个硕士毕业论文出来呢?一举两得嘛。洗完衣服已经晚上七点多,赶紧IEL下载一堆论文,到晚上十一点的时候,新的开题报告写出来了…
写完就要答辩之类,要求还是蛮高,感觉对开题报告的答辩比本科毕业时候答辩都难…因为导师和博士们真的在听。不过拼真本事的时候我是从来不怕的。
然后签字什么的,到现在也没忙完。
还有三个网站要架设、搬家之类,因为都是商业级别的项目,也占用了不少时间。
最大的成就是在DreamHost上架了一个同济网的备份论坛,恢复了几年前bbs和bbs2的双线运营状况。不过这个目前还在同济网运营团队内部研究怎么利用,我是打算每个月把数据更新一下,打开简单的搜索吧。有兴趣可以预览下:http://bbs2.tongji.net

忙起来的时候,令人担心的事情好像就变得不那么烦恼了。只是累了的时候,会觉得更累。