中文国家代码顶级域 “中国”将正式启用
除了传统的.cn、.com、.net等英文域名后缀之外,国际互联网将首次出现“中国”这样的非英语域名后缀.
记者昨天获悉,在刚刚闭幕的ICANN(互联网名称与数字地址分配机构)巴黎年会上,ICANN理事会一致通过了一项重要决议,允许使用其他语言包括中文等作为互联网顶级域字符.决议内容包括,“.中国”将于2009年上半年率先写入全球根域名系统,成为首批新设的非拉丁语系字符顶级域之一,即中文国家代 码顶级域“中国域名”将正式启用.
资深业内人士认为,“中国域名”的正式启用,意味着“中国域名”将正式融入国际互联网,作为中华文化在网络上的国家象征登上历史舞台.
简单来说,中文用户今后在浏览器地址栏不仅可以通过输入英文域名lenovo.com.cn来访问联想公司网站,还可以直接输入中国域名“联想.中国”完成这一操作.
对此,ICANN主席特拉什(Peter Dengate Thrush)评价称,这是项历史性决议,它将给互联网样式和运行模式带来巨大变化,将使互联网更为开放,使用方法更为多样化.
ICANN理事、我国互联网知名专家钱华林指出,现在中国有2亿多网民,也就意味着还有10多亿人没有上网.纯中文的“中国域名”并非只为现在的网民准备,更是为未来的数亿中国人所准备.
据介绍,“中国域名”正式进入国际互联网,是中国互联网界多年努力的成果.对中国互联网用户来说,中国域名无疑是以中文为品牌名称的企事业单位在网络上最好的品牌载体.
目前,互联网顶级域名体系只支持包括26个英文字母、连字符和阿拉伯数字0至9 在内的37个字符.此项决议意味着诞生于1983年的域名系统(DNS-Domain Name System)在被英语语种“独霸”25年之后,将真正迎来包括中文在内的世界各大语种顶级域时代.

脑残.中国
打这样的域名真的很舒服么?这样的域名不但击键次数不少,而且很不舒服,因为我要切换输入法打英文句号。
轰轰烈烈的非拉丁域名实行了好多年了,价格依旧地昂贵,却鲜有人使用。中文域名号称主要优点是好记,其实我倒觉得naocan.zhongguo也很好记啊…
互联网普及的今天,网民不会一点点英文好像没法生存,即便不会英文,记上几个TLD应该还是不成问题的吧。
如果真的更新到root DNS去了,我就去开发个插件,把脑残。中国自动改成脑残.中国,一定大卖~

[singlepic=14479,,,left]

Google Analytics(分析)是一款免费的 Web 分析产品,根据它提供的丰富详尽的图表式报告,网站管理员与营销人员可以更好地了解并影响访问者的行为,从而提高营销活动的投资回报率。
Google Analytics(分析)给网站管理员提供了这样一个途径:了解目前网站的状态,知道可以改进的方向。下面要做的事情就是每次只对网站作一次改动,并且给 Google Analytics(分析)一段时间,它会告诉您这次改动带来的改变是否符合预期。
就像 Google Analytics(分析)的高级经理 Brett Crosby 在 Analytics blog 里提到的:“不论您如何使用 Google Analytics(分析),最重要的是您已经在使用它。”您已经在试图通过对访问者行为的分析来理解您的访问者,并且朝着优化的方向努力。当您越了解访问者并且愿意朝着提升他们访问体验的方向努力时,也意味着您正走在一条通往拥有更多忠实访问者和提高您的投资回报率的康庄大道上。

1. Web分析产品之争
不可否认,JavaScript的登峰造极之作就是Web分析产品了。市面上有很多这样的产品可以选择,国内国外的都有,比如中国站长站,51.la都提供这样的分析产品,DreamHost之类的托管商也提供基于Apache日志的分析产品。我认为,Web分析工具是网站的核心工具之一,不应该随意的选择。
Google目前来看还是一个很负责任的公司,其产品值得信赖,关键的是Google Analytics确实也不错,尤其是其JavaScript控件库强大和完善,更是让我们这些JavaScript程序员无比崇拜。

[singlepic=14481,500,,center]

在这篇文章中,我想结合实际中的一个网站的数据信息,说明一下Google Analytics有什么用以及怎么用的问题。

2. Google Analytics原理及如何启用Google Analytics
Google Analytics是基于JavaScript的,只要把类似这样一段代码插入你的页面源代码中,就可以使用Google Analytics了。其中,UA-XXXXXXX-X是每创立一个分析帐户时生成的,你的帐户当然和我的不一样。

[code=’html’]


[/code]

或者使用新版本:

[code=’html’]


[/code]

主要原理是,将一个外链JavaScript脚本包含到本页中,然后设置一个参数,指定这是哪个站(即访问报告给哪个帐户),然后调用一个JavaScript函数,由里面的函数来收集当前用户的信息(IP,浏览器版本,当前页等等等等)。记录下信息之后,再用Google Analytics的网页来使用这些数据进行数据分析和数据挖掘。

3. 多元化分析的基础
注意一点,Google Analytics是一个网站分析工具,其数据基于对于网站浏览者的长期采样。一个刚刚使用Google Analytics的用户的数据是杂乱无章且没有多少意义的,长期使用,至少一个月,才能够看出趋势。
下图展示了一个较大的站最近两个月的数据。

[singlepic=14480,500,113,center]

可以观察到网站流量稳定在25000左右,但是在6月3日出现了一个奇点,这时候可以去网站搜索了一下这一天发生了什么事情,导致了这样的数据出现。原来,网站中包含一篇文章,是同济大学6月3日一场地震分析的报告会,被搜索引擎错误地当作6月3日地震预测的文章(是谣言!)排到了前面,这是应该主动去删除这样的不实信息(即便可能不是我们的错,而是搜索引擎的错误)。浏览量固然重要,但道德更重要,不要用谣言等手段骗取用户浏览。

下图是另外一个时间段的情况。明显观察到4月18日到4月20日数据出现了一个低谷。

[singlepic=14482,500,113,center]

这是因为,网站在这段时间由于内容审核被机房屏蔽了一段时间,不能够访问,网站管理员虽采取了转向到临时网站的策略,但仍旧因为内容不如原来丰富,导致流量大幅减少。

从上面可以看出,单纯看数据是没有意义的,应该数据结合网站的状况做多元化分析。

4. 浏览量数据
Google Analytics对数据进行区分,包括访问次数、绝对唯一访问者人数、综合浏览量、平均综合浏览量、网站停留时间、跳出率和新访问率。

[singlepic=14483,,,right]

  • 综合浏览量:一切数据的核心是综合浏览量(Page View)。每次网页被加载,调用Google Analytics代码都会增加一次综合浏览量,其他的数据都是根据这个数据以及其他参数区别出来的。
  • 绝对唯一访问者人数:Google Analytics使用cookie对访问者进行标识,这样,当用户隔了一段时间再次访问,即便因为ADSL等等原因换了IP,仍旧算作同一个访问者,并且计入回头客。当然,这个值只能表明一个大概的下限,因为可能有多个人共享同一台机器或者用户禁用了cookie而导致这个值比正确值小。
  • 平均综合浏览量:平均综合浏览量计算一个综合浏览量的平均值,说明一个用户一般看了几个(次)网页。
  • 网站停留时间:用户在网站大概看了多长时间。也不是精确的值,根据一次会话中最先的访问和最后的访问比较得到。
  • 跳出率:就是说别人进了你的网站后没有再查看你网站的其他的网页的比率,当然跳出率越高,就一定程度上说明你的网站的首页吸引力不够,需要对目标网页做一定优化。或者是网站SEO的关键字有问题,导致用户进来了才发现,这并不是他/她要找的网站。
  • 新访问率:第一次来的用户的比率,也不是精确值,用户可能会清空cookie,导致重复计算,一般这个值说明了一个新访问率的上限。

5. 用户信息
Google Analytics还可以记录下用户使用机器的一些特征,比如浏览器及其版本、Java版本、Flash版本、操作系统语言等等信息。这些信息可以为网站设计者提供重要参考,可以根据比例来选择重点测试平台和采用那个版本的技术等等。
比如,作为专业Web开发人员的我可能会觉得FireFox很好很强大,并且在自己的机器上使用FireFox来浏览各种网站,那么能否就以FireFox上的显示效果为准来编写我的网页?当然不能。

[singlepic=14484,,,center]

上图可以看出,虽然FireFox很热,但是IE仍然是最重要的客户端浏览器,这意味着如果你编写了一段只能在FireFox上运行正常的页面,仍然将会在91.40%的用户浏览器里变成一团乱麻。

6. 来源分析
Google Analytics可以通过用户访问的HTTP refer信息整理分析用户是从哪里进入了你的网站。

[singlepic=14485,,,center]

从图上可以看出,用户来源基本四分天下,直接通过地址访问、通过Google、通过Baidu和通过其他方式数量基本差不多。进一步也可以看出,Baidu在中国还是很有市场份额的。

[singlepic=14478]

陕西镇坪县农民周正龙拍摄的“华南虎”照片是一个用老虎画拍摄的假虎照。

老虎来了!
莫非现在真的流行真人化童谣?当80后都长大了,却发现原来小时候的每天晚上,妈妈在床边讲的故事原来都是真的,只不过狼变成了老虎,故事的名字也不叫“狼来了的故事”,而叫做“正龙拍虎”。
真的很不容易哦,折腾大半年了,中国人终于正面回答了一个事实,老虎照片到底是真的还是假的。我想网络舆论基本上都是善意的,没有怀疑过到底有没有老虎,更没有怀疑过政府的诚信,只是想知道这张明显造假的照片什么时候才能说它是假的。对待科学,诚实是一个基本的态度,而且,这又不是哪一派理论,只是一个事实而已。

套用一句新话,做人不一定要高尚,但不能无耻。

DreamHost是美国一家价廉物美的托管商,国内很多站长在DreamHost上架WordPress。
有时候希望使用WordPress的开发版本,每天需要从WordPress的SVN服务器上update最新的版本。
其实,DreamHost有Shell,也有cron计划脚本功能,每天午夜的时候都会执行,当然你也可以设成每周或者每月,这里是更新WordPress,还是需要每天做的。

我的WordPress在/mnt/local/home/nocoo/WebSite/nocoo.us目录下,脚本如下:
[code=’css’]
svn cleanup /mnt/local/home/nocoo/WebSite/nocoo.us
svn co http://svn.automattic.com/wordpress/trunk/ /mnt/local/home/nocoo/WebSite/nocoo.us
[/code]

第一行也许不必,但实际使用中最好加上,因为是cron执行svn,有时候执行完可能会lock掉,下次就更新失败了。
假设把这个文件放在/mnt/local/home/nocoo/WebSite下,然后在DreamHost Panel里面的Goodies->Cron Jobs里注册一个新的cron job就好了。

就像这样(点击看大分辨率):

[singlepic=14475,500,,center]

原来我总是很自信地以为:你有本事找到 MD5 的碰撞又如何?你难道还有本事让两个可执行文件的 MD5 一样,却又都能正常运行,并且可以做完全不同的事情么?
答:还真的可以.

这两个程序会在屏幕上打印出不同的字符,但是它们的 MD5 都是一样的。

通读其论文后摘要如下:
这几位密码学家使用的是“构造前缀碰撞法”(chosen-prefix collisions)来进行此次攻击(是王小云所使用的攻击方法的改进版本)。
他们所使用的计算机是一台 Sony PS3,且仅用了不到两天。
他们的结论:MD5 算法不应再被用于任何软件完整性检查或代码签名的用途。

另:现在,如果仅仅是想要生成 MD5 相同而内容不同的文件的话,在任何主流配置的电脑上用几秒钟就可以完成了。
这几位密码学家编写的“快速MD5碰撞生成器”:

04年8月的一天,名不见经传的山东大学教授王小云(人家导师可是潘承洞噢!)冲上California Santa Barbara国际密码大会讲台强行公布了一个结果,宣告给了世界一个信不信由你的故事。
据说,可以通过填充的方法使得两只鸭子完全一样大,而且鸭子妈妈都分不出来哦。
那么,这过程是每个人都能做的么?答曰,还不行,必须是有经验的填鸭师傅用很好很强大的工具在几小时内才能搞定。
哇哈哈,那还好,MD5还算安全吧~
实践再一次表明,预言未来的人总会自取其辱。科学家的脑袋不是线性,也不是函数能够表述的,其实,人脑性能曲线是超越数的偏微分方程,信不信也由你。现在有人给出了反例,看来MD5用来验证EXE程序没被篡改这一应用是不行了,那么,离大面积的MD5密码生成器还有多远呢?
跑题了,说点正经的。MD5的价值相比大家都清楚,绝大部分的网站使用MD5加密用户信息的密码。一旦MD5的伪装或者逆转破解(这好像不可能,hash之后熵值太大了)能够在平常的PC上完成,我们的信息就都完蛋了,只要在局域网上侦听一下,你就可以拿到你的同学或者同事的一切一切哦~

世界是透明的其实也挺好。