Archive for December, 2006

网络海啸

前几天台湾南部地震,随后就发生了网络瘫痪。有报道将此次天灾称为“网络海啸”。香港也受到影响,几乎无法访问美国的网站。

无法访问的网页包括Google,连同Gmail,Google Talk,Google Scholar,Picasa Web,Google Reader,Google Groups等服务亦无法正常使用。打不开的网站也包括Wikipedia。这直接导致我无法有效地进行期末复习,无法收发邮件自不必提。另外,linshuang.info打不开,访问量锐减。甚至连打往美国的长途(IP)电话都进行不了了。

作为计算机的学生,无法正常使用网络所带来的痛苦是可想而知的。更为关键的是,经过反复尝试,竟然没有找到一种有效的方法得以正常使用Gmail,甚至没有一个可用的搜索引擎。没想到Internet这个东西鲁棒性那么差,而离开了Internet,居然什么事也做不了,而且任何已有的专业知识及经验都没了用武之地。不能不说,这是相当令人沮丧的一件事情。

今天考完试,晚上打开网页,发现基本恢复正常了。台湾中华电信说,地震破坏的国际海缆已恢复8成。光缆彻底修复还要些时日,大约一个月左右。真是庆幸。

Comments (1)

360安全卫士

几天前,室友的电脑感染了一堆乱七八糟的木马程序,让我帮忙来看。我一看就觉得很棘手,系统进程里面有好几个可疑程序,关掉后不久还会又出来。

于是灵机一动,下载了个“360安全卫士”。运行后,果然把5~6个刻意程序都杀除了。重启一遍,又杀掉2个。再重启,就查不出来了。

趁机观察了一下 360safe 这个软件,如果它不是因为它当初“流氓”的背景,还真是不错的说:可以扫描系统中的自启动进程,当前进程,当前所有网络连接,IE 工具栏及插件安装情况等信息。很多还都能给出简要说明,直接告诉你哪个是安全的,哪个不是。不过可惜有点弱智,Java 相关的程序基本上都不认识。对于 IE 工具栏和插件,还能选择性免疫。最赞的是,对它无法解决的问题,还能手动生成文本格式的报告,供用户发给高手求助使用。

但愿这回 360safe 真的不再流氓了。

Comments

感受HKU的考试

本学期,我在 HKU 共选有 5 门课,全部需要进行期末考试。到今天为止,已经考过 4 门。这 5 门考试,每门都是 3 小时(而在清华,要考 2 个小时以上就算是很长的了)。考试的形式也和清华一样,有开卷(允许带任何资料进入考场)、半开卷(允许只带一张自己的 A4 纸进入考场,内容随意)、闭卷。考试大多允许使用计算器,不过很多情况下用处很有限。

考试很多时候是在一个大型的体育场馆进行,我的考试中有 3 次是这样安排的。所有的试题及答题册在考生进入考场前就已放在桌子上,学生对号入座后,即可开始答题。同一考场内可以同时进行多项考试,因为收卷时间相同,考试形式也可能作了考虑(即同一考场的考试要么都是开卷,要么都是半开卷,要么都是闭卷),故不会互相影响。答题过后,如果愿意提前交卷,只需将答题册放在桌面,收好东西离场即可。试卷可以带走。

答题册的设计很有趣,翻开就是横格纸,每页纸正面用于答题,背面用于做草稿。每页只能答一道题,但一道题可以使用多页。试题册共有 14 页或 28 页,左上角有穿孔,可于增加额外答题纸时穿线使用。答题册页面上不可写姓名,只能在答题册封面写学号。封面上还需要写明答题顺序及所用计算器型号等信息。整体设计显得无懈可击。

HKU 几乎所有的课程,都不是期末考试一锤定音的(清华也是这样)。我所参与的几门课程期末考试在课程总评中所占比例在 40%~60%。另外,最终的分数都会进行正态化处理,这从一定程度上保证了各届考生及同一课程不同 subclass 考生之间的公平性。不过,将如何得到的原始分数正态化,此过程看来并没有明确规定,可见实际操作中还是容许一定的模糊性的。一般而言,总评“A”的比例约在 15% 左右,因此只要保证最终自己的成绩在“平均值加一倍标准差”之上,就至少能够保证“A-”了。

Comments

怎么连自己名字都拼不对呢?

摘自昨天的 Google 黑板报

google_sucks.jpg

看看他们多久能够改过来。

Comments

会见“贵系”学长

会见“贵系”学长是我在港大期间经常做的事情。和他们交流,往往自己能够受到很多启发。这里要说明一下,“贵系”一词,通常是对说话人对方的人所属院系的敬称;但如果说话双方都是清华大学计算机系的人,那么这时“贵系”指代的就是自己的系。不要问我这是为什么,原因很复杂,反正大家都这么用,就习以为常了。

比如前天,我就见到了“贵系”著名的“李老师”,清华二字班(2002)一位学长。李老师目前是香港科技大学在读博士生,而两年前,他曾到香港科技大学交换。“李老师”是对他的尊称,表明走的是“学术路线”。李老师搞竞赛出身,在TopCoder上表现一贯十分勇猛,前不久参加Google CodeJam,还应邀到美国参加了决赛。

他此程来到港岛的港大来看我们(其实只看到我和宋姐姐),顺道办理“中联办”登记手续。我们去到港大转了一小圈,坐在图书馆旁的星巴克的遮阳伞下交谈。我们突发奇想,Song姐姐在不在呢?打个电话发现她正在图书馆,而且没什么事,于是把她叫下来一起闲聊。

Song姐姐比我和李老师都要年长。她在清华读的计算机本科、硕士,工作了两年,现在来到港大,攻读新闻专业MPhil。Song姐姐经历了听他们两个谈话,谈计算机系的各位牛们、总们的传奇故事,使我印象中那些先进事迹的得到了印证,不由得钦佩不已。有的去了Microsoft、Google,还有Sohu/Sogou做开发,有的整天奔行于地球各地,有的继续在大学当faculty,都开始招学生了。虽然那些学习成绩最好的,都在事业上比较成功。而学习成绩不是特别出众的,也有不少成功的案例,这使我很受鼓舞。和他们常常聊天,自己对未来的把握也会有机会变得更加明确。最起码,可以了解到“doing research”是什么含义,其内涵与外延是什么。如何挖paper,读paper,憋paper,发paper。哪些会议是牛会议,哪些刊物是牛刊物,哪些学校的哪个方向是最牛。甚至还有,美国的哪些地方气候不太适宜人类居住,等等。从他们的经验和教训中可以总结出很多规律性的东西来。听了他们说的这么好,说,干脆我也来写个paper吧,就发《清华学报》吧。李老师顿时眼前一亮,Song姐姐立马说,“好!”可是我却不以为意,想不出什么好写。他们说,这就是本科生和研究生的差别吧。

Partita也是一个对我有很大帮助的人。他是三年前来港大交换的计算机系学生。我在这边的选课、学习,甚至玄学上,他都给予了我很大的引导。他平时言谈似乎不多,爱好艺术,由于和我思维方法很相似,我们极具共同语言。一些在他的思维体系中成立的定理都可以不加证明地平移到我的体系中,反之亦然,这省去了很多口舌。他也经常在我遇到困难的时候鼓励我。我有一次周五晚上和他抱怨作业题没想法,他说周一下午让我找他谈谈,结果周日下午我基本上自己搞定了。于是我去到他的办公室,就改变了谈话的主题。我见识了一次什么是真正的“数据挖掘”。Google Scholar这个工具,各种关键词的组合,各种operator的使用,被他用得出神入化。“没有Google Scholar,我真不知道这个研究生怎么念。”他坦言。据说,他曾经和布总合作过一个毕业设计,之后多时才发现他们的东西已经有人做过了。还有人写篇文章提到个好不容易想出的算法,却被问及为什么用别人的“专利算法”……在信息闭塞的时代,这种现象恐怕比比皆是。但是在当今这个资讯全面开放的时代,就没有理由容得这样的事情发生了。

Comments (4)

电子商务大作业(续)

Presentation的时候,我们早于预定的时间来到了现场。结果被告知需要推迟40分钟才能开始。于是先看了几组其他同学的presentation。

第一组做的是一个财务摘要的系统。用户通过iKey登录,可以查看并管理自己近期的财务信息。他们的网站做的很精巧,演讲也很有水平。可是,这个想法实施的困难在于如何获取个人财务信息数据源,以及人们为什么需要这个工具。我觉得,如果这个项目能够和一些网上银行系统加以结合(事实上,国内的浦发银行的网上银行就已经有这种功能了),将成为一种完美的组合。此时iKey也可以作为网上银行的认证工具。但是,操作网上银行对安全性的要求必然高于查看个人财务信息的安全性要求,而且二者登录认证必然是需要统一的。所以与已有的网上银行合作,iKey就没有了用武之地。

第二组同学做的是一个酒店门禁管理系统的延伸。每位入住的旅客被发给一张带IC芯片的钥匙卡,此卡除可用来开门外,还可以在房间内通过指定的计算机终端登录,订购酒店附加服务(如:送水果,餐食等)。这个想法的巧妙之处在于:钥匙卡是通常入住酒店所必备的,将其更换为IC卡,不必改变用户习惯。但是,评委之一提出一个尖锐的问题:酒店房间里面既然有能够打到前台的电话,为什么还要用这套设备来订购服务?

第三组同学做的是一个在线律师答问系统。iKey的作用还是登录认证,除此以外,就再没有什么与iKey有必然联系了。

最后轮到我们了。我虽然知道这种想法其实基本上是行不通的,但也只硬着头皮好上了。出乎意料的是,一位评委对我们系统的技术方面很感兴趣。我们在Q&A环节探讨了很多。他问:是不是真的用私钥签名?还是仅仅作个标记?数字签名后的文件是什么样?(我说自己做一个wrapper类型的文件。)最尖锐的两个问题是:对图片作数字签名本身,只能证明上传人具有这张图片,但并不能证明他拥有此图片的版权。(“What does it mean that someone “havs” the picture?”)还有这个系统的商业模式是什么。(即:怎么赚钱?)对这些问题,我按照自己的理解予以了回答。

由于教师时间安排有些问题,问答只得告一段落。之后我们还到外面和评委继续交流。他说我们的这个想法很有意思。回来看了看当时的录像,似乎我在回答问题的时候表现的确实有些语无伦次,甚至显得aggresive。其实,有时候问答并不是一定要争辩出个对错。只是一个交流的方式而已。

Comments (1)

电子商务大作业

我在港大期间共选了5门课。每门6学分,都是专业课。其中一门叫做 Electronic Commerce Technology(电子商务技术),课程大作业是小组合作做个基于 Public Key Infrastructure Technology 的新型网站,还要配有简单的商业计划书。说白了,就是这个网站必须要能赚钱。最后还要有一个presentation。因为时间安排很紧,这项作业是从deadline的前一周才开始构思的。所谓PKI,可以理解为一种目前认为比较安全的密码及认证机制,有多种不同的应用方式。如汇丰、恒生银行推广的“保安编码器”就算一种,国内的工行推广“U盾”也是另外一种。

一开始时没有任何想法,我们始终无法想明白两个问题:一是,PKI(公钥加密基础)究竟怎样才能与传统商业模式结合?事实上,PKI这种技术往往被用于对安全性要求较高的场合,如目前的网上银行等服务。什么样的场合才需要如此高规格的安全性认证呢?二是,怎样才能使他成为一个“能够赚钱”的网站呢?如果是容易想出的商业模式,必定落入传统的套路。思考的过程就像是在构思创业的历程。经多方求证、征集建议,最后我们考虑建立一个图片交易网站。世界上有很多独立摄影师和独立艺术家,他们创作的作品被平面设计人士、刊物编辑等采用,并因此获得薪酬。我们构建一个这样的平台,使他们得以通过某种形式达成交易。

在这个平台中,独立摄影师及艺术家可以上传自己的作品。上传作品前,需要由网站颁发一个私钥,储存于一个类似“U盾”的设备里。上传作品时,上传者身份需要通过PKI技术认证,同时图片也可由存储于他的电子设备中的私钥来签名(但不是加密)。这样做的目的是确认作者的版权,留下证据。签名不会影响图像的质量。而艺术作品消费者(平面设计师等)通过在网页上浏览,找到中意的作品后,可以直接付款买下。付款后,将会得到高清晰度的图片,同时获得的还有使用此图片的版权许可。付款中的一定比例由网站留作交易手续费,这是网站得以盈利的来源。

基本想法就是这样。于是我用最快的速度实现了一个表达这种想法的示例网站。用 JSP+Servlet 写代码,NetBeans IDE+Sun Application Server 本地调试。由于时间不允许完全自己设计,采用了 Berkeley 授权的 Sun BluePrint PetStore 的框架,节省了大量时间。PetStore自身使用 dojo 的 AJAX 库,做出来很美观。虽然先前没有自己写过 JSP,但是由于有着充足的 ASP 和 PHP 经验,JSP 也很容易理解。写完后的感觉是:JSP和PHP相比,太耗资源了。……

Presentation 前一天的中午,在餐厅见到清华经管学院的同学。一起吃饭的时候聊起我们的项目,他说,需要做商业分析。什么是商业分析呢?大概包括行业形势、成本利润、供需关系……等一系列项目。他说,这个网站要赚钱,首先要给出证明供给是充分的,需求是庞大的,而且还得是一个买方市场,否则对卖家就不构成使用这个网站的激励;再者,要说明艺术家和消费者通过网站交易,均会比传统通过中间人的方式节省成本;最重要的,还要知道网站一年的收入能否大过一年的运行费用,等等。……听上去确实受启发。我们此前光注重了技术范畴的考虑,却对商业范畴的理解近乎空白。虽说以上道理谁都明白,但是能不能自己想出来,还那么有调理,就不容易了。

(未完待续)

Comments (1)

百度搜索结果注水

前几天看到网上有篇转载《信息时报》的报道,百度搜索大量注水被指技术作弊。经过我的独立测试,证实确实如此。

以下是测试结果:

在 www.google.com 上搜索“site:linshuang.info”,显示搜索结果228个。逐页查看,被列为不重复的搜索结果有74个;将重复的结果显示出来,共显示结果23页(每页10个结果),最后一页有7个结果。故共有227个结果能够显示出来。

在 www.baidu.com 上搜索“site:linshuang.info”,显示搜索结果12800个。但是,每页10个结果,显示到第29页面就没有了,这说的是“去除重复”之后的结果。如果让它把这些“重复”的内容显示出来,结果明显增多,但到76页之后,就再也显示不出来了。

由此可见,baidu.com 确实存在夸大搜索我的网页结果数量的问题。相比之下,google.com 在返回对我的主页的查询结果时,数量在误差许可的范围内,基本属实。

很多人也同时发现,google.com 的结果经常(但不永远)比实际显示出的结果数多1。据鱼总说,估计是google程序有bug,某个该初始化为0的变量初始化为1了。哈哈……

Comments (1)

计划恢复Blog写作

在港大交换的一个学期,到现在为止,已经基本结束。所有的授课和作业都已完成,剩下的只是复习考试。不得不说,在港大的学习还是比较紧张的,而且越到后面感觉越紧,时间不够用。先前有人在Blog评论中问我“在港大品出点什么了没有”,很抱歉,当时来的不久,确实没“品”出什么来。现在对一些比较具体的问题,我觉得已经可以回答了。

今天把网站调整了一下。现在 linshuang.info 已经迁移到了新的服务器上,功能较以往没有什么改变。安全性方面,该打的补丁打上了,希望能有所增强。Blog 换了个风格,比原来土黄色的清爽一些。Wiki 也换了个首页,是为了响应有人提出“在wiki里面比较晕”的批评。

根据服务器的有关记录,在过去的三个月中,平均每天都有几十人(次)访问我的页面,平均每人(次)浏览2~3页(次)。我可以想象他们没有看到任何更新的情况下,会是多么失望。作为补偿,我将在接下来几天的时间内,陆续通过“倒叙”的手法描述一下过去的三个月中发生了什么,我做了什么。敬请大家留意。

Comments (1)