说起这次旅行,之所以成功还有个long story。这里不便细说,只能在研讨班的时候介绍了。不过,既然是Web的最高级别的盛会,总要体现一点Web的光环吧。还没有到会,我就体会了一把。
因为我需要在5月6日晚前到达,所以老早就订了飞机票。航线是上海-东京-檀香山-东京-上海,只有美国西北(Northwest airline)的这条航线最近,价格也最便宜。 <顺便插一个花絮> 开始我向我们的东航订航线,由于东航只飞到Los Angles,并只和America Airline联航,所以订票小姐居然建议我飞到LA再乘AA飞回到檀香山!这是先跑直线的两个端点,再回到直线的中点的航线!!亏得我早就知道我们国家领导人访美时总是先到檀香山适应时差,再行飞到美国的西海岸,否则我还差点上了当了!(当然,地理知识在这里是决定因素:-)不过我怀疑是否这个小姐OS学得特好,把磁道上扇区隔离排列的道理灵活应用到这里来了。 由于要避开周末的疯狂票价,所以我只好求订6号启程13号返程的机票。好不容易找到唯一能够订这个航线的“美国”旅行公司,订票小姐却告诉我6号到东京的票没有,只好要了7号的票。我好说呆说,她坚持说没有。所有其他段的票都落实了,就是说6号从上海到东京的票没有,坚决没有!把我急得……好在我灵机一动,去了Northwest的网站http://www.nwa.com,来了个online 由于要避开周末的疯狂票价,所以我只好求订6号启程13号返程的机票。好不容易找到唯一能够订这个航线的“美国”旅行公司,订票小姐却告诉我6号到东京的票没有,只好要了7号的票。我好说呆说,她坚持说没有。所有其他段的票都落实了,就是说6号从上海到东京的票没有,坚决没有!把我急得……好在我灵机一动,去了Northwest的网站http://www.nwa.com,来了个online booking!6号的那个航班有的!!!于是,马上电话订票小姐,我要6号的航班!她还说没有!然后我理直气壮地……她磨蹭了一会儿,就向我祝贺运气好……于是,Web真的帮组了WWW2002的attendees。 其实,我之所以理直气壮是因为我知道西北的那个网站是可靠的,我一年前就在这个网站上直接买“票”,并办理了“换票(check-in)”手续,拿到了机位号。所以这里所谓的“票”,就是网站返回的一个号码(当然是在确认了payment之后)。凭这个号码,如果你没有托运行李的话,上机场直接奔检票口就可以了,只要报一下号码,show一下ID,pass!这就叫作E-ticket。 It is real world!
Whoo, Web!
Lenny
在东京成天机场无聊地等转机时,猛然发现一个问题,令我担心起来。大会寄给我的宣传小册子介绍说,本次大会在整个会场范围内提供Wireless Internet Access,提醒大家带好电脑和802-11卡及驱动程序。我开始没有重视这条消息,现在我担心不要这次会议超前得ONLY Wireless Internet Access!那我扛了我的笔记本不是白辛苦了!
下午2点,注册完成后直奔cybercafe(大会提供的机房),总算放下了心,照样躺着一大箩网线头,插上就可以用.还各有10几台PC和Mac.
处理完所有email,可以休息了. 什么wireless?我要一根辫子.
Lenny
16:00 6 May
今天全部是tutorial & workshop.这算是conference的“垫赛”。仔细研究过后,上午选择了两两个主题:Web Service Composition(tutorial)和Semantic Web Workshop 2002。 先到Web service composition的tutorial。
<什么是tutorial> 我认识一个老外,曾认真地组织一个conference的tutorial,因为她说开了这个tutorial后可以拿到外快补贴她这次开会的费用。简言之,tutorial是一种课程教学讲座,听的人要付钱的!当然,不是人人都可以开tutorial,有严格的审查制度,不然我自己也可以来开个CIP的tutorial了。 <什么是tutorial结束 >
实际上这个讲座没有任何新鲜的素材,不过有以下几点素材的表达是很值得学习的:
1、 应用系统的体系结构的演化:slide8-11。最高境界是cooperative,最低阶段是centralized。
2、 一个b2c的简单例子:slide22,很能说明问题。
3、 Integration Levels:slide50,Integration Scenarios:slide51。这是我认为这个讲座最精彩的片子恕?br> 4、 居然开始讨论service processing modeling,简直不知所云。Slide73-93
5、 Layers of Interoperability:slide95。这是我个人所感兴趣的话题,可惜这里没有展开细讲。
6、 Service发展趋势:slide99。不错,比较精彩。
7、 本讲座的后1/3都是讲agent了,提到de facto Standard Agent Types,slide106。
8、 cooperative service sample:slide116-120,其重要性参见1、
9、 ……溜出去听另一个workshop了。
这里是这个讲座的ppt文件。
抽空去了semantic workshop,还是跟3年前(http://www8.org)一样,只有理想,见不到实际的东西。每人5分钟的讲座根本不能make sense。
再回到tutorial,听到一个有趣的问题的问和答:
Q:现在有多少已经实现的web service?
A:IBM和Microsoft各有一个UDDI server供publish web service,其他都是实验阶段。
我想,scguo要失望了。 我问到的问题:如何对付发布service时描述的语义的规范(how to deal with the normalization of semantic of description of a web service?)例如,讲座中有个service例子:GetCurrentTemp,发布时,为什么不可以是GetCurrentTemprature,GetTempratureCurrent,甚至是GetCurrTemp?回答:这是自然语言的semantic问题,不是这里讨论的范畴。 Lenny
继续参加Service Composition Technologies tutorial。中间中断去浏览了poster展览,粗粗一看,至少有5篇和Web Crawler有关!大会有个正式的session叫Crawling,将专门交流3篇正式论文。
<感叹> 郭蕾、贡珍仙:你们3年前把那个项目做好,该是你们来这里展览你们的成果了。 另一方面,自己有一点点得意。算了,好汉不提当年勇。 <感叹结束>
以为下午的technologies总要比上午更具体一些吧。结果,还是空的一塌糊涂。我个人不相信这些老外是作过这些事情后的总结,所以,只能佩服这些老外的“抽象工作”能力了。反正我是没有这种能力了。
这里是这个讲座的ppt文件。
Lenny
檀香山的清晨是美丽的。清晨起来坐在阳台上,几乎可以触摸到Waikiki Beach。已经有人在浪里翻滚了。
今天是正式大会的第一天。前两天基本翻看了论文的题目,有一些感兴趣的主题,看看能否同作者当面交流了。不过先要把原来的论文看懂才行。
昨晚向Martin Gaedke学习了他的成果:他的类似Portal系统和Web Engineering(他维护着这个方向的一个网站,是这个方向的活跃分子)。老外(至少这个德国人)也是喜欢听赞扬的话,当我指出他的Portal类似与Oracle的Portal时,明显他有不高兴。 What is the difference between your system and Oracle Portal Framework?他的回答不到点子上。按照我的看法,不如Oracle的东西。不过有一点很有趣,他的系统构建在.NET上,听了一些关于.NET的功能和介绍:微软的产品一如既往的特点:很容易上手,但常常crash掉。
关于Web Engineering,有大文章。可惜我对此不感兴趣,只是了解和质疑了这个方向的内容和目标。
Lenny
真羡慕扛着大大小小笔记本到处游逛而永远在线的与会者。昨天Martin也是特地到海滩边上拉了个椅子来向我们演示他在德国的原型系统。一小时过后我才明白为什么他要到宾馆外面来演示他的系统:不是为了欣赏海滩风光,不是为了炫耀他的wireless card,而是为了: 吸烟!
不过在会场上到处走,打开笔记本就能够连在网上,确实既方便了工作,也方便了开小差。看来今后的问题是wireless power而不是wireless network了,这个辫子现在暂时还丢不掉。
Lenny 8 May
一般conference的结构是:半天两个session时段,每个时段同时上演多个parallel session,每个session安排交流3-4篇论文。两个时段之间有coffee break。
第一个和最后一个session往往是全体参加的session,今天的就是opening ceremony。
先是组委会主席、东道主David Lassner, University of Hawaii Director of Information Technology,简单致词,欢迎与会者。开场节目是夏威夷土著人唱的迎宾曲(???,我是没有听懂,除了反反复复高高低低各种调子的aloha,夏威夷语,你好,欢迎之意),其间,主 席放了一个关于当地天气的一个笑话。他提到本次与会有超过900名代表,来自34个国家。
<会议规模大小>
我在01年Boston参加的AISM大会比这还大,招待宴会是在Boston的Art Museum举行,就有点象在兵马俑博物馆里开招待宴会,人人举着酒杯、托着菜盘高谈阔论,制服鲜明的侍者托着小点的盘子穿梭来往于真假古董之间。 不过我知道有40k人的学术会议,象SIGRAPH之类。当然,规模大小不能说明学术水平,但很能说明组织经营水平。
<会议规模大小结束>
接着是IW3C2的执行长,风度很好的一位LADY,Wendy Hall致词,感谢组织者和与会者,这是由于她的身份决定的。 接着,David又很客气的引出了本次会议的承办者,Pacific Telecom. Council主席Hoyt Zia,看得出,这是一个成功的商人,不失时机地推销他们每年都承办的另一个telecom的conference。这次活,只是他们的外快而已。 然后,Hoyt介绍出重量级嘉宾,夏威夷执行州长,Mazie Hirono,一位风度更好的Lady,致欢迎词。首先,她巧妙地恭维了与会者,说她很难相信在夏威夷这么早(8:30)能够聚集到这么多人开会(言下之意夏威夷人这个时间会因为贪恋昨日的美景而呼胡大睡),她的这个马屁拍得人人都舒服。然后合理地恰如其分地赞扬了Web对夏威夷地方经济建设的贡献,这种赞扬听不出一点虚情假意的官样味道。最后,大力地推广了夏威夷的旅游产业,希望大家不但这次来为她做贡献,以后也要来做贡献。 最后,轮到这个session的主角,Tim Berners-Lee作keynote speech。David在介绍这位例行的演说者时,堆了一大堆的awards。我想,作为web的领航者,Tim每年一次的这个keynote会花掉他不少头发吧。 Tim还是那样的激情满怀,充满斗志。演讲的题目是Spec Count,主题仍然是继续推销Semantic Web.同三年前WWW8相比,Tim为我们堆砌了近百个Specs!!!当然,他还在说,We are not done! 他从低层的ethernet packet需要spec说起,谈到IP需要spec.,往上TCP需要spec.,再往上端口80、http需要spec。在往上,在http上流的信息需要SPEC。我W3C现在就是在做这些SPEC,我们需要更多的PUBLIC INPUTS,我们有loyalty,我们会注意今后将来根据我们的工作进行专利申请工作,以确保不被不法商人谋取私利(WHO KNOWS?)。 在他的激情演说中,插了一个小花絮。 大凡这类大牌演说过后,我认为最精彩的部分是问题和回答。可惜,Tim的这次演讲只留了不到5分钟的时间来回答问题。更为可惜的是,我连这个问题是什么都没有听懂,短短的一句话,音调从低到高一溜烟的没了,只听懂了“15年了,,,又怎样。。。”之类,大意是质疑Tim的努力和观点,因为会场爆发了一片笑意。Tim辩解地说了一些,我们能够怎样,已经怎样,还在做什么等。我个人感觉,效果不如WWW8。 OK, coffee break! 赶紧补吃早饭。
Lenny
Parallel session的缺点之一就是当鱼和熊掌不可得兼。
准备好了去听e-Learning的session。
A Step ahead in E-learning Standardization: Building Learning Systems from Reusable and Interoperable Software Components: fig5到fig7很有价值,值得一看。 纯粹是空谈!e-learning还没有影呢,就已经来standardization了,不过抢占CORBALearn的制高点的做法值得称赞。
Kukakuka: An Online Environment for Artifact-Centered Discourse: 这个老师不贪功,一上来就说,这是我的学生和我做的,他就坐在后面,大家可以同他交流。 这是一个纯粹的应用系统,没有技术含量。是一个在线的bbs加上一个立线的news。
ARE COMPUTER SUPPORTED LEARNING ENVIRONMENTS REALLY LEARNING ENVIRONMENTS? 没有时间听,溜掉了。不过题目很恐怖。看样子是社会学心理学等,总之不会是cs/it。
Lenny
晚 8 May
Poster是我们这种(英语+学术)水平的人可以露脸的地方。请看本次poster的情况:
164 poster submissions, 25% increase over the previous year; 39 posters from the Refereed Paper Track;论文水平不高,被降级使用; Each poster was sent out to at least three reviewers; 72 posters, bringing a total of 107 posters to be presented at the Welcome/Poster Reception.
味道好的是:观赏poster和晚餐安排在同一时间和地点。于是,作者们忙着在在自己大字报前,忙不迭地向端着盘子边吃边看的人介绍并演示自己的成果,在整个一个集市拍卖的场景,如果不解恨,旁边欢畅的会议大厅可以供双方坐下来慢慢谈。我故意作者们是吃不大饱的,反而是评赏的人因为活动量大而增进了食欲。
我仔细看了关于crawler的几个大字报,并和六个作者进行了交流(一个是日本、一个香港、一个中国,其他三个不知道什么国)。
Taking Charge of Profile Information Conveyance:
UbiCrawler: Scalability And Fault-Tolerance Issues:
A New Model for Web Crawling:
另外关于page ranking/ text clustering都是比较感兴趣的主题。
Lenny
这是集中的大session,属于keynote档次。
有一个big name:HP的掌舵人。演讲的题目叫Building Chain of Trust。到底是超一流的重量级人物,居然总是走在并想在人家前面。 讲的是未来的数字时代的trust问题,而且还要一个chain的背景下。 从地层的器件到板子、整机、操作系统、应用软件,那一环都有个上和下的信任问题,例如,操作系统一旦从新启动, 原来正在运行的网络应用的信任链就断掉了。想想也是后怕,凭什么说我email给你的确认信就是真的我发出的? 这个中间经过了许许多多的环节,谁来保证这些个环节都是可靠的,并且可以作为法庭上承堂证供的?当然,演说者希望是hp:-) 这是一笔大文章,好像没有谁能够承受,但是,至少人家已经想到了。虽然不能完全听懂这位老兄的高见,
第二个演说者,是UC berkeley 的律师,美国50大杰出律师之一,百名数字时代人物之一。谈的是知识产权问题。我就更加没有兴趣和听得懂了。
Lenny
因为明天就要回家,所以就听了一篇论文就去机房处理email了。 RP-19 Description & Analysis Session Template Detection via Data Mining and its Applications:作者认为,现在的web页面根据内容分为明显的区域块,每个区域就是用template做出来的。 三大原理,一个著名的算法。 三个case study。 页面分类算法。 测试结果。
本文可以作为范例,叫学生读。
lenny
Personalized Pocket Directories for Mobile Devices: 这是一篇非常简单易懂得论文,探讨了用三种模型来重新定制从content server到pda的通道,用目录的视图来作为pda的信息访问模型。
A Web Middleware Architecture for Dynamic Customization of Content for Wireless Clients: 这种思路我十分熟悉,不失为一种解决这个问题的好的方法。问题是,n个pda,m个server,那么要多少个midator?
Mobile Streaming Media CDN Enabled by Dynamic SMIL: 小日本的这个介绍,咬牙切齿, 从这篇文章推导出来,Wireless的应用离不开locale cache,不管是在client端、中间基站端、或者server端。本文的方法就是把巨型的stream content拆解在SMIL中再发布到wireless端,(又是一个XML的绝好应用),于是,wireless端得到的就好像是动态的装配文件,内容就近抓取。
lenny
Open Learning Objects: the case for inner metadata
Semantic Interoperability, Communities of Practice and the CanCore Learning Object Metadata Profile
Semantic Web Metadata for e-Learning - Some Architectural Guidelines
Web Crawling High-Quality Metadata using RDF and Dublin Core
这4篇论文可以让学生阅读。
lenny
按照我个人的观点,Web正面临挑战和危机。说是危机一点都不过分,面临灭绝的危机。首先,什么是Web?是HTTP+HTML!现在叫得最响的是Web Service和分布计算。不管是CORBA也好、DCOM也好,SAOP也好,HTTP只是作为一个通讯的通道,甚至只是一个Start up一个应用时的通道,一旦这个应用起来了,完全可以脱离http进行通讯。所以,http的重要性正在日渐缩小。另一方面,在用户界面上,html也正在失去作为这些应用程序界面描述的核心地位,浏览器越来越自作主张地支持新的功能,更不用说那些直接可以处理界面的诸如Java之类的客户开发环境了。所以,以我之见,将来的趋势,Web只能是作为一本黄页目录的功能。http将不被作为应用层的协议对待,而下降到同TCP/IP等同的地位了。
Tim不必伤心,因为首先,Tim以Web的贡献和成就,足以同历史上任何一位科学家的成就相媲美。第二,Internet的命运也好不到哪里,或者,以TCP/IP为核心的Internet面临同Web相同的境地。分布应用的需求和网络基础设施的普及,TCP/IP本身不适应离散和分布计算的要求,本质上只适用一种Client/Server的计算模式。所以,TCP/IP也会被只作为网络服务的启动媒介,不会在服务的生命全周期内(或者是关键阶段)依赖于TCP/IP。
那么,Tim该做什么?作为Web之父,本能的反应时拯救Web。Semantic Web就这样出笼了。很幸运,Tim开始大张旗鼓地抛出Semantic Web的WWW8上,我也聆听了Tim的布道,回来后赶快宣传。现在的Semantic Web并不能救Web,事实上已经跨越到信息系统这个领域中了。这个工作并没有什么不好,也是很有价值的。但没有必要同Web捆绑在一起。在这次keynote中,Tim冒出一个奇怪的说法,bit does mean something,所以URI也要描述并要颁布新的Spec。其实质,还是希望分布应用也用URI来指东指西,从而让URI这个地道的Web部件搭上Web service的快车。这明显令我反感。分布应用的调用协议要达成统一还早呢,URI显然不是最佳候选。
Semantic的东西还是有搞头的,但不能只吊死在Web上。
Lenny
书到用时方恨少。不知道zhhzer们能否体会。我在读研究生时常用的话是,到了资料室查资料的时候,方觉得自己是多么的渺小,所以有时也得闭门造造车,否则你连自己的车轱辘都不会有。现在我常体会到的是:书到用时方恨少。在这次大会过程中,我又有了到一个大大的资料室的感觉,不过更痛苦的是,交流的不畅:语言障碍。英语学得好不好绝对不是能否对付日常生活交流(更不是TOFEL/GRE),而是理解和表达人文(不是公式、步骤)内容,通俗点讲就是吵架和辩论。我还差远呢。即便是Microsoft Research Asia的中国精英们,也还差远呢。
lenny
遗憾之一,没有我们的学生来参加这些会议。不是不能,而是不为。先算一算经济帐。大会会期5天,吃饭基本解决。我的注册费是495美元,而学生只有200美元! (我本来也想以学生身份来注册,搞一张学生证明还不容易?况且,为学校省钱还不好?不过,还是放不下中国人的面子。) 加上旅行机票¥4800,再加上住,两个人同住就可以平均60美元/天。所以,只要这个学生与会者收获多多,那么就是看这个200美元+500美元+¥4800与学生在会议的收获和影响相符不相符了。我个人认为,只要这个学生有论文、甚至只要有Poster,那就是值得的。
在我们的研究生研讨会上,我反复主张我们的研究生要积极参加学术活动,起码要从国内的做起。什么时候,我们的研究生才能冲出中国,走向世界?
遗憾之二,没有把照相机带来。虽然我早知道没有时间和兴致享受夏威夷的美丽风光,但随时欣赏的机会还是有的。可惜!
lenny
晚饭后散步,特地去了夫人和我曾经旅游住过的地方,Waikiki Gateway Hotel。当时觉得这家旅馆很好,离海滩特近。现在当然更羡慕离海滩更近的Sheraton Princess Waiulani。对着美丽德夏威夷风光,当时和夫人商定,儿子以后长大成家立业,强烈建议小家庭来夏威夷度假。现在我还是保持着这个愿望。 But I will not give him a penny for such a tour ‘cause my parent did not do so. Study and work hard, my son. Best wishes to you!
Lenny
Qiang Lv 2008-07-21