菜地

“采菊东篱下,悠然见南山”。何妨学陶令,拾掇片菜地。
posts - 833, comments - 3323, trackbacks - 39, articles - 1
  Home :: Contact :: Syndication  :: Login

News

 

朋友,您好!

这是我2006年5月1日劳动节建立的“开放的客厅”。欢迎串门!

我的地理位置在中国的北京。不过网络时代“天涯若比邻”。我们即使远隔重洋,串门也很方便,只须轻点鼠标,即可象古老传说中的神仙一样,逍遥游天下……

我的邮箱:caiya003@126.com

 

文章 分类

☆☆☆☆☆ 链接

关于数字化图书馆

Posted on Saturday, June 17, 2006 7:26 PM #☆我的所有文章 #管窥IT

 

【菜地】刚才听见央视新闻联播中说,有一种扫描机器人研制成功并投入使用,可以自动扫描图书,这机器将在图书馆数字化进程中大展宏图。赶紧看一眼,见到电视画面上一台机器在自动翻页、扫描一本书。消息转瞬即逝了。感觉这条消息事关数字化建设之大计,于是上网“谷歌”(Google)了一下,没找着刚才新闻联播里说的那一条,找到了下面这一条,感觉同样具有一定参考价值,全文转载如下。

 

【转载】

 

 宇宙全书:一个古老梦想 

2006-6-9 10:35:58   义川

 

 

 

 

自从有了文字记载的历史以来,人类就一直怀有一个梦想,一个希望,那就是建造一座能够收藏天下所有知识的图书馆。亚历山大大帝曾经在埃及的亚历山大城差一点就实现了这个梦想。他将当时世界上差不多将近70%的图书(那时候叫手卷)都搜罗进了亚历山大图书馆。

 

然而自那以后,这个梦想就离人类越来越遥远了。

 

我查阅了出版业的统计资料,现在世界上差不多每分钟就要出新书二到三种,每年大约要出100万到200万种。这还没有包括其他媒介形式的出版物。当然,这是现在的速度。如果我们以称得上图书出版大国的中国为例,从西汉到清末的2100余年间,除去重复,所出版的各类中文书籍也就大约20万种。

 

如果我们读美国《连线》杂志作家凯文·凯利最近发表在《纽约时报》上的文章“扫描这本书”,那么凯利给出的统计数据是这样的:从古代的苏美尔人发明了泥板文字(即楔形文字)以来直到现在,人类的所有“出版物”至少包括3200万种图书、7.5亿篇文章、2500万首歌曲、5亿张图片、50万部电影、300万部电视剧和短剧,或者1000亿个Web网页等等。据凯利估算,所有这一切信息都可以装进一个50PB的硬盘。如果iPod的硬盘未来能有这么大,那我们就实现了古老的梦想,拥有了一个宇宙图书馆,或者拥有了一部像博尔赫斯所形容的可以了解一切知识的宇宙“全书”,而且还可以随身携带。

 

不过凯利似乎有些漏算。首先,他给的这些数字可能被严重低估了(尤其是纸质图书的数字);其次,到未来能够将所有出版物都数字化的时候,这个数字会怎样增长我们还不知道;再次,这个未来会有多长?凯利在文中介绍了一个扫描机器人,每小时可以自动扫描1000页图书,我们需要多少机器人,用多长时间来完成所有的扫描工作?最后,正像凯利所言,在美国扫描一本书的成本目前大约为30美元,只需粗略计算,我们就知道数字化的转换成本大得惊人,而且似乎永无止境。

 

当然,我们的梦想依然在实现的途中。比如Amazon已经将上百万册英文图书数字化了,而中国的超星数字图书馆也已将130万种中文图书放在了网上。此外,还有更多的政府、大学、企业甚至个人也在从事着同样的工作。

 

不过,问题依然存在。博尔赫斯在他的“通天塔图书馆”中描绘了一个上穷碧落、下通无底深渊、旁通无限的图书馆。他相信,在这个图书馆里一定藏着一本宇宙全书。但是我们当然还记得古人也曾经企图建造一座通天塔,后来由于上帝淆乱其语言而坍塌了。

 

假如世界上有十种主要的语言(当然不止),如果各语言之间无法进行数字化沟通,那么未来那本宇宙全书的效用对于操某一种语言的人而言就只有百分之十左右了。

 

宇宙全书,依然还是一个梦想。但是它离我们似乎越来越近,不再是越来越远了。而这一切,全赖数字化和互联网所赐!

 

 

北京时间:2006年6月17日 21:26 贴出

栏目:管窥IT

Feedback

# re: 关于数字化图书馆

6/18/2006 1:11 PM by 刘郎
好,利环保,盗版也方便了

Post Comment

Title  
Name  
Url
Comment   
Protected by Clearscreen.SharpHIPEnter the code you see: