1.5.5 信息领域
这两张图片显示的是一台普通PC(也可能是两台)和服务器机群的一部分:
我们曾经将注意力集中在普通用途的“工具”上: 你不能看到、 感觉到或听到软件。我们无法给你提供一张程序的图片, 因此我们给你看一下运行它的“工具”。但是, 很多软件直接处理“信息”。因此, 让我们来考虑一下运行“普通软件”的“普通计算机”的“普通用途”。
一个“服务器机群”是提供Web服务的多台计算机的集合。通过使用Web搜索引擎, 我们找到由维基百科(一个Web目录)提供的下列知识。在2004年, 据估计搜索引擎的服务器机群是以下规模:
719个机架
63272台机器
126544个CPU
253THz的处理能力
126544GB的内存
5062TB的硬盘空间
一个GB是1G字节, 大约是1000000000个字符。一个TB是1T字节, 等于1000GB, 大约是1000000000000个字符。最近, 这个“机群”变得更加庞大。这是一个相当极端的例子, 但是每个大公司都在Web上运行程序, 并通过它与用户或消费者进行交互。更多的例子包括Amazon(销售图书和其他商品)、 Amadeus(航空票务和汽车租赁)和eBay(在线拍卖)。数以百万计的小公司、 组织和个人也存在于Web上。它们中的大多数并不运行自己的软件, 但是也有很多在运行并且相当复杂。
其他更传统、 更大规模的计算机应用主要涉及: 会计、 订单处理、 发薪水、 记录保存、 账单、 库存管理、 个人记录、 学生记录、 病历等, 基本上每个组织都需 4婕锹 商业和非商业、 政府和个人)。这些记录是每个组织的支柱。通过计算机处理这些记录看起来很简单: 这些信息(记录)中的大多数只需要存储和检索, 只有非常少的部分需要处理。这方面的例子主要包括:
12∶30飞往芝加哥的航班是否仍然准时?
Gilbert Sullivan是否曾经患过麻疹?
Juan Valdez订购的咖啡是否已经启运?
Jack Sprat在1996年购买的是哪种餐椅?
2006年8月从212区号拨出电话的数量是多少?
1月售出的咖啡壶数量和总价是多少?
规模庞大的数据库使得这些系统非常复杂。这样, 就对响应时间(对每个查询的响应通常不超过2秒钟)和准确性(至少在大多数情况下)的需求。如今, 人们谈论T字节的数据(一个字节等于用于存储一个普通字符的内存大小)已经很常见了。这就是传统的“数据处理”, 它正在和“Web”相融合, 这是由于当前多数的数据库访问都通过Web接口。
这种计算机应用通常称为信息处理。它将重点集中在数据上, 通常是大量的数据。这就导致了在数据的组织和传输上的挑战, 以及在怎样以可以理解的形式来表示大量数据的大量有趣的工作: “用户接口”是处理数据中的重要方面。例如, 对古典文学(Chaucer的《Canterbury Tales》或Cervantes的《Don Quixote》)的分析工作, 通过比较几十个版本以找出哪个才是作者的实际创作。我们需要以分析人员提供的多种标准来搜索文本, 并且以有助于发现要点的方式来显示结果。思考一下文本分析和出版: 当前, 几乎所有的文章、 书籍、 小册子、 报纸等都通过计算机生产。设计出能够很好地支持这一切的软件, 对大多数人仍是一个缺乏真正好的解决方案的问题。