文明的度量：社会发展如何决定国家命运：第二章跨越时空的度量：社会发展指数_伊恩·莫里斯

在第一章中，我提出，对于长达两个世纪的关于为什么西方主宰世界这一问题的争论，最好的解决办法是建立一个社会发展指数，因为这将使我们能够将西方社会的发展与非西方社会的发展进行长期比较。我们只有确定了需要解释的历史的轮廓，才能对为什么西方主宰世界做出更好的解释。

继而我查看了自19世纪50年代以来的社会进化论研究，以及自20世纪70年代以来对其最新版本——新进化论——的批评。在本章中，我将描绘一种社会发展指数。这种指数回应了对进化论的最严厉的批评，又没有忽视其中心目标——能够对社会发展进行跨越时空的度量和比较。

我的方法依赖于9个核心假设。首先，我会对它们进行阐述；其次，我将继续解释社会发展指数将如何运作。在本章结束时，我将解释为什么我认为这个指数完善了20世纪新进化论的指数。

定量、东西方、时间：什么支撑着社会发展指数

我做了9个基本假设，每个假设都需要开展不同程度的讨论。

定量分析

社会发展除非能够量化，否则就是一个无用的概念。已经有好几代历史学家对定量和定性的优缺点进行了争论，我不打算对这些越来越没有结果的争论老调重弹。

我并不想当然地认为定量分析就一定比定性分析更客观，无论我们是计算还是描述，都总会出现本能的判断和潜在的武断的识别。第三章至第六章将详细介绍一些在这方面，我所做过的最重要的判断和识别。

也就是说，定量分析的办法应当比定性分析更清晰，因为定量迫使分析者专注于这些判定，并且要系统地阐明做出某个选择而不是另一选择的理由。如果我们不对社会发展进行定量分析，争论就将继续陷于打概念仗的泥沼之中。所以我们的目标必须是为社会发展建立一个数字指标，使得对世界上的不同地区和不同历史时期进行直接的比较变得可行。

简约性

据说爱因斯坦说过：“在科学上，应当使事情尽可能地简单，直到不可能更简单了。”尽管没有人曾试图寻找这句引言的原始出处，但我认为，必须以此作为研究社会发展的目标，但是并非所有人类学者都同意这样的看法。（就此而言，也并非所有自称社会科学家的学者都同意。）

学者们通常会认为做学问的目的应当是为我们对世界的理解增加复杂性。无疑有许多问题——尤其在文化研究方面——需要能使我们的认知更加复杂、更加玄妙精微的方法，为此甚至可以付出使之晦涩难懂的代价，但在讨论为什么西方主宰世界这个话题时，一般来说，主要是因为复杂性太重了，使得中心议题在大量细节中被模糊了，分析往往会陷入“只见树木，不见森林”的典型误区。

特性

设定像“社会发展”这样一个宽泛的概念，要求我们先将其分解为更小的、可直接度量的单位。遵照HDI模式，我试图在为社会发展的形式定义时涵盖全部标准的最小数量的具体特性。任何特性列表都不可能是完美的，但我们追求的目标是挑选出最佳集合。也就是说，如果我们在这种集合中增加更多的特性，就将经不起爱因斯坦的简单性的考验，因为那将使事情走向毫无必要的复杂；而如果我们减少特性，那么这份列表就将无法包含定义的全部要素，并将使事情过分简单化。

第一个HDI是在1990年由经济学家马赫布卜·哈克（Mahbub Haq）设计的，旨在将发展经济学家们的注意力从国民收入核算上转移到人类福祉上。在和阿马蒂亚·森（Amartya Sen）及一个联合国经济学家团队的合作下，哈克巧妙地设计出了HDI，为联合国发展署的官员们提供了一种单一分数，使他们能够了解各国在促使其居民发挥其内在潜力方面做得怎么样。

HDI利用3个特性：出生时的预期寿命、知识和教育（以成人识字率占2/3的分数，以大中小学入学率占另外1/3的分数），以及生活水准[以美元计算的购买力平价换算的人均国内生产总值（GDP）]。联合国人类发展计划署经常改变其计算方法，2011年变动尤为明显，其进行了大改变，为生成分数提供了一个便利的计算器。

HDI被批评得体无完肤，从对特性的选择、基础数据的差错、对教育和收入的看重，到对环保和道德的忽视，都是如此，然而它仍然被证明极其有用，并得到了广泛运用。

人类发展与我在第一章中定义的社会发展并不相同，但是确定一个易处理的小数量的可定量分析的特性这一基本原则却是相通的。当然，HDI与我的社会发展指数也存在较大的差异，最明显的是，每个发表的HDI都是对一时的快照，不考虑历史变化。HDI可以通过比较每个年度报告中单一国家的分数，在一定程度上估量一段时间的变化，但由于其可能得到的最大分值总是1.0，HDI更适合于在图表中标示一个国家在某一时间点在世界上的相对位置，而不大适合于度量发展水平历经时间长河的变化。

总之，尽管HDI和我的社会发展指数目标大为不同，但其基本原则——小数量的可定量分析的特性能够作为较为宽泛的概念的代表物——却是个极好的起点。

有用特性的标准

在社会科学中，就如何挑选好特性有很多讨论，大多数说法都关注6项标准：

（1）特性必须是相关的。也就是说，必须告诉我们一些与我在第一章中定义的社会发展有关的情况。

（2）特性必须是独立于文化之外的。例如，我们也许会认为文学和艺术的质量是衡量社会发展的有用的尺度，但是众所周知，对这些问题的判断是受到文化制约的。

（3）特性必须是相互独立的。例如，如果我们以一国人口数量和一国财富数量为特性，就不能再以人均财富量为第三个特性了，因为这是前两个特性的产物。

（4）特性必须有充分的文件证明。当我们回溯几千年前的历史时，这的确是个问题。特别是对遥远的过去，我们的确可能对一些可能有用的特性知之不多。

（5）特性必须是可靠的。也就是说专家们对证据的判断多少是一致的。

（6）特性必须是便利的。这也许是最不重要的原则，但取得证据越难，计算结果的时间越长，这个特性的用处越小。

关注东方和西方，而不是整个世界

对社会发展进行真正的全球考察，尽可能详细地评估世界所有地区的情况，当然是非常受欢迎的。然而，那需要极其大量的工作，对于解释为什么西方主宰世界这个问题着实是个钝器，它增添了不必要的复杂性，经不起简单的检验。

为什么西方主宰世界这一争论的核心问题，是西方的社会发展水平在遥远的古代就比世界其余地区的高，还是西方仅是在近代异军突起。为回答这个问题，我们没必要同样详细地调查世界上所有地区的社会发展状况。出于贾雷德·戴蒙德的《枪炮、病菌和钢铁：人类社会的命运》和《西方将主宰多久》第二章中讨论的原因，在最近一次冰期的末期，大约公元前13700年时，“幸运纬度带”（大致为北纬20°~35°的旧世界和南纬15°至北纬20°的新世界，见图2.1）的地区中的一小部分社会的社会发展开始加速，超越了世界上所有其他地区。

图2.1 幸运纬度带

资料来源：迈克尔·安吉（Michele Angel）制作

在过去数百年间，世界上仅有的似乎比较可能与西方匹敌的地区，是那些从新世界的核心地带发展起来的地区，以及南亚和东亚。这些地区在最后一个冰期的末期时，成为潜在的可用于家居的植物和动物聚集最稠密的地区。实际上，自最后一个冰期末期起，唯一在社会发展方面得分高于西方的地区是东亚。因而，遵照精简原则，我关注东西方的对比。

哪儿是东方，哪儿是西方

解释为什么西方主宰世界这个问题的最大困难之一，在于不同的学者倾向于以不同的方式定义“西方”这个词，使争论陷入了打概念仗的僵局。据历史学家诺曼·戴维斯（Norman Davies）计算，学术界共有不下12种不同的定义，相通之处仅仅是他所谓的“弹性地理”。戴维斯的结论是，西方“几乎可以被其定义者以任何他们认为合适的方式进行定义”，结果便是“西方文明本质上是个知识建构上的混合词，可用来进一步为其创造者的利益服务”。

戴维斯指出，问题在于历史学家们往往从他们喜欢与西方联系起来的一些价值着手，比如，民主、基督教、科学或自由，然后确定一批似乎享有这些价值的国家。然后再一本正经地将这些国家与一系列他们认为不享有这些价值的“非西方”国家对比，再就差异提出一种解释。他们的困境在于，反对的历史学家们也可以很简单地将另外一些价值定为西方的精髓，提取另外一些享有这些价值的国家进行不同的对比，自然会得出不同的结论，但能同样服务于自己的目的。

为了避免这种民族优越感，我做出了极其不同的假设。我不是建立一些我认为属于西方的价值，再沿时间向前回溯，而是一开始就着眼于故事开端，再向后展望。地区之间生活方式的根本不同，实际上只是在最后一个冰期结束后才开始发展起来的。当时一些群体开始栽培植物、驯化动物，而另一些群体仍在延续着采集食物的谋生手段。正如我在《西方将主宰多久》的第二章中所解释的，我对“西方”的定义是，人类在欧亚大陆最西部最早进行驯养生活的核心地带，即底格里斯河和幼发拉底河的源头地区，通过一系列殖民和竞争发展和扩张的社会。

在这一地区，驯养生活促使人口增长，同时推动了社会向前发展和人口向外扩张。到公元前4000年时，这个“西方”已经扩展至包括了欧洲大陆的大部，以及今埃及、今伊朗的西部边缘和中亚的一些绿洲（见图2.2）。在公元第一个千年，“西方”继续扩张，囊括了今天我们称之为“欧洲”的全部地区；在公元第二个千年，欧洲人又将“西方”扩展至美洲、大洋洲和非洲海岸。

图2.2 西方的早期扩张，公元前9000~前4000年

同样，当我提及“东方”时，指的是人类在欧亚大陆最东部最早进行驯养生活的核心地带，即黄河和长江之间的地区，也是通过一系列的殖民和竞争发展和扩张的那些社会。像在西方一样，驯养生活促使人口增长，同时推动了社会向前发展和人口向外扩张。到公元前2000年时，“东方”扩展至包括了我们今天称为“东南亚”的大部分地区。到公元前1500年时，“东方”又囊括了今天的菲律宾和朝鲜半岛，在公元第一个千年中又兼并了日本。

这种将“东方”和“西方”定义为欧亚大陆最东端和最西端的驯养生活核心地带的社会的办法是常识。这样定义还有一大好处，就是使我们能够对长期的人类历史采取一贯的概念，避免困扰了很多关于为什么西方主宰世界的争论的意识形态极端化。

度量的时间间隔

社会发展指数的主要目标之一，是度量随时间推移而产生的变化，所以指数必须有历经时间长河的维度。我从最后一个冰期接近结束时，即公元前14000年开始打分，一直持续到公元2000年，这样不仅提供了一个便利的结束点，也使我们能再有一些时间看看此后的发展趋势如何。

遵照精简原则，在计算社会发展分数时，时间间隔应当小到足以显示变化的大致模式，但不能更小了。在史前时期，年代测定技术通常要允许较大幅度的误差，但社会变化的速度通常也非常缓慢。即使我们有足够好的证据来区别公元前12000年和公元前11900年，其差异也许仍然太小，无法度量。

因此我使用一种浮动的间隔。从公元前14000~前4000年，我以每1 000年为单位来度量社会发展。从公元前4000~前2500年，证据的质量改善了，变化加速了，因此我以每500年为单位来度量社会发展。对于公元前2500~前1500年，我将间隔减为每250年为单位，最终从公元前1400~公元2000年，我以每100年为单位来度量。到了20世纪，资料的质量已使我们可以逐年探查变化。甚至如果我们愿意的话，至少自20世纪下半叶起，可以逐月查看变化，不过精确到这个程度对于回答为什么西方主宰世界这个问题并无多少助益，却要增加巨大工作量，违背了对有用特性的讨论中的第6项原则。

这个办法的缺点之一在于史前时代的变化不可避免地会被消除掉。的确，从长远来看，冰期结束后的头几千年，社会的发展变化比过去数百年缓慢得多，但在极少数的情况下，史前考古遗迹的年代也可以得到非常精确的确定（例如，法国阿尔卑斯山脚的湖畔村庄，通过树木年代学测出的时间，误差只在几年之间），很明显，这些漫长的波浪遮掩了很多较短的周期。目前，似乎还没有办法解决。

关注核心地带

历史学家彭慕兰在其里程碑式的著作《大分流》（The Great Divergence）中指出，一些历史学家热衷于提升欧洲的优越地位，于是经常犯一个低级的错误，即与将现代欧洲早期最发达的部分，如英国和荷兰，与整个中国对比，然后得出结论：欧洲在18世纪，甚至在17世纪，就要发达得多。将不相称的地区相比较，得出的是无意义的结果（这就是第一章中所提到的，纳罗尔提议用他本人创造的更抽象的“文化单位”，来取代考古学家们和人类学家们用于做比较的正式单位的原因）。因此，以适当的、可比较的时空单位来考察社会发展，对我们来说是至关重要的。

有一个解决方案，是把上述定义的整个东方地区和西方地区作为我们的分析单位，尽管这意味着西方的分数，比如说公元1900年的分数，将把工业化的英国、俄国的农奴，墨西哥的日工，以及澳大利亚的农场工人归在一起计算。继而我们不得不为整个西方地区计算一个平均的发展分数，然后再对东方重做一遍同样的工作，再对历史上每一个更早期的点重复同样的进程。这样做就太复杂了，因而是不切实际的，违背了对有用特性的讨论中的第6条原则；而且这样做也许根本是无意义的。当要解释为什么西方主宰世界时，最重要的信息通常会来自比较每个地区最发达的部分，也就是聚集着政治、经济、社会和文化相互作用最强烈的核心地带。社会发展指数需要衡量和比较这些核心地带内发生的变化。

随着时间推移，这些核心地带发生了极大的迁移和变化（见图2.3）。从公元前11000~约公元1400年，西方的核心地带在地理上非常稳定，一直安于地中海的东端，除了约公元前250~公元250年的500年间，罗马帝国向西扩张，纳入了意大利。否则，西方的核心地带就始终维持在今伊拉克、埃及和希腊形成的三角形内。自公元1400年起，这一核心地带不断地向北和向西迁移，先到达意大利北部，继而到达西班牙和法国，然后又扩张至英国、低地国家和德国。公元1900年，该核心地带跨越了大西洋。到2000年时，牢牢地在北美洲扎了根。

图2.3 东方和西方核心地带的迁移

资料来源：迈克尔·安吉制作

在东方，核心地带始终保持在最初的黄河–长江之间地带，一直到公元1850年。尽管大约公元前4000年后，重心北移至黄河流域的中原地区，公元500年后又回到了南方的长江谷地，公元1400年后再次逐渐北移。到公元1900年时，该核心地带纳入了日本，到公元2000年时又纳入了中国东南部。

至于东方和西方的核心地带的确切边界在哪里，无论在任何时间点，专家们都会有不同见解。在表2.1中，我大致标示了核心地带。

表2.1 公元前14000~公元2000年西方和东方核心地带

西方公元前14000~前5000年侧翼丘陵区（亚洲西南部）公元前4000~前3500年美索不达米亚平原（亚洲西南部）公元前3000年埃及（非洲东北部）公元前2500~前1300年埃及（非洲东北部）、美索不达米亚平原（亚洲西南部）公元前1200~前1000年埃及（非洲东北部）公元前900~前700年叙利亚–美索不达米亚平原（亚洲西南部）公元前600年埃及（非洲东北部）、美索不达米亚平原（亚洲西南部）公元前500年波斯帝国（亚洲西南部）公元前400年波斯帝国–爱琴海（亚洲西南部－非洲东北部－欧洲东南部）公元前300年希腊化王国（亚洲西南部－非洲东北部－欧洲东南部）公元前200年地中海盆地（亚洲西南部－非洲东北部－欧洲东南部）公元前100~公元200年地中海中部（欧洲南部）公元300~600年地中海东部（亚洲西南部－非洲东北部－欧洲东南部）公元700~800年埃及（非洲东北部）、叙利亚－伊拉克（亚洲西南部）公元900年埃及（非洲东北部）、西班牙（欧洲西南部）公元1000~1400年地中海盆地（亚洲西南部－非洲北部－欧洲南部）公元1500~1600年大西洋沿岸地区（欧洲西部）公元1700~1800年法国、英国（西北欧洲）公元1900年德国、法国、英国、美国（欧洲北部，美洲北部）公元2000年美国（美洲北部）东方公元前14000~前2250年黄河－长江河谷（中国）公元前2000~前600年黄河河谷（中国）公元前500~公元200年黄河－长江河谷（中国）公元300~900年长江河谷（中国）公元1000~1500年黄河－长江河谷（中国）公元1600年黄河－长江河谷（中国）、日本公元1700~1800年黄河－长江河谷（中国）公元1900年日本公元2000年中国东部、日本

近似和讹误

理所当然的是，世上根本没有百分之百精确的指数，无论是从较严格的意义上来解释“精确”一词，使其意味着所有单个细节都绝对正确，还是从较宽泛的意义上解释，使其意味着所有专家都会做出同样的估计，即使他们无法证明这些估计是正确的。在所有历史知识中，我们可以完全确信的只有很少一部分，而专家们能一致同意的更少。因此，如果问我计算的社会发展分数是否正确，是没有意义的。它们当然是不正确的。唯一有意义的问题是，它们有多不正确？它们是否大错特错，证明了我错误地识别了社会发展历史的基本形状，意味着我对为什么西方主宰世界所做的解释存在致命的缺陷？抑或这些误差实际上都微不足道？

解决这些问题有两个主要办法。一个办法是假设我犯了系统错误，普遍地高估了西方的分数而低估了东方的分数（或者相反），然后再问：（1）我们需要将分数改变多少，以使历史显得非常不同，使得《西方将主宰多久》一书中所提出的论点不再适用？（2）这样的改变是否貌似合理？我将在第七章中回答这些问题。

另一个办法是假设错误不是系统性的，高估或低估东方和西方分数的错误都是以随意和不可预知的方式犯下的。解决这类问题的唯一办法是自我修复我个人打分所基于的证据。我将在第三章到第六章详细说明这种办法。

社会发展是可以计算的

第一项挑战是找到符合有用特性假设下所列6项标准的最小数目的特性。在试过几种组合之后，我选定了4个特性：（1）能量获取；（2）社会组织；（3）战争能力；（4）信息技术。

能量获取必须作为社会发展的所有可用的衡量尺度的基础。牛顿的热力学第二定律告诉我们，物质的复杂组合使得其如果没有自身所处环境的补充能量的输入，经过一段时间就会分解。人类如果不获取能量，也会（像植物和其他动物一样）死去。同样的，除非人类能从所处环境中获取能量，否则人类创造的社会也会瓦解。人类群体为了增强对他们所处的自然环境和精神环境的控制，把该做的事情做好，不得不增加其能量获取。

然而，单是能量获取不足以衡量对社会发展重要的一切事物。甚至我所知道的对文明最简化的定义——莱斯利·怀特的C= E×T，都认为衡量人们对他们获取的能量的使用方式，与衡量能量本身同等重要，这是理所当然的。然而，怀特对“技术”的分类太过宽泛、太难以量化，所以我进一步将其细分为3个特性。

社会组织是其中的第一个。这一概念不可避免地在相当大的程度上与斯宾塞的分化概念重合，但为了避开我在第一章中提到的关于定义和衡量尺度的无休无止的争论，我从经济学家那里学来了一招，以社会中最大永久定居地的人口规模，作为对社会组织的大致的间接度量。

这也许看上去像种奇怪的方式。今天世界上一些最大的城市简直是功能失调的噩梦，充满了犯罪、污秽和疾病。然而历史上的大多数大城市无疑也是如此。在公元前1世纪，罗马有100万居民。那里也有街头犯罪团伙，时常会导致政府停转；城市人口死亡率过高，以至于每个月都不得不容许上千名乡下人移居罗马，以保持人口数量。然而尽管罗马有种种邪恶，保持其城市运转的组织，却是世界上任何其他早期社会所远远无法胜任的——正如管理像拉各斯（人口1 100万），或孟买（人口1 900万），更不用说东京（人口3 500万）这样的城市，要求有远高于罗马帝国的组织能力。

这就是社会科学家们经常将城市化作为评估社会组织的大致尺度的原因。这样做有好几种办法。我们可以计算一个社会中居住在特定规模的定居点（10 000人是较流行的截断点）的人口的比例，也可以将定居点分成不同的等级，计算每个社会有多少个等级。然而我选择的办法，是只分别计算东方和西方社会最大的永久定居点的人口数量。我选择这种办法，一是因为如果我们要将研究一直回溯到公元前14000年的话，我们必须使用一些证据，而这种办法看上去最适合于这类证据；二是因为我知道还没有哪项研究表明这种办法比任何复杂得多的办法更不好用。

信息技术是能量使用方面又一个不可或缺的要素。随着社会发展的推进，人们必然要处理和交流巨量的信息。任何社会如果没有文字和计算系统，都不可能发展得太远。为了发展得更远，要求有越来越成熟的媒体储存和传播信息，要求有专门的机构将读写和计算技能传授给越来越多的人。

战争能力也是社会发展至关重要的一部分。像植物和所有其他动物一样，人类若想生存，必须竞争和合作。鉴于人类（像蚂蚁和黑猩猩一样）已经发展为一种社会性物种，需要时常将其合作性的行动转为群体针对其他敌对群体的暴力竞争。在考古记录中，武器和堡垒占有非常突出的地位；当信息技术达到能够记录细节的阶段后，世界上大多数文明的文字资料中，都充斥着对战争和战役的描写。

这4个特性并非合起来就构成了过去16 000年社会发展的总体画面，也没有比联合国的特性——预期寿命、教育和收入——告诉我们更多的关于我们想了解的人类发展情况。这些特征的功能非常有限：它们只是给我们提供一个关于社会发展的有用的概览，展示一下我们在回答为什么目前西方主宰世界这个问题时需要解释的模式。

并不是只有这4个特性能起到这样的作用。我也观察过若干其他可能的特性，包括最大的政治中心的人口规模、科学能力和对于技术能力的更广泛的衡量尺度，但是，没有一个能像能量获取、社会组织、信息技术和战争能力这样，更好地服务于有用特性假设下开列的原则。也就是说，特性中的确有相当大的冗余，说明与社会发展的核心概念关联密切的任何特性组合，都可能产生非常近似的一套分数。

250分还是0.01分：哪个社会更发达

对于任何指数来说，最大的挑战无疑都是决定如何给特性分配分数。为了使情况简单，我决定将1 000分定为指数的顶点——公元2000年前所可能得到的最高分数。然而，这个顶点与HDI中可能的最高分1.0所起的作用非常不同。在联合国的指数中，1.0代表着某种完美，意味着任何一个社会的得分都不可能高过1.0。而我的社会发展指数则相反，1 000分只是公元2000年所能得到的最高分。从指数的顶点到本书写作时，又过了十几年，西方发展的分数在继续上涨，已经超过了1 000分。假如东方和西方继续以20世纪的速度发展，到21世纪末时，两者都将达到5 000分；而如果增长率超过20世纪的速度——目前的情况似乎正是这样——两者在2100年时的得分还会更高。

设计了HDI的经济学家们创建了一个详尽的权重体系，将3个特性的分数标准化，然后计算出相加后总分的平均数。相反的是，当1956年纳罗尔发表了他原创的社会发展指数时，他给他的3个特性设置了相同的权重，他解释说，“因为没有明显的理由认为某一特性比另一特性有任何更高的重要性。”

不同权重的优缺点总是有讨论的余地，我将在第七章再回到这个问题上，但是纳罗尔的办法在这里似乎比联合国的要中肯。即使有很好的理由确定某项特性比另一项意义更重要，也没有根据假设这一重要性能贯穿我们所考察的整个16 000年，或者它们始终同样适用于东方和西方。

因此我把我的1 000分平均分配在4个特性上。这意味着在某个特性上能获得最高值的社会，将在其达到那个水平的阶段（在任何情况下，都将是公元2000年）获得250分，而其他社会因为达到的是较低值，相应地获得较低的分数。我将在第三章到第六章详细说明证据、定义问题和我如何计算每个特性的分数，但在此，我要简短地举一个具体例子，以说明打分系统的运行机制。我将以社会组织为例，通过最大定居点的规模来进行间接度量，因为这也许是最简单明了的特性了。

大多数地理学家都将公元2000年时的东京，归为自公元前14000~公元2000年我们所知的最大城市，该城有大约2 670万居民。于是，公元2000年的东京获得了划拨给社会组织这一特性的满分250分，即意味着在指数中，每106 800人得1分（2 670万人除以250分）。公元2000年，西方核心地带的最大城市是纽约，有1 670万人。按照每106 800人1分的算法，纽约的得分是156.37分。

公元1900年的资料没有这么完备，但所有历史学家都一致认为那时候的城市要小得多。在西方，1900年的伦敦大约有660万居民，得61.80分；而在东方，最大的城市还是东京，但那时只有175万人，得16.39分。

当我们回溯到公元1800年时，历史学家们不得不将若干不同种类的证据结合起来，包括食品供应和税收记录、城市覆盖的自然区域、这些区域内房屋的密度，以及逸闻故事等，不过大多数人的结论都是，北京是当时世界上最大的城市，人口可能有110万，得10.30分；西方最大的城市还是伦敦，人口有大约86.1万人，得8.06分。

沿时间继续回溯，误差幅度将越大，但在公元1700年之前的1 000年间，世界上最大的城市显然在中国（日本的城市经常紧随其后）。公元800~1200年，首先是长安，其次是开封，最后是杭州，人口在100万上下（分数在9分左右）。与之相反的是，西方城市始终没有超过其一半的规模（西方最大的城市通常在欧洲南部和亚洲西南部的伊斯兰地区，而不是欧洲北部和西部的基督教地区）。再往前几个世纪，这种情况则要颠倒过来：公元前1世纪，有100万人口的罗马无疑是世界上最大的大都会，而中国长安的居民人数可能只有其一半。

当我们回退到史前时代时，证据无疑越发模糊了，数字也变得小得多了。然而，将系统的考古调查结果和较小区域内详细的发掘记录结合起来，我们对于城市规模仍能产生合理的感知。这在很大程度上是分解的艺术，不过就算是最广为人们接受的估量结果，仍可能需打10%的折扣，但误差幅度不可能更大了；而且由于我们对东方和西方的考古遗址采用同样的估算方法，大概的趋势应该还是相当可靠的。

由于在社会组织这个特性上，需要有106 800人才能得1分，略微超过1 000人将得到0.01分，这是值得纳入指数的最低分数了。能达到这个水平的西方最大的村落出现在大约公元前7500年，而东方最大的村落出现在公元前3500年左右。在这两个时间之前，西方和东方的得分都将为0（参见第四章）。

另外3个特性的分数，也以同样的方式计算：（1）确定在这个生活维度中能得到最高分的社会（就能量获取而言，在公元2000年的美国，平均每个居民每天消耗大约228 000千卡的能量）；（2）将满分250分分配给这个社会；（3）计算能得到1分所需要的表现（就能量获取而言，228 000除以250分，等于平均每人每天消耗912千卡得1分）；（4）估算历史上不同时间每个社会在这个特性上的分值；（5）将这些估算出的分值除以分母，将它们换算成指标中的分数。在计算了自公元前14000~公元2000年整个时期中每个特性的得分后，我只需将4个特性的得分相加，就能得到一系列每个地区社会发展的分数。这就使得我们可以将世界上不同地区在历史不同时期的社会发展状况进行对比了。

反对者的声音

根据第一章回顾的关于新进化论的争论，可能存在4种主要的反对我的意见。我将针对每一种说上几句，解释一下为什么这几种反对意见都不是致命的。

1.将不同时代和地区的社会发展量化并进行对比，使人类失去了人性，因此我们不能这样做。

这是20世纪七八十年代人类学和社会学领域反对新进化论的浪潮中最具影响力的声调，类似的观点在历史学家中也赢得了许多追随者。然而，这却是至今提出的反对意见中也许最令人无所谓的，因为一旦我们认识到不同的问题需要我们以不同程度的抽象性来解决，其力量就基本消失了。

到20世纪80年代后期，许多领域的学者们都感觉到像新进化论、新古典经济学等高度抽象的科目，以及同源方法，都留下了太多未解之谜，于是他们非常明智地转变了观念，采取了似乎更有利于做好工作，以回答他们感兴趣的问题的思维方式。例如，许多社会学家不再将支持常态和结构化的分化和功用作为组织概念，甚至社会科学中最坚定地致力于量化和抽象化的人口学和经济学，也进行了自身的后现代转型。

当然，我发现了我自己的研究正是如此。在利用新进化论和20世纪80年代中期的比较框架，弄清了铁器时代希腊的社会变化后，这些方法的局限性就变得越来越明显了。古希腊社会一些最重要的特征，如激进的男性民主制与大规模奴隶制的结合，很不符合瑟维斯、帕森斯和弗里德的理论，他们都认为民主是与先进的现代国家相关联的。如果完全不解释希腊民主制的来源，无视古希腊人的独特成就，而在社会发展指数中给希腊打分，就会使事情更加困难。

但这并不意味着社会进化论和社会发展指数都是在浪费时间，这只是意味着回答这个特别的问题还需要其他工具。用一种更狭隘、更排他主义的方法去研究古希腊社会，会比进化论的方法产生更多成果，但这样也有局限性，尤其是不足以解释经济、军事和政治发展是如何驱动了公元前第一个千年内的变化的。为了弄清这些问题，也得到其他材料的指引，我重新转向更广泛的进化论工具和将希腊置于全球框架中的需要。

问为什么目前西方主宰世界，与问为什么有些希腊城邦给予所有成年男性公民投票权，是不同类型的问题。这是一个宏大的比较研究的问题，要求我们纵观数千年历史，横跨百万平方千米土地，汇聚几十亿人口。为实现这一目标，一个社会发展指数恰好是我们需要的工具。

2.将社会量化并进行比较是一种合理的做法，但我定义的社会发展（社会达成目标的能力），却不是应该度量的事物。

这种反对意见用不着多费口舌就能解决。持这种意见的批评者需要表明有其他事物可供度量和比较，对于解释为什么目前西方主宰世界，将比我定义的社会发展更加有益。我不知道是否存在这样的其他事物，所以我请批评者们来确定，并证明它们能产生更有益的结果。

3.我所定义的社会发展，也许是一种在历史长河中比较不同地区的有用方式，但我用来度量的特性（能量获取、社会组织、战争能力和信息技术），并不是最好的特性。

这种反对意见可能以3种形式出现：

（1）在我考察的4个特性（能量获取、社会组织、战争能力和信息技术）之外，我们还应增加更多的特性。不过尽管必然还有很多特性可供我们考察，但精简原则要求我们在能涵盖社会发展的全部意味的最小数量的特性之外，不要再增加更多的特性。批评者需要证明我的4个特性实际上未能涵盖社会发展的一个或多个重要方面，而涵盖这些方面将会产生足以与我的指数大相径庭的结果，因而值得付出额外的努力，增加工作的复杂性。

（2）我们应当采用不同的特性。同样，当然有其他变量可供我们度量，但我考察过的所有其他特性，都不大符合前述各种原则，普遍存在严重的经验主义问题，或文化依赖，或相互重叠。如前面所提到的，大多数其他特性在历史大部分时期中都多多少少显示出相当大的冗余，而对于它们的任何貌似合理的组合，往往都会产生大致相同的最终结果。

（3）我们关注的特性应当更少。考虑到4个特性当中存在的冗余，我们或许应减少几个特性，以增强简约性。很显然，方法也许是放弃社会组织、战争能力和信息技术，只专注于能量获取，因为社会组织、战争能力和信息技术都只是使用能量的途径。图2.4展示了单看能量的指标会是什么样的。图2.5则不同，展示了由全部指标产生的分数，但两者的区别并不大。在单有能量的图中，正如在完全的社会发展图中一样，自冰期晚期以来，西方仍在90%的时间里领先东方；东方仍然是在大约公元550~1750年超越了西方；大约公元100~1100年仍然有一个硬上限阻碍了发展（稍高于每人每天30 000千卡）；后工业革命时代的得分仍高于较早的时代；公元2000年仍然由西方主宰世界。

图2.4 公元前14000~公元2000年东方和西方的能量获取情况（线性标尺）

图2.5 公元前14000~公元2000年东方和西方社会发展得分（线性标尺）

单是关注能量，当然有更加简约的好处，但也有巨大的缺陷。我采用的4个特性并不完全多余，自大约公元1800年工业革命开始以来，能量获取与其他特性呈现非线性关系。能量获取的余裕的增长，导致了选定领域能量使用的极其巨大的增长。新技术的出现，20世纪城市的规模翻了4番，战争能力增强了50倍，信息技术跃进了80倍，而人均能量获取才翻了一番。如果只关注能量，就经不起爱因斯坦理论的检验，因为那样太简单了，扭曲了历史的原貌。

4.这4个特性是度量社会发展的好办法，但我犯了事实错误，得到了错误的度量结果。

正如在讨论近似和讹误时提到的，应对这个反对意见有两种主要方法。一种是假设我犯了系统性的经验主义错误，始终高估了西方的分数而低估了东方的分数（或者相反），然后问两个问题：（1）我们需要把分数改变多少，才能使历史看上去非常不同，以致《西方将主宰多久》一书中提出的观点不再有效？（2）这样的改变是否似是而非？我将在第七章里论述，有充分的理由认为这种意见不能成立。

另一种辩驳这种意见的办法是，假设存在一贯但并不系统的经验主义错误，随意、出人意料且严重地夸张或低估了东方和/或西方的分数。避免这一危险的唯一办法，无疑就是贯彻第三章到第六章提出的意见，对照证据检查指标中的分数。

通吃：展示历史的轮廓

对于我创造的社会发展指数，我最想说的是，它反映了对社会进化论的批判，也同样反映了社会进化论者们的贡献。从斯宾塞最初的文章发表以来，社会进化论的批评者们就辩称，社会进化论者们试图解释一切，却往往最终什么也没有解释清楚。

批评者们有一点显然是正确的，就是没有能通吃的社会发展指数。纵观整个20世纪，指数创造者们想把各种各样的主题纳入自己的框架，却往往使得不具备可操作性，而解决这个问题的努力，经常又使情况雪上加霜。例如，卡内罗的解决办法是给他的指数增加越来越多的特性，结果，特性从1962年的8种，膨胀到1970年的618种，仍然还望不到明显的尽头。

本书中的指数并非试图解释一切，只专注一个问题：为什么欧亚大陆西端的社会，在19世纪主宰了世界，而其在北美的殖民地，又在20世纪取代了它们。

这样的专注有3点好处。它使得3种情况成为可能：（1）定义社会发展的核心概念时，头脑中有这一特定问题；（2）选择能直接证明核心概念，同时又合情合理、易于操作的特性；（3）设计能在时间的推移中度量变化的指数。

这些好处也使得我避免了许多摧毁了新进化论者的指数的困难。其中最重要的也许是棘手的分化概念。这个概念是从斯宾塞那里传承下来的，但几乎不可能付诸实践。由斯宾塞学说的分化概念发展而来的某些见解，在任何关于社会发展或社会进化的有用的定义中，都应占有一席之地。而这种见解的确在我的指数中出现了，作为更广泛的社会组织特性的一部分，通过城市规模而进行间接度量。然而，这里提供的指数确保不会陷入麦圭尔（McGuire）在新进化论者对分化的研究中发现的那些陷阱。

同时，这个指数也避免了与任何特定的社会进化理论密切结合（相反的是，比如说，与卡内罗的量表分析倒是密切结合，而量表分析又是与直线发展的阶段理论明显相关联的）。这个指数也同样便于度量是否所有社会都的确是沿着卡内罗提出的路线发展的，或者自组织临界性是否始终符合长期、大规模的社会变迁。

本章介绍的方法对于解决分析单位问题，也有一定的作用。这个问题曾令20世纪的社会进化论者痛苦不堪。这里介绍的办法，也使得在东方和西方各确定一个核心地带，有了很大的灵活度，由社会发展水平来决定，而不是由它们的周边区域来决定。

这对于通过城市规模这个变量间接度量的社会组织特性，也非常适用，尽管它并没有完全解决能量获取、战争能力和信息技术的单位定义问题。对于这些特性，仍然有可能有倾向性地确定一个核心，有意地将高分和低分的地区结合在一起，人为地制造出较低的总体分数。

在《西方将主宰多久》一书中，我将下面这个问题称为“彭慕兰问题”：历史学家彭慕兰注意到，认为欧洲在工业革命以前就已经比中国发达的历史学者们，经常试图以一种不相称的比较来证明自己的论点，即以欧洲一小块发达的核心地带——通常包括英国和低地国家——与整个中国相比较。彭慕兰指出，更相称的比较，应当是将英国与长江三角洲比较，或者将整个中国与整个欧洲相比较。

我的指数应对彭慕兰问题的主要办法是要求分析必须清楚。表2.1清楚地显示了在每个时间点上，哪个地方被认为是每个地区的核心地带。该表允许批评者们挑战定义，提出另外的核心地带，并显示出他们的修改将会如何改变分数。将假设暴露于挑战和歪曲之下，给指数建设提供了一种较好的基础，比试图制定能应对一切可能性的规矩要好。

最后，说说定量分析的问题。长达50年的关于社会进化的数值方法的辩论，其主要教训是辩论本身就跑题了。有些学者从原则上就反对定量分析的办法，另一些学者反对定性分析的办法也同样是建立在原则的基础上，但两派学者都错了。有些问题只能用定量的办法来回答，而有些问题只适用于定性的办法。如果“为什么目前西方主宰世界”这个问题果真是一个关于社会发展的问题的话，那么最好的办法是定量分析，使用一个能向我们展示需要解释的历史轮廓的社会发展指数。