弗里德曼文萃-美-密尔顿·弗里德曼 - 正文 11．实证经济学的方法论

    在凯恩斯的名著《政治经济学的范围与方法》一书中，约翰. 梅纳德·凯恩斯对实证科学及规范科学作了区分。他认为：“一门实证科学……是关于什么是这一类问题的系统的知识体系；而一门规范科学（或称为管理科学）……是关于什么应该是这一类问题的标准的系统的知识体系……；是一门艺术……是为达到某一特定目标而设立的原则体系”；他指出：“这二者之间的混淆带有很大的普遍性，并成为很多殆害大分之谬误的根源”；他还强调了“创立一门准确无误的政治经济学的实证科学的重要性。”

    本文将主要对某些方法论问题加以阐述，这些问题产生于人们为创立凯恩斯所倡导的“准确无误的实证科学”所作的努力，其中特别涉及的是，如何确定某一被提出的假说或理论，是否应被暂时地接受为“关于什么是这一类问题的系统的知识体系”的一部分。但是，凯恩斯所悲叹的这种混淆仍然如此之普遍，并极大地妨害了人们对经济学可以是——而且部分地确实是——一门实证科学的认可。所以，我们最好在本文的开头先论述一下实证经济学与规范经济学之间的关系。

    1．实证经济学与规范经济学之间的关系

    在某种程度上，实证经济学与规范经济学之间的混淆是不可避免的。在几乎每一个人看来，经济学所研究的问题与其自身是极为攸关的，而且是困于他们自己的经历与能力的范围之内；这一现象便是不断的广泛的分歧的根源，并成了频繁立法的契机。那些自许为“专家”的人们意见迟异，而且我们很难保证他们都是毫无偏见的。无论如何，在那些事关重大的问题上，即使这些“专家”们几乎一口同声而且毫无偏见，我们也很难完全不加考虑地接受他们的观点。实证经济学的结论似乎是，而且确实是与重要的规范问题密切相关的，是与应该做什么及如何取得某一既定目标等问题密切相关的。门外汉与专家一样，都在无一避免地试图改造实证结论以适应为他们所极力坚持的规范性的先入之见，并当这些实证结论的规范性含义——或所谓的这些实证结论的规范性含义——不合他们的口味时就否定这些实证结论。

    从原则上说，实证经济学是独立于任何特别的伦理观念或规范判断的。正如凯恩斯所说，它要解决的是“什么是”，而不是“什么应该是”一类的问题。它的任务是提供一套一般化体系，这个一般化体系可以被用来对环境发生变化所产生的影响作以正确的预测。这一体系的运行状况可以通过它所取得的预测与实际情况相比的精确度、覆盖率及一致性等指标来加以考察。简而言之，实证经济学是，或者说可以是一门“客观的”科学，这里“客观”一词的含义完全等同于任一自然科学上的定义。当然，经济学所涉及的是人与人之间的关系，而且调查研究者本身就是被调查研究的事物的一部分。与自然科学相比，调查研究者与被调查研究的事物之间更具有本质上的联系。上述事实在使社会科学家得到了一系列自然科学家无法得到的数据的同时，也使社会科学家在实现客观性的目标上遇到了特有的困难，但是在我看来，这些都不是这两类科学之间的根本差异之所在。

    另一方面，规范经济学及经济学的技术也不可能独立于实证经济学。任何政策结论都不可避免地要基于对采取某一种而不是另外一种行动将产生的影响所作的预测，而预测则必须明确或不明确地基于实证经济学。当然。在政策结论与实证经济结论之间并不存在着—一对应的关系；如果有的话，那么则不必另外再创立一门规范经济学了。两个不同的个体可能在对某一个别立法的结果问题上意见一致。但其中的一个可能认为这些结果有利于平衡，进而拥护这项立法；而另外一个却可能认为这些结果是不合意的,进而反对这项立法。

    然而，我对这样一种看法提出疑义：这种看法认为，在目前的西方世界，特别是美国，在毫无偏见的公民之间所存在的有关经济政策的分歧，主要地来源于人们对所采取的行动将带来的经济影响的不同预测。而这些分歧从原则上说是可以通过实证经济学的发展而予以消除的。持这种看法的人不认为人们关于经济政策的分歧是来源于人们在基本的行为准则方面的根本性分歧，来源于人们在最终可能出现的矛盾双方问题上的分歧。一个明显的而且并非不重要的事例就是最低工资限制问题。尽管在形式上存在着对这一立法的褒贬纷争，但人们在为所有的人争取到一个“生存工资”这一政策目标上却形成了根本一致的意见。而且“生存工资”这一含义模糊的概念在这一类问题的讨论中得到了广泛的运用。人们的意见分歧主要产生于人们在预测方面的隐含的或明确的分歧。这一预测涉及的是最低工资限制这一特殊手段在实现目标中的功效问题。该项立法的支持者们认为（即预测），法定的最低工资通过提高那些工资收入在最低工资线之下的劳动者的收入，及提高那些工资收入在最低工资线之上的劳动者的收入，进而消除了贫困。而且与此同时并不存在完全失业人数增加及就业条件因该立法的实行而恶化一类的消极作用。而该项立法的反对者们认为（即预测），法定的最低工资通过失业人数的增加及就业条件的恶化而加重了贫困现象。而且这一消极作用不仅抵消了该项立法给在业者工资收入所带来的有益影响，市且还可能使之状况更加恶化。人们在该项立法的经济影响问题上的看法一致，并不能使人们在该项立法的合意性问题上看法一致。这是因为仍然存在着人们在该项立法的政治或社会影响等问题上的分歧。但是，在目标一致的情况下，人们一定会经过漫长的道路而趋于一致的。

    人们在工会的适当作用及地位的问题上的各种不同意见，及人们对直接的价格与工资控制的合意性及关税的合意性等问题的各种不同看法，都是以实证分析中的一些密切关税的分歧为依据的。人们对所谓的规模经济的重要性的不同预测，在很大程度上说明了人们在工业部门中政府的全面控制的合意性及必要性，甚至在社会主义（而不是私人企业）的合意性及必要性等问题上的不同看法。而且关于这一方面问题的事例举不胜举。当然，我的这一主张——即在西方社会中人们在经济政策问题上的主要分歧具有如上所述的性质——其本身就是一种“实证”阐述，它的正确与否还有待于经验证据的检验。

    如果这一主张是合理的，那么它意味着。人们在“正确的”经济政策问题上的一致意见较少地取决于规范经济学的进步，而更多地是取决于这样一种实证经济学的发展：它所得出的结论不仅而且值得受到广泛的赞同。它还意味着：对实证经济学与规范经济学加以严格的区分的主要原因就在于这样一种贡献，即这一区分促进了人们在政策问题上的意见一致。

    2．实证经济学

    实证科学的终极目的就是要发展这样一种“理论”或”假说”，使之能够对尚未观察到的现象作出合理的、有意义的（而不是老生常谈的）预测。总体说来，这样一种理论是一个由两种元素构成的复杂的混合体。部分地说，它是一种‘语言”，旨在促进“系统的、有组织的推论方法”。部分地说，它是一系列假说的综合体，旨在从纷繁复杂的现实中抽象出事物的本质特征。

    作为一种语言，理论不具有任何实质性的内容；它是一系列同义反复的词语的综合体。它的作用在于为经验材料的组织及对经验材料的理解提供文牍服务；而且用以检验这一服务质量的标准也是那些适合于文牍体系的标准。对这些事物的种类所下的定义清楚而准确吗？对这些事物种类的划分穷尽了吗？我们知道每一单个项目都应归于哪一类吗？或者，在这其中是否存在着相当的似是而非现象呢？人们对大标题及次标题体系的划分是否已达到这样的完备程度，从而使我们能够迅速地找到我们所要的条目呢？还是由于混乱不清而使得我们不得不一处一处地加以涉猎呢？我们将要研究的条目是否都已编排到一起了呢？条目的编排系统是否已避免了交叉重复呢？

    对上述这些问题的回答部分地取决于逻辑上的考虑，部分地取决于事实上的考虑。标准的逻辑准则本身可以说明某一特殊语言是否是完全的及连续的，即这一语言中的命题是“正确的”还是“错误的”。事实上的证据本身可以说明“逻辑编排系统”的种类能否在实际中找到有意义的对应物，即在分析具体问题中的某一特殊种类时，这些条目划分是否能起到一定的作用。“供给”与“需求”这一简单的事例既说明了这一点也说明了前面所谈到的一系列逻辑分析问题。作为经济理论这种语言的构成要素，供给与需求是两大主要类别，影响产品的相对价格的因素及影响生产的因素都被划到这两大类别中来。这种二分法的实用性取决于“它在经验资料方面的高度概括性，即如果我们把任一问题中影响需求的力量与影响供给的力量分别开列出来的话，那么我们将会得到这样两类资料：它们之间很少有哪些项目是共同的。”现在，这样一种概括对于象消费品终极市场一样的市场来说是合理的。在这一类市场中，可以被看作是需求产品的经济单位与可以被看作是供给产品的经济单位之间存在着明确的、严格的区分。很少存在这样的混乱现象：从某一方面看来，某一特殊因素应被划归影响供给的项目之类，而从另一方面看来，又应被划归影响需求的项目之类。而且也很少有必要考虑两个类别之间的交叉效应（即交叉重复）。在这类问题中，在标题“供给”与＿“需求”下对有关因素进行编排所需要采取的步骤既简单又明了，从而极大地简化了我们所面临的问题，而且这种简单明了的方法还防止了在其它情况下可能出现的差错。但是，这种概括并不是在任何情况下都是合理的。例如，在一个主要是投机性的市场中，对于价格的每日波动来说，这一概括就是不合理的。例如，一则关于增加超额利润税的谣传，对于股票市场来说，是应当看作是主要对今天的公司股票供给发生影响的因素呢，还是应当看作是主要对今天的公司股票需求发生影响的因素呢？在类似的情况下，几乎对于每一因素来说，将其划归“供给”标题之下的理由大约与将其划归“需求”标题之下的理由一样多。这些概念仍然可以使用而且不可能是毫无意义的；它们仍然是“正确的”，但与在第一个例子中的情况相比它们的用处则明显地要小得多，这是因为它们没有有意义的实证对应物。

    作为一种实证假说体系，理论应该通过其对它意在加以“解释”的那一类现象的预测能力来检验。唯有实际证据才能表明该理论是“正确的”还是“错误的”。或者更为准确地说，唯有实际证据才能表明该理论是被作为合理因素而暂时地得到“接受”呢，还是遭到了“拒绝”。正如我下面将更为详细地阐述的那样，对某一假说的合理性的唯一有关的检验，是将其预测与实际情况所作的比较。郊果该假说的预测（“频繁地”或比来自于另一假说的预测更为经常地）与实践相抵触，那么该假说则遭到了否定；如果该假说的预测没有与实践相抵触，那么它则为人们所认可；如果该假说业已多次成功地避免了可能出现的抵触现象，那么它则具有极大的可信赖程度。实际证据永远也不可能“证实”某一假说的正确性，它只能通过无法将该假说驳倒来显示该假说的正确性。当我们说到某一假说已经在实践中得到了确认时（并不十分准确），我们通常所指的就是这个意思。

    为了避免误解，可能有必要明确一下：我们用来检验某一假说的合理性的“预测”，并不一定非得是对尚未发生的现象所作的预测，也就是说，不一定非得是对将来事件的预见。它可以是对业已发生了的现象所作的预测，但前提条件是对这一现象所作的观察尚未进行，或者是虽然对这一现象的观察业已作出。但进行预测的人尚不知晓。例如，在其它一些情况已知的情况下，某一假说预测在1906年将会有某些情况发生。如果对这一时期的史料记载所作的研究表明，在1906年某些情况确实发生了，那么该预测则得到了实践的确认。反之，如果研究表明在1906年某些情况并没有发生，那么该预测则与实际情况发生了抵触。

    从这种意义上讲，某一假说的合理性本身并不足以作为对其它假说进行取舍的标准。人们可以观察到的事实在数量上必然是十分有限的，但可能的假说却是无限的。如果存在某一种假说与可得证据相一致，那么一定还有无数的假设也与这一可得证据相一致。例如，假设对某一特殊消费品所征收的一种特别货物税，导致了价格的上涨，其上涨幅度完全等同于税收的数量。这与竞争情况下稳定的需求曲线、水平的且稳定的供给曲线是一致的；但它也与竞争情况下需求曲线或供给曲线发生必要的相应移动后的斜率为正或为负的供给曲线相一致：它也与垄断情况下常边际成本及稳定的需求曲线相一致，只是为了取得上述结果要求后者具有某一特定的形状；等等，等等，无穷无尽。这一假说所适应的另外一种证据可以起到剔除上述某些可能情况的作用；但它绝不可能把这些可能性削减为一种，而独自地与这一有限的证据相一致。对那些与可得证据同等一致的假说所进行的选择，在某种程度上是任意的。虽然我们一致同意这样的观点：对选择所进行的考虑应以“简洁性”与“成效性”为出发点，但这二条标准的本身就意味着否定完全的有目的的简化。一理论越是“简单明了”，在某一既定领域内对现象进行预测所需要的初始知识也就越少；一理论越是“富有成效”，它对现象所作的预测也就越精确，而且该理论进行预测所依据的范围也就越大，同时，为了进一步研究的需要，它所要加以说明的东西也就越多。逻辑上的完整性与一致性虽然也与评判的标准有关，但只起一个辅助作用；二者的作用在于确保该假说能够正确地阐明宗旨，而且做到使每一个研究该假说的人的理解都准确无误——在这里，它们与统计计算中对数字精确度的检验所起的作用是一样的。

    不过，我们对社会科学中某一特殊预测所作的检验，很少能够通过这样一种实践来进行：这种实践是经过专门设计的，意在消除被认为是最重要的干扰因素。通常，我们不得不依赖于偶然发生的“实际情况”所提供的证据来进行我们的检验、在我看来，社会科学中无法进行所谓的”有所控制”的实验，这并不能反映社会科学与自然科学之间的根本区别。这既是因为“无法控制”的实验并非为社会科学所特有（自然科学中的天文学就是一例），又是因为有控制的实验与无控制的实验之间的差异充其量不过是一个程度上的差异。没有哪一种实验是可以完全控制的，同时每一种实验中又都存在着部分的控制，这是因为某些干扰因素在整个实验过程中应保持相对的稳定．

    实践所提供的证据是大量的，而且常常是确定性的，犹如经过了设计的实验一般。所以，无法指导实际情况并不是通过预测的成功来检验假设的根本性障碍。但如此得到的证据在解释上却要比前种情况困难得多。它常常是复杂的，而且总是间接的和不完全的。对这种证据的收集常常是困难的，而且对这些证据的解释通常需要进行细致入微的分析工作，同时还涉及到一系列的推理判断，而这些很少能够真正做到把握事物的真谛。“具有决定性意义”的实验所带来的大量的直接证据与经济学之无缘，的确妨碍了检验假说工作的顺利进行。但与这一情况在取得合理的结论，及在由可得证据所证明了的结论上取得一致意见等方面所带来的巨大困难相比，前一种妨碍则显得微不足道了。它使得人们对失败的假说的摒除工作进展缓慢且困难重重。这些失败的假说很少永远告别经济舞台，相反却总是一再出现。

    当然，这些方面的问题并不是整齐划一的。有时，实践所提供的证据与有控制的实验所能提供的证据几乎一样地直接、大量与确定。也许，最明显的重要例证要数通货膨胀问题。这种通货膨胀证据是服务于这样一种假说的：在一个较短的时期里，货币数量的大量增加必然伴随着价格的大幅度上升。这里，这方面的证据是大量的，且为对这些证据加以解释所需要的推理判断较少。然而，尽管存在着大量的价格大幅度上涨的事例，但这些事例与货币存量的大量增加之间的本质上的—一对应关系，及在其它相关的情况下的变异程度等，决定了每一次新的通货膨胀体验都必将带来激烈的争论，而且这种争论不仅仅是来源于非职业经济学家的人民大众。反对原假说的观点认为：货币存量的增加或者是来源于由其它因素所导致的价格上涨的偶然性影响，或者是价格上涨的一个完全偶然且不必要的附带物。

    检验大量的经济假说的困难性所造成的一种影响就是：它使得我们的检验工作退回到纯粹的正统或繁琐分析中去。正如我们业已阐述的那样，繁琐重复在经济学及其它科学中，作为一种专门的语言或“分析编排体系”而占有极为重要的地位。此外，同样是同义反复的正统逻辑学与数学又成了这些问题的重要工具：检验判断推理的正确性；发现假说的深刻含义；确定是否一系列被假定为不同的假说的确不可能是等价的，或者在它们之间存在着差异等。

    但是，如果一经济理论想保能够预测未来，而不仅仅是描绘行动的结果，那么仅作为一个同义重复的体系是远远不够的。同样，如果一经济理论想要有别于模糊数学时，那么仅作为一个同义重复的体系也是远远不够的。而且如我们前面所提到的那样，这些同义反复的实用性本身还将最终地取决于关于将某一棘手的实际问题划归某一种类的那些假说的可接受性。

    通过预测而对经济假说加以检验所具有的困难造成了另一个更为深刻的影响，那就是它使人们对经验证据在理论著作中的作用产生了误解。在下述两个虽联系紧密但并不相同的阶段中，经验证据起到了至关重要的作用：一是构造假说的阶段，二是检验假说的合理性的阶段。完整且详尽的经验资料，作为我们将通过假说而予以概括总结或“加以解释”的实际现象的代表，除在提出新假说时所具有的重大作用外，还被用来验证一假说确实说明了它旨在说明的问题——即该假说对某一现象所作的阐述并不与人们业已观察到的实际情况相矛盾。在某一假说与人们掌握的实际资料相一致的情况下，人们对该假说所作的进一步检验，是要将那些事先并不知道然而却可以从实践中观察到的新因素从假说中剔除出去，同时还要对这些被剔除的因素加以检验，以了解这些因素与其它的经验证据之间的背离情况。为了使后一种检验同前一种检验密切相关，那些被剔除的因素必须与该假说旨在说明的问题同属一类现象；而且对这些被剔除的因素所作的限定必须足够地准确，从而使得人们所作的观察能够证明这些因素是不正确的。

    构造假说与检验其合理性这两个阶段之间的相互联系可以从两个方面表现出来。第一，在某种程度上可以这样说：进入每一阶段的那些特定的因素，是由资料的收集及某一特定的调查者的知识水平所决定的一个偶然现象。被用来检验某一假说的内涵的那些因素可能同样适当地属于被用来构造假说的那些原始资料，反之亦然。第二，创立一假说的过程从来都不是从零开始的。所谓的最初阶段本身也总是要涉及到对一系列早些时候提出的、以实际观察为依据的假说所进行的比较。这些假说的涵义之间的相互矛盾，成了促进人们构造新假说或修改原有假说的始动力。所以，这两个在方法上截然不同的阶段，在实际进程中又总是相辅相成、互为前提的。

    人们对这一简洁明了的过程所产生的误解，主要在于下面这一表述：“该假说是为解释这一类现象而提出的。”社会科学中，对这一类现象的新证据的获得十分困难，而且对这些新证据与该假说的含义之间的一致性的判断也十分困难，这些情况使得社会科学试图作出这样的假设：其它的、更为可得的证据与该假说的合理性是同样相关的。这就等于说假定假说不仅具有“含义”，而且还具有”“假设”；这些“假设”与“现实”之间的一致性是检验该假说的合理性的标准——这一标准或者不同于通过含义所进行的检验，或者是对通过含义所进行的检验的一种补充。这一为人们所广泛持有的观点不仅是根本错误的，而且还成了更多的缪误产生的根源。它不仅没有为不合理的假说向合理的假说的转化提供捷径，相反却混淆了是非，造成了人们对经验证据在经济理论中的重要性的误解，使得人们为促进实证经济学的发展所作的智睿的探索迷失了方向，而且阻碍了实证经济学中人们在试验性的假说上一致意见的取得。

    即使在一理论可以被说成是具有“假设”的限度内，即使在这些‘假设”的”真实性”可以独立于预测的合理性而接受检验的限度内，该理论的重要性与它的“假设”的“真实性”之间的相互关系，也完全不同于我们前面所批评的那种观点所提出的内容，甚至几乎是后者的反面。那些真正重要且伟大的假说所具有的“假设”，是对现实的一种粗略的、不十分精确的、描述性的表述．而且，一般说来，某一理论越是杰出，那么它的“假设”（在上述意义上）就越是超脱现实。这其中的原因是非常简单的。如果一假说能够通过极为有限的资料而进行大量的“阐述”，即如果一假说能够从它旨在解释的那一现象周围的大量复杂且详尽的情况中，抽象出共同且关键的因素，并能保证仅在这些有限资料的基础上作出合理的预测，那么，这一假说就是意义重大的。所以，为了意义重大，一个假说在其假设方面必须运用一些描述性的技巧；既然该假说的伟大成功将证明其它许多的有关情况与该假说旨在阐明的现象是毫不相关的，那么该假说也就不必考虑并说明这些情况。

    为了使这一点不那么难于理解，我们所要问的另一个与一理论的“假设”有关的问题，不是这些假设是否在描述上是“现实主义的”，因为它们从来就不是，而是这些设想对于我们已有的目标来说，是否是一个足够好的近似物。而对这一问题的回答唯有道过考察该理论是否应验，即该理论是否取得了足够精确的预测水平来进行。这样，这两种原假设为独立的检验方法合二为一。

    垄断的与不完全的竞争理论，就是在经济理论中忽视上述主张的一个例子。被说成是构成新古典经济理论的基础的“完全竞争”或“完全垄断”假设，是现实生活的一幅虚假的图象这样一种观点，明确地促进了垄断与不完全竞争分析的发展，而且也大致地说明了该分析得到广泛的接受与赞同的原因。而这一观点本身，几乎全部地以这些假设的这种直接可见的不精确性为基础，而不是以从新古典经济理论中导出的预测的任何得到认可的矛盾点为基础的。许多年以前，《美国经济评论》对边际分析问题所进行的长篇累牍的讨论，是另一个虽不如前一个例子重要，但比前者更为明确的例子。争论双方的文章，在很大程度上都忽略了在我看来似乎是关键性的问题——即边际分析原理与实践经验的一致性问题，而注重于商人是否确实地通过考察代表边际成本与边际收益的表格、或曲线、或多变量函数，来制定他们的决策这样一个几乎毫不相关的问题。也许这两个例子及它们所业已揭示的其它许多事例，可以对所涉及的方法论原则问题的讨论起到判别作用，而且通过这两个例子所说明的问题也许要比其它似乎是适当的方法所能说明的问题要广泛得多．

    3．可以通过一假说的假设的真实性来检验该假说吗？

    我们先从自由落体法则这样一个简单的自然事例开始来进行我们的讨论。在真空中，一落体的加速度是一个常数——g，在地球上是每平方秒大约32呎——而且落体的加速度与该物体的形状、投掷方法等因素无关，这一假说已得到了人们的广泛接受。这就等于说一落体在任一特定的时间范围内所下落的距离可以用S=1／2

    gt2这一公式来算出。这里，

    S是该落体下落的距离，单位是呎，t是物体下落的时间，单位是秒。将这一公式应用到一个从楼顶下抛的实心球上，就等于说这样抛下的那个球的运行情况就如用它在真空中被抛下时的运行情况。通过这一假说的假设来对其进行检验，可能意味着对实际气压进行测量，并确定它是否接近于零。在海平面上，气压大约是每平方时15磅。为了使这一气压差别被判定为可忽略不计的，15是否是足够趋近于零的呢？因为这一实心球从楼顶降落到地面实际所需的时间与这一公式所给出的时间非常接近，所以很明显，这一15之差足够趋近于零。然而，假定现在抛下的是一根羽毛而不是一个实心球。那么这一公式所得出的结果则是非常之不精确的．很明显，对于一根羽毛（而不是对于一个实心球）来说，每平方时

    15磅完全不同于零。或者，我们再假定这一公式的应用对象是从3万呎高的飞机上抛下的一个球。在这一高度，气压绝对地小于每平方吋15磅。然而，从3万呎降到2万呎（在这一点上的气压仍然大大小于海平面上的水平）所用的实际时间却完全不同于上述公式所预测的时间——大大地高于实心球从楼顶落到地面所需的时间。按照上述公式，该球的速度应为gt，而且还应该稳定地增长。事实上，一个从3万呎降落的球是在它碰到地面以前达到它的最高速度的。而且上述公式的其它含义也都与此类同。

    为了使气压差别能够被判定为是可以忽略不计的，15是否足够地趋近千零这一初始问题本身就是明显地愚不可及的。每平方吋15磅等价于每平方呎2160磅，也等价于每平方吋0．0075吨。如果没有一些外在的比较标准，则不存在对这些数字评判大小的依据。而这唯一相关的比较标准就是在一系列既定的情况下，该公式可以应用或不可以应用的气压水平。但这又在另一个层次上带来了同样的问题。“可以应用或不可以应用”的含义是什么？即使我们可以消除测量上的误差，但物体降落的实际测得时间与公式计算所得的时间，很少（如果曾经有过的话）完全相等。为了能够判定自由落体理论之“不可以应用”，这二者之间的差异必须要多大呢？下面将是进行比较的两条重要的外在标准。一个是与该理论进行比较、且在所有其它方面与该理论是同等地可接受的另一理论所能达到的精确度。另一个是这样一种标准，它只有在存在着某一业已为人们所知道的、具有更好的预测水平，然而其预测成本较高的理论的前提下，才会存在。而且更高的精确度所带来的效益（这取决于人们的使用目的），一定能够弥补取得这一精确度所需要的成本。

    这一例子既证明了通过一理论的假设来检验该理论的不可能性，也证明了“某一理论的假设”这一概念的模糊性。S=1／2 gt2这一公式对于真空中的落体来说是正确的，而且可以通过对这一类物体的运行情况的分析而推导出来。所以，可以这样阐述：在多种情况下，在实际大气中降落的物体，其运行情况如同在真空中所进行的降落。如果用我们经济学中最常用的话来表述，那么上述文字立刻会被表述成：这一公式假设存在着一个真空。然而很明显上述表述并没有作任何诸如此类的假设。上述表述的真正意思是：在许多情况下，气压的存在，物体的形状，投掷物体者的姓名，投掷物体所采用的方法及许多其它的附加条件，对于该物体在一定时间内所下降的距离并无可估计的影响。我们完全可以对该假说重新进行表述，从而完全不再提及真空因素：在许多情况下，一物体在一给定的时间内所下降的距离由公式s=1/2

    gt2给出。如果我们撇开该公式的历史不谈，撇开与之相联的其它自然科学理论不谈，那么说该公式假设存在着一个真空还有意义吗？就我所知，还可能存在着其它的假设体系，而能够取得这同样的公式。这一公式之所以被接受是因为它与现实相符，而不是因为我们生活在一个大致的真空里——不管这种大致的真空指的是什么。

    与这一假说相联系的一个重要的问题，是要限定该公式可以应用的条件，或者更为准确地说，是要限定在各种情况下该公式预测的总的误差范围。的确，正如上述对该假说的重新表述中所蓄含的那样，这样的限定与该假说并不是截然不同的两件事。限定本身就是该假说的一个重要组成部分，而且它是这样一个组成部分：随着实践的不断增加，它是特别有可能被修改与扩展的部分。

    在落体这一特殊情况中，还存在着另一虽仍不完善但更为一般化的理论。这一理论主要来自于人们为解释前一种简单理论中存在的误差而进行的探索；而且在这一理论中，人们可以对某些可能存在的干扰因素的影响加以衡量；而且在这一理论中，前一种简单理论只是作为一种特例而存在。然而，这一更为一般化的理论并不总是能够得到应用。这是因为，它所取得的精确度的增加可能不能弥补使用这一理论所带来的成本的增加。所以，在何种情况下前一种较简单的理论可以“充分完善地”反映现实，这仍然是一个事关重要的问题。气压是限定该理论可应用的情况的那些变量中的一个，但只是其中之一；物体的形状，使达到的速度，及其它变量也都是与限定有关的。对气压以外的这些变量加以阐述的方法之一，就是将这些变量视为决定对真空“假设”的某种背离是否是事关重大的。例如，每平方吋15磅的气压对于一支羽毛来说是截然不同于零的；但对于从一高度不大的地方下抛的实心球来说，却是可以视为趋近于零的，这些都是物体的形状所带来的差别。然而，这样的表述绝然区别于下面这种不同的表述：该理论不能应用于羽毛落体，因为该理论的假设是错误的。然而它们之间的相互关系却完全是另一种情况：对于羽毛来说，这些假设是错误的，原因在于该理论不能应用于羽毛落体。这一点需要引起大家的重视。这是因为，在限定某一理论可以成立的条件的过程中，“假设”的完全正确的运用通常错误地被理解为假设可以被用来确定某一理论可以成立的条件，而且，这一误解成了理论可以通过其假设而进行检验这一观点的主要根源。

    下面我们再来看另一个例子。这一次是一个臆造的事例，旨在使之成为社会科学中的许多假说的同类物。让我们来考虑一下一棵树上叶子的密度。我提出的假说是：这些叶子的位置是这样确定的：在其周围的叶子位置一定的条件下，每一片叶子都好象有意地使它所能得到的阳光数量最大化；每一片叶子都好象知晓决定在不同的位置上可得阳光数量的自然法则，并且能够迅速地（或曰即刻地）由任一位置移到任一其它合意的且尚未被占据的位置。现在，该假说的某些更为明确的含义明显地与实际情况相一致：例如，一般来说，树南侧的叶子密于树北侧的叶子，但如本假说所意含的那样，在山的北坡，或当树的南侧为其它东西所遮盖的情况下，树的南北两侧叶子密度的差异就不会那么明显。或完全不是原来的那种情况。就我们所知，叶子不能“有计划地行事”，或者说不能有意识地“追求”什么，它们没有进过学校并学会为计算“最佳”位置所必需的科学或数学的有关法则，难道我们可以据此认为该假说是不可接受的或曰不合理的吗？很明显，该假说的这些与事实相矛盾的情况中，没有一个是至关重要的。这里所涉及的现象不在“该假说旨在阐述的那一类现象”的范围之内。该假说并没有宣称叶子可以做到上述事情，它只是认为：这些叶子的密度是同一的，就犹如它们可以做上述事情一般．尽管该根说的“假设”中存在着明显的非现实性，但由于该假说的含义与实际观察的一致性，使得该假说具有极大的合理性。我们倾向于在下述意义上“阐述”该假说的合理性：由于阳光促进了叶子的生长，所以，在阳光较多的地方叶子将生长得更加茂密，或者说将有更多的假定存在的叶子能够得以生存下来。所以，完全被动地将这一假说应用到更为广泛的情况中去所得到的这一结果，与通过将某些特定环境附加其上所得到的结果是完全相同的。这后一种说法比前面造的那一种假说更为引人入胜，这不是因为后一种假说的“假设”更具“现实性”，而且因为后一种假说的“假设”本身就是一个更为一般化的理论的一部分。这种更为一般化的理论所能应用的现象种类更为广大，而且在这一更为一般化的理论中，一棵树上叶子的具体位置不过是该理论的一个特例。这一更为一般化的理论有着更多的可能招致异议的含义，但由于该理论可适用的范围更为广泛从而使得这些含义避开了可能发生的任何抵触。这样一来，叶子生长的直接证据为来自于这一更为一般化的理论所适用的其它现象的间接证据所加强。

    我们所臆造的这一假说大致说来是正确的，也就是说，仅对于某些现象来说，该假说关于叶子密度的预测达到了“足够的”精确水平。我不知道这某些现象是什么，也不知道如何去定义它们。然而，有一点似乎是明确的，那就是：在这一例子中，该理论的这些“假设”并不属于该理论的假设范围：也就是说，树的种类，土地的性质等都是可能影响到该理论的合理性所存在的范围的变量种类，而叶子进行复杂的数学计算，或从一个位置移到另一个位置的可能性问题，却与该理论合理性的范围限制无关。一个与人类行为有关的例子大致类似于我们刚才所举的那个例子。这个例子我与萨维奇已在别处引用过。现在，让我们来考虑一下一位台球行家对击球情况进行预测的问题。下述假设似乎并非毫无道理：绝妙的预测通常都是通过这样的假说来取得。这种假说认为，这位台球行家的击球活动就犹如他知晓将会给出最佳运行方向的那个复杂的数学公式一般。而且这一数学公式可以通过眼睛对角度的观察，并确定该球所在的位置等而精确地进行计算。这位台球行家通过该公式而进行闪电般的计算。然后使球按该公式所指定的方向运行。我们对这一假说的信赖并不是基于这样一种观点：台球手（即使是台球行家）可以而且确实经历过前面所描述过的过程；相反，我们对该假说的信赖是缘于这样一种观点：除非这些台球手可以通过这样或那样的方法而取得与上述过程同样的结果，否则的话，他们事实上就不是台球行家。

    由这些例子进而引申出下面这个经济原说，这似乎是很容易做到的。这一经济假说认为，在许多情况下，单个企业常常是如此行事，犹如他们在有计划地使其预期成果（通常，如果理解有误的话，则称之为‘利润”）最大化，而且掌握着为成功地实现这一目的所必需的全部数据资料；也就是说，犹如他们知晓相关的成本与需求函数，可以通过他们所掌握的所有情况来计算边际成本与边际收益，并使得他们所采取的每一个行动都恰到好处地符合边际成本与边际收益相等的原则。当然，现在的商人实际上并不完全按照经济数学家所发现的方便途径来解这一联立方程体系。只不过他们这样做的可能性比叶子或台球手明确地完成复杂的数学计算，或落体决定创造一个真空的可能性要大一些。如果台球手被问到他是如何确定击球方向的，那么他可能回答说他“恰好算了出来”，但此外他还要摩擦一下兔后腿来证实一下。而如果一位商人被问到他是如何决策的，那么他可能回答说他是以平均成本来定价的，而且当市场情况发生了变化时，当然也会出现一些微小的偏差。这一表述与前一个表述几乎是同样有帮助的，但它们之中没有一个与对有关假说所进行的检验有联系。

    人们对上述成果最大化假说的信赖是由一非同寻常的特征证据所证明的。在某种程度上，这一证据与关于台球手行为的假说中所引证的证据是非常相似的——也就是说，除非商人可以通过这种或那种方法而使其行为近似于与成果最大化相一致的行为，否则，他们似乎不可能长久地维持他们的生意。这里不管明显地、直接地决定商业行为的因素是什么——习惯性的反应，随机性的机遇，或难于归类的一些东西——其结果都是一样的。不论什么时候，只要这一决定因素碰巧导致了与合理的、有实际根据的成果最大化相符合的行为，则生意使会兴隆，并进而需求资源以扩大经营；反之，只要这一决定因素不能带来与合理的、有实际根据的成果最大化相符合的行为，则生意将会亏损，且只有从外部引入新资源才能维持存在。这样一来，“自然选择”过程促进了该假说合理化的实现，或者说在自然选择既定的情况下，人们对该假说恰当地概括了生存条件这一判定，成了人们接受该假说的主要依据。

    该成果最大化假说的另一更为重要的证据，来自于该假说在特殊问题中的无数次应用，及在这多次应用中，该假说的含义与实际情况并没有发生抵触这一事实。然而，如果要让这一证据提供佐证那是极为困难的。这是因为它散落在无数的商业便函中、文章中，及专题著作中，而这一切主要地是与特殊的具体问题相联系，而与对该假说的检验并不相关。然而，在很长时期内人们对该假说的持续使用与接受，及未能创立一种逻辑严密、自圆其说的假说来取而代之并得到广泛的接受这一情况，间接地有力地证明了该假说的存在价值。任一假说的证据都总是由人们试图证明它与实际情况相抵触而遭到的多次失败所组成。只要该假说仍在继续使用，那么这一证据就会继续增加。而且，由于该证据的特殊性质，让该证据提供完全充分的证明是十分困难的。这已开始变成某一科学的传统及传说的一部分，后者反映在人们持有假说的坚定性方面，而不是反映在教科书中对那些未能证明该假说与实际情况相抵触的事例所进行的罗列上面。

    4．理论“假设”的重要性与作用

    到现在为止。我们对一理论的‘假设”的重要性问题所作的结论几乎全都是否定的：我们已经证明了一理论是不能用其“假设”的“真实性”来加以检验的，而且，一理论的“假设”这一概念充满了可疑之点。但是，如果这就是问题的全部，那么我们将很难对这一概念的广泛应用作出解释。同时我们也很难说明这样一种较强的倾向：我们每个人都常常身不由已地谈到一理论的假设，并对各种理论的假设加以比较。有烟就有火。

    在方法论当中（如同在实证科学中一样），作出否定性的结论通常要比作出肯定性的结论更有把握。所以，与前面的评述相比，我对下面这些有关“假设”的重要性及作用的评述的把握性较小。就我所能认识到的，一理论的“假设”具有三种虽则紧密相连但却完全不同的实证作用：（1）它们是对一理论进行描述或表述的一种简便形式；（2）它们有时会促进通过假说的含义而对假说所作的间接检验；而且（3）如

11．实证经济学的方法论（1/2）