对保证年收入的经济反应：来自加拿大和美国的经验

作者：Derek Hum and Wayne Simpson

来源：https://www.jstor.org/stable/2535174

译者：赵文鑫

本文回顾了加拿大和美国五种收入维持方案的研究。在勾勒出实验的曲折和政治背景之后，我们比较了他们的设计，并讨论了一些重要的分析难点。我们的主要关注点是工作激励问题，既包括实验效应的非结构性估计，也包括结构性劳动力供给函数的弹性估计。我们为加拿大实验提供了非结构和结构模型的初步估计。我们更简要地讨论了与保证每年到来相关的一些非工作反应发现，并就社会实验和政策过程提供了一些个人评论。

介绍

美国和加拿大是世界上最繁荣的工业国家之一。但是，这两个国家在富饶的同时也经历了严重的贫困。在这两个国家，人们越来越担心，政府向贫困人口提供的现金转移支付几乎没有减少他们的数量，也没有减少他们对福利的依赖，也没有鼓励他们向全职就业过渡。人们已经达成共识，即每个国家的福利制度都以其独特的方式缺乏协调和效率低下。在过去的两年里，两国都进行了大量的创造性思维和社会实验。

尽管加拿大人和美国人高度重视他们有时认为是两国之间的特殊关系，但这并不意味着他们的历史、宪法结构、态度或政策主张是相同的。事实上，鉴于它们在许多其他经济安排中的相似性，它们之间的差异，特别是在社会和文化事务上的差异，就更加微妙。由于加拿大-美国自由贸易协定，这些分歧最近被置于中心位置，特别是加拿大，作为小得多的伙伴，加拿大特别担心该协议将直接或间接地迫使两国调整其社会计划（Hum 1988a）。过去，收入保障计划几乎没有趋同（Kesselman，1990）。这一特点之所以突出，只是因为在许多其他经济政策领域——包括个人和公司税收、放松管制和稳定经济中——对美国的模仿有着惊人的记录。但是，无论两国过去是共同的还是各自为政的道路，可以肯定的是，两国将继续相互借鉴思想。在过去的 2 年里，没有什么比保证年收入或负所得税更自由地跨越加拿大-美国边境的想法了。

“收入维持”是一个广泛的类别，可以包括任何以实物或现金形式提供收入条件的福利。一种特殊的收入维持形式是负所得税（NIT），它为没有其他收入的家庭提供最高现金福利（G），并为家庭收到的每一美元其他收入减少支付金额，按特定的“税收”或“福利减少”率（t）。由于家庭收到的金额永远不能少于G，这相当于保证了家庭的最低收入转移，因此被称为“保证年收入”（GAI）。NIT 和 GAI 这两个术语通常可以互换使用，以指代任何收入维持计划，该计划通常通过税收转移系统而不是通过传统的福利提供以收入为条件的现金福利，后者基于对需求的酌情确定。

这种措辞无疑反映了经济学家米尔顿·弗里德曼（Milton Friedman，1963）关于负所得税的最初建议，其中他提出，个人所得税（PIT）允许的未使用的免税和扣除的一部分实际上由政府支付给个人。与此同时，在加拿大，一名特许会计师详细介绍了一项关于无条件收入津贴的提案，包括成本计算和行政程序（Smith 1965）。此后，关于GAI或NIT的主题出现了许多变化，包括一些不那么明显的变化。例如，很容易证明，NIT与加拿大现在实施的许多省级和联邦可退还收入测试的税收抵免计划没有显着差异（Hum 1988b），人们普遍认为，加拿大的老年保障金（OAS）减免（转移计划）与加拿大养老金计划（CPP/QPP）和保证收入补助金（GIS）计划相结合，有效地构成了老年人的保证年收入。

GAI 或 NIT 的概念在六十年代初是一个激进的建议。人们对其可能的经济影响知之甚少，尤其是GAI如何影响个人劳动力市场行为。因此，美国和加拿大在七十年代都开展了一系列社会实验，以探索保障收入计划的经济和社会后果。这些实验耗资数百万美元，持续多年，并测试了提供转移支付的负所得税方法。在每种情况下，实验目标的核心都是工作激励问题，以及对全国性GAI最终成本的担忧。很明显，GAI或NIT计划越慷慨，如高支持水平（G）和低税率（t）所规定的那样，政府的计划成本就越大。这是因为非工人将获得更多的付款，低收入工人将保留其收入的更大一部分，并且更大比例的人口将成为接受者，因为高担保和低税率具有提高该计划的收入资格门槛的作用。因此，试图通过GAI消除贫困的成本可能很高，这取决于所选择的支持水平和税率。同样，GAI 是否会诱导身体健全的个人减少工作也是一个迫在眉睫的政策问题，这个问题需要仔细的实证研究和精确的测量才能提供必要的答案。

所有关于保证收入的实验现在都已经完成，并且有关于各种行为反应的研究结果。时至今日，这些数据和发现仍在产生新的见解。由于其中心焦点、政策重要性和持续的争议，我们将重点关注对 GAI 的工作激励或劳动力供给反应，尽管我们也将简要考虑反应的其他方面。毋庸置疑，所有的实验都经过精心设计，产生了大量的信息，并导致（并将继续导致）巨大的研究工作。此外，由于每个实验在设计、样本组成、付款交付方式和统计方法方面都不同，因此不同实验的结果不具有直接可比性。然而，在工作激励的情况下，通过分析结构性劳动力供给模型，可以实现实验间和非实验证据之间的可比性。

围绕 GAI 的政策辩论和政治历史太过庞大，无法调查。因此，我们将注意力局限于保障收入的社会实验，这不仅是因为它们具有重要的象征意义，而且因为它们作为打破过去先例的研究项目具有无可争辩的重要性，还因为它们的精神概括了整整一代人对收入维持可能性和社会改革的思考。

下一节概述了美国和加拿大收入维持实验起源的历史和政治背景。接下来是各种实验设计的简要概述，介绍了它们的主要相似之处和独特之处，并指出了实验希望在工作行为反应问题上学到什么。第四节讨论了与分析实验产生的那种实验面板数据相关的一些选定的分析方法，以及这些独特的经济数据集可以解决哪些问题和好处。然后，我们从实验效应的非结构性估计和结构性劳动供给函数的工资和收入弹性估计的角度总结和讨论了工作激励问题。我们提出了一些对加拿大实验的非结构和结构模型的初步估计。我们更简要地讨论了与 GAI 相关的一些非工作反应发现，并在我们的结论中对社会实验和政策过程提供了一些个人评论。

实验的历史背景

美国实验的起源

林登·约翰逊（Lyndon Johnson）总统在1964年的国情咨文中呼吁向贫困宣战。同年，美国国会成立了经济机会办公室（OEO），作为消除贫困努力的先锋。OEO讨论的项目包括三个方面，即公共就业战略、社区行动计划和收入维持。虽然维持收入在消除贫困方面的作用很容易被接受，但事实证明，以保障收入或负所得税的方式提供现金转移支付更具争议性。

负所得税的想法最初遭到反对和忽视。一些人，如OEO研究副主任Alvin Schorr，赞成一种基于儿童津贴的替代提案，该提案应支付给所有有子女的家庭，无论收入如何。相比之下，OEO研究办公室主任Joseph Kershaw强调了收入条件付款的分配效率，并向OEO主任Sargent Shriver推荐了NIT提案。施莱弗被研究小组的大力倡导所征服，于1965 年 9 月提交给白宫的反贫困计划将 NIT 作为一个组成部分。OEO 还于 1965 年 10 月向预算局提交了一份耗资 47 亿美元的 NIT 提案，作为其反贫困计划的核心。然而，白宫全神贯注于越南战争和OEO的一些社会项目的受欢迎程度下降。它没有认真对待NIT的提议（Levine 1975），总统的唯一回应是任命一个收入维持计划委员会（Lampman 1974）。

尽管缺乏政治热情，但负所得税的想法并没有消亡。部分由于OEO坚定不移的信念和支持，部分由于持续不断的贫困战争，负所得税的支持者认为负所得税的想法已经到来。但除了OEO的支持之外，其他因素也促成了最终的一系列负税实验。OEO继续将NIT作为其反贫困战略任务的一部分，专门引起注意。此外，研究人员和OEO官僚们深受Lampman（1974）所称的“项目规划预算系统的上升学科”（PPBS）的影响。OEO内部最突出的是关键人物——许多人是从兰德公司或五角大楼招募的，是社会福利的新手，对特定机构或提案没有明确的忠诚度。这些人接受了评估技术的应用。因此，以维持收入的方式阐述了消除贫困的目标，提出了各种备选建议，并根据“10亿美元的最大收益”为不同的计划分配了成本效益分数。在这项工作中，负所得税获得了高分，因此，将进一步讨论的重点放在国家所得税方法的特定方面，例如担保金额和税率的成本敏感性和工作抑制效应。因此，一般现金转移机制对未成年、身体健全的个人工作努力的影响成为（现已澄清的）主要实证问题。

许多对负所得税的批评者认为，它的成本将高于现有的福利计划，因为它的目标是向在职穷人提供现金支付 – 这是一个没有资格参加大多数其他计划的群体。相比之下，NIT的支持者认为主要的绊脚石是政治性的。政治家和公众都坚信，NIT会促进身体健全的穷人的懒惰，任何“没有确凿事实”的论点都不可能消除这种信念。然后，这成为主要问题——推动了关于 NIT 的成本、该计划的行政实用性和机制、缺乏或以其他方式产生污名化效应以及其他方面的所有其他分歧。

从工作抑制的角度来看待NIT的核心问题，有效地将这个问题转变为经济学家可以声称具有特殊能力的问题。用经济学的术语来说，NIT被重新表述为与劳动休闲选择相关的工资率（价格）和收入弹性的争议。经济理论提供了一个方便的连贯模型，经济学家自己也很容易证明，现有的数据来源无法自信地回答激励问题。事实上，早期的研究在对劳动力供给反应的估计上产生了很大的差异，特别是在已婚妇女的工资弹性方面（Cain and Watts 1973），这种差异已经持续了下来。

最初的想法要归功于麻省理工学院的经济学研究生希瑟·罗斯（Heather Ross），他在1965年夏天与经济顾问委员会（Council of Economic Advisers）合作。尽管罗斯的具体建议没有被接受，但根据莱文（Levine，1975，第17页）的说法，它在OEO内部得到了广泛的传播，许多计量经济学家强烈支持实验的想法（Orcutt和Orcutt 1968）。实验提案得到了OEO的大力支持，OEO于1966年开始认真规划实验设计。最终的提案也得到了OEO研究人员的认可，萨金特·施莱弗（Sargent Shriver）于1967年表示赞同。施莱弗能够抵制政治上的反对，到明年秋天，家庭已经被选中参加负所得税实验，正在支付款项，北美第一个大规模的社会实验——新泽西州毕业工作激励实验已经开始。这项承诺并不被称为负所得税征收，而是出于政治目的，是一种“工作激励实验”，意味着预期结果令人满意而不是不愉快。同样，该实验现在强调了该项目的纯科学层面，正如通过威斯康星州贫困研究所（故意）资助该实验所所证明的那样。

因此，美国的第一次收入维持实验是出于截然不同的动机和利益而形成的。毫无疑问，反贫困计划在为政治和政策辩论营造气氛方面发挥了重要作用。同样，PPBS的成本效益工具和OEO研究人员对NIT的大力倡导也是因素。同样，热衷于将社会科学扩展到受控实验领域的学术计量经济学家也发挥了重要作用（Lampman 1974，foreward）。尽管如此，仍然没有一种说法能够完全反映新泽西州实验如何以及为什么产生的微妙之处。正如 Haveman 和 Watts （1976）所观察到的那样，这个问题也没有随着实验的诞生而结束：“那些出于’一般-政治-示范’原因支持实验的人的动机与那些出于’技术-经济-实验’原因而希望实验的人之间的紧张关系在整个 [新泽西州] 实验期间持续存在。它影响了它的所有主要特征，从技术设计到持续时间，到地点的选择，最后到结果的解释“。

美国的其他维持收入的实验也迅速跟进。OEO向贫困研究所（Institute for Research on Poverty）提供了一笔进一步的赠款，用于在农村地区进行负税实验。卫生、教育和福利部（HEW）还资助了印第安纳州加里的一个项目，以及华盛顿州西雅图和科罗拉多州丹佛的其他项目。这些其他实验中的每一个都有略微不同的重点，并且通常包含额外的研究目标，但新泽西州的实验在为一系列精心控制的科学实地测试开创先例方面仍然与众不同。

加拿大实验的起源

在加拿大，关于美国反贫困战争的讨论以及作为其反贫困战略的一部分而提出的各种建议并没有被忽视。加拿大援助计划（CAP）于1967年生效，并成为加拿大反贫困工作的核心。大约在1968年夏天第一批家庭参加新泽西州实验时，加拿大经济委员会重新租用了其第五次年度审查（加拿大经济委员会，1968年），向加拿大人介绍加拿大的贫困程度。1970年11月，国家卫生和福利部发布了一份白皮书，强调了保障收入作为消除贫困措施的潜力，但也担心其抑制经济效应。白皮书宣称（第 41 页）：“一个全面的保证收入计划……值得考虑的[必须]为通常在劳动力市场上的人提供大量的好处。因此，需要进行大量的进一步研究和调查，就像目前在美国新泽西州和西雅图进行的实验一样，以找出这样的计划会对人们的动机、工作和储蓄的动机产生什么影响。在这些问题得到解答之前，对生产率影响的恐惧将成为制定总体保障收入计划的主要障碍“（加拿大，1970年）。

次年，即1971年，发表了《克罗尔报告》（加拿大，1971年），该报告建议，基于NIT的GAI应在全国范围内统一实施，并由加拿大政府提供资金和管理。1971年出版的《Castonguay-Nepveu报告》（魁北克省，1971年）提出了一个创新的两部分保障收入方案：一个计划为那些无法工作的人提供高支持水平和高税率，另一个计划为那些对劳动力有重要依恋的人提供较低的支持水平和较低的税率。然而，试验和改革的动力来自另一个季度：联邦省级关系和宪法。

1971年，在维多利亚州举行了一次联邦-省级会议，试图改写和“归还”加拿大宪法。当魁北克宣布它不能支持“维多利亚宪章”时，各省和加拿大似乎达成了协议，因为在某种程度上，它“未能在社会政策领域提供管辖权解决”，并且“在这些问题得到满足之前，不可能归还宪法”（Van Loon 1979）。维多利亚会议之后，联邦与省级的关系中存在了很多不满，这在1972年的省级福利部长会议上浮出水面。联邦政府对未能归还宪法（包括修改公式）深感失望。联邦政府在1971年单方面改变失业保险制度，并提议对家庭津贴进行改革，加剧了各省的不满。此外，还对联邦政府侵入省级管辖范围感到不满，这些省份认为这些计划考虑不周且不协调。因此，当省级福利部长会议一致呼吁进行联合审查“为在加拿大实现合理的社会保障体系制定更好的机制”时，联邦政府很快同意了

在1971年期间，马尼托巴省对测试保障收入方法表示了浓厚的兴趣，特别是作为示范项目或行政测试。1974 年 6 月 4 日，加拿大和马尼托巴省签署了一项关于基本年度收入实验项目的协议，涵盖费用分摊安排和两国政府各自的角色。该协议是在橙皮书（加拿大，1973年）发布和联邦-省级社会保障联合审查开始大约一年后达成的。

社会保障审查和，马尼托巴省基本年度收入评估（称为“Mincome”）在目的和时间上明显相关。该审查被各种视为试图取代CAP立法的某些部分（1975年公报），或者甚至被视为维多利亚州休会的宪法讨论的替代物（Van Loon 1979年）。全国福利委员会（1976年，第1页）直言不讳地断言，“社会保障审查的目标是建立有保障的年收入。同样，Mincome也不仅仅是计量经济学中一项昂贵的活动。联合新闻稿（国家卫生和福利部/卫生和社会发展部，1974年，第5页）宣布加拿大和马尼托巴省批准该试验，对保证收入测试的作用和目的非常明确。它宣称：“马尼托巴实验有望为加拿大所有十个省和联邦政府去年4月启动的对加拿大社会保障体系的审查做出重要贡献。

曼尼托巴省最初对 GAI 的支持是基于其对行政和运营问题的浓厚兴趣。曼尼托巴省省长爱德华·施雷尔（Edward Schreyer）认为GAI基本上涉及“收入测试”，并认为它“与负所得税完全没有区别”（温尼伯论坛报，1971年）。此外，由于 GAI“会……作为加拿大援助计划计划的替代品，“Mincome”项目将在加拿大援助计划的支持下建立。州长施雷尔认为，马尼托巴省的财务参与“超过50万美元”，涉及的家庭数量“可能为500个”，但“接近300个”。然而，出现的并不是曼尼托巴省想要的“300个家庭”和五十万美元的简单演示，而是一个极其复杂的实验，按照美国的努力模式，并专注于工作反应的问题。

然而，与美国的努力不同，毕竟这些努力最终都发布了最终报告和调查结果，而加拿大的项目萎靡不振。该项目没有公布有关参与者劳动力市场反应的官方调查结果，收集的大量数据仍处于存档状态。Mincome实验在1979年悄然夭折，官方报道为实验目标的重定向。到那时，社会保障审查已经结束;该国没有政治支持对有保障收入所承诺的那种全面改革。GAI概念本身已经失去了吸引力。

在接下来的几年里，数据集本身的命运似乎不确定。数据存档的方式（未公开的位置、未知的访问方式等）使研究界感到沮丧。直到最近，加拿大学术界才对加拿大实验进行了分析。毫不奇怪，时至今日，加拿大关于保障收入对工作行为影响的讨论仍然严重依赖美国的结果。

实验设计和预期行为反应

收入维持实验仍然是GAI研究的重点，特别是涉及工作激励等经济问题。虽然这些实验有许多共同的元素，但它们也有独特的特点。作为下一节对实验结果讨论的序幕，我们回顾了五个收入维持实验的设计以及预期的劳动力供给响应。

所有实验都旨在估计家庭对永久性 GAI 计划的反应，该计划将根据公式提供基于家庭收入 Y 的收入维持付款 P：（见原文）

其中 Y = wh + y，其中 h 是工作小时数，w 是小时工资，y 是其他家庭收入。支持和计划响应的水平将取决于指定的保障水平 G 和税收（或福利减少）率t。因此，为了调查计划的反应，实验向选定的个人提供了各种计划（G 和 t 的组合），包括一个对照组，该组仍保留在现有的福利计划中，但以与接受 GAI 付款的人（实验组）相同的方式进行监测。原则上，这种设计提供了一种简单、直接的比较，可以比较转向替代 GAI 计划的影响。

特别是，这些实验试图测量劳动力供给响应，或者最简单地说，是由外部干预引起的工作时间h的变化。在传统的消费者理论的基础上，人们预计会做出回应，这可以用静态劳动力供给模型来概括：（见原文）

取等式（2）的总微分，可以得到以工作小时数表示的劳动力-供给响应：（见原文）

这取决于每个家庭成员的工资率的变化以及实验干预导致的非劳动收入的变化。此响应可以重写，以将总工资效应或未补偿的工资效应分解为补偿工资（或替代）效应和收入效应，如下所示：（见原文）

其中afs/aw > 0 > 0为替代效应，haf/aY < 0为收益效应。将（4）代入（3）得到 :（见原文）

对于减少税后工资（dw < 0）并增加非劳动收入保障（dy > 0）的GAI计划，等式（4）中的符号意味着劳动力供给必须下降，dh < 0。8 通过引入税后工资率和收入保障的大幅变化，实验因此成为检验这种智慧和衡量不同计划劳动力供给效应程度的策略。

保证收益实验具有许多共同的特点，便于比较实验设计和结果。常见的设计元素可以追溯到关于新泽西州毕业工作激励实验的原始审议。例如，Conlisk 和 Watts （1969）为新泽西实验开发了样本设计和分配模型，该模型用于所有后续实验。该模型提供了一种形式化技术，该技术改编自经典的实验设计文献，用于分配样本点，权衡研究收益（根据指定响应函数的估计响应的方差减少）与为每个选择的家庭提供的大量转移美元成本，以满足总体预算约束。给定响应函数和总预算，赋值模型将生成产生最小预测误差的样本分配。然后，可以根据实验的预期损耗和最小规模的要求等考虑因素调整样品分配。虽然赋值模型在许多方面确实是最优的，但回想起来，赋值模型给响应分析带来了一些问题，特别是非随机赋值，下文将对此进行讨论。

表1展示了五个实验的许多关键设计特征，从中可以看出更多的相似性和一些不同的特征。每个实验都集中在低收入家庭单位。新泽西州、农村、西雅图-丹佛和 Mincome 实验使用了类似的收入临界值（约为官方贫困线的 150%），而 Gary 实验则接纳了收入达到贫困线及以上 240% 的家庭。每个实验都包括一些计划，根据担保水平和税率来定义，但西雅图-丹佛不包括税率下降、咨询和培训补贴计划。加里实验包括社会服务咨询和日托补贴计划，Mincome包括一个饱和站点，为马尼托巴省和多芬省的整个社区提供一个计划。实验的持续时间为 3 年，但西雅图-丹佛在 5 年和 20 年计划中招募了一些家庭，以调查实验持续时间的影响。（见原文）

西雅图 – 丹佛是迄今为止最大的实验，有4,800个参与家庭，几乎与其他四个实验的总和一样多。就测试的各种计划而言，这也是最雄心勃勃的。

此外，每个实验点都提供了对北美不同环境和不同地区的低收入家庭的观察：新泽西州集中在较旧工业区的市中心家庭;农村实验研究了普遍的农村贫困地区（北卡罗来纳州）以及较为富裕中的贫困地区（爱荷华州）;西雅图：丹佛着眼于一个就业稳定的西海岸城市（西雅图，因为它对航空航天业的依赖）和另一个就业稳定性更高的城市（丹佛）;加里检查了黑人贫民窟家庭，尤其是以女性为户主的黑人家庭;Mincome 在城市（温尼伯）和农村（多芬饱和点）环境中研究了加拿大的低收入家庭。

现在，每个实验都进行了单独检查，并发布了各种研究报告。在所有情况下，个人研究人员都被允许开发和测试他们自己的模型，选择他们自己的样本子集，选择他们的反应度量，并解释他们的结果。然而，这些实验也代表了一系列密切相关的试验，这些试验具有许多共同的设计特征，可以告诉我们北美人口对保证年收入计划的行为反应。尽管每个实验在选址、目标人群和计划设计方面都有独特的特点，但共同的特征可以告诉我们很多关于反应的各个方面，其中最重要的仍然是工作激励的话题。现在我们转向对五个实验中劳动力供给反应的分析。

劳动供给对保障收入的响应：实验分析与响应

这五个实验旨在对保证年收入计划的反应提供可靠和可信的分析，为政策制定提供信息。特别是，正如第二节所讨论的，对于基于非实验性证据和政治观念的预期劳动力供应反应存在相当大的争议。来自执行者的数据有望解决这一争议。在本节中，我们结合了实验中劳动力供给反应的分析、遇到的问题以及获得的结果。

劳动力供给反应分析

这些实验为面板数据提供了某些关键变量（税率和保障水平）的重大变化，这些变量在衡量劳动力供给反应时特别有用。考虑一个标准表示形式，即在时间段 t 中按个人 i 划分的年度工作小时数hit中：（见原文）

其中，Xit代表工作时间的可观察决定因素（实验状态、工资率、家庭收入等），αi代表不可观察的分效应（能力、抱负等），ηt代表时间效应（经济增长、技术变革等），而ξit是标准干扰项。例如，如果出现以下情况，则对等式（6）的估计可能存在偏差：（见原文）

自早期文献以来，许多分析家都关注这个问题（Garfinkel 1973;Greenberg 和 Kosters 1973）。然而，如果单个效应是固定的，我们可以估计一个形式的方程（见原文）

该来源没有偏差，其中 hi、Xi和η代表所有时间段或某个特定时间段（例如实验前观察）的个体i和ηt-η可以通过虚拟变量表示为中等持续时间（3 年）的面板数据的固定时间效应。此外，将家庭随机分配到实验和控制计划的实验设计将确保决定因素Xit -Xi和误差ξit – ξi的独立性，从而以相对简单且良好的统计方法提供对劳动力供给反应行为的无偏估计。

根据公式（7），对劳动力供给反应的分析通常可分为两种主要类型：（a）非结构性方差分析（ANOVA）方法和（b）结构性劳动力供给模型。方差分析方法仅涉及通过虚拟变量来区分实验组和控制组，通常放弃时间效应并区分不同的计划或通过样条序列（Watts、Poirier 和 Mallar 1976）。然而，结构性劳动力供给模型是从等式（5）等经济模型推导出来的，其中（见原文）

捕捉税后工资和非劳动收入的变化（在实验前的工作时间评估），这将主要由实验组经历。

结构性劳动供给模型要求对劳动供给反应的结构进行更细致的规范化，增加了对劳动供给反应行为的规范化错误或误读的可能性。方差分析模型避免了这个问题，但当只使用虚拟变量来区分实验计划时，就不能轻易地推广到社会政策分析中。估计的响应必然只适用于所测试的特定实验计划，它对评估任何具有完全不同特征的预期保证收入计划的影响 – 例如加拿大麦克唐纳委员会最近提出的普遍收入保障计划（加拿大，1985年） – 尚不清楚。仅修正方差分析（或协方差分析;ANCOVA）包含实验设计参数（G和t）的模型，例如为新泽西州估计的样条函数，可以预测对此类程序的响应。然而，结构性劳动力供给模型的估计可以应用于对社会政策的一般评估以及保证年收入概念（Keeley 1981）。因此，方差分析模型和结构模型都提供了有关劳动力供给响应的有用信息，下面将考虑每种类型的预测。

实验数据分析中存在的问题

实验数据可能会解决在衡量劳动力供给对保证年收入计划的反应时的一些非常严重的问题。然而，仍然存在一些问题，其中最重要的问题似乎是非随机选择和不参与。我们将简要概述这些问题的性质，以便对实验数据进行分析，然后讨论这些问题对估计劳动力供给反应的影响的证据。

当实验预算受到限制时，所有五个实验都使用了Conlisk-Watts（1969）赋值模型，有利于使用廉价的观测值来提高估计的可靠性。因此，将发生非随机分配，因为实验观察的成本取决于家庭收入，而家庭收入反过来又会影响劳动力供给，从等式（2）中可以看出。因此，实验前收入低的家庭不太可能被分配到慷慨的计划（低t，高G），但他们的低收入可能意味着他们在实验前也提供很少的劳动力。在这种情况下，家庭对实验组的分配与劳动力供应无关，因此不与等式（7）中的误差项无关。这将给方程（7）的普通最小二乘（OLS）估计引入偏差，无论是方差分析还是结构方程。Keeley和Robins（1978）认为，纠正非随机赋值偏差的唯一方法是将所有赋值变量作为控制变量包含在估计模型中。由此产生的实验效应估计值将是无偏不倚的，取决于所进行的特定分配。但是，由于分配根据家庭规模和组成以及实验前的收入而变化，因此分配类别的数量可能会非常大，这种策略可能会严重降低估计的可靠性（Keeley 1981）。

是否参与GAI实验的决定在一定程度上取决于预期的财务收益。在指定计划中，低于盈亏平衡水平B的家庭面临着一个实验性改变的税收转移制度，这与教科书理论上的家庭预算约束发生意外变化的情况相对应。然而，对于处于B级或以上的实验分配家庭来说，由于在边际上不受其分配计划的影响，因此出现了不参与的问题。这些家庭可能会或可能不会选择参与，这取决于补偿工资效应的大小以及他们的收入与B的接近程度（Ashenfelter 1980）。非随机分配可能会使问题进一步复杂化，因为盈亏平衡状态和劳动力供应取决于实验前的收入和家庭规模，这也会影响分配。

实验组和对照组中的许多家庭在实验完成之前就离开了实验。例如，在新泽西州，1,357 个注册家庭中有 374 个（28%）没有完成实验;在Mincome，在温尼伯注册的1,187个家庭中有427个（36%）未能完成所有调查。如果这种损耗是随机的，那么唯一的担忧就是样本量减少导致的效率损失。然而，离开实验的决定可能取决于留下来的经济激励，而经济激励因盈亏平衡状态和税率而异（式[1]）。由于计划的分配取决于实验前的收入和劳动力供给，因此留在实验中的激励也将与这些变量相关，从而为劳动力供给反应的分析引入了另一个潜在的样本选择偏差来源。总而言之，尽管实验数据有潜力并有望回答有关保证收入计划可能的工作反应的问题，但这些实验并非没有自己的分析难题。

劳动供给反应的实验证据

如第IVA节所述，方差分析和结构模型都提供了有关使用实验数据对GAI的劳动力供给响应的有用信息。方差分析模型直接回答了这个问题，“是否存在实验反应（即，实验组和对照组之间的劳动力供应反应是否不同）？相比之下，结构模型回答了以下问题：“就传统（替代和收入）劳动力供给效应而言，实验反应是什么？这些模型应该提供关于劳动力供给对保障收入计划的响应的类似答案，但结构模型的结果可能在其他社会政策评估中更有用。

在表2中，我们总结了来自各种研究的证据，这些研究涉及五个实验中实验组和对照组之间平均年工作小时数的差异。对于美国的实验，介绍了Keeley（1981年，第5章），Robins（1985年）和Burtless（1986年）对实验证据的调查。结果表明，正如预期的那样，随着保障收入计划的引入，工作时间将减少，尽管下降的幅度取决于几个因素。 Robins 和 Burtless 对美国结果的加权平均值表明，丈夫的工作时间减少了约 6%，妻子减少了 19%，单身母亲减少了 15%。但请注意，只有西雅图-丹佛的结果具有统计显著性;从已发表的报告中可以看出，新泽西州、加里州和农村实验的估计值通常微不足道。在加拿大的实验中，反应同样适中——男性为1%，妻子为3%，未婚女性为5%——当时间效应被适当地包括在内时，如等式（7）所示，在统计学上不显著。（见原文）

一个值得关注的领域可能是非随机样本分配和参与实验可能产生的偏差。Ashenfelter（1980,1983）的Seattle-Denver实验和Sabourin（1985）的Mincome实验都发现，参与主要由资格（盈亏平衡状态）而不是选择（劳动力供给反应）决定，这意味着参与行为对表2中测量的劳动力供给反应影响不大。Hausman和Wise（1979）将损耗概率模型与个体反应的随机效应模型结合使用，在Gary实验中发现结构模型没有损耗偏差，但非结构（ANOVA）模型存在一些偏差证据。Robins和West（1986）结合了来自社会保障局收入记录和西雅图-丹佛数据库的证据，以检验方差分析框架中关于损耗偏差的各种假设，但他们得出的结论是，损耗偏差不太可能是一个严重的问题。然而，Ashenfelter和Plant（1990）从西雅图-丹佛实验中发现了系统性损耗的证据，并得出结论，劳动力-供给反应的非参数估计对损耗行为很敏感。Hum 和 Simpson（1991 年，第 7 章）发现，一旦考虑了时间效应，分配变量（实验前收入、盈亏平衡状态和家庭规模）在方差分析模型中是微不足道的。虽然没有明确的证据表明分配和参与偏差是实验中的一个严重问题，但鉴于Ashenfelter和Plant（1990）的最新证据，有必要进行进一步的研究。

很难断定表2中的实验效应，即使是具有统计学意义的实验效应，是否大。这个问题的答案取决于所提供的保障收入计划的慷慨程度，表2中的结果是对具体实验性实验反应的估计数。也就是说，结果是在每个站点测试的所有程序的加权平均值。结果只是暗示，如果实施类似“平均计划”之类的措施，工作时间将会减少。此外，将这些结果与基于结构性劳动力供给模型的非实验证据进行比较是非常困难的。

结构模型表面上基于等式（5），尽管这种特定的回归模型只针对西雅图丹佛（Keeley et al. 1978）和Mincome进行了估计。例如，Keeley 等人指定的模型将方程（5）和（7）组合在一起，得到（见原文）

其中 Δh 是实验期和实验前期之间的工作时间变化，Δw 是税后工资的变化，hpΔw + Δy 是在实验前评估的收入变化，Z 是一组控制变量。补偿工资（替代）效应β3和收入效应β2是直接估计的。Keeley等人实际上估计了该形式的相关方程（见原文）

使用 Tobit 回归，其中 hp 作为解释变量包含在内，以纠正在确定收入变化时因实验前劳动力供给替代永久劳动力供给而引起的任何偏差。其他估计值，例如Robins（1985）为新泽西州，加里和农村实验提出的估计值，通常是对结构模型参数的间接估计值，这些估计值可能与Seattle-Denver和Mincome的参数不具有严格可比性。

表3总结了与结构模型一致的劳动力供给反应的证据。提出弹性估计值是为了便于在实验之间以及与非实验研究进行比较，并为当前的政策分析提供最有用的信息。与非实验文献相比，GAI实验的结果提供了非常均匀且相当低的劳动力供给响应弹性估计。因此，实验证据证实了男性劳动力供给反应非常无弹性的非实验证据（Keeley 1981;基林斯沃思 1983;Pencavel 1986 年;Hum 和 Simpson 1991）。Robins（1985）对所有实验的加权平均值为0.08的替代弹性和0.10的收入弹性。（见原文）

然而，与大多数非实验证据不同，妻子和单身母亲的实验证据表明，他们也存在类似的非弹性反应。罗宾斯对妻子和单身母亲的替代弹性的估计为0.17和0.13，对他们各自收入弹性的估计为0.06和0.16。遗憾的是，表3中估计值的统计显著性要么不可用（例如，因为替代值是根据Slutsky公式计算的），要么在大多数情况下没有报告。然而，Robins（1985）指出，他对美国个别实验的平均估计替代和收入效应的20%与理论预测（积极的替代效应和负收入效应）相矛盾;只有在西雅图-丹佛实验中，结果才与标准理论一致，尽管其他地方的矛盾结果通常可能在统计学上不显著，因此被解释为0。

Mroz（1987）和MaCurdy，Green和Paarsch（1990）最近的研究解释了为什么在使用非实验数据的研究中，特别是对于已婚妇女，劳动力供给弹性估计被夸大了。Mroz在大多数针对职业妻子的研究中发现了严重错误规格偏倚的证据。少数通过Mroz规格测试的非实验研究证实了使用实验数据发现的低弹性估计值。MaCurdy等人表明，过去十年中通常对已婚妇女的非实验数据集进行，以纠正由非线性预算约束引起的偏差的估计程序，本身偏向于更高的工资效应。

加拿大实验的初步证据与美国实验的证据一致，即劳动力供给弹性估计值远小于Mincome实验前调查等非实验数据的相应估计值（Prescott， Swidinsky， and Wilton 1986;Hum 和 Simpson 1991）。我们使用基于等式（5）的组内估计器来解释面板 t 相对于基期（所有面板的平均值）的工作小时数变化：（见原文）

其中 wit – wi 是税后工资相对于基期的变化，vit – vi 是基期收入的变化，cit – ci 是家庭中学龄前儿童人数相对于基期的变化，ti 是一组虚拟变量，其中 ti = 1 对应于 1975 年的面板（i = 2）， 1976 面板（i = 3）和 1977 面板（i = 4），ξ 是残差项。如果来自非随机分配和参与的未观察到的个体效应和实验设计效应是固定的，则组内估计器应产生替代效应 β1和收入效应 β2 的无偏估计。该模型与Keeley等人（1978;见上文方程[8]）相同，只是增加了一个变量以反映家庭中学龄前儿童数量的任何变化，但他们选择了等式（9），该公式需要包含一整套控制变量。此外，正如Mroz（1987）所证明的那样，他们使用的Tobit估计器在估计非实验数据的劳动力供给弹性方面并未被证明是可靠的。Hum和Simpson（1991）发现，Keeley模型通常比组内估计量产生更大的估计替代弹性，这一结果与Mroz一致。

我们的Mincome初步结果表明，与预期相反，薪酬工资弹性为负，但这些弹性通常微不足道，可能应被视为零。由于对其他实验的许多研究产生了反常的，但很小且通常微不足道的工资和收入效应，因此我们的结果与新泽西州，加里和农村实验的结果一致，如果不是西雅图丹佛的话。已婚男子和妇女对劳动力供应反应的一个始终重要的因素是家中有学龄前儿童。学龄前儿童显著增加了丈夫的劳动力供给，而妻子的劳动力供给减少了大致相同的量。事实上，Mincome的初步结果表明，家庭构成的变化对劳动力供给的影响可能比保障收入计划大得多。

劳动力供给以外的应对措施

可以理解的是，NIT实验集中在工作对保证收入的反应上，这不仅是因为如果将全国性的GAI作为消除贫困的策略实施，它对于计算计划成本具有重要意义，而且还因为对身体健全人群的大规模工作退出的恐惧被认为是最终的绊脚石。同时，研究了劳动力供给以外的一些行为反应。所审查的专题清单可以从以下方面大致分类：（a）消费模式研究，其中审查了实验参与者在服装、住房、耐用消费品、食品、医疗保健、债务和资产积累等商品上的支出;（b）人力资本投资研究，其中诸如儿童护理、咨询、上学、营养、移民和地理流动性是人们关注的焦点;（c）非经济或“社会学”反应，我们应该用这个术语来涵盖心理健康、婚姻稳定性、犯罪、政治参与、教育愿望和家庭生活等广泛的话题。这里甚至可能包括诸如误报行为、参与者对计划规则的理解等行政问题。因此，在“短期”和“长期”反应方面，消费和人力资本研究之间可以粗略区分。

显然，上述主题列表的范围很广，任何试图提供严格分类的尝试都似乎是徒劳的。此外，许多研究没有得到证实，并且极难评估。就预期的行为结果而言，非工作反应结果不仅更加复杂，而且它们也必然更加分散，因为通常没有共同的出发点、理论结构，甚至没有明确定义的实证技术。尽管如此，从政策角度来看，上述松散的分类可以突出一些令人担忧的问题。

消费研究之所以引起人们的兴趣，是因为它可能会揭示 GAI 接受者是否以“如此可接受”的方式改变他们的支出模式。在回顾农村实验的一些消费研究时，Michael（1978）认为，与退出工作的问题及其对计划成本的影响不同，研究人员没有解决明确的社会问题或紧迫的计划性问题。Baumol （1974）在早些时候对新泽西州结果的回顾中也是如此：“那些担心 [GAI] 最坏情况的人可能会持有这样的假设，即大部分付款将被接受者浪费——要么花在毒品、饮料和赌博上，要么在增加的闲暇时间中被无益地使用”（第 253 页）。改变这种观点的当地人将包括一种可能性，即 GAI 根本不会对生活方式产生实质性干扰，并且非工作反应影响很小。

鲍莫尔的引述有助于提醒我们，围绕 GAI 的大部分激情和争议都围绕着社会愿意接受社会认可的对无条件现金支付的回应。就劳动力市场而言，这显然是一个抑制工作因素的问题。在消费方面，这更微妙地表现为对GAI资金使用方式的不满。正如马斯特斯所说：“劳动力供应分析与穷人是懒惰流浪汉的刻板印象有关。支出分析可能与穷人是挥霍无度的酒鬼的定型观念有关。

在决定提供实物福利与现金转移之间作出决定时，消费研究也具有潜在的政策重要性，特别是在住房和食品以及可能的儿童保育或教育等领域。然而，许多人认为，在这些问题上，实验以外的研究项目可能会提供更好的行为反应时间（Hanushek 1986）。在这个问题上，加拿大人和美国人也会有不同的政策偏好。

在人力资本投资的实验中，研究的结果比在消费研究中的研究要少得多。鉴于每次实验的持续时间都非常短，这也许是可以理解的，预计这对人力资本投资的反应比工作努力或非耐用品的消费更成问题。梅特卡夫（Metcalf，1973,1974）特别强调了这样一个事实，即有限持续时间的实验可能会低估长期收入效应，而高估长期价格效应。无论如何，可以公平地得出结论，NIT实验中的各种消费和人力资本投资研究对政策影响不大。这是因为，总的来说，研究表明，实验对消费和投资决策几乎没有或没有明显的影响，或者，如果检测到任何反应，它要么是轻微的，轻微有益的，要么，就住房而言，它只是改变了已经计划的购买时间（Hanushek 1986）。此外，所有这些研究的基调加在一起表明，NIT付款的花费方式与以其他方式获得的货币收入大致相同。

各种社会学反应也难以评估，部分原因是经济学家经常质疑构建的规模测量的可靠性。同样，人们普遍认为，在社会学反应的标题下研究的许多问题 – 例如心理健康和婚姻互动 – 没有得到NIT实验设计的很好的服务，并且从这些主题中获得的任何信息都只是一个受欢迎的奖励。唯一的例外是婚姻不稳定或家庭解体的问题。

GAI 对婚姻破裂和家庭组成的影响已成为一个重大争议，现在可能已成为政策制定者和学者之间关于 GAI 的政策辩论的首要议程。原因很明显。首先，成本影响引起了巨大的共鸣;为了获得更大的福利而被迫分裂的家庭将增加整体计划成本，同样的恐惧激发了人们对工作抑制的担忧。其次，一个实际上鼓励婚姻和家庭破裂的GAI计划，无论是政策制定者还是公众都是不可接受的。第三个因素是最近关于这一主题的研究具有争议性。

新泽西州实验的初步发现表明，GAI付款可能会在一定程度上影响家庭的破裂或持久性，但在对工作反应的匆忙调查结果中，这一发现被遗忘了。然而，Hannan、Tuma 和 Groeneveld （1977， 1978）以及 Groeneveld， Tuma， and Hannan （1980）报告的惊人发现，即 NIT 计划显著增加了婚姻解体。Cain和Wissoker（1990a）重新审视了相同的证据，发现对婚姻不稳定的影响只是轻微或微不足道的。正如默里（在本期中）明显提到美国的争议所指出的那样，“尘埃最终将尘埃落定”。与此同时，艾伦（在本期中）不得不在不太理想的情况下探索加拿大面临的同样困难的问题，使用加拿大人口普查数据并专注于一般的福利，而不是 GAI 计划。加拿大关于GAI和婚姻稳定性的实验证据才刚刚出现，现在判断“雪会如何堆积”还为时过早。初步结果表明，婚姻解除对NIT付款的反应适中（Choudhry 1989;Hum 和 Choudhry 1992，出版中）。这场辩论仍在继续。预计GAI的战场将转向福利结构和家庭组成之间的联系，这比关于工资和收入弹性估计的技术性争吵要直观和容易理解得多。

总结

在过去25年中，加拿大和美国在保证年收入方面采取了类似的道路。对公共援助计划的不满导致两国都考虑了保障收入计划。这种考虑足够严重，足以激发大规模的社会实验，以确定这样一个计划的经济影响。对实验和 GAI 问题的分析绝不是穷尽的，但现在已经积累了大量的研究，以确定我们在理解 GAI 计划的经济影响方面的共同进展。在有限的篇幅内，我们试图介绍和评估来自美国来源的证据，并提供加拿大实验的一些初步可比结果，特别关注主要的政策和研究主题，即劳动力供应反应或工作激励。

如果我们被要求“用 25 个字或更少的字”总结从实验中学到的关于 GAI 计划的经济影响的内容，我们会回答说：“迄今为止，几乎没有发现不利影响。那些发现的不利影响，如工作反应，比没有实验的情况下预期的要小。事实上，在经济学家之间逐渐形成的共识中，即劳动力供给反应的弹性比以前估计的要小，特别是对于已婚妇女来说，我们认为实验证据发挥了重要作用（Hum and Simpson 1991）。这种共识应该影响未来关于GAL成本的政策辩论，以及其他社会政策改革。例如，Burtless（1986）估计，根据西雅图-丹佛的结果，相当慷慨的GAI（贫困线的75%，税率为50%）在工作收入减少方面的成本将抑制，每转移给穷人一美元，将产生30至60美分。由于其他实验发现劳动力供给反应较小，因此这可能对预期的GAI计划的成本进行了较高的估计，但与非实验证据相比，该估计要小得多，也要精确得多。这些成本是否“高”，以及这些成本是否“值得”，取决于评估者，并最终取决于对公众对GAI支持的政治评估。但是，既然实验已经报告了，如果（何时？）福利改革和GAI重新成为政策的焦点，那么这种评估将得到更好的信息。

另一个可能被问到的问题是，GAI的经验是否包含对社会政策评估的教训。我们认为，从实验设计到分析方法，在各种问题上都吸取了宝贵的经验教训。继续从对实验的重新评估中吸取经验教训，并应用于其他更温和的社会政策评估，如美国的就业和培训政策。对于那些认为 GAI 辩论和收入维持实验不值钱的人，我们只会观察到，与加拿大和美国社会项目的年度支出相比，所涉及的资金很少。如果 GAI 的经验可以激化政策辩论并帮助我们避免将来做出不明智的社会政策决策，那么这可能是一项可靠的投资。

转载请注明：《中国社会分红/基本收入研究网》　浏览量：231 views