ECTA-2026-03-03

婚姻市场中的分类匹配（assortative matching）模式对家庭间不平等具有直接且深远的影响。然而，基于收入这一连续变量测量匹配的分类程度，面临理论和数据层面的双重挑战。本文利用荷兰极其丰富的行政税务面板数据（覆盖 2013 至 2019 年全部税务档案），发展了一套新颖的半参数方法论，将 Choo 和 Siow（2006b）的 SEV 框架直接扩展至大规模收入类别，允许高度灵活的匹配模式。

具体而言，研究首先采用非参数方法，将男女收入各分为 30 个组别，生成 30×30 的匹配矩阵，并计算每对收入组合的结构性剩余系数。然而，由于样本噪声问题，直接计算第二交叉差分（即局部超模性核心）无法得到稳健结论。为此，作者提出了半参数模型，用高次多项式（degree 6）灵活逼近剩余函数，通过估计第二交叉导数来识别局部正分类匹配（PAM）和负分类匹配（NAM）区域。

研究发现，在 2013 至 2019 年间缔结的所有婚姻中，大多数夫妇确实呈现出强烈的正向分类匹配倾向——尤其是中低收入且收入相近的夫妇。然而，存在一个小规模但统计显著的少数群体（约 2.5%，超过 13,000 对夫妇）表现出显著的负分类匹配特征：这些"传统型"夫妇遵循"男性养家"模式，丈夫收入较高（超过 60,000 欧元），而妻子收入远低于丈夫（低于 30,000 欧元）。这一模式在七年数据中表现出惊人的稳定性。

研究进一步发现，使用婚后当前收入（而非婚前收入）进行匹配分析，会产生误导性结论。通过将新婚夫妇的匹配模式与全人口（包含已婚多年夫妇）进行比较，以及用 2013 年婚前收入替代 2019 年当前收入进行估计，作者证实了劳动供给对婚姻状态变化的内生反应会严重偏误匹配模式的估计。此外，研究还通过安慰剂检验（随机匹配个体）、改变收入分箱方式、提高多项式阶数、使用对数收入等多项稳健性检验，验证了结论的可靠性。

论文提供了内部和外部双重验证：内部验证显示模型预测的对数家庭收入均值、方差及配偶收入相关系数与实际数据几乎完全吻合；外部验证则利用 2021 年新冠疫情导致婚姻数量下降 13% 的准自然实验，证明模型能准确预测匹配模式变化（预测配偶收入相关系数 29.50% vs. 实际 29.54%）。此外，估计的剩余与离婚概率显著负相关，进一步支持了模型的有效性。

总之，本文为基于连续变量的婚姻匹配分析提供了一套完整且灵活的方法论框架，并揭示了婚配模式在收入分布上的显著异质性——这一发现对理解家庭不平等和代际传递具有重要政策含义。