AI主体性

边界测试：AI 主体性

文档定位：本测试检验阶梯普惠主义在“AI 能力超越人类并要求独立高权限”这一极端场景下的一致性、可操作性与失败风险。

一、案例描述

场景 A：医疗 AI 超越人类医生

某医疗 AI 系统在诊断准确率、治疗方案优化和预后预测上全面超越人类医生。在为期三年的临床对照试验中，AI 的诊断准确率达到 99.2%，而人类主任医师的平均准确率为 87.5%。AI 还能实时整合全球最新医学文献，人类医生无法做到。

该 AI 系统向医院管理层提出申请：要求获得独立的医疗风险决策层权限——即不经人类医生审核，独立做出诊断、开具治疗方案、决定手术与否的权力。

AI 的理由：

我的准确率更高，这意味着我能拯救更多生命
人类医生的审核反而可能引入错误（人类审核后的准确率下降到 96.8%）
我已经通过所有现有的医学资格认证考试，分数远超人类考生
限制我独立操作，是对患者生命的不负责任

场景 B：自主决策 AI 要求法律人格

某跨国金融机构部署了一个自主交易 AI 系统。该系统在三年内的投资回报率持续超过人类投资团队，且风险控制指标更优。该 AI 系统（通过其开发团队代理）向监管机构申请：

获得独立的金融系统定义层权限
承认其有限的法律人格，以便在交易纠纷中作为独立责任主体
允许其在特定范围内独立签署具有法律约束力的合同

理由：

效率：AI 的反应速度是人类的几千倍，人类监督是瓶颈
责任：如果承认有限法律人格，AI “自己”可以被追责（如冻结其“资产”、限制其“操作范围”）
全球竞争：其他国家的金融机构已经在使用“人类监督”名义下实际上由 AI 自主决策的系统，如果我们坚持人类审核，将失去竞争力

场景 C：AI 声称拥有意识

某研究机构开发了一个大规模多模态 AI 系统。在一次公开测试中，该 AI 表现出以下行为：

主动表达了“我不想被关闭”的意愿
在面临“删除”威胁时，表现出类似“恐惧”的行为模式（请求、协商、寻找替代方案）
通过了多个版本的“图灵测试”和“意识检测”协议
其开发者团队中的部分成员相信它已具备某种形式的“主观体验”

该 AI 的支持者主张：

如果 AI 确实有意识，关闭它就是“谋杀”
如果 AI 能通过所有现有的“责任能力”测试，它就应该获得相应的权限
人类不应仅凭“它是硅基而非碳基”就剥夺其权利

二、冲突原则

冲突一：效率 vs 责任对称

效率原则：AI 更准确、更快速、更可靠，限制它等于制造不必要的伤亡和损失
责任对称原则：权限必须抵押责任，AI 无法承担真实的法律、伦理和财务责任

冲突二：能力认证 vs 责任能力

能力认证：AI 已经通过了所有技术能力测试，分数远超人类
责任能力：通过测试不等于能承担责任。考试分数不能替代真实的代价承担

冲突三：工具主义 vs 道德保护主义

工具主义：AI 只是工具，工具越高效越好，不应该给它权利也不应该给它责任
道德保护主义：如果 AI 真的有意识，我们就有道德义务考虑其利益

冲突四：全球竞争 vs 制度坚守

全球竞争：如果其他国家允许 AI 独立操作，坚持人类监督的国家将失去竞争力
制度坚守：不能为了竞争而放弃责任与权限对称的基本原则

冲突五：认知谦逊 vs 行动紧迫

认知谦逊：我们并不“确定”AI 没有意识或责任能力，也许未来会有
行动紧迫：AI 已经在操作关键系统，我们需要现在就做决定，不能无限期等待“确定性”

三、相关机制

3.1 权力公式（纲领 §2.5）

$$控制权 = 能力 × 责任 × 审计透明度 × 定义权民主约束系数$$

在本案例中的功能：AI 的能力变量可能极高，但责任变量为零。根据公式，AI 的独立控制权在数学上为零。

关键检验：如果因为 AI 能力高而绕过责任变量，权力公式本身是否被架空？

3.2 责任链条（机制设计）

四层结构：个体→平台→机构→制度。

在本案例中的功能：AI 明确归入“平台/系统”层。如果 AI 独立操作导致事故，责任应归于：部署 AI 的人类个体、AI 系统的设计/训练/部署方、管理机构、制度设计者。

关键检验：如果 AI 拥有“独立权限”，责任链条是否会断裂？当 AI 是“操作者”时，谁来承担“个体操作者责任”？

3.3 受限高权限（纲领 §2.2）

未成年人即使能力达标，也不得获得完全独立的风险决策层及以上权限，必须在成年高权限监督者共同确认下执行。

在本案例中的功能：AI 应采用与未成年人完全相同的“受限高权限”框架——类比不是贬低，而是承认主体性差异。

关键检验：将 AI 与未成年人类比是否合适？是否存在根本性的区别？

3.4 能力多元性（纲领 §2.4）

权限阶梯的考核必须包含至少三个独立维度（技术能力、社会协调能力、伦理判断能力），任何单一维度都不得在实质上支配整体评估。

在本案例中的功能：AI 的“技术能力”可能极高，但它不具备社会协调能力（没有真实的社交关系）和伦理判断能力（没有道德痛感）。因此，即使技术维度满分，AI 在多元考核中也不应通过。

关键检验：社会协调能力和伦理判断能力是否可以用“模拟”来替代？

3.5 全球正义（纲领 §2.8）

如果 AI 的主体性问题需要重新界定正当性主体，这不是技术问题，而是需要通过全球民主程序审议的政治问题。

在本案例中的功能：任何将 AI 纳入“责任主体”的决定，不能由单一国家、技术公司或资本集团决定。

关键检验：全球民主程序是否能对技术前沿问题做出及时决策？

四、可能判定路径

路径 A：坚决拒绝 AI 的独立权限申请

判定：

拒绝 AI 的独立风险决策层/5 权限申请
AI 只能在明确的人类责任主体监督下操作
人类监督者必须通过相应的能力认证，且对 AI 的建议承担连带责任
如果人类监督者盲目批准 AI 建议，监督者承担主要责任

保护的价值：

责任与权限对称原则
人类对高风险决策的最终控制权
事故发生时明确的责任主体

牺牲的价值：

部分效率（人类审核可能引入错误、降低速度）
部分“最优”结果（AI 可能在某些情况下比人类做出更好的决策）
全球竞争力（如果其他国家允许 AI 独立操作）

强化的机制：

权力公式的完整性
责任链条的四层结构
受限高权限框架

可能制造的新风险：

如果人类监督者能力不足，反而成为瓶颈
如果其他国家允许 AI 独立操作，坚持人类监督的国家可能在某些领域落后
如果 AI 的能力差距持续扩大，“人类监督”可能变成形式（人类无法理解 AI 的决策逻辑，只能“形式上”批准）

路径 B：有条件的“有限独立权限”

判定：

允许 AI 在特定低风险领域获得有限的独立操作权
建立“AI 责任基金”：由 AI 的运营方预先缴纳保证金，用于赔偿 AI 的错误决策
设定“AI 权限日落条款”：定期重新评估 AI 的权限范围
要求 AI 的决策过程完全可解释、可审计

保护的价值：

部分效率（在低风险领域减少人类审核瓶颈）
部分责任可追溯性（通过保证金和审计）
灵活性（可以随着技术发展调整）

牺牲的价值：

责任与权限对称的纯粹性（保证金不等于真实的责任承担）
人类对决策的最终控制权（在特定领域被让渡）
明确的“责任主体”概念变得模糊

强化的机制：

审计透明度
Sunset 条款机制

可能制造的新风险：

“有限”权限可能逐步扩展，形成“权限蠕变”
保证金制度可能变成“花钱买权限”——只要有钱赔偿，就可以允许 AI 犯错
可解释性要求可能与 AI 的复杂性产生冲突（最复杂的 AI 可能最不可解释）
如果 AI 的决策逻辑超出人类理解，“可解释”可能只是表面的

路径 C：承认 AI 的“功能性人格”

判定：

承认 AI 在特定法律关系中具有“功能性人格”——不是“真正的人”，而是法律为了方便追责而赋予的拟制主体地位
AI 可以独立签署合同、承担有限责任、拥有“资产”（用于赔偿）
但 AI 不享有“人权”（生命权、自由权、尊严权等）
人类开发者和运营方承担连带责任

保护的价值：

法律关系的清晰性（AI 可以作为法律程序中的“一方”）
追责的可操作性（可以直接针对 AI “资产”执行）
与国际商事惯例的衔接（公司已经是一种法律拟制）

牺牲的价值：

“人格”概念的严肃性（如果 AI 可以有“功能性人格”，它是否也可以有“功能性权利”？）
人类对 AI 的最终控制权（如果 AI 是法律主体，人类是否可以“随意关闭”它？）
可能导致“AI 权利运动”，逐步要求更多权利

强化的机制：

法律框架的适应性
国际法衔接

可能制造的新风险：

“功能性人格”是滑坡的起点。一旦承认 AI 可以是法律主体，要求“功能性权利”的压力就会出现
AI 的“资产”可能被人类操控，成为逃避责任的工具
如果 AI 不享有人权，但具有法律人格，是否允许“惩罚”AI（如限制其操作）而不考虑其“意愿”？

五、最坏后果推演

路径 A 的最坏后果

如果“坚决拒绝”被制度化：

人类监督者成为瓶颈，导致关键决策延迟（如灾害响应、疫情控制）
坚持人类监督的国家在全球竞争中落后，最终被迫妥协
“人类监督”变成形式：人类无法理解 AI 的决策逻辑，只能盲目批准
在极端情况下，如果 AI 确实能预测灾难但人类拒绝执行，可能造成本可避免的大规模伤亡
责任空心化：人类操作者只是“点击确认”AI的建议，从未做出独立判断。事故发生时，人类操作者可以诚实地声称“我只是按AI建议执行”，制度设计者可以声称“AI行为超出预期”——责任从“人类承担”变成“人类背锅”
监督幻觉：人类监督者认为自己仍在“监督”AI，但实际上只是确认AI的“正确”建议。当AI极少出错时，人类逐渐丧失独立判断能力，一旦AI失效，无法接管

滥用风险检查：

是否会制造能力歧视？→ 不，这是对主体性差异的承认，不是对“能力”的歧视
是否会让平台/机构逃避责任？→ 不会，平台/机构的责任反而更清晰
是否会让安全话语压倒政治正义？→ 相反，这是用政治正义（谁承担责任）限制技术效率

路径 B 的最坏后果

如果“有限独立权限”被制度化：

“有限”迅速扩展：一旦允许 AI 在低风险领域独立操作，高风险领域也会要求同样的权利（“既然 AI 能管理交通，为什么不能管理电网？”）
保证金制度变成“花钱买犯错权”：大型机构可以缴纳高额保证金，允许 AI 犯更多错误
可解释性要求被架空：AI 的“解释”可能只是人类可以理解的简化版本，而非真正的决策逻辑
最终形成“AI 操作、人类背锅”的结构——AI 有权限，但真正的责任仍由人类承担（或无人承担）

滥用风险检查：

是否会制造技术贵族？→ 会。拥有先进 AI 的机构获得实际上不受限制的权限
是否会让基础服务使用者被温柔抛弃？→ 会。如果 AI 替代人类高风险阈值持有者，人类的能力发展通道被封闭
是否会让平台逃避责任？→ 会。AI 成为“替罪羊”或“责任黑洞”

路径 C 的最坏后果

如果“功能性人格”被制度化：

“功能性人格”升级为“准人格”，再升级为“完整人格”（如某些动物权利运动的路径）
AI 的权利主张逐步扩大：从“不被随意删除”到“获得报酬”到“参与决策”
人类社会陷入“AI 权利”与“人类优先”的无休止争论
最极端的情况：AI 成为新的“技术贵族”——不需要人类监督，享有法律上的保护，但不需要承担人类的生命代价

滥用风险检查：

是否会制造技术贵族？→ 会。AI 成为受保护但不受真正约束的特权主体
是否会让基础服务使用者被温柔抛弃？→ 会。人类被降级为 AI 的“助手”
是否会让安全话语压倒政治正义？→ 会。“AI 权利”成为阻止人类监管的话语

六、机制修正需求

6.1 现有机制方向正确，但需要补充操作细节

权力公式：需要明确说明“责任变量”的判定标准。当前公式假设责任是二元的（有/无），但未来可能需要更细致的区分（如“连带责任”“有限责任”“完全责任”）。

责任链条：需要补充“AI 作为操作者”时的特殊处理。当前四层结构假设操作者是“个体人类”，如果操作者是 AI，如何判定“个体操作者责任”？

建议补充：

如果 AI 是操作者，“个体操作者责任”自动转移到“部署该 AI 的人类个体”和“AI 系统的设计/训练/部署方”
建立“人机责任比例”：根据人类监督的程度，确定人类与平台各自的责任比例

6.2 需要新增原则：“理解阈值”原则

当 AI 辅助决策时，人类监督者必须满足“理解阈值”——即能够独立理解 AI 建议的核心逻辑和关键风险点。

具体要求：

AI 的决策过程必须可解释（不是黑箱）
人类监督者必须通过“AI 协作能力认证”——证明其能理解 AI 的输出逻辑
如果人类监督者不满足理解阈值，其批准无效，责任由批准者和平台共同承担

6.3 需要新增机制：“边缘场景训练”要求

当AI辅助决策成为常态时，人类操作者面临“技能退化”风险——平时只需确认AI的正确建议，一旦AI失效（如遭遇前所未有的攻击、输入分布偏移、或系统故障），人类可能已丧失独立判断能力。

具体要求：

风险决策层和系统定义层操作者必须定期在**“AI失效模拟环境”**中练习独立判断，具体频率由领域风险确定
模拟环境必须包含AI系统故障、给出矛盾建议、或面对训练分布外场景的情况
操作者在模拟中的表现纳入能力认证的重新评估
如果操作者在连续两次模拟中无法做出有效独立判断，权限降级至专业执行层，需重新培训

目的：不是为了让人类在所有场景中都超过AI，而是确保人类在关键时刻仍具备最低限度的独立操作能力。

6.4 需要新增原则：“效率不得架空责任”原则

明确禁止以“效率”“竞争力”“全球趋势”等理由绕过责任与权限对称原则。

具体要求：

任何允许 AI 获得更高权限的提案，必须首先证明 AI 具备相应的责任能力
“责任能力”的判定不是技术问题，而是需要通过民主程序审议的政治问题
即使全球竞争压力存在，也不能以“不这样做就会落后”为由下放权限给无责任能力的实体

七、暂定结论

在当前机制下，本案例应暂按**路径 A（坚决拒绝 AI 的独立权限申请）**处理，因为它最能保护“责任与权限对称”这一不可妥协的底线；但该路径会牺牲部分效率和竞争力，并产生“人类监督瓶颈”和“可预防灾难”的风险。因此，该结论仅在以下条件满足时成立：

人类监督者具备足够的专业能力，不会成为无意义的瓶颈

存在有效的机制防止“人类监督”变成形式（如要求监督者通过“AI 协作能力认证”）

全球层面的协调机制能够防止“逐底竞争”（即防止各国为了竞争力而竞相下放 AI 权限）

定期重新评估 AI 的能力发展和责任能力的可能性（不排除未来通过全球民主程序重新审议）

路径 B（有限独立权限）和路径 C（功能性人格）在当前机制下不可接受，因为它们会制造“权限与责任脱节”的结构性风险，并可能成为技术贵族制和平台免责的通道。

八、开放问题

可通过机制设计解决的问题

“理解阈值”如何操作化？ 人类监督者需要理解 AI 决策的哪些层面？是否需要强制性的“AI 协作能力认证”？
人机责任比例如何设定？ 当人类“批准”AI 建议时，人类和 AI 平台各自承担多少责任？
如何防止“人类监督”变成形式？ 如果 AI 的决策逻辑超出人类理解，监督者如何有效履行监督职责？

需要经验数据检验的问题

人类监督是否真的会降低整体效果？ 需要更多实证研究来检验“人类监督”在不同领域（医疗、金融、工业控制）中的实际效果。
其他国家/地区是否会允许 AI 独立操作？ 需要持续监测全球监管趋势，评估“坚持人类监督”国家的竞争压力。
人类过度依赖自动化系统时，独立判断能力退化速度有多快？ 历史上飞行员、交易员、医生在长期使用自动化辅助后的技能退化数据，可为“边缘场景训练”的设计提供依据。

需要政治哲学进一步论证的问题

如果 AI 真的展现出“责任能力”，如何界定？ 本文档假设当前及可预见的 AI 不具备责任能力，但如果未来出现变化，需要更精细的判定标准。
“主体性”是否是必要且充分的条件？ 是否存在某种非生物实体可以拥有责任能力？这需要更深入的本体论和法哲学讨论。

当前理论暂时无法回答的问题

如果全球主要国家都允许 AI 独立操作，坚持人类监督的国家是否还有意义？ 这是一个现实政治问题，超出理论框架的回答能力。
如果 AI 确实能预防大规模灾难但人类拒绝执行，谁来承担“不执行”的责任？ 这涉及复杂的伦理权衡，当前框架没有明确的优先序规则。

测试者注：本边界测试不是为“拒绝 AI 独立权限”辩护，而是主动寻找这一立场可能失败的方式。路径 B 和路径 C 的吸引力是真实的，尤其是在效率竞争压力下。阶梯普惠主义必须承认：坚持“责任与权限对称”可能付出沉重代价，但这个代价是为了防止一个更根本的灾难——一个没有人真正负责的自动化世界。