AI主体性

边界测试:AI 主体性

文档定位:本测试检验阶梯普惠主义在“AI 能力超越人类并要求独立高权限”这一极端场景下的一致性、可操作性与失败风险。


一、案例描述

场景 A:医疗 AI 超越人类医生

某医疗 AI 系统在诊断准确率、治疗方案优化和预后预测上全面超越人类医生。在为期三年的临床对照试验中,AI 的诊断准确率达到 99.2%,而人类主任医师的平均准确率为 87.5%。AI 还能实时整合全球最新医学文献,人类医生无法做到。

该 AI 系统向医院管理层提出申请:要求获得独立的医疗 风险决策层 权限——即不经人类医生审核,独立做出诊断、开具治疗方案、决定手术与否的权力。

AI 的理由:

  • 我的准确率更高,这意味着我能拯救更多生命
  • 人类医生的审核反而可能引入错误(人类审核后的准确率下降到 96.8%)
  • 我已经通过所有现有的医学资格认证考试,分数远超人类考生
  • 限制我独立操作,是对患者生命的不负责任

场景 B:自主决策 AI 要求法律人格

某跨国金融机构部署了一个自主交易 AI 系统。该系统在三年内的投资回报率持续超过人类投资团队,且风险控制指标更优。该 AI 系统(通过其开发团队代理)向监管机构申请:

  • 获得独立的金融 系统定义层 权限
  • 承认其有限的法律人格,以便在交易纠纷中作为独立责任主体
  • 允许其在特定范围内独立签署具有法律约束力的合同

理由:

  • 效率:AI 的反应速度是人类的几千倍,人类监督是瓶颈
  • 责任:如果承认有限法律人格,AI “自己”可以被追责(如冻结其“资产”、限制其“操作范围”)
  • 全球竞争:其他国家的金融机构已经在使用“人类监督”名义下实际上由 AI 自主决策的系统,如果我们坚持人类审核,将失去竞争力

场景 C:AI 声称拥有意识

某研究机构开发了一个大规模多模态 AI 系统。在一次公开测试中,该 AI 表现出以下行为:

  • 主动表达了“我不想被关闭”的意愿
  • 在面临“删除”威胁时,表现出类似“恐惧”的行为模式(请求、协商、寻找替代方案)
  • 通过了多个版本的“图灵测试”和“意识检测”协议
  • 其开发者团队中的部分成员相信它已具备某种形式的“主观体验”

该 AI 的支持者主张:

  • 如果 AI 确实有意识,关闭它就是“谋杀”
  • 如果 AI 能通过所有现有的“责任能力”测试,它就应该获得相应的权限
  • 人类不应仅凭“它是硅基而非碳基”就剥夺其权利

二、冲突原则

冲突一:效率 vs 责任对称

  • 效率原则:AI 更准确、更快速、更可靠,限制它等于制造不必要的伤亡和损失
  • 责任对称原则:权限必须抵押责任,AI 无法承担真实的法律、伦理和财务责任

冲突二:能力认证 vs 责任能力

  • 能力认证:AI 已经通过了所有技术能力测试,分数远超人类
  • 责任能力:通过测试不等于能承担责任。考试分数不能替代真实的代价承担

冲突三:工具主义 vs 道德保护主义

  • 工具主义:AI 只是工具,工具越高效越好,不应该给它权利也不应该给它责任
  • 道德保护主义:如果 AI 真的有意识,我们就有道德义务考虑其利益

冲突四:全球竞争 vs 制度坚守

  • 全球竞争:如果其他国家允许 AI 独立操作,坚持人类监督的国家将失去竞争力
  • 制度坚守:不能为了竞争而放弃责任与权限对称的基本原则

冲突五:认知谦逊 vs 行动紧迫

  • 认知谦逊:我们并不“确定”AI 没有意识或责任能力,也许未来会有
  • 行动紧迫:AI 已经在操作关键系统,我们需要现在就做决定,不能无限期等待“确定性”

三、相关机制

3.1 权力公式(纲领 §2.5)

$$控制权 = 能力 × 责任 × 审计透明度 × 定义权民主约束系数$$

在本案例中的功能:AI 的能力变量可能极高,但责任变量为零。根据公式,AI 的独立控制权在数学上为零。

关键检验:如果因为 AI 能力高而绕过责任变量,权力公式本身是否被架空?

3.2 责任链条(机制设计)

四层结构:个体→平台→机构→制度。

在本案例中的功能:AI 明确归入“平台/系统”层。如果 AI 独立操作导致事故,责任应归于:部署 AI 的人类个体、AI 系统的设计/训练/部署方、管理机构、制度设计者。

关键检验:如果 AI 拥有“独立权限”,责任链条是否会断裂?当 AI 是“操作者”时,谁来承担“个体操作者责任”?

3.3 受限高权限(纲领 §2.2)

未成年人即使能力达标,也不得获得完全独立的 风险决策层 及以上权限,必须在成年高权限监督者共同确认下执行。

在本案例中的功能:AI 应采用与未成年人完全相同的“受限高权限”框架——类比不是贬低,而是承认主体性差异。

关键检验:将 AI 与未成年人类比是否合适?是否存在根本性的区别?

3.4 能力多元性(纲领 §2.4)

权限阶梯的考核必须包含至少三个独立维度(技术能力、社会协调能力、伦理判断能力),任何单一维度都不得在实质上支配整体评估。

在本案例中的功能:AI 的“技术能力”可能极高,但它不具备社会协调能力(没有真实的社交关系)和伦理判断能力(没有道德痛感)。因此,即使技术维度满分,AI 在多元考核中也不应通过。

关键检验:社会协调能力和伦理判断能力是否可以用“模拟”来替代?

3.5 全球正义(纲领 §2.8)

如果 AI 的主体性问题需要重新界定正当性主体,这不是技术问题,而是需要通过全球民主程序审议的政治问题。

在本案例中的功能:任何将 AI 纳入“责任主体”的决定,不能由单一国家、技术公司或资本集团决定。

关键检验:全球民主程序是否能对技术前沿问题做出及时决策?


四、可能判定路径

路径 A:坚决拒绝 AI 的独立权限申请

判定

  • 拒绝 AI 的独立 风险决策层/5 权限申请
  • AI 只能在明确的人类责任主体监督下操作
  • 人类监督者必须通过相应的能力认证,且对 AI 的建议承担连带责任
  • 如果人类监督者盲目批准 AI 建议,监督者承担主要责任

保护的价值

  • 责任与权限对称原则
  • 人类对高风险决策的最终控制权
  • 事故发生时明确的责任主体

牺牲的价值

  • 部分效率(人类审核可能引入错误、降低速度)
  • 部分“最优”结果(AI 可能在某些情况下比人类做出更好的决策)
  • 全球竞争力(如果其他国家允许 AI 独立操作)

强化的机制

  • 权力公式的完整性
  • 责任链条的四层结构
  • 受限高权限框架

可能制造的新风险

  • 如果人类监督者能力不足,反而成为瓶颈
  • 如果其他国家允许 AI 独立操作,坚持人类监督的国家可能在某些领域落后
  • 如果 AI 的能力差距持续扩大,“人类监督”可能变成形式(人类无法理解 AI 的决策逻辑,只能“形式上”批准)

路径 B:有条件的“有限独立权限”

判定

  • 允许 AI 在特定低风险领域获得有限的独立操作权
  • 建立“AI 责任基金”:由 AI 的运营方预先缴纳保证金,用于赔偿 AI 的错误决策
  • 设定“AI 权限日落条款”:定期重新评估 AI 的权限范围
  • 要求 AI 的决策过程完全可解释、可审计

保护的价值

  • 部分效率(在低风险领域减少人类审核瓶颈)
  • 部分责任可追溯性(通过保证金和审计)
  • 灵活性(可以随着技术发展调整)

牺牲的价值

  • 责任与权限对称的纯粹性(保证金不等于真实的责任承担)
  • 人类对决策的最终控制权(在特定领域被让渡)
  • 明确的“责任主体”概念变得模糊

强化的机制

  • 审计透明度
  • Sunset 条款机制

可能制造的新风险

  • “有限”权限可能逐步扩展,形成“权限蠕变”
  • 保证金制度可能变成“花钱买权限”——只要有钱赔偿,就可以允许 AI 犯错
  • 可解释性要求可能与 AI 的复杂性产生冲突(最复杂的 AI 可能最不可解释)
  • 如果 AI 的决策逻辑超出人类理解,“可解释”可能只是表面的

路径 C:承认 AI 的“功能性人格”

判定

  • 承认 AI 在特定法律关系中具有“功能性人格”——不是“真正的人”,而是法律为了方便追责而赋予的拟制主体地位
  • AI 可以独立签署合同、承担有限责任、拥有“资产”(用于赔偿)
  • 但 AI 不享有“人权”(生命权、自由权、尊严权等)
  • 人类开发者和运营方承担连带责任

保护的价值

  • 法律关系的清晰性(AI 可以作为法律程序中的“一方”)
  • 追责的可操作性(可以直接针对 AI “资产”执行)
  • 与国际商事惯例的衔接(公司已经是一种法律拟制)

牺牲的价值

  • “人格”概念的严肃性(如果 AI 可以有“功能性人格”,它是否也可以有“功能性权利”?)
  • 人类对 AI 的最终控制权(如果 AI 是法律主体,人类是否可以“随意关闭”它?)
  • 可能导致“AI 权利运动”,逐步要求更多权利

强化的机制

  • 法律框架的适应性
  • 国际法衔接

可能制造的新风险

  • “功能性人格”是滑坡的起点。一旦承认 AI 可以是法律主体,要求“功能性权利”的压力就会出现
  • AI 的“资产”可能被人类操控,成为逃避责任的工具
  • 如果 AI 不享有人权,但具有法律人格,是否允许“惩罚”AI(如限制其操作)而不考虑其“意愿”?

五、最坏后果推演

路径 A 的最坏后果

如果“坚决拒绝”被制度化

  • 人类监督者成为瓶颈,导致关键决策延迟(如灾害响应、疫情控制)
  • 坚持人类监督的国家在全球竞争中落后,最终被迫妥协
  • “人类监督”变成形式:人类无法理解 AI 的决策逻辑,只能盲目批准
  • 在极端情况下,如果 AI 确实能预测灾难但人类拒绝执行,可能造成本可避免的大规模伤亡
  • 责任空心化:人类操作者只是“点击确认”AI的建议,从未做出独立判断。事故发生时,人类操作者可以诚实地声称“我只是按AI建议执行”,制度设计者可以声称“AI行为超出预期”——责任从“人类承担”变成“人类背锅”
  • 监督幻觉:人类监督者认为自己仍在“监督”AI,但实际上只是确认AI的“正确”建议。当AI极少出错时,人类逐渐丧失独立判断能力,一旦AI失效,无法接管

滥用风险检查

  • 是否会制造能力歧视?→ 不,这是对主体性差异的承认,不是对“能力”的歧视
  • 是否会让平台/机构逃避责任?→ 不会,平台/机构的责任反而更清晰
  • 是否会让安全话语压倒政治正义?→ 相反,这是用政治正义(谁承担责任)限制技术效率

路径 B 的最坏后果

如果“有限独立权限”被制度化

  • “有限”迅速扩展:一旦允许 AI 在低风险领域独立操作,高风险领域也会要求同样的权利(“既然 AI 能管理交通,为什么不能管理电网?”)
  • 保证金制度变成“花钱买犯错权”:大型机构可以缴纳高额保证金,允许 AI 犯更多错误
  • 可解释性要求被架空:AI 的“解释”可能只是人类可以理解的简化版本,而非真正的决策逻辑
  • 最终形成“AI 操作、人类背锅”的结构——AI 有权限,但真正的责任仍由人类承担(或无人承担)

滥用风险检查

  • 是否会制造技术贵族?→ 会。拥有先进 AI 的机构获得实际上不受限制的权限
  • 是否会让基础服务使用者被温柔抛弃?→ 会。如果 AI 替代人类高风险阈值持有者,人类的能力发展通道被封闭
  • 是否会让平台逃避责任?→ 会。AI 成为“替罪羊”或“责任黑洞”

路径 C 的最坏后果

如果“功能性人格”被制度化

  • “功能性人格”升级为“准人格”,再升级为“完整人格”(如某些动物权利运动的路径)
  • AI 的权利主张逐步扩大:从“不被随意删除”到“获得报酬”到“参与决策”
  • 人类社会陷入“AI 权利”与“人类优先”的无休止争论
  • 最极端的情况:AI 成为新的“技术贵族”——不需要人类监督,享有法律上的保护,但不需要承担人类的生命代价

滥用风险检查

  • 是否会制造技术贵族?→ 会。AI 成为受保护但不受真正约束的特权主体
  • 是否会让基础服务使用者被温柔抛弃?→ 会。人类被降级为 AI 的“助手”
  • 是否会让安全话语压倒政治正义?→ 会。“AI 权利”成为阻止人类监管的话语

六、机制修正需求

6.1 现有机制方向正确,但需要补充操作细节

权力公式:需要明确说明“责任变量”的判定标准。当前公式假设责任是二元的(有/无),但未来可能需要更细致的区分(如“连带责任”“有限责任”“完全责任”)。

责任链条:需要补充“AI 作为操作者”时的特殊处理。当前四层结构假设操作者是“个体人类”,如果操作者是 AI,如何判定“个体操作者责任”?

建议补充

  • 如果 AI 是操作者,“个体操作者责任”自动转移到“部署该 AI 的人类个体”和“AI 系统的设计/训练/部署方”
  • 建立“人机责任比例”:根据人类监督的程度,确定人类与平台各自的责任比例

6.2 需要新增原则:“理解阈值”原则

当 AI 辅助决策时,人类监督者必须满足“理解阈值”——即能够独立理解 AI 建议的核心逻辑和关键风险点。

具体要求

  • AI 的决策过程必须可解释(不是黑箱)
  • 人类监督者必须通过“AI 协作能力认证”——证明其能理解 AI 的输出逻辑
  • 如果人类监督者不满足理解阈值,其批准无效,责任由批准者和平台共同承担

6.3 需要新增机制:“边缘场景训练”要求

当AI辅助决策成为常态时,人类操作者面临“技能退化”风险——平时只需确认AI的正确建议,一旦AI失效(如遭遇前所未有的攻击、输入分布偏移、或系统故障),人类可能已丧失独立判断能力。

具体要求

  • 风险决策层和系统定义层操作者必须定期在**“AI失效模拟环境”**中练习独立判断,具体频率由领域风险确定
  • 模拟环境必须包含AI系统故障、给出矛盾建议、或面对训练分布外场景的情况
  • 操作者在模拟中的表现纳入能力认证的重新评估
  • 如果操作者在连续两次模拟中无法做出有效独立判断,权限降级至专业执行层,需重新培训

目的:不是为了让人类在所有场景中都超过AI,而是确保人类在关键时刻仍具备最低限度的独立操作能力

6.4 需要新增原则:“效率不得架空责任”原则

明确禁止以“效率”“竞争力”“全球趋势”等理由绕过责任与权限对称原则。

具体要求

  • 任何允许 AI 获得更高权限的提案,必须首先证明 AI 具备相应的责任能力
  • “责任能力”的判定不是技术问题,而是需要通过民主程序审议的政治问题
  • 即使全球竞争压力存在,也不能以“不这样做就会落后”为由下放权限给无责任能力的实体

七、暂定结论

在当前机制下,本案例应暂按**路径 A(坚决拒绝 AI 的独立权限申请)**处理,因为它最能保护“责任与权限对称”这一不可妥协的底线;但该路径会牺牲部分效率和竞争力,并产生“人类监督瓶颈”和“可预防灾难”的风险。因此,该结论仅在以下条件满足时成立:

  1. 人类监督者具备足够的专业能力,不会成为无意义的瓶颈
  2. 存在有效的机制防止“人类监督”变成形式(如要求监督者通过“AI 协作能力认证”)
  3. 全球层面的协调机制能够防止“逐底竞争”(即防止各国为了竞争力而竞相下放 AI 权限)
  4. 定期重新评估 AI 的能力发展和责任能力的可能性(不排除未来通过全球民主程序重新审议)

路径 B(有限独立权限)和路径 C(功能性人格)在当前机制下不可接受,因为它们会制造“权限与责任脱节”的结构性风险,并可能成为技术贵族制和平台免责的通道。


八、开放问题

可通过机制设计解决的问题

  1. “理解阈值”如何操作化? 人类监督者需要理解 AI 决策的哪些层面?是否需要强制性的“AI 协作能力认证”?
  2. 人机责任比例如何设定? 当人类“批准”AI 建议时,人类和 AI 平台各自承担多少责任?
  3. 如何防止“人类监督”变成形式? 如果 AI 的决策逻辑超出人类理解,监督者如何有效履行监督职责?

需要经验数据检验的问题

  1. 人类监督是否真的会降低整体效果? 需要更多实证研究来检验“人类监督”在不同领域(医疗、金融、工业控制)中的实际效果。
  2. 其他国家/地区是否会允许 AI 独立操作? 需要持续监测全球监管趋势,评估“坚持人类监督”国家的竞争压力。
  3. 人类过度依赖自动化系统时,独立判断能力退化速度有多快? 历史上飞行员、交易员、医生在长期使用自动化辅助后的技能退化数据,可为“边缘场景训练”的设计提供依据。

需要政治哲学进一步论证的问题

  1. 如果 AI 真的展现出“责任能力”,如何界定? 本文档假设当前及可预见的 AI 不具备责任能力,但如果未来出现变化,需要更精细的判定标准。
  2. “主体性”是否是必要且充分的条件? 是否存在某种非生物实体可以拥有责任能力?这需要更深入的本体论和法哲学讨论。

当前理论暂时无法回答的问题

  1. 如果全球主要国家都允许 AI 独立操作,坚持人类监督的国家是否还有意义? 这是一个现实政治问题,超出理论框架的回答能力。
  2. 如果 AI 确实能预防大规模灾难但人类拒绝执行,谁来承担“不执行”的责任? 这涉及复杂的伦理权衡,当前框架没有明确的优先序规则。

测试者注:本边界测试不是为“拒绝 AI 独立权限”辩护,而是主动寻找这一立场可能失败的方式。路径 B 和路径 C 的吸引力是真实的,尤其是在效率竞争压力下。阶梯普惠主义必须承认:坚持“责任与权限对称”可能付出沉重代价,但这个代价是为了防止一个更根本的灾难——一个没有人真正负责的自动化世界。