AI 分级治理与普惠访问研究草案(迭代稿)

一、总纲

问题意识

人工智能正在改变社会成员获取能力、承担风险和参与公共生活的方式。一个核心张力正在浮现:如果 AI 能力完全按市场或权力逻辑分配,大多数人将被锁定在标准化、低质量的服务层,而高风险决策权则被少数机构垄断;但如果废除一切门槛、无差别开放高影响力权限,又可能将公共安全置于不可控的风险之中。

本文尝试提出的问题框架是:社会公平不必被理解为抹杀差异的绝对平均,而可以被理解为——在确保基础 AI 能力普惠可及的前提下,使高影响力、高风险的权力依据能力、专业素养、责任承担与审计约束分级开放

核心承诺

本文围绕四个基本承诺展开:

  1. 基础有保障:教育、医疗、法律救济、公共安全等基础 AI 服务应作为权利而非奖励向所有人开放,不设前置能力门槛。
  2. 发展有通道:愿意承担更大公共责任的人,可以通过公开透明的认证获得更高权限,但通道开放不是对所有人的竞争命令。
  3. 风险有约束:高权限必须与高责任、高审计、高透明度绑定,权限不是财产,不得继承,可降级可撤销。
  4. 跨国不封死:任何国家或地区都不应被永久锁定为低权限使用者,技术援助必须包含能力建设路径。

本文定位

本文是一份研究草案,不是最终方案。它承认以下不可消除的张力:任何分级体系都会在一定程度上复制既有不平等;任何能力考核都依赖不可控因素;任何制度设计都无法完美实现其目标。因此,本文不提供“保证”,只提供一组可讨论、可操作、可自我修正的制度原则框架。

本文采用双层结构:前半部分(核心原则)聚焦可操作的风险分级机制设计;后半部分(跨国公共性、社会契约、批判与反驳)聚焦正当性基础与自我检验。对政治哲学传统(罗尔斯、诺齐克、桑德尔、福柯、布迪厄、阿马蒂亚·森、法兰克福学派)的详细对话已归入 理论地基,供感兴趣的读者深入阅读。本文仅保留与核心原则直接相关的论证线索。

方法论立场:渐进修正与责任治理

本文采取审慎的渐进修正立场:承认现代社会中存在真实而深刻的权力不平等、资源垄断与制度性排斥,也承认 AI 时代可能进一步放大能力、权限与规则定义权的分配问题。但这些风险不应被简化为单一阵营叙事,也不能假定对既有制度作整体性否定就会自动导向更公正的安排。

凡是可以通过渐进改革、公共审计、责任链条、权利保障、制度申诉和透明治理加以修正的问题,应优先以这些方式处理。本文关注的目标不是制造新的敌人,而是减少支配、降低伤害、扩大人的真实能力,并让掌握更大权力者承担更大的公共责任。

正当性主体

这里的“全人类”是正当性主体,意味着 AI 时代的基础红利不应被民族国家、资本平台或技术共同体独占;任何处于一国管辖范围内的个人——无论其是否持有该国公民身份——都应被纳入基础普惠层和人权保障通道的覆盖范围。

“公民”仍可作为具体制度执行中的法律身份,用于高权限认证、税务关联和审计责任追溯。民族国家不是正义的最终边界,而是跨国 AI 治理中的执行单元、地方自治单元与责任承接单元。当国家法律将某些人排除在基础保障之外时,全球治理机制和跨国申诉渠道应提供兜底保护。


二、核心原则

2.1 基础设施普惠化

AI 作为新时代的水电煤,必须在教育、医疗、信息获取、公共服务与日常生产力领域实现无差别普惠。技术进步的果实应当首先转化为全体社会成员的生活底线提升,确保未掌握高级技能者不因时代跃迁而被抛离,反而获得更坚实的生存与发展基座。

这一原则的理论根基在于:在 AI 时代,“获取 AI 基础设施”是一种基本善(primary goods)的重新配置。罗尔斯论证了理性的个人无论追求何种生活计划都需要基本善——基本自由、机会、收入与财富、自尊的基础。在 AI 时代,这些手段需要更新:如果一个人在教育、医疗、信息获取领域被系统性排除在 AI 基础设施之外,他几乎无法有效参与现代社会。

但关键区别:罗尔斯要求“保证”基本善,本文只讨论“尽力保障”的制度含义。这个“尽力”不是修辞上的谦虚,而是制度工程学上的诚实——现代管理系统无法做到真正的“保证”,只能追求渐进改善。

这里需要区分两类承诺:基础服务覆盖、质量追赶和能力建设属于渐进实现义务,制度必须持续投入、公开差距并接受审查;生命、健康、人身安全、基本法律救济和知情权属于不可让渡底线,不能以资源不足、效率优化或风险阈值差异为由主动取消。“尽力保障”限制的是制度对完美结果的承诺,不削弱这些最低权利的强制性。

因此,基础设施普惠化不是一句口号,而是一组硬性约束:

  • 基础普惠层是权利,不是奖励。任何公民默认享有教育、医疗、法律援助、公共服务和信息获取的基础 AI 工具,无需前置认证。
  • 安全封装不等于低质量封装。“安全封装”指将复杂 AI 系统的能力限制在预设的安全边界内,使普通用户无需理解底层技术即可获得服务。基础普惠层的服务必须经过质量检验,不能因“面向大众”就降低安全标准。
  • 知情权是不可剥夺的。基础服务使用者公民有权知晓自身风险阈值位置、高风险阈值持有者功能、限制理由及能力发展路径。没有知情权,“便利”只是麻痹。

2.2 执行权限风险分级

越接近金融决策、生命健康、法律裁判、工业控制、物理机器人、关键基础设施与公共安全领域,越必须建立不可逾越的能力边界与资质门槛。高权限不是天赋人权,而是经专业训练、通过考核认证、接受行为审计并承担明确法律与伦理责任后方能解锁的社会信托。

风险分级权限模型不是能力等级表,而是风险治理表。风险阈值越高,意味着可触及的系统风险越大,因此责任、审计、重新认证和反哺义务必须同步提高。本文关注的核心风险之一,就是“权限提升、责任滞后”的结构。

风险分级权限模型的核心规则

  • 领域分离:权限按领域授予。医疗风险决策层 不自动等于金融风险决策层,网络安全系统定义层 不自动等于法律 AI 系统定义层。同一个人可在不同领域拥有不同 风险阈值。
  • 最小必要权限:任何任务只授予完成该任务所需的最低权限。不得为了便利授予泛化高风险权限。
  • 权限可降级:任何风险阈值位置都必须接受重新认证、审计和降级。权限不是财产,而是社会信托。定期重新认证确保能力维持、责任履行和审计合规。
  • 高权限不得继承:权限不得因家庭、机构、学历、财富或既有身份自动传递。任何继承性通道都构成固化风险。
  • 低权限有知情权:基础服务使用者有权知道自己被限制的功能、限制理由、能力发展路径和申诉方式。

未成年人与责任能力受限者的特殊处理:未成年人即使技术能力达标,也不得获得完全独立的 风险决策层及以上权限。可在严格条件下获得“受限高权限”:必须在成年高权限监督者共同确认下执行真实操作,操作范围限于已认证的具体任务,机构和平台承担更高管理责任。

2.3 反对双重极端

本文关注两类相反但同样危险的机制风险:一类是少数机构以知识产权、资本壁垒或安全话语垄断 AI 核心能力,制造新的阶层固化;另一类是将危险权力以“平等”之名无差别下放给缺乏判断力与责任能力的个体,以抽象开放叙事置换现实安全。

防止能力定义权过度集中和基础服务使用者安全保护不是非此即彼。真正的危险来自两端:一端是少数平台、机构或专家共同体以“能力”和“安全”为名垄断核心权力,将社会锁定为少数人的游戏;另一端是以“平等”和“权利”为名废除一切门槛,将高风险决策外包给无责任能力的主体。

本文的工作假设是:高风险权限应当开放,但开放必须有约束;基础服务必须保护,但保护不能变成抛弃。

2.4 能力多元性原则

风险分级权限模型的考核标准应至少包含三个独立的能力维度(技术能力、社会协调能力、伦理判断能力),任何单一维度都不得在实质上支配整体评估。任何单一群体不得垄断能力标准的制定。基础服务使用者不是“能力不足者”,而是“能力领域不同者”。本文明确拒绝“高权限 = 高能力,低权限 = 低能力”的隐含等式。

能力认证的核心设计

三维度考核

  • 技术能力:理解、操作、评估特定 AI 系统的能力。考核形式包括情境模拟测试、故障排查测试、技术方案评审。关键设计:允许使用参考手册和工具,模拟真实工作场景,不测试死记硬背。
  • 社会协调能力:在多元利益相关者环境中协调冲突、沟通信息、维系合作的能力。考核形式包括角色扮演协商、跨文化沟通测试、团队协作任务。关键设计:场景不预设“正确答案”,允许不同风格的协商策略。
  • 伦理判断能力:在技术决策中识别伦理张力、权衡多元价值、做出负责任判断的能力。考核形式包括伦理困境案例分析、伦理委员会模拟、价值冲突日志。关键设计:不要求“正确答案”,要求决策过程的透明性和可辩护性

平行认证路径: 标准化考核偏向特定的认知类型和文化背景。为确保不同背景的人可以用自己的优势路径获得同等权限,提供三种平行路径:

  • 标准化考核路径(默认):适合受过正规教育、擅长考试的人。
  • 实践展示路径(替代):候选人提交真实工作场景中的工作样本(portfolio),由三主体联合评审团评估。
  • 师徒传承路径(替代,仅适用于特定领域):由两名已获得该风险阈值位置权限的资深从业者联合推荐,推荐人承担连带责任。

所有路径的获得者必须在监督下度过试用期,并在合理周期后接受统一的实操评估。如果评估不通过,权限降级或撤销。

等级制而非通过/不通过: 不是简单的“通过”或“不通过”,而是等级评定(A/B/C/D)。A 级获得最高权限,B 级获得标准权限,C 级获得受限权限(需在监督下操作),D 级未通过。

认知偏见的持续监测: 建立能力认证偏见监测系统,追踪不同人群(性别、地域、教育背景、母语、年龄)的通过率差异、考核形式偏好、平行路径分布和申诉中的偏见指控。偏见审查会和公开报告必须定期举行,具体周期由领域风险和数据更新频率确定。

理论地基的支撑与修正: 能力多元性原则得到了四篇新增理论地基的直接支撑与修正。福柯揭示了"能力"本身即是规训权力的产物——三维度考核预设了一种理性、系统化、可评估的主体理想,那些不符合这种理想的人会被系统性排除。因此,能力维度必须保持开放性,公民有权质疑"某项能力为何被纳入考核"。布迪厄暴露了文化资本如何通过看似公平的标准复制阶层结构——三维度考核若都偏向"中产阶级惯习",则只是扩展了文化资本的兑换范围。因此,评审团必须阶层多元化,考核形式必须惯习敏感,通过率差异必须被追问是能力差异还是阶层偏见。阿马蒂亚·森区分了"功能运作"(已实现的功能)与"能力集"(可实现功能的能力)——考核测量的是前者而非后者,因此情境模拟测试和试用期评估尤为重要;同时,森揭示了"适应性偏好"的危险——长期处于低权限处境的人可能内化"我不配"的信念,因此制度必须主动外展而非仅仅等待申请者。

2.5 分级定义权的多方参与制度约束

任何风险分级权限模型的考核标准、认证规则、审计流程,都应由至少三个相互独立的制定主体共同设计。定义者必须接受定期独立审计,任期有明确上限,不得长期连任。当某一风险阈值位置的固化率超过预设阈值时,该位置的考核标准必须自动冻结并接受多方参与的制度审议,使用基础普惠层服务的代表必须拥有实质性参与权。

三主体设计

  • 主体 A:技术专家委员会——提供技术可行性评估、安全标准建议、前沿风险分析。
  • 主体 B:利益相关方代表委员会——代表不同风险阈值群体的利益,确保标准制定不被技术精英垄断。必须包含一定比例的使用基础普惠层服务的代表。
  • 主体 C:伦理审查与外部监督委员会——审查标准制定过程的程序正义性、利益冲突、文化偏见。

定义权的核心约束

  • 广泛共识原则:任何标准必须获得三主体的广泛共识支持,具体决策程序由领域风险和代表结构确定。
  • 冷却期:标准制定后必须经过合理期限的公共评论期,才能生效。
  • 异议机制:任何受影响者有权对标准提出异议,异议必须被记录、回应和审议。
  • 自动冻结:当某一风险阈值位置的固化率(某一群体的占比)超过阈值时,该风险阈值位置的考核标准自动冻结,进入多方参与的制度审议程序。

申诉机制: 区分“异议”(针对规则本身)和“申诉”(针对个案决定):

  • 异议:针对考核标准、认证规则、安全封装规则的合理性。任何公民有权提出异议,无需证明自己受损。
  • 申诉:针对个案决定(认证未通过、权限降级、责任判定等)。统一的申诉入口,包含能力认证申诉、权限降级申诉、责任判定申诉、审计结果申诉、服务质量申诉。

2.6 基础服务使用者质量标准承诺

基础普惠层的 AI 服务在关键指标上不得低于高风险阈值持有者在同等场景下性能标准的质量底线。该底线是最低报警线,不是长期正义线;具体数值由领域和时代条件确定,必须接受定期审查,并在发现系统性伤害时提高保护要求。基础服务使用者长期获得安全、可用、合规但滞后的服务,也可能构成慢性低配。("慢性低配"指:基础普惠层服务虽满足最低安全标准,但在模型版本、解释深度、响应速度、功能自由度等方面长期显著落后于高权限层级,导致使用者被稳定地落后化。)基础服务使用者公民享有不可剥夺的知情权,有权知晓自身所处风险阈值位置、高风险阈值持有者功能、限制理由及能力发展路径。高风险阈值持有者的系统性优势必须通过再分配机制反哺基础普惠层,反哺不仅包括补偿性服务提升,也包括追赶性能力建设。

质量底线的功能:把“温柔的抛弃”变成可见问题。如果低权限医疗诊断明显更差、低权限法律援助缺少关键步骤、低权限教育 AI 长期使用旧模型——制度至少必须承认差距存在。但质量底线不是正义充分线,如果某项服务长期只维持在底线附近,必须启动质量追赶、原因解释和反哺投入。

慢性低配风险: 基础服务使用者长期获得安全、可用、合规但滞后的 AI 服务,高风险阈值持有者持续获得更强模型、更深解释、更快反馈。基础服务使用者没有被抛弃,却被稳定地落后化。质量底线必须绑定动态差距监测:比较解释深度、更新速度、工具自由度、个性化水平和公共训练机会;监测基础服务使用者与高风险阈值持有者的差距是否连续扩大;评估基础服务使用者是否借助服务获得能力增长和治理参与。

溢出反哺机制("反哺"指:高权限持有者将其系统性优势的一部分通过再分配回流至基础普惠层,包括提升基础层服务质量和将成熟能力下放给基础层): 高风险阈值持有者获得的系统性优势(更大的系统自由度、更高的决策影响力、更多的信息获取权)不是纯粹“个人努力”的结果,而是内嵌了社会提供的多层基础设施。社会有权要求一部分收益回流。

反哺至少应区分两种类型:

  • 补偿性反哺:提升基础普惠层服务质量、提供费用补贴、改善弱势地区算力和模型接入。防止基础服务使用者跌破基本保障线。
  • 追赶性反哺:将成熟、稳定、可审计的高权限能力转化为基础普惠能力;建立低风险公共训练环境;缩短高权限能力成熟后向基础普惠层下放的周期。让基础服务使用者获得更强的行动能力、理解能力和公共参与能力。

反哺资金中必须有稳定部分用于追赶性反哺,具体比例由领域条件、差距规模和基础服务使用者代表参与决定。如果基础服务使用者与高风险阈值持有者的动态差距连续扩大,该比例应自动上调。

2.7 话语透明性与公共政策维度

本文承认分级体系不只是技术治理方案,也包含公共政策与价值权衡。任何技术标准必须公开其对应的权衡,不允许用“技术优化”替代“公共讨论”。对本框架的批评不必附带替代方案即可成立。

“风险分级”描述的是现实社会中已经存在的资源、能力与权力差异,而不是人的价值等级。本文关注低资源者获得更强行动能力的制度条件,但拒绝把低资源处境归因于个人不够优秀;能力发展通道只能表示高风险权限和公共能力的可进入性,不能被解释为唯一正当的人生方向。

话语透明性的具体要求

  • 每一个“技术标准”背后对应的公共权衡必须公开。例如,“安全封装”的设计不能只论证“这更安全”,还必须说明“这牺牲了哪些公民权利”“这些牺牲是否经过多方参与的制度审议”“谁有权决定这种牺牲是可接受的”。
  • 分级体系必须被承认包含公共政策选择,不能用“技术优化”替代“公共讨论”。
  • 批评者有权说“这个分级体系不公平”,而不必同时说“如果不这样分级,应该如何分级”。要求批评者提出替代方案,是技术治理话语消解批判的惯用策略。
  • “风险分级”不是唯一隐喻,必须预留空间,承认未来可能出现更优的社会组织隐喻(如“网络”“生态”“协作 Commons”)。

法兰克福学派的批判支撑法兰克福学派揭示了技术治理话语如何成为一种新的统治形式——"安全"替换"正义","效率"替换"公平","能力"替换"权力"。话语透明性原则是对这种批判的直接回应:不是放弃技术治理词汇,而是在使用这些词汇时同时暴露它们遮蔽的东西。但法兰克福学派的终极挑战是:一旦制度使用技术治理的话语,它就已经内化了技术理性的逻辑。抵抗只能在话语内部进行,而不能完全跳出话语。这是本文必须诚实面对的困境——它用技术理性的工具来对抗技术理性的后果。

2.8 跨国公平、地方自治与能力访问不平等

AI 时代的基础技术红利不应被任何国家、平台或技术集团永久占有。任何地方共同体享有必要的技术自治权,包括可审计权、本地化部署权、基础能力建设权,以及在不制造全球不平等的前提下设定本地安全标准的权利。

技术自治权不是封闭权。民族国家不得以“国家安全”、“文明差异”或“技术主权”为名,将关键 AI 能力永久封锁,或将低资源地区锁定在只能调用封装接口、不能理解系统逻辑、不能参与标准制定的依赖位置。高权限国家、平台和机构的技术输出应附带实质性技术转移义务。跨国 AI 治理标准应由多边机制制定,低资源地区应拥有实质性参与权、阻滞权和申诉权。跨国治理框架必须承认当前能力分布的历史成因,并通过算力共享、数据 Commons、开放架构、研发资金转移和人才培养机制矫正历史不平等。

全球维度的核心原则

  • 基础普惠层的正当性主体是所有人。基础 AI 服务、人权保障通道和必要信息可及性不应取决于国籍、地区财富或平台会员身份。
  • 跨国权限不自动等价。一国医疗 AI 风险决策层 不自动等于另一国医疗 AI 风险决策层;跨国权限需要额外接受本地法律、文化风险、语言环境和公共责任审查。
  • 全球系统定义层必须受到更强约束。("全球系统定义层"指:参与制定全球通用 AI 模型标准、跨国审计规则、基础模型开放等级和算力分配规则的最高治理层级,其决策影响所有国家和地区的 AI 能力安排。)参与该层级制定的主体,必须接受多边审计、利益冲突披露和低资源地区的实质性阻滞。
  • 国家或地区不得被永久标记为低权限主体。低资源地区可以在特定高风险技术上暂时缺乏操作能力,但制度必须提供能力建设、技术转移和本地化部署路径。没有能力发展路径的封装不是安全,而是跨国能力访问不平等的固化。
  • 地方自治不得成为封锁权。国家或地区可以根据本地风险调整部署方式,但不能以安全为名阻止基础能力扩散,或禁止其他地区获得审计、训练和替代能力。

全球治理的过渡性正当性: 全球层面不存在真正的“代表”结构。将合法性来源从“代表”转向“被约束”——全球治理机构的权力来自其自身受到的约束强度。约束越强,该机构越有权行动;约束越弱,其行动越应被质疑。

具体机制包括:

  • 实质性阻滞权:低资源地区对全球标准拥有实质性否决或暂停权。
  • 审计链公开:任何全球决策必须有公开理由和可追溯的审计记录。
  • Sunset 条款:全球系统定义层标准机构定期自动触发重新评估。
  • 退出权:任何参与方有权退出,但退出必须公开说明理由并接受审计。

法兰克福学派的生活世界殖民化警示法兰克福学派的哈贝马斯提出了"生活世界的殖民化"概念——当系统(官僚体系、市场、技术治理)不断侵入生活世界(家庭、社区、文化),将人际关系还原为系统逻辑时,就发生了殖民化。在 AI 全球治理中,这意味着:跨国平台、全球审计机构和多边治理机制可能以"能力建设"和"技术转移"为名,将本地医生与患者之间的信任关系、本地社区的文化传统和伦理共识、本地民主审议替换为算法诊断、全球"安全标准"和技术专家的设计。本文的地方自治权(可审计权、本地化部署权、基础能力建设权)正是对这种殖民化的抵抗——技术援助不能只是"给你用",而必须包含"让你有能力理解、审计、修改和替代"的路径。

2.9 人权保障通道:生死场景中的非分级底线

人权保障不是分级体系的内部原则,而是分级体系得以建立的前置条件。 如果一种分级体系在生死场景中系统性置人于死地,它就不具备正当性,无论其效率论证多么充分。

在涉及生命、健康、人身安全与基本法律救济的不可逆损害场景中,核心服务质量不得因风险阈值而存在差异。此类场景中的 AI 辅助服务适用人权保障通道

  • 自动激活:任何人自动接入最高标准的核心 AI 辅助,不经过常规 风险阈值 认证流程。
  • 公共承担:费用由公共基金支出,不从个人风险阈值追溯。
  • 核心等同:诊断结论、治疗方案、法律策略、安全指令等直接影响结果的关键判断必须同等。解释形式、界面适配等周边表达可以差异化,但不得影响核心判断的准确性。
  • 资源诚实:人权保障通道提供的是底线保障,不是无限资源。公共预算约束可能导致某些高成本投入存在上限,但这个上限必须是公共预算约束,不能是风险阈值歧视。制度必须公开承认这一限制,并通过反哺机制持续缩小差距。在任何情况下,资源不足不能成为降低核心服务标准的正当理由——标准不可妥协,不足只能通过扩大公共投入来解决。
  • 严格限定:人权保障通道仅适用于每个人都会面对的共性生存问题(急诊医疗、重大疾病诊断、人身安全预警、灾害响应、刑事法律援助等)。个人选择(如择期手术、美容医疗、商业法律咨询)不得进入该通道。

质量底线仅适用于非不可逆的基础发展场景与日常服务配置。它不能被援引为在生死场景中制造差异的理由。


核心原则概念溯源表

原则核心张力哲学对话机制展开批判检验状态
2.1 基础设施普惠化技术红利普惠共享 vs 资源有限性与效率约束罗尔斯(基本善/底层优先);阿马蒂亚·森(适应性偏好/能力集)权限阶梯 §基础普惠层基础服务使用者质量底线安全封装层批判(安全封装风险)已确立
2.2 执行权限风险分级高风险权限需专业资质 vs 开放通道防垄断诺齐克(社会信托/资格边界)风险分级权限模型能力认证责任链条能力歧视批判(权限差异外溢为身份等级)已确立
2.4 能力多元性标准化考核 vs 多元认知类型排斥桑德尔(善观念预设);福柯(规训权力);布迪厄(文化资本/区隔);阿马蒂亚·森(功能运作 vs 能力集)能力认证(三维度、平行路径、偏见监测)能力歧视批判(单一能力垄断)待夯实
2.5 分级定义权的多方参与制度约束专家知识必要性 vs 民主参与防垄断诺齐克(定义权即权力);福柯(正常化与权力生产)风险分级权限模型阈值设定原则自我否定条款(定义权贵族化)待夯实
2.6 基础服务使用者质量标准质量底线防抛弃 vs 慢性低配风险罗尔斯(强保障 vs 最大化);布迪厄(象征暴力)基础服务使用者质量底线基础服务使用者长期劣化(慢性低配)待夯实
2.7 话语透明性技术治理效率 vs 政治维度遮蔽桑德尔(技术中立话语批判);法兰克福学派(技术理性批判)审计透明度自我否定条款(技术话语遮蔽政治)已确立
2.8 跨国公平、地方自治与能力访问不平等全球技术扩散 vs 地方自治/反殖民法兰克福学派(生活世界殖民化);自我否定条款(跨国能力访问不平等批判)风险分级权限模型 §全球维度审计透明度 §跨国审计技术贵族批判国际技术霸权前沿探索
2.9 人权保障通道效率分级 vs 生死场景人权底线罗尔斯(底层优先/基本善)基础服务使用者质量底线 §人权保障通道医疗责任切割(生死场景中同等保护)已确立

阅读指引:哲学对话回答"为什么可辩护";机制设计回答"如何实现";批判检验回答"在哪里最可能失败"。三者必须交叉阅读,任何一层都不能单独提供充分辩护。

附录:理论地基与核心原则的交叉参照

理论层次对话者核心命题在研究草案中的位置引入的修正/张力
分配正义传统罗尔斯基本善;底层优先;差别原则2.1、2.6、2.9从"保证"修正为"尽力保障"
分配正义传统诺齐克社会信托;资格边界;定义权即权力2.2、2.5资格边界修正底层优先
分配正义传统桑德尔无负担自我批判;善观念预设2.4、2.7拒绝能力=价值的隐含等式
能力批判审视福柯规训权力;正常化;能力作为意识形态伪装2.4、2.5能力维度必须保持开放性;公民有权质疑标准
能力批判审视布迪厄文化资本;区隔;阶层再生产2.4、2.6评审团阶层多元化;考核形式惯习敏感
能力批判审视阿马蒂亚·森功能运作 vs 能力集;适应性偏好2.1、2.4情境模拟测试;试用期评估;主动外展
话语与理性批判法兰克福学派技术理性批判;生活世界殖民化;效率意识形态2.7、2.8话语透明性原则的直接来源;地方自治权抵抗殖民化

三、跨国公共性转向

技术进步并不天然通向更幸福的社会。技术只能扩大人类能力,却不能自动决定这种能力被用于解放还是控制、用于合作还是对抗、用于降低匮乏还是制造新的匮乏感。

因此,本文不把研究对象限定为单一国家内部的分配正义,而把 AI 时代全人类的共同处境作为正当性基础。真正需要追问的不是某个国家、制度或阵营是否最终胜利,而是:为什么人类已经拥有如此多知识、技术和生产力,却仍然无法稳定走向一个更少恐惧、更少羞辱、更少互害的社会?

竞争叙事最危险之处在于征用人类真实的恐惧。失业、落后、资源不足和未来不确定性是真实痛苦,但它们常被压缩成敌我故事:痛苦来自外部敌人,牺牲是历史必需,服从是安全前提。于是,本应被理解和解决的痛苦,被转译成继续制造痛苦的理由。

跨国公共性转向不意味着建立一个抹平差异的全球中心。相反,它要求区分三层秩序:

  1. 全人类是正当性主体:任何基础 AI 能力安排都必须能向每一个人说明其正当性,而不能只向本国公民、资本股东或技术共同体负责。
  2. 民族国家是执行单元:公共财政、司法救济、审计责任和地方风险判断仍需要通过现实政治共同体承接,但这些共同体不能把自身利益伪装成正义边界。
  3. 地方自治是有限权利:地方共同体可以调整部署方式、语言接口、文化适配和安全细则,但不能以自治之名制造全球技术封锁、永久依赖或跨国能力访问不平等。

技术具有开放倾向:代码可复制,模型可迁移,知识可扩散。但开放倾向不是解放承诺。没有制度约束,开放也可能被重新封闭为知识产权壁垒、平台垄断、国家安全禁令和阵营竞赛。本文提出的跨国公共性视角需要同时坚持两点:承认技术扩散的现实可能性,并警惕恐惧政治对这种可能性的封闭。

文明真正值得追求的,不是某个阵营在角斗场中获胜,而是让角斗场不再成为人类想象未来的唯一形式。


四、社会契约

在本文讨论的普惠访问框架下,每一个人都应享有不可剥夺的基础保障权:不学习、不深入技术细节的人,依然有权在安全封装的标准化接口中享受 AI 带来的便利与尊严,并且不因此被视为失败者、不完整公民或全球技术秩序中的低等成员。

这一承诺不是家长式的“我们保护他们”,而是承认:技术的复杂性不应成为排斥的理由。如果一个人因为不愿意或不能够掌握 AI 系统的底层逻辑,就被剥夺了基本服务、尊严和社会参与权,那么技术本身就是不正义的。

与此同时,社会需要保持能力发展通道的开放:愿意投入学习、理解系统逻辑、主动承担公共责任的人,有权依其风险阈值位置获得更高的系统自由度、创造力空间与社会行动能力。但能力发展通道的开放不是对所有人的竞争命令,而是对既有封闭权限结构的公共化改造。不是每个人都必须进入更高风险位置,但高风险权限应对每一个愿意承担相应责任的人开放。

社会契约的核心条款

  1. 基础保障不可剥夺:无论能力、意愿、背景如何,每个人都享有基础 AI 服务、人权保障通道和必要信息可及性。
  2. 能力发展通道真正开放:认证标准公开透明,平行路径为不同背景的人提供替代通道,偏见监测系统确保该通道不被特定群体垄断。
  3. 知情权的对等性:基础服务使用者不仅有权知道自己被限制了什么,还有权知道限制的理由、高风险阈值持有者拥有什么、以及如何申请升级。
  4. 失败不被污名化:未通过认证或选择不申请升级的人,不会被标签化为“能力不足者”“懒惰者”或“失败者”。
  5. 权限与责任对称:获得更高权限的人必须承担更高责任,接受更严格的审计,并将系统性优势的一部分反哺基础普惠层。

在全球层面,这一契约还意味着:任何国家、地区或共同体都不应被永久锁定为低权限使用者。技术援助不能只是“给你用”,而必须包含“让你有能力理解、审计、修改和替代”的路径。


五、权力约束框架

任何风险阈值位置的权限解锁,都应以对应位置的责任链条为抵押;任何高权限行为,都应留痕、可审计、可追溯、可问责。控制权的获得与维持同时取决于四个相互强化的约束条件:

权力约束框架的四重条件

  1. 能力条件:操作者必须具备与风险层级相匹配的技术能力、社会协调能力和伦理判断能力。能力缺失时,不得授予相应权限。

  2. 责任条件:权限必须与可明确追溯的责任主体绑定。责任链条断裂时,权限应当冻结或降级。权限不是天赋,而是可撤回的社会信托。

  3. 审计透明条件:任何高权限行为必须留痕、可审计、可追溯。审计机制缺位时,即使能力和责任都具备,该权限的正当性也存疑。

  4. 定义权约束条件:分级的定义权(考核标准、风险阈值、认证规则)必须受到多方约束。当定义权被单一机构垄断、异议通过率长期过低、或固化率超过阈值时,整个分级体系的正当性受损,所有层级的控制权上限都应被压缩。这不是惩罚个体,而是惩罚结构性的权力垄断

说明:此前版本曾尝试用乘法公式表达上述关系,但四个变量并非同质量纲,无法自然映射到实数域;“多方约束系数”的测量方式也缺乏操作化定义。因此本版将公式降级为定性约束框架——它指明的是必要条件关系,而非数值运算关系。


六、暂定愿景

本文暂时追求的社会图景是:基础有保障,发展有通道,高风险有约束,跨国不封死。 让技术尽可能托举更多人,而非割裂社会、国家与文明。


七、已回应问题与当前薄弱点

本节不把“已有回应”写成“已经解决”。它只做状态区分:哪些问题已经获得初步结构,哪些问题仍是本文的真实薄弱点,哪些问题已经转入条件性观察。本文的成熟度不取决于是否消灭漏洞,而取决于能否准确暴露漏洞并把它们接入后续讨论。

7.1 已形成初步回应,但仍未封闭的问题

问题一:理论根基悬空。 早期草案曾被质疑只是在反对粗糙的结果平等,而没有说明自身与罗尔斯、诺齐克、桑德尔等理论传统的关系。当前回应已进入 理论地基罗尔斯篇确立底层优先与基本善框架的继承关系,诺齐克篇处理资格、财产权与社会信托的张力,桑德尔篇处理能力测量与风险分级隐喻的善观念预设,福柯布迪厄阿马蒂亚·森法兰克福学派则补入规训、文化资本、能力集与技术理性的批判维度。

剩余风险:这些理论资源并不天然兼容。罗尔斯要求底层优先,诺齐克要求资格边界,桑德尔提醒共同体善观念,福柯和布迪厄怀疑能力标准本身,森要求区分真实能力与适应性偏好,法兰克福学派警惕技术理性吞没公共判断。本文不能把这种张力包装成综合理论的胜利,只能把它作为持续检验机制设计的规范压力。

问题二:机制复杂度与现实成本。 三主体、平行认证、交叉审计、责任链条和多层申诉在理论上能抑制权力固化,但在现实中可能因人力、时间、财政和协调成本过高而流于形式。

当前回应:机制设计文档已压缩为原则框架,删除作为硬性结论的具体数字,避免把未经验证的阈值伪装成制度答案。具体实施方案需根据领域风险、资源条件和时代技术水平操作化。

剩余风险:成本问题不能只交给“未来执行”。如果认证、申诉和审计本身变成高门槛,基础服务使用者、小机构和低资源地区会被排斥在纠错机制之外,分级体系就会以程序正义之名复制排斥。

问题三:安全封装层是否成为温柔的抛弃。 当前回应已写入核心原则 2.6,并由 基础服务使用者质量底线 展开。基础服务使用者不得被理解为低价值人群,基础普惠层必须有质量底线、知情权和反哺机制。

剩余风险:质量底线只能是最低报警线,不能被解释为正义充分线。尤其在医疗、法律救济、公共安全等不可逆损害场景中,质量底线必须让位于人权保障通道;在日常服务场景中,长期安全但滞后的服务也可能制造慢性低配。

问题四:缺少机制风险画像与自我批判。 当前回应已进入 批判与反驳自我否定条款能力歧视批判安全封装层批判技术贵族批判。这些文档从能力测量、分级定义权、安全封装、技术中立话语、跨国能力访问不平等五个方向推导本框架自身可能失败的方式。

剩余风险:崩溃指标已经出现,但阈值设定原则仍不够统一。不同风险不能机械共用同一数字,也不能完全交给专家自由裁量;需要说明哪些阈值来自权利底线,哪些来自统计异常,哪些来自公共程序。

7.2 当前真实薄弱点

薄弱点一:理论资源与机制条款之间仍有断裂。 目前的理论地基已经能说明“为什么要警惕能力标准、技术治理和定义权”,但还没有充分说明每一项批判如何改变具体制度。例如,规训批判应如何改变重新认证周期,文化资本批判应如何改变评审团组成,能力集理论应如何改变主动外展义务,技术理性批判应如何限制审计语言本身。这些连接如果不压实,理论地基就会停留在装饰性引用。

薄弱点二:边界测试尚未反向改写主张。 国际技术霸权、基础服务使用者长期劣化、医疗责任切割等案例已经提出,但它们更多是在验证既有原则,而不是迫使原则改写。真正有效的边界测试必须允许出现三种结果:保留原则、收窄原则、承认原则失败。否则边界测试会退化为辩护附录。

薄弱点三:跨国维度的强制力与合法性仍未闭合。 跨国公共性转向已经写入原则,但跨国治理机构凭什么约束国家、平台和高权限技术共同体,低资源地区的阻滞权如何避免被象征化,技术转移义务如何避免变成新形式的依赖管理,仍缺乏足够清晰的制度闭环。

薄弱点四:基础服务使用者的主体性仍不够强。 本文反复强调基础普惠层不是低价值层,但现有机制仍主要把基础服务使用者写成被保护者、被反哺者和申诉者。下一步必须补强其定义参与权、评估权、暂停权和知识生产权,否则“普惠”仍可能保留家长制结构。

薄弱点五:实施顺序仍不清楚。 当前文本同时提出基础普惠、风险分级、能力认证、审计透明、反哺机制、人权保障通道和跨国技术转移,但没有明确哪些是前置条件,哪些可以试点,哪些必须等到公共财政、审计能力或跨国程序成熟后才能启动。没有实施顺序,框架容易显得完整却不可执行。

7.3 已转入条件性观察的问题

AI 主体性不再列为当前未处理薄弱点。 当前回应已进入 AI主体性与责任能力AI主体性:基于生成式 LLM 的十种不可能能力(主观体验、生命处境、责任能力、价值信念、主体意志、现实在场、人格连续性、创造冲动、道德痛感、具体之爱),推导出 AI 不能成为独立的权限主体或责任主体。AI 的责任条件为零,因此其独立控制权在正当性上无法成立。在可预见的未来,AI 只能在明确的人类责任主体监督下以“受限高权限”形式操作。

条件性风险:如果未来 AI 展现出可被公共程序承认的责任能力,现有结论必须重开。但这不是单纯技术判定问题,而是根本制度问题:谁有权承认责任主体,谁承担误判后果,谁能代表被影响者同意权限下放。在这些问题解决前,本文暂时采取的审慎立场是:宁可承受一定效率损失,也不能把不可追责的系统提升为独立控制主体。


开放说明:本文是一份面向公共讨论的问题框架,不主张已经给出最终答案。欢迎围绕基础 AI 服务的普惠边界、高风险权限的责任约束、能力认证的偏见风险、跨国技术不平等以及制度失败条件继续提出反例和修正意见。