开放期刊系统

前景理论视域下 AI 时代算法威慑与人机博弈

雷 黄(山东青州高新技术研究所,中国)
喆 崔(山东青州高新技术研究所,中国)
浩 贺(山东青州高新技术研究所,中国)
睿 宋(山东青州高新技术研究所,中国)
林栋 余(山东青州高新技术研究所,中国)

摘要

针对传统威慑理论的“理性行为体假设”在AI治理中的失效问题,本文基于前景理论构建人机动态博弈模型,提出认知适配威慑框架。核心贡献包括:(1)设计双模态威慑机制,通过参考点锚定与概率权重修正解决非理性决策偏差;(2)建立人类前景效用函数(损失厌恶系数λ=2.18)与AI深度策略梯度模型(DDPG),实现概率纠偏与损失自适应放大;(3)混合实验显示:适配信号使违规抑制率提升32%(OR=0.68),动态策略使合规率提高13%(p<0.01),策略方差缩减42%(F=9.37)。结果表明,算法威慑需融合行为参数(概率扭曲δ=0.76)而非依赖技术优势。研究为AI治理提供基于“心理适配性”的理论框架。

关键词

算法威慑;前景理论;人机博弈;认知适配;损失厌恶

全文:

PDF

参考

Crandall, J. W., Oudah, M., Ishowo-Oloko, F., Abdallah, S., Bonnefon, J. F. (2018). Cooperating with machines. Nature Communications, 9(1), 233.

Tesla Safety Team. (2023). Autopilot’s Collision Avoidance Mechanism: Technical Whitepaper. https://www.tesla.com/autopilot.

Chen, X., Zhang, Y., Wang, H., & Liang, Y. (2022). A dynamic adversarial risk analysis model for financial fraud detection. Expert Systems with Applications, 187, 115895.

Tversky A, Kahneman D. Advances in prospect theory:Cumulative representation of uncertainty[J]. Journal of Risk and Uncertainty, 1992.

Barberis N C. Thirty years of prospect theory in economics: A review and assessment[J]. Journal of Economic Perspectives, 2013.

Schulman J, et al. Trust region policy optimization[C]. ICML, 2015.



DOI: http://dx.doi.org/10.12345/bdai.v6i3.28235

Refbacks

  • 当前没有refback。
版权所有(c)2025 雷 黄, 喆 崔, 浩 贺, 睿 宋, 林栋 余 Creative Commons License
此作品已接受知识共享署名-非商业性使用 4.0国际许可协议的许可。
  • :+65-62233778 QQ:2249355960 :contact@s-p.sg