当前位置:首页 > 科技文档 > 自然科学 > 正文

人工智能价值对齐现有方法的批判与生成性认知路径分析

科学技术哲学研究 页数: 8 2025-04-05
摘要: 人工智能很难对齐,错位人工智能的部署可能不可逆转地破坏人类对世界的控制,甚至威胁人类文明。人工智能安全的主要方法是AI对齐,即创造与“人类价值观”对齐的人工智能。“价值对齐问题”是如何将人工智能的价值观与人类的价值观相一致的挑战,无论它们是什么,这样人工智能就不会对人类的存在构成风险。现有的几种主要价值对齐方法,例如技术路径和规范路径都没有解决价值对齐问题,建议在哲学上植根于当... (共8页)

开通会员,享受整站包年服务
说明: 本文档由创作者上传发布,版权归属创作者。若内容存在侵权,请点击申诉举报