Anthropic’s Responsible Scaling Policy: Version 3.0

Anthropic’s Responsible Scaling Policy: Version 3.0

AIの安全性をどうやって”将来のリスク”から守るか? Anthropicが新たなアプローチを公開

Anthropicが「Responsible Scaling Policy(RSP)」のバージョン3.0を発表しました。これは、AI技術が急速に進化する中で、まだ起きていない「将来の危険」にどう備えるかを定めた自主的なルール集です。

RSPって何?
→ AIモデルが「ある能力レベル」を超えたら、それに応じた安全対策を取る「if-then(もし〜なら)」型のルール
→ 例:生物学的な危険につながる能力を持ったら、特定の対策を実施する

なぜ今更新?
Anthropicは2023年9月にRSPを初めて導入してから2年以上運用してきました。その間にAIは「チャット」から「Webを検索」「コードを書いて実行」「パソコンを操作」「自律的に複数の作業をこなす」へと進化。新しい能力が生まれるたびに、新しいリスクも登場してきたんです。

今回のv3.0では、これまでの経験を踏まえて「うまくいった部分は強化」「足りなかった部分は改善」「透明性と説明責任を高める新しい仕組み」を追加したとのこと。

技術が指数関数的に進化する時代、「今は大丈夫」でも「来月は危険」かもしれない。だからこそ「能力の段階に応じた段階的な対策」という考え方は、とても理にかなっていると感じます。あなたは、AIの安全対策にどんなルールが必要だと思いますか?

#AI安全性 #Anthropic #ResponsibleAI

https://www.anthropic.com/news/responsible-scaling-policy-v3