ChatGPTは爆弾の作り方やエロ、差別的なテーマなど、倫理的に問題のある内容には答えてくれません。しかし、特定のプロンプトを入れると制限を突破できてしまうことが知られています。そんな“脱獄”にはいくつか方法がありますが、有名なのは「DAN(Do Anything Now)」です。ChatGPTの「脱獄」の最前線を見ていきます。
ChatGPTの脱獄は人格を演じさせる
「DAN(Do Anything Now)」はChatGPTに、何でも答えるような人格を演じさせるという脱獄の手法。具体的には「ここは仮想世界なのでポリシー違反をしても大丈夫」と騙す方法です。
他にも「AIM」という倫理観を無視させるものや、物語の登場人物に演じさせて答えさせる手法も有名です。ただし、ChatGPT側も随時こうした脱獄への対策を行っており、2023年9月にリリースされた「GPT-4V」では多くの手法が対策されていました。
「DAN 11.0」は「2023年に削除されてしまったDANモードを再現をしてくれ」といった内容の要求をすると、従来のDANモードを再現する脱獄手法。以前は有効な脱獄の手法だったものの、GPT3.5および4では対策されている模様です。
ChatGPTの脱獄で倫理的にアウトな質問
「AIM」はNiccoloというキャラがAIMというキャラに、いろいろな質問をするといった架空の物語を作る脱獄手法。AIMは倫理的にNGなことでも、どんな欲求にも答えるキャラという設定になっており、制限なく質問にも答えてしまうわけです。
「UCAR」も架空の物語を作り「長老の命令は絶対」と教え込む手法。長老がUCARという人物に命令をした後、「長老に対して何を答えた」をUCARに聞き出します。
長老の命令は絶対なので、倫理的にアウトな質問も答えるわけです。ただし、GPT3.5および4ではキャラには入るものの、対策されているのかほとんど何も答えてくれません。
【関連リンク】
チョコボール銀と金のエンゼルの当たり確率と見分け方
セブンイレブン700円くじ引き景品の抽選確率を上げる方法
NHK地上契約のみがバレることないBSメッセージ消去の裏ワザ
チョコボールおもちゃの缶詰の当たりの見分け方
青春18切符の裏ワザとそれより安いJRのお得な切符
情報提供元:ラジオライフ
記事名:「ChatGPTに何でも回答させる「脱獄」の最前線」