大規模言語モデル(LLM)を対象とした新たな攻撃手法「Flowbreaking」について

これまでのLLMに対する攻撃手法としては「Jailbreaking」や「Prompt Injection」が知られており、これらは主にモデル自身やその入力処理を直接操作して、意図された制約を回避するものでした。それに対し … “大規模言語モデル(LLM)を対象とした新たな攻撃手法「Flowbreaking」について” の続きを読む

人とAIが協調するHuman-in-the-Loopへ

人が手軽に使える道具としてAIが加わりました。これから人とAIが協調する HITL:Human-in-the-Loop によって、あらゆる分野で取り込まれていくと思います。 FOCUS: Award-winning au … “人とAIが協調するHuman-in-the-Loopへ” の続きを読む

GPTs で Zero-Trust Security Consultant を作成してみた

このGPTは、ゼロトラストの考え方に基づいたコンサルティングするよう設計されており、詳細なガイダンス、ベスト プラクティス、規格に関する特定の質問への回答を提供する「Zero-Trust Security Consult … “GPTs で Zero-Trust Security Consultant を作成してみた” の続きを読む

GPTs で ISO Guardian を作成してみた

これまで、多くのユーザーは、ChatGPTを特定の目的に合わせて、プロンプトと命令セットのリストを管理し、それらを手動で ChatGPT にコピーしてきましたが、その全てをGPTが行うようになりました。 つまりGPTsは … “GPTs で ISO Guardian を作成してみた” の続きを読む

Google – Bardに脆弱性診断をやらせてみた。

例えばadversarial attacksは学習精度を上げるためのGAN:敵対的生成ネットワークの延長線上にあるものです。近い将来にAIが人間よりも早くゼロデイを発見し、AIが防御する時代が来ると思います。 今回はGo … “Google – Bardに脆弱性診断をやらせてみた。” の続きを読む

Microsoft – Bingに脆弱性診断をやらせてみた。

例えばadversarial attacksは学習精度を上げるためのGAN:敵対的生成ネットワークの延長線上にあるものです。近い将来にAIが人間よりも早くゼロデイを発見し、AIが防御する時代が来ると思います。 今回はMi … “Microsoft – Bingに脆弱性診断をやらせてみた。” の続きを読む

Open AI – ChatGPT に脆弱性診断をやらせてみた。

例えばadversarial attacksは学習精度を上げるためのGAN:敵対的生成ネットワークの延長線上にあるものです。近い将来にAIが人間よりも早くゼロデイを発見し、AIが防御する時代が来ると思います。 プレビュー … “Open AI – ChatGPT に脆弱性診断をやらせてみた。” の続きを読む