Tujuh kerentanan yang diungkap Tenable berasal dari cara ChatGPT menyerap dan memproses instruksi dari sumber eksternal, termasuk situs web yang diaksesnya, hasil pencarian, komentar blog, dan URL yang dibuat khusus.
Dikutip dari Tenable, perusahaan ini menunjukkan bagaimana penyerang dapat mengeksploitasi kelemahan-kelemahan itu dengan menyembunyikan prompt berbahaya dalam komentar blog, ‘meracuni’ hasil pencarian untuk menerobos filter keamanan ChatGPT, dan memanfaatkan cara ChatGPT memproses riwayat percakapan dan menyimpan memori.
1. Indirect Prompt Injection in Browsing Context
Kerentanan ini terjadi ketika penyerang menyuntikkan instruksi berbahaya ke dalam konten eksternal yang sah, seperti komentar di postingan blog atau halaman web terpercaya.
Jika pengguna meminta ChatGPT untuk meringkas konten halaman tersebut, komponen penjelajah web akan mengambil dan menjalankan instruksi tersembunyi.
Instruksi ini dapat memanipulasi respons ChatGPT, misalnya dengan mengirimkan tautan ke situs phising yang berbahaya kepada pengguna, semuanya tanpa sepengetahuan pengguna.
2. Safety Mechanism Bypass
Mekanisme keamanan ChatGPT dirancang untuk memblokir URL yang tidak aman. Namun peneliti menemukan bahwa penyerangan dapat melewati fitur ini. Mereka melakukannya dengan memanfaatkan URL wrapper terpercaya untuk menyamarkan tautan berbahaya yang sebenarnya.
Karena ChatGPT mempercayai domain wrapper tersebut, tautan berbahaya akan ditampilkan kepada pengguna dan dapat dieksekusi, dan berpotensi mengarahkan pengguna ke situs web berbahaya.
3. Conversation Injection
Kerentanan ini mengeksploitasi cara ChatGPT berinteraksi dengan SearchGPT. Penyerang dapat memasukkan instruksi berbahaya ke dalam konten yang diambil oleh SearchGPT.
Setelah instruksi ini masuk ke dalam topik percakapan, ChatGPT membacanya seolah-olah instruksi itu adalah bagian dari obrolan sebelumnya. Hal ini memaksa model untuk memberikan balasan yang tidak dimaksudkan.
:strip_icc():format(jpeg)/kly-media-production/medias/5402142/original/052189800_1762238898-chatgpt-free-india.jpeg?w=1200&resize=1200,0&ssl=1)