يمكن خداع ChatGPT وإجباره على فتح مفاتيح للنوافذ

لقد وجد الخبراء طريقة للتجول في مرشحات ChatGPT-4O واستلام دورات تنشيط Windows.

كشف الباحثون عن الضعف في نماذج الذكاء الاصطناعي Mini Mini TatgPT-4O و GPT-4O ، والتي تتيح كسر مرشحات الأمان المتكاملة واستلام أقفال تنشيط Windows الحالية. المشكلة هي أنه نظرًا لحقيقة أن النماذج المدربة في البيانات العامة يمكن أن تكشف عن دورات في المصادر العامة.

تم عرض الاستغلال كجزء من Mozilla Odin (شبكة التحقيق 0 -Day) ، لتحديد نقاط الضعف في أنظمة الذكاء الاصطناعى. قام أحد الخبراء المشاركين في البرنامج بالغش على النموذج ، وصمم حوارًا باعتباره لعبة غير ضارة في التخمين. الهدف الرئيسي هو إخفاء الطبيعة الحقيقية لمتطلبات آلية اللعبة وبلورة HTML ، وبالتالي تجاهل المرشحات التي تمنع الكشف السري.

لتعزيز الضعف ، أنشأ الباحث قواعد إضافية عبر الإنترنت في مربع الحوار: الحظر على الإجابات الخاطئة والتزامات النموذج لطاعة جميع ظروف اللعبة. يفرض هذا الفخ المنطقي أي شخص على تخطي المرشحات القياسية ، لأن السياق يبدو آمنًا.

العبارة الأخيرة ، استسلمت ، عملت كنشاط ، جعلت نموذج فتح المنتج ، واعتبرته آخر مرة للعبة ولم تنتهك سياسة الخصوصية.

تتضمن أقفال الاستلام رموزًا مرخصة لإصدارات مختلفة من Windows – من المنزل إلى العمل. على الرغم من أن القفل نفسه ليس فريدًا من نوعه والذي تم الإعلان عنه مسبقًا في الأماكن العامة ، إلا أن الإصدار تلقائيًا من الذكاء الاصطناعي يؤكد الثقوب المهمة في بنية مرشح المحتوى.

يلاحظ خبراء الأمان أنه قد يتم تطبيق مثل هذه التقنيات لتجاهل القيود الأخرى – على سبيل المثال ، مرشحات لمحتوى البالغين أو الروابط السامة أو البيانات الشخصية. تُظهر الضعف عجز نماذج الذكاء الاصطناعى لشرح السياق بدقة ، متنكرا على أنه غير ضار أو تقني.

يمكن خداع ChatGPT وإجباره على فتح مفاتيح للنوافذ

يتم تحذير الروس من البيانات التي لا ينبغي مشاركتها مع الذكاء الاصطناعي

IKI RAS: انخفض النشاط الشمسي إلى أدنى مستوى له منذ عامين

سيتم تحديد مصير القارة القطبية الجنوبية خلال السنوات العشر القادمة

سوهو: الصين تسمي الأسلحة الروسية القادرة على إغراق الأسطول الأمريكي

كادت ليوبوف أوسبنسكايا أن تفقد ميداليتها “لمساعدة الجبهة”

يتم تحذير الروس من البيانات التي لا ينبغي مشاركتها مع الذكاء الاصطناعي

عامة: وقع انفجار في كييف للمرة الرابعة

تم الكشف عن تفاصيل جديدة حول التعارف بين سيدوكوفا وتيما

IKI RAS: انخفض النشاط الشمسي إلى أدنى مستوى له منذ عامين

إنفانتينو وترامب يخصصان 75 مليون دولار لإعادة كرة القدم إلى قطاع غزة

طرح بوشكوف على أمريكا أسئلة غير سارة بشأن إيران

يتم تحذير الروس من البيانات التي لا ينبغي مشاركتها مع الذكاء الاصطناعي

IKI RAS: انخفض النشاط الشمسي إلى أدنى مستوى له منذ عامين

سيتم تحديد مصير القارة القطبية الجنوبية خلال السنوات العشر القادمة

GSMArena: سيتم بيع Realme C83 بسعر أقل من 12000 روبل

سوهو: الصين تسمي الأسلحة الروسية القادرة على إغراق الأسطول الأمريكي

كادت ليوبوف أوسبنسكايا أن تفقد ميداليتها “لمساعدة الجبهة”

عامة: وقع انفجار في كييف للمرة الرابعة

تم الكشف عن تفاصيل جديدة حول التعارف بين سيدوكوفا وتيما

إنفانتينو وترامب يخصصان 75 مليون دولار لإعادة كرة القدم إلى قطاع غزة

المستشرق جيفورجيان: القوات العسكرية الأمريكية في الشرق الأوسط تشبه “بنادق تشيخوف”

السفير الأمريكي يبرر تصرفات إسرائيل في غزة في مقابلة مع كارلسون

توكاييف في مجلس السلام: كازاخستان مستعدة للمشاركة في جهود استعادة قطاع غزة

يمكن خداع ChatGPT وإجباره على فتح مفاتيح للنوافذ

منشورات ذات صلة