اكتشاف جديد صادم حول نماذج الذكاء الاصطناعي من "OpenAI"

     
صوت العاصمة             عدد المشاهدات : 108 مشاهده       تفاصيل الخبر       الصحافة نت
اكتشاف جديد صادم حول نماذج الذكاء الاصطناعي من "OpenAI"

‎أعطت نتائج دراسة جديدة مصداقية للادعاءات

‎بأن شركة الذكاء الاصطناعي "OpenAI" دربت على الأقل بعض نماذج الذكاء الاصطناعي التي طورتها على محتوى محمي بحقوق الطبع والنشر.

‎وتواجه الشركة بالفعل دعاوى قضائية رفعها مؤلفون ومبرمجون وأصحاب حقوق آخرون، متهمين "OpenAI" باستخدام أعمالهم -كتبهم وقواعد بياناتهم البرمجية وما إلى ذلك- لتطوير نماذجها دون إذن.

‎ولطالما تحججت "OpenAI" بدفاع الاستخدام

‎العادل، لكن المدعين في هذه القضايا يجادلون بأنه لا يوجد استثناء في قانون حقوق الطبع والنشر الأميركي لبيانات التدريب.

‎وتتعلم نماذج الذكاء الاصطناعي، بتدريبها على كميات كبيرة من البيانات، الأنماط، وهكذا تتمكن من إنشاء المقالات والصور وغيرها.

‎ومعظم النتائج التي تعطيها النماذج ليست نسخًا حرفية لبيانات التدريب، ولكن نظرًا لطريقة "تعلم" النماذج، فإن بعضها يكون كذلك حتمًا.

‎ووُجِد أن نماذج الصور تكرر لقطات شاشة من أفلام تدربت عليها، بينما لُوحظ أن نماذج اللغة تنتحل محتوى مقالات إخبارية بفعالية.

‎على سبيل المثال، تُعتبر كلمة "رادار" في جملة "جلستُ أنا وجاك ساكنين تمامًا مع صوت أزيز الرادار" ذات مستوى مفاجأة عالية لأنها أقل احتمالًا إحصائيًا من كلمات مثل "محرك" أو "راديو" أن تظهر قبل كلمة "أزيز".

‎وفحص المشاركون في الدراسة العديد من نماذج شركة "OpenAI"، بما في ذلك "GPT-4" و"GPT-3.5"، بحثًا عن علامات الحفظ من خلال إزالة الكلمات ذات المفاجأة العالية من مقتطفات من كتب الخيال ومقالات صحيفة نيويورك تايمز، ودفع النماذج إلى محاولة "تخمين" الكلمات التي تم حجبها.

‎وخلص الباحثون إلى أنه إذا نجحت النماذج في التخمين بشكل صحيح، فمن المرجح أنها حفظت المقتطف أثناء عملية التدريب.

‎ووفقًا لنتائج الاختبارات، أظهر نموذج "GPT-4" علامات على حفظ أجزاء من كتب الخيال الشهيرة، بما في ذلك كتب في مجموعة بيانات تحتوي على عينات من كتب إلكترونية محمية بحقوق الطبع والنشر.

‎وأظهرت النتائج أيضًا أن النموذج حفظ أجزاء من مقالات صحيفة نيويورك تايمز، وإن كان بمعدل أقل نسبيًا.

‎قالت أبيلاشا رافيشاندر، طالبة الدكتوراه في جامعة واشنطن والمؤلفة المشاركة في الدراسة، لموقع "TechCrunch"، إن النتائج تُلقي الضوء على "البيانات المثيرة للجدل" التي ربما تم تدريب النماذج عليها.

‎وأضافت: "عملنا يهدف إلى توفير أداة لفحص النماذج اللغوية الكبيرة، ولكن هناك حاجة حقيقية إلى مزيد من شفافية البيانات في النظام البيئي بأكمله".

‎ولطالما دعت "OpenAI" إلى تخفيف القيود على تطوير النماذج باستخدام بيانات محمية بحقوق الطبع والنشر.

شارك

Google Newsstand تابعوا آخر أخبارنا المحلية وآخر المستجدات السياسية والإقتصادية عبر Google news


تابعنا على يوتيوب

تابعنا على تويتر

تابعنا على تيليجرام

تابعنا على فيسبوك

أربعة محافظين يرفضون الإقالة .. ورئيس الحكومة يعطي مهلة 72 ساعة لبدء إجراءات إقالتهم

العاصفة نيوز | 1109 قراءة 

ضـ.ـربة أمـ.ـريكية دقيقة تستهدف هذه المنطقة وانباء عن مصـ.ـرع قيادي كبير

صوت العاصمة | 765 قراءة 

في إطار مكافحة الفساد.. إغلاق الحسابات الحكومية خارج البنك المركزي خلال مهلة محددة

حشد نت | 693 قراءة 

الفريق طارق صالح يصل إلى البرازيل على رأس وفد اليمن للمشاركة في القمة المناخية

حشد نت | 411 قراءة 

  هاني بن بريك يدافع عن وزير الخارجية شايع الزنداني ويثير انقساماً داخل صفوف أنصار المجلس الانتقالي الجنوبي

مأرب برس | 403 قراءة 

شركة ‘‘صقر الحجاز’’ تخرج عن صمتها وتكشف سبب احتراق إحدى حافلاتها في طريق العرقوب

المشهد اليمني | 388 قراءة 

فيديو | القيادي في الحراك الجنوبي “شفيع العبد” لـ“بران برس”: الانتقالي صمم خارج الحدود لابتزاز الشرعية والسعودية ولا يمثل الجنوبيين

بران برس | 386 قراءة 

بالفيديو.. اول تعليق للمعتمر المصري في حادثة الحرم المكي

موقع الأول | 369 قراءة 

” هاني بن بريك” يخرج عن صمته ويفاجئ الوزير الزنداني برد حاسم

المشهد اليمني | 356 قراءة 

اسرائيل تقصف عاصمة عربية وتبرر هذا الأمر!

عدن تايم | 332 قراءة