تستخدم OpenAI المدعومة من Microsoft، جنبًا إلى جنب مع Google المحتوى عبر الإنترنت الذي أنشأته الشركات لتدريب نماذج الذكاء الاصطناعي الخاصة بهم، وذلك دون طلب إذن محدد، وهو جزء من معركة قانونية محتدمة ستقرر مستقبل الويب وكيفية تطبيق قوانين حقوق النشر في هذا العالم الجديد، ولكن مع ذلك لن تسمح شركة OpenAI و Google باستخدام بياناتهم لتدريب نماذج الذكاء الاصطناعي الأخرى.
ووفقًا لما ذكره موقع business insider، فإنه من المرجح أن تجادل صناعة التكنولوجيا بأن نهجها هو الاستخدام العادل، هذا لم يتقرر بعد، ولكن حقيقة أن شركات التكنولوجيا الكبيرة هذه لن تسمح باستخدام المحتوى الخاص بها لتدريب نماذج الذكاء الاصطناعي الأخرى، تجعل السؤال هنا لماذا يُسمح لهم بفعل ذلك للآخرين؟
فيما يلي مقتطف من أعلى شروط استخدام الذكاء الاصطناعي التوليدية من Google:
لا يجوز لك استخدام الخدمات لتطوير نماذج التعلم الآلي أو التكنولوجيا ذات الصلة.
وإليك القسم ذي الصلة من شروط استخدام OpenAI، الشركة التي تقف وراء ChatGPT:
لا يجوز لك ... استخدام مخرجات الخدمات لتطوير نماذج تنافس OpenAI.
هذه الشركات يعلمون أن جودة المحتوى أمر حيوي لتدريب نماذج الذكاء الاصطناعي الجديدة، لذلك من المنطقي أنهم لن يسمحوا باستخدام مخرجاتهم بهذه الطريقة، ولكن لماذا يسمح أي موقع أو شركة أخرى باستخدام محتواها بحرية من قبل شركات التكنولوجيا العملاقة هذه لتدريب نماذجها؟
تقول Reddit وشركات أخرى إن هذا يكفي، حيث بدأت الشركات الأخرى للتو في إدراك ما كان يحدث، وهم ليسوا سعداء.
تخطط منصة Reddit، التي تم استخدامها لسنوات في تدريب نموذج الذكاء الاصطناعي، لبدء فرض رسوم للوصول إلى بياناتها.
قال ستيف هوفمان، الرئيس التنفيذي لشركة Reddit: مجموعة بيانات Reddit ذات قيمة كبيرة حقًا.. لكننا لسنا بحاجة إلى إعطاء كل هذه القيمة لبعض أكبر الشركات في العالم مجانًا.