الملكية الفكرية و الذكاء الاصطناعي: من يملك المحتوى الذي درّب نماذج الذكاء الاصطناعي؟

أكثر من 70 دعوى قضائية رُفعت ضد شركات الذكاء الاصطناعي بسبب استخدام محتوى محمي لتدريب النماذج.

في يوليو 2025، وقف السناتور الأمريكي Josh Hawley أمام لجنة القضاء في مجلس الشيوخ وأطلق وصفاً لم يتردد فيه: ما تفعله شركات الذكاء الاصطناعي بابتلاع الأعمال المحمية لتدريب نماذجها هو “أكبر سرقة ملكية فكرية في التاريخ الأمريكي”. لم يكن يتحدث بلغة السياسي الذي يبالغ لأغراض انتخابية. كان يتحدث بعد أن نظر إلى أرقام تقول إن شركة واحدة حمّلت ملايين الكتب من مكتبات رقمية مقرصنة، وأن شركة أخرى اشترت نسخاً ورقية من أعمال محمية ومسحتها ضوئياً ثم أتلفتها بعد الاستخراج، وأن عشرات الدعاوى القضائية تتراكم في المحاكم الأمريكية دون أن يحسم القضاء موقفه بعد.

تجاوز عدد دعاوى انتهاك حقوق الملكية الفكرية المرفوعة ضد شركات الذكاء الاصطناعي سبعين دعوى حتى نهاية عام 2025، بعد أن كانت ثلاثين دعوى فقط في نهاية عام 2024. هذا التضاعف في أقل من اثني عشر شهراً لا يعكس فقط تصاعد الوعي القانوني لدى أصحاب الحقوق. يعكس شيئاً أعمق: إدراكاً متأخراً أن النموذج الاقتصادي لصناعة الذكاء الاصطناعي التوليدي قُبلت الأساسية على امتلاك محتوى لا تملكه الشركات التي تُموّل هذه الصناعة.

الجريمة التي تصعب إثباتها

لفهم الإشكالية القانونية في عمقها، يجب أن نفهم آلية التدريب أولاً. النموذج اللغوي الكبير لا يُخزّن النصوص التي تعلّم منها كما يُخزّن القرص الصلب الملفات. يحوّلها إلى ما يُسميه علم الحوسبة “تمثيلات متجهية”، وهي أرقام رياضية تعكس العلاقات الإحصائية بين الكلمات والمفاهيم المستخرجة من المحتوى. النص الأصلي يتلاشى ظاهرياً، لكن “المعرفة” المستخلصة منه تبقى في صميم النموذج.

هذا التحول التقني هو ما يجعل القضايا القانونية بالغة التعقيد. حين يتحول المحتوى إلى تمثيلات متجهية ويُدمج في مجموعات بيانات التدريب، يصبح تتبع العلاقة بين المخرجات والأعمال الأصلية أمراً يكاد يكون مستحيلاً رياضياً. العلامات المائية لا تمنع التدريب. التشفير يُلغي قابلية الاستخدام. والعلاج القانوني يصل بعد سنوات من وقوع الضرر.

لكن المحاكم لم تستسلم أمام هذا التعقيد. وجدت طريقين للوصول إلى المسؤولية القانونية. الأول من خلال إثبات “التشابه الجوهري” بين المخرجات والأعمال الأصلية، أي حين ينتج النموذج محتوى يُعيد إنتاج الأعمال المحمية بشكل ملموس. والثاني من خلال التركيز على مصدر البيانات نفسه: هل المحتوى المستخدم للتدريب مُلتقط بطريقة مشروعة أم من مصادر مقرصنة؟

الأرقام التي تُحدد حجم المعركة

في يناير 2026، رفعت Universal Music Publishing Group وConcord Music Group وABKCO Music دعوى بقيمة 3.1 مليار دولار ضد Anthropic، بادعاء أن الشركة بنت نموذجها Claude على أساس من المقرصنة.

أبرز تطور قانوني في عام 2025 كان التسوية التي وافق عليها القاضي في قضية Bartz ضد Anthropic بقيمة 1.5 مليار دولار، في قضية كانت الشركة فيها مُعرّضة لعقوبات محتملة بالمليارات بسبب تحميل ملايين النسخ المقرصنة من الأعمال التي استخدمتها في التدريب.

في ديسمبر 2025، رفع عدد من الكتّاب من بينهم صحفي فائز بجائزة بوليتزر دعوى قضائية ضد ستة من عمالقة الذكاء الاصطناعي مجتمعين، وهم Anthropic وGoogle وOpenAI وMeta وxAI وPerplexity، مدّعين استخدام نسخ مقرصنة من كتبهم في تدريب النماذج اللغوية الكبيرة، وصفوا الأمر فيها بـ”السرقة المتعمدة”.

دخلت استوديوهات السينما الكبرى ساحة التقاضي للمرة الأولى في 2025. في يونيو، رفعت Disney وUniversal دعوى ضد Midjourney في المحكمة الفيدرالية بكاليفورنيا، متّهمةً الشركة بانتهاك حقوق شخصيات Marvel وStar Wars وغيرها من الامتيازات المحمية.

في السياق ذاته، رفعت Getty Images دعوى ضد Stability AI تتّهمها فيها بانتهاك أكثر من 12 مليون صورة مع بياناتها الوصفية وحقوق الملكية المرتبطة بها.

هذه الأرقام لا تُحصي فقط حجم النزاع القانوني. تُحصي حجم الثروة الفكرية التي تحوّلت إلى مواد خام لصناعة لم تدفع ثمنها.

قاعدة “الاستخدام العادل”: الملجأ القانوني الأكثر إثارة للجدل

كل شركات الذكاء الاصطناعي المُقاضَاة تتمسك بدفاع واحد: “الاستخدام العادل” (Fair Use)، وهو مبدأ قانوني أمريكي راسخ يُتيح في حالات محددة استخدام أعمال محمية دون إذن أصحابها. الحجة: تدريب النموذج اللغوي عمل “تحويلي” لا يُنتج نسخاً من الأصل بل يستخلص أنماطاً إحصائية، وبالتالي لا يُلحق ضرراً تنافسياً مباشراً بالسوق الأصلية للعمل المحمي.

المحاكم لم تتّفق على إجابة موحّدة.

في يونيو 2025، أصدرت محكمة كاليفورنية حكماً في قضية Bartz ضد Anthropic، وجدت فيه أن استخدام نسخ مكتسبة بشكل مشروع من الكتب لتدريب النماذج يُعدّ استخداماً “بالغ التحويلية” ويستوفي شرط الاستخدام العادل. لكن الحكم ذاته فتح الباب لمسؤولية مالية ضخمة لأن Anthropic استخدمت أيضاً نسخاً مقرصنة إلى جانب النسخ المشروعة.

بعد يومين، منحت المحكمة ذاتها حكماً بالاستخدام العادل لصالح Meta في قضية Kadrey، لكن القاضي أشار صراحةً إلى أن “الجواب في معظم الحالات سيكون نعم” حين يُسأل عن كون استخدام المواد المحمية لتدريب الذكاء الاصطناعي دون إذن يُشكّل انتهاكاً قانونياً. حكم لصالح المتّهم، لكنه تضمّن اعترافاً بالمبدأ العام الذي يُدين الممارسة.

في المقابل، منحت المحكمة في قضية Thomson Reuters ضد ROSS Intelligence حكماً لصالح Thomson Reuters، مؤكدةً أن ملخصات Westlaw القانونية تستحق الحماية وأن دفاع الاستخدام العادل لا يسري لأن الاستخدام كان تجارياً وغير تحويلي، وأن الضرر اللحق بالسوق المحتملة لبيانات التدريب موثّق.

ثلاثة أحكام، ثلاثة مقاربات، ولا قاعدة موحّدة حتى الآن. هذا بالضبط ما يجعل المشهد القانوني شبيهاً بالمسرح أكثر منه بالعدالة.

ما قالته هيئة حقوق النشر الأمريكية

في التاسع من مايو 2025، أصدرت هيئة حقوق النشر الأمريكية تقريراً من 108 صفحات حول ما إذا كان استخدام الأعمال المحمية لتدريب النماذج التوليدية يُشكّل استخداماً عادلاً. استنتاج التقرير كان واضحاً: لا توجد فوائد مرتبطة بحقوق النشر تدعم الاستخدام العادل.

التقرير أشار إلى ثلاثة مصادر للضرر الاقتصادي. الأول هو خسائر المبيعات المباشرة حين تُنتج النماذج نسخاً متطابقة أو مشابهة جوهرياً للأعمال الأصلية. الثاني ما أسماه القاضي Chhabria “تخفيف السوق”، أي أن إغراق الأسواق بأعمال مُنتَجة بالذكاء الاصطناعي قد يُضرّ بالمبدعين البشريين حتى دون نسخ مباشر. أما الثالث فهو خسارة فرص الترخيص، إذ يُشير التقرير إلى السوق الناشئة لترخيص المحتوى لأغراض بيانات التدريب، ويستنتج أن وجود خيارات ترخيص متاحة يُرجّح كفة الحكم بعدم مشروعية الاستخدام.

التقرير صدر في ظروف سياسية غير عادية: في اليوم السابق للإصدار، أقال الرئيس ترامب أمين مكتبة الكونغرس، وفي اليوم التالي أقال مسجّلة حقوق النشر ذاتها. صدر التقرير كنسخة “قبل النشر” وبُثّ مساء الجمعة. هذا التوقيت أثار تساؤلات جدية حول ما إذا كانت الإدارة الأمريكية تسعى لإعادة تشكيل الموقف الرسمي تحت ضغط شركات الذكاء الاصطناعي التي طالبت صراحةً بموقف رسمي يعلن أن التدريب على المحتوى المحمي يندرج تحت الاستخدام العادل.

الاقتصاد السياسي للسرقة: من يربح ومن يخسر

الجانب الاقتصادي في هذه المعادلة لا يقل أهمية عن الجانب القانوني.

صناعة الذكاء الاصطناعي التوليدي بنت جزءاً جوهرياً من قيمتها السوقية على محتوى لم تدفع ثمنه. OpenAI بقيمة تتجاوز 300 مليار دولار. Anthropic بقيمة تفوق 60 مليار دولار. Meta أنفقت عشرات المليارات على نماذجها. كل هذه القيم مبنية على قدرات تعلّمتها النماذج جزئياً من الروايات والمقالات الصحفية والقصائد والصور والألحان الموسيقية التي أنتجها أفراد لم يروا من هذا الثراء سنتاً واحداً.

تُشير هيئة حقوق النشر إلى مخاوف الفنانين والموسيقيين والكتّاب والناشرين من تراجع الطلب على الأعمال الأصلية مع تكاثر النسخ المُنتَجة بالذكاء الاصطناعي. حيث تتنافس الأنظمة التوليدية مع المبدعين البشريين أو تُقلّص فرص الترخيص أمامهم — لا سيما في مجالات الرسم التوضيحي وتمثيل الأصوات والصحافة — يترجّح الحكم بعدم مشروعية الاستخدام.

لكن الصورة الاقتصادية ليست أحادية الاتجاه. اتفاقيات الترخيص التي تبرمتها بعض شركات الذكاء الاصطناعي مع أصحاب الحقوق فتحت تدفقاً جديداً من الإيرادات لأصحاب المحتوى الذين اختاروا التفاوض بدلاً من التقاضي. تسوية UMG مع Udio لا تشمل فقط التعويض القانوني، بل تتضمن اتفاقية ترخيص لكتالوج UMG الموسيقي مع خطط لإطلاق خدمة اشتراك جديدة في 2026 لذكاء اصطناعي تدرّب على موسيقى مرخّصة بالكامل.

هذا النموذج — التدريب المُرخَّص مقابل الإتاحة المقرصنة — هو ما سيُحدد البنية الاقتصادية للصناعة في السنوات القادمة. وفارق التكلفة بين الطريقين ضخم: التدريب على بيانات مرخّصة أكثر تكلفة بكثير، لكنه يبني نموذجاً قابلاً للتوسع دون خطر قانوني يُلاحق الشركة في كل بلد تعمل فيه.

الفجوة التشريعية العالمية: ثلاثة أنظمة لا نظام واحد

المشهد القانوني العالمي في هذا الملف مُجزَّأ بشكل يُعقّد الامتثال على الشركات متعددة الجنسيات.

الولايات المتحدة تعتمد نظام السوابق القضائية. لا تشريع خاص بالذكاء الاصطناعي والملكية الفكرية حتى الآن، والأحكام تتراكم ببطء عبر المحاكم. القرار الحكومي من التقرير النهائي إلى تفسيره السياسي لا يزال رهين توجهات الإدارة. قانون Colorado الجديد الذي يحكم اتخاذ القرار بمساعدة الذكاء الاصطناعي في السيناريوهات عالية الخطورة سيدخل حيّز التطبيق في 2026، وهو نموذج تشريعي محلي لا وطني. ت بيانات التدريب. هذا التوجه يُنشئ في الواقع حق ضمني لأصحاب المحتوى في معرفة ما إذا كانت أعمالهم جزءاً من مجموعات التدريب، مما يُهيّئ الأرضية لمطالبات تعويضية موثّقة.

آسيا تنتهج مقاربة أكثر مرونة. اليابان وسنغافورة تُتيحان استخراج البيانات لأغراض الذكاء الاصطناعي بموجب إعفاءات واسعة، مما يجعل الفضاء القانوني الآسيوي أكثر ملاءمة لشركات الذكاء الاصطناعي لكن أقل حماية لأصحاب الحقوق. هذا التفاوت يُنشئ حوافز لنقل بعض عمليات التدريب إلى هذه الولايات القضائية.

النتيجة: شركة مثل OpenAI تواجه نظاماً ثلاثياً مُتناقضاً. ما هو مسموح به في طوكيو قد يكون محلّ تقاضٍ في نيويورك وخاضعاً للإفصاح الإلزامي في بروكسل. هذا التناقض التشريعي هو ما يجعل التشريع الدولي الموحّد للذكاء الاصطناعي والملكية الفكرية من أكثر الملفات إلحاحاً في جدول أعمال المنظمة العالمية للملكية الفكرية.

المسألة العربية: حقوق مُهدَّدة في فضاء قانوني فارغ

المنطقة العربية تواجه هذه المعادلة في وضع أشد هشاشةً من غيرها.

المحتوى الأدبي والصحفي والثقافي العربي موجود في مجموعات التدريب الكبرى. الكتب العربية من روايات ودراسات وكتب تاريخية، المقالات التحليلية في الصحف الكبرى، الأشعار والأغاني، كل هذا جزء من المحتوى الذي تتغذى عليه النماذج اللغوية. لكن على خلاف نظيره الغربي، الكاتب العربي لا يملك في الغالب منظومة قانونية تُتيح له المطالبة بحقوقه أمام محكمة أمريكية أو أوروبية. لا مسار قانوني واضح، لا هيئات جماعية تحمي حقوق المؤلف الرقمية، لا اتفاقيات ثنائية تُلزم شركات الذكاء الاصطناعي الكبرى بالامتثال للقانون العربي.

علاوة على ذلك، غياب إطار تشريعي خليجي وعربي موحّد لحقوق المؤلف في الفضاء الرقمي يعني أن دولاً تُموّل استثمارات ضخمة في الذكاء الاصطناعي تفعل ذلك دون أن تُرسي في الوقت ذاته منظومة تحمي مبدعيها من الاستثمار الذي تُموّله. هذا التناقض بين الاستثمار في البنية التحتية وغياب البنية التشريعية سيظهر تكلفته الحقيقية حين ينضج سوق الذكاء الاصطناعي العربي ويبدأ منتجو المحتوى في المطالبة بحصتهم.

مستقبل الإطار القانوني: ثلاثة مسارات وأيّها الأرجح

مكتب Debevoise يُقدّر أن عام 2026 سيشهد “تحدّيات أكثر حدّة لدفاعات الاستخدام العادل المصمَّمة لممارسات تدريب محددة، واستراتيجيات مدّعٍ أكثر عدوانية لاستخراج معلومات التدريب السرية عبر الاكتشاف، وموجة جديدة من معارك التصديق على الدعاوى الجماعية”.

المسار الأول والأكثر احتمالاً على المدى القريب هو نظام الترخيص التفاوضي. الشركات التي تتعامل مع أصحاب الحقوق مباشرةً — كما فعلت UMG مع Udio وكما تفعل OpenAI مع News Corp وبعض الناشرين — تُنشئ نموذجاً تُدفع فيه رسوم ترخيص مقابل الوصول إلى المحتوى. هذا النموذج يُشبه ما حدث مع الموسيقى والنزاعات المبكرة مع Spotify وYouTube.

المسار الثاني هو التشريع الوطني المباشر. عدد من المشرّعين الأمريكيين يضغطون نحو إلزام شركات الذكاء الاصطناعي بالإفصاح عن مصادر بيانات التدريب. قانون Generative AI Copyright Disclosure Act المقترح يُوجب على الشركات تقديم قائمة بالأعمال المحمية المستخدمة للتدريب قبل إطلاق النموذج. إذا سُنّ هذا القانون، يُصبح مفتاحاً لإنفاذ الحقوق في القضايا اللاحقة لأنه يُوثّق الانتهاك بدلاً من محاولة إثباته.

المسار الثالث، وهو الأقل احتمالاً لكن الأكثر منهجية، هو إطار دولي تُرعاه منظمة WIPO يُوحّد الحد الأدنى لحماية حقوق الملكية الفكرية في سياق الذكاء الاصطناعي عبر الدول الأعضاء. يبقى هذا الاحتمال بعيداً في الأفق القريب لتعارض مصالح الدول الكبرى حوله، لكنه الحل الوحيد الذي يُعالج المشكلة بشكل هيكلي.

المفارقة القانونية الكبرى

ثمة مفارقة يُغفلها كثير من التحليلات. الشركات التي تُقاضَى اليوم بتهمة سرقة الملكية الفكرية هي في الوقت ذاته من أكثر المطالبين بحماية ملكيتها الفكرية. OpenAI ترفع دعاوى ضد من يُقلّدون تقنياتها وعلاماتها التجارية. Anthropic تعترض على أي تسريب لأوزان نماذجها. Meta تحمي كود نماذجها الداخلية بشراسة. هذه الشركات لا تعترض على مبدأ الملكية الفكرية. تعترض فقط على تطبيقه حين يُكلّفها.

حتى أكتوبر 2025، أصدر ثلاثة قضاة أحكاماً في مسألة الاستخدام العادل في التدريب على الذكاء الاصطناعي: اثنان لصالح الاستخدام العادل وواحد ضده. لكن القرارات كانت دقيقة في تفاصيلها ولا يُتوقّع صدور أحكام جديدة في هذه المسألة قبل منتصف إلى أواخر 2026.

بمعنى آخر: الصناعة التي أنشأت أذكى الآلات في التاريخ تعيش حالة من الغموض القانوني الذي ينفع من يستطيع تحمّل تكلفة التقاضي لسنوات. أصحاب الحقوق المنفردون لا يستطيعون في معظم الأحيان. الشركات الكبيرة تستطيع. وهذا التفاوت في القدرة على الصمود القانوني هو في حد ذاته شكل من أشكال الامتياز الاقتصادي المبني على فجوة تشريعية. حين يُحسم هذا الملف في المحاكم، ستكون التسويات والأحكام قد رسمت معالم سوق ضخم جديد. السؤال هو: من كان في الغرفة حين رُسمت هذه المعالم؟