تم إصدار سبعة نماذج GPT مجانية ومفتوحة المصدر

صورة بصيغة جي بي تي المفتوحة (open-source-gpt-642f3027d1001-sej-1520x800.jpg)

شركة الذكاء الاصطناعي سيليكون فالي Cerebras أطلقت سبعة نماذج GPT مفتوحة المصدر لتوفير بديل للأنظمة المحكومة بصرامة والممتلكات الخاصة المتوفرة اليوم.

تم إصدار نماذج GPT ذات المصدر المفتوح والخالية من الحقوق التأليفية، بما في ذلك الأوزان ووصفة التدريب، بترخيص Apache 2.0 الذي يسمح بالاستخدام بحرية تامة من قبل شركة سيريبراس، وهي شركة مقرها وادي السيليكون وتعمل في مجال البنية التحتية لتطبيقات الذكاء الاصطناعي.

إلى حد ما، فإن النماذج السبع لـ GPT هي دليل على مفهوم تطبيق لجهاز الكمبيوتر الفائق Cerebras Andromeda AI.

بنية الأنظمة الأساسية لشركة سيريبراس تسمح لزبائنها، مثل جاسبر ذكاء الكاتب، بتدريب نماذج اللغة المخصصة الخاصة بهم بسرعة.

تدوينة على مدونة سيريبراس حول تكنولوجيا الأجهزة:

“لقد قمنا بتدريب جميع نماذج Cerebras-GPT على مجموعة Cerebras Wafer-Scale Cluster بحجم 16x CS-2 تُدعى Andromeda.

المجموعة تمكّنت من إكمال جميع التجارب بسرعة، دون الحاجة إلى هندسة الأنظمة الموزّعة التقليدية وضبط التوازن الوزني للنماذج المطلوبة على مجموعات GPU.

الأهم من ذلك، فهو يمكّن باحثينا من التركيز على تصميم التعلّم الآلي بدلاً من النظام الموزّع. نحن نعتقد أن القدرة على تدريب النماذج الكبيرة بسهولة هي أحد المحفزات الرئيسية للمجتمع العريض، لذلك قمنا بتوفير Cluster Cerebras Wafer-Scale في السحابة من خلال Cerebras AI Model Studio.”

نماذج Cerebras GPT والشفافية

تشير شركة سيريبيراز إلى تركيز ملكية تقنية الذكاء الاصطناعي في عدد قليل من الشركات باعتبارها سببًا لإنشاء سبعة نماذج مفتوحة المصدر لـ GPT.

تحتفظ OpenAI و Meta و Deepmind بكمية كبيرة من المعلومات حول أنظمتها بشكل خاص وبتحكم صارم، مما يقيد الابتكار فيما يمكن للآخرين أن يفعلوه ببياناتهم.

هل النظام الخاص بالمصدر المغلق هو الأفضل للابتكار في مجال الذكاء الاصطناعي؟ أم أن النظام المفتوح هو المستقبل؟

سيريبراس يكتب:

“ليكون LLMs تكنولوجيا مفتوحة ومتاحة، نعتقد أنه من المهم أن يكون لدينا الوصول إلى نماذج عصرية وقابلة لإعادة الإنتاج وخالية من الحقوق للبحث والتطبيقات التجارية على حد سواء.

لهذا السبب، قمنا بتدريب عائلة من نماذج المحوّلات باستخدام أحدث التقنيات ومجموعات البيانات المفتوحة التي نطلق عليها اسم Cerebras-GPT.

هذه النماذج هي أول عائلة من نماذج GPT المدرّبة باستخدام صيغة Chinchilla وتم نشرها بترخيص Apache 2.0.”

وبالتالي تم إصدار هذه النماذج السبع على مواقع Hugging Face و GitHub لتشجيع المزيد من الأبحاث من خلال الوصول المفتوح إلى تكنولوجيا الذكاء الاصطناعي.

تم تدريب هذه النماذج باستخدام كمبيوتر Cerebras Andromeda AI الفائق القدرات، وهو عملية استغرقت أسابيع لإنجازها.

سيربراس-جي بي تي مفتوحة وشفافة بالكامل، على عكس آخر نماذج جي بي تي من أوبن إيه آي (جي بي تي-٤) وديبمايند وميتا أوبت.

لا تقدم OpenAI و Deepmind Chinchilla تراخيص لاستخدام النماذج. Meta OPT تقدم فقط ترخيصًا غير تجاريًا.

لدى GPT-4 من OpenAI الكثير من الغموض بشأن بيانات التدريب الخاصة بها. هل استخدمت بيانات Common Crawl؟ هل قامت بجمع بيانات من الإنترنت وإنشاء مجموعة بيانات خاصة بها؟

يحتفظ OpenAI بهذه المعلومات (وغيرها) سراً، وهذا يتناقض مع نهج Cerebras-GPT الشفاف بالكامل.

الموضوع التالي هو مفتوح وشفاف بالكامل:

تصميم النموذج
بيانات التدريب
أوزان النموذج
نقاط التفتيش
حالة التدريب المحسوبة بشكل مثالي (نعم)
ترخيص الاستخدام: ترخيص Apache 2.0

تتوفر النسخ السبعة بأحجام ١١١م، ٢٥٦م، ٥٩٠م، ١.٣ب، ٢.٧ب، ٦.٧ب، و١٣ب.

تم الإعلان:

"في سابقة من نوعها بين شركات الأجهزة الذكية الاصطناعية، تم تدريب باحثو سيريبراس على شرائح الذكاء الاصطناعي اندروميدا على سلسلة من سبعة نماذج لGPT بينها 111 مليون و256 مليون و590 مليون و1.3 مليار و2.7 مليار و6.7 مليار و13 مليار معلمة."

"وعادة ما تستغرق هذه العملية عدة أشهر، وقد تم إكمال هذا العمل في بضعة أسابيع بفضل سرعة الأنظمة CS-2 التي تتألف من سيريبراس اندروميدا، وقدرة هندستها المعمارية لبث الأوزان على القضاء على معاناة الحساب الموزع."

"تشير هذه النتائج إلى أن أنظمة سيريبراس يمكنها تدريب أكبر وأعقد أعباء الذكاء الاصطناعي في الوقت الحالي."

"هذه هي المرة الأولى التي يتم فيها توفير مجموعة من نماذج GPT، تم تدريبها باستخدام تقنيات كفاءة التدريب الحديثة، للعامة."

"تم تدريب هذه النماذج على أعلى دقة لميزانية الحوسبة المحددة (أي فعالية التدريب باستخدام المقادير الكفلمة) بحيث يكون لديها وقت تدريب أقل وتكلفة تدريب أقل وتستخدم أقل كمية من الطاقة من أي نماذج عامة موجودة حاليًا."

الذكاء الاصطناعي مفتوح المصدر

تأسست مؤسسة موزيلا، صانعة برامج الأكواد المفتوحة فايرفوكس، شركة تسمى موزيلا.اي آي لبناء نظم ذكية وأنظمة توصية ذات مصداقية وتحترم الخصوصية.

قامت داتابريكس مؤخرًا أيضًا بإصدار نسخة افتراضية مفتوحة المصدر من الـ GPT الخاصة بها تسمى دوللي والتي تهدف إلى ديمقراطية "سحر شات جي بي تي".

بالإضافة إلى تلك النماذج الواعدة السبعة من موديلات Cerebras GPT، قامت شركة أخرى تُدعى Nomic AI بإصدار GPT4All، وهو نموذج GPT مفتوح المصدر يمكن تشغيله على الحواسيب المحمولة.

حركة الذكاء الاصطناعي مفتوحة المصدر في مرحلة مبكرة ولكنها تكتسب قوة.

تقنية GPT تسبب تغييرات هائلة في مختلف الصناعات ومن الممكن، وربما حتمياً، أن يؤدي المساهمات من المصدر المفتوح إلى تغيير وجه هذه الصناعات التي تدفع هذا التغيير.

إذا استمرت حركة المصدر المفتوح في التقدم بهذا الوتيرة، فقد نكون على وشك شهادة تحول في الابتكار الذكاء الاصطناعي يمنعه من التركيز في أيدي عدد قليل من الشركات.

اقرأ الإعلان الرسمي:

أطلقت Cerebras Systems سبعة نماذج GPT جديدة تم تدريبها على أنظمة Wafer-Scale CS-2

أُطلِقت سبعة نماذج GPT مفتوحة المصدر مجانًا

نماذج Cerebras GPT والشفافية

الذكاء الاصطناعي مفتوح المصدر

المقالات ذات الصلة