تم الكشف عن GPT-4: التطوير الكبير التالي لـ ChatGPT هنا

صورة-لقطة-شاشة-2023-03-14-في-01-13-41-ظهرا.jpg

قدرات ChatGPT المتقدمة، مثل تصحيح الأخطاء في الشفرة وكتابة مقال أو إطلاق نكتة، أدت إلى شعبيتها الكبيرة. على الرغم من قدراتها، كانت مساعدتها مقتصرة على النصوص -- ولكن هذا سيتغير.

في يوم الثلاثاء، كشفت OpenAI عن GPT-4، نموذج ضخم متعدد الوسائط يقبل إدخالات نصية وصور ويُخرج نصًا.

أيضًا: كيفية جعل ChatGPT يوفر المصادر والاستشهادات

فرق بين GPT-3.5 و GPT-4 سيكون "رقيق" في المحادثات العادية. ومع ذلك، سيكون النموذج الجديد أكثر قدرة من حيث الموثوقية والإبداع وحتى الذكاء.

وفقًا لشركة OpenAI ، حقق GPT-4 نتائج مشرفة تتصدر التصنيف العالمي بنسبة 10٪ في اختبار محاكاة لامتحان المحكمة ، بينما حققت GPT-3.5 نتائج متدنية تتراوح بحوالي 10٪. أيضًا ، تفوق GPT-4 على GPT-3.5 في سلسلة من اختبارات المعايير الأساسية كما هو موضح في الرسم البياني أدناه.

صورة-لقطة-شاشة-2023-03-14-الساعة-1-40-32-بعد-الظهر.jpg

للمزيد من السياق، يعمل ChatGPT على نموذج لغوي معاير بشكل صحيح من نموذج في سلسلة 3.5، والتي تحد من إخراج الروبوت الدردشة إلى النص فحسب.

تبع إعلان جي بي تي-4 لشركة OpenAI خطاب أرنداس براون، المدير التنفيذي لمايكروسوفت في ألمانيا، الأسبوع الماضي، حيث صرح بأن جي بي تي-4 سيكون متاحًا قريبًا وسيتيح إمكانية تحويل النصوص إلى فيديو.

أيضًا: كيف يعمل ChatGPT؟

"سنقدم جي بي تي - 4 الأسبوع المقبل؛ سنمتلك هناك نماذج متعددة الوسائط التي ستقدم إمكانيات مختلفة تمامًا - على سبيل المثال، الفيديوهات"، وفقًا لما قاله براون وفقًا لما نقلته هايز، وكالة أنباء ألمانية، في حدث.

على الرغم من أن GPT-4 يكون متعدد الوسائط ، إلا أنه كانت هناك ادعاءات غير دقيقة بخصوص مولد نص إلى فيديو. لا يستطيع النموذج توليد فيديو بالكامل حتى الآن ، ولكنه يمكنه قبول الإدخالات البصرية مما يعد تغييرا رئيسيا عن النموذج السابق.

واحدة من الأمثلة التي قدمها OpenAI لعرض هذه الميزة تُظهر ChatGPT فحص صورة في محاولة لمعرفة ما في الصورة قد يكون مضحكًا، بناءً على إدخال المستخدم.

أمثلة أخرى شملت رفع صورة لرسم بياني وطلب من GPT-4 إجراء حسابات منها أو رفع ورقة عمل وطلب منه حل الأسئلة.

أيضًا: 5 طرق يمكن لـ ChatGPT مساعدتك في كتابة مقالة

تقول شركة OpenAI إنها ستقوم بإصدار قدرة إدخال النص لـ GPT-4 عبر ChatGPT وواجهة برمجة التطبيقات (API) عبر قائمة انتظار. ستضطر إلى الانتظار لفترة أطول للحصول على ميزة إدخال الصورة نظرًا لأن OpenAI تتعاون مع شريك واحد للبدء في ذلك.

إذا كنت مخيباً للآمال بشأن عدم وجود مُصنع نصوص إلى فيديو، لا تقلق، فهذه ليست فكرة جديدة تمامًا. تملك شركات التكنولوجيا العمالقة مثل ميتا وجوجل نماذج قائمة بالفعل. ميتا لديها "صُنِعَ فيدِيو" وجوجل لديها "إماجن فيديو"، وكلاهما يستخدم الذكاء الاصطناعي لإنتاج فيديو من إدخال المستخدم.

تم الكشف عن GPT-4: هنا ترقية كبيرة لـ ChatGPT

المقالات ذات الصلة