صدور OpenAI GPT-4 في منتصف مارس 2023

صورة-gpt-4-640b66db8c60d-sej-1520x800.jpg

رئيس تكنولوجيا المعلومات لمايكروسوفت في ألمانيا، أندرياس براون، أكد أن GPT-4 سيتم إطلاقه خلال أسبوع من تاريخ 9 مارس 2023، وسيكون متعدد الوسائط. تعني الذكاء الاصطناعي المتعدد الوسائط أنه سيكون قادرًا على العمل مع أنواع متعددة من المدخلات مثل الفيديو والصور والصوت.

تحديث: إصدار GPT-4 أصدر في 14 مارس 2023

أصدرت OpenAI GPT-4 في 14 مارس 2023. إنه نموذج متعدد الوسائط يقبل التلميحات الصورية والنصية.

النمط هو عبارة تُستخدم في التعلم الآلي للدلالة على أشكال الإدخال مثل النص، وكذلك الحواس مثل الصوت والرؤية والشم وغيرها.

وصف إعلان OpenAI مدى تطور GPT-4:

“... في حين أنها أقل قدرة على اجتياز سيناريوهات العالم الحقيقي بمقارنة مع البشر، فإنها تظهر أداءا على مستوى البشر في مجموعة متنوعة من المقاييس المهنية والأكاديمية.

على سبيل المثال، يجتاز امتحان حانة محاكاة بدرجة حوالي النسبة العشرية العليا للممتحنين؛ بينما كانت نسبة جي بي تي-3.5 في الحوض السفلى 10٪.

لقد قضينا 6 أشهر في مزامنة جي بي تي-4 تكراريًا باستخدام دروس من برنامج الاختبار التحدي الخاص بنا بالإضافة إلى تشات جي بي تي، مما أدى إلى أفضل النتائج التي حققناها على الإطلاق (رغم أنها ليست مثالية) فيما يتعلق بالحقائق، وقابلية التوجيه، وعدم تجاوز الخطوط الدفاعية.”

نماذج لغوية متعددة الوسائط وكبيرة الحجم

الدرس الأهم من الإعلان هو أن GPT-4 متعدد الوسائط (تنبأ SEJ بأن GPT-4 متعدد الوسائط في يناير 2023).

الطورية هي إشارة إلى نوع الإدخال الذي يتعامل به نموذج لغوي كبير (في هذه الحالة).

يمكن أن يشمل الوسائط المتعددة النصوص والكلام والصور والفيديو.

تعمل GPT-3 و GPT-3.5 فقط في وضع واحد ، النصوص.

وفقًا لتقرير الأخبار الألمانية، قد يكون بإمكان GPT-4 العمل في ما لا يقل عن أربع طرق، وهي الصور والصوت (السمع) والنصوص والفيديو.

يتم نقل كلام الدكتور أندرياس براون ، المدير التنفيذي لشركة مايكروسوفت في ألمانيا:

"سنقدم GPT-4 الأسبوع المقبل، هناك سنمتلك نماذج متعددة الوسائط التي ستقدم إمكانيات مختلفة تمامًا - على سبيل المثال الفيديو..."

التقرير لم يشتمل على تفاصيل حول GPT-4، لذلك غير واضح ما تمت مشاركته حول التعددية الوسائط إذا كان محددًا لـ GPT-4 أم يعتمد على العموم.

مدير استراتيجية الأعمال في مايكروسوفت، هولغر كين، شرح مفاهيم التعددية في التفاعل ولكن التقرير لم يوضح ما إذا كان يشير إلى التعددية في GPT-4 أو التعددية بشكل عام.

أعتقد أن إشاراته إلى التعددية في الوسائط كانت محددة لـGPT-4.

التقرير الإخباري المشارك:

"قد شرح كين ما يدور حول الذكاء الاصطناعي متعدد الوسائط، الذي يمكنه ترجمة النص ليس فقط إلى صور، ولكن أيضًا إلى موسيقى وفيديو."

حقيقة مثيرة أخرى هي أن شركة مايكروسوفت تعمل على "مقاييس الثقة" من أجل توطيد الذكاء الاصطناعي لديها بالحقائق لجعله أكثر موثوقية.

مايكروسوفت كوسموس-1

شيء ما تم تقريره بشكل لا يتناسب في الولايات المتحدة هو أن مايكروسوفت أطلقت نموذج لغة متعدد الوسائط يسمى Kosmos-1 في بداية مارس 2023.

وفقًا لتقرير نشره موقع أخبار ألماني بعنوان Heise.de:

“...فريقنا خضع النموذج المدرب مسبقًا لاختبارات مختلفة، وحقق نتائج جيدة في تصنيف الصور والإجابة على أسئلة حول محتوى الصورة وتسمية الصور تلقائيًا والتعرف على النصوص البصرية ومهام إنتاج الكلام.

...الاستنتاج البصري، أي الوصول إلى استنتاجات حول الصور من دون استخدام اللغة كمرحلة وسيطة يبدو أنه مفتاح هنا...

Kosmos-1 هو نمط خارج المسار يجمع بين أنماط النص والصور.

GPT-4 يتجاوز Kosmos-1 لأنه يضيف وسيلة تواصل ثالثة وهي الفيديو، ويبدو أنه يتضمن أيضًا وسيلة التواصل صوتيًا.

يعمل عبر عدة لغات

يبدو أن GPT-4 يعمل بجميع اللغات. وصف بأنه قادر على استلام سؤال بالألمانية والإجابة بالإيطالية.

هذا نوعًا ما مثال غريب، لأنه من الغريب أن يطلب أحدهم سؤالًا باللغة الألمانية ويريد الحصول على إجابة باللغة الإيطالية؟

هذا ما تم تأكيده:

“...تقنية قد تقدمت حتى أصبحت تعمل بجميع اللغات: يمكنك طرح سؤال باللغة الألمانية والحصول على إجابة باللغة الإيطالية.

ثمة تطلع أن مايكروسوفت (OpenAI) ستقوم بجعل النماذج شاملة من خلال متعدد الأوضاع."

أعتقد أن نقطة الاختراق هي أن النموذج يتجاوز اللغة بقدرته على استخلاص المعرفة من لغات مختلفة. لذا، إذا كانت الإجابة باللغة الإيطالية، فسيعرف النموذج ذلك وستتمكن من توفير الإجابة باللغة التي تمت طرح السؤال بها.

هذا سيجعلها مشابهة لهدف الذكاء الاصطناعي المتعدد الوسائط في جوجل المسمى "مام". يقال أن "مام" قادرة على تقديم إجابات باللغة الإنجليزية للبيانات الموجودة فقط في لغة أخرى، مثل اللغة اليابانية.

تطبيقات جي بي تي-4

لا يوجد إعلان حاليًا عن مكان ظهور GPT-4. ولكن تم ذكر Azure-OpenAI بشكل خاص.

جوجل تكافح لمواكبة مايكروسوفت من خلال دمج تقنية منافسة في محرك البحث الخاص بها. تزيد هذه التطورات من انفجار الإدراك بأن جوجل تتخلف وتفتقر إلى القيادة في الذكاء الاصطناعي للمستخدم.

جوجل بالفعل تدمج AI في العديد من المنتجات مثل Google Lens و Google Maps ومجالات أخرى يتفاعل فيها المستهلكون مع Google. هذا النهج يهدف إلى استخدام AI كتكنولوجيا مساعدة، لمساعدة الأشخاص في المهام الصغيرة.

الطريقة التي يقوم بها مايكروسوفت بتنفيذها أكثر وضوحًا وبالتالي فإنها تجتذب كل الانتباه وتعزز صورة جوجل كشركة تكافح وتحاول اللحاق بالركب.

اقرأ إعلان إطلاق OpenAI GPT-4 الرسمي هنا.

اقرأ التقرير الألماني الأصلي هنا:

سيتم إطلاق GPT-4 الأسبوع المقبل - وسيكون متعدد الأوضاع، وفقًا لما ذكرته مايكروسوفت ألمانيا

المقالات ذات الصلة

عرض المزيد >>

أطلق العنان لقوة الذكاء الاصطناعي مع HIX.AI!