كيف يعمل ChatGPT؟

new-green.jpg

تعد ChatGPT واحدة من أرقى الأدوات الجديدة التي تعمل بالذكاء الاصطناعي ، ولكن الخوارزميات التي تعمل في الخلفية تعمل بالفعل على تشغيل مجموعة كاملة من التطبيقات والخدمات منذ عام 2020. لذا لفهم كيفية عمل ChatGPT ، نحتاج إلى البدء بالحديث عن اللغة الأساسية المحرك الذي يشغله.

GPT في ChatGPT هي في الغالب GPT-3 ، أو Generative Pre-المدرب Transformer 3 ، على الرغم من أن GPT-4 متاح الآن لمشتركي ChatGPT Plus - ومن المحتمل أن تصبح أكثر انتشارًا قريبًا. تم تطوير نماذج GPT بواسطة OpenAI (الشركة التي تقف وراء ChatGPT ومنشئ الصور DALL · E 2) ، لكنها تدعم كل شيء بدءًا من ميزات الذكاء الاصطناعي في Bing وحتى أدوات الكتابة مثل Jasper و Copy.ai. في الواقع ، تستخدم معظم مولدات نصوص الذكاء الاصطناعي المتوفرة حاليًا GPT-3 ، ومن المرجح أن تقدم GPT-4 كخطوة تالية.

جلبت ChatGPT GPT-3 إلى دائرة الضوء لأنها جعلت عملية التفاعل مع منشئ نصوص AI بسيطة و- والأهم من ذلك- مجانية للجميع. بالإضافة إلى أنه روبوت محادثة ، وقد أحب الناس روبوت محادثة جيد منذ SmarterChild.

في حين أن GPT-3 و GPT-4 هما أكثر نماذج اللغات الكبيرة (LLM) شيوعًا في الوقت الحالي ، فمن المحتمل أن تكون هناك منافسة أكثر بكثير خلال السنوات القليلة المقبلة. Google ، على سبيل المثال ، لديها Bard - روبوت محادثة AI الخاص بها - والذي يتم تشغيله بواسطة محرك اللغة الخاص به Pathways Language Model (PaLM 2). ولكن في الوقت الحالي ، يعد عرض OpenAI هو المعيار الفعلي للصناعة. إنها فقط أسهل أداة يمكن للأشخاص الحصول عليها.

لذا فإن الإجابة على "كيف يعمل ChatGPT؟" هي في الأساس: GPT-3 و GPT-4. لكن دعونا نحفر أعمق قليلاً.

ما هو ChatGPT؟

ChatGPT هو تطبيق تم إنشاؤه بواسطة OpenAI. باستخدام نماذج لغة GPT ، يمكنه الإجابة على أسئلتك ، وكتابة نسخة ، ومسودة رسائل البريد الإلكتروني ، وإجراء محادثة ، وشرح التعليمات البرمجية بلغات برمجة مختلفة ، وترجمة اللغة الطبيعية إلى رمز ، والمزيد - أو على الأقل محاولة - كل ذلك استنادًا إلى اللغة الطبيعية يطالبك إطعامه. إنه روبوت محادثة ، لكنه جيد حقًا.

2.png

في حين أنه من الرائع التلاعب بما إذا كنت تريد ، على سبيل المثال ، كتابة سونيت شكسبير عن حيوانك الأليف أو الحصول على بعض الأفكار لسطر الموضوع لبعض رسائل البريد الإلكتروني التسويقية ، إلا أنه مفيد أيضًا لـ OpenAI. إنها طريقة للحصول على الكثير من البيانات من مستخدمين حقيقيين وهي بمثابة عرض توضيحي رائع لقوة GPT ، والتي قد تشعر ببعض الغموض ما لم تكن متعمقًا في التعلم الآلي.

في الوقت الحالي ، يقدم ChatGPT نموذجين من GPT. الافتراضي ، GPT-3.5 ، أقل قوة ولكنه متاح للجميع مجانًا. يقتصر GPT-4 الأكثر تقدمًا على مشتركي ChatGPT Plus ، وحتى أنهم يتلقون فقط عددًا محدودًا من الأسئلة كل يوم.

تتمثل إحدى ميزات ChatGPT الكبيرة في قدرتها على تذكر المحادثة التي تجريها معها. هذا يعني أنه يمكنه استخلاص السياق من كل ما طلبته مسبقًا ثم استخدام ذلك لإبلاغ محادثته معك. يمكنك أيضًا طلب إعادة صياغة وتصحيحات ، وستشير مرة أخرى إلى كل ما كنت تناقشه من قبل. يجعل التفاعل مع الذكاء الاصطناعي يبدو وكأنه ذهاب وإياب حقيقي.

إذا كنت تريد حقًا التعود على ذلك ، فاذهب وقضاء خمس دقائق في اللعب مع ChatGPT الآن (إنه مجاني!) ، ثم عد لقراءة كيفية عمله.

كيف يعمل ChatGPT؟

تم استخدام مجموعة البيانات الضخمة هذه لتكوين شبكة عصبية التعلم العميق [ ... ] على غرار الدماغ البشري - مما سمح لـ ChatGPT بتعلم الأنماط والعلاقات في البيانات النصية [ ... ] للتنبؤ بالنص الذي يجب أن يأتي بعد ذلك في أي جملة معينة .

يعمل ChatGPT من خلال محاولة فهم الموجه الخاص بك ثم نطق سلاسل من الكلمات التي يتوقع أنها ستجيب على سؤالك بشكل أفضل ، بناءً على البيانات التي تم التدريب عليها.

دعنا نتحدث بالفعل عن هذا التدريب. إنها عملية يتم فيها إعطاء الذكاء الاصطناعي الناشئ بعض القواعد الأساسية ، ثم يتم إما وضعه في مواقف أو إعطاء كميات كبيرة من البيانات للعمل من خلالها من أجل تطوير خوارزمياته الخاصة.

تم تدريب GPT-3 على ما يقرب من 500 مليار "رمز مميز" ، مما يسمح لنماذج لغتها بتعيين المعنى بسهولة أكبر والتنبؤ بنص متابعة معقول. يتم ربط العديد من الكلمات برموز فردية ، على الرغم من أن الكلمات الأطول أو الأكثر تعقيدًا غالبًا ما تنقسم إلى رموز متعددة. في المتوسط ، يبلغ طول الرموز المميزة أربعة أحرف تقريبًا ، وقد ظل OpenAI هادئًا بشأن الأعمال الداخلية لـ GPT-4 ، ولكن يمكننا أن نفترض بأمان أنه تم تدريبه على نفس مجموعة البيانات نظرًا لأنه أكثر قوة.

image3.png
image4.png

جاءت جميع الرموز من مجموعة ضخمة من البيانات التي كتبها البشر. يتضمن ذلك الكتب والمقالات والمستندات الأخرى عبر جميع الموضوعات والأنماط والأنواع المختلفة - وكمية لا تصدق من المحتوى المأخوذ من الإنترنت المفتوح. في الأساس ، سُمح له بسحق المجموع الكلي للمعرفة البشرية.

تم استخدام مجموعة البيانات الضخمة هذه لتكوين شبكة عصبية للتعلم العميق - وهي خوارزمية معقدة ومتعددة الطبقات وموزنة على غرار الدماغ البشري - والتي سمحت لـ ChatGPT بتعلم الأنماط والعلاقات في البيانات النصية والاستفادة من القدرة على إنشاء مثل البشر. الردود من خلال التنبؤ بالنص الذي يجب أن يأتي بعد ذلك في أي جملة معينة.

على الرغم من أن هذا في الواقع يقلل من بيع الأشياء بشكل كبير. لا يعمل ChatGPT على مستوى الجملة - بدلاً من ذلك ، يقوم بإنشاء نص لما يمكن أن تتبعه الكلمات والجمل وحتى الفقرات أو المقاطع. إنه ليس النص التنبؤي على هاتفك الذي يخمن الكلمة التالية بصراحة ؛ إنها تحاول إنشاء استجابات متماسكة تمامًا لأي مطالبة.

لتحسين قدرة ChatGPT على الاستجابة لمجموعة متنوعة من المطالبات المختلفة ، تم تحسينها للحوار باستخدام تقنية تسمى التعلم المعزز مع التغذية المرتدة البشرية (RLHF). بشكل أساسي ، أنشأ البشر نموذجًا للمكافأة ببيانات المقارنة (حيث تم تصنيف استجابات نموذجية أو أكثر من قبل مدربي الذكاء الاصطناعي) ، بحيث يمكن للذكاء الاصطناعي معرفة الاستجابة الأفضل.

5.png

العودة إلى الشبكة العصبية التي شكلتها. بناءً على كل هذا التدريب ، تحتوي الشبكة العصبية لـ GPT-3 على 175 مليار من المعلمات أو المتغيرات التي تسمح لها بأخذ مدخلات - موجهك - وبعد ذلك ، بناءً على القيم والأوزان التي تقدمها للمعلمات المختلفة (وكمية صغيرة من العشوائية ) ، وتخرج كل ما تراه أفضل ما يتوافق مع طلبك. لم تذكر شركة OpenAI عدد المعلمات التي تحتويها GPT-4 ، ولكن من الآمن تخمين أنها أكثر من 175 مليارًا وأقل من 100 تريليون معلمة كانت شائعة في السابق. بغض النظر عن العدد الدقيق ، فإن المزيد من المعلمات لا يعني تلقائيًا أفضل. ربما تأتي بعض القوة المتزايدة لـ GPT-4 من وجود معلمات أكثر من GPT-3 ، ولكن ربما يرجع الكثير إلى التحسينات في كيفية تدريبها.

في النهاية ، فإن أبسط طريقة لتخيلها هي مثل إحدى ألعاب "إنهاء الجملة" التي لعبتها عندما كنت طفلاً.

في النهاية ، فإن أبسط طريقة لتخيلها هي مثل إحدى ألعاب "إنهاء الجملة" التي لعبتها عندما كنت طفلاً. على سبيل المثال ، عندما أعطيت ChatGPT باستخدام GPT-3 موجه الأوامر ، "Zapier is…" استجابت قائلة:

"Zapier هي أداة أتمتة قائمة على الويب تتيح للمستخدمين ربط تطبيقات الويب المختلفة معًا من أجل أتمتة المهام المتكررة وتحسين سير العمل."

هذا هو نوع الجملة الذي يمكنك أن تجده في مئات المقالات التي تصف ما يفعله زابير ، لذلك فمن المنطقي أنه نوع من الأشياء التي يبثها هنا. ولكن عندما أعطاها المحرر نفس الموجه ، قال:

"Zapier هي أداة أتمتة قائمة على الويب تتيح للمستخدمين ربط تطبيقات الويب المختلفة وأتمتة سير العمل فيما بينها."

هذا مشابه جدًا ، لكنه ليس نفس الاستجابة تمامًا. هذه العشوائية (التي يمكنك التحكم فيها في بعض تطبيقات GPT-3 مع إعداد يسمى "درجة الحرارة") تضمن أن ChatGPT لا يستجيب فقط لكل استجابة مع ما يرقى إلى إجابة الأسهم. يتم تشغيل كل مطالبة من خلال الشبكة العصبية بأكملها في كل مرة ، ودحرجة زوج من الزهر هنا وهناك للحفاظ على الأشياء جديدة. ليس من المحتمل أن تبدأ في الادعاء بأن زابير لون من كوكب المريخ ، لكنه سيخلط بين الكلمات التالية بناءً على احتمالاتها النسبية.

(لما يستحق الأمر ، عند تشغيله على GPT-4 ، قال ChatGPT: " Zapier هي أداة أتمتة قائمة على الويب تتيح للمستخدمين دمج المهام وأتمتتها بين التطبيقات والخدمات المختلفة عبر الإنترنت."

نطق الكلمات وليس المعرفة

صانعو ChatGPT هم أول من قال إنه يمكن أن ينتج معلومات غير صحيحة (وربما ضارة) ، على الرغم من أنهم يعملون بجد لإصلاحها.

هذا مثال بسيط. عندما طلبت من ChatGPT باستخدام GPT-3 و GPT-4 الرد على "Harry Guinness ..." ، أجاب GPT-3 أولاً بسؤال هاري غينيس. سؤال رائع - حرفيا اثنان منا! فقلت ، "هاري غينيس الكاتب" (هذا أنا). خمن GPT-4 من أكون على الفور ، على الرغم من أن كلا الردين كانا رائعين:

GPT-3: Harry Guinness كاتب وصحفي مستقل مقيم في أيرلندا. كتب لمجموعة متنوعة من المنشورات ، بما في ذلك The New York Times و The Guardian و The Huffington Post و Popular Mechanics. يغطي موضوعات تتراوح من التكنولوجيا والتصوير إلى السفر والثقافة.

GPT-4: هاري غينيس كاتب ومصور وخبير تقني أيرلندي. لقد كتب للعديد من المنشورات ، بما في ذلك How-To Geek و Lifehacker و Tuts +. يركز عمله بشكل أساسي على التكنولوجيا والبرامج التعليمية والنصائح ، بالإضافة إلى التصوير الفوتوغرافي وتحرير الصور. اكتسبت موسوعة جينيس سمعة طيبة في إنشاء أدلة تفصيلية تساعد القراء على فهم الموضوعات المعقدة أو حل المشكلات بطريقة مباشرة.

يتم سحب الأسطر الأولى والأخيرة من GPT-3 حرفيًا تقريبًا من مواقع الويب المختلفة الخاصة بي ومن السير الذاتية للمؤلف حول الويب (على الرغم من أنني عادةً ما أدرج نفسي ككاتب مستقل ومصور فوتوغرافي ، وليس صحفيًا). لكن قائمة المنشورات مكونة أساسًا. لقد كتبت لصحيفة The New York Times ، ولكن ليس لصحيفة The Guardian أو The Huffington Post أو Popular Mechanics (أكتب بانتظام لـ Popular Science ، لذلك قد يكون هذا هو مصدرها).

تحصل GPT-4 على جزء المصور بشكل صحيح وتسرد بالفعل بعض المنشورات التي كتبت من أجلها ، وهو أمر مثير للإعجاب ، على الرغم من أنها ليست أكثر المنشورات التي سأفتخر بها. إنه مثال رائع على كيف تمكنت OpenAI من زيادة دقة GPT-4 بالنسبة إلى GPT-3 ، على الرغم من أنها قد لا تقدم دائمًا الإجابة الصحيحة .

لكن دعنا نعود إلى GPT-3 حيث يقدم الخطأ مثالًا مثيرًا للاهتمام لما يحدث وراء الكواليس في ChatGPT. في الواقع لا يعرف أي شيء عني. إنه ليس حتى نسخ / لصق من الإنترنت والثقة في مصدر المعلومات. بدلاً من ذلك ، فهو ببساطة يتنبأ بسلسلة من الكلمات التي ستأتي بعد ذلك بناءً على مليارات نقاط البيانات التي يمتلكها.

على سبيل المثال: يتم تجميع New York Times في كثير من الأحيان مع The Guardian و Huffington Post مقارنة بالأماكن التي كتبت عنها ، مثل Wired ، و Outside ، و The Irish Times ، وبالطبع Zapier. لذلك عندما يتعين عليها تحديد ما يجب أن يتبعه من صحيفة نيويورك تايمز ، فإنها لا تسحب من المعلومات المنشورة عني ؛ يسحب قائمة المنشورات الكبيرة هذه من جميع بيانات التدريب التي لديه. إنه ذكي جدًا ويبدو معقولًا ، لكنه ليس صحيحًا.

يقوم GPT-4 بعمل أفضل بكثير ويسلط الضوء على المنشورات ، لكن بقية ما يقوله يبدو وكأنه جمل متابعة معقولة. لا أعتقد أنه يحظى بأي تقدير كبير لسمعتي: إنه مجرد قول الشيء الذي تقوله السيرة الذاتية. إنها أفضل بكثير في إخفاء كيفية عملها من GPT-3 ، على الرغم من أنها في الواقع تستخدم نفس الأسلوب إلى حد كبير.

ومع ذلك ، من المثير للإعجاب مدى تحسن GPT بالفعل. في الوقت الحالي ، تم قفل GPT-4 خلف اشتراك متميز ، لذا فإن معظم محتوى ChatGPT الذي تراه سيعتمد على GPT-3 ، ولكن قد يتغير ذلك خلال الفترة التالية. من يدري ما سيحققه GPT-5.

ما هي واجهة برمجة تطبيقات ChatGPT؟

لا تملك شركة أوبن أيه آي موقفاً خاصاً بنا فيما يتعلق بتقنيتها. تمتلك الشركة منصة API تسمح للمطورين بدمج قوة ChatGPT في تطبيقاتهم وخدماتهم (مقابل سعر بالطبع).

يستخدم Zapier واجهة برمجة تطبيقات ChatGPT لتشغيل تكامل ChatGPT الخاص به ، والذي يسمح لك بتوصيل ChatGPT بآلاف التطبيقات الأخرى وإضافة الذكاء الاصطناعي إلى تدفقات عملك المهمة. فيما يلي بعض الأمثلة لتبدأ بها ، ولكن يمكنك تشغيل ChatGPT من أي تطبيق.

يمكنك أيضًا الاستفادة من نماذج OpenAI الأخرى - مثل DALL · E و Whisper - مع تكامل OpenAI الخاص بـ Zapier. أتمتة سير العمل الذي يتضمن إنشاء الصور ونسخ الصوت مباشرة من التطبيقات التي تستخدمها بالفعل.

القراءة ذات الصلة: كيف يمكنك (ومتى لا يجب عليك) استخدام ChatGPT لكتابة نسخة تسويقية

المقالات ذات الصلة

عرض المزيد >>

أطلق العنان لقوة الذكاء الاصطناعي مع HIX.AI!