Skip to content

Commit

Permalink
Update docs/source/ar/chat_templating.md
Browse files Browse the repository at this point in the history
Co-authored-by: Abdullah Mohammed <554032+abodacs@users.noreply.github.com>
  • Loading branch information
AhmedAlmaghz and abodacs authored Oct 30, 2024
1 parent 3344ca0 commit 6222ee6
Showing 1 changed file with 1 addition and 1 deletion.
2 changes: 1 addition & 1 deletion docs/source/ar/chat_templating.md
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,7 @@

تعد **الدردشة** أحد استخدامات نماذج اللغات الكبيرة (LLMs) شائعة الاستخدام بشكل متزايد. ففي سياق الدردشة، وبدلاً من متابعة سلسلة نصية واحدة (كما هو الحال مع نماذج اللغات القياسية)، يواصل النموذج بدلاً من ذلك محادثة تتكون من رسالة واحدة أو أكثر، تتضمن كل منها دورًا، مثل "المستخدم" أو "المساعد"، بالإضافة إلى نص الرسالة.

تماما مثل التجزئة، تتوقع النماذج المختلفة تنسيقات إدخال مختلفة للغاية للدردشة. هذا هو السبب في أننا أضفنا **قوالب الدردشة** كميزة. قوالب الدردشة هي جزء من المحلل اللغوي. فهي تحدد كيفية تحويل المحادثات، الممثلة على شكل قوائم من الرسائل، إلى سلسلة واحدة قابلة للتحليل اللغوي بتنسيق النموذج المتوقع.
وكما هو الحال مع تقسيم النص إلى رموز (tokenization)، تتوقع النماذج المختلفة تنسيقات إدخال مختلفة تمامًا للمحادثة. لهذا السبب أضفنا **قوالب الدردشة** كميزة جديدة. تُعد قوالب المحادثة جزءًا من tokenizer. تحدد هذه القوالب كيفية تحويل المحادثات، والتي يتم تمثيلها كقوائم من الرسائل، إلى سلسلة نصية واحدة قابلة للتقسيم إلى رموز بالتنسيق الذي يتوقعه النموذج.

دعونا نجعل هذا ملموسًا بمثال سريع باستخدام نموذج `BlenderBot`. لدى BlenderBot قالب افتراضي بسيط للغاية، والذي يضيف في الغالب مسافات بيضاء بين جولات الحوار:

Expand Down

0 comments on commit 6222ee6

Please sign in to comment.