LightGPT

LightGPT-instruct-6B هو نموذج لغوي تم تطويره بواسطة AWS Contributors استنادًا إلى GPT-J 6B. تم ضبطه بدقة على مجموعة بيانات تعليمات OIG-small-chip2 ، والتي تحتوي على مثال تدريب 200 ألف تقريبًا em> وتم ترخيصه بموجب Apache-2.0.
إمكانيات النموذج: تم تصميم النموذج لإنشاء نص استجابة للمطالبات بتعليمات محددة ، باتباع تنسيق موحد. يتعرف على اكتمال استجابته عندما ينتهي موجه الإدخال بالرمز المميز “### Response: n”. تم تدريب النموذج خصيصًا للمحادثات الإنجليزية.
النشر وكود المثال: يتم دعم نشر نموذج LightGPT-instruct-6B على Amazon SageMaker ، وتوفر الوثائق مثالاً على رمز لتوضيح العملية.
مقاييس التقييم: يتم تقييم أداء النموذج باستخدام مقاييس مختلفة ، بما في ذلك LAMBADA PPL (الارتباك) و LAMBADA ACC (الدقة) و WINOGRANDE و HELLASWAG و PIQA و GPT-J.
القيود: النموذج يسلط الضوء على قيود معينة من النموذج. وتشمل هذه قدرتها على النضال مع اتباع التعليمات الطويلة بدقة ، وتقديم إجابات غير صحيحة لأسئلة الرياضيات والاستدلال ، وفي بعض الأحيان توليد إجابات خاطئة أو مضللة. يفتقر النموذج أيضًا إلى فهم السياق ويولد ردودًا تستند فقط إلى الموجه المحدد.
واقعة الاستخدام: