تدريب الذكاء الاصطناعي

كيفية ضبط نماذج اللغة الكبيرة للعربية: دليل ٢٠٢٥

فريق أبحاث الذكاء الاصطناعي — ALAMIA·١٥ مارس ٢٠٢٥·١٢ دقيقة قراءة

العربية من أصعب اللغات على نماذج اللغة الكبيرة — وأهمها استراتيجياً. يتجاوز عدد المتحدثين ٤٠٠ مليوناً في ٢٢ دولة، وتنمو الاقتصادات الرقمية بسرعة في السعودية وقطر والإمارات وشمال أفريقيا؛ من يتقن معالجة العربية يكتسب ميزة تنافسية كبيرة.

في ALAMIA، ضبطنا نماذج لغة كبيرة للعربية في عشرات مشاريع المؤسسات — من رقمنة الحكومة السعودية ضمن رؤية ٢٠٣٠ إلى أتمتة خدمة العملاء بالدارجة المغربية. يقدّم هذا الدليل منهجيتنا المجرّبة.

لماذا العربية صعبة على نماذج اللغة الكبيرة

تُدرَّب النماذج العامة غالباً على الإنجليزية. العربية تطرح تحديات مميزة:

ازدواجية اللغة — الفصحى العصرية واللهجات (دارجة، خليجية، مصرية) سجلات مختلفة حسب السياق
كتابة من اليمين لليسار — التقطيع وأنماط الانتباه تحتاج معالجة مخصصة
صرف غني — التذكير والتأنيث والعدد والإعراب عبر الزوائد، ما يوسّع التباين المفرداتي
تبديل شفرات — في المغرب العربي مزج فرنسي-عربي دائم؛ في الخليج مزج إنجليزي-عربي
بيانات تدريب محدودة — العربية أقل من ٣٪ من Common Crawl، وهو أساس تدريب كثير من النماذج

الخطوة ١ — اختيار النموذج الأساسي المناسب

ليست كل النماذج متساوية في العربية. توصياتنا من اختبارات الإنتاج:

Llama 3.1 8B

★★★★☆

أفضل توازن للضبط العربي. أساس متعدد اللغات قوي.

Mistral 7B v0.3

★★★★☆

ممتاز للعربية الخليجية. استدلال سريع ومناسب للمؤسسات.

Falcon 7B

★★★☆☆

من الإمارات، قاعدة عربية جيدة. أقل توجيهاً بالتعليمات.

AraGPT2

★★★★★

أصل عربي. الأفضل لمهام التوليد بالفصحى.

الخطوة ٢ — إعداد مجموعات البيانات

جودة البيانات هي كل شيء. للضبط العربي تحتاج:

مجسّم نطاقي — على الأقل ٥٠ ألف مثال باللهجة والمجال المستهدفين
وسم اللهجات — فصل واضح بين الفصحى والخليج والدارجة وحالات التبديل
صيغة التعليمات — تحويل النص الخام إلى أزواج تعليم-استجابة للتوليف الخاضع للإشراف
ترشيح الجودة — إزالة تناقضات التشكيل وأخطاء الترميز والعربية المحوّلة حرفياً

⚠️ خطأ شائع

لا تمزج الفصحى والدارجة في دفعة ضبط واحدة دون وسوم لهجة. النماذج المدرّبة على مزيج غير موسوم تنتج لغة هجينة ضعيفة في كل لهجة وتربك المستخدمين المؤسسيين.

الخطوة ٣ — إعدادات الضبط

فرط معاملات مختبرة في الإنتاج لنماذج ٧B على ضبط التعليمات العربية:

# ALAMIA Arabic Fine-tuning Config
training_args = {
    "model_name":        "meta-llama/Meta-Llama-3.1-8B",
    "learning_rate":     2e-4,
    "num_train_epochs":  3,
    "per_device_batch":  4,
    "gradient_accum":    8,          # effective batch = 32
    "warmup_ratio":      0.03,
    "lr_scheduler":      "cosine",
    "lora_r":            64,          # higher r for Arabic morphology
    "lora_alpha":        128,
    "lora_dropout":      0.05,
    "target_modules":    ["q_proj", "v_proj", "k_proj", "o_proj"],
    "max_seq_length":    2048,
    "bf16":              True,
}

ملاحظة: نستخدم رتبة LoRA ٦٤ بدلاً من ١٦–٣٢ المعتادة بالإنجليزية. الصرف الغني للعربية يستدعي رتبة أعلى لالتقاط أنماط المفردات الإضافية.

الخطوة ٤ — التقييم للعربية

معايير الإنجليزية (MMLU، HellaSwag) غير كافية. استخدم:

ALUE — ثماني مهام تشمل المشاعر والكيانات المسماة والإجابة والاستنتاج اللغوي
AraBench — دقة تمييز اللهجة عبر ١٧ لهجة عربية
ARCD — فهم القراءة العربية لتقييم الإجابة على الأسئلة
تقييم بشري — دائماً مع متحدثين أصليين من المنطقة المستهدفة (الخليج ≠ المغرب)

نتائج فعلية من مشاريع ALAMIA

درجة F1 لاستخراج الكيانات — عربية الخليج

٦١٪

قبل

+٢٨

٨٩٪

بعد

دقة مشاعر الدارجة

٥٤٪

قبل

+٣٠

٨٤٪

بعد

استخراج نص قانوني بالفصحى

٧١٪

قبل

+٢٣

٩٤٪

بعد

التعامل مع التبديل فرنسي-عربي

٣٨٪

قبل

+٣٨

٧٦٪

بعد

تحتاج ذكاء اصطناعي بالعربية لمؤسستك؟

تتخصص ALAMIA في معالجة العربية لأسواق الخليج وشمال أفريقيا والlevant. اطلب استشارة مجانية.

تقييم مجاني للذكاء الاصطناعي العربي