محتويات المقال
يستهلك المستخدمون بانتظام مبالغ تصل إلى 200 دولار شهرياً أو 47 دولاراً أسبوعياً على فواتير واجهة برمجة التطبيقات (API) الخاصة بوكيل OpenClaw، وذلك بسبب الاعتماد الافتراضي على نماذج مدفوعة مثل Claude Haiku وSonnet. بالنسبة للمطورين والمستخدمين المحترفين الذين ينشرون وكلاء ذكاء اصطناعي يعملون باستمرار، يعد تحسين هذه التكاليف أمراً بالغ الأهمية. من خلال الانتقال إلى النماذج المحلية عبر أداة Ollama أو الاستفادة من الفئات المجانية السحابية، يمكنك خفض إنفاقك الشهري إلى الصفر تقريباً مع الحفاظ على 70% من الوظائف الأساسية للوكيل.
اعتباراً من مارس 2026، أصبحت أداة Ollama مزوداً رسمياً معتمداً لوكيل OpenClaw، مما يلغي الحاجة إلى حلول التفافية معقدة. يجعل هذا التكامل التشغيل المحلي سلساً للغاية، مما يضمن عدم خروج بياناتك من جهازك أبداً. قبل الغوص في الإعدادات، تأكد من امتلاكك للتجهيزات المناسبة للتعامل مع أعباء العمل هذه بكفاءة.
المتطلبات الأساسية ومواصفات النظام
- تثبيت نشط لوكيل OpenClaw.
- الأجهزة للنماذج المحلية: جهاز Mac Mini بمعالج M4 (وذاكرة 16 غيغابايت)، أو حاسوب شخصي ببطاقة رسوميات طراز RTX 3090 أو 4090 (بذاكرة فيديو VRAM سعة 20 غيغابايت فأكثر) للحصول على أداء مثالي. يمكن للحواسيب المحمولة بذاكرة 8 غيغابايت تشغيل نماذج أصغر.
- الحسابات للنماذج السحابية: حسابات مجانية على منصة OpenRouter، أو Google AI Studio (لنموذج Gemini)، أو منصة Groq.
المسار الأول: تكوين النماذج السحابية المجانية
يعد هذا النهج مثالياً إذا كنت تفتقر إلى أجهزة محلية قوية. فهو يستفيد من الفئات المجانية لواجهات برمجة التطبيقات من كبار المزودين، على الرغم من أنك ستواجه في النهاية قيوداً على معدل الاستخدام أثناء الضغط المكثف.
- سجل للحصول على حساب في منصة OpenRouter للوصول إلى أكثر من 30 نموذجاً مجانياً، بما في ذلك طراز Llama 3.3 70B وطراز Nemotron Ultra 253B.
يضمن هذا الإجراء معالجة سياقات ضخمة (تصل إلى نافذة سياق بحجم 262 ألف رمز) دون الحاجة إلى وحدات معالجة رسوميات محلية باهظة الثمن. - حدّث ملف تكوين JSON الخاص بوكيل OpenClaw باستخدام مفتاح واجهة برمجة التطبيقات لمنصة OpenRouter.
يسمح هذا بتوجيه طلبات الوكيل عبر الفئة المجانية، متجاوزاً نقاط الاتصال المدفوعة لشركة Anthropic أو شركة OpenAI.
{
"env": {
"OPENROUTER_API_KEY": "sk-or-..."
},
"agents": {
"defaults": {
"model": {
"primary": "openrouter/nvidia/nemotron-ultra-253b:free"
}
}
}
}
كبديل، يمكنك استخدام نموذج Gemini Flash من شركة Google، والذي يوفر 15 طلباً في الدقيقة مجاناً. كما تقدم منصة Groq فئات مجانية سريعة للغاية، على الرغم من أن قيود معدل الاستخدام تكون أكثر صرامة للوكلاء الذين يعملون باستمرار.
المسار الثاني: تشغيل النماذج المحلية عبر Ollama (بتكلفة صفرية تماماً)
هذا هو الحل الجذري للتخلص من فواتير واجهة برمجة التطبيقات (API) بالكامل. نظراً لأن النماذج تعمل محلياً، فلا توجد قيود على معدل الاستخدام، ولا حاجة لمفاتيح API، وتنعدم مخاوف خصوصية البيانات.
- ثبّت أداة Ollama باستخدام أمر واجهة سطر الأوامر (CLI) الرسمي.
يؤسس هذا محرك الاستدلال المحلي المطلوب لتشغيل نماذج الذكاء الاصطناعي مباشرة على أجهزتك.
curl -fsSL https://ollama.com/install.sh | sh
- حمّل طراز Qwen3.5 المناسب بناءً على سعة ذاكرة الفيديو (VRAM) في نظامك.
يضمن هذا أداءً مثالياً؛ حيث يعد طراز 27B الخيار الأفضل لاستدعاء الأدوات، بينما يعمل طراز 35b-a3b بسرعة 112رمزآ في الثانية على بطاقة رسوميات طراز RTX 3090.
# للأجهزة بذاكرة فيديو 20 غيغابايت فأكثر (RTX 3090, 4090, M4 Pro/Max)
ollama pull qwen3.5:27b
# للأجهزة بذاكرة فيديو 16 غيغابايت
ollama pull qwen3.5:35b-a3b
# للأجهزة بذاكرة فيديو 8 غيغابايت (معظم الحواسيب المحمولة)
ollama pull qwen3.5:9b
- نفّذ أمر الإعداد الأولي لوكيل OpenClaw واختر Ollama من قائمة المزودين.
يؤدي هذا إلى الاكتشاف التلقائي لنماذجك المحلية عبر المنفذ http://127.0.0.1:11434، مما يجعل جميع تكاليف الاستدلال صفراً بشكل تلقائي.
openclaw onboard
- عطّل معلمة الاستدلال (Reasoning) وتجنب مسار واجهة برمجة التطبيقات
/v1إذا كنت تقوم بتكوين ملف JSON يدوياً.
يمنع هذا الفشل الصامت في استدعاء الأدوات، نظراً لأن أداة Ollama لا تدعم مطالبات دور "المطور" المستخدمة افتراضياً، كما أن مسار/v1يعطل مخرجات JSON.
{
"models": {
"providers": {
"ollama": {
"baseUrl": "http://localhost:11434",
"apiKey": "ollama-local",
"api": "ollama",
"models": [
{
"id": "qwen3.5:27b",
"name": "Qwen3.5 27B",
"reasoning": false,
"contextWindow": 131072,
"maxTokens": 8192
}
]
}
}
}
}
المسار الثالث: استراتيجية التوجيه الاحتياطي الهجين
تحتوي الإعدادات المجانية بالكامل على قيود. قد تواجه النماذج المحلية صعوبة في عمليات تصحيح الأخطاء (Debugging) المعقدة متعددة الخطوات، بينما تصل الفئات السحابية المجانية إلى حدود معدل الاستخدام. لذا، فإن الإعداد الأكثر كفاءة هو النهج الهجين المتسلسل.
- كوّن نظاماً احتياطياً متسلسلاً للنماذج في إعدادات OpenClaw.
يضمن هذا الموثوقية من خلال توجيه 70% من المهام اليومية إلى النموذج المحلي المجاني Qwen3.5 27B، مع الاحتفاظ بنموذج Claude Sonnet 4.6 حصرياً للتصعيدات المعقدة والطارئة.
{
"agents": {
"defaults": {
"model": {
"primary": "ollama/qwen3.5:27b",
"fallbacks": [
"openrouter/nvidia/nemotron-ultra-253b:free",
"anthropic/claude-sonnet-4-6"
]
}
}
}
}
تكاليف خفية يجب تجنبها
حتى إذا قمت بتحسين مهامك الأساسية، يمكن للعمليات الخلفية أن تستنزف ميزانيتك بصمت. كن على دراية بمستهلكات الموارد الخفية هذه:
- نبضات الاتصال (Heartbeats): يجري وكيل OpenClaw فحوصات صحية كل 30 إلى 60 دقيقة. إذا كان نموذجك الأساسي هو Claude Opus، فقد تكلف هذه النبضات وحدها من 30 إلى 50 دولاراً شهرياً. في المقابل، نبضات النماذج المحلية مجانية.
- وراثة الوكلاء الفرعيين (Sub-agents): عندما ينشئ وكيلك وكيلاً فرعياً للعمل المتوازي، فإنه يرث نموذجك الأساسي. تأكد من إعداد نماذج احتياطية لمنع الفواتير الضخمة الناتجة عن العمليات المتوازية.
- تضخم وظائف Cron: تنشئ كل وظيفة مجدولة (Cron job) سجل جلسة. على مدار أسابيع، تتراكم هذه السجلات وتضخم نافذة السياق الخاصة بك. تأكد من التحديث إلى أحدث إصدار للاستفادة من ميزة زمن بقاء الجلسة (Session TTL).
- مهارات Clawhub: تؤدي إضافة المهارات إلى حقن تعليمات إضافية في نافذة السياق الخاصة بك. في النماذج المحلية ذات السياق المحدود (8K-32K)، يمكن للمهارات أن تستهلك نصف السياق المتاح قبل أن تصدر أي مطالبة.
التكلفة الحقيقية للراحة
إن التفاوت بين فاتورة واجهة برمجة تطبيقات بقيمة 200 دولار شهرياً وإعداد هجين بتكلفة 2.40 دولار لا يتعلق بالقدرات الخام؛ بل هو "ضريبة الراحة". غالباً ما يحصل المستخدمون الذين يدفعون أسعاراً مميزة على أداء أفضل بشكل هامشي فقط في المهام الروتينية مثل إدارة التقويم، وعمليات البحث على الويب، والتعديلات البرمجية البسيطة. لقد أثبت النموذج المحلي Qwen3.5 27B قدرة عالية على التعامل مع هذه العمليات اليومية دون أي عناء.
مع تزايد دمج وكلاء الذكاء الاصطناعي في سير عملنا اليومي، فإن طبيعة "التشغيل الدائم" لهذه الأدوات تجعل الاعتماد الحصري على النماذج السحابية المدفوعة أمراً غير مستدام مالياً للمطورين المستقلين. أصبح نهج التوجيه الهجين - الذي يعتمد افتراضياً على الاستدلال المحلي ولا يصعد إلى النماذج السحابية إلا عندما يفشل في الاستنتاج - المعيار الصناعي الجديد بسرعة.
في النهاية، الهدف هو مطابقة تعقيد المهمة مع تكلفة النموذج. من خلال تدقيق عبء العمل الفعلي لوكيلك، ستجد على الأرجح أن 80% من إجراءاته تتطلب استثماراً مالياً صفرياً. ابدأ بالخيارات المجانية، ولا تدفع مقابل قدرات الاستنتاج المعقدة إلا عندما تتطلب المهمة ذلك حقاً.