أداة OpenClaw: ذاكرة محلية للبحث في Telegram

أطلق مشروع OpenClaw حلاً برمجياً جديداً يوفر ذاكرة طويلة المدى للمساعدات الذكية، مصمماً لتمكين المستخدمين من إجراء بحث دلالي شامل داخل سجلات محادثات تطبيق Telegram الخاصة بهم دون الاعتماد على الخدمات السحابية المكلفة. تعتمد هذه الأداة على تقنيات التضمين المحلي وقواعد البيانات المتجهة لضمان بقاء المحادثات الخاصة مخزنة بأمان على جهاز المستخدم، مما يلغي الحاجة لدفع اشتراكات شهرية لواجهات برمجية مثل OpenAI أو Voyage التي قد تتراوح تكلفتها بين 5 و10 دولارات شهرياً.

يعمل النظام بنسبة 100% محلياً باستخدام وحدة المعالجة المركزية (CPU)، مما يجعله مناسباً للعمل على أجهزة الكمبيوتر المحمولة العادية دون الحاجة لبطاقات رسوميات متطورة. وتعد هذه الخطوة حلاً لمشكلة الخصوصية والتكلفة التي تواجه مطوري المساعدات الشخصية عند التعامل مع كميات ضخمة من البيانات النصية.

البنية التقنية ونتائج الأداء

يعتمد النظام في جوهره على نموذج nomic-embed-text-v1.5 لتوليد التضمينات (Embeddings) وقاعدة بيانات sqlite-vec لتخزين المتجهات. وقد أظهرت اختبارات الأداء التي أجراها الفريق على بيانات محادثات ثنائية اللغة (الروسية والإنجليزية) تفوق نموذج nomic-embed-text v1.5 الصغير، حيث حقق متوسط دقة (Top-1 Score) بلغ 0.69 مع زمن فهرسة لم يتجاوز 2.4 ثانية، رغم أن حجم النموذج يبلغ 84 ميجابايت فقط. في المقابل، سجل نموذج EmbeddingGemma (بحجم 300 مليون معلمة) دقة 0.60، بينما سجل نموذج Qwen3-Embedding (بحجم 0.6 مليار معلمة) دقة 0.56، مما يثبت كفاءة النماذج الصغيرة المحسنة في التعامل مع البيانات الحوارية.

تبدأ آلية العمل بتصدير سجلات Telegram إلى تنسيق JSON. يمكن لمستخدمي نظام Windows القيام بذلك عبر ميزة التصدير في تطبيق Telegram Desktop، بينما يمكن لمستخدمي نظامي macOS وLinux استخدام سكريبت بلغة Python يعتمد على مكتبة Telethon. بعد التصدير، يتم تقسيم البيانات إلى ملفات Markdown يومية (حوالي 50 رسالة لكل ملف) لتسهيل عملية البحث الدلالي، ثم يقوم النظام بفهرسة هذه الملفات محلياً.

المزامنة وقابلية التوسع

يدعم نظام OpenClaw المزامنة بين أجهزة متعددة باستخدام نظام Git. يمكن للمستخدمين إنشاء مستودع Git في مجلد الذاكرة ورفع التحديثات إلى خادم خاص. ومن خلال إعداد مهام مجدولة (Cron Jobs)، يمكن تحديث فهرس الذاكرة تلقائياً كل 5 دقائق عبر الأجهزة المختلفة، مما يضمن توحيد قاعدة المعرفة دون الحاجة لخدمة سحابية مركزية.

وفيما يتعلق بقابلية التوسع، يحافظ النظام على أداء ممتاز حتى مع زيادة حجم البيانات. عند التعامل مع 7,000 رسالة، يتم وصف جودة البحث بأنها "ممتازة" مع زمن فهرسة يبلغ 2.4 ثانية. وعند الوصول إلى 100,000 رسالة، يرتفع زمن الفهرسة إلى حوالي 30 ثانية مع الحفاظ على الجودة. أما عند تجاوز مليون رسالة، يقترح المطورون الانتقال إلى تقنيات "الرسم البياني المعرفي" (Knowledge Graph) للحفاظ على دقة النتائج.

خارطة الطريق: مشروع Vigil v2

كشف المطورون عن خططهم للمرحلة القادمة تحت اسم "Vigil v2"، وهو نظام ذاكرة مستقل بالكامل سيشمل رسماً بيانياً معرفياً مدعوماً بتقنية Kùzu لربط العلاقات بين الكيانات، بالإضافة إلى بحث هجين يجمع بين البحث المتجه وبحث الكلمات المفتاحية عبر SQLite FTS5. كما سيتضمن النظام استخراجاً محلياً للكيانات باستخدام نموذج Qwen 3، ومقاييس عصبية تحاكي الدوبامين والكورتيزول لتحديد أهمية الذكريات.

متطلبات التشغيل

البرنامج الأساسي: أي إصدار حديث من OpenClaw.
بيئة التشغيل: بيئة Node.js 20+ ولغة Python 3.10+ (لتشغيل سكريبتات التصدير).
التخزين: مساحة قرص تبلغ حوالي 100 ميجابايت لنموذج التضمين.
العتاد: لا يتطلب وحدة معالجة رسوميات (GPU)، يعمل بكفاءة على المعالج المركزي.

رأيي التقني

يمثل الانتقال نحو قواعد البيانات المتجهة المحلية مثل sqlite-vec قفزة نوعية في مجال الذكاء الاصطناعي الذي يحترم الخصوصية. يثبت تطبيق OpenClaw أننا لم نعد بحاجة إلى نماذج سحابية ضخمة ومكلفة لتحقيق بحث دلالي عالي الجودة في البيانات الشخصية. إن تفوق نموذج nomic-embed-text v1.5 الصغير (84 ميجابايت) على نماذج أكبر بكثير يؤكد أن التحسين البرمجي غالباً ما يتفوق على القوة الخام في مهام محددة مثل أرشفة المحادثات. بالنسبة للمطورين الذين يبنون مساعدات شخصية، تعد هذه البنية "صفرية التكلفة" المخطط المعياري المستقبلي للتعامل مع سياق المستخدم الحساس.