الرؤية الحاسوبية والذكاء الاصطناعي
بتقدم الذكاء الاصطناعي ظهرت تقنية مهمة جداً، أو يمكننا القول بأنها هي التي أسهمت في تقدم الذكاء الاصطناعي. أنا أتحدث عن أحد أبرز تقنيات الذكاء الاصطناعي المستخدمة الآن.. أعني الرؤية الحاسوبية (Computer Vision). تخيل أنك تستطيع تعليم جهاز كمبيوتر فهم ما يراه وتحليل المشاهد البصرية من حوله، تمامًا كما نفعل نحن البشر.
![]() |
| what is computer vision - الرؤية الحاسوبية والذكاء الاصطناعي |
تخيل يصديقي مدى التطبيقات والاستخدامات التي يمكن أن نقوم بها باستخدام هذه التقنية. في مقال اليوم بإذن الله، سنتحدث عن ماذا تعني الرؤية بالحاسب، وكيف يعمل نظام الرؤية الحاسوبية، وما الفرق بينه وبين معالجة الصور (Image Processing)، وفي النهاية سنذكر بعض التطبيقات التي تستخدم الـ Computer Vision بشكل أساسي في عملها. سعدت بوجودكم.
ما هي رؤية الحاسب
أرأيت العين في الإنسان يصديقي! هذه هي بالضبط تقنية الـ Computer Vision في الآلة أو الرؤية الحاسوبية كما قلنا (أحياناً أذكر المصطلح بالانجليزي وأحياناً بالعربي). عينيك ترى صور وأحداث مختلفة، فتمررها للمخ عن طريق أعصاب معينة، فيحللها المخ ويجعلك تفهم ما ترى بشكل بديهي جداً، ومن ثم تتخذ على أساس ذلك قرار ما أو قد لا يستدعي الأمر أخذ أي قرار من الأساس. الفكرة هنا أنه في حين أن المخ البشري يستخدم الخلايا العصبية لمعالجة المعلومات، فإن الآلة تعتمد على خوارزميات رياضية تعتمد على البيانات الضخمة وليس على "الأعصاب" بالمعنى الحرفي.
لتعريف أكثر إيضاحاً يصديقي، تقنية الـ Computer Vision هي أحد أبرز تقنيات الذكاء الاصطناعي المجوجودة حالياً، تستخدمها الآلات (لا يقصد بالآلات الروبوتات ولكن يقصد أي نظام حاسوبي) لكي تتعرف على الصور بشكل تلقائي وتقوم بوصفها بدقة وبكفاءة. تستخدم تقنية الـ Computer Vision التعلم العميق (Deep Learning) والشبكات العصبية الالتفافية (Convolutional Neural Networks) لتحليل الصور واستخراج المعلومات منها. باستخدام الـ Computer Vision سنجعل الآلة تتمكن من القيام بمهام مختلفة مثل التصنيف والمراقبة والتوصية والكشف.
التوصية شئ أساسي على مواقع التجارة الإلكترونية أمازون وغيرها.. ترشيح الفيديوهات على اليوتيوب والفيسبوك.. الكشف مثلاً عن المنتجات التي بها عيب كما في المصانع.. إلخ، سنتطرق بشكل أكبر لجزء التطبيقات في آخر المقال.
كيف يعمل نظام الرؤية الحاسوبية
كما قلنا نظام الرؤية الحاسوبية يعتمد على تقنيتان رئيسيتان وهما التعلم العميق (DL) والشبكات العصبية الالتفافية (CNNs)، وهناك تقنية أخرى تستخدم وهي الشبكات العصبية المتكررة (Recurrent Neural Networks أو RNNs).
بطريقة مختصرة، الفكرة الأساسية وراء عمل نظام الرؤية الحاسوبية، هو أنه يكون عندنا نموذج (Model) يتم تدريبه على كمية ضخمة من البيانات المرئية الخاصة بالمهمة المراد القيام بها، مثل الصور والفيديوهات. باستخدام هذه التقنيات يكون النموذج قد كون أنماط وطرق للتمييز بين الأشياء المختلفة. على سبيل المثال إذا تم تدريب النموذج على صور عديدة لسيارات مختلفة، فسيتمكن في المرة القادمة من تحديد أي صورة لسيارة بدقة.
![]() |
| كيف يعمل نظام الرؤية الحاسوبية |
هناك ملحوظة مهمة، التعلم العميق هو في الأساس مرحلة متقدمة من التعلم الآلي (ML)، يمكنك الرجوع يصديقي إلي مقالاتي السابقة "supervised and unsupervised learning" و "what is machine learning" ستفهم أكثر عن التعلم الآلي وعلاقته بالتعلم العميق، وكيف أنه هو المحور الأساسي في الذكاء الاصطناعي بشكل عام.
ما الفرق بين الرؤية الحاسوبية ومعالجة الصور
كما عرفت يصديقي الـ Computer Vision هو التقنية التي تمكن الآلة من فهم ما تراه وبناءً على ذلك يتم تنفيذ مهمة معينة، مثل تصنيف الصور. إذن ما الفرق بينه وبين معالجة الصور (Image Processing)؟
في الواقع على الرغم من بعض التشابهات بين التقنيتين، إلا أنهما مختلفين ويمكننا القول بأن تقنية معالجة الصور جزء من تقنية الرؤية الحاسوبية. يتم استخدام تقنية معالجة الصور بشكل أساسي في التعديل والتغيير على الصور؛ فنستطيع مثلاً تحسين الصورة وجعلها أكثر وضوحاً.
بإختصار تقنية معالجة الصور تستخدم للتعديل على الصور، بينما الرؤية الحاسوبية تستخدم لرؤية وفهم الصورة، ولا تغير فيها، قد تتضمن بعض التعديلات على الصورة (باستخدام تقنية معالجة الصور) كجزء من التحليل، لكن الهدف الرئيسي هو فهم الصورة وليس تعديلها بشكل أساسي.
تطبيقات الرؤية الحاسوبية
تطبيقات الرؤية الحاسوبية كثيرة ومتنوعة يصديقي، إذا كتبت على جوجل تطبيقات الرؤية الحاسوبية أو الـ computer vision ستجد أمامك كثير من الأشياء، ستجد أشياء تستخدمها يومياً والمفاجئة أنها مبنية على تقنية الـ Computer Vision. لقد ذكرنا بالفعل في جزئية "ما هي رؤية الحاسب" بالأعلى بعض التطبيقات الشائعة للتقنية، ولكن على سبيل الذكر هذه بعض التطبيقات الأخرى المنتشرة:
- التعرف على الوجه (Face Recognition): كما في موبايلك يصديقي.
- أنظمة الأمان والمراقبة (Security and Surveillance): كما في الأماكن العامة و الشركات و المصانع.. إلخ.
- مراقبة الجودة في الصناعات (Quality Control): مثل اكتشاف المنتجات التي بها عيوب، وإعادتها إلى التصنيع من جديد مثلاً.
- التعرف على النصوص من الصور (Optical Character Recognition - OCR): يمكننا بذلك تحويل أي كلام بداخل صورة إلى نص؛ فمثلاً لو عندنا كتاب كامل لا يتوفر إلا كصورة، يمكننا تحويله إلى نص بسهولة.
- المركبات ذاتية القيادة (Autonomous Vehicles): كما في سيارة Tesla، تعتمد بشكل أساسي على تقنية الـ Computer Vision بحيث تتمكن من رؤية الطريق وتتبع إشارات المرور ..إلخ، وعلى أساس ذلك تتصرف مثل الإنسان (للعلم هذا الأمر مازال يواجه بعض التحديات ولكنه في تطور مستمر) .
- تطبيقات البيع بالتجزئة (Retail Applications): مثل أمازون وعلي اكسبرس وحتى فيسبوك وغيرهم، يتم تحليل سلوك العملاء، وعلى أساس ذلك يتم ترشيح منتجات لهم، وفي الغالب هذه المنتجات كان عندهم الرغبة في شرائها فعلاً.
- تحسين الصور والفيديوهات (Image and Video Enhancement): يمكننا باستخدام تقنية الرؤية الحاسوبية وتقنية معالجة الصور تحسين جودة الصور والفيديوهات القديمة المهمة بالنسبة لنا، والتي غالباً ما تكون جودتها سيئة جداً ولا يفهم منها شئ.
- الزراعة (Agriculture): تستخدم في المساحات والمشاريع الزراعية الكبيرة، مثل مراقبة المحاصيل وجني الثمار الناضجة وفي المقابل ترك الأخرى إلى أن تنضج.. وهكذا.
كانت هذه فقط بعض التطبيقات، وهناك تطبيقات أخرى كثيرة. الفكرة أن المجال يتطور بشكل متسارع جداً، وكل فترة تظهر تطورات جديدة وتقنيات جديدة، وأرجو أن يكون ذلك في حدود النفع والإفادة.
الخاتمة
إلى هنا يصديقي، أعتقد أنك عرفت what is computer vision وعلاقته بالذكاء الاصطناعي، وكيف يعمل، وما الفرق بينه وبين تقنية معالجة الصور، كما أشرنا إلى بعض استخداماته. أرجو لي ولك التوفيق. إذا انتفعت مني بشئ ولو بسيط؛ فلا تنساني من صالح دعائك.
كان معكم علي وحيد.
"اللهم إن كان من توفيق فمنك وحدك وإن كان من خطأ أو نسيان فمني ومن الشيطان."
المصادر
التسميات
الذكاء الاصطناعي والتكنولوجيا

