بحث وتنفيذ تقنية التركيز التلقائي لعدسة الأشعة تحت الحمراء بناءً على مصفوفة البوابة القابلة للبرمجة ميدانيًا

بحث وتنفيذ تقنية التركيز التلقائي لعدسة الأشعة تحت الحمراء بناءً على مصفوفة البوابة القابلة للبرمجة ميدانيًا

ملخص

في ضوء الخصائص العامة للضوضاء الهامشية العمودية والضوضاء العشوائية في صور الأشعة تحت الحمراء، تعمل هذه الورقة على تحسين وتحسين خوارزمية تقييم حدة الأشعة تحت الحمراء وخوارزمية تسلق التل في عملية التركيز.

بحث وتنفيذ تقنية التركيز التلقائي لعدسة الأشعة تحت الحمراء بناءً على مصفوفة البوابة القابلة للبرمجة ميدانيًا
تلعب تقنية التركيز التلقائي دورًا مهمًا في مجال مراقبة التصوير الحراري بالأشعة تحت الحمراء. في الوقت الحاضر، توجد بعض المشكلات المتعلقة بتقنية التركيز التلقائي بالأشعة تحت الحمراء، مثل معدل النجاح المنخفض والهندسة المعمارية المعقدة وسرعة التركيز المنخفضة. لذلك، تقترح هذه الدراسة تقنية التركيز التلقائي لعدسة الأشعة تحت الحمراء المعتمدة على FPGA، والتي تحقق وظائف معالجة الصور بالأشعة تحت الحمراء وعرضها والتركيز التلقائي باستخدام FPGA واحد.

في ضوء الخصائص المشتركة للضوضاء الشريطية العمودية والضوضاء العشوائية في صور الأشعة تحت الحمراء، تعمل هذه الدراسة على تحسين وتحسين خوارزمية تقييم تعريف الأشعة تحت الحمراء وخوارزمية تسلق الجبال في عملية التركيز. أظهرت النتائج التجريبية أن الخوارزمية وطريقة التنفيذ المقترحة في هذه الدراسة يمكن أن تساعد في التركيز على عدسة الأشعة تحت الحمراء بشكل ملحوظ. وفي الوقت نفسه، تتميز الطريقة المقترحة بخصائص مثل التكامل العالي، وسرعة التركيز السريعة، ومعدل النجاح العالي، وبالتالي لديها آفاق تطبيق واسعة.

تم استخدام تكنولوجيا التصوير الحراري بالأشعة تحت الحمراء على نطاق واسع في الدفاع الوطني والحرب والكشف والمراقبة وغيرها من المجالات في السنوات الأخيرة. بالنسبة لشاشات التصوير الحراري المستخدمة في الدفاعات الحدودية والساحلية، يحتاج القرص الدوار الذي يعمل بالأشعة تحت الحمراء إلى فترة ثابتة من الدوران وتحديد المواقع أثناء الاستخدام لتحقيق غرض الدوريات. في كل مرة يتحول فيها إلى موضع جديد، فإنه يحتاج إلى إعادة التركيز للحصول على صورة واضحة. ولذلك، فإن وظيفة التركيز التلقائي لجهاز التصوير الحراري بالأشعة تحت الحمراء يمكن أن تسهل إلى حد كبير مراقبة واستخدام المشغل.

بالمقارنة مع تقنية التصوير بالضوء الأبيض المرئي، فإن تقنية التصوير بالأشعة تحت الحمراء تحقق تصوير الجسم المرصود بناءً على تسخين الجسم المرصود نفسه. نظرًا لأن مبدأ التصوير الخاص به لا يتوافق مع مبدأ التصوير بالضوء الأبيض المرئي، فإن تقنية التصوير بالأشعة تحت الحمراء وتكنولوجيا التصوير بالضوء الأبيض تتمتع بدرجة معينة من الإدراك. الاختلاف. لقد كانت تقنية التركيز التلقائي المستندة إلى الصور ناضجة جدًا في معالجة الصور بالضوء الأبيض. في الأدب [1] والأدب [2]، يستخدم المؤلف الكمبيوتر الشخصي وFPGA لإكمال التركيز التلقائي للعدسة بناءً على صور الضوء الأبيض المرئي، على التوالي.

في التطبيقات العملية، يتأثر أداء جهاز تصوير الكشف بالأشعة تحت الحمراء بعدة عوامل مثل كاشفات الأشعة تحت الحمراء، ودوائر التحويل التناظرية إلى الرقمية، وتبديد الحرارة الهيكلي، والعدسات البصرية. تقنية التركيز التلقائي للصور ذات الضوء الأبيض التقليدية لها تأثير ضعيف على التركيز التلقائي لصور الأشعة تحت الحمراء. لذلك، من الضروري اقتراح تقنية التركيز التلقائي بناءً على خصائص صورة الأشعة تحت الحمراء نفسها (ظاهرة الخطوط العمودية، والضوضاء المفرطة، وما إلى ذلك).

تقترح هذه الورقة تقنية التركيز التلقائي لعدسة الأشعة تحت الحمراء المعتمدة على FPGA. بالمقارنة مع الأدبيات [3]، فإنه يعمل على تحسين خوارزمية تقييم جودة الصورة لخصائص الخطوط العمودية في صورة الأشعة تحت الحمراء. بالمقارنة مع الأدبيات [4]، فإن صورة الأشعة تحت الحمراء صاخبة. الميزات قم بتحسين خوارزمية تسلق التل لتحقيق التحكم في العدسة.

بالمقارنة مع الأدبيات [5]، فإن هذه المقالة لا تعتمد على مشاركة الكمبيوتر المضيف. يتم تنفيذه بالكامل بواسطة FPGA نفسه لتحقيق الحصول على الصور، وتحسين الصورة، وتقييم تعريف الصورة، وتنفيذ خوارزمية تسلق التل، والتحكم في المحركات، وما إلى ذلك. وفي العمل، فإنه يحسن بشكل كبير تكامل التصوير الحراري بأكمله.

1. تكوين جهاز التصوير الحراري ومبدأ التركيز التلقائي

1.1 تكوين التصوير الحراري

يظهر في الشكل 1 جهاز التصوير الحراري مع وظيفة التركيز التلقائي المقترحة في هذه الورقة. وتشمل المكونات الرئيسية عدسة الأشعة تحت الحمراء، وكاشف الأشعة تحت الحمراء، ودائرة معالجة الصور، ودائرة FPGA، وDDR3، ودائرة محرك المحرك، ومحرك التركيز، وآلية التركيز. (العتاد الميكانيكي).
الشكل 1: التصوير الحراري بالأشعة تحت الحمراء للتركيز التلقائي

1.2 مبدأ عمل جهاز التصوير الحراري ومبدأ عمل التركيز التلقائي

يظهر الشكل 2 البنية الرئيسية للتصوير الحراري بالأشعة تحت الحمراء.
الشكل 2: الهيكل الرئيسي لجهاز التصوير الحراري بالأشعة تحت الحمراء

من الشكل 2 يمكننا أن نرى تكوين جهاز التصوير الحراري بأكمله. سير العمل للتصوير الحراري على النحو التالي.

(1) يدخل الضوء المستوى البؤري لكاشف الأشعة تحت الحمراء من خلال عدسة الأشعة تحت الحمراء. الطول الموجي الفعال للطيف الذي يمكن أن تمر به عدسة الأشعة تحت الحمراء هو 8-12 مترًا، والذي يمكنه تصفية الضوء الأبيض المرئي.

(2) يقوم المستوى البؤري للأشعة تحت الحمراء بتحويل ضوء الأشعة تحت الحمراء إلى إشارات كهربائية. دقة التصوير الفعالة للمستوى البؤري للأشعة تحت الحمراء المحدد هي 720 × 576.

(3) إخراج الإشارة بواسطة المستوى البؤري للأشعة تحت الحمراء هو إشارة فيديو تناظرية، والتي تحتاج إلى تحويل رقمي إلى تناظري في الدائرة، ويتم تحويل الإشارة التناظرية بالأشعة تحت الحمراء إلى بيانات فيديو رقمية زوجية وفردية مكونة من 14 بت مع شريحة تحويل الإعلانات AD9251.

(4) يجب إعادة تنظيم بيانات التكافؤ داخل FPGA، ثم يتم إجراء معالجة ما بعد الصورة مثل التصحيح غير الموحد وتحسين الصورة والشريط الرأسي وتعويض درجة الحرارة على صورة الأشعة تحت الحمراء. هذا الجزء ليس محور هذه المقالة ولن يتم مناقشته.

في هذه الخطوة، يجب ربط بيانات التكافؤ التي تم إنشاؤها في الخطوة (3) سطرًا تلو الآخر في صورة كاملة. تأتي القيم الرمادية لبكسلتين متجاورتين في كل سطر من الصورة من مصادر مختلفة (قنوات التكافؤ). إنتاج ظاهرة "الخطوط العمودية". الخطوط العمودية شائعة في التصوير بالأشعة تحت الحمراء. في هذه الخطوة، تعمل FPGA على تحسين الصورة لإزالة التداخل الذي تسببه الخطوط العمودية وجعل إطار الصورة بالكامل أكثر سلاسة وسلاسة.

(5) يتم تشفير بيانات الصورة المعالجة إلى تنسيق فيديو PAL من خلال دائرة خارجية وإخراجها مباشرة إلى الشاشة، أو يمكن ضغطها وترميزها إلى الخادم لعرضها عبر الشبكة. للتركيز التلقائي، يجب الاعتماد على بيانات الصورة التي تم إنشاؤها في هذه الخطوة.

(6) إجراء تقييم وضوح الصورة بناءً على الصورة التي تم إنشاؤها في (5). تتمتع FPGA بقدرات معالجة قوية للبيانات المتوازية، لذلك يتم اختيار خوارزمية الطاقة المتدرجة لتقييم الوضوح. تتطلب خوارزمية الطاقة المتدرجة شائعة الاستخدام معالجة البيانات لجميع وحدات البكسل في الصورة بأكملها، الأمر الذي يتطلب قدرًا كبيرًا نسبيًا من العمليات الحسابية ووقت معالجة طويلًا. تقترح هذه الورقة خوارزمية طاقة متدرجة محسنة لتقييم وضوح التصوير، راجع الفصل الثاني للحصول على التفاصيل.

(7) تقوم نهاية PL لـ FPGA بتمرير نتيجة تقييم وضوح الصورة إلى الرابط التالي للمعالجة. بالنسبة لهذه الخطوة، يعتمد كل (6) و (7) في تصميم الأدبيات [5] على تنفيذ الكمبيوتر الشخصي للكمبيوتر المضيف. ستستمر هذه المقالة في تنفيذ التركيز التلقائي بناءً على الوضوح داخل FPGA.

(8) يستخدم طرف PL لـ FPGA خوارزمية تسلق التل للتحكم في المحرك وفقًا لبيانات تقييم التعريف ثم يضبط البعد البؤري للعدسة، ويحصل أخيرًا على صورة واضحة ويكمل التركيز.

تُستخدم خوارزمية تسلق التل على نطاق واسع في التركيز التلقائي لتصوير الضوء المرئي. ومع ذلك، نظرًا للضوضاء الكبيرة والخطوط العمودية لصورة الأشعة تحت الحمراء نفسها، ستظهر حالة "قمة التل الزائفة" أثناء عملية التسلق. سيؤدي وجود "قمم التلال الكاذبة" بشكل مباشر إلى فشل التركيز التلقائي. لهذا السبب، قامت هذه المقالة بتحسين وتحسين خوارزمية تسلق التل، راجع الفصل 3 للحصول على التفاصيل.

باختصار، يظهر الشكل 3 عملية تحقيق التركيز التلقائي. العملية برمتها عبارة عن عملية ردود فعل مغلقة الحلقة، الأمر الذي يتطلب تعديلًا وتحسينًا متكررًا لتحقيق أوضح حالة للصورة في النهاية، أي الحالة المركزة. تستخدم هذه المقالة سلسلة ZYNQ من Xilinx FPGA FXC7Z030-2FBG676 لتنفيذ الخطوات المذكورة أعلاه (4) إلى (8). ينقسم ZYNQ إلى نهاية PL ونهاية PS.

نهاية PL عبارة عن مصفوفة بوابة منطقية قابلة للبرمجة لمعالجة الصور وتقييم التعريف، ونهاية PS هي نواة ARM، والتي تُستخدم لتنفيذ خوارزميات تسلق التل والتحكم في المحركات. في الوقت نفسه، تم تجهيز FPGA خارجيًا بشريحتين DDR3، النموذج هو Micron's MT41J128M16HA، بسعة شريحة واحدة تبلغ 256 ميجابايت وشريحتين بسعة 512 ميجابايت، والتي تستخدم للتخزين المؤقت لبيانات صورة الفيديو.
الشكل 3: عملية التركيز التلقائي

2. تحقيق تقييم جودة الصورة بالأشعة تحت الحمراء في FPGA

2.1 خوارزمية تقييم الوضوح

يقدم الأدب [6] مقدمة شاملة ومحددة لخوارزمية تقييم التعريف، حيث يجمع بين خصائص صور الأشعة تحت الحمراء وصعوبة تنفيذ FPGA. في هذا البحث، تم استخدام خوارزمية الطاقة المتدرجة للحكم على حدة الصورة.

كما هو موضح في الشكل 4، يتم تنفيذ مجموع فروق المربعات على القيم الرمادية للبكسلات في منطقة القناع 3×3 لبكسلات الصورة.
الشكل 4: حساب طاقة التدرج باستخدام قناع 3×3

بالنسبة للبكسل (x, y) في الشكل، حدد قيمة الطاقة الخاصة به على أنها F(x, y) كمجموع مربعات القيم الرمادية لوحدات البكسل الثمانية المجاورة المحيطة به واختلافاتها. كما هو موضح في الصيغة (1):
أضف مجموع كل مربعات فرق البكسل الرمادي للحصول على قيمة طاقة التدرج للصورة:
للحصول على صورة عالية الوضوح، نظرًا لأن تفاصيل الصورة أكثر، فإن قيمة الطاقة المتدرجة Fقيمةسوف تكون قيمة كبيرة نسبيا. بالنسبة للصورة غير الواضحة، لا تختلف قيمة كل بكسل كثيرًا، وقيمة Fقيمةهو أيضا صغير جدا. بالنسبة للصورة ذات البكسل الواحد (جميع قيم البكسل هي نفسها)، قيمة F = 0.

وبالتالي فإن قيمة Fقيمةيمكن أن يعكس درجة تفاصيل الصورة، والتي بدورها تعكس وضوح الصورة. يمكن لخوارزمية الطاقة المتدرجة تقييم حدة الصورة. تستخدم هذه المقالة هذه الخوارزمية لتقييم مدى وضوح صورة الأشعة تحت الحمراء.

2.2 تحسين خوارزمية الطاقة المتدرجة في الحكم على تعريف صورة الأشعة تحت الحمراء

تتمتع طاقة التدرج المذكورة في القسم 2.1 بنتيجة جيدة لتقييم وضوح صور الضوء الأبيض المرئي. ومع ذلك، نظرًا لأن صور الأشعة تحت الحمراء يتم ربطها ببيانات أعمدة فردية وزوجية (الخطوة 3 المذكورة في القسم 1.2)، فإن وحدات البكسل المجاورة اليمنى واليسرى تكون باللون الرمادي. تختلف قيمة الدرجة كثيرًا، كما أن تأثير التركيز المباشر باستخدام خوارزمية تقييم الطاقة المتدرجة التقليدية ليس جيدًا. قامت هذه المقالة بإجراء تحسينات معينة على الخوارزمية استجابة لهذه الظاهرة، باستخدام قناع 3×5 بدلاً من قناع 3×3، والذي يمكن أن يتجنب الاختلاف الناتج عن وحدات بكسل الصورة لمصادر الفيديو المختلفة ويقلل التشويش الناتج عن الوضع الرأسي المشارب إلى أصغر.

في الوقت نفسه، نظرًا للمتطلبات الزمنية للتركيز التلقائي لجهاز التصوير الحراري، فإن حساب طاقة التدرج المستخدم في هذه المقالة لا يحسب قيمة البكسل للصورة بأكملها ولكنه يأخذ وحدات البكسل الموجودة في منطقة الثلث الأوسط للحساب، بحيث يتم احتساب مبلغ الحساب لكامل الصورة 1/9 من المبلغ. بعد الكثير من التحقق التجريبي، فإن تأثير التركيز التلقائي المحسوب عن طريق أخذ مساحة 1/3 من وسط الصورة يتوافق مع تأثير الصورة بأكملها.

يظهر الشكل 5 التحديد المحسن للقناع ومنطقة المركز.
2.3 تنفيذ الخوارزمية المحسنة في FPGA

تستخدم نهاية PL لـ FPGA FIFO والتسجيل لتحقيق المخزن المؤقت لـ 9 بيانات لنافذة القناع. يحتاج البرنامج الموجود على جانب PL إلى إكمال ①تصميم توقيت إشارات التحكم في القراءة والكتابة FIFO؛ ②تخزين بيانات القناع 3×5 مؤقتًا؛ ③حساب مجموع التباين لقناع 3×5 أحادي البكسل، وإخراج البيانات.

يوضح الشكل 6 الرسم التخطيطي للتحكم الداخلي في القراءة والكتابة لـ FPGA لـ FIFO. عند وصول الصف الأول من البيانات، اكتبه في FIFO1؛ عند وصول الصف الثاني من البيانات، اقرأ الصف الأول من البيانات المخزنة في FIFO1 واكتبه في FIFO2، واكتب الصف الثاني من البيانات إلى FIFO2 في نفس الوقت؛ عند وصول الصف الثالث من البيانات، اقرأ البيانات الموجودة في FIFO1 وFIFO2 في نفس الوقت. في هذا الوقت، يدخل الصف الثالث من البيانات إلى مجموعة التسجيل اللاحقة REG1 مع الصفين الأول والثاني من البيانات المخزنة في FIFO1 وFIFO2 ~REG9. تمثل بيانات REG1~REG9 على التوالي (x-2,y-1)، (x،y-1)، (x+2،y-1)، (x-2،y)، (x، y)، (x+2,y), (x-2,y+1), (x,y+1), (x+2,y+1) 9 نقاط.
الشكل 6: تخزين بيانات القناع 3 × 3 مؤقتًا بواسطة FIFO والتسجيل
وفقًا للبيانات التسعة الموجودة في سجلات REG1~REG9 في الشكل 6، تحسب FPGA تباين القيم الرمادية للبكسلات في REG5 والسجلات الثمانية المتبقية (الصيغة (1)). نظرًا لأن الخوارزمية المحسنة تحسب فقط مساحة الثلث الأوسط، يقوم البرنامج بتعيين عداد الأعمدة وعدادات الصفوف لحساب الصفوف والأعمدة في إطار الصورة. عندما يصل عدد عداد الأعمدة إلى 241~480 وعدد عداد الصفوف إلى النطاق من 193~384 (يعني هذا النطاق أنه بالنسبة لشاشة بدقة 720×576، فإن 1/3 نقطة البكسل في المنطقة المركزية)، فإن بيانات البكسل تعتبر متاحة للحساب. قم بتجميع قيم التباين لجميع وحدات البكسل في هذا النطاق، وأخيرًا احصل على قيمة طاقة متدرجة 32 بت (الصيغة (2)).

وفقًا للنظرية المقدمة أعلاه، كلما كانت قيمة 32 بت أكبر، كانت الصورة أكثر وضوحًا، مما يوفر أساسًا لتسلق الجبال لتحقيق ضبط التركيز لاحقًا.

3. تنفيذ خوارزمية تسلق التل المحسنة في FPGA

3.1 التركيز التلقائي بناءً على خوارزمية تسلق التل

يحتوي المرجع [7] على مقدمة أكثر تفصيلاً لخوارزمية تسلق التل. كما هو موضح في الشكل 7، فإن المبدأ الأساسي لخوارزمية تسلق التل هو عملية التقريب المستمر لقيمة طاقة التدرج القصوى. كما يتبين من المخطط الانسيابي للتركيز التلقائي في الشكل 3، ستتغير الصورة بعد كل تركيز، وستتغير طاقة التدرج أيضًا وفقًا لذلك. في عملية التغيير المستمر هذه، أوجد الحد الأقصى لقيمة طاقة التدرج، وهي أوضح لحظة في الصورة. موضع العدسة المطابق لأوضح صورة هو موضع التركيز البؤري.

يمكن أن نرى من الرسم التخطيطي في الشكل 7 أن هناك 8 خطوات لتسلق الجبال في عملية التركيز. الخطوات الثلاث الأولى تكون دائمًا في عملية "الصعود"، والخطوتين الرابعة والخامسة تكون في عملية "الانحدار". في هذا الوقت، أصبحت الصورة أسوأ من الخطوة 3 السابقة، لذلك تبدأ الخطوتان السادسة والسابعة في "الرجوع إلى الجبل". بعد الخطوة السابعة، تجاوزت بالفعل قمة الجبل، لذلك قمت بتغيير طول الخطوة وصعدت أخيرًا إلى "قمة الجبل" في الخطوة الثامنة لإكمال عمل التركيز.
الشكل 7: خوارزمية تسلق التل
في العمل الفعلي، غالبًا ما يمكن إكمال عملية التسلق خلال 8 محاولات، من الضروري خلالها ضبط طول الخطوة بشكل مستمر لتحقيق غرض التركيز.

3.2 تحسين وتحقيق خوارزمية تسلق التل في التركيز التلقائي لعدسة الأشعة تحت الحمراء

يوضح الشكل 7 تنفيذ تسلق الجبال تحت شاشة الضوء الأبيض، وهو مثالي نسبيًا. بالنسبة لصور الأشعة تحت الحمراء ذات الضوضاء الكبيرة نسبيًا، سيكون هناك "قمم جبلية" متعددة أثناء عملية التسلق، كما هو موضح في الشكل 8.
الشكل 8: تسلق التل لتركيز صورة الأشعة تحت الحمراء

A وB وD في الشكل 8 هي "قمم الجبال الزائفة"، والتي تنتج عن الضوضاء في صورة الأشعة تحت الحمراء. وفقًا للعملية القياسية لتسلق الجبال، بدءًا من الموضع الأولي للعدسة لتسلق الجبل، من السهل الحكم بشكل خاطئ على A باعتباره قمة الجبل. في هذا الوقت، لا يمكن تحقيق الغرض من التركيز. لهذا السبب، تعمل هذه الورقة على تحسين خوارزمية تسلق الجبال للتركيز التلقائي لصورة الأشعة تحت الحمراء على النحو التالي.

(1) يتلقى طرف PS الخاص بـ FPGA قيمة طاقة التدرج المرسلة من طرف PL لتحديد ما إذا كان سيتم تسلق الجبل أم لا. من أجل تقليل تأثير الضوضاء، يتم حساب متوسط كل 3 قيم يتم تلقيها كأساس لتسلق الجبال، أي لحساب متوسط قيمة ثلاث قيم طاقة متدرجة لصورة ثابتة، وذلك لتقليل تأثير الضوضاء العشوائية على تقييم وضوح الصورة

(2) فيما يتعلق بآلية الحكم على ما إذا كان يجب "الرجوع للخلف وتسلق الجبل"، يتم الحكم على أنه عند طول الخطوة الحالية، إذا كان "أسفل الجبل" مرتين متتاليتين، فإنه يبدأ في النظر إلى الوراء. وبموجب هذه الآلية، سترتد القمم الصغيرة نسبيًا لـ A وB في قيمة طاقة التدرج أثناء عملية التحديد الثانية، والتي يتم الحكم عليها على أنها ذروة زائفة، لكن هذا الوضع لن يحدث عند الذروة الحقيقية C.

استنادًا إلى مخططي التحسين المذكورين أعلاه، تظهر عملية التركيز التلقائي على جانب PS المستند إلى FPGA في هذه المقالة في الشكل 9.
الشكل 9. خوارزمية تسلق التل المحسنة المطبقة على FPGA PS

4 تحقيق الوظيفة واختبار الأداء

4.1 تأثير التركيز

تم إعادة إنتاج ومقارنة تقنية التركيز التلقائي المقترحة في هذه الورقة وطرق التركيز التلقائي المقترحة في الأدبيات [2] والأدبيات [4] على التوالي. كما هو مبين في الشكل 10.
(أ) صورة الضوء المرئي (ب) الصورة الأصلية بالأشعة تحت الحمراء
(ج) الصورة المطبقة في الوثيقة[2] (د) الصورة المطبقة في الوثيقة[4]
(هـ) الصورة المنفذة بالطريقة المقترحة في هذه الورقة

الشكل 10. تتم مقارنة تأثير التركيز التلقائي المقترح في هذه الورقة مع المخططات الأخرى

تُظهر صور الأشعة تحت الحمراء الأربع في الشكل 10 تأثير التركيز لعدسة الأشعة تحت الحمراء. بالنسبة لعملية التركيز هذه، نظرًا لأن الصورة الأصلية واضحة نسبيًا، فإنها ستختبر قدرة خوارزمية التركيز على قراءة تفاصيل الصورة ومعالجتها. لإجراء تقييم موضوعي لحدة الصور الأربع (ب) و(ج) و(د) و(هـ)، يتم استخدام "قيمة تباين التدرج الرمادي" المقترحة في المرجع [8] لتقييم حدة الصور الأربع .

بالمقارنة مع الصورة الباهتة، يجب أن تحتوي الصورة ذات التركيز الواضح على اختلاف أكبر في التدرج الرمادي بين بياناتها، أي أن تباينها يجب أن يكون أكبر. يمكن قياس حدة الصورة من خلال تباين بيانات التدرج الرمادي للصورة، فكلما زاد التباين، كلما كان الوضوح أفضل.

حساب قيمة التباين الرمادي للصورة في MATLAB، وتظهر النتائج في الجدول 1.

الجدول 1: التباين الرمادي لأربع صور
ويتبين من الصورة في الشكل 10 والجدول 1:

لم تخضع صورة الأشعة تحت الحمراء الأصلية (ب) لأي معالجة للتركيز. على الرغم من أن الصورة يمكن أن تظهر صورة الكائن، إلا أنها لا تزال غير واضحة قليلاً بالعين المجردة، وقيمة تباين التدرج الرمادي الخاصة بها صغيرة نسبيًا، مما يشير إلى أن التفاصيل ليست كافية.

(ج) تتم معالجة الصورة بواسطة طريقة تركيز صورة الضوء الأبيض، دون النظر إلى خصائص ضوضاء الشريط العمودي لصورة الأشعة تحت الحمراء، وبالتالي فإن تأثير التركيز عام، ويمكن رؤيته من قيمة التباين في التدرج الرمادي.

(د) تم تحسين تأثير عرض الصورة إلى حد ما مقارنة بـ (ج)، لكنه لا يستطيع الوصول إلى تأثير الخوارزمية (هـ) المقترحة في هذا البحث. يجب أن تكون خوارزمية التحسين في عملية التسلق ليست جيدة بما فيه الكفاية.

(هـ) توضح الصورة تأثير العرض المركز الذي حققته الخوارزمية المقترحة في هذه الورقة. يمكن أن نرى بوضوح أن تأثير العرض أفضل من (د) و(ج).

يمكن أيضًا رؤية الجودة المحددة للصورة من خلال حجم قيمة تباين التدرج الرمادي للصور الأربع في الجدول 1، والصورة بعد تركيز الخوارزمية المقترحة في هذه الورقة هي الأكثر وضوحًا. يوضح أن الخوارزمية المقترحة في هذا البحث لها أداء وتأثير جيد في عملية التركيز التلقائي.

يقارن الشكل 11 صورة عرض التركيز التي تم الحصول عليها بعد حساب قيمة طاقة التدرج للصورة بأكملها وحساب قيمة طاقة التدرج لمنطقة 1/3. الصورة (ب) في الشكل 11 هي الصورة (هـ) في الشكل 10.
( أ ) حساب طاقة التدرج الكامل للصورة
( ب ) 1/3 حساب طاقة تدرج الصورة
              
الشكل 11 مقارنة عرض الصور بناءً على طاقة التدرج في منطقتين

من المقارنة بين الصورتين في الشكل 11، لا يوجد فرق في الأساس. الفرق بين متوسط قيمة المربع على المستوى الرمادي للاثنين أقل من 1، مما يوضح أن الطريقة المقترحة في هذه الورقة للحصول على قيمة طاقة التدرج من مركز 1/3 الصورة ممكنة. تتمثل ميزة هذه الخوارزمية المحسنة والمحسنة في أنها توفر وقت التركيز التلقائي واستهلاك موارد FPGA إلى حد كبير.

4.2 منحنى تسلق التل أثناء التركيز

يحلل هذا القسم منحنيات تسلق التل للخوارزميات الثلاثة في عملية التركيز التلقائي. وبما أن تسلق الجبال بأكمله يتم تحقيقه بناءً على دوران المحرك، فيمكن ملاحظة عملية تسلق الجبل بأكملها من خلال زاوية دوران المحرك.

فيما يلي مقارنة بين الخوارزميات الثلاثة (المرجع [2]، والمرجع [4]، وهذه المقالة) في عملية التركيز التلقائي، ودوران المحرك، والتركيز النهائي. بعد الاختبار السابق، نستنتج أن المحرك يحتاج إلى تدوير 751 في الاتجاه الإيجابي من الموضع الأولي إلى موضع التركيز، وهو الخط الأفقي المنقط المرجعي في الشكل 12.
شكل 12: منحنيات تركيز الدوران الحركي باستخدام ثلاث خوارزميات لتسلق الجبال

ويتبين من الشكل 12:

(1) تحتوي خوارزمية تسلق الجبال المقترحة في هذه الورقة على خطوة كبيرة نسبيًا في المرحلة المبكرة، لذا يمكنها الصعود إلى قمة الجبل بسرعة. في نهاية التسلق الثالث، تجاوز قمة الجبل، لذلك تم تقليل طول خطوة التسلق الرابع للحكم على ما إذا كانت "قمة جبل زائفة"؛

(2) الخوارزميات الثلاثة أكثر دقة في الحكم على "قمة الجبل" لأن الصورة نفسها نظيفة نسبيًا والضوضاء قليلة، لذا فإن التسلق الثانوي الذي تقترحه الخوارزمية في هذه الورقة لا يلعب دورًا هنا؛

(3) الخوارزمية المقترحة في هذه الورقة والخوارزمية المقترحة في الأدبيات [4] أكثر استجابة من الخوارزمية المقترحة في الأدبيات [2] في الحكم على الاتجاه الهبوطي، والتحكم أفضل؛

(4) وصلت الخوارزمية المقترحة في هذا البحث بشكل أساسي إلى حالة مستقرة (نهاية التركيز) بعد الصعود السابع ووصلت إلى نهاية التركيز عند الثلثين، ووصلت الخوارزمية الأخرى إلى حالة مستقرة بعد الصعود الثامن. الأدبيات [2] تستغرق الخوارزمية في [4] 3.6 ثانية، والخوارزمية في [4] تستغرق 3.4 ثانية؛

(5) تختلف الخوارزميات الثلاثة في حجم خطوة الإعداد وكل وقت تشغيل، لذلك يمكن أن نرى من الشكل 12 أن وقت عملية التسلق في المرحلة المبكرة يكون متسقًا نسبيًا، والوقت غير متسق إذا لم يكن هناك التكيف في المرحلة اللاحقة؛

(6) من منظور تأثير التركيز النهائي، فإن الخوارزمية المقترحة في هذا البحث أفضل من تأثير تركيز الأدب [2] والأدب [4]، وتأثير تركيز الأدب [2] هو الأسوأ، وهو نفس تأثير التركيز الموضح في الشكل 10.

4.3 اختبار وقت التركيز التلقائي

يمكن لنظام التركيز التلقائي للعدسة بالأشعة تحت الحمراء المعتمد على بنية FPGA إكمال عمل التركيز التلقائي بشكل أفضل. يتمتع وضع عمل وحدة المعالجة المركزية الفردية أيضًا بميزة كبيرة مقارنة بالبنيات الأخرى من حيث تكامل المنتج.

وفي الوقت نفسه، يتمتع هذا النظام أيضًا بأداء أفضل في الوقت الفعلي. انطلاقًا من المراجع، لا تشرح المخططات الأخرى وقت التركيز التلقائي أكثر من اللازم. بالنسبة للتصميم المقترح في هذه المقالة، يمكن التحكم فيه خلال 5 ثوانٍ من بداية التصوير وحتى الانتهاء من التركيز. يظهر تحليل استهلاك الوقت الرئيسي في الشكل 13. الوقت الإجمالي هو 3.55 ثانية، وهو أفضل من وقت التركيز التلقائي لمعظم كاميرات الأشعة تحت الحمراء في السوق.

4.4 استهلاك موارد FPGA

تستخدم هذه الورقة ثلث الشاشة بأكملها لحساب قيمة طاقة التدرج، وذلك بشكل أساسي لتوفير موارد FPGA ووقت الحساب. من وقت الحساب، يكون الفرق بين حساب طاقة تدرج البكسل للصورة بأكملها وحساب مساحة 1/3 هو 42.84-4.76 = 38.08 مللي ثانية. وعلى الرغم من أن هذه المرة صغيرة بالنسبة إلى 4.55 ثانية المستخدمة في عملية التركيز بأكملها، إلا أنها فترة طويلة نسبيًا لتشغيل برنامج FPGA الداخلي.
الشكل 13: الوقت المستغرق في التركيز التلقائي

بالنسبة لاستهلاك الموارد الداخلية لـ FPGA، يكون الفرق بين الاثنين كبيرًا نسبيًا أيضًا. يسرد الجدول 2 استهلاك موارد FPGA بالطريقتين.
يمكن أن نرى من الجدول 2 أن طريقة التركيز التلقائي المستخدمة في هذه المقالة لا تستخدم العديد من موارد FPGA الداخلية، حتى لو تم ذلك للشاشة بأكملها، فإن موارد XC7Z030 كافية. لكن بالنسبة إلى FPGAs، كلما قل استخدام الموارد، زادت إمكانية التحكم في البرنامج.

تهدف هذه الورقة إلى التركيز التلقائي للعدسة في جهاز التصوير الحراري بالأشعة تحت الحمراء، وتقترح تقنية التركيز التلقائي لعدسة الأشعة تحت الحمراء المستندة إلى FPGA. بالمقارنة مع تقنية التركيز التلقائي للضوء الأبيض المرئي وتقنية التركيز التقليدية بالأشعة تحت الحمراء، فإن التكنولوجيا المقترحة في هذه الورقة لديها ثلاثة تحسينات رئيسية:

①يستخدم الجهاز بأكمله معالج FPGA واحد لإكمال معالجة الصور بالأشعة تحت الحمراء وعرضها وتركيز العدسة، مما يحسن بشكل كبير تكامل المنتج؛

② تهدف إلى خصائص صور الأشعة تحت الحمراء ومزايا المعالجة المتوازية FPGA للبيانات، ويتم اقتراح خوارزمية طاقة متدرجة محسنة، والتي يمكنها حقًا تقييم وضوح صور الأشعة تحت الحمراء؛

③وفقًا لخصائص صور الأشعة تحت الحمراء، تم تحسين خوارزمية تسلق الجبال وتحسينها لتصفية قمم الجبال الزائفة بشكل فعال وتحقيق غرض تسلق الجبال.

تتحقق هذه الورقة من التحسينات التقنية الثلاثة المذكورة أعلاه، وتؤكد النتائج أيضًا تفوق الخوارزمية المقترحة في هذه الورقة. في الوقت الحاضر، تم تطبيق تقنية التركيز التلقائي المقترحة في هذه المقالة بشكل ناضج على منتجات التصوير الحراري، ووظائفها وأدائها على المستوى الرائد في الصناعة، ولها أهمية ترويجية جيدة. بصفته خبيرًا في كاميرات التصوير الحراري بالأشعة تحت الحمراء لسنوات عديدة، يستطيع Quanhom مشاركة بعض المعرفة المهنية والشاملة في مجال بصريات الأشعة تحت الحمراء.

كشركة مصنعة من ذوي الخبرةالمكونات الكهروميكانيكية البصريةتلتزم شركة Quanhom بتزويد المستخدمين بمجموعة متنوعة من كاميرات الأشعة تحت الحمراء الحرارية (LWIR وMWIR وSWIR) ذات الجودة الممتازة. لدينا سمعة جيدة في الصناعة بفضل تكنولوجيا البحث والتطوير الرائدة وتكنولوجيا التصنيع الممتازة. وتباع منتجاتنا في جميع أنحاء العالم وقد نالت الثناء والثقة من العديد من العملاء. إذا كنت تريد معرفة المزيد عن خدماتنا ذات الصلة، يمكنك أن ترسل لنا احتياجاتك، وسنقدم لك إجابة مرضية في أقرب وقت ممكن.

المؤلفون: صن شاوي، يانغ يويتاو، يانغ بينغوي، وان أنجون، تشونغ هايلين

مصدر المجلة: المجلد 43 العدد 5، تكنولوجيا الأشعة تحت الحمراء، مايو 2021

تاريخ الاستلام: 2020-11-07؛ تاريخ التعديل: 2021-03-24.

مراجع:

[1] جاو زيبين. بحث حول تقنية التركيز التلقائي لكاميرا الضوء المرئي للمنصة الكهروضوئية المحمولة جواً [د]. كلية الدراسات العليا بالأكاديمية الصينية للعلوم (معهد تشانغتشون للبصريات والآلات الدقيقة والفيزياء)، 2010.

[2] إن آي وينجيا. نظام مراقبة فيديو بالتركيز التلقائي يعتمد على FPGA[D]. ووهان: جامعة ووهان للتكنولوجيا، 2012.

[3] لي شنيانغ. خوارزمية التركيز التلقائي بناءً على قيمة طاقة صورة الأشعة تحت الحمراء [J]. شانشي للتكنولوجيا الإلكترونية، 2014(4): 6-9.

[4] زانغ بو، زانغ جانج، تشنغ يونغ تشيانغ. تصميم معالج الفيديو مع وظيفة التركيز التلقائي[J]. شاشات الكريستال السائل والعرض، 2010، 25(3): 396-400.

[5] وان شياوفان، ليو ياوين، زانغ دونغيان. تصميم نظام التصوير الحراري بالأشعة تحت الحمراء ذو التركيز التلقائي عبر الإنترنت [J]. تكنولوجيا الأشعة تحت الحمراء، 2018، 40(8): 743-748.

[6] وانغ جيان. بحث حول تقنية التركيز التلقائي بناءً على معالجة الصور [د]. تشنغدو: كلية الدراسات العليا بالأكاديمية الصينية للعلوم (معهد تكنولوجيا الإلكترونيات الضوئية)، 2013.

[7] شو تشيلي. بحث حول نظام التركيز التلقائي SEM المعتمد على FPGA[D]. نانجينغ: جامعة جنوب شرق، 2016.

[8] تشين غوجين، زو مياوفين، زانغ كيسونغ. دراسة عن وظيفة تقييم الحدة لعملية تركيز الصورة [J]. الحصول على البيانات ومعالجتها، 2009، 24(2): 165-169.