لزوم مدیریت داده های تصویری در سیستم های مداربسته از جمله مسائل مهم در صنعت حفاظتی و نظارت تصویری است. به همین منظور این صنایع همواره در تلاش برای گسترش دستگاه ها یا سیستم ذخیره سازی از طریق توسعه نرم افزارها، تولید محصولات ابداعی و جدید و …هستند.
در سالهای اخیر تکنولوژی آنچنان به سرعت گسترش یافته به طوری که پیشرفت هایی که در ۴۰ سال اخیر صورت گرفته قابل مقایسه با چند صده گذشته نیست. یکی از مسائل پیشرو در فناوری های جدید استفاده از هوش مصنوعی در محصولات الکترونیکی است که دوربین های مداربسته نیز از این قاعده مستثنی نیستند. در این مقاله قصد داریم درباره کاربرد هوش مصنوعی در محصولات بپردازیم.
نارسایی های موجود در الگوریتم های هوشمند قدیمی
مسئله ای که در اینجا مطرح است برآورد تقاضای مشتری است که روز بروز ابعاد گسترده تری پیدا می کند. در گذشته در سیستم های مداربسته قابلیت هایی به شکل امروزی وجود نداشت اما رفته رفته با آمدن فناوری های جدیدتر این مسئله نیز برطرف شده به طوری که هم اکنون شاهد طیف وسیعی از قابلیت های پردازش تصویری اعم از جستجوی سوژه در تصاویر، تعقیب و ردیابی هوشمند و … هستیم.
اما موضوعی که در حال حاضر مطرح است بسیار فراتر از قابلیت های تصویری مذکور است. و با اینکه سیستم های نظارت تصویری هوشمند سال هاست که در دسترس بوده و مورد استفاده قرار می گیرند، اما، هنوز نتایج حاصل از آنها در حد ایده آل نیست.
یکی از شرکت های پیشرو در زمینه ادغام هوش مصنووعی با سیستم های مداربسته، شرکت هایک ویژن است که نام فناوری ابداعی خود را Deep learning گذاشته است. در این فناوری سعی شده است با بکارگیری هوش مصنوعی در محصولات بسیاری از نارسایی های سیستم های هوشمند قدیمی در تجزیه و تحلیل داده ها برطرف گردد.
از دلایل عمده افزایش محبوبیت Deep Learning در سال های اخیر می توان به موارد زیر اشاره نمود:
- توانایی پردازش داده ها در مقیاس زیاد
- قدرت محاسباتی فوق العاده
- ساختار شبکه ای
فرآیند تشخیص چهره در دوربین مداربسته یکی از قابلیت های مهم و کارآمد است که دارای الگوریتم های مختلف و پیچیده ای است. این فرآیند دارای دو مرحله کلیدی است:
- ارزیابی سوژه و بدست آوردن اطلاعات لازم از آن
- دسته بندی اطلاعات به دست آمده
ارزیابی سوژه و بدست آوردن اطلاعات لازم از آن
درجه دقت در این مرحله فاکتور بسیار مهمی است که مستقیما بر روی دقت الگوریتم تاثیر می گذارد. بیشتر کارهای پردازشی و محاسباتی مربوط به این بخش است. در دوربین های هوشمند قدیمی طراحی الگوریتم ها توسط متخصصین نرم افزار انجام می شد که اساسا بر اساس شاخصه های ذهنی بود. به همین دلیل تعریف بسیاری از ویژگی های انتزاعی به طرزی که برای انسان قابل درک باشد بسیار سخت بود و ناچارا از بین می رفت. در این دسته از دوربین ها با قابلیت تشخیص چهره بسیاری از فاکتورهای محیطی اعم از مکان نصب دوربین، زاویه دید، میزان نور در محیط بر روی کارایی این قابلیت تاثیر گذار هستند که این یک نکته منفی در آن محسوب می گردد. در الگوریتم هایی که بر اساس هوش مصنوعی طراحی شده اند اما سعی شده تا به نکات ظریف و جزئی دقت شود.
دسته بندی اطلاعات به دست آمده
سوژه های مختلف اعم از وسایل نقلیه، اشیا مختلف، افراد، حیوانات و … دارای ویژگی های ظاهری مختلفی هستند و تشخیص هر کدام بر اساس الگوریتم های تعریف شده متفاوتی است. از آنجایی که ویژگی های ظاهری یک وسیله نقلیه پیچیدگی خاصی نداشته و نهایتا شامل شاخصه هایی نظیر نوع آرم، ابعاد، رنگ و …است، دوربین های هوشمند قدیمی در تشخیص اشیا و وسایل نقلیه بسیار موفق عمل می کردند.
اما در مورد کاراکترهای ظاهری انسان به دلیل آنکه اغلب به دلیل تنوع بالا و پیچیدگی زیاد دچار خطا می شدند. و بازده خوبی ندارند به همین دلیل افزایش درک عمقی بواسطه طراحی الگوریتم های پیچیده تر در هوش مصنوعی به شدت لازمه کارکرد بهتر قابلیت تشخیص چهره در دوربین های مداربسته است.
آشنایی با مزایای DEEP Learning و مقایسه الگوریتم های آن
تکنولوژی هوش مصنوعی در هایک ویژن که آن را با نام Deep learning می شناسیم بر اساس پارامتر ها و الگوریتم هایی برای تشخیص المان های ظاهری پیچیده طراحی شده است. این بدین معنی است که طراحی ها دیگر توسط افراد انجام نشده و می توان آن را بر عهده ماشین ها گذاشت.
نکته جالب توجه اینکه طراحی این تکنولوژی بر اساس عملکرد سیستم عصبی مغز انسان انجام شده و همانطور که مغز توانایی یادگیری موضوعات و دسته بندی آنها را در لایه و سطوح مختلف خود دارد Deep learning نیز می تواند کاراکترهای متنوع را درک و دسته بندی کرده و اقدام لازم را در مورد آنها انجام دهد. کارایی این سیستم در جایی بارز و مشخص می گردد که می تواند اطلاعات اضافی و کم اهمیت را نیز تشخیص داده و در صورت لزوم حذف کند(object abstraction) و یا اینکه اطلاعات جدیدی خلق یا بازیابی(recreation) نماید. در زیر به برخی از راهکارهای مفید ارائه شده در Deep learning می پردازیم:
تبدیل الگوریتم های سطحی به عمیق
مدل های الگوریتمی در Deep learning برخلاف انواع قدیمی تر که دارای ساختاری دو یا سه لایه بودند دارای صد ها لایه متعدد است. به همین سبب این سیستم ها قادرند تا حجم وسیعی از اطلاعات را پردازش و دسته بندی کنند. همانطور که گفتیم مدل Deep learning منشا گرفته از سیستم یادگیری در مغز انسان است و از فرآیند انتزاعی لایه لایه تبعیت می کند.
هر لایه دارای شاخص و حجم پردازشی متفاوتی است و هر چه شاخص بالاتری داشته باشد مولفه های تعریف شده برای آن اختصاصی تر خواهند بود. مثال فرآیند یادگیری در این غالب بدین گونه است که یک پیام خارجی به محض دریافت از لایه های مختلف عبور کرده و پس از پردازش به صورت یک مفهوم و درک عمیق از سوژه مورد نظر برای انسان به صورت قابل درکی نمایش داده خواهد شد.
حرکت از الگوریتم های مشخص مصنوعی تا شناخت ویژگی ها
در مدل هوش مصنوعی Deep learning هیچگونه دخالت دستی انسان وجود ندارد و تمامی عملکردها به صورت کامپیوتری انجام می شود. این مدل قابلیت این را دارد که حجم بسیار زیادی از اطلاعات را مورد پردازش قرار دهد. طبقه بندی اطلاعات در آن به این صورت است که هرچه سوژه مورد نظر دارای جزئیات بیشتری باشد به صورت خیلی دقیق تری برای دستگاه قابل تشخیص خواهد بود. در زیر به بخشی از مزایای این مدل اشاره شده است:
- دقت تشخیص بالا در تشخیص سوژه که می تواند با قدرت مغز انسان برابری کرده و حتی در مواردی عملکرد بهتری نیز داشته باشد.
- قابلیت تشخیص دقیق سوژه های مختلف از یکدیگر
- قابلیت تشخیص و دسته بندی هزاران ویژگی از سوژه های مختلف
کاربردهای محصولات مبتنی بر Deep Learning
به دلیل رشد و پیشرفت تکنولوژی های صوتی تصویری اهمیت ابداع مدل هایی مانند Deep Learning بسیار افزایش می یابد. با استفاده از این الگو در قابلیت های هوشمند مانند تشخیص چهره، تشخیص نفوذ، ردیابی و تعقیب سوژه و … می توان به طور کامل انتظارات و نیاز های کاربران را برآورده ساخت. در زیر به بسیاری از کاربردهای این مدل در سیستم های نظارت تصویری اشاره شده است:
- تشخیص چهره
- شناسایی چهره
- تشخیص وسیله نقلیه مختلف اعم از موتوردار یا بدون موتور (دوچرخه و …)
- تشخیص آرم تجاری وسیله نقلیه
- تشخیص عابر پیاده
- تشخیص ویژگی های بدن انسان
- تشخیص ویژگی های غیر طبیعی صورت
- تجزیه و تحلیل رفتاری جمعیت، ردیابی چند هدف
- و …
منبع: tticctv