کتاب پردازش تصاویر دیجیتالی با روشهای نوین یادگیری تنسوری و منیفلدی در MATLAB، اثر علیرضا شجاعی فرد و حمیدرضا یزدانی؛ ضمن معرفی مبادی و مفاهیم اولیه ریاضی مورد نیاز در مباحث پردازش تصاویری دیجیتالی و ماشین بینایی، از قبیل ماتریسها، تنسورها، منیفلدها و فضاهای هندسی مرتبط و نیز مبادی علم داده و تجزیه و تحلیل کلان دادهها، جعبه ابزارها، بستههای نرمافزاری و کدهای عملیاتی مرتبط با الگوریتمها و روشهای حل مسائل تکمیل ماتریسی، تکمیل تنسوری و روشهای نوین ترکیبی تنسوری - منیفلدی را در ارتباط با پردازش تصاویر و بینایی ماشین در نرم افزار متلب، مورد بحث و بررسی قرار می دهیم.
در هر قسمت، پیش زمینه ریاضی و هندسی کار توضیح داده شده، پس از بیان الگوریتم اصلی به صورت گام به گام، نحوه پیادهسازی کدها و برنامهها را خواهیم دید، همچنین برای نمونه آنها را بر چند مثال پیادهسازی نموده تا توان عملیاتی و کارایی آنها را محک بزنیم هر یک از روشهای مطرح شده شامل روشهای شناخته شده کاهش بعد نظیر تحلیل مؤلفه اصلی و تحلیل تفکیکی خطی یا روشهای طیفی نظیر شناسایی چهره ویژه و فیشر و نیز روشهای یادگیری منیفلدی و تنسوری دارای نقاط قوت و ضعف مختص به خود هستند که در بخشهای مرتبط آورده شدهاند.
نکته قابل توجه این است که روشهای ترکیبی در این میان موفقیت بیشتری داشتهاند. ترکیب روشهای مرسوم کاهش بعد خطی نظیر PCA و LDA با تنسورها و ایجاد الگوریتمهای نوینی نظیر MPCA و MLDA خود شاهدی بر این مدعاست. در نهایت، روشهای مرتبط را مقایسه نموده، با بیان نقاط قوت و ضعف هر روش در قیاس با دیگر روشها رهیافتهای محاسباتی را درباره کارایی و توانایی هر روش در رویارویی با مسائل مرتبط با آن ارائه مینماییم. بر اساس نوع پایگاه داده و حجم دادههای مورد بررسی، میزان اهمیت هزینه محاسباتی و به ویژه زمان مصرف شده برای شناسایی تصاویر، میتوان روش مناسب را انتخاب نمود.
۲-۴ بستههای نرمافزاری
در این بخش ابتدا به بیان و بررسی بستههای نرمافزاری میپردازیم. این بستهها در انواع کدها و برنامههای عملیاتی که بعداً بررسی میشوند، به صورت پیشفرض بارگزاری شده و به کار میروند. برای دانلود این بستهها و جعبه ابزارها میتوانید به این سایتها مراجعه نمایید، البته بسیاری از کدها و جعبه ابزارهای مرتبط از سایتهایی نظیر جیتهاب و جیت لب نیز قابل دانلود هستند. بنابراین ابتدا در این بخش آنها را توضیح میدهیم و سپس در بخش بعدی به سراغ کدهای برنامهها و الگوریتمهای مطرح میپردازیم.
۱-۲-۴ بسته تنسوری
این بسته تنسوری شامل مجموعه کدهایی برای تجزیه کاملاً مثبت (CP) آرایههای چند مسیری، ۴ نوع بهینهسازی روشهای جستجوی خطی (ELS) با محدودیتهای مثبت، HOSVD در زمینه کار با تنسورهای حقیقی و مختلط است. اما ALS (کمترین مربعات جایگزین) تنها با تنسورهای مختلط کار میکند؛ محدودیتهای مثبت تنها با ALS کار میکنند. ظاهراً ELS با تنسورهای مرتبه ۵ و ۷ به خوبی عمل نمیکند، همچنین با تنسورهای مختلط به خوبی عمل نمینماید. روشهای تنزل گرادیان (grad)، لونبرگ - مارکات (lm) و نیز گرادیان مزدوج با مرحله بهینه (nlcg) نیز به کار برده شدهاند. در پایان عملگرهای بردار یکانی (unvec)، وارون برداری و ضرب خاتری - رائو نیز استفاده شدهاند.
۲-۲-۴. جعبه ابزار تنسوری رتبه پایین
این مجموعه شامل مقایسهای از پیادهسازی روشهای نیوتن گراسمانی و شبه نیوتن گراسمانی بر روی چند مثال با بیان نتایج آنها (در tensorAlgs) و نیز جعبه ابزاری برای محاسبات مربوط به منیفلدهای گراسمانی (در grassClasses) است:
1)ضرب داخلی دو بردار مماسی.
2)نرم بردارهای مماسی.
3)انتقال موازی در راستای بردارهای موازی.
4)انتقال موازی در راستای ژئودزیکهای منیفلدهای گراسمانی.