PrinceofAI Weekly

هفته نامه شماره پنجاه ونهم

Feb 21, 2024

استفاده از یادگیری عمیق در تشخیص پارکینسون از طریق چشم

این مطالعه پتانسیل تصویربرداری شبکیه را به عنوان یک ابزار تشخیصی برای بیماری پارکینسون (PD) مورد بحث قرار می‌دهد، که با علائم حرکتی و غیرحرکتی به دلیل از دست دادن نورون‌های دوپامینرژیک مشخص می‌شود. مرگ و میرهای مرتبط با PD افزایش یافته است و نیاز به سیستم های تشخیصی بهتر را برجسته می کند. تصویربرداری شبکیه، که به عنوان پنجره ای به مغز دیده می شود، بینش هایی را در مورد بیماری های نورودژنراتیو ارائه می دهد. الگوریتم‌های هوش مصنوعی (AI)، از جمله مدل‌های یادگیری عمیق، به عنوان ابزار تشخیصی کارآمد پیشنهاد شده‌اند. هدف این مطالعه بررسی عملکرد طبقه‌بندی الگوریتم‌های هوش مصنوعی در مراحل مختلف PD، دستیابی به نتایج امیدوارکننده در پیش‌بینی بروز PD قبل از تشخیص است. شبکه‌های عصبی عمیق از مدل‌های یادگیری ماشین معمولی بهتر عمل می‌کنند و پتانسیل مداخله زودهنگام بیماری را نشان می‌دهند. این مطالعه بر نقش سیستم های هوش مصنوعی خودکار در کمک به چشم پزشکان در شناسایی نشانگرهای زیستی بیماری تاکید می کند و نادر بودن ارزیابی PD مبتنی بر هوش مصنوعی با استفاده از تصویربرداری شبکیه را برجسته می کند.

صنعت:

مدل یادگیری عمیق می تواند آهنرباهای تک مولکولی را پیش بینی کند

این مطالعه کاربرد یادگیری عمیق را در پیش‌بینی آهن‌رباهای تک مولکولی (SMM) از مجموعه‌ای از کمپلکس های فلزی با هدف ساده‌سازی کشف مواد مورد بحث قرار می‌دهد. SMMها رفتار آرامش مغناطیسی را در سطح مولکول فردی نشان می دهند و کاربردهای بالقوه ای در فناوری های مختلف دارند. محققان از یادگیری عمیق برای تجزیه و تحلیل رابطه بین ساختارهای مولکولی و رفتار SMM، با استفاده از نمایش وکسل ساختارهای مولکولی و یک مدل شبکه عصبی کانولوشنالی سه بعدی استفاده کردند. این مدل به میزان دقت 70 درصدی در تمایز بین SMM و غیر SMM دست یافت و با موفقیت نامزدهای SMM بالقوه را از مجموعه داده‌ای از کمپلکس های فلزی شناسایی کرد. اگرچه این روش فرآیند کشف SMM را ساده می کند، تحقیقات تجربی بیشتری برای تأیید پیش بینی ها مورد نیاز است. با این وجود، این رویکرد نیاز به محاسبات محاسباتی پیچیده را کاهش می دهد و روشی مقرون به صرفه و صرفه جویی در زمان برای توسعه مواد ارائه می دهد.

مقاله:

Scalable Diffusion Models with Transformers

این مقاله کلاس جدیدی از مدل‌های انتشار به نام ترنسفورمرهای انتشار (DiTs) را بر اساس معماری ترنسفورمر مورد بحث قرار می‌دهد. این مدل‌ها، مدل‌های انتشار پنهان تصاویر را با استفاده از ترنسفورمرها به جای ستون فقرات U-Net سنتی، آموزش می‌دهند و روی تکه‌های پنهان کار می‌کنند. مقیاس پذیری DiTs بر اساس پیچیدگی عبور رو به جلو، اندازه گیری شده توسط Gflops، تجزیه و تحلیل می شود. نتایج نشان می‌دهد که DiT‌هایی با Gflops بالاتر، که از طریق افزایش عمق/عرض ترنسفورمر یا توکن‌های ورودی به دست می‌آیند، FID پایین‌تری دارند (فاصله اولیه فریشت)، که نشان‌دهنده عملکرد بهتر است. بزرگترین مدل‌های DiT-XL/2 از مدل‌های انتشار قبلی در معیارهای ImageNet شرطی برتر عمل می‌کنند و به FID پیشرفته 2.27 دست می‌یابند.

آموزش:

تقسیم بندی معنایی چیست؟

تقسیم بندی معنایی (Semantic Segmentation) یک کار بینایی کامپیوتری است که شامل تقسیم یک تصویر به بخش ها یا مناطق متعدد است که هر بخش نشان دهنده یک کلاس یا دسته خاص است. بر خلاف تشخیص اشیا، که اشیاء فردی را در یک تصویر شناسایی و محلی می کند، تقسیم بندی معنایی یک برچسب به هر پیکسل در تصویر اختصاص می دهد و به طور موثر تصویر را بر اساس اطلاعات معنایی به بخش های معنی دار تقسیم می کند.

در تقسیم‌بندی معنایی، هدف این است که هر پیکسل در تصویر ورودی را به یکی از چندین کلاس یا دسته‌های از پیش تعریف‌شده، مانند «شخص»، «ماشین»، «جاده»، «ساختمان»، و غیره طبقه‌بندی کنیم. این درک دقیق از تصویر امکان درک دقیق صحنه و تجزیه و تحلیل در سطح پیکسل را فراهم می کند.

تقسیم بندی معنایی به طور گسترده در کاربردهای مختلف استفاده می شود، از جمله:

1. وسایل نقلیه خودران: تقسیم بندی معنایی به وسایل نقلیه خودران کمک می کند تا با شناسایی و تقسیم بندی اشیاء مختلف در جاده، مانند وسایل نقلیه، عابران پیاده، علائم راهنمایی و رانندگی، و خط کشی های جاده، محیط اطراف خود را درک کنند.

2. تجزیه و تحلیل تصویر پزشکی: در تصویربرداری پزشکی، بخش‌بندی معنایی برای کارهایی مانند تشخیص تومور، تقسیم‌بندی اندام‌ها و طبقه‌بندی بافت استفاده می‌شود که امکان تشخیص دقیق‌تر و برنامه‌ریزی درمان را فراهم می‌کند.

3. تجزیه و تحلیل تصاویر ماهواره ای: تقسیم بندی معنایی به طبقه بندی پوشش زمین، برنامه ریزی شهری، پایش محیطی و واکنش به بلایا با تقسیم تصاویر ماهواره ای به انواع مختلف پوشش زمین، مانند جنگل ها، بدنه های آبی، مناطق شهری و زمین های کشاورزی کمک می کند.

4. رباتیک: بخش‌بندی معنایی ربات‌ها را قادر می‌سازد تا با تقسیم‌بندی اشیاء و موانع موجود در محیط اطراف خود، به طور مؤثرتری محیط خود را درک کرده و با آن تعامل داشته باشند و وظایف ناوبری و دستکاری را تسهیل کنند.

الگوریتم‌های تقسیم‌بندی معنایی معمولاً از تکنیک‌های یادگیری عمیق، مانند شبکه‌های عصبی کانولوشنی (CNN) برای یادگیری نمایش‌های قدرتمند تصاویر و طبقه‌بندی دقیق هر پیکسل به کلاس‌های معنایی استفاده می‌کنند. این مدل‌ها بر روی مجموعه داده‌های مشروح بزرگ آموزش داده می‌شوند، جایی که هر پیکسل در تصاویر آموزشی با کلاس معنایی مربوطه برچسب‌گذاری می‌شود. سپس می‌توان از مدل‌های آموزش‌دیده برای انجام بخش‌بندی معنایی روی تصاویر جدید و دیده نشده استفاده کرد و بینش‌های ارزشمندی را در مورد محتوای بصری تصاویر ارائه کرد.

کدینگ:

کتابخانه pathlib در پایتون

کتابخانه «pathlib» در پایتون یک رویکرد شی گرا برای کار با مسیرهای سیستم فایل ارائه می دهد. در پایتون 3.4 به عنوان بخشی از کتابخانه استاندارد معرفی شد و در مقایسه با دستکاری مسیرهای سنتی مبتنی بر رشته، روشی شهودی و خواندنی تر برای تعامل با فایل ها و دایرکتوری ها ارائه می دهد.

ویژگی های کلیدی کتابخانه «pathlib» عبارتند از:

1. نمایش شی گرا از مسیرها: مسیرها به عنوان اشیاء «مسیر» نمایش داده می شوند که روش ها و ویژگی هایی را برای پیمایش، دستکاری و پرس و جو در اجزای مسیر ارائه می دهند.

2. مدیریت مسیر مستقل از پلتفرم: «pathlib» تفاوت‌های خاص پلتفرم را در نحو مسیر انتزاعی می‌کند و کد را در سیستم‌های عامل مختلف قابل حمل‌تر می‌کند.

3. کد مختصر و قابل خواندن: کد «pathlib» در مقایسه با دستکاری مسیر مبتنی بر رشته سنتی خواناتر و مختصرتر است و درک و نگهداری آن را آسان‌تر می‌کند.

4. پشتیبانی از عملیات رایج سیستم فایل: «pathlib» روش هایی را برای عملیات رایج سیستم فایل مانند ایجاد فایل، حذف، کپی، انتقال و تکرار بر روی محتویات دایرکتوری ارائه می کند.

به طور کلی، کتابخانه «pathlib» کار با مسیرهای سیستم فایل در پایتون را ساده می‌کند و به عنوان رویکرد ترجیحی برای دستکاری مسیر در کد پایتون مدرن در نظر گرفته می‌شود.

راههای ارتباطی با ما:

اینستاگرام:
princeofai@
وبسایت:
https://princeofai.com
تلگرام:
https://t.me/princeofaii

PrinceofAI’s Substack