اخبار:
استفاده از یادگیری عمیق در تشخیص پارکینسون از طریق چشم
این مطالعه پتانسیل تصویربرداری شبکیه را به عنوان یک ابزار تشخیصی برای بیماری پارکینسون (PD) مورد بحث قرار میدهد، که با علائم حرکتی و غیرحرکتی به دلیل از دست دادن نورونهای دوپامینرژیک مشخص میشود. مرگ و میرهای مرتبط با PD افزایش یافته است و نیاز به سیستم های تشخیصی بهتر را برجسته می کند. تصویربرداری شبکیه، که به عنوان پنجره ای به مغز دیده می شود، بینش هایی را در مورد بیماری های نورودژنراتیو ارائه می دهد. الگوریتمهای هوش مصنوعی (AI)، از جمله مدلهای یادگیری عمیق، به عنوان ابزار تشخیصی کارآمد پیشنهاد شدهاند. هدف این مطالعه بررسی عملکرد طبقهبندی الگوریتمهای هوش مصنوعی در مراحل مختلف PD، دستیابی به نتایج امیدوارکننده در پیشبینی بروز PD قبل از تشخیص است. شبکههای عصبی عمیق از مدلهای یادگیری ماشین معمولی بهتر عمل میکنند و پتانسیل مداخله زودهنگام بیماری را نشان میدهند. این مطالعه بر نقش سیستم های هوش مصنوعی خودکار در کمک به چشم پزشکان در شناسایی نشانگرهای زیستی بیماری تاکید می کند و نادر بودن ارزیابی PD مبتنی بر هوش مصنوعی با استفاده از تصویربرداری شبکیه را برجسته می کند.
صنعت:
مدل یادگیری عمیق می تواند آهنرباهای تک مولکولی را پیش بینی کند
این مطالعه کاربرد یادگیری عمیق را در پیشبینی آهنرباهای تک مولکولی (SMM) از مجموعهای از کمپلکس های فلزی با هدف سادهسازی کشف مواد مورد بحث قرار میدهد. SMMها رفتار آرامش مغناطیسی را در سطح مولکول فردی نشان می دهند و کاربردهای بالقوه ای در فناوری های مختلف دارند. محققان از یادگیری عمیق برای تجزیه و تحلیل رابطه بین ساختارهای مولکولی و رفتار SMM، با استفاده از نمایش وکسل ساختارهای مولکولی و یک مدل شبکه عصبی کانولوشنالی سه بعدی استفاده کردند. این مدل به میزان دقت 70 درصدی در تمایز بین SMM و غیر SMM دست یافت و با موفقیت نامزدهای SMM بالقوه را از مجموعه دادهای از کمپلکس های فلزی شناسایی کرد. اگرچه این روش فرآیند کشف SMM را ساده می کند، تحقیقات تجربی بیشتری برای تأیید پیش بینی ها مورد نیاز است. با این وجود، این رویکرد نیاز به محاسبات محاسباتی پیچیده را کاهش می دهد و روشی مقرون به صرفه و صرفه جویی در زمان برای توسعه مواد ارائه می دهد.
مقاله:
Scalable Diffusion Models with Transformers
این مقاله کلاس جدیدی از مدلهای انتشار به نام ترنسفورمرهای انتشار (DiTs) را بر اساس معماری ترنسفورمر مورد بحث قرار میدهد. این مدلها، مدلهای انتشار پنهان تصاویر را با استفاده از ترنسفورمرها به جای ستون فقرات U-Net سنتی، آموزش میدهند و روی تکههای پنهان کار میکنند. مقیاس پذیری DiTs بر اساس پیچیدگی عبور رو به جلو، اندازه گیری شده توسط Gflops، تجزیه و تحلیل می شود. نتایج نشان میدهد که DiTهایی با Gflops بالاتر، که از طریق افزایش عمق/عرض ترنسفورمر یا توکنهای ورودی به دست میآیند، FID پایینتری دارند (فاصله اولیه فریشت)، که نشاندهنده عملکرد بهتر است. بزرگترین مدلهای DiT-XL/2 از مدلهای انتشار قبلی در معیارهای ImageNet شرطی برتر عمل میکنند و به FID پیشرفته 2.27 دست مییابند.
آموزش:
تقسیم بندی معنایی چیست؟
تقسیم بندی معنایی (Semantic Segmentation) یک کار بینایی کامپیوتری است که شامل تقسیم یک تصویر به بخش ها یا مناطق متعدد است که هر بخش نشان دهنده یک کلاس یا دسته خاص است. بر خلاف تشخیص اشیا، که اشیاء فردی را در یک تصویر شناسایی و محلی می کند، تقسیم بندی معنایی یک برچسب به هر پیکسل در تصویر اختصاص می دهد و به طور موثر تصویر را بر اساس اطلاعات معنایی به بخش های معنی دار تقسیم می کند.
در تقسیمبندی معنایی، هدف این است که هر پیکسل در تصویر ورودی را به یکی از چندین کلاس یا دستههای از پیش تعریفشده، مانند «شخص»، «ماشین»، «جاده»، «ساختمان»، و غیره طبقهبندی کنیم. این درک دقیق از تصویر امکان درک دقیق صحنه و تجزیه و تحلیل در سطح پیکسل را فراهم می کند.
تقسیم بندی معنایی به طور گسترده در کاربردهای مختلف استفاده می شود، از جمله:
1. وسایل نقلیه خودران: تقسیم بندی معنایی به وسایل نقلیه خودران کمک می کند تا با شناسایی و تقسیم بندی اشیاء مختلف در جاده، مانند وسایل نقلیه، عابران پیاده، علائم راهنمایی و رانندگی، و خط کشی های جاده، محیط اطراف خود را درک کنند.
2. تجزیه و تحلیل تصویر پزشکی: در تصویربرداری پزشکی، بخشبندی معنایی برای کارهایی مانند تشخیص تومور، تقسیمبندی اندامها و طبقهبندی بافت استفاده میشود که امکان تشخیص دقیقتر و برنامهریزی درمان را فراهم میکند.
3. تجزیه و تحلیل تصاویر ماهواره ای: تقسیم بندی معنایی به طبقه بندی پوشش زمین، برنامه ریزی شهری، پایش محیطی و واکنش به بلایا با تقسیم تصاویر ماهواره ای به انواع مختلف پوشش زمین، مانند جنگل ها، بدنه های آبی، مناطق شهری و زمین های کشاورزی کمک می کند.
4. رباتیک: بخشبندی معنایی رباتها را قادر میسازد تا با تقسیمبندی اشیاء و موانع موجود در محیط اطراف خود، به طور مؤثرتری محیط خود را درک کرده و با آن تعامل داشته باشند و وظایف ناوبری و دستکاری را تسهیل کنند.
الگوریتمهای تقسیمبندی معنایی معمولاً از تکنیکهای یادگیری عمیق، مانند شبکههای عصبی کانولوشنی (CNN) برای یادگیری نمایشهای قدرتمند تصاویر و طبقهبندی دقیق هر پیکسل به کلاسهای معنایی استفاده میکنند. این مدلها بر روی مجموعه دادههای مشروح بزرگ آموزش داده میشوند، جایی که هر پیکسل در تصاویر آموزشی با کلاس معنایی مربوطه برچسبگذاری میشود. سپس میتوان از مدلهای آموزشدیده برای انجام بخشبندی معنایی روی تصاویر جدید و دیده نشده استفاده کرد و بینشهای ارزشمندی را در مورد محتوای بصری تصاویر ارائه کرد.
کدینگ:
کتابخانه pathlib در پایتون
کتابخانه «pathlib» در پایتون یک رویکرد شی گرا برای کار با مسیرهای سیستم فایل ارائه می دهد. در پایتون 3.4 به عنوان بخشی از کتابخانه استاندارد معرفی شد و در مقایسه با دستکاری مسیرهای سنتی مبتنی بر رشته، روشی شهودی و خواندنی تر برای تعامل با فایل ها و دایرکتوری ها ارائه می دهد.
ویژگی های کلیدی کتابخانه «pathlib» عبارتند از:
1. نمایش شی گرا از مسیرها: مسیرها به عنوان اشیاء «مسیر» نمایش داده می شوند که روش ها و ویژگی هایی را برای پیمایش، دستکاری و پرس و جو در اجزای مسیر ارائه می دهند.
2. مدیریت مسیر مستقل از پلتفرم: «pathlib» تفاوتهای خاص پلتفرم را در نحو مسیر انتزاعی میکند و کد را در سیستمهای عامل مختلف قابل حملتر میکند.
3. کد مختصر و قابل خواندن: کد «pathlib» در مقایسه با دستکاری مسیر مبتنی بر رشته سنتی خواناتر و مختصرتر است و درک و نگهداری آن را آسانتر میکند.
4. پشتیبانی از عملیات رایج سیستم فایل: «pathlib» روش هایی را برای عملیات رایج سیستم فایل مانند ایجاد فایل، حذف، کپی، انتقال و تکرار بر روی محتویات دایرکتوری ارائه می کند.
به طور کلی، کتابخانه «pathlib» کار با مسیرهای سیستم فایل در پایتون را ساده میکند و به عنوان رویکرد ترجیحی برای دستکاری مسیر در کد پایتون مدرن در نظر گرفته میشود.
راههای ارتباطی با ما:
اینستاگرام:
princeofai@
وبسایت:
https://princeofai.com
تلگرام:
https://t.me/princeofaii