اخبار:
یادگیری ماشین کوانتومی دقت تشخیص آلزایمر را افزایش می دهد
بیماری آلزایمر (AD) یک اختلال عصبی جدی است که بر تواناییهای ذهنی تأثیر میگذارد و چالشهای مختلفی ایجاد میکند و تشخیص زودهنگام را حیاتی میکند. MRI ساختاری یک ابزار تشخیصی کلیدی برای شناسایی مراحل AD است. تکنیکهای یادگیری عمیق (DL) و یادگیری انسمبل، پیشرفتهایی را در تشخیص بیماری نشان دادهاند، با یادگیری ماشین کوانتومی (QML) مزایای بیشتری در سرعت و مقیاسپذیری ارائه میدهد.
محققان یک مدل DL انسمبل را با استفاده از طبقه بندی کننده های QML برای طبقه بندی مراحل AD از داده های MRI مغز پیشنهاد کردند. این مدل از نسخه های سفارشی VGG16-ResNet50 برای استخراج ویژگی و QML برای طبقه بندی استفاده کرد. برای آموزش از مجموعه داده های تصویربرداری عصبی بیماری آلزایمر ADNI استفاده شد.
این مطالعه با هدف توسعه یک مدل کارآمد با ادغام منابع داده های مختلف برای نتایج پیش بینی بهتر انجام شد. عملکرد با استفاده از معیارهایی مانند یادآوری، دقت، امتیاز F1، سطح زیر منحنی (AUC) و دقت ارزیابی شد. مدل پیشنهادی با سایر تکنیکها مقایسه شد و نشان داد که مدل انسمبل با QML از سایرین بهتر عمل میکند و به بالاترین دقت 99.89 درصد در مجموعه دادههای ادغامشده ADNI دست مییابد.
صنعت:
تحقیقات ویدیو به صدا از پیکسل های ویدیویی و پیام های متنی برای تولید موسیقی متن استفاده می کند
مدل های تولید ویدیو به سرعت در حال پیشرفت هستند، اما بسیاری از آنها در حال حاضر ویدیوهای بی صدا تولید می کنند. گام بعدی مهم ایجاد موسیقی متن های هماهنگ برای این ویدیوها است. فناوری جدید ویدیو به صدا (V2A) با ترکیب پیکسلهای ویدیویی با پیامهای متنی به زبان طبیعی برای ایجاد مناظر صوتی غنی که با عملکرد روی صفحه نمایش مطابقت دارد، این مشکل را برطرف میکند. V2A را می توان با مدل های تولید ویدیو مانند Veo جفت کرد تا نمرات دراماتیک، جلوه های صوتی واقعی یا دیالوگ هایی متناسب با شخصیت ها و لحن ویدیو ایجاد کند. همچنین میتواند موسیقی متن فیلمهای سنتی، از جمله مطالب بایگانی و فیلمهای صامت را تولید کند، بنابراین امکانات خلاقانه را گسترش میدهد.
مقاله:
Image-based facial emotion recognition using convolutional neural network on emognition dataset
تشخیص احساسات از روی تصاویر چهره به دلیل تغییرات قابل توجه در حالات چهره چالش برانگیز است. تحقیقات قبلی با استفاده از مدلهای یادگیری عمیق برای تشخیص احساسات چهره (FER) بر مجموعه دادههایی با عبارات محدود متمرکز شده است. این مطالعه از مجموعه داده Emognition استفاده می کند که شامل ده احساس است: سرگرمی، هیبت، اشتیاق، دوست داشتن، تعجب، خشم، انزجار، ترس، غم و خنثی. محققان دادههای ویدئویی را در تصاویر پیش پردازش کردند و دادهها را افزایش دادند. آنها مدلهای شبکه عصبی کانولوشنی (CNN) را با استفاده از دو رویکرد پیشنهاد کردند: انتقال یادگیری با مدلهای از پیش آموزشدیده Inception-V3 و MobileNet-V2، و ساخت از ابتدا با استفاده از روش تاگوچی برای بهینهسازی فراپارامترها. مدل پیشنهادی به دقت 96% و میانگین امتیاز F1 0.95 در دادههای تست دست یافت.
آموزش:
هیستوگرام در آمار و یادگیری ماشین چیست؟
هیستوگرام (Histogram) یک نمایش گرافیکی از توزیع یک مجموعه داده است. هیستوگرام یک نوع نمودار میله ای است که فرکانس یا تعداد نقاط داده را در بازه های زمانی مشخص به نام bin نمایش می دهد. هر نوار در هیستوگرام نشان دهنده بسامد نقاط داده ای است که در یک bin خاص قرار می گیرند.
کدینگ:
کتابخانه gc در پایتون چیست؟
کتابخانه gc در پایتون رابط جمعآوری زباله است که یک رابط برای مدیریت خودکار حافظه و امکانات جمعآوری زباله مفسر پایتون فراهم میکند. جمع آوری زباله فرآیند آزادسازی خودکار حافظه است که دیگر توسط برنامه استفاده نمی شود، که به جلوگیری از نشت حافظه کمک می کند.