اخبار:
تولید کننده گفتار هوش مصنوعی به برابری انسانی رسیده است - اما انتشار آن بسیار خطرناک است
مایکروسافت VALL-E 2 را توسعه داده است، یک مولد پیشرفته تبدیل متن به گفتار با هوش مصنوعی که می تواند صدای گوینده انسان را با استفاده از تنها چند ثانیه از آن صدا به دقت تقلید کند. بر اساس مقاله ای که در arXiv منتشر شده، VALL-E 2 گفتار طبیعی و قانع کننده ای را تولید می کند که می تواند با یک شخص واقعی اشتباه گرفته شود و عملکردی در سطح انسانی در ترکیب متن به گفتار صفر شات به دست می آورد. هوش مصنوعی حتی برای جملات پیچیده یا تکراری به طور مداوم گفتاری با کیفیت بالا تولید می کند. به دلیل ماهیت قانع کننده آن، مایکروسافت تصمیم گرفته است که VALL-E 2 را برای عموم منتشر نکند.
صنعت:
پیدا کردن اشتباهات GPT-4 با GPT-4
CriticGPT که اخیراً توسعه یافته است، مدلی مبتنی بر GPT-4، برای شناسایی خطاها در خروجی کد ChatGPT است. کاربرانی که CriticGPT به آنها کمک می کند، 60 درصد مواقع از کاربران بدون کمک بهتر عمل می کنند. مدلهای مشابه CriticGPT در تلاش هستند تا در خط لوله برچسبگذاری RLHF (یادگیری تقویتی از بازخورد انسانی) ادغام شوند تا به آموزش دهندگان هوش مصنوعی کمک صریح ارائه کنند. هدف از این کار بهبود ارزیابی خروجی های سیستم های پیشرفته هوش مصنوعی است. از آنجایی که ChatGPT دقیقتر میشود و اشتباهات آن ظریفتر میشود، تشخیص نادرستیها برای آموزش دهندگان هوش مصنوعی سختتر میشود که چالشی را برای RLHF ایجاد میکند. CriticGPT با برجسته کردن نادرستی در پاسخهای ChatGPT به رفع این مشکل کمک میکند.
مقاله:
Water body extraction from high spatial resolution remote sensing images based on enhanced U-Net and multi-scale information fusion
تکنیکهای یادگیری عمیق به طور فزایندهای برای تقسیمبندی معنایی تصاویر سنجش از راه دور برای استخراج اطلاعات در مورد آبها استفاده میشوند. با این حال، مدل های فعلی به دلیل پیچیدگی اشیاء زمینی و پس زمینه، اغلب با تصاویر با وضوح بالا دست و پنجه نرم می کنند. این چالشها شامل پوشش گیاهی، سایهها و مرزها، شکلها و اندازههای مختلف آب است. برای پرداختن به این مسائل، این مقاله EU-Net را معرفی میکند، مدل جدیدی که به طور خاص برای استخراج آب از تصاویر با وضوح بالا طراحی شده است. EU-Net، بر اساس معماری U-Net، دارای اتصالات باقیمانده پیشرفته، مکانیسم های توجه، پیچش های Dilated چند مقیاسی، و ماژول های ترکیب ویژگی های چند مقیاسی است. این پیشرفتها به مدل این امکان را میدهد که ویژگیهای پیچیده را بیاموزد، بر روی مناطق مهم تمرکز کند، حوزه دریافتی خود را گسترش دهد و ساختارهای کوچک و بزرگ را به طور موثر پردازش کند. نتایج تجربی نشان میدهد که EU-Net از مدلهای موجود در شناسایی دقیق آبها در تصاویر سنجش از دور با وضوح بالا بهتر عمل میکند.
آموزش:
RLHF چیست؟
یادگیری تقویتی از بازخورد انسانی (RLHF) روشی است که برای آموزش مدلهای هوش مصنوعی، از جمله مدلهای زبان بزرگ مانند GPT-4، با گنجاندن بازخورد انسانی در فرآیند آموزش استفاده میشود. به طور کلی، RLHF یک تکنیک قدرتمند است که از تخصص انسانی برای افزایش عملکرد و قابلیت اطمینان مدلهای هوش مصنوعی بهره میبرد و آنها را برای موارد استفاده عملی و در دنیای واقعی مناسبتر میسازد.
کدینگ:
کتابخانه tqdm در پایتون چیست؟
کتابخانه tqdm در پایتون یک کتابخانه محبوب برای ایجاد نوارهای پیشرفت است که به شما امکان می دهد پیشرفت کد خود را هنگام اجرا مصور کنید. این به ویژه برای ردیابی پیشرفت حلقه ها و پردازش های تکرارشونده، به ویژه در کارهای طولانی مدت مانند پردازش داده ها، آموزش یادگیری ماشین و دانلود فایل مفید است.