خانه ~ تکنولوژی ~ توصیف تصاویر در هوش مصنوعی گوگل

توصیف تصاویر در هوش مصنوعی گوگل

هم اکنون شرکت های توسعه دهنده های هوش مصنوعی درآمد قابل توجهی دارند.
بهتر است بگوییم برای کسانی که کارشان را ماشین انجام میدهد خیلی جالب نیست؛

مثلا یکی از این کارها، کپشن نویسی عکس است.

گوگل که به تازگی الگوریتم جدید خود یعنی «Show and Tell» را برای توسعه دهندگانش عرضه کرده است؛

گوگل با این الگوریتم سوژه های موجود در عکس ها با ۹۳.۹ درصد دقت آموزش داده.

دقتی که از آن صحبت می کنیم به نسبت دو سال قبل پیشرفت بزرگی محسوب داشته.
الگوریتم یاد شده در آن زمان قادر بود با دقت ۸۹.۶ درصد عکس ها را طبقه بندی کند.

از توصیف بهتر عکس ها می توان به شیوه های مختلفی بهره گرفت،

از جمله کمک به تاریخ نویسان، افراد دچار نابینایی یا کم بینایی، و البته، دیگر محققان حوزه ی هوش مصنوعی.

نقل از دیجیاتو

کد متن باز ریلیز شده ی گوگل از مدل نسل سوم « Inception » و سامانه ی بصری تازه ای بهره می برد که در تشخیص سوژه های جداگانه در یک تصویر عملکرد بهتری دارد.

محققان این الگوریتم را با هدف بالا بردن دقت، بهینه سازی هر چه بیشتر توصیف کرده اند.

تیم توسعه دهنده در توضیح تلاش های خود گفته است:
«برای مثال، مدل طبقه بندی تصاویر به شما خواهد گفت که یک سگ، چمن و یک فریزبی در تصویر وجود دارند، اما توصیف طبیعی عکس باید رنگ چمن ها و نحوه ی ارتباط سگ با فریزبی را نیز به شما بگوید».

نمونه ای از تغییر کپشن نویسی قدیم به جدید

سامانه‌ی هوش مصنوعی گوگل پس از آنکه با استفاده از کپشن‌های نوشته شده توسط انسان آموزش دیده توانسته است به شرح تصاویری بپردازد که حتی قبلاً آنها را ندیده است.

محققان در این خصوص اظهار داشته اند:
« جالب است بدانید که مدل ما می‌تواند در مواجهه با تصاویر کاملاً جدید و حتی ترکیبی و ساختگی ، توانایی تولید کپشن هایی ( توضیحات ) دقیق و تازه برای آنها را در خود به وجود آورد.
این موضوع نشان دهنده ی درک بهتر از سوژه ها و ساختار تصاویر است ».

نمونه کپشن ها :
تصاویر سمت چپ نمونه های آموزشی کپشن شده توسط انسان – تصویر سمت راست نمونه ی کپشن شده توسط هوش مصنوعی

برای مثال، سامانه ی توصیف محتویات تصویر گوگل با استفاده از چندین عکس متفاوت با سوژه ی سگ ها و ساحل، قادر است کپشن‌های تازه ای برای یک تصویر مشابه اما اندکی متفاوت تولید کند.

شرکت گوگل کد های منبع این الگوریتم را روی سامانه ی TensorFlow خود در اختیار تمام علاقمندان قرار داده است.
البته برای استفاده از آن باید خودتان ابتدا به آن آموزش دهید؛
فرایندی که با فرض بهره مندی از یک پردازنده‌ی گرافیکی ( NVIDIA Tesla ) ، می تواند چند هفته طول بکشد.

بنابراین اگر فکر کردید می‌توانید از آن برای کپشن سازی عکس های خود در اینستاگرام استفاده کنید،

باید منتظر شوید یک نفر مدل آموزش دیده‌ی آن را منتشر کند.

منبع : دیجیاتو

درباره‌ی وی‌میز

همچنین ببینید

ارسال زمان دار در تلگرام

ارسال پیام زمان دار در تلگرام

در آپدیت جدید تلگرام شما قادر هستید برای آینده و در روز و ساعت مشخص پیام را ارسال کنید.

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *