Tagهوش توصیف

هوش مصنوعی مایکروسافت می تواند تصاویر را برای کاربران نابینای آفیس توصیف کند

هوش مصنوعی مایکروسافت می تواند تصاویر را برای کاربران نابینای آفیس توصیف کند

اگرچه هوش مصنوعی پیشرفت آهسته و پیوسته ای در سیستم های همه منظوره از جمله دستیارهای صوتی دارد، اما شاید قابلیت های AI برای کمک به افراد ناتوان و معلول را بتوان یکی از مهم ترین تأثیرات سیستم های هوشمند بر زندگی امروز دانست.

در همین رابطه اپلیکیشن های مجموعه آفیس مایکروسافت از جمله ورد و پاورپوینت به قابلیتی مجهز شده اند که می توانند به صورت خودکار عناوینی را برای تصاویر موجود در سند در نظر بگیرند و زمانی که فایل برای کاربران نابینا به نمایش درآید، علاوه بر اطلاعات متنی، توصیف عکس ها نیز برای او ارائه می گردد.

مایکروسافت برای دستیابی به این مهم از «سرویس شناختی بر اساس بینایی ماشین» استفاده کرده، که روش شبکه های عصبی را با فنون یادگیری عمیق ترکیب می نماید تا محتوای تصاویر را درک و توصیف کند.

microsoft-powerpoint-automatic-alt-text

گفتنیست فیسبوک نیز چندی پیش از قابلیت مشابهی برای تولید خودکار کپشن عکس در این شبکه اجتماعی رونمایی کرد، و دیگر غول های فناوری نیز از روش های هوش مصنوعی برای ارتقاء دسترسی و تجزیه و تحلیل دقیق تر تصاویر و ویدیوها به منظور کسب اطلاعات ارزشمند بهره می گیرند.

مایکروسافت می گوید قالب های آماده ای را نیز در مجموعه آفیس قرار می دهد که ساختار آنها برای مرور از طریق راهنمای صوتی و صفحه کلید بهینه گشته، ضمن اینکه فونت ها و رنگ های به کار رفته در آنها نیز برای سهولت استفاده افراد کم بینا یا کوررنگ طراحی شده.

گفتنیست قابلیت فوق از سال آینده برای مشترکین آفیس 365 و روی نرم افزارهای ورد و پاورپوینت برای کامپیوترهای شخصی عرضه می شود.

The post appeared first on .

هوش مصنوعی مایکروسافت می تواند تصاویر را برای کاربران نابینای آفیس توصیف کند

پیشرفت چشمگیر هوش مصنوعی گوگل در توصیف تصاویر

پیشرفت چشمگیر هوش مصنوعی گوگل در توصیف تصاویر

در حال حاضر توسعه دهنده های هوش مصنوعی به اصطلاح نانشان در روغن است، اما بد به حال کسانی کارشان را ماشین ها هم می توانند انجام دهند. یکی از این کار ها، کپشن نویسی عکس است. گوگل به تازگی الگوریتم «Show and Tell» خود را برای توسعه دهندگان عرضه کرده است؛ الگوریتمی که می توان آن را برای شناسایی سوژه های موجود در عکس ها با ۹۳.۹ درصد دقت آموزش داد. این میزان دقت به نسبت دو سال قبل پیشرفت بزرگی محسوب می شود. الگوریتم یاد شده در آن زمان قادر بود با دقت ۸۹.۶ درصد عکس ها را طبقه بندی کند.

از توصیف بهتر عکس ها می توان به شیوه های مختلفی بهره گرفت، از جمله کمک به تاریخ نویسان، افراد دچار نابینایی یا کم بینایی، و البته، دیگر محققان حوزه ی هوش مصنوعی.

کد متن باز ریلیز شده ی گوگل از مدل نسل سوم «Inception» و سامانه ی بصری تازه ای بهره می برد که در تشخیص سوژه های جداگانه در یک تصویر عملکرد بهتری دارد. محققان مذکور این الگوریتم را با هدف بالا بردن دقت، بهینه سازی نیز کرده اند. تیم توسعه دهنده در توضیح تلاش های خود اذعان داشته است: «برای مثال، مدل طبقه بندی تصاویر به شما خواهد گفت که یک سگ، چمن و یک فریزبی در تصویر وجود دارند، اما توصیف طبیعی عکس باید رنگ چمن ها و نحوه ی ارتباط سگ با فریزبی را نیز به شما بگوید».

مقایسه ی کپشن های قدیمی و جدید برای یک تصویر

سامانه ی گوگل پس از آنکه با استفاده از کپشن های نوشته شده توسط انسان آموزش دیده توانسته است به شرح تصاویری بپردازد که قبلاً ندیده بوده است. محققان در این خصوص اظهار داشته اند: «جالب اینجاست که مدل ما می تواند در مواجهه با تصاویر کاملاً جدید، توانایی تولید کپشن هایی دقیق و تازه برای آنها را در خود پدید بیاورد. این موضوع نشان دهنده ی درک عمیق تری از سوژه ها و بافتار تصاویر است».

تصاویر سمت چپ نمونه های آموزشی کپشن شده توسط انسان- تصویر سمت راست نمونه ی کپشن شده توسط ماشین

برای مثال، سامانه ی توصیف تصویر گوگل با استفاده از چندین عکس با سوژه ی سگ ها و ساحل، قادر بوده کپشن تازه ای برای یک تصویر مشابه اما اندکی متفاوت خلق کند.

شرکت گوگل کد های منبع این الگوریتم را روی سامانه ی خود در اختیار تمام علاقمندان قرار داده است. البته برای استفاده از آن باید خودتان آموزشش بدهید؛ فرایندی که با فرض بهره مندی از یک پردازنده ی گرافیکی NVIDIA Tesla، می تواند چند هفته طول بکشد. بنابراین اگر فکر کردید می توانید از آن برای کپشن کردن عکس های اینستاگرامی خود استفاده کنید باید منتظر شوید یک نفر مدل آموزش دیده ی آن را منتشر کند.

The post appeared first on .

پیشرفت چشمگیر هوش مصنوعی گوگل در توصیف تصاویر

در حال حاضر توسعه دهنده های هوش مصنوعی به اصطلاح نانشان در روغن است، اما بد به حال کسانی کارشان را ماشین ها هم می توانند انجام دهند. یکی از این کار ها، کپشن نویسی عکس است. گوگل به تازگی الگوریتم «Show and Tell» خود را برای توسعه دهندگان عرضه کرده است؛ الگوریتمی که می توان آن را برای شناسایی سوژه های موجود در عکس ها با ۹۳.۹ درصد دقت آموزش داد. این میزان دقت به نسبت دو سال قبل پیشرفت بزرگی محسوب می شود. الگوریتم یاد شده در آن زمان قادر بود با دقت ۸۹.۶ درصد عکس ها را طبقه بندی کند.

از توصیف بهتر عکس ها می توان به شیوه های مختلفی بهره گرفت، از جمله کمک به تاریخ نویسان، افراد دچار نابینایی یا کم بینایی، و البته، دیگر محققان حوزه ی هوش مصنوعی.

کد متن باز ریلیز شده ی گوگل از مدل نسل سوم «Inception» و سامانه ی بصری تازه ای بهره می برد که در تشخیص سوژه های جداگانه در یک تصویر عملکرد بهتری دارد. محققان مذکور این الگوریتم را با هدف بالا بردن دقت، بهینه سازی نیز کرده اند. تیم توسعه دهنده در توضیح تلاش های خود اذعان داشته است: «برای مثال، مدل طبقه بندی تصاویر به شما خواهد گفت که یک سگ، چمن و یک فریزبی در تصویر وجود دارند، اما توصیف طبیعی عکس باید رنگ چمن ها و نحوه ی ارتباط سگ با فریزبی را نیز به شما بگوید».

مقایسه ی کپشن های قدیمی و جدید برای یک تصویر

سامانه ی گوگل پس از آنکه با استفاده از کپشن های نوشته شده توسط انسان آموزش دیده توانسته است به شرح تصاویری بپردازد که قبلاً ندیده بوده است. محققان در این خصوص اظهار داشته اند: «جالب اینجاست که مدل ما می تواند در مواجهه با تصاویر کاملاً جدید، توانایی تولید کپشن هایی دقیق و تازه برای آنها را در خود پدید بیاورد. این موضوع نشان دهنده ی درک عمیق تری از سوژه ها و بافتار تصاویر است».

تصاویر سمت چپ نمونه های آموزشی کپشن شده توسط انسان- تصویر سمت راست نمونه ی کپشن شده توسط ماشین

برای مثال، سامانه ی توصیف تصویر گوگل با استفاده از چندین عکس با سوژه ی سگ ها و ساحل، قادر بوده کپشن تازه ای برای یک تصویر مشابه اما اندکی متفاوت خلق کند.

شرکت گوگل کد های منبع این الگوریتم را روی سامانه ی خود در اختیار تمام علاقمندان قرار داده است. البته برای استفاده از آن باید خودتان آموزشش بدهید؛ فرایندی که با فرض بهره مندی از یک پردازنده ی گرافیکی NVIDIA Tesla، می تواند چند هفته طول بکشد. بنابراین اگر فکر کردید می توانید از آن برای کپشن کردن عکس های اینستاگرامی خود استفاده کنید باید منتظر شوید یک نفر مدل آموزش دیده ی آن را منتشر کند.

The post appeared first on .

پیشرفت چشمگیر هوش مصنوعی گوگل در توصیف تصاویر