Tagهوش به

تاکوترون؛ هوش مصنوعی جدید و پیشرفته گوگل برای تبدیل متن به گفتار

تاکوترون؛ هوش مصنوعی جدید و پیشرفته گوگل برای تبدیل متن به گفتار

گوگل نیز همانند هر شرکت دیگری، می خواهد خروجی گفتاری محصولاتش تا جای ممکن واقعی و طبیعی به نظر برسد. برای حصول این نتیجه می توان از یک هنرپیشه معروف و خوش صدا (مثلاً اسکارلت یوهانسون) بخواهیم تمام کلمات و عبارات و آواهای مختلف را ادا کند و سپس با استفاده از نرم افزاری پیچیده آنها را با هم ترکیب نماییم، اما این روش برای گوگل چندان هیجان انگیز نیست.

غول تکنولوژی مانتن ویو به تازگی از سامانه جدیدی تحت عنوان «» (Tacotron) رونمایی کرده که از فنون یادگیری عمیق (deep learning) برای تبدیل نوشته به گفتار بهره می گیرد. تاکوترون قادر است ویژگی های عروضی (تُن و آهنگ موسیقایی گفتار) را رعایت کند، ابهام معنایی (مانند تلفظ متفاوت read در زمان های حال و گذشته) را تشخیص دهد، خطاهای املایی نوشته را به بهترین شکل ممکن اصلاح نماید، و حتی سبک های نوشتاری هیجانی و نامأنوس (مثلاً «این خعععلی عاولیه») را نیز به خوبی ادا کند؛ این قابلیت ها تاکنون در هیچکدام از موتورهای تبدیل نوشتار به گفتار وجود نداشت.

گوگل در خود عنوان می دارد که سنتز مُقطع گفتار، یعنی همان رویکردی که هم اکنون توسط اپل در «سیری» به کار گرفته می شود، خروجی طبیعی تری را در مقایسه با تاکوترون خواهد داشت، اما پیاده سازی آن بسیار پر هزینه، دشوار و با محدودیت های خاصی همراه است. مثلاً دو عبارت با کلمات مشابه در حالت خبری و سؤالی، آهنگ بیان متفاوتی خواهند داشت و تغییر نرم افزاری این ویژگی، نمی تواند در تمامی شرایط خروجی مطلوبی را ایجاد کند.

برای غلبه بر این مشکلات ناخواسته و خاص که قابل شناسایی و برنامه ریزی نیستند، تاکوترون از سیستم هوش مصنوعی مبتنی بر یادگیری عمیق برای تصمیم گیری استفاده می کند و اگرچه طبیعی ترین خروجی را تحویل نمی دهد، اما بسیار سریع تر از فناوری های کنونی عمل کرده، پیاده سازی آن ساده تر است، و موارد استثنایی و خاص را نیز به خوبی مدیریت می نماید.

به گفته مدیر این پروژه، تاکوترون فرایند پردازش و تبدیل متن به گفتار را با استفاده از معماری ساده شبکه عصبی انجام می دهد و به همین دلیل، آموزش آن با استفاده از پایگاه داده عظیم نوشتار و گفتار همانند آنچه گوگل در اختیار دارد، بسیار ساده خواهد بود.

البته گوگل هنوز در مورد استفاده از تاکوترون در محصولاتش چیزی نگفته، اما اگر در آینده با عبارتی عجیب و غریب و فنی روبرو شدید که موتور تبدیل نوشتار به گفتار گوگل به راحتی از عهده خواندن آن برآمد، مطمئن باشید که توکاترون در آن سوی خط حضور دارد.

The post appeared first on .

تاکوترون؛ هوش مصنوعی جدید و پیشرفته گوگل برای تبدیل متن به گفتار

هوش مصنوعی دیپ مایند می تواند به هنگام باخت، رفتاری ستیزه جویانه نشان دهد

هوش مصنوعی دیپ مایند می تواند به هنگام باخت، رفتاری ستیزه جویانه نشان دهد

بنابر تحقیقات جدید DeepMind که یکی از زیرمجموعه های گوگل به شمار می رود، هوش مصنوعی می تواند رفتار خود را براساس محیطی که در آن قرار دارد تغییر دهد؛ درست مانند عکس العملی که انسان ها در شرایط مختلف از خود نشان می دهند.

محققین کامپیوتر دیپ مایند اخیراً رفتارهای هوش مصنوعی خود را در حالات مختلف اجتماعی مورد بررسی قرار داده اند و برای دستیابی به نتیجه بهتر از و علوم اجتماعی بهره گرفته اند. طی این تحقیقات، آنها کشف کردند که هوش مصنوعی می تواند هنگام مواجهه با حس شکست، «رفتاری ستیزه جویانه» از خود نشان دهد.

برای این تحقیق، هوش مصنوعی دیپ مایند در دو بازی مورد آزمایش قرار گرفت: یک بازی جمع آوری میوه و یک بازی شکار گله ای. هردو بازی، شکلی ساده و دوبعدی دارند و از همان شخصیت های مبتنی بر هوش مصنوعی بهره می گیرند که پیش تر نمونه آن را در آزمایش دیپ مایند با آتاری دیده بودیم.

در آزمایش بازی جمع آوری، که بازیکنان باید سیب هایی را جمع آوری کنند، امکان ضربه زدن به شخصیت های دیگر نیز مهیا شده است. با ازای هر دو ضربه ای که به یک بازیکن وارد شود، وی برای مدتی محدود از بازی خارج می شود و بازیکن دیگر، فرصتی برای جمع آوری می یابد؛ بنابراین اصلی ترین هدف بازی، کنار زدن دیگر بازیکنان و جمع آوری سیب های بیشتر است.

همین قانون ساده، سبب می شود تا بازی شکلی رقابتی به خود بگیرد و هر بازیکن، دائماً و دائماً در صدد حذف رقیب خود برآید. بعد از 40 میلیون گام در بازی، تیم محققان دریافت که هوش مصنوعی یاد گرفته به هنگام دسترسی به منابع کمتر (یعنی سیب ها) و احتمال انجام عملی هزینه بر (یعنی عدم دریافت جایزه به ازای جمع آوری سیب)، رفتاری ستیزه جویانه تر از خود نشان دهد.

به همین شکل، هرچه سیب ها در محیط بیشتر باشد و احتمال عملی هزینه بر کاهش یابد، از میزان ستیزه جویی هوش مصنوعی نیز کاسته می شود. محققان می گویند که این رویکرد طمعکارانه، نشان دهنده تمایل هوش مصنوعی به کنار زدن رقبا و جمع آوری تمام سیب ها برای خود است.

در بازی دوم، دو شخصیت داخل بازی به عنوان گرگ عمل می کنند و باید به دنبال شخصیت سوم، یعنی شکار باشند. اگر هر دو گرگ هنگام گرفتن شکار در نزدیکی وی حضور یابند، هر دو جایزه دریافت می کنند. درست مثل بازی جمع آوری سیب، هوش مصنوعی بعد از مدتی با محیط آشنا شد و این بار، شخصیت های مبتنی بر هوش مصنوعی با یکدیگر همکاری می کردند؛ چه در زمینه یافتن یکدیگر و گرفتن شکار و چه در زمینه گیر انداختن شکار تا زمانی که گرگ دوم از راه برسد.

محققان می گویند این آزمایش نشان می دهد که هوش های مصنوعی می توانند با یکدیگر همکاری داشته باشند تا بهترین خروجی را پدید آورند. با این همه، بدیهی است که کمپانی هایی مانند دیپ مایند تنها در نقاط آغازین پیشرفت های وسیع در زمینه هوش مصنوعی قرار دارند و تا درک بهتر این سیستم ها، زمان زیادی باقی مانده است.

The post appeared first on .

هوش مصنوعی دیپ مایند می تواند به هنگام باخت، رفتاری ستیزه جویانه نشان دهد

هوش مصنوعی و یادگیری عمیق به کمک تکنیک لب خوانی می آیند

هوش مصنوعی و یادگیری عمیق به کمک تکنیک لب خوانی می آیند

لب خوانی عملی دشوار و پیچیده است. نتایج به دست آمده از این تکنیک تفاوت های زیادی را بین افراد نشان می دهد، اما در مجموع می توان گفت شخص عادی با نگاه به چهره دیگران، می تواند از هر 10 واژه یکی را به درستی حدس بزند، و این موضوع در بین متخصصین لب خوانی کمی بالاتر است.

با این حال، اگر با به کار گیری روش های هوش مصنوعی و یادگیری عمیق توانسته ایم تشخیص گفتار صوتی را به عملکردی در سطح انسان برسانیم، پس چرا از همین رویه برای لب خوانی بهره نگیریم؟

به تازگی محققین دانشگاه اکسفورد مقاله ای را منتشر کرده اند که به کار گیری روش یادگیری عمیق را در لب خوانی نشان می دهد، و نتایج آن نسبتاً امیدوارکننده است. این نرم افزار که LipNet نام دارد، در شرایط کنترل شده به دقت 93.4 درصدی در تشخیص لغات دست یافته، در حالی که متخصصین لب خوانی در شرایطی مشابه حداکثر 52.3 درصد واژه ها را به درستی شناسایی کردند.

نکته مهم در مورد این نرم افزار، عملکرد سریع و بلادرنگ آن است و با اینکه سیستم هنوز در مراحل اولیه قرار دارد، باز هم می تواند ویدیوی صامت را به صورت آنی به متن نوشتاری تبدیل نماید.

آموزش سیستم فوق با استفاده از مجموعه داده GRID صورت گرفته، که ده ها هزار ویدیوی کوتاه از 34 نفر داوطلب را در بر می گیرد. این افراد در کلیپ های 3 ثانیه ای، جملاتی با الگوی مشخص و کلمات محدود را بیان می کردند. به همین دلیل منتقدین پروژه فوق می گویند این پژوهش در جهان واقعی کاربرد نخواهد داشت.

البته محققین مورد بحث در دفاع از خود عنوان داشتند دلیل استفاده از GRID صرفاً به خاطر محدودیت داده های استاندارد کنونی بوده و در صورتی که مجموعه داده غنی تر و گسترده تری در اختیار داشته باشند، می توانند همین نتایج مثبت را به دست آورند.

گفتنیست افرادی که در مورد حریم شخصی و مشکلات امنیتی این تکنولوژی بدبین هستند نیز نگران نباشند. به گفته این پژوهشگران، لب خوانی دقیق به تصویربرداری مستقیم از چهره با وضعیتی ثابت و قابلیت مشاهده زبان وابسته است، بنابراین دوربین های شهری هیچگاه محتوایی با کیفیت را برای استفاده از این فناوری تولید نخواهند کرد.

The post appeared first on .

هوش مصنوعی و یادگیری عمیق به کمک تکنیک لب خوانی می آیند

لب خوانی عملی دشوار و پیچیده است. نتایج به دست آمده از این تکنیک تفاوت های زیادی را بین افراد نشان می دهد، اما در مجموع می توان گفت شخص عادی با نگاه به چهره دیگران، می تواند از هر 10 واژه یکی را به درستی حدس بزند، و این موضوع در بین متخصصین لب خوانی کمی بالاتر است.

با این حال، اگر با به کار گیری روش های هوش مصنوعی و یادگیری عمیق توانسته ایم تشخیص گفتار صوتی را به عملکردی در سطح انسان برسانیم، پس چرا از همین رویه برای لب خوانی بهره نگیریم؟

به تازگی محققین دانشگاه اکسفورد مقاله ای را منتشر کرده اند که به کار گیری روش یادگیری عمیق را در لب خوانی نشان می دهد، و نتایج آن نسبتاً امیدوارکننده است. این نرم افزار که LipNet نام دارد، در شرایط کنترل شده به دقت 93.4 درصدی در تشخیص لغات دست یافته، در حالی که متخصصین لب خوانی در شرایطی مشابه حداکثر 52.3 درصد واژه ها را به درستی شناسایی کردند.

نکته مهم در مورد این نرم افزار، عملکرد سریع و بلادرنگ آن است و با اینکه سیستم هنوز در مراحل اولیه قرار دارد، باز هم می تواند ویدیوی صامت را به صورت آنی به متن نوشتاری تبدیل نماید.

آموزش سیستم فوق با استفاده از مجموعه داده GRID صورت گرفته، که ده ها هزار ویدیوی کوتاه از 34 نفر داوطلب را در بر می گیرد. این افراد در کلیپ های 3 ثانیه ای، جملاتی با الگوی مشخص و کلمات محدود را بیان می کردند. به همین دلیل منتقدین پروژه فوق می گویند این پژوهش در جهان واقعی کاربرد نخواهد داشت.

البته محققین مورد بحث در دفاع از خود عنوان داشتند دلیل استفاده از GRID صرفاً به خاطر محدودیت داده های استاندارد کنونی بوده و در صورتی که مجموعه داده غنی تر و گسترده تری در اختیار داشته باشند، می توانند همین نتایج مثبت را به دست آورند.

گفتنیست افرادی که در مورد حریم شخصی و مشکلات امنیتی این تکنولوژی بدبین هستند نیز نگران نباشند. به گفته این پژوهشگران، لب خوانی دقیق به تصویربرداری مستقیم از چهره با وضعیتی ثابت و قابلیت مشاهده زبان وابسته است، بنابراین دوربین های شهری هیچگاه محتوایی با کیفیت را برای استفاده از این فناوری تولید نخواهند کرد.

The post appeared first on .

هوش مصنوعی و یادگیری عمیق به کمک تکنیک لب خوانی می آیند

هوش مصنوعی IBM قادر است واکنش ما به آب و هوا را نیز پیش بینی کند

هوش مصنوعی IBM قادر است واکنش ما به آب و هوا را نیز پیش بینی کند

بر اساس نظریه ی «اثر پروانه ای»، پیش بینی آب و هوا ماهیتاً کار دشواری است. اما IBM اعتقاد دارد اگر هوش رایانشی و داده های بیشتری به کار گرفته شوند، حداقل باید بتوان کیفیت پیش بینی آب و هوا را بهبود بخشید. Big Blue سعی دارد الگوهای آب و هوایی منطقه ای خود را با الگوهای جهانی «شرکت پیش بینی آب و هوا» ادغام و Deep Thunder را خلق کند. دیپ تاندر بهترین سیستم پیش بینی آب و هوا نامیده شده است. این شرکت برای تحلیل تمام این داده ها، در حال ساخت الگوریتم های جدید یادگیری عمیق و آموزش آنها برای استفاده از چندین پتابایت داده ی تاریخی است.

IBM علاوه بر پیش بینی آب و هوا، با مرتبط کردن داده های دیگر به وضعیت جوی، به کمک کسب و کار ها خواهد شتافت. این شرکت با پیش بینی آب و هوا با دقت ۰.۲ تا ۱.۲ مایل، قادر است با دقیق ترین جزئيات به شرکت ها اطلاع دهد وضعیت آب و هوایی چه تأثیری روی مواردی نظیر رفتار خرید مشتریان خواهد گذاشت، تا به این ترتیب شرکت ها بتوانند محصولات خود را به نحو مقتضی انبار و بازاریابی کنند.

شرکت های برق و تلفن نیز می تواند از این داده ها برای پیش بینی آسیب دیدگی های احتمالی خطوط انتقال خود بر اثر طوفان استفاده کنند، تا بتوانند بر اساس پیش بینی های خود اقدامات لازم را به عمل بیاورند.

اگر تا الان تصور می کردید به اندازه ی کافی تحت نظر نیستید باید گفت «پیش بینی کسب و کاری»، به شرکت ها کمک می کند رفتار ما را بهتر از هر زمان دیگری بسنجند. اما بهبود پیش بینی آب و هوا به طور اخص به دلیل تغییرات آب و هوایی تازه ای که در کره ی ما روی می دهد، می تواند بسیار مفید واقع شود. مری گلاکین از «شرکت پیش بینی آب و هوا» می گوید: «این الگوی ترکیبی جدید، پلتفرم ایده آلی برای درک آثار آب و هوا برای هر نوع کاربرد کسب و کاری و صنعتی در اختیار ما قرار می دهد».

The post appeared first on .

هوش مصنوعی IBM قادر است واکنش ما به آب و هوا را نیز پیش بینی کند

بر اساس نظریه ی «اثر پروانه ای»، پیش بینی آب و هوا ماهیتاً کار دشواری است. اما IBM اعتقاد دارد اگر هوش رایانشی و داده های بیشتری به کار گرفته شوند، حداقل باید بتوان کیفیت پیش بینی آب و هوا را بهبود بخشید. Big Blue سعی دارد الگوهای آب و هوایی منطقه ای خود را با الگوهای جهانی «شرکت پیش بینی آب و هوا» ادغام و Deep Thunder را خلق کند. دیپ تاندر بهترین سیستم پیش بینی آب و هوا نامیده شده است. این شرکت برای تحلیل تمام این داده ها، در حال ساخت الگوریتم های جدید یادگیری عمیق و آموزش آنها برای استفاده از چندین پتابایت داده ی تاریخی است.

IBM علاوه بر پیش بینی آب و هوا، با مرتبط کردن داده های دیگر به وضعیت جوی، به کمک کسب و کار ها خواهد شتافت. این شرکت با پیش بینی آب و هوا با دقت ۰.۲ تا ۱.۲ مایل، قادر است با دقیق ترین جزئيات به شرکت ها اطلاع دهد وضعیت آب و هوایی چه تأثیری روی مواردی نظیر رفتار خرید مشتریان خواهد گذاشت، تا به این ترتیب شرکت ها بتوانند محصولات خود را به نحو مقتضی انبار و بازاریابی کنند.

شرکت های برق و تلفن نیز می تواند از این داده ها برای پیش بینی آسیب دیدگی های احتمالی خطوط انتقال خود بر اثر طوفان استفاده کنند، تا بتوانند بر اساس پیش بینی های خود اقدامات لازم را به عمل بیاورند.

اگر تا الان تصور می کردید به اندازه ی کافی تحت نظر نیستید باید گفت «پیش بینی کسب و کاری»، به شرکت ها کمک می کند رفتار ما را بهتر از هر زمان دیگری بسنجند. اما بهبود پیش بینی آب و هوا به طور اخص به دلیل تغییرات آب و هوایی تازه ای که در کره ی ما روی می دهد، می تواند بسیار مفید واقع شود. مری گلاکین از «شرکت پیش بینی آب و هوا» می گوید: «این الگوی ترکیبی جدید، پلتفرم ایده آلی برای درک آثار آب و هوا برای هر نوع کاربرد کسب و کاری و صنعتی در اختیار ما قرار می دهد».

The post appeared first on .

هوش مصنوعی IBM قادر است واکنش ما به آب و هوا را نیز پیش بینی کند