مکالمه خصوصی در اتاق های پر سر و صدا با یک هدفون جدید

گوپا: هدفون های «ایزوله کننده مکالمه» مجهز به هوش مصنوعی، امکان مکالمه خصوصی را در اتاق های پر سر و صدا فراهم می کنند. این دستیار شنوایی فعال، گویندگان را در عرض چند ثانیه شناسایی کرده و هر صدای دیگری را سرکوب می کند و در آزمایش های اولیه موفق نشان داده است.

به گزارش گوپا به نقل از ایسنا، افراد در اتاق های شلوغ، هنگام پخش موسیقی، صدای تق و تق بشقاب ها و با وجود ده ها مکالمه میان افراد مختلف صحبت می کنند و برای بسیاری، گوش دادن به یک صدا به گوش تیز کردن و تلاش ذهنی زیادی نیاز دارد. این در حالیست که این کوشش برای افرادی که مشکلات شنوایی دارند، می تواند طاقت فرسا باشد.
حال تعدادی از پژوهشگران دانشگاه واشینگتن(Washington) می گویند که راهی برای عبور از این سر و صدا پیدا کرده اند.
هدفون های هوشمند جدید مجهز به هوش مصنوعی می توانند به صورت خودکار صدای طرف مقابل مورد نظر کاربر برای مکالمه را از هرج و مرج اطراف جدا کنند.

فناوری شنوایی هوشمندتر

برعکس دستگاههای ایزوله کننده گفتار موجود، نمونه اولیه این هدفون جدید منتظر ورودی دستی نمی ماند. هدفون ها تشخیص می دهند که چه کسی بخشی از مکالمه است و صداهایی را که با ریتم گفتار نوبتی مطابقت ندارند، خاموش می کنند.
یک مدل هوش مصنوعی الگوهای زمان بندی را تحلیل و بررسی می کند و دیگری صداهای نامربوط را فیلتر می کند.
این سیستم، طرف های مکالمه را در عرض دو تا چهار ثانیه شناسایی می کند.
این تیم، کار خودرا بتازگی در چین و در کنفرانس روش های تجربی در پردازش زبان طبیعی به اشتراک گذاشت. شایان ذکر است که کد اصلی آن متن باز است.
پژوهشگران باور دارند که این فناوری می تواند از سمعک ها، هدفون ها و عینک های هوشمند آینده پشتیبانی کند.
شیام گولاکوتا(Shyam Gollakota)، نویسنده ارشد این مطالعه اظهار داشت که نگاههای قبلی خیلی فراتر از انتظار کاربران هستند.
وی ادامه داد: نگاههای موجود برای شناسایی این که فرد به چه کسی گوش می دهد، به طور عمده شامل الکترودهای کاشته شده در مغز برای ردیابی توجه است.
وی اشاره کرد که الگوهای طبیعی در گفتگو، مسیر بهتری را ارایه می دهند.
گولاکوتا افزود: بینش ما این است که وقتی با گروه خاصی از افراد صحبت می نماییم، گفتار ما به صورت طبیعی از یک ریتم نوبتی پیروی می کند و ما می توانیم هوش مصنوعی را آموزش دهیم تا این ریتم ها را فقط با بهره گیری از صدا، بدون نیاز به کاشت الکترود، پیشبینی و ردیابی کند.

نحوه رفتار این هدفون در استفاده واقعی

این سیستم زمانی فعال می شود که فرد آغاز به صحبت می کند. مدل اول، بررسی این که «چه کسی چه زمانی صحبت کرده است» را اجرا می کند و بدنبال همپوشانیِ کم بین گویندگان می گردد.
مدل دوم سیگنال را پالایش می کند و صدای ایزوله شده را بصورت لحظه ای به کاربر بازمی گرداند.
نمونه اولیه اکنون از مکالماتی که شامل کاربر و حداکثر چهار گوینده دیگر می شود، بدون تأخیر قابل توجه پشتیبانی می کند. پژوهشگران این تجربه را با ۱۱ شرکت کننده آزمایش کردند.
آنها وضوح، حذف نویز و درک مطلب را با و بدون فیلترها ارزیابی کردند. نسخه فیلتر شده بالاتر از دو برابر امتیاز بیشتری به دست آورد.
این پروژه برمبنای آزمایش های قبلی تیم «گولاکوتا» تولید شده است. نمونه های اولیه قبلی نیاز به نگاه کردن به فرد برای جداسازی صدای او یا تنظیم حباب های صوتی مبتنی بر فاصله داشتند.
گویلین هو(Guilin Hu)، محقق ارشد این مطالعه می گوید: طراحی جدید، این مراحل را حذف می کند. هر کاری که ما قبلاً انجام داده ایم، مستلزم آنست که کاربر بصورت دستی یک گوینده خاص یا فاصله ای را که باید گوش دهد، انتخاب نماید که برای تجربه کاربر خوب نیست.
وی ادامه داد: این سیستم جدید به صورت خودکار واکنش نشان داده است. آن چه ما نشان داده ایم، یک تکنولوژی است که پیشگیرانه عمل می کند و چیزی است که قصد انسان را بصورت غیرتهاجمی و خودکار استنباط می کند.
البته فضا و گفتارهای آشفته هنوز مشکلاتی را به وجود می آورد. قطع کردن صحبت افراد، صحبت کردن بین حرف های یکدیگر یا پیوستن به مکالمه در حین مکالمه می تواند ردیابی را گیج کند.
در عین حال، نتایج اولیه تیم را تحت تاثیر قرار داد. مدلها برای زبان های انگلیسی، ماندارین و ژاپنی آموزش دیده بودند و زبان های دیگر ممکنست نیاز به تنظیمات داشته باشند.
نسخه فعلی از هدفون های روگوشی تجاری و مدارهای پایه استفاده می نماید. «گولاکوتا» انتظار دارد که این فناوری به هدفون های داخل گوشی یا سمعک ها هم توسعه یابد. همین تیم نشان داد که مدلهای هوش مصنوعی مشابه می توانند روی تراشه های به اندازه سمعک اجرا شوند.

به گزارش گوپا به نقل از ایسنا، افراد در اتاق های شلوغ، هنگام پخش موسیقی، صدای تق و تق بشقاب ها و با وجود ده ها مکالمه میان افراد مختلف صحبت می کنند و برای بسیاری، گوش دادن به یک صدا به گوش تیز کردن و تلاش ذهنی زیادی نیاز دارد. این در حالیست که این تلاش برای اشخاصی که مشکلات شنوایی دارند، می تواند طاقت فرسا باشد. وی افزود: نگاههای موجود برای شناسایی اینکه فرد به چه کسی گوش می دهد، به صورت عمده شامل الکترودهای کاشته شده در مغز برای ردیابی توجه است.

منبع: گوپا

1404/09/20

12:55:11

5.0 / 5

154

تگهای خبر: آزمایش , آینده , تكنولوژی , تولید

این مطلب را می پسندید؟

(1)

(0)

تازه ترین مطالب مرتبط

نظرات بینندگان در مورد این مطلب

لطفا شما هم در مورد این مطلب نظر دهید

= ۹ بعلاوه ۱

ثبت نظر