آریا جوان

آخرين مطالب

پروژه یوفونیا گوگل؛ تشخیص گفتار مبتلایان به اختلالات تکلم به کمک هوش مصنوعی فناوری

  بزرگنمايي:

آریا جوان - پروژه‌‌ی یوفونیا نمونه‌‌ای از تلاش‌های گوگل در به‌کارگیری هوش مصنوعی و فناوری تشخیص گفتار برای فراهم‌آوردن امکان استفاده‌ی افراد مبتلا به اختلالات گفتاری از تکنولوژی‌های روز دنیا است.

مقاله‌های مرتبط:
سیستم تشخیص گفتار جدید گوگل به‌ صورت آفلاین نیز کار می‌کندصحت شناسایی تشخیص گفتار گوگل به 95 درصد رسید
گوگل که مدتی است تلاش‌هایش برای فراهم‌کردن امکان استفاده‌ی افراد معلول از تکنولوژی‌های روز دنیا را آغاز‌ کرده‌، اخیرا پروژه‌ای به‌نام یوفونیا (Euphonia) را رونمایی کرده است. یوفونیا برگرفته از نام ماشین سخن‌گویی است که اواخر قرن هجدهم و اوایل قرن نوزدهم، جوزف یوفونیا ، مخترع آلمانی، ابداع کرد و ساخت. درواقع، این پروژه تلاشی برای ارتقای قابلیت‌های فناوری تشخیص گفتار به‌منظور فراهم‌آوردن امکان درک صحبت‌های افراد مبتلا به مشکلات تکلم و اختلالات گفتاری است؛ چرا‌که سیستم‌های پردازش گفتار طبیعی موجود قابلیت درک صحبت‌های افراد مبتلا به بیماری‌های پیش‌رونده‌ای همچون ALS را ندارد. بیماری اسکلروز جانبی آمیوتروفیک (Amyotrophic Lateral Sclerosis) که استیون هاوکینگ نیز به آن مبتلا بود، نوعی بیماری نورون‌های حرکتی است که موجب تخریب پیش‌رونده و ترمیم‌ناپذیر دستگاه عصبی می‌شود. در این بیماری، دستگاه عصبی مرکزی و ماهیچه‌ها به‌ویژه ماهیچه‌های دست، پا، ساعد، سر و گردن به‌شدت صدمه می‌بینند و فرد مبتلا معمولا دچار ناتوانی‌های حرکتی می‌شود و پس از سه تا پنج سال جان خود را از دست می‌دهد. در ویدئو زیر، دیمیتری کانوسکی (Dimitri Kanevsky) از محققان گوگل که خود نیز مبتلا به نوعی اختلال گفتاری است، نتایج تحقیقات اخیر این شرکت را در عمل آزمایش می‌کند و نهایتا از محصول تولیدی در پروژه‌ی Parrotron نتیجه مطلوب را می‌گیرد. محصول تولید‌شده در این پروژه، گفتار افراد مبتلا به اختلالات تکلم را مستقیما و بدون تبدیل به متن، به گفتار سلیس ماشینی تبدیل می‌کند.


لینک دانلود
ازآنجاکه مبنای یادگیری در تکنولوژی ASR (تشخیص گفتار خودکار یا Automatic Speech Recognition)، صحبت‌کردن به‌شیوه‌ی معمول و متداول است، سیستم‌هایی که از این تکنولوژی بهره‌ می‌گیرند، برای افرادی که با لهجه‌ی خاصی صحبت‌ می‌کنند یا مبتلا به اختلالات تکلم هستند، چندان کاربردی نیست و حتی درباره‌ی مبتلایان به اختلالات گفتاریِ نه‌چندان حاد، همچون ALS نیز، نرخ خطای کلمه‌ی درخورتوجهی را شاهد هستیم. نرخ خطای کلمه (WER) معمول‌ترین شاخص برای مقایسه‌ی عملکرد سیستم‌های ASR است و از تقسیم مجموع تعداد کلمات اشتباه تشخیص‌ داده‌شده و کلمات گفته‌نشده‌ی اضافه‌شده و کلمات گفته‌شده‌ی تشخیص‌ داده‌نشده، بر تعداد کل کلمات گفته‌شده به‌دست می‌آید. گوگل در پروژه‌ی Parrotron، گفتار افراد مبتلا به اختلالات تکلم را بدون تبدیل به متن، به گفتار سلیس ماشینی تبدیل می‌کند
احتمالا اینجا هم متهم ردیف اول، مجموعه داده‌هایی هستند که سیستم برای یادگیری دراختیار دارد. این یکی از تعصبات ضمنی رایجی است که نمونه‌های مشابه‌اش را در مدل‌های دیگر هوش مصنوعی و زمانی‌که نرخ خطای سیستم بیشتر از حد موردانتظار محقق است، شاهد هستیم. شاید ناتوانی سیستم‌های تشخیص چهره در شناسایی افراد رنگین‌پوست در مقایسه با ساخت سیستم تشخیص گفتاری که برای افراد مبتلا به اختلالات گفتاری کاربردی نیست، خطای چندان چشمگیری به‌شمار نیاید؛ اما در هر دو مورد، بخشی از مشکل سیستم دراختیار نداشتن داده‌های مربوط به گروه‌های خاصی از افراد است. این امر برای محققان گوگل به‌معنای جمع‌آوری ساعت‌ها داده‌ی صوتی از افراد مبتلا به ALS است و ازآنجاکه نوع و میزان پیشرفت مشکلات گفتاری در این بیماران از فردی به فرد دیگر متفاوت است، طبیعی است انتظار داشته‌ باشیم فرایند تطبیق این تکنولوژی با اثرهای ناشی از یک بیماری، کاملا از روند تطبیق آن با مثلا لهجه‌ای غیرمعمول متفاوت باشد. پژوهشگران پروژه‌ی یوفونیا ضمن ارزیابی‌های خود دریافته‌اند وقتی این مدل نمی‌تواند واجِ اداشده را به‌درستی تشخیص دهد، دو نوع خطا ممکن است رخ‌ داده‌ باشد: 1. سیستم واج اداشده و به‌تبع آن، کلمه را به‌اشتباه تشخیص‌ داده‌ باشد؛ 2. سیستم توانایی تشخیص واج اداشده را نداشته‌ و به‌ناچار آن‌ را حدس‌ زده‌ باشد. در این‌ صورت، نزدیکی آوایی یک یا چندین واج‌ در یک کلمه، ممکن است به خطا در جایگزینی واج‌ها و به‌تبع آن، اشتباه در تشخیص کلمه منجر شود. حل مشکل دوم با توجه به قابلیت‌های هوش‌ مصنوعی، چندان دشوار به‌نظر‌ نمی‌رسد. اگر سیستم در جمله‌ی «من روزی یک سیب می‌خورم»، نتواند «س» را در کلمه «سیب» تشخیص‌ دهد، برای مدلی که از هوش ‌مصنوعی بهر‌ه‌ می‌گیرد، احتمال آنکه گوینده جمله‌ی «من روزی یک شیب می‌خورم» را بیان کرده باشد، با احتمال بیان جمله‌ی مذکور به‌صورت صحیح یکسان نیست. سیستم با بهره‌گیری از هوش‌ مصنوعی و آنچه درباره‌ی الگوهای کلامی زبان انسان می‌داند و با درنظرداشتن موضوع صحبت گوینده و زمینه‌های مرتبط با آن، می‌تواند جمله‌ی صحیح را حدس‌ بزند. اطلاعات بیشتر درباره‌ی این پروژه که همچنان مراحل تحقیقاتی را پشت‌سر می‌گذارد، در مقاله‌ای با عنوان Personalizing ASR for Dysarthric and Accented Speech with Limited Data دردسترس است که ماه آینده در کنفرانس Interspeech استرالیا ارائه خواهد‌ شد.

لینک کوتاه:
https://www.aryajavan.ir/Fa/News/162835/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

آلگری: می‌خواستم خودم را هم تعویض کنم!

گلزنی منتظرمحمد مقابل تیم ملی امید تاجیکستان

کارشناسی داوری فولاد - مس رفسنجان

کارشناسی داوری دیدار استقلال - شمس آذر

حمله هواداران عصبانی تراکتور به مینی ون حامل بازیکنان در فرودگاه تبریز

چرا جیمی کرگر به پیروزی و صعود بایرن مونیخ مقابل آرسنال باور داشت؟

رزرو بلیت پاریس برای 4 کشتی‌گیر و ابهام در 57 و 86 کیلو

یوونتوس به زحمت از شکست گریخت

کارشناسی داوری سپاهان - ذوب آهن

کارشناسی داوری پیکان - هوادار

پیشنهاد رسمی امیر قلعه نویی و فدراسیون فوتبال به دست افشین قطبی رسید

کارشناسی داوری صنعت نفت - پرسپولیس

کارشناسی داوری گل گهر - استقلال خوزستان

کارشناسی داوری نساجی - تراکتور

صحبت های سیدعلی میرغفاری رئیس صدور مجوز حرفه ای استقلال

عذرخواهی کاپیتان استقلال بخاطر 10 دقیقه پایانی

واکنش وزارت خارجه ایران به اقدام آمریکا برای تمدید تحریم نفتی ونزوئلا

گلکسی زد فلیپ 6 با پردازنده پرچمدار قدرت‌نمایی کرد

گزارش Surfshark: از سال 2004 تاکنون، میلیاردها حساب کاربری هک شده‌اند

اپل پیام‌رسان‌های واتساپ و تلگرام را از اپ استور چین حذف کرد

عکس های کاملا به موقع

گناه مخاطب چی بود فرشته؟

بیرانوند فردا گچ دستش را باز می کند

معاون پرسپولیس: اعلام کردند VAR منتفی شد

علت توقف مذاکره تراکتور با بردیف از زبان نصیرزاده

نکته‌نگران کننده استقلال؛ وزن‌تعویض‌ها بالا نیست

کارشناسی داوری مس رفسنجان - پیکان

کارشناسی داوری شمس آذر - فولاد

کارشناسی داوری استقلال خوزستان - صنعت نفت

پلی به گذشته؛ برتری 2-1 بایرن مونیخ مقابل منچستریونایتد

بخش‌هایی از داوری گلاره ناظمی در اولین قضاوت خود به عنوان داور اول در جام ملت های فوتسال آسیا

گل زیبای دوشان ولاهوویچ به کالیاری از روی ضربه آزاد

آخرین خبر از واگذاری مالکیت باشگاه پرسپولیس

رسانه صهیونیستی: نتانیاهو یک آدم حراف و طبل تو خالی از کار درآمد

تصویب چهاردهمین بسته تحریمی اتحادیه اروپا علیه روسیه

اگزینوس 2500 احتمالاً عملکرد بهینه‌تر نسبت به اسنپدراگون 8 نسل 4 خواهد داشت

زلزله تایوان نزدیک به 100 میلیون دلار به TSMC خسارت وارد کرده است

رونمایی اسپیکر نمایشگردار اپل محتمل‌تر شد

ترفند عجیب گراز برای فرار از دست سگ‌های شکارچی!

خیلی شانس آورد از یک تصادف مرگبار نجات پیدا کرد!

دابسمش علی لهراسبی برای مخاطبانش

سلمان: در باز است، باز پرنده است، پس در پرنده است!

وقتی نمیتونی دو دقیقه ساکت بشینی

فامیل دور و بچه‌ش و ببعی قاچاقی میخوان برن ترکیه

بلایی که مهسا طهماسبی سر گربه های محله آورده

عمو کاووس: مرگ حقه، میکروب بهانه است

سرپرست استقلال: مشکل تیم ما مالی است

کری ستاره بارسا برای رئال؛ با 200 درصد توان بازی می کنیم

رضاوند: بازی‌ها با VAR برگزار شود تا حق تیمی‌ خورده نشود

واکنش بادامکی به استفاده از VAR در هفته‌های پایانی