در حالی که دستیارهای صوتی مانند سیری، الکسا یا Google Assistant میتوانند برای عملکردهای مختلف مبتنی بر صدا مفید باشند، مواقعی وجود دارد که لازم است برخی از کارها را بدون ایجاد مزاحمت برای دیگران، مثلاً در یک کتابخانه یا منطقه آرام در دفتر انجام دهید. بنابراین، دو محقق دانشگاه کرنل برای کمک به کاربران در ارائه بیصدا دستورات صوتی به دستگاههای هوشمند، یک دوربین پوشیدنی با قابلیت تشخیص گفتار بیصدا ساختند. بیایید نگاهی به جزئیات بیاندازیم.
محققان دوربین با قابلیت تشخیص گفتار بیصدا را توسعه دادند
چنگ ژانگ، استادیار علوم اطلاعات در کالج محاسباتی و علوم اطلاعات دانشگاه کورنل، و رویدونگ ژانگ، دانشجوی دکترا در همان دانشگاه، دوربین ویژه تشخیص گفتار بیصدا را توسعه دادند.
«تصور کنید زمانی که دستان شما اشغال شده است یا نمیخواهید برای تعامل با دستگاههای هوشمند خود دست دراز کنید، ممکن است بخواهید از کنترل صوتی استفاده کنید. با این حال، اگر در یک مکان پر سر و صدا یا در یک جلسه هستید، کنترل صدا و استفاده از دستورات صوتی ممکن نیست. چنگ ژانگ، یکی از محققان این پروژه، توضیح میدهد که این همان جایی است که گفتار بیصدا مطرح میشود.
این دستگاه SpeeChin نامیده شده است زیرا از یک دوربین IR (مادون قرمز) برای ضبط حرکات چانه و گردن کاربر استفاده میکند تا دستورات صوتی متعددی را تشخیص دهد، حتی زمانی که آنها دستورات را زمزمه میکنند یا فقط به زبان میآورند. دستگاه در یک گردنبند آویزان میشود، درست زیر گردن کاربر با دوربین IR به سمت بالا، به سمت چانه قرار داده میشود.
به گفته محققان، این دوربین حرکات چانه و گردن کاربر را میگیرد تا تشخیص دهد که چه چیزی میخواهد بگوید. از این رو، میتوانید لبهای خود را زمزمه کنید یا به سادگی حرکت دهید، انگار که کلمه یا عبارت خاصی را برای دستگاه میگویید تا دقیقاً فرمانی را که میخواهید منتقل کنید، دریافت کنید.
محققان میگویند که دوربین تشخیص گفتار بیصدا میتواند 54 عبارت انگلیسی و دستورات صوتی عمومی و 44 کلمه و عبارت را به زبان چینی ماندارین تشخیص دهد. آنها SpeeChin را با 20 شرکتکننده آزمایش کردند و دستگاه توانست 90.5 درصد دقت را هنگام تشخیص دستورات انگلیسی و 91.6 درصد دقت را هنگام تشخیص دستورات چینی ارائه دهد. اما، زمانی که شرکتکنندگان در حالی که دستورات بیصدا به دوربین میدادند، حرکت میکردند، میزان دقت کاهش یافت.
در مورد در دسترس بودن چنین دستگاهی، محققان به وضوح باید در آینده روی قابلیت اطمینان SpeeChin کار کنند. از این رو، ممکن است مدتی طول بکشد تا یک دوربین پوشیدنی با قابلیت تشخیص گفتار بیصدا مانند SpeeChin به صورت تجاری در بازار موجود شود. بنابراین، نظر شما در مورد SpeeChin چیست؟ آیا فکر میکنید این گجت موفقی در بازار باشد؟