Iranian Futurist 
Iranian Futurist
Ayandeh-Negar
Welcome To Future

Tomorow is built today
در باره ما
تماس با ما
خبرهای علمی
احزاب مدرن
هنر و ادبیات
ستون آزاد
محیط زیست
حقوق بشر
اخبار روز
صفحه‌ی نخست
آرشیو
اندیشمندان آینده‌نگر
تاریخ از دیدگاه نو
انسان گلوبال
دموکراسی دیجیتال
دانش نو
اقتصاد فراصنعتی
آینده‌نگری و سیاست
تکنولوژی
از سایت‌های دیگر


ماشین هایی ​که زبانتان را می فهمند

اگر عضو یکی از شبکه‌های زیر هستید می‌توانید این مطلب را به شبکه‌ی خود ارسال کنید:
Twitter Google Yahoo Delicious بالاترین دنباله

[01 Apr 2013]   [ ]

یکی از کارآمدترین ابزارهای مبادله اطلاعات برای بشر گفتار است. انسان امروزی همواره در این آرزو بوده است که بتواند به روشی برای کنترل محیط و ارتباط با ابزارها و ماشین ها از طریق این ابزار کارآمد یعنی گفتار دست یابد.

از این رو در سال های اخیر تولید سیستم های تشخیص و بازشناسی گفتار در بسیاری از مراکز تحقیقاتی در سطح دنیا مورد توجه قرار گرفته است. با توجه به اهمیت این سیستم ها در طراحی و ساخت نسل آینده ابزارهای ارتباطی، طراحی سیستم های پیشرفته در بازشناسی گفتار مورد توجه گروهی از پژوهشگران قرار گرفته است.


پژوهشگران دانشکده مهندسی دانشگاه صنعتی امیرکبیر از دستیابی به روش جدیدی برای بهبود عملکرد سیستم های بازشناسی گفتار در سامانه های هوشمند خبر داده اند که براساس آن می توان نرم افزارهایی را برای فراهم ساختن امکان استفاده از شیوه ارتباطی جدیدی در تلفن های همراه و کامپیوترها بدون نیاز به موس و صفحه کلید طراحی کرد.
با مهندس کامران قاصدی دانش آموخته کارشناسی ارشد مهندسی پزشکی و مجری این طرح درباره سیستم های بازشناسی گفتار و امکانات مختلف این سیستم ها گفت وگو کرده ایم که در ادامه آن را می خوانید.


بازشناسی گفتار در حوزه ارتباطات هوشمند بین انسان ها و سیستم های کامپیوتری چه جایگاهی دارد؟


مهم ترین هدف بازشناسی گفتار کمک به حذف وسایل ارتباطی واسطه نظیر موس و صفحه کلید در کامپیوترها و تلفن های همراه است. یعنی به کمک آن می توان ابزارهای ارتباطی را از طریق گفتار تحت کنترل قرار داد. با توجه به کاربردهای فراوانی که بازشناسی گفتار دارد، نقش اساسی این فناوری در حوزه ارتباطات هوشمند مورد توجه قرار گرفته است. در حقیقت ۲۵ سال از زمانی که نخستین بار روش های بازشناسی گفتار مورد توجه قرار گرفت، می گذرد. در این پروژه برای به حداقل رساندن نویز یا صداهای مزاحم محیطی و پارامترهای متغیر گفتار از بازشناسی گفتار براساس اطلاعات صوتی و تصویری استفاده شده است. یعنی علاوه بر سیگنال های صوتی، تصویر فرد کاربر نیز مشاهده می شود و براساس منحنی که از خطوط دور لب فرد ترسیم می شود، ویژگی هایی استخراج می شود که در بازشناسی گفتار مورد استفاده قرار می گیرد. این فرآیند درست شبیه همان فرآیندی است که در لب خوانی انجام می شود. در نهایت این ویژگی ها در کنار ویژگی ها و خصوصیات صدای فرد برای تشخیص آنچه گفته است مورد استفاده قرار می گیرد.


این روش بر چه مبنایی ارائه شده است؟


ما برای این کار با اخذ مجوز از دانشگاه ATH سوئیس پایگاه اطلاعات آنها را دانلود کردیم و سپس روی این داده ها برنامه هایی را اجرا کردیم و توانستیم به نتایجی در زمینه ارائه روشی جدید برای بازشناسی گفتار دست یابیم. پس از این می توان براساس روش جدید ارائه شده با همکاری شرکت ها، محصولات تجاری را مبتنی بر این روش با بازار عرضه کرد. نتایج این تحقیق نشان می دهد این روش جدید در بازشناسی گفتار می تواند از فواید بی شماری برخوردار باشد. برای مثال محصولات جدید سونی مجهز به نرم افزاری است که از قابلیت تطبیق با صدای صاحبش برخوردار است. در این صورت برای فعال شدن سیستم عامل، دیگر نیازی به حساب کاربری و رمز عبور ندارید بلکه لپ تاپ یا گوشی تلفن همراه مارک سونی شما به محض شنیدن صدایتان فعال می شود. بر اساس این نتایج می توان نرم افزاری را طراحی کرد که در این طرح، تحقیقات لازم برای ساخت نمونه داخلی آن صورت گرفته است.


ویژگی منحصر به فرد این روش در مقایسه با روش های مشابه بازشناسی گفتار چیست؟


این روش جدید در مقایسه با روش های قبلی از کاربردهای متنوع تری برخوردار است. این روش در نهایت می تواند به طراحی و ساخت سامانه های هوشمندی منجر شود که می توانند با کاربرانشان ارتباط برقرار کنند. گام بعدی پیشرفت این سیستم ها تحلیل محتوایی گفتار است. به عبارت دیگر کامپیوتر جمله شما را نمی نویسد بلکه این جمله را درک می کند و براساس آن منابعی را که مرتبط است در اختیارتان قرار می دهد. البته پیش از این نیز در این زمینه اقدامات مشابهی نظیر طراحی نرم افزارهای هوشمند تایپ توسط گروهی از محققان دانشگاه صنعتی شریف انجام شده بود اما همه روش های پیشین دارای محدودیت است. برخی از این محدودیت ها ناشی از این است که کاربر باید حتما در اتاقی کاملا ساکت که عایق صداست از این نرم افزار استفاده کند. اما در دنیای واقعی و روزمره شما در محیطی هستید که مجموعه ای از صداهای محیطی مزاحم و صدای افراد دیگر هم وجود دارد.


چرا به این فکر افتادید که بهتر است در سیستم های بازشناسی گفتار از ویژگی های تصویری استفاده کنید؟


انسان این توانایی را دارد که بتواند تنها صدایی را که مورد نظرش است، بشنود و بقیه صداها را فیلتر کند. اما ماشین ها در این زمینه با محدودیت مواجه هستند. برای مثال، صداهای محیطی و بالا و پایین شدن صداها در این سیستم اختلال ایجاد می کند. این روش جدید در مقایسه پیشرفته تر است و قابلیت حذف صداهای محیطی را دارد. یکی از راهکارها برای حل این مشکل علاوه بر بهره مندی از اطلاعات تصویری این است که در این روش از الگوی مغز انسان ایده گرفته شود. در قشر کورتکس مغز نواحی جداگانه ای تحت عنوان بخش های بینایی و شنیداری وجود دارد که اطلاعات را پردازش می کند. در بخش بالاتر پردازش اطلاعات به درک گفتار منتهی می شود. در این روش جدید از اطلاعات فیزیولوژیک هم استفاده شده است.


این روش جدید چه امکاناتی را باهدف بهبود ارتباطات هوشمند در اختیار کاربران قرار می دهد؟


نتایج به دست آمده از این تحقیقات را می توان در قالب یک نرم افزار ارائه کرد که روی ابزارهای مختلف قابل نصب است و بر این اساس اپلیکیشن هایی برنامه نویسی می شود. در این زمینه اقدامات مشابهی نیز انجام شده است. برای مثال اپل که از جمله شرکت های بزرگ و مطرح در زمینه طراحی و ساخت گوشی های هوشمند است از روش مشابهی در طراحی سیستم نرم افزاری نسل جدید گوشی های آیفون استفاده کرده است که ارتباط کاربر با گوشی تلفن همراه را به شیوه ای متفاوت امکان پذیر می سازد. به این ترتیب می توانید از گوشی تلفن همراهتان سوالی بپرسید. این نرم افزار سوال شما را درک کرده و درباره آن در اینترنت جستجو می کند و در نهایت نتیجه جستجو را اعلام می کند. در حقیقت این نرم افزار از عملکردی شبیه یک منشی اختصاصی برای کاربران برخوردار است. اما اگر بتوان کیفیت بازشناسی گفتار را در این نرم افزار ارتقا داد تا ویژگی هوشمندی هم به آن اضافه شود می تواند از قابلیت درک عواطف و احساسات کاربران نیز برخوردار شود.


تاثیر فناوری بازشناسی گفتار بر آینده فناوری

نخستین سیستم های بازشناسی گفتار سال ۱۳۳۲ طراحی شد. یکی از بزرگ ترین محدودیت های این سیستم ها در مقایسه با سیستم های امروزی این بود که این سیستم به شیوه گفتار گسسته که مستلزم ایجاد وقفه بین کلمات است و به صورت وابسته به شخص گوینده و تنها با تعداد واژه محدودی عمل می کرد.

ابتدا استفاده از این فناوری به افرادی که با ناتوانی در استفاده از شیوه های متداول ارتباطی مواجه بودند، محدود می شد اما بتدریج محدوده کاربری آنها گسترده تر شد.

این سیستم قابلیت اجرا و کنترل گفتاری برنامه های کامپیوتری را دارد و به این ترتیب کار با نرم افزارها بسیار سریع تر می شود.

علاوه بر این سیستم های بازشناسی گفتار، امکان کنترل از راه دور وسایل و ابزارهای مختلف را نیز فراهم می کند. گفتاری شدن نرم افزارهای آموزشی و بازی ها نیز موجب جذاب تر شدن این نرم افزار شده است. سیستم های بازشناسی گفتار انواع مختلفی دارد.

بعضی از این سیستم ها تنها گفتار پیوسته را شناسایی می کند و بعضی دیگر تنها در صورتی که بین کلمات فاصله یا به اصطلاح سکوت وجود داشته باشد واژه ها را تشخیص می دهد، اما بهترین و ایده آل ترین سیستم بازشناسی گفتار سیستمی است که توانایی تشخیص گفتار پیوسته ای را که به گوینده ای خاص وابسته نباشد، داشته باشد و بتواند صدای شخص گوینده را از میان مجموع صداهای محیطی تشخیص دهد.

به طور کلی، هدف از طراحی و ساخت این سامانه فراهم کردن امکان ارتباط بین انسان ها و ماشین های مختلف از جمله رایانه ها از طریق گفتار است.

اگر بخواهیم دورنمایی از آینده را ترسیم کنیم باید اشاره کنیم که بزودی ماشین ها و ابزار دوروبرمان آنقدر هوشمند و طبیعی با ما ارتباط برقرار خواهند کرد که ما طبیعتا حضور آنها در کنار خودمان را به عنوان موجودی ذی شعور خواهیم پذیرفت. چنین سامانه هایی می تواند به کودکانی که دچار محدودیت های گفتاری هستند، کمک کند تا بر این محدودیت ها غلبه کنند.


کامران قاصدی

فرانک فراهانی‌جم

مطلب‌های دیگر از همین نویسنده در سایت آینده‌نگری:


منبع:


بنیاد آینده‌نگری ایران



دوشنبه ۱۰ ارديبهشت ۱۴۰۳ - ۲۹ آوریل ۲۰۲۴

تکنولوژی

+ راهنمای جامع آشنایی با مدل هوش مصنوعی مولد، کاربردها و انواع آن مترجم: حمیدرضا تائبی

+ تولید متن یا Text Generation چیست؟  حمیدرضا تائبی

+ چه تکنولوژی‌هایی باعث تحول دیجیتال در صنعت کشاورزی می‌شوند؟ -

+ ارتباط انقلاب صنعتی چهارم با تحول دیجیتال چیست؟ -

+ هوش مصنوعی در خدمت دموکراسی /

+ انقلاب صنعتی چهارم چیست و چگونه بر زندگی ما تاثیر می گذارد؟ فاطمه حسینی

+ یادگیری ماشین آنلاین چیست و چرا نقش مهمی در دنیای هوش مصنوعی دارد؟  حمیدرضا تائبی

+ خودیابی فرهنگی در جهان دیجیتال  فرهنگ امروز/ عیسی عبدی

+ انقلاب بزرگ فین‌تک‌ها در یک دهه آینده مترجم: مهسا قنبری

+ راهکار محققان برای مجهز شدن IoT به شبکه‌های عصبی بهینه  مهدی صنعت‌جو

+ ۱۰ شغلی که هوش مصنوعی تصاحب نخواهد کرد  مهدی صنعت‌جو

+ پیوند کامپیوتر و مغز انسان محسن آقاجانی

+ فناوری‌های نوظهور 

+ قدرت‌نمایی هوش مصنوعی در دنیای داروسازی حمیدرضا تائبی

+ تاثیر ابزارهای هوشمند بر کنترل شیوع بیماری‌های فراگیر 

+ فناوری تشخیص چهره در یک قدمی زندگی ما حمیدرضا تائبی

+ آیا تلفن هوشمند، بخشی از وجود ماست؟ 

+ انقلاب عاشقانه در زمانه تکنولوژی 

+ آیا تکنولوژی باعث خوشبختی بشر می‌شود؟ محمدحسین آشنا

+ آیا فناوری تشخیص چهره نگران کننده است؟  مهدی زارع سریزدی

+ روبات‌هایی که می‌بینند و از انسان می‌آموزند- مهدی صنعت‌جو

+ یک راهکار عالی برای آنکه بدانید اینترنت شما چه زمانی قطع شده است حمیدرضا تائبی

+ آیا ماشین‌ها ما را از کار برکنار خواهند کرد؟ حمیدرضا مازندرانی

+ پیامدهای نسل چهارم فناوری رسانه‌های اجتماعی  دکتر محمود سریع‌القلم

+ طبقه‌ای به نام علوم انسانی دیجیتال 

+ تکنولوژی و آینده جامعه 

+ گشايش اولین فروشگاه بدون فروشنده و صف توسط آمازون 

+ فناوری‌هایی که در سال ۲۰۱۸ رشد می‌کنند مهدی مطلبی

+ صوفیا، ربات شهروند تمایل به تشکیل خانواده دارد! 

+ روبات عصیانگر در شهر بی‌قانون؛ آغاز عصر وحشت حمیدرضا تائبی

+ اسکلت‌ پوشیدنی شنوا برای معلولین مهدی صنعت‌جو

+ سازمان ملل، هوش مصنوعی را زیر نظر می‌گیرد مهدی صنعت‌جو

+ عطش ساختن فردا  سید کامران باقری

+ کارخانه های آینده | کسب و کاری با فناوری چاپ سه بعدی 

+ تكنولوژى‌آموزشى‌ يا‌تكنولوژى‌يادگيرى 

+ با این لباس هوشمند گرم می‌شوید 

+ خطر هک‌شدن خودروهای هوشمند جدی است 

+ آیا هوش مصنوعی بزرگترین تهدید برای تمدن بشری است؟ مهدی صنعت‌جو

+ انسان یا محصول، نسل‌های آینده کدامند؟ حمیدرضا تائبی

+ این روبات 500 برابر سریع‌تر از انسان کار می‌کند حمید نیک‌روش

+ جلوگیری از تصادفات منجر به مرگ خودران‌ها با تصمیم‌گیری به سبک انسان حمید نیک‌روش

+ کدام شغل‌ها تا ۱۰ سال آینده نابود می‌شوند؟ حمیدرضا تائبی

+ از این پس هوش مصنوعی مصدومیت‌های ورزشکاران را پیش‌بینی می‌کند حمیدرضا تائبی

+ هوش مصنوعی خودسر!/ آیا ترس دانشمندان به واقعیت بدل می‌شود؟ 

+ آیا در نهایت ماشین ها میتوانند پیش داوری و تعصب داشته باشند؟ 

+ تجاری‌سازی فناوری رابط مغز و کامپیوتر 5 دستاورد مهم دارد 

+ این ربات خیلی راحت و سریع خودروی شما را پارک می کند! +تصاویر 

+ استفاده از ربات‌ها در صنعت بیمه 

+ پایان عصر نفت! بهزاد احمدی نیا

+ چاپ 3 بعدی استخوان مصنوعی 

+ تولید دست مصنوعی 15 دلاری 

+ انسان‌ها و هوش مصنوعی همزیستی مستقل را تجربه خواهند کرد حمیدرضا تائبی

+ روبات‌ها به یکدیگر مهارت‌های جدید را یاد می‌دهند حمید نیک‌روش

+ دختر یازده ساله در نشست سالانه سهامدارن مایکروسافت چه سوالی مطرح کرد؟ حمیدرضا تائبی

+ بیشتر از ۸۰ درصد مشاغل امروزی تا چند سال آینده از بین می‌روند! حمید نیک‌روش

+ انقلاب الکترونیک , یا چگونه قاره آسیا زباله دان جهان شد 

+ فناوری های تشخیص هویت. صالح سپهری‌فر

+ رانندگی در واقعیت افزوده فرانک فراهانی جم

+ با بمب الکترومغناطیسی آشنا شویم 

+ ساخت جوهر از آلودگی هوا! 

+ خانه‌ای که در باد می‌رقصد+تصاویر 

+ مرکز تخصصی بازی‌های رایانه‌ای به حوزه درمان و امنیت وارد می‌شود 

+ ویژگی‌های بایسته معلمان در بهبود فرآیند یاددهی-یادگیری مدارس هوشمند 

+ جهان در 150 سال آینده چگونه خواهد بود؟. 

+ آینده نگری در مدیران IT 

+ بازی پیامکی و محتوای آموزشی - سرگرمی برای آینده پژوهی وحید وحیدی مطلق

+ ماشین هایی هوشمند تر از انسان 

+ مجازی بودگی و قدرت «دولت موبایل» داود زارعیان

+ تکنولوژی های آینده چگونه خواهند بود؟ عرفان کسرایی

+ انقلاب صنعتی چهارم در راه است احمد علوی

+ بررسی رابطه ی بین سناریو های تکنولوژی با داستان های علمی- تخیلی با نگاهی به چرخه ی روبوت آسیموف و فضای سایبری گیبسون مریم اخوی

+ آیا حضور ربات‌ها را در زندگی‌مان خواهیم پذیرفت؟ جین ویکفیلد - بی‌بی‌سی

+ ﺗﻌﺎرض دو ﻧﮕﺮش در ﻓﻠﺴﻔﮥ ﺗﮑﻨﻮﻟﻮژی و ﭘﮋواک آن در ﻓﻀﺎی ﻓﮑﺮی اﯾﺮان رهبر محمودزاده

+ روبات های پرستار در راه اند...مزایا ، معایب و خطرات صالح سپهری فر

+ سیر تحولی علم و تکنولوژي بعد از جنگ جهانی دوم الکساندر کینگ

+ ضرورت ارزیابی اخلاقی تکنولوژی های نوین ارتباطی وحیده علی پور

+ فیسبوک چگونه با استفاده از هوش مصنوعی تصاویر را برای نابینایان قابل درک می کند؟  مریم موسوی

+ چيني ها آيفون توليد مي کنند نه استيو جابز جوزف ناي

+ بهبود الگوی زندگی در مساله انرژی و تکنولوژی جلال نبهانی‌زاده

+ برای زندگی درکنار ربات ها آماده اید؟ شهرام یزدان پناه

+ دوران رباتی میترا بهاری

+ دسترسی ۵۰ درصدی کشورهای در حال توسعه به اینترنت باندپهن 

+ ﺗﻜﻨﻮﻟﻮژي اﺟﺘﻤﺎﻋﻲ ﺟﺮﻳﺲ ﻫﻨﺴﻮن اوﻣﺎﻧﺎروﻻ

+ ﺗﻜﻨﻮﻟﻮژي در ﻛﺸﻮرﻫﺎي در ﺣﺎل ﺗﻮﺳﻌﻪ ﺟﺮﻳﺲ ﻫﻨﺴﻮن اوﻣﺎﻧﺎروﻻ

+ فناوری اطلاعات در سازمان ها و ادارات شهاب وهابزاده

+ جنگ‌‌‌ بر ‌‌پایه ‌‌فناوری ‌‌اطلاعات‌ فریبا فرهادیان‌

+ تأملی دوباره در مفهوم اطلاعات و دانش: با تأکید بر حوزۀ علم اطلاعات و دانش شناسی مریم صابری

+ فهم سواد اطلاعاتي Barbara Humes

+ فناوری اطلاعات در حال ایجاد تحولی انقلابی در محصولات است روشنگری مدیریت اینترنت اشیاء

+ سبقت کتابهای الکترونیکی از کتابهای چاپی تا ۲۰۱۸ 

+ انقلاب اینترنت اشیا در سال ۲۰۲۰ 

+ نقش فناوری اطلاعات در سازمان‌های امروزی 

+ نابرابری دیجیتالی 

+ آینده پژوهی و چالشهای صنعت نساجی  فاطمه رئيسي 1 ، احسان قرباني 2 ، محمد قانع، فاطمه معدني

+ فناوری نسل آینده مترجم: فرناز رجبی مهر

+ نسل جديد خانه‌هاي خورشيدي 

+ خانه‌هایی که از صاحبان‌شان باهوش‌ترند 

+ افزایش شدت حملات سایبری در دهه آینده 

+ هرآنچه که درباره اینترنت اشیا می‌دانیم  زومیت

+ سفری به دنیای آینده 



info.ayandeh@gmail.com
©ayandeh.com 1995