با حمایت ستاد فناوری اطلاعات، ارتباطات و میکروالکترونیک معاونت علمی؛

ارتباط بین انسان و ماشین از طریق گفتار به کاربردهای وسیع‌تری توسعه می‌یابد

نخستين نرم‌افزار تايپ گفتاري زبان فارسي بر اساس فناوری تشخیص گفتار پیوسته مستقل از گوینده فارسی طراحی‌شده و ارتباط بین انسان و ماشین (ازجمله رایانه‌ها) را ممکن ساخته است.

نخستين نرم‌افزار تايپ گفتاري زبان فارسي بر اساس فناوری تشخیص گفتار پیوسته مستقل از گوینده فارسی طراحی‌شده و ارتباط بین انسان و ماشین (ازجمله رایانه‌ها) را ممکن ساخته است. 

به گزارش مرکز روابط عمومی و اطلاع‌رسانی معاونت علمی و فناوری ریاست جمهوری، نخستين نرم‌افزار تايپ گفتاري زبان فارسي با هدف ایجاد ارتباط بین انسان و ماشین (از جمله رایانه‌ها) از طریق گفتار توسط شرکت عصرگویش‌پرداز طراحی شده است. از طریق این فناوری انسان برای انجام کارهای معمول با ماشین‌ها می‌تواند به‌جای استفاده از کلید و دکمه، با صحبت کردن با ماشین درخواست خود را به آن منتقل کند. 

حسین صامتی، عضو هیئت علمی دانشکده‌ مهندسی کامپیوتر دانشگاه صنعتی شریف و طراح این نرم‌افزار در خصوص معرفی نرم‌افزار نویسا با اشاره به اینکه فعالیت در زمینه هوش مصنوعی و پردازش سیگنال گفتار باهدف ایجاد ارتباط بین انسان و ماشین اجرایی شده است بیان کرد: نویسا علاوه بر بازشناسی گفتار پیوسته و طبیعی فارسی و نوشتن متن معادل آن،  براساس شناختی که از مدل زبانی دارد پیش‌بینی ادامه متن را انجام می‌دهد و از این طریق دقت تایپ را افزایش می‌دهد.

صامتی نرم‌افزار نویسا را شامل دو بخش اصلی توصیف کرد و گفت: نرم‌افزار تايپ گفتاري زبان فارسي از دو بخش اصلی پردازش گفتار و پردازش زبانی تشکیل‌شده است،  که در پردازش گفتار  به بررسی  سیگنال گفتار پرداخته می‌شود و در بخش زبانی کلمات ادا شده ازلحاظ فراوانی، گرامر و معناشناسی مورد بررسی قرار می‌گیرد که در نهایت متن معادل گفتار به درستی تهیه می‌شود. 

این فعال حوزه فناوری با اشاره به این‌که این نرم‌افزار در سال ۸۶ برای اولین بار در دنیا توسط محققان داخلی طراحی شده است گفت: شرکت عصرگویش پرداز پیشرو در طراحی نرم‌افزار تبدیل گفتار به متن فارسی در جهان بود ولی در حال حاضر شرکت‌هایی همچون گوگل و چندین شرکت‌ داخلی برای زبان فارسی این سامانه را ارائه کرده¬اند که هیچیک امکان بازشناسی متون تخصصی را ندارند.

وی گفت: نیاز به این سامانه از زمان‌های دور برای  انسان وجود داشته است و از دهه ۱۹۸۰ به بعد با فراهم شدن ابزارهای لازم سامانه¬های کاربردی بازشناسی گفتار در جهان ارائه شد. 

صامتی با اشاره به مشتریان این نرم افزار در داخل گفت: در حال حاضر بیش از ۳ هزار مشتری اعم از سازمانی و شخصی در کشور از استفاده‌کنندگان این نرم‌افزار طراحی‌شده هستند. 

وی در ادامه افزود: بانک‌ها , قوه قضاییه، پزشکان ، وزارت نفت، وزارت ارشاد و دانشجویان از مشتریان این نرم‌افزار تولیدشده در کشور به شمار میروند. 

صامتی تشخیص لهجه و لحن و ایجاد پروفایل شخصی برای تمامی کاربران نرم‌افزار را از قابلیت‌های این نرم‌افزار خواند و گفت: از مهم‌ترين ويژگي‎های نسخه جديد نرم‌افزار نويسا تولید آن در نسخه¬های مختلف برای کاربری‌های مختلف است که از این کاربری‌ها، می‎توان به کاربری بیمارستانی، حقوقی، سازمانی و مدارس و نیز برای نویسندگان اعم از فیلم‌نامه‌نویس و نویسنده کتاب اشاره کرد که در هر یک از نسخه‎ها با توجه به نیازهای کاربر، تطبیق با واژگان و مدل زبانی آن گروه کاربران صورت گرفته است.

این فعال حوزه فناوری با اشاره به  اینکه هیچ تناقضی میان طراحی این نرم‌افزار و بحث اشتغال وجود  ندارد گفت: با توجه به این‌که کار در حوزه فناوری‌های نوین همیشه همراه با موضوع اشتغال‌زایی بوده است نرم‌افزار طراحی‌شده ممکن است نیاز به وجود تایپیست را کم‌رنگ‌تر کند اما طراحی و به‌کارگیری این نرم‌افزار نیازمند گروهی از تحصیل‌کردگان به‌منظور تحقیق و توسعه است و اشتغال‌زایی برای نخبگان ایجاد می‌کند. همچنین پردازش خودکار زبان فارسی، راهگشای انجام پروژه¬های متعدد کاربردی در زمینه خط و زبان فارسی در محیط رایانه خواهد بود که بدون ابزار بازشناسی گفتار چنین کاربردهایی ممکن نبود. کاربردهایی مانند تشخیص تمایل کاربران، مدیریت ارتباط مشتریان از طریق ارتباط صوتی آنان، آمارگیری و تشخیص میزان رضایت کاربران هر سامانه با تبدیل گفتار آنان به متن و تحلیل آن متون عملی خواهد بود و این پروژه‌ها به نوبه خود شغل‌های زیادی برای متخصصین و نخبگان ایجاد خواهد کرد.


استفاده در نرم‌افزارهای آموزشی و بازی‌ها

از فرمان‌های صوتی می‌توان برای افزایش قابلیت‌های جدید به نرم‌افزارهای مختلف مانند بازی‌ها و نرم‌افزارهای آموزشی استفاده کرد. گفتاری کردن نرم‌افزارها، علاوه بر افزودن امکانات جدید به آن‌ها، باعث جذاب‌تر شدن آن‌ها نیز می‌شود. به‌عنوان نمونه‌هایی از این کاربرد، می‌توان به نرم‌افزارهایی که در آن‌ها نیاز به سؤال و جواب وجود دارد (مانند آموزش زبان انگلیسی و آموزش قرآن، نرم‌افزارهایی با سؤالات چهار جوابی و …) اشاره کرد.

اجرا و کنترل برنامه‌های رایانه به کمک گفتار

این قابلیت کاربران را قادر می ساز تا بتوانند با استفاده از گفتار، کارهای کامپیوتری را انجام داده و یا نرم‌افزارها را کنترل کنند. به‌عنوان‌مثال، کاربر می‌تواند با گفتن «به اینترنت وصل شو» یا «اینترنت» مرورگر اینترنت را باز کند و به اینترنت وصل شود. یا با گفتن «اندازه نوشته را بزرگ‌تر کن» یا «بزرگ‌تر» اندازه متن نوشته‌شده در ویرایشگر Wordرا بزرگ‌تر کند. به‌صورت مشابهی، کاربر می‌تواند فرمان‌های صوتی مختلفی را در نرم‌افزارهای نصب‌شده در رایانه تعریف کند و بابیان آن‌ها، نرم‌افزارها را کنترل کند.

 

کلمات کلیدی

تصاویر

 ستاد فرهنگسازی اقتصاد دانش بنیان
//isti.ir/ZMPd