گپ با هوش‌مصنوعی به لهجه‌های شیرین فارسی
  1. خبری
  2. همه خبرها
  3. خبر فوری
  4. اقتصادی
گپ با هوش‌مصنوعی به لهجه‌های شیرین فارسی

گپ با هوش‌مصنوعی به لهجه‌های شیرین فارسی

خبر فوریخبرگزاری خبر فوری |
داستان استارتاپ ایرانی ساکن «استیشن اف» که یک دستیار صوتی مشابه «الکسا» و «سیری» ساخته‌ است، ‌با این تفاوت که زبان فارسی و حتی لهجه‌های مختلف را می‌فهمد و به حرف‌های کاربر جواب می‌دهد.

از بچگی عاشق کارهای عجیب و غریب بود؛ ‌ عاشق ساختن روبات‌ و بعدتر برنامه‌نویسی، اما دست‌آخر زبان‌شناس و در نهایت زبان‌شناس کامپیوتری شد. سرنوشت، بازی بامزه‌ای را با سمیه باقربیگی شروع کرده بود. او را یک دور، بین تمام چیزهایی که دوست داشت، گرداند و بعد تمام آنچه در این سال‌ها آموخته بود، از زبان‌شناسی گرفته تا برنامه‌نویسی و … به کارش آمد تا بتواند آن را در یکی از پروژه‌های خاص در حوزه هوش مصنوعی ایران به‌کار بگیرد؛ ‌پروژه‌ای که زندگی او را از نظر حرفه‌ای و البته شخصی کاملا تغییر داد. سمیه باقربیگی و همسرش اکنون استارتاپ «های‌برینی» را که سال‌ها در ایران فعال بود، به فرانسه برده‌اند تا در استیشن‌ اف، بزرگ‌ترین مجتمع استارتاپی جهان در مقیاس جهانی، کارشان را پیش ببرند. این داستان زندگی سمیه باقربیگی و استارتاپ خاصی است که محصولاتی در حوزه پردازش متن، گفتار و تصویر ارائه می‌کند. جالب‌ترین آنها که توجه زیادی را در دنیا به‌خودش جلب کرده و به قول باقربیگی باعث شده سرمایه‌گذارهای خارجی با گفتن WOW ابراز تعجب کنند، دستیار شخصی «پارسی» است؛ سامانه‌ای شبیه دستیارهای صوتی خارجی مثل الکسا و سیری اما به زبان فارسی؛ سامانه‌ای که خودشان می‌گویند از رقبای خارجی بهتر کار می‌کند، لهجه‌های مختلف را می‌فهمد و بعد از درک آنچه کاربر می‌گوید، جواب مناسب را برایش ارائه می‌کند. سمیه باقر‌بیگی در گفت‌وگو با همشهری از جزئیات و فراز و نشیب‌های فعالیت استارتاپی تا رسیدن به نقطه کنونی گفته است.

داستان یک سفر علمی

تولید دستیار صوتی یک‌شبه اتفاق نمی‌افتد. سمیه باقربیگی هم بعد از تحصیل در رشته‌های مختلف ازجمله زبان‌شناسی و برنامه‌نویسی، چند سالی در آزمایشگاه‌های مرتبط مشغول فعالیت بود تا بتواند رسما و به‌طور مستقل روی ساخت نرم‌افزارهایی هوشمند کار کند که تازه بازارشان در ایران رو به رشد بود.

اولین نرم‌افزار مستقل

اولین پروژه مستقل سمیه باقربیگی و همسرش، مهدی گلزارنیا، سامانه‌ای بود که بعدها به نام «اولین موتور صوتی فارسی تلفن‌همراه» مشهور شد. بازار هدف این محصول ابتدا افراد کم‌بینا و نابینا بود. این برنامه می‌توانست برایشان متن پیامک یا هرچیزی که به‌صورت نوشتاری در صفحه گوشی ظاهر می‌شد را بخواند. از آنجا که عمده بازار ایران در آن زمان در دست نوکیا بود، این برنامه برای موبایل‌های آن شرکت تهیه شده بود. سمیه باقربیگی می‌گوید: «برخوردها با ما در سازمان بهزیستی به‌شدت بد و غیرحرفه‌ای بود. تا جایی که به‌خودم قول دادم، هرگز به آنجا برنگردم، ‌حتی اگر به باختم منجر شود». جامعه هدف کوچک و برخوردهای نامناسب در بعضی سازمان‌ها باعث شد، کم‌کم به فکر بازارهای دیگری بیفتند.

تلاش برای فهمیدن لهجه‌های ایرانی

مدتی بعد، هردو تصمیم گرفتند سامانه تبدیل متن به گفتار تلفنی را برای سامانه‌های تلفنی تولید کنند؛ سامانه‌ای که می‌توانست روی تلفن‌بانک، منشی تلفنی و … کار کند. این ماژول می‌توانست مشتری‌های بزرگی مثل بانک‌ها و شرکت‌های بزرگ را هم جلب کند. واقعا هم همین‌طور شد. چند بانک و سازمان از این سامانه روی تلفنبانک و سامانه‌های تلفنی خود استفاده کردند. برای توسعه پروژه‌ها و به‌دست‌آوردن سهم بزرگ‌تری از بازار، ‌تصمیم‌ گرفتند روی محصولات دیگری در حوزه هوش مصنوعی کار کنند؛ در نتیجه سامانه‌های جدید تشخیص چهره، نویسه‌خوان نوری، چت‌بات و سامانه‌های بازشناسی گفتار را راه‌اندازی کردند. باقربیگی می‌گوید: «یکی از جالب‌ترین پروژه‌‌ها، سامانه دستیار صوتی بود؛ چیزی شبیه سیری در آیفون که در آن کاربر می‌تواند دستوراتش را به‌صورت صوتی ارائه کند و دستگاه براساس الگوهایی که برایش تعریف شده، پاسخ‌هایی مناسب دهد. این سامانه می‌تواند لهجه‌های مختلف را شناسایی کرده و پاسخ مناسب ارائه کند». برای اینکه سامانه، دستورهای کاربر را دقیق‌تر و بهتر تشخیص بدهد، ‌باید پیکره گفتاری بزرگی درست می‌کردند. یکی از بهترین راه‌ها این بود که بایگانی صداهای آدم‌های واقعی که کلمات خاصی را تلفظ می‌کنند در اختیار داشته باشند و بتوانند از طریق آن، به دستگاه آموزش دهند. گروه با ایده جمع‌سپاری توانستند نزدیک به ۲هزار ساعت گفتار از لهجه‌های مختلف را جمع‌آوری کنند، برچسب بزنند و الگوریتم‌های خود را با این دیتا آموزش دهند.

بومی‌سازی در ایران، توسعه در جهان

چت‌بات‌های فارسی الان هم وجود دارند اما از آنجا که برای تشخیص گفتار از سرویس‌های گوگل استفاده می‌کنند، عملکردشان در بعضی موارد نقص دارد. برای پوشاندن این نقطه ضعف، سمیه باقربیگی و همکارانش صفر تا صد ماجرا را خودشان انجام دادند و الگوریتم‌های یادگیری ماشینی خودشان را تولید کردند و همین باعث می‌شود امکان شخصی‌سازی خدمات براساس درخواست مشتری فراهم باشد. ضمن اینکه چون گواهی تمام خدمات در شرکت تولید شده است، می‌توانند سرویس‌ها را روی سرور مشتری ارائه کنند، ‌بدون اینکه به اتصال به سرورهای واسطه‌ای مثل سرویس‌های گوگل نیاز باشد. با این روش، امنیت سرویس بهتر تامین می‌شود؛ ‌ مسئله‌ای که به‌خصوص برای بانک‌ها اهمیت زیادی دارد. شرکت حالا و در میانه مسیر، ۵سامانه مختلف را از صفر تا صد طراحی، پیاده‌سازی و تولید کرده است.

این محصولات به‌صورت Web API و Offline SDK برای برنامه‌نویسان ارائه می‌شود. با این حساب، برنامه‌نویسان می‌توانند با استفاده از API تشخیص چهره یا بازشناسی گفتار در برنامه‌های خودشان استفاده کنند. اکنون پلتفرم این استارتاپ، زبان فارسی را پشتیبانی می‌کند و برنامه آینده‌شان این است که زبان انگلیسی و فرانسه را نیز به پلتفرم خود اضافه کنند.

در وبسایت خبری بخوانید: اخبار اقتصادی دلار و بورس | جدیدترین اخبار مهم تکنولوژی و فناوری

پژوهش در یک آزمایشگاه حرفه‌ای

چند سالی که از ورود به دانشگاه گذشت، فهمید علایق دیگری هم دارد. سمیه باقربیگی عاشق فلسفه، روانشناسی و زبان‌شناسی شده بود. کارشناسی‌ارشد رشته زبان‌شناسی را هم گذراند اما در همان سال‌ها اتفاق عجیبی در دانشگاه شهیدبهشتی رخ داد؛ آن‌هم ساخت یک آزمایشگاه خاص بود که زبان را با رایانه مرتبط می‌کرد؛ آزمایشگاه پردازش زبان طبیعی به سرپرستی دکتر شمس فرد. خودش دراین‌باره می‌گوید: «تز فوق‌لیسانس من ساخت نیمه‌خودکار شبکه واژگانی افعال بود. در این پروژه دکتر شمس فرد استاد راهنمای من بودند و دکتر دبیرمقدم، رئیس گروه زبان‌شناسی دانشگاه علامه نیز مشاورم». کارکردن روی این پروژه خیلی بیشتر از آنچه تصور می‌کرد، زمان برد و برای پیشبرد آن، باید از همه مهارت‌هایش استفاده می‌کرد. همزمان به‌صورت پاره وقت در شرکت نرم‌افزاری‌ای کار می‌کرد که در همان جا، سمیه با همسر فعلی‌اش مهدی گلزارنیا آشنا شد؛ مردی که از همان زمان به او کمک کرد بتواند تزش را به شکل مناسبی ارائه کند. او و مهدی با هم ساختار جدیدی را شکل دادند که حالا به پایتخت فرانسه رسیده است.

گپ با هوش‌مصنوعی به لهجه‌های شیرین فارسی - 14

مهاجرت استارتاپ‌ها فرار مغزها نیست

با وجود موفقیت‌های شرکت، به‌دلیل تحریم‌ها عملا امکان سرمایه‌گذاری خارجی و توسعه فعالیت برای آنها وجود نداشت. به همین دلیل، آنها تصمیم گرفتند، برای دسترسی بهتر به بازارهای جهانی در استیشن اف حضور داشته باشند. از این طریق، شرکت امکان تعامل با سازمان‌های مشابه و شرکت‌های بین‌المللی بزرگ را به دست می‌آورد. سمیه باقربیگی می‌گوید: «هدفمان توسعه سامانه‌های ایرانی در یک بازار بین‌المللی است و این امکانات در فضایی مثل استیشن اف به خوبی فراهم شده است». ‌ او درباره اینکه رفتن استارتاپ‌ها از کشور به فرار مغزها تشبیه می‌شود، چندان خوشحال نیست و می‌گوید: «شرکت‌های استارتاپی برای توسعه بازارشان ناچار به تعامل با جهان و ارائه سرویس‌های خود به بازار جهانی هستند اما به‌دلیل تحریم‌ها و مشکلات مشابه، عملا از داخل ایران چنین امکانی فراهم نیست. ما بارها به نمایشگاه‌های مختلف خارجی رفته و توانستیم تا پای قرارداد هم پیش برویم اما صرفا به‌دلیل تحریم‌ها و مسائل بانکی نتوانستیم قراردادمان را امضا کنیم. همه ما دوست داریم کارمان را در ایران ادامه بدهیم و تجربه‌هایمان قطعا برای کشور مفید خواهد بود اما زمانی این موضوع به نتیجه می‌رسد که سایه سنگین فشار از سر ما برداشته شود».

گپ با هوش‌مصنوعی به لهجه‌های شیرین فارسی - 17

رؤیای فارسی حرف‌زدن با روبات‌ها

سمیه باقربیگی از همان کودکی ساختن روبات و انجام کارهای عجیب را دوست داشت. این داستان سال‌های اولیه زندگی اوست که از روبات‌سازی شروع می‌شود و تا نخستین پله‌های شناخت زبان آدم‌آهنی‌ها پیش می‌رود.

شاگرد درس‌خوان بود اما خجالتی. اهل شلوغ‌بازی نبود اما زیاد مطالعه می‌کرد و فکرهای بزرگی از سرش می‌گذشت. یکی از عجیب‌ترین‌هایشان شاید ساخت یک آدم‌آهنی بود؛ ایده‌ای که در اواسط دهه۶۰ کمتر ذهن بچه‌ها را مشغول می‌کرد. سمیه باقربیگی اما نه‌تنها به این موضوع فکر می‌کرد بلکه خیال داشت تصمیمش را هرطور هست عملی کند. اوایل تابستان ۱۰سالگی تصمیم گرفت واقعا روبات بسازد و تمام ۳ماه تابستان را در زیرزمین خانه گذراند تا تصمیمش را عملی کند. خودش می‌گوید: «روبات که نه، ‌بیشتر شبیه عروسکی بود که به آن وسایل الکترونیکی و محاسباتی مثل ماشین‌حساب وصل کرده باشند. خودم می‌دانستم کار نمی‌کند اما این آخرین حد توانم بود. می‌دانستم یک‌جای کار می‌لنگد اما نمی‌دانستم کجاست. دست‌آخر رفتم پیش مادرم تا از او بپرسم مشکل کجاست و چطور باید حلش کنم. می‌دانستم تقریبا شکست خورده‌ام. اما چهره مادر وقتی عروسک‌ روباتیک مرا دید، هیچ‌وقت یادم نمی‌رود. طوری برخورد کرد انگار واقعا بهترین روبات دنیا را درست کرده‌ام و هر دستوری که بدهیم اجرا می‌کند. تا مدت‌ها بعد همین عروسک ماشین‌حسابی را به همه نشان می‌داد و با خوشحالی می‌گفت، دخترم مهندس روبات است! حال من را در آن مواقع تصور هم نمی‌توانید بکنید؛ روی ابرها بودم».

مدتی بعد سمیه نوجوان فهمید، یکی از دلایلی که عروسک ماشین‌حسابی‌اش کار نکرده، این بوده که «برنامه‌» نداشته است. برای همین به فکرش رسید که برنامه‌نویسی یاد بگیرد. او می‌گوید: «بچه که بودم، رایانه‌های رومیزی کومودور تازه به بازار آمده بودند و پدرم بابت جایزه شاگرد اولی یکی برایم خرید. از طرفی، کلاس‌های برنامه‌نویسی جالبی در دانشگاه شهید بهشتی برگزار می‌شد که می‌توانستم در آنها به‌صورت آزاد شرکت کنم. بهتر از این نمی‌شد، هم کلاس می‌رفتم و برنامه‌نویسی تئوری یاد می‌گرفتم، هم در عمل روی کامپیوترم که آن زمان پدیده مهمی بود، همه‌چیز را تمرین می‌کردم». او در دورانی کنکور داد که همه بر سر مهندسی برق و کامپیوتر رقابت می‌کردند. اما او سراغ چیزی رفت که دوست داشت؛ «مهندسی نرم‌افزار در تمام شهرهای ایران را انتخاب کردم و دست آخر، در همین رشته‌ای که دوست داشتم پذیرفته شدم.» علایق او اما همچنان در حال تغییرکردن است. انگار هرچند سال یک‌بار، ‌سمیه باقربیگی بخش‌های جدیدی از شخصیت خودش را کشف می‌کند.

خواندن خبر در سایت منبع

در ادامه بخوانید

فیلم | خودروهای باورنکردنی نسل آینده در فرانکفورت

خبرآنلاینخبرآنلاین1 روز قبل

رهبر معظم انقلاب: نمی‌گویم باب گفت‌وگو و مراوده را ببندید +فیلم

اقتصاد آنلایناقتصاد آنلاین19 ساعت قبل

سامانه جامع انبارها بعد از شش سال

صدا و سیماصدا و سیما1 روز قبل
برای تامین به موقع کالا در بازار باید اطلاعات کالا‌ها در انبار‌ها و همچنین ورود و خروج آن‌ها بصورت برخط در دسترسی باشد. به گزارش خبرنگار خبرگزاری صداوسیما برای تامین به موقع کالا در بازار باید اطلاعات کالا‌ها در انبار‌ها و همچنین ورود و خروج آن‌ها بصورت برخط در دسترسی باشد. سامانه جامع انبار‌ها برای دستیابی به همین هدف آغاز به کار کرد. امروز هم ما از پانصدهزار انبار ثبت شده اطلاعات تنها هشت هزار انبار بصورت برخط در دسترس است.

روایت شاهدان از برق گرفتگی کودک ۸ ساله در ورزشگاه آزادی +فیلم

اقتصاد آنلایناقتصاد آنلاین15 ساعت قبل

ارباب حلقه‌ها و کوپه ۴ درب ۲۰۱۹/مراحل طراحی یک خودروی باکیفیت را از نزدیک ببینید! (+فیلم و تصاویر)

عصر ایرانعصر ایران1 روز قبل
زیرا در آن زمان بود که آئودی مدل مفهومی پرولوگ را معرفی کرد. مفهومی پرولوگطراحیدر ادامه فیلمی را مشاهده می‌کنید که مراحل جالب طراحی جزئیات A۷ اسپرت بک را نشان می‌دهد. آئودی در مدل A۷ اسپرت بک از یک گریل (جلوپنجره) توسعه یافته در عرض و ارتفاع استفاده کرده که البته بافت ساده‌ای نیز دارد. شاید بگوئید ما با یک خودروی اسپرت سر و کار نداریم اما این یک کوپه چهار درب است که روح اسپرت در تمامی بخش‌های خودرو حضور دارد. با حرکت به سمت نمای جانبی A۷ اسپرت بک اولین چیزی که خودنمایی می‌کند خط شانه قوی در بدنه خودرو است.

رهبر معظم انقلاب: تا آمریکا توبه نکند، هیچ مذاکره‌ای اتفاق نمی‌افتد +فیلم

اقتصاد آنلایناقتصاد آنلاین18 ساعت قبل

نظرها

اخبار بیشتر

تازه‌ترین خبرها

همه

پاسخ به اعتراضات به‌حق کارگران هپکو ضرب و شتم آنان بود؟

خبری16 ساعت قبل

قطع همکاری برانکو با تیم الاهلی عربستان

خبری19 ساعت قبل

پیگیری علت وقوع حادثه برق‌گرفتگی برای عماد در ورزشگاه آزادی

خبری19 ساعت قبل

ارائه خدمات به کشاورزان و روستائیان از طریق اپلیکیشن

تابناکچند ثانیه قبل

سرنوشت ۲ شرور خط خطی پایتخت +عکس

فردا نیوز26 دقیقه قبل

وضعیت وخیم دانشمند برجسته ایرانی در زندان آمریکا/ وزارت خارجه برای آزادی دکتر سلیمانی چه کرده است؟

میزان‌آنلاین27 دقیقه قبل

اکبر رحمتی بازیگر «خروج» حاتمی‌کیا شد/هفته آینده برای فیلمبرداری راهی گچساران می‌شوم

میزان‌آنلاین30 دقیقه قبل

از «نامه سرگشاده ۱۱ نفر از کارشناسان وزارت مالیه به وزیر مالیه» تا «اعلام رئیس جدید تعزیرات حکومتی»

تابناک30 دقیقه قبل

از اولین درخشش اصغر فرهادی تا اشتباه ابراهیم حاتمی‌کیا در دوره دانشجویی

خبرآنلاین30 دقیقه قبل

سود سال ۹۷ سهام عدالت آبان ماه پرداخت می‌شود

ایلنا30 دقیقه قبل