زنی که پشت صدای Siri است

تاریخ انتشار: ۰۰:۱۹ - ۲۳ تير ۱۳۹۴

بسیاری از اوقات ممکن است از خود پرسیده باشیم آیا پشت صداهای الکترونیکی که این روزها در دستیارهای شخصی صوتی روی موبایل و تبلت می‏شنویم انسان واقعی وجود دارد؟ در مورد دستیار شخصی اپل یعنی Siri یک انسان واقعی وجود دارد؛ «سوزان بنت».

«سوزان بنت» یک صداپیشه است که صدای او پشت صدای آهنین Siri قرار دارد و البته صدای او روی بسیاری از سرویس‏های صوتی دیگر هم هست.

گفت‌وگو با «سوزان بنت» شما را شگفت‌زده می‏کند. او در عین حال که می‏تواند بسیار عادی و معمولی صحبت کند ناگهان هم می‏تواند صدای خود را به صدایی که همه ما در دستیار صوتی Siri شنیده‏ایم تغییر دهد و شما تصور می‏کنید دارید با کامپیوتر صحبت می‏کنید.

«سوزان بنت» در برلینگتن کانادا به دنیا آمد اما وقتی خیلی جوان بود به نیویورک نقل مکان کرد. حضور او در نیویورک باعث شد که او سبک گفتاری آمریکایی داشته باشد. او در دانشگاه Brown آواز و بازیگری را فراگرفت و بعد به آتلانتا رفت جایی که صدای بدون لهجه‏اش فرصت‏های مناسبی را برای کار برایش فراهم کرد.

در دهه ۱۹۷۰ صدای «سوزان بنت» نخستین بار روی سیستم صوتی دستگاه‏های ATM قرار گرفت و برای چند دهه صدای خاص او روی سرویس‏های پاسخ‏دهی خودکار صوتی، سیستم‏های PA و... قرار گرفته است.

در سال ۲۰۰۵ وقتی «سوزان بنت» برای Siri صدای خود را ضبط می‏کرد هیچ ایده‏ای از اینکه قرار است بعدا صدای او روی میلیون‏ها آی‌فون قرار بگیرد نداشت.

در واقع هنوز حتی آی‌فونی به وجود نیامده بود. (سیری نخستین بار به‌صورت اپلیکیشن روی فروشگاه‏ نرم‏افزار اپل قرار گرفت و در سال ۲۰۱۰ توسط اپل خریده شد). او حتی تا سال ۲۰۱۱ که برای نخستین بار Siri روی آی‌فون 4S عرضه شد نمی‌دانست که صدای او روی این سرویس قرار دارد.

Siri باید قادر باشد هر چیزی را به زبان انگلیسی بگوید و این چالش این کار بوده است. «سوزان بنت» می‏گوید: طی ماه جولای من چهارساعت در روز و در پنج روز هفته مشغول ضبط Siri بودم. این زمان برای یک صدا پیشه زمان زیادی است، چراکه شما در یک مدت طولانی و مداوم باید صحبت کنید و این شما را خسته می‏کند.

در عین حال لحن صدای Siri یک حالت شوخ‏طبعانه هم دارد. به گفته «سوزان بنت» این صدا باید یک کاراکتر خاص خود را می‏داشت و من یک حالت شوخ‏طبعی به آن اضافه کردم و این در عین استواری و وضوحی بود که باید در بیان کلمات به‌کار برده می‏شد.

صداپیشگی به گفته «سوزان بنت» نیازمند نوعی هوشمندی تکنیکی هم هست چیزی که به گفته او متنی که ۶۵ ثانیه قابل خواندن است را باید طی ۶۰ ثانیه گفت، اما موضوع سیری از این هم سخت‏تر بود. ضبط صدا برای این کاربرد کامپیوتری به شیوه ادای همه کلمات و جملات موجود در زبان انگلیسی نبود و به جای آن او باید صداهای پایه را بیان می‏کرد.

برای ضبط، صداپیشه باید انواع جملات ناتمام را با تمام آواهای مختلف زبان انگلیسی بیان کند. این موضوع باعث می‏شودکه زمان زیادی گرفته شود، چراکه صداپیشه باید یک جمله را با انواع و اقسام آواها بیان کند تا نتیجه کار به صدای انسانی بیشتر شبیه شود.

به‌عنوان مثال صدا پیشه باید در کلماتی مانند «hiss»،«snakes»، یا «rose» حرف S را با آواهای مختلف بیان کند. بقیه کار ترکیب توسط کامپیوتر انجام می‏شود. «سوزان بنت» اما حالا معتقد است صدای Siri نیاز به یک ضبط جدید دارد تا بتوان آن را بهبود داد، البته اپل نشان داده به مرور زمان توانسته با استفاده از بهبودهای نرم‏افزاری و تکنیک‏های دیگر به صدای Siri جنبه انسانی‏تری بدهد.

نکته قابل توجه در مورد «سوزان بنت» این است که او کار ضبط صداو کارهای مرتبط با آن را در استودیوی خانگی خود انجام می‏دهد. جایی که هزینه تجهیزات آن هم بسیار بالا بوده است.

منبع: دنیای اقتصاد

از میان اخبار