بسیاری از اوقات ممکن است از خود پرسیده باشیم آیا پشت صداهای الکترونیکی که این روزها در دستیارهای شخصی صوتی روی موبایل و تبلت میشنویم انسان واقعی وجود دارد؟ در مورد دستیار شخصی اپل یعنی Siri یک انسان واقعی وجود دارد؛ «سوزان بنت».
«سوزان بنت» یک صداپیشه است که صدای او پشت صدای آهنین Siri قرار دارد و البته صدای او روی بسیاری از سرویسهای صوتی دیگر هم هست.
گفتوگو با «سوزان بنت» شما را شگفتزده میکند. او در عین حال که میتواند بسیار عادی و معمولی صحبت کند ناگهان هم میتواند صدای خود را به صدایی که همه ما در دستیار صوتی Siri شنیدهایم تغییر دهد و شما تصور میکنید دارید با کامپیوتر صحبت میکنید.
«سوزان بنت» در برلینگتن کانادا به دنیا آمد اما وقتی خیلی جوان بود به نیویورک نقل مکان کرد. حضور او در نیویورک باعث شد که او سبک گفتاری آمریکایی داشته باشد. او در دانشگاه Brown آواز و بازیگری را فراگرفت و بعد به آتلانتا رفت جایی که صدای بدون لهجهاش فرصتهای مناسبی را برای کار برایش فراهم کرد.
در دهه ۱۹۷۰ صدای «سوزان بنت» نخستین بار روی سیستم صوتی دستگاههای ATM قرار گرفت و برای چند دهه صدای خاص او روی سرویسهای پاسخدهی خودکار صوتی، سیستمهای PA و... قرار گرفته است.
در سال ۲۰۰۵ وقتی «سوزان بنت» برای Siri صدای خود را ضبط میکرد هیچ ایدهای از اینکه قرار است بعدا صدای او روی میلیونها آیفون قرار بگیرد نداشت.
در واقع هنوز حتی آیفونی به وجود نیامده بود. (سیری نخستین بار بهصورت اپلیکیشن روی فروشگاه نرمافزار اپل قرار گرفت و در سال ۲۰۱۰ توسط اپل خریده شد). او حتی تا سال ۲۰۱۱ که برای نخستین بار Siri روی آیفون 4S عرضه شد نمیدانست که صدای او روی این سرویس قرار دارد.
Siri باید قادر باشد هر چیزی را به زبان انگلیسی بگوید و این چالش این کار بوده است. «سوزان بنت» میگوید: طی ماه جولای من چهارساعت در روز و در پنج روز هفته مشغول ضبط Siri بودم. این زمان برای یک صدا پیشه زمان زیادی است، چراکه شما در یک مدت طولانی و مداوم باید صحبت کنید و این شما را خسته میکند.
در عین حال لحن صدای Siri یک حالت شوخطبعانه هم دارد. به گفته «سوزان بنت» این صدا باید یک کاراکتر خاص خود را میداشت و من یک حالت شوخطبعی به آن اضافه کردم و این در عین استواری و وضوحی بود که باید در بیان کلمات بهکار برده میشد.
صداپیشگی به گفته «سوزان بنت» نیازمند نوعی هوشمندی تکنیکی هم هست چیزی که به گفته او متنی که ۶۵ ثانیه قابل خواندن است را باید طی ۶۰ ثانیه گفت، اما موضوع سیری از این هم سختتر بود. ضبط صدا برای این کاربرد کامپیوتری به شیوه ادای همه کلمات و جملات موجود در زبان انگلیسی نبود و به جای آن او باید صداهای پایه را بیان میکرد.
برای ضبط، صداپیشه باید انواع جملات ناتمام را با تمام آواهای مختلف زبان انگلیسی بیان کند. این موضوع باعث میشودکه زمان زیادی گرفته شود، چراکه صداپیشه باید یک جمله را با انواع و اقسام آواها بیان کند تا نتیجه کار به صدای انسانی بیشتر شبیه شود.
بهعنوان مثال صدا پیشه باید در کلماتی مانند «hiss»،«snakes»، یا «rose» حرف S را با آواهای مختلف بیان کند. بقیه کار ترکیب توسط کامپیوتر انجام میشود. «سوزان بنت» اما حالا معتقد است صدای Siri نیاز به یک ضبط جدید دارد تا بتوان آن را بهبود داد، البته اپل نشان داده به مرور زمان توانسته با استفاده از بهبودهای نرمافزاری و تکنیکهای دیگر به صدای Siri جنبه انسانیتری بدهد.
نکته قابل توجه در مورد «سوزان بنت» این است که او کار ضبط صداو کارهای مرتبط با آن را در استودیوی خانگی خود انجام میدهد. جایی که هزینه تجهیزات آن هم بسیار بالا بوده است.