این روزها بازار هوش مصنوعی داغ است و هر روز هنرنمایی تازهای میکند. تواناییهایی دارد که خیلی کسب و کارها از جمله ارائه کنندگان آنلاین ویدئو را به چالش کشیده است.
به گزارش خبرآنلاین، هوش مصنوعی مولد نوعی از هوش مصنوعی است که اگر توسط مجموعه دادههای عظیم تعلیم داده شود میتواند با پیش بینی کلمه یا پیکسل بعدی متن، عکس، صدا یا ویدیو تولید کند. سادهترین ورودی برای هوش مصنوعی مولد، متن توصیفی (یا اعلان) است. بر اساس متن داده شده، مبدل از پیش آموزش دیده (GPT) میتواند پاراگرافی بنویسد، مدل متن به تصویری مثل استیبل دیفیوژن میتواند تصویر تولید کند، موزیک ال ام میتواند موسیقی تولید کند و ایمجن ویدئو (Imagen Video) میتواند ویدئو بسازد. این فناوری تمام اشکال تولید محتوا را تحت تاثیر قرار خواهد داد. در زمینه تولید ویدئو این فناوری میتواند از موبایل و شبکههای مجازی هم انقلابیتر عمل کند. این فناوری همچنین صنعت تولید ویدئو را از پایه تغییر میدهد.
نتفلیکس، تیک تاک و یوتیوب حکم رانان این عرصه را در نظر بگیرید. با اینکه هر کدام از نظر تولید محتوا و مدل کسب و کار منحصر به فرد هستند، ولی هر سه تای آنها با تشویق تولید کنندگان به تولید محتوای سرگرم کننده، تطبیق محتوا با مصرف کننده مناسب و شناسایی محتوای تعامل برانگیز به فعالیت خود ادامه میدهند. هر کدام از این سه عامل دست به دست هم داده اند تا چرخهای بسازند که به این سه پلتفرم کمک کند تا بازدیدکنندگان را جذب کنند. اما این چرخه در حال از دست دادن شتاب خود است. هوش مصنوعی مولد با تولید زنجیره ارزش جدید برای تولید محتوای ویدئویی مشکلات آنها را بیشترهم خواهد کرد.
نتفلیکس، تیک تاک و یوتیوب به لطف توانایی خود در تعیین اهمیت و جذابیت محتوا عمل کرد خوبی داشته اند. آنها به دادههای فراوانی دسترسی دارند که تعیین میکنند هر شخص به چه طریقی چه چیزی تماشا میکند. با وجود موفقیت آنها تعیین اینکه هر شخص "چه چیزی" تماشا میکند دو چالش بزرگ پدید آورده.
جمع آوری ویژگیهای دقیق و بدرد بخور: اگر یک ویدئو قراردادی باشد (مثل فیلمهای موجود در نتفلیکس) در دسته بندیهایی مثل ژانر، بازیگران، مدت زمان فیلم و ... قرار میگیرد. ولی این دسته بندیهای کلی و بعضی اوقات سلیقهای هستند، که یادگیری آن را برای یک الگوریتم سخت میکند. البته خیلی از ویژگیهای یک ویدئو را میتوان مشخص کرد مثل متن نمایشنامه، فهرست برداشتها و دیگر مشخصات تولید که دقیقا مشخص است. ولی تلاش برای استفاده از این اطلاعات باعث به وجود آمدن مشکل دیگری شد. ممکن است اطلاعات زیادی برای توصیف یک ویدئو وجود داشته باشد.
غلبه بر موانع موجود برای تولید: تولید محصولی هالیودی و انحصاری فرایند آهسته و هزینه بر است. نتفلیکس در سال ۲۰۲۲، ۱۷ میلیارد دلار برای تولید محتوا هزینه کرد. گرگ پیترز مدیر عامل نتفلیکس میگوید:، ولی اگر ما بتوانیم هر هفته سریالی مثل " چهار شنبه (WEDNESDAY) " یا " گلس آنین (GLASS ONION) " بسازیم، بخش زیادی از بینندگان را پس میگیریم. " بدون شک آنها مدل ساخت سریال فعلی خود نمیتوانند هر هفته سریالی مثل ونزدی (اقتباسی پرطرفدار با بودجه بالا از فیلم خانواده آدامز) بسازند.
مدل دیگر تولید محتوا که تیک تاک و یوتیوب از آن استفاده میکنند، استفاده از محتوای تولید شده توسط کاربران است. با اینکه این روش ارزان و سریعتر است، ولی مستلزم تعیین سه مشوق است تا بین سه هدف تعادل ایجاد کند ۱: حفظ تولید کنندگان پرنفوذ ۲: تشویق تولید کنندگان تازه وارد ۳: حفظ و رشد شالوده بازدید کنندگان. پلتفرمهای فعال در این زمینه با تلاش برای تولید مقدار مناسب محتوای سرگرم کننده توسط گروه کوچکی از تولیدکنندگان پرطرفدار، آتش جنگ انگیزشی را برافروخته اند. برای مثال گفته میشود تیک تاک برای تبلیغ دستی ویدئوها از قابلیتی به نام "heating" استفاده میکند. در حالی که ویدئوهای کوتاه یوتیوب، برای در آمد بیشتر تولید کنندگان شرایط را آسانتر کرده (برای تولید این نوع ویدئوها در یوتیوب به ۱۰۰۰ دنبال کننده نیاز دارید در حالی که در تیک تاک باید حداقل ۱۰۰ هزار دنبال کننده داشته باشید.)
این دو چالش به نوعی دلیل شکست پلتفرم پخش زنده Quibi را که عمر کوتاهی داشت، توضیح میدهد. Quibi ضعفهای این سه پلتفرم را در یک پلتفرم خلاصه کرده بود. آنها با استخدام تولید کنندگان و بازیگران گران قیمت، هزینه تولید محصولات انحصاری هالیوود مانند را دو برابر کرده بودند. آنها به جای اینکه مانند تیک تاک و یوتیوب به تولید کنندگان فردی بها دهند، تمرکز خود را معطوف تولید کنندگان و بازیگران مشهور کردند. در عوض آنها محتوای ضعیف (ومعمولا درجه دو) که اصلا مناسب نبود تولید کردند. این اتفاق به این دلیل رخ داد که مخاطبین هدف آنها نسل جوان بود، اما از تولید کنندگان این گروه سنی استفاده نکرد. همچنین، در کمال شگفتی، آنها از هوش مصنوعی برای تعیین محتوای مورد نیاز برای تولید استفاده نکردند. (البته از هوش مصنوعی برای پیشنهاد اینکه تماشگران چه چیزی تماشا کنند استفاده کردند)
تا به حال هیچ پلتفرمی که توسط انسان کنترل میشود نتوانسته از این دو چالش سربلند بیرون بیاید. با این حال احتمالا راه حلی وجود دارد. هوش مصنوعی مولد ویدئوهایی که تولید میشوند، نحوه تولید آنها و اینکه چه کسی آنها را تماشا میکند را تغییر خواهد داد و نوع جدیدی از پلتفرم مجهز به هوش مصنوعی را به وجود خواهد آورد.
این شرایط را تصور کنید. تولید کنندهای متن زیر را به هوش مصنوعی میدهد: «دو نفر در کافه آرت دکو نشسته اند. بیرون برف میبارد. یکی از آنها گازی به پنیر سوییسی خود میزند و میگوید" من خلاقانه یبوست دارم. "» یک ویدئو واقع گرایانه ولایو اکشن (با صدا) تقریبا بلافاصله تولید میشود و در دسترس میلیاردها بیننده قرار میگیرد ما نه تنها میدانیم چه کسی چه مدت تماشا کرده است، چه کسی چه قسمتهایی را نادیده گرفته است، لایک ها، اشتراک گذاری ها، نظرات، جستجوها و همه بحثهای خارج از پلتفرم در مورد ویدیو، بلکه ورودی دقیق استفاده شده برای ایجاد آن ویدیو را نیز میدانیم. در یک بخش، این سناریو بر دو چالشی که پلتفرمهای ویدئویی موجود با آن دست و پنجه نرم میکنند غلبه میکند. ان فناوری توضیح دقیق تری از ویدئو ارائه میدهد (اعلان متن ورودی به هوش مصنوعی) , و موانع تولید را تا حد زیادی از پیش رو بر میدارد. (به سادگی با تایپ کردن تخیلات خود میتوانید محتوا تولید کنید) دیگر نیازی نیست با برنامه کپ کات یا حتی بازیگران سر و کله بزنید.
این رویایی به نظر میرسد (در واقع هم چنان یک رویا هست، چون این فناوری هنوز وجود ندارد)، اما این مجموعهای از سه برنامه هوش مصنوعی خواهد بود. هوش مصنوعی اول بر اساس متن داده شده ویدئو را تولید میکند، هوش مصنوعی دوم ویدئو را در معرض دید تماشاگران مناسب قرار میدهد و هوش مصنوعی سوم از بازخوردهای موجود استفاده میکند تا تولید کنندگان را برای تولید محتوای بعدی راهنمایی کند. نسخه ابتداییتر این روش تولید در حال تولید است. شاید مهمترین آن سیت کام کمدی ساین فیلد"هیچ برای همیشه" باشد که از هوش مصنوعی مولد برای نوشتن فیلم نامه استفاده میکند و بیش ۱۰۰ هزار دنبال کننده دارد.
پلتفرمهای ویدئویی که توسط هوش مصنوعی مولد اداره میشوند با راهنمایی تولید کنندگان و نشان دادن محتوای مرتبط به تماشاگران، موانع موجود در ایجاد ارزش در تولید را کاهش میدهند. هم زمان، این موانع کاهش یافته و راهنماییها به سازندگان این امکان را میدهد تا ارزشی را که میتوانند در خارج از شرکت ایجاد کنند افزایش دهند؛ و به لطف ارتباط نزدیک به صفر دو طرف در تولید و تماشای محتوای مرتبط، تولید کنندگان هم تماشاگر هستند و برعکس. اگر تماشگر بتواند متنی را جست و جو کند، م آن متن تبدیل به اعلانی برای برای ویدئو جدید بشود، این مرز باریکتر هم خواهد شد.
تاثیر اقتصادی این فرآیند عظیم خواهد بود. از قدیم، درصد کمی از محتوای خیلی محبوب در یک پلتفرم مقدار زیادی از محتوای کم طرفدار جبران میکند. پلتفرم مبتنی بر هوش مصنوعی مولد موفقیت محتوای محبوب را افزایش میدهد، چون تولید کنندگان به لطف توصیههای الگوریتمی میدانند در مرحله بعدی چه محتوایی باید بسازند. در عین حال، موانع بسیار کمتر برای تولید سود دیگران را هم افزایش خواهد داد.
پلتفرمهای پیشرو فعلی چگونه سازگار خواهند شد؟ از این سه پلتفرم، نتفلیکس بیشتر روی مدل کسب و کار خود تمرکز کرده و بعید است تغییر بزرگی ایجاد کند. آنها مدتها بود در برابر روشی مبتنی بر تبلیغات مقاومت میکردند و به تازگی شروع به حرکت در این مسیر کرده اند. تیک تاک از نظر مدل کسب و کار، تواناییها و انعطاف پذیری نسبت به آنچه میبینیم نزدیکترین پلتفرم به هوش مصنوعی مولد است,، اما در ایالات متحده تحت بررسیهای نظارتی است. یوتیوب تلاش زیادی کرده و با معرفی ویدئوهای کوتاه و تشویق تولیدکنندگان در موقعیت مطلوب تری قرار دارد. آنها همچنین حامی تواناییهای هوش مصنوعی گوگل هستند. با این حال گوگل قبلا نشان داده از نظر تجاری در زمینه هوش مصنوعی مولد به کندی عمل میکند.
پیشرفتهای اخیر در زمینه فنی و آگاهی هوش مصنوعی مولد چشمگیر بوده. در حال حاضر فناوری لازم برای تولید فیلمهای واقع گرایانه و لایو اکشن از یک نوشته را نداریم، و وجود چنین فناوری کلید ساخت پلتفرمهای جدید است.
حتی زمانی که این فناوری در دسترس قرار بگیرد، شاید نتواند تصویر دقیقی از نوشتههای وارد شده ارائه دهد و این پلتفرم احتمالا تعداد زیادی ویدئو مشابه تولید میکند که با نوشتن متنهای مشابه توسط تولیدکننده- بیننده پایدارتر خواهد شد؛ و وقتی این پلتفرم روش تولید محتوای جذاب را یاد بگیرد,، تضاد منافع بین پلتفرم و سازندگان چگونه مدیریت خواهد شد؟ این پلتفرم چگونه از تولید ویدئوهای دیپ فیک غیر مجاز، تبلیغات اجتناب ناپذیر و اطلاعات غلط جلوگیری خواهد کرد.
علیرغم این اخطارها، احتمالا هوش مصنوعی مولد باعث به وجود آمدن پلتفرم ویدئویی جدیدی میشود که یا جایگزین تیک تاک، یو تیوب و نتفلیکس میشود، یا حداقل محتوای آنها را تامین میکند فناوری هوش مصنوعی مولد نه تنها برای تولید محتوا بلکه برای تقویت پویایی پلت فرم در بین پلتفرم، سازندگان و مصرف کنندگان نیز استفاده خواهد شد. واضح است که تمام این موارد همراه با عدم اطمینان به فناوری و وجود خطرات اخلاقی است؛ و البته ویدئو یکی از زمینههایی است که انتظار میرود چنین تغییر سریعی را در آن ببینیم. حوزههای خلاقانه دیگری مثل هنر، موسیقی و کلام نوشتاری منتظر تغییرات بزرگ و فرصتهای تجاری جدید هستند. (یا حداقل افرادی که از هوش مصنوعی مولد در این زمینه استفاده میکنند منتظر این تغییرات هستند)
منبع: HBR