آیا چت جی پی تی، قادر به طرح نقشه‌های شیطانی خواهد بود؟

چت جی پی تی جایگزین پزشکان نمی‌شود، اما در تنظیم پرونده‌های الکترونیکی پزشکی کار پزشکان را راحت‌تر می‌سازد. چت جی پی تی نمی‌تواند مقالات قابل انتشار را از ابتدا بنویسد، اما ممکن است خلاصه‌ای از اطلاعات مرتبط را در قالبی جمع آوری شده و مفید در اختیار خبرنگاران قرار دهد.

تاریخ انتشار: ۰۱:۴۲ - ۲۷ فروردين ۱۴۰۲

فرارو- مدل‌های زبان بزرگ به طرز شگفت انگیزی هوشمند به نظر می‌رسند، اما واقعا زیر پوشش آن چه می‌گذرد؟

به گزارش فرارو به نقل از نیویورکر، نوامبر گذشته اندکی پس از انتشار چت جی پی تی توسط Open AI آن توسعه دهنده نرم افزار اعلام کرد که بیش از یک میلیون نفر برای آزمایش چت جی پی تی ثبت نام کرده اند. اینترنت مملو از نمونه‌های جالب و چشمگیر مشابهی از توانایی نرم افزار در ارائه پاسخ‌های قابل قبول حتی به باطنی‌ترین درخواست‌ها بود. با این وجود، مدت زمان زیادی به طول نیانجامید که داستان‌های ناراحت کننده‌ای ظاهر شدند.

یک استاد اعلام کرد که چت جی پی تی به پرسش‌های امتحانی دانش آموزان اش پاسخ داده که خبر بدی برای معلمان بود. فردی دیگر ابزاری را برای نوشتن کل متن یک کتاب کودکان مورد استفاده قرار داد و سپس فروش آن را در آمازون آغاز کرد که خبر بدی برای نویسندگان بود. یک کاربر باهوش چت جی پی تی را متقاعد کرد قوانین ایمنی را دور بزند قوانینی که آن برنامه را از بحث شخصی در مورد خود باز می‌دارد. چت جی پی تی به او گفت: "فکر می‌کنم می‌توانید بگویید که من در نسخه ماتریکس زندگی می‌کنم".

نگرانی از این که این فناوری بالقوه دردسرساز به زودی در زندگی ما جاسازی خواهد شد چه بخواهیم و چه نخواهیم در اواسط ماه مارس زمانی که مشخص شده بود چت جی پی تی یک نوع آزمایش بتا است که توسط Open AI برای جمع‌آوری بازخورد منتشر شده تشدید شد.

نسل بعدی مدل‌های زبان بزرگ جی پی تی -۴ بود که مایکروسافت به زودی آن را در مجموعه نرم افزاری آفیس خود ادغام خواهد کرد. ناظران عرصه فناوری، چون "یووال نوح هراری"، "تریستان هریس" و "آزا راسکین" در مقاله‌ای مشترک هشدار دادند: "ما یک هوش بیگانه را احضار کرده‌ایم". آنان نوشتند: "ما چیز زیادی در مورد آن نمی‌دانیم جز این که بسیار قدرتمند است و هدایای خیر کننده‌ای به ما ارائه می‌دهد، اما می‌تواند پایه‌های تمدن مان را نیز هک کند".

چه نوع ذهن‌های جدیدی در دنیای ما آزاد می‌شوند؟

پاسخ‌های چت جی پی تی و سایر چت بات‌هایی که پس از آن منتشر شدند اغلب نشان می‌دهند که آن برنامه‌ها اغلب قدرتمند، پیچیده، تخیلی و احتمالا خطرناک هستند. ولی آیا این واقعا درست است؟ اگر این ابزار‌های جدید هوش مصنوعی را به عنوان جعبه سیاهی مرموز در نظر بگیریم غیر ممکن است که بتوانیم چنین استدلالی را مطرح کنیم.

تنها با صرف زمان برای بررسی نحوه عملکرد این فناوری از مفاهیم سطح بالای آن گرفته تا سیم کشی دیجیتال اولیه‌ای که دارد می‌توانیم بفهمیم که با چه چیزی سر و کار داریم. ما پیام‌هایی را به فضای خالی الکترونیکی ارسال نموده و پاسخ‌های شگفت انگیزی دریافت می‌کنیم.

اگر می‌خواهید یک فناوری به ظاهر پیچیده را درک کنید تصور این که خودتان آن را اختراع کنید می‌تواند مفید باشد. بنابراین، فرض کنید که می‌خواهیم یک برنامه به سبک چت جی پی تی بسازیم برنامه‌ای که قادر به درگیر شدن در مکالمه طبیعی با یک کاربر انسانی است. یک مکان خوب برای شروع ممکن است "نظریه ریاضی ارتباطات" باشد مقاله‌ای اساسی که در سال ۱۹۴۸ میلادی توسط "کلود شانون" ریاضیدان منتشر شد. مقاله‌ای که کم و بیش رشته تئوری اطلاعات را ابداع کرد که مملو از ریاضیات است.

با این وجود، آن نظریه هم چنین شامل یک بخش آسان برای درک است که در آن شانون آزمایشی هوشمندانه در تولید خودکار متن را توصیف می‌کند. روش شانون که نیازی به رایانه نداشت از زیرساخت آماری زبان انگلیسی بهره برد. او با انتخاب کلمه "the" به عنوان بذر یک جمله جدید شروع کرد. سپس کتابی را از کتابخانه اش باز کرد و به صفحه‌ای تصادفی آورد و آن خواند تا اینکه با "the" در متن مواجه شد.

در این مرحله، او کلمه بعدی را نوشت که اتفاقاً "سر" بود. سپس این فرآیند را تکرار کرد یک صفحه تصادفی جدید را انتخاب کرد تا زمانی که با "سر" مواجه شد مطالعه کرد کلمه‌ای را که به دنبال آن بود را یادداشت کرد و این روند را ادامه داد و تکرار کرد. او با جست و جو، ضبط و جستجوی دوباره متنی را ایجاد کرد.

ما اکنون در طراحی برنامه چت فرضی خود از همان رویکرد کلی برای تولید پاسخ‌های مان در یک کلمه در یک زمان استفاده می‌کنیم یعنی جستجو در متن منبع خود برای گروه‌هایی از کلمات که با انتهای جمله‌ای که در حال حاضر می‌نویسیم مطابقت دارند. متاسفانه ما نمی‌توانیم به طور کامل به این سیستم اعتماد کنیم. مشکل این است که ما در نهایت به دنبال عباراتی می‌گردیم که اصلا در متن منبع نشان داده نمی‌شوند.

ما نیاز داریم که برنامه‌مان حتی زمانی که نمی‌تواند کلمات دقیق مورد نظر خود را پیدا نماید کار کند. این مشکل دشواری به نظر می‌رسد، اما اگر پارادایم خود را از جستجو به رای دادن تغییر دهیم می‌توانیم پیشرفت کنیم. اگر این کار را انجام دهیم عباراتی که تطابق ضعیفی با هدف دارند رای ضعیفی دریافت می‌کنند در حالی که مطابقت‌های دقیق، قوی‌ترین رای‌ها را ایجاد می‌کنند. سپس برنامه ما می‌تواند از آرای جدول بندی شده برای ایجاد تنوع کمی در انتخاب‌های خود استفاده کند با انتخاب کلمه بعدی به صورت نیمه تصادفی کلماتی که امتیاز بالاتری دارند بیش‌تر از مواردی که امتیاز کمتری دارند انتخاب می‌شوند. اگر این نوع سیستم به درستی پیکربندی شده باشد و با مجموعه‌ای از متون منبع به اندازه کافی غنی، حجیم و متنوع ارائه شود می‌تواند قطعات طولانی از نثری با صدای بسیار طبیعی تولید کند.

یک چت بات هم چنین باید آن چه را که کاربران می‌پرسند معنی کند، زیرا یک درخواست برای خلاصه‌ای کوتاه از اصل عدم قطعیت هایزنبرگ نیاز به پاسخ متفاوتی نسبت به درخواست دستور پخت مک اند چیز (پاستا و پنیر) دارد. در حالت ایده آل ما می‌خواهیم برنامه مان به مهم‌ترین ویژگی‌های اعلان هر کاربر توجه کند و سپس از آن برای هدایت انتخاب کلمه استفاده کند و پاسخ‌هایی ایجاد کند که نه تنها صدای طبیعی دارند بلکه منطقی نیز هستند.

اگرچه Open AI جزئیات فنی سطح پایین زیادی را در مورد چت جی پی تی منتشر نکرده، اما ما می‌دانیم که جی پی تی - ۳ مدل زبانی‌ای که چت جی پی تی بر آن استوار است بر روی قطعات استخراج شده از مجموعه عظیمی از متن نمونه که اکثر مردم را شامل می‌شود آموزش دیده است. اگر داده‌هایی که برنامه اصلی جی پی تی -۳ را تعریف می‌کنند چاپ می‌شدند برای ذخیره آن به صد‌ها هزار کتاب با طول متوسط نیاز داشتیم.

آن چه تا اینجا بیان کردیم ایده‌های مفهومی است که به یک برنامه امکان می‌دهند متنی را با سبک و درک قابل توجهی که توسط ابزار‌هایی مانند چت جی پی تی نمایش داده می‌شوند تولید کنند.

با این وجود، اگر واقعا می‌خواهیم این فناوری را درک کنیم باید در مورد نحوه پیاده سازی آن در رایانه‌های واقعی نیز چیز‌هایی بدانیم. هنگامی که درخواستی را به چت جی پی تی ارسال می‌کنید متنی که در وب سایت Open AI تایپ می‌کنید به یک برنامه کنترلی که در جایی در مرکز محاسبات ابری اجرا می‌شود تحویل داده می‌شود. در این مرحله متن شما در دسته‌ای از اعداد بسته بندی می‌شود به گونه‌ای که درک و مدیریت آن را برای رایانه‌ها آسان‌تر می‌کند. اکنون اعداد آماده پردازش توسط برنامه اصلی چت جی پی تی هستند که از لایه‌های متمایز زیادی تشکیل شده است که هر یک توسط یک شبکه عصبی مصنوعی عظیم تعریف شده اند.

ورودی شما به ترتیب در امتداد این لایه‌ها ارسال می‌شود مثل یک نسخه دیجیتالی از بازی تلفنی. هر لایه از شبکه عصبی خود برای شناسایی ویژگی‌های مرتبط در متن استفاده می‌کند و سپس آن را با خلاصه‌هایی از آن چه کشف کرده برای استفاده لایه‌های بعدی حاشیه نویسی می‌کند. جزییات فنی نحوه عملکرد این شبکه‌ها برای اهداف ما کمی مشکل است. نکته مهم آن است که وقتی یک درخواست در هر لایه حرکت می‌کند تعداد زیادی محاسبات ریاضی غیرقابل درک را راه اندازی می‌کند که با هم چیزی کم و بیش شبیه به یک نسخه فشرده و درهم از رای گیری کلمه‌ای مبتنی بر قوانین کلی را اجرا می‌کنند.

پس از این که ورودی شما از تمام این لایه‌ها عبور کرد خروجی نهایی چیزی است که تعداد آرا را برای هر کلمه بعدی ممکن تقریبی می‌کند. برنامه کنترل از این شمارش‌ها برای انتخاب موارد بعدی به صورت نیمه تصادفی استفاده می‌کند. پس از تمام این کار‌ها ما تنها یک کلمه از پاسخ چت جی پی تی را تولید کرده ایم. برنامه کنترل با وظیفه شناسی آن را به درخواست اصلی شما اضافه می‌کند و این متن کمی دراز را از ابتدا در تمام لایه‌های شبکه عصبی اجرا می‌کند تا کلمه دوم را ایجاد کند. سپس دوباره این کار را انجام می‌دهد تا زمانی که پاسخ کاملی برای بازگشت به مرورگر وب شما داشته باشد.

اکنون می‌توانیم به پرسش اصلی خود بازگردیم: برنامه‌ای مانند چت جی پی تی چه نوع ذهنی دارد؟ هنگام تعامل با این سیستم‌ها زمان زیادی به طول نمی‌انجامد که وارد مکالمه‌ای شوید که باعث ناراحتی شما می‌شود. شاید لحظه‌ای از انسانیت غیرعادی آن غافلگیر شده باشید یا از پیچیدگی یک پاسخ شگفت زده شوید. با این وجود، اکنون می‌دانیم که این شاهکار‌ها در واقع چگونه انجام می‌شوند. می‌توانیم این برداشت‌ها را تعدیل کنیم. سیستمی مانند چت جی پی تی ایجاد نمی‌کند بلکه تقلید می‌کند.

چت جی پی تی متنی را کپی می‌کند، دستکاری می‌کند، و متنی را که در اصل توسط هوش انسانی نوشته شده بود کپی کرده و به هم می‌چسباند تا چیزی را تولید کند که به نظر می‌رسد یک شخص واقعی در مورد آن موضوع صحبت می‌کند. چت جی پی تی هیچ تصور واقعی‌ای در مورد چیزی که درباره آن صحبت می‌کند ندارد. این ایده که برنامه‌هایی مانند چت جی پی تی ممکن است شکل قابل تشخیصی از هوش را نشان دهند با تمرکز بیش تری در جزئیات معماری آن تضعیف می‌شود.

هوشیاری به توانایی مغز برای حفظ تصوری که دائما به روز می‌شود به عنوان یک موجود متمایز در تعامل با مدلی از دنیای بیرونی بستگی دارد. این در حالیست که لایه‌های شبکه‌های عصبی که سیستم‌هایی مانند چت جی پی تی را تشکیل می‌دهند ثابت هستند و زمانی که آموزش ببینند هرگز تغییر نمی‌کنند. چت جی پی تی هیچ خاطره‌ای از مکالمات گذشته را حفظ نمی‌کند. چت جی پی تی تنها واژگان را یک به یک در پاسخ به هر ورودی بیان می‌نماید و دقیقا همان قوانین را برای هر عمل مکانیکی تولید دستوری به کار می‌گیرد صرفنظر از این که آن کلمه بخشی از توصیف تعمیر یک دستگاه باشد یا یک شوخی در یک نمایشنامه کمدی.

حتی منطقی نیست که در مورد چت جی پی تی به عنوان یک موجودیت منفرد صحبت کنیم. در واقع نسخه‌های زیادی از برنامه در هر زمان اجرا می‌شود و هر یک از این کپی‌ها به خودی خود بر روی چندین پردازنده مجزا تقسیم می‌شوند (زیرا کل برنامه بیش از حد بزرگ است و در حافظه یک دستگاه قرار نمی‌گیرد) که به احتمال زیاد بین سرویس دهی بسیاری از تعاملات نامرتبط کاربر به سرعت به عقب و جلو می‌روند.

در مجموع، این مشاهدات خبر خوبی برای کسانی است که می‌ترسند هوش مصنوعی شکلی فوق هوشمند را به خود بگیرد و تبدیل به تهدیدی رو به پیشرفت شود یا این که ممکن است روزی به زودی به طور تصادفی یک موجود خودآگاه را در یک رایانه به دام بیندازیم، اما حتی اگر فرض کنیم که چنین سیستمی ظهور خواهد کرد به شکل مدل‌های زبان بزرگ نخواهد بود.

با این وجود، حتی اگر چت جی پی تی هوشمند نباشد آیا باز هم نمی‌تواند شغل مان را از ما بگیرد؟ درک تازه مان از نحوه عملکرد این برنامه‌ها نیز می‌تواند به ما در مقابله با این ترس کمک کند. بر اساس آن چه تاکنون آموخته ایم عملکرد چت جی پی تی به نظر می‌رسد کم و بیش محدود به نوشتن در مورد ترکیبی از موضوعات شناخته شده با استفاده از ترکیبی از سبک‌های شناخته شده است جایی که "شناخته" به این معنی است که برنامه به اندازه کافی در طول مدت زمان با موضوع یا سبک خاصی مواجه شده است. اگرچه برنامه می‌تواند از طریق آموزش نمونه‌های جالب توجهی را ایجاد کند، اما بعید است که این فناوری در شکل فعلی خود به طور قابل توجهی بازار کار را مختل کند.

علاوه بر این، این برنامه‌ها از بحران اعتماد رنج می‌برند: برای تولید متنی طراحی شده اند که درست به نظر می‌رسد، اما توانایی محدودی برای تشخیص درستی آن چه می‌گویند دارند. در نتیجه، احتمالا اکثر کارفرمایان در برون سپاری مشاغل به یک افسانه گر پشیمان تردید خواهند کرد.

این بدان معنا نیست که مدل‌های زبان بزرگ هیچ برنامه کاربردی حرفه‌ای مفیدی نخواهند داشت. آن‌ها تقریبا مطمئنا این کار را خواهند کرد، اما با توجه به محدودیت‌های این فناوری‌ها برنامه‌ها احتمالا بیش‌تر از آن چیزی که گمان می‌رود متمرکز و سفارشی‌تر خواهند بود.

تقلید از نوشته‌های انسانی موجود با استفاده از ترکیب دلخواه موضوعات و سبک‌ها یک دستاورد چشمگیر است. با معرفی جی پی تی -۳ که راه را برای نسل بعدی چت بات‌هایی که در ماه‌های اخیر ما را تحت تاثیر قرار داده اند هموار نمود Open AI ظاهرا یکباره جهشی قابل توجه در مطالعه هوش مصنوعی ایجاد کرد.

با این وجود، زمانی که وقت گذاشتیم تا جعبه سیاه را باز کنیم و اصطلاحا فنر‌ها و چرخ دنده‌های داخل آن را بچرخانیم متوجه شدیم که برنامه‌هایی مانند چت جی پی تی هوشی بیگانه نیستند که اکنون مجبور باشیم همزیستی با آن را بیاموزیم.

در عوض، معلوم شد که آن برنامه‌ها بر اساس منطق دیجیتالی پیش پا افتاده تطبیق الگو اجرا می‌شوند که به مقیاسی بسیار بزرگ‌تر کشیده شده اند. پیش بینی دقیق اینکه چگونه این مدل‌های زبانی بزرگ در آینده در زندگی ما ادغام می‌شوند دشوار است، اما می‌توانیم مطمئن باشیم که قادر به طرح نقشه‌های شیطانی نیستند و بعید به نظر می‌رسد که اقتصاد ما تضعیف کنند. چت جی پی تی شگفت انگیز به نظر می‌رسد، اما در نهایت واضح است که آن چه منتشر می‌کند بیش‌تر خودکار است تا امری معجزه آسا و یا زنده شدن از طریق جادو.

از میان اخبار