فرارو- کمتر از چهار ماه پس از انتشار چت جی پی تی هوش مصنوعی تولید کننده متن که به نظر میرسد ما را به عصر فناوری علمی - تخیلی سوق داده است Open AI از محصول جدیدی به نام جی پی تی -۴ (GPT-۴) رونمایی کرده است.
به گزارش فرارو به نقل از آتلانتیک، بیش از یک سال از انتشار شایعات و هیاهو در مورد این برنامه میگذرد: کارشناسان گفته اند که این برنامه فوق العاده قدرتمند خواهد بود و قادر به نوشتن کتابهای ۶۰ هزار کلمهای از طریق تک دستور و تولید ویدئو از متن خواهد بود. به نظر میرسد تواناییهای جی پی تی -۴ علیرغم آن که چشمگیر است، اما بسیار کمتر از انتظار میباشد: عملکرد آن در تستهای استاندارد و سایر معیارها نسبت به مدل قبلی بهتر است در دهها زبان کار میکند و میتواند تصاویر را به عنوان ورودی بگیرد برای مثال، این بدان معناست که قادر است محتوای یک عکس یا نمودار را توصیف کند.
برخلاف چت جی پی تی این مدل تازه در حال حاضر برای آزمایش عمومی در دسترس نیست (اگرچه میتوانید آن را درخواست کنید یا هزینه دسترسی را بپردازید). در حالی که چت جی پی تی تنها میتواند متن را مدیریت کند جی پی تی -۴ به طور دقیق به پرسشهای مربوط به عکسهای کابلهای رایانه پاسخ داد، اما ورودیهای تصویر هنوز به صورت عمومی در دسترس نیستند حتی برای کسانی که در نهایت از لیست انتظار دسترسی پیدا کردند. بنابراین، تایید ادعاهای Open AI امکان پذیر نیست.
مدل تازه جی پی تی -۴ تازهترین مدل در یک شجره نامه طولانی (جی پی تی -۲، جی پی تی -۱، چت جی پی تی، جی پی تی – ۳.۵، و جی پی تی -۳) از آن چیزی است که اکنون با عنوان "مدلهای زبان بزرگ" یا LLM شناخته میشود که برنامههای هوش مصنوعی هستند که یاد میگیرند تا پیش بینی کنند چه واژگانی احتمالا به دنبال یکدیگر میآیند.
این مدلها بر اساس فرضیهای کار میکنند که ریشههای شان به برخی از اولین تحقیقات هوش مصنوعی در دهه ۱۹۵۰ میلادی باز میگردد: این که رایانهای که زبان را میفهمد و تولید میکند لزوما هوشمند خواهد بود.
این باور زیربنای بازی تقلیدی معروف "آلن تورینگ" بود که اکنون به عنوان تست تورینگ شناخته میشود که هوش رایانهای را بر اساس نحوه خواندن متنی انسان ارزیابی میکرد.
در آن برنامههای اولیه هوش مصنوعی دانشمندان رایانه به جای استنتاجهای آماری عمیقی که امروزه استفاده میشود قوانین پیچیده و دست نوشته را استخراج میکردند. پیش سازهای مدلهای زبان بزرگ معاصر به اوایل دهه ۲۰۰۰ میلادی باز میگردند زمانی که دانشمندان استفاده از نوعی برنامه الهام گرفته از مغز انسان به نام "شبکه عصبی" را آغاز کردند که بسیاری از لایههای به هم پیوسته گرههای مصنوعی را شامل میشد که حجم عظیمی از دادههای آموزشی را پردازش کرده و متن را تولید میکند.
این فناوری در سالیان اخیر به لطف برخی از پیشرفتهای کلیدی به ویژه افزایش دامنه توجه برنامهها به سرعت پیشرفت کرده است. جی پی تی - ۴ میتواند نه تنها بر اساس عبارت قبلی بلکه بر اساس بسیاری از کلمات قبلی پیش بینی کند و اهمیت هر کلمه را متفاوت ارزیابی نماید.
"مدلهای زبان بزرگ" امروزی برای یافتن این الگوهای آماری عمیق، کتابها، مدخلهای ویکیپدیا، پستهای رسانههای اجتماعی، و منابع بی شماری دیگر را میخوانند. Open AI هم چنین شروع به استفاده از محققان انسانی برای تنظیم دقیق خروجیهای مدلهای خود کرده است. در نتیجه، جی پی تی -۴ و برنامههای مشابه دارای امکانات قابل توجهی در حوزه زبان، نوشتن داستان کوتاه، مقاله و کپی تبلیغاتی هستند.
برخی از زبان شناسان و دانشمندان علوم شناختی بر این باورند که این مدلهای هوش مصنوعی درک مناسبی از علم نحو و حداقل طبق گفته Open AI شاید حتی ذرهای از درک یا استدلال را نشان میدهند اگرچه نکته اخیر بسیار بحث برانگیز است و تسلط دستوری وصرف و نحوی رسمی به دور از توانایی تفکر است.
جی پی تی – ۴ تازهترین نقطه عطف در عرصه فناوری مرتبط با زبان است و بخشی از انفجار گستردهتر "هوش مصنوعی مولد" یا برنامههایی است که قادر به تولید تصاویر، متن، کد، موسیقی و ویدئو در پاسخ به درخواستها میباشند. اگر چنین نرم افزاری به وعدههای بزرگ خود عمل کند میتواند شناخت و خلاقیت انسان را بازتعریف نماید درست مانند اینترنت، نوشتن یا حتی پیش از آن مانند آتش. Open AI هر تکرار جدید از "مدلهای زبان بزرگ" خود را به عنوان گامی به سمت ماموریت اعلام شده شرکت برای ایجاد "هوش عمومی مصنوعی" یا رایانههایی که میتوانند یاد بگیرند و در همه چیز برتری داشته باشند به روشی که "به نفع همه بشریت باشد" قاب بندی میکند. "سم آلتمن" مدیر عامل Open AI به "نیویورک تایمز" گفته است که اگرچه جی پی تی -۴ استدلال یا هوشمندی را حل نکرده، اما گامی رو به جلو نسبت به آن چیزی است که در حال حاضر وجود دارد.
با این وجود، هوش مصنوعی پیشرفتهتر خواه عموماً باهوش باشد یا نباشد ممکن است بخش عظیمی از جمعیت را بیکار کند یا کارهای بوروکراتیک جدید مرتبط با هوش مصنوعی و نیازهای بهره وری بالاتر را جایگزین کار منظم کند.
صرفنظر از آن که این فناوری برای افراد عادی یک موهبت باشد یا یک بار سنگین کسانی که آن را کنترل میکنند بدون شک سود زیادی کسب خواهند کرد همان طور که Open AI به سمت تجاری سازی و فقدان شفافیت حرکت کرده اند همگان خواستار ورود به عرصه هوش مصنوعی هستند. شرکتهایی مانند اسنپ و اینستاکارت از فناوری Open AI از دستیارهای هوش مصنوعی در خدمات خود استفاده میکنند. در اوایل سال جاری مایکروسافت ۱۰ میلیارد دلار در Open AI سرمایه گذاری کرد و اکنون فناوری چت بات را در موتور جستجوی بینگ خود گنجانده است.
گوگل با سرمایه گذاری مبلغ کمتری در استارت آپ رقیب هوش مصنوعی "آنتروپیک" (Anthropic) (که اخیرا ۴.۱ میلیارد دلار ارزش داشت) و اعلام ظرفیتهای هوش مصنوعی مختلف در جستجوی گوگل، نقشهها و برنامههای دیگر خود اقدام کرد. آمازون "هاگینگ فیس" (Hugging Face) وب سایتی محبوب که دسترسی آسان به ابزارهای هوش مصنوعی میدهد را در AWS گنجانده است تا با "آزور" (Azure) سرویس ابری مایکروسافت رقابت کند.
متا مدتهاست که یک بخش هوش مصنوعی دارد و اکنون "مارک زاکربرگ" در تلاش است تا یک تیم خاص و مولد با هوش مصنوعی از خاکسترهای پیکسلی متاورس بسازد. استارت آپها میلیاردها دلار سرمایهگذاری خطرپذیر دارند.
جی پی تی -۴ در حال حاضر بینگ جدید را تامین میکند و میتوان آن را در مایکروسافت آفیس ادغام کرد. مدیر عامل مایکروسافت در رویدادی که ماه گذشته بینگ جدید را معرفی کرد گفته بود:"مسابقه از امروز شروع میشود و ما به سرعت حرکت میکنیم".
حتی از آنجایی که "مدلهای زبان بزرگ" در تولید تکرار واضحات عالی هستند بسیاری از منتقدان میگویند که اساس دنیا را درک نمیکنند و شاید نتوانند درک کنند. این مدلها پاسخهایی را با توهم دانایی کل تولید میکنند به این معنی که میتوانند به راحتی دروغهای قانع کننده و نفرت مذموم را منتشر کنند. پیشینه نشان میدهد که مهملات زیادی از سوی ابزارهای هوش مصنوعی منتشر میشوند. چت بات اصلی مایکروسافت به نام Tay که در سال ۲۰۱۶ میلادی منتشر شد زنستیز و نژادپرستانه بود و به سرعت متوقف شد.
جی پی تی -۲ سوگیری علیه زنان و سایر گروههای جمعیتی را از خود نشان داد. هم چنین، جی پی تی -۳ مطالب نژادپرستانه و جنسیتی را گفته بود و چت جی پی تی متهم به اظهارنظرهای سمی مشابهی شد. Open AI سعی کرد هر بار مشکل را برطرف کند و در این باره متحمل شکست شد. بینگ جدید که نسخهای از جی پی تی ۴ را اجرا میکند سهم خود را در نگارش متنهای آزار دهنده و توهین آمیز نشان داده است: به کودکان توهینهای قومیتی را آموزش میدهد، شعارهای نازیستی را تبلیغ کرده و نظریههای علمی را ابداع میکند.
در واقع، Open AI در پست وبلاگ خود اعتراف میکند که جی پی تی -۴ واقعیات را تبدیل به توهم میکند و خطاهای استدلالی ایجاد مینماید و بررسی واقعیات خیلی بهتر نشده است و میتواند میتواند سوگیریهای مختلفی در خروجیهای خود داشته باشد. با این وجود، همان گونه که هر کاربر چت جی پی تی میتواند تایید کند حتی متقاعدکنندهترین الگوها نیز نتایج کاملا قابل پیش بینیای ندارند.
با توجه بیشتر پژوهشگران به سوگیری تکرار یک مدل زبان در آینده جی پی تی -۴ یا موارد دیگر میتوانند روزی این الگوی تثبیت شده را بشکنند. با این وجود، فارغ از آن که مدل تازه توانایی خود را در چه چیزی ثابت کند هنوز پرسشهای بسیار بزرگتری وجود دارند: این فناوری برای چه کسی است؟ زندگی چه کسانی مختل میشود؟ و اگر پاسخها را دوست نداشته باشیم آیا میتوانیم کاری برای مخالفت با آن فناوریها انجام دهیم؟