هوش مصنوعی مولد: ایجاد محتوای جدید

در حالی که هوش مصنوعی پیش‌بینی‌کننده، بینش‌هایی را از داده‌های موجود استخراج می‌کند، هوش مصنوعی مولد یک قدم فراتر می‌رود و چیزی جدید خلق می‌کند. این هوش مصنوعی می‌تواند متن بنویسد، تصاویر تولید کند، کد تولید کند یا حتی رابط‌های کاربری کامل را طراحی کند. در اینجا چند نمونه رایج از موارد استفاده هوش مصنوعی مولد آورده شده است:

  • تولید محتوا : دستیاران نویسندگی هوش مصنوعی می‌توانند پیش‌نویس‌هایی ایجاد کرده و متن موجود را اصلاح کنند.
  • خلاصه‌سازی : ابزارهایی مانند Google AI Overviews اسناد، جلسات یا صفحات وب طولانی را به خلاصه‌های مختصر و کاربردی تبدیل می‌کنند.
  • تولید کد : ابزارهای توسعه‌دهنده از هوش مصنوعی مولد برای نوشتن و اصلاح کد استفاده می‌کنند و بهره‌وری توسعه‌دهنده را افزایش می‌دهند.
  • ایجاد تصویر و دارایی : با استفاده از مدل‌های بصری، کاربران می‌توانند دارایی‌های بصری مانند بنرها و تصاویر کوچک را تولید کنند.

حلقه هوش مصنوعی مولد

بیشتر مدل‌های هوش مصنوعی مولد با استفاده از شبکه‌های عصبی و معماری‌های تبدیل‌کننده آموزش داده می‌شوند. مدل‌ها یاد می‌گیرند که عنصر بعدی در یک دنباله، مانند کلمه، پیکسل یا یادداشت بعدی را بر اساس عناصر قبلی آن پیشنهاد دهند.

از نظر ریاضی، این خیلی با هوش مصنوعی پیش‌بینی‌کننده فاصله ندارد. هر دو از داده‌ها الگو می‌گیرند. تفاوت در مقیاس است.

در هوش مصنوعی پیش‌بینی‌کننده، گزینه‌های خروجی به چند برچسب مانند «ریزش» یا «بدون ریزش» محدود می‌شوند. در هوش مصنوعی مولد، فضای خروجی می‌تواند شامل صدها هزار گزینه باشد. مکانیسم پیش‌بینی که بر اساس میلیاردها مثال آموزش دیده است، به یک موتور قدرتمند تبدیل می‌شود که قادر به تولید خروجی‌های جدید و دیده نشده است.

توسعه یک سیستم هوش مصنوعی مولد از یک رویکرد تکراری پیروی می‌کند.

هر مرحله، در یک دایره پیوسته، به مرحله بعدی اشاره دارد.
شکل ۱. درست مانند حلقه پیش‌بینی هوش مصنوعی، شما با تعریف مورد استفاده خود شروع می‌کنید. حلقه در هر مرحله تکرار می‌شود و دوباره شروع می‌شود.

ما نحوه‌ی کار این قابلیت را با برنامه‌ی نمونه‌ی خود، BlogBuddy ، که یک دستیار سیستم مدیریت محتوا است و به کاربران کمک می‌کند تا توضیحات جذاب و عناوین مقاله‌ی سئوپسند ایجاد کنند، بررسی خواهیم کرد.

مورد استفاده خود را تعریف کنید

طرح اولیه سیستم هوش مصنوعی BlogBuddy.
شکل ۲. طرح اولیه سیستم شما برای برنامه Blogbuddy . نمودار را در اندازه کامل باز کنید .

بیان مسئله شما باید شامل موارد زیر باشد:

  • روش ورودی و خروجی . این می‌تواند متن (نثر یا کد)، تصاویر یا صدا باشد.
  • روش ورودی . آیا محتوا از فیلد آپلود، متن آزاد یا ورودی‌های ساختارمند دیگری آمده است؟
  • مخاطب . چه کسی این وظیفه را انجام می‌دهد؟ آیا آنها دانش عمومی دارند یا به دانش تخصصی نیاز دارند؟

ویژگی‌های BlogBuddy حول محور تولید متن می‌چرخد. ورودی نیمه‌ساختاریافته است: کاربران یک موضوع یا پیش‌نویس کوتاه ارائه می‌دهند و مدل، نسخه‌های مختلف را برمی‌گرداند. مخاطب، بازاریاب است و دانش تخصصی در زمینه ویراستاری دارد.

تعیین یک استاندارد کیفی برای خروجی‌های شما بسیار مهم است. در مورد ما، می‌خواهیم متنی کوتاه، قابل مرور و غنی از کلمات کلیدی تولید کنیم که با لحن نشریه مطابقت داشته باشد.

معیارهای موفقیت واضح به شما کمک می‌کنند تا بقیه فرآیند را هدایت کنید. در بخش توسعه مبتنی بر ارزیابی، درباره جمع‌آوری معیارهای موفقیت بیشتر خواهید آموخت.

مدل پایه را انتخاب کنید

طیف گسترده‌ای از مدل‌های موجود وجود دارند که از قبل روی مجموعه داده‌های بزرگ و جهانی آموزش دیده‌اند. رفتار آنها را می‌توان برای نیازهای خاص تطبیق داد. مدل‌های هوش مصنوعی مولد معمولاً بسیار بزرگتر و پیچیده‌تر از مدل‌های پیش‌بینی هستند، بنابراین بهتر است به جای ساخت و آموزش مدل خودتان، آن را بر اساس یک مدل موجود بسازید.

انتخاب شما، قابلیت‌ها، هزینه، قابلیت سفارشی‌سازی و مرزهای حریم خصوصی محصول شما را تعیین می‌کند. انتخاب مدل به شدت به پلتفرمی که سیستم هوش مصنوعی خود را روی آن مستقر می‌کنید، وابسته است.

بعداً در این دوره، یاد می‌گیرید که چگونه پلتفرم خود را انتخاب کنید .

مهندسی سریع و زمینه

وقتی مدل خود را انتخاب کردید، باید دستورالعمل‌های صحیح را با یک اعلان به آن بدهید. برای BlogBuddy، ممکن است مدل را به صورت زیر اعلان کنیم:

Generate three short, engaging title suggestions for this article

انواع مختلفی از اطلاعات وجود دارد که می‌توانید به یک درخواست اضافه کنید. برای مثال:

  • یک اعلان سیستمی که رفتار کلی را تنظیم می‌کند.
  • زمینه‌ی ورودی-ویژه برای وظیفه‌ی فعلی.
  • دستورالعمل‌های کاربر در برنامه‌های مکالمه‌ای، مانند چت‌بات‌ها یا عامل‌ها.

استنتاج و پس‌پردازش

پس از مونتاژ شدن اعلان شما، برای استنتاج به مدل ارسال می‌شود. می‌توانید پارامترهای مدل ، از جمله دما (برای خلاقیت) و حداکثر مقدار توکن‌ها (برای طول و حجم) را تغییر دهید تا نحوه پاسخ مدل را تنظیم کنید. پس از تولید، خروجی اغلب با قوانین و محافظ‌های اضافی پردازش می‌شود.

برای مثال، می‌توانید متن جنسیتی را اصلاح کنید، لحن را تعدیل کنید یا اصطلاحات ممنوعه را فیلتر کنید.

برای پشتیبانی از شفافیت و کالیبراسیون اعتماد، می‌توانید یک مدل ثانویه کوچک‌تر برای طبقه‌بندی یا خلاصه کردن نتیجه اضافه کنید. برای مثال: « مقدمه از ۱۲ مقاله مرتبط تولید شده است. میزان اطمینان: بالا. »

حلقه ارزیابی و بازخورد

از آنجایی که فضای خروجی برای هوش مصنوعی مولد عملاً نامحدود است، اکثر سوالات یک پاسخ صحیح واحد ندارند. معیارهای استاندارد، مانند MMLU یا SQuAD ، می‌توانند قابلیت کلی مدل را اندازه‌گیری کنند، اما به ندرت نیازهای خاص کاربران انسانی را در بر می‌گیرند. در زمینه محصول، باید ترکیبی از معیارهای کیفی و کمی خود را تعریف کنید:

  • دقت : آیا خروجی واقعاً صحیح است؟
  • مفید بودن : آیا خروجی، انتظارات تعیین‌شده توسط درخواست یا هدف کاربر را برآورده می‌کند؟
  • خوانایی و لحن : آیا خروجی واضح و مطابق با استانداردهای برند است؟
  • تلاش انسانی : چه میزان ویرایش یا گردآوری دستی مورد نیاز است؟
  • درک حوزه : آیا خروجی، دانش خاص حوزه را منعکس می‌کند؟

برای ارزیابی این معیارها، می‌توانید بررسی انسانی و امتیازدهی خودکار را ترکیب کنید. به عنوان مثال، می‌توانید از کاربران بخواهید خروجی‌های واقعی را ارزیابی کنند، از یک مدل دوم برای ارزیابی خودکار (که به آن LLM-as-a-judge نیز گفته می‌شود) استفاده کنید و بررسی‌های داخلی دوره‌ای را برای شناسایی سوگیری یا توهم انجام دهید.

داده‌های واقعی استفاده یکی از بزرگترین دارایی‌های شما هنگام ساخت با مولد است. در صورت امکان، این تعاملات را ثبت کنید تا بتوانید پیام‌ها و زمینه‌ها را تغییر دهید، مدل‌های مختلف را آزمایش کنید یا پارامترها را در طول زمان تنظیم کنید. هر تعامل، اصلاح یا امتیاز کاربر به بازخوردی تبدیل می‌شود که می‌تواند به شما در تعیین مراحل بهینه‌سازی بعدی کمک کند:

  • ورودی‌های غیرمنتظره کاربر می‌تواند به شما کمک کند تا تشخیص دهید که آیا در حال حل مسئله‌ی درستی هستید یا خیر.
  • درخواست‌های مکرر مربوط به یک حوزه خاص می‌تواند در انتخاب مدل مؤثر باشد. شما می‌توانید از یک مدل LLM بزرگ و عمومی به یک مدل کوچک و دقیق تغییر دهید.
  • توهمات مکرر می‌تواند به فقدان زمینه خاص در دستورالعمل‌های شما اشاره داشته باشد.
  • ویرایش‌های سنگین می‌توانند نشان‌دهنده‌ی ناکافی بودن زمینه‌ی مشترک باشند. مدل از اطلاعاتی که توسط کاربر بدیهی فرض می‌شود، آگاه نیست.

با گذشت زمان، این حلقه‌های بازخورد، ویژگی هوش مصنوعی مولد شما را از یک فراخوانی مدل ایستا به یک سیستم زنده تبدیل می‌کنند که به طور مداوم با نیازها و ترجیحات کاربران شما سازگار می‌شود.

مشکلات رایج و راهکارهای کاهش آنها

از آنجا که هوش مصنوعی مولد در فضایی باز از ورودی‌ها و خروجی‌ها عمل می‌کند، سطح ریسک آن بسیار گسترده‌تر از سیستم‌های پیش‌بینی‌کننده است. فراتر از تولید خروجی‌های نادرست، می‌تواند محتوای سمی، مغرضانه یا گمراه‌کننده تولید کند یا حتی کاربران را ناخواسته دستکاری کند. این شکست‌ها می‌توانند اعتماد را از بین برده و شرکت شما را در معرض عواقب مالی یا قانونی قرار دهند.

به همین دلیل است که هوش مصنوعی مولد به یک رویکرد مدیریت ریسک پیشگیرانه و مداوم نیاز دارد. در اینجا برخی از رایج‌ترین خطرات آورده شده است:

  • توهم : مدل حقایق را جعل می‌کند یا جزئیات را اشتباه بیان می‌کند. برای کاهش آن، از RAG برای زمینه‌سازی مبتنی بر واقعیت استفاده کنید.
  • اعتماد بیش از حد : کاربران فرض می‌کنند خروجی‌ها همیشه درست هستند. برای کاهش این مشکل، به جای انتشار خودکار، جریان بررسی و ویرایش را تشویق کنید. در کتاب «مدیریت هوش مصنوعی: ساخت مسئولانه» ، یاد خواهید گرفت که چگونه به کاربران کمک کنید تا اعتماد خود را تنظیم کنند.
  • ناهماهنگی : خروجی‌ها در طول اجراها به شدت متفاوت هستند. برای کاهش آن، از قالب‌های آماده، کنترل دما یا نمونه‌های چند قسمتی برای تثبیت لحن و ساختار استفاده کنید.
  • محتوای سمی یا مضر : مدل، متن مغرضانه، توهین‌آمیز یا دستکاری‌شده تولید می‌کند. برای کاهش این موارد، قبل از نمایش، فیلترهای تعدیل و طبقه‌بندی‌کننده‌های سمیت را اعمال کنید. خروجی‌ها را به‌طور مداوم با درخواست‌های واقعی آزمایش کنید و یک حلقه بازخورد برای علامت‌گذاری و آموزش مجدد موارد حاشیه‌ای نگه دارید.
  • تأخیر و هزینه : مدل‌های بزرگ می‌توانند کند و گران باشند. به خصوص اگر هدف شما پذیرش در مقیاس بزرگ باشد، تخمین هزینه و میزان استفاده از منابع مدل‌ها از قبل می‌تواند دشوار باشد. برای کاهش این مشکل، از ذخیره‌سازی موقت، دسته‌بندی و مدل‌های کوچک‌تر برای کارهای کوتاه استفاده کنید.

نکات مهم شما

به طور خلاصه، هوش مصنوعی مولد ایده‌های خام را به محتوای ملموس مانند متن، تصویر، کد یا مکالمه تبدیل می‌کند. این هوش مصنوعی در جایی رشد می‌کند که خلاقیت و سازگاری بیش از دقت اهمیت داشته باشند.

به عنوان یک توسعه‌دهنده وب، موفقیت شما به طراحی دستورالعمل‌های مناسب، پایه‌گذاری مدل خود بر اساس داده‌های مناسب و همسوسازی مداوم سیستم با ترجیحات کاربر بستگی دارد.

منابع

درباره انتخاب مدل‌های کوچک‌تر و پایدارتر بخوانید. برای یادگیری پیشرفته‌تر:

درک خود را بررسی کنید

تفاوت کلیدی بین هوش مصنوعی مولد و خروجی هوش مصنوعی پیش‌بین چیست؟

خروجی‌های هوش مصنوعی مولد به چند برچسب مانند «ریزش» یا «عدم ریزش» محدود می‌شوند.
این نادرست است.
هوش مصنوعی مولد، محتوای جدید را از فضای خروجی گزینه‌ها (متن، پیکسل، کد) ایجاد می‌کند.
کارت عالی بود، کاملاً درسته!
هوش مصنوعی مولد فقط برای پیش‌بینی عددی استفاده می‌شود.
این نادرست است.
هوش مصنوعی مولد از داده‌ها برای یادگیری الگوها استفاده نمی‌کند.
این نادرست است.

نقش دمای مدل چیست؟

این پارامتر، تصادفی بودن پاسخ مدل را کنترل می‌کند.
این نادرست است.
خلاقیت پاسخ مدل را تنظیم می‌کند.
کارت عالی بود، کاملاً درسته!
این عبارت‌های ممنوعه را فیلتر می‌کند.
این نادرست است.
سرعت مدل را افزایش می‌دهد.
این نادرست است.

چرا معیارهای استاندارد اغلب برای ارزیابی هوش مصنوعی مولد کافی نیستند؟

آنها برای اجرا خیلی گران هستند.
این نادرست است.
آنها به ندرت نیازهای خاص کاربران انسانی و هدف محصول را در نظر می‌گیرند.
کارت عالی بود، کاملاً درسته!
آنها فقط برای تولید تصویر کار می‌کنند، نه متن.
این نادرست است.
عبور از آنها برای مدل‌های مدرن خیلی آسان است.
این نادرست است.

کدام یک از موارد زیر از جمله روش‌های رایج برای کاهش توهم است؟

از تکنیک‌هایی مانند RAG (بازیابی-تولید افزوده) برای پایه‌گذاری مبتنی بر واقعیت استفاده کنید.
کارت عالی بود، کاملاً درسته!
برای خلاقانه‌تر شدن مدل، دمای آن را افزایش دهید.
این نادرست است.
استفاده از هوش مصنوعی را متوقف کنید و به تولید محتوای دستی روی بیاورید.
این ممکن است رخ دهد، اما راهی برای کمک به مدل در ایجاد خروجی‌های دقیق‌تر نیست.
اگر خروجی مشکوک به نظر می‌رسد، آن را از کاربر پنهان کنید.
در حالی که می‌توانید سعی کنید اطلاعات نادرستی را که از رسیدن به کاربر حاصل شده است، ارائه دهید، این کار به توهمات مداوم نمی‌پردازد.

طبق حلقه هوش مصنوعی مولد، با بازخورد کاربران چه باید کرد؟

برای حفظ حریم خصوصی، فوراً آن را حذف کنید.
این نادرست است.
از آن برای اصلاح تعریف مسئله، انتخاب مدل یا سوالات استفاده کنید.
کارت عالی بود، کاملاً درسته!
آن را در یک پایگاه داده جداگانه ذخیره کنید و هرگز به آن نگاه نکنید.
این نادرست است.
از آن فقط برای تنبیه الگو به خاطر رفتار بد استفاده کنید.
این نادرست است.