معرفی نمایندگان

منتشر شده: ۲۵ فوریه ۲۰۲۵

الکساندرا کلپر
Alexandra Klepper
کاسپر کولیکووسکی
Kasper Kulikowski

توسعه‌دهندگان وب در حال ساخت و بهینه‌سازی وب‌سایت‌ها برای مخاطبان انسانی و غیرانسانی، از جمله خزنده‌ها و سایر ربات‌ها، بوده‌اند. عامل‌های هوش مصنوعی جدیدترین کاربران وب هستند که از بهینه‌سازی شما سود می‌برند.

در اصل، یک عامل سیستمی است که ورودی را دریافت می‌کند، آن را تفسیر می‌کند، سپس اقدامات را از طرف کاربر (چه انسان و چه عامل دیگر) برنامه‌ریزی و اجرا می‌کند. یک عامل دارای اجزای متعددی است که می‌تواند شامل مدل‌ها، APIها یا ابزارهای دیگر باشد.

چندین ویژگی وجود دارد که عامل‌ها را تعریف می‌کند . در زمینه توسعه وب، باید موارد زیر را در نظر بگیرید:

  • خودمختار : عامل‌ها می‌توانند بدون دخالت مستقیم انسان عمل کنند.
  • تعاملی : عامل‌ها می‌توانند با سایر عامل‌ها و انسان‌ها مکالمه کنند.
  • واکنشی: یک عامل محیط خود را درک می‌کند و به تغییرات پاسخ می‌دهد.
  • کنشگرانه : نمایندگان می‌توانند برای رسیدن به اهداف خاص ابتکار عمل به خرج دهند.

برای مثال، Example Bookshop یک کتابفروشی آنلاین است. یک کاربر می‌تواند با تعامل با یک مدل زبان بزرگ (LLM)، بر اساس کتاب‌هایی که دوست دارد و سایر علایقش، توصیه‌هایی برای یک کتاب جدید جمع‌آوری کند. یک عامل می‌تواند کاربر را به صفحه کتاب توصیه‌شده هدایت کند و فرآیند پرداخت را آغاز کند. اگر کتاب موجود نبود، عامل می‌تواند کاربر را برای خرید آن توصیه به یک کتابفروشی آنلاین دیگر هدایت کند.

از آنجایی که نمایندگان کاربران نسبتاً جدیدی در وب هستند، قبل از اینکه نیاز به اتخاذ بهترین شیوه‌ها داشته باشید، مدتی زمان دارید. با این حال، بسیاری از بهترین شیوه‌ها برای کمک به نمایندگان در واقع به همه کاربران کمک می‌کند، به خصوص در ساخت یک وب‌سایت قابل دسترس .

در این سند، ما بررسی می‌کنیم که چگونه نمایندگان به عنوان کاربران وب عمل می‌کنند و چرا باید ساخت وب‌سایت خود را با در نظر گرفتن نمایندگان در نظر بگیرید.

نحوه عملکرد نمایندگان به عنوان کاربر

بخش زیادی از بحث پیرامون هوش مصنوعی و وب‌سایت‌ها، مربوط به خزنده‌هایی است که برای جمع‌آوری داده‌های آموزشی برای LLMها استفاده می‌شوند. داده‌های جمع‌آوری‌شده برای آموزش اغلب در مجموعه داده‌های باز مانند Common Crawl نگهداری می‌شوند که به جلوگیری از غرق شدن سایت‌ها توسط خزنده‌ها کمک می‌کند. با این حال، آموزش تنها یکی از دلایلی است که شما با سیستم‌های هوش مصنوعی مواجه خواهید شد.

سیستم‌های هوش مصنوعی می‌توانند بر اساس درخواست یک کاربر خاص (چه انسان و چه عامل) صفحات خاصی را برای استخراج هدف قرار دهند. به عنوان مثال، یک کاربر می‌تواند منابعی را در اختیار NotebookLM قرار دهد و سیستم محتوا را استخراج می‌کند تا به کاربر در انجام وظایف مرتبط، مانند خلاصه‌سازی یا جمع‌آوری داده‌ها، کمک بهتری کند.

عامل‌ها از الگوهای مشابهی پیروی می‌کنند و به نمایندگی از کاربر، صفحات را می‌خزند تا به درخواست کاربر پاسخ دهند، اما جریان ممکن است کمتر خطی باشد.

در حالی که مدت‌هاست از نمایندگان برای کارهای اتوماسیون و جمع‌آوری اطلاعات استفاده می‌شود، اکنون می‌توانند روی لینک‌ها و دکمه‌ها کلیک کنند، فیلدها را پر کنند و در صفحات اسکرول کنند و گردش‌های کاری را از طرف کاربران انجام دهند. این کارها می‌توانند کارهای کوچکی مانند پر کردن فرم‌های تماس یا کارهای پیچیده‌تری مانند رزرو پرواز برای خانواده شما باشند.

درک رضایت مهم‌ترین مهارت برای این نوع جدید از کارگزاران است، زیرا آنها به عنوان همراه انسان‌ها عمل می‌کنند. کارگزاران باید در نقاط حساس، مانند مرحله خرید یا ارسال فرمی با اطلاعات حساس، درخواست تأیید کنند.

نمایندگان به عنوان همراهان

عامل‌ها می‌توانند همراه یا حتی جایگزین کاربران انسانی باشند و به انجام وظایف پیچیده در وب‌سایت یا برنامه وب شما کمک کنند. در سطح بالا، روند کار یک عامل همیشه یکسان است:

  1. استعلام را دریافت کنید.
  2. نحوه رسیدگی به پرس و جو را پردازش و برنامه ریزی کنید.
  3. طرح را اجرا کنید.
  4. هر درسی را که یاد گرفته‌اید در حافظه ذخیره کنید.

نمایندگان برای پشتیبانی از وظایف در چندین منبع ، بهترین گزینه هستند. در مورد خرید کتاب، نماینده ممکن است در حال انجام یک کار در منبع شما باشد، در حالی که در سایر منابع مشابه نیز پیمایش می‌کند. هرچه سایت شما در پشتیبانی از یک نماینده برای انجام وظیفه بهتر باشد، احتمال بیشتری وجود دارد که نماینده آن را با منبع شما انجام دهد.

وظیفه شما به عنوان یک توسعه‌دهنده وب، پشتیبانی و ساخت ابزارهایی است که به انسان‌ها و عامل‌ها کمک می‌کند تا وظایف حیاتی را به طور مؤثر انجام دهند. اما ابزارها تنها بخشی از زیرساخت عامل هستند.

زیرساخت عامل

انسان‌ها با عامل‌ها همکاری می‌کنند. هر قطعه اطلاعات را به مدل ارسال و برمی‌گرداند.
یک انسان با یک عامل کار می‌کند که شامل یک مدل، قوانین، حافظه و ابزارها است.

یک عامل، واحدی شامل چندین قطعه متصل به هم است:

  • مدل : مدل‌های زبان بزرگ (LLM) پایه و اساس یک عامل هوش مصنوعی هستند. این مدل‌ها استدلال، پایه دانش و توانایی پردازش و تولید زبان را فراهم می‌کنند.
  • قوانین : محدودیت‌های مختلف، از جمله شخصیت، دستورالعمل‌ها و اهداف، به عامل کمک می‌کنند تا وظایف را به طور مداوم انجام دهد.
  • حافظه : حافظه کوتاه‌مدت و حافظه بلندمدت از یک عامل پشتیبانی می‌کنند تا زمینه را مدیریت کند، کارایی را افزایش دهد و به‌طورکلی عملکرد بهتری برای کاربر داشته باشد.
  • ابزارها : ابزارهای مختلفی وجود دارد که یک عامل می‌تواند از آنها استفاده کند، از جمله APIها، توابع، پایگاه‌های داده و حتی سایر عامل‌ها. به عنوان مثال، WebMCP پیشنهادی در برنامه پیش‌نمایش اولیه کروم برای پشتیبانی از تعاملات ساختاریافته در وب‌سایت شما است.

وقتی کارگزاران با وب‌سایت‌ها به عنوان منبع داده رفتار می‌کنند یا مستقیماً با صفحات تعامل دارند، می‌توانند این کار را به صورت بصری یا معنایی انجام دهند:

  • تعامل بصری : عامل از صفحه وب رندر شده یک تصویر لحظه‌ای می‌گیرد. از یک مدل بینایی برای خواندن محتوا و شناسایی عناصر تعاملی استفاده می‌کند.
  • تعامل معنایی : عامل DOM را تجزیه و تحلیل می‌کند و متن را مستقیماً می‌خواند. این امر به ویژه برای عامل‌هایی که وظایف خودکار انجام می‌دهند، رایج است.

برای تعاملات بصری و معنایی، کارشناسان از سایت‌هایی که به خوبی طراحی شده‌اند، پیمایش در آنها آسان است و سلسله مراتب محتوایی واضحی دارند، سود می‌برند.

نمایندگان نیاز به دسترسی به داده‌ها دارند

یک راه برای تعریف عامل‌ها، رابطه‌ی آنها با داده‌ها است. آیا مالک عامل و داده‌ها یکسان است یا متفاوت؟ این انتخاب مشخص می‌کند که چه لایه‌هایی از احراز هویت مورد نیاز است و انجام این کار چقدر چالش‌برانگیز است.

عامل بدون طرف

یک عامل صفر-طرفه ، یک عامل مبتنی بر مرورگر یا مبتنی بر سیستم عامل است که در یک زمینه محلی با استفاده از داده‌های محلی عمل می‌کند. از آنجایی که مرورگرها و سیستم‌های عامل، تنظیمات سفارشی کاربر را ذخیره می‌کنند که می‌توانند به عنوان اطلاعات شخصی قابل شناسایی (PII) در نظر گرفته شوند، یک عامل صفر-طرفه می‌تواند از عملیاتی که این داده‌ها را با سایر طرفین به اشتراک می‌گذارند، جلوگیری کند.

نماینده شخص اول

عامل شخص اول زمانی است که ابزار و اطلاعات متعلق به یک طرف هستند، بنابراین توسعه‌دهندگان می‌توانند ابزارها را در اختیار داشته باشند و از آنها پشتیبانی کنند، دسترسی به اطلاعات و پیکربندی را مدیریت کنند.

برای مثال، فرض کنید شما کاربری هستید که قصد سفر به تورنتو را دارید و می‌خواهید فهرستی از مکان‌های دیدنی تهیه کنید. یک عامل ارائه شده توسط گوگل مپس می‌تواند مجموعه‌ای از معیارها و داده‌ها را برای ایجاد فهرستی از نقاط مورد علاقه از طرف شما دریافت کند و هر مورد را روی نقشه علامت‌گذاری کند. این عامل را می‌توان یک عامل شخص ثالث در نظر گرفت زیرا توسط گوگل ارائه شده است، که مالک داده‌های نقشه و هرگونه تنظیمات شخصی دیگری است که توسط کاربر وارد شده ذخیره شده است.

نماینده شخص ثالث

یک عامل شخص ثالث توسط یک توسعه‌دهنده یا سازمان خارجی ایجاد می‌شود و عملکردها و داده‌هایی را از سرویس‌های خارجی ارائه می‌دهد. به عنوان مثال، ممکن است بخواهید یک ارائه‌دهنده تقویم شخص ثالث از یک ویژگی مبتنی بر رویداد در وب‌سایت شما پشتیبانی کند. می‌توانید ابزارهایی مانند WebMCP را به این عامل‌ها ارائه دهید، یا عامل‌ها را در گردش‌های کاری خود ادغام کنید (با فرض اینکه بررسی حریم خصوصی شما را با موفقیت پشت سر بگذارند).

یک عامل شخص ثالث می‌تواند به طور قابل تصوری همان وظیفه نقشه‌برداری را انجام دهد، زمانی که به عنوان یک افزونه ساخته شود.

توسعه‌دهندگان می‌توانند عاملی بسازند که برای ایجاد لیست‌ها به منابع خاصی متکی باشد، مانند گرفتن بهترین رستوران‌ها از روزنامه‌های محلی. این عامل علاوه بر دسترسی خواندن و نوشتن در یک ابزار ایجاد لیست، چه نقشه‌های گوگل باشد و چه یک سرویس جایگزین، به دسترسی خواندن به سایت‌های روزنامه‌های محلی نیز نیاز دارد. این امر مستلزم چندین لایه رضایت و مجوز و همچنین ابزارهای خاص برای تعامل با سایت‌ها (مانند ابزار Playwright ) است.

این احتمال وجود دارد که وب‌سایت یا برنامه وب شما یک ارائه‌دهنده اطلاعات شخص ثالث برای یک نماینده باشد. در این صورت، ممکن است بخواهید ساختار مجوزهایی ارائه دهید که به نمایندگان و انسان‌ها امکان دهد وظایف را با شما انجام دهند.

غذاهای بیرون‌بر

اکنون که درک درستی از نحوه کار نمایندگان دارید، می‌توانید تصمیم بگیرید که وب‌سایت شما چگونه می‌تواند به بهترین شکل از آنها پشتیبانی کند.

ما به به‌روزرسانی این مجموعه با بهترین شیوه‌های عملی برای پشتیبانی از تعاملات وب‌سایت و برنامه‌های وب شما با نمایندگان ادامه خواهیم داد.