منتشر شده: ۲۵ فوریه ۲۰۲۵
توسعهدهندگان وب در حال ساخت و بهینهسازی وبسایتها برای مخاطبان انسانی و غیرانسانی، از جمله خزندهها و سایر رباتها، بودهاند. عاملهای هوش مصنوعی جدیدترین کاربران وب هستند که از بهینهسازی شما سود میبرند.
در اصل، یک عامل سیستمی است که ورودی را دریافت میکند، آن را تفسیر میکند، سپس اقدامات را از طرف کاربر (چه انسان و چه عامل دیگر) برنامهریزی و اجرا میکند. یک عامل دارای اجزای متعددی است که میتواند شامل مدلها، APIها یا ابزارهای دیگر باشد.
چندین ویژگی وجود دارد که عاملها را تعریف میکند . در زمینه توسعه وب، باید موارد زیر را در نظر بگیرید:
- خودمختار : عاملها میتوانند بدون دخالت مستقیم انسان عمل کنند.
- تعاملی : عاملها میتوانند با سایر عاملها و انسانها مکالمه کنند.
- واکنشی: یک عامل محیط خود را درک میکند و به تغییرات پاسخ میدهد.
- کنشگرانه : نمایندگان میتوانند برای رسیدن به اهداف خاص ابتکار عمل به خرج دهند.
برای مثال، Example Bookshop یک کتابفروشی آنلاین است. یک کاربر میتواند با تعامل با یک مدل زبان بزرگ (LLM)، بر اساس کتابهایی که دوست دارد و سایر علایقش، توصیههایی برای یک کتاب جدید جمعآوری کند. یک عامل میتواند کاربر را به صفحه کتاب توصیهشده هدایت کند و فرآیند پرداخت را آغاز کند. اگر کتاب موجود نبود، عامل میتواند کاربر را برای خرید آن توصیه به یک کتابفروشی آنلاین دیگر هدایت کند.
از آنجایی که نمایندگان کاربران نسبتاً جدیدی در وب هستند، قبل از اینکه نیاز به اتخاذ بهترین شیوهها داشته باشید، مدتی زمان دارید. با این حال، بسیاری از بهترین شیوهها برای کمک به نمایندگان در واقع به همه کاربران کمک میکند، به خصوص در ساخت یک وبسایت قابل دسترس .
در این سند، ما بررسی میکنیم که چگونه نمایندگان به عنوان کاربران وب عمل میکنند و چرا باید ساخت وبسایت خود را با در نظر گرفتن نمایندگان در نظر بگیرید.
نحوه عملکرد نمایندگان به عنوان کاربر
بخش زیادی از بحث پیرامون هوش مصنوعی و وبسایتها، مربوط به خزندههایی است که برای جمعآوری دادههای آموزشی برای LLMها استفاده میشوند. دادههای جمعآوریشده برای آموزش اغلب در مجموعه دادههای باز مانند Common Crawl نگهداری میشوند که به جلوگیری از غرق شدن سایتها توسط خزندهها کمک میکند. با این حال، آموزش تنها یکی از دلایلی است که شما با سیستمهای هوش مصنوعی مواجه خواهید شد.
سیستمهای هوش مصنوعی میتوانند بر اساس درخواست یک کاربر خاص (چه انسان و چه عامل) صفحات خاصی را برای استخراج هدف قرار دهند. به عنوان مثال، یک کاربر میتواند منابعی را در اختیار NotebookLM قرار دهد و سیستم محتوا را استخراج میکند تا به کاربر در انجام وظایف مرتبط، مانند خلاصهسازی یا جمعآوری دادهها، کمک بهتری کند.
عاملها از الگوهای مشابهی پیروی میکنند و به نمایندگی از کاربر، صفحات را میخزند تا به درخواست کاربر پاسخ دهند، اما جریان ممکن است کمتر خطی باشد.
در حالی که مدتهاست از نمایندگان برای کارهای اتوماسیون و جمعآوری اطلاعات استفاده میشود، اکنون میتوانند روی لینکها و دکمهها کلیک کنند، فیلدها را پر کنند و در صفحات اسکرول کنند و گردشهای کاری را از طرف کاربران انجام دهند. این کارها میتوانند کارهای کوچکی مانند پر کردن فرمهای تماس یا کارهای پیچیدهتری مانند رزرو پرواز برای خانواده شما باشند.
درک رضایت مهمترین مهارت برای این نوع جدید از کارگزاران است، زیرا آنها به عنوان همراه انسانها عمل میکنند. کارگزاران باید در نقاط حساس، مانند مرحله خرید یا ارسال فرمی با اطلاعات حساس، درخواست تأیید کنند.
نمایندگان به عنوان همراهان
عاملها میتوانند همراه یا حتی جایگزین کاربران انسانی باشند و به انجام وظایف پیچیده در وبسایت یا برنامه وب شما کمک کنند. در سطح بالا، روند کار یک عامل همیشه یکسان است:
- استعلام را دریافت کنید.
- نحوه رسیدگی به پرس و جو را پردازش و برنامه ریزی کنید.
- طرح را اجرا کنید.
- هر درسی را که یاد گرفتهاید در حافظه ذخیره کنید.
نمایندگان برای پشتیبانی از وظایف در چندین منبع ، بهترین گزینه هستند. در مورد خرید کتاب، نماینده ممکن است در حال انجام یک کار در منبع شما باشد، در حالی که در سایر منابع مشابه نیز پیمایش میکند. هرچه سایت شما در پشتیبانی از یک نماینده برای انجام وظیفه بهتر باشد، احتمال بیشتری وجود دارد که نماینده آن را با منبع شما انجام دهد.
وظیفه شما به عنوان یک توسعهدهنده وب، پشتیبانی و ساخت ابزارهایی است که به انسانها و عاملها کمک میکند تا وظایف حیاتی را به طور مؤثر انجام دهند. اما ابزارها تنها بخشی از زیرساخت عامل هستند.
زیرساخت عامل

یک عامل، واحدی شامل چندین قطعه متصل به هم است:
- مدل : مدلهای زبان بزرگ (LLM) پایه و اساس یک عامل هوش مصنوعی هستند. این مدلها استدلال، پایه دانش و توانایی پردازش و تولید زبان را فراهم میکنند.
- قوانین : محدودیتهای مختلف، از جمله شخصیت، دستورالعملها و اهداف، به عامل کمک میکنند تا وظایف را به طور مداوم انجام دهد.
- حافظه : حافظه کوتاهمدت و حافظه بلندمدت از یک عامل پشتیبانی میکنند تا زمینه را مدیریت کند، کارایی را افزایش دهد و بهطورکلی عملکرد بهتری برای کاربر داشته باشد.
- ابزارها : ابزارهای مختلفی وجود دارد که یک عامل میتواند از آنها استفاده کند، از جمله APIها، توابع، پایگاههای داده و حتی سایر عاملها. به عنوان مثال، WebMCP پیشنهادی در برنامه پیشنمایش اولیه کروم برای پشتیبانی از تعاملات ساختاریافته در وبسایت شما است.
وقتی کارگزاران با وبسایتها به عنوان منبع داده رفتار میکنند یا مستقیماً با صفحات تعامل دارند، میتوانند این کار را به صورت بصری یا معنایی انجام دهند:
- تعامل بصری : عامل از صفحه وب رندر شده یک تصویر لحظهای میگیرد. از یک مدل بینایی برای خواندن محتوا و شناسایی عناصر تعاملی استفاده میکند.
- تعامل معنایی : عامل DOM را تجزیه و تحلیل میکند و متن را مستقیماً میخواند. این امر به ویژه برای عاملهایی که وظایف خودکار انجام میدهند، رایج است.
برای تعاملات بصری و معنایی، کارشناسان از سایتهایی که به خوبی طراحی شدهاند، پیمایش در آنها آسان است و سلسله مراتب محتوایی واضحی دارند، سود میبرند.
نمایندگان نیاز به دسترسی به دادهها دارند
یک راه برای تعریف عاملها، رابطهی آنها با دادهها است. آیا مالک عامل و دادهها یکسان است یا متفاوت؟ این انتخاب مشخص میکند که چه لایههایی از احراز هویت مورد نیاز است و انجام این کار چقدر چالشبرانگیز است.
عامل بدون طرف
یک عامل صفر-طرفه ، یک عامل مبتنی بر مرورگر یا مبتنی بر سیستم عامل است که در یک زمینه محلی با استفاده از دادههای محلی عمل میکند. از آنجایی که مرورگرها و سیستمهای عامل، تنظیمات سفارشی کاربر را ذخیره میکنند که میتوانند به عنوان اطلاعات شخصی قابل شناسایی (PII) در نظر گرفته شوند، یک عامل صفر-طرفه میتواند از عملیاتی که این دادهها را با سایر طرفین به اشتراک میگذارند، جلوگیری کند.
نماینده شخص اول
عامل شخص اول زمانی است که ابزار و اطلاعات متعلق به یک طرف هستند، بنابراین توسعهدهندگان میتوانند ابزارها را در اختیار داشته باشند و از آنها پشتیبانی کنند، دسترسی به اطلاعات و پیکربندی را مدیریت کنند.
برای مثال، فرض کنید شما کاربری هستید که قصد سفر به تورنتو را دارید و میخواهید فهرستی از مکانهای دیدنی تهیه کنید. یک عامل ارائه شده توسط گوگل مپس میتواند مجموعهای از معیارها و دادهها را برای ایجاد فهرستی از نقاط مورد علاقه از طرف شما دریافت کند و هر مورد را روی نقشه علامتگذاری کند. این عامل را میتوان یک عامل شخص ثالث در نظر گرفت زیرا توسط گوگل ارائه شده است، که مالک دادههای نقشه و هرگونه تنظیمات شخصی دیگری است که توسط کاربر وارد شده ذخیره شده است.
نماینده شخص ثالث
یک عامل شخص ثالث توسط یک توسعهدهنده یا سازمان خارجی ایجاد میشود و عملکردها و دادههایی را از سرویسهای خارجی ارائه میدهد. به عنوان مثال، ممکن است بخواهید یک ارائهدهنده تقویم شخص ثالث از یک ویژگی مبتنی بر رویداد در وبسایت شما پشتیبانی کند. میتوانید ابزارهایی مانند WebMCP را به این عاملها ارائه دهید، یا عاملها را در گردشهای کاری خود ادغام کنید (با فرض اینکه بررسی حریم خصوصی شما را با موفقیت پشت سر بگذارند).
یک عامل شخص ثالث میتواند به طور قابل تصوری همان وظیفه نقشهبرداری را انجام دهد، زمانی که به عنوان یک افزونه ساخته شود.
توسعهدهندگان میتوانند عاملی بسازند که برای ایجاد لیستها به منابع خاصی متکی باشد، مانند گرفتن بهترین رستورانها از روزنامههای محلی. این عامل علاوه بر دسترسی خواندن و نوشتن در یک ابزار ایجاد لیست، چه نقشههای گوگل باشد و چه یک سرویس جایگزین، به دسترسی خواندن به سایتهای روزنامههای محلی نیز نیاز دارد. این امر مستلزم چندین لایه رضایت و مجوز و همچنین ابزارهای خاص برای تعامل با سایتها (مانند ابزار Playwright ) است.
این احتمال وجود دارد که وبسایت یا برنامه وب شما یک ارائهدهنده اطلاعات شخص ثالث برای یک نماینده باشد. در این صورت، ممکن است بخواهید ساختار مجوزهایی ارائه دهید که به نمایندگان و انسانها امکان دهد وظایف را با شما انجام دهند.
غذاهای بیرونبر
اکنون که درک درستی از نحوه کار نمایندگان دارید، میتوانید تصمیم بگیرید که وبسایت شما چگونه میتواند به بهترین شکل از آنها پشتیبانی کند.
- درباره WebMCP مطالعه کنید و در برنامه پیشنمایش اولیه شرکت کنید.
- یاد بگیرید که چگونه یک وبسایت قابل دسترس بسازید .
- برای آشنایی با نحوه اضافه کردن سیستمهای هوش مصنوعی به سایتهایتان، در دوره آموزشی «یادگیری هوش مصنوعی» شرکت کنید.
ما به بهروزرسانی این مجموعه با بهترین شیوههای عملی برای پشتیبانی از تعاملات وبسایت و برنامههای وب شما با نمایندگان ادامه خواهیم داد.