এজেন্টদের সাথে পরিচিতি

প্রকাশিত: ২৫ ফেব্রুয়ারী, ২০২৫

অনুসরণ
Alexandra Klepper
ক্যাসপার কুলিকোস্কি
Kasper Kulikowski

ওয়েব ডেভেলপাররা ক্রলার এবং অন্যান্য বট সহ মানব এবং অ-মানব দর্শকদের জন্য ওয়েবসাইট তৈরি এবং অপ্টিমাইজ করছে। AI এজেন্টরা হল সর্বশেষ ওয়েব ব্যবহারকারী যারা আপনার অপ্টিমাইজেশন থেকে উপকৃত হয়।

এর মূলে, এজেন্ট হল এমন একটি সিস্টেম যা ইনপুট গ্রহণ করে, ব্যাখ্যা করে, তারপর ব্যবহারকারীর পক্ষে (সেটি মানুষ হোক বা অন্য কোনও এজেন্ট) কর্ম পরিকল্পনা করে এবং সম্পাদন করে। একটি এজেন্টের একাধিক উপাদান থাকে, যার মধ্যে মডেল, API, বা অন্যান্য সরঞ্জাম অন্তর্ভুক্ত থাকতে পারে।

এজেন্টদের সংজ্ঞায়িত করার জন্য বেশ কয়েকটি বৈশিষ্ট্য রয়েছে। ওয়েব ডেভেলপমেন্টের প্রেক্ষাপটে, আপনার নিম্নলিখিত বিষয়গুলি বিবেচনা করা উচিত:

  • স্বায়ত্তশাসিত : এজেন্টরা সরাসরি মানুষের হস্তক্ষেপ ছাড়াই কাজ করতে পারে।
  • ইন্টারেক্টিভ : এজেন্টরা অন্যান্য এজেন্ট এবং মানুষের সাথে কথোপকথন করতে পারে।
  • প্রতিক্রিয়াশীল: একজন এজেন্ট তার পরিবেশ উপলব্ধি করে এবং পরিবর্তনের প্রতি সাড়া দেয়।
  • সক্রিয় : এজেন্টরা নির্দিষ্ট লক্ষ্য পূরণের জন্য উদ্যোগ নিতে পারে।

উদাহরণস্বরূপ, Example Bookshop হল একটি অনলাইন বইয়ের দোকান। একজন ব্যবহারকারী একটি বৃহৎ ভাষা মডেল (LLM) এর সাথে যোগাযোগ করে তাদের পছন্দের বই এবং অন্যান্য আগ্রহের উপর ভিত্তি করে একটি নতুন বইয়ের জন্য সুপারিশ সংগ্রহ করতে পারেন। একজন এজেন্ট ব্যবহারকারীকে প্রস্তাবিত বইয়ের পৃষ্ঠায় নিয়ে যেতে পারেন এবং চেকআউট প্রক্রিয়া শুরু করতে পারেন। যদি বইটি স্টকের বাইরে থাকে, তাহলে এজেন্ট ব্যবহারকারীকে অন্য অনলাইন বইয়ের দোকানে সেই সুপারিশটি কিনতে নিয়ে যেতে পারেন।

যেহেতু এজেন্টরা ওয়েবে মোটামুটি নতুন ব্যবহারকারী, তাই আপনার কাছে সেরা অনুশীলনগুলি গ্রহণ করার আগে কিছুটা সময় আছে। তবে, এজেন্টদের সাহায্য করার জন্য অনেক সেরা অনুশীলন আসলে সমস্ত ব্যবহারকারীদের সাহায্য করে, বিশেষ করে একটি অ্যাক্সেসযোগ্য ওয়েবসাইট তৈরি করা

এই নথিতে, আমরা পর্যালোচনা করব কিভাবে এজেন্টরা ওয়েব ব্যবহারকারী হিসেবে কাজ করে এবং কেন আপনার এজেন্টদের কথা মাথায় রেখে আপনার ওয়েবসাইট তৈরি করা উচিত।

এজেন্টরা ব্যবহারকারী হিসেবে কীভাবে কাজ করে

AI এবং ওয়েবসাইটগুলির বেশিরভাগ আলোচনা LLM-এর জন্য প্রশিক্ষণ ডেটা স্ক্র্যাপ করার জন্য ব্যবহৃত ক্রলার নিয়ে। প্রশিক্ষণের জন্য স্ক্র্যাপ করা ডেটা প্রায়শই Common Crawl-এর মতো খোলা ডেটাসেটে রাখা হয়, যা সাইটগুলিকে ক্রলার দ্বারা ছেঁকে যাওয়া থেকে রক্ষা করে। তবে, প্রশিক্ষণ হল AI সিস্টেমগুলির মুখোমুখি হওয়ার একটি কারণ।

AI সিস্টেমগুলি নির্দিষ্ট ব্যবহারকারীর অনুরোধের ভিত্তিতে (সেটি মানুষ হোক বা এজেন্ট) নির্দিষ্ট পৃষ্ঠাগুলিকে স্ক্র্যাপ করার জন্য লক্ষ্য করতে পারে। উদাহরণস্বরূপ, একজন ব্যবহারকারী NotebookLM- কে উৎস সরবরাহ করতে পারে এবং সিস্টেমটি ব্যবহারকারীকে সম্পর্কিত কাজগুলিতে, যেমন সারসংক্ষেপ বা ডেটা একত্রিতকরণে আরও ভালভাবে সহায়তা করার জন্য সামগ্রীটি স্ক্র্যাপ করে।

এজেন্টরা ব্যবহারকারীর অনুরোধের উত্তর দেওয়ার জন্য ব্যবহারকারীর পক্ষ থেকে একই ধরণের প্যাটার্ন অনুসরণ করে এবং পৃষ্ঠাগুলি ক্রল করে, তবে প্রবাহটি কম রৈখিক হতে পারে।

যদিও এজেন্টদের দীর্ঘদিন ধরে অটোমেশনের কাজ এবং তথ্য সংগ্রহের জন্য ব্যবহার করা হয়ে আসছে, এখন তারা লিঙ্ক এবং বোতামে ক্লিক করতে, ক্ষেত্র পূরণ করতে এবং পৃষ্ঠাগুলিতে স্ক্রোল করতে পারে, ব্যবহারকারীদের পক্ষে কর্মপ্রবাহ সম্পন্ন করতে পারে। এগুলি ছোট কাজ হতে পারে, যেমন যোগাযোগ ফর্ম পূরণ করা, অথবা আরও জটিল কাজ, যেমন আপনার পরিবারের জন্য ফ্লাইট বুক করা।

এই নতুন ধরণের এজেন্টদের জন্য সম্মতি বোঝা সবচেয়ে গুরুত্বপূর্ণ দক্ষতা, কারণ তারা মানুষের সঙ্গী হিসেবে কাজ করে। এজেন্টদের গুরুত্বপূর্ণ পয়েন্টগুলিতে নিশ্চিতকরণের জন্য জিজ্ঞাসা করা উচিত, যেমন ক্রয় পদক্ষেপ বা সংবেদনশীল তথ্য সহ একটি ফর্ম জমা দেওয়া।

সহযোগী হিসেবে এজেন্টরা

এজেন্টরা মানব ব্যবহারকারীদের সঙ্গী বা এমনকি সারোগেটও হতে পারে, আপনার ওয়েবসাইট বা ওয়েব অ্যাপ্লিকেশনে জটিল কাজ সম্পন্ন করতে সহায়তা করে। উচ্চ স্তরে, একজন এজেন্টের প্রক্রিয়া সর্বদা একই রকম থাকে:

  1. প্রশ্নটি গ্রহণ করুন।
  2. প্রশ্নটি কীভাবে সমাধান করবেন তা প্রক্রিয়া করুন এবং পরিকল্পনা করুন।
  3. পরিকল্পনাটি বাস্তবায়ন করুন।
  4. শেখা যেকোনো শিক্ষা মনে রাখবেন।

একাধিক অরিজিন জুড়ে কাজগুলি সমর্থন করার জন্য এজেন্টরা সবচেয়ে উপযুক্ত। বই কেনার ক্ষেত্রে, এজেন্ট আপনার অরিজিন সংক্রান্ত কোনও কাজ সম্পন্ন করার পাশাপাশি অন্যান্য অনুরূপ অরিজিনগুলিতেও নেভিগেট করতে পারে। আপনার সাইটটি কোনও এজেন্টকে কাজটি সম্পন্ন করতে যত ভালোভাবে সহায়তা করবে, এজেন্ট আপনার অরিজিন দিয়ে এটি সম্পন্ন করার সম্ভাবনা তত বেশি।

একজন ওয়েব ডেভেলপার হিসেবে আপনার কাজ হলো মানুষ এবং এজেন্টদের গুরুত্বপূর্ণ কাজগুলো দক্ষতার সাথে সম্পন্ন করতে সাহায্য করার জন্য সরঞ্জাম তৈরি করা এবং সহায়তা করা। কিন্তু সরঞ্জামগুলি এজেন্ট অবকাঠামোর একটি অংশ মাত্র।

এজেন্ট পরিকাঠামো

মানুষ এজেন্টদের সাথে সহযোগিতা করে। প্রতিটি টুকরো মডেলে তথ্য পাঠায় এবং ফেরত দেয়।
একজন মানুষ একজন এজেন্টের সাথে কাজ করে, যার মধ্যে একটি মডেল, নিয়ম, স্মৃতি এবং সরঞ্জাম থাকে।

একটি এজেন্ট হল একটি ধারণকৃত ইউনিট যার একাধিক সংযুক্ত অংশ রয়েছে:

  • মডেল : বৃহৎ ভাষা মডেল (LLM) হল একটি AI এজেন্টের ভিত্তি। এগুলি যুক্তি, জ্ঞানের ভিত্তি এবং ভাষা প্রক্রিয়াকরণ এবং উৎপন্ন করার ক্ষমতা প্রদান করে।
  • নিয়ম : ব্যক্তিত্ব, নির্দেশাবলী এবং লক্ষ্য সহ বিভিন্ন সীমাবদ্ধতা এজেন্টকে ধারাবাহিকভাবে কাজ সম্পাদনে সহায়তা করে।
  • স্মৃতি : স্বল্পমেয়াদী স্মৃতি এবং দীর্ঘমেয়াদী স্মৃতি একটি এজেন্টকে প্রেক্ষাপট পরিচালনা করতে, দক্ষতা অর্জন করতে এবং সাধারণত ব্যবহারকারীর জন্য আরও ভালো কার্য সম্পাদন করতে সহায়তা করে।
  • টুলস : একজন এজেন্ট অনেক ধরণের টুল ব্যবহার করতে পারে, যার মধ্যে রয়েছে API, ফাংশন, ডাটাবেস এবং এমনকি অন্যান্য এজেন্ট। উদাহরণস্বরূপ, WebMCP হল Chrome এর প্রাথমিক প্রিভিউ প্রোগ্রামের একটি প্রস্তাব যা আপনার ওয়েবসাইটে কাঠামোগত ইন্টারঅ্যাকশন সমর্থন করে।

যখন এজেন্টরা ওয়েবসাইটগুলিকে ডেটা উৎস হিসেবে বিবেচনা করে বা পৃষ্ঠাগুলির সাথে সরাসরি যোগাযোগ করে, তখন তারা দৃশ্যত বা শব্দার্থগতভাবে তা করতে পারে:

  • ভিজ্যুয়াল ইন্টারঅ্যাকশন : এজেন্ট রেন্ডার করা ওয়েব পৃষ্ঠার একটি স্ন্যাপশট নেয়। এটি কন্টেন্টটি পড়তে এবং ইন্টারেক্টিভ উপাদানগুলি সনাক্ত করতে একটি ভিশন মডেল ব্যবহার করে।
  • শব্দার্থিক মিথস্ক্রিয়া : এজেন্ট DOM বিশ্লেষণ করে এবং সরাসরি টেক্সট পড়ে। এটি বিশেষ করে স্বয়ংক্রিয় কাজ সম্পাদনকারী এজেন্টদের ক্ষেত্রে সাধারণ।

ভিজ্যুয়াল এবং সিমেন্টিক উভয় ধরণের মিথস্ক্রিয়ার জন্য, এজেন্টরা এমন সাইটগুলি থেকে উপকৃত হয় যা সু-নকশিত, নেভিগেট করার জন্য স্বজ্ঞাত এবং একটি স্পষ্ট বিষয়বস্তু শ্রেণিবিন্যাস রয়েছে।

এজেন্টদের ডেটা অ্যাক্সেসের প্রয়োজন হয়

এজেন্টদের সংজ্ঞায়িত করার একটি উপায় হল ডেটার সাথে এর সম্পর্ক। এজেন্ট এবং ডেটার মালিক কি একই নাকি আলাদা? এই পছন্দটি নির্ধারণ করে যে প্রমাণীকরণের কোন স্তরগুলি প্রয়োজন এবং কাজটি সম্পন্ন করা কতটা চ্যালেঞ্জিং।

জিরো-পার্টি এজেন্ট

একটি জিরো-পার্টি এজেন্ট হল একটি ব্রাউজার-ভিত্তিক বা অপারেটিং সিস্টেম-ভিত্তিক যা স্থানীয় ডেটা ব্যবহার করে স্থানীয় প্রেক্ষাপটে কাজ করে। যেহেতু ব্রাউজার এবং অপারেটিং সিস্টেমগুলি কাস্টম ব্যবহারকারীর পছন্দগুলি সংরক্ষণ করে যা ব্যক্তিগতভাবে সনাক্তযোগ্য তথ্য (PII) হিসাবে বিবেচিত হতে পারে, তাই একটি জিরো-পার্টি এজেন্ট অন্যান্য পক্ষের সাথে এই ডেটা ভাগ করে নেওয়ার ক্রিয়াকলাপগুলিকে প্রতিরোধ করতে পারে।

প্রথম পক্ষের এজেন্ট

প্রথম পক্ষের এজেন্ট হলো যখন টুল এবং তথ্য একই পক্ষের মালিকানাধীন থাকে, যাতে ডেভেলপাররা টুলের মালিকানা এবং সহায়তা পেতে পারে, তথ্যের অ্যাক্সেস এবং কনফিগারেশন পরিচালনা করতে পারে।

উদাহরণস্বরূপ, ধরুন আপনি একজন ব্যবহারকারী যিনি টরন্টোতে ছুটি কাটানোর পরিকল্পনা করছেন এবং আপনি ভ্রমণের জন্য স্থানগুলির একটি তালিকা তৈরি করতে চান। গুগল ম্যাপস দ্বারা সরবরাহিত একজন এজেন্ট আপনার পক্ষে আকর্ষণীয় স্থানগুলির একটি তালিকা তৈরি করার জন্য মানদণ্ড এবং ডেটার একটি সেট নিতে পারে, যা মানচিত্রে প্রতিটি আইটেম চিহ্নিত করে। এটিকে প্রথম পক্ষের এজেন্ট হিসাবে বিবেচনা করা যেতে পারে কারণ এজেন্টটি গুগল দ্বারা সরবরাহিত হয়, যার কাছে লগ-ইন করা ব্যবহারকারীর দ্বারা সঞ্চিত মানচিত্রের ডেটা এবং অন্যান্য ব্যক্তিগত পছন্দের মালিকানাও রয়েছে।

তৃতীয় পক্ষের এজেন্ট

একটি তৃতীয় পক্ষের এজেন্ট একজন বহিরাগত ডেভেলপার বা প্রতিষ্ঠান দ্বারা তৈরি করা হয় এবং এটি বহিরাগত পরিষেবাগুলি থেকে ফাংশন এবং ডেটা অফার করে। উদাহরণস্বরূপ, আপনি আপনার ওয়েবসাইটে একটি ইভেন্ট-ভিত্তিক বৈশিষ্ট্য সমর্থন করার জন্য একটি তৃতীয় পক্ষের ক্যালেন্ডার প্রদানকারী চাইতে পারেন। আপনি এই এজেন্টদের জন্য সরঞ্জামগুলি অফার করতে পারেন, যেমন WebMCP, অথবা এজেন্টগুলিকে আপনার কর্মপ্রবাহে একীভূত করতে পারেন (ধরে নিলে তারা আপনার গোপনীয়তা পর্যালোচনায় উত্তীর্ণ হবে)।

একটি তৃতীয় পক্ষের এজেন্ট সম্ভবত একই ম্যাপিং কাজটি সম্পন্ন করতে পারে, যখন এটি একটি এক্সটেনশন হিসাবে তৈরি করা হয়।

ডেভেলপাররা এমন একটি এজেন্ট তৈরি করতে পারেন যা তালিকা তৈরির জন্য নির্দিষ্ট উৎসের উপর নির্ভর করে, যেমন স্থানীয় সংবাদপত্র থেকে সেরা রেস্তোরাঁগুলি ক্যাপচার করা। এই এজেন্টের স্থানীয় সংবাদপত্রের সাইটগুলিতে পড়ার অ্যাক্সেসের পাশাপাশি তালিকা তৈরির সরঞ্জাম, তা গুগল ম্যাপ বা বিকল্প পরিষেবা, পড়ার এবং লেখার অ্যাক্সেসের প্রয়োজন হবে। এর জন্য সম্মতি এবং অনুমতির কয়েকটি স্তরের প্রয়োজন হবে, পাশাপাশি সাইটগুলির সাথে ইন্টারঅ্যাক্ট করার জন্য নির্দিষ্ট সরঞ্জামগুলির প্রয়োজন হবে (যেমন একটি নাট্যকার সরঞ্জাম )।

সম্ভবত আপনার ওয়েবসাইট বা ওয়েব অ্যাপ্লিকেশনটি কোনও এজেন্টের জন্য তৃতীয় পক্ষের তথ্য সরবরাহকারী হতে পারে। এই ক্ষেত্রে, আপনি এমন একটি অনুমতি কাঠামো অফার করতে চাইতে পারেন যা এজেন্ট এবং মানুষের জন্য আপনার সাথে কাজগুলি সম্পন্ন করা সম্ভব করে তোলে।

টেকওয়েস

এখন যেহেতু আপনি এজেন্টদের কাজ করার পদ্ধতি সম্পর্কে ভালোভাবে বুঝতে পেরেছেন, তাই আপনি সিদ্ধান্ত নিতে পারেন যে আপনার ওয়েবসাইট কীভাবে তাদের সর্বোত্তমভাবে সহায়তা করতে পারে।

আপনার ওয়েবসাইট এবং ওয়েব অ্যাপ্লিকেশনের এজেন্টদের সাথে মিথস্ক্রিয়াকে সমর্থন করার জন্য আমরা কার্যকর সেরা অনুশীলনগুলি সহ এই সিরিজটি আপডেট করতে থাকব।