ขอขอบคุณที่ติดตาม Google I/O ดูเนื้อหาตามคำขอ

เลือกแพลตฟอร์มของคุณ

ก่อนที่จะสร้างด้วย AI คุณต้องเลือกแพลตฟอร์มที่จะโฮสต์ ตัวเลือกของคุณส่งผลต่อความเร็ว ต้นทุน ความสามารถในการปรับขนาด และความน่าเชื่อถือของระบบ AI คุณสามารถเลือกได้ระหว่าง:

AI ฝั่งไคลเอ็นต์: ทำงานในเบราว์เซอร์โดยตรง ซึ่งหมายความว่าข้อมูลจะยังคงเป็นส่วนตัวอยู่ในอุปกรณ์ของผู้ใช้ และไม่มีเวลาในการตอบสนองของเครือข่าย อย่างไรก็ตาม AI ฝั่งไคลเอ็นต์ต้องมี Use Case ที่เฉพาะเจาะจงและกำหนดไว้อย่างดีจึงจะทำงานได้ดี
AI ฝั่งเซิร์ฟเวอร์: ทำงานในระบบคลาวด์ มีความสามารถสูงและปรับขนาดได้ แต่ มีราคาแพงกว่าในแง่ของเวลาในการตอบสนองและค่าใช้จ่าย

แต่ละตัวเลือกมีข้อดีและข้อเสียต่างกัน และการตั้งค่าที่เหมาะสมจะขึ้นอยู่กับกรณีการใช้งาน ทักษะของทีม และทรัพยากร เช่น คุณอาจเสนอเครื่องมือสรุปที่ทำงานในเครื่องเพื่อให้ผู้ใช้ถามคำถามส่วนตัวได้โดยไม่ต้องจัดการข้อมูลส่วนบุคคลที่ระบุตัวบุคคลนั้นได้ (PII) อย่างไรก็ตาม เจ้าหน้าที่ฝ่ายสนับสนุนลูกค้าอาจให้คำตอบที่เป็นประโยชน์มากขึ้นได้โดยใช้โมเดลบนระบบคลาวด์ที่มีสิทธิ์เข้าถึงฐานข้อมูลขนาดใหญ่ของแหล่งข้อมูล

ในโมดูลนี้ คุณจะได้ศึกษาวิธีทำสิ่งต่อไปนี้

เปรียบเทียบข้อดีข้อเสียระหว่าง AI ฝั่งไคลเอ็นต์และฝั่งเซิร์ฟเวอร์
เลือกแพลตฟอร์มให้ตรงกับกรณีการใช้งานและความสามารถของทีม
ออกแบบระบบไฮบริดที่มี AI ทั้งในไคลเอ็นต์และเซิร์ฟเวอร์เพื่อให้เติบโตไปพร้อมกับผลิตภัณฑ์ของคุณ

ตรวจสอบตัวเลือก

สำหรับการติดตั้งใช้งาน ให้พิจารณาแพลตฟอร์ม AI ตามแกนหลัก 2 แกน โดยมีตัวเลือกดังต่อไปนี้

ตำแหน่งที่โมเดลทํางาน: โมเดลทํางานฝั่งไคลเอ็นต์หรือฝั่งเซิร์ฟเวอร์
ความสามารถในการปรับแต่ง: คุณสามารถควบคุมความรู้และความสามารถของโมเดลได้มากน้อยเพียงใด หากควบคุมโมเดลได้ ซึ่งหมายความว่าคุณสามารถแก้ไขน้ำหนักของโมเดลได้ คุณจะปรับแต่งลักษณะการทำงานของโมเดลให้ตรงกับข้อกำหนดเฉพาะได้

ตัวอย่างโมเดลตามแพลตฟอร์มและการควบคุม — รูปที่ 1: ตัวเลือกแพลตฟอร์ม AI ที่จำแนกตามแพลตฟอร์มการ ติดตั้งใช้งานและระดับการควบคุม

AI ฝั่งไคลเอ็นต์

AI ฝั่งไคลเอ็นต์จะทำงานในเบราว์เซอร์ และการคำนวณจะเกิดขึ้นในอุปกรณ์ของผู้ใช้ คุณไม่จำเป็นต้องจัดสรรการประมวลผลในช่วงเวลาอนุมาน และข้อมูลจะยังคงอยู่ในเครื่องของผู้ใช้ ซึ่งทำให้ WebAssembly ทำงานได้รวดเร็ว เป็นส่วนตัว และเหมาะสำหรับประสบการณ์การใช้งานแบบอินเทอร์แอกทีฟที่ใช้ทรัพยากรน้อย

อย่างไรก็ตาม โมเดลฝั่งไคลเอ็นต์มักมีขนาดเล็กมาก ซึ่งอาจจำกัดความสามารถและประสิทธิภาพของโมเดล เหมาะสำหรับงานที่มีความเฉพาะเจาะจงสูง เช่น การตรวจหาความเป็นพิษหรือการวิเคราะห์ความรู้สึก โดยมักจะเป็นงาน AI แบบคาดการณ์ที่มีพื้นที่เอาต์พุตจำกัด

คุณมี 2 ตัวเลือกหลักๆ ดังนี้

AI ในตัว: เบราว์เซอร์ เช่น Google Chrome และ Microsoft Edge กำลังผสานรวมโมเดล AI โดยสามารถเข้าถึงได้ผ่านการเรียกใช้ JavaScript โดยไม่ต้องตั้งค่าหรือโฮสต์ เมื่อดาวน์โหลดโมเดลแล้ว ทุกเว็บไซต์ที่ใช้โมเดลดังกล่าวจะเรียกใช้ได้
โมเดลที่กำหนดเอง: คุณสามารถใช้ไลบรารีฝั่งไคลเอ็นต์ เช่น Transformers.js และ MediaPipe เพื่อ ผสานรวมโมเดลเข้ากับแอปพลิเคชัน ซึ่งหมายความว่าคุณสามารถควบคุมน้ำหนักของโมเดลได้ แต่ก็หมายความว่าผู้ใช้เว็บไซต์ทุกคนต้องดาวน์โหลดโมเดลที่กำหนดเอง แม้แต่โมเดล AI ที่เล็กที่สุดก็มีขนาดใหญ่ในบริบทของเว็บไซต์

AI ฝั่งเซิร์ฟเวอร์

เมื่อใช้ AI ฝั่งเซิร์ฟเวอร์ เว็บแอปพลิเคชันจะเรียก API เพื่อส่งอินพุตไปยังโมเดล AI และรับเอาต์พุต การตั้งค่านี้รองรับโมเดลที่ใหญ่ขึ้นและซับซ้อนมากขึ้น และไม่ขึ้นอยู่กับฮาร์ดแวร์ของผู้ใช้

AI ฝั่งเซิร์ฟเวอร์มี 2 หมวดหมู่ ดังนี้

บริการที่มีการจัดการ: โมเดลเหล่านี้โฮสต์อยู่ในศูนย์ข้อมูลโดยบุคคลที่สาม เช่น Gemini 3 และ GPT-5 เจ้าของโมเดลจะให้ API เพื่อเข้าถึงโมเดล ซึ่งหมายความว่าคุณสามารถใช้โมเดลที่ล้ำสมัยที่สุดได้โดยมีการตั้งค่าเพียงเล็กน้อย โมเดลเหล่านี้เหมาะสำหรับ การสร้างต้นแบบอย่างรวดเร็ว การสนทนาแบบปลายเปิด และการให้เหตุผลแบบอเนกประสงค์ อย่างไรก็ตาม การปรับขนาดในบริการที่มีการจัดการอาจมีค่าใช้จ่ายสูง
โมเดลที่โฮสต์ด้วยตนเอง: คุณสามารถติดตั้งใช้งานโมเดลแบบโอเพนเวท เช่น Gemma หรือ Llama ในโครงสร้างพื้นฐานของคุณเอง หรือในคอนเทนเนอร์ที่มีการจัดการ เช่น Vertex AI หรือ Hugging Face Inference ซึ่งหมายความว่าคุณจะได้รับประโยชน์จากการฝึกเบื้องต้นที่ผู้สร้างโมเดลทำไว้ แต่คุณยังคงควบคุมโมเดล ข้อมูลการปรับแต่ง และประสิทธิภาพได้

เลือกแพลตฟอร์มเริ่มต้น

ตรวจสอบลักษณะทางสถาปัตยกรรมของแพลตฟอร์ม AI และวิเคราะห์ ข้อดีข้อเสียเพื่อตัดสินใจเกี่ยวกับการตั้งค่าเริ่มต้น

กำหนดข้อกำหนดด้านสถาปัตยกรรม

ทุกการตัดสินใจต้องมีการประนีประนอม ดูคุณลักษณะสำคัญที่กำหนดต้นทุนและมูลค่าของแพลตฟอร์ม AI

ความสามารถของโมเดล: ประสิทธิภาพของโมเดลในกลุ่มผู้ใช้และ งานที่หลากหลายโดยไม่ต้องปรับแต่ง ซึ่งมักจะสัมพันธ์กับขนาดโมเดล
ความสามารถในการปรับแต่ง: ระดับที่คุณสามารถปรับแต่ง แก้ไข หรือควบคุม ลักษณะการทำงานและสถาปัตยกรรมของโมเดล
ความแม่นยำ: คุณภาพและความน่าเชื่อถือโดยรวมของการคาดการณ์ หรือการสร้างของโมเดล
ความเป็นส่วนตัว: ระดับที่ข้อมูลผู้ใช้ยังคงอยู่ในเครื่องและอยู่ภายใต้การควบคุมของผู้ใช้
ต้นทุนคงที่: ค่าใช้จ่ายที่เกิดซ้ำซึ่งจำเป็นต่อการใช้งานระบบ AI โดยไม่คำนึงถึงการใช้งาน รวมถึงการจัดสรรและการบำรุงรักษาโครงสร้างพื้นฐาน
ต้นทุนต่อคำขอ: ต้นทุนเพิ่มเติมของคำขอขาเข้าแต่ละรายการ
ความเข้ากันได้: วิธีการทำงานของแนวทางในเบราว์เซอร์ อุปกรณ์ และสภาพแวดล้อมต่างๆ โดยไม่มีตรรกะสำรอง
ความสะดวกของผู้ใช้: ผู้ใช้ต้องทำตามขั้นตอนเพิ่มเติมเพื่อใช้ระบบ AI หรือไม่ เช่น การดาวน์โหลดโมเดล
ความสะดวกของนักพัฒนาแอป: ความรวดเร็วและง่ายดายในการ ติดตั้งใช้งาน ผสานรวม และบำรุงรักษาโมเดลสำหรับนักพัฒนาแอปส่วนใหญ่ โดยไม่ต้องมีความเชี่ยวชาญด้าน AI โดยเฉพาะ

ตารางต่อไปนี้แสดงตัวอย่างค่าประมาณของประสิทธิภาพของแต่ละแพลตฟอร์ม สำหรับแต่ละเกณฑ์ โดย 1 คือต่ำสุด และ 5 คือสูงสุด

เกณฑ์	ไคลเอ็นต์		เซิร์ฟเวอร์
	AI ในตัวหรือในอุปกรณ์	โมเดลที่กำหนดเอง	บริการที่มีการจัดการ	รูปแบบการโฮสต์ด้วยตนเอง
พลังของโมเดล	ทำไมถึงให้คะแนนพลังของโมเดล 2 ดาว AI ในตัวและในอุปกรณ์ใช้โมเดลเบราว์เซอร์ขนาดเล็กที่โหลดไว้ล่วงหน้าซึ่งได้รับการเพิ่มประสิทธิภาพสำหรับฟีเจอร์เฉพาะงานที่จำกัด แทนที่จะเป็นการสนทนาหรือการให้เหตุผลแบบเปิด	ทำไมถึงให้คะแนนความสามารถของโมเดล 3 ดาว ไลบรารีฝั่งไคลเอ็นต์ที่กำหนดเองมีความยืดหยุ่นมากกว่า AI ในตัว แต่คุณยังคงถูกจำกัดด้วยขนาดการดาวน์โหลด ขีดจำกัดของหน่วยความจำ และฮาร์ดแวร์ของผู้ใช้	ทำไมจึงให้คะแนนพลังของโมเดล 4 ดาว บริการที่มีการจัดการและการโฮสต์ด้วยตนเองช่วยให้คุณเข้าถึงโมเดลขนาดใหญ่ที่ทันสมัย ซึ่งมีความสามารถในการให้เหตุผลที่ซับซ้อน การจัดการบริบทที่ยาว และครอบคลุมงานในวงกว้าง
ความสามารถในการปรับแต่ง	เหตุใดจึงให้ 1 ดาวสำหรับการปรับแต่ง โมเดลในตัวไม่อนุญาตให้เข้าถึงน้ำหนักของโมเดลหรือข้อมูลการฝึก วิธีหลักในการปรับแต่งลักษณะการทำงานของโมเดลคือการใช้พรอมต์วิศวกรรม	เหตุใดจึงให้ 5 ดาวสำหรับการปรับแต่ง ตัวเลือกนี้ช่วยให้คุณควบคุมการเลือกโมเดลและน้ำหนักได้ ไลบรารีฝั่งไคลเอ็นต์หลายรายการยังอนุญาตให้ปรับแต่งและฝึกโมเดลด้วย	เหตุใดจึงให้ 1 ดาวสำหรับการปรับแต่ง บริการที่มีการจัดการจะแสดงโมเดลที่มีประสิทธิภาพ แต่ให้การควบคุมพฤติกรรมภายในของโมเดลน้อยที่สุด โดยปกติแล้ว การปรับแต่งจะจำกัดอยู่แค่การแจ้งและบริบทอินพุต	เหตุใดจึงให้ 5 ดาวสำหรับความสามารถในการปรับแต่ง โมเดลที่โฮสต์ด้วยตนเองช่วยให้คุณควบคุมน้ำหนักของโมเดล ข้อมูลการฝึก การปรับแต่ง และการกำหนดค่าการติดตั้งใช้งานได้อย่างเต็มที่
ความแม่นยำ	เหตุใดจึงให้คะแนนความถูกต้อง 2 ดาว ความแม่นยำในโมเดลในตัวเพียงพอสำหรับงานที่มีขอบเขตชัดเจน แต่ขนาดโมเดลที่จำกัดและการสรุปทั่วไปจะลดความน่าเชื่อถือสำหรับอินพุตที่ซับซ้อนหรือมีความแตกต่างเล็กน้อย	เหตุใดจึงให้คะแนนความถูกต้อง 3 ดาว คุณสามารถปรับปรุงความแม่นยำของโมเดลฝั่งไคลเอ็นต์ที่กำหนดเองได้ในกระบวนการเลือกโมเดล อย่างไรก็ตาม ยังคงมีข้อจำกัดด้านขนาดโมเดล การหาปริมาณ และความแปรปรวนของฮาร์ดแวร์ไคลเอ็นต์	เหตุใดจึงต้องให้คะแนนความถูกต้อง 5 ดาว โดยปกติแล้ว บริการที่มีการจัดการจะมีความแม่นยำค่อนข้างสูง ซึ่งเป็นผลมาจากโมเดลขนาดใหญ่ ข้อมูลการฝึกที่ครอบคลุม และการปรับปรุงอย่างต่อเนื่องของผู้ให้บริการ	เหตุใดจึงให้คะแนนความถูกต้อง 4 ดาว ความแม่นยำอาจสูง แต่ขึ้นอยู่กับโมเดลที่เลือกและความพยายามในการปรับแต่ง ประสิทธิภาพอาจช้ากว่าบริการที่มีการจัดการ
เวลาในการตอบสนองของเครือข่าย	ทำไมเวลาในการตอบสนองของเครือข่ายจึงได้ 5 ดาว การประมวลผลเกิดขึ้นในอุปกรณ์ของผู้ใช้โดยตรง		ทำไมเวลาในการตอบสนองของเครือข่ายจึงได้ 2 ดาว มีการรับส่งข้อมูลแบบไปกลับไปยังเซิร์ฟเวอร์
ความเป็นส่วนตัว	เหตุใดจึงให้คะแนนความเป็นส่วนตัว 5 ดาว ข้อมูลผู้ใช้ควรอยู่ในอุปกรณ์โดยค่าเริ่มต้น ซึ่งจะช่วยลดการเปิดเผยข้อมูลและลดความซับซ้อนในการปฏิบัติตามข้อกำหนดด้านความเป็นส่วนตัว		เหตุใดจึงให้คะแนนความเป็นส่วนตัว 2 ดาว ต้องส่งข้อมูลที่ผู้ใช้ป้อนไปยังเซิร์ฟเวอร์ภายนอก ซึ่งจะเพิ่มการเปิดเผยข้อมูลและข้อกำหนดด้านการปฏิบัติตามข้อกำหนด อย่างไรก็ตาม มีโซลูชันเฉพาะเพื่อลดปัญหาด้านความเป็นส่วนตัว เช่น Private AI Compute	เหตุใดจึงให้คะแนนความเป็นส่วนตัว 3 ดาว ข้อมูลจะยังอยู่ภายใต้การควบคุมขององค์กร แต่จะออกจากอุปกรณ์ของผู้ใช้และต้องมีการจัดการที่ปลอดภัยและมาตรการการปฏิบัติตามข้อกำหนด
ค่าธรรมเนียมคงที่	เหตุใดจึงให้ 5 ดาวสำหรับต้นทุนคงที่ โมเดลจะทำงานในอุปกรณ์ที่มีอยู่ของผู้ใช้ จึงไม่มีค่าใช้จ่ายด้านโครงสร้างพื้นฐานเพิ่มเติม		เหตุใดจึงให้ 5 ดาวสำหรับต้นทุนคงที่ API ส่วนใหญ่จะเรียกเก็บเงินตามการใช้งาน จึงไม่มีต้นทุนคงที่	เหตุใดจึงให้ 2 ดาวสำหรับต้นทุนคงที่ ต้นทุนคงที่รวมถึงโครงสร้างพื้นฐาน การบำรุงรักษา และค่าใช้จ่ายในการดำเนินงาน
ต้นทุนต่อคำขอ	เหตุใดจึงให้คะแนน 5 ดาวสำหรับต้นทุนต่อคำขอ ไม่มีค่าใช้จ่ายต่อคำขอเนื่องจากระบบจะเรียกใช้การอนุมานในอุปกรณ์ของผู้ใช้		เหตุใดจึงให้ 2 ดาวสำหรับต้นทุนต่อคำขอ บริการที่มีการจัดการมักจะมีราคาต่อคำขอ ค่าใช้จ่ายในการปรับขนาดอาจเพิ่มขึ้นอย่างมาก โดยเฉพาะเมื่อมีการเข้าชมสูง	เหตุใดจึงให้ 3 ดาวสำหรับต้นทุนต่อคำขอ ไม่มีค่าใช้จ่ายต่อคำขอโดยตรง แต่ค่าใช้จ่ายต่อคำขอที่มีประสิทธิภาพจะขึ้นอยู่กับการใช้โครงสร้างพื้นฐาน
ความเข้ากันได้	เหตุใดจึงให้คะแนนความเข้ากันได้ 2 ดาว ความพร้อมใช้งานจะแตกต่างกันไปตามเบราว์เซอร์และอุปกรณ์ ซึ่งต้องมีการสำรองข้อมูลสำหรับสภาพแวดล้อมที่ไม่รองรับ	ทำไมจึงให้คะแนนความเข้ากันได้ 1 ดาว ความเข้ากันได้ขึ้นอยู่กับความสามารถของฮาร์ดแวร์และการรองรับรันไทม์ ซึ่งจำกัดการเข้าถึงในอุปกรณ์ต่างๆ	เหตุใดจึงให้คะแนนความเข้ากันได้ 5 ดาว แพลตฟอร์มฝั่งเซิร์ฟเวอร์เข้ากันได้กับผู้ใช้ทุกรายในวงกว้าง เนื่องจากมีการอนุมานฝั่งเซิร์ฟเวอร์และไคลเอ็นต์ใช้เพียง API
ความสะดวกของผู้ใช้	เหตุใดจึงให้ 3 ดาวสำหรับความสะดวกของผู้ใช้ โดยทั่วไปแล้วฟีเจอร์นี้จะทำงานได้อย่างราบรื่นเมื่อพร้อมใช้งาน แต่ AI ในตัวต้องมีการดาวน์โหลดโมเดลเริ่มต้นและการรองรับเบราว์เซอร์	เหตุใดจึงให้ 2 ดาวสำหรับความสะดวกของผู้ใช้ ผู้ใช้อาจพบความล่าช้าเนื่องจากการดาวน์โหลดหรือฮาร์ดแวร์ที่ไม่รองรับ	เหตุใดจึงให้ 4 ดาวสำหรับความสะดวกของผู้ใช้ ใช้งานได้ทันทีโดยไม่ต้องดาวน์โหลดหรือมีข้อกำหนดของอุปกรณ์ จึงมอบประสบการณ์การใช้งานที่ราบรื่นให้แก่ผู้ใช้ อย่างไรก็ตาม อาจเกิดความล่าช้าหากการเชื่อมต่อเครือข่ายไม่ดี
ความสะดวกของนักพัฒนาแอป	เหตุใดจึงให้ 5 ดาวเพื่อความสะดวกของนักพัฒนาแอป AI ในตัวต้องมีการตั้งค่าเพียงเล็กน้อย ไม่ต้องมีโครงสร้างพื้นฐาน และไม่ต้องมีความเชี่ยวชาญด้าน AI มากนัก จึงผสานรวมและบำรุงรักษาได้ง่าย	เหตุใดจึงให้ 2 ดาวเพื่อความสะดวกของนักพัฒนาแอป ต้องมีการจัดการโมเดล รันไทม์ การเพิ่มประสิทธิภาพ และความเข้ากันได้ในอุปกรณ์ต่างๆ	เหตุใดจึงให้ 4 ดาวสำหรับความสะดวกของนักพัฒนาแอป บริการที่มีการจัดการช่วยลดความซับซ้อนในการติดตั้งใช้งานและการปรับขนาด อย่างไรก็ตาม คุณยังคงต้องผสานรวม API, จัดการค่าใช้จ่าย และทำวิศวกรรมพรอมต์	เหตุใดจึงให้ 1 ดาวเพื่อความสะดวกของนักพัฒนาแอป การติดตั้งใช้งานฝั่งเซิร์ฟเวอร์ที่กำหนดเองต้องอาศัยความเชี่ยวชาญอย่างมากในด้านโครงสร้างพื้นฐาน การจัดการโมเดล การตรวจสอบ และการเพิ่มประสิทธิภาพ
ความพยายามในการบำรุงรักษา	เหตุใดจึงให้คะแนนความพยายามในการบำรุงรักษา 4 ดาว เบราว์เซอร์จะจัดการการอัปเดตและการเพิ่มประสิทธิภาพโมเดล แต่นักพัฒนาแอปต้องปรับตัวให้เข้ากับความพร้อมให้บริการที่เปลี่ยนแปลงไป	เหตุใดจึงให้คะแนนความพยายามในการบำรุงรักษา 2 ดาว ต้องมีการอัปเดตโมเดล การปรับแต่งประสิทธิภาพ และความเข้ากันได้อย่างต่อเนื่องเมื่อเบราว์เซอร์และอุปกรณ์มีการพัฒนา	เหตุใดจึงให้ 5 ดาวสำหรับความพยายามในการบำรุงรักษา ผู้ให้บริการจะเป็นผู้จัดการการบำรุงรักษา	เหตุใดจึงให้คะแนนความพยายามในการบำรุงรักษา 2 ดาว ต้องมีการบำรุงรักษาอย่างต่อเนื่อง ซึ่งรวมถึงการอัปเดตโมเดล การจัดการโครงสร้างพื้นฐาน การปรับขนาด และความปลอดภัย

ปัจจัยอื่นๆ ตามสถานการณ์

วิเคราะห์ข้อดีข้อเสีย

เราจะเพิ่มฟีเจอร์อีกอย่างลงใน Example Shoppe ซึ่งเป็นแพลตฟอร์มอีคอมเมิร์ซขนาดกลาง เพื่อแสดงให้เห็นกระบวนการตัดสินใจ คุณสนใจที่จะประหยัดค่าใช้จ่ายในการบริการลูกค้านอกเวลาทำการ จึงตัดสินใจสร้างผู้ช่วยที่ทำงานด้วยระบบ AI เพื่อตอบคำถามของผู้ใช้เกี่ยวกับการสั่งซื้อ การคืนสินค้า และผลิตภัณฑ์

รูปที่ 2 ในโมดูลนี้ เราจะมุ่งเน้นที่เลเยอร์ข้อมูลและเลเยอร์อัจฉริยะของพิมพ์เขียวระบบ AI สำหรับ Example Shoppe เป็นหลัก
คุณสามารถดูพิมพ์เขียวระบบ AI ฉบับเต็ม ซึ่งมีโอกาสและโซลูชัน

วิเคราะห์สถานการณ์โดยใช้ 2 มุมมอง ได้แก่ ข้อกำหนดของกรณีการใช้งานและข้อจำกัดทางธุรกิจ หรือข้อจำกัดของทีม

ข้อกำหนดของ Use Case
ข้อกำหนด	การวิเคราะห์	เกณฑ์	ผลกระทบ
ความแม่นยำสูงและใช้งานได้หลากหลาย	ผู้ใช้ถามคำถามที่ซับซ้อนต่างๆ เกี่ยวกับคำสั่งซื้อ ผลิตภัณฑ์ และการคืนสินค้า	ความสามารถและความแม่นยำของโมเดล	ต้องใช้โมเดลภาษาขนาดใหญ่ (LLM)
ความเฉพาะเจาะจงของข้อมูล	โดยจะต้องตอบคำถามที่เฉพาะเจาะจงเกี่ยวกับข้อมูลบริษัท ผลิตภัณฑ์ และนโยบาย	ความสามารถในการปรับแต่ง	ต้องมีการนำเข้าข้อมูล เช่น RAG แต่ไม่ต้องมีการปรับแต่งโมเดล

ข้อจำกัดทางธุรกิจหรือทีม
ข้อกำหนด	การวิเคราะห์	เกณฑ์	ผลกระทบ
ฐานผู้ใช้	ผู้ใช้หลายแสนราย	ความสามารถในการปรับขนาด ความเข้ากันได้	ต้องมีสถาปัตยกรรมที่รองรับการเข้าชมจำนวนมากและเชื่อถือได้
สิ่งที่ควรโฟกัสหลังเปิดตัว	ทีมจะย้ายไปทำโปรเจ็กต์อื่นๆ หลังจากเปิดตัวเวอร์ชัน 1	ความพยายามในการบำรุงรักษา	ต้องการโซลูชันที่ต้องมีการบำรุงรักษาอย่างต่อเนื่องน้อยที่สุด
ความเชี่ยวชาญของทีม	นักพัฒนาเว็บที่มีความสามารถ แต่มีความเชี่ยวชาญด้าน AI/ML น้อย	ความสะดวกของนักพัฒนาแอป	โซลูชันต้องติดตั้งใช้งานและผสานรวมได้ง่ายโดยไม่ต้องมีทักษะด้าน AI เฉพาะทาง

เมื่อจัดลําดับความสําคัญของเกณฑ์แล้ว คุณสามารถดูตารางการประมาณการแลกเปลี่ยนเพื่อพิจารณาว่าแพลตฟอร์มใดตรงกับเกณฑ์ที่มีลําดับความสําคัญสูงสุด

เกณฑ์ที่มีลำดับความสำคัญ	ผู้ชนะบนแพลตฟอร์ม
พลังของโมเดล	ฝั่งเซิร์ฟเวอร์
ความสามารถในการปรับแต่ง	ฝั่งเซิร์ฟเวอร์: รูปแบบที่โฮสต์ด้วยตนเอง
ความสะดวกของนักพัฒนาแอป	ฝั่งเซิร์ฟเวอร์: บริการที่มีการจัดการ
ความพยายามในการบำรุงรักษา	ฝั่งเซิร์ฟเวอร์: บริการที่มีการจัดการ
ความเข้ากันได้และความสามารถในการปรับขนาด	ฝั่งเซิร์ฟเวอร์

การวิเคราะห์นี้แสดงให้เห็นอย่างชัดเจนว่าคุณควรใช้ AI ฝั่งเซิร์ฟเวอร์และอาจใช้ บริการที่มีการจัดการ ซึ่งเป็นโมเดลที่หลากหลายสำหรับคำถามที่ซับซ้อนของลูกค้า ซึ่งช่วยลดความพยายามในการบำรุงรักษาและการพัฒนาด้วยการส่งต่อโครงสร้างพื้นฐาน คุณภาพของโมเดล และเวลาทำงานไปยังผู้ให้บริการ

แม้ว่าการปรับแต่งจะจำกัด แต่ก็คุ้มค่าสำหรับทีมพัฒนาเว็บที่มีประสบการณ์ด้านวิศวกรรมโมเดลจำกัด

การตั้งค่าการสร้างที่เพิ่มการดึงข้อมูล (RAG) จะช่วยให้คุณระบุบริบทที่เกี่ยวข้องกับโมเดลในเวลาที่อนุมานได้

AI แบบไฮบริด

ระบบ AI ที่มีประสิทธิภาพมักไม่ได้ทำงานบนแพลตฟอร์มเดียวหรือใช้โมเดลเดียว แต่จะกระจายภาระงาน AI เพื่อเพิ่มประสิทธิภาพการแลกเปลี่ยน

ค้นหาโอกาสสำหรับ AI แบบไฮบริด

เมื่อเปิดตัวแล้ว คุณควรปรับแต่งข้อกำหนดตามข้อมูลและฟีดแบ็กในชีวิตจริง ในตัวอย่างของเรา ซึ่งก็คือ Example Shoppe คุณรอ 2-3 เดือนเพื่อ วิเคราะห์ผลลัพธ์และพบข้อมูลต่อไปนี้

คำขอประมาณ 80% เป็นคำขอที่ซ้ำกัน ("คำสั่งซื้อของฉันอยู่ที่ไหน" "ฉันจะ คืนสินค้าได้อย่างไร") การส่งคำขอเหล่านี้ไปยังบริการที่มีการจัดการจะทำให้เกิดค่าใช้จ่ายและค่าใช้จ่ายเพิ่มเติมจำนวนมาก
มีเพียง 20% ของคำขอเท่านั้นที่ต้องใช้การให้เหตุผลที่ลึกซึ้งยิ่งขึ้นและการสนทนาแบบปลายเปิด แบบอินเทอร์แอกทีฟ

โมเดลน้ำหนักเบาในเครื่องจะจัดประเภทอินพุตของผู้ใช้และตอบคำค้นหาที่ใช้เป็นประจำ เช่น "นโยบายคืนสินค้าของคุณคืออะไร" คุณสามารถกำหนดเส้นทางคำถามที่ซับซ้อน ไม่ค่อยพบ หรือไม่ชัดเจนไปยังโมเดลฝั่งเซิร์ฟเวอร์ได้

การใช้ AI ทั้งฝั่งเซิร์ฟเวอร์และฝั่งไคลเอ็นต์จะช่วยลดต้นทุนและความ หน่วงเวลา พร้อมทั้งยังคงสิทธิ์เข้าถึงการให้เหตุผลที่มีประสิทธิภาพเมื่อจำเป็น

กระจายภาระงาน

หากต้องการสร้างระบบไฮบริดนี้สำหรับ Example Shoppe คุณควรเริ่มด้วยการกำหนด ระบบเริ่มต้น ในกรณีนี้ คุณควรเริ่มที่ฝั่งไคลเอ็นต์ แอปพลิเคชัน ควรกำหนดเส้นทางไปยัง AI ฝั่งเซิร์ฟเวอร์ใน 2 กรณีต่อไปนี้

การสำรองข้อมูลตามความเข้ากันได้: หากอุปกรณ์หรือเบราว์เซอร์ของผู้ใช้จัดการคำขอไม่ได้ ระบบควรสำรองข้อมูลไปยังเซิร์ฟเวอร์
การส่งต่อตามความสามารถ: หากคำขอมีความซับซ้อนมากเกินไปหรือเป็นคำขอแบบเปิด สำหรับโมเดลฝั่งไคลเอ็นต์ตามที่กำหนดไว้ในเกณฑ์ที่กำหนดไว้ล่วงหน้า ควรส่งต่อ ไปยังโมเดลฝั่งเซิร์ฟเวอร์ที่ใหญ่กว่า คุณสามารถใช้โมเดลเพื่อจัดประเภทคำขอเป็นคำขอทั่วไป เพื่อให้คุณทำงานฝั่งไคลเอ็นต์ หรือคำขอที่ไม่ธรรมดา และส่งคำขอไปยังระบบฝั่งเซิร์ฟเวอร์ เช่น หาก โมเดลฝั่งไคลเอ็นต์พิจารณาว่าคำถามเกี่ยวข้องกับปัญหาที่พบได้ไม่บ่อย เช่น การขอเงินคืนในสกุลเงินอื่น

ความยืดหยุ่นทำให้เกิดความซับซ้อนมากขึ้น

การกระจายภาระงานระหว่าง 2 แพลตฟอร์มจะช่วยให้คุณมีความยืดหยุ่นมากขึ้น แต่ก็เพิ่มความซับซ้อนด้วยเช่นกัน

การประสานงาน: สภาพแวดล้อมการดำเนินการ 2 แบบหมายถึงชิ้นส่วนที่เคลื่อนไหวมากขึ้น คุณ ต้องมีตรรกะสำหรับการกำหนดเส้นทาง การลองใหม่ และการสำรอง
การควบคุมเวอร์ชัน: หากคุณใช้โมเดลเดียวกันในแพลตฟอร์มต่างๆ โมเดลนั้นจะต้อง เข้ากันได้กับทั้ง 2 สภาพแวดล้อม
การออกแบบพรอมต์และการออกแบบบริบท หากคุณใช้โมเดลที่แตกต่างกันในแต่ละแพลตฟอร์ม คุณจะต้องออกแบบพรอมต์ สำหรับแต่ละแพลตฟอร์ม
การตรวจสอบ: บันทึกและเมตริกจะแยกกันและต้องใช้ความพยายามเพิ่มเติมในการรวม
ความปลอดภัย: คุณกำลังดูแลพื้นที่การโจมตี 2 แห่ง ทั้งอุปกรณ์ปลายทางในเครื่องและในระบบคลาวด์ ต้องได้รับการเสริมความแข็งแกร่ง

นี่เป็นอีกหนึ่งข้อแลกเปลี่ยนที่คุณควรพิจารณา หากมีทีมขนาดเล็กหรือกำลังสร้างฟีเจอร์ที่ไม่จำเป็น คุณอาจไม่ต้องการเพิ่มความซับซ้อนนี้

สิ่งที่ได้เรียนรู้

คาดว่าตัวเลือกแพลตฟอร์มจะมีการเปลี่ยนแปลง เริ่มต้นจากกรณีการใช้งาน ปรับให้สอดคล้องกับประสบการณ์และทรัพยากรของทีม และทำซ้ำเมื่อทั้งผลิตภัณฑ์และความพร้อมใช้งาน AI เติบโตขึ้น งานของคุณคือการค้นหาส่วนผสมที่เหมาะสมระหว่างความเร็ว ความเป็นส่วนตัว และการควบคุม สำหรับผู้ใช้ จากนั้นสร้างโดยมีความยืดหยุ่น วิธีนี้จะช่วยให้คุณปรับตัวตาม ข้อกำหนดที่เปลี่ยนแปลงไปและรับประโยชน์จากการอัปเดตแพลตฟอร์มและโมเดลในอนาคตได้

แหล่งข้อมูล

เนื่องจากการเลือกแพลตฟอร์มและโมเดลมีความสัมพันธ์กัน โปรดอ่านเพิ่มเติมเกี่ยวกับการเลือกโมเดล
อ่านวิธีก้าวข้ามระบบคลาวด์ด้วย AI แบบไฮบริดและฝั่งไคลเอ็นต์

ทดสอบความเข้าใจ

อะไรคือ 2 ปัจจัยหลักที่ควรพิจารณาเมื่อเลือกแพลตฟอร์ม AI สำหรับแอปพลิเคชันของคุณ

ภาษาโปรแกรมและเฟรมเวิร์ก

ไม่ถูกต้อง

ค่าใช้จ่ายของโมเดลและความเร็วในการฝึก

เยี่ยมมาก ถูกต้องแล้ว

ตำแหน่งที่โมเดลทำงาน (ในไคลเอ็นต์หรือเซิร์ฟเวอร์) และระดับการควบคุมโมเดล

ไม่ถูกต้อง

ขนาดของทีมพัฒนาและงบประมาณการตลาด

ไม่ถูกต้อง

เมื่อใดที่บริการที่มีการจัดการฝั่งเซิร์ฟเวอร์ เช่น Gemini Pro เป็นตัวเลือกที่ดีที่สุดสำหรับแพลตฟอร์มของคุณ

เมื่อทีมของคุณมีความเชี่ยวชาญด้านแมชชีนเลิร์นนิงอย่างลึกซึ้งและต้องการปรับค่าน้ำหนักด้วยตนเอง

ไม่ถูกต้อง

เมื่อคุณต้องการสร้างต้นแบบอย่างรวดเร็วสำหรับงานการให้เหตุผลที่ซับซ้อนโดยไม่ต้องจัดการโครงสร้างพื้นฐาน

เยี่ยมมาก ถูกต้องแล้ว

เมื่อผู้ใช้ไม่มีการเชื่อมต่ออินเทอร์เน็ต

ไม่ถูกต้อง

เมื่อคุณต้องการเวลาในการตอบสนองที่ต่ำที่สุดเท่าที่จะเป็นไปได้สำหรับเอฟเฟกต์วิดีโอแบบเรียลไทม์

ไม่ถูกต้อง

ประโยชน์หลักของการใช้ระบบ AI แบบไฮบริดคืออะไร

ซึ่งช่วยให้คุณกระจายภาระงานเพื่อเพิ่มประสิทธิภาพการแลกเปลี่ยน เช่น การเรียกใช้งานงานง่ายๆ ในเครื่องเพื่อความเร็ว และงานที่ซับซ้อนในเซิร์ฟเวอร์เพื่อประสิทธิภาพ

เยี่ยมมาก ถูกต้องแล้ว

ซึ่งจะช่วยให้คุณชำระค่าใช้จ่ายทั้งฝั่งไคลเอ็นต์และเซิร์ฟเวอร์เท่ากัน

ไม่ถูกต้อง

ซึ่งบังคับให้ผู้ใช้ดาวน์โหลดโมเดลขนาดใหญ่ทุกครั้งที่เข้าชมเว็บไซต์

ไม่ถูกต้อง

ซึ่งช่วยลดความจำเป็นในการใช้ตรรกะสำรองในโค้ด

ไม่ถูกต้อง

ตรวจสอบตัวเลือก

AI ฝั่งไคลเอ็นต์

AI ฝั่งเซิร์ฟเวอร์

เลือกแพลตฟอร์มเริ่มต้น

กำหนดข้อกำหนดด้านสถาปัตยกรรม

ทำไมถึงให้คะแนนพลังของโมเดล 2 ดาว

ทำไมถึงให้คะแนนความสามารถของโมเดล 3 ดาว

ทำไมจึงให้คะแนนพลังของโมเดล 4 ดาว

เหตุใดจึงให้ 1 ดาวสำหรับการปรับแต่ง

เหตุใดจึงให้ 5 ดาวสำหรับการปรับแต่ง

เหตุใดจึงให้ 1 ดาวสำหรับการปรับแต่ง

เหตุใดจึงให้ 5 ดาวสำหรับความสามารถในการปรับแต่ง

เหตุใดจึงให้คะแนนความถูกต้อง 2 ดาว

เหตุใดจึงให้คะแนนความถูกต้อง 3 ดาว

เหตุใดจึงต้องให้คะแนนความถูกต้อง 5 ดาว

เหตุใดจึงให้คะแนนความถูกต้อง 4 ดาว

ทำไมเวลาในการตอบสนองของเครือข่ายจึงได้ 5 ดาว

ทำไมเวลาในการตอบสนองของเครือข่ายจึงได้ 2 ดาว

เหตุใดจึงให้คะแนนความเป็นส่วนตัว 5 ดาว

เหตุใดจึงให้คะแนนความเป็นส่วนตัว 2 ดาว

เหตุใดจึงให้คะแนนความเป็นส่วนตัว 3 ดาว

เหตุใดจึงให้ 5 ดาวสำหรับต้นทุนคงที่

เหตุใดจึงให้ 5 ดาวสำหรับต้นทุนคงที่

เหตุใดจึงให้ 2 ดาวสำหรับต้นทุนคงที่

เหตุใดจึงให้คะแนน 5 ดาวสำหรับต้นทุนต่อคำขอ

เหตุใดจึงให้ 2 ดาวสำหรับต้นทุนต่อคำขอ

เหตุใดจึงให้ 3 ดาวสำหรับต้นทุนต่อคำขอ

เหตุใดจึงให้คะแนนความเข้ากันได้ 2 ดาว

ทำไมจึงให้คะแนนความเข้ากันได้ 1 ดาว

เหตุใดจึงให้คะแนนความเข้ากันได้ 5 ดาว

เหตุใดจึงให้ 3 ดาวสำหรับความสะดวกของผู้ใช้

เหตุใดจึงให้ 2 ดาวสำหรับความสะดวกของผู้ใช้

เหตุใดจึงให้ 4 ดาวสำหรับความสะดวกของผู้ใช้

เหตุใดจึงให้ 5 ดาวเพื่อความสะดวกของนักพัฒนาแอป

เหตุใดจึงให้ 2 ดาวเพื่อความสะดวกของนักพัฒนาแอป

เหตุใดจึงให้ 4 ดาวสำหรับความสะดวกของนักพัฒนาแอป

เหตุใดจึงให้ 1 ดาวเพื่อความสะดวกของนักพัฒนาแอป

เหตุใดจึงให้คะแนนความพยายามในการบำรุงรักษา 4 ดาว

เหตุใดจึงให้คะแนนความพยายามในการบำรุงรักษา 2 ดาว

เหตุใดจึงให้ 5 ดาวสำหรับความพยายามในการบำรุงรักษา

เหตุใดจึงให้คะแนนความพยายามในการบำรุงรักษา 2 ดาว

วิเคราะห์ข้อดีข้อเสีย

AI แบบไฮบริด

ค้นหาโอกาสสำหรับ AI แบบไฮบริด

กระจายภาระงาน

ความยืดหยุ่นทำให้เกิดความซับซ้อนมากขึ้น

สิ่งที่ได้เรียนรู้

แหล่งข้อมูล

ทดสอบความเข้าใจ