ก่อนที่จะสร้างด้วย AI คุณต้องเลือกแพลตฟอร์มที่จะโฮสต์ ตัวเลือกของคุณส่งผลต่อความเร็ว ต้นทุน ความสามารถในการปรับขนาด และความน่าเชื่อถือของระบบ AI คุณสามารถเลือกได้ระหว่าง:
- AI ฝั่งไคลเอ็นต์: ทำงานในเบราว์เซอร์โดยตรง ซึ่งหมายความว่าข้อมูลจะยังคงเป็นส่วนตัวอยู่ในอุปกรณ์ของผู้ใช้ และไม่มีเวลาในการตอบสนองของเครือข่าย อย่างไรก็ตาม AI ฝั่งไคลเอ็นต์ต้องมี Use Case ที่เฉพาะเจาะจงและกำหนดไว้อย่างดีจึงจะทำงานได้ดี
- AI ฝั่งเซิร์ฟเวอร์: ทำงานในระบบคลาวด์ มีความสามารถสูงและปรับขนาดได้ แต่ มีราคาแพงกว่าในแง่ของเวลาในการตอบสนองและค่าใช้จ่าย
แต่ละตัวเลือกมีข้อดีและข้อเสียต่างกัน และการตั้งค่าที่เหมาะสมจะขึ้นอยู่กับกรณีการใช้งาน ทักษะของทีม และทรัพยากร เช่น คุณอาจเสนอเครื่องมือสรุปที่ทำงานในเครื่องเพื่อให้ผู้ใช้ถามคำถามส่วนตัวได้โดยไม่ต้องจัดการข้อมูลส่วนบุคคลที่ระบุตัวบุคคลนั้นได้ (PII) อย่างไรก็ตาม เจ้าหน้าที่ฝ่ายสนับสนุนลูกค้าอาจให้คำตอบที่เป็นประโยชน์มากขึ้นได้โดยใช้โมเดลบนระบบคลาวด์ที่มีสิทธิ์เข้าถึงฐานข้อมูลขนาดใหญ่ของแหล่งข้อมูล
ในโมดูลนี้ คุณจะได้ศึกษาวิธีทำสิ่งต่อไปนี้
- เปรียบเทียบข้อดีข้อเสียระหว่าง AI ฝั่งไคลเอ็นต์และฝั่งเซิร์ฟเวอร์
- เลือกแพลตฟอร์มให้ตรงกับกรณีการใช้งานและความสามารถของทีม
- ออกแบบระบบไฮบริดที่มี AI ทั้งในไคลเอ็นต์และเซิร์ฟเวอร์เพื่อให้เติบโตไปพร้อมกับผลิตภัณฑ์ของคุณ
ตรวจสอบตัวเลือก
สำหรับการติดตั้งใช้งาน ให้พิจารณาแพลตฟอร์ม AI ตามแกนหลัก 2 แกน โดยมีตัวเลือกดังต่อไปนี้
- ตำแหน่งที่โมเดลทํางาน: โมเดลทํางานฝั่งไคลเอ็นต์หรือฝั่งเซิร์ฟเวอร์
- ความสามารถในการปรับแต่ง: คุณสามารถควบคุมความรู้และความสามารถของโมเดลได้มากน้อยเพียงใด หากควบคุมโมเดลได้ ซึ่งหมายความว่าคุณสามารถแก้ไขน้ำหนักของโมเดลได้ คุณจะปรับแต่งลักษณะการทำงานของโมเดลให้ตรงกับข้อกำหนดเฉพาะได้
AI ฝั่งไคลเอ็นต์
AI ฝั่งไคลเอ็นต์จะทำงานในเบราว์เซอร์ และการคำนวณจะเกิดขึ้นในอุปกรณ์ของผู้ใช้ คุณไม่จำเป็นต้องจัดสรรการประมวลผลในช่วงเวลาอนุมาน และข้อมูลจะยังคงอยู่ในเครื่องของผู้ใช้ ซึ่งทำให้ WebAssembly ทำงานได้รวดเร็ว เป็นส่วนตัว และเหมาะสำหรับประสบการณ์การใช้งานแบบอินเทอร์แอกทีฟที่ใช้ทรัพยากรน้อย
อย่างไรก็ตาม โมเดลฝั่งไคลเอ็นต์มักมีขนาดเล็กมาก ซึ่งอาจจำกัดความสามารถและประสิทธิภาพของโมเดล เหมาะสำหรับงานที่มีความเฉพาะเจาะจงสูง เช่น การตรวจหาความเป็นพิษหรือการวิเคราะห์ความรู้สึก โดยมักจะเป็นงาน AI แบบคาดการณ์ที่มีพื้นที่เอาต์พุตจำกัด
คุณมี 2 ตัวเลือกหลักๆ ดังนี้
- AI ในตัว: เบราว์เซอร์ เช่น Google Chrome และ Microsoft Edge กำลังผสานรวมโมเดล AI โดยสามารถเข้าถึงได้ผ่านการเรียกใช้ JavaScript โดยไม่ต้องตั้งค่าหรือโฮสต์ เมื่อดาวน์โหลดโมเดลแล้ว ทุกเว็บไซต์ที่ใช้โมเดลดังกล่าวจะเรียกใช้ได้
- โมเดลที่กำหนดเอง: คุณสามารถใช้ไลบรารีฝั่งไคลเอ็นต์ เช่น Transformers.js และ MediaPipe เพื่อ ผสานรวมโมเดลเข้ากับแอปพลิเคชัน ซึ่งหมายความว่าคุณสามารถควบคุมน้ำหนักของโมเดลได้ แต่ก็หมายความว่าผู้ใช้เว็บไซต์ทุกคนต้องดาวน์โหลดโมเดลที่กำหนดเอง แม้แต่โมเดล AI ที่เล็กที่สุดก็มีขนาดใหญ่ในบริบทของเว็บไซต์
AI ฝั่งเซิร์ฟเวอร์
เมื่อใช้ AI ฝั่งเซิร์ฟเวอร์ เว็บแอปพลิเคชันจะเรียก API เพื่อส่งอินพุตไปยังโมเดล AI และรับเอาต์พุต การตั้งค่านี้รองรับโมเดลที่ใหญ่ขึ้นและซับซ้อนมากขึ้น และไม่ขึ้นอยู่กับฮาร์ดแวร์ของผู้ใช้
AI ฝั่งเซิร์ฟเวอร์มี 2 หมวดหมู่ ดังนี้
- บริการที่มีการจัดการ: โมเดลเหล่านี้โฮสต์อยู่ในศูนย์ข้อมูลโดยบุคคลที่สาม เช่น Gemini 3 และ GPT-5 เจ้าของโมเดลจะให้ API เพื่อเข้าถึงโมเดล ซึ่งหมายความว่าคุณสามารถใช้โมเดลที่ล้ำสมัยที่สุดได้โดยมีการตั้งค่าเพียงเล็กน้อย โมเดลเหล่านี้เหมาะสำหรับ การสร้างต้นแบบอย่างรวดเร็ว การสนทนาแบบปลายเปิด และการให้เหตุผลแบบอเนกประสงค์ อย่างไรก็ตาม การปรับขนาดในบริการที่มีการจัดการอาจมีค่าใช้จ่ายสูง
- โมเดลที่โฮสต์ด้วยตนเอง: คุณสามารถติดตั้งใช้งานโมเดลแบบโอเพนเวท เช่น Gemma หรือ Llama ในโครงสร้างพื้นฐานของคุณเอง หรือในคอนเทนเนอร์ที่มีการจัดการ เช่น Vertex AI หรือ Hugging Face Inference ซึ่งหมายความว่าคุณจะได้รับประโยชน์จากการฝึกเบื้องต้นที่ผู้สร้างโมเดลทำไว้ แต่คุณยังคงควบคุมโมเดล ข้อมูลการปรับแต่ง และประสิทธิภาพได้
เลือกแพลตฟอร์มเริ่มต้น
ตรวจสอบลักษณะทางสถาปัตยกรรมของแพลตฟอร์ม AI และวิเคราะห์ ข้อดีข้อเสียเพื่อตัดสินใจเกี่ยวกับการตั้งค่าเริ่มต้น
กำหนดข้อกำหนดด้านสถาปัตยกรรม
ทุกการตัดสินใจต้องมีการประนีประนอม ดูคุณลักษณะสำคัญที่กำหนดต้นทุนและมูลค่าของแพลตฟอร์ม AI
- ความสามารถของโมเดล: ประสิทธิภาพของโมเดลในกลุ่มผู้ใช้และ งานที่หลากหลายโดยไม่ต้องปรับแต่ง ซึ่งมักจะสัมพันธ์กับขนาดโมเดล
- ความสามารถในการปรับแต่ง: ระดับที่คุณสามารถปรับแต่ง แก้ไข หรือควบคุม ลักษณะการทำงานและสถาปัตยกรรมของโมเดล
- ความแม่นยำ: คุณภาพและความน่าเชื่อถือโดยรวมของการคาดการณ์ หรือการสร้างของโมเดล
- ความเป็นส่วนตัว: ระดับที่ข้อมูลผู้ใช้ยังคงอยู่ในเครื่องและอยู่ภายใต้การควบคุมของผู้ใช้
- ต้นทุนคงที่: ค่าใช้จ่ายที่เกิดซ้ำซึ่งจำเป็นต่อการใช้งานระบบ AI โดยไม่คำนึงถึงการใช้งาน รวมถึงการจัดสรรและการบำรุงรักษาโครงสร้างพื้นฐาน
- ต้นทุนต่อคำขอ: ต้นทุนเพิ่มเติมของคำขอขาเข้าแต่ละรายการ
- ความเข้ากันได้: วิธีการทำงานของแนวทางในเบราว์เซอร์ อุปกรณ์ และสภาพแวดล้อมต่างๆ โดยไม่มีตรรกะสำรอง
- ความสะดวกของผู้ใช้: ผู้ใช้ต้องทำตามขั้นตอนเพิ่มเติมเพื่อใช้ระบบ AI หรือไม่ เช่น การดาวน์โหลดโมเดล
- ความสะดวกของนักพัฒนาแอป: ความรวดเร็วและง่ายดายในการ ติดตั้งใช้งาน ผสานรวม และบำรุงรักษาโมเดลสำหรับนักพัฒนาแอปส่วนใหญ่ โดยไม่ต้องมีความเชี่ยวชาญด้าน AI โดยเฉพาะ
ตารางต่อไปนี้แสดงตัวอย่างค่าประมาณของประสิทธิภาพของแต่ละแพลตฟอร์ม สำหรับแต่ละเกณฑ์ โดย 1 คือต่ำสุด และ 5 คือสูงสุด
| เกณฑ์ | ไคลเอ็นต์ | เซิร์ฟเวอร์ | ||
| AI ในตัวหรือในอุปกรณ์ | โมเดลที่กำหนดเอง | บริการที่มีการจัดการ | รูปแบบการโฮสต์ด้วยตนเอง | |
| พลังของโมเดล |
ทำไมถึงให้คะแนนพลังของโมเดล 2 ดาวAI ในตัวและในอุปกรณ์ใช้โมเดลเบราว์เซอร์ขนาดเล็กที่โหลดไว้ล่วงหน้าซึ่งได้รับการเพิ่มประสิทธิภาพสำหรับฟีเจอร์เฉพาะงานที่จำกัด แทนที่จะเป็นการสนทนาหรือการให้เหตุผลแบบเปิด |
ทำไมถึงให้คะแนนความสามารถของโมเดล 3 ดาวไลบรารีฝั่งไคลเอ็นต์ที่กำหนดเองมีความยืดหยุ่นมากกว่า AI ในตัว แต่คุณยังคงถูกจำกัดด้วยขนาดการดาวน์โหลด ขีดจำกัดของหน่วยความจำ และฮาร์ดแวร์ของผู้ใช้ |
ทำไมจึงให้คะแนนพลังของโมเดล 4 ดาวบริการที่มีการจัดการและการโฮสต์ด้วยตนเองช่วยให้คุณเข้าถึงโมเดลขนาดใหญ่ที่ทันสมัย ซึ่งมีความสามารถในการให้เหตุผลที่ซับซ้อน การจัดการบริบทที่ยาว และครอบคลุมงานในวงกว้าง |
|
| ความสามารถในการปรับแต่ง |
เหตุใดจึงให้ 1 ดาวสำหรับการปรับแต่งโมเดลในตัวไม่อนุญาตให้เข้าถึงน้ำหนักของโมเดลหรือข้อมูลการฝึก วิธีหลักในการปรับแต่งลักษณะการทำงานของโมเดลคือการใช้พรอมต์วิศวกรรม |
เหตุใดจึงให้ 5 ดาวสำหรับการปรับแต่งตัวเลือกนี้ช่วยให้คุณควบคุมการเลือกโมเดลและน้ำหนักได้ ไลบรารีฝั่งไคลเอ็นต์หลายรายการยังอนุญาตให้ปรับแต่งและฝึกโมเดลด้วย |
เหตุใดจึงให้ 1 ดาวสำหรับการปรับแต่งบริการที่มีการจัดการจะแสดงโมเดลที่มีประสิทธิภาพ แต่ให้การควบคุมพฤติกรรมภายในของโมเดลน้อยที่สุด โดยปกติแล้ว การปรับแต่งจะจำกัดอยู่แค่การแจ้งและบริบทอินพุต |
เหตุใดจึงให้ 5 ดาวสำหรับความสามารถในการปรับแต่งโมเดลที่โฮสต์ด้วยตนเองช่วยให้คุณควบคุมน้ำหนักของโมเดล ข้อมูลการฝึก การปรับแต่ง และการกำหนดค่าการติดตั้งใช้งานได้อย่างเต็มที่ |
| ความแม่นยำ |
เหตุใดจึงให้คะแนนความถูกต้อง 2 ดาวความแม่นยำในโมเดลในตัวเพียงพอสำหรับงานที่มีขอบเขตชัดเจน แต่ขนาดโมเดลที่จำกัดและการสรุปทั่วไปจะลดความน่าเชื่อถือสำหรับอินพุตที่ซับซ้อนหรือมีความแตกต่างเล็กน้อย |
เหตุใดจึงให้คะแนนความถูกต้อง 3 ดาวคุณสามารถปรับปรุงความแม่นยำของโมเดลฝั่งไคลเอ็นต์ที่กำหนดเองได้ในกระบวนการเลือกโมเดล อย่างไรก็ตาม ยังคงมีข้อจำกัดด้านขนาดโมเดล การหาปริมาณ และความแปรปรวนของฮาร์ดแวร์ไคลเอ็นต์ |
เหตุใดจึงต้องให้คะแนนความถูกต้อง 5 ดาวโดยปกติแล้ว บริการที่มีการจัดการจะมีความแม่นยำค่อนข้างสูง ซึ่งเป็นผลมาจากโมเดลขนาดใหญ่ ข้อมูลการฝึกที่ครอบคลุม และการปรับปรุงอย่างต่อเนื่องของผู้ให้บริการ |
เหตุใดจึงให้คะแนนความถูกต้อง 4 ดาวความแม่นยำอาจสูง แต่ขึ้นอยู่กับโมเดลที่เลือกและความพยายามในการปรับแต่ง ประสิทธิภาพอาจช้ากว่าบริการที่มีการจัดการ |
| เวลาในการตอบสนองของเครือข่าย |
ทำไมเวลาในการตอบสนองของเครือข่ายจึงได้ 5 ดาวการประมวลผลเกิดขึ้นในอุปกรณ์ของผู้ใช้โดยตรง |
ทำไมเวลาในการตอบสนองของเครือข่ายจึงได้ 2 ดาวมีการรับส่งข้อมูลแบบไปกลับไปยังเซิร์ฟเวอร์ |
||
| ความเป็นส่วนตัว |
เหตุใดจึงให้คะแนนความเป็นส่วนตัว 5 ดาวข้อมูลผู้ใช้ควรอยู่ในอุปกรณ์โดยค่าเริ่มต้น ซึ่งจะช่วยลดการเปิดเผยข้อมูลและลดความซับซ้อนในการปฏิบัติตามข้อกำหนดด้านความเป็นส่วนตัว |
เหตุใดจึงให้คะแนนความเป็นส่วนตัว 2 ดาวต้องส่งข้อมูลที่ผู้ใช้ป้อนไปยังเซิร์ฟเวอร์ภายนอก ซึ่งจะเพิ่มการเปิดเผยข้อมูลและข้อกำหนดด้านการปฏิบัติตามข้อกำหนด อย่างไรก็ตาม มีโซลูชันเฉพาะเพื่อลดปัญหาด้านความเป็นส่วนตัว เช่น Private AI Compute |
เหตุใดจึงให้คะแนนความเป็นส่วนตัว 3 ดาวข้อมูลจะยังอยู่ภายใต้การควบคุมขององค์กร แต่จะออกจากอุปกรณ์ของผู้ใช้และต้องมีการจัดการที่ปลอดภัยและมาตรการการปฏิบัติตามข้อกำหนด |
|
| ค่าธรรมเนียมคงที่ |
เหตุใดจึงให้ 5 ดาวสำหรับต้นทุนคงที่โมเดลจะทำงานในอุปกรณ์ที่มีอยู่ของผู้ใช้ จึงไม่มีค่าใช้จ่ายด้านโครงสร้างพื้นฐานเพิ่มเติม |
เหตุใดจึงให้ 5 ดาวสำหรับต้นทุนคงที่API ส่วนใหญ่จะเรียกเก็บเงินตามการใช้งาน จึงไม่มีต้นทุนคงที่ |
เหตุใดจึงให้ 2 ดาวสำหรับต้นทุนคงที่ต้นทุนคงที่รวมถึงโครงสร้างพื้นฐาน การบำรุงรักษา และค่าใช้จ่ายในการดำเนินงาน |
|
| ต้นทุนต่อคำขอ |
เหตุใดจึงให้คะแนน 5 ดาวสำหรับต้นทุนต่อคำขอไม่มีค่าใช้จ่ายต่อคำขอเนื่องจากระบบจะเรียกใช้การอนุมานในอุปกรณ์ของผู้ใช้ |
เหตุใดจึงให้ 2 ดาวสำหรับต้นทุนต่อคำขอบริการที่มีการจัดการมักจะมีราคาต่อคำขอ ค่าใช้จ่ายในการปรับขนาดอาจเพิ่มขึ้นอย่างมาก โดยเฉพาะเมื่อมีการเข้าชมสูง |
เหตุใดจึงให้ 3 ดาวสำหรับต้นทุนต่อคำขอไม่มีค่าใช้จ่ายต่อคำขอโดยตรง แต่ค่าใช้จ่ายต่อคำขอที่มีประสิทธิภาพจะขึ้นอยู่กับการใช้โครงสร้างพื้นฐาน |
|
| ความเข้ากันได้ |
เหตุใดจึงให้คะแนนความเข้ากันได้ 2 ดาวความพร้อมใช้งานจะแตกต่างกันไปตามเบราว์เซอร์และอุปกรณ์ ซึ่งต้องมีการสำรองข้อมูลสำหรับสภาพแวดล้อมที่ไม่รองรับ |
ทำไมจึงให้คะแนนความเข้ากันได้ 1 ดาวความเข้ากันได้ขึ้นอยู่กับความสามารถของฮาร์ดแวร์และการรองรับรันไทม์ ซึ่งจำกัดการเข้าถึงในอุปกรณ์ต่างๆ |
เหตุใดจึงให้คะแนนความเข้ากันได้ 5 ดาวแพลตฟอร์มฝั่งเซิร์ฟเวอร์เข้ากันได้กับผู้ใช้ทุกรายในวงกว้าง เนื่องจากมีการอนุมานฝั่งเซิร์ฟเวอร์และไคลเอ็นต์ใช้เพียง API |
|
| ความสะดวกของผู้ใช้ |
เหตุใดจึงให้ 3 ดาวสำหรับความสะดวกของผู้ใช้โดยทั่วไปแล้วฟีเจอร์นี้จะทำงานได้อย่างราบรื่นเมื่อพร้อมใช้งาน แต่ AI ในตัวต้องมีการดาวน์โหลดโมเดลเริ่มต้นและการรองรับเบราว์เซอร์ |
เหตุใดจึงให้ 2 ดาวสำหรับความสะดวกของผู้ใช้ผู้ใช้อาจพบความล่าช้าเนื่องจากการดาวน์โหลดหรือฮาร์ดแวร์ที่ไม่รองรับ |
เหตุใดจึงให้ 4 ดาวสำหรับความสะดวกของผู้ใช้ใช้งานได้ทันทีโดยไม่ต้องดาวน์โหลดหรือมีข้อกำหนดของอุปกรณ์ จึงมอบประสบการณ์การใช้งานที่ราบรื่นให้แก่ผู้ใช้ อย่างไรก็ตาม อาจเกิดความล่าช้าหากการเชื่อมต่อเครือข่ายไม่ดี |
|
| ความสะดวกของนักพัฒนาแอป |
เหตุใดจึงให้ 5 ดาวเพื่อความสะดวกของนักพัฒนาแอปAI ในตัวต้องมีการตั้งค่าเพียงเล็กน้อย ไม่ต้องมีโครงสร้างพื้นฐาน และไม่ต้องมีความเชี่ยวชาญด้าน AI มากนัก จึงผสานรวมและบำรุงรักษาได้ง่าย |
เหตุใดจึงให้ 2 ดาวเพื่อความสะดวกของนักพัฒนาแอปต้องมีการจัดการโมเดล รันไทม์ การเพิ่มประสิทธิภาพ และความเข้ากันได้ในอุปกรณ์ต่างๆ |
เหตุใดจึงให้ 4 ดาวสำหรับความสะดวกของนักพัฒนาแอปบริการที่มีการจัดการช่วยลดความซับซ้อนในการติดตั้งใช้งานและการปรับขนาด อย่างไรก็ตาม คุณยังคงต้องผสานรวม API, จัดการค่าใช้จ่าย และทำวิศวกรรมพรอมต์ |
เหตุใดจึงให้ 1 ดาวเพื่อความสะดวกของนักพัฒนาแอปการติดตั้งใช้งานฝั่งเซิร์ฟเวอร์ที่กำหนดเองต้องอาศัยความเชี่ยวชาญอย่างมากในด้านโครงสร้างพื้นฐาน การจัดการโมเดล การตรวจสอบ และการเพิ่มประสิทธิภาพ |
| ความพยายามในการบำรุงรักษา |
เหตุใดจึงให้คะแนนความพยายามในการบำรุงรักษา 4 ดาวเบราว์เซอร์จะจัดการการอัปเดตและการเพิ่มประสิทธิภาพโมเดล แต่นักพัฒนาแอปต้องปรับตัวให้เข้ากับความพร้อมให้บริการที่เปลี่ยนแปลงไป |
เหตุใดจึงให้คะแนนความพยายามในการบำรุงรักษา 2 ดาวต้องมีการอัปเดตโมเดล การปรับแต่งประสิทธิภาพ และความเข้ากันได้อย่างต่อเนื่องเมื่อเบราว์เซอร์และอุปกรณ์มีการพัฒนา |
เหตุใดจึงให้ 5 ดาวสำหรับความพยายามในการบำรุงรักษาผู้ให้บริการจะเป็นผู้จัดการการบำรุงรักษา |
เหตุใดจึงให้คะแนนความพยายามในการบำรุงรักษา 2 ดาวต้องมีการบำรุงรักษาอย่างต่อเนื่อง ซึ่งรวมถึงการอัปเดตโมเดล การจัดการโครงสร้างพื้นฐาน การปรับขนาด และความปลอดภัย |
วิเคราะห์ข้อดีข้อเสีย
เราจะเพิ่มฟีเจอร์อีกอย่างลงใน Example Shoppe ซึ่งเป็นแพลตฟอร์มอีคอมเมิร์ซขนาดกลาง เพื่อแสดงให้เห็นกระบวนการตัดสินใจ คุณสนใจที่จะประหยัดค่าใช้จ่ายในการบริการลูกค้านอกเวลาทำการ จึงตัดสินใจสร้างผู้ช่วยที่ทำงานด้วยระบบ AI เพื่อตอบคำถามของผู้ใช้เกี่ยวกับการสั่งซื้อ การคืนสินค้า และผลิตภัณฑ์
คุณสามารถดูพิมพ์เขียวระบบ AI ฉบับเต็ม ซึ่งมีโอกาสและโซลูชัน
วิเคราะห์สถานการณ์โดยใช้ 2 มุมมอง ได้แก่ ข้อกำหนดของกรณีการใช้งานและข้อจำกัดทางธุรกิจ หรือข้อจำกัดของทีม
| ข้อกำหนด | การวิเคราะห์ | เกณฑ์ | ผลกระทบ |
| ความแม่นยำสูงและใช้งานได้หลากหลาย | ผู้ใช้ถามคำถามที่ซับซ้อนต่างๆ เกี่ยวกับคำสั่งซื้อ ผลิตภัณฑ์ และการคืนสินค้า | ความสามารถและความแม่นยำของโมเดล | ต้องใช้โมเดลภาษาขนาดใหญ่ (LLM) |
| ความเฉพาะเจาะจงของข้อมูล | โดยจะต้องตอบคำถามที่เฉพาะเจาะจงเกี่ยวกับข้อมูลบริษัท ผลิตภัณฑ์ และนโยบาย | ความสามารถในการปรับแต่ง | ต้องมีการนำเข้าข้อมูล เช่น RAG แต่ไม่ต้องมีการปรับแต่งโมเดล |
| ข้อกำหนด | การวิเคราะห์ | เกณฑ์ | ผลกระทบ |
| ฐานผู้ใช้ | ผู้ใช้หลายแสนราย | ความสามารถในการปรับขนาด ความเข้ากันได้ | ต้องมีสถาปัตยกรรมที่รองรับการเข้าชมจำนวนมากและเชื่อถือได้ |
| สิ่งที่ควรโฟกัสหลังเปิดตัว | ทีมจะย้ายไปทำโปรเจ็กต์อื่นๆ หลังจากเปิดตัวเวอร์ชัน 1 | ความพยายามในการบำรุงรักษา | ต้องการโซลูชันที่ต้องมีการบำรุงรักษาอย่างต่อเนื่องน้อยที่สุด |
| ความเชี่ยวชาญของทีม | นักพัฒนาเว็บที่มีความสามารถ แต่มีความเชี่ยวชาญด้าน AI/ML น้อย | ความสะดวกของนักพัฒนาแอป | โซลูชันต้องติดตั้งใช้งานและผสานรวมได้ง่ายโดยไม่ต้องมีทักษะด้าน AI เฉพาะทาง |
เมื่อจัดลําดับความสําคัญของเกณฑ์แล้ว คุณสามารถดูตารางการประมาณการแลกเปลี่ยนเพื่อพิจารณาว่าแพลตฟอร์มใดตรงกับเกณฑ์ที่มีลําดับความสําคัญสูงสุด
การวิเคราะห์นี้แสดงให้เห็นอย่างชัดเจนว่าคุณควรใช้ AI ฝั่งเซิร์ฟเวอร์และอาจใช้ บริการที่มีการจัดการ ซึ่งเป็นโมเดลที่หลากหลายสำหรับคำถามที่ซับซ้อนของลูกค้า ซึ่งช่วยลดความพยายามในการบำรุงรักษาและการพัฒนาด้วยการส่งต่อโครงสร้างพื้นฐาน คุณภาพของโมเดล และเวลาทำงานไปยังผู้ให้บริการ
แม้ว่าการปรับแต่งจะจำกัด แต่ก็คุ้มค่าสำหรับทีมพัฒนาเว็บที่มีประสบการณ์ด้านวิศวกรรมโมเดลจำกัด
การตั้งค่าการสร้างที่เพิ่มการดึงข้อมูล (RAG) จะช่วยให้คุณระบุบริบทที่เกี่ยวข้องกับโมเดลในเวลาที่อนุมานได้
AI แบบไฮบริด
ระบบ AI ที่มีประสิทธิภาพมักไม่ได้ทำงานบนแพลตฟอร์มเดียวหรือใช้โมเดลเดียว แต่จะกระจายภาระงาน AI เพื่อเพิ่มประสิทธิภาพการแลกเปลี่ยน
ค้นหาโอกาสสำหรับ AI แบบไฮบริด
เมื่อเปิดตัวแล้ว คุณควรปรับแต่งข้อกำหนดตามข้อมูลและฟีดแบ็กในชีวิตจริง ในตัวอย่างของเรา ซึ่งก็คือ Example Shoppe คุณรอ 2-3 เดือนเพื่อ วิเคราะห์ผลลัพธ์และพบข้อมูลต่อไปนี้
- คำขอประมาณ 80% เป็นคำขอที่ซ้ำกัน ("คำสั่งซื้อของฉันอยู่ที่ไหน" "ฉันจะ คืนสินค้าได้อย่างไร") การส่งคำขอเหล่านี้ไปยังบริการที่มีการจัดการจะทำให้เกิดค่าใช้จ่ายและค่าใช้จ่ายเพิ่มเติมจำนวนมาก
- มีเพียง 20% ของคำขอเท่านั้นที่ต้องใช้การให้เหตุผลที่ลึกซึ้งยิ่งขึ้นและการสนทนาแบบปลายเปิด แบบอินเทอร์แอกทีฟ
โมเดลน้ำหนักเบาในเครื่องจะจัดประเภทอินพุตของผู้ใช้และตอบคำค้นหาที่ใช้เป็นประจำ เช่น "นโยบายคืนสินค้าของคุณคืออะไร" คุณสามารถกำหนดเส้นทางคำถามที่ซับซ้อน ไม่ค่อยพบ หรือไม่ชัดเจนไปยังโมเดลฝั่งเซิร์ฟเวอร์ได้
การใช้ AI ทั้งฝั่งเซิร์ฟเวอร์และฝั่งไคลเอ็นต์จะช่วยลดต้นทุนและความ หน่วงเวลา พร้อมทั้งยังคงสิทธิ์เข้าถึงการให้เหตุผลที่มีประสิทธิภาพเมื่อจำเป็น
กระจายภาระงาน
หากต้องการสร้างระบบไฮบริดนี้สำหรับ Example Shoppe คุณควรเริ่มด้วยการกำหนด ระบบเริ่มต้น ในกรณีนี้ คุณควรเริ่มที่ฝั่งไคลเอ็นต์ แอปพลิเคชัน ควรกำหนดเส้นทางไปยัง AI ฝั่งเซิร์ฟเวอร์ใน 2 กรณีต่อไปนี้
- การสำรองข้อมูลตามความเข้ากันได้: หากอุปกรณ์หรือเบราว์เซอร์ของผู้ใช้จัดการคำขอไม่ได้ ระบบควรสำรองข้อมูลไปยังเซิร์ฟเวอร์
- การส่งต่อตามความสามารถ: หากคำขอมีความซับซ้อนมากเกินไปหรือเป็นคำขอแบบเปิด สำหรับโมเดลฝั่งไคลเอ็นต์ตามที่กำหนดไว้ในเกณฑ์ที่กำหนดไว้ล่วงหน้า ควรส่งต่อ ไปยังโมเดลฝั่งเซิร์ฟเวอร์ที่ใหญ่กว่า คุณสามารถใช้โมเดลเพื่อจัดประเภทคำขอเป็นคำขอทั่วไป เพื่อให้คุณทำงานฝั่งไคลเอ็นต์ หรือคำขอที่ไม่ธรรมดา และส่งคำขอไปยังระบบฝั่งเซิร์ฟเวอร์ เช่น หาก โมเดลฝั่งไคลเอ็นต์พิจารณาว่าคำถามเกี่ยวข้องกับปัญหาที่พบได้ไม่บ่อย เช่น การขอเงินคืนในสกุลเงินอื่น
ความยืดหยุ่นทำให้เกิดความซับซ้อนมากขึ้น
การกระจายภาระงานระหว่าง 2 แพลตฟอร์มจะช่วยให้คุณมีความยืดหยุ่นมากขึ้น แต่ก็เพิ่มความซับซ้อนด้วยเช่นกัน
- การประสานงาน: สภาพแวดล้อมการดำเนินการ 2 แบบหมายถึงชิ้นส่วนที่เคลื่อนไหวมากขึ้น คุณ ต้องมีตรรกะสำหรับการกำหนดเส้นทาง การลองใหม่ และการสำรอง
- การควบคุมเวอร์ชัน: หากคุณใช้โมเดลเดียวกันในแพลตฟอร์มต่างๆ โมเดลนั้นจะต้อง เข้ากันได้กับทั้ง 2 สภาพแวดล้อม
- การออกแบบพรอมต์และการออกแบบบริบท หากคุณใช้โมเดลที่แตกต่างกันในแต่ละแพลตฟอร์ม คุณจะต้องออกแบบพรอมต์ สำหรับแต่ละแพลตฟอร์ม
- การตรวจสอบ: บันทึกและเมตริกจะแยกกันและต้องใช้ความพยายามเพิ่มเติมในการรวม
- ความปลอดภัย: คุณกำลังดูแลพื้นที่การโจมตี 2 แห่ง ทั้งอุปกรณ์ปลายทางในเครื่องและในระบบคลาวด์ ต้องได้รับการเสริมความแข็งแกร่ง
นี่เป็นอีกหนึ่งข้อแลกเปลี่ยนที่คุณควรพิจารณา หากมีทีมขนาดเล็กหรือกำลังสร้างฟีเจอร์ที่ไม่จำเป็น คุณอาจไม่ต้องการเพิ่มความซับซ้อนนี้
สิ่งที่ได้เรียนรู้
คาดว่าตัวเลือกแพลตฟอร์มจะมีการเปลี่ยนแปลง เริ่มต้นจากกรณีการใช้งาน ปรับให้สอดคล้องกับประสบการณ์และทรัพยากรของทีม และทำซ้ำเมื่อทั้งผลิตภัณฑ์และความพร้อมใช้งาน AI เติบโตขึ้น งานของคุณคือการค้นหาส่วนผสมที่เหมาะสมระหว่างความเร็ว ความเป็นส่วนตัว และการควบคุม สำหรับผู้ใช้ จากนั้นสร้างโดยมีความยืดหยุ่น วิธีนี้จะช่วยให้คุณปรับตัวตาม ข้อกำหนดที่เปลี่ยนแปลงไปและรับประโยชน์จากการอัปเดตแพลตฟอร์มและโมเดลในอนาคตได้
แหล่งข้อมูล
- เนื่องจากการเลือกแพลตฟอร์มและโมเดลมีความสัมพันธ์กัน โปรดอ่านเพิ่มเติมเกี่ยวกับการเลือกโมเดล
- อ่านวิธีก้าวข้ามระบบคลาวด์ด้วย AI แบบไฮบริดและฝั่งไคลเอ็นต์
ทดสอบความเข้าใจ
อะไรคือ 2 ปัจจัยหลักที่ควรพิจารณาเมื่อเลือกแพลตฟอร์ม AI สำหรับแอปพลิเคชันของคุณ
เมื่อใดที่บริการที่มีการจัดการฝั่งเซิร์ฟเวอร์ เช่น Gemini Pro เป็นตัวเลือกที่ดีที่สุดสำหรับแพลตฟอร์มของคุณ
ประโยชน์หลักของการใช้ระบบ AI แบบไฮบริดคืออะไร