ขอขอบคุณที่ติดตาม Google I/O ดูเนื้อหาตามคำขอ

AI ที่เหมาะสม: ดีต่อธุรกิจ ผู้ใช้ และโลก

Rachel Lee Nabors

เผยแพร่: 10 พฤศจิกายน 2025

เมื่อสร้างเว็บไซต์และเว็บแอปด้วย AI คุณอาจสร้างต้นแบบด้วยโมเดลภาษาขนาดใหญ่ (LLM) เช่น ChatGPT, Gemini หรือ Claude แล้วจึงนําไปใช้งานจริง LLM เป็นโมเดลพื้นฐานประเภทหนึ่ง ซึ่งเป็นโมเดลขนาดใหญ่มากที่ผ่านการฝึกเบื้องต้นมาแล้ว ซึ่ง ต้องใช้ทรัพยากรจำนวนมาก มีราคาแพง และมักไม่ใช่เครื่องมือที่ดีที่สุดสำหรับ งาน โมเดลขนาดเล็กเฉพาะงานในพื้นที่ใช้ทรัพยากรน้อยกว่า และมักจะให้การตอบกลับที่ดีขึ้น เร็วขึ้น และมีต้นทุนต่ำกว่าโมเดลพื้นฐานแบบ "ขนาดเดียวใช้ได้กับทุกอย่าง"

เมื่อเลือกโมเดลที่ดีขึ้น คุณก็เลือกแนวทางที่ยั่งยืนมากขึ้น ซึ่งเราจะเรียกว่า AI ที่มีขนาดเหมาะสม AI ที่เหมาะสมจะช่วยให้คุณได้รับสิ่งต่อไปนี้

ลดเวลาในการตอบสนองสำหรับผู้ใช้เมื่อโมเดลทำงานในเครื่องแทนที่จะส่งคำขอไปกลับ ไปยังเซิร์ฟเวอร์ที่อยู่ไกล
ค่าใช้จ่าย API ลดลงเมื่อคุณไม่ต้องชำระเงินสำหรับความสามารถที่ไม่ได้ใช้
การเข้าถึงแอปแบบออฟไลน์ไปยังโมเดลฝั่งไคลเอ็นต์ในอุปกรณ์ ซึ่งจะสร้างประสบการณ์ที่น่าเชื่อถือยิ่งขึ้น

แม้ว่าโมเดลพื้นฐานจะมีความโดดเด่นในด้านการให้เหตุผลและการสนทนาทั่วไป แต่การใช้โมเดลพื้นฐานสำหรับงานเฉพาะ (เช่น การจัดประเภทข้อความหรือการแยกข้อมูล) ก็เหมือนกับการใช้รถแข่ง Formula 1 เพื่อไปซื้อ McDonald's แม้ว่าในทางเทคนิคแล้วจะเป็นไปได้ แต่ก็ ไม่มีประสิทธิภาพอย่างมาก (และผู้โดยสารจะรู้สึกไม่สบาย) แต่ให้ปรับการติดตั้งใช้งานให้ตรงกับความต้องการจริง

แนวทางปฏิบัติเกี่ยวกับ AI ที่ยั่งยืนและประสบการณ์ของผู้ใช้ที่ดีที่สุดไม่ได้เป็น สิ่งสำคัญที่ขัดแย้งกัน ซึ่งเป็นลำดับความสำคัญเดียวกันที่แสดงในรูปแบบที่แตกต่างกัน

วิธีหนึ่งในการประเมินผลกระทบด้านสิ่งแวดล้อมของ AI คือ

การฝึก: การฝึกโมเดลครั้งแรกต้องใช้ทรัพยากรจำนวนมาก ผู้ให้บริการโมเดลเป็นผู้จัดการการเพิ่มประสิทธิภาพและ "การเรียนรู้" นี้
การอนุมาน: คุณจะทำการอนุมานเมื่อป้อนข้อมูลใหม่ (พรอมต์) ให้กับโมเดลที่ฝึกแล้วเพื่อสร้างเอาต์พุต (ข้อความตอบกลับ) การอนุมานใช้ทรัพยากรน้อยกว่าการฝึกมาก

การฝึกโมเดลเป็นต้นทุนคงที่ แต่ต้นทุนการอนุมานจะปรับขนาดตามการใช้งาน ซึ่งทำให้การเลือกโมเดลเป็นปัจจัยสำคัญที่คุณควบคุมได้ คุณสามารถเลือกได้อย่างชาญฉลาดสำหรับกรณีการใช้งานและสำหรับโลกใบนี้ ซึ่งเป็นการสนับสนุนการพัฒนา AI อย่างมีความรับผิดชอบ

ใช้ AI ที่เน้นผู้ใช้เป็นอันดับแรก

สร้าง AI แบบ User First แทนที่จะสร้าง AI แบบ Model First พิจารณาว่า AI สามารถทำงานใดได้บ้างที่จะช่วยให้แอปของคุณใช้งานง่ายขึ้น หรือลดภาระงานของผู้ใช้ หรือจำนวนการสลับบริบทที่ผู้ใช้ต้องทำ

เช่น สมมติว่าคุณดำเนินธุรกิจชื่อ Rewarding Eats ซึ่งให้คะแนนแก่ผู้ใช้ที่รับประทานอาหารนอกบ้านในร้านอาหารบางแห่ง คุณสามารถใช้ AI เพื่อสแกนรูปภาพใบเสร็จหาร้านอาหารและยอดใช้จ่ายทั้งหมด แทนที่จะให้ลูกค้าป้อนข้อมูลด้วยตนเอง ฟีเจอร์นี้มีแนวโน้มที่จะปรับปรุงประสบการณ์ของผู้ใช้แอปพลิเคชันของคุณ

เมื่อสร้าง AI ที่เน้นผู้ใช้เป็นหลัก

กำหนดข้อกำหนดของงาน AI ต้องทำงานอะไรบ้าง เป็นข้อความทั้งหมดหรือมีองค์ประกอบเสียงหรือภาพ
เลือกรุ่นที่เหมาะสม โมเดลที่ต่างกันจะมีประสิทธิภาพมากกว่าใน งานที่ต่างกัน และมักจะมีร่องรอยการใช้งานที่น้อยกว่า
ทำความเข้าใจข้อจำกัดในการติดตั้งใช้งาน โมเดลควรอยู่ที่ใด ข้อมูลจะอยู่ที่ไหน ผู้ใช้จะมี การเชื่อมต่อที่เชื่อถือได้ไหม
ใช้การเพิ่มประสิทธิภาพแบบค่อยเป็นค่อยไปเพื่อประสบการณ์การใช้งานที่รวดเร็วและปลอดภัยที่สุด

กำหนดข้อกำหนดของงาน

แทนที่จะมองหา "ที่ที่จะใช้ AI" หรือ "ฟีเจอร์ AI ที่จะเพิ่ม" คุณควร ถามว่า "ประสบการณ์การใช้งานที่ราบรื่นควรเป็นอย่างไร" คุณควรพูดคุยกับผู้จัดการผลิตภัณฑ์โดยขึ้นอยู่กับขนาดของบริษัท

ลองดูแอปตัวอย่างของเราอย่าง Rewarding Eats คำถามแรกที่ต้องถามคือ "เราจำเป็นต้องใช้ AI สำหรับสิ่งนั้นไหม"

โมเดลพื้นฐานอาจร่างค่าใช้จ่ายจากใบเสร็จได้โดยใช้พรอมต์บางอย่าง แต่การจัดการเรื่องนี้อย่างมีประสิทธิภาพมากขึ้นไม่จำเป็นต้องใช้โมเดลขนาดใหญ่เลย ใช้การรู้จำอักขระด้วยภาพ (OCR) เพื่อแยกวิเคราะห์ข้อความจากรูปภาพและ ส่งไปยังโมเดลเฉพาะงาน เช่น โมเดลการจัดประเภทข้อความ เพื่อระบุ รายการและค่าใช้จ่ายจากข้อความที่แยกวิเคราะห์แล้ว ซึ่งทำได้ในอุปกรณ์ของผู้ใช้ โดยไม่ต้องส่งข้อมูลไปยังเซิร์ฟเวอร์

ในกรณีส่วนใหญ่ หากคุณเชื่อว่าจำเป็นต้องใช้โมเดลพื้นฐาน คุณอาจต้องแบ่งปัญหาออกเป็นงานแยกกัน

เลือกรุ่นที่เหมาะสม

เมื่อทราบแล้วว่าคุณต้องการทำภารกิจใดให้เสร็จ คุณก็เลือกประเภทโมเดลและโมเดลที่เหมาะสมกับงานได้ แม้ว่าโมเดลพื้นฐานจะเข้าถึงได้ง่ายกว่า แต่โมเดลขนาดเล็กจะทำงานได้เร็วกว่าและถูกกว่า เมื่อเข้าใจงานแล้ว คุณจะเลือกโมเดลขนาดเล็กที่เหมาะกับงานเพื่อจัดการงานได้

เนื่องจากมีโมเดลและประเภทโมเดลที่แตกต่างกันมากมาย โปรดอ่านข้อมูลเชิงลึกเกี่ยวกับการเลือกโมเดลเพื่อพิจารณาตัวเลือกที่เหมาะสมสำหรับโปรเจ็กต์ของคุณ

เลือกตำแหน่งที่เหมาะสมสำหรับโมเดล

แม้ว่าโมเดลพื้นฐานจะมีขนาดใหญ่เกินกว่าที่จะทำงานได้แม้ในเดสก์ท็อปที่ทรงพลังที่สุด แต่LLM ที่มีขนาดเล็กกว่า โมเดลภาษาขนาดเล็ก (SLM) และโมเดลเฉพาะงานก็สามารถทำงานได้ในอุปกรณ์หลายเครื่อง

ประเภทโมเดล	อยู่ในอุปกรณ์ (ฝั่งไคลเอ็นต์) อยู่แล้ว	ดาวน์โหลดลงในอุปกรณ์	รูปแบบที่โฮสต์ในเซิร์ฟเวอร์
โมเดลเฉพาะงาน	ไม่แนะนำ	ไม่แนะนำ	แนะนำ
โมเดลภาษาขนาดเล็ก (SLM)	แนะนำ	แนะนำ	แนะนำ
โมเดลพื้นฐาน	ไม่แนะนำ	ไม่แนะนำ	แนะนำ

SLM สะดวกแต่ไม่ค่อยพบเห็น มีโทรศัพท์มือถือหลายพันล้านเครื่อง และมีเพียงรุ่นล่าสุดและรุ่นที่มีราคาสูงกว่าเท่านั้นที่สามารถเรียกใช้ SLM ในเครื่องได้ ซึ่งเป็นเพียงส่วนน้อยของตลาด

ใช้เมทริกซ์นี้เพื่อกำหนดตำแหน่งที่ดีที่สุดสำหรับโมเดล

เมตริก	ฝั่งไคลเอ็นต์ / เครื่อง	ฝั่งเซิร์ฟเวอร์ / ระยะไกล
การเชื่อมต่อ	ต้องใช้โหมดออฟไลน์ เครือข่ายไม่เสถียร สถานที่ปลอดภัย	สภาพแวดล้อมที่ออนไลน์อยู่เสมอ
ตำแหน่งของข้อมูล	การประมวลผลรูปภาพของผู้ใช้ ข้อความที่ป้อน และไฟล์ส่วนตัว	การทำงานกับเอกสารและฐานข้อมูลฝั่งเซิร์ฟเวอร์
รูปแบบการใช้งาน	การโทรที่มีความถี่สูง (การแปลแชท การวิเคราะห์แบบเรียลไทม์)	งานที่ซับซ้อนเป็นครั้งคราว
แบนด์วิดท์	ผู้ใช้อุปกรณ์เคลื่อนที่ พื้นที่ชนบท เอาต์พุตไฟล์ขนาดใหญ่	บรอดแบนด์แบบไม่จำกัด การตอบกลับขนาดเล็ก
ความเป็นส่วนตัวและความปลอดภัย	ข้อมูลที่มีการควบคุม (การดูแลสุขภาพ การเงิน) การปฏิบัติตามข้อกำหนดอย่างเคร่งครัด	ข้อมูลธุรกิจมาตรฐาน โครงสร้างพื้นฐานด้านการรักษาความปลอดภัยที่ได้รับการยอมรับ
ผลกระทบต่อแบตเตอรี่	แอปเดสก์ท็อป กรณีการใช้งานที่ทนต่อการใช้พลังงาน	แอปบนอุปกรณ์เคลื่อนที่ที่มีแบตเตอรี่จำกัด

การอนุมานฝั่งไคลเอ็นต์ การเพิ่มประสิทธิภาพแบบก้าวหน้า และแบบไฮบริด

ไลบรารีอย่าง TensorFlow.js, Transformers.js และ ONNX.js ช่วยให้แอปพลิเคชันของคุณ ทำการอนุมานฝั่งไคลเอ็นต์ด้วยข้อมูลผู้ใช้ได้ คุณแปลงโมเดลเป็นรูปแบบที่เหมาะสม จากนั้นโฮสต์โมเดลจากระยะไกลหรือฝังโมเดลไว้ในแอปโดยตรง ประสบการณ์ของผู้ใช้ที่ดีที่สุดคือการใช้โมเดลที่โหลดไว้ล่วงหน้า โมเดลที่ดาวน์โหลดได้ และโมเดลระยะไกลผสมกันอย่างราบรื่น เพื่อให้ผู้ใช้ทำงานได้โดยไม่ต้องประนีประนอม

แม้ว่าการใช้โมเดลที่โฮสต์ในระบบคลาวด์ระยะไกลจะเป็นตัวเลือกที่แนะนำเพื่อความปลอดภัย (หรือขนาด ที่ต้องการ) แต่การมีโมเดลในเครื่องเพียงพอเมื่อการเชื่อมต่อขาดหายไปจะช่วย สร้างประสบการณ์การใช้งานที่ยืดหยุ่นได้

ท้ายที่สุดแล้ว การติดตั้งใช้งานโมเดลมี 3 แนวทาง เลือกตัวเลือกที่เหมาะกับความต้องการของคุณมากที่สุด

เน้นการทำงานแบบออฟไลน์: แอปมีข้อกำหนดในการทำงานแบบออฟไลน์ มีการใช้งานความถี่สูง และมีข้อมูลที่มีความละเอียดอ่อน
เน้นการทำงานจากระยะไกล: การให้เหตุผลที่ซับซ้อน โมเดลขนาดใหญ่ การใช้งานไม่บ่อย
แนวทางแบบผสม: ดาวน์โหลดโมเดลขนาดเล็กขณะใช้ API แล้วเปลี่ยนเมื่อพร้อม

สิ่งที่คุณจะทำขั้นต่อไป

เทคโนโลยีมักจะตามมาหลังจากการใช้งาน วิธีที่ดีที่สุดสำหรับนักพัฒนาซอฟต์แวร์ในการ มีอิทธิพลต่อทิศทางของอุตสาหกรรม เพื่อให้ผู้ใช้ได้รับประสบการณ์ที่ดียิ่งขึ้นและโลกของเรามีผลลัพธ์ที่ดีขึ้นคือ

เลือกเครื่องมือที่เหมาะกับงาน โมเดลขนาดเล็กใช้ทรัพยากรน้อยกว่าและมักทำงานได้ดีเท่ากับโมเดลขนาดใหญ่ ด้วยความช่วยเหลือจากการออกแบบพรอมต์ ซึ่งช่วยลดเวลาในการตอบสนอง
กำหนดให้มีความโปร่งใสเกี่ยวกับค่าใช้จ่ายในการอนุมานและการฝึก สนับสนุนให้บริษัทของคุณให้ความสำคัญกับโมเดลที่เปิดเผยตัวเลขเหล่านี้
วางโมเดลไว้ใกล้กับข้อมูลเพื่อลดต้นทุนการรับส่งข้อมูลไปยังเซิร์ฟเวอร์
ใช้สิ่งที่พร้อมใช้งานอยู่แล้ว หากมีโมเดลในอุปกรณ์อยู่แล้ว ให้ใช้โมเดลเหล่านั้นก่อน

แหล่งข้อมูล

หากต้องการเจาะลึกหัวข้อเหล่านี้ ฉันใช้แหล่งข้อมูลต่อไปนี้ ในการเขียนบทความนี้ ซึ่งเป็นเนื้อหาที่น่าอ่าน

ประสิทธิภาพและการวิจัยโมเดล

โมเดลภาษาขนาดเล็กคืออนาคตของ Agentic AI (เอกสารงานวิจัยของ NVIDIA) สนับสนุนการวิจัยเกี่ยวกับความสามารถของ SLM
การตรวจสอบผลกระทบด้านสิ่งแวดล้อมของ Mistral ความโปร่งใสของต้นทุนการฝึกและอนุมาน
การศึกษาต้นทุนการอนุมานของ Google: การวัดผลกระทบต่อสิ่งแวดล้อม
การศึกษาของ Nature: ผลกระทบต่อสิ่งแวดล้อมจาก AI เทียบกับมนุษย์: การวิเคราะห์เปรียบเทียบการทำงานของ AI กับมนุษย์
การอภิปรายผลกระทบด้านสิ่งแวดล้อมของ AI บริบทเกี่ยวกับการอภิปรายด้านสิ่งแวดล้อม

เครื่องมือการติดตั้งใช้งานและการพัฒนา

การโหลดโมเดล TensorFlow.js: การติดตั้งใช้งานโมเดลฝั่งไคลเอ็นต์
ตัวอย่าง Transformers.js การอนุมานโมเดลในเบราว์เซอร์
รันไทม์ ONNX.js: การติดตั้งใช้งานโมเดลข้ามแพลตฟอร์ม
คู่มือ AI แบบไฮบริดของ Firebase: การผสานรวมโมเดลในเครื่องและระยะไกล