อภิธานศัพท์และแนวคิด

แหล่งข้อมูลหลักที่เชื่อถือได้สำหรับคำศัพท์แมชชีนเลิร์นนิง (ML) หลายคำคือพจนานุกรม ML เราจะรวมเฉพาะคำและคำศัพท์ที่มักมีการอ้างอิงถึงและไม่ได้อยู่ในคำศัพท์ ML เท่านั้น แทนที่จะทำซ้ำงานของบุคคลดังกล่าว

พิมพ์เขียวระบบ AI

เมื่อสร้างฟีเจอร์หรือผลิตภัณฑ์ AI ใหม่ ให้กำหนดพิมพ์เขียวระบบ AI โดยเชื่อมโยงโอกาสในการใช้ AI กับวิธีสร้างโซลูชัน คุณควร กำหนดค่าต่อไปนี้

  • ทำไมคุณจึงสร้าง กรณีการใช้งาน AI ที่พร้อมใช้งานมีอะไรบ้าง และมีคุณค่าต่อผู้ใช้อย่างไร
  • แอปพลิเคชันของคุณจะทำงานอย่างไร
  • คุณจะมั่นใจได้อย่างไรว่าระบบแต่ละส่วนได้รับการพัฒนาอย่างมีความรับผิดชอบ

อ่านเกี่ยวกับพิมพ์เขียวในข้อมูลเบื้องต้นเกี่ยวกับ AI บนเว็บ

สถาปัตยกรรม AI แบบผสม

สถาปัตยกรรม AI แบบผสม ซึ่งเป็นการรวมโมเดลอย่างน้อย 1 รายการและคอมโพเนนต์อื่นๆ เช่น ฐานข้อมูล, API และการควบคุมที่ทำงานร่วมกันเพื่อมอบ ลักษณะการทำงานที่แข็งแกร่งและรับรู้บริบท

การออกแบบบริบท

การออกแบบบริบทคือกระบวนการเลือกข้อมูล (โทเค็น) ที่เกี่ยวข้องมากที่สุดแบบไดนามิก สําหรับคําขอที่กําหนดเพื่อเพิ่มโอกาสในการ ได้รับผลลัพธ์ที่มีคุณค่า

การเปลี่ยนแปลงของข้อมูล

การเปลี่ยนแปลงของข้อมูลเกิดขึ้นเมื่อข้อมูลการฝึกไม่เป็นตัวแทนของความเป็นจริงอีกต่อไป พฤติกรรมของผู้ใช้ การเก็บรวบรวมข้อมูล และสภาพแวดล้อมของข้อมูลอาจเปลี่ยนแปลงได้ทุกเมื่อ ซึ่งอาจส่งผลให้ประสิทธิภาพของโมเดลลดลง

ซอฟต์แวร์เชิงกำหนด

เมื่อได้รับอินพุตที่เฉพาะเจาะจง ซอฟต์แวร์ที่กำหนดจะทำตามชุดขั้นตอนเดียวกันเสมอเพื่อนำไปสู่เอาต์พุตที่เหมือนกัน ซอฟต์แวร์ประเภทนี้มีความน่าเชื่อถือมากที่สุด เนื่องจากคาดการณ์ได้และทำงานได้อย่างมีประสิทธิภาพ

ปัญญาประดิษฐ์ (AI) ไม่ใช่การกำหนด เส้นทางและผลลัพธ์อาจแตกต่างกันอย่างมาก แม้จะใช้พรอมต์เดียวกันก็ตาม

การพัฒนาที่ขับเคลื่อนด้วยการประเมิน (EDD)

กรอบการพัฒนาที่ขับเคลื่อนด้วยการประเมิน (EDD) มีกระบวนการที่ทำซ้ำและทดสอบได้เพื่อปรับปรุงผลลัพธ์ในขั้นตอนเล็กๆ และมั่นใจ จับการถดถอย และปรับพฤติกรรมของโมเดลให้สอดคล้องกับความคาดหวังของผู้ใช้ และผลิตภัณฑ์เมื่อเวลาผ่านไป

ซึ่งเปรียบได้กับการพัฒนาที่ขับเคลื่อนด้วยการทดสอบ (TDD) ที่ปรับให้เข้ากับความไม่แน่นอนของ AI การประเมิน AI ไม่สามารถฮาร์ดโค้ดได้เนื่องจากเอาต์พุตทั้งที่จัดรูปแบบอย่างถูกต้องและไม่ถูกต้องอาจมีรูปแบบต่างๆ มากมายที่คุณคาดไม่ถึง ซึ่งแตกต่างจากการทดสอบหน่วยที่กำหนด

Generative AI

Generative AI คือระบบแมชชีนเลิร์นนิง ที่สร้างเนื้อหาได้ ซึ่งหมายความว่าโมเดลสามารถเขียนข้อความ สร้างรูปภาพ สร้างโค้ด หรือแม้แต่ออกแบบอินเทอร์เฟซผู้ใช้ทั้งหมดได้

การกำกับดูแล

เราจะกล่าวถึงการกำกับดูแล AI ใน 3 มิติ ดังนี้

  • ความเป็นส่วนตัว: จัดการข้อมูลอย่างมีความรับผิดชอบ อธิบายสิ่งที่เก็บรวบรวม และลดข้อมูลที่ออกจากเบราว์เซอร์
  • ความเป็นธรรม: ตรวจสอบโมเดลว่ามีพฤติกรรมที่เลือกปฏิบัติ (อคติ) หรือไม่ และสร้าง ลูปที่ให้ผู้ใช้แจ้งปัญหา
  • ความไว้วางใจและความโปร่งใส: ออกแบบระบบให้มีความโปร่งใสและมีความไว้วางใจที่ปรับเทียบแล้ว เพื่อให้ผู้ใช้ได้รับประโยชน์จากระบบต่อไปแม้จะมีความไม่แน่นอนและข้อผิดพลาดที่อาจเกิดขึ้น

มิติสุดท้ายคือความปลอดภัย ซึ่งเป็นมิติที่สำคัญของการกำกับดูแล AI เรา ตั้งใจที่จะให้ข้อมูลเพิ่มเติมเกี่ยวกับความปลอดภัยในโมดูลในอนาคต

ในระหว่างนี้ เราขอแนะนำให้อ่านเฟรมเวิร์ก AI ที่ปลอดภัย (SAIF) ของ Google และบล็อกความปลอดภัยของ Google

รุ่น

โมเดลเป็นกระดูกสันหลังที่สำคัญที่สุดของระบบ AI โดยพื้นฐานแล้ว โมเดล คือชุดพารามิเตอร์และโครงสร้างที่รองรับระบบในการคาดการณ์ วิธีการทำงานของโมเดลอาจแตกต่างกันไปตามรูปแบบการฝึก (มีการควบคุมดูแลหรือไม่มีการควบคุมดูแล) และวัตถุประสงค์ของโมเดล (เชิงคาดการณ์หรือเชิงสร้างสรรค์)

การ์ดโมเดล

การ์ดโมเดลคือภาพรวมที่มีโครงสร้างของวิธีออกแบบและประเมินโมเดล โดยเป็นอาร์ติแฟกต์สำคัญที่สนับสนุนแนวทางของ Google ในการใช้ AI อย่างมีความรับผิดชอบ

น้ำหนักของโมเดล

น้ำหนักของโมเดล คือค่าตัวเลขที่กำหนดความสำคัญของข้อมูลบางอย่าง ค่าเหล่านี้ จะได้รับการอัปเดตอย่างต่อเนื่องในการฝึกโมเดลจนกว่าจะมีการกำหนดน้ำหนักที่เหมาะสม คุณสามารถแก้ไขน้ำหนักของโมเดลแบบเปิดได้ เช่น Gemma

โอกาสสำหรับ AI

หมวดหมู่ต่างๆ ที่ใช้ในการกำหนดกรอบโซลูชัน AI มีดังนี้

  • ข้อมูลเชิงลึก: ปรับปรุงการตัดสินใจ
  • ความสะดวก: ลดอุปสรรค
  • การทำงานอัตโนมัติ: แทนที่งานที่ต้องทำซ้ำๆ
  • การเพิ่มประสิทธิภาพ: ช่วยผู้ใช้ในงานที่ซับซ้อนหรือสร้างสรรค์
  • การปรับตามโปรไฟล์ของผู้ใช้: ปรับผลิตภัณฑ์ให้เหมาะกับความต้องการและความชอบของแต่ละบุคคล

ซึ่งจะกล่าวถึงอย่างละเอียดในสำรวจกรณีการใช้งาน

แพลตฟอร์ม

AI ฝั่งไคลเอ็นต์ทำงานในเบราว์เซอร์โดยตรง ซึ่งหมายความว่าข้อมูลจะยังคงเป็นส่วนตัวอยู่ในอุปกรณ์ของผู้ใช้ และไม่มีเวลาในการตอบสนองของเครือข่าย อย่างไรก็ตาม AI ฝั่งไคลเอ็นต์ต้องมี Use Case ที่เฉพาะเจาะจงและกำหนดไว้อย่างชัดเจนจึงจะทำงานได้ดี

AI ฝั่งเซิร์ฟเวอร์ประกอบด้วยโมเดลที่โฮสต์และเรียกใช้การอนุมานในระบบคลาวด์ ซึ่งมีความสามารถสูงและปรับขนาดได้ แต่มีราคาแพงกว่าและต้องใช้การเชื่อมต่อเครือข่าย

Predictive AI

AI เชิงคาดการณ์ (หรือเชิงวิเคราะห์) คือชุดอัลกอริทึมที่ช่วยให้คุณเข้าใจข้อมูลที่มีอยู่และคาดการณ์สิ่งที่น่าจะเกิดขึ้นต่อไป โมเดล AI เชิงคาดการณ์จะเรียนรู้จากรูปแบบในอดีตเพื่อ คาดการณ์ผลลัพธ์ แสดงข้อมูลเชิงลึก และขับเคลื่อนการตัดสินใจที่ชาญฉลาดยิ่งขึ้น

วิศวกรรมพรอมต์

การออกแบบพรอมต์คือการเขียนและเขียนพรอมต์ใหม่เพื่อสร้าง เอาต์พุตที่สอดคล้องกับความคาดหวังของผู้ใช้ พรอมต์ที่เขียนอย่างดีควรมีลักษณะดังนี้

  • ระบุวิธีที่ LLM ควรสร้างคำตอบ
  • ประกอบด้วยคอมโพเนนต์หลายอย่างที่สามารถกำหนดเวอร์ชัน ทดสอบ และปรับปรุงได้ เมื่อเวลาผ่านไป
  • สามารถใช้เป็นอาร์ติแฟกต์ที่แชร์สำหรับการทำงานร่วมกันในทีมต่างๆ ได้

การเขียนพรอมต์มีเทคนิคหลายอย่างที่คุณสามารถนำไปใช้ได้ ซึ่งคุณสามารถอ่านได้ในโมดูลการเขียนพรอมต์

ประเภทพรอมต์

คิดว่าประเภทพรอมต์เป็นกลุ่มเป้าหมายของพรอมต์ อ่านเพิ่มเติมเกี่ยวกับเรื่องนี้ได้ ในโมดูลวิศวกรรมพรอมต์

พรอมต์ของระบบ

พรอมต์ของระบบจัดทำโดยนักพัฒนาแอปพลิเคชันและกำหนดลักษณะการทำงานโดยรวมของโมเดล โดยสามารถกำหนดบทบาทของโมเดล ("คุณเป็นผู้ช่วยด้านการเขียน") น้ำเสียงที่คาดหวัง รูปแบบเอาต์พุต (เช่น สคีมา JSON ที่เข้มงวด) และข้อจำกัดส่วนกลาง ได้ พรอมต์นี้จะยังคงเสถียรในคำขอต่างๆ

พรอมต์ของผู้ใช้

พรอมต์ของผู้ใช้มีคำขอทันทีที่นำไปสู่เอาต์พุต ผู้ใช้จะระบุตัวแปรอินพุตในรูปแบบใดรูปแบบหนึ่ง (เช่น ข้อความที่เลือกหรือ รูปแบบที่คาดไว้) และขอให้ดำเนินการเฉพาะ เช่น "สร้าง ชื่อ 3 ชื่อสำหรับโพสต์นี้" "เขียนย่อหน้านี้ต่อ" หรือ "ทำให้เป็นทางการมากขึ้น"