Generative AI: สร้างเนื้อหาใหม่

ในขณะที่ AI เชิงคาดการณ์ดึงข้อมูลเชิงลึกจากข้อมูลที่มีอยู่ Generative AI จะก้าวไปอีกขั้นและสร้างสิ่งใหม่ๆ โดยสามารถเขียนข้อความ สร้างรูปภาพ สร้างโค้ด หรือแม้แต่ออกแบบอินเทอร์เฟซผู้ใช้ทั้งหมด ตัวอย่างกรณีการใช้งาน Generative AI ที่พบบ่อยมีดังนี้

  • การสร้างเนื้อหา: ผู้ช่วยในการเขียน AI สามารถสร้างฉบับร่างและปรับแต่งข้อความที่มีอยู่
  • การสรุป: เครื่องมืออย่างข้อมูลภาพรวมโดย AI ของ Google จะย่อเอกสาร การประชุม หรือหน้าเว็บที่ยาวให้เป็นข้อมูลสรุปที่กระชับและนำไปใช้ได้จริง
  • การสร้างโค้ด: เครื่องมือสำหรับนักพัฒนาซอฟต์แวร์ใช้ Generative AI เพื่อเขียนและปรับโครงสร้างโค้ดใหม่ ซึ่งจะช่วยเพิ่มประสิทธิภาพการทำงานของนักพัฒนาซอฟต์แวร์
  • การสร้างรูปภาพและชิ้นงาน: ผู้ใช้สามารถสร้างชิ้นงานภาพ เช่น แบนเนอร์และภาพปก โดยใช้โมเดลการมองเห็น

วงจรของ Generative AI

โมเดล Generative AI ส่วนใหญ่ได้รับการฝึกโดยใช้โครงข่ายประสาทเทียม และสถาปัตยกรรม Transformer โมเดลจะเรียนรู้ที่จะแนะนำองค์ประกอบถัดไปในลำดับ เช่น คำ พิกเซล หรือโน้ตถัดไป โดยอิงตามองค์ประกอบก่อนหน้า

ในทางคณิตศาสตร์แล้ว การทำงานนี้ไม่ได้แตกต่างจาก AI เชิงคาดการณ์มากนัก ทั้ง 2 อย่างนี้เรียนรู้รูปแบบจากข้อมูล ความแตกต่างอยู่ที่ขนาด

ใน AI เชิงคาดการณ์ ตัวเลือกเอาต์พุตจะจำกัดไว้ที่ป้ายกำกับ 2-3 รายการ เช่น "การเลิกใช้งาน" หรือ "ไม่มีการเลิกใช้งาน" ใน Generative AI พื้นที่เอาต์พุตอาจมีตัวเลือกหลายแสนรายการ กลไกการคาดการณ์ได้รับการฝึกฝนจากตัวอย่างนับพันล้านรายการจนพัฒนาเป็นเครื่องมืออันทรงพลังที่สามารถสร้างเอาต์พุตใหม่ๆ ที่ไม่เคยเห็นมาก่อน

การพัฒนาระบบ Generative AI เป็นไปตามแนวทางแบบวนซ้ำ

แต่ละขั้นตอนจะชี้ไปยังขั้นตอนถัดไป
ในวงกลมต่อเนื่อง
รูปที่ 1 เช่นเดียวกับลูป AI แบบคาดการณ์ คุณเริ่มต้นด้วยการกำหนดกรณีการใช้งาน ลูปจะวนซ้ำในแต่ละขั้นตอนและเริ่มต้นอีกครั้ง

เราจะอธิบายวิธีการทำงานของฟีเจอร์นี้โดยใช้แอปพลิเคชันตัวอย่าง BlogBuddy ซึ่งเป็น ผู้ช่วยระบบจัดการเนื้อหาที่ช่วยให้ผู้ใช้สร้างคำอธิบายที่น่าสนใจ และชื่อบทความที่เหมาะกับ SEO

กำหนดกรณีการใช้งาน

พิมพ์เขียวระบบ BlogBuddy AI
รูปที่ 2 พิมพ์เขียวของระบบสำหรับแอปพลิเคชัน Blogbuddy เปิดแผนภาพขนาดเต็ม

คำชี้แจงปัญหาควรมีข้อมูลต่อไปนี้

  • รูปแบบอินพุตและเอาต์พุต ซึ่งอาจเป็นข้อความ (ร้อยแก้วหรือโค้ด) รูปภาพ หรือเสียง
  • วิธีการป้อนข้อมูล เนื้อหามาจากช่องอัปโหลด ข้อความอิสระ หรืออินพุตโครงสร้างอื่นๆ ใช่ไหม
  • กลุ่มเป้าหมาย ผู้ที่ดำเนินงานนี้คือใคร ผู้ใช้มีความรู้ทั่วไป หรือต้องการความรู้เฉพาะทาง

ฟีเจอร์ของ BlogBuddy มุ่งเน้นไปที่การสร้างข้อความ อินพุตเป็นแบบ กึ่งมีโครงสร้าง: ผู้ใช้ระบุหัวข้อหรือฉบับร่างสั้นๆ แล้วโมเดลจะแสดง รูปแบบต่างๆ กลุ่มเป้าหมายคือการตลาดที่มีความรู้เฉพาะทางด้านบรรณาธิการ

คุณควรตั้งค่ามาตรฐานคุณภาพสำหรับเอาต์พุต ในกรณีของเรา เราต้องการสร้างข้อความสั้นๆ ที่สแกนได้และมีคีย์เวิร์ดจำนวนมากซึ่งเหมาะกับโทนของสิ่งพิมพ์

เมตริกวัดความสำเร็จที่ชัดเจนจะช่วยให้คุณนำทางกระบวนการที่เหลือได้ คุณจะ ดูข้อมูลเพิ่มเติมเกี่ยวกับการรวบรวมเมตริกความสําเร็จได้ใน การพัฒนาที่ขับเคลื่อนด้วยการประเมิน

เลือกโมเดลพื้นฐาน

มีโมเดลมากมายที่พร้อมใช้งานซึ่งได้รับการฝึกล่วงหน้าจากชุดข้อมูลขนาดใหญ่และครอบคลุม และปรับเปลี่ยนลักษณะการทำงานให้เหมาะกับความต้องการเฉพาะได้ โดยปกติแล้ว โมเดล Generative AI จะมีขนาดใหญ่และซับซ้อนกว่าโมเดลเชิงคาดการณ์มาก ดังนั้นจึงควรสร้างต่อยอดจากโมเดลที่มีอยู่แทนที่จะสร้างและฝึกโมเดลของคุณเอง

ตัวเลือกของคุณจะเป็นตัวกำหนดความสามารถ ต้นทุน การปรับแต่ง และขอบเขตความเป็นส่วนตัวของผลิตภัณฑ์ การเลือกรุ่นมีความเชื่อมโยงอย่างมากกับแพลตฟอร์มที่คุณใช้ระบบ AI

ในส่วนหลังของหลักสูตรนี้ คุณจะได้เรียนรู้วิธีเลือกแพลตฟอร์ม

วิศวกรรมพรอมต์และบริบท

เมื่อเลือกรุ่นแล้ว คุณต้องป้อนคำสั่งที่ถูกต้องพร้อมพรอมต์ สำหรับ BlogBuddy เราอาจป้อนพรอมต์โมเดลดังนี้

Generate three short, engaging title suggestions for this article

คุณเพิ่มข้อมูลได้หลายประเภทลงในพรอมต์ เช่น

  • พรอมต์ของระบบที่กำหนดลักษณะการทำงานทั่วไป
  • บริบทเฉพาะอินพุตสำหรับงานปัจจุบัน
  • คำสั่งสำหรับผู้ใช้ในแอปพลิเคชันแบบสนทนา เช่น แชทบอทหรือเอเจนต์

การอนุมานและการประมวลผลภายหลัง

เมื่อประกอบพรอมต์แล้ว ระบบจะส่งไปยังโมเดลเพื่อทำการอนุมาน คุณสามารถเปลี่ยนพารามิเตอร์ของโมเดล ซึ่งรวมถึงอุณหภูมิ (เพื่อความสร้างสรรค์) และจำนวนโทเค็นสูงสุด (เพื่อความยาวและความละเอียด) เพื่อปรับวิธีที่โมเดลตอบ หลังจากสร้างแล้ว มักจะมีการประมวลผลเอาต์พุตด้วยกฎและขอบเขตเพิ่มเติม

เช่น คุณอาจปรับข้อความที่ระบุเพศ กลั่นกรองน้ำเสียง หรือกรองคำที่ถูกแบนออก

คุณสามารถเพิ่มโมเดลรองขนาดเล็กเพื่อจัดประเภทหรือสรุปผลลัพธ์เพื่อรองรับความโปร่งใสและการปรับเทียบความน่าเชื่อถือ เช่น "คำนำที่สร้างจากบทความที่เกี่ยวข้อง 12 รายการ ความมั่นใจ: สูง"

วงจรการประเมินและฟีดแบ็ก

เนื่องจากพื้นที่เอาต์พุตสำหรับ Generative AI นั้นแทบจะไม่มีที่สิ้นสุด พรอมต์ส่วนใหญ่จึงไม่มีคำตอบที่ถูกต้องเพียงคำตอบเดียว การเปรียบเทียบมาตรฐาน เช่น MMLU หรือ SQuAD สามารถวัดความสามารถทั่วไปของโมเดลได้ แต่แทบจะไม่ตอบโจทย์ความต้องการเฉพาะ ของผู้ใช้ที่เป็นมนุษย์ ในบริบทของผลิตภัณฑ์ คุณต้องกำหนดส่วนผสมของเมตริกเชิงคุณภาพและเชิงปริมาณด้วยตนเอง ดังนี้

  • ความถูกต้อง: เอาต์พุตถูกต้องตามข้อเท็จจริงไหม
  • ประโยชน์: เอาต์พุตเป็นไปตามความคาดหวังที่พรอมต์กำหนดหรือเจตนาของผู้ใช้หรือไม่
  • ความสามารถในการอ่านและโทน: ผลลัพธ์ชัดเจนและสอดคล้องกับมาตรฐานแบรนด์หรือไม่
  • ความพยายามของมนุษย์: ต้องมีการแก้ไขหรือดูแลจัดการด้วยตนเองมากเพียงใด
  • ความเข้าใจโดเมน: เอาต์พุตแสดงความรู้เฉพาะโดเมนหรือไม่

หากต้องการประเมินเมตริกเหล่านี้ คุณสามารถใช้การตรวจสอบจากเจ้าหน้าที่และการให้คะแนนอัตโนมัติร่วมกันได้ เช่น คุณสามารถขอให้ผู้ใช้ให้คะแนนเอาต์พุตในชีวิตจริง ใช้โมเดลที่ 2 สำหรับ การประเมินอัตโนมัติ (เรียกอีกอย่างว่า LLM-as-a-judge) และทำการตรวจสอบภายในเป็นระยะๆ เพื่อหาอคติหรืออาการหลอน

ข้อมูลการใช้งานจริงเป็นหนึ่งในทรัพย์สินที่มีค่าที่สุดเมื่อสร้างด้วย Generative AI หากเป็นไปได้ ให้บันทึกการโต้ตอบเหล่านี้เพื่อปรับแต่งพรอมต์และบริบท ทดสอบโมเดลต่างๆ หรือปรับพารามิเตอร์เมื่อเวลาผ่านไป การโต้ตอบ การแก้ไข หรือการให้คะแนนของผู้ใช้แต่ละครั้งจะกลายเป็นความคิดเห็นที่ช่วยคุณกำหนดขั้นตอนการเพิ่มประสิทธิภาพครั้งถัดไปได้

  • อินพุตของผู้ใช้ที่ไม่คาดคิดจะช่วยให้คุณทราบว่ากำลังแก้ปัญหาที่ถูกต้องหรือไม่
  • คำขอที่เกิดขึ้นซ้ำๆ สำหรับโดเมนที่เฉพาะเจาะจงจะช่วยให้ทราบถึงตัวเลือกโมเดล คุณอาจเปลี่ยน จาก LLM ขนาดใหญ่ทั่วไปเป็นโมเดลขนาดเล็กที่ปรับแต่งมาอย่างละเอียด
  • การหลอนบ่อยๆ อาจบ่งบอกถึงการขาดบริบทที่เฉพาะเจาะจงในพรอมต์ของคุณ
  • การแก้ไขอย่างหนักอาจบ่งบอกถึงบริบทที่แชร์ไม่เพียงพอ โมเดลไม่ทราบข้อมูลที่ผู้ใช้ถือว่าทราบอยู่แล้ว

เมื่อเวลาผ่านไป วงจรความคิดเห็นเหล่านี้จะเปลี่ยนฟีเจอร์ Generative AI จากการเรียกโมเดลแบบคงที่ให้กลายเป็นระบบที่มีชีวิตซึ่งปรับให้เข้ากับความต้องการและความชอบของผู้ใช้ได้อย่างต่อเนื่อง

ข้อผิดพลาดที่พบบ่อยและการลดความเสี่ยง

เนื่องจาก Generative AI ทำงานในพื้นที่เปิดของอินพุตและเอาต์พุต พื้นผิวความเสี่ยงจึงกว้างกว่าในระบบการคาดการณ์มาก นอกจากจะสร้างเอาต์พุตที่ไม่ถูกต้องแล้ว ยังอาจสร้างเนื้อหาที่เป็นพิษ มีอคติ หรือทำให้เข้าใจผิด หรือแม้แต่ โน้มน้าวผู้ใช้โดยไม่ตั้งใจได้ด้วย ความล้มเหลวเหล่านี้อาจทำให้ความน่าเชื่อถือลดลงและทำให้บริษัทของคุณ ต้องเผชิญกับผลกระทบทางการเงินหรือทางกฎหมาย

ด้วยเหตุนี้ Generative AI จึงต้องใช้แนวทางการจัดการความเสี่ยงเชิงรุกอย่างต่อเนื่อง ความเสี่ยงที่พบบ่อยที่สุดมีดังนี้

  • อาการหลอนของ AI: โมเดลแต่งข้อเท็จจริงขึ้นมาหรือระบุรายละเอียดผิด หากต้องการ ลดผลกระทบ ให้ใช้ RAG เพื่ออ้างอิงข้อเท็จจริง
  • เชื่อมั่นมากเกินไป: ผู้ใช้คิดว่าเอาต์พุตถูกต้องเสมอ เพื่อลดความเสี่ยง แนะนําให้ใช้ขั้นตอนการตรวจสอบและแก้ไขแทนการเผยแพร่โดยอัตโนมัติ ใน การกำกับดูแล AI: การสร้างอย่างมีความรับผิดชอบ คุณจะ ได้เรียนรู้วิธีช่วยผู้ใช้ปรับระดับความไว้วางใจ
  • ความไม่สอดคล้องกัน: เอาต์พุตจะแตกต่างกันอย่างมากในแต่ละครั้งที่รัน หากต้องการลดปัญหา ให้ใช้เทมเพลตพรอมต์ การควบคุมอุณหภูมิ หรือตัวอย่างแบบไม่กี่ช็อตเพื่อรักษาโทนและ โครงสร้าง
  • เนื้อหาที่เป็นพิษหรือเป็นอันตราย: โมเดลสร้างข้อความที่ลำเอียง ไม่เหมาะสม หรือ เป็นการบิดเบือน หากต้องการลดความเสี่ยง ให้ใช้ตัวกรองการกลั่นกรองและเครื่องมือแยกประเภทความเป็นพิษก่อนแสดง ทดสอบเอาต์พุตอย่างต่อเนื่องด้วยพรอมต์จริงและสร้างวงจรความคิดเห็นเพื่อแจ้ง และฝึกซ้ำในกรณีที่ซับซ้อน
  • เวลาในการตอบสนองและต้นทุน: โมเดลขนาดใหญ่อาจทำงานช้าและมีค่าใช้จ่ายสูง โดยเฉพาะอย่างยิ่งหากคุณตั้งเป้าที่จะนำไปใช้ในวงกว้าง การประมาณต้นทุน และการใช้ทรัพยากรของโมเดลล่วงหน้าอาจเป็นเรื่องยาก หากต้องการลดปัญหา ให้ใช้การแคช การประมวลผลแบบกลุ่ม และโมเดลขนาดเล็กสำหรับงานสั้นๆ

สิ่งที่ได้เรียนรู้

กล่าวโดยย่อคือ Generative AI จะเปลี่ยนไอเดียดิบๆ ให้กลายเป็นเนื้อหาที่จับต้องได้ เช่น ข้อความ รูปภาพ โค้ด หรือการสนทนา โดยจะทำงานได้ดีในกรณีที่ความคิดสร้างสรรค์และความสามารถในการปรับตัว มีความสำคัญมากกว่าความแม่นยำ

ในฐานะนักพัฒนาเว็บ ความสำเร็จของคุณขึ้นอยู่กับการออกแบบพรอมต์ที่เหมาะสม การอิงโมเดลกับข้อมูลที่ถูกต้อง และการปรับระบบให้สอดคล้องกับค่ากำหนดของผู้ใช้อย่างต่อเนื่อง

แหล่งข้อมูล

อ่านเกี่ยวกับการเลือกโมเดลขนาดเล็กและยั่งยืน หากต้องการเรียนรู้เพิ่มเติม

ทดสอบความเข้าใจ

ผลลัพธ์ของ Generative AI กับ Predictive AI แตกต่างกันอย่างไร

เอาต์พุตของ Generative AI จะจำกัดไว้ที่ป้ายกำกับเพียงไม่กี่รายการ เช่น "เลิกใช้งาน" หรือ "ไม่เลิกใช้งาน"
ไม่ถูกต้อง
Generative AI สร้างเนื้อหาใหม่จากพื้นที่เอาต์พุตของตัวเลือก (ข้อความ พิกเซล โค้ด)
เยี่ยมมาก ถูกต้องแล้ว
Generative AI ใช้สำหรับการคาดการณ์เชิงตัวเลขเท่านั้น
ไม่ถูกต้อง
Generative AI ไม่ได้ใช้ข้อมูลเพื่อเรียนรู้รูปแบบ
ไม่ถูกต้อง

อุณหภูมิของโมเดลมีบทบาทอย่างไร

ซึ่งจะควบคุมความสุ่มของคำตอบของโมเดล
ไม่ถูกต้อง
โดยจะปรับความสร้างสรรค์ของคำตอบของโมเดล
เยี่ยมมาก ถูกต้อง
โดยจะกรองคำที่ถูกแบนออก
ไม่ถูกต้อง
ซึ่งจะเพิ่มความเร็วของโมเดล
ไม่ถูกต้อง

เหตุใดเกณฑ์มาตรฐานที่ได้มาตรฐานจึงมักไม่เพียงพอต่อการประเมิน Generative AI

มีค่าใช้จ่ายในการดำเนินการสูงเกินไป
ไม่ถูกต้อง
ซึ่งมักจะไม่ตอบโจทย์ความต้องการที่เฉพาะเจาะจงของผู้ใช้ที่เป็นมนุษย์และความตั้งใจของผลิตภัณฑ์
เยี่ยมมาก ถูกต้อง
โดยจะใช้ได้กับการสร้างรูปภาพเท่านั้น ไม่ใช่ข้อความ
ไม่ถูกต้อง
ซึ่งโมเดลสมัยใหม่สามารถผ่านการทดสอบนี้ได้ง่ายเกินไป
ไม่ถูกต้อง

ข้อใดต่อไปนี้คือการลดปัญหาการหลอนที่พบบ่อย

ใช้เทคนิคต่างๆ เช่น RAG (Retrieval-Augmented Generation) เพื่อให้ข้อมูลอ้างอิงเป็นข้อเท็จจริง
เยี่ยมมาก ถูกต้องแล้ว
เพิ่มอุณหภูมิของโมเดลเพื่อให้มีความคิดสร้างสรรค์มากขึ้น
ไม่ถูกต้อง
หยุดใช้ AI แล้วเปลี่ยนไปสร้างเนื้อหาด้วยตนเอง
ซึ่งอาจเกิดขึ้นได้ แต่ไม่ใช่แนวทางที่จะช่วยให้โมเดลสร้างเอาต์พุตที่แม่นยำมากขึ้น
ซ่อนเอาต์พุตจากผู้ใช้หากดูน่าสงสัย
แม้ว่าคุณจะพยายามป้องกันไม่ให้ผู้ใช้ได้รับข้อมูลเท็จ แต่ก็ไม่ได้เป็นการแก้ปัญหาการหลอนอย่างต่อเนื่อง

คุณควรทำอย่างไรกับความคิดเห็นของผู้ใช้ตามวงจร Generative AI

โปรดลบออกทันทีเพื่อปกป้องความเป็นส่วนตัว
ไม่ถูกต้อง
ใช้เพื่อปรับแต่งคำจำกัดความของปัญหา การเลือกโมเดล หรือพรอมต์
เยี่ยมมาก ถูกต้อง
จัดเก็บไว้ในฐานข้อมูลแยกต่างหากและอย่าดู
ไม่ถูกต้อง
ใช้เพื่อลงโทษโมเดลสำหรับลักษณะการทำงานที่ไม่ดีเท่านั้น
ไม่ถูกต้อง