Yann LeCun’s World Model

ปรับปรุงจากโพสต์ต้นฉบับใน Facebook

ในรอบสัปดาห์ที่ผ่านมา ข้อความบรรทัดเดียวที่สั่นสะเทือนวงการ AI คือ อ.ยาน Yann LeCun ออกมาโพสต์ว่า “ถ้าคุณเป็นนักเรียนที่อยากทำเรื่อง AI ยุคถัดไป ก็อย่ามาทำเรื่อง LLM เลย”

If you are a student interested in building the next generation of AI systems, don't work on LLMs https://t.co/H1qX3gClEu

— Yann LeCun (@ylecun) May 22, 2024

ข้อความสั้นๆ ประโยคเดียว แต่พอคนโพสต์เป็น อ. Yann อิมแพคมันเลยสูงมาก สารภาพว่าผมเห็นข้อความนี้ตอนแรกก็อึ้งๆ ไปเล็กน้อย แต่พอมานั่งทบทวนดูก็ถือว่าไม่เกินคาด เมื่อเทียบกับสิ่งที่แกพูดบ่อยๆ ในช่วงหลัง (เพียงแต่ไม่คิดว่าแกจะพูดออกมาตรงๆ ขนาดนี้)

สำหรับคนนอกวงการอาจไม่รู้จักว่า อ. Yann เป็นใคร ตำแหน่งอย่างเป็นทางการของแกคือ Chief AI Scientist ของ Meta (ชื่อในอดีตคือ Facebook AI Research หรือ FAIR) อธิบายง่ายๆ ว่าเป็นผู้นำสูงสุดในสายงานวิจัย AI ของ Meta/Facebook นั่นเอง

อ. Yann ถือเป็นหนึ่งในสาม Godfathers of AI ของวงการ หากใครเริ่มเข้าสู่วงการ AI น่าจะเคยเขียนโค้ดฝึก AI ให้อ่านลายมือภาษาอังกฤษ ที่เทียบได้กับ Hello World ของวงการโปรแกรมมิ่ง เจ้าฐานข้อมูลลายมือ MNIST ก็สร้างโดย อ. Yann นี่ล่ะ ทุกวันนี้เรายังต้องดาวน์โหลดลายมือจากเว็บส่วนตัวของแกกันอยู่เลย

เคยเขียนถึง อ. Yann ไปแล้วครั้งหนึ่ง Yann LeCun and the AI Gold Rush

เมื่อคนระดับ อ. Yann ออกมาวิจารณ์เรื่อง LLM ที่เป็นกระแสอยู่ในตอนนี้ จึงเป็นสิ่งที่น่าจับตา ต้นเหตุของโพสต์นี้มาจากแกไปพูดงาน VivaTech ที่ฝรั่งเศส (แกเป็นคนฝรั่งเศส) และบอกว่า LLM เป็นเกมของยักษ์ใหญ่เท่านั้น เราไม่สามารถประดิษฐ์คิดค้นอะไรเกี่ยวกับ LLM ได้เองลำพังอีกแล้ว เอาเวลาไปทำอย่างอื่นดีกว่า

เรื่องนี้ก็ตรงกับที่ผมคิด และเคยเขียน-พูดตามเวทีต่างๆ ไว้ประมาณนึงว่า LLM มันเป็นเกมของยักษ์ใหญ่ระดับโลก ต้องใช้ทรัพยากรมหาศาลทั้ง GPU/ข้อมูล/นักวิจัย มีบริษัทที่ทำได้จริงจังอยู่ไม่เกินนิ้วมือข้างเดียว และตอนนี้ดูเหมือนจะเหลือแค่สองขั้วคือ Google vs OpenAI/Microsoft ยืนซัดกันอยู่เท่านั้น บริษัทยักษ์ใหญ่รายอื่นก็หมดสิทธิต่อกรแล้ว

แต่ถ้าใครติดตาม อ. Yann มา น่าจะเคยเห็นสิ่งที่แกวิจารณ์ข้อจำกัดของ LLM อยู่บ่อยๆ (แม้ Meta ของแกก็ทำโมเดล Llama) ว่ามันไม่มี “ตรรกะ” “เหตุผล” “การวางแผน” อะไรมากนัก มันเป็นแค่เครื่องมือพยากรณ์คำที่เก่งมากๆ ตัวหนึ่งเท่านั้น

ชาว Prompt Engineer อาจกรีดร้องกับสิ่งนี้ และอาจตั้งแง่กับ อ. Yann ว่า LLM มันเก่งฉกาจเบอร์นี้แล้ว ถามอะไรตอบได้ แต่งกลอนได้ เขียนโปรแกรมได้ ยังจะเรียกร้องอะไรอีก อ. อิจฉาที่ OpenAI ทำโมเดลได้เก่งกว่าตัวเองใช่ไหมเลยออกมาแซะเขาเสียๆ หายๆ อะไรแนวๆ นี้

เผอิญว่า อ. Yann แกน่าจะเป็นสาย “คนจริง” แกเลยเสนอสถาปัตยกรรม AI ที่น่าจะมีความฉลาด มีความเข้าใจต่อโลกภายนอก มีปัญญา มีเหตุผล ทัดเทียมกับมนุษย์ขึ้นมาได้จริงๆ มาได้สักพักหนึ่งแล้ว (ตั้งแต่ต้นปี 2022) โดยมีชื่อเรียกรวมๆ ว่าเป็น autonomous intelligence

autonomous intelligence ของ อ. Yann นั้นเลียนแบบการทำงานของสมองมนุษย์ มีโมดูลชิ้นส่วนต่างๆ ทำงานร่วมกัน เช่น หน่วยควบคุม (configurator), หน่วยรับข้อมูลภายนอก (perception) และที่สำคัญที่สุดคือ ตัวสร้างโมเดลของโลก (world model) เพื่อพยากรณ์ว่าโลกภายนอกจะเปลี่ยนไปอย่างไร แล้วโมเดลจะสั่งการให้ทำอะไร

สถาปัตยกรรมของ อ. Yann นั้นซับซ้อนมาก (แกบอกว่ารวบรวมความคิดทั้งชีวิตมาทำเรื่องนี้) ผมพยายามอ่านงานเขียน-ดูคลิปแกบรรยายตามที่ต่างๆ แล้วพบว่ามันไกลเกินกว่าสติปัญญาของผมจะเข้าใจได้แล้ว พลังวัตรไม่พอ 555 หากใครสนใจลองดูคลิป ซึ่งเป็นคลิปที่ อ. Yann เองแนะนำให้ดู

กล่าวโดยสรุปคือ ในโลกที่เราพูดคำว่า AI กันจนเฝือ และโมเดลภาษา LLM เริ่มมาถึงข้อจำกัดของมันแล้ว (หลังพัฒนาแบบก้าวกระโดดในช่วง 2 ปีนี้) ก้าวต่อไปของ AI ยังไม่ชัดเจนว่าจะไปทางไหนต่อ แต่อย่างน้อย อ. Yann ในฐานะหนึ่งในผู้ทรงอิทธิพลของโลกสายวิจัย ก็มีข้อเสนอที่ยิ่งใหญ่ มีพิมพ์เขียวว่ามันควรเป็นอย่างไร ซึ่งก็เป็นสิ่งที่พวกเราๆ ต้องศึกษากันต่อไปนั่นเอง

Published

June 3, 2024

Isriya Paireepairit in Technology | June 3, 2024

Yann LeCun’s World Model