buzzword ยอดนิยมของโลกไอทีในรอบหลายปีที่ผ่านมา ย่อมมีคำว่า Big Data ติดอันดับอยู่เสมอ และคำใหม่ที่กำลังมาแรงคือ AGI (artificial general intelligence)
ทั้งสองคำนี้ส่งเสริมซึ่งกันและกัน เรามักเห็นการพูดถึงการนำปริมาณข้อมูลขนาดใหญ่มากขึ้นเรื่อยๆ (ใหญ่แค่ไหนก็ไม่ทราบชัด) นำมาเทรน AI ที่ฉลาดขึ้นเรื่อยๆ จนสุดท้ายมันจะกลายร่างเป็น AGI เข้าสักวัน
แต่มีบุคคลหนึ่งที่ปฏิเสธแนวทางที่ว่านี้ เขาคือ Andrew Ng ผู้ยิ่งใหญ่อีกคนของโลก AI และน่าจะเป็น “อาจารย์” ของวงการ AI ที่มีลูกศิษย์มากที่สุดในโลก (จากคอร์สของเขาใน Coursera ที่ตัวเลขในระบบบอกว่ามีคนเรียน 6.4 ล้านคน)
ประวัติของ Andrew Ng ก็ไม่ธรรมดา เขาเป็นหนึ่งในผู้ก่อตั้ง Google Brain, ผู้ร่วมก่อตั้ง Coursera, หัวหน้านักวิจัย Baidu และที่ผมเพิ่งรู้จากบทสัมภาษณ์เขาคือ เขามีเอี่ยวกับโครงการเฮลิคอปเตอร์บนดาวอังคารด้วย เพราะเคยมีงานวิจัยเรื่องการบินอัตโนมัติด้วย AI และลูกศิษย์ PhD คนแรกของเขาคือ Pieter Abbeel ก็เป็นหัวเรี่ยวหัวแรงในวงการนี้
คนระดับ Andrew Ng ที่สามารถเรียกได้เต็มปากว่าเป็นหนึ่งใน godfather ของวงการ AI จะหันไปทำอะไร “ใหญ่ๆ” แบบ OpenAI สร้างโมเดล GPT คงไม่ใช่เรื่องน่าแปลกใจนัก
แต่สิ่งที่เขาเลือกทำหลังออกจาก Baidu ในปี 2017 กลับเป็นทางตรงข้ามเลย เขาไปก่อตั้งบริษัทชื่อ Landing AI ซึ่งเลือกทำ AI แบบเฉพาะทางแทน นั่นคืองานสายวิเคราะห์ภาพ (computer vision) เจาะกลุ่มลูกค้าอุตสาหกรรม
แนวคิดของ Andrew Ng เรียกว่า Data-Centric AI ซึ่งเขาอธิบายไว้ในบทสัมภาษณ์กับ MIT Sloan ได้ครบถ้วนเห็นภาพดี
Data-Centric AI คือการมองว่า การแข่งกันที่ระดับโมเดลของ AI (compute/code) นั้นไม่ได้ช่วยเพิ่มประสิทธิภาพของผลลัพธ์อีกมากนักแล้ว เราควรมาสนใจเรื่องคุณภาพของข้อมูล (data) ที่ใช้เทรนโมเดลแทนดีกว่า
Andrew Ng บอกว่า บริษัทที่มีข้อมูลปริมาณมากๆ มีผู้ใช้งานเป็นหลักพันล้านคนนั้นเอาจริงๆ มีไม่เยอะเลย บริษัทพวกนี้มีทุกอย่างพร้อม มีคน มีเงิน มีข้อมูล มีทรัพยากรเครื่อง สามารถทำโมเดลขนาดใหญ่ๆ มากๆ ได้ไม่ยาก และเราเห็นการนำโมเดล AI ระดับสูงเหล่านี้ไปใช้งานในผลิตภัณฑ์อื่นๆ ของบริษัทกันมากมาย
แต่ถ้าเราลองไปดูในบริษัทระดับทั่วๆ ไป เช่น โรงพยาบาล โรงงาน เรากลับไม่เห็นการนำ AI ไปใช้งานกันมากเท่าที่ควร (ทั้งที่มีประโยชน์มหาศาล) แม้เป็นงานง่ายๆ อย่างการวิเคราะห์ภาพสินค้าว่ามีปัญหา defect หรือไม่ ก็ยังไม่ค่อยมีคนใช้กัน
“If I go see a health care system or manufacturing organization, frankly, I don’t see widespread AI adoption anywhere.” This is due in part to the ad hoc way data has been engineered
เหตุผลของ Andrew Ng มองว่าเป็นเพราะบริษัทเหล่านี้มี “ข้อมูล” ไม่เยอะมาก อาจมีรูปสินค้าที่มีปัญหาเพียง 50 รูปเท่านั้น ข้อมูลเพียงเท่านี้จะนำไปเทรนให้เป็นโมเดลระดับ GPT หลายพันล้านพารามิเตอร์ได้อย่างไรกัน
ปัญหาเรื่องข้อมูลที่มีจำกัด จึงกลายเป็นจุดร่วมขององค์กรขนาดเล็กจำนวนมาก ซึ่งสาเหตุมาจากวิธีการเก็บข้อมูลที่ไม่เป็นระบบนัก (ข้อมูลเดียวกันในองค์กรคนละแห่ง มีฟิลด์หรือวิธีเก็บแตกต่างกันอย่างสุดขั้ว, วิธีการ label ข้อมูลของผู้เชี่ยวชาญภาคอุตสาหกรรมแต่ละคนต่างกัน) หรือบางครั้งก็มีความจำกัดที่ตัวข้อมูลจริงๆ (เช่น ภาพ x-ray โรคหายาก มันก็มีแค่ไม่กี่ภาพเพราะมีคนป่วยไม่กี่คน)
The recipe for AI adoption in consumer software internet companies doesn’t work for many other industries, Ng said, because of the smaller data sets and the amount of customization needed.
“I think what every hospital needs, what every health care system may need, is a custom AI system trained on their data,” Ng said. “Same for manufacturing. In deep visual defect inspection, every factory makes something different. And so, every factory may need a custom AI model that’s trained on pictures.”
ตัวอย่างการ label ภาพสินค้าว่ามีตำหนิหรือไม่ ผู้เชี่ยวชาญการคัดแยกเห็นตรงกันว่า ภาพซ้ายมีตำหนิชัดเจน ภาพขวาไม่มีตำหนิแน่นอน แต่ภาพตรงกลาง ความเห็นอาจแตกต่างกัน ส่งผลให้ข้อมูลที่ใช้เทรนไม่สม่ำเสมอ (inconsistent)
เป้าหมายของ Landing AI จึงเป็นการหาวิธีให้องค์กรขนาดเล็ก ที่มีปริมาณข้อมูลจำกัด (small data) สามารถนำ AI มาช่วยทำงานได้เหมือนกัน ขอเพียงแค่ว่าสามารถสร้างข้อมูลที่มีคุณภาพ (good data) มาใช้เทรนโมเดลได้
For industries that don’t have access to tons of data, “being able to get things to work with small data, with good data, rather than just a giant dataset, that would be key to making these algorithms work,”
สิ่งที่ Landing AI ทำคือการสร้างเครื่องมือชื่อ LandingLens เพื่อช่วยให้องค์กรจัดการกับข้อมูลภาพของตัวเองได้ดีขึ้น เป็นกระบวนการ MLops (machine learning operations) คือไม่ใช่ทำงานที่ตัวโมเดลโดยตรง แต่ทำที่งานปฏิบัติการอื่นๆ ที่รายล้อมตัวโมเดลอยู่
LandingLens จะทำคลังภาพที่เรียกว่า Defect Book เอาไว้สะสมตัวอย่างของภาพสินค้าที่มีปัญหา, มีตัวช่วยทำ label ข้อมูลกำกับแต่ละภาพ, กระบวนการนำข้อมูลไปเทรน วัดผล และเทรนซ้ำ เพื่อให้ได้ผลลัพธ์ออกมาดีที่สุด
อธิบายง่ายๆ มันคือชุดเครื่องมือเกือบสำเร็จรูปที่ให้องค์กรทำโมเดล computer vision ของตัวเอง โดยไม่จำเป็นต้องมีผู้เชี่ยวชาญเรื่องโมเดล หรือแม้แต่เครื่องที่ใช้ประมวลผล ขอเพียงแค่มีโจทย์ มีภาพ ก็เข้ามาจ่ายเงินแบบ pay-per-use กับ Landing AI ได้เลย
1/Landing AI is releasing our computer vision tool for anyone to use! You can label images, train a model, and deploy your model to production in minutes. Our data-centric tool then helps you improve your model quickly. Start for free at https://t.co/802tOScsqH pic.twitter.com/LpWzISV0k9
— Andrew Ng (@AndrewYNg) February 22, 2023
สิ่งที่ Andrew Ng ทำไม่ได้ซับซ้อนแบบพวกโมเดล LLM ขนาดใหญ่ (ทั้งที่แกเคยทำงานวิจัยยิ่งใหญ่ๆ มา) แต่เป็นการประยุกต์ใช้งานที่ระดับปลายทางแล้ว จึงน่าสนใจมากว่าแกเห็นช่องว่างอะไร ถึงมาทำแนวนี้
สิ่งที่พอวิเคราะห์ได้คือ Andrew Ng ทำผลิตภัณฑ์ที่มีกลุ่มเป้าหมายชัดเจนมากๆ (computer vision สำหรับลูกค้าภาคอุตสาหกรรม) เขาน่าจะเห็นว่าในตลาดมีโอกาสแบบนี้เยอะมาก (ลูกค้ารายย่อยแต่จำนวนมากๆ) ก็คงต้องรอดูกันว่าเขาและ Landing AI จะประสบความสำเร็จแค่ไหน เพราะปัจจุบันมีบริษัทที่ทำด้าน MLops มากมาย และมีบริษัทที่ทำผลิตภัณฑ์แข่งกับ Landing AI เป็นจำนวนมาก
“I see lots of, let’s call them $1 million to $5 million projects, there are tens of thousands of them sitting around that no one is really able to execute successfully,” Ng said. “Someone like me, I can’t hire 10,000 machine learning engineers to go build 10,000 custom machine learning systems.”
ก็น่าสนใจว่าในโลกที่เน้นอะไรใหญ่ๆ อลังๆ เรากลับเห็นคนที่มีโปรไฟล์ระดับนี้ หันไปจับตลาดสิ่งที่เล็กๆ แต่มีจำนวนมากแทน
ในคลิป TED Talk ด้านล่าง Andrew เปรียบเทียบกับโลกยุคอดีต ที่มีแค่ “พระ” หรือ “นักบวช” เท่านั้นที่สามารถเข้าถึงทักษะการอ่าน-เขียนได้ ทักษะเหล่านี้ถูกจำกัดไว้ที่คนระดับสูงเท่านั้น เหมือนกับโลก AI ทุกวันนี้ที่ทักษะยังจำกัดอยู่กับวิศวกร machine learning ระดับสูงเช่นกัน เป้าหมายของเขาคือ “ปลดล็อค” ทักษะพวกนี้ออกมาให้คนจำนวนมากใช้งานได้ (democratizing access)
หมายเหตุ: นอกจาก Landing AI แล้ว Andrew Ng ยังมีอีกโปรเจคคือ DeepLearning.ai ที่เน้นเรื่องการอบรม รวมถึงไปลงทุนในบริษัทสตาร์ตอัพ AI อื่นๆ อีกมากด้วย