in Technology

Google I/O 2025

เมื่อเจ้านายขอให้สรุปงาน Google I/O 2025 เมื่อคืนนี้ให้

เนื่องจากเดี๋ยวนี้แก่แล้วอยู่ดึกดูไม่ไหว ส่วนกลางวันก็มีภารกิจมากมาย เลยเพิ่งดู keynote จนจบ มาช้าดีกว่าไม่มาเนอะ

ผมเห็นฝรั่งโพสต์เอาไว้ว่า Google I/O ครั้งนี้ “ดีที่สุด” ในรอบหลายปี พอได้ดูเองแล้วก็เห็นด้วยตามนั้น

นับตั้งแต่ ChatGPT เปิดตัวช่วงปลายปี 2022 กูเกิลในฐานะผู้ริเริ่ม “T” (Transformer) ก็ตกเป็นผู้ตามมาโดยตลอด ออกอะไรมาก็ไล่ตาม OpenAI ไม่ทัน แถมหลายครั้งยังโดน OpenAI เปิดตัวของตัดหน้ากันดื้อๆ ให้เป็นที่เยาะเย้ยด้วยซ้ำ

แต่หลังจัดทัพกันใหม่ ปรับกระบวนท่ากันมาพอสมควร งาน Google I/O 2025 คงถูกเรียกได้ว่าเป็น “จุดเปลี่ยน” ที่กูเกิลกำลังเปลี่ยนตัวเองจากผู้ตามมาเป็นผู้นำสักทีครับ

แยกประเด็นตามนี้

1. เรือธง AI Chat ตามทัน + แซงหน้าทุกคนแล้ว

เราเห็น Gemini ง่อยๆ มาพักใหญ่ๆ ถามอะไรก็ตอบไม่ค่อยได้ (ทั้งตั้งใจไม่ตอบ และไม่ตั้งใจคือตอบไม่ได้จริงๆ) แต่คราวนี้ Gemini กำลังไล่ตามมาอย่างยิ่งใหญ่ อะไรที่ควรมี คู่แข่งมี ตอนนี้ทำได้หมดแล้ว

ถ้าไม่มีเวลาจริงๆ สามารถดูได้เพียงคลิปเดียว ขอแนะนำคลิปนี้ แสดงแสนยานุภาพของ Gemini Live

ที่สำคัญคือ Gemini Live มันฟรีแบบไม่ต้อง subscribe ใดๆ ฟรีทุกคนแบบไร้เงื่อนไข เหตุผลก็เพราะว่ากูเกิลรวยมากจนทำแบบนี้ได้ (แล้วใครมันจะไปสู้ได้)

2. โมเดล LLM มีทั้งเก่งที่สุด x ถูกที่สุด

ตัว Gemini ในฐานะโมเดล LLM ก็ตามหลังโมเดลตระกูล GPT-4 หรือ Claude มาตลอดเช่นกัน เพิ่งมีช่วงปี 2025 นี้เองที่ Gemini 2.5 Pro ผงาดขึ้นมาครองชาร์ทอันดับ 1 ในเบนช์มาร์คต่างๆ ได้สำเร็จ

to be fair คืออันดับในชาร์ทมันเปลี่ยนแปลงได้เสมอ พรุ่งนี้ OpenAI อาจออกโมเดลใหม่มาโค่น Gemini ได้ แต่การที่ Gemini มันขึ้นมาติดชาร์ทอันดับ 1 อยู่พักใหญ่ๆ แปลว่าตอนนี้กูเกิลมีศักยภาพที่จะสร้าง “โมเดลระดับแชมป์” ได้แล้ว (ก่อนหน้านี้ทำไม่ได้ไง) ดังนั้นถ้า OpenAI หรือ Anthropic มาโค่นแชมป์ได้ อีกสักพักกูเกิลก็น่าจะแซงกลับได้ (ถ้าต้องการ)

แต่โมเดลเก่งที่สุด ไม่ได้แปลว่าดีที่สุดเสมอไป เพราะปัจจัยเรื่องความเร็ว latency และราคาค่ารันก็มีผลเหมือนกัน

กูเกิลเลยมีโมเดลอีกตัวคือ Gemini 2.5 Flash ที่ไม่ต้องเก่งมาก แต่ตอบเร็วและราคาถูกมากมาให้เลือกใช้สำหรับงานทั่วๆ ไป (กูเกิลใช้คำว่า workhorse model) แถมกูเกิลยังคอยอัพเดตมันอยู่ตลอดเวลา ทำให้ความสามารถเพิ่มขึ้นเรื่อยๆ ตอนนี้ขึ้นมาติดชาร์ทอันดับ 2 แล้ว (คือเป็นรองแค่ Gemini 2.5 Pro พี่ใหญ่ของตัวเองเท่านั้น)

สิ่งที่เซอร์ไพร์สมากที่สุดใน I/O รอบนี้คือ Gemini 2.5 Flash มันถูกลงอีก เพราะใช้ token น้อยลงครับ ถ้าถามว่าภาพไหนที่สำคัญที่สุดใน I/O รอบนี้ ผมยกให้เป็นภาพ Pareto Frontier ที่แสดงวิธีคิดของกูเกิลในการสร้างโมเดล สังเกตว่าโมเดลของกูเกิล ซึ่งอยู่บนเส้นสีฟ้าในภาพ จะเป็นโมเดลที่อยู่ขวาบนสุดของตลาด ซึ่งหมายความว่า price/performance ดีที่สุดในตลาดนั่นเอง

แปลว่าต่อให้พรุ่งนี้ OpenAI หรือ Anthropic ออกโมเดลตัวเทพมา ก็ไม่มีทางทำ price/performance สู้กูเกิลได้อยู่ดี

(หมายเหตุ: หลังจาก Google I/O สองวัน Anthropic ออก Claude 4 มาแซงหน้า Gemini ได้จริงๆ)

ตลาดโมเดล LLM ตอนนี้น่าจะอยู่ในระดับที่ “โมเดลอะไรก็ให้ผลลัพธ์พอๆ กัน” สำหรับงานส่วนใหญ่แล้ว ผมเพิ่งฟัง startup รายหนึ่งมานำเสนอผลิตภัณฑ์ ซึ่งเขาระบุว่าเลือกใช้ Gemini ด้วยเหตุผลนี้เลย คือ ความสามารถพอๆ กัน แต่ราคาถูกกว่ากันมาก ซึ่งอันนี้น่ากลัวมากสำหรับคู่แข่ง

3. โมเดลประเภทอื่นก็จัดเต็ม

นอกจากโมเดลภาษาที่เป็นโมเดลหลักแล้ว กูเกิลยังมีโมเดลสร้างภาพ วิดีโอ เพลง เวอร์ชันใหม่เปิดตัวมาครบคือ Imagen 4, Veo 3, Lyria 2

ทีเด็ดคงเป็นตัว Veo 3 ที่สร้างเสียงประกอบในวิดีโอได้แล้ว ไม่ต้องไปทำเสียงแยก

นอกจากนี้กูเกิลยังออก Flow เครื่องมือสร้างหนังด้วย AI (อำนวยความสะดวกให้ใช้โมเดลข้างต้นง่ายๆ) มันอธิบายเป็นตัวหนังสือยาก เอาเป็นว่าดูคลิปกันเองดีกว่า แล้วจะจบว่า The end of Pixar is near 555

4. Personalization ทำไปทำไม เมื่อกูเกิลรู้จักเราหมดอยู่แล้ว

อีกประเด็นที่น่าสนใจคือ เมื่อเราใช้บริการ AI มากขึ้นเรื่อยๆ เราก็คาดหวังความสะดวก ไม่ต้องการมาสอน AI ทุกเรื่องเสมอไป เราชอบกินอะไร ชอบเที่ยวที่ไหน ชอบสินค้าแบบไหน ทำไมต้องมาบอกทุกครั้ง

บริการ AI Chat หลายเจ้าเพิ่มฟีเจอร์ memory เข้ามา ให้ AI จำบทสนทนาเก่าๆ ของเราได้ ไม่ต้องบอกกันใหม่

แต่กูเกิลมีข้อได้เปรียบที่เหนือกว่าใครๆ คือ กูเกิลรู้จักเราทุกอย่างแล้วจากบริการต่างๆ เช่น Search, YouTube, Gmail, Photos ฯลฯ ทำไมต้องมาเรียนรู้กันใหม่ ก็แค่เปิดท่อให้ Gemini เข้ามาอ่านไฟล์ใน Google Drive ของเราก็จบแล้วนี่นา

บนเวที Sundar Pichai เดโมฟีเจอร์นี้ โดยการบอกว่าเพื่อนอีเมลมาถามว่า ตอนที่ขับรถเที่ยว Utah เป็นยังไงบ้าง มีสถานที่ท่องเที่ยวแนะนำไหม ซึ่ง Sundar บอกว่าเขาลืมไปหมดแล้ว จะตอบเพื่อนยังไงดี วิธีการแก้ปัญหาก็ไม่ยากคือเอา Gemini อ่านอีเมลเก่า เอกสารเก่าทั้งหมด แล้วสรุปแผนการเดินทางมาให้เพื่อนได้เลยไง! ง่ายชะมัด

ฟีเจอร์ Personalized ยังต่อยอดไปยัง Smart Reply ของ Gmail ได้ด้วย ในเมื่อ Gemini อ่านเมลเก่าของเราได้ทั้งหมด ทำไมจะเขียนเมลแทนเรา ในภาษาแบบตัวเราเองไม่ได้ล่ะ!

5. Search ไม่มีอนาคตแล้ว จริงหรือ?

หลายคนบอกว่าเลิกเข้ากูเกิลแล้วหลังมี ChatGPT หรือบ้างก็ย้ายไปใช้ Perplexity แถมเมื่อเร็วๆ นี้ยังมีข่าวจากฝั่งแอปเปิลบอกว่า คนเข้า Google จาก Safari น้อยลงเป็นครั้งแรก ทำหุ้นตกไปอีก

หลังจากกล้าๆ กลัวๆ มานาน ในที่สุดกูเกิลก็เปิดตัว AI Mode ซึ่งอธิบายง่ายๆ ว่ามันคือการเปลี่ยน interface หลักของ Google Search ให้หน้าตาเหมือน Perplexity นั่นแหละ (ลาก่อนวงการ SEO)

เหตุผลที่กูเกิลกั๊กๆ เรื่องนี้มาตลอดเพราะรู้อยู่แก่ใจว่า การเอา AI มาแทนที่ web search แบบเดิมมันจะทำลายอุตสาหกรรมเว็บ และแหล่งรายได้จากโฆษณาของกูเกิล (เฉพาะส่วน search) ไปอย่างสิ้นเชิง แต่เมื่อคู่แข่งทั้ง ChatGPT หรือ Perplexity บี้เข้ามาเรื่อยๆ ก็ไม่มีทางเลือก ทำก็ทำวะ จึงออกมาเป็นอย่างที่เห็น

หมายเหตุ: ตอนนี้ AI Mode ยังเปิดให้เฉพาะลูกค้าในสหรัฐ เลยยังให้ความเห็นไม่ได้ว่าเป็นไงนะครับ

สรุป: สงคราม AI จบยังไง

ถ้าเทียบให้เห็นภาพง่ายๆ ผมคิดว่ามันเหมือนตอนสงครามโลกมากๆ คือ OpenAI นั้นห้าวเป้งมาก เปรี้ยวตีนมาก ผงาดอย่างรวดเร็วขึ้นมาท้าทาย status quo แบบดั้งเดิม ใช้พลังความสดใหม่ energetic แบบเดียวกับญี่ปุ่นหรือเยอรมนี โจมตีแบบสายฟ้าฟาด Blitzkrieg แปปเดียวกวาดทั้งยุโรปหรือเอเชียตะวันออก

ส่วนกูเกิลนั้นเหมือนอเมริกา กว่าจะเข้าร่วมสงครามก็ยึกๆ ยักๆ อยู่นาน กล้าๆ กลัวๆ อย่างโง้นอย่างงี้ จนกระทั่งเจอกระตุกหนวดเสือที่ Pearl Harbor ค่อยตื่นขึ้นมา จากนั้นค่อยระดม “สรรพกำลัง” ที่ไม่มีใครเทียบได้ เอาชนะสงครามได้ในระยะยาว

ผมว่าสถานการณ์มันเหมือนกันมาก กูเกิลมี resource มหาศาลในระดับที่ไม่มีใครเทียบได้ ตั้งแต่ออกแบบชิป TPU เองจึงทำต้นทุนค่ารัน AI ได้ต่ำกว่าใคร ไปจนถึงงานวิจัยระดับ frontier research จำนวนมาก (ถ้านึกไม่ออกก็คือ T=Transformer ไปจนถึง AlphaFold ที่ทำให้ Demis Hassabis ได้รางวัลโนเบล) สารพัดโปรเจคที่เปิดตัวเมื่อ 2-3 ปีก่อนอย่าง Starline, Astra, Mariner ตอนนี้มันกลายเป็นผลิตภัณฑ์หรือบริการออกสู่ลูกค้าจริงๆ แล้ว ในบล็อกเปิดตัว Google I/O ใช้พาดหัวว่า “From research to reality” นี่แหละใช่เลย แล้วใครจะไปสู้พี่ได้

นี่ยังไม่รวมคลังพระสมบัติจากธุรกิจโฆษณาด้วยนะครับ เรียกว่าพิมพ์เงินใช้เองก็ว่าได้ ในขณะที่ OpenAI หรือ Anthropic ต้องไปหาเงินจาก VC มาเผาอยู่เรื่อยๆ แต่กูเกิลผลิตเงินเองได้ อ๋อ เราเป็นผู้ตามอยู่ในตลาดนี้งั้นเหรอ งั้นเปิดให้ใช้ฟรีเลยแล้วกันไม่ต้องคิดเงิน

สรุปว่าสงครามจะจบยังไง ไม่รู้หรอก แต่ถ้าเอา analogy แบบสงครามโลกมาเทียบ ตอนนี้เราน่าจะผ่านจุดสงคราม Midway มาเรียบร้อยแล้ว ยักษ์หลับตื่นแล้ว