กลุ่ม SCBX จับมือ Stanford CRFM เปิดตัว ThaiExam Leaderboard HELM ช่วยพัฒนา AI โมเดลภาษาไทย - Forbes Thailand

กลุ่ม SCBX จับมือ Stanford CRFM เปิดตัว ThaiExam Leaderboard HELM ช่วยพัฒนา AI โมเดลภาษาไทย

SCB 10X และ SCBX ร่วมมือกับ ศูนย์วิจัยสแตนฟอร์ดด้านโมเดลโครงสร้างพื้นฐาน เปิดตัว ThaiExam leaderboard เพื่อช่วยประเมินโมเดลภาษาขนาดใหญ่ (LLM) ในบริบทภาษาไทย เชื่อว่าจะช่วยให้ AI ตอบสนองเป็นภาษาไทยดีขึ้น


    นายกสิมะ ธารพิพิธชัย Head of AI Strategy บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) กล่าวว่า ความร่วมมือกับศูนย์วิจัยสแตนฟอร์ดด้านโมเดลโครงสร้างพื้นฐาน (Stanford CRFM) จะใช้กรอบการประเมินของ HELM (Holistic Evaluation of Language Models) โดยความร่วมมือในครั้งนี้ช่วยให้การประเมินโมเดลภาษาครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก

    ทั้งนี้ ThaiExam Leaderboard ออกแบบมาเพื่อประเมินโมเดลภาษาไทยขนาดใหญ่ ซึ่งได้มาจากการสอบวัดความรู้เชิงวิชาการระดับชั้นมัธยมศึกษาและการสอบวิชาชีพทางการเงิน เช่น ONET, TGAT, A-Level และการสอบผู้แนะนำการลงทุน (IC)

    ปัจจุบัน โมเดลขั้นสูง เช่น GPT-4 และ Claude 3 จะมีความสามารถหลายภาษา แต่กรอบการประเมินจะมุ่งเน้นการประเมินเป็นภาษาอังกฤษส่วนใหญ่ ดังนั้น ThaiExam leaderboard จะมาช่วยระบบการประเมินที่ถูกปรับแต่งสำหรับภาษาไทย เพื่อพัฒนาสามารถประเมินประสิทธิภาพของโมเดลในภาษาไทยได้อย่างแม่นยำและโปร่งใส ด้วยข้อความภาษาไทยดั้งเดิมและชุดการประเมินที่ครอบคลุม โครงการนี้เสนอมาตรฐานที่จำเป็นสำหรับการทำความเข้าใจว่าโมเดลภาษาทำงานได้ดีแค่ไหนในบริบทภาษาไทย

    "ความร่วมมือกับ Stanford CRFM ในครั้งนี้ตอกย้ำถึงความมุ่งมั่นของเราในการพัฒนา NLP ภาษาไทยและกำหนดมาตรฐานสำหรับการประเมินโมเดลภาษาหลายภาษาเรามั่นใจเป็นอย่างยิ่งว่า ThaiExam Leaderboard จะสามารถกระตุ้นการพัฒนาโมเดลภาษาไทยและส่งเสริมความร่วมมือในชุมชนวิจัย AI เพื่อสนับสนุนภาษาเฉพาะถิ่นที่ไม่ได้เป็นภาษาสากลและเป็นภาษาที่มีข้อมูลจำกัด" นายกสิมะ กล่าว

    อย่างไรก็ตาม ThaiExam Leaderboard ได้ประเมิน โมเดลภาษาไทยที่โดดเด่น 34 โมเดล โดย หนึ่งในนั้นมีโมเดลของ Typhoon ซึ่งผลจากการประเมินระบุว่า Typhoon 1.5X Instruct (70B) มีประสิทธิภาพเหนือกว่าโมเดลปิด เช่น GPT-4 Turbo และ Claude 3 Sonnet ที่เน้นความสามารถด้านภาษาไทยที่แข็งแกร่งด้วยความแม่นยำ 61.7% แม้แต่โมเดล Typhoon ขนาดเล็ก (8B) ก็ยังเหนือกว่า GPT-3.5 Turbo ในขณะที่โมเดล เช่น Claude 3 Haiku และ Llama 3 (70B) ได้แสดงผลลัพธ์ที่น่าสนใจ

    ปัจจุบัน SCB 10X เดินหน้าสนับสนุนการพัฒนา AI ร่วมกับบริษัท AI และสถาบันชั้นนำทั่วเอเชียตะวันออกเฉียงใต้และทั่วโลก เช่น มหาวิทยาลัยเคมบริดจ์ และมหาวิทยาลัยทิงหัว รวมถึง มหาวิทยาลัยมหิดลอีกทั้ง SCB 10X ยังมีส่วนร่วมในโครงการ เช่น SEA-LION v2 และ Project SEALD ร่วมกับ AI Singapore (AISG) เพื่อส่งเสริมโมเดลภาษาสำหรับภูมิภาค ความพยายามเหล่านี้ทำให้ประเทศไทยมีบทบาทในการพัฒนาเทคโนโลยี AI ทั่วโลก



เรื่องราวอื่นๆ ที่น่าสนใจ : 10 นักลงทุนแนวหน้าแห่งธุรกิจเทคบนทำเนียบ Midas List 2024

ไม่พลาดบทความและเรื่องราวน่าสนใจอื่นๆ ติดตามเราได้ที่เฟซบุ๊ก Forbes Thailand Magazine