- ประสิทธิภาพสูงสุด ด้วย Multimodal Models ประมวลผลข้อมูลทั้งข้อความ ภาพและเสียง
เอสซีบี เท็นเอกซ์ (SCB 10X) บริษัทภายใต้กลุ่มเอสซีบี เอกซ์ (SCBX Group) เดินหน้าผลักดันระบบนิเวศและคอมมูนิตี้ด้าน AI ในประเทศไทย พร้อมปลดล็อกศักยภาพด้านโมเดลภาษาไทยขนาดใหญ่ เพื่อมุ่งสู่การเป็น AI-First Organization ผ่านการจัดงาน “Typhoon 2 Unveiled: Advancing AI Research in Thailand” สัมมนาให้ความรู้ ความเข้าใจเกี่ยวกับ AI จากวิทยากรผู้คร่ำหวอดในวงการ AI ในเมืองไทย อาทิ SCBX, SCB 10X, DataX, VISTEC, Artificial Intelligence Association of Thailand (AIAT), มหาวิทยาลัยมหิดล, จุฬาลงกรณ์มหาวิทยาลัย และ iApp Technology โดยภายในงานจะมีการเปิดตัว “ไต้ฝุ่น 2” (Typhoon 2) โมเดลภาษาไทยขนาดใหญ่ (Thai Large Language Model) เวอร์ชั่นใหม่ล่าสุด ที่พัฒนาขึ้นโดยมุ่งเน้นการประมวลผลภาษาไทยที่มีประสิทธิภาพสูงและตอบโจทย์บริบทเฉพาะของประเทศไทยอย่างแท้จริง พร้อมผลักดันอุตสาหกรรม AI ไทยสู่ความก้าวหน้าระดับโลก งานจะจัดขึ้นในวันพฤหัสบดีที่ 23 มกราคม 2568 เวลา 16.30 – 21.30 น. ที่ DISTRICTX อาคาร FYI Center สำหรับนักพัฒนา หรือบุคคลที่สนใจสามารถลงทะเบียนเข้าร่วมงานได้ที่ https://lu.ma/droty4z9 (ขอสงวนสิทธ์เข้าร่วมสำหรับผู้ที่ลงทะเบียนและได้รับการตอบกลับทางอีเมลเพื่อเข้าร่วมเท่านั้น)
“ไต้ฝุ่น 2” เวอร์ชั่นใหม่ล่าสุดได้รับการออกแบบให้มีความสามารถตอบสนองต่อการใช้งานได้หลากหลายมากยิ่งขึ้น โดยมีขนาดโมเดลเพิ่มขึ้นถึง 5 ขนาด (1B, 3B, 7B, 8B และ 70B) ด้วยคุณสมบัติใหม่ที่โดดเด่น (Key Features) ได้แก่
- เพิ่มประสิทธิภาพและความแม่นยำของภาษาไทยที่สูงขึ้น ประเมินจากเกณฑ์มาตรฐาน เช่น ThaiExam และ M3Exam ซึ่งมีการประมวลผลภาษาไทยที่เหนือกว่าโมเดล Open source อื่นๆ
- ปรับปรุงประสิทธิภาพการทำตามคำสั่งที่ดีขึ้น เมื่อเทียบกับ Typhoon 1.0 – Typhoon 1.5X โดยประเมินจากมาตรฐาน IFEval-TH และ MT-Bench
- รับข้อมูล และGenerate Text ได้มากขึ้น โดยขยายความยาว Context จาก 8,192 เป็น 128,000 Tokens ช่วยให้สามารถทำงานกับข้อมูลที่ซับซ้อนได้มากขึ้น
- เพิ่มความสามารถในการเรียกใช้งานฟังก์ชัน (Function Calling) ที่ดีที่สุดในระดับ SOTA (State-of-the-Art)
- มีโมเดลขนาดเล็กที่รองรับการทำงานบนอุปกรณ์พกพา สำหรับงานที่ไม่ซับซ้อน เช่น การสรุปข้อมูลและแปลภาษา
- มี Safety Classifier Model (Preview) ที่ถูกปรับแต่งเพื่อบริบทภาษาไทย ช่วยพิจารณาความเหมาะสมของคำที่ป้อนเข้าไป หากพบว่าไม่เหมาะสมก็จะแจ้งเตือน
นอกเหนือจากนี้ได้มีการพัฒนา โมเดล Multimodal ซึ่งรองรับการประมวลผลทั้งข้อความ เสียง และภาพอย่างครบถ้วน เพื่อเปิดโอกาสใหม่ในการใช้งานในหลายบริบทและยกระดับประสิทธิภาพของ “ไต้ฝุ่น 2” โดยมีสองโมเดลสำคัญ ได้แก่
- Typhoon2-Audio (Research Preview)
- รองรับการทำงานร่วมกันของข้อมูลเสียงและข้อความ: สามารถรับ Input และสร้าง Output ได้ทั้งสองรูปแบบในเวลาเดียวกัน เพื่อให้การโต้ตอบเป็นธรรมชาติและราบรื่นยิ่งขึ้น
- มีความสามารถในการวิเคราะห์เสียงอย่างลึกซึ้ง: สามารถเข้าใจเนื้อหาและแยกแยะอารมณ์ในเสียงได้
- เพิ่มประสิทธิภาพในการประมวลผลคำสั่งที่ซับซ้อน: รองรับการโต้ตอบที่ต้องการความละเอียดและการดำเนินการหลายขั้นตอน
- พัฒนาฟังก์ชัน Text-to-Speech: เปลี่ยนข้อความเป็นเสียงภาษาไทยด้วยคุณภาพที่เหนือกว่าโมเดล Open Source อื่นๆ
- Typhoon2-Vision (Research Preview)
- เสริมศักยภาพในการประมวลผลและเข้าใจภาพ: รองรับการวิเคราะห์ภาพอย่างละเอียดและทำความเข้าใจเนื้อหาได้ครบถ้วน
- มีฟังก์ชัน OCR (Optical Character Recognition) ในตัว: แปลงข้อความจากภาพหรือเอกสารให้อยู่ในรูปแบบดิจิทัลได้อย่างแม่นยำ เหมาะสำหรับการจัดการข้อมูลในงานหลากหลายประเภท
**คำชี้แจงสำคัญ (Disclaimer) โมเดล Typhoon2-Audio และ Typhoon2-Vision ถูกพัฒนาขึ้น และสามารถทดลองใช้งานหรือประยุกต์ใช้ร่วมกับ Application ในรูปแบบต่างๆ ได้อย่างหลากหลาย อย่างไรก็ตาม เนื่องจากปัจจุบัน ยังอยู่ในขั้นตอนพัฒนาและทดลองวิจัย จึงอาจจะยังไม่เหมาะกับการนำไปใช้งานในเชิงพาณิชย์อย่างเต็มรูปแบบ
“ไต้ฝุ่น 2” ได้รับการสนับสนุนจากพันธมิตรชั้นนำทั้งในไทยและต่างประเทศ ได้แก่ VISTEC, มหาวิทยาลัยมหิดล, Artificial Intelligence Association of Thailand (AIAT), AI Singapore (AISG), Stanford Human-Centered Artificial Intelligence (Stanford HAI), Together AI, SEA AI Lab, InnovestX, Sambanova Systems เพื่อร่วมกันผลักดันการประยุกต์ใช้โมเดลภาษาไทยขนาดใหญ่ให้เกิดขึ้นในหลากหลายอุตสาหกรรม
สำหรับผู้ที่สนใจเข้าร่วมงาน “Typhoon 2 Unveiled: Advancing AI Research in Thailand” สามารถลงทะเบียนได้ที่ https://lu.ma/droty4z9 หรือติดตามข้อมูลเกี่ยวกับ “ไต้ฝุ่น 2” และร่วมทดลองใช้งานโมเดลภาษาไทยขนาดใหญ่ เวอร์ชั่นใหม่ล่าสุด ได้ที่ https://opentyphoon.ai/