อาจารย์คณะวิศวฯ จุฬาฯ นำเทคโนโลยี AI Deep Tech พัฒนาโปรแกรมสแกนเอกสารและรูปภาพเป็นข้อความ (OCR) อ่านภาษาไทยแม่นยำกว่า 90% UTC จุฬาฯ พร้อม spin-off สู่ตลาดในนามบริษัท Eikonnex AI จำกัด
หลายคนที่ทำงานด้านข้อมูลที่มีการใช้เอกสารกระดาษ เช่น การทำแบบสอบถาม งานวิจัย ฯลฯ คงจะรู้ดีว่างานยากและจำเจจริงๆ อยู่ที่ตอนได้รับกระดาษพร้อมคำตอบหรือข้อมูลกลับมาแล้ว ต้องมาพิมพ์ข้อความจากกระดาษทีละแผ่นๆ เพื่อจัดเก็บข้อมูลเป็นไฟล์ดิจิทัล เป็นงานที่ใช้เวลามาก แถมทำให้สายตาล้า ออฟฟิศซินโดรมถามหาอีกต่างหาก
งานแบบนี้ สำหรับรองศาสตราจารย์ ดร.ธนารัตน์ ชลิดาพงศ์ อาจารย์จากภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย สามารถทดแทนด้วยแนวคิดปัญญาประดิษฐ์ (AI: Artificial Intelligence) อาจารย์ธนารัตน์จึงนำทีมนิสิตปริญญาเอก ดร.ธนานพ กอบชัยสวัสดิ์ ร่วมพัฒนา “ReadMe” โปรแกรมประเภท OCR (Optical Character Recognition) เพื่อช่วยสแกนข้อความทั้งภาษาไทยและภาษาอังกฤษที่อยู่บนเอกสาร รูปภาพ หรือไฟล์วีดิโอ ให้ออกมาเป็นตัวหนังสือดิจิทัลได้ทันที
OCR คืออะไร
เทคโนโลยี OCR หรือ Optical Character Recognition คือ โปรแกรมที่ใช้สแกนตัวหนังสือจากภาพ หรือวีดิโอ ให้กลายเป็นตัวหนังสือแบบดิจิทัล เพื่อนำข้อมูลมาวิเคราะห์ผล พร้อมนำไปประยุกต์ใช้งานได้ทันที ซึ่งรูปภาพที่นำมาใช้สแกนนั้นเป็นได้ 2 ลักษณะ คือ รูปภาพทั่วไป (Scene text image) และรูปภาพที่เป็นเอกสาร (Document scanned image)
เทคโนโลยี OCR ประยุกต์ใช้ได้หลากหลายรูปแบบ เช่น การอ่านรหัสไปรษณีย์บนซองจดหมาย เพื่อคัดแยกซองจดหมายได้โดยอัตโนมัติ การอ่านหมายเลขบนแคร่รถไฟ เพื่อให้สามารถทราบตำแหน่งของตู้รถไฟว่าอยู่จุดไหนเวลาใดได้ทันที สามารถใช้กับกล้องติดหน้ารถยนต์เพื่อช่วยอ่านป้ายจราจรและป้ายบอกทาง หรือช่วยอ่านป้ายต่างๆ ให้ผู้มีสายตาเลือนราง เป็นต้น
“OCR ถือเป็นนวัตกรรมที่ใช้ปัญญาประดิษฐ์ช่วยลดการใช้แรงงานมนุษย์ ประหยัดเวลา ทำให้ชีวิตประจำวันของคนเรามีความสะดวกและง่ายขึ้นมากเลยทีเดียว” รศ.ดร.ธนารัตน์ กล่าว
ReadMe อ่านไทยคล่องแบบเจ้าของภาษา
เทคโนโลยี OCR ได้รับการพัฒนามาอย่างต่อเนื่องจนมีความแม่นยำสูงขึ้นกว่าก่อนมาก แต่ก็ยังคงมีจุดอ่อนที่เป็นอุปสรรคต่อการใช้งานสำหรับคนไทย ซึ่งก็คือการอ่าน “ภาษาไทย” นั่นเอง
“ไวยากรณ์และโครงสร้างของภาษาอังกฤษจะง่ายต่อคอมพิวเตอร์ในการอ่าน แต่ภาษาไทยยากกว่ามาก เพราะตัวอักขระเยอะ มีสระ มีวรรณยุกต์ ในหนึ่งบรรทัดมีตัวอักษรได้ถึง 4 ระดับ ในขณะที่ภาษาอังกฤษมีเพียงระดับเดียว” รศ.ดร.ธนารัตน์ อธิบาย
แต่ปัญหาดังกล่าวกลายเป็นอดีตไปแล้ว เมื่อเทคโนโลยีการเรียนรู้เชิงลึก (Deep Learning) เข้ามามีบทบาทช่วยให้ AI ฉลาดมากขึ้น
“เมื่อนำเทคโนโลยีใหม่มารวมกับโจทย์เดิม ก็ช่วยเพิ่มความแม่นยำให้เทคโนโลยี OCR อ่านภาษาไทยได้เก่งเหมือนมีคนไทยมาอ่านเอง”
Read Me ช่วยเบาแรงในภาคธุรกิจ
ReadMe เป็นผลิตภัณฑ์ชิ้นแรกของบริษัท Eikonnex AI จำกัด ภายใต้การสนับสนุนจากศูนย์วิจัยและพัฒนาเทคโนโลยีเพื่ออุตสาหกรรม จุฬาลงกรณ์มหาวิทยาลัย (Chula UTC) ที่ รศ.ดร.ธนารัตน์ พัฒนาขึ้นหลังจากสำรวจปัญหาในภาคธุรกิจ
“งานของภาคธุรกิจส่วนใหญ่เป็นงานเอกสาร ซึ่งปัจจุบันยังใช้คนในการกรอกข้อมูลอยู่ เสียแรงและเวลามาก เราจึงพัฒนาโปรแกรม ReadMe เพื่อตอบโจทย์ธุรกิจ โดยเน้นที่การอ่านเอกสารให้แม่นยำ และเกิดข้อผิดพลาดให้น้อยที่สุด” รศ.ดร.ธนารัตน์ กล่าวและยกตัวอย่างการประยุกต์ใช้ ReadMe ในสายงานธนาคาร
“องค์กรที่นำ ReadMe ไปใช้ในระบบแล้ว พบว่า เมื่อเทียบกับ OCR ของบริษัทอื่นๆ ทั้งของไทยและต่างประเทศ ReadMe มีความแม่นยำมากที่สุดถึง 92.6% ช่วยลดความผิดพลาดของมนุษย์ได้มาก (human error)”
ปัจจุบัน บริษัท Eikonnex AI จำกัด ให้บริการ ReadMe ทั้งในรูปแบบของการเข้าไปช่วยพัฒนาโปรแกรมหรือแอปพลิเคชัน (Software development) เพื่อธุรกิจนั้นๆ หรือต้องการซื้อตัวโปรแกรม (Licensing) ไปใช้กับแอปพลิเคชันขององค์กรเองก็สามารถทำได้เช่นกัน
“ยุคนี้เป็นยุค digital transformation แทบทุกองค์กรต้องปรับตัว ปรับทุกอย่างให้เป็นดิจิทัล ReadMe เป็นหนึ่งในเครื่องมือที่จะช่วยให้องค์กรเข้าสู่ digital transformation ได้เร็วขึ้น” รศ.ดร.ธนารัตน์ กล่าว
เมื่อมี ReadMe เจ้าหน้าที่กรอกข้อมูลจะ “ตกงาน”? AI จะเข้ามา “แทนที่” หรือ “ช่วยอำนวยความสะดวก” ให้ชีวิตมนุษย์? มนุษย์ควรรับมือกับการเปลี่ยนแปลงเช่นนี้อย่างไร?
“เทคโนโลยีก้าวหน้ามากและรวดเร็ว โดยเฉพาะเทคโนโลยี OCR หรือ ReadMe มาแน่ๆ เมื่อซอฟแวร์สามารถอ่านและแปลงเอกสารต่างๆ ได้แม่นยำ หลายอาชีพ หลายงานจะถูกแทนที่ด้วยเทคโนโลยี มนุษย์ก็ต้องปรับตัวไปทำงานอื่นที่คอมพิวเตอร์ยังไม่สามารถทำได้” รศ.ดร.ธนารัตน์ ให้ข้อคิด
ผู้สนใจผลิตภัณฑ์ ReadMe สามารถดูรายละเอียดเพิ่มเติมได้ทางเว็บไซต์ https://www.eikonnex.ai/ และเข้าไปทดลองใช้ ReadMe เวอร์ชันทดลองได้ที่ https://readme.eikonnex.ai/
ที่มา: ศูนย์สื่อสารองค์กร จุฬาลงกรณ์มหาวิทยาลัย