Baidu สร้างปัญญาประดิษฐ์แปลภาษาเกือบทันที ไม่ต้องรออินพุตจบประโยค

2018-10-25

Baidu รายงานสถาปัตยกรรมปัญญาประดิษฐ์สำหรับแปลภาษา STACL (Simultaneous Translation with Anticipation and Controllable Latency) ที่สามารถแปลประโยคได้ต่อเนื่อง โดยรอประโยคอินพุตเพียง 3-5 คำเท่านั้น คล้ายกับล่ามมืออาชีพที่สามารถแปลได้แทบทันที

ความยากของการแปลภาษาโดยที่อินพุตยังไม่จบประโยคอยู่ที่โครงสร้างประโยคแต่ละภาษาอาจจะต่างกันมาก เช่น ภาษาจีนนั้นกริยาอาจจะอยู่ท้ายประโยคทำให้ไม่สามารถแปลได้อย่างแม่นยำหากไม่เห็นทั้งประโยค เพราะภาษาอังกฤษหรือภาษาไทยนั้นกริยาอยู่หลังประธาน STACL อาศัยการคาดเดาคำล่วงหน้า แต่แทนที่จะคาดเดาจากภาษาต้นฉบับเหมือนมนุษย์ที่เวลาฟังภาษาใดก็จะคิดล่วงหน้าว่าผู้พูดกำลังจะพูดคำอะไรเป็นคำถัดไป STACL จะพยายามคาดเดาคำในภาษาที่กำลังแปล โดยสามรถปรับพารามิเตอร์การรอคำอินพุต เช่น wait-3 ก็จะเป็นการรออินพุต 3 คำก่อนจะเริ่มแปล

ภายในของ STACL เป็นโมเดลปัญญาประดิษฐ์ที่ดัดแปลงมาอีกที โดยใช้โมเดล RNN ที่ทำขึ้นเอง กับโมเดล Transformer ของกูเกิล

ผลทดสอบของของ Baidu แสดงให้เห็นว่าการแปลภาษาอังกฤษไปเยอรมันนั้นหากรอคำอินพุตมากพอสมควร เช่น เกิน 5 คำขึ้นไปคุณภาพคำแปลก็จะใกล้เคียงกับการแปลทั้งประโยคมาก ขณะที่การแปลภาษาจีนเป็นอังกฤษนั้นการรอคำอินพุตให้มากขึ้นช่วยเพิ่มคุณภาพการแปลได้มากกว่า

ล่ามแบบแปลทันทีนั้นต้องอาศัยความเชี่ยวชาญสูง และล่ามหนึ่งคนมักสามารถทำงานต่อเนื่องได้ไม่เกิน 30 นาทีเท่านั้นก่อนที่ความผิดพลาดจะสูงขึ้นอย่างมาก อย่างไรก็ดี STACL เองก็ยังจำกัดกว่ามนุษย์อยู่มาก

ที่มา – Baidu Research

No Description