Salesforce เปิดตัว TransmogrifAI เครื่องมือโอเพ่นซอร์สสำหรับทำ machine learning อัตโนมัติ

2018-08-16

Salesforce เปิดตัวเครื่องมือโอเพ่นซอร์สใหม่ TransmogrifAI ไลบรารีทำ machine learning อัตโนมัติสำหรับข้อมูลเชิงโครงสร้างหรือ structured data ตัวไลบรารีออกแบบให้มีความยืดหยุ่น สามารถประมวลผลได้ตั้งแต่บนแล็ปท็อปไปจนถึงคลัสเตอร์ เขียนด้วย Scala และพัฒนาบน Apache Spark

Mayukh Bhaowal กรรมการฝ่ายจัดการผลิตภัณฑ์ของ Salesforce Einstein ให้ข้อมูลกับ VentureBeat ว่า TransmogrifAI เป็นผลการพัฒนาไลบรารีด้าน machine learning ของ Salesforce โดยไลบรารีนี้ทำให้ทีม Einstein สามารถดีพลอยโมเดลสำหรับลูกค้าองค์กรได้ในเวลาไม่กี่ชั่วโมง

TransmogrifAI มีการทำงานสามขั้นตอนหลัก ๆ ขั้นตอนแรกจะเป็นการเลือกฟีเจอร์ โดยผู้ใช้จะต้องให้ schema ของข้อมูล ไลบรารีจะแยกฟีเจอร์ออกมาให้อัตโนมัติ พร้อมกำจัดฟีเจอร์ที่ทำนายยากหรือมีความลำเอียงสูง รวมถึงสัญญาณที่ไม่จำเป็นออกไป ถัดไปคือขั้นตอนการทำ feature engineering โดยตัวไลบรารีจะแปลงข้อมูลเป็นเวกเตอร์ และขั้นตอนสุดท้ายก็คือการเทรนโมเดล ซึ่งไลบรารีจะเลือกโมเดลที่เหมาะสมที่สุดมาเทรนให้ และสุ่มตัวอย่างพร้อมกับรีคาลิเบรตเพื่อหลีกเลี่ยงความไม่สมดุลของข้อมูลด้วย

ระบบการเทรนโมเดลของ TransmogrifAI จะให้ความสำคัญกับการแสดงข้อมูลเกี่ยวกับตัวโมเดลอย่างชัดเจน เพื่อให้มีความโปร่งใสในเรื่องปัจจัยที่มีผลต่อการทำนายของโมเดล ซึ่ง Shubha Nabar กรรมการอาวุโสฝ่ายวิทยาการข้อมูลของ Salesforce Einstein กล่าวว่า “ในแง่ของความเชื่อถือและความเป็นส่วนตัวของข้อมูล เป็นเรื่องสำคัญที่โมเดลที่ถูกสร้างขึ้นมาจะต้องไม่ใช่กล่องดำ”

สำหรับซอร์สโค้ดของ TransmogrifAI สามารถเข้าไปดูได้ที่ GitHub

ที่มา – VentureBeat

No Description
ภาพประกอบโดย Salesforce