New York Times ใช้ Google Cloud จัดเก็บภาพข่าวเก่า และใช้ ML ช่วยค้นหารูปนำมาใช้ง่ายขึ้น

2018-11-10

Google Cloud ร่วมมือกับสำนักข่าวเก่าแก่ The New York Times เสนอเทคโนโลยีช่วยจัดการรูปภาพข่าวเก่าๆ ของสำนักข่าวที่มีหลายล้านรูปภาพ ทั้งที่เป็นไฟล์ภาพแล้วและยังไม่เป็นไฟล์ ช่วยให้การค้นหาภาพข่าวเก่าและนำมาใช้นั้นทำได้ง่ายขึ้น

ปัจจุบัน ภาพที่ไม่ได้เป็นไฟล์ของสำนักข่าวจะถูกเก็บไว้ในล็อกเกอร์ มีการ์ดบอกไว้ว่าเป็นภาพข่าวช่วงไหน แต่ก็ไม่สามารถทำให้เห็นภาพทั้งหมด ไม่ได้บอกรายละเอียดว่าแต่ละภาพเป็นภาพเกตุการณ์อะไร Google ช่วยแก้ไขด้วยการจัดทำไฟล์เอกสารรูปภาพเหล่านี้ให้อยู่ในรูปแบบดิจิทัลความละเอียดสูงบน Cloud Storage และมี API หรือช่องทางเข้าถึงรูปภาพให้ค้นภาพนำมาใช้ได้

No Description

วิธีการทำงานคือ เมื่อรูปภาพถูกฝังลงใน Cloud Storage จากนั้นก็ใช้ Cloud Pub/Sub หรือบริการสื่อสารข้อมูลระหว่างแอพแบบเรียลไทม์ในการทำงานหลายอย่างได้โดยไม่ต้องสร้าง API ขึ้นมาใหม่ โดยรูปภาพจะถูกปรับขนาดโดยใช้บริการ Google Kubernetes Engine (GKE) และข้อมูลเมตาของรูปภาพจะถูกจัดเก็บไว้ในฐานข้อมูล PostgreSQL ที่ทำงานบน Cloud SQL

อย่างไรก็ตาม ลำพังจัดเก็บภาพนั้นยังไม่เพียงพอ ต้องหาบริบทของภาพได้ด้วย The New York Times ใช้ Cloud Vision API ที่สามารถอ่านบริบทรูปภาพและอ่านตัวอักษรหรือบทความที่แปะด้านหลังรูปได้ ถอดออกมาเป็นอักษรดิจิทัล ช่วยให้ค้นหาและเข้าใจเหตุการณ์ของภาพถ่ายได้ดีขึ้น

No Description

ที่มา – Google Blog