Google BigQuery รองรับข้อมูลแบบ geospatial, โมเดลใหม่บน BigQuery ML

2018-10-15

Google ประกาศเพิ่มฟีเจอร์ใหม่ให้ BigQuery ระบบ data warehouse บน Google Cloud Platform โดยมีฟีเจอร์ใหม่ที่สำคัญคือ รองรับข้อมูลสารสนเทศเชิงพื้นที่ (geospatial), โมเดลและฟังก์ชันใหม่บน BigQuery ML, การตั้งกำหนดเวลาการ query และอื่น ๆ

ฟีเจอร์แรกคือ BigQuery GIS เป็นการรองรับข้อมูลอิงตามลักษณะพื้นที่ (geospatial) โดยผู้ใช้สามารถวิเคราะห์ big data โดยใช้คำสั่ง SQL ปกติ โดยตัว BigQuery จะใช้ไลบรารีการคำนวณแบบเดียวกับที่ใช้ใน Earth Engine, Google Maps และ Google Earth จึงเหมาะกับการใช้งานกับข้อมูลปริมาณมาก

ตอนนี้ BigQuery GIS เปิดให้ใช้งานในแบบเบต้าแล้ว อ่านรายละเอียดเพิ่มเติมได้ที่ BigQuery GIS Documentation

ถัดไปคือฟีเจอร์ในส่วนของ BigQuery ML จะเพิ่มการรองรับโมเดล multi-class logistic regression สามารถทำนายค่าได้มากสุดถึง 10 ค่า, ให้น้ำหนักค่าแต่ละค่าด้วยตัวเองหรืออัตโนมัติได้, ฟังก์ชันใหม่สำหรับคืนค่า confusion matrix สำหรับโมเดล logistic regression และเปิดให้ใช้ BigQuery ML ใน Tokyo (asia-northeast1) แล้ว

ตอนนี้ BigQuery ML ยังเปิดให้บริการในรูปแบบเบต้าอยู่ รายละเอียดเพิ่มเติมอ่านได้จาก BigQuery ML Documentation

ถัดไปคือการตั้งกำหนดเวลารัน query ใน BigQuery โดยคลิกปุ่ม Schedule Query ใต้ query ที่ต้องการตั้งเวลา จากนั้นก็เลือกเวลาที่ต้องการให้รัน query และจะให้แจ้งเตือนทางไหน ซึ่งตอนนี้ผู้ใช้จะต้องตั้งเวลาบน BigQuery Classic Web UI ก่อน ในอนาคต Google จะเปิดให้ตั้งเวลาบน UI แบบใหม่ใน Cloud Console รายละเอียดเพิ่มเติมอ่านได้จาก Scheduling Queries

ส่วนเรื่องอื่น ๆ เกี่ยวกับ BigQuery ที่ Google ประกาศออกมาพร้อมกันด้วย เช่น

  • BigQuery Cost Control ระบบทำนายค่าใช้จ่ายก่อนการรัน query, วิเคราะห์ audit log และอื่น ๆ เปิดให้ใช้งานในรูปแบบ generally available แล้ว
  • ประเภทข้อมูลแบบ NUMERIC ที่มีความแม่นยำสูงสำหรับจัดการกับข้อมูลประเภทจำนวนเต็มหรือ floating-point ขนาดใหญ่เปิดให้ใช้งานในรูปแบบ generally available แล้ว

ที่มา – Google Cloud Blog

No Description