Skip to main content

Google Sheets

info

Phần hướng dẫn tạo source data từ Google Sheets này sẽ bao gồm hai phần:

  1. Hướng dẫn thiết lập Source từ Google Sheets.
  2. Hướng dẫn điền các trường thông tin khi setup Connection với Source là từ Google Sheets

Phần 1: Hướng dẫn thiết lập Source từ Google Sheets

note

Sau khi đã thao tác các bước nền là chọn source và vào được trang setup source chi tiết, bạn tiến hành thao tác điền các trường thông tin cần thiết như hướng dẫn dưới đây. Hướng dẫn các bước nền để tạo source trên Elton bạn có thể xem ở phần Getting Started - Mục Thiết lập Source.

Bước 1: Cho phép truy cập Google Sheets ở trong phần api của Google BigQuery

note
  • Để tạo source và liên kết thành công với Google Sheets, bạn cần đảm bảo rằng bạn đã setup xong project của bạn trên Google BigQuery và Google Sheets là dịch vụ đã được kích hoạt.

  • Cách setup, tạo project từ Google Bigquery bạn có thể tham khảo thêm ở phần Phần 1: Hướng dẫn cài đặt nền (setup trên Google BigQuery)

  • Khi đã thao tác và tạo project thành công trên Google BigQuery, bạn truy cập vào đường link này: https://console.cloud.google.com/apis/library để tiến hành kích hoạt Google Sheets trên project của bạn

  • Tại màn hình chính, bạn thao tác chọn project đã tạo, sau đó tìm và nhấn vào mục Google Sheets API

  • Tại màn hình chi tiết của Google Sheets API, bạn thao tác chọn nút Enable là đã kích hoạt xong Google Sheet cho project của bạn.

Bước 2: Điền các trường thông tin cần thiết tại chi tiết source trên Elton

(1) Tại giao diện setup data source của Google Sheets, bạn thao tác điền các thông tin định danh cho source chuẩn bị tạo:

  • Display name: Tên hiển thị của source. Elton khuyến khích bạn đặt tên có mối liên hệ với source Google Sheets mà bạn sắp sửa tạo (Ví dụ: Elton Google Sheets).
  • Description: Mô tả của source

  • Connection - JSON Credentials: Tại phần này bạn thao tác copy toàn bộ code JSON từ file mà bạn đã tải về máy lúc setup project tương ứng trên BigQuery. Hướng dẫn chi tiết tạo project trên BigQuery bạn có thể xem thêm ở Phần 1: Hướng dẫn cài đặt nền (setup trên Google BigQuery)

  • Sau khi hoàn tất điền các thông tin của source ở (1), bạn nhấn Save => hệ thống sẽ đưa về trang thông tin chi tiết của source bạn vừa tạo.

Phần 2: Hướng dẫn điền các trường thông tin khi setup Connection với Source là từ Google Sheets

Tại mục "Source Config" của màn hình setup chi tiết connection có source là Google Sheets, các trường thông tin bạn cần điền sẽ có ý nghĩa như sau:

1. Select Google Sheets Source

  • Tại đây hệ thống sẽ hiển thị tên của source Google Sheets mà bạn đã tạo và chọn.

2. Google Sheet URL

  • Bạn thao tác copy link URL của sheet mà bạn muốn kết nối và paste vào ô này.

3. Sheet name

  • Bạn thao tác copy tên của sheet mà bạn muốn kết nối và paste vào ô này.

4. Start Cell

  • Là ô trên google sheets mà bạn sẽ bắt đầu scan để lấy data.

  • Trong một vài trường hợp, 1 số file Google Sheet được thiết kế có header hoặc tên người tạo, chứ không phải là bắt đầu A1 là data ngay. Vì vậy, khi điền vào ô này bạn cần kiểm tra lại file Google Sheet của bạn phần dữ liệu sẽ bắt đầu từ ô nào, để điền vào chính xác nhất.

5. Load strategy

  • Thông tin được dùng để xác định cách mà dữ liệu trong sheet sẽ được cập nhật khi có thay đổi phát sinh (chỉnh sửa hoặc thêm dòng mới). Có 3 lựa chọn để cập nhật dữ liệu: Merge, Overwrite, Append.
  1. Merge
  • Nếu chọn option là Merge, khi có một dòng mới phát sinh, hệ thống sẽ detect và cập nhật vào. Trường hợp dòng dữ liệu đã tồn tại có thay đổi, hệ thống sẽ tự động cập nhật các thay đổi đó.

  • Để option Merge hoạt động, bạn cần phải điền thêm Key field. Key field ở đây được định nghĩa là cột định danh của một record dữ liệu.

  • Ví dụ: File Google Sheet về Dữ liệu những đơn hàng của cửa hàng A thì sẽ luôn có một cột dùng để định danh các đơn hàng. Cụ thể trong trường hợp này sẽ là cột Mã đơn hàng. Vì vậy đối với ví dụ trên thì Key field sẽ là tên của cột định danh: Mã đơn hàng. Bạn thao tác điền Mã đơn hàng vào ô Key field.

  1. Overwrite
  • Nếu chọn option là Overwrite, mỗi khi cập nhật dữ liệu hệ thống sẽ thực hiện ghi đè lên toàn bộ dữ liệu cũ cũng như cập nhật thêm dữ liệu mới nếu có.
  1. Append
  • Nếu chọn option là Append, hệ thống sẽ chỉ cập nhật những record mới xuất hiện và sẽ không update data cũ khi có thay đổi.

6. Advanced configs - Date format config

  • Trường thông tin này cung cấp cho bạn các lựa chọn để format dữ liệu liên quan tới ngày/tháng/năm (date) trong trường hợp dữ liệu của bạn có nhập date theo các format không chuẩn, để quy về thành một chuẩn dữ liệu chung khi tạo connection.

  • Option None: Bạn chọn không cần format định dạng ngày/tháng/năm lại mà dùng định dạng đã có sẵn trong dữ liệu.

  • Option Basic: Bạn chọn cài đặt format cơ bản mà Elton cung cấp cho bạn. Bạn có thể chọn Day first hoặc Year first.

  • Option Custom: Bạn tự định nghĩa format định dạng date của bạn. Lưu ý, khi tự định nghĩa cách format lại date, bạn vẫn cần tuân thủ một quy tắc nhất định. Trong trường hợp này bạn cần tham khảo thêm quy tắc format date ở đây.

tip

Elton khuyến khích bạn chọn option Basic vì option này về cơ bản đã có thể bao quát hết các trường hợp nhập định dạng date sai, từ đó quy về chung một định dạng duy nhất.

Add-on: Cách tính Billable Pipeline cho source

  • Khi sử dụng Elton, bạn sẽ được thông báo về cách mà hệ thống sẽ tính phí sử dụng dịch vụ. Cách tính hiện tại chủ yếu dựa trên số pipeline bạn tạo.

  • Tuỳ từng loại source mà cách tính số lượng pipeline giới hạn sẽ khác nhau. Để biết thêm chi tiết, bạn vui lòng tham khảo cách tính ở link ở đây.