Google Sheets
Phần hướng dẫn tạo source data từ Google Sheets này sẽ bao gồm hai phần:
- Hướng dẫn thiết lập Source từ Google Sheets.
- Hướng dẫn điền các trường thông tin khi setup Connection với Source là từ Google Sheets
Phần 1: Hướng dẫn thiết lập Source từ Google Sheets
Sau khi đã thao tác các bước nền là chọn source và vào được trang setup source chi tiết, bạn tiến hành thao tác điền các trường thông tin cần thiết như hướng dẫn dưới đây. Hướng dẫn các bước nền để tạo source trên Elton bạn có thể xem ở phần Getting Started - Mục Thiết lập Source.
Bước 1: Cho phép truy cập Google Sheets ở trong phần api của Google BigQuery
-
Để tạo source và liên kết thành công với Google Sheets, bạn cần đảm bảo rằng bạn đã setup xong project của bạn trên Google BigQuery và Google Sheets là dịch vụ đã được kích hoạt.
-
Cách setup, tạo project từ Google Bigquery bạn có thể tham khảo thêm ở phần Phần 1: Hướng dẫn cài đặt nền (setup trên Google BigQuery)
- Khi đã thao tác và tạo project thành công trên Google BigQuery, bạn truy cập vào đường link này: https://console.cloud.google.com/apis/library để tiến hành kích hoạt Google Sheets trên project của bạn

-
Tại màn hình chính, bạn thao tác chọn project đã tạo, sau đó tìm và nhấn vào mục
Google Sheets API -
Tại màn hình chi tiết của
Google Sheets API, bạn thao tác chọn nútEnablelà đã kích hoạt xong Google Sheet cho project của bạn.
Bước 2: Điền các trường thông tin cần thiết tại chi tiết source trên Elton
(1) Tại giao diện setup data source của Google Sheets, bạn thao tác điền các thông tin định danh cho source chuẩn bị tạo:
- Display name: Tên hiển thị của source. Elton khuyến khích bạn đặt tên có mối liên hệ với source Google Sheets mà bạn sắp sửa tạo (Ví dụ: Elton Google Sheets).
- Description: Mô tả của source

-
Connection - JSON Credentials: Tại phần này bạn thao tác copy toàn bộ code JSON từ file mà bạn đã tải về máy lúc setup project tương ứng trên BigQuery. Hướng dẫn chi tiết tạo project trên BigQuery bạn có thể xem thêm ở Phần 1: Hướng dẫn cài đặt nền (setup trên Google BigQuery)
-
Sau khi hoàn tất điền các thông tin của source ở (1), bạn nhấn
Save=> hệ thống sẽ đưa về trang thông tin chi tiết của source bạn vừa tạo.
Phần 2: Hướng dẫn điền các trường thông tin khi setup Connection với Source là từ Google Sheets
General info
1. Name: Tên của cài đặt connection bạn sắp tạo.
2. Description: Mô tả của cài đặt connection bạn sắp tạo
3. Sync Frequency: Chọn khoản thời gian định kỳ mà bạn muốn dữ liệu của connection sắp tạo được cập nhật. Ví dụ: Nếu bạn chọn option là Every 1 hour, thì cứ mỗi 1 tiếng hệ thống sẽ tự chạy và sync dữ liệu một lần.
Source config
Tại mục "Source Config" của màn hình setup chi tiết connection có source là Google Sheets, các trường thông tin bạn cần điền sẽ có ý nghĩa như sau:

1. Select Google Sheets Source
- Tại đây hệ thống sẽ hiển thị tên của source Google Sheets mà bạn đã tạo và chọn.
2. Google Sheet URL
- Bạn thao tác copy link URL của sheet mà bạn muốn kết nối và paste vào ô này.
3. Sheet name
- Bạn thao tác copy tên của sheet mà bạn muốn kết nối và paste vào ô này.
4. Start Cell
-
Là ô trên google sheets mà bạn sẽ bắt đầu scan để lấy data.
-
Trong một vài trường hợp, 1 số file Google Sheet được thiết kế có header hoặc tên người tạo, chứ không phải là bắt đầu A1 là data ngay. Vì vậy, khi điền vào ô này bạn cần kiểm tra lại file Google Sheet của bạn phần dữ liệu sẽ bắt đầu từ ô nào, để điền vào chính xác nhất.
-
Ví dụ: Trong hình ở dưới thì ở cell đầu tiên (A1) của sheet không phải là bắt đầu của dữ liệu, mà là tên chung của bảng. nội dung của bảng dữ liệu chỉ thực sự bắt đầu ở cell A2, khi mà tên cột (heading) đầu tiên được thể hiện. Vì vậy, trong trường hợp này, start cell của bạn là A2.

5. Load strategy
- Thông tin được dùng để xác định cách mà dữ liệu trong sheet sẽ được cập nhật khi có thay đổi phát sinh (chỉnh sửa hoặc thêm dòng mới). Có 3 lựa chọn để cập nhật dữ liệu: Merge, Overwrite, Append.
- Merge
-
Nếu chọn option là
Merge, khi có một dòng mới phát sinh, hệ thống sẽ detect và cập nhật vào. Trường hợp dòng dữ liệu đã tồn tại có thay đổi, hệ thống sẽ tự động cập nhật các thay đổi đó. -
Để option
Mergehoạt động, bạn cần phải điền thêmKey field.Key fieldở đây được định nghĩa là cột định danh của một record dữ liệu. -
Ví dụ: File Google Sheet về Dữ liệu những đơn hàng của cửa hàng A thì sẽ luôn có một cột dùng để định danh các đơn hàng. Cụ thể trong trường hợp này sẽ là cột
Mã đơn hàng. Vì vậy đối với ví dụ trên thìKey fieldsẽ là tên của cột định danh:Mã đơn hàng. Bạn thao tác điềnMã đơn hàngvào ôKey field.
- Overwrite
- Nếu chọn option là
Overwrite, mỗi khi cập nhật dữ liệu hệ thống sẽ thực hiện ghi đè lên toàn bộ dữ liệu cũ cũng như cập nhật thêm dữ liệu mới nếu có.
- Append
- Nếu chọn option là
Append, hệ thống sẽ chỉ cập nhật những record mới xuất hiện và sẽ không update data cũ khi có thay đổi.
6. Advanced configs - Date format config
-
Trường thông tin này cung cấp cho bạn các lựa chọn để format dữ liệu liên quan tới ngày/tháng/năm (date) trong trường hợp dữ liệu của bạn có nhập date theo các format không chuẩn, để quy về thành một chuẩn dữ liệu chung khi tạo connection.
-
Option None: Bạn chọn không cần format định dạng ngày/tháng/năm lại mà dùng định dạng đã có sẵn trong dữ liệu.
-
Option Basic: Bạn chọn cài đặt format cơ bản mà Elton cung cấp cho bạn. Bạn có thể chọn
Day firsthoặcYear first. -
Option Custom: Bạn tự định nghĩa format định dạng date của bạn. Lưu ý, khi tự định nghĩa cách format lại date, bạn vẫn cần tuân thủ một quy tắc nhất định. Trong trường hợp này bạn cần tham khảo thêm quy tắc format date ở đây.
Elton khuyến khích bạn chọn option Basic vì option này về cơ bản đã có thể bao quát hết các trường hợp nhập định dạng date sai, từ đó quy về chung một định dạng duy nhất.
Add-on: Cách tính Billable Pipeline cho source
-
Khi sử dụng Elton, bạn sẽ được thông báo về cách mà hệ thống sẽ tính phí sử dụng dịch vụ. Cách tính hiện tại chủ yếu dựa trên số pipeline bạn tạo.
-
Tuỳ từng loại source mà cách tính số lượng pipeline giới hạn sẽ khác nhau. Để biết thêm chi tiết, bạn vui lòng tham khảo cách tính ở link ở đây.