Dữ liệu của bạn trong GA4 có thể không chính xác – Data sampling. Nếu bạn không cấu hình đúng hoặc có lượng dữ liệu lớn thì kết quả sẽ sai số từ 10-80%, hoặc thậm chí nhiều hơn. 

Bạn có thể tin tưởng dữ liệu như lượt truy cập (visits) và lượt xem trang (pageviews), thông tin về doanh thu (revenues), giao dịch (transactions), mục tiêu chuyển đổi (goal conversions) và tỷ lệ chuyển đổi (conversion rates)… Có rất nhiều nghi ngờ liên quan tới dữ liệu mà bạn thắc mắc, vậy làm thế nào để biết? Loạt bài kinh nghiệm cần biết khi sử dụng GA4 sẽ mang lại cho bạn những thông tin hữu ích.

Nguyên nhân dữ liệu không chính xác

Đa phần lý do dữ liệu không chính xác là do bước cài đặt. Một lý do khác, nằm ngoài tầm kiểm soát của người dùng trong Google Analytics – GA là phiên bản miễn phí – Standard, là xác suất nhận dữ liệu mẫu (data sampling) trong báo cáo GA. 

Data sampling là gì?

Data sampling là quá trình sử dụng tập con của dữ liệu để phân tích với mục đích hiểu được toàn bộ dữ liệu nhanh chóng. Ví dụ: bạn có 10,000 miếng lego trong phòng, bạn muốn biết có bao nhiêu miếng lego có màu đỏ? Giả sử bạn lấy ra 1,000 miếng lego và giả định có 200 miếng lego màu đỏ. Vậy với 10,000 miếng lego thì sẽ có 2,000 miếng lego màu đỏ.

  • Như ví dụ trên, data sampling sẽ ước lượng thay vì tính toán cụ thể.
  • Data sampling chỉ đạt tiêu chí về tốc độ, nhưng độ chính xác không cao. Quay trở lại ví dụ trên, nếu mật độ phân bố của các miếng lego màu đỏ không đồng đều nhau sẽ dẫn đến tình trạng ước lượng sai.

Data sampling trong GA4 hiển thị như thế nào?

Trên GA4, báo cáo được xây dựng với 2 phần: Báo cáo tiêu chuẩn và báo cáo tùy chỉnh (Advance). Trong hoạt động phân tích dữ liệu, lấy mẫu là phương pháp phân tích một nhóm dữ liệu nhỏ để tìm ra những thông tin có ý nghĩa trong tập dữ liệu lớn hơn.

Báo cáo tiêu chuẩn thông thường sẽ không áp dụng data sampling, kể cả khi sử dụng secondary dimensions, lọc hoặc chỉnh sửa báo cáo.

Upsampled Report

Tuy nhiên, đối với website hoặc app hoặc gộp chung website và app dữ liệu hiển thị với dạng dấu “!” hình tam giác, thì nguyên nhân có thể là do Google Analytics đã áp dụng ngưỡng dữ liệu. Các ngưỡng dữ liệu được áp dụng để ngăn một người dùng bất kỳ đang xem báo cáo hoặc dữ liệu khám phá suy luận ra danh tính của người dùng cá nhân dựa trên thông tin nhân khẩu học, mối quan tâm hoặc các tín hiệu khác có trong dữ liệu.

Thresholding applied

Với báo cáo tùy chỉnh (Advance) – data sampling thường xảy ra khi tạo các phân tích nâng cao (khi bạn thực hiện báo cáo với nhiều giá trị hoặc biến.

Data sampling

Trong trường hợp trên, để thực hiện dữ liệu một cách đầy đủ, các bạn nên cân nhắc upgrade GA4 lên GA4 360, Tính năng request unsampled sẽ thực hiện chức năng này. Hãy liên hệ với Kasatria để được tư vấn.

Request Data sampling

Process request upsampled

Các bạn cũng có thể thực hiện lấy dữ liệu từ BigQuery (G4 cho phép liên kết với BigQuery), tuy nhiên, trừ khi bạn upgrade lên GA4 360 thì sẽ không bị hạn chế về mặt dữ liệu. GA4 bản miễn phí chỉ cho phép tối đa 1 triệu event mỗi ngày.