Hướng dẫn sử dụng Regular Expression (Regex) trong Google Analytic

Huong-dan-su-dung-regular-expression-googleanalytic

Share This Post

Share on facebook
Share on linkedin
Share on twitter
Share on email

Như đã đề cập trong bài viết 10 kỹ năng cần thông thạo để được gọi là chuyên gia Google Analytic, thông thạo Regular Expression (Regex) sẽ giúp bạn thao tác dễ dàng hơn nhiều khi cần filter data hay thiết lập 1 mục tiêu trong Google Analytic.

Nếu bạn chưa quen thuộc với Regular Expression, bài viết này sẽ giúp bạn làm quen và hướng dẫn chức năng cực kỳ mạnh mẽ này.

Viết tắt:

Regular Expression: Regex

Google Analytic: GA

I. Sử dụng Regex ở đâu?

Advanced Search

Trong Advanced Search của GA, bạn chọn “Matching RegExp” và nhập lệnh tìm kiếm vào

Tạo Mục tiêu

Admin->Goal-> Create new Goal

Nếu Goal thuộc loại Destination thì bạn chọn Drop down menu và chọn “Regular Expression”

regular-expression-1

Lọc dữ liệu (Filter)

Admin->Filter-> Add Filter

Ví dụ bạn muốn loại bỏ tất cả lượt xem từ nhân viên nội bộ trong công ty. Bạn nhập Exclude -> traffic from IP address và IP address của cty bạn là dải IP từ 198.51.100.1 – 198.51.100.25. Thay vì nhập Exclude 25 lần từng IP này, bạn dùng lệnh Regex 198\.51\.100\.\d*.

II. Hướng dẫn sử dụng các lệnh Regex

1. \ (backflash)

Lệnh này có nghĩa là “thoát”, lấy ví dụ như sau:

Bạn có 1 tìm kiếm link như sau /folder?pid=123, nhưng vấn đề là dấu ? cũng có ý nghĩa trong Regex nên bạn phải nói cho GA biết là dấu ? đó không có ý nghĩa gì đâu, chỉ là 1 ký tự bình thường thôi. Khi đó bạn sử dụng \ phía trước ký tự ? như sau:

/folder\?pid=123

regex-backflash

2. | (the Pipe)

Lệnh này có nghĩa là “hoặc”. Lệnh này sử dụng rất dễ.

Ví dụ bạn đặt Goal là vào trang thank-you hoặc confirmation. Bạn sẽ vào Goal và chọn destination là thank-you|confirmation. Traffic vào cả 2 trang này đều được tính vào 1 Goal id trong GA.

refex-pipe-goal

Hoặc ví dụ khác, bạn muốn lọc chỉ xem data những bài viết về EmailGoogle. Bạn nhập Email|Google là xong.

Các bài viết có chưá từ khoá Email và Google sẽ trả về cho bạn.

regex-pipe

3. ? (the Question Mark)

Đây là câu lệnh đã được nhắc tới ở phần | (backflash). Lệnh ? có nghĩa là “ký tự phía trước có cũng được, không có cũng được”

Ví dụ: Bạn muốn lọc bài viết về Google Analytic nhưng không biết cữ Google hay Gooogle. Bạn sẽ nhập lệnh như sau để có cả 2 kết quả:

Gooo?gle

Nếu bạn chỉ search Google Analytic, kết quả sẽ không trả về dữ liệu Gooogle Analytic

Câu lệnh này sử dụng tốt khi bạn đang phân vân không biết viết từ này có đúng hay không, kiểu như Suggession hay là Suggesion.

regex-questionmark4. () Parentheses

Lệnh này nghĩa là “tương đồng”

Dấu ngoặc tròn này ý nghĩa giống như dấu ngoặc trong toán.

(2+3)x5 = 2×5 + 3×5

Thay vì viết dài ra thì dùng dấu ngoặc để gom nội dung lại.

Ví dụ. Bạn có 1 form đăng ký để ở chuyên mục Google Analytic và 1 form khác ở chuyên mục Google Tag Manager. Bạn muốn đo xem trang thank-you đến từ cả 2 thư mục thì thay vì việc phải nhập 2 lần là:

/googleanalytic/thank-you

and

/googletagmanager/thank-you

Với regex () và kết hợp |, bạn nhập như sau:

/google(analytic|tagmanager)/thank-you

regex-parentheses-1

Lấy 1 ví dụ khác có sự kết hợp với lệnh ?

Bạn có nhiều landing page khác nhau để confirm khi KH đăng ký form thành công:

/thank-you

/thanks

/thanksalot

Dùng regex ()? để lọc với câu lệnh:

/thanks(alot)?

Với dấu ?, có nghĩa là (alot) là tuỳ chọn, có cũng được, không có cũng được. Kết quả sẽ trả về bắt buộc phải có /thanks và (alot) là tuỳ chọn, vì vậy kết quả sẽ trả về cả /thanks và /thanksalot và không có /thank-you vì không có s trong URL.

regex-parentheses

5. [-] (Square Brackets and Dashes)

Lệnh này có nghĩa là Liệt kê danh sách

Ví dụ như bạn muốn lọc adsets1 đến adset19, bạn sẽ nhập

adsets1[1-9]

ký tự trong dấu [] gồm cả số, lẫn chữ cái.

Ví dụ [a-z] liệt kê tất cả chữ cái từ a đến z. VD: dragonballx, dragonballz.

Thực hành vài lần trong GA bạn sẽ hiểu câu lệnh này.

6. {} (Braces)

Lệnh này có nghĩa là “Nhắc lại ký tự cuối cùng”

Có 2 hình thức sử dụng câu lệnh này.

  • Nếu câu lệnh dạng {x,y} có nghĩa là ký tự cuối cùng được nhắc lại ít nhất x lần và tối đa y lần.
  • Nếu câu lệnh dạng {x} có nghĩa là ký tự cuối cùng được nhắc lại chính xác lần.

Ví dụ đối với câu lênh dạng {x,y}

Bạn cần lọc những IP từ 123.169.1.0 đến 123.169.1.99, bạn sẽ nhập

123\.169\.1\.[0-9]{1,2}}

Ví dụ đối với câu lênh dạng {x}

Bạn cần lọc IP từ 123.169.1.69 đến 123.169.1.96, bạn sẽ nhập

123\.169\.1\.[0-9]{2}

7. . (the Dot)

Câu lệnh này thực ra rất khó hiểu. Một mình nó thường không làm được gì. Nó thường phải đi kèm với 1 Regex khác.

Lênh . có nghĩa là bao gồm tất cả nhưng chỉ 1 ký tự kể cả khoảng trắng.

Ví dụ bạn lọc dữ liệu và nhập .ite, nó sẽ trả ra kết quả như site, bite, lite, pite, %ite, #ite, ite…

Bạn sẽ gặp trường hợp nhập IP address vào và bị lỗi do qúa nhiều dấu ., bạn cần thêm regex \ để phủ định ý nghĩa . về chỉ là dấu chấm bình thường.

Trường hợp bạn có 1 dải dữ liệu IP như là 125.169.1.250 đến 125.169.1.255, bạn sẽ nhập

125\.169\.1\.25.

Tìm hiểu thêm sự kết hợp của . với các regex khác phía dưới sẽ thấy được sự mạnh mẽ của nó chứ không thực sự vô dụng như khi nó đứng 1 mình.

8. + (Plus)

Lệnh này có nghĩa là “bao gồm nhân bản 1 hoặc nhiều của ký tự trước nó”

Về cơ bản, đây cũng là 1 regex khá vô dụng khi đứng 1 mình nhưng đôi lúc cần đến thì nó lại tỏ ra khá hữu hiệu

Ví dụ để hiểu regex này, với từ Google sẽ có người viết gooooogle hoặc gooooooogle, vậy để lọc tất cả dữ liệu này, bạn nhập

goo+gle

kết quả sẽ trả ra gồm goooogle hay goooogle… nhưng sẽ không có gogle vì nó chỉ gồm nhân bản của 1 hoặc nhiều của ký tự ngay trước nó, không bao gồm zero.

9. * (Star)

Lệnh này y hệt + (plus) ngoại trừ việc nó bao gồm 0 hoặc nhiều nhân bản của ký tự ngay trước nó.

có nghĩa là với cùng ví dụ trên thì câu lênh goo*gle vẫn trả ra được kết quả là gogle. 

10. .* (Dot Star)

Lệnh này có nghĩa là “Mọi thứ”

Ví dụ mình có rất nhiều bài viết trong thư mục dinh dưỡng nhưng muốn lọc ra tất cả bài viết kết thúc bằng day-thi.html

Câu lệnh sẽ là

/dinh-duong/.*day-thi\.html

Và đây là kết quả

regex-dot star

Nếu bạn kết hợp với .*() trở thành (.*) thì có nghĩa là Get all, nghĩa là Lấy mọi thứ

11. ^ (Caret)

Lệnh này có nghĩa là “Bắt đầu chính xác với câu lệnh Regex”

Ví dụ bạn có URL www.demo.com/google/google-analytic-advanced/folder-1.html và bạn chỉ muốn chọn từ page path 2 là google analytic. Bạn dùng filter data với Regex ^/google-analytic-advanced nhưng kết quả là không có gì. Tại sao vậy?

Bởi vì GA đọc URL bắt đầu từ .com (hoặc .vn, .edu…) trở về sau, nó cần phải bắt đầu từ Google nếu không nó là 1 URL không có nghĩa. Việc bạn bỏ qua /google/… chẳng khác nào bạn ở giữa 1 cây cầu mà không có lối vào.

Câu lệnh đúng phải là:

^/google/google-analytic-advanced

regex-caret

12. $ (Dollar sign)

Lệnh này nghĩa là “Stop here”, không chọn tiếp những nội dung kể từ sau $.

Ví dụ bạn chỉ muốn chọn đọc dữ liệu của trang chủ. Trang chủ trong GA được ký hiệu là /, nhưng vấn đề là nếu chỉ search /, nó sẽ liệt kê tất cả URL khác nữa.

Với regex $, bạn nhập: /$

nghĩa chỉ chọn những URL kết thúc với /, nhưng 1 vấn đề nữa là có nhiều URL cũng kết thúc với / nhưng không phải là trang chủ. Lúc này bạn cần kết hợp với regex ^. Để chọn chỉ trang chủ, bạn nhập

^/$

regex-dollar-homepage

Lấy ví dụ khác, bạn có chuyên mục Dinh dưỡng với URL là /dinh-duong, bạn chỉ muốn xem có bao nhiêu Traffic vào Chuyên mục Dinh dưỡng này và không muốn xem cụ thể trong từng bài viết với URL như là /dinh-duong/post1, /dinh-duong/post2 …, bạn cần nhập lệnh search advanced như sau:

/dinh-duong$

regex-dollar-2

Trên đây là hướng dẫn sử dụng 12 câu lênh Regex trong Google Analytic. Bạn sẽ cần luyện tập nhiều để có thể thông thạo kết hợp các câu lệnh này để có thể trở thành chuyên gia về Google Analytic.

III. Một số link kênh Youtube để tham khảo về Regex

Kênh Measureschool – How to use Regular Expressions with Google Tag Manager & Google Analytics

Kênh Loves data – Google Analytic RegEx | Top 5 tips

Tung Phan (Daniel)

Tung Phan (Daniel)

Digital Marketing Specialist. Chia sẻ những kiến thức về marketing trong quá trình làm việc và tự tìm tòi học hỏi qua các tài liệu. Hy vọng mọi người cảm thấy có ích!

Subscribe To Our Newsletter

Get updates and learn from the best

More To Explore