Bài viết này dành cho các bạn mới tìm hiểu về xây dựng mô hình dữ liệu (Data Modeling) trong Power BI Desktop, hướng dẫn cách tạo mối quan hệ hoạt động (Active) hoặc không hoạt động (Inactive) trong mô hình dữ liệu. Các mối quan hệ hoạt động (active relationship) truyền các bộ lọc đến các bảng khác một cách mặc định còn các mối quan hệ không hoạt động (inactive relationship) chỉ áp dụng các bộ lọc khi biểu thức DAX USERELATIONSHIP() được sử dụng.

Note: Phần giới thiệu về mối liên kết giữa các mô hình không được đề cập trong bài viết này. Nếu bạn chưa rõ về đặc điểm hoặc cách định cấu hình chúng, bạn có thể nên tìm hiểu thêm về Model relationships in Power BI Desktop

Active Relationships

Trong mô hình dữ liệu, chúng ta nên xác định các mối liên kết Active relationship bất cứ khi nào có thể. Từ đó, chúng ta có thể mở rộng tính năng phân tích của báo cáo và người dùng khi làm việc với Q&A và có thể dễ dàng sử dụng model của bạn.

Một ví dụ về một model Import được thiết kế để phân tích tình hình chuyến bay đúng giờ của các hãng hàng không. Mô hình này bao gồm bảng Flight, đây là nơi lưu trữ thông tin chi tiết mỗi chuyến bay trong mỗi hàng. Các hàng này ghi lại ngày bay, số hiệu chuyến bay, sân bay khởi hành và đến, và bất kỳ thời gian trễ nào (tính bằng phút). Ngoài ra còn có bảng Airport lưu mỗi hàng với một tên sân bay cụ thể. Mỗi hàng mô tả mã sân bay, tên sân bay và quốc gia.

quản lý mối quan hệ relationships của Data Model

Bảng Flight và Airport có sự liên kết với nhau. Trong bảng Flight, cột DepartureAirport và ArrivalAirport liên quan đến cột Airport của bảng Airport. Trong thiết kế star schema, bảng Airport được mô tả như một dimension. Trong model này, nó có hai vai trò là ArrivalAirport và DepartureAirport.

Mặc dù thiết kế này hoạt động tốt trong star schema, nhưng nó không phù hợp với các model của Power BI. Lí do là bởi vì các mối quan hệ mô hình là các đường dẫn truyền bộ lọc và các đường dẫn này phải xác định (lọc theo 1 cột). Vì lý do này, một mô hình không thể có nhiều active relationship giữa hai bảng. Do đó, ngoài active relationship đã có, các mối quan hệ khcs được đặt trong inactive relationship được biểu thị bằng đường đứt nét. Cụ thể, đó là mối quan hệ với cột ArrivalAirport đang hoạt động. Điều này có nghĩa là các bộ lọc áp dụng cho bảng Airport sẽ tự động truyền đến cột ArrivalAiport của bảng Flight.

Tuy nhiên, mô hình này lại có những hạn chế nghiêm trọng về dữ liệu có thể được báo cáo. Cụ thể, với mô hình trên, chúng ta không thể lọc bảng Aiport để tự động tách biệt thông tin chi tiết chuyến bay lúc khởi hành (Departure Airport). Vì các yêu cầu báo cáo liên quan đến việc lọc (hoặc nhóm) theo sân bay đi và đến cùng một lúc, nên cần có hai mối quan hệ active relationship này. Chuyển yêu cầu này thành thiết kế mô hình Power BI có nghĩa là mô hình phải có hai bảng airport.

quản lý mối quan hệ relationships của Data Model

Bây giờ mô hình này đã có 2 bảng Airport: Departure Airport và Arrival Airport. Mối quan hệ giữa các bảng và bảng Flight đã được kích hoạt. Các tên cột ỏ bảng Departure Airport và Arrival Airport được chỉnh sửa lại từ các từ như Departure hoặc Arrival.

quản lý mối quan hệ relationships của Data Model

Phương pháp tái cấu trúc

Đây là một phương pháp để cấu trúc lại mô hình từ một bảng dimension đóng vai trò duy nhất sang thiết kế với một bảng cho mỗi vai trò nhất định.

  1. Loại bỏ mọi inactive relationship.
  2. Cân nhắc đổi tên bảng dimension để mô tả rõ hơn vai trò của nó. Trong ví dụ, bảng Airport liên quan đến cột ArrivalAirport của bảng Flight, vì vậy nó được đổi tên thành Arrival Airport.
  3. Tạo một bản sao của bảng để cung cấp một tên để thể hiện vai trò của nó. Nếu đó là bảng Import, bạn có thể cân nhắc sử dụng DAX tạo bảng. Nếu đó là bảng DirectQuery, bạn có thể sao chép truy vấn Power Query.

Trong ví dụ, bảng Departure Airport được tạo bằng các bảng được tính toán sau đây:

DAX

Departure Airport = ‘Arrival Airport’

  1. Tạo một active relationship cho bảng mới.
  2. Cân nhắc đổi tên các cột trong bảng để cung cấp chính xác vai trò của chúng. Trong ví dụ trên, tất cả các cột đều có tiền tố là Departure hoặc Arrival. Những tên này đảm bảo báo cáo và sẽ có mô tả cụ thể giữa 2 bảng. Và cũng cải thiện trải nghiệm Hỏi & Đáp, cho phép người dùng dễ dàng viết câu hỏi của họ.
  3. Cân nhắc thêm mô tả vào bảng phân vai. (Trong trường Field, mô tả xuất hiện trong chú thích công cụ khi người làm báo cáo di con trỏ qua bảng.) Bằng cách này, bạn có thể thông báo bất kỳ chi tiết truyền bộ lọc bổ sung nào cho các báo cáo của bạn.

Inactive relationships

Inactive Relationship

Trong trường hợp đặc biệt, các mối quan hệ của inactive relationships có thể giải quyết các nhu cầu bảng báo cáo đặc biệt, điển hình là với Role-playing Dimension (nếu bạn chưa hiểu về Role-playing Dimesnion, có thể đọc ở bài viết này: )

Bây giờ chúng ta hãy xem xét các yêu cầu về mô hình và báo cáo:

  • Mô hình bán hàng bao gồm bảng Sales có 2 cột là OrderDate và ShipDate.
  • Mỗi hàng trong bảng Sales ghi lại từng đơn hàng order.
  • Bộ lọc ngày thường được dùng cho cột OrderDate để lưu các ngày cụ thể.
  • Chỉ có một measure yêu cầu bộ lọc ngày đến cột ShipDate và cột này gồm các ô trống (BLANKs) cho đến khi đơn hàng được giao.
  • Không bắt buộc phải lọc đồng thời hoặc theo nhóm trong order và ngày ship.

Đây là một phần model của 2 bảng

quản lý mối quan hệ relationships của Data Model

Bảng Sales và Date có sự liên kết với nhau. Trong bảng Sales, cột OrderDate và ShipDate có liên quan đến cột Date của bảng Date. Trong model này thì có 2 vai trò của bảng Date là cung cấp dữ liệu ngày order và ngày ship.

Có 6 hàm tính sẽ được lọc bới cột OrderDate nhưng sẽ có hàm Orders Shipped được lọc bới cột ShipDate.

Ví dụ hàm Orders dưới đây chỉ đơn giản là tính các hàng của bảng Sales. Các bộ lọc sẽ áp dụng cho bảng Date sẽ kết nối đến cột OrderDate

DAX

Orders = COUNTROWS(Sales)

Hàm Orders Shipped sẽ sử dụng USERELATIONSHIP của hàm DAX để tạo bộ lọc kết nối đến cột ShipDate.

DAX

Orders Shipped =

CALCULATE(

COUNTROWS(Sales)

,USERELATIONSHIP(‘Date'[Date], Sales[ShipDate])

)

Model này hỗ trợ tạo ra bảng báo cáo sau

quản lý mối quan hệ relationships của Data Model

Trang báo cáo lọc theo quý 2019 Q4. Đây là bảng trực quan nhóm theo tháng hiển thị các thống kê bán khàng khác nhau. Các hàm tính Orders và Orders Shipped cho ra nhiều kết quả khác nhau. Chúng cùng sử dụng chung một phương pháp đó là tính hàng tròn bảng Sales nhưng truyền bộ lọc qua bảng Date là khác nhau.

Lưu ý rằng bộ slicer bao gồm một mục BLANK, đây là slicer từ bảng mở rộng table expansion. Mặc dù mỗi hàng trong bảng Sales có ngày đặt hàng, một số hàng có ngày giao hàng là (Blank) có nghĩa là những đơn hàng này vẫn chưa được giao. Bảng mở rộng cũng xem xét các mối quan hệ inactive relationship và do đó các BlANKs xuất hiện do các vấn đề về độ chính xác của dữ liệu (data integrity).

Kết luận

Chúng ta nên xác định các active relationship bất cứ lúc nào có thể. Vì mối quan hệ này sẽ mở rộng phạm vi và tiềm năng cho cả người tạo báo cáo và người dùng làm việc với Q&A để có thể sử dụng bảng báo cáo của bạn. Điều đó có nghĩa là các bảng dimension phải được sao chép trong báo cáo của bạn.

Tuy nhiên, trong các trường hợp cụ thể, bạn có thể xác định một hoặc nhiều inactive relationship cho bảng dimension. Vì vậy ta có thể xem xét khi:

  • Không yêu cầu bảng báo cáo phải lọc đồng thời theo các vai trò khác nhau
  • Bạn sử dụng hàm USERELATIONSHIP của DAX để kích hoạt một relationship cụ thể cho các tính toán liên quan.

𝐂𝐎̂𝐍𝐆 𝐓𝐘 𝐂𝐎̂̉ 𝐏𝐇𝐀̂̀𝐍 𝐊𝐏𝐈𝐌

Leave a Comment