A. TỔNG QUAN DỰ ÁN

Trong các dự án phân tích dữ liệu phức tạp, việc quản lý phiên bản, phối hợp nhóm và triển khai tự động luôn là những thách thức lớn. Để giải quyết vấn đề này, Git Integration trong Microsoft Fabric chính là công cụ mạnh mẽ giúp bạn kiểm soát toàn bộ quy trình phát triển dữ liệu một cách hiệu quả.

Git Integration cho phép bạn đồng bộ toàn bộ workspace của mình—bao gồm báo cáo Power BI, pipeline xử lý dữ liệu và các thành phần quan trọng khác—với một repository Git (như GitHub hoặc Azure DevOps). Điều này giúp bạn theo dõi, kiểm soát thay đổi dễ dàng và triển khai một cách tự động, đảm bảo tính liên tục và nhất quán trong quá trình làm việc.

Các lợi ích dung Git:

  • Quản lý phiên bản dễ dàng: Mọi thay đổi đều được ghi lại, giúp bạn quay về phiên bản trước đó nếu cần, hạn chế tối đa rủi ro sai sót.
  • Hợp tác nhóm hiệu quả: Các thành viên có thể làm việc trên nhánh riêng biệt, thử nghiệm thoải mái mà không lo ảnh hưởng đến môi trường chính. Khi hoàn tất, chỉ cần merge để đồng bộ thay đổi.
  • Theo dõi chi tiết mọi thay đổi: Lịch sử chỉnh sửa rõ ràng với đầy đủ thông tin về người thực hiện, thời điểm thay đổi và nội dung cập nhật, giúp kiểm soát quy trình làm việc tốt hơn.
  • Triển khai tự động: Tích hợp với CI/CD pipeline, mọi cập nhật sẽ được tự động triển khai lên môi trường sản xuất, giảm thiểu công sức và tối ưu thời gian triển khai.

Với Git Integration, Microsoft Fabric mang đến một giải pháp toàn diện giúp quản lý và triển khai dữ liệu nhanh chóng, chính xác, phù hợp với các dự án phân tích dữ liệu quy mô lớn.

B. CÁC BƯỚC THỰC HIỆN:

1. Đầu tiên, các bạn cần tạo một project trên azure devops (https://dev.azure.com/), như trong ảnh mình đang có sẵn một project tên Fabric.

Có thể là hình ảnh về văn bản

2. Tại workspace trong Fabric bạn đang làm việc, chọn Workspace settings.

Có thể là hình ảnh về văn bản

3. Chọn Git integration và Azure Devops.

Có thể là hình ảnh về văn bản

4. Chọn Project bạn vừa tạo ở bước đầu tiên
– Branch: Chọn một nhánh hiện có hoặc chọn New Branch để tạo một nhánh mới.
– Folder: Nhập tên thư mục hiện có hoặc nhập một tên mới để tạo thư mục mới. Nếu bạn để trống tên thư mục, nội dung sẽ được tạo trong thư mục gốc.

Chọn connect and sync.

Có thể là hình ảnh về văn bản cho biết 'Data Engineering Postgres Search Workspace settings General ቀ License info Trial: 21 days left AAD account 20133098@st.hcmute.edu.vn 8 Azure connections G+ Log out System storage x Git integration OneLake Connect Git repository and branch Manage Manageallaccounts all accounts Organization' Workspace identity 20133098 Network security Project O Monitoring Fabric Power BI Git repository 1 Fabric Delegated Settings Branch i main Data Engineering/Science Git folder Data Factory Enter name folder Connect and sync Cancel'

5. Quy trình đồng bộ:
– Nếu workspace hoặc nhánh Git đang trống, hệ thống sẽ sao chép toàn bộ nội dung từ bên có dữ liệu sang bên còn trống.
– Nếu cả workspace và nhánh Git đều có nội dung, hệ thống sẽ yêu cầu bạn chọn hướng đồng bộ (từ Git sang workspace hoặc ngược lại).
Sau khi kết nối thành công, vì project này đã được tạo sẵn các item từ trước, nên toàn bộ nội dung đó đã được đồng bộ vào workspace hiện tại.

Có thể là hình ảnh về văn bản

6. Khi nối thành công với một thư mục Git, các chỉnh sửa workspace của bạn sẽ như bình thường. Mọi thay đổi vẫn sẽ chỉ được lưu trong workspace trừ khi bạn commit các thay đổi của mình lên nhánh Git.
Ở đây mình mới vừa thêm nội dung mới cho file nb_01, chọn icon Source control.

Có thể là hình ảnh về văn bản cho biết 'Fabric + New item Create deployment pipeline B New folder Create app 08 → Import Manage access Source control Workspace settings Name Filter by keyword = Filter env Git status LH_01 Type Synced Task LH_01 Environment Synced LH_01 Lakehouse nb_01 Semantic model +.. SQL analytics end... Uncommitted Notebook'

7. Ở đây sẽ hiện các danh sách các item đã thay đổi, chọn item bạn muốn commit và thêm mô tả cho commit (không bắt buộc).

Có thể là hình ảnh về văn bản

8. Sau khi commit thành công, bạn có thể check trên azure devops lịch sử đã commit.

Có thể là hình ảnh về văn bản cho biết 'Azure DevOps F Commits နွ main Fabric a Search Commits TN Graph On Commit Commit ID a Pull Request Status feat: added extract function 1cd6cb1f Tot Nguyen Just now feat: add new code in nb_ c6aeAb69 Tot Nguyen Yesterday 11:05 AM Committing items from wor... 0e4fe9cf Tot Nguyen Yesterday 10:40 AM feat: add new file etl step1.py db13b43f R Tot Nguyen Yesterday at 10:31 AM test: add readme 6a703776 R Tot Tot Nguyen Yesterday 10:27 AM >'

 

Viết bài: Nguyễn Văn Trường Tốt