Nghiên cứu ứng dụng trực quan hóa dữ liệu trong phổ biến thông tin thống kê

30/05/2019 - 09:13 AM - 552 lượt xem
Trong những năm gần đây, công tác phổ biến thông tin thống kê của Tổng cục Thống kê ngày càng được đẩy mạnh bằng nhiều cách thức, đa dạng về nội dùng và phong phú về hình thức. Kết quả của cuộc điều tra Nhu cầu và mức độ hài lòng của người dùng tin năm 2017 do TCTK tiến hành cho thấy, hình thức phổ biến thông tin qua website đang chiếm được sự yêu thích của người dùng. Vậy câu hỏi đặt ra là công cụ phổ biến thông tin nào trên website sẽ đem lại hiệu quả nhất bên cạnh các ấn phẩm in dạng điện tử hoặc các báo cáo, bảng biểu số liệu? Các nhà khoa học cho rằng, người dùng tin ghi nhớ hình ảnh mô tả về số liệu thống kê nhanh hơn nhiều lần so với những gì họ đọc và nghe. Chính vì vậy, giải đáp cho câu hỏi này thì trực quan hóa dữ liệu là một trong những lựa chọn không thể bỏ qua. Hiện nay trên thị trường có rất nhiều phần mềm, công cụ trực quan hóa dữ liệu như Power BI, Sisense, Tableau, Zoho, Qlik Sense... Hiện TCTK đang nghiên cứu sử dụng phần mềm trực quan hóa dữ liệu Power BI trong công tác phổ biến thông tin thống kê.

Power BI là phần mềm phân tích của Microsoft cung cấp tính năng trực quan hóa dữ liệu có tính tương tác cao. Với phần mềm này, người dùng thông thường (hay các cán bộ ngành thống kê) có thể tự tạo báo cáo (trên máy tính) và trang báo cáo (trên web) còn gọi là dashboard mà không cần phụ thuộc vào nhân viên công nghệ thông tin hoặc quản trị viên cơ sở dữ liệu.
 
Thay vì thể hiện dưới dạng bảng biểu thông thường trong excel hay các tập ấn phẩm in dài hàng nghìn trang, số liệu thống kê có thể được tập hợp và gom vào kho dữ liệu chung của Power BI, từ đó người làm thống kê sẽ thiết kế ra các trang báo cáo dưới dạng biểu đồ và hình ảnh tùy theo nhu cầu của từng đơn vị.

Người dùng tin sẽ dễ dàng tiếp cận số liệu thống kê được thể hiện dưới dạng biểu đồ, bảng biểu động trên trang web. Những biểu đồ hay bảng biểu này có tính tương tác cao, dễ sử dụng, dễ hiểu và thu hút người dùng tin hơn. Tính tương tác được thể hiện ở việc người dùng có thể lựa chọn chỉ tiêu thống kê và các phân tổ tùy theo các trang báo cáo đã được thiết kế sẵn. Số liệu thống kê trong các biểu đồ sẽ tự động thay đổi đúng với yêu cầu của người dùng tin. Điểm khác biệt lớn nhất giữa việc thể hiện số liệu thống kê dưới dạng biểu đồ bằng công cụ office thông thường như Excel, Word, Power point và công cụ Power BI chính là tính tương tác với người dùng tin. Đối với một biểu đồ được dựng bởi các công cụ thông thường, thông tin được thể hiện thường là cố định.

Ví dụ như biểu đồ cột về Tốc độ tăng GDP các năm 2011-2018. Người làm thống kê sẽ gặp hạn chế khi muốn đưa thêm các thông tin vào biểu đồ này như tốc độ tăng theo khu vực kinh tế hay theo phương pháp sử dụng. Khi dựng biểu đồ bằng công cục office thông thường, giải pháp được đưa ra sẽ là tạo thêm 1 hoặc 2 biểu đồ theo các phân tổ khác. Đối với Power BI, người lập báo cáo có thể thêm vào các bộ lọc là các phân tổ mà họ muốn thể hiện hay người dùng tin quan tâm, để tạo ra các tương tác đối với người dùng tin trên cùng một biểu đồ. Người dùng tin có thể lựa chọn bộ lọc tốc độ tăng GDP theo khu vực kinh tế hay theo phương pháp sử dụng để có được thông tin mà họ muốn và số liệu trên biểu đồ sẽ tự động thay đổi khi phân tổ được lựa chọn.

 
Nghiên cứu ứng dụng trực quan hóa dữ liệu trong phổ biến thông tin thống kê

Ngoài ra, đối với một trang báo cáo trong phần mềm Power BI, người lập báo cáo có khả năng tạo ra nhiều biểu đồ, bảng biểu, bản đồ, hình ảnh minh họa có tính liên kết với nhau bằng cách sử dụng chung một kho dữ liệu có sẵn. Điều này khác hoàn toàn đối với một trang báo cáo trên trang office thông thường. Đối với các biểu đồ được tạo bằng công cụ microsoft word, excel hay power point, các biểu đồ đứng độc lập với nhau. Trong power BI, việc liên kết các thành phần trên một báo cáo được thiết lập dễ dàng bằng cách lựa chọn phân tổ của chỉ tiêu thống kê cụ thể. Hình dạng, số liệu của các bảng biểu và biểu đồ cũng sẽ thay đổi theo nhằm giúp người dùng tin có thể khai thác thông tin được nhiều nhất và có cái nhìn từ bao quát đến cụ thể về lĩnh vực được thể hiện trên trang báo cáo của Power BI.

Công cụ trực quan hóa dữ liệu Power BI thích hợp nhất đối với việc biểu hiện các dữ liệu nguồn (raw data) thu được từ các cuộc điều tra hơn là các số liệu tổng hợp (summary data). Điều này không có nghĩavới số liệu tổng hợp (ví dụ như số liệu trong niên giám hoặc báo cáo tháng) là không thể dùng được. Đối với số liệu tổng hợp hay số liệu nguồn, nếu muốn thể hiện trên power BI một cách tốt nhất thì đều cần phải có số liệu theo chuỗi thời gian (dãy năm hoặc tháng);được phân tổ nhiều chiu (phân theo khu vực và ngành kinh tế, theo địa phương, theo nước...).

Power BI nhấn mạnh vào khả năng thể hiện dữ liệu động, khả năng tương tác với người dùng tin nên thích hợp nhất với việc phổ biến số liệu thống trên website trên các thiết bị điện tử (như điện thoại máy tính bảng). Đối với hình thức phổ biến thông tin dưới dạng ấn phẩm hoặc sản phẩm in, Power BI khó có thể áp dụng để phát huy hết được thế mạnh.

Để đa dạng hình thức phổ biến thông tin, website của Tổng cục Thống kê có thể thiết kế để người dùng tin truy cập số liệu theo hai hình thức song song, đó là thông qua bảng biểu số liệu thông thường như hiện tại hoặc thiết kế trang dữ liệu được hình ảnh hóa (giống như ASEANstats hiện đang phổ biến số liệu thống ASEAN). Với cách phổ biến số liệu theo kiểu truyền thống, người dùng tin có thể xem trực tiếp dưới dạng bảng biểu hoặc tải về dưới dạng Excel, thích hợp với những người muốn nghiên cứu sâu và tiến hành tính toán thêm. Tuy nhiên, cách phổ biến này cũng sẽ kén người dùng vì không phải website nào ng tương thích khi xem trên điện thoại máy tính bảng (hiện này website của Tổng cục Thống ng không thích hợp để sử dụng trên điện thoại máy tính bảng). Những người dùng tin muốn sử dụng dữ liệu theo cách này thường sẽ phải dùng máy tính. Với cách phổ biến số liệu trên website sử dụng phần mềm Power BI, người dùng tin có thể sử dụng bất cứ thiết bị điện tử nào trên nhiều nền tảng khác nhau được hình ảnh phong phú, dễ nhìn, dễ hiểu, thu hút người dùng tin. Tuy nhiên,ngnhững nhược điểmngười dùng tin chỉ có thể tương tác với trang báo cáo để đọc được số liệu mà họ muốn, nhưng không thể thay đổi cấu trúc hay số liệu trong báo cáo, ng như tải về máy để tính toánbắt buộc phải sử dụng online./.

 
Nghiên cứu ứng dụng trực quan hóa dữ liệu trong phổ biến thông tin thống kê 1

 
ThS. Thái Hà
Vụ Thống kê Tổng hợp - TCTK

Các bài viết khác
Liên kết website
Liên kết website
Thăm dò ý kiến

Đánh giá khách quan của bạn về thông tin chúng tôi cung cấp? Vui lòng tích vào ô bên dưới để trả lời!

Top