Xu hướng trao đổi thông tin của thống kê hiện đại

07/10/2019 - 09:22 AM
SDMX - Statistical Data and Metadata Exchange - Chuẩn trao đổi dữ liệu và dữ liệu đặc tả thống kê, là một bộ tiêu chuẩn kỹ thuật và hướng dẫn của các đối tượng nhằm trao đổi dữ liệu và dữ liệu đặc tả thống kê theo một định dạng thống nhất, bằng cách sử dụng công nghệ thông tin hiện đại với trọng tâm là dữ liệu tổng hợp. Đây là xu hướng trao đổi thông tin của thống kê trên thế giới hiện nay.

Sơ lược v SDMX

Ra đời năm 2001, SDMX là sáng kiến chung của 7 tổ chức quốc tế bao gồm: Ngân hàng thanh toán quốc tế (BIS), Ngân hàng trung ương châu Âu (ECB), Thống kê châu Âu (Eurostat), Quỹ tin tệ quốc tế (IMF), Tổ chức hợp tác và phát triển kinh tế (OECD), Thống kê Liên hợp quốc (UNSD) và Ngân hàng Thế giới (WB). Sáng kiến này xuất phát từ thực tế việc thu thập, xử lý và trao đổi số liệu thống kê thường tiêu tốn nhiu thời gian và nhân lực. Cùng với đó, nhu cầu áp dụng các công nghệ mới trong thống kê ngày càng tăng; mỗi tổ chức, cơ quan thống kê lại có một phương pháp trao đổi và xử lý số liệu riêng. Do đó, sáng kiến v SDMX ra đời đã giải quyết những vấn đ trên bằng việc phát triển một quy trình hiệu quả hơn để trao đổi và chia sẻ số liệu (data), dữ liệu đặc tả (metadata) bằng cách sử dụng công nghệ hiện đại. Đây là tiêu chuẩn mã hóa điện tử cho số liệu và dữ liệu đặc tả mà các tổ chức áp dụng chung, áp dụng công nghệ dựa trên nn web. Tiêu chuẩn này sẽ giống như một ngôn ngữ chung để các tổ chức dễ dàng trao đổi dữ liệu và dữ liệu đặc tả chỉ thông qua máy tính có kết nối internet mà không mất nhiu công sức của con người. Đối với người dùng tin, sau khi đăng ký trên các trang web của các tổ chức thống kê, sẽ dễ dàng thu thập được thông tin và sẽ được tự động cập nhật thông tin mới nhất khi có thay đổi.

Từ trước đến nay, các tổ chức hầu như không sử dụng bất k tiêu chuẩn hoặc cấu trúc dữ liệu thống kê thống nhất để trao đổi, mà chủ yếu chỉ sử dụng Excel hoặc CSV file. Do đó, SDMX là bước tiến quan trọng trong việc chia sẻ, trao đổi dữ liệu và dữ liệu đặc tả thống kê, với việc cung cấp một mô hình hiệu quả để giải quyết vấn đ thống kê chung và cung cấp một giao diện chuẩn hóa ra bên ngoài thông qua dịch vụ web.

Mục đích của SDMX là giúp quy trình sản xuất thống kê thực hiện các bước một cách chính xác, phù hợp với các chuẩn chung; giúp người dùng tìm kiếm thông tin cần thiết như Mô tả quần thể điu tra; Tìm kiếm dữ liệu sẵn sàng; Tìm kiếm bằng từ khóa; Tìm kiếm bằng các trình đơn (menu); Tìm kiếm một cách logic; Giao diện giữa các phần khác nhau được kết nối trong hệ thống thông tin thống kê. SDMX - công nghệ được sử dụng để tự động và chuẩn hóa dữ liệu và dữ liệu đặc tả nên dữ liệu sẽ được cập nhật dễ dàng và đảm bảo tính kịp thời. Với SDMX, không những các cơ sở dữ liệu (CSDL) quốc gia được lưu trữ, trao đổi dễ dàng trên phạm vi toàn cầu, mà các CSDL khác của các cơ quan thống kê, các bộ, ban ngành, các cấp quản lý hành chính cũng có thể phổ biến và trao đổi rộng rãi trong một quốc gia,...

Thành phần của SDMX bao gồm: Mô hình thông tin SDMX (Khái niệm); Hướng dẫn nội dung theo định hướng (khái niệm và danh sách mã được chia sẻ); Cơ sở hạ tầng công nghệ thông tin để trao đổi và chia sẻ (nn tảng công nghệ thông tin). Các tiêu chuẩn của SDMX được thiết kế để hỗ trợ các yêu cầu của tất cả các quá trình tự động hóa và công nghệ.

Công cụ hỗ trợ ứng dụng SDMX là SDMX Reference Infrastructure (SDMX-RI). Đây là cơ sở hạ tầng dịch vụ tổng quát cho phép tái sử dụng một phần hoặc toàn bộ các công cụ/module để trao đổi dữ liệu. Có thể sử dụng trực tiếp SDMX-RI hoặc có bổ sung thêm các module mới, sửa đổi các module, hoặc có thể tích hợp thêm một số chức năng vào môi trường phổ biến số liệu hiện tại. Trong đó, sử dụng công cụ Mapping Assistant (ánh xạ dữ liệu) để báo cáo và phổ biến thông tin trong cơ sở dữ liệu hiện có theo chuẩn của SDMX. Ứng dụng của SDMX ngày càng trở nên rộng rãi và phổ biến trên toàn thế giới. SDMX là cách thức trao đổi dữ liệu tốt nhất hiện có, cạnh tranh và hơn nữa có các tiêu chuẩn bổ sung là Cơ sở dữ liệu trao đổi. SDMX giúp hài hòa hóa các phân loại; hài hòa hóa các cấu trúc (định nghĩa cấu trúc dữ liệu); tổ chức của dữ liệu đặc tả; trực quan; phổ biến thông tin và tạo thành một hệ thống dữ liệu như một bộ sưu tập.

Trao đổi dữ liệu thống kê và dữ liệu đặc tả sử dụng nhiu quy trình tự động khác nhau, nhưng có một số điểm chung là sử dụng công nghệ thông tin là gần như phổ biến trong các khâu của hệ thống. Vì vậy, SDMX nhằm mục đích cung cấp các tiêu chuẩn có ích nhất cho các quy trình tự động và công nghệ, có thể được mô tả như sau:
  1. Trao đổi hàng loạt dữ liệu và dữ liệu đặc tả: Việc truyn tải toàn bộ hoặc một phần cơ sở dữ liệu giữa các đối tác, bao gồm cập nhật thường xuyên hay đột xuất với tần suất gia tăng.
  2. Cung cấp các dữ liệu một cách dễ dàng và có thể chế biến dữ liệu đặc tả trên Internet. Công nghệ cao đáp ứng dịch vụ XML và web như cơ chế chính để tự động hoá dữ liệu và cung cấp dữ liệu đặc tả.
  3. Quy trình chung: Ứng dụng và quy trình chung đối với một số tập hợp các dữ liệu và dữ liệu đặc tả, các loại dịch vụ được thiết kế tự động để xử lý các loại dữ liệu và dữ liệu đặc tả thống kê. Điu này đặc biệt đúng trong trường hợp các trang web và cổng thông tin điện tử cung cấp nguồn cấp dữ liệu được thực hiện có sẵn trên Internet.
  4. Trình bày và chuyển đổi dữ liệu: Để làm cho dữ liệu và dữ liệu đặc tả hữu ích cho người tiêu dùng, nhà cung cấp cần được hỗ trợ các quy trình tự động chuyển đổi chúng thành các định dạng ứng dụng cụ thể theo định dạng tiêu chuẩn và định dạng phần mô tả rõ ràng nếu việc trao đổi thông tin giữa các đối tác được hỗ trợ.
Từ khi ra đời cho đến nay, SDMX đã có khá nhiu tiến bộ trong việc phát triển chuẩn SDMX. Nhiu tổ chức thống kê đã sử dụng và áp dụng SDMX trong các lĩnh vực thống kê như: Tài khoản quốc gia, cán cân thanh toán, đầu tư nước ngoài, MDG, hệ thống phổ biến số liệu GDDS, SDG... Và SDMX đang tiếp tục được mở rộng cho các lĩnh vực khác. SDMX phiên bản 1.4.0 là phiên bản cải tiến mới nhất được phát hành tháng 6 năm 2019.

Ứng dụng SDMX trong phổ biến thông tin của Thống kê Việt Nam

Theo đánh giá, việc áp dụng SDMX vẫn còn mới đối với thống kê khu vực nói chung và ở Việt Nam nói riêng. Theo đó, tại Việt Nam để bắt kịp với sự phát triển v công nghệ của thống kê thế giới, thống kê Việt Nam cũng đã ứng dụng SDMX để phổ biến các chỉ tiêu phát triển quốc gia được phổ biến trên trang Cơ sở dữ liệu quốc gia (Country Data) của Liên hợp quốc và phổ biến Niên giám Thống kê trên website và phổ biến các chỉ tiêu phát triển bn vững (SDG) trong thời gian tới:
  1. Phổ biến các chỉ tiêu phát triển quốc gia
Bộ chỉ tiêu phát triển quốc gia bao gồm các chỉ tiêu thuộc các lĩnh vực kinh tế, xã hội, môi trường phản ánh động thái và sự phát triển của quốc gia. Mỗi chỉ tiêu được gắn với dữ liệu đặc tả gồm thông tin v khái niệm, định nghĩa, phương pháp tính, nguồn số liệu, phân tổ chủ yếu và các hạn chế khuyến nghị nếu có. Các chỉ tiêu này đu định dạng Định nghĩa cấu trúc dữ liệu và theo chuẩn của SDMX. Việt Nam đã chọn Danh mục gồm 60 chỉ tiêu phát triển để trao đổi và chia sẻ với mục đích nâng cao sự hiểu biết v các chính sách và xu hướng phát triển quốc gia, từ đó cải tiến việc phổ biến số liệu cấp quốc gia và cấp toàn cầu theo phương thức gắn kết thông qua việc xác lập một cơ sở dữ liệu quốc gia, cổng phổ biến thông tin một cửa toàn cầu.
  1. Phổ biến Niên giám Thống kê trên website
Niên giám thống kê là sản phẩm thống kê quan trọng của ngành Thống kê, bao gồm những số liệu thống kê cơ bản phản ánh khái quát động thái và thực trạng kinh tế - xã hội của cả nước, của các vùng và các địa phương. Việc lựa chọn Niên giám thống kê để phổ biến trên web và nhằm mục đích trao đổi thông qua lựa chọn ứng dụng SDMX là cần thiết theo xu hướng chung của thế giới và của phương thức trao đổi dữ liệu và dữ liệu đặc tả thống kê hiện đại.

Việc ứng dụng SDMX nhằm chia sẻ và phổ biến thông tin thống kê trên trang web là thích hợp và cần thiết khi nhìn từ 3 góc độ: (i) Xuất bản: Nhà sản xuất thông tin cung cấp luồng dữ liệu SDMX có sẵn như một sản phẩm thông tin điện tử trung gian và tăng giá trị cho người sử dụng cuối cùng; (ii) Thu thập: Tổ chức SDMX lưu trữ dữ liệu thống kê một cách tiêu chuẩn hóa, vì vậy nó có thể được sử dụng để duy trì và tái sử dụng lại các hệ thống/cơ sở dữ liệu đó; (iii) Phổ biến: Mục tiêu chính SDMX là việc trao đổi số liệu thống kê và dữ liệu đặc tả thống kê, cung cấp một cách tương thích thông tin giữa các nn tảng và độc lập từ các thiết bị mang tin. Một số tổ chức Thống kê đang phát triển “công cụ phần mm” và sử dụng SDMX như dữ liệu đầu vào để hiển thị ký tự, bản đồ…

Ứng dụng SDMX để trao đổi và phổ biến Niên giám thống kê trên trang web với mục đích: Tuân thủ các nguyên tắc chính thức cho việc định dạng dữ liệu và dữ liệu đặc tả, từ đó các dữ liệu có thể được trao đổi, đọc và xử lý mà không cần đến sự can thiệp của con người; Thiết lập các tiêu chuẩn kỹ thuật và các hướng dẫn theo định hướng nội dung, tạo thuận lợi cho việc trao đổi dữ liệu và dữ liệu đặc tả thông qua việc sử dụng các công nghệ thông tin hiện đại, giảm gánh nặng báo cáo, tập trung vào dữ liệu tổng hợp và dữ liệu chuỗi thời gian; Nhu cầu chuẩn hoá thông tin thống kê.
  1. Phổ biến chỉ tiêu phát triển bn vững (SDG)
Nhu cầu số liệu phục vụ giám sát, đánh giá thực hiện các mục tiêu phát triển bn vững cần theo nguyên tắc của Chương trình nghị sự 2030 của Liên hợp quốc là “Không bỏ ai lại phía sau”. Do đó, việc thực hiện một hệ thống so sánh và phổ biến thông tin các chỉ tiêu phát triển bn vững quốc gia đang được ưu tiên lựa chọn. Xây dựng hoàn chỉnh hệ thống phổ biến các chỉ tiêu phát triển bn vững quốc gia thông qua ứng dụng SDMX là cần thiết để việc truy cập được cải thiện và dễ dàng hơn, phục vụ tốt hơn nhu cầu giám sát và đánh giá các mục tiêu phát triển bn vững, đồng thời giảm sự thiếu nhất quán giữa cơ sở dữ liệu quốc gia và quốc tế.

Ứng dụng SDMX sẽ cải thiện sự liên kết giữa các chỉ tiêu phát triển bn vững giữa Tổng cục Thống kê với các bộ, ngành và với các tổ chức quốc tế; thúc đẩy việc sử dụng các định nghĩa theo tiêu chuẩn, các phương pháp luận, các mô hình trao đổi dữ liệu và chuyển giao dữ liệu, đồng thời giúp cải thiện tính có sẵn của số liệu thống kê chính thống của Việt Nam tại cấp quốc tế nhằm xây dựng cơ sở dữ liệu đối với các chỉ tiêu phát triển bn vững ở cấp quốc gia và kết nối cơ sở dữ liệu này với cơ sở dữ liệu của Liên hợp quốc.

Tăng cường kiến thức trong hệ thống thống kê chính thức của Việt Nam thông qua đào tạo nhận thức thống kê và công nghệ hiện đại, liên quan đến các chủ đ như: Các chỉ tiêu phát triển; quy trình lưu giữ số liệu; trao đổi, phổ biến số liệu; trình bày và công bố số liệu.

Những tiêu chuẩn của SDMX cũng có thể được sử dụng trong một hệ thống quốc gia cho việc truyn tải hay chia sẻ dữ liệu và dữ liệu đặc tả thống kê đáp ứng tốt những nhu cầu của người sử dụng v dữ liệu và dữ liệu đặc tả thống kê có cấu trúc tốt ở dạng thức có thể tái sử dụng; Đây được xem như một sự lựa chọn cho các quốc gia cũng như các tổ chức quốc tế; quản lý tổng thể cơ sở dữ liệu và theo dõi cập nhật sự thay đổi cơ sở dữ liệu qua thời gian.

Tuy nhiên, việc áp dụng SDMX trong trao đổi thông tin thống kê ở nước ta còn một số khó khăn, bởi đây là một khái niệm mới, chưa được phổ biến rộng rãi. Bên cạnh đó, dữ liệu đặc tả của một số chỉ tiêu được xây dựng mới, không có sẵn, dẫn đến khó khăn trong việc xây dựng theo chuẩn dữ liệu đặc tả; Việc chuẩn hóa dữ liệu đặc tả của một số chỉ tiêu mang tính chất đặc thù của Việt Nam để thuận tiện cho việc so sánh các khác biệt với quốc tế trong quá trình sử dụng thông tin đòi hỏi nhiu thời gian thực hiện; các chỉ tiêu thống kê Việt Nam sẵn có nhưng không có trong danh mục để chia sẻ với quốc tế. Ngoài ra, các tiêu chuẩn v nhân lực, cơ sở hạ tầng công nghệ thông tin đáp ứng trong việc thực hiện ứng dụng SDMX ở nước ta cũng là vấn đ còn nhiu bất cập, hạn chế…/.
Trần Thị Thu Trang
Vụ Thống kê Tổng hợp - Tổng cục Thống kê

 
Các bài viết khác
Liên kết website
Liên kết website
Thăm dò ý kiến

Đánh giá khách quan của bạn về thông tin chúng tôi cung cấp? Vui lòng tích vào ô bên dưới để trả lời!

Top