Đảm bảo chất lượng dữ liệu hành chính sử dụng trong sản xuất thông tin thống kê - Kinh nghiệm từ thống kê Mỹ

27/11/2023 - 04:04 PM
Tầm quan trọng của dữ liệu hành chính trong sản xuất thông tin thống kê

Dữ liệu hành chính từ lâu đã là nguồn thông tin quan trọng được sử dụng trong sản xuất số liệu thống kê. Trong thời đại Cách mạng Công nghiệp 4.0, khi công nghệ thông tin là đòn bẩy hỗ trợ sự phát triển của mọi ngành nghề, hoạt động kinh tế, việc chia sẻ thông tin giữa các ngành, các cơ quan càng trở nên thường xuyên và là xu thế không thể đảo ngược. Tại kỳ họp thứ 10, Quốc hội khóa XIII đã thông qua Luật thống kê 2015 trong đó có quy định thêm một nguồn dữ liệu phục vụ cho sản xuất thông tin thống kê, đó là dữ liệu từ hồ sơ hành chính (Quy định tại Chương II, Mục 2, Luật thống kê 2015 “Sử dụng dữ liệu hành chính cho hoạt động thống kê nhà nước”).

Chiến lược phát triển Thống kê Việt Nam giai đoạn 2021-2030, tầm nhìn đến năm 2045 cũng đề ra một trong những mục tiêu quan trọng của thống kê Việt Nam thời gian tới là đổi mới mạnh mẽ, đồng bộ phương pháp và cách thức thu thập thông tin thống kê, trong đó nhấn mạnh tập trung khai thác, sử dụng dữ liệu hành chính để biên soạn các chỉ tiêu thống kê thuộc hệ thống chỉ tiêu thống kê quốc gia. Cụ thể: Phấn đấu vào năm 2025 đạt 50%, vào năm 2030 đạt 70% số chỉ tiêu thống kê thuộc các hệ thống chỉ tiêu thống kê được biên soạn từ nguồn dữ liệu hành chính.

Việc tận dụng nguồn dữ liệu hành chính đem lại rất nhiều lợi ích cho cơ quan thống kê cũng như toàn xã hội. Theo đó, Hệ thống thống kê nhà nước có thể khai thác nguồn tài nguyên thông tin sẵn có, đầy đủ về phạm vi, thường xuyên được cập nhật, giúp tiết kiệm thời gian và chi phí. Sử dụng nguồn dữ liệu hành chính để sản xuất thông tin thống kê còn giúp giảm bớt phiền hà, gánh nặng cho người cung cấp thông tin và người thu thập thông tin. 

Tuy nhiên, việc khai thác sử dụng hồ sơ hành chính cho mục đích thống kê sẽ gặp một số bất cập như: Sự khác biệt về khái niệm, bảng phân loại, phạm vi, đối tượng. Dữ liệu hành chính được các cơ quan hành chính nhà nước thu thập phục vụ cho công tác quản lý chuyên ngành của cơ quan đó. Các mục đích quản lý chuyên ngành này ở nhiều khía cạnh khác với mục đích của công tác thống kê. Chính vì vậy, đôi khi đối tượng quản lý, khái niệm, cách phân loại sử dụng trong dữ liệu hành chính không khớp với các yêu cầu về thông tin từ cơ quan thống kê. Ngoài ra, chất lượng số liệu thống kê sản xuất từ dữ liệu hành chính cũng phụ thuộc vào chất lượng của dữ liệu hành chính. Để sử dụng dữ liệu hành chính đáp ứng đúng với yêu cầu thông tin mà cơ quan thống kê cần cho số liệu tính toán của mình, đòi hỏi cơ quan thống kê phải có các công cụ chuyển đổi thích hợp, cần thiết.

Công cụ đánh giá chất lượng dữ liệu hành chính của thống kê Mỹ

Ở các nước phát triển như: Anh, Mỹ, khối các nước Bắc Âu… việc khai thác, sử dụng dữ liệu hành chính phục vụ cho mục đích thống kê đã được thực hiện từ lâu và rất thành công. Thậm chí ở một nước Bắc Âu như Đan Mạch cơ quan thống kê đã không còn tiến hành Tổng điều tra dân số từ năm 1973, thay vào đó họ tổng hợp thông tin thống kê liên quan từ dữ liệu của các cơ quan hành chính.

Tại Mỹ, một công cụ đánh giá chất lượng dữ liệu hành chính được Nhóm làm việc về chất lượng dữ liệu thuộc Ủy ban liên cơ về chính sách thống kê xây dựng vào năm 2011. Công cụ này là phương tiện hỗ trợ sự trao đổi thông tin giữa một bên là người sử dụng dữ liệu hành chính - người có thể lần đầu tiên làm quen với cấu trúc, nội dung, ý nghĩa của các bản ghi hành chính hay là người đã nhiều lần sử dụng bản ghi hành chính nhưng chưa nắm rõ những thay đổi hệ thống hiện tại, với một bên là nhà cung cấp các bản ghi hành chính.

Công cụ này giúp nâng cao chất lượng dữ liệu theo hai cách. Đầu tiên, giúp người dùng hiểu rõ hơn thuộc tính của dữ liệu, công cụ cho phép khai thác dữ liệu cho các mục đích phù hợp và có ý nghĩa hơn so với mục đích sử dụng ban đầu. Thứ hai, Công cụ giúp nâng cao chất lượng dữ liệu theo thời gian, cho cả mục đích quản trị và mục đích thống kê. Công cụ này đánh giá cả 6 chiều chất lượng thống kê, gồm: Tính liên quan, khả năng tiếp cận dữ liệu, tính chặt chẽ, khả năng diễn giải, tính chính xác và môi trường thể chế.

Công cụ được thể hiện dưới dạng quy định các khái niệm cho 6 chiều chất lượng và một bộ câu hỏi giúp người dùng dữ liệu đánh giá chất lượng nguồn dữ liệu theo 6 chiều đó. Công cụ gồm 43 câu hỏi được phân thành 3 giai đoạn chia sẻ dữ liệu: Khám phá, Khai thác ban đầu, Khai thác lại. Ở mỗi giai đoạn, các câu hỏi được thiết kế theo chiều chất lượng liên quan đến giai đoạn đó.

12 câu hỏi của giai đoạn Khám phá gồm các thông tin liên quan đến tính khả thi và khả năng thực thi một dự án chia sẻ dữ liệu, hay nói cách khác khả năng thông qua một biên bản ghi nhớ về chia sẻ dữ liệu.

Giai đoạn Khai thác ban đầu bắt đầu bằng việc phát triển một biên bản ghi nhớ giữa 2 cơ quan (MOU), hoàn thiện và ký kết biên bản ghi nhớ, kết thúc bằng việc nhận dữ liệu lần đầu tiên. Trong giai đoạn này, nhiều thông tin chi tiết về chất lượng dữ liệu là mối quan tâm của nhân viên thống kê như các phương pháp ghi hồ sơ, biết được nguồn gốc sai số, tỉ lệ giá trị bị khuyết trong mỗi trường dữ liệu. Giai đoạn này khả năng truy cập và khả năng diễn giải là 2 chiều chất lượng rất quan trọng.

Các câu hỏi của giai đoạn Khai thác lại bao hàm việc nhận định kỳ dữ liệu. Các câu hỏi này sẽ được trả lời khi lên kế hoạch nhận dữ liệu lần thứ hai. Giai đoạn khai thác lại gồm 11 câu hỏi. 9 câu hỏi được lặp lại của giai đoạn Khám phá và Khai thác bạn đầu, 2 câu hỏi hoàn toàn mới.

 
Đảm bảo chất lượng dữ liệu hành chính sử dụng trong sản xuất thông tin thống kê: Kinh nghiệm từ thống kê Mỹ
Đảm bảo chất lượng dữ liệu hành chính sử dụng trong sản xuất thông tin thống kê: Kinh nghiệm từ thống kê Mỹ 1
Đảm bảo chất lượng dữ liệu hành chính sử dụng trong sản xuất thông tin thống kê: Kinh nghiệm từ thống kê Mỹ 2
Đảm bảo chất lượng dữ liệu hành chính sử dụng trong sản xuất thông tin thống kê: Kinh nghiệm từ thống kê Mỹ 3

Kết luận

Bộ công cụ đánh giá chất lượng dữ liệu hành chính của thống kê Mỹ là một gợi ý rất tốt cho cơ quan thống kê đang xây dựng và theo đuổi mục tiêu tăng cường số liệu thống kê được sản xuất từ dữ liệu hành chính và nguồn thông tin mới. Bộ công cụ không chỉ giúp cơ quan thống kê hiểu rõ được chất lượng nguồn thông tin hành chính đang và sẽ sử dụng để sản xuất thông tin thống kê, nhìn thấy sự khác biệt về phạm vi, khái niệm, cách phân loại để có sự điều chỉnh nguồn thông tin hợp lí phù hợp cho mục đích thống kê, giúp sản xuất ra số liệu thống kê đảm bảo chất lượng. Bộ công cụ cũng giúp người sử dụng nguồn dữ liệu hành chính dù không cho mục đích thống kê có thể hiểu rõ cấu trúc cũng như các thuộc tính khác của dữ liệu. Theo Chiến lược phát triển ngành Thống kê tầm nhìn đến 2045, mục tiêu quan trọng thời gian tới của Thống kê Việt Nam là tăng cường sản xuất số liệu thống kê từ dữ liệu hành chính. Do vậy cần cân nhắc xây dựng một số công cụ để có thể giám sát chất lượng dữ liệu hành chính được sử dụng để sản xuất số liệu thống kê. Bộ công cụ đánh giá chất lượng dữ liệu hành chính của Mỹ sẽ là gợi ý để cơ quan thống kê xây dựng một công cụ đánh giá hiệu quả và phù hợp với điều kiện hoàn cảnh Việt Nam./.

 
Lê Thủy Tiên
   Vụ Phương pháp chế độ và Quản lý chất lượng thống kê - TCTK

Các bài viết khác
Liên kết website
Liên kết website
Thăm dò ý kiến

Đánh giá khách quan của bạn về thông tin chúng tôi cung cấp? Vui lòng tích vào ô bên dưới để trả lời!

Top