Sử dụng dữ liệu hành chính trong công tác thống kê là xu thế tất yếu

02/06/2023 - 05:10 PM
Dữ liêu hành chính đã được Việt Nam luật hóa trong Luật Thống kê năm 2015, theo đó Dữ liệu hành chính là dữ liệu của cơ quan nhà nước được ghi chép, lưu giữ, cập nhật trong các hồ sơ hành chính dạng giấy hoặc dạng điện tử (Khoản 6, Điều 3, Luật Thống kê năm 2015).

Sử dụng dữ liệu hành chính trong công tác thống kê đã có từ thế kỷ XVIII

Dữ liệu hành chính (DLHC) và sử dụng DLHC trên thế giới thực chất đã có từ lâu. Theo một nghiên cứu được công bố của tác giả Svein Nordbotten, thuộc đại học Bergen – Na Uy, từ thế kỷ XVIII, khi Cơ quan thống kê chính thức đầu tiên được thành lập thì các hồ sơ nhân khẩu, dữ liệu thuế, kế toán công dữ liệu, dữ liệu sức khỏe, dữ liệu xã hội, dữ liệu y tế và dữ liệu trường học được tổng hợp để phân tách các ‘loại’ thống kê để mô tả sự thịnh vượng của đất nước. Vào khoảng giữa thế kỷ XIX, hợp tác quốc tế về thống kê chính thức được khởi xướng. Trong giai đoạn này số liệu thống kê được tính toán chủ yếu dựa trên DLHC (dữ liệu không phải vì mục đích thống kê) sau đó được bổ sung bằng dữ liệu chỉ thu thập cho các mục đích thống kê như: điều tra dân số và điều tra mẫu thống kê.

Các nước sử dụng thành công dữ liệu hành chính trong công tác thống kê chính thức

Các nước trong khối Scandinavia như: Na-Uy, Thụy Điển, Đan Mạch và Phần Lan đã sử dụng dữ liệu hành chính (DLHC) trong công tác thống kê từ rất sớm và khá thành công. Cụ thể: Ở Na-Uy tiềm năng của việc sử dụng DLHC và các bản ghi đăng ký hành chính đã được nhận ra từ những 1969. Từ đó, Thống kê Na-Uy đã sử dụng kết hợp giữa DLHC và dữ liệu điều tra trong công tác thống kê. Tại Đan Mạch, DLHC được xây dựng căn cứ vào Sổ Đăng ký Cá nhân Trung tâm (CPR), Đăng ký kinh doanh (CVR) và Sổ Đăng ký Nhà ở và Hộ Gia đình (BBR). Thống kê Phần Lan (văn phòng thống kê trung ương) thu thập gần như tất cả (chiếm khoảng 93%) dữ liệu từ các nguồn hành chính. Từ năm 1990, Phần Lan cũng đã hoàn toàn dựa vào DLHC để thực hiện điều tra dân số và nhà ở. Ngay trong các văn bản quy phạm pháp luật của mình Phần Lan cũng dựa trên nguyên tắc cốt lõi là khai thác và tận dụng tối đa nguồn DLHC để đưa ra các quyết sách.

Xu hướng sử dụng dữ liệu hành chính trong công tác thống kê
Dữ liêu hành chính đã được Việt Nam luật hóa trong Luật Thống kê năm 2015. Ảnh minh họa

Bên cạnh các nước trong khối Scandinavia, hiện nay trên thế giới việc nghiên cứu ứng dụng khai thác DLHC trong sản xuất số liệu thống kê đã và đang dần được chú trọng, có nhiều nghiên cứu và đã được áp dụng thành công ở một số nước Châu Á (Singapore, Nhật Bản). Trong quá trình sản xuất số liệu thống kê nhân khẩu học của Singapore, thông tin nhân khẩu học cơ bản về dân số Singapore và cơ sở dữ liệu thống kê về nhà ở dân cư, cả hai đều lấy dữ liệu từ nhiều nguồn hành chính. Điều tra dân số Singapore năm 2020 trước thách thức của đại dịch COVID-19, Cục Thống kê Singapore đã thực hiện chiến lược tích hợp thông tin có sẵn từ các cơ quan chính phủ khác và sử dụng DLHC để kiểm tra tính nhất quán và xác nhận kết quả điều tra dân số, giúp giảm gánh nặng của người trả lời. Ở Nhật Bản, hồ sơ hành chính đã được sử dụng như một dữ liệu có giá trị nguồn từ lâu.

Sử dụng dữ liệu hành chính trong công tác thống kê là xu thế tất yếu

Trong một tài liệu gần đây của Ủy ban kinh tế - xã hội châu Á-Thái Bình Dương (ESCAP) nghiên cứu về việc sử dụng DLHC trong điều tra dân số và nhà ở đã nhận định, đây là xu hướng mới nổi ở Châu Á và Thái Bình Dương. Có 47 trong số 58 quốc gia thành viên và liên kết của ESCAP đã sử dụng DLHC trong Tổng điều tra dân số chu kỳ 2020.

Hàn Quốc đến năm 2000, Tổng điều tra dân số vẫn tiến hành theo phương pháp truyền thống với việc thu thập thông tin hoàn toàn thông qua bảng hỏi. Đến năm 2015, Hàn Quốc đã tiến hành Tổng điều tra dân số với phương pháp kết hợp với số hộ khẩu (Resident Registration Register - RRR). Ngoài ra, thống kê Hàn Quốc còn sử dụng sổ đăng ký thống kê dựa trên thông tin từ 25 sổ đăng ký hành chính và tạo ra một bộ dữ liệu vi mô cho tổng điều tra dân số dựa trên sổ đăng ký.

Tương tự như Hàn Quốc, năm 2010, tổng điều tra dân số của Indonesia vẫn theo cách truyền thống. Đến năm 2020, Indonesia đã sử dụng dữ liệu dân số từ hệ thống đăng ký dân số của mình để hiện đại hóa phương pháp điều tra. Để tạo điều kiện cho cơ quan thống kê Indonesia có quyền truy cập vào nguồn DLHC phục vụ cho công tác thống kê, một số công cụ lập pháp đã được ban hành hoặc sửa đổi tập trung vào cung cấp cho Cơ quan Thống kê Indonesia những thông tin cần thiết truy cập dữ liệu từ Hệ thống đăng ký dân số.
Australia, Indonesia, Hàn Quốc và Thổ Nhĩ Kỳ là những ví dụ về các quốc gia sử dụng kết hợp DLHC trong tổng điều tra dân số.

Ở Việt Nam, hiện Tổng cục Thống kê sử dụng 3 nguồn dữ liệu chính: Dữ liệu từ điều tra thống kê, DLHC và chế độ báo cáo thống kê. Trong 3 nguồn này thì việc biên soạn các chỉ tiêu thống kê chủ yếu được lấy từ dữ liệu điều tra thống kê và dữ liệu từ các báo cáo thống kê. Riêng nguồn DLHC hiện nay chủ yếu khai thác gián tiếp thông qua báo cáo thống kê, cũng như sử dụng kết hợp với nguồn dữ liệu điều tra.

Hiện, Tổng cục Thống kê đã hợp tác với Tổng cục Hải quan trong việc xây dựng quy trình, biểu mẫu và thử nghiệm sử dụng dữ liệu hải quan để sản xuất số liệu thống kê xuất nhập khẩu.

Các cơ sở dữ liệu quốc gia (CSDLQG) về đăng ký doanh nghiệp đã kết nối liên thông với CSDL của Tổng cục Thuế nhằm trao đổi, chia sẻ thông tin về đăng ký doanh nghiệp, tình trạng hoạt động, số liệu sản xuất kinh doanh của doanh nghiệp… theo thời gian thực (realtime).

Ngoài ra, hoạt động đăng ký hộ tịch hiện đang được thực hiện tại Việt Nan, điều này sẽ tạo điều kiện thuận lợi giúp chuyển dịch việc sản xuất một số chỉ tiêu thống kê nhất định từ điều tra thống kê sang sử dụng hồ sơ hành chính, đặc biệt việc sử dụng duy nhất một mã định danh cá nhân sẽ giúp Tổng cục Thống kê xây dựng kho dữ liệu chuỗi thời gian theo chiều dọc (longitudinal time series) trong lĩnh vực thống kê xã hội.

Có thể thấy, việc khai thác và sử dụng DLHC trong sản xuất thông tin thống kê đang trở thành xu hướng mới trong công tác thống kê của nhiều nước trên thế giới nói chung và Việt Nam nói riêng.

Dù đạt được một số kết quả đáng ghi nhận, song việc sử dụng DLHC trong công tác thống kê hiện nay vẫn gặp một số khó khăn, thách thức. Đó là, trước hết, nguồn DLHC ở Việt Nam hiện đang nằm trải rộng ở tất cả các cơ quan, bộ, ngành gây khó khăn trong việc khai thác nếu không có chế tài cũng như mô hình/quy trình khai thác thích hợp.

Hai là, các bộ ngành chưa triển khai đồng bộ tất cả các cơ sở dữ liệu (CSDL), cũng như chưa kết nối các thông tin. Chẳng hạn Bộ Giáo dục và Đào tạo đã thực hiện được hầu hết các CSDL về cán bộ;  CSDL ngành về giáo dục mầm non, phổ thông, về giáo dục đại học....; Bộ Nội vụ đã hoàn thành việc xây dựng CSDL về công chức, viên chức, đang tập huấn cho những người làm công nghệ thông tin của các bộ, ngành. Bộ Công an quản lý dữ liệu dân cư... Tuy nhiên, việc chia sẻ với các bộ, ngành, kết nối chia sẻ trên NGSP (Hệ thống kết nối, liên thông các hệ thống thông tin ở Trung ương và địa phương) hoặc cung cấp cho người dân/doanh nghiệp thì chưa được thực hiện hoặc thực hiện lẻ tẻ...

Ba là, các CSDL quốc gia và các CSDL chuyên ngành hiện nay đều chưa có một quy định, hay cơ chế chia sẻ cụ thể, chi tiết và đầy đủ đối với cơ quan thống kê.

Có thể thấy, sử dụng DLHC cho mục đích thống kê đang trở thành xu thế chung trên toàn thế giới cũng như ở Việt Nam. Nền thống kê nước ta hiện nay sẽ bị hạn chế và không bắt kịp xu thế nếu chỉ dựa trên hệ thống sản xuất số liệu thống kê hiện có. Ngoài việc cần phải thích ứng liên tục với các yêu cầu mới, để giảm gánh nặng thống kê nhà nước, hiện ngành Thống kê đang nghiên cứu thay thế các quy trình sản xuất số liệu thống kê tốn kém và cồng kềnh bằng các quy trình sản xuất tích hợp giúp tiết kiệm chi phí, thời gian; kết hợp với việc sử dụng mới và mở rộng các nguồn dữ liệu hiện có, dựa nhiều hơn vào các DLHC sẵn có từ các cơ quan Chính phủ. Để làm được điều này, chỉ riêng ngành Thống kê là không đủ, cần sự chung tay từ tất cả các cấp chính quyền trung ương, địa phương, các bộ ngành./.


Ưu điểm khi sử dụng DLHC

Giảm chi phí: Nguồn DLHC là nguồn dữ liệu lớn, đa dạng và sẵn có vì vậy nếu các cơ quan thống kê khi khai thác sử dụng nguồn dữ liệu này để sản xuất số liệu thống kê nhà nước thì sẽ tiết kiệm được chi phí với việc thu thập dữ liệu thống kê thông qua các cuộc điều tra bởi sẽ không mất thêm các khoản chi phí khác ngoại trừ các khoản phụ phí hoặc chi phí liên quan đến làm sạch dữ liệu.

Giảm tải gánh nặng của thu thập thông tin thống kê: Khi khai thác nguồn DLHC sẵn có sẽ giúp giảm tải gánh nặng đáng so với quy trình khai thác sản xuất số liệu thống kê truyền thống như: giảm gánh nặng về nguồn nhân lực và thủ tục hành chính; giảm gánh nặng đối với người được phỏng vấn trong các cuộc điều tra.

Tính kịp thời và mức độ thường xuyên, liên tục của số liệu: Thông tin thu thập từ các cuộc điều tra chuyên môn luôn có độ trễ nhất định do để triển khai một cuộc điều tra thống kê cần phải được tiến hành đúng theo trình tự, đảm bảo đúng và đầy đủ tất cả các khâu. Trái lại, với nguồn DLHC thì các thông tin đã sẵn có không cần phải tiến hành các khâu: chuẩn bị, tập huấn và triển khai thu thập thông tin.

DLHC là dữ liệu được thu thập có tính liên tục, trực tiếp. Các nguồn DLHC luôn được cập nhật thường xuyên hàng năm, hàng quý, hàng tháng và thậm chí hàng ngày, hàng giờ tùy thuộc vào nhu cầu về nguồn dữ liệu theo quy định của pháp luật.

Có độ bao phủ rộng, thông tin đa dạng và phân tổ được theo nhiều tiêu thức: DLHC được thu thập dựa trên quy định của pháp luật phục vụ công tác quản lý của các cơ quan hành chính của tất cả từ các cơ quan, tổ chức đến các cá nhân chính vì thế, DLHC sẽ có độ bao phủ rộng. Ở nhiều quốc gia trên thế giới hay ở một số lĩnh vực cụ thể thì DLHC có tính bao phủ gần như 100% dân số giúp có thể phân tổ cũng như đảm bảo độ tin cậy ở cấp nhỏ.

Giảm sai số trong điều tra thống kê: Trong nghiên cứu thống kê có hai loại sai số là “sai số phi chọn mẫu” và “sai số chọn mẫu”. Cả hai loại sai số này sẽ được khắc phục bằng việc thay thế bằng việc khai thác nguồn DLHC sẵn có.

Nguồn: Cục Thu thập dữ liệu và ứng dụng CNTT thống kê - TCTK

Các bài viết khác
Liên kết website
Liên kết website
Thăm dò ý kiến

Đánh giá khách quan của bạn về thông tin chúng tôi cung cấp? Vui lòng tích vào ô bên dưới để trả lời!

Top