Xây dựng cơ sở dữ liệu thống kê trong bối cảnh cách mạng công nghiệp lần thứ tư

12/10/2021 - 10:48 AM

Cuộc Cách mạng công nghiệp lần thứ 4 (CMCN 4.0) là sự kết hợp của công nghệ trong các lĩnh vực vật lý, công nghệ số và sinh học, tạo ra những khả năng sản xuất hoàn toàn mới và có tác động sâu sắc đến đời sống kinh tế, chính trị, xã hội của thế giới. CMCN 4.0 được hình thành trên nền tảng công nghệ số và sự tích hợp các công nghệ thông minh để tối ưu hóa quy trình, phương thức sản xuất. Dưới tác động của CMCN 4.0, việc xây dựng cơ sở dữ liệu thống kê đối mặt với những thách thức lớn phải vượt qua và chỉ khi vượt qua những thách thức này mới nắm bắt được cơ hội, chuyển cơ hội thành hiện thực.

Đc trưng cơ bn ca CMCN 4.0

Mt là, da trên nn tng ca s kết hp công ngh cm biến mi, phân tích d liu ln, đin toán đám mây và kết ni internet vn vt s thúc đy s phát trin ca máy móc t đng hóa và h thng sn xut thông minh.

Hai là, s dng công ngh in 3D đ sn xut sn phm mt cách hoàn chnh nh nht th hóa các dây chuyn sn xut không phi qua giai đon lp ráp các thiết b ph tr - công ngh này cũng cho phép con ngưi có th in ra sn phm mi bng nhng phương pháp phi truyn thng, b qua các khâu trung gian và gim chi phí sn xut nhiu nht có th.

Ba là, công ngh nano và vt liu mi to ra các cu trúc vt liu mi ng dng rng rãi trong hu hết các lĩnh vc.

Bn là, trí tu nhân to và điu khin hc cho phép con ngưi kim soát t xa, không gii hn v không gian, thi gian, tương tác nhanh hơn và chính xác hơn.

Thách thc trong xây dng cơ s d liu thng kê trong bi cnh CMCN 4.0

- Dưi tác đng ca CMCN 4.0, vic xây dng cơ s d liu thng kê phi đt và gn vi môi trưng d liu m, đc bit là d liu quc gia. Đây là thách thc rt ln trong quá trình xây dng các cơ s d liu thng kê.

D liu m là ngun tài nguyên thiết yếu mi ca thi k chuyn đi s, d liu cn phi đưc m, đc bit là d liu quc gia. D liu m là d liu mà bt k ai cũng có th truy cp, s dng và chia s. D iu m tr nên s dng đưc khi đưc làm sn sàng đnh dng ph biến, máy đc đưc. D liu m phi đưc cp phép m. Giy phép ca nó phi cho phép mi ngưi s dng d liu đó theo bt k cách gì h mun, bao gm biến đi, kết hp và chia s nó vi nhng ngưi khác, thm chí mt cách thương mi.

Đ các ngun d liu m đưc vn hành và cung cp thông tin mt cách hiu qu cho các cơ s d liu thng kê thì các ngun d liu m phi đáp ng các yêu cu sau:
  • D liu phi đy đ và cp nht
  • Mi b d liu nên có đnh danh s.
  • Có phiên bn d liu khác nhau nếu có cp nht, thay đi theo thi gian.
  • Không có thông tin nh hưng đến mi con ngưi c th (ví d không nên có d liu m v lch s bnh tt mt ngưi có tên, tui tht)
  • Có h tr ly d liu theo tng khi nh nếu b d liu quá ln
  • Luôn online và min phí, không yêu cu đăng ký, không b gn vi bn quyn, phát minh sáng chế.
  • Ngun d liu phi tin tưng và có t chc chu trách nhim vi mi b d liu, có chđin t, xut x, thi gian ca b d liu.
  • Có tài liu mô t v d liu đi kèm.
  • An toàn khi m ra: Ví d không cha mã đc, mã lnh thc hin trên máy ngưi ly hay dùng d liu, không quá ln đ gây nghn mng.
  • Có danh sách các ng dng liên quan đã s dng b s liu.
  • Cơ s d liu thng kê cn tuân theo đnh dng chun nht đnh (có cu trúc) đ trao đi gia các h thng máy nhưng cũng phi thun tin đ con ngưi d chia s và x lý. Tuy nhiên, d liu m có cu trúc d liu phc tp, đòi hi phân cp. Đây là mt trong các thách thc mà nhiu cơ s d liu Vit Nam gp phi khi ch xây dng mt giao din Web cho ngưi dùng tra cu mà không h tr vic ti d liu hay giao din lp trình ng dng đ ngưi quan tâm có th dùng b d liu theo cách ca mình.
  • V ngun s liu, hin ti các ch tiêu thng kê thuc các cơ s d liu thng kê đưc thu thp ch yếu qua: Điu tra thng kê; chế đ báo cáo thng kê và s dng d liu hành chính cho hot đng thng kê nhà nưc. Nhng s liu này chưa đưc sp xếp, t chc khoa hc, cp nht và khai thác thưng xuyên mà các thông tin đang nm ri rác trong các ngun thông tin ch yếu như: Niên giám Thng kê hàng năm ca Tng cc Thng kê, Niên giám Thng kê ca các B, ngành, n phm t các cuc điu tra thng kê. Ngoài ra, nhiu thông tin ch tiêu quan trng có th tính toán đưc t các ngun s liu hin ti nhưng chưa đưc tính toán và công b.
Hơn na trong bi cnh CMCN 4.0, cơ s d liu thng kê phi đưc tích hp thông tin t các ngun d liu mi như các ngun d liu m, d liu ln, d liu vin thám, v tinh…Đây là thách thc rt ln trong vic xây dng các cơ s d liu này.
  • Vn đ chun hóa d liu là thách thc đưc đt ra. Đó là vic chun hóa ni dung (đc tính) ca tng ch tiêu trong cơ s d liu; đnh dng d liu theo các cu trúc thng nht; đi chiếu và ánh x theo các ni dung d liu bo đm tương thích theo thi gian; phân tách d liu theo các chiu khác nhau: thành th/nông thôn, tnh/thành ph, dân tc, gii tính, đ tui, trình đ hc vn, ngành kinh tế, thành phn kinh tế, trình đ đào to…
  • Xây dng các bng phân loi dùng chung, các bng tương thích, ánh x là mt thách thc khi xây dng cơ sơ d liu thng kê trong bi cnh CMCN 4.0. D liu trong các cơ s d liu thng kê đưc ly t nhiu ngun, nhiu đnh dng khác nhau, ni dung và cu trúc d liu thay đi theo chui thi gian, đ thng nht s dng trong cùng mt cơ s d liu phi xây dng các bng phân loi; các bng tương thích và ánh x d liu t các phiên bn d liu khác nhau.
  • Ngoài ra, xây dng các mô t d liu cũng là mt thách thc trong quá trình xây dng cơ s d liu thng kê trong bi cnh CMCN 4.0. D liu trong cơ s d liu thng kê phi đưc mô t các đc tính ca nó đ bo đm liên kết, kết ni vi các d liu khác. Mô t d liu gm phm vi s liu, phương pháp thu thp, quyn s, trng s, mu thu thp, mi liên h vi các d liu khác, ngun thu thp s liu, tính cp nht…
Gii pháp

Đ nm bt đưc cơ hi, chuyn cơ hi thành hin thc khi xây dng cơ s d liu thng kê trong bi cnh CMCN 4.0, bài viết tp trung vào mt s gii pháp sau:

Th nht là xây dng chính sách, pháp lut v d liu m, đc bit là d liu quc gia. Đây là ngun d liu quan trng nht cung cp d liu cho cơ s d liu thng kê trong bi cnh CMCN 4.0. Chính sách, pháp lut v d liu m phi đm bo: D liu mà bt k ai cũng có th truy cp, s dng và chia s; d liu m tr nên s dng đưc khi đưc làm sn sàng đnh dng ph biến, máy đc đưc; d liu m phi đưc cp phép m - giy phép phi cho phép mi ngưi s dng d liu đó theo bt k cách gì h mun, bao gm biến đi, kết hp và chia s nó vi nhng ngưi khác, thm chí mt cách thương mi.

Th hai là thiết lp hành lang pháp lý v vic công nhn, tha nhn các ngun d liu phi truyn thng phc v cho mc đích thng kê nhà nưc như d liu ln, d liu vin thám, v tinh… cũng như khng đnh giá tr thông tin thng kê khai thác t các ngun d liu phi truyn thng này.

Th ba là ch đng xây dng các đnh dng chun, có cu trúc cho tng cơ s d liu thng kê; xây dng các bng phân loi dùng chung, các bng tương thích, ánh x d liu và thiết lp mô t đi vi tng d liu trong cơ s d liu./.

 
ThS. Cao Quang Thành
Phó Cc trưng Cc Thu thp d liu và ng dng CNTT Thng kê - TCTK
 
 
 

Các bài viết khác
Liên kết website
Liên kết website
Thăm dò ý kiến

Đánh giá khách quan của bạn về thông tin chúng tôi cung cấp? Vui lòng tích vào ô bên dưới để trả lời!

Top