Thực trạng quản trị dữ liệu trong các ngân hàng thương mại Việt Nam Quản trị dữ liệu xuất hiện từ những năm 1990 - 2010, khi mà các tổ chức bắt đầu xây dựng kho dữ liệu (Data Warehouse) để lưu trữ và quản lý dữ liệu dựa trên các mô hình dữ liệu (data model). Tuy nhiên, ở giai đoạn /này, Quản trị dữ liệu chỉ xoay quanh từng hệ thống đơn lẻ, chưa có sự gắn kết trên toàn bộ hệ thống. Từ năm 2010, khi mức độ tăng trưởng dữ liệu tăng cao, để tiến hành phân tích dữ liệu, các doanh nghiệp cần có sự tương tác, phối hợp của nhiều hệ thống, và lúc này họ bắt đầu để ý đến giá trị của dữ liệu. Lúc đó khái niệm Quản trị dữ liệu toàn diện mới thực sự hình thành với 3 trụ cột chính: Con người - mô hình tổ chức, Chính sách - quy định, và Công nghệ dữ liệu.
Tại Việt Nam, khái niệm Quản trị dữ liệu cũng được đưa vào khá sớm, năm 2014, ngân hàng TMCP Việt Nam Thịnh Vượng đã triển khai dự án Khung Quản trị dữ liệu và bắt đầu áp dụng Quản trị dữ liệu ở quy mô nhỏ, Quản trị chất lượng dữ liệu vào năm 2015. Từ năm 2014 đến nay, các ngân hàng đã manh nha việc triển khai Quản trị dữ liệu toàn diện. Tuy nhiên kết quả vẫn còn rất hạn chế, khi hiện tại các ngân hàng triển khai Quản trị dữ liệu vẫn chỉ đếm trên đầu ngón tay, nếu đánh giá một cách thực sự công tâm, thì mức độ triển khai của các ngân hàng này vẫn chỉ ở mức bắt đầu, sơ khởi. Sau đây, bài báo sẽ đi sâu phân tích quản trị dữ liệu dưới hai khía cạnh: Hệ thống hạ tầng và mô hình tổ chức.
Từ năm 2000 đến năm 2010, phần lớn các ngân hàng đều triển khai xây dựng kho dữ liệu. Tuy nhiên, do việc xây dựng chưa có quy hoạch dẫn đến tồn tại nhiều kho dữ liệu phục vụ nhiều mục đích khác nhau.
Hình 1. Mô hình dữ liệu thực tế tại một ngân hàng với nhiều kho dữ liệu khác nhau.
Việc này dẫn đến một loạt các vấn đề như sau:
- Do tồn tại nhiều kho dữ liệu khác nhau phục vụ mục đích khác nhau, dẫn đến báo cáo từ các kho này sẽ khác nhau. Việc phân định báo cáo nào là chính xác mất rất nhiều thời gian do phải tìm hiểu nguồn dữ liệu và cách thức xử lý dữ liệu.
- Việc tồn tại nhiều kho dữ liệu dẫn đến việc quản lý không hiệu quả, làm tăng nguy cơ rò rỉ dữ liệu ra bên ngoài. Thực tế, năm 2012 đã có ngân hàng tiến hành truy tố nhân viên của mình do lấy dữ liệu khách hàng và bán ra thị trường.
- Việc quản lý dữ liệu trên các kho do nhiều người thực hiện, và quá trình triển khai không thực hiện tài liệu ghi nhận hệ thống, dẫn đến việc khai thác dữ liệu không hiệu quả và phải phụ thuộc vào một số cá nhân đã làm lâu năm am hiểu hệ thống. Sẽ rất khó để tìm được đúng dữ liệu mình cần nếu không có hệ thống Siêu dữ liệu.
Với mô hình dữ liệu như Hình 1, các ngân hàng hiện tại đang chưa thực sự quản trị dữ liệu do:
- Chiến lược dữ liệu nhằm phục vụ các mục tiêu kinh doanh của ngân hàng;
- Mô hình kiến trúc tổng thể được quy hoạch dài hạn và quản lý bởi đơn vị chuyên trách;
- Hệ thống các chính sách, quy định về dữ liệu để hướng dẫn các đơn vị trong ngân hàng tuân thủ;
- Hệ thống siêu dữ liệu là nơi ghi nhận quá trình phát triển, luồng dữ liệu, ý nghĩa của các phân hệ, bảng, trường dữ liệu;
- Chưa phân loại được dữ liệu, chưa có hệ thống Quản lý dữ liệu chủ.
Hình 2. Mô hình dữ liệu thực tế tại một ngân hàng, tồn tại nhiều kho dữ liệu khác nhau.
Hình 3. Mức đầu tư cho một khách hàng tại Việt Nam và các khu vực.
Mô hình tổ chức quản trị dữ liệu
Về nhận thức giá trị của dữ liệu đối với tổ chức, năm 2018 tác giả có thực hiện một khảo sát chuyên gia trong phạm vi nhỏ về Mức độ trưởng thành của Quản trị dữ liệu trong ngân hàng. Kết quả là nhận thức về giá trị của dữ liệu trong ngân hàng vẫn đang còn rất hạn chế, mới đạt mức 1 - Chưa triển khai trong 6 mức trưởng thành của Quản trị dữ liệu. Điều này cho thấy, các ngân hàng tại Việt Nam hiểu rõ giá trị của dữ liệu, tuy nhiên để coi dữ liệu là “tài sản chiến lược” thì thực sự khó. Các ngân hàng còn đang rất lúng túng trong việc hiểu đúng giá trị của dữ liệu và cách thức triển khai Quản trị dữ liệu.
Điều này cũng tương đối phù hợp với một khảo sát được tác giả thực hiện năm 2018 về định mức đầu tư cho một khách hàng, so sánh giữa các ngân hàng Việt Nam và các ngân hàng trong khu vực Châu Á, Châu Phi, Trung Đông và Châu Âu.
Với mỗi khách hàng, các ngân hàng tại Việt Nam đầu tư trung bình khoảng 0.5$, trong khi đó các ngân hàng tại khu vực Châu Á Thái Bình Dương và khu vực Châu Phi đầu tư 3.84$ và 3.53$, khu vực Trung Đông và Châu Âu mức đầu tư cao hơn rất nhiều. Việc đầu tư vào công nghệ thu thập, quản lý và khai thác thông tin khách hàng cũng phần nào cho thấy mức độ quan tâm tới dữ liệu của ngân hàng.
Về mô hình tổ chức, hiện tại phần lớn các ngân hàng đang chưa có một đơn vị độc lập, chuyên trách quản trị và khai thác dữ liệu.
Các ngân hàng hiện đang phân bổ các đơn vị quản trị và khai thác dữ liệu thành các đơn vị trực thuộc Khối và chưa tập trung. Ví dụ: khối Tài chính kế toán có đơn vị khai thác dữ liệu với tên gọi như Hệ thống Thông tin Quản lý, Tài chính doanh nghiệp hoặc Quản lý hiệu suất; các khối Bán lẻ, khối Doanh nghiệp có đơn vị làm báo cáo độc lập thường được gọi là Phòng Phát triển kinh doanh, Phòng hỗ trợ kinh doanh... Ngoài các đơn vị này, một số ngân hàng còn có đơn vị khai thác dữ liệu trực thuộc Văn phòng Tổng Giám Đốc, Trung tâm Xuất sắc (Center of Excellence), với các tên gọi khác nhau như Trung tâm Năng lực Thông tin Kinh doanh (Business Intelligence Competency Center) hoặc Trung tâm Phân tích kinh doanh.
Việc phân bổ mô hình tổ chức phân tán như Hình 4 cũng tương đối phù hợp với những phân tích ở Hình 1, Hình 2. Với mô hình tổ chức phân tán như vậy thì các ngân hàng cũng chưa thể quản trị và khai thác dữ liệu một cách tối ưu. Vậy để triển khai Quản trị dữ liệu, các ngân hàng cần bắt đầu từ đâu, các giải pháp cụ thể sẽ được trình bày ở Phần II của bài viết này.
Hình 4. Mô hình tổ chức đơn vị quản trị và khai thác dữ liệu tại các ngân hàng Việt Nam.
Nguyễn Minh Đức, Giám đốc Dữ liệu Ngân hàng TMCP Quân đội
09:00 | 07/05/2021
16:00 | 03/05/2021
10:00 | 19/06/2024
Ngày 18/6, tại Thừa Thiên Huế, Cục Cơ yếu Đảng - Chính quyền, Ban Cơ yếu Chính phủ đã tổ chức triển khai máy tính an toàn đa giao diện có cài đặt sản phẩm mật mã - MTCD-3M (3M) và tập huấn, hướng dẫn quản lý, sử dụng máy 3M cho cán bộ, chuyên viên các phòng chuyên môn thuộc Văn phòng Tỉnh ủy và văn thư các cơ quan tham mưu giúp việc Tỉnh ủy.
10:00 | 22/03/2024
Với sự tương tác kinh tế, xã hội và văn hóa ngày càng diễn ra phổ biến trên Internet, nhu cầu ngày càng tăng trong vài thập kỷ qua nhằm bắt chước sự ngẫu nhiên của thế giới tự nhiên và tạo ra các hệ thống kỹ thuật số để tạo ra các kết quả không thể đoán trước. Các trường hợp sử dụng cho tính không thể đoán trước này bao gồm đưa vào sự khan hiếm nhân tạo, xây dựng các cơ chế bảo mật mạnh mẽ hơn và tạo điều kiện cho các quy trình ra quyết định trung lập đáng tin cậy. Trong bài viết này, tác giả sẽ phân tích tính ngẫu nhiên, tìm hiểu về các loại ngẫu nhiên và vai trò quan trọng của sự ngẫu nhiên đối với Blockchain và hệ sinh thái Web3.
14:00 | 01/03/2024
Giấu tin (steganography) là một kỹ thuật nhúng thông tin vào một nguồn đa phương tiện nào đó, ví dụ như tệp âm thanh, tệp hình ảnh,... Việc này giúp thông tin được giấu trở nên khó phát hiện và gây ra nhiều thách thức trong lĩnh vực bảo mật và an toàn thông tin, đặc biệt là quá trình điều tra số. Thời gian gần đây, số lượng các cuộc tấn công mạng có sử dụng kỹ thuật giấu tin đang tăng lên, tin tặc lợi dụng việc giấu các câu lệnh vào trong bức ảnh và khi xâm nhập được vào máy tính nạn nhân, các câu lệnh chứa mã độc sẽ được trích xuất từ ảnh và thực thi. Nhằm mục đích cung cấp cái nhìn tổng quan về phương thức ẩn giấu mã độc nguy hiểm, bài báo sẽ giới thiệu về kỹ thuật giấu tin trong ảnh và phân tích một cuộc tấn công cụ thể để làm rõ về kỹ thuật này.
08:00 | 25/01/2024
Tháng 12/2023, các nhà nghiên cứu của hãng bảo mật Fortinet xác định được ba gói độc hại mới trong kho lưu trữ nguồn mở Python Package Index (PyPI) có khả năng triển khai tệp thực thi CoinMiner để khai thác tiền điện tử trên các thiết bị Linux bị ảnh hưởng. Các nhà nghiên cứu cho rằng các chỉ số xâm phạm (IoC) của các gói này có điểm tương đồng với gói PyPI Culturestreak được phát hiện vào đầu tháng 9/2023. Bài viết này sẽ phân tích các giai đoạn tấn công của ba gói PyPI độc hại này, trong đó tập trung vào những điểm tương đồng và sự phát triển của chúng so với gói Culturestreak.
Trong bối cảnh chuyển đổi số và ứng dụng rộng rãi của công nghệ thông tin (CNTT) thì xu hướng kết nối liên mạng để chia sẻ cơ sở dữ liệu (CSDL) trở nên tất yếu. Các hệ thống công nghệ vận hành (Operational Technology - OT) cũng không nằm ngoài xu hướng này, quá trình đó được gọi là Hội tụ IT/OT. Do vậy, nhu cầu truyền dữ liệu một chiều giữa các mạng độc lập ngày càng tăng để phục vụ cho mục đích khai thác dữ liệu. Bài viết này giới thiệu một giải pháp mới dựa trên công nghệ vi mạch tích hợp khả trình (Field-Programmable Gate Array - FPGA), sử dụng cơ chế xử lý đa luồng tốc độ cao, giúp duy trì băng thông hệ thống mà không gây ra tình trạng treo hoặc nghẽn mạng, cho phép các kết nối yêu cầu thời gian thực. Đồng thời, bài viết cũng sẽ trình bày giải pháp giả lập giao thức TCP/IP hỗ trợ cho các giao thức truyền thông trong các hệ thống mạng điều khiển IT/OT.
09:00 | 06/01/2025
Cách mạng khoa học công nghiệp 4.0 với sự hội tụ của hệ thống không gian mạng thực - ảo, điện toán đám mây, Internet vạn vật (IoT) được đưa vào ứng dụng rộng rãi, ảnh hưởng trực tiếp đời sống, kinh tế, xã hội, quốc phòng, an ninh của các quốc gia. Sự xuất hiện của các thiết bị IoT làm gia tăng sự kết nối của con người, dịch vụ, thúc đẩy mạnh mẽ số hóa, tự động hóa ở tất cả các ngành nghề, lĩnh vực, mang lại những lợi ích to lớn, tạo ra các mô hình kinh doanh mới nhưng đồng thời cũng tiềm ẩn nhiều nguy cơ bị tấn công mạng, gây mất an toàn thông tin, an ninh mạng. Bài viết sẽ thông tin tới độc giả về xu hướng tấn công vào thiết bị IoT và đưa ra một số kiến nghị để ứng phó với các thách thức đang đặt ra.
13:00 | 23/01/2025