Khi một cuộc hội thoại được chuyển qua phân tích hay nhập vào mô hình dữ liệu lớn, các thuật ngữ như dữ liệu Có cấu trúc, Bán cấu trúc hoặc Không cấu trúc thường hay được nhắc đến. Đây là những loại hình dữ liệu quan trọng cần biết trong thời đại mà dữ liệu Bán cấu trúc và Không cấu trúc đang gia tăng với tốc độ chóng mặt, đồng thời những công cụ để quản lý và phân tích các loại dữ liệu này cũng đang dần trở nên phổ biến. Dưới đây là những gì bạn cần biết. Show
1. Dữ liệu Có cấu trúcĐây là loại dữ liệu dễ dàng tìm kiếm và sắp xếp nhất, vì nó thường được hàm chứa trong các cột và hàng, và các thành phần của chúng có thể được liên kết bằng những trường được định sẵn từ trước. Hãy nghĩ về những dữ liệu bạn có thể lưu trữ trong một tệp Excel và chúng ta sẽ thấy ngay được ví dụ về dữ liệu có cấu trúc. Dữ liệu có cấu trúc có thể bám theo một mô hình dữ liệu mà người thiết kế cơ sở dữ liệu (CSDL) tạo ra — ví dụ như các bản thống kê bán hàng theo vùng miền, xếp theo loại mặt hàng hoặc theo khách hàng. Đối với dữ liệu có cấu trúc, các hạng mục có thể được nhóm lại để tạo thành các mối liên hệ với nhau (các ‘khách hàng’ cùng có phản hồi ‘thỏa mãn’ về dịch vụ chẳng hạn). Những điều này sẽ giúp dữ liệu có cấu trúc dễ dàng được lưu trữ, phân tích, tìm kiếm, và trở thành loại dữ liệu dễ sử dụng nhất cho doanh nghiệp trong thời gian gần đây. Ngày nay, phần lớn những loại dữ liệu được cho là có cấu trúc chỉ chiếm ít hơn 20% tổng số dữ liệu thu được. Thông thường, dữ liệu có cấu trúc được quản lý bằng Ngôn ngữ Truy vấn Có cấu trúc (Structured Query Language — SQL) — một loại ngôn ngữ lập trình được phát triển bởi IBM từ những năm 1970 dành cho các CSDL có liên hệ. Dữ liệu có cấu trúc được tạo ra bởi máy móc và con người. Các ví dụ của dữ liệu có cấu trúc bao gồm dữ liệu tài chính như các giao dịch, chi tiết địa chỉ, thông tin nhân khẩu, đánh giá của người dùng, các bản ghi chú của máy, dữ liệu địa điểm từ các thiết bị thông minh, … 2. Dữ liệu Không cấu trúcMột phần rất lớn của tất cả dữ liệu trên thế giới này là dữ liệu Không cấu trúc. Loại dữ liệu này là loại không thể chứa trong CSDL dạng hàng và cột, và nó cũng không có mô hình dữ liệu nào liên quan. Ví dụ như một đoạn chữ trong một email chẳng hạn. Sự thiếu hụt về cấu trúc đã khiến dữ liệu Không cấu trúc trở nên khó tìm kiếm, quản lý và phân tích, cũng là lý do vì sao các công ty đều bỏ qua dạng dữ liệu này; cho đến gần đây khi sự ra đời của trí tuệ nhân tạo và các thuật toán máy tự học khiến cho quá trình này trở nên dễ hơn đôi chút. Các ví dụ khác của dữ liệu Không cấu trúc gồm có hình ảnh, phim và các tệp âm thanh, các tệp chứa chữ cái, các nội dung từ mạng xã hội, hình ảnh từ vệ tinh, các bài thuyết trình, tệp PDF, các câu trả lời từ bản khảo sát câu hỏi mở, các trang web và bản thu từ các cuộc gọi hỗ trợ khách hàng. Thay vì sử dụng Excel hay CSDL quan hệ, dạng dữ liệu Không cấu trúc thường được lưu trữ trong các hầm dữ liệu, cơ sở dữ liệu NoSQL, các ứng dụng và kho chứa dữ liệu khác. Sự màu mỡ của thông tin trong các khối dữ liệu Không cấu trúc giờ đây đã có thể được khai thác và được tự động xử lý bởi các thuật toán và trí tuệ nhân tạo trong thời đại ngày nay. Công nghệ này đã nâng tầm dữ liệu Không cấu trúc lên thành nguồn tài nguyên cực kỳ giá trị đối với các tổ chức. 3. Dữ liệu Bán cấu trúcNgoài dữ liệu Có cấu trúc và Không cấu trúc, có một loại dữ liệu khác nữa, cơ bản là dựa trên sự pha trộn của 2 loại trên. Loại dữ liệu này có một số tính chất đồng nhất có thể xác định được, nhưng lại không hình thành một cấu trúc rõ ràng và phù hợp với CSDL quan hệ. Vì vậy, một số thuộc tính có tổ chức được gán cho nó như các nhãn về ngữ nghĩa (semantic tag) hay các siêu dữ liệu (metadata) với mục đích dễ dàng sắp xếp hơn, nhưng vẫn sẽ có những lỗ hổng trong việc này. Email là một ví dụ điển hình. Nội dung thực chất của email thuộc dạng Không cấu trúc, nhưng nó lại mang các dữ liệu Có cấu trúc như tên, địa chỉ của người gửi và người nhận, thời gian gửi, … Một ví dụ khác là ảnh kỹ thuật số. Bản thân hình ảnh đó là Không cấu trúc, nhưng nếu bức ảnh đó được chụp từ điện thoại, thì nó sẽ được gắn ngày tháng và thời gian, nhãn về địa lý, và có khi còn có ID của thiết bị. Một khi được lưu trữ, bức ảnh đó cũng có thể được gắn nhãn như ‘chó’ hay ‘mèo’. Rất nhiều thứ khác mà mọi người thường xếp vào dạng dữ liệu Không cấu trúc nhưng thực ra lại là Bán cấu trúc, bởi vì nó mang trong mình những tính chất có thể phân loại được. 4. Sự khác nhau giữa Dữ liệu Có cấu trúc, Bán cấu trúc và Không cấu trúcĐể hiểu một cách dễ nhất sự khác nhau giữa các loại hình dữ liệu, hãy thử dùng phép loại suy này. Khi đi phỏng vấn việc làm, tưởng tượng rằng ta có 3 dạng phỏng vấn khác nhau: Có cấu trúc, Bán cấu trúc và Không cấu trúc. Đối với loại phỏng vấn Có cấu trúc, người phỏng vấn sẽ theo sát một kịch bản có sẵn được viết bởi phòng Nhân sự và áp dụng với tất cả các ứng viên. Đối với hình thức phỏng vấn Không cấu trúc, cuộc phỏng vấn sẽ phụ thuộc hoàn toàn vào người phỏng vấn quyết định xem câu hỏi sẽ là gì, và cả thứ tự của những câu hỏi đó đối với từng ứng viên nữa. Còn hình thức phỏng vấn Bán cấu trúc sẽ lấy các yếu tố từ cả cuộc phỏng vấn Có và Không cấu trúc. Nó sẽ có tính chất nhất quán và các nhân tố định lượng giống như khi phỏng vấn Có cấu trúc, và sẽ gồm cả sự thoải mái để tùy biến câu hỏi dựa trên tình hình thực tế. Như vậy, với dữ liệu nói chung, dữ liệu Có cấu trúc sẽ dễ dàng sắp xếp và bám theo một định dạng nhất định; dữ liệu Không cấu trúc sẽ phức tạp hơn và thường bao gồm các thông tin định tính mà hầu như không thể nào lược bớt hay sắp xếp lại trong CSDL quan hệ; và dữ liệu Bán cấu trúc thì có các nhân tố từ cả hai hình thức trên. <Nguồn: insights.innovatube.com> Xem thêm SQL là gì? Những gì cần biết về SQL (Last Updated On: 18/08/2021) Kể từ những năm 1970, một số tổ chức đã bắt đầu phát triển các HTTT thực sự khác biệt với các HTTT quản lý truyền thống. Chúng có thể tác động qua lại và được thiết kế giúp đỡ người sử dụng khai thác dữ liệu và các mô hình hỗ trợ cho việc ban hành các quyết định không có cấu trúc hoặc bán cấu trúc. Vào những năm 1980, các hệ thống này đã nhanh chóng phát triển và nâng lên mức hỗ trợ tạo quyết định của các cá nhân, các nhóm và thậm chí toàn bộ tổ chức. Đó chính là các HTTT hỗ trợ ra quyết định và hỗ trợ ra quyết định theo nhóm. Quá trình ra quyết định trong các tổ chứcTrong các tổ chức, vai trò của các nhà quản lý thể hiện qua chính các hoạt động mà họ thường thực hiện và thường được chia thành 3 nhóm chính: vai trò giữa các cá nhân với nhau, vai trò mang tính thông tin và vai trò có tính quyết định.
Theo các lý thuyết quản lý hiện đại, việc ra quyết định quản lý không hẳn là trung tâm của các hoạt động quản lý, tuy nhiên nó rất quan trọng và mang tính thách thức lớn nhất đối với các nhà quản lý. Các quyết định quản lý có thể được phân thành 3 mức: chiến lược, chiến thuật và tác nghiệp. Trong mỗi mức, các quyết định còn được phân loại theo dạng có cấu trúc (có thể lập trình được), dạng không có cấu trúc (không lập trình được) và dạng bán cấu trúc.
Nhìn chung, quá trình ra quyết định được tiến hành qua 4 bước:
HTTT hỗ trợ ra quyết định1. Khái niệmHTTT hỗ trợ ra quyết định (DSS – Decision Support System) là HTTT cho phép tổng hợp dữ liệu và phân tích dữ liệu qua các mô hình phức tạp để hỗ trợ cho những quyết định dạng không có cấu trúc hoặc bán cấu trúc. Hệ thống này có chức năng cung cấp thông tin và trợ giúp cho các nhà quản lý trong suốt quá trình xây dựng và thông qua các quyết định quản lý. Các nhà quản lý có thể tìm những dữ liệu thích hợp, lựa chọn và sử dụng các mô hình thích hợp, điều khiển quá trình thực hiện nhờ những phương tiện có tính chuyên nghiệp. Hệ thống hỗ trợ ra quyết định được ứng dụng trong nhiều lĩnh vực hoạt động của các tổ chức. Trước đây, các HTTT trợ giúp ra quyết định hướng đến các nhà quản lý cấp cao, còn ngày nay bắt đầu nhằm vào đối tượng là các nhà quản lý cấp trung. Một HTTT hỗ trợ ra quyết định được tổ chức hiệu quả nếu có khả năng phục vụ nhiều cấp quản lý khác nhau:
Một số ví dụ về các hệ thống DSS:
2. Các thành phần cơ bản của hệ thốngMô hình tổng quát của HTTT hỗ trợ ra quyết định được biểu diễn trong hình dưới. Một HTTT hỗ trợ ra quyết định bao gồm 5 thành phần cơ bản: – Phần cứng và hệ thống truyền thông: hệ thống các máy tính được nối mạng để có thể trao đổi các mô hình phần mềm và các số liệu với các hệ thống hỗ trợ ra quyết định khác. – Nhân lực: bao gồm các nhà quản lý sử dụng hệ thống, các lập trình viên và các kỹ thuật viên quản lý hệ thống. – CSDL: bao gồm dữ liệu (hiện tại hoặc quá khứ) từ CSDL của các tổ chức kinh tế, ngân hàng dữ liệu bên ngoài, CSDL nội bộ riêng cho các nhà quản lý. Hệ thống DSS bảo đảm tính toàn vẹn của dữ liệu, bản thân nó không tạo ra hoặc cập nhật dữ liệu mà chỉ tổ chức dữ liệu lại theo cách mà từng cá nhân hoặc từng nhóm nhận thấy là phù hợp để tạo quyết định dựa trên tình trạng thực tế. CSDL của mô hình này thường đã được tổng hợp và lưu trữ đặc biệt cho mục đích sử dụng riêng của hệ thống DSS do hai nguyên nhân: tổ chức cần bảo vệ CSDL của tổ chức, chống sự phá hoại từ những thay đổi đột ngột hoặc không thích hợp; nếu tự rà soát CSDL lớn của tổ chức thì đó sẽ là một quá trình chậm chạp và tốn kém. – Mô hình: tổng thể các mô hình phân tích và toán học sử dụng trong quá trình ra quyết định như mô hình thống kê, mô hình dự báo, mô hình điều hành, mô hình lập kế hoạch. Mỗi mô hình là một sự mô tả các yếu tố hoặc các mối quan hệ của một hiện tượng nào đó, ví dụ như mô hình phân tích hồi quy, phân tích độ nhạy, phân tích tình huống, tìm điểm hoà vốn, mô hình bài toán quy hoạch tuyến tính… Mỗi hệ thống DSS được xây dựng cho một tập hợp các mục đích khác nhau và sẽ tạo ra một tập hợp các mô hình phụ thuộc theo mục đích mà nó hướng tới. – Phần mềm: bao gồm các module để quản lý CSDL, các mô hình thông qua quyết định và các chế độ hội thoại giữa người sử dụng với hệ thống. Hệ thống phần mềm DSS cho phép người sử dụng có thể can thiệp vào CSDL và cơ sở mô hình của hệ thống một cách dễ dàng. Hệ thống phần mềm DSS cung cấp các biểu đồ dễ sử dụng và các giao diện linh hoạt, cho phép cả các nhà quản lý không có kinh nghiệm sử dụng máy tính cũng có thể tiếp cận hệ thống một cách dễ dàng. 3. Phương pháp xây dựng hệ thốngDo hệ thống DSS được tạo ra để phục vụ cho nhu cầu đặc biệt của nhà quản lý và chuyên dùng cho một lớp các quyết định nào đó nên trong quá trình xây dựng hệ thống DSS cần có sự tham gia của người sử dụng ở mức cao nhất. Hệ thống này chỉ sử dụng một số lượng nhất định các dữ liệu liên quan, không cần việc trao đổi các dữ liệu một cách trực tiếp và có xu hướng sử dụng những mô hình phân tích phức tạp hơn các hệ thống khác. Quy trình xây dựng các hệ thống DSS thường có các bước sau:
HTTT hỗ trợ ra quyết định theo nhómDo cách làm việc theo nhóm ngày càng gia tăng trong các tổ chức nên vào cuối những năm 1980, những người phát triển hệ thống bắt đầu quan tâm đến việc phát triển các HTTT có khả năng hỗ trợ tạo quyết định theo nhóm. HTTT hỗ trợ ra quyết định theo nhóm (GDSS – Group Decision Support System) được phát triển để giải quyết các vấn đề không có cấu trúc nhằm nâng cao chất lượng và hiệu quả của những cuộc gặp theo nhóm. Nhờ các hệ thống này, số lượng các cuộc gặp gỡ của các nhà ra quyết định tăng lên, thời gian họp cũng được kéo dài hơn và gia tăng số ý kiến tham gia để giải quyết các vấn đề của tổ chức. Việc tạo ra các quyết định theo nhóm có đặc thù riêng và khác với việc ra những quyết định của mỗi cá nhân. Sự thành công của hệ thống hỗ trợ ra quyết định theo nhóm phụ thuộc vào những yếu tố sau:
Hệ thống GDSS có khả năng giúp giải quyết các vấn đề của các cuộc họp bằng cách như sau:
Hệ thống GDSS có rất nhiều ưu điểm, tuy nhiên nó khá phức tạp; tính hiệu quả của các công cụ được sử dụng phụ thuộc phần nào vào các thiết bị phần cứng, chất lượng của các kế hoạch, sự hợp tác của các thành viên…; chi phí cho những hệ thống này khá đắt nên thực tế việc đưa các hệ thống này vào sử dụng vẫn còn hạn chế. |