i
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC DÂN LẬP HẢI PHÒNG
NGUYỄN ĐĂNG HIỆP
NGHIÊN CỨU HỆ THỐNG TRỢ GIÚP QUYẾT ĐỊNH
TRONG TƯ VẤN NGHỀ NGHIỆP CHO HỌC SINH
TRUNG HỌC PHỔ THÔNG
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
CHUYÊN NGÀNH:
HỆ THỐNG THÔNG TIN
MÃ SỐ:
60480104
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS. ĐỖ TRUNG TUẤN
Hải Phòng, 10/2017
ii
LỜI CẢM ƠN
Luận văn “Nghiên cứu hệ thống trợ giúp ra quyết định trong tư vấn nghề nghiệp
cho học sinh trung học phổ thông” được hoàn thành không những nhờ sự nỗ lực của cá
nhân tác giả mà còn có sự trợ giúp, giúp đỡ từ rất nhiều tập thể và cá nhân.
Trước hết, tác giả xin chân thành cảm ơn tất cả các Giáo sư, Phó giáo sư, tiến sĩ,
các thầy giáo cô giáo của Khoa công nghệ thông tin trường Đại học Dân lập Hải Phòng
đã nhiệt tình giảng dạy, tạo điều kiện thuận lợi cho tác giả trong quá trình học tập, nghiên
cứu, hoàn thành chương trình học tập của khóa học.
Đặc biệt, tác giả bày tỏ lòng biết ơn sâu sắc đến thầy PGS.TS. Đỗ Trung Tuấn, các
thầy cô trong hội đồng khoa học đã giành thời gian chỉ bảo tận tình giúp em hoàn thành
luận văn.
Tác giả xin chân thành cảm ơn Sở GD và ĐT Hải Phòng, Ban giám hiệu và giáo
viên trường THPT Lê Ích Mộc huyện Thủy Nguyên thành phố Hải Phòng đã quan tâm
giúp đỡ tạo mọi điều kiện thuận lợi cho tác giả trong suốt quá trình học tập, nghiên cứu
và hoàn thành luận văn.
Tác giả xin cảm ơn gia đình, bạn bè, đồng nghiệp, đã động viên tiếp thêm nghị lực
để tác giả hoàn thành khóa học và luận văn.
Mặc dù đã có nhiều cố gắng, song luận văn khó tránh khỏi những thiếu sót. Tác
giả rất mong sự chỉ bảo, góp ý của các nhà khoa học, các thầy cô giáo và đồng nghiệp.
Xin trân trọng cảm ơn!
Hải Phòng, tháng 10 năm 2017
Nguyễn Đăng Hiệp
iii
MỤC LỤC
LỜI CẢM ƠN
……………………………………………………………………………………………. ii
MỤC LỤC ……………………………………………………………………………………………….. iii
DANH SÁCH NHỮNG TỪ VIẾT TẮT ………………………………………………………. vi
Danh mục các hình vẽ và bảng biểu ……………………………………………………………. vii
MỞ ĐẦU ……………………………………………………………………………………………………1
1. Lý do chọn đề tài ………………………………………………………………………………1
2. Mục tiêu nghiên cứu ………………………………………………………………………….2
3. Nội dung nghiên cứu
………………………………………………………………………….2
4. Phương pháp nghiên cứu ……………………………………………………………………2
5. Cấu trúc luận văn ………………………………………………………………………………2
Chương 1…………………………………………………………………………………………………….3
TỔNG QUAN VỀ HỆ THỐNG TRỢ GIÚP QUYẾT ĐỊNH …………………………….3
1.1. Hệ thống thông tin ……………………………………………………………………………..3
1.2. Hệ trợ giúp ra quyết định …………………………………………………………………….4
1.2.1. Quyết định…………………………………………………………………………………..4
1.2.2. Quá trình ra quyết định …………………………………………………………………5
1.3. Hệ trợ giúp quyết định ………………………………………………………………………..7
1.3.1. Khái niệm hệ trợ giúp quyết định …………………………………………………..7
1.3.2. Các thành phần của hệ trợ giúp quyết định ……………………………………..7
1.3.3. Mô hình ra quyết định
…………………………………………………………………..8
1.3.4. Phân loại hệ trợ giúp ra quyết định
…………………………………………………9
1.3.5. Năng lực của hệ trợ giúp quyết định
……………………………………………..11
1.3.6. Phân tích “What-if” ……………………………………………………………………13
1.4. Quá trình ứng dụng tin học trong các bài toán phi cấu trúc ……………………14
1.4.1. Bài toán phi cấu trúc …………………………………………………………………..14
1.4.2. Loại bài toán phi cấu trúc ……………………………………………………………14
1.5. Cây quyết định …………………………………………………………………………………16
1.5.1 Khái niệm về cây quyết định ………………………………………………………..16
1.5.2 Một số vấn đề khi sử dụng cây quyết định …………………………………….17
1.5.3. Đánh giá cây quyết định trong lĩnh vực khai phá dữ liệu
……………….19
1.6. Thuật toán C4.5………………………………………………………………………………..22
iv
1.6.1 Giới thiệu về thuật toán cây quyết định
…………………………………………22
1.6.2 Giới thiệu thuật toán C4.5 ……………………………………………………………22
1.6.3 Thuật toán C4.5 dùng Gain-entropy làm độ đo lựa chọn thuộc tính “tốt
nhất”
……………………………………………………………………………………………………………23
1.6.4 Thuật toán C4.5 với cơ chế riêng trong xử lý những giá trị thiếu
…….26
1.6.5 Tránh “quá vừa” dữ liệu ……………………………………………………………..26
1.6.6 Chuyển đổi từ cây quyết định sang luật ………………………………………..27
1.6.7 Nhận xét về thuật toán C4.5 …………………………………………………………28
1.7. Kết luận
…………………………………………………………………………………………..28
Chương 2…………………………………………………………………………………………………..29
NHU CẦU RA QUYẾT ĐỊNH ĐỐI VỚI VIỆC LỰA CHỌN NGHỀ NGHIỆP
CỦA HỌC SINH TRUNG HỌC PHỔ THÔNG ………………………………………………………29
2.1 Thực trạng của việc chọn nghề của thanh niên
………………………………………29
2.1.1. Thực trạng chung của thanh niên
………………………………………………….29
2.1.2. Thực trạng của lựa chọn nghề nghiệp của học sinh
…………………………31
2.2.3 Nhu cầu về nguồn nhân lực ………………………………………………………….33
2.2. Yêu cầu của nhà trường về trợ giúp quyết định…………………………………….35
2.2.1. Về ngành nghề lao động ……………………………………………………………..35
2.2.2. Ngành nghề đông người chọn trong mười năm tới …………………………40
2.3. Định hướng nghề tại cơ sở giáo dục phổ thông
…………………………………….43
2.3.1. Tư vấn nghề tại cơ sở giáo dục …………………………………………………….43
2.3.2. Tư vấn nhờ hệ thống công nghệ thông tin ……………………………………..46
2.4. Kết luận
…………………………………………………………………………………………..47
Chương 3…………………………………………………………………………………………………..48
THỬ NGHIỆM TRỢ GIÚP QUYẾT ĐỊNH LỰA CHỌN NGHỀ NGHIỆP TẠI
TRƯỜNG TRUNG HỌC PHỔ THÔNG ………………………………………………………………..48
3.1. Đặt vấn đề ……………………………………………………………………………………….48
3.1.1. Tổng quan về phần mềm Weka ……………………………………………………48
3.1.2. Xây dựng dữ liệu đưa vào phần mềm
……………………………………………50
3.2. Chuẩn bị dữ liệu thử nghiệm ……………………………………………………………..52
3.2.1 Trích chọn thuộc tính
…………………………………………………………………..52
3.2.2 Trích chọn thuộc tính bằng phần mềm Weka
………………………………….53
3.2.3 Chuẩn hóa dữ liệu ……………………………………………………………………….54
3.2.4 Lựa chọn thuật toán J48 để xây dựng cây quyết định ………………………56
v
3.2.5 Đánh giá hiệu quả phân lớp của thuật toán
……………………………………..58
3.3. Đánh giá kết quả sử dụng cây quyết định
…………………………………………….67
3.3.1. Giải pháp xây dựng hệ thống
……………………………………………………….67
3.3.2. Giao diện phần mềm
…………………………………………………………………..67
3.4. Kết luận chương
……………………………………………………………………………….68
KẾT LUẬN
……………………………………………………………………………………………….69
1. Những kết quả đạt được của luận văn ………………………………………………..69
2. Hướng phát triển ……………………………………………………………………………..69
TÀI LIỆU THAM KHẢO …………………………………………………………………………..71
vi
DANH SÁCH NHỮNG TỪ VIẾT TẮT
ACM
Hội máy tính Hoa Kì
AEC
Cộng đồng kinh tế ASEAN
ANN
Mạng thần kinh nhân tạo
BCHTW
Ban chấp hành trung ương
CBGV
Vật tư giáo viên
CBQL
Vật tư quản lý
CNTT
Công nghệ thông tin
CSDL
Cơ sở dữ liệu
DB
Database Management
DBMS
Database Management System
DD
Data Dictionary
DGMS
Dialog Generation and Management System
DSS
Decision Support Systems
EIS
Hệ thống thông tin khai thác
ES
Hệ chuyên gia
GDSS
Hệ trợ giúp quyết định theo nhóm
GV
Giảng viên
GVCN
Giáo viên chủ nhiệm
HHTQD
Hệ trợ giúp quyết định
HSSV
Sinh viên sinh viên
MBMS
Model Base Management System
MSS
Hệ trợ giúp quản lý
What if
Câu hỏi trong DSS
vii
Danh mục các hình vẽ và bảng biểu
Hình 1.1. Hệ thống thông tin xí nghiệp …………………………………………………………..4
Hình 1.2. Các giai đoạn của quá trình ra quyết định …………………………………………6
Hình 1.3. Hệ thống ra quyết định và môi trường của nó ……………………………………7
Hình 1.4. Cấu trúc chung của mô hình định lượng……………………………………………8
Hình 1.5. Mô hình khái niệm của DSS
………………………………………………………….10
Hình 1.6. Thí dụ về DSS và EIS …………………………………………………………………..13
Hình 1.7 Thí dụ về chức năng what-if để phân tích dữ liệu và phân tích nhân quả
trong phần mềm Excel ………………………………………………………………………………………….13
Hình 1.8. Chức năng quản lý ……………………………………………………………………….14
Hình 1.9 Ví dụ về cây quyết định …………………………………………………………………17
Hình 1.10. Thuật toán cây quyết định
……………………………………………………………22
Hình 1.11. Giả mã của thuật toán C4.5
………………………………………………………….23
Bảng 1.1 Bảng dữ liệu tập huấn luyện với thuộc tính phân lớp là buys_computer
…………………………………………………………………………………………………………………………..24
Hình 2.1. Tư vấn chọn nghề tại Hội chợ việc làm thanh niên …………………………..30
Bảng 2.1. Lựa chọn của học sinh THPT sau khi tốt nghiệp (nguồn: tự điều tra)
…30
Bảng 2.2 Những thuận lợi của học sinh THPT khi lựa chọn
…………………………….31
Bảng 2.3. Những khó khăn của học sinh THPT khi lựa chọn …………………………..31
Hình 2.2. Nhu cầu về nhân lực về công nghệ thông tin ngày càng tăng …………….33
Hình 2.3. Tư vấn việc làm tại Học viện ngân hàng …………………………………………36
Hình 2.4. Khám chữa bệnh ………………………………………………………………………….38
Hình 2.5. Công nghệ thông tin thời đại số hóa ……………………………………………….39
Hình 2.6. Nhu cầu tuyển dụng theo trình độ, tháng 3-4 năm 2015 ……………………40
Hình 2.7. Các nước khối AEC ……………………………………………………………………..41
Hình 2.8. Định hướng nghề tại cơ sở giáo dục ……………………………………………….44
Hình 2.9. Tư vấn nhờ máy tính
…………………………………………………………………….46
Hinh 3.1. Công cụ của Weka ……………………………………………………………………….48
Hinh 3.2. Môi trường chính của Weka ………………………………………………………….49
Hinh 3.3. Dữ liệu đầu vào thông dụng trong weka
………………………………………….50
Bảng 3.1. Nghề lựa chọn thử nghiệm của luận văn
…………………………………………51
Hinh 3.4. Dữ liệu huyến luyện để đưa vào Weka
……………………………………………51
viii
Hinh 3.5. Lược đồ thử nghiệm trong luận văn ……………………………………………….52
Hình 3.6: Trích chọn thuộc tính bằng phần mềm Weka
…………………………………..53
Hình 3.7: Lựa chọn thuật toán để chuẩn hóa dữ liệu bằng Weka
………………………54
Hình 3.7: Chuẩn dữ diệu cho các các thuộc tính …………………………………………….55
Hình 3.4: Bảng dữ liệu sau khi đã chuẩn hóa …………………………………………………56
Hình 3.8: Lựa chọn thuật toán J48 với phần mềm Weka …………………………………57
Hình 3.9: Đánh giá hiệu quả của thuật toán bằng phương pháp cross-validation ..58
Hình 3.10: Cây quyết định
…………………………………………………………………………..60
Hình 3.11. Màn hình Weka
………………………………………………………………………….62
Hình 3.12. Đánh giá kết quả ………………………………………………………………………..62
Hình 3.13. Màn hình Weka lần hai
……………………………………………………………….63
Hình 3.14. Đánh giá đối với lần hai
………………………………………………………………63
Hình 3.15. Màn hình đối với lần ba
………………………………………………………………64
Hình 3.16. Đánh giá đối với lần ba
……………………………………………………………….64
Hình 3.17. Màn hình đối với lần thứ tư …………………………………………………………65
Hình 3.18. Đánh giá đối với lần thứ tư ………………………………………………………….65
Hình 3.18. Màn hình đối với lần thứ năm ……………………………………………………..66
Hình 3.19. Đánh giá đối với lần thứ năm ………………………………………………………66
Hình 3.20. Giao diện chương trình hỗ trợ ra quyết định trong tư vấn nghề nghiệp
…………………………………………………………………………………………………………………………..67
Hình 3.12. Giao diện nhập các thông tin để được tư vấn …………………………………67
Hình 3.13. Giao diện ra quyết định tư vấn …………………………………………………….68
1
MỞ ĐẦU
1. Lý do chọn đề tài
Trong thời đại ngày nay, trước sự đa dạng và phức tạp của hoàn cảnh khách
quan cùng với sự phát triển như vũ bão của công nghệ thông tin, nhà quản lý cần có
những tính toán đảm bảo được tính chính xác, kịp thời công việc quản lý của mình.
Các ứng dụng máy tính cho quản lý ngày càng nhiều. Cách mạng về máy vi tính
khiến máy vi tính giúp nhiều cho các nhà quản lý. Các nhà quản lý có thể truy cập
đến hàng ngàn cơ sở dữ liệu trong nhiều nước. Hầu hết các tổ chức, tư nhân hay tập
thể, đều dùng phân tích có tính toán trong quyết định của mình.
Các công ty đang phát triển các hệ thống phân tán cho phép khai thác dễ
dàng các dữ liệu tại nhiều địa điểm. Các hệ thống thông tin đa dạng có thể được tích
hợp với các hệ thống thông tin khác. Nhà quản lý dễ ra quyết định hơn do họ có
thông tin chính xác hơn. Việc dùng các hệ thống trợ giúp nhờ máy tính sẽ làm thay
đổi cung cách quản lý, tổ chức và công nghệ. Hơn nữa nó giúp tạo ra tiềm năng trợ
giúp quản lý.
Tuy nhiên cho dù có nhiều phát triển về công nghệ, nhiều nhà quản lý không
dùng máy tính, hay chỉ dùng với các quyết định đơn giản. Hệ trợ giúp quyết định
(DSS), Hệ trợ giúp quyết định theo nhóm (GDSS), hệ thống thông tin khai thác
(EIS), Hệ chuyên gia (ES), và mạng thần kinh nhân tạo (ANN) là các công nghệ
chính để thay đổi tình trạng này. Các công nghệ được nghiên cứu được gọi chung là
các hệ trợ giúp quản lý (MSS). DSS và ES cũng là giáo trình được hội ACM
khuyến cáo trong chương trình khung của các hệ thống thông tin máy tính.
Cùng với sự phát triển của khoa học kĩ thuật, nền kinh tế thế giới cũng đang
phát triển theo hướng nền kinh tế tri thức, với sự phát triển của những ngành công
nghệ cao. Việt Nam cũng nằm trong xu hướng chung đó. Trong tình hình chung của
đất nước, xã hội hóa giáo dục là một trong những hướng đi cần thiết. Trên thực tế
thì hàng nghìn sinh viên ra trường không có việc làm, hoặc sau khi tốt nghiệp phải
làm trái ngành, không đúng với chuyên môn được đào tại, vì vậy vấn đề lựa chọn
sao cho đúng, định hướng nghề nghiệp ngay từ trên ghế nhà trường là vô cùng cấp
thiết.
Chính vì vậy, với tư cách là một người trực tiếp giảng dạy trong nhà trường
Trung học phổ thông (THPT) tôi quyết định chọn đề tài “Nghiên cứu hệ thống trợ
giúp quyết định trong tư vấn nghề nghiệp cho học sinh trung học phổ thông” nhằm
hỗ trợ cho việc lựa chọn nghề nghiệp cho các em học sinh ngay từ khi ngồi trên ghế
nhà trường, xác định nghề nghiệp cho tương lai.
2
2. Mục tiêu nghiên cứu
Tìm hiểu về hệ thống trợ giúp quyết định trong quản lý nói chung và sử dụng
các công cụ trợ giúp quyết định để trợ giúp công tác định hướng nghề nghiệp cho
học sinh THPT nói riêng.
3. Nội dung nghiên cứu
Nội dung nghiên cứu của luận văn là:
Lý thuyết về tâm lý chọn nghề, tư chất và năng lực con người, xu
hướng chọn nghề.
Các kỹ thuật ra quyết định.
Lý thuyết về định hướng nghề nghiệp dựa trên thực tế địa phương
4. Phương pháp nghiên cứu
Để hoàn thành các nội dung nghiên cứu đề tài, học viên lựa chọn sử dụng các
phương pháp sau:
Thu thập dữ liệu;
Tìm hiểu vấn đề;
Thử nghiệm;
Viết báo cáo.
5. Cấu trúc luận văn
Luận văn được chia thành các chương :
1. Chương đầu trình bày tổng quan về các hệ thống DSS, một số khía
cạnh liên quan đến hệ thống thông tin quản lí và nhu cầu của quá trình
ra quyết định trong công tác quản lí;
2. Chương 2 về nhu cầu ra quyết định cho công tác lựa chọn nghề cho
học sinh THPT
3. Chương 3 Thử nghiệm trợ giúp quyết định lựa chọn nghề nghiệp cho
học sinh THPT
Cuối luận văn là phần kết luận và danh sách các tài liệu tham khảo, sử dụng
trong luận văn.
3
Chương 1
TỔNG QUAN VỀ HỆ THỐNG TRỢ GIÚP QUYẾT ĐỊNH
Hiện nay nước ta đang diễn ra sự ứng dụng các thành tựu của Công nghệ
thông tin vào cuộc sống. Có những ứng dụng đã và đang đem lại những hiệu quả to
lớn cho xã hội như Internet, Trí tuệ nhân tạo, Hệ chuyên gia, Cơ sở dữ liệu, … tuy
nhiên, có những ứng dụng rất mới và cần được sự quan tâm và đóng góp của mọi
người như Hệ trợ giúp quyết định. Người đóng góp đầu tiên cho DSS là nhà tin học
Scott- Morton từ những năm 70 của thế kỷ 20. Ngay từ ban đầu DSS được coi như
một hệ thống tương tác máy tính, giúp người ra quyết định dùng dữ liệu và các mô
hình để giải quyết bài toán không có cấu trúc. Ban đầu DSS được phát triển và ứng
dụng vào hầu hết các lĩnh vực của cuộc sống. DSS càng ngày càng trở thành một trợ
lý, trợ lý máy tính, với những đặc tính vô cùng quý báu như chính xác, tính toán
nhanh, khả năng ghi nhớ lớn, trung thành và không bao giờ biết mệt mỏi, phù hợp
với một xã hội biến động như ngày nay.
Hệ trợ giúp quyết định DSS giúp người lãnh đạo trong việc quyết định các
chủ trương kịp thời, đúng đắn, khả thi và có hiệu quả. Thông thường, việc trợ giúp
nói trên dựa trên cơ sở các phương pháp tối ưu hoá toán học (lý thuyết quy hoạch,
xác suất thống kê, quá trình ngẫu nhiên…) và các kinh nghiệm của các chuyên gia,
đồng thời tận dụng thế mạnh của các phương tiện. Tin học trong việc phân tích,
đánh giá, đề xuất phương án, lựa chọn tiêu chuẩn tối ưu và tìm phương án tối ưu
cũng như dự báo, dự đoán các tình huống có thể xảy đến và các hướng dự phòng,
ứng phó hiệu quả.
Mặc dù DSS kết hợp trong mình những thành tựu của nhiều chuyên ngành
Tin học tiên tiến như Trí tuệ nhân tạo, Quản trị hệ thống, Hệ chuyên gia, khoa học
về quản lý, … nhưng DSS chỉ làm một nhiệm vụ là trợ giúp con người. Nói cách
khác, nhà quản lý có thể hỏi Hệ trợ giúp quyết định để nhận được các thông tin định
hướng cho việc ra quyết định còn quyền quyết định cuối cùng vẫn thuộc về con
người – người ra quyết định.
1.1. Hệ thống thông tin
Hệ thống thông tin là một hệ thống mà mục tiêu tồn tại của nó là cung cấp
thông tin phục vụ cho hoạt động của con người trong một tổ chức nào đó.
Hệ thống thông tin có một vai trò quan trọng cho việc ra quyết định quản lý
4
hệ thống. Trong thời đại ngày nay sự bùng nổ của công nghệ thông tin làm cho nhu
cầu có được thông tin chính xác, đầy đủ kịp thời cho việc ra quyết định quản lý
không thể thiếu được. Trợ giúp quyết định quản lý thuộc phạm trù các công nghệ
trợ giúp quản lý. Do đó tầm quan trọng của việc trợ giúp quản lý gắn liền với tầm
quan trọng của hệ trợ giúp quyết định. Một quyết định kịp thời, đúng đắn sẽ đẩy
công tác quản lý nói chung tiến triển tốt. Do đó việc nghiên cứu và tìm ra một
phương pháp có tính chất tương đối phổ biến cho các dạng quyết định là công việc
của hệ trợ giúp quyết định mà ta sẽ đề cập tới trong đề tài này.
C u c điều hành IT
Phần mềm và ng ng
Đích chiến lược và yêu cầu kinh oanh
Mạng và các hệ hống
Tổ ch c ngư i ng và ợ gi p
Chuẩn và chính sách IT
Quản ị và an oàn hệ hống
Mô hình ữ liệu hống nh
Hình 1.1. Hệ thống thông tin xí nghiệp
1.2. Hệ trợ giúp ra quyết định
1.2.1. Quyết định
1.2.1.1. Khái niệm về quyết định
Đó là một lựa chọn về “đường lối hành động” (Simon 1960; Costello &
Zalkind 1963; Churchman 1968), hay “chiến lược hành động” (Fishburn 1964) dẫn
đến một mục tiêu mong muốn” (Churchman 1968).
“Một quá trình lựa chọn có ý thức giữa hai hay nhiều phương án để chọn ra
một phương án tạo ra được kết quả mong muốn trong các điều kiện ràng buộc đã
biết”.
1.2.1.2. Hiểu rõ thêm về ra quyết định
Việc đưa ra quyết định đối với một vấn đề xuất hiện trong khắp các lĩnh vực,
5
hoạt động của đời sống mà đôi khi chúng ta không nhận ra. Từ những việc đơn giản
như chọn một bộ quần áo để đi dự tiệc cho đến các công việc lớn lao như phân bố
ngân sách vào các chương trình của quốc gia đều là các công việc đưa ra quyết
định.
Vậy đưa ra quyết định chính là chọn ra trong các giải pháp khả thi một giải
pháp mà theo người đưa ra quyết định là phù hợp nhất.
1.2.2. Quá trình ra quyết định
1.2.2.1. Phân loại quyết định
Có thể phân ra bốn loại quyết định như sau [2]:
1. Quyết định có cấu trúc (Structured Decision): Các quyết định mà
người ra quyết định biết chắc chắn đúng. Ví dụ: Bài toán quyết định
thưởng, phạt Nhân viên.
2. Quyết định không có cấu trúc (NonStructured Decision): Các quyết
định mà người ra quyết định biết là có nhiều câu trả lời gần đúng và
không có cách nào để tìm ra câu trả lời chính xác nhất. Ví dụ: Bài
toán quyết định chiến lược phát triển của Nhà trường.
3. Quyết định đệ quy (Recurring Decision): Các quyết định lặp đi lặp lại.
4. Quyết định không đệ quy (Nonrecurring Decision): Các quyết định
không xảy ra thường xuyên.
1.2.2.2. Các giai đoạn của quá trình ra quyết định
Theo Simon [5], quá trình ra quyết định và quan hệ giữa chúng được giới
thiệu ở hình dưới đây:
Giai đoạn thứ nhất là nhận định (Intelligence): Tìm kiếm các tình
huống dẫn đến việc phải ra quyết định, nhận dạng các vấn đề, nhu
cầu, cơ hội, rủi ro.
6
Thực ế
Pha trí tuệ
Các m c iêu về ổ ch c
Tìm kiếm và quế các hủ c
Thu hập ữ liệu
Xác định v n đề
Xác định sở hữu của v n đề
Phân loại các v n đề
Phá biểu các v n đề
Pha thiết kế
Tạo mô hình
Thiế lập iêu chí lựa chọn
Tìm kiếm các phướng án hay hế
Dự đoán và đo kế quả a
Pha lựa chọn
Giải pháp cho mô hình
Phân ích nhạy cảm
Chọn phương án ố nh
Lên kế hoạch cài đặ
Đơn giản hóa
Các giả hiế
Kiểm ch ng mô hình
Thử nghiệm, kiểm a
giải pháp đề xu
Phá biểu v n đề
Các giải pháp hay hế
Cài đặ giải pháp
Giải pháp
Thành công
Không thành công
Hình 1.2. Các giai đoạn của quá trình ra quyết định
Giai đoạn thứ hai là thiết kế (Design): Phân tích các hướng tiếp cận để giải
quyết vấn đề, đáp ứng các nhu cầu, tận dụng các cơ hội, hạn chế các rủi ro.
Giai đoạn thứ ba là lựa chọn (Choice): Cân nhắc và đánh giá từng giải pháp
và chọn giải pháp tối ưu.
Cuối cùng là tiến hành ra quyết định (Implementation): Thực hiện giải pháp
được chọn, theo dõi kết quả và điều chỉnh khi thấy cần thiết.
1.2.2.3. Tìm kiếm và đánh giá các lựa chọn một phần rất quan trọng trong
trợ giúp ra quyết định.
Giai đoạn lựa chọn (Choice Phase) là giai đoạn quan trọng nhất của quá trình
ra quyết định. Giai đoạn này bao gồm ba bước chính sau đây:
1. Tìm kiếm lựa chọn
2. Đánh giá lựa chọn
3. Giới thiệu lựa chọn
Trong trường hợp này người ra quyết định muốn sử dụng mô hình quy chuẩn
để tìm kiếm một lựa chọn tối ưu, thì Hệ trợ giúp có thể sử dụng phương pháp vét
cạn để duyệt hết các lựa chọn hay mô hình toán học để phân tích.
Đối với mô hình mô tả, ta có thể sử dụng phương pháp kinh nghiệm
(Heuristic search) để duyệt các lựa chọn dựa trên các quy luật rút ra từ thử và sai
hay kinh nghiệm.
7
Phương pháp đáng giá các lựa chọn được quy định khác nhau trong bài toán
một mục tiêu và bài toán đa mục tiêu. Bài toán một mục tiêu có thể được mô hình
hóa bằng bảng ra quyết định hay cây quyết định.
Một trong các phương pháp hiệu quả để giải quyết đa mục tiêu là đo lường
trọng số của các ưu tiên ra quyết định (Analytical Hierarechy press of Expert
choice). Một phương pháp khác là tối ưu hóa dựa trên các mô hình toán học tuyến
tính (Microsoft Excel, Lingo…). Một phương pháp khác là lập trình kinh nghiệm sử
dụng Heuristics như là tabu search, giải thuật di truyền.
1.3. Hệ trợ giúp quyết định
1.3.1. Khái niệm hệ trợ giúp quyết định
Trong thập niên 1970, Scott Norton đưa những khái niệm đầu tiên về hệ trợ
giúp quyết định (Decision Support System, DSS). Ông định nghĩa “DSS là các hệ
dựa trên máy tính, có tính tương tác, giúp các nhà ra quyết định dùng dữ liệu và mô
hình để giải các bài toán phi cấu trúc, những bài toán mờ, phức tạp với lời giải
không hoàn chỉnh”.
Cho đến nay chưa có một định nghĩa thống nhất về DSS. Tuy nhiên tất cả
đều đồng ý mục đích cơ bản nhất của DSS là trợ giúp và cải tiến việc ra quyết định.
1.3.2. Các thành phần của hệ trợ giúp quyết định
Một hệ trợ giúp quyết định gồm có ba thành phần chính:
1. Quản lý dữ liệu
2. Quản lý mô hình
3. Quản lý giao diện người dùng
Cạnh anh
Ngân hàng
Cổ đông
Nhà cung c p
Điều kiện khí hậu
Khách hàng
Chính quyền
Biên hệ thống
Môi trường
Đầu vào :
Vậ liệu hô
Giá
Tài nguyên
Các quá trình :
Thủ c
Chương ình
Công c
Hoạ động
Quyế định
Đầu ra :
Hiệu năng
Hậu quả
Sản phẩm cuối
Phân phối ịch v
Người ra quyết định
Phản hồi
Hình 1.3. Hệ thống ra quyết định và môi trường của nó
8
Quản lý dữ liệu (Data Management): Thực hiện công việc lưu trữ các thông
tin của hệ và phục vụ cho việc lưu trữ, cập nhật, truy vấn thông tin.
Quản lý mô hình (Model Management) hay còn gọi là hệ quản trị cơ sở mô
hình (MBMS, model base management system): bao gồm các mô hình ra quyết định
(DSS models) và việc quản lý các mô hình này. Một số ví dụ của các mô hình này
bao gồm: mô hình nếu thì, mô hình tối ưu, mô hình tìm kiếm mục đích, mô hình
thống kê.
Quản lý giao diện người dùng giúp người sử dụng giao tiếp với và ra lệnh
cho hệ thống. Các thành phần vừa kể trên tạo nên HHTQĐ, có thể kết nối với
intranet/extranet của tổ chức hay kết nối trực tiếp với Internet.
1.3.3. Mô hình ra quyết định
Một đặc trưng cơ bản của hệ trợ giúp ra quyết định là phải có ít nhất một mô
hình trợ giúp ra quyết định. Việc chọn lựa và xây dựng mô hình nằm trong giai
đoạn thứ 2 (Design Phase) của quá trình ra quyết định.
Mô hình là một khái quát hóa hay trừu tượng hóa các vấn đề thực tế thành
các mô hình định tính hay định lượng. Đó là một quy trình kết hợp cả khoa học (sự
chính xác, logic) và nghệ thuật (sự sáng tạo).
Một mô hình gồm ba thành phần cơ bản:
1. Decision Variables: Đây là các lựa chọn xác định bởi người ra quyết
định. Chẳng hạn trong bài toán quyết định thưởng phạt nhân viên …
2. Uncontrollable Variables: Đây là các biến không nằm trong sự kiểm
soát của người ra quyết định (bị tác động bởi các yếu tố bên ngoài).
Chẳng hạn trong bài toán trên thì đây là…
3. Result Variables: Đây là biến kết quả của mô hình. Chẳng hạn trong
bài toán trên đây…
Các mối quan hệ oán học
Các biến kế quả
Các biến quyế định
Các biến không
điều khiển được
Hình 1.4. Cấu trúc chung của mô hình định lượng
9
Khi lựa chọn quyết định cuối cùng, người ra quyết định có thể muốn có một
quyết định tối ưu hay một quyết định thỏa đáng, phần tối ưu. Do vậy có thể chia ra
hai loại mô hình trợ giúp ra quyết định.
1. Mô hình quy chuẩn (Normative Model): Mô hình này xem xét tất cả
các phương án và chọn ra phương án tối ưu.
2. Mô hình mô tả (Desscriptive Model): Mô hình xem xét một tập hợp
các điều kiện theo ý người dùng và xem xét các phương án theo các
điều kiện này và đưa ra một kết quả thỏa đáng. Vì mô hình này không
xem xét hết tất cả các phương án nên kết quả cuối cùng chỉ gần tối ưu.
Mô hình quy chuẩn thường được sử dụng trong bài toán tối ưu hóa một mục
tiêu. Mô hình mô tả thường được sử dụng trong bài toán tối ưu hóa đa mục tiêu khi
các mục tiêu này có thể mâu thuẫn nhau.
1.3.4. Phân loại hệ trợ giúp ra quyết định
Hệ trợ giúp ra quyết định được phân loại dựa trên nhiều tiêu chí. Hiện nay,
vẫn chưa có cách phân loại thống nhất. Sau đây là hai cách phổ biến nhất.
Theo [2] có tất cả năm loại hệ trợ giúp ra quyết định
1. Hướng giao tiếp (Communication, Driven DSS);
2. Hướng dữ liệu (Data, Driven DSS);
3. Hướng tài liệu (Document, Driven DSS);
4. Hướng tri thức (Knowledge, Driven DSS);
5. Hướng mô hình (Model, Driven DSS).
Hướng giao tiếp : Hệ trợ giúp ra quyết định sử dụng mạng và công nghệ viễn
thông để liên lạc và cộng tác. Công nghệ viễn thông bao gồm mạng cục bộ (LAN),
mạng diện rộng (WAN), Internet, ISDN, mạng riêng ảo…. là then chốt trong việc
trợ giúp ra quyết định. Các ứng dụng của Hệ trợ giúp ra quyết định hướng giao tiếp
là Phần mềm nhóm (Group ware), hội thảo từ xa (Videoconferencing), bản tin
(Bulletin Boards) …
10
Nguồn ữ liệu ong
Nguồn ữ liệu ngoài
T ích ữ liệu
Tài chính
Tiếp hị
Sản xu
Nhân sự
…
Cơ sở ữ liệu ợ gi p quyế định
Hệ quản trị cơ sở dữ liệu
Tìm kiếm
Cập nhậ
Tạo báo cáo
Tiện nghi
hỏi dữ liệu
Từ điển ữ liệu
Cơ sở i h c
về ổ ch c
Dữ liệu iêng, cá nhân
Kho ữ liệu của ổ ch c
Quản ị giao iện
Quản ị mô hình
Hệ hống con ựa
ên i h c
Hình 1.5. Mô hình khái niệm của DSS
Hướng dữ liệu, Hệ trợ giúp ra quyết định dựa trên truy xuất và xử lý dữ liệu.
Phiên bản đầu tiên được gọi là Hệ chỉ dành cho việc truy xuất dữ liệu (Retrieval,
Only DSS). Kho dữ liệu (Data warehoure) là cơ sở dữ liệu tập trung chứa thông tin
từ nhiều nguồn đồng thời sẵn sàng cung cấp thông tin cần thiết cho việc ra quyết
định. OLAP có nhiều tính năng cao cấp. Ví dụ dữ liệu vật tư cần phải phân cấp theo
nhiều chiều như theo trình độ học vấn, số năm công tác, theo người làm việc…
Hướng tài liệu, Hệ trợ giúp ra quyết định dựa trên việc truy xuất và phân tích
các văn bản, tài liệu…. Trong một đơn vị, có rất nhiều văn bản như các công văn đi,
đến, nội bộ, giấy tờ… Internet cho phép truy xuất các kho tài liệu lớn như kho văn
bản, hình ảnh, âm thanh.. Một công cụ tìm kiếm hiệu quả là phần quan trọng đối với
Hệ trợ giúp ra quyết định dạng này.
Hướng tri thức, Hệ trợ giúp ra quyết định có thể đề nghị và đưa ra những tư
vấn cho người ra quyết định. Những hệ này là các hệ chuyên gia với một kiến thức
chuyên ngành cụ thể, nắm vững các vấn đề trong chuyên ngành đó và có kỹ năng để
giải quyết những vấn đề này. Các công cụ khai mở dữ liệu có thể dùng để tạo ra các
hệ dạng này.
11
Theo Holsapple và Whinston (1996) [6] phân ra 6 loại Hệ trợ giúp ra quyết
định.
1. Hướng văn bản (Text, Oriented DSS);
2. Hướng cơ sở dữ liệu (Database, Oriented DSS);
3. Hướng bảng tính (Spreasheet, Oriented DSS);
4. Hướng người giải quyết (Solver, Oriented DSS);
5. Hướng luật (Rule, Oriented DSS);
6. Hướng kết hợp (Compound DSS).
Hướng văn bản, Thông tin (bao gồm dữ liệu và kiến thức) được lưu trữ dưới
dạng văn bản. Vì vậy hệ thống đòi hỏi lưu trữ và xử lý văn bản một cách hiệu quả.
Các công nghệ mới như quản lý văn bản một cách hiệu quả. Các công nghệ mới
như hệ quản lý văn bản dựa trên Web, Interlligent Agents có thể được sử dụng cùng
với hệ này.
Hướng cơ sở dữ liệu, Cở sở dữ liệu đóng vai trò chủ yếu trong hệ này. Thông
tin trong cơ sở dữ liệu thường có cấu trúc chặt chẽ, các mô tả rõ ràng. Hệ này cho
phép người dùng truy vấn thông tin dễ dàng và rất mạnh về báo cáo.
Hướng bảng tính, Một bản tính là một mô hình để cho phép người dùng thực
hiện việc phân tích trước khi ra quyết định. Bản tính bao gồm nhiều mô hình thống
kê, lập trình tuyến tính… Bản tính phổ biến nhất Mircrosoft Excel. Hệ này được
dùng rông rãi trong các hệ liên quan tới người dùng cuối.
Hướng người giải quyết, Một trợ giúp là một giải thuật hay chương trình để
giải quyết một vấn đề cụ thể chẳng hạn như tính lượng hàng đặt tối ưu hay tính toán
xu hướng bán hàng. Một số trợ giúp khác phức tạp như tối ưu hóa đa mục tiêu. Hệ
này bao gồm nhiều trợ giúp như vậy.
Hướng luật, Kiến thức của hệ này được mô tả các quy luật thủ tục hay lý lẽ.
Hệ này gọi là hệ chuyên gia. Các quy luật này có thể định tính hay định lượng. Các
ví dụ của hệ này như là hướng dẫn không lưu, hướng dẫn giao thông trên biểu, trên
bộ…
Hướng kết hợp, Một hệ tổng hợp có thể kết hợp hai hay nhiều trong số năm
kể trên.
1.3.5. Năng lực của hệ trợ giúp quyết định
Năng lực của DSS, người ta thấy:
Cung cấp trợ giúp cho người ra quyết định trong những tình huống
không cấu trúc và nửa cấu trúc. Những tình huống này không thể
12
giải quyết bằng các hệ thống tính toán khác.
Sự trợ giúp được cung cấp cho các mức quản lý khác nhau từ người
thực thi đến các nhà quản lý.
Sự trợ giúp cho cá nhân và cho cả nhóm
DSS trợ giúp cho các giai đoạn của quá trình ra quyết định: Giai
đoạn trí tuệ, thiết kế, lựa chọn và cài đặt.
DSS trợ giúp cho sự đa dạng của quá trình ra quyết định và các kiểu
quyết định. Có sự phù hợp giữa DSS và tính cách của cá nhân người
ra quyết định, như từ vựng và kiểu ra quyết định.
DSS thích nghi và mềm dẻo. Do vậy người dùng có thêm xóa, kết
hợp. thay đổi hoặc sắp đặt lại các phần tử cở bản để DSS có thể cung
cấp sự trả lời nhanh chóng cho những tình huống không mong đợi.
DSS dễ sử dụng, người dùng cảm thấy thoải mái đối với hệ thống do
DSS thân thiện dùng, mềm, dẻo, những khả năng đồ họa mạnh và có
ngôn ngữ giao diện người và máy thích hợp.
DSS cố gắng nâng cao hiệu quả của quá trình ra quyết định, chẳng
hạn như đúng đắn, chính xác, thời gian và chất lượng…
Người ra quyết định điều khiển toàn bộ các bước của quá trình ra
quyết định trong việc giải quyết các bài toán. DSS hướng vào sự trợ
giúp chứ không thay thế những người ra quyết định. Người ra quyết
định có thể bỏ qua lời khuyên của máy tính vào bất kỳ giai đoạn nào
trong quá trình xử lý.
DSS thường sử dụng các mô hình cho sự phân tích các tình huống ra
quyết định. Khả năng mô hình hóa cho phép thí nghiệm với những
chiến lược khác nhau và với những cấu hình khác nhau.
DSS ở mức cao được trang bị thành phần trí thức, do vậy nó cho
phép những giải pháp tiềm năng và hiệu quả để giải quyết những bài
toán khó.
13
Hình 1.6. Thí dụ về DSS và EIS
1.3.6. Phân tích “What-if”
Một người làm mô hình tạo ra những dự đoán và những giả định để đánh giá
dữ liệu vào. Công việc này nhiều khi để đánh giá tương lai không chắc chắn. Khi
mô hình được giải quyết, các kết quả tất nhiên phụ thuộc vào những dữ liệu này.
Phân tích nhạy cảm cố gắng kiểm tra sự tác động của những sự thay đổi của dữ liệu
vào trên những giải pháp được đề nghị (các biến kết quả). Kiểu của phân tích nhạy
cảm được gọi là phân tích “What – if”, bởi vì nó được cấu trúc như là “Điều gì xảy
ra cho giải pháp nếu biến vào, giả thiết, hoặc giá trị của tham số được thay đổi”.
Nếu giao diện người sử dụng phù hợp thì các nhà quản lý dễ hỏi máy tính những
câu hỏi kiểu như thế này. Hơn nữa họ có thể nhắc lại những câu hỏi và thay đổi tỷ
lệ, hoặc thay đổi bất kỳ dữ liệu nào khác trong câu hỏi.
Hình 1.7 Thí dụ về chức năng what-if để phân tích dữ liệu và phân tích nhân quả trong
phần mềm Excel
14
1.4. Quá trình ứng dụng tin học trong các bài toán phi cấu trúc
1.4.1. Bài toán phi cấu trúc
Bài toán phi cấu trúc là bài toán không có thuật toán (tức là không có lời giải
chính xác trên máy tính điện tử) mà dùng máy tính điện tử để trợ giúp một số phần
việc.
Hệ trợ giúp quyết định cơ bản trợ giúp các nhà ra quyết định trong các tình
huống nửa cấu trúc và phi cấu trúc bằng cách kết hợp phán xử của con người và xử
lý thông tin bằng máy tính. Các bài toán như vậy không thể/không thuận tiện giải
quyết được chỉ bằng các công cụ máy tính hóa hay các phương pháp định lượng.
1.4.2. Loại bài toán phi cấu trúc
Loại bài toán đó là loại bài toán quản lý và ra quyết định
1.4.2.1. Quản lý
Công việc quản lý về cơ bản là quá trình ra quyết định, tức lựa chọn các
phương án .
quyÕ
t ®
Þ
nh
thùc hiÖ
n
tiÕ
p tôc thùc hiÖ
n vµ
thu thËp th«ng tin
kiÓ
m tra kÕ
t qu¶
hoµn toµn tho¶ m· n
Lóc xem xÐ
t
§ óng
Sai
§ óng
Sai
quyÕ
t ®
Þ
nh mí i
Hình 1.8. Chức năng quản lý
Theo Herbert A.Simon, 1960, quản lý là ra quyết định. Quản lý được mô tả
như chu trình liên tục các quyết định và kiểm tra, xem xét.
Đối với khoa học người ta có khái niệm: Khoa học quản lý gồm việc áp dụng
15
phương pháp khoa học để giải quyết vấn đề của hệ thống người – máy, dùng đo định
lượng có hiệu quả. Giải pháp gồm các hoạt động được liệt kê.
Một số lĩnh vực được kể đến, liên quan đến DSS: (i) tối ưu; (ii) điều khiển
tác nghiệp; (iii) trợ giúp quyết định.
1.4.2.2. Ra quyết định
Ra quyết định ở một quá trình lựa chọn có ý thức giữa hai hoặc nhiều
phương án để chọn ra một phương án này sẽ tạo ra một kết quả mong muốn trong
các điều kiện ràng buộc đã biết.
Các loại ra quyết định trong quản lý gồm có hai loại:
Ra quyết định theo chương trình : Nhằm giải quyết các bài toán cấu trúc tốt,
lặp đi lặp lại các phương án hầu như có sẵn, lời giải thường dựa trên các kinh
nghiệm. Thường để giải quyết bài toán dạng này, các nhà quản lý lập ra các quy
trình, luật hay chính sách.
Quy trình (Procedure): Bao gồm một chuỗi các bước có liên
quan nhau mà người ra quyết định có thể sử dụng để xử lý các
bài toán cấu trúc tốt.
Luật (Rule): Là phát biểu cụ thể hướng dẫn người ra quyết định
nên làm điều gì và không nên làm điều gì.
Chính sách (Policy): Là các hướng dẫn để định hướng cho người
ra quyết định trong việc giải quyết vấn đề. Khác với luật, chính
sách thường là những khái niệm chung chung để người ra quyết
định tham khảo hơn là những điều buộc người ra quyết định phải
làm.
Ra quyết định không theo chương trình :
Nhằm giải quyết các bài toán cấu trúc kém, các vấn đề mới, đơn
chiếc không lặp đi lặp lại, thông tin không rõ ràng.
Trong thực tế có nhiều bài toán ở dạng trung gian giữa hai loại
vấn đề trên.
Ra quyết định theo tính chất của vấn đề
Theo tính chất của vấn đề, có thể chia quyết định làm ba loại:
1. Ra quyết định trong điều kiện chắc chắn (cetainty): Khi ra quyết
định đã biết chắc chắn trạng thái nào sẽ xảy ra, do đó sẽ dễ dàng
và nhanh chóng ra quyết định.
2. Ra quyết định trong điều kiện rủi ro (risk): Khi ra quyết định đã
16
biết được xác suất xảy ra ở mỗi trạng thái.
3. Ra quyết định trong điều kiện không chắc chắn (uncertainty): Khi
ra quyết định, không biết được xác suất xảy ra của mỗi trạng thái
hoặc không biết được các dữ liệu liên quan đến các vấn đề cần giải
quyết.
Quá trình ra quyết định: Quá trình ra quyết định gồm có một số vấn đề sau:
Hệ thống mục tiêu và môi trường;
Dự kiến giải pháp;
Các kĩ thuật tìm giải pháp;
Các hoạt động sau khi có giải pháp.
1.5. Cây quyết định
1.5.1 Khái niệm về cây quyết định
Trong những năm qua, nhiều mô hình phân lớp dữ liệu đã được các nhà
khoa học trong nhiều lĩnh vực khác nhau đề xuất như mạng notron, mô hình thông
kê tuyến tính, hay bậc hai, cây quyết định, mô hình di truyền. Trong số những mô
hình đó, cây quyết định với những ưu điểm của mình được đánh giá là một công
cụ mạnh, phổ biến và đặc biệt thích hợp cho data mining nói chung và phân lớp
dữ liệu nói riêng. Có thể kể ra những ưu điểm của cây quyết định như: xây dựng
tương đối nhanh; đơn giản, dễ hiểu. Hơn nữa các cây có thể dễ dàng được chuyển
đổi sang các câu lệnh SQL để có thể được sử dụng để truy nhập cơ sở dữ liệu
một cách hiệu quả. Cuối cùng, việc phân lớp dựa trên cây quyết định đạt được
sự tương tự và đôi khi là chính xác hơn so với các phương pháp phân lớp khác.
Cây quyết định là biểu đồ phát triển có cấu trúc dạng cây, như mô tả
trong hình vẽ sau:
17
Hình 1.9 Ví dụ về cây quyết định
Trong cây quyết định:
Gốc: là nút trên cùng của cây;
Nút trong: biểu diễn một kiểm tra trên một thuộc tính đơn (hình
chữ nhật) ;
Nhánh: biểu diễn các kết quả của kiểm tra trên nút trong (mũi
tên) ;
Nút lá: biểu diễn lớp hay sự phân phối lớp (hình tròn) .
Để phân lớp mẫu dữ liệu chưa biết, giá trị các thuộc tính của mẫu được
đưa vào kiểm tra trên cây quyết định. Mỗi mẫu tương ứng có một đường đi từ
gốc đến lá và lá biểu diễn dự đoán giá trị phân lớp mẫu đó.
1.5.2 Một số vấn đề khi sử dụng cây quyết định
Các vấn đề đặc thù trong khi học hay phân lớp dữ liệu bằng cây quyết
định gồm: xác định độ sâu để phát triển cây quyết định, xử lý với những thuộc tính
liên tục, chọn phép đo lựa chọn thuộc tính thích hợp, sử dụng tập dữ liệu đào tạo
với những giá trị thuộc tính bị thiếu, sử dụng các thuộc tính với những chi phí khác
nhau, và cải thiện hiệu năng tính toán. Sau đây sẽ đề cập đến những vấn đề chính
đã được giải quyết trong các thuật toán phân lớp dựa trên cây quyết định.
1.5.2.1 Đủ dữ liệu
Có thể hiểu đây là hiện tượng cây quyết định chứa một số đặc trưng riêng
của tập dữ liệu đào tạo, nếu lấy chính tập dữ liệu huấn luyện để thử lại mô hình