ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ VŨ THỊ PHƯƠNG THẢO
RA QUYẾT ĐỊNH VỚI THÔNG TIN KHÔNG CHẮC CHẮN BẰNG VIỆC ỨNG
DỤNG CÂY QUYẾT ĐỊNH LUẬN VĂN THẠC SĨ
LUẬN VĂN THẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS ĐỖ VĂN THÀNH Hà Nội - 2011
3
MỤC LỤC
MỞ ĐẦU 6
CHƯƠNG 1: TỔNG QUAN VỀ MÔ HÌNH CÂY QUYẾT ĐỊNH VÀ
THÔNG TIN KHÔNG CHẮC CHẮN 9
1.1 Tổng quan về mô hình cây quyết định 9
1.1.1 Giới thiệu cây quyết định 9
1.1.2 Các kiểu cây quyết định 12
1.1.3 Ưu điểm của cây quyết định 13
1.1.4 Nhược điểm của cây quyết định 13
1.1.5 Ứng dụng của cây quyết định 14
1.1.6 Xây dựng và ứng dụng cây quyết định 15
1.2 Tổng quan về thông tin không chắc chắn 22
1.2.1 Khái niệm 22
2.4.3 Căn cứ vào chủ trương, đường lối, chính sách phát triển kinh tế xã hội
của Đảng và Nhà nước 54
2.5 Kết luận chương 2 54
CHƯƠNG 3
RA QUYẾT ĐỊNH VỚI THÔNG TIN KHÔNG CHẮC CHẮN TRONG LẬP KẾ
HOẠCH SẢN XUẤT KINH DOANH DOANH NGHIỆP 56
3.1 Lược sử vấn đề nghiên cứu 56
3.2. Xác định vấn đề nghiên cứu 57
3.3. Dữ liệu phục vụ lập kế hoạch sản xuất kinh doanh của doanh nghiệp 58
3.3.1 Dữ liệu phục vụ lập kế hoạch sản xuất kinh doanh: 58
3.3.2 Đánh giá về kế hoạch sản xuất kinh doanh hiện nay của công ty 58
3.4. Ứng dụng mô hình cây quyết định trong công tác lập kế hoạch sản xuất
kinh doanh 63
3.3.1 Ứng dụng mô hình cây quyết định trong việc ra quyết định với thông
tin không chắc chắn 63
3.5. So sánh với cây quyết định khác 72
3.6 Kết luận chương 3 75
KẾT LUẬN 76
TÀI LIỆU THAM KHẢO 77
4
DANH MỤC HÌNH
Hình 1: Cây quyết định cho bài toán 10
Hình 2: Hàm Entropy của Shanon 11
Hình 3: Cây quyết định hỗ trợ ra quyết định 11
Hình 4: Phân loại tƣ duy của sự không chắc chắn 23.
Hình 5: Giá đỡ, nhân và biên của tập mờ 33
Hình 6: Cây quyết định cho bài toán ra quyết định trong điều kiện không
trọng là doanh nghiệp cần nắm bắt đầy đủ, kịp thời và xử lý, khai thác có hiệu quả các
thông tin liên quan đến hoạt động sản xuất kinh doanh của doanh nghiệp, đến thị
trƣờng tiêu thụ sản phẩm hàng hoá và dịch vụ do doanh nghiệp tạo ra.
Quá trình toàn cầu hoá và thông tin hoá diễn ra mạnh mẽ đã làm công tác lập kế
hoạch phát triển sản xuất kinh doanh doanh nghiệp ngày càng phức tạp. Trong quá
trình lập kế hoạch, các doanh nghiệp phải xử lý một số lƣợng rất lớn thông tin, trong
số đó có nhiều thông tin đƣợc biết không chắc chắn, để rút ra những tri thức mới và ra
quyết định từ những tri thức này. Nhƣ vậy ngày càng có nhiều thông tin với tốc độ
thay đổi rất nhanh để trợ giúp việc ra quyết định và ngày càng có nhiều câu hỏi mang
tính chất định tính cần phải trả lời dựa trên một khối lƣợng dữ liệu khổng lồ đã có, đặc
biệt trong đó có nhiều dữ liệu không chắc chắn.
Các phƣơng pháp quản trị và khai thác, phân tích dữ liệu truyền thống đã không
đáp ứng đƣợc thực tế bùng nổ của thông tin và dữ liệu, đòi hỏi phải có phƣơng pháp,
kỹ thuật mới để tổng hợp, lƣu trữ, xử lý và khai thác thông tin, dữ liệu. Lĩnh vực phát
hiện tri thức từ các cơ sở dữ liệu đã đƣợc hình thành, trong đó khai phá dữ liệu (data
mining) đƣợc xem là trung tâm của lĩnh vực nghiên cứu và ứng dụng này.
Hiện tại, ngƣời ta đã xây dựng đƣợc khá nhiều kỹ thuật khai phá dữ liệu nhƣ
phân cụm phân lớp dữ liệu, mạng nơtron, giải thuật di truyền, luật kết hợp, mạng
Bayes, Trong các kỹ thuật này cây quyết định đƣợc coi là công cụ mạnh và phổ biến
nhất, nó đặc biệt thích hợp cho những vấn đề khai phá dữ liệu nhằm hỗ trợ quá trình ra
quyết định.
Cây quyết định thực chất là công cụ hỗ trợ quyết định, có thể biểu diễn dữ liệu
phức tạp theo một cấu trúc đơn giản hơn rất nhiều dƣới dạng cây. Cây quyết định cũng
có thể đƣợc sử dụng để xử lý thông tin không chắc chắn.
Luận văn này nằm trong hƣớng khảo cứu, ứng dụng cây quyết định trong việc
xử lý thông tin không chắc chắn nhằm rút ra tri thức mới, phục vụ ra quyết định trong
quá trình lập kế hoạch phát triển sản xuất kinh doanh của doanh nghiệp.
Không kể các phần mở đầu, kết luận, mục lục, danh mục bảng, hình và tài liệu
tham khảo, luận văn gồm 3 chƣơng nội dung chính, trong đó:
9
CHƢƠNG 1: TỔNG QUAN VỀ MÔ HÌNH CÂY QUYẾT ĐỊNH VÀ
THÔNG TIN KHÔNG CHẮC CHẮN
Chƣơng này giới thiệu tổng quan về mô hình cây quyết định và thông tin không
chắc chắn. Luận văn trƣớc hết trình bày lý thuyết chung nhất về cây quyết định nhƣ
giới thiệu cây quyết định, phân loại, xây dựng và ứng dụng của cây quyết định. Sau đó
trình bày về thông tin không chắc chắn, gồm khái niệm cơ bản, các cách biểu diễn
thông tin không chắc chắn với lý thuyết xác suất, định lý Bayes, lý thuyết về yếu tố
chắc chắn Standford và tập mờ.
1.1 Tổng quan về mô hình cây quyết định
1.1.1 Giới thiệu cây quyết định
Trong lĩnh vực học máy, cây quyết định là một kiểu mô hình dự báo (predictive
model), nghĩa là một ánh xạ từ các quan sát về một sự vật/hiện tƣợng tới các kết luận
về giá trị mục tiêu của sự vật/hiện tƣợng
[3,12]
. Mỗi một nút trong (internal nút) tƣơng
ứng với một biến; đƣờng nối giữa nó với nút con của nó thể hiện một giá trị cụ thể cho
biến đó. Mỗi nút lá đại diện cho giá trị dự báo của biến mục tiêu, cho trƣớc các giá trị
của các biến đƣợc biểu diễn bởi đƣờng đi từ nút gốc tới nút lá đó. Kỹ thuật học máy
dùng trong cây quyết định đƣợc gọi là học bằng cây quyết định, hay chỉ gọi với cái tên
ngắn gọn là cây quyết định.
Học bằng cây quyết định là phƣơng pháp thông dụng trong khai phá dữ liệu.
Khi đó, cây quyết định mô tả một cấu trúc cây, trong đó, các lá đại diện cho các phân
loại còn cành đại diện cho các kết hợp của các thuộc tính dẫn tới phân loại đó. Một cây
quyết định có thể đƣợc học bằng cách chia tập hợp nguồn thành các tập con dựa theo
một kiểm tra giá trị thuộc tính. Quá trình này đƣợc lặp lại một cách đệ qui cho mỗi tập
con dẫn xuất. Quá trình đệ qui hoàn thành khi không thể tiếp tục thực hiện việc chia
tách đƣợc nữa, hay khi một phân loại đơn có thể áp dụng cho từng phần tử của tập con
dẫn xuất. Một bộ phân loại rừng ngẫu nhiên (random forest) sử dụng một số cây quyết
Quá trình xây dựng cây chủ yếu phụ thuộc vào việc chọn thuộc tính tốt nhất để
phân hoạch dữ liệu. Chọn thuộc tính phân hoạch tốt theo nghĩa, cho ra kết quả là cây
nhỏ nhất. Việc lựa chọn này dựa vào các heuristics: chọn thuộc tính sinh ra các nút
thuần khiết nhất.
Giải thuật học cây quyết định tiêu biểu C4.5 của Quinlan
[12]
sử dụng entropy của
Shannon để đánh giá sự hỗn loạn thông tin. Theo nhƣ hình 2, độ hỗn loạn đạt cực đại
khi phân phối xác suất của lớp bằng nhau (bài toán 2 lớp, thì giá trị 0.5). Nhƣng nếu tỉ
lệ dữ liệu đã biết là lệch nhau, chẳng hạn ta có 10% là lớp dƣơng (pos) và 90% là lớp
âm (neg), thì tại một nút khi phân hoạch, độ hỗn loạn nên đạt cực đại khi biết xác suất
của lớp dƣơng là 0.1 chứ không phải là 0.5. Đây là yếu điểm của việc dùng hàm
entropy khi xử lý dữ liệu không cân bằng về lớp, trong khi thực tế, dữ liệu thƣờng mất
cân bằng. Vì lý do đó những
11
Hình 2: Hàm entropy của Shannon
năm gần đây ngƣời ta tập trung nghiên cứu đề xuất thay thế hàm phân hoạch cây quyết
định entropy bằng bằng hàm khoảng cách Kolmogorov-Smirnov để xử lý tốt hơn cho
dữ liệu không cân bằng
[10-11]
.
Có thể nói cây quyết định đƣợc mô tả nhƣ là sự kết hợp của các kỹ thuật toán
chia thành 2 loại chính:
1.1.2.1 Cây hồi quy: ƣớc lƣợng các hàm giá có giá trị là số thực thay vì đƣợc sử
dụng cho các nhiệm vụ phân loại.
Giá trị thuộc tính liên tục A cần đƣợc rời rạc hóa trong cây quyết định. Với các
cách tiếp cận thông thƣờng: ta coi thuộc tính chỉ có một cách rời rạc trong khoảng [ -
∞,t] , [t,+∞] . Cần lựa chọn ngƣỡng t: để với mỗi trƣờng hợp của t tính toán độ tăng
thông tin của A do sự rời rạc của t. Chọn t với độ tăng thông tin lớn nhất (t có thể biến
đổi với các trƣờng hợp của A trên cây). Các giá trị của t đƣợc xem xét: giá trị của A
trong một số trƣờng hợp của dữ liệu
[3,8].
Nói cách khác với thuộc tính liên tục (thuộc tính dạng số) thì tập giá trị là
không xác định trƣớc. Chính vì vậy, trong quá trình phát triển cây, cần sử dụng kiểm
tra dạng nhị phân: value(A) ≤ θ. Với θ là hằng số ngưỡng đƣợc lần lƣợt xác định dựa
trên từng giá trị riêng biệt hay từng cặp giá trị liền nhau (theo thứ tự đã sắp xếp) của
thuộc tính liên tục đang xem xét trong tập dữ liệu
[8].
1.1.2.2 Cây phân loại
Nếu biến phụ thuộc nhận giá trị phân loại, tức giá trị biểu trƣng (symbol) đƣợc
sắp thứ tự. Chẳng hạn nhƣ: giới tính (nam hay nữ), kết quả của một trận đấu (thắng
hay thua), trình độ học lực (xuất sắc, giỏi, khá, trung bình, yếu) Khi đó các thuộc
tính có giá trị rời rạc
[3, 12].
Một cây quyết định phân loại là một mô hình phân loại (bộ phân loại) cho một
biến lớp T khi biết các thuộc tính A. Để phân lớp mẫu dữ liệu chƣa biết, giá trị các
thuộc tính của mẫu đƣợc đƣa vào kiểm tra trên cây quyết định. Mỗi mẫu tƣơng ứng có
một đƣờng đi từ gốc đến lá và lá biểu diễn dự báo giá trị phân lớp mẫu đó.
Ngoài hai loại trên, một cây quyết định có thể đƣợc thể hiện gọn nhƣ một sơ đồ
của các thuộc tính nhƣ lãi suất ngân hàng, tín dụng, ….
[3]
* Dễ xẩy ra lỗi khi có quá nhiều lớp
Một số cây quyết định chỉ thao tác với những lớp giá trị nhị phân dạng đúng/sai
hay chấp nhận/từ chối. Số khác lại có thể chỉ định các bản ghi vào một số lớp bất kỳ,
nhƣng dễ xảy ra lỗi khi số mẫu dùng để xây dựng mô hình ứng với một lớp là nhỏ.
Điều này xẩy ra càng thƣờng xuyên hơn với những cây có nhiều tầng hay có nhiều
nhánh trên một nút.
* Chi phí tính toán để xây dựng mô hình cây quyết định cao:
Quá trình phát triển cây quyết định đắt về mặt tính toán. Vì cây quyết định có
rất nhiều nút trong trƣớc khi đi đến lá cuối cùng. Tại từng nút, cần tính một độ đo (hay
tiêu chuẩn phân chia) trên từng thuộc tính, với thuộc tính liên tục phải thêm thao tác
14
xắp xếp lại tập dữ liệu theo thứ tự giá trị của thuộc tính đó. Sau đó mới có thể chọn
đƣợc một thuộc tính phát triển và tƣơng ứng là một phân chia tốt nhất. Một vài thuật
toán sử dụng tổ hợp có trọng số các thuộc tính kết hợp với nhau để phát triển cây quyết
định. Quá trình cắt cụt cây cũng “đắt” vì nhiều cây con ứng cử viên phải đƣợc tạo ra
và so sánh.
1.1.5 Ứng dụng của cây quyết định
Một trong những ứng dụng của cây quyết định là đƣợc sử dụng để phân lớp dữ
liệu. Tuy có nhiều kỹ thuật phân lớp khác đã đƣợc đề xuất nhƣ: phân lớp Bayes, phân
lớp K - hàng xóm gần nhất, mạng nơron, phân tích thống kê,…, nhƣng phân lớp cây
quyết định vẫn đƣợc coi là công cụ mạnh, phổ biến và đặc biệt thích hợp cho khai phá
dữ liệu
[4].
1.1.5.1 Sử dụng để phân lớp dữ liệu
Để phân lớp mẫu dữ liệu chƣa biết, giá trị các thuộc tính của mẫu đƣợc đƣa vào
kiểm tra trên cây quyết định. Mỗi mẫu tƣơng ứng có một đƣờng đi từ gốc đến lá và lá
1.1.5.2 Sử dụng trong các mô hình dự báo
Cây quyết định có thể xử lý tốt các thuộc tính có giá trị liên tục. Do đó có thể
đƣợc sử dụng để xây dựng mô hình với các hàm nhận giá trị liên tục.
Đối với hoạt động sản xuất kinh doanh doanh nghiệp, một mô hình dự báo cần
có khả năng dự báo đƣợc lƣợng tiền tiêu dùng của các khách hàng tiềm năng dựa trên
những thông tin về thu nhập và nghề nghiệp của khách hàng. Hay nhờ các luật về xu
hƣớng mua hàng của khách hàng trong siêu thị, thông qua mô hình dự báo các nhân
viên kinh doanh có thể ra những quyết sách đúng đắn về lƣợng mặt hàng cũng nhƣ
chủng loại bày bán. Cây quyết định thƣờng đƣợc ứng dụng trong phƣơng pháp (mô
hình) dự báo định lƣợng có khả năng dự báo nhƣ trên.
1.1.5.3 Sử dụng để biểu diễn các vấn đề ra quyết định
Dựa trên việc xử lý các thông tin thu thập đƣợc, cây quyết định đƣợc sử dụng
để biểu diễn các vấn đề ra quyết định. Khi đó cần chọn một mô hình toán học trong
phƣơng pháp định lƣợng để đánh giá vấn đề đó. Việc chọn lựa mô hình đƣợc dựa vào
sự hiểu biết, vào thông tin ít hay nhiều về khả năng xuất hiện các trạng thái của hệ
thống.
1.1.6 Xây dựng và ứng dụng cây quyết định
Xây dựng và ứng dụng cây quyết định là quá trình nhiều bƣớc gồm: tạo lập, cắt
tỉa cây quyết định, sau đó trích rút ra các luật, sử dụng các thủ tục suy diễn để rút ra tri
thức thu đƣợc. Sau đây luận văn trình bày về các quá trình trên.
1.1.6.1 Thủ tục tạo lập cây quyết định
Quá trình tạo cây quyết định gồm hai giai đoạn
[3, 12]
* Giai đoạn thứ nhất phát triển cây quyết định:
Giai đoạn này phát triển bắt đầu từ gốc, đến từng nhánh và phát triển quy nạp
theo cách thức chia để trị cho tới khi đạt đƣợc cây quyết định với tất cả các lá đƣợc
gán nhãn lớp.
Thuật toán xây dựng cây quyết định
Luận văn trình bày giải thuật quy nạp xây dựng cây quyết định ID3 (gọi tắt là
* ID3 xây dựng cây quyết định theo giải thuật sau:
Function induce_tree(tập_mẫu, tập_thuộc_tính)
begin
if mọi mẫu trong tập_mẫu đều nằm trong cùng một lớp
then
return một nút lá đƣợc gán nhãn bởi lớp đó
else if tập_thuộc_tính là rỗng then
return nút lá đƣợc gán nhãn bởi tuyển của tất cả các lớp trong
tập_mẫu else
begin
chọn một thuộc tính P, lấy nó làm gốc cho cây hiện tại;
xóa P ra khỏi tập_thuộc_tính;
với mỗi giá trị V của P
17
begin
tạo một nhánh của cây gán nhãn V;
Đặt vào phân_vùng
V
các ví dụ trong tập_mẫu có giá
trị V tại thuộc tính P;
Gọi induce_tree(phân_vùng
V
, tập_thuộc_tính), gắn
kết quả vào nhánh V
end
end
end
Sau khi xây dựng đƣợc cây quyết định, bƣớc tiếp theo là cắt tỉa nhánh của cây.
2
đo độ tƣơng quan giữa
từng thuộc tính và nhãn lớp. Sau đó lựa chọn thuộc tính có độ tƣơng quan lớn nhất
[1]
.
- Tăng thêm thông tin (Information gain)
[12]
: Khác với Gini-index, tiểu chuẩn
này sử dụng hàm entropy để đo độ bất định của một phân chia và lựa chọn thuộc tính
theo mức độ cực đại hóa chỉ số entropy. Các thuật toán sử dụng tiêu chuẩn này là ID3,
C4.5.
Khái niệm entropy của một tập S đƣợc định nghĩa trong Lý thuyết thông tin
[15]
là số lƣợng mong đợi các bít cần thiết để mã hóa thông tin về lớp của một thành viên
rút ra một cách ngẫu nhiên từ tập S. Trong trƣờng hợp tối ƣu, mã có độ dài ngắn nhất.
Theo lý thuyết thông tin, mã có độ dài tối ƣu là mã gán –log
2
(p(v)) bits cho thông điệp
có xác suất là p(v).
Entropy(S ) =
Vv
vpvp ))((log*)(
2
với V là tập các giá trị.
Trong trƣờng hợp S là tập mẫu, thì thành viên của S là một mẫu, mỗi mẫu thuộc
một lớp hay có một giá trị phân loại.
v
là
tập con của S chứa các mẫu có thuộc tính A mang giá trị v.
1.1.6.2 Ứng dụng trích rút luật từ cây quyết định
19
Tri thức trong cây quyết định có thể đƣợc chiết xuất và trình bày dƣới dạng các
luật phân loại IF-THEN. Một luật tƣơng ứng với một đƣờng đi từ gốc tới một nút lá.
Mỗi cặp thuộc tính - giá trị dọc theo đƣờng đi tạo thành một liên kết trong tiền đề luật
(IF), nút lá là lớp dự báo, thiết lập nên mệnh đề kết quả luật (THEN), các luật IF-
THEN là các tri thức thu đƣợc từ việc xây dựng cây quyết định.
Một luật có thể đƣợc tỉa bớt bằng cách gỡ bỏ một số điều kiện trong tiền đề luật
mà không làm ảnh hƣởng nhiều đến độ chính xác của luật. Đối với mỗi lớp, các luật
trong phạm vi một lớp có thể đƣợc sắp xếp theo độ chính xác của chúng. Do đó rất dễ
xảy ra hiện tƣợng một mẫu kiểm định sẽ không thỏa bất kỳ một tiền đề luật nào.
Ví dụ: Các luật đƣợc sinh ra từ cây quyết định ví dụ hình 3 là
IF „Nợ >n‟ THEN “Không cho vay”
IF „Nợ <n‟ AND „Thu nhập < T‟ THEN “Không cho vay”
IF „Nợ <n‟ AND „Thu nhập >T‟ THEN “Cho vay”
Các luật IF – THEN có các ƣu điểm sau đây:
- Mỗi luật IF – THEN mô tả một phần nhỏ tƣơng đối độc lập của tri thức.
- Có thể thêm và cơ sở tri thức các luật mới, hoặc loại bỏ một số luật cũ mà
không ảnh hƣởng nhiều tới các luật khác.
- Các hệ tri thức với cơ sở tri thức gồm các luật IF – THEN có khả năng đƣa ra
lời giải thích cho các quyết định của hệ.
Ngôn ngữ bao gồm các luật IF- THEN, là ngôn ngữ phổ biến nhất để biểu diễn
tri thức. Các câu Horn (mang tên nhà logic Alfred Horn, năm 1951) đƣợc viết dƣới
dạng: IF P
1
and and P
20
Luật suy diễn
Một công thức H đƣợc xem là hệ quả logic (logical consequence) của một tập
công thức G ={G
1
, ,G
m
} nếu trong bất kỳ minh họa nào mà {G
1
, ,G
m
} đúng thì H
cũng đúng, hay nói cách khác bất kỳ mô hình nào của G cũng là mô hình của H
[4]
.
Khi có một cơ sở tri thức, ta muốn sử dụng các tri thức trong cơ sở này để suy
ra tri thức mới mà nó là hệ quả logic của các công thức trong cơ sở tri thức. Điều đó
đƣợc thực hiện bằng cách sử dụng các luật suy diễn (rule of inference). Luật suy diễn
giống nhƣ một thủ tục mà chúng ta sử dụng để sinh ra một công thức mới từ các công
thức đã có. Một luật suy diễn gồm hai phần: một tập các điều kiện và một kết luận.
Các hệ tri thức mà cơ sở tri thức bao gồm các luật sẽ đƣợc gọi là các hệ dựa trên
luật. Một khi chúng ta đã lƣu trữ một cơ sở tri thức, chúng ta cần có thủ tục lập luận để
rút ra các kết luận từ cơ sở tri thức. Trong các hệ dựa trên luật, có hai phƣơng pháp
luận lập luận cơ bản: Lập luận tiến, và lập luận lùi
Lập luận tiến
Tƣ tƣởng cơ bản của lập luận tiến là áp dụng luật suy diễn Modus Ponens tổng
quát. Trong mỗi bƣớc của thủ tục lập luận tiến, ngƣời ta xét một luật trong cơ sở luật.
Đối sánh mỗi điều kiện của luật với các sự kiện trong cơ sở sự kiện, nếu tất cả các điều
kiện của luật đều đƣợc thoả mãn thì sự kiện trong phần kết luận của luật đƣợc xem là
sự kiện đƣợc suy ra. Nếu sự kiện này là sự kiện mới (không có trong bộ nhớ làm việc),
thuyết đã đƣa ra đƣợc xem là đúng. Ngƣợc lại, dù ta áp dụng luật nào để phát triển các
giả thuyết cũng dẫn tới các giả thuyết không có trong bộ nhớ làm việc và không thể
quy giả thuyết này về các giả thuyết mới khác, thì giả thuyết đã đƣa ra đƣợc xem là sai
Sau đây là thủ tục suy diễn lùi. Trong thủ tục này, Hyp và là các biến địa
phƣơng trong thủ tục. Giá trị ban đầu của Hyp là danh sách các giả thuyết ban đầu
(biểu diễn câu hỏi đƣợc đặt ra), còn giá trị ban đầu của là phép thế rỗng.
[4]
procedure Backward_Chaining (Hyp, );
begin
H giả thuyết đầu tiên trong danh sách Hyp;
for mỗi luật R = (Conds, Q) do
if H hợp nhất với Q bởi phép thế
1
then
1. Loại H khỏi danh sách Hyp;
2. Thêm các điều kiện của luật Conds vào danh sách Hyp;
3. áp dụng phép thế
1
vào các giả thuyết trong danh sách Hyp;
4. Lấy hợp thành của các phép thế và
1
để nhận đƣợc phép thế mới,
tức là
1
;
if Hyp = [ ] then cho ra
else Backward_Chaining (Hyp, );
end;
Trong thủ tục lập luận lùi, mỗi đƣợc cho ra là một phép thế biến làm cho giả
thuyết ban đầu trở thành đúng, tức là (Hyp) = H
sự kiện, hiện tƣợng mà về bản chất không thể mô tả chính xác chúng bởi các mô hình
đơn định. Tính không chắc chắn có thể xuất hiện do sự hiểu biết không đầy đủ về vấn
đề đang xét. Ngay cả khi có thể mô tả chính xác, đơn định một quá trình, một hiện
tƣợng tự nhiên-kinh tế-xã hội nào đó, nhƣng nếu mô tả đầy đủ và chính xác thì sẽ rất
phức tạp, độ phức tạp của tính toán, lập luận sẽ rất cao. Trong các trƣờng hợp đó, có
thể mô tả xấp xỉ bằng cách sử dụng tính không chắc chắn để đơn giản cho việc tính
toán, suy diễn.
Rủi ro là tình trạng không chắc chắn mà một số sự kiện, hiện tƣợng có thể phải
chịu những tác dụng không mong muốn hoặc bị thiệt hại đáng kể.
Trong hoạt động sản xuất kinh doanh doanh nghiệp, đo lƣờng rủi ro là một tập
hợp các phép đo sự không chắc chắn có thể gây ra những thiệt hại, và độ lớn của
những thiệt hại này cũng bao gồm mức lỗ trong các biến. Một cách khái quát đo lƣờng
rủi ro chỉ đơn giản là một phép đo của sự không chắc chắn cùng với chuyển nhƣợng bị
mất (hoặc thiệt hại) cho mỗi tình trạng không chắc chắn.
23
Trong đời sống thực, nhất là trong hoạt động sản xuất kinh doanh doanh nghiệp
nguyên tắc phân loại sự không chắc chắn còn bao gồm một ý nghĩa rộng hơn của sự
không chắc chắn, cụ thể nó còn đƣợc tiếp cận từ quan điểm đạo đức.
1.2.2 Phân loại sự không chắc chắn
Sự không chắc chắn có thể đƣợc chia thành các bộ phận đƣợc xác định rõ và
không rõ nét, gồm đối tƣợng và chủ thể không chắc chắn. Không chắc chắn cũng đƣợc
xác định có thể đƣợc phân tích với lý thuyết xác suất. Sự thiếu rõ ràng có thể đƣợc
chia thành đặc trƣng không và bất hòa. Đặc trƣng không thể đƣợc phân tích với lý
thuyết khả năng và bất hòa có thể đƣợc phân tích với bản thể học.
Nhận thức không chắc chắn
(epistemological uncertainty)
Bản thế không chắc chắn
(ontological uncertainty)
Đạo đức không chắc
chắn
( moral uncertainty)
Quy tắc không chắc chắn
(rule uncertainty)
Tri thức hƣớng dẫn quyết định
(knowledge guided decision)
Lý trí hƣớng dẫn quyết định
(Quasi-rational decision)
Quy tắc hƣớng dẫn quyết định
(rule guided decision)
Trực giác hƣớng dẫn quyết định
(intuition guiđe decision)
24
- Sự không chắc chắn đƣợc sử dụng thiết kế các trò chơi, đáng chú ý nhất là trò
chơi về cờ bạc, nơi mà “cơ hội” là trọng tâm trò chơi.
- Trong khoa học, dự báo các sự kiện trong tƣơng lai nên đƣợc hiểu là có một
loạt các giá trị dự kiến, giá trị không chắc chắn.
- Trong dự báo thời tiết hiện nay bao gồm dữ liệu về mức độ sự không chắc
chắn trong thông tin để dự báo thời tiết.
- Sự không chắc chắn thƣờng là một yếu tố quan trọng trong kinh tế. Theo nhà
kinh tế Frank Knight, nó là khác nhau từ nguy cơ, nơi có một xác suất cụ thể đƣợc gán
cho mỗi kết quả (nhƣ khi lật một đồng xu công bằng). Không chắc chắn liên quan đến
một tình huống có xác suất không rõ, trong khi xác suất ƣớc tính của các kết quả có
thể không cần phải thêm với sự thống nhất.