Mục lục
LỜI CẢM ƠN ..........................................................................................................................................1
LỜI CAM ĐOAN ....................................................................................................................................2
DANH MỤC CÁ C HÌNH VẼ: ...............................................................................................................3
DANH MỤC CÁ C BẢNG: .....................................................................................................................4
LỜI MỞ ĐẦU ..........................................................................................................................................5
CHƢƠNG I. CÁC KHÁI NIỆM CƠ BẢN. .........................................................................................7
1.
2.
Khái quát về thị trƣờng tài chính và hoạt động tín dụng tại Việt Nam .................................7
1.1.
Thị trƣờng tài chính ............................................................................................................7
1.2.
Hoạt động tín dụng..............................................................................................................9
1.3.
Kinh doanh ngân hàng..................................................................................................... 10
1.4.
Tín dụng ngân hàng ......................................................................................................... 11
Nghiệp vụ xếp hạng tín dụng trong Ngân hàng ..................................................................... 13
2.1.
2.2.
Khai phá dữ liệu:...................................................................................................................... 28
1.1.
Khái niệm .......................................................................................................................... 28
1.2.
Quá trình phát hiện tri thức ............................................................................................ 29
1.3.
Các dạng dữ liệu có thể khai phá .................................................................................... 29
1.4.
Các kỹ thuật khai phá dữ liệu ......................................................................................... 31
1.5.
Đán
1.6.
Cá p ƣơn p áp v kỹ thuật cải thiện độ chính xác phân lớp ................................... 47
1.7.
Ứng dụng........................................................................................................................... 50
iá iệu suất bộ phân lớp ...................................................................................... 38
.................................................................................................................................................................65
1.
Nạp dữ liệu xếp hạn đã ó ..................................................................................................... 66
2.
Xây dựng bộ phân lớp bằng công cụ Tree Bagger ................................................................ 68
3.
Phân lớp dữ liệu mới ................................................................................................................ 75
4.
Kiểm tra lại: đán
iá kết quả phân lớp ................................................................................ 78
4.1.
So sánh xếp hạng dự đoán v
ếp hạng thực tế ............................................................. 79
4.2.
So sánh xếp hạng thực tế và số vụ vỡ nợ tron năm tiếp theo ..................................... 83
CHƢƠNG IV. KẾT LUẬN .................................................................................................................89
Tôi xin cam đoan số liệu và kết quả nghiên cứu trong luận văn này là trung thực
và chưa hề được sử dụng để bảo vệ một học vị nào. Mọi sự giúp đỡ cho việc thực hiện
luận văn này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ
nguồn gốc rõ ràng và được phép công bố.
Hà Nội, ngày 24 tháng 10 năm 2016
Học viên
Nguyễn Thị Lan
2
DANH MỤC CÁ C HÌNH VẼ:
Hình 1. Mô hình thị trường tài chính
Hình 2. Mô hình hoạt động ngân hàng
Hình 3. Các chức năng của ngân hàng hiện đại
Hình 4. Quá trình Khai phá dữ liệu
Hình 5. Các lĩnh vực liên quan đến Khai phá dữ liệu
Hình 6. Bước học của quá trình phân lớp dữ liệu
Hình 7. Bước phân lớp của quá trình phân lớp dữ liệu
Hình 8. Quá trình đánh giá bộ phân lớp
Hình 9. Biểu đồ đường cong ROC
Hình 10. Biểu đồ đường cong ROC gồm 2 mô hình
Hình 11. Mô hình cây quyết định
Hình 12. Mô hình phương pháp quần thể
Hình 13. Sai số phân lớp với mỗi kích thước lá khác nhau
Hình 14. Mức độ quan trọng của thuộc tính
Hình 15. Sai số phân lớp với các tập biến độc lập khác nhau
Hình 16. So sánh xếp hạng dự đoán và thực tế
Hình 17. Biểu đồ chính xác tích lũy
Xuất phát từ việc muốn tìm hiểu thị trường tài chính, hoạt động tín dụng, ứng
dụng của cây quyết định, cùng với sự chỉ dẫn và giúp đỡ tận tình của TS. Vũ Văn
Thiệu, em đã chọn đề tài “Xây dựng phần mềm xếp hạng tín dụng trong ngân hàng sử
dụng cây quyết định”. Luận văn nghiên cứu về mô hình cây quyết định, một thành
phần quan trọng trong lý thuyết khai phá dữ liệu.
Nội dung luận văn gồm:
Chương 1. Các khái niệm cơ bản: trình bày khái quát về thị trường tài chính,
nghiệp vụ xếp hạng tín dụng trong ngân hàng.
Chương 2. Khai phá dữ liệu và Cây quyết định: khái quát về khai phá dữ liệu và
các kỹ thuật khai phá dữ liệu, trình bày khái quát về cây quyết định, các thuật toán xây
dựng cây quyết định.
5
Chương 3. Trình bày về việc xây dựng công cụ xếp hạng tín dụng trong ngân
hàng sử dụng cây quyết định.
6
CHƯƠNG I. CÁC KHÁI NIỆM CƠ BẢN.
1. Khái quát về thị trƣờng tài chính và hoạt động tín dụng tại Việt Nam
1.1.
Thị trƣờng tài chính
1.1.1
Khái niệm
7
Hình 1-Mô hình thị trƣờng tài chính
1.1.3 Chứ năn
a thị trƣờng tài chính
Thứ nhất, chức năng dẫn nguồn tài chính từ những chủ thể có khả năng cung
ứng nguồn tài chính đến những chủ thể cần nguồn tài chính:
-
Thị trường tài chính đóng vai trò là kênh dẫn vốn từ người tiết kiệm đến
người kinh doanh. Giúp cho việc chuyển vốn từ người không có cơ hội đầu tư sinh lợi
đến những người có cơ hội đầu tư sinh lợi.
-
Thị trường tài chính thúc đẩy việc tích lũy và tập trung tiền vốn để đáp
ứng nhu cầu xây dựng cơ sở vật chất kỹ thuật, sản xuất kinh doanh.
-
Thị trường tài chính giúp cho việc sử dụng vốn có hiệu quả hơn, không
chỉ đối với người có tiền đầu tư mà còn cả với người vay tiền để đầu tư.
-
Thị trường tài chính tạo điều kiện thuận lợi cho việc thực hiện các chính
cho vay. Trong thực tế, quan hệ tín dụng rất đa dạng, nhưng dù là dạng nào nó cũng là
một hoạt động quan trọng của thị trường tài chính hay nói rộng hơn là nền kinh tế hàng
hóa. Mục đích và tính chất của tín dụng là do mục đích và tính chất của nền kinh tế
hàng hóa quyết định. Sự vận động của tín dụng luôn chịu sự chi phối của các quy luật
kinh tế của phương thức sản xuất trong xã hội.
1.2.2 Đặ điểm c a hoạt động tín dụng
Tín dụng là quan hệ chuyển nhượng giá trị mang tính chất tạm thời: đó là sự
chuyển quyền sử dụng vốn cho người sử dụng trong một thời gian nhất định, còn
quyền sở hữu vốn vẫn thuộc về người sở hữu vốn. Trong thời hạn cho vay, người sở
9
hữu vốn không có quyền đòi lại vốn đã cho vay và khi hết thời hạn, người đi vay phải
trả lại số vốn đã vay cho người sở hữu vốn.
Đảm bảo tính hoàn trả về thời gian và giá trị: đây là đặc trưng cơ bản của quan
hệ tín dụng, vì khi hết thời hạn cho vay thì người đi vay phải hoàn trả cả gốc và lãi của
khoản vay. Do đó, tín dụng mang tính chất có hoàn trả nhưng không có ngang giá (vì
khoản tiền thu về lớn hơn khoản tiền cho vay lúc đầu).
Quan hệ tín dụng được xây dựng trên cơ sở sự tin tưởng giữa người đi vay và
người cho vay: Đây là điều kiện tiên quyết để thiết lập quan hệ tín dụng, vì chỉ khi có
sự tin tưởng thì mới diễn ra hoạt động cho vay. Có thể nói sự tin tưởng ở đây nghĩa là
người cho vay tin rằng người đi vay sẽ hoàn trả đầy đủ cả gốc và lãi cho mình.
1.2.3 Chứ năn
a hoạt động tín dụng
Trong nền kinh tế hàng hóa tiền tệ, tín dụng thực hiện ba chức năng cơ bản sau:
1, Chức năng tập trung và phân phối lại vốn tiền tệ theo nguyên tắc có hoàn trả.
2, Chức năng tiết kiệm tiền mặt.
11
cho khách hàng vay là mức lợi tức mà khách hàng phải trả trong suốt khoảng thời gian
tồn tại của khoản vay.
Chủ thể tham gia trong quan hệ tín dụng ngân hàng là ngân hàng, Nhà nước,
doanh nghiệp và hộ dân cư. Đối tượng được sử dụng trong quan hệ tín dụng là tiền, do
đó, nó không chịu sự giới hạn theo hàng hoá, vận động đa phương đa chiều. Đây chính
là ưu điểm nổi bật và là đặc điểm khác biệt giữa tín dụng ngân hàng với các loại hình
tín dụng khác.
1.4.2 Quy trình tín dụng ngân hàng
Việc xây dựng một quy trình có nhiều cách. Nếu xét theo các giai đoạn thì sơ đồ
tổng quát của quy trình này như sau:
Giai đoạn 1 (Từ đề nghị vay đến quyết định cho vay) gồm các bước:
-
Giới thiệu và lập hồ sơ yêu cầu cấp tín dụng.
-
Phân tích tín dụng.
-
Quyết định cho vay.
Giai đoạn 2 (Từ quyết định cho vay đến rút vốn) gồm các bước:
-
Nghiệp vụ xếp hạng tín dụng trong Ngân hàng
n qu n về ếp ạn t n ụn
Theo hãng xếp hạng tín dụng Standards & Poor, xếp hạng tín dụng là những ý
kiến đánh giá hiện tại về rủi ro tín dụng, chất lượng tín dụng, khả năng và thiện ý của
chủ thể đi vay trong việc đáp ứng các nghĩa vụ tài chính một cách đầy đủ và đúng hạn.
Còn theo hãng Moody's, xếp hạng tín dụng là những ý kiến đánh giá về chất lượng tín
dụng và khả năng thanh toán nợ của chủ thể đi vay dựa trên những phân tích tín dụng
cơ bản và biểu hiện thông qua hệ thống ký hiệu AAA-C. Như vậy, hệ thống chấm điểm
tín dụng và xếp hạng khách hàng là một quy trình đánh giá khả năng thực hiện các
nghĩa vụ tài chính của một khách hàng đối với một ngân hàng như việc trả lãi và trả
gốc nợ vay khi đến hạn hoặc các điều kiện tín dụng khác nhằm đánh giá, xác định rủi
ro trong hoạt động tín dụng của ngân hàng. Mức độ rủi ro tín dụng thay đổi theo từng
đối tượng khách hàng và được xác định thông qua quá trình đánh giá bằng thang điểm,
dựa vào các thông tin tài chính và phi tài chính có sẵn của khách hàng tại thời điểm
chấm điểm tín dụng và xếp hạng khách hàng.
2.1.1 Hệ thống ký hiệu xếp hạng tín dụng
Hệ thống xếp hạng tín dụng doanh nghiệp được các tổ chức sử dụng thường bao
gồm 9 cấp độ có mức độ rủi ro giảm dần từ AAA đến C được thể hiện trong bảng sau:
13
Bảng 1 - Hệ thống ký hiệu xếp hạng tín dụng
AAA+
AAA-
DN(doanh nghiệp) có tiềm DN có tiềm lực tài chính mạnh, có
Loại
và ổn định, không chịu sức tốt, có rủi ro nhất định từ môi trường
tốt
ép về cạnh tranh và rủi ro từ kinh doanh và từ cạnh tranh. Rủi ro
ngành kinh tế. Rủi ro tương trung bình.
đối thấp.
BBB
BBB
Loại
khá
BBB-
DN hoạt động đạt hiệu quả, DN hoạt động đạt hiệu quả nhưng vẫn
duy trì ổn định, khả năng trả còn hạn chế nhất định về tiềm lực tài
nợ trung bình. Rủi ro trung chính. Rủi ro trung bình.
bình.
BB
Loại
BB+
trung
DN khả năng tự chủ tài chính DN khả năng tự chủ tài chính thấp.
bình
thấp. Rủi ro tương đối.
Khả năng trả nợ thấp. Rủi ro cao.
CCC+
CCC-
B-
Loại
DN khả năng cạnh tranh và DN khả năng cạnh trạnh và năng lực
trung
năng lực quản lý kém do gặp quản lý kém. Lịch sử vay và trả nợ
bình
khó khăn nhất định từ môi chưa tốt. Rủi ro rất cao.
yếu
thấp, năng lực quản lý yếu lực quản lý yếu kém. Có dấu hiệu phá
kém
kém. Có vấn đề về pháp lý. sản do có liên quan đến pháp luật. Rủi
Rủi ro rất cao.
ro rất cao.
(Nguồn: mẫu báo cáo xếp hạng tín dụng doanh nghiệp của trung tâm thông tin tín
dụng quốc gia Việt Nam CIC)
15
Bảng 2 - Quyết định cấp tín dụng c a ngân hàng dựa trên thứ hạng khách hàng
ứ
ạn
Cấp t n ụn
AAA
Đáp ứng tối đa nhu cầu tín dụng
AA
Đáp ứng tối đa nhu cầu tín dụng
A
có hoạt động vay vốn tại các ngân hàng thương mại như các thông tin tài chính từ báo
cáo tài chính của doanh nghiệp, các thông tin phi tài chính (kinh nghiệm quản lý, môi
trường kiểm soát nội bộ, sự phụ thuộc vào các đối tác)… Các ngân hàng thương mại
không sử dụng kết quả xếp hạng tín dụng nhằm thể hiện giá trị của người đi vay mà chỉ
là đưa ra ý kiến hiện tại dựa trên các nhân tố ảnh hưởng đến rủi ro, từ đó có chính sách
tín dụng và giới hạn cho vay phù hợp.
2.2.
ầm qu n tr n
ếp ạn t n ụn
Hoạt động tín dụng cơ bản vẫn chiếm tỷ trọng lớn trong cơ cấu doanh thu và lợi
nhuận của các ngân hàng thương mại. Trong quá trình cấp tín dụng, các ngân hàng
16
thương mại khó tránh khỏi rủi ro tín dụng phát sinh từ nhiều nguyên nhân khác nhau.
Tổn thất từ rủi ro tín dụng là rất nghiêm trọng, bởi không những làm giảm lợi nhuận
của ngân hàng mà còn ảnh hưởng đến an toàn của toàn hệ thống. Do vậy, nghiên cứu
biện pháp để nhận biết, đo lường và hạn chế được rủi ro tín dụng là một yêu cầu cấp
bách đối với các ngân hàng thương mại và cơ quan quản lý Nhà nước.
Từ đó, hoạt động xếp hạng tín dụng ra đời như là một xu thế tất yếu nhằm hỗ trợ
cho các tổ chức tín dụng trong đó có ngân hàng thương mại trong việc đưa ra quyết
định cấp tín dụng và hạn chế rủi ro tín dụng.
Vai trò của xếp hạng tín dụng với thị trường tài chính:
- Các nhà đầu tư sử dụng kết quả xếp hạng tín dụng để thực hiện chiến lược đầu
tư sao cho rủi ro thấp nhất nhưng kết quả đạt được như mong muốn;
- Các tổ chức đi vay, cần huy động vốn sử dụng kết quả xếp hạng tín nhiệm để
vay, vốn lưu động.
Các dữ liệu định tính: Đó là những quan sát không đo lường được bằng số.
Trong tập dữ liệu định tính mỗi quan sát sẽ và chỉ thuộc về một kiểu loại nào đó. Ví dụ
như tình hình cạnh tranh, xu hướng thị trường, vị thế kinh doanh của công ty, sự đa
dạng hoá hoạt động và các luật lệ, quy định.
Nguyên tắc 2: Việc phân tích được tiến hành bằng phương pháp từ trên xuống
(top-down), có nghĩa là phân tích từ các yếu tố vĩ mô ảnh hưởng đến công ty đến các
yếu tố của bản thân công ty theo trình tự sau:
(1) Phân tích rủi ro mang tính vĩ mô về xu hướng của quốc gia, ngành như tốc
độ tăng trưởng kinh tế của quốc gia, sự ổn định về chính trị, chính sách tài chính, sự
mở cửa thị trường, …
(2) Phân tích rủi ro hoạt động kinh doanh như tình hình cạnh tranh, xu hướng thị
trường, vị thế kinh doanh của công ty, sự đa dạng hoá hoạt động và các quy định.
(3) Phân tích rủi ro tài chính bao gồm hàng loạt chỉ tiêu phụ thuộc vào từng
ngành nghề, kết hợp so sánh giữa rủi ro tài chính và rủi ro kinh doanh, xem xét độ linh
hoạt tài chính cũng như chính sách tài chính.
(4) Phân tích hướng phát triển của công ty như chất lượng ban quản lý và chiến
lược kinh doanh.
(5) Phân tích tình trạng pháp lý của doanh nghiệp.
18
Nguyên tắc 3: Xây dựng thang điểm các chỉ tiêu đơn giản, dễ hiểu, dễ so sánh.
Các chỉ tiêu được cho điểm, sau đó tổng hợp lại và phản ánh qua ký hiệu xếp hạng.
2.3.2. Quy trình xếp hạng tín dụng
(1) Thu thập thông tin
(2) Phân loại theo ngành, quy mô
(3) Phân tích các chỉ tiêu và cho điểm
(4) Tổng hợp điểm và đưa ra kết quả xếp hạng
(5) Phê chuẩn và sử dụng kết quả xếp hạng
Nam, số liệu lợi nhuận giữ lại có thể rút ra từ bảng cân đối kế toán, bao gồm cả lợi
nhuận sau thuế chưa phân phối và các quỹ thuộc vốn chủ sở hữu.
Các tỷ số tài chính trong mô hình Z-score:
X1 =
(1)
Trong đó:
Vốn luân chuyển (vốn lưu động) = tài sản ngắn hạn - nợ ngắn hạn.
Những khoản thua lỗ trong hoạt động kinh doanh của doanh nghiệp sẽ làm giảm
tỷ số X1.
Tỷ số này có liên quan đến các trục trặc của doanh nghiệp và là công cụ đo
lường độ thanh khoản ròng của công ty tương ứng với tổng vốn. Thông thường một
công ty trải qua một thời kỳ thua lỗ kéo dài sẽ có tài sản lưu động bị co lại so với tổng
tài sản. Trong ba tỷ số thanh khoản được đánh giá để đưa vào mô hình thì tỷ số này tỏ
ra hiệu quả nhất. Hai tỷ số còn lại là tỷ số thanh toán hiện hành và tỷ số thanh toán tức
thời tỏ ra kém hữu ích hơn.
X2 =
(2)
Trong đó:
Tỷ số này đo lường lợi nhuận giữ lại tích lũy qua thời gian hay thặng dư kiếm
được trong quá trình hoạt động.
Sự trưởng thành của công ty cũng được đánh giá qua tỷ số này. Các công ty mới
thành lập thường có tỷ số này thấp vì chưa có thời gian để tích lũy lợi nhuận. Theo
nghiên cứu của Dan&Bradsheet, các công ty dễ bị phá sản ở những năm đầu hoạt động
và khoảng 50% số công ty mới thành lập chỉ hoạt động trong từ 1 đến 5 năm đầu.
20
X5 =
(5)
21
Đo lường khả năng quản trị của công ty để tạo doanh thu trước sức ép cạnh
tranh của các đối thủ khác.
Tỷ số này có mức độ quan trọng thấp nhất trong mô hình nhưng vẫn khá quan
trọng vìgiúp khả năng phân biệt tổng thể của mô hình được nâng cao.
X5 thay đổi trên một khoảng rộng đối với các ngành khác nhau và các quốc gia
khác nhau, do đó Altman đã phát triển một mô hình thay thế mà không có chỉ tiêu này.
Đối với doanh nghiệp sản xuất đã cổ phần hóa:
Z = 1.2X1 + 1.4X2 + 3.3X3 + 0.64X4 + 0.999X5
(6)
Nếu Z > 2.99: doanh nghiệp thuộc vùng an toàn, chưa có nguy cơ phá sản.
Nếu 1.8 < Z < 2.99: doanh nghiệp nằm trong vùng cảnh báo, có thể có nguy cơ
phá sản.
Nếu Z < 1.8: doanh nghiệp nằm trong vùng nguy hiểm, nguy cơ phá sản cao.
Đối với doanh nghiệp sản xuất chưa cổ phần hóa:
Z' = 0.717X1 + 0.847X2 + 3.107X3 + 0.42X4 + 0.998X5
(7)
Nếu Z' > 2.9: doanh nghiệp thuộc vùng an toàn, chưa có nguy cơ phá sản.
Nếu 1.23 < Z' < 2.9: doanh nghiệp nằm trong vùng cảnh báo, có thể có nguy cơ
phá sản.
khoản phải thu; Kỳ thu tiền bình quân; Vòng quay tổng tài sản.
- Các tỷ số đòn bẩy tài chính để đo lường mức độ sử dụng nợ để tài trợ cho hoạt
động của doanh nghiệp, chẳng hạn như: Hệ số nợ so với vốn chủ sở hữu; Hệ số nợ so
với tổng tài sản; Hệ số tài trợ vốn chủ sở hữu; Hệ số nợ dài hạn; Phân tích hệ số khả
năng hoàn trả lãi vay; Hệ số khả năng trả nợ.
- Các chỉ tiêu khả năng sinh lời để đo lường khả năng sinh lời của doanh nghiệp,
chẳng hạn như: Hệsố thu nhập trên tổng tài sản; Khả năng sinh lời so với doanh thu…
Các chỉ tiêu phi tài chính: Các chỉ tiêu phi tài chính được thu thập từ các nguồn
thông tin trong và ngoài doanh nghiệp bao gồm: lĩnh vực hoạt động kinh doanh, uy tín
23