BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH
Nguyễn Thùy Liên
VẤN ĐỀ SO SÁNH CÁC MẪU DỮ LIỆU
THỐNG KÊ: SỰ NỐI KHỚP GIỮA DẠY
HỌC XÁC SUẤT THỐNG KÊ VỚI ĐÀO
TẠO CỬ NHÂN KINH TẾ
LUẬN VĂN THẠC SĨ GIÁO DỤC HỌC
Thành phố Hồ Chí Minh – 2013
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH
Nguyễn Thùy Liên
VẤN ĐỀ SO SÁNH CÁC MẪU DỮ LIỆU
THỐNG KÊ: SỰ NỐI KHỚP GIỮA DẠY
HỌC XÁC SUẤT THỐNG KÊ VỚI ĐÀO
TẠO CỬ NHÂN KINH TẾ
Chuyên ngành: Lý luận và phương pháp dạy học bộ môn Toán
Mã số: 60 14 01 11
LUẬN VĂN THẠC SĨ GIÁO DỤC HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS. LÊ THỊ HOÀI CHÂU
2. Khung lý thuyết tham chiếu ........................................................................................... 7
3. Phương pháp nghiên cứu ............................................................................................... 9
CHƯƠNG 1: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG HAI
GIÁO TRÌNH CHUYÊN NGÀNH .......................................................................... 11
1.1. So sánh các mẫu dữ liệu thống kê ............................................................................ 11
1.2. So sánh các mẫu dữ liệu thống kê trong giáo trình chuyên ngành kinh tế .......... 12
1.2.1. Phân tích giáo trình Phân tích và đầu tư chứng khoán .......................................... 13
1.2.2. Phân tích giáo trình Kinh tế lượng ........................................................................ 21
1.3. Tổng kết chương 1 ..................................................................................................... 29
CHƯƠNG 2: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG GIÁO
TRÌNH XS – TK ........................................................................................................ 31
2.1. Phân tích GT3 ............................................................................................................ 34
2.1.1. Kỳ vọng, phương sai, độ lệch chuẩn của ĐLNN .................................................. 34
2.1.2. Giá trị trung bình, phương sai của tổng thể và mẫu .............................................. 41
2.1.3. Hàm hồi qui ........................................................................................................... 43
2.1.4. Các tổ chức toán học liên quan đến so sánh các mẫu dữ liệu thống kê ................ 43
2.2. Tổng kết chương 2 ..................................................................................................... 48
CHƯƠNG 3: NGHIÊN CỨU THỰC NGHIỆM .................................................... 51
3.1. Thực nghiệm ............................................................................................................... 51
3.2. Phân tích tiên nghiệm ................................................................................................ 54
3.3. Phân tích hậu nghiệm ................................................................................................ 59
KẾT LUẬN ................................................................................................................ 64
TÀI LIỆU THAM KHẢO ........................................................................................ 66
PHỤ LỤC ................................................................................................................... 68
2
MỞ ĐẦU
1. Những ghi nhận ban đầu và câu hỏi xuất phát
Xác suất – Thống kê (XS – TK) là một khoa học nghiên cứu các đại lượng ngẫu nhiên
nên đóng vai trò quan trọng trong hầu hết mọi lĩnh vực của thế giới hiện đại, từ khoa học,
công nghệ, đến kinh tế, chính trị,…Khoa học này trang bị cho chúng ta công cụ để tìm ra
qui luật của những hiện tượng liên quan đến một tập hợp đông đảo các đối tượng mà ta chỉ
có thể tiếp cận một bộ phận của nó (gọi là mẫu thống kê). Chính vì vậy mà XS – TK là môn
học bắt buộc đối với sinh viên của tất cả các trường đại học, cao đẳng và hầu hết các trường
đào tạo nghề trên cả nước. Nhiệm vụ của môn học này là cung cấp cho sinh viên những kiến
thức liên quan đến XS – TK cũng như tạo cơ sở cho sinh viên học các bộ môn chuyên
ngành khác.
Tuy nhiên, trong nghiên cứu của nhóm tác giả Lê Thị Hoài Châu - Đào Hồng Nam:
“Một nghiên cứu về dạy học xác suất trong đào tạo ngành Y”, các tác giả đã chỉ ra sự “thiếu
sót” của chương trình dạy XS – TK trong các trường đào tạo ngành Y. Nội dung chính của
nghiên cứu trên bàn về việc dạy toán trong đào tạo ngành Y với nội dung xoay quanh mô
hình ngưỡng P-K, một mô hình cho phép các bác sĩ quyết định xem bệnh nhân không cần
điều trị, hay cần làm xét nghiệm, hay phải điều trị ngay. Qua phân tích những kiểu nhiệm vụ
liên quan đến mô hình ngưỡng được xem xét trong giáo trình XS – TK sử dụng ở trường
Đại học Y-Dược thành phố Hồ Chí Minh, các tác giả nhận thấy:
“Kỹ thuật toán học cho phép giảm thiểu yếu tố chủ quan trong chẩn bệnh đã không được đưa
vào trong giáo trình. Hệ quả là sinh viên thiếu những kỹ thuật thỏa đáng để chẩn đoán và điều
trị cho bệnh nhân tương lai của họ” (Lê Thị Hoài Châu - Đào Hồng Nam (2013))
Như vậy rõ ràng rằng, việc dạy học XS – TK trong trường đào tạo Y chưa thực sự cung cấp
đủ các công cụ toán cho hoạt động nghề nghiệp của các bác sĩ tương lai.
Chính từ những kết quả nghiên cứu của nhóm tác giả Lê Thị Hoài Châu - Đào Hồng Nam,
chúng tôi đặt ra câu hỏi: Liệu trong các trường đào tạo nghề khác, chẳng hạn như trường
đào tạo kinh tế, thì XS – TK có cung cấp đủ kiến thức cho các môn chuyên ngành sử
dụng hay không?
37
38
39
40
41
42
43
Số ngày có
cùng sản lượng
1
2
7
6
8
12
4
16
13
12
5
7
2
5
Theo bạn, sản xuất theo công nghệ nào cho năng suất ổn định hơn? Giải thích cho
kết luận của bạn.
Thực chất, yêu cầu của bài toán chính là so sánh độ phân tán của hai tổng thể: tổng thể sản
lượng (thu được mỗi ngày) khi sử dụng công nghệ A và tổng thể sản lượng (thu được mỗi
ngày) khi sử dụng công nghệ B. Trong bài toán này chúng tôi đã cố ý chọn số liệu sao cho
giá trị năng suất trung bình của công nghệ A lớn hơn năng suất trung bình công nghệ B và
phương sai của công nghệ A lớn hơn phương sai của công nghệ B nhưng hệ số biến động
của công nghệ A lại nhỏ hơn hệ số biến động của công nghệ B. Như vậy, công nghệ A cho
năng suất ổn định hơn.
Tuy nhiên, kết quả khảo sát được thống kê trong bảng 1 khiến chúng tôi rất bất ngờ.
Chiến
4,24%
9,32%
viên
Tỉ lệ
Bảng 1. TK câu trả lời cho bài toán 1
Trong bảng 1, S1a là chiến lược giải sử dụng so sánh hai phương sai, cách giải này đưa ra
đáp án sai: “công nghệ B cho năng suất ổn định hơn”. Trong khi đó, chiến lược giải cho đáp
án đúng là S1c và S1b thì có rất ít hoặc không có sinh viên nào sử dụng. Từ kết quả điều tra
ban đầu này, chúng tôi thu hẹp câu hỏi nghiên cứu lại như sau: Môn SX – TK dạy ở Đại học
Kinh tế TP.HCM đã cung cấp đủ kiến thức cho sinh viên để học có thể giải quyết các vấn
đề của thực tiễn hay của chuyên ngành liên quan đến vấn đề so sánh các tham số của hai
hay nhiều tổng thể chưa?
Từ những băn khoăn và nghi vấn trên, chúng tôi quyết định chọn đề tài: Vấn đề so sánh các
mẫu dữ liệu thống kê: Sự nối khớp giữa dạy học XS – TK với đào tạo cử nhân kinh tế.
Trong khuôn khổ một luận văn thạc sỹ, chúng tôi giới hạn phạm vi nghiên cứu trên hai
phương diện. Về phương diện các chuyên ngành kinh tế chúng tôi chọn môn Kinh tế lượng
và môn Phân tích và đầu tư chứng khoán để nghiên cứu. Về phương diện khoa học XS - TK
6
chúng tôi chọn đối tượng tri thức là “so sánh các mẫu dữ liệu TK”. Ở đây, thuật ngữ “ so
sánh các mẫu dữ liệu TK” được chúng tôi dùng theo nghĩa dự đoán về so sánh các tham số
của các tổng thể dựa trên mẫu dữ liệu TK. Những nghiên cứu của chúng tôi chỉ gói gọn
trong phạm vi của thống kê mô tả mà không đi sâu vào thống kê suy diễn.
Trong nghiên cứu của mình, chúng tôi sẽ tìm câu trả lời cho các câu hỏi sau:
Q1: Trong hai giáo trình chuyên ngành kinh tế, so sánh các mẫu dữ liệu thống kê
nhằm giải quyết những vấn đề gì? Phương pháp giải quyết như thế nào? Khái niệm, lý
Như vậy, nghiên cứu R(I,O) sẽ giúp chúng tôi trả lời câu hỏi Q1 và Q2.
2.1.2. Quan hệ cá nhân đối với một đối tượng tri thức
Một đối tượng là một cái gì đó tồn tại ít nhất đối với một cá nhân. Quan hệ cá nhân của một
cá nhân X với một đối tượng tri thức O, ký hiệu R(X, O), là tập hợp những tác động qua lại
mà X có thể có với O. R(X, O) cho biết X nghĩ gì về O, X hiểu như thế nào O, X có thể thao
tác O ra sao.
Như vậy nghiên cứu R(X,O) sẽ giúp chúng tôi trả lời phần nào câu hỏi Q3. Ở đây O vẫn là
đối tượng tri thức “so sánh các mẫu dữ liệu thống kê” còn X là sinh viên.
2.1.3. Praxéologie
Vấn đề đặt ra là làm thế nào để vạch rõ quan hệ thể chế R(I,O) ?
Hoạt động nghiên cứu, dạy và học là một bộ phận của hoạt động xã hội. Do đó, cũng cần
thiết xây dựng một mô hình cho phép mô tả và nghiên cứu thực tế đó. Xuất phát từ quan
điểm này mà Chevallard (1998) đã đưa vào khái niệm praxéologie. Khái niệm chính là “chìa
khóa” giúp chúng ta làm rõ mối quan hệ I thể chế với tri thức O.
Theo Chavallard, mỗi praxéologie là một bộ gồm 4 thành phần [T, τ , θ , Θ ], trong đó : T là
một kiểu nhiệm vụ; τ là kỹ thuật cho phép giải quyết T; θ là công nghệ giải thích cho kỹ
thuật τ ; Θ là lí thuyết giải thích cho θ .
Nếu T là một kiểu nhiệm vụ toán học, thì praxéologie được gọi mà một tổ chức toán học và
viết là OM. Trong trường hợp này, khối công nghệ - lí thuyết chỉ bao gồm những tri thức
toán học.
Việc xác định các praxéologie gắn với đối tượng O sẽ cho phép chúng tôi: vạch rõ các quan
hệ thể chế R (I,O), đồng thời tìm ra sự chênh lệch nếu có giữa những praxéologie cần dạy và
được dạy. Từ đó, chúng tôi sẽ tìm được câu trả lời cho Q1, Q2 và một phần Q3.
2.2. Khái niệm qui tắc hành động và hợp đồng dạy học
8
Để làm rõ những qui tắc ứng xử của học sinh đối với đối tượng tri thức “so sánh các mẫu dữ
liệu thống kê”, chúng tôi sử dụng khái niệm qui tắc hành động và hợp đồng dạy học:
“Một qui tắc hành động là một mô hình được xây dựng nhằm giải thích và chỉ rõ những kiến
Từ đó chúng tôi sẽ so sánh những gì nghiên cứu được ở Q1 và Q2 để tìm ra câu trả lời cho
Q3.
10
CHƯƠNG 1: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG
HAI GIÁO TRÌNH CHUYÊN NGÀNH
Nội dung chính của chương 1 xoay quanh vấn đề “so sánh các mẫu dữ liệu thống kê” được
trình bày trong hai giáo trình chuyên ngành kinh tế. Những phân tích thể chế dạy học hai
môn chuyên ngành này sẽ giúp chúng tôi trả lời câu hỏi Q1:
Q1: Trong hai giáo trình chuyên ngành kinh tế, so sánh các mẫu dữ liệu thống kê
nhằm giải quyết những vấn đề gì? Phương pháp giải quyết như thế nào? Khái niệm, lý
thuyết toán nào giải thích cho những phương pháp ấy?
1.1. So sánh các mẫu dữ liệu thống kê
“So sánh các mẫu dữ liệu thống kê” là thuật ngữ viết tắt chúng tôi dùng để chỉ việc so sánh
tham số của các tổng thể khác nhau dựa trên những mẫu thu được.
Việc so sánh tham số của các tổng thể giúp người ta đưa ra những đánh giá về những tổng
thể đó và từ đó có thể đưa ra được kế hoạch phù hợp cho công việc của họ.
Chẳng hạn một công ty muốn mở thêm chi nhánh kinh doanh. Công ty này đi khảo sát thị
trường tại hai khu vực A và B về mức thu nhập của người dân. Tại khu vực A họ thu được
mẫu A1, tại khu vực B họ thu được mẫu B1. Từ hai mẫu này họ xem xét, đưa ra đánh giá về
thu nhập bình quân của hai khu vực A và B xem bên nào cao hơn, sau đó kiểm định lại kết
quả. Khi đã có được kết luận với độ tin cậy cao, công ty sẽ đưa ra quyết định phù hợp là mở
chi nhánh tại khu vực A hay B.
Trên thực tế, chúng ta có thể thấy việc sử dụng tham số trung bình của các tổng thể để so
sánh được sử dụng rất phổ biến như: so sánh nhiệt độ trung bình, lượng mưa trung bình giữa
Ý kiến trên cho thấy mối liên hệ mật thiết giữa XS-TK với hai môn chuyên ngành kinh tế.
Do đó, chúng tôi mong đợi sẽ tìm thấy những vấn đề làm nảy sinh nhu cầu so sánh các mẫu
dữ liệu thống kê, trong hai giáo trình được sử dụng trong dạy học hai môn chuyên ngành mà
chúng tôi quan tâm. Đồng thời, chúng tôi sẽ chỉ ra những praxéologie có liên quan nhằm
hiểu rõ hơn mối quan hệ thể chế đối với tri thức so sánh các mẫu dữ liệu thống kê: tri thức
so sánh các mẫu dữ liệu thống kê tồn tại như thế nào, có vai trò gì, chịu những ràng buộc
nào của thể chế? Từ đó, chúng tôi sẽ tìm được những “yếu tố” toán thống kê mà thể chế dạy
học hai môn chuyên ngành đưa ra để giải quyết các vấn đề liên quan đến so sánh các mẫu
dữ liệu thống kê. Đó cũng chính là những “yếu tố” toán cần thiết phải được cung cấp trong
môn học XS – TK.
12
Để trả lời câu hỏi Q1 đã đặt ra, chúng tôi sẽ cố gắng tìm câu trả lời cho các câu hỏi sau:
-
So sánh các mẫu dữ liệu thống kê được sử dụng trong những vấn đề nào?
-
Có những praxéologie nào liên quan đến so sánh các mẫu dữ liệu TK? Kĩ thuật
giải quyết chúng là gì? Yếu tố công nghệ và lý thuyết nào giải thích cho kĩ thuật
đó?
1.2.1. Phân tích giáo trình Phân tích và đầu tư chứng khoán
Trong phần này chúng tôi sẽ tham khảo tài liệu sau:
[1] Bùi Kim Yến – Thân Thị Thu Thủy (2009), Phân tích và đầu tư chứng khoán, Nxb
Thống kê.
Đây là giáo trình được sử dụng trong trường đại học kinh tế TP.HCM. Để thuận tiện cho
biết chắc được nền kinh tế sẽ như thế nào, nên các nhà phân tích sẽ tìm ra một xác suất để xảy
ra một tình trạng kinh tế nào đó.
Mức sinh lời kỳ vọng dựa trên xác suất của từng tình trạng kinh doanh.
k = ∑ Pk
i i
Trong đó: ki: mức sinh lời; pi: xác suất xảy ra” (GT1, tr.58)
Trong khi đó, rủi ro:
“là khả năng mức sinh lời thực tế nhận được trong tương lai có thể khác với dự tính ban đầu.
Độ dao động của lợi suất đầu tư 2 càng cao thì rủi ro càng cao” (GT1, tr.49)
1F
Mức độ rủi ro của dự án được đo bằng phương sai, độ lệch chuẩn hoặc hệ số biến động:
“Để đo lường rủi ro trong mức sinh lời của một loại chứng khoán, đó là tính toán mức dao
động trong mức sinh lời bằng cách sử dụng thước đo phương sai (variance) và độ lệch chuẩn
(standard deviation)” (GT1, tr.60)
“Một cách đo lường mức độ rủi ro của các phương án khác nữa, là dùng hệ số biến động.
Hệ số biến động được tính bằng cách lấy độ lệch tiêu chuẩn chia cho lãi suất mong đợi của
phương án đầu tư.
CV =
δ
k
” (GT1, tr.63)
Các tác giả giải thích việc sử dụng hệ số biến động để đo lường rủi ro như sau:
r=
Như vậy phương sai, độ lệch chuẩn hay hệ số biến động của các phương án đầu tư chứng
khoán phản ánh mức độ phân tán của những giá trị lợi nhuận quanh lợi nhuận kỳ vọng. Mức
độ phân tán này cho chúng ta biết mức độ chênh lệch có thể có giữa lợi nhuận thực tế với lợi
nhuận mong đợi (lợi nhuận kỳ vọng). Cũng vì vậy mà những tham số này được sử dụng để
đo mức độ rủi ro của các phương án đầu tư chứng khoán.
Để sinh viên hiểu rõ hơn về lợi nhuận và rủi ro, tác giả lấy hai ví dụ minh họa. Đặc biệt, hai
ví dụ này có liên quan đến việc đánh giá rủi ro của các phương án đầu tư chứng khoán. Việc
đánh giá rủi ro thực sự rất cần thiết đối với mỗi nhà đầu tư. Vì vậy, tác giả rất chú trọng tới
vấn đề này trong giáo trình.
Với ví dụ trang 58 của GT1, chúng tôi thấy xuất hiện một vấn đề liên quan đến so sánh các
tham số của hai tổng thể:
“Ví dụ: Công ty Bưu Chính Viễn Thông hiện đang sử dụng mạng lưới “điện thoại tiêu
chuẩn”. Công ty đang nghiên cứu một đề án mạng lưới “điện thoại kiểu mới”. Các chuyên
viên tiếp thị của công ty cho rằng việc sử dụng mạng lưới mới sẽ mang lại lợi nhuận cao hơn
trong các thời kỳ cao điểm và trung bình, nhưng trong thời kỳ khó khăn, khách hàng sẽ tiêu
thụ ít hơn và mạng lưới mới dự đoán sẽ không mang lại lợi nhuận. Trước khi quyết định đầu
tư, các nhà nghiên cứu thị trường của công ty cần xác định rủi ro và lợi nhuận của hai phương
án trên.
Phương án kiểu mới
Tình trạng kinh tế
Tỷ lệ xảy ra tình trạng Suất lợi nhuận ở mỗi tình
kinh tế
trạng kinh tế
15
Phát đạt
20%
Bình thường
0,4
15%
Khó khăn
0,3
10%
-------1,0
(GT1, tr.59)
Trước khi đưa ra lời giải thì các tác giả nhắc lại công thức tính lợi nhuận kỳ vọng, hay lãi
suất mong đợi (lãi suất trung bình):
“Pi là khả năng xảy ra (xác suất) của các tình trạn kinh tế
ki là suất lợi nhuận dự đoán cho từng thời kỳ kinh tế.
Thì k là tỷ lệ lãi suất mong đợi (trung bình).
n
k = ∑ Pk
i i ” (GT1, tr.60)
i =1
Sau đó, lợi nhuận mong đợi của hai phương án được tính như sau:
“Đối với phương án mạng lưới điện thoại mới:
2
- Tìm độ lệch tiêu chuẩn bằng căn bậc hai của δ 2 :
Độ lệch tiêu chuẩn: δ =
∑ (k
n
i =1
)
2
i
− k × Pi ” (GT1, tr.61)
Với các bước tính độ lệch chuẩn nêu ra ở trên, độ lệch chuẩn của từng dự án được tính dưới
dạng bảng như sau:
“Mạng lưới điện thoại mới:
ki – k
(ki – k )
(ki – k )2Pi
100 – 15
δ2
20 – 15
(5)
(25)(0,3) = 7,5
15 – 15
0
0.(0,4) = 0
10 – 15
( - 5)
(25)(0,3)= 7,5
Độ lệch tiêu chuẩn: δ = 3,87% ” (GT1, tr.62)
Phương sai δ 2 =15,0
Từ những kết quả tính toán lợi nhuận kỳ vọng và độ lệch chuẩn, tác giả kết luận:
“Phương án mạng lưới tiêu chuẩn với độ lệch tiêu chuẩn 3,87% nhỏ hơn nhiều so với độ lệch
tiêu chuẩn của phương án đầu tư mới 65,84%. Điều đó dẫn đến khả năng rủi ro của phương án
mạng lưới tiêu chuẩn thấp hơn so với phương án mới, và có thể nói phương án mạng lưới tiêu
10%
Nếu nhìn vào độ lệch tiêu chuẩn δ B < δ A và ta chọn phương án B là hoàn toàn không
chính xác vì tỷ suất lãi mong đợi của phương án A lớn hơn phương án B.
Hợp lý hơn ta tính hệ số biến động (CV)
18