BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC HOA SEN
KHOA KINH TẾ THƯƠNG MẠI
------------- -------------
BỘ MÔN
NGUYÊN LÝ THỐNG KÊ
NHÓM 5
CHIỀU CAO TRUNG BÌNH CỦA SINH
VIÊN NỮ TẠI ĐH HOA SEN
GIÁO VIÊN HƯỚNG DẪN: LÊ THỊ THIÊN HƯƠNG
Năm học: 2011 - 2012
1
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC HOA SEN
KHOA KINH TẾ THƯƠNG MẠI
------------- -------------
BỘ MÔN
NGUYÊN LÝ THÔNG KÊ
NHÓM 5
CHIỀU CAO TRUNG BÌNH CỦA SINH
VIÊN NỮ TẠI ĐH HOA SEN
Trang 3
CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN
MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG
LỜI CẢM ƠN
Chúng tôi xin gửi lời cảm ơn chân thành đến cô Lê Thị Thiên Hương và
những giúp đỡ, góp ý giúp chúng tôi hoàn thành đề tài này một cách tốt và
hiệu quả nhất.
Nhóm chúng tôi cũng xin gửi lời cảm ơn đến khoa Kinh Tế Thương
Mại trường Đaị học Hoa Sen vì đã tạo cơ hội cho chúng tôi học tập một môn
học có tính ứng dụng cao vào thực tiễn và hỗ trợ tốt cho khả năng tổng hợp,
xử lý số liệu cho chúng tôi.
Tuy nhiên do những hạn chế về mặt kiến thức cũng như thời gian, nhóm
chúng tôi không tránh khỏi những sai sót. Rất mong sự đánh giá và góp ý
của cô.
Chúng tôi chân thành cảm ơn.
Nhóm thực hiện đề án.
Trang 4
CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN
MÔN HỌC NGUYÊN LÝ THỐNG KÊ
DANH SÁCH SINH VIÊN
STT
MSSV
HỌ VÀ TÊN
1
101417
Lê Ngọc Bích Thủy
2
101534
Trần Thị Muội
3
101471
Võ Thị Thanh Trúc
4
101515
Phạm Trịnh Huyền Trân
Trang 6
CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN
MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG
MỤC LỤC
Contents
Trang 7
CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN
MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG
BẢNG PHÂN CÔNG CÔNG VIỆC
Họ tên
1. Trần Thị Muội
2. Lê Thụy Bích Thủy
3. Võ Thị Thanh Trúc
4.Phạm Trịnh Huyền Trân
5.Phạm Trần Thiên Lý
6.Lê Quỳnh Như
SINH VIÊN NỮ TẠI ĐH HOA SEN
MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG
A. MỞ ĐẦU
1. Cơ sở lý thuyết
CHƯƠNG I. GIỚI THIỆU MÔN HỌC
I.1. KHÁI NIỆM VÀ CHỨC NĂNG CỦA THỐNG KÊ
1. Khái niệm
Có thể hiểu khái niệm thống kê trên hai góc độ:
•
Góc độ lý luận: Thống kê là một môn khoa học kinh tế, nghiên
cứu mặt lượng trong mối liên hệ chặt chẽ với mặt chất của các
hiện tượng và quá trình kinh tế xã hội, phát sinh trong điều kiện
thời gian và địa điểm cụ thể.
•
Góc độ nghiệp vụ: Thống kê có thể hiểu là các số liệu thể hiển
thôn tin về đối tượng nghiên cứu.
Một cách tổng quát, có thể định nghĩa: Thống kê là một nhành của toán
học liên quan đến việc thu thập, phân tích và trình bày các dữ liệu. Đây
là một khoa học bao gốm một hệ thống các phương pháp từ việc thu thập,
trình bày, tóm tắt dữ liệu đến các phương pháp phân tích và dự đoán, giúp
các nhà quản lý đưa ra các quyết định.
2. Chức năng của thống kê
vị được nghiên cứu.
Thống kê mô tả và thống kê suy diễn tạo thành thống kê ứng dụng, còn
thống kê toán là lĩnh vực nghiên cứu cơ sở lý thuyết của khoa học thống kê.
I.2. CÁC KHÁI NIỆM CƠ BẠN CỦA THỐNG KÊ
1. Tổng thể , đơn vị tổng thể, mẫu
Tổng thể thống kê (hay tổng thể) là tập hợp tất cả các đối tượng mà
ta nghiên cứu. các đơn vị (hay phần tử) tạo thành tổng thể được gọi là đơn vị
tổng thể. Mẫu là một bộ phận lấy ra từ tổng thể.
2. Biến
Biến là đặc điểm của đơn vị tổng thể, được chia ra thành hai loại:
•
Biến định tính thể hiện tính chất của đơn vị được khỏa sát.
•
Biến định lượng thể hiện bằng các số.
3. Dữ liệu
Dữ liệu là kết quả quan sát được của các biến, giá trị nhận được có
thể thay đổi từ đơn vị này sang đơn vị khác. Dữ liệu cũng được phận biệt
thành hai loại: dữ liệu định tính và định lượng.
4. Tiêu thức thống kê
Tiêu thức thống kê là khái niệm dùng để chỉ các đặc điểm của đơn
vị tồng thể mà ta nghiên cứu.
trên một tổng thề được gọi là tiêu thức thay phiên.
5. Chỉ tiêu thống kê
Chỉ tiêu thống kê là các trị số phản ánh các đặc điểm, các tính chất cơ bản
của tổng thể thống kê trong điều kiện thời gian và không gian xác định.
Chỉ tiêu thống kê có thể phân biệt thành hai loại: chỉ tiêu khối lượng và chỉ
tiêu chất lượng.
a. Chỉ tiêu khối lượng là các chỉ tiêu biểu hiện sự quy mô của
tổng thể.
b. Chỉ tiêu chất lượng là các chỉ tiêu biểu hiện tính chất, trình
độ phổ biến, quan hệ so sánh trong tổng thể.
I.3. CÁC BẬC ĐO LƯỜNG VÀ THANG ĐO DỮ LIỆU
Để thực hiện nghiên cứu, trong thống kê người ta sử dụng bốn cấp bậc đo
lường theo mức độ thông tin tăng dần, đó là thang đo: định danh, thứ bậc,
khoảng và tỉ lệ.
1. Thang đo định danh (hay thang đo phân loại) là bậc thấp nhất,
không thể hiện sự hơn kém. Thang đo này được sử dụng cho
các dữ liệu định tính, chỉ khác biệt nhau về tên gọi.
2. Thang đo thứ bậc thể hiện sự hơn kém của dữ liệu nhưng
không biết chính xác mức độ hơn kém đó. Thang đo này cũng
được sử dụng cho các dữ liệu định tính.
Trang 12
CHIỀU CAO TRUNG BÌNH CỦA
năng nguồn nhân lực, kinh phí và thời gian cho phép. Muốn vậy phải xác
định rõ những dữ liệu nào cần thu thập, thứ tự ưu tiên của các dữ liệu này.
2. Nguồn dữ liệu
Khi nghiên cứu, ta có thể sử dụng các dữ liệu từ những nguồn có sẵn, đã
được công bố hoặc chưa công bố, hay có thể tự mình đi thu tthập dữ liệu
mới.
Dữ liệu từ nguồn có sẵn, thường đã qua tổng hợp, xử lý, gọi là dữ liệu thứ
cấp.
Dữ liệu thu thập trực tiếp từ các đối tượng nghiên cứu gọi là dữ liệu sơ cấp.
Trang 13
CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN
MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG
a. Nguồn dữ liệu thứ cấp khá đa dạng, có thể là:
•
Các báo cáo nội bộ cơ quan, doanh nghiệp: các số liệu
báo cáo về tình hình sản xuất, tiêu thụ, tài chính,…
•
Các số liệu của Cơ quan Thống kê nhà nước, Cơ quan
Chính phủ: dân số, việc làm, mức sống dân cư, tài
nguyên,…
•
Điều tra toàn bộ là tiến hành thu thập, ghi chép dữ
liệu trên tất cả các đọn vị của tổng thể.
•
Điều tra không toàn bộ là chỉ tiến hành thu thập trên
một số đơn vị được chọn ra từ tổn thể đang nghiên
cứu.
3. Các phương pháp thu thập dữ liệu sơ cấp
a. Thu thập trực tiếp
•
Trang 14
Quan sát
CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN
•
MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG
Phỏng vấn trực tiếp
b. Thu thập gián tiếp
Tel
Tốt
Hạn chế
tiếp
Tốt
Đầy đủ
Chậm
Nhanh
Nhanh
Thấp
Cao
Cao
Tiết kiệm
Tốn kém
Tốn kém
4. Các kĩ thuật chọn mẫu
Mục đích của việc chọn mẫu là đảm bảo cho mẫu được chọn thật sự phản
ánh trung thực, đại điện cho toàn bộ tổng thể.
Cột thứ nhất mô tả các biểu hiện hoặc các giá trị (hay khoảng giá trị)
của dữ liệu.
Cột thứ hai mô tả tần số tương ứng với các biểu hiện hoặc giá trị đó.
Cột thứ ba là các tần suất (tỉ lệ %).
a. Cách lập bảng tần số cho dữ liệu định tính
Đối với các dữ liệu định tính như giới tính, nhành học,…, ta sẽ lập bảng tần
số gồm các thông tin sau đây:
Cột thứ nhất liệt kê tất cả các biểu hiện có thể có của tập dữ liệu.
Cột thứ hai ghi tần số (số lần từng biểu hiện đó xuất hiện trong tập dữ
liệu). tổng của cột tần số phải bằng số phần tử của tập dữ liệu.
Cột thứ ba ghi tần suất (bằng cách lấy tần số chia cho số phần tử của
tập dữ liệu và nhân với 100%). Tổng của cột tần suất phải bằng 100%.
X max − X min
k
Một số điều kiện phải tuân thủ khi phân nhóm:
Các nhóm không được trùng nhau, mỗi giá trị chỉ thuộc về một nhóm.
Tất cả các nhóm phải bảo đảm bao quát hết tất cả các giá trị của mẫu
số liệu.
Không có nhóm rỗng (tức là nhóm không có phần tử nào).
Chú ý: Trong bảng tần số đôi khi người ta còn thêm vào cột tần số tích lũy
(hoặc tần suất tích lũy) thể hiện số lần quan sát (hoặc % số lần quan sát)
cộng dồn đến giới hạn tr6en của một nhóm nào đó. Nói cách khác, tần số
tích lũy cho thấy có bao nhiêu quan sát bằng hoặc nhỏ hơn một vị trí nào đó
của biến khảo sát.
(3) Phân nhóm mở
Ngoài cách phân nhóm như trên ta còn có thể phân nhóm mở, trong đó nhóm
đầu tiên không có giới hạn dười và nhóm cuối cùng không có giới hạn trên,
các nhóm còn lại có khoảng cách đều hoặc không đều nhau. Mục đích của
phân nhóm mở là để nhóm đầu tiên và nhóm cuối cùng chứa các đơn vị có
giá trị đột biến và tránh việc lập quá nhiều tổ. khi tính toán đối với phân
nhóm mở người ta quy ước lấy khoảng cách của nhóm mở bằng khoảng cách
Biểu đồ nhánh và lá (còn gọi là biểu đồ thân và lá) là một công cụ để tóm
lược và trình bày tập dữ liệu, giúp người xem thấy được dữ liệu gốc và cách
thức phân tán nó. Để trình bày dữ liệu theo phương pháp nhánh và lá, mỗi trị
số được tách thành hai phần:
Phần nhánh: bao gồm một hay nhiều chữ số đầu tiên. Phần nhánh
được đặt ở cột đầu tiên theo thứ tự tăng dần. Số nhánh được chọn sao
cho nó có ít nhánh so với số quan sát (số lá). Thông thường số nhánh
trong khoảng từ 5 đến 20 là vừa.
Phần lá: gồm các chữ số còn lại. Lá ở một nhánh cũng sắp xếp theo
thứ tự tăng dần. cũng có tể chia đôi một nhánh thành nhánh trên và
nhánh dưới khi có quá nhiều lá.
b. Đồ thị thống kê cho dữ liệu định tính
(1) Biểu đồ dạng thanh (thanh đứng hay thanh ngang)
Trên biểu đồ này, mỗi thanh đại diện cho một phân loại của biến (tiêu thức
thống kê) mà ta quan tâm, chiều dài của thanh thể hiện tần số của các quan
sát thuộc về phân loại đó. Còn chiều rộng của các thanh bằng nhau.
Không nên nhầm lẫn giữa Histogram với biểu đồ thanh đứng. đây là hai
công cụ thống kê khác nhau, thể hiện hai loại dữ liệu định lượng, định tính.
Giữa các thanh của Histogram không có khoảng cách, còn giữa các thanh
Trang 18
phần tử (các quan sát), sau đó đem chia cho tổng số phần tử (tổng số quan
sát).
Có hai loại turng bình cộng là trung bình cộng đơn giản (mean) và trung bình
cộng có trong số (weighted mean).
a. Trung bình cộng đơn giản
Trang 19
Trung bình tổng thể:
CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN
MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG
Giả sử tổng thể có N phần tử (quan sát), X i là giá trị của phần tử thứ i. Khi
1 N
µ = ∑ Xi
N i =1
đó trung bình cộng của tổng thể là
(1)
Trung bình mẫu
Giả sử mẫu có n phần tử (hay còn nói cỡ mẫu là n), khi đó trung bình cộng
của mẫu (hay trung bình mẫu) là
k
i
(3) với
∑f
i =1
i
=n
là số
phần tử của mẫu.
Chú ý: trường hợp dữ liệu phân nhóm có khoảng cách thì turng bình mẫu
k
X =
được tính gần đúng bởi công thức
∑x f
i =1
k
i i
hoặc quá nhỏ), giá trị trung bình sẽ kém tiêu biểu nếu trong dãy số có các giá
trị đột biến.
Trung bình cộng được sử dụng để so sánh giữa hau hay nhiều tổng
thể.
Tổng độ lệch giữa các giá trị X i với giá trị trung bình X bằng 0, nghĩa
n
là
∑ (X
i =1
i
− X) = 0
2. Mốt (Mode)
Khái niệm
Mốt là giá trị xuất hiện nhiều nhất trong một dãy số, kí hiệu là Mo.
b) Cách xác định mốt
(1) Trường hợp dữ liệu không phân nhóm: Mốt là giá trị có tần số lớn nhất.
(2) Trường hợp dữ liệu phân nhóm có khoảng cách đều nhau: Trước hết
a)
Trang 21
CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN
MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG
-
Mốt có thể xác định cho dữ liệu sử dụng các thang đo khác như thang đo
-
định danh, thang đo thứ bậc.
Khác với trung bình cộng và trung vị, một tập sữ liệu có thể không xác
định được mốt vì không có giá trị nào xuất hiện nhiều nhất. Ngược lại, có
một số trường hợp có nhiều mốt.
3. Trung vị (Median)
Trong một tập dữ liệu đã được sắp xếp theo thứ tự tăng dần thì trung vị, kí
hiệu Me , là giá trị đứng giữa của tập dữ liệu. Nói cách khác, trung vị chia
dãy số làm hai phần, mỗi phần có số đơn vị tổng thể bằng nhau.
a) Cách xác định trung vị:
(1) Xác định trung vị cho dữ liệu không phân nhóm
-
Trường hợp số phần tử của mẫu n là số lẻ: M e =
Với dữ liệu đã phân nhóm, trung vị được xác định một cách xấp xỉ qua các
bước sau:
Bước 1: Tính tần số tích lũy.
Bước 2: Xác định nhóm chứa trung vị là nhóm có tần số tích lũy bằng (hoặc
n +1
vừa đủ lớn hơn) 2
Bước 3: Áp dụng công thức
n
− S M e −1
X M e min + hM e . 2
f Me
Me =
(6)
Trang 22
CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN
MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG
trong đó X M e min là giới hạn dưới của nhóm chứa M e ; hM e là khoảng cách của
nhóm chứa M e ; S M e −1 là tần số tích lũy của nhóm đứng trước nhóm chứa M e ;
f M e là tần số của nhóm chứa M e .
4. Tứ phân vị - thập phân vị
Tứ phân vị, thập phân vị là chỉ tiêu đo lường độ phân tán chứ không phải chỉ
4 . Do đó, tứ
1
phân vị thứ nhất bằng lượng biến ở vị trí thứ ba cộng với 4 giá trị chênh
lệch giữa lượng biến ở vị trí thứ ba và thứ tư. Còn tứ phân vị thứ ba bằng
3
lượng biến ở vị trí thứ chín cộng với 4 giá trị chênh lệch giữa lượng biến ở
vị trí thứ chín và thứ mười.
Trang 23
CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN
MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG
(2) Đối với dữ liệu phân nhóm có khoảng cách:
3n
n
− S Q3 −1
− SQ1 −1
4
4
Q1 = X Q1 min + hQ1 .
Q3 = X Q3 min + hQ3 .
f Q1
f Q3
Số trung bình, số turng vị và mốt mới chỉ cho ta biết được giá trị trung
tâm, mức độ đại diện của hiện tượng mà chưa phản ánh đầy đủ các tính
chất đặc thù của dãy số lượng biến. Do vậy, ngoài các đặc trưng đo lường
khuynh hướng tập trung, ta cần đánh giá độ phân tán (độ biến thiên) của
dữ liệu.
Khoảng biến thiên (Range) kí hiệu R, là chênh lệch giữa giá
1.
trị lớn nhất và giá trị nhỏ nhất của dãy lượng biến R = X max − X min (1)
Khoảng biến thiên càng nhỏ thì tổng thể càng đồng đều, số turng bình càng
có tính đại diện cao và ngược lại.
Trang 24
CHIỀU CAO TRUNG BÌNH CỦA
SINH VIÊN NỮ TẠI ĐH HOA SEN
MÔN HỌC NGUYÊN LÝ THỐNG KÊ
GVHD: LÊ THỊ THIÊN HƯƠNG
Nhược điểm của khoảng biến thiên là chỉ phụ thuộc vào giá trị lớn nhất và
giá trị nhỏ nhất của dãy lượng biến.
Độ trải giữa (Interquartile range) kí hiệu RQ , là chênh lệch
2.
giữa tứ phân vị thứ ba và tứ phân vị thứ nhất RQ = Q3 − Q1 (2)
các độ lệch giữa các lượng biến và số trung bình cộng của các lượng biến đó.
Cách xác định phương sai
1 k
1 k 2
2
σ = ∑ ( X i − µ ) fi = ∑ X i fi − µ 2
N i =1
N i =1
Phương sai tính từ tổng thể chung:
2
k
trong đó f i là tần số của giá trị X i và
Trang 25
N = ∑ fi
i =1
là số phần tử của tổng thể.