5/29/2014 1
Đo lường vị trí trung tâm và
biến thiên
Lớp CN YTCC Đồng Tháp
5/29/2014 2
Mục tiêu
• Tính được các giá trị: trung bình, trung vị,
phương sai, độ lệch chuẩn.
• Trình bày được ý nghĩa của những chỉ số: Trung
bình, trung vị, phương sai, độ lệch chuẩn.
5/29/2014 3
Ví dụ 1
• Số liệu Hemoglobin ở 70 phụ nữ
• Làm thế nào để tóm tắt số liệu này?
5/29/2014 4
Tóm tắt số liệu
Đặc trưng chung của bộ số liệu này là gì?
x
i
5/29/2014 5
Tóm tắt số liệu
• Thông qua các con số thống kê cơ bản:
– Mức độ tập trung
• Trung bình
• Trung vị
• Mode (yếu vị)
– Mức độ phân tán
• Khoảng
• Phương sai – Độ lệch chuẩn
• Khoảng phân vị
5/29/2014 6
– Tập hợp 1, 2, 3, 4, 5
không có mode.
– Tập hợp 1, 2, 3, 3, 4, 5, 5
có 2 mode: 3 và 5
Tìm mode trong ví dụ 1
5/29/2014 10
Tại sao?
• Tại sao lại có các giá trị thống kê khác nhau
dùng để đo lường độ tập trung?
• Vì: Chúng có các tính chất, điểm mạnh điểm yếu
để giúp chúng ta hiểu bản chất của bộ số liệu.
5/29/2014 11
Trung bình
• Điểm mạnh
– Tính toán rất đơn giản
– Giá trị trung bình là duy nhất
• Điểm yếu
– Dễ bị ảnh hưởng bởi các giá trị đầu cùng của bộ số
liệu
– Ví dụ
• Trung bình của 1, 2, và 1.000.000 là 333.334,33,
Không thể nói là đại diện cho bộ số liệu được
• Hoặc giá trị trung bình của 1; 2; 9500; 9600; 9700
và 9900 là 6450.5 !
5/29/2014 12
Trung vị
• Điểm mạnh
– Duy nhất đối với mỗi bộ số liệu
– Tiện dụng trong việc mô tả độ lệch của các quan sát
bao gồm cả các quan sát cực lớn hoặc cực nhỏ.
– Số ngày nằm viện trung bình là 10 ngày (1-50 ngày)
Nêu khoảng của bộ số liệu ví dụ 1?
5/29/2014 16
Phân tán
Trung bình
So với trung bình, mức độ phân tán
của bộ số liệu này được đánh giá như thế nào?
x
i
0
5/29/2014 17
Vấn đề
• Nếu cộng tất cả các chênh lệch, vấn đề gì sẽ
xảy ra?
• Giải pháp
(
x
i - )²
• Khi đó, phương sai được tính là
S
x x
n
x nx
n
x n x
n
i
i
n
i
Các bước
• Tính trung bình
• Tính hiệu số (xi - )
• Bình phương hiệu số
trên
• Cộng tất cả các bình
phương
• Chia cho (n-1)
• Tính trung bình
• Bình phương mỗi giá
trị quan sát
• Cộng các bình
phương
• Tính ( )
• Chia cho (n-1)
5/29/2014 20
Độ lệch chuẩn
• Điểm yếu của phương sai: đơn vị đo lường
bình phương
• Độ lệch chuẩn (standard deviation – SD, S): lấy
căn của phương sai
• Tính độ lệch chuẩn của ví dụ 2
5/29/2014 21
Ý nghĩa
• Minh họa mức độ phân tán của số liệu
– Khoảng 68% các giá trị quan sát sẽ nằm trong
khoảng (trung bình ± s)
– Khoảng 95% các giá trị quan sát nằm trong khoảng
(trung bình ± 2s)
– Hầu hết nằm trong khoảng (trung bình ± 3s)
– Q
2
= giá trị quan sát thứ (n+1)/2
– Q
3
= giá trị quan sát thứ 3(n+1)/4