Tài liệu Tài liệu giảng dạy Nguyên lý thống kê kinh tế: BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC QUY NHƠN
BỘ MÔN TOÁN KINH TẾ
TÀI LIỆU GIẢNG DẠY
NGUYÊN LÝ THỐNG KÊ KINH TẾ
(TRÌNH ĐỘ ĐẠI HỌC, KHỐI NGÀNH KINH TẾ)
Bình Định, 06/2016
i
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC QUY NHƠN
BỘ MÔN TOÁN KINH TẾ
TÀI LIỆU GIẢNG DẠY
NGUYÊN LÝ THỐNG KÊ KINH TẾ
(TRÌNH ĐỘ ĐẠI HỌC, KHỐI NGÀNH KINH TẾ)
SỐ TÍN CHỈ: 3 (LÝ THUYẾT: 45)
Bình Định, 06/2016
ii
MỤC LỤC
Chương 1: Tổng quan về thống kê học 1
1.1. Khái niệm thống kê học 1
1.2. Một số khái niệm thường dùng trong thống kê 1
1.2.1. Tổng thể thống kê 1
1.2.2. Tổng thể mẫu 2
1.2.3. Tiêu thức thống kê 2
1.2.4. Chỉ tiêu thống kê 3
1.2.5. Thang đo trong thống kê 3
1.2.5.1. Thang đo định danh 4
1.2.5.2. Thang đo thứ bậc 4
1.2.5.3. Thang đo khoảng 4
1.2.5.4. Thang đo tỷ lệ 4
1.2.5.5. Một số kỹ thuật thiết kế thang đo 5
1.2.6. Bảng câu hỏi (phiếu điều tra) 7
1.2.7. Dữ liệu thống kê 9
1.3. Các phương pháp thống kê 10
Câu hỏi ôn tập 12
Chương...
152 trang |
Chia sẻ: putihuynh11 | Lượt xem: 718 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Tài liệu giảng dạy Nguyên lý thống kê kinh tế, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC QUY NHƠN
BỘ MÔN TOÁN KINH TẾ
TÀI LIỆU GIẢNG DẠY
NGUYÊN LÝ THỐNG KÊ KINH TẾ
(TRÌNH ĐỘ ĐẠI HỌC, KHỐI NGÀNH KINH TẾ)
Bình Định, 06/2016
i
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC QUY NHƠN
BỘ MÔN TOÁN KINH TẾ
TÀI LIỆU GIẢNG DẠY
NGUYÊN LÝ THỐNG KÊ KINH TẾ
(TRÌNH ĐỘ ĐẠI HỌC, KHỐI NGÀNH KINH TẾ)
SỐ TÍN CHỈ: 3 (LÝ THUYẾT: 45)
Bình Định, 06/2016
ii
MỤC LỤC
Chương 1: Tổng quan về thống kê học 1
1.1. Khái niệm thống kê học 1
1.2. Một số khái niệm thường dùng trong thống kê 1
1.2.1. Tổng thể thống kê 1
1.2.2. Tổng thể mẫu 2
1.2.3. Tiêu thức thống kê 2
1.2.4. Chỉ tiêu thống kê 3
1.2.5. Thang đo trong thống kê 3
1.2.5.1. Thang đo định danh 4
1.2.5.2. Thang đo thứ bậc 4
1.2.5.3. Thang đo khoảng 4
1.2.5.4. Thang đo tỷ lệ 4
1.2.5.5. Một số kỹ thuật thiết kế thang đo 5
1.2.6. Bảng câu hỏi (phiếu điều tra) 7
1.2.7. Dữ liệu thống kê 9
1.3. Các phương pháp thống kê 10
Câu hỏi ôn tập 12
Chương 2: Điều tra thống kê (Thu thập dữ liệu thống kê) 13
2.1. Khái niệm về điều tra thống kê 13
2.2. Các loại điều tra thống kê 14
2.2.1. Điều tra thường xuyên 14
2.2.2. Điều tra không thường xuyên 14
2.2.3. Điều tra toàn bộ 15
2.2.4. Điều tra không toàn bộ 15
2.3. Hình thức tổ chức thu thập thông tin 15
2.3.1. Báo cáo thống kê định kỳ 16
2.3.2. Điều tra chuyên môn 18
2.4. Phương pháp thu thập thông tin thống kê 18
2.4.1. Phương pháp trực tiếp 18
2.4.2. Phương pháp gián tiếp 19
Câu hỏi ôn tập 21
iii
Chương 3: Tổng hợp và trình bày dữ liệu thống kê 22
3.1. Phân tổ thống kê 22
3.1.1. Khái niệm 22
3.1.2. Các loại phân tổ thống kê 22
3.1.3. Tiêu thức phân tổ 25
3.1.4. Bảng phân phối tần số 25
3.1.5. Cách phân tổ thống kê 26
3.2. Bảng thống kê 29
3.2.1. Khái niệm 29
3.2.2. Cấu trúc bảng thống kê 29
3.2.3. Yêu cầu và quy ước của việc xây dựng bảng thống kê 30
3.3. Tổng hợp bằng đồ thị và biểu đồ thống kê 32
Câu hỏi ôn tập 34
Chương 4: Đo lường các mức độ của hiện tượng kinh tế-xã hội 36
4.1. Số tuyệt đối 36
4.1.1. Khái niệm 36
4.1.2. Phân loại số tuyệt đối 36
4.2. Số tương đối 36
4.2.1. Khái niệm 36
4.2.2. Ý nghĩa của số tương đối 37
4.2.3. Đặc điểm của số tương đối 37
4.2.4. Phân loại số tương đối 38
4.3. Các đặc trưng đo lường khuynh hướng tập trung 40
4.3.1. Số bình quân (trung bình) 40
4.3.2. Số trung vị 43
4.3.3. Giá trị mốt 45
4.4. Các đặc trưng đo lường mức độ phân tán 47
4.4.1. Khoảng biến thiên 47
4.4.2. Độ lệch tuyệt đối bình quân 47
4.4.3. Phương sai 48
4.4.4. Độ lệch chuẩn 48
4.4.5. Hệ số biến thiên 48
Câu hỏi ôn tập 49
iv
Chương 5: Ðiều tra chọn mẫu 53
5.1. Giới thiệu chung về điều tra chọn mẫu 53
5.1.1. Khái niệm điều tra chọn mẫu 53
5.1.2. Ưu, nhược điểm của điều tra chọn mẫu 53
5.1.3. Sự cần thiết của điều tra chọn mẫu 53
5.2. Các giai đoạn của điều tra chọn mẫu 54
5.2.1. Xác định mục đích nghiên cứu 54
5.2.2. Xác định tổng thể nghiên cứu 54
5.2.3. Xác định kích thước mẫu 54
5.2.4. Lựa chọn phương pháp thu thập dữ liệu 54
5.2.5. Sử dụng các thông tin từ mẫu để suy luận thống kê 55
5.2.6. Kết luận về tổng thể nghiên cứu 55
5.3. Sai số chọn mẫu 55
5.4. Một số phương pháp tổ chức chọn mẫu ngẫu nhiên thường dùng 56
5.4.1. Chọn mẫu ngẫu nhiên đơn giản 56
5.4.2. Chọn mẫu phân tổ (phân loại) 61
5.4.3. Chọn mẫu cả khối (chọn mẫu chùm) 64
5.4.4. Chọn mẫu nhiều cấp (chọn mẫu phân tầng) 67
Câu hỏi ôn tập 68
Chương 6: Phân tích hồi quy và tương quan 70
6.1. Mối liên hệ tương quan và nhiệm vụ của phân tích hồi quy 70
6.1.1. Quan hệ tương quan 70
6.1.2. Nhiệm vụ phân tích hồi quy và tương quan 70
6.1.3. Ý nghĩa của phân tích hồi quy và tương quan 70
6.2. Hồi quy và tương quan tuyến tính giữa hai tiêu thức số lượng 70
6.2.1. Bài toán đặt vấn đề 70
6.2.2. Hệ số tương quan 72
6.3. Hồi quy và tương quan tuyến tính bội 72
6.3.1. Hệ số tương quan bội 72
6.3.2. Hệ số tương quan chuẩn hóa 73
6.3.4. Hệ số tương quan riêng phần 73
6.4. Hồi quy và tương quan phi tuyến giữa hai tiêu thức số lượng 74
6.4.1. Hàm parabol 74
v
6.4.2. Hàm Hyperbol 74
6.4.3. Hàm mũ 74
6.4.4. Tỷ số tương quan 74
6.5. Tương quan hạng và tương quan giữa hai tiêu thức thuộc tính 76
6.5.1. Tương quan hạng 76
6.5.2. Tương quan giữa hai tiêu thức thuộc tính 76
Câu hỏi ôn tập 77
Chương 7: Dãy số thời gian 79
7.1. Khái niệm và phân loại dãy số thời gian 79
7.2. Các thành phần của dãy số thời gian 80
7.2.1. Yếu tố xu thế 80
7.2.2. Yếu tố thời vụ 80
7.2.3. Yếu tố chu kỳ 80
7.2.4. Yếu tố ngẫu nhiên 80
7.3. Các chỉ tiêu phân tích dãy số thời gian 80
7.3.1. Mức độ bình quân theo thời gian 80
7.3.2. Lượng tăng (giảm) tuyệt đối 81
7.3.3. Tốc độ phát triển 83
7.3.4. Tốc độ tăng (giảm) 84
7.3.5. Giá trị tuyệt đối 1% tăng (giảm) liên hoàn 85
7.4. Các phương pháp biểu hiện xu hướng biến động của dãy số thời gian 85
7.4.1. Phương pháp bình quân trượt 85
7.4.2. Phương pháp hồi quy 86
7.5. Các phương pháp dự báo biến động của dãy số thời gian 89
7.5.1. Dự báo dự vào lượng tăng (giảm) tuyệt đối bình quân 89
7.5.2. Dự báo dựa vào tốc độ phát triển bình quân 89
7.5.3. Dự báo theo phương trình hồi quy tuyến tính 90
7.5.4. Dự báo theo mô hình nhân 93
Câu hỏi ôn tập 94
Chương 8: Phương pháp chỉ số 97
8.1. Khái niệm chỉ số thống kê 97
8.2. Các loại chỉ số trong thống kê 97
8.2.1. Chỉ số phát triển 97
vi
8.2.2. Chỉ số không gian 100
8.2.3. Chỉ số kế hoạch 101
8.3. Hệ thống chỉ số 101
8.3.1. Phương pháp xây dựng hệ thống chỉ số 105
8.3.2. Hệ thống chỉ số phân tích biến động chỉ tiêu trung bình 105
8.3.3. Hệ thống chỉ số phân tích biến động tổng lượng biến tiêu thức 107
Câu hỏi ôn tập 109
Chương 9: Kiểm định giả thuyết thống kê 113
9.1. Kiểm định tham số 113
9.1.1. Kiểm định giả thuyết về giá trị trung bình của tổng thể chung 113
9.1.2. Kiểm định giả thuyết về phương sai của tổng thể chung 119
9.1.3. Kiểm định giả thuyết về tham số p của phân phối không – một 122
9.2. Kiểm định phi ttham số 125
9.2.1. Kiểm định giả thuyết về tính độc lập của hai dấu hiệu định tính 125
9.2.2. Kiểm định giả thuyết về quy luật phân phối xác suất
của biến ngẫu nhiên 126
9.3. Kiểm định mô hình hồi quy 128
9.3.1. Kiểm định ý nghĩa của các hệ số bêta 128
9.3.2. Kiểm định ý nghĩa của hệ số tương quan 129
9.3.3. Kiểm định sự phù hợp của phương trình 130
TÀI LIỆU THAM KHẢO 131
PHỤ LỤC CÁC BẢNG SỐ 132
1
Chương 1
TỔNG QUAN VỀ THỐNG KÊ HỌC
1.1 Khái niệm thống kê học
Trong đời sống hàng ngày, chúng ta thường bắt gặp thuật ngữ “Thống kê” trên các
phương tiện thông tin đại chúng như báo chí, phát thanh, truyền hình Thuật ngữ
“Thống kê” có thể được hiểu theo hai nghĩa như sau:
Thống kê là các số liệu được thu thập để phản ánh các hiện tượng tự nhiên, kỹ
thuật, kinh tế, xã hội. Ví dụ sản lượng của một công ty, lượng mưa trong năm
của một khu vực địa lý, tốc độ tăng trưởng kinh tế của một quốc gia, dân số,
lao động, nhiệt độ
Thống kê cũng được hiểu là hệ thống các phương pháp để nghiên cứu (thu
thập, tổng hợp, phân tích) các hiện tượng tự nhiên, kỹ thuật, kinh tế, xã hội.
Xét theo quá trình hình thành và phát triển, có thể thấy thống kê là một bộ phận
của khoa học xã hội. Tuy nhiên nó có những đặc thù riêng cho phép nó trở thành một
ngành khoa học riêng biệt. Đặc thù thứ nhất là nó chỉ nghiên cứu mặt lượng của các
hiện tượng kinh tế xã hội. Đặc thù thứ hai là thống kê học chủ yếu nghiên cứu các hiện
tượng số lớn. Đặc thù thứ ba là nó không chỉ nghiên cứu các hiện tượng trong trạng
thái tĩnh mà còn nghiên cứu trong cả trạng thái động. Đặc thù thứ tư là nghiên cứu
trong điều kiện thời gian và không gian cụ thể. Từ những điều vừa trình bày trên, ta có
thể đi đến định nghĩa thống kê như sau:
Thống kê là hệ thống các phương pháp dùng để thu thập, xử lý và phân tích các con số
(mặt lượng) của những hiện tượng số lớn để tìm hiểu bản chất và tính quy luật vốn có
của chúng (mặt chất) trong điều kiện thời gian và không gian cụ thể.
1.2 Một số khái niệm thường dùng trong thống kê
1.2.1 Tổng thể thống kê
Tổng thể thống kê là tập hợp các đơn vị hay phần tử thuộc hiện tượng nghiên cứu
mà ta cần quan sát, thu thập và phân tích.
Ví dụ: Tổng thể các hộ gia đình ở thành phố Quy Nhơn.
Các đơn vị cấu thành tổng thể thống kê gọi là đơn vị tổng thể. Đơn vị tổng thể là
căn cứ quan trọng để xác định các phương pháp điều tra thích hợp, để tiến hành tổng
hợp và áp dụng những công thức tính toán khi phân tích thống kê.
Phân loại tổng thể thống kê:
Tổng thể bộc lộ: là tổng thể mà ta có thể quan sát trực tiếp hoặc nhận biết được các
đơn vị của nó. Ví dụ như số sinh viên của một trường đại học tại một thời điểm nào đó,
hoặc số lượng hàng hóa bán ra trong một kỳ nào đó.
2
Tổng thể tiềm ẩn: là các đơn vị tổng thể thường không thể trực tiếp quan sát hoặc nhận
biết được. Ví dụ: tổng thể những người ủng hộ chính sách kinh tế nào đó, hoặc tổng
thể những người hâm mộ bóng đá.
Tổng thể đồng nhất: là các đơn vị giống nhau ở một hay một số đặc điểm chủ yếu có
liên quan đến mục đích nghiên cứu, và ngược lại gọi là tổng thể không đồng chất. Ví
dụ như đối với việc nghiên cứu tình hình thu nhập của người lao động tại các ngân
hàng thương mại cổ phần trên địa bàn thành phố Hà Nội thì tổng thể gồm các ngân
hàng thương mại cổ phần trên địa bàn thành phố Hà Nội là tổng thể đồng chất, nhưng
tổng thế gồm các ngân hàng trên địa bàn thành phố Hà Nội là tổng thể không đồng
chất. Cần lưu ý thêm rằng tổng thể thống kê có thể là hữu hạn hoặc vô hạn.
1.2.2 Tổng thể mẫu (mẫu)
Trong nhiều tình huống thực tế, khi phân tích các hiện tượng kinh tế - xã hội,
chúng ta không thể nghiên cứu cũng như thu thập số liệu của tổng thể chung do chúng
quá lớn gây ra chi phí cao, tốn nhiều thời gian và có thể dẫn đến sai số đáng kể trong
quá trình thu thập dữ liệu và nghiên cứu, hoặc do không thể xác định được quy mô
tổng thể chung, hoặc cũng có thể là khi nghiên cứu toàn bộ tổng thể chung sẽ làm phá
vỡ hay ảnh hưởng hưởng đến việc nghiên cứu các tính chất của tổng thể chung. Chẳng
hạn như doanh nghiệp cần nghiên cứu thông tin phản hồi về chất lượng sản phẩm từ
phía khách hàng tiêu dùng, rõ ràng rằng doanh nghiệp không thể nào biết hết được số
lượng khách hàng của doanh nghiệp để tiến hành thu thập thông tin phân tích. Khi đó
người ta thường sử dụng một số phương pháp chọn mẫu thích hợp nào đó (chọn lặp,
chọn không lặp, chọn theo khối, chọn hệ thống...) để chọn một số phần tử từ tổng thể
chung để nghiên cứu. Những phần tử được chọn ra như thế được gọi là tổng thể mẫu.
1.2.3 Tiêu thức thống kê
Là khái niệm dùng để chỉ các đặc điểm đặc trưng của đơn vị tổng thể.
Ví dụ khi nghiên cứu nhân khẩu, mỗi nhân khẩu có các tiêu thức như: giới tính, độ
tuổi, trình độ học vấn, nghề nghiệp, dân tộc, tôn giáo Khi nghiên cứu các doanh
nghiệp, mỗi doanh nghiệp có các tiêu thức như: số lượng công nhân, giá trị tài sản cố
định, giá trị máy móc thiết bị, vốn đầu tư, doanh thu tiêu thụ sản phẩm, lợi nhuận
Tiêu thức thống kê có thể chia làm hai loại:
Tiêu thức thuộc tính: là tiêu thức phản ánh tính chất hay loại hình của đơn vị
tổng thể, không biểu hiện trực tiếp bằng các con số. Ví dụ như tiêu thức giới
tính, nghề nghiệp, tình trạng hôn nhân, dân tộc, thành phần kinh tế, nhóm sản
phẩmTiêu thức thuộc tính còn được gọi là chất lượng hay tiêu thức phi số
lượng.
Tiêu thức số lượng: là tiêu thức biểu hiện trực tiếp bằng các con số. Ví dụ
như chiều cao, trọng lượng con người, năng suất lao động, doanh số bán
hàng, mức lương, kim ngạch xuất-nhập khẩu Các trị số cụ thể khác nhau
3
của tiêu thức số lượng gọi là lượng biến. Lượng biến có thể phân thành hai
loại là lượng biến rời rạc và lượng biến liên tục.
1.2.4 Chỉ tiêu thống kê
Là chỉ sự biểu hiện một cách tổng hợp đặc điểm về mặt lượng trong sự thống nhất
mật thiết với mặt chất của tổng thể thống kê trong điều kiện thời gian và không gian
cụ thể.
Một chỉ tiêu thống kê luôn có hai mặt: Khái niệm và mức độ. Khái niệm bao gồm
định nghĩa và giới hạn về thực thể, chỉ rõ nội dung kinh tế xã hội của chỉ tiêu thống kê.
Mức độ phản ánh quy mô hoặc cường độ của hiện tượng.
Ví dụ: Tốc độ tăng trưởng kinh tế Việt Nam năm 2015 là 6,68%.
Theo Nghị định số 56/2009/NĐ-CP ngày 30/6/2009 của Chính phủ, doanh nghiệp
nhỏ và vừa là cơ sở kinh doanh đã đăng ký kinh doanh theo quy định pháp luật, được
chia thành ba cấp như sau:
Doanh
nghiệp
siêu nhỏ
Doanh nghiệp nhỏ Doanh nghiệp vừa
Số lao động
Tổng
nguồn vốn
Số lao
động
Tổng nguồn
vốn
Số lao động
I. Nông, lâm
nghiệp và
thuỷ sản
<10 người
20 tỷ
đồng trở
xuống
10 – 200
người
20 – 100 tỷ
đồng
200 – 300
người
II. Công
nghiệp và
xây dựng
< 10 người
20 tỷ
đồng trở
xuống
10 – 200
người
20 – 100 tỷ
đồng
200 – 300
người
III.Thương
mại và dịch
vụ
< 10 người
10 tỷ
đồng trở
xuống
10 – 50
người
10 – 50 tỷ
đồng
50 – 100
người
Chỉ tiêu thống kê được phân thành hai loại:
Chỉ tiêu khối lượng: là các chỉ tiêu biểu hiện quy mô của tổng thể. Ví dụ như
số doanh nghiệp quốc doanh, tổng sản phẩm quốc nội, số sinh viên đại học,
số diện tích gieo trồng... Chỉ tiêu khối lượng có ý nghĩa rất lớn đối với thực
tiễn như trong tiêu dùng, phân phối sản phẩm, kiểm tra tình hình thực hiện kế
hoạch...
Chỉ tiêu chất lượng: biểu hiện tính chất, trình độ phổ biến quan hệ so sánh
trong tổng thể, chẳng hạn như tốc độ phát triển kinh tế, mật độ dân số, giá
thành đơn vị sản phẩm, năng suất lao động, năng suất cây trồng...
1.2.5 Thang đo thống kê
4
Nói chung, thống kê dùng 4 loại thang đo cơ bản dưới đây:
1.2.5.1 Thang đo định danh (Nominal scale)
Là thang đo đánh số các biểu hiện cùng loại của tiêu thức thuộc tính.
Loại thang đo này thường được dùng với các tiêu thức thuộc tính mà các biểu hiện
của nó là một hệ thống các loại khác nhau không theo một trật tự xác định, chẳng hạn
như: giới tính, khu vực địa lý, nghề nghiệp, tôn giáo, sắc tộc...Người ta đánh số (mã
hóa) hoặc dùng ký tự để chỉ định cho từng loại, ví dụ như đối với tiêu thức giới tính ta
có hai loại nam và nữ, hơn nữa không có trật tự nào giữa hai loại này, biểu hiện nam
được đánh số 1 và nữ được đánh số 2.
Các con số không có quan hệ hơn kém, không thực hiện được các phép tính đại số,
chỉ dùng để mã hóa và đếm tần số.
1.2.5.2 Thang đo thứ bậc (Ordinal scale)
Là thang đo định danh nhưng giữa các biểu hiện của tiêu thức có quan hệ hơn
kém.
Thường dùng để đo các tiêu thức thuộc tính mà các biểu hiện có quan hệ thứ tự
như đo thái độ đối với một hành vi nào đó (hoàn toàn đồng ý, đồng ý, chưa quyết định,
hoàn toàn không đồng ý) hoặc thứ tự chất lượng sản phẩm, huân chương, bậc thợ...
Trong một số trường hợp thang đo thứ bậc có thể kết hợp với thang đo định danh
để hiểu rõ được khái niệm hơn. Chẳng hạn, để đánh số các biểu hiện của tiêu thức
tôn giáo có thể dùng thang đo định danh (1. Phật giáo, 2. Thiên chúa giáo, 3. Hồi giáo,
4. Đạo hinđu, 5. Đạo cao đài...). Tuy nhiên, để biểu hiện hành vi tôn giáo thì có thể
dùng thang đo thứ bậc. Chẳng hạn, bạn có dự hoạt động tôn giáo không: 1. Hàng ngày,
2. Hàng tuần, 3. Một vài tuần trong một tháng, 4. Hàng tháng, 5. Một vài lần trong
năm, 6. Hàng năm, 7. Không bao giờ.
Sự chênh lệch giữa các biểu hiện không nhất thiết là bằng nhau, không thực hiện
được các phép tính đại số, con số có trị số cao hơn không có nghĩa ớ bậc cao hơn mà là
do quy định, chẳng hạn như chất lượng sản phẩm loại 1 là tốt nhất nhưng bậc thợ càng
cao thì càng thể hiện trình độ chuyên môn tốt.
1.2.5.3 Thang đo khoảng (Interval scale)
Là thang đo thứ bậc có các khoảng cách đều nhau nhưng không có điểm gốc là 0.
Thang đo này được sử dụng cho các tiêu thức số lượng và luôn có đơn vị đo.
Ngoài ra, loại thang đo này chưa có điểm gốc là số 0 nên không so sánh được tỷ lệ
giữa các trị số đo. Ví dụ, khi đo nhiệt độ không khí, điểm quy ước tại đó nước đóng
băng là 0 độ (theo thang đo Celsius).
Thang đo này có thể thực hiện các phép tính đại số, và tính được các tham số đặc
trưng như trung bình, tỷ lệ, phương sai
1.2.5.4 Thang đo tỷ lệ (Ratio scale)
Là thang đo khoảng với một điểm gốc 0 tuyệt đối được coi như là điểm xuất phát
5
của độ dài đo lường trên thang đo.
Ví dụ: Thu nhập trung bình một tháng của ông A là 3 triệu đồng và thu nhập của bà B
là 6 triệu đồng, ta có thể nói rằng thu nhập trung bình trong một tháng của bà B gấp
đôi thu nhập của ông A.
Với các đặc điểm của thang đo tỷ lệ, ta có thể so sánh được tỷ lệ giữa các trị số đo.
Chẳng hạn các đơn vị đo lường vật lý thông thường (lít, kg, mét..), số lao động, số con,
số chiếc...
Đây là loại thang đo chặt chẽ nhất trong các loại thang đo vừa được giới thiệu, và
ta có thể thực hiện được tất cả các phép tính và phân tích số liệu.
Lưu ý rằng, theo thứ tự liệt kê các loại thang đo: thang đo định danh, thang đo thứ
bậc, thang đo khoảng, và thang đo tỷ lệ thì thang đo ở sau có chất lượng đo lường cao
hơn thang đo phía trước, hơn nữa việc xây dựng thang đo cũng phức tạp hơn. Tuy
nhiên, không phải thang đo có chất lượng đo lường cao hơn là tốt hơn mà tuỳ thuộc
vào đặc điểm của hiện tượng và tiêu thức nghiên cứu.
1.2.5.5 Một số kỹ thuật thiết kế thang đo
Thang đo tỷ lệ liên tục
Sử dụng thang đo khoảng để tạo ra các mục lựa chọn, người trả lời sẽ chọn một
mục để đánh dấu vào đó. Số mục là chẵn hay lẻ không có sự sai biệt gì đáng kể. Nếu
dùng số lẻ thì người trả lời hay có xu hướng “trung dung” bằng cách chọn mục ở giữa,
còn nếu dùng số chẵn thì người trả lời sẽ thể hiện nghiêng nhiều hơn về hướng một
hướng nào đó.
Ví dụ: Bạn ưa thích ngành học của mình ở mức độ nào:
□ Rất thích □ Khá thích □ Bình thường □ Không thích □ Rất ghét
Thang đo Likert (điều mục)
Đây là loại thang đo đơn giản và phù hợp với nhiều hoàn cảnh khác nhau. Loại này
đòi hỏi người được phỏng vấn cho biết thái độ của họ và điều mục đánh giá mà họ lựa
chọn. Các mục được sắp xếp theo một thứ tự nào đó.
Ví dụ: Với câu hỏi “ Bạn có thoả mãn với công việc mà bạn đang làm hiện nay
không?” có thể đặt các thang đo sau:
o Rất thoả mãn.
o Tương đối thoả mãn.
o Không quan tâm.
o Không được thoả mãn lắm.
o Rất khó chịu.
Thang đo này tuy đơn giản nhưng cần phải quan tâm đến một số vấn đề sau:
Số lượng điều mục: Cần có sự quyết định số mục lựa chọn tượng trưng cho thái
độ của người được phỏng vấn. Chẳng hạn, thang mục chỉ có 2 mục đối nhau
(đồng ý hay không đồng ý) mang tính chất của thang đo định danh rất khó cho
6
công việc phân tích nhưng có thể thích hợp khi bảng câu hỏi dài hoặc khi trình
độ văn hoá của người được hỏi có giới hạn. Mặt khác có thể sử dụng nhiều điều
mục để giúp cho người được hỏi có nhiều sự lựa chọn rộng rãi và cho phép đo
độ nhạy bén hơn. Một số nhà nghiên cứu cho rằng câu hỏi có 5 hoặc 6 mục trả
lời là phù hợp hơn cả.
Số điều mục trả lời không nên lẻ để tránh dẫn đến việc người trả lời có thái độ
trung dung với cách chọn câu trả lời ở giữa, và dễ đưa đến câu trả lời không
đúng sự thật. Số điều mục chẵn thì người được hỏi bắt buộc phải biểu lộ thái độ
của mình.
Không nên đặt câu trả lời lệch về một phía, vì điều này sẽ làm cho người trả lời
khó chọn. Ví dụ, với câu hỏi “đề nghị bạn cho biết tốc độ mau lẹ trong cung
cách phục vụ khách hàng” mà sử dụng các điều mục : tuyệt, rất tốt, tốt, trên
trung bình, trung bình thì sẽ rất không thích hợp cho người không thích cung
cách phục vụ ấy.
Thang đo xếp hạng theo thứ tự
Loại thang đo này cho phép so sánh các điều mục trả lời trong khi 2 thang đo trước
không thể so sánh được vì ở hai loại thang đo trên người được hỏi xét đoán không dựa
vào căn cứ cụ thể nào cả. Đối với loại thang đo xếp hạng theo thứ tự, người được hỏi
sắp xếp hạng các mục trả lời theo thứ tự mà họ đánh giá. Ví dụ: Để nâng cao chất
lượng học tập của sinh viên, nhà trường đã sử dụng các biện pháp sau đây:
o Điểm danh thường xuyên ở lớp.
o Kiểm tra bài thường xuyên.
o Quy chế thi nghiêm túc.
o Học bổng có nhiều mức theo theo kết quả thi từng học kỳ.
o Cho nhiều chuyên đề nghiên cứu và bài tập lớn.
o Nộp chi phí cao khi phải thi lại.
Hãy xếp thứ tự các biện pháp trên từ phương pháp hiệu quả nhất theo thứ tự từ 1
đến 6?
Loại thang đo này tuy đơn giản, dễ trả lời song cũng có những nhược điểm là:
Khó liệt kê được đầy đủ các trường hợp nên dữ liệu thu thập thiếu chính
xác.
Vì nhấn mạnh vào việc xếp thứ tự nên có thể ảnh hưởng đến câu trả lời,
đặc biệt là mục thứ nhất và mục chót thường được quan tâm nhiều hơn.
Khi hỏi để xếp hạng những mục hoàn toàn nằm ngoài ý thích của người
được hỏi thì những câu trả lời sẽ không có ý nghĩa.
Thang đo có tổng số điểm không đổi
Thang điểm có tổng không đổi cung cấp một sự nhận thức tổng quát tốt hơn về
khoảng cách giữa các điểm trên giải thang điểm. Đối với thang điểm này, người được
7
hỏi cần chia hoặc xác định một số điểm có tổng không đổi (thường là 100) để biểu thị
sự quan trọng tương đối của những đặc điểm được nghiên cứu. Số điểm được chia cho
mỗi điều mục chỉ rõ hạng bậc của nó và đồng thời cũng chỉ rõ sự khác biệt giữa các
điều mục với nhau. Cũng vẫn với ví dụ trên, chia 100 điểm cho các biện pháp theo tầm
quan trọng của mỗi biện pháp.
Thang điểm này còn một số tồn tại sau: Thứ nhất, không thể chắc chắn là liệu
những kết quả có biểu thị đúng với khoảng cách và tỷ lệ hay không. Thứ hai, nếu có
quá nhiều đặc điểm thì việc chia điểm cũng gặp khó khăn.
Thang đo có hai cực đối nghịch nhau
Được biểu hiện dưới dạng một dãy số liên tục từ 1 đến 5, hoặc từ 1 đến 7, hoặc từ -
3 đến +3, trong đó hai cực của thang đo này luôn đối lập nhau về mặt ngữ nghĩa. Dữ
liệu thu được trong thang đo này thường được phân tích dưới dạng điểm trung bình
của tất cả mẫu nghiên cứu theo từng nội dung được hỏi.
Ví dụ, hãy nêu các nhận định của bạn về các mặt sau đây của nhà hàng A. Hãy
khoanh tròn số tương ứng với sự lựa chọn của bạn:
Sạch 1 2 3 4 5 6 7 Bẩn
Rẻ 1 2 3 4 5 6 7 Đắt
Phục vụ nhanh 1 2 3 4 5 6 7 Phục vụ chậm
Ngon 1 2 3 4 5 6 7 Dở
Ngoài các thang đo cơ bản trên còn có nhiều cách đặt thang đo nữa, chẳng hạn như
thang đo so sánh từng cặp, thang đo Q-sort, thang đo Stapel tuỳ thuộc vào kỹ thuật
của các nhà nghiên cứu. Tuy vậy, mỗi thang đo đều có ưu nhược điểm riêng, do đó
người nghiên cứu phải biết lựa chọn loại thang đo nào thích hợp nhất, có khả năng đáp
ứng tốt nhất những nhu cầu thông tin với chi phí thấp nhất, phương pháp truyền đạt dễ
hiểu, dễ trả lời.
1.2.6 Bảng câu hỏi (phiếu điều tra)
Khái niệm bảng câu hỏi
Bảng câu hỏi là một công cụ dùng để thu thập dữ liệu, bao gồm một tập hợp các
câu hỏi và các câu trả lời được sắp xếp theo logic nhất định, là phương tiện dùng để
giao tiếp giữa người thu thập số liệu và người cung cấp thông tin.
Các bước cơ bản sau đây để thiết kế một bảng câu hỏi
Bước 1: Xác định mục đích, nội dung, đối tượng nghiên cứu
Bước 2: Xác định phương pháp phỏng vấn
Bước 3: Phác thảo nội dung bảng câu hỏi
Bước 4: Chọn dạng cho các câu hỏi (câu hỏi đóng hoặc câu hỏi mở)
Câu hỏi mở là dạng câu hỏi mà người cung cấp thông tin có thể tùy chọn phương
án và cách thức trả lời. Loại câu hỏi này thường được dùng khi người nghiên cứu
8
muốn có những thăm dò ngoài giả thiết ban đầu về vấn đề nghiên cứu. Người ta
thường sử dụng một cách hạn chế các câu hỏi mở vì việc xử lý các thông tin từ loại
câu hỏi này phức tạp và ít hiệu quả.
Câu hỏi đóng là dạng câu hỏi mà người khảo sát đã định sẵn các phương án trả lời,
nhằm tập trung vào việc thỏa mãn mục đích nghiên cứu, tạo điều kiện cho việc tập hợp
và xử lý thông tin đơn giản hơn, bao gồm 4 dạng cơ bản sau: Câu hỏi với câu trả lời
có dạng: “ có hoặc không”. Câu hỏi xếp hạng thứ tự là dạng câu hỏi mà ta đưa ra sẵn
các phương án trả lời, và để cho người trả lời lựa chọn, so sánh và xếp hạng chúng
theo thứ tự. Câu hỏi đánh dấu tình huống trong danh sách là dạng câu hỏi mà ta đưa
ra sẵn các phương án trả lời, và người trả lời sẽ đánh dấu vào những mục phù hợp với
họ. Câu hỏi dạng bậc thang là dạng câu hỏi có sử dụng thang đo thứ bậc hoặc thang
đo khoảng để hỏi về mức độ đồng ý hay phản đối, mức độ thích hay ghét của người trả
lời về một vấn đề nào đó.
Bước 5: Xác định từ ngữ thích hợp cho bảng câu hỏi
- Nên dùng từ ngữ quen thuộc, tránh dùng tiếng lóng hoặc từ chuyên môn.
- Nên dùng từ ngữ dễ hiểu, để mọi người ở bất cứ trình độ nào cũng có thể hiểu
được.
- Tránh đưa ra câu hỏi quá dài.
- Tránh đặt câu hỏi mơ hồ, không rõ ràng.
- Tránh đưa ra câu hỏi quá cụ thể.
- Tránh hỏi trực tiếp những vấn đề riêng tư.
- Tránh đưa ra câu hỏi quá cường điệu.
- Tránh đặt câu hỏi có gợi ý sẵn câu trả lời.
- Tránh đặt câu hỏi dựa theo giá trị xã hội đã được xác nhận.
Bước 6: Xác định cấu trúc bảng câu hỏi
- Nên sắp xếp các câu hỏi theo trình tự hợp lý.
- Nên chia vấn đề lớn thành nhiều vấn đề nhỏ hơn để hỏi.
- Nên tuân theo trình tự về tâm lý: Hỏi cái chung rồi mới đến cái riêng, những câu
hỏi ít gây hứng thú nên hỏi cuối cùng, nên theo trình tự để khơi gợi trí nhớ về các sự
việc đã qua.
Bước 7: Thiết kế việc trình bày bảng câu hỏi
Cần quan tâm đến việc in ấn, trình bày bảng câu hỏi để tạo tâm lý thiện cảm, thoải
mái và lôi cuốn người cấp tin.
Bước 8: Điều tra thử để kiểm tra bảng câu hỏi
Về nguyên tắc, một bảng câu hỏi cần phải được áp dụng thử để kiểm tra trước khi
thực hiện phỏng vấn chính thức. Việc điều tra được tiến hành trên một mẫu nhỏ được
chọn ra từ tổng thể cần nghiên cứu, để xem người trả lời có hiểu và trả lời đúng hay
không, để xem người điều tra có làm tốt nhiệm vụ hay không, để xem thông tin được
9
thu thập như thế nào, và để xác định thời gian cho thực hiện phỏng vấn một người. Sau
khi điều tra thử sẽ xử lý và phân tích dữ liệu để qua đó tiến hành chỉnh sửa, loại bỏ
hoặc bổ sung câu hỏi nhằm hoàn thiện phiếu điều tra.
Cũng cần lưu ý thêm rằng, trong đa số các trường hợp, việc giải thích nội dung
thông tin cần thu thập và các khái niệm có liên quan không thực hiện được ngay trong
bảng câu hỏi. Khi đó người ta sử dụng sổ tay điều tra. Một sổ tay điều tra cần được
soạn thảo với mức chi tiết cao nhất có thể. Đối với các cuộc điều tra do Nhà nước tổ
chức, các tài liệu hướng dẫn luôn được soạn thảo đi kèm để giải thích đầy đủ các nội
dung trong phiếu điều tra, chẳng hạn như tài liệu hướng dẫn về điều tra doanh nghiệp
2015.
1.2.7 Dữ liệu thống kê
Dữ liệu thống kê là các sự kiện và số liệu được thu thập, tổng hợp và phân tích để
trình bày và giải thích ý nghĩa của chúng. Tất cả các dữ liệu được thu thập trong một
nghiên cứu cụ thể được gọi là bộ dữ liệu phục vụ cho cuộc nghiên cứu đó.
Các loại dữ liệu thống kê
Dữ liệu thống kê được chia làm hai loại: dữ liệu định tính và dữ liệu định lượng.
Dữ liệu định tính bao gồm các nhãn hay tên gọi được sử dụng để xác định đặc
điểm của đơn vị tổng thể, và được đo lường bởi thang đo định danh hoặc thang đo thứ
bậc. Dữ liệu định tính thường được mã hóa bằng những con số, có tác dụng giúp đếm
tần số hay tần suất, việc thực hiện các phép tính đại số trên các số này không có ý
nghĩa thống kê.
Dữ liệu định lượng bao gồm các giá trị bằng con số cụ thể, và được đo lường bởi
thang đo khoảng hoặc thang đo tỷ lệ. Đối với dữ liệu định lượng, ta có thể thực hiện
các phép tính đại số cũng như sử dụng nhiều phương pháp phân tích thống kê khác
nhau trên đó để thu được những thông tin thống kê có ý nghĩa.
Các nguồn dữ liệu thống kê
Khi nghiên cứu một hiện tượng cụ thể, người nghiên cứu có thể sử dụng dữ liệu từ
nguồn dữ liệu đã có sẵn. Dựa vào cách thức này, người ta chia dữ liệu thành hai loại
chủ yếu: dữ liệu thứ cấp và dữ liệu sơ cấp.
Dữ liệu thứ cấp: là các thông tin có sẵn, đã qua tổng hợp và xử lý. Loại dữ kiện này có
thể thu thập từ các ấn phẩm nhà nước như Niên giám thống kê, từ các tạp chí chuyên
ngành như Tạp chí Con số và Sự kiện của Tổng cục Thống kê
Ngoài ra, với sự phát triển về khoa học và công nghệ như hiện nay, mạng internet
chính là nơi lưu trữ nguồn dữ liệu thứ cấp khổng lồ mà chúng ta được phép truy cập để
sử dụng. Hầu hết các công ty đều có trang web riêng để cung cấp những thông tin cơ
bản đối với công ty của mình về doanh số, số nhân viên, số lượng sản phẩm, giá sản
phẩm, đặc điểm của sản phẩm.
10
Mặt khác, các cơ quan nhà nước cũng có các trang web riêng, cung cấp các dữ liệu
thứ cấp tương đối đầy đủ, chẳng hạn như trang web của Tổng cục Thống kê
( trang web của Bộ Lao động - Thương binh Xã hội
( Vì vậy, chúng ta có thể khai thác các dữ liệu từ nguồn tài liệu
phong phú này để phục vụ cho việc nghiên cứu thống kê.
Dữ liệu thứ cấp có ưu điểm là có thể chia sẻ chi phí, do đó nó có tính kinh tế hơn,
số liệu được cung cấp kịp thời hơn. Tuy nhiên, dữ liệu thứ cấp thường là các thông tin
cơ bản, số liệu đã được tổng hợp đã qua xử lý nên không đầy đủ hoặc không phù
hợp cho quá trình nghiên cứu. Dữ liệu thứ cấp thường ít được sử dụng để dự báo trong
thống kê, số liệu này thường được sử dụng trong trình bày tổng quan nội dung nghiên
cứu, là cơ sở để phát hiện ra vấn đề nghiên cứu. Ngoài ra, dữ liệu thứ cấp còn được sử
dụng để đối chiếu lại kết quả nghiên cứu để nhằm kiểm tra lại tính đúng đắn hoặc phát
hiện ra những vấn đề mới để có hướng nghiên cứu tiếp.
Dữ liệu sơ cấp: trong nhiều trường hợp, dữ liệu cần cho phân tích thống kê không có
sẵn từ nguồn dữ liệu thứ cấp. Khi đó để có dữ liệu, ta cần phải trực tiếp thực hiện các
cuộc điều tra thống kê như được trình bày trong chương 2.
1.3 Các phương pháp thống kê
Các phương pháp thống kê có thể được chia thành hai nhóm phương pháp: thống kê
mô tả và thống kê suy diễn.
Thống kê mô tả: bao gồm các phương pháp có liên quan đến việc thu thập số liệu, mô
tả và trình bày dữ liệu bằng bảng và đồ thị, tính toán các đặc trưng của dữ liệu như giá
trị trung bình, giá trị mốt nhằm phản ánh một cách tương đối đầy đủ về đối tượng
nghiên cứu.
Thống kê suy luận: bao gồm các phương pháp ước lượng các đặc trưng của tổng thể,
kiểm định các giả thuyết thống kê, phân tích mối liên hệ giữa các hiện tượng nghiên
cứu, dự đoán hoặc ra quyết định trên cơ sở thông tin thu thập từ kết quả quan sát trên
tổng thể mẫu.
Cụ thể:
Thu thập và xử lý số liệu: Số liệu thu thập thường rất nhiều và hỗn độn, các dữ
liệu đó chưa đáp ứng cho quá trình nghiên cứu. Để có hình ảnh tổng quát về
tổng thể nghiên cứu, số liệu thu thập phải được xử lý như: tổng hợp, trình bày,
tính toán các số đo; kết quả có được sẽ giúp khái quát được đặc trưng của tổng
thể.
Nghiên cứu các hiện tượng trong điều kiện không chắc chắn: Trong thực tế, có
nhiều hiện tượng mà thông tin liên quan đến đối tượng nghiên cứu không đầy
đủ, chẳng hạn như nghiên cứu về nhu cầu của thị trường về một loại sản phẩm
ở mức độ nào, tình trạng của nền kinh tế ra sao, để nắm được các thông tin này
một cách rõ ràng quả là một điều không chắc chắn.
11
Điều tra chọn mẫu
Trong một số trường hợp, việc nghiên cứu toàn bộ tất cả các đơn cần điều tra
của tổng thể là một điều không khả thi hoặc không hiệu quả, xét cả về mặt kinh
tế (chi phí, thời gian) và thời hạn báo cáo (báo cáo kịp thời, đúng tiến độ).
Chính điều này đã đặt ra cho thống kê xây dựng các phương pháp chỉ cần
nghiên cứu đặc điểm, tính chất các đơn vị trong một bộ phận của tổng thể (tổng
thể mẫu), ta có thể suy luận ra đặc điểm, tính chất chung cho cả tổng thể mà vẫn
đảm bảo độ tin cậy cho phép.
Nghiên cứu mối liên hệ giữa các hiện tượng
Giữa các hiện tượng nghiên cứu thường có mối liên hệ với nhau. Ví dụ như mối
liên hệ giữa chi tiêu và thu nhập; mối liên hệ giữa lượng vốn vay và các yếu tố
tác động đến lượng vốn vay như chi tiêu, thu nhập, trình độ học vấn; mối liên
hệ giữa tốc độ phát triển với tốc độ phát triển của các ngành, lạm phát, tốc độ
phát triển dân sốSự hiểu biết về mối liên hệ giữa các hiện tượng rất có ý
nghĩa, phục vụ cho quá trình dự báo.
Dự báo: Sử dụng phương pháp phân tích định lượng hoặc phương pháp phân
tích định tính để dự báo trạng thái tương lai của các hiện tượng kinh tế - xã hội
dựa vào tài liệu thống kê. Tuy nhiên, ngày nay, người ta chủ yếu sử dụng
phương định lượng để dự báo với mục đích cung cấp cho những nhà quản lý cái
nhìn mang tính khoa học hơn và cụ thể hơn trước khi ra quyết định phù hợp.
Các phương pháp định lượng như: Phương pháp hàm hồi quy, phương pháp
hàm xu thế và biến động thời vụ, phương pháp san bằng mũ thường được sử
dụng trong dự báo thống kê.
12
Câu hỏi ôn tập:
1. Đối tượng nghiên cứu của thống kê học là gì?
2. Dữ liệu thống kê là gì? Các loại dữ liệu thống kê và nguồn dữ liệu thống kê?
3. Phân biệt thống kê mô tả và thống kê suy luận (phân tích).
4. So sánh các loại thang đo khác nhau, cho ví dụ minh họa.
5. Phiếu điều tra là gì? Nêu những lưu ý quan trọng khi xây dựng phiếu điều tra,
cho ví vụ minh họa.
6. Lượng biến của các tiêu thức sau đây thuộc loại nào?
a. Năng suất lao động tính bằng tạ/ha.
b. Số lượng công nhân của doanh nghiệp.
c. Thời gian thắp sáng của bóng đèn.
d. Mức độ phần trăm hoàn thành kế hoạch sản lượng.
e. Số doanh nghiệp của một tỉnh.
f. Bậc thợ của công nhân.
g. Cân nặng của trẻ sơ sinh tại một bệnh viện.
h. Thu nhập của nhân viên trong một công ty.
i. Số sinh viên tại một trường đại học.
j. Vốn điều lệ của một ngân hàng.
7. Các câu sau đây đúng hay sai, nếu sai hãy giải thích.
a. Thang đo khoảng là thang đo cao nhất trong các loại thang đo.
b. Lượng biến về tuổi tác là một ví dụ của tiêu thức thuộc tính.
c. Chiều cao của sinh viên là lượng biến liên tục.
d. Thời gian bay từ Hà Nội đến Quy Nhơn là lượng biến rời rạc.
e. Thu nhập là thang đo khoảng.
13
Chương 2
ĐIỀU TRA THỐNG KÊ
Từ việc nghiên cứu những hiện tượng số lớn, để các con số có thể nói lên được bản
chất, quy luật phát triển của hiện tượng, việc nghiên cứu thống kê luôn phải trải qua
nhiều giai đoạn có mối quan hệ chặt chẽ với nhau từ việc thu thập thông tin, tổng hợp
số liệu đến việc phân tích số liệu. Do đó có thể nói một quá trình nghiên cứu thống kê
gồm ba giai đoạn chính: điều tra thống kê (thu thập số liệu), tổng hợp thống kê (xử lý
số liệu), phân tích và dự báo. Chương này trình bày nội dung về điều tra thống kê.
2.1 Khái niệm về điều tra thống kê
Điều tra thống kê là việc tổ chức một cách khoa học dựa trên kế hoạch thống nhất
việc thu thập, ghi chép các tài liệu thống kê theo mục đích, yêu cầu nghiên cứu đối với
hiện tượng và quá trình kinh tế - xã hội trong điều kiện thời gian và không gian cụ thể.
Ví dụ: Ở nước ta, cuộc tổng điều tra dân số được tiến hành 10 năm một lần. Để thực
hiện nhiệm vụ này, các bộ phận chuyên trách và các đơn vị liên quan phải xây dựng kế
hoạch và phương án điều tra hết sức cụ thể như việc tổ chức tuyên truyền để người dân
hiểu rõ mục đích, ý nghĩa của cuộc điều tra để khai báo trung thực, chính xác; phải tổ
chức nhiều tổ điều tra và tập huấn cho nhân viên điều tra cách phỏng vấn, ghi chép số
liệu; thiết kế phiếu điều tra, xây dựng phần mềm dùng để nhập và xử lý số liệu; chuẩn
bị kinh phí cần thiết cho cuộc điều tra; xác định thời điểm và thời gian điều tra Việc
xây dựng kế hoạch và phương án điều tra phải có căn cứ khoa học và đòi hỏi trình độ
tổ chức cao.
Nhiệm vụ của điều tra thống kê là thu thập và cung cấp thông tin về các đơn vị
tổng thể cho các khâu tiếp theo của quá trình nghiên cứu thống kê. Do đó để cho việc
thực hiện các giai đoạn nghiên cứu thống kê tiếp theo có hiệu quả và đáp ứng được các
yêu cầu đề ra thì các tài liệu điều tra phải có chất lượng. Do vậy các yêu cầu như: thích
đáng, chính xác, khách quan, trung thực, kịp thời và đầy đủ là không thể thiếu trong
điều tra thống kê.
Thích đáng: Số liệu thu thập phải phù hợp, đáp ứng được mục đích nghiên cứu. Số
liệu đáp ứng được mục tiêu nghiên cứu có tính chất trực tiếp hoặc gián tiếp. Đối với
những thông tin dễ tiếp cận thường thì ta sử dụng số liệu trực tiếp, ví dụ muốn biết
được nhu cầu của khách hàng chúng ta có thể hỏi trực tiếp khách hàng. Tuy nhiên, một
số nội dung nghiên cứu mang tính chất nhạy cảm hoặc khó thu thập thì chúng ta có thể
thu nhập những số liên quan gián tiếp, ví dụ để thu thập thu nhập của cá nhân chúng ta
có thể thu thập những nội dung có liên quan như nghề nghiệp, đơn vị công tác, chức
vụ, nhà ở, phương tiện đi lại...
Chính xác: Các thông tin trong quá trình nghiên cứu phải có giá trị, đáng tin cậy để
các phân tích, kết luận phản ánh đúng đặc điểm bản chất của hiện tượng. Vì vậy điều
14
tra viên phải có trình độ chuyên môn và tinh thần trách nhiệm.
Khách quan: Có nghĩa là các tài liệu thu thập được phải phản ảnh đúng đắn tình hình
thực tế khách quan của hiện tượng nghiên cứu. Điều này đòi hỏi việc ghi chép phải
khách quan, không được tùy tiện thêm bớt, không được sao chép một cách tùy hứng,
không được suy luận theo ý muốn chủ quan của bất kỳ một tổ chức hay cá nhân nào.
Trung thực: Yêu cầu này đòi hỏi người thu thập thông tin phải tuyệt đối trung thực,
ghi chép đúng những gì đã được nghe, được thấy. Đối với người cung cấp thông tin,
đòi hỏi họ phải cung cấp thông tin xác thực, không được che giấu và khai man thông
tin.
Kịp thời: Tài liệu ghi chép được phải mang tính thời sự, phục vụ các yêu cầu nghiên
cứu đúng lúc cần thiết. Trong quản lý kinh tế, yêu cầu này giúp cho nhà quản lý ra các
quyết định chuẩn xác, mang lại lợi ích kinh tế cao. Ngoài ra, việc cung cấp thông tin
cũng phải đảm bảo đúng hạn quy định của phương án điều tra.
Đầy đủ: Có nghĩa là tài liệu thu thập được theo đúng nội dung và số đơn vị tổng thể đã
quy định trong văn bản điều tra, có như vậy mới đáp ứng được mục đích nghiên cứu.
2.2 Các loại điều tra thống kê
Ta có sơ đồ về các loại điều tra thống kê như sau:
2.2.1 Điều tra thường xuyên: là tiến hành thu thập thông tin một cách thường xuyên
của hiện tượng nghiên cứu, được áp dụng với hiện tượng nghiên cứu có sự biến động
liên tục. Tài liệu có được từ loại điều tra này là cơ sở để lập các báo cáo thống kê định
kỳ, để theo dõi tình hình thực hiện kế hoạch. Ví dụ như chấm công hàng ngày số công
nhân đi làm tại một xí nghiệp, ghi chép số sản phẩm xuất nhập kho hàng ngày, ghi
chép số lượng nguyên vật liệu nhập kho
2.2.2 Điều tra không thường xuyên: là chỉ tiến hành thu thập thông tin của hiện
tượng nghiên cứu khi thấy cần thiết, được áp dụng cho những hiện tượng nghiên cứu ít
biến động, biến động chậm, hoặc không cần theo dõi thường xuyên. Ví dụ như điều tra
dân số, điều tra mức sống dân cư, điều tra cơ sở kinh tế, hành chính, sự nghiệp, điều
tra nhu cầu nhà ở của dân cư, điều tra dư luận xã hội Hình thức chủ yếu của loại
15
điều tra này là các cuộc điều tra chuyên môn. Để thuận tiện cho việc so sánh, phân tích
sự biến động của hiện tượng theo thời gian, các cuộc điều tra không thường xuyên
cũng được tiến hành lặp đi lặp lại theo một chu kỳ nhất định và người ta kế thừa các
kết quả của cuộc điều tra trước nếu nó vẫn còn sử dụng được.
2.2.3 Điều tra toàn bộ: là tiến hành thu thập thông tin đối với tất cả các đơn vị của
tổng thể. Ví dụ như điều tra tài sản, điều tra dân số, điều tra hàng hóa, vật tư tồn
khoTài liệu có được qua điều tra toàn bộ là khá đầy đủ và toàn diện, giúp cho việc
tính toán các chỉ tiêu một cách chính xác. Do đó, tuy loại điều tra này đòi hỏi chi phí
cao nhưng nó đem lại lợi ích rất lớn trong nghiên cứu thống kê.
2.3.4 Điều tra không toàn bộ: là tiến hành thu thập thông tin từ một số đơn vị được
chọn ra từ tổng thể chung. Các đặc trưng có được từ kết quả điều tra này dùng để suy
rộng ra cho tổng thể chung. Điều tra không toàn bộ được sử dụng khá phổ biến trong
nghiên cứu thống kê hiện nay, giúp tiết kiệm được chi phí và thời gian, làm cho chất
lượng các tài liệu thu được tốt hơn.
Điều tra chọn mẫu là loại điều tra thống kê không toàn bộ mà trong đó một số đơn vị
được chọn ra đủ lớn theo những nguyên tắc nhất định (thường thì làm theo nguyên tắc
ngẫu nhiên), đảm bảo tính đại diện cho tổng thể chung để điều tra thực tế và dựa vào
kết quả điều tra được có thể tính toán suy rộng cho toàn bộ tổng thể chung. Ví dụ như
điều tra chất lượng của sản phẩm đồ hộp, điều tra năng suất cây trồng, điều tra giá cả
thị trường, điều tra đời sống dân cư
Điều tra trọng điểm là loại điều tra không toàn bộ, chỉ tiến hành điều tra ở bộ phận
chủ yếu nhất, có đặc điểm nổi bật nhất của tổng thể nhằm nghiên cứu tính chất điển
hình của hiện tượng. Kết quả điều tra không được dùng để suy rộng các đặc trưng đó
cho tổng thể chung. Loại điều tra này thích hợp với những đối tượng có các bộ phận
tương đối tập trung, chiếm tỷ trọng lớn trong tổng thể. Ví dụ như để điều tra sản lượng
cây chè, ta chỉ cần thu thập về loại cây này ở các vùng có số lượng lớn như Thái
Nguyên, Bảo Lộc
Điều tra chuyên đề là loại điều tra chỉ được tiến hành trên một số rất ít đơn vị tổng
thể. Do đó có thể đi sâu thu thập thông tin trên nhiều tiêu thức. Kết quả điều tra không
được dùng để suy rộng hoặc làm căn cứ để đánh giá tổng thể chung. Kết quả phân tích
tài liệu trong điều tra chuyên đề dùng để nghiên cứu những vấn đề mới phát sinh,
nghiên cứu kinh nghiệm của các đơn vị tiên tiến hoặc phân tích tìm ra nguyên nhân
yếu kém của các đơn vị lạc hậu. Ví dụ như điều tra hiệu quả của thâm canh một số loại
cây trồng, điều tra về năng suất lao động, giá thành sản phẩm, chất lượng sản phẩm
2.3 Hình thức tổ chức thu thập thông tin
Có hai hình thức thu thập thông tin thống kê chủ yếu: báo cáo thống kê định kỳ và
điều tra chuyên môn.
16
2.3.1 Báo cáo thống kê định kỳ
Là hình thức thu thập thông tin thống kê theo chế độ báo cáo thống kê do cơ quan
Nhà nước có thẩm quyền ban hành.
Báo cáo thống kê bao gồm:
Phần tên gọi của báo cáo, cơ quan ban hành, đơn vị báo cáo, thời gian định kỳ
lập và gởi báo cáo, cơ quan chủ quản nhận báo cáo, chữ ký của người lập báo cáo,
chữ ký của trưởng đơn vị báo cáo
Phần trình bày chỉ tiêu, tiêu thức và số liệu tổng hợp, tính toán theo yêu cầu
báo cáo.
Dưới đây là biểu báo cáo hàng tháng của các doanh nghiệp nhà nước có hoạt động
sản xuất công nghiệp và biểu báo cáo tháng hoạt động xuất khẩu hàng hóa ban hành
theo Quyết định số 156/2003/QĐ-TCTK ngày 13/3/2003 của Tổng cục trưởng Tổng
cục Thống kê hiện đang sử dụng:
- Biểu số 01 - ĐTDN
Ban hành theo Quyết định số
156/2003/QĐ-TCTK ngày
13/3/2003 của Tổng cục
trưởng Tổng cục Thống kê
- Ngày nhận báo cáo:
Ngày 08 sau tháng báo cáo
BÁO CÁO
HOẠT ĐỘNG SẢN XUẤT CÔNG GHIỆP
Áp dụng đối với doanh nghiệp hoạt động....
Tháng ..... năm 201....
- Đơn vị gởi:..............................
- Đơn vị nhận báo cáo:
+ Cục Thống kê tỉnh ..
+ Ban quản lý.
+ Đơn vị chủ quản
Tên doanh nghiệp: .............................................................Số điện thoại:......................
Địa chỉ: - Huyện (Quận)................................................................
- Tỉnh (Thành phố) ......................................................
Loại hình: DNNN 1 DN Ngoài NN 2 DN có vốn ĐT nước ngoài 3
1. Sản xuất, tiêu thụ, tồn kho sản phẩm:
Ghi chú: Cột A ghi theo danh mục sản phẩm quy định của từng ngành.
2. Doanh thu thuần của hoạt động sản xuất công nghiệp: Đơn vị tính: Triệu đồng
Mã số
Thực
hiện
tháng
Cộng dồn từ
đầu năm đến
cuối tháng
Dự tính thực
hiện tháng
tiếp theo
Tên sản phẩm
Mã sản
phẩm
Đơn vị
tính sản
phẩm
Tồn
kho
đầu
tháng
báo
cáo
Sản
phẩm SX
trong
tháng
báo cáo
Tiêu thụ trong tháng
báo cáo
Xuất kho
cho chế
biến tiếp
trong
doanh
nghiệp
Dự tính
sản
phẩm
SX
tháng
tiếp
theo
Sản phẩm
SX cộng
dồn từ đầu
năm đến
cuối kỳ báo
cáo
Số
lượng
sản
phẩm
Giá trị
sản phẩm
(triệu
đồng)
A B C 1 2 3 4 5 6 7
- SP . . . . . . . . .
- SP . . . . . . . . .
- SP . . . . . . . . .
17
báo
cáo
báo cáo
A B 1 2 3
6.1 Doanh thu thuần của hoạt động SX công nghiệp 01
6.2 Thuế và các khoản phải nộp nhà nước 02
3. Số ngày hoạt động trong tháng của doanh nghiệp: ngày
4. Tình hình sản xuất trong tháng (ghi tóm tắt những khó khăn, thuận lợi chính):
.......................................................................................................................................................
Người ghi phiếu
(Ký, ghi rõ họ tên)
Điều tra viên
(Ký, ghi rõ họ tên)
Ngày ... tháng ... năm 201.
Giám đốc doanh nghiệp
(Ký, đóng dấu)
- Biểu 01e/CS
Ban hành theo Quyết định số
156/2003/QĐ-TCTK ngày
13/3/2003 của Tổng cục trưởng
Tổng cục Thống kê
- Ngày nhận báo cáo: Ngày 12
tháng sau tháng báo cáo
BÁO CÁO THÁNG
HOẠT ĐỘNG XUẤT KHẨU
HÀNG HÓA
(Áp dụng đối với doanh nghiệp có
hoạt động xuất khẩu hàng hóa)
(Tháng......./..............)
Đơn vị nhận báo cáo:
- Cục Thống kê tỉnh
- Ban quản lý..
- Đơn vị chủ quản
Mã số thuế của doanh nghiệp
1. Tên doanh nghiệp: .......................................................................................................................
2. Ngành sản xuất kinh doanh chính: .......................................................................................
3. Loại hình doanh nghiệp: ............................................................................................................
Mã số
Đơn vị
tính
Thực hiện
tháng báo cáo
Cộng dồn
Từ đầu năm đến
cuối tháng báo cáo
Dự tính
tháng tiếp theo
Lượng
Giá trị
(1.000USD)
Lượng
Giá trị
(1.000USD)
Lượng
Giá trị
(1.000USD)
A B C D 1 2 3 4 5 6
TỔNG GIÁ TRỊ (1+2) (FOB) 1.000USD
1 Xuất khẩu trực tiếp "
Tr.đó:XK ủy thác cho DN khác "
Mặt hàng/nước hàng đến (*)
- Mặt hàng...../nước....... Ghi theo
đơn vị tính
của hàng
hóa
Tr.đó:XK ủy thác cho DN khác
- Mặt hàng....../nước......
Tr.đó:XK ủy thác cho DN khác
.........
2 Ủy thác xuất khẩu 1.000USD
Mặt hàng (*)
.........
Ngày ....... tháng ....... năm ..............
Người lập biểu
(Ký, ghi rõ họ tên)
Người kiểm tra biểu
(Ký, ghi rõ họ tên)
Giám đốc doanh nghiệp
(Ký, đóng dấu)
18
2.3.2 Điều tra chuyên môn
Là hình thức tổ chức thu thập thông tin thống kê một cách không thường xuyên,
được tiến hành theo một kế hoạch và phương pháp quy định riêng cho mỗi lần điều
tra. Đối tượng được tổ chức điều tra chuyên môn là những hiện tượng nghiên cứu
không có yêu cầu theo dõi thường xuyên, hoặc quá tốn kém khi thực hiện thu thập tài
liệu thường xuyên liên tục, hoặc những hiện tượng tuy có biến động theo thời gian
nhưng chậm hoặc không quá lớn, hoặc những hiện tượng xảy ra bất thường.
Điều tra chuyên môn khác với báo cáo thống kê ở hai điểm: một là, không thường
xuyên tổ chức thu thập thông tin thống kê, mà chỉ thực hiện mỗi khi cần thiết; hai là,
mỗi lần tổ chức thu thập thông tin được tiến hành theo kế hoạch, phương pháp và nội
dung điều tra riêng. Ví dụ như tổng điều tra dân số, điều tra giá cả thị trường, điều tra
nhu cầu nhà ở, tổng điều tra tài sản cố định, điều tra hàng hóa, vật tư tồn kho, điều tra
thiệt hại bão lũ, thiên tai
Trong điều kiện kinh tế thị trường hiện nay, các cuộc điều tra chuyên môn ngày
càng có vai trò quan trọng trong việc thu thập các tài liệu thống kê. Tuy nhiên, muốn
thực hiện có hiệu quả các cuộc điều tra loại này, chúng ta cần xây dựng các phương án
điều tra hết sức chi tiết và toàn diện.
2.4 Phương pháp thu thập thông tin thống kê
Có hai phương pháp thu thập thông tin thống kê chủ yếu: phương pháp trực tiếp và
phương pháp gián tiếp.
2.4.1 Phương pháp trực tiếp
Là phương pháp điều tra để thu thập tài liệu thống kê ban đầu, trong đó nhân viên
thống kê trực tiếp tiếp xúc với đối tượng điều tra để tiến hành các công việc điều tra
và ghi chép số liệu, hoặc trực tiếp giám sát những người được bố trí tham gia cuộc
điều tra. Ví dụ như điều tra dân số, điều tra năng suất lúa, điều tra hàng tồn kho, điều
tra chăn nuôi, điều tra giá cả thị trường, điều tra đời sống dân cư Phương pháp trực
tiếp được thực hiện theo các hình thức chủ yếu: quan sát trực tiếp, phỏng vấn trực
diện, và phỏng vấn qua điện thoại.
Quan sát trực tiếp: là phương pháp thu thập dữ liệu bằng cách quan sát hành động,
hành vi, thái độ của đối tượng được điều tra đang diễn ra. Ví dụ, quan sát thái độ của
khách hàng khi thưởng thức các món ăn tại một nhà hàng, hoặc nghiên cứu trẻ con yêu
thích màu sắc nào. Phương pháp này tỏ ra hiệu quả đối với các trường hợp đối tượng
khó tiếp cận và người điều tra muốn tăng tính khách quan của đối tượng.
Phỏng vấn trực diện: phương pháp này thích hợp cho những cuộc điều tra thu thập
nhiều thông tin với nội dung tương đối phức tạp, cần thu thập một cách chi tiết, gồm
có hai hình thức là phỏng vấn cá nhân và phỏng vấn nhóm. Phỏng vấn cá nhân là việc
nhân viên điều tra tiếp xúc trực diện với đối tượng cung cấp thông tin để thu thập tài
liệu ban đầu, thường được thực hiện tại nhà riêng hoặc tại nơi làm việc, và được áp
19
dụng khi tiến hành điều tra chính thức. Phỏng vấn nhóm là việc nhân viên điều tra
phỏng vấn từng nhóm để thảo luận về một vấn đề nào đó, thường được sử dụng khi
tiến hành điều tra thử để kiểm tra lại nội dung của bảng hỏi (phiếu điều tra) hoặc nhằm
tìm hiểu một vấn đề phức tạp mà bản thân người nghiên cứu chưa nắm được một cách
đầy đủ, cần tham khảo có ý kiến cụ thể từ những người am hiểu.
Phỏng vấn qua điện thoại: là phương pháp thu thập thông tin thống kê thông qua
việc phỏng vấn trực tiếp đối tượng điều tra bằng điện thoại theo một bảng hỏi được
soạn sẵn. Áp dụng khi mẫu nghiên cứu gồm nhiều đối tượng là cơ quan xí nghiệp,
hoặc đối tượng nghiên cứu phân bố phân tán trên nhiều địa bàn thì phỏng vấn bằng
điện thoại có chi phí thấp hơn phỏng vấn bằng thư (phỏng vấn gián tiếp). Tuy nhiên,
thời gian phỏng vấn bị hạn chế vì người trả lời thường không sẵn lòng nói chuyện lâu
qua điện thoại, nhiều khi người cần hỏi từ chối trả lời hay không có ở nhà. Vì vậy, nên
sử dụng kết hợp phỏng vấn bằng điện thoại với phương pháp thu thập dữ liệu khác để
tăng thêm hiệu quả của phương pháp.
Tóm lại, có thể nói rằng tài liệu điều tra bằng phương pháp trực tiếp sẽ có độ chính
xác cao, nhân viên điều tra sẽ kịp thời phát hiện sai sót để sửa chữa và bổ sung nếu họ
làm việc với tinh thần trách nhiệm cao. Tuy nhiên, phương pháp này đòi hỏi nhiều
nhân lực, chi phí cao.
2.4.2 Phương pháp gián tiếp
Là phương pháp điều tra thu thập thông tin thống kê trong đó người điều tra
không trực tiếp tiếp xúc với đối tượng điều tra, không trực tiếp làm các công việc điều
tra. Phương pháp gián tiếp được thực hiện theo các hình thức chủ yếu: quan sát gián
tiếp, phỏng vấn gián tiếp (phương pháp phát phiếu điều tra).
Quan sát gián tiếp: là tiến hành quan sát kết quả hay tác động của hành vi, chứ
không trực tiếp quan sát hành vi. Ví dụ, nghiên cứu hồ sơ về doanh số bán trong từng
ngày của một siêu thị để có thể thấy được xu hướng tiêu dùng của khách hàng trong
từng thời kỳ, hoặc nghiên cứu về hồ sơ ghi lại hàng tồn kho có thể thấy được xu hướng
chuyển dịch của thị trường
Phương pháp phỏng vấn gián tiếp: Theo phương pháp này, tài liệu điều tra được
thực hiện bằng cách người được hỏi nhận phiếu điều tra (nhân trực tiếp từ cơ quan
điều tra thống kê, hoặc nhận phiếu qua thư gửi bưu điện), tự mình ghi hoặc chọn câu
trả lời vào phiếu rồi gửi trở lại cơ quan điều tra thống kê. Đặc điểm cơ bản của phương
pháp này là người hỏi và người trả lời không trực tiếp gặp nhau. Do đó để nâng cao
chất lượng thông tin thu thập được, cần chú ý đến một số điều kiện cơ bản như sau:
người được hỏi phải có trình độ nhất định, tự giác và có ý thức trách nhiệm; phiếu điều
tra nên ngắn gọn; các câu hỏi phải rõ ràng, dễ hiểu, dễ trả lời; không để thất lạc phiếu.
Phương pháp phỏng vấn gián tiếp có ưu điểm là dễ tổ chức, tiết kiệm chi phí và điều
tra viên, nhưng lại có nhược điểm là khó kiểm tra cũng như đánh giá độ chuẩn xác các
20
câu trả lời, tỷ lệ thu hồi phiếu trong nhiều trường hợp là không cao.
Ngoài ra, trong điều tra thu thập dữ liệu thống kê, người ta còn sử dụng một số
phương pháp khác như: phương pháp thu thập thông tin qua những nguồn tài liệu có
sẵn như website của tổng cục thống kê ( niên giám thống kê, chứng
từ sổ sách
21
Câu hỏi ôn tập:
1. Phân biệt các loại điều tra thống kê, cho ví dụ minh họa.
2. Liệt kê một số cuộc điều tra thống kê thực tế hiện nay ở nước ta (hàng tháng, hàng
quý, hàng năm,). Đối với cuộc tổng điều tra dân số được tiến hành năm 2009,
hãy xác định mục đích, phạm vi, đối tượng, đơn vị và nội dung của cuộc điều tra
này.
3. Vì sao người ta lại cho rằng: để thu thập thông tin thống kê thường tiến hành điều
tra không toàn bộ?
4. Để xác định được số sản phẩm công nghiệp sản xuất được hàng tháng thống kê
tiến hành điều tra toàn bộ hay không toàn bộ? Vì sao?
5. Để xác định được số sản phẩm công nghiệp sản xuất được hàng tháng thống kê
tiến hành điều tra toàn bộ hay không toàn bộ? Vì sao?
6. Hàng năm, các doanh nghiệp phải nộp “Báo cáo tài chính doanh nghiệp” cho các
cơ quan liên quan.
a. Đây có phải là cuộc điều tra thống kê không?
b. Nếu là cuộc điều tra thống kê thì đó là điều tra toàn bộ hay không toàn bộ?
c. Phương pháp thu thập thông tin là trực tiếp hay gián tiếp?
7. Số hộ trên địa bàn vào ngày 1 tháng 7 năm 2010 của tỉnh A là 250.000 hộ. Để xác
định mức sống của dân cư, Cục Thống kê của tỉnh tiến hành điều tra ở 150 hộ.
Nhân viên tham gia điều tra có 5 người. Họ đến các hộ để thu thập thông tin. Hãy
xác định: Tổng thể chung, tổng thể mẫu, loại điều tra, phương pháp điều tra.
8. Thiết kế một nghiên cứu thống kê về một vấn đề mà anh/ chị quan tâm.
22
Chương 3
TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ
Các tài liệu thu được trong quá trình điều tra thống kê chỉ mới là tài liệu sơ khởi
ban đầu, phản ảnh đặc trưng riêng lẻ của từng đơn vị tổng thể, chúng ta chưa thể rút ra
được những đặc trưng chung nhất về hiện tượng nghiên cứu từ các tài liệu này. Vì vậy
chúng cần được tổng hợp lại một cách có hệ thống và khoa học.
Tổng hợp thống kê là tiến hành tập trung, chỉnh lý, hệ thống hoá một cách khoa
học các tài liệu ban đầu thu thập được trong điều tra thống kê, nhằm làm cho các đặc
trưng riêng biệt về từng đơn vị của hiện tượng nghiên cứu bước đầu chuyển thành
những đặc trưng chung của toàn bộ hiện tượng.
Nhiệm vụ cơ bản của tổng hợp thống kê là chuyển các đặc trưng cá biệt của từng
đơn vị thành đặc trưng chung của tổng thể. Tài liệu thống kê sau khi được tổng hợp
được sử dụng để phân tích và dự báo thống kê. Có hai phương pháp tổng hợp thống kê
chủ yếu, đó là phương pháp đơn giản và phương pháp phân tổ thống kê. Phương pháp
đơn giản được vận dụng khi số đơn vị điều tra ít hoặc lượng tài liệu không nhiều, theo
đó các tài liệu được sắp xếp theo một trật tự nhất định nào đó như tăng hoặc giảm dần,
theo vần Ngược lại, trong trường hợp số đơn vị điều tra nhiều hay lượng tài liệu
điều tra lớn, việc sử dụng phương pháp đơn giản sẽ gặp nhiều khó khăn. Khi đó
phương pháp phân tổ thống kê được sử dụng để thay thế.
3.1 Phân tổ thống kê
3.1.1 Khái niệm
Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để sắp xếp các
đơn vị của tổng thể vào các tổ, nhóm tổ, hoặc các tiểu tổ có tính chất khác nhau đáp
ứng mục đích yêu cầu nghiên cứu.
Ví dụ như dân số được phân tổ theo khu vực, giới tính, độ tuổi, tình trạng hôn
nhân... Khi nghiên cứu tình hình sản xuất của các doanh nghiệp công nghiệp, có thể
phân tổ số doanh nghiệp thành các nhóm theo các tiêu thức như: thành phần kinh tế,
ngành sản xuất, số lượng lao động, giá trị sản xuất công nghiệp Kết quả của quá
trình phân tổ thường tạo thành một dãy số phân phối, bao gồm lượng biến và tần số
phân phối.
Ý nghĩa của phân tổ thống kê
Đây là phương pháp tổng hợp dữ liệu có ý nghĩa quan trọng trong nghiên cứu
thống kê, bởi vì:
Trong các cuộc khảo sát điều tra thực tế, các hiện tượng kinh tế xã hội tương
đối phức tạp, nếu không tiến hành phân tổ thì ta sẽ không thể hệ thống các tài
liệu điều tra một cách khoa học. Khi phân tổ thống kê, các đơn vị trong tổng
23
thể có cùng đặc điểm, tính chất được sắp xếp chung vào một tổ. Sau đó
nghiên cứu đặc điểm riêng của từng tổ và rút ra các kết luận về đặc điểm
chung của tổng thể.
Phân tổ còn được vận dụng ngay trong giai đoạn điều tra thống kê, nhằm
phân chia các đối tượng điều tra thành các bộ phận với đặc điểm, tính chất
khác nhau. Từ đó chọn các đơn vị điều tra sao cho có tính đại diện cho tổng
thể chung.
Ví dụ: Có tài liệu điều tra 10 công nhân tại một doanh nghiệp được sắp xếp theo tuổi
nghề va năng suất lao động như sau:
Tên
CN
Tuổi nghề
(năm)
NSLĐ Tên CN Tuổi nghề (năm) NSLĐ
A 1 25 F 6 60
B 2 40 G 7 70
C 3 40 H 8 70
D 4 50 I 9 88
E 5 55 J 10 90
Kết quả tổng hợp trên đã thể hiện rõ nét mối quan hệ giữa tuổi nghề với NSLĐ ở
công ty này: tuổi nghề càng cao thì năng suất lao động càng cao.
3.1.2 Các loại phân tổ thống kê
Căn cứ vào nhiệm vụ của phân tổ thống kê: Có 3 loại phân tổ thống kê, bao gồm phân
tổ phân loại, phân tổ kết cấu và phân tổ liên hệ.
Phân tổ phân loại là phân chia các loại hình kinh tế - xã hội nhằm nêu lên đặc
trưng của từng loại hình và mối quan hệ giữa chúng với nhau.
Ví dụ: Phân tổ phân loại dân số bình quân nước ta theo khu vực và giới tính năm
2012
Khu vực Tổng số
(Nghìn người)
Cơ cấu
(%)
Giới tính Tổng số
(Nghìn người)
Cơ cấu
(%)
Thành thị
Nông thôn
28.269,2
60.540,1
31,83
68,17
Nam
Nữ
43.908,2
44.901,1
49,44
50,56
Cả nước 88.809,3 100 Cả nước 88.809,3 100
Nguồn: Tổng cục Thống kê
Theo ví dụ trên, nếu chỉ căn cứ vào những số liệu thống kê riêng lẻ của từng nhân
khẩu, ta không rút ra được kết luận gì về đặc trưng cơ bản của dân số nước ta. Ngược
lại, với số liệu thống kê đã được tổng hợp như trên, ta có thể thấy sự mất cân bằng
24
giữa nam và nữ của dân số nước ta năm 2012 là không đáng kể; số dân sống ở khu vực
nông thôn gần gấp đôi số dân sống ở khu vực thành thị.
Phân tổ kết cấu là phân chia hiện tượng nghiên thành các tổ có tính chất khác
nhau, sau đó tính tỷ trọng của mỗi bộ phận cấu thành nên tổng thể, và đánh giá kết cấu
của hiện tượng theo tiêu thức nghiên cứu. Ví dụ như tổng sản phẩm trong nước theo
giá thực tế được phân tổ kết cấu theo nhóm ngành kinh tế.
Ví dụ: Phân tổ kết cấu tổng sản phẩm trong nước theo giá thực tế theo ngành kinh tế
qua các năm 2007-2010.
TỔNG SỐ
Nông nghiệp, lâm
nghiệp và thủy sản
Công nghiệp chế
biến, chế tạo
Giá trị
(Tỷ đồng)
Cơ cấu
(%)
Giá trị
(Tỷ đồng)
Cơ cấu
(%)
Giá trị
(Tỷ đồng)
Cơ cấu
(%)
2007 1.246.769,29 100 232.586 18,66 241.629 19,39
2008 1.616.047,13 100 329.886 20,42 300.256 18,59
2009 1.809.148,95 100 346.786 19,17 331.093 18,30
2010 2.157.828,00 100 396.576 18,38 279.360 12,95
Nguồn: Tổng cục Thống kê
Phân tổ liên hệ là việc phân chia hiện tượng nghiên cứu theo nhiều tiêu thức có
liên hệ với nhau, trên cơ sở đó đánh giá mối liên hệ giữa các tiêu thức đó. Tiêu thức
liên hệ trong trường hợp này gồm hai loại: tiêu thức nguyên nhân và tiêu thức kết quả.
Khi phân tổ liên hệ có nhiều tiêu thức, thì tiến hành phân tổ theo một tiêu thức nguyên
nhân trước, sau đó mỗi tổ lại được chia thành các tiểu tổ theo tiêu thức nguyên nhân
thứ hai Ví dụ như phân tổ liên hệ giữa năng suất lao động và tuổi nghề của công
nhân, hoặc phân tổ liên hệ cho năng suất lao động với trình độ kỹ thuật và tuổi nghề
của công nhân trong một doanh nghiệp. Dưới đây là một số bảng dữ liệu thống kê dựa
trên các kiểu phân tổ vừa nêu ở trên.
Ví dụ: Ta có phân tổ liên hệ giữa năng suất lao động với trình độ kỹ thuật và tuổi nghề
trong một doanh nghiệp như sau:
Phân tổ công nhân
Số công nhân
Năng suất lao
động bình quân
năm (tr.đ/người) Trình độ kỹ thuật Tuổi nghề
Đã qua đào tạo
Dưới 5
5-10
10-15
15-20
20 trở lên
20
40
45
15
10
212,50
237,50
250,00
270,00
255,00
Chung 130 243,08
25
Chưa qua đào tạo
Dưới 5
5-10
10-15
15-20
20 trở lên
15
20
20
10
5
150,00
185,00
197,50
240,00
210,00
Chung 70 152,57
Chung cho cả doanh nghiệp 200 211,40
Căn cứ vào số lượng tiêu thức để phân tổ: Có hai loại là phân tổ thống kê, bao gồm
phân tổ theo một tiêu thức và phân tổ theo nhiều tiêu thức.
Phân tổ theo một tiêu thức: là phân chia tổng thể nghiên cứu thành các tổ có tính
chất khác nhau dựa vào một tiêu thức thống kê. Ví dụ như dựa vào tiêu thức thành
phần kinh tế, các doanh nghiệp của một địa phương được phân thành 5 tổ với các tên
gọi: kinh tế nhà nước, kinh tế tập thể, kinh tế cá thể, kinh tế tư nhân và kinh tế có vốn
đầu tư nước ngoài.
Phân tổ theo nhiều tiêu thức: là tiến hành phân chia tổng thể nghiên cứu thành các
tổ và các tiểu tổ có tính chất khác nhau dựa trên ít nhất hai tiêu thức thống kê trở lên,
bao gồm phân tổ kết hợp và phân tổ nhiều chiều.
3.1.3 Tiêu thức phân tổ
Khái niệm
Tiêu thức phân tổ là tiêu thức được chọn làm căn cứ để phân chia tổng thể nghiên
cứu thành các tổ có tính chất và đặc điểm khác nhau. Tiêu thức được chọn để phân tổ
phải phản ảnh đúng bản chất của hiện tượng nghiên cứu và phù hợp với mục đích
nghiên cứu.
Ví dụ, nếu hoạt động sản xuất của doanh nghiệp chủ yếu dựa trên kỹ thuật hiện
đại, tiên tiến thì ta chọn tiêu thức phân tổ là giá trị sản xuất, hoặc giá trị thiết bị sản
xuất chủ yếu. Ngược lại nếu hoạt động sản xuất của doanh nghiệp chủ yếu bằng
phương pháp thủ công, phần lớn dựa vào sức lao động của con người thì ta chọn tiêu
thức phân tổ là số lượng công nhân.
Các căn cứ để lựa chọn tiêu thức phân tổ
Thứ nhất, phải dựa vào phân tích lý luận để lựa chọn ra tiêu thức bản chất nhất phù
hợp với mục đích nghiên cứu.
Thứ hai, phải căn cứ vào điều kiện lịch sử cụ thể của hiện tượng nghiên cứu để
chọn ra tiêu thức phân tổ phù hợp.
Thứ ba, phải tuỳ theo mục đích nghiên cứu và điều kiện tài liệu thực tế mà quyết
định phân tổ hiện tượng theo một hay nhiều tiêu thức.
3.1.4 Bảng phân phối tần số
Sau khi phân tổ thống kê, các số liệu thường được trình bày dưới dạng bảng phân
26
phối tần số để dễ dàng nhận biết được một số tính chất cơ bản của hiện tượng nghiên
cứu.
Lượng biến Tần số Tần suất (%) Tần số tích luỹ
1x 1f
1f
n
1f
2x 2f
2f
n
1 2f f
...
kx kf
kf
n
1 2 ... kf f f
Tổng n 100
Cần lưu ý rằng, trong các bài toán có phân tổ thống kê, các lượng biến là giá trị đại
diện cho các tổ.
3.1.5 Cách phân tổ thống kê
Phân tổ theo tiêu thức thuộc tính
Trong phân tổ này, số tổ được hình thành bằng số các loại hình khác nhau của hiện
tượng nghiên cứu. Có hai trường hợp:
Nếu tiêu thức có ít thuộc tính, có thể coi mỗi thuộc tính là một tổ.Ví dụ: phân
tổ dân số theo giới tính, phân tổ các doanh nghiệp theo thành phần kinh tế,
phân tổ sản phẩm công nghiệp theo nhóm A và nhóm B
Nếu tiêu thức có nhiều thuộc tính, nên ghép nhiều tổ nhỏ thành một số tổ lớn
theo nguyên tắc các tổ nhỏ ghép lại phải giống nhau hoặc gần giống nhau
(thường được quy định bằng văn bản) về tính chất phù hợp với mục đích, yêu
cầu nghiên cứu. Ví dụ, khi điều tra về dân số theo khả năng lao động, ta phân
tổ thành các loại hình: chưa đến tuổi lao động, trong tuổi lao động, quá tuổi
lao động
Trong thực tế, thống kê thường phân tổ theo bảng danh mục hay bảng phân loại do
Nhà nước quy định thống nhất và cố định trong một thời gian dài, nhằm đảm bảo tính
so sánh được của các tài liệu thống kê. Chẳng hạn, người ta đã thực hiện điều này dưới
các hình thức: bảng danh mục hàng hóa, bảng danh mục nghề nghiệp, bảng hệ thống
ngành kinh tế
Phân tổ theo tiêu thức số lượng
Đối với tiêu thức số lượng, việc phân tổ thống kê dựa vào số lượng biến của tổng
thể mẫu, bao gồm hai trường hợp:
Trường hợp tiêu thức số lượng có ít trị số thì mỗi một trị số ứng với một tổ.
27
Ví dụ, phân tổ số công nhân của một doanh nghiệp dệt theo số máy dệt mỗi công nhân
phụ trách ở bảng sau:
Số máy dệt mỗi
công nhân phụ trách
Số công nhân
(người)
11
12
13
14
15
16
6
14
40
100
80
30
Cộng 270
Trường hợp tiêu thức số lượng có nhiều trị số thì ta sẽ phân tổ thành các khoảng trên
trục số thực (có thể bằng nhau hoặc không bằng nhau). Nếu tổ với các đầu mút hữu
hạn thì gọi là tổ đóng, khi đó các đầu mút bên phải và bên trái của tổ được gọi là giới
hạn trên và giới hạn dưới tương ứng. Trị số chênh lệch giữa hai giới hạn đó gọi là
khoảng cách tổ. Tổ thiếu một trong hai giới hạn gọi là tổ mở.
Phân tổ với khoảng cách tổ đều nhau: Được sử dụng khi hiện tượng biến động tương
đối đồng đều.
Đối với lượng biến liên tục, việc phân tổ gồm các bước sau đây:
Bước 1: Xác định số tổ 3 2k n , với n là số quan sát (cỡ mẫu).
Bước 2: Xác định khoảng cách tổ : max min
x x
h
k
(số này thường được làm tròn)
trong đó: xmax và xmin tương ứng là lượng biến lớn nhất và lượng biến nhỏ nhất của tiêu
thức, k là số tổ cần phân.
Lưu ý: Nếu giá trị quan sát trùng với giới hạn trên của một tổ thì nó được xếp và tổ
tiếp theo.
Ví dụ: Phân tổ 30 công nhân tại một doanh nghiệp theo tiêu thức mức thu nhập tháng
của một công nhân. Biết rằng số liệu thu thập được như sau.
Đơn vị: 1000 đồng
3000 3.200 3.350 3.200 3.700 3.500
3.800 3.900 4000 3.850 3.400 3.500
3.600 3.400 3.600 3.600 3.500 3.600
3.750 3.500 3.400 3.55 4000 3.100
3.550 3.600 3.550 3.600 3.400 3.400
28
Nếu dự kiến chia thành 5 tổ thì
h =
4000 3000
5
= 200
Dựa vào h = 200 ta thành lập các tổ và sắp xếp số công nhân vào các tổ thích hợp. Khi
đó ta có bảng phân tổ công nhân theo mức thu nhập tháng:
Mức thu nhập tháng của một
công nhân (1000 đồng)
Số công nhân
(người)
Từ 3000 đến dưới 3.200
Từ 3.200 đến dưới 3.400
Từ 3.400 đến dưới 3.600
Từ 3.600 đến dưới 3.800
Từ 3.800 đến 4.000
2
3
12
8
5
Tổng 30
Nếu số tổ được phân không theo yêu cầu cho trước thì ta tính số tổ 3 2 4k n , sau đó
tính khoảng cách tổ h và phân tổ tương tự như trên.
Đối với lượng biến rời rạc, các tổ được thiết lập theo quy định như sau: giới hạn dưới
của tổ sau lớn hơn giới hạn trên của tổ trước (thường là một đơn vị) và trị số của
khoảng cách tổ được xác định theo công thức dưới đây:
( 1)max minx x kh
k
Ví dụ: Có tài liệu về số công nhân của 20 doanh nghiệp sản xuất công nghiệp như sau:
Doanh
nghiệp
Số CN
(người)
Doanh
nghiệp
Số CN
(người)
Doanh
nghiệp
Số CN
(người)
Doanh
nghiệp
Số CN
(người)
1 1.200 6 1.430 11 1.650 16 2.883
2 1.304 7 1.350 12 2.050 17 2.540
3 1.500 8 1.240 13 2.120 18 2.760
4 1.670 9 1.700 14 1.980 19 2.300
5 1.400 10 1.800 15 2.400 20 2.130
Giả sử chia 20 doanh nghiệp này thành bốn tổ có khoảng cách đều nhau theo tiêu thức
số công nhân (có lượng biến rời rạc).
Khi đó
h =
(2.883 1.200) (4 1)
4
= 420 công nhân
29
Dựa vào h = 420, ta thành lập các tổ và sắp xếp các đơn vị tổng thể vào các tổ thích
hợp như sau
Số công nhân của
doanh nghiệp
Số doanh
nghiệp
1.200 – 1.620
1.621 – 2.041
2.042 – 2.462
2.463 – 2.883
7
5
5
3
Tổng 20
Phân tổ với khoảng cách tổ không đều nhau được áp dụng khi hiện tượng có lượng
biến trên các đơn vị tổng thể biến động không đều. Khi đó ta phân tổ dựa trên việc
phân tích quan hệ lượng - chất, có nghĩa là khi lượng biến thay đổi làm cho chất thay
đổi thì phải hình thành tổ mới, còn khi lượng biến thay đổi mà chất vẫn chưa thay đổi
thì ghép các đơn vị đó vào một tổ. Ví dụ, phân tổ dân số tại một địa phương theo độ
tuổi như sau:
Độ tuổi Số dân Ghi chú
Dưới 1
Từ 1 đến 3
Từ 4 đến 6
Từ 7 đến 18
Từ 19 đến 60
Từ 60 tuổi trở lên
15.000
80.000
70.000
515.000
1.200.000
120.000
Còn bú mẹ
Nhà trẻ
Mẫu giáo
Học phổ thông
Tuổi lao động
Tuổi nghỉ hưu
Tổng 2.000.000
Trong ví dụ trên, ta thấy các tổ có khoảng cách tổ không đều nhau, hơn nữa các tổ đầu
tiên và tổ cuối cùng là các tổ mở.
3.2 Bảng thống kê
3.2.1 Khái niệm
Bảng thống kê là hình thức trình bày thông tin thống kê theo các hàng và các cột;
được sắp xếp có hệ thống, logic, khoa học, nhằm phản ánh các đặc trưng về mặt lượng
của hiện tượng nghiên cứu.
3.2.2 Cấu trúc bảng thống kê
Về hình thức: Bảng thống kê bao gồm các hàng ngang, cột dọc, tiêu đề chung, các tiêu
đề nhỏ (tiêu mục) và các con số. Bảng thống kê bao giờ cũng chỉ rõ đơn vị tính của các
số liệu trong bảng. Nếu tất cả các số liệu đều thống nhất một đơn vị tính thì ghi “đơn vị
tính: ” tại vị trí phía trên cùng, bên phải của bảng. Ngược lại, các số liệu trong bảng
không cùng đơn vị tính thì các đơn vị tính ghi thống nhất theo dòng hoặc theo cột, đi
kèm bên cạnh các tiêu mục. Lưu ý rằng tiêu đề là tên gọi chung phản ảnh nội dung, ý
30
nghĩa của bảng, do đó nó thường được viết ngắn gọn, dễ hiểu và nói lên được ý nghĩa,
nội dung ghi trong bảng.
Phần nội dung: gồm phần chủ đề (phần chủ từ) và phần giải thích (phần tân từ). Phần
chủ đề thường được đặt ở vị trí bên trái của bảng, nêu rõ đối tượng được trình bày.
Phần giải thích thường được đặt ở phía trên của bảng, gồm các chỉ tiêu giải thích các
đặc điểm của đối tượng nghiên cứu, tức là giải thích phần chủ đề. Dưới đây là hình
thức bảng thống kê giản đơn:
Tên bảng thống kê
Phần giải thích
Phần chủ đề
Đơn vị tính Mã số Tên các chỉ tiêu của phần giải thích
A B C 1 2 3 4 5
Tên các chỉ tiêu
của phần chủ
đề
Nguồn thông tin:
3.2.3 Yêu cầu và quy ước của việc xây dựng bảng thống kê
Khi xây dựng bảng thống kê nên tuân thủ các nguyên tắc sau đây: Quy mô của
bảng không quá lớn, không nên kết hợp quá nhiều chỉ tiêu, nhiều tiêu thức phân tổ. Vì
như vậy sẽ rất khó nhận thức, đối chiếu các chỉ tiêu, phân tích và nhận xét về hiện
tượng nghiên cứu.
Một số ký hiệu quy ước cho một bảng thống kê:
- Nếu không có tài liệu thì trong ô ghi dấu gạch ngang “-“
- Nếu số liệu còn thiếu, sau này sẽ bổ sung sau thì trong ô ghi dấu ba chấm “...”
- Ký hiệu gạch chéo “x” trong ô nào đó thì nói lên hiện tượng không có liên quan
đến chỉ tiêu đó, nếu ghi số liệu vào đó sẽ vô nghĩa hoặc thừa.
Phần chú thích ở cuối bảng: Được dùng để giải thích rõ các nội dung chỉ tiêu trong
bảng, nói rõ nguồn tài liệu đã sử dụng hoặc các chỉ tiêu cần thiết khác. Đối với các tài
liệu khoa học, việc ghi rõ nguồn trích dẫn số liệu được coi như là bắt buộc, không thể
thiếu trong bảng thống kê.
Các ví dụ:
a/ Lao động từ 15 tuổi trở lên đang làm việc hàng năm phân theo giới tính và phân
theo nhóm tuổi trong cả nước.
31
ĐVT: Nghìn người
2010 2011 2012 2013 Sơ bộ
2014
TỔNG SỐ 49048,5 50352,0 51422,4 52207,8 52744,5
Phân theo giới tính
Nam 25305,9 26024,7 26499,2 26830,2 27025,8
Nữ 23742,6 24327,3 24923,2 25377,6 25718,7
Phân theo nhóm
tuổi
15-19 3170,9 2924,7 2550,9 2601,5 2395,4
20-24 5422,1 5096,7 4904,8 4826,4 4714,9
25-29 6618,5 6449,4 6258,0 6119,1 6121,1
30-34 6342,1 6301,9 6232,2 6352,2 6514,6
35-39 6225,4 6387,9 6520,9 6449,6 6456,7
40-44 5778,4 6067,1 6412,3 6462,2 6525,1
45-49 5418,4 5835,2 6212,2 6122,7 6085,9
50+ 10072,5 11289,2 12331,0 13274,2 13930,7
Nguồn: Niên giám thống kê 2014
b/ Diện tích, dân số và mật độ dân số năm 2014 phân theo đại phương vùng Bắc Trung
Bộ và duyên hải miền Trung.
Diện tích(*)
(Km2)
Dân số trung bình
(Nghìn người)
Mật độ dân số
(Người/km2)
Tổng 95832,4 19522,5 204
Thanh Hóa 11129,5 3496,1 314
Nghệ An 16490,0 3037,4 184
Hà Tĩnh 5997,8 1255,3 209
Quảng Bình 8065,3 868,2 108
Quảng Trị 4739,8 616,4 130
Thừa Thiên - Huế 5033,2 1131,8 225
Đà Nẵng 1285,4 1007,7 784
Quảng Nam 0438,4 1471,8 141
Quảng Ngãi 5152,7 1241,4 241
Bình Định 6050,6 1514,5 250
Phú Yên 5060,6 887,4 175
Khánh Hòa 5217,7 1196,9 229
Ninh Thuận 3358,3 590,4 176
Bình Thuận 7813,1 1207,4 155
(*) Theo Quyết định số 1467/QĐ-BTNMT ngày 21 tháng 7 năm 2014 của Bộ trưởng
Bộ Tài nguyên và Môi trường.
Nguồn: Tổng cục Thống kê
32
3.3 Tổng hợp bằng đồ thị và biểu đồ thống kê
Phương pháp trình bày thông tin thống kê bằng đồ thị và biểu đồ thống kê trên cơ
sở sử dụng kết hợp giữa thông tin thống kê với hình vẽ, đường nét, màu sắc và mỹ
thuật nhằm giúp cho người đọc nhận thức được một cách dễ dàng, nhanh chóng những
nét khái quát về đặc điểm cơ bản của hiện tượng nghiên cứu. Trong công tác thống kê,
người ta thường dùng các loại đồ thị và biểu đồ như: Đồ thị dạng dòng kẻ (gấp khúc),
đồ thị dạng điểm, đồ thị dạng cột, đồ thị dạng mạng nhện (dạng rada), biểu đồ diện
tích (dạng bánh), biểu đồ cành – lá.
Ví dụ: Về vốn đầu tư phát triển toàn xã hội thực hiện theo giá hiện hành, ta có thể biểu
diễn qua các dạng đồ thị sau:
Đồ thị dạng điểm
Đồ thị dạng cột
33
Đồ thị dạng mạng nhện (đồ thị rada)
Biểu đồ diện tích (dạng bánh): Ví dụ, biểu đồ dạng bánh về dân số trung bình theo
địa phương vùng Bắc Trung Bộ và duyên hải miền Trung năm 2009.
34
Câu hỏi ôn tập:
1. Có tài liệu về năng suất lúa (tạ/ha) củ 50 hộ nông dân ở một địa phương được
ghi nhận như sau:
35 41 32 44 33 41 38 44 43 42
30 35 35 43 48 46 48 49 39 49
46 42 41 51 36 42 44 34 46 34
36 47 42 41 37 47 49 38 41 39
40 44 48 42 46 52 43 41 52 43
a. Hãy phân tổ tài liệu trên thành các tổ có khoảng cách đều nhau, qua đó lập
bảng phân phối tần số, tính tần số tích lũy, tần suất, tần suất tích lũy.
b. Vẽ biểu đồ phân phối tần số, tần số tích lũy.
c. Trình bày số liệu theo phương pháp nhánh và lá.
2. Có tài liệu về số nhân viên bán hàng trong 54 siêu thị thuộc một thành phố
năm 2011 như sau:
14 7 10 16 12 7 16 18 18
12 8 14 16 12 16 16 12 16
18 16 14 7 18 20 18 16 14
7 10 18 18 12 14 14 8 14
20 18 16 12 10 14 10 18 10
10 16 14 14 21 16 18 18 16
Hãy phân tổ tài liệu trên để nêu lên quy mô của các siêu thị trong thành phố
này. Biểu hiện kết quả phân tổ bằng bảng thống kê, đồ thị và nêu những nhận
xét chủ yếu.
3. Một cơ quan bảo vệ môi trường lấy các mẫu nước từ 15 dòng sông và suối
khác nhau, sau đó xét nghiệm mức độ ô nhiễm của từng mẫu nước với kết quả
như sau:
Mẫu
nước
Tỷ lệ
ô nhiễm (%)
Mẫu
nước
Tỷ lệ
ô nhiễm (%)
Mẫu nước Tỷ lệ
ô nhiễm (%)
1 35.5 6 52.9 11 60.0
2 45.3 7 32.1 12 47.3
3 67.3 8 41.2 13 38.6
4 57.4 9 50.7 14 46.2
5 53.6 10 55.8 15 64.1
35
Hãy phân tổ các mẫu nước trên theo tỷ lệ ô nhiễm trong các khoảng (đơn vị
tính: %): 30-40, 40-50, 50-60, 60-70. Trình bày kết quả dưới dạng bảng thống
kê và rút ra nhận xét. (Theo các nhà khoa học, tỷ lệ ô nhiễm từ 40% trở lên là
quá mức cho phép).
4. Có tài liệu về giá trị sản xuất công nghiệp của một địa phương được trình bày
dưới bảng sau:
Doanh
nghiệp
Năm 2010 Năm 2011
GTSXCN
(triệu đồng)
Tỷ trọng (%) GTSXCN
(triệu đồng)
Tỷ trọng (%)
A 6.450 20 9.225 24
B 15.900 50 21.300 55
C 7.500 24 6.450 17
D 1.800 6 1.950 5
Cộng 31.650 100 38.925 100
Hãy biểu diễn những số liệu trên dưới dạng các đồ thị sau: Biểu đồ hình cột,
biểu đồ hình tròn.
5. Có tài liệu phân tổ 500 cửa hàng thương mại của một thành phố theo số nhân
viên bán hàng như sau:
Phân tổ cửa hàng theo số
nhân viên bán hàng
Số cửa hàng
<10 20
11-20 45
21-30 85
31-40 105
41-50 120
51-60 55
61-70 40
>71 30
Yêu cầu:
a. Tính số nhân viên bán hàng bình quân của cửa hàng thương mại trong thành
phố.
b. Tính tỷ trọng từng loại cửa hàng.
c. Trình bày kết quả tính toán trong bảng số liệu thống kê.
36
Chương 4
ĐO LƯỜNG CÁC MỨC ĐỘ
CỦA HIỆN TƯỢNG KINH TẾ XÃ HỘI
Việc nghiên cứu các mức độ của hiện tượng kinh tế xã hội là yêu cầu quan trọng
của quá trình nghiên cứu thống kê, nhằm biểu hiện mặt lượng trong quan hệ mật thiết
với mặt chất của hiện tượng nghiên cứu trong điều kiện thời gian và không gian cụ thể.
4.1 Số tuyệt đối
4.1.1 Khái niệm: Số tuyệt đối là chỉ tiêu biểu hiện quy mô, khối lượng của hiện
tượng hoặc quá trình kinh tế - xã hội trong điều kiện thời gian và không gian cụ thể.
Số tuyệt đối trong thống kê bao gồm các con số phản ánh quy mô của tổng thể hay
của từng bộ phận trong tổng thể, chẳng hạn như số doanh nghiệp, số nhân khẩu, số học
sinh đi học, số lượng cán bộ khoa học... hoặc tổng các trị số theo một tiêu thức nào đó,
ví dụ như tiền lương của công nhân, giá trị sản xuất công nghiệp, tổng sản phẩm trong
nước (GDP) ....
Số tuyệt đối dùng để đánh giá và phân tích thống kê, là căn cứ không thể thiếu
được trong việc xây dựng chiến lược phát triển kinh tế, tính toán các mặt cân đối,
nghiên cứu các mối quan hệ kinh tế - xã hội, là cơ sở để tính toán các chỉ tiêu tương
đối và bình quân.
4.1.2. Phân loại số tuyệt đối:
Có hai loại số tuyệt đối: Số tuyệt đối thời kỳ và số tuyệt đối thời điểm.
Số tuyệt đối thời kỳ: Phản ánh quy mô, khối lượng của hiện tượng trong một thời kỳ
nhất định. Ví dụ, giá trị sản xuất công nghiệp trong một tháng, quý hoặc năm; Sản
lượng lương thực năm 2005, năm 2006, năm 2007 ...
Số tuyệt đối thời điểm: Phản ánh quy mô, khối lượng của hiện tượng ở một thời điểm
nhất định như: dân số của một địa phương nào đó có đến 0 giờ ngày 01/04/2009; giá
trị tài sản cố định có đến 31/12/2007; lao động làm việc của doanh nghiệp vào thời
điểm 1/7/2007.
4.2 Số tương đối
4.2.1 Khái niệm
Số tương đối là chỉ tiêu biểu hiện quan hệ so sánh giữa hai chỉ tiêu thống kê cùng
loại nhưng khác nhau về thời gian hoặc không gian hoặc giữa hai chỉ tiêu khác loại
nhưng có quan hệ với nhau.
Nếu so sánh giữa hai chỉ tiêu thống kê cùng loại nhưng khác nhau về thời gian ta
có số tương đối động thái, số tương đối kế hoạch. Nếu so sánh giữa hai chỉ tiêu thống
37
kê cùng loại nhưng khác nhau về không gian có số tương đối không gian hay số tương
đối so sánh, số tương đối kết cấu. Nếu so sánh giữa hai chỉ tiêu thống kê khác loại
nhưng có quan hệ với nhau ta có số tương đối cường độ. Trong hai đại lượng đem ra
so sánh của số tương đối, một đại lượng được chọn làm gốc. Số tương đối có thể được
biểu hiện bằng số lần, số phần trăm (%), hay bằng các đơn vị kép như: người/km2....
4.2.2 Ý nghĩa của số tương đối
Để đánh giá sự biến động của hiện tượng theo thời gian người ta thường phải sử
dụng số tương đối. Số tương đối được dùng để phản ánh những đặc điểm về kết cấu,
quan hệ tỷ lệ, trình độ phát triển, để lập kế hoạch và kiểm tra mức độ hoàn thành kế
hoạch, mức độ phổ biến của hiện tượng trong điều kiện không gian và thời gian cụ thể.
Người ta sử dụng số tương đối để công bố thông tin trên các phương tiện thông tin đại
chúng nhằm giữ bí mật thông tin khi cần thiết.
Ví dụ: Nếu nói bão lụt đã gây thiệt hại cho tỉnh A rất lớn, nó làm cho 30% diện tích
lúa vụ mùa 2009 không thu hoạch được. Đọc con số này ta không biết được thiệt hại
lớn đến mức độ nào. Nếu tỉnh đó cấy 1000 ha mà mất 30% thì chỉ mất 300 ha; còn nếu
tỉnh đó cấy 100.000 ha thì diện tích không thu hoạch đượclà 30.000 ha.
Số tương đối còn được dùng để so sánh những hiện tượng không cùng quy mô.
Chẳng hạn, dân số của thành phố Hồ Chí Minh và tỉnh Bình Định rất khác nhau. Do đó
số trẻ em sinh ra trong năm chắc chắn ở thành phố Hồ Chí Minh sẽ nhiều hơn tỉnh
Bình Định từ 5 đến 7 lần. Muốn đánh giá công tác kế hoạch hoá gia đình ở đâu thực
hiện tốt hơn ta phải dùng số tương đối như tỷ lệ sinh thô trong năm hoặc tỷ lệ phụ nữ
trong độ tuổi sinh sản sinh con thứ 3. Đơn vị nào có các tỷ lệ trên cao chứng tỏ ở đó
công tác dân số kế hoạch hoá gia đình thực hiện chưa tốt.
4.2.3 Đặc điểm của số tương đối
Số tương đối là sản phẩm của tính toán. Căn cứ vào các số tuyệt đối đã có để tính
ra số tương đối. Chẳng hạn, căn cứ vào các số tuyệt đối trong báo cáo của Hội đồng
nhân dân xã Phúc Sơn ta tính được các số tương đối như: Sản lượng thóc sản xuất
được tính bình quân cho một nhân khẩu là 1.200.000 kg : 4000 người = 300 kg/người.
Sản lượng thịt sản xuất được tính bình quân cho một nhân khẩu là 700.000 kg : 4000
người = 175 kg/người. Sản lượng thóc sản xuất của năm 2009 so với 2008
là(1200:1100) 100 = 1,091 lần hay bằng 109,1%.
Các con số tính được ở trên được gọi là số tương đối. Từ thực tế tính toán đó có
thể rút ra nhận xét tổng quát sau: Thứ nhất, muốn tính được số tương đối phải có gốc
để so sánh. Thứ hai, số tương đối phải được vận dụng kết hợp với số tuyệt đối. Số
tương đối thường là kết quả của việc so sánh giữa hai số tuyệt đối. Số tương đối tính ra
có thể rất khác nhau, tuỳ thuộc vào việc lựa chọn gốc so sánh. Có khi số tương đối có
giá trị rất lớn nhưng ý nghĩa của nó không đáng kể vì trị số tuyệt đối tương ứng của nó
lại rất nhỏ và ngược lại. Ví dụ, 1% dân số Việt Nam tăng lên trong những năm 1960
38
đồng nghĩa với dân số tăng thêm 300 nghìn người, nhưng 1% dân số tăng lên trong
những năm 2000 lại đồng nghĩa với dân số tăng thêm 800 nghìn người.
4.2.4 Phân loại số tương đối
Tuỳ theo việc lựa chọn chỉ tiêu so sánh theo thời gian hay theo không gian mà hình
thành nên số tương đối. Có 5 loại số tương đối với ký hiệu quy ước:
yo - Mức độ của hiện tượng nghiên cứu ở kỳ gốc;
y1 - Mức độ của hiện tượng nghiên cứu ở kỳ nghiên cứu;
yk - Mức độ kỳ kế hoạch của hiện tượng nghiên cứu.
Số tương đối động thái
Số tương đối động thái là sự so sánh mức độ của hiện tượng kỳ nghiên cứu (hay kỳ
báo cáo) với kỳ gốc so sánh.
1
0
100d
y
t
y
Công thức trên nếu nhân với 100 đơn vị tính là %; nếu không nhân với 100 thì đơn
vị tính là lần. Kết quả tính cho biết, so kỳ nghiên cứu với kỳ gốc thì hiện tượng nghiên
cứu đã lớn lên hay nhỏ đi bao nhiêu lần hoặc bằng bao nhiêu %?
Số tương đối kế hoạch
Số tương đối kế hoạch được dùng để lập kế hoạch phát triển kinh tế –xã hội của
từng đơn vị cơ sở hoặc trên phạm vi rộng như cả tỉnh hoặc cả nước và kiểm tra việc
thực hiện kế hoạch đó. Nó được tính bằng hai chỉ tiêu:
Số tương đối nhiệm vụ kế hoạch:
0
100kkh
y
t
y
Số tương đối thực hiện kế hoạch: được dùng để kiểm tra tình hình thực hiện kế
hoạch phát triển của hiện tượng nghiên cứu. Nó được tính theo công thức sau:
1 100th
k
y
t
y
Số tương đối kết cấu (còn gọi là số tương đối cơ cấu hay tỷ trọng)
Số tương đối kết cấu (tkc) là tỷ trọng của từng bộ phận cấu thành trong tổng thể của
hiện tượng nghiên cứu.
100ikc
i
y
t
y
Trong đó: yi - Mức độ của bộ phận thứ i trong tổng thể nghiên cứu
yi - Mức độ chung của tổng thể nghiên cứu.
Số tương đối so sánh
Số tương đối so sánh (tss) là loại số tương đối được tính bằng cách so sánh hai mức
độ của một chỉ tiêu thống kê nhưng khác nhau về không gian (còn gọi là số tương
đối không gian); hoặc so sánh giữa hai bộ phận trong cùng một tổng thể.
39
100iss
j
k
t
k
Trong đó: tss - Số tương đối so sánh
ki - Mức độ của bộ phận i hay đơn vị i
kj- Mức độ của bộ phận j hay đơn vị j
Số tương đối cường độ
Là loại số tương đối so sánh hai chỉ tiêu thống kê khác loại nhưng có quan hệ với
nhau. Ví dụ, mật độ dân số / km2 (người / km2); thu nhập / đầu người (nghìn đồng
/người)Đơn vị đo của số tương đối cường độ là đơn vị kép.
i
cd
p
h
t
h
Trong đó: tcd – Sốtương đối cường độ
hi – Mức độ của chỉ tiêu i
hp – Mức độ của chỉ tiêu p
Lưu ý:
Khi sử dụng hai loại số này phải chú ý đến đặc điểm của hiện tượng để rút ra
kết luận được chính xác. Ví dụ, trong điều kiện lao động thủ công, quy mô lao
động được coi là tiêu chuẩn để đánh giá quy mô doanh nghiệp. Song trong điều
kiện kinh tế phát triển thì phải xét đến quy mô vốn. Với lao động thủ công, trình
độ tay nghề (bậc thợ) của người lao động được dùng để thể hiện trình độ kỹ
thuật của doanh nghiệp nhưng trong điều kiện hiện nay phải là mức trang bị vốn
/ lao động, trình độ học vấn (bằng cấp)
Phải sử dụng kết hợp số tương đối với số tuyệt đối
Ví dụ: Mặc dù tốc độ phát triển GDP của Việt Nam khá cao (số tương đối) nhưng do
điểm xuất phát (số tuyệt đối) quá thấp nên mức sống của dân cư còn ở mức thấp so
với thế giới. Cuối năm 2007, Nhà nước điều chỉnh mức lương tối thiểu tăng 10,2%.
Xét về số tương đối ta có cảm giác mức sống được cải thiện rất nhiều. Song mức
lương cơ bản xuất phát quá thấp là 490 nghìn đồng. Nay được nâng lên 540 nghìn
đồng. Như vậy mức lương cơ bản tăng 90 nghìn đồng và với số tiền này chỉ mua được
khoảng 1 kg thịt bò loại ngon. Bởi thế khi sử dụng số tương đối phải luôn xem xét gắn
nó với số tuyệt đối.
40
Bảng tổng kết về số tuyệt đối và số tương đối
Số tuyệt đối Số tương đối
Khái niệm
Số tuyệt đối trong thống kê
là loại chỉ tiêu biểu hiện
quy mô, khối lượng, kích
thước của hiện tượng kinh
tế – xã hội trong điều kiện
thời gian và địa điểm cụ thể
Số tương đối trong thống kê
là loại chỉ tiêu biểu hiện
quan hệ so sánh giữa hai chỉ
tiêu thống kê cùng loại
nhưng khác nhau về thời
gian, không gian hoặc giữa
hai chỉ tiêu thống kê khác
loại nhưng có quan hệ với
nhau.
Ý nghĩa
Biểu hiện quy mô, khối
lượng của hiện tượng
nghiên cứu.
Để tính các số tương đối,
số bình quân.
Để đánh giá sự biến động
của hiện tượng.
Để giữ bí mật thông tin khi
cần thiết.
Để lập và kiểm tra việc thực
hiện kế hoạch.
Để so sánh những hiện
tượng không cùng quy mô.
Đặc điểm
Kết quả của điều tra hoặc
tổng hợp thống kê
Kết quả của tính toán
Đơn vị đo
Đơn vị tự nhiên, đơn vị vật
lý, đơn vị tiêu chuẩn, đơn
vị tiền tệ đơn vị kép.
%, lần, đơn vị kép
Các loại số
Hai loại số tuyệt đối: thời
điểm và thời kỳ
5 loại số tương đối: Động
thái, kế hoạch, kết cấu, so
sánh và cường độ.
4.3 Các đặc trưng đo lường khuynh hướng tập trung
4.3.1 Số bình quân (trung bình)
Số bình quân là chỉ tiêu biểu hiện mức độ điển hình của một tổng thể gồm nhiều
đơn vị cùng loại được xác định theo một tiêu thức nào đó. Số bình quân được sử dụng
phổ biến trong thống kê để nêu lên đặc điểm chung nhất, phổ biến nhất của hiện tượng
kinh tế - xã hội trong các điều kiện thời gian và không gian cụ thể.
Ví dụ: Tiền lương bình quân một công nhân trong doanh nghiệp là mức lương phổ
41
biến nhất, đại diện cho các mức lương khác nhau của công nhân trong doanh nghiệp;
thu nhập bình quân đầu người của một địa bàn là mức thu nhập phổ biến nhất, đại diện
cho các mức thu nhập khác nhau của mọi người trong địa bàn đó.
Số bình quân còn dùng để so sánh đặc điểm của những hiện tượng không có cùng
một quy mô hay làm căn cứ để đánh giá trình độ đồng đều của các đơn vị tổng thể.
Xét theo vai trò đóng góp khác nhau của các thành phần tham gia bình quân hoá, số
bình quân chung được chia thành số bình quân giản đơn và số bình quân gia quyền. Số
bình quân giản đơn được tính trên cơ sở các thành phần tham gia bình quân hoá có vai
trò về qui mô (tần số) đóng góp như nhau. Số bình quân gia quyền (trung bình có
trọng số) được tính trên cơ sở các thành phần tham gia bình quân hoá có vai trò về qui
mô (tần số) đóng góp khác nhau.
Để tính được số bình quân chính xác và có ý nghĩa, điều kiện chủ yếu là nó phải
được tính cho những đơn vị cùng chung một tính chất (tổng thể đồng chất). Muốn vậy,
phải dựa trên cơ sở phân tổ thống kê một cách khoa học và chính xác. Đồng thời phải
vận dụng kết hợp giữa số bình quân tổ với số bình quân chung. Có nhiều loại số bình
quân khác nhau. Trong thống kê kinh tế - xã hội thường dùng các loại sau: Số bình
quân giản đơn, số bình quân điều hoà, số bình quân hình học (bình quân nhân).
Số bình quân cộng giản đơn
ixx
n
Trong đó: xi- Lượng biến của tiêu thức ứng với đơn vị thứ i ( 1,i n )
n- Số đơn vị mẫu
Ví dụ: Có tài liệu thống kê về năng suất lao động của 5 công nhân trong một tổ như
sau:
NSLĐ (tr.đ/người) 12 14 11 15 16
Số lao động (Người) 1 1 1 1 1
NSLĐ bình quân = Tổng giá trị / Tổng số lao động = 68/ 5 = 13,6 tr.đ./người
Số bình quân cộng gia quyền
i i
i
x f
x
f
Trong đó xi - Lượng biến của tiêu thức ở tổ thứ i (i= 1,,n)
fi - Quyền số (trọng số)
Các ví dụ:
a/ Giả sử có số liệu thu nhập lao động của một công ty như sau:
Mức lương (tr.đ/người) Từ 1-1,5 1,5-3 3-5 5-7
Số lao động (Người) 10 20 30 10
42
(fi)
Khi đó mức thu nhập bình quân của một lao động toàn công ty là
i i
i
x f
x
f
= 3,25 tr. đ/ người, với ix là giá trị bình quân của tổ thứ i.
b/ Có tài liệu thống kê về mức thu nhập của một công ty như sau:
Mức thu nhập (tr. đ./người) 5
Số lao động (người) 10 20 30 50 18 12 10
Hãy tính mức thu nhập bình quân một lao động của công trên?
Trước hết, cần lưu ý rằng: đối với bài toán phân tổ có các tổ mở, để thuận tiện cho
tính toán người ta quy ước xem tổ mở như tổ đóng với khoảng cách tổ mở bằng
khoảng cách tổ đóng gần nó nhất.
Mức thu nhập
(triệu đồng/người)
Số lao động
(người)
Thu nhập bình
quân tổ
<1 10 0,75
1-1,5 20 1,25
1,5-2 30 1,75
2-2,5 50 2,25
2,5-4 18 3,25
4-5 12 4,5
>5 10 5,5
Tổng số 150
Thay số liệu vào công thức ta có
365
2,433
150
i i
i
x f
x
f
Số bình quân điều hoà
Số bình quân điều hoà là một dạng đặc biệt của số bình quân cộng. Xét về nội
dung kinh tế, số bình quân điều hoà cũng giống như bình quân cộng giản đơn. Tuy
nhiên trong trường hợp này ta không có thông tin nào về số đơn vị tổng thể fi. So sánh
những thông tin đã có và chưa biết để tính số bình quân theo phương pháp tính số bình
quân cộng và số bình quân điều hoà.
43
Số trung bình cộng Số trung bình điều hoà
Biết xi Biết xi
Biết fi Không biết fi
Không biết xifi Biết xifi
Tính số trung bình Tính số trung bình
Công thức tính:
i i
i i
i
x f
x
x f
x
Ví dụ: Giả sử có tài liệu thống kê về năng suất và sản lượng lúa vụ đông xuân của
mộtt xã như sau:
Chỉ tiêu \ Thôn A B C
Năng suất lúa (tạ / ha) (xi) 40 50 60
Sản lượng lúa (tấn) ( xifi ) 280 350 360
Khi đó năng suất lúa bình quân/ ha của toàn xã là
280 350 360
4,95
280 350 360
4 5 6
i i
i i
i
x f
x
x f
x
tấn/ha
Số bình quân nhân (bình quân hình học)
Số bình quân nhân (bình quân hình học) là loại số bình quân được tính trong mối
quan hệ tích số (tính tốc độ phát triển bình quân). Số bình quân nhân được sử dụng khá
rộng rãi trong việc lập lập kế hoạch và đánh giá tình hình phát triển kinh tế-xã hội cho
một khoảng thời gian nào đó (thường tính cho 5 hoặc 10 năm). Chẳng hạn, trong nghị
quyết Đại hội đại biểu toàn quốc của Đảng Cộng sản Việt Nam lần thứ X có nêu lên
mục tiêu phấn đấu đến năm 2010 GDP của Việt Nam sẽ gấp đôi năm 2000. Vậy nhiệm
vụ phấn đấu đạt tốc độ phát triển bình quân năm của thời kỳ 2000-2010 là bao nhiêu?
Ta sử dụng số bình quân nhân để trả lời câu hỏi trong tình huống này.
4.3.2 Số trung vị (Me)
Số trung vị là lượng biến của tiêu thức nghiên cứu ứng với đơn vị đứng ở vị trí
chính giữa của dãy số phân phối đã được sắp xếp theo thứ tự tăng dần. Số trung vị chia
dãy số làm hai phần, mỗi phần có số đơn vị tổng thể bằng nhau.
Cách xác định số trung vị
Trường hợp tài liệu không phân tổ
44
Nếu số đơn vị của dãy số là số chẵn thì giá trị của trung vị là trung bình cộng
giản đơn của 2 lượng biến đứng giữa dãy số phân phối.
Nếu số đơn vị lẻ thì giá trị của trung vị là lượng biến đứng ở giữa dãy số.
Trường hợp tài liệu có phân tổ
Tài liệu phân tổ có khoảng cách tổ: trước tiên ta xác định tổ chứa trung vị, đó
là tổ có tần số tích luỹ lớn hơn hoặc bằng
1
2
if . Sau đó trị số gần đúng
của số trung vị được tính theo công thức:
1
(min)
2 e
e e
e
i
m
e m m
m
f
S
m x h
f
Trong đó (min)emx : giới hạn dưới của tổ chứa trung vị
em
h : khoảng cách của tổ chứa trung vị
1emS : tổng tần số của các tổ đứng trước tổ chứa trung vị
em
f : tần số của tổ chứa trung vị
if : tổng các tần số
Ví dụ: Có tài liệu phân tổ như sau:
Doanh thu (triệu đồng) Cửa hàng (fi) Tần số tích luỹ
200 – 400 8 8
400 – 500 12 20
500 – 600 25 45
600 – 800 25 70
800 – 1000 9 79
Tổng 79
Ta có
1 79 1
40
2 2
if
Tổ chứa trung vị sẽ là tổ thứ 3 (500 – 600) vì có tần số tích luỹ là 45 > 40
Dựa vào công thức ta có
1
(min)
79
20
2 2500 100. 578
25
e
e e
e
i
m
e m m
m
f
S
m x h
f
(triệu đồng)
Lưu ý: Nếu dãy số phân phối chuẩn (phân phối đối xứng) thì số trung vị chính bằng số
trung bình cộng. Sử dụng số trung vị thay cho số trung bình cộng khi cần ước
lượng nhanh giá trị trung bình của hiện tượng nghiên cứu.
45
4.3.3 Giá trị mốt (Mo)
Mốt trong thống kê là lượng biến của tiêu thức nghiên cứu ứng với quyền số (hoặc
mật độ phân bố) lớn nhất. Điều đó có nghĩa mốt là sự biểu hiện mức độ phổ biến nhất
của hiện tượng nghiên cứu.
Cách xác định Mo
Tài liệu phân tổ không có khoảng cách tổ thì giá trị của mốt chính là lượng
biến của tiêu thức nghiên cứu có quyền số (hoặc tần số) lớn nhất.
Ví dụ: Giả sử có tài liệu thống kê mức lương tháng 7/2007 công nhân của một công ty
như sau:
Số công nhân
(người)
10 20 40 60 50 30 10
Mức lương
(1000đ)
1.000 1.200 1.250 1.500 1.700 1.800 2.000
Trong trường hợp này quyền số lớn nhất là 60. Như vậy giá trị của mốt (Mo) là
1.500.000 đồng / người. Mốt nói lên rằng mức lương phổ biến nhất ở công ty này là
1.500.000 đồng /người.
Tài liệu phân tổ có khoảng cách tổ đều: trước hết cần xác định tổ chứa mốt,
tức là tổ có tần số lớn nhất, sau đó trị số gần đúng của mốt được xác định
theo công thức sau:
0 0
0 0
0 0 0 0
1
0 (min)
1 1( ) ( )
m m
m m
m m m m
f f
m x h
f f f f
Trong đó
0 (min)m
x : giới hạn dưới của tổ chứa mốt
0m
h : khoảng cách của tổ chứa mốt
0m
f : tần số của tổ chứa mốt
0 1m
f : tần số của tổ đứng trước tổ chứa mốt
0 1m
f : tần số của tổ đứng sau tổ chứa mốt
Ví dụ: Có tài liệu tổng hợp về doanh số bán của 50 cửa hàng tại một thành phố trong
tháng 9/2013 như sau:
Doanh số bán (triệu
đồng)
Số cửa hàng
200 – 300 8
300 – 400 12
400 – 500 20
500 – 600 7
600 – 700 3
46
Tổng cộng 50
Trong tài liệu này, tổ chứa mốt là tổ thứ 3 (400 – 500) vì đây là tổ có tần số lớn
nhất. Và mốt được xác định như sau:
0
20 12
400 100 438,095
(20 12) (20 7)
m
Tài liệu phân tổ có khoảng cách tổ không đều: trước hết cần xác định tổ chứa
mốt, tức là tổ có mật độ phân phối lớn nhất (mật độ phân phối là tỉ số giữa
tần số của tổ với khoảng cách tổ tương ứng), sau đó trị số gần đúng của mốt
được xác định theo công thức sau:
0 0
0 0
0 0 0 0
1
0 (min)
1 1( ) ( )
m m
m m
m m m m
d d
m x h
d d d d
Trong đó
0 (min)m
x : giới hạn dưới của tổ chứa mốt
0m
h : khoảng cách của tổ chứa mốt
0m
d : mật độ của tổ chứa mốt, 0
0
0
m
m
m
f
d
h
0 1m
d : mật độ của tổ đứng trước tổ chứa mốt
0 1m
d : mật độ của tổ đứng sau tổ chứa mốt
Ví dụ: Có tài liệu tổng hợp về doanh thu của 70 cửa hàng tại một thành phố trong
tháng 7/2012 như sau:
Doanh số thu (triệu đồng) Số cửa hàng Khoảng cách tổ Mật độ phân phối
200 – 400 8 200 0,04
400 – 500 10 100 0,01
500 – 600 23 100 0,23
600 – 800 23 200 0,115
800 – 1000 6 200 0,03
Tổng cộng 70
Trong tài liệu này, tổ chứa mốt là tổ thứ 3 (500 – 600) vì đây là tổ có mật độ phân
phối lớn nhất (d = 0,23), và mốt được xác định như sau:
0
0,23 0,01
500 100 565,476
(0,23 0,01) (0,23 0,115)
m
Ý nghĩa của đại lượng Mo
Nó có thể bổ sung hoặc thay thế cho số bình quân cộng. Giúp ta ước lượng
rất nhanh ra giá trị của số trung bình trong trường hợp phân phối chuẩn (phân
phối đối xứng).
47
Trong một số lĩnh vực sản xuất hàng loạt liên quan đến kích cỡ. Nếu biết
được mốt của kích cỡ thì sản xuất loại đó nhiều hơn các kích cỡ khác. Chẳng
hạn sản xuất giầy, quần áo may sẵnphải dựa trên giá trị mốt của người tiêu
dùng.
Mốt có ưu điểm là không chịu ảnh hưởng của các lượng biến đột xuất, nhưng
cũng chính điều này làm cho nó kém nhạy bén với sự biến thiên trong tiêu
thức thống kê.
4.4 Các đặc trưng đo lường mức độ phân tán
Độ phân tán của tiêu thức dùng để đánh giá mức độ đại diện của số bình quân đối
với tổng thể được nghiên cứu. Trị số này tính ra càng lớn, tính biến thiên của tiêu thức
càng lớn do đó mức độ đại diện của số bình quân đối với tổng thể càng thấp và ngược
lại.
Quan sát độ biến thiên tiêu thức trong dãy số lượng biến sẽ thấy nhiều đặc trưng về
phân phối, kết cấu, tính đồng đều của tổng thể. Độ biến thiên của tiêu thức được sử
dụng nhiều trong nghiên cứu thống kê như phân tích biến thiên cũng như mối liên hệ
của hiện tượng, dự đoán thống kê, điều tra chọn mẫu ...
Khi nghiên cứu độ biến thiên của tiêu thức, thống kê thường dùng các chỉ tiêu như
khoảng biến thiên, độ lệch tuyệt đối bình quân, phương sai, độ lệch tiêu chuẩn và hệ số
biến thiên. Dưới đây là nội dung và phương pháp tính của các chỉ tiêu đó.
4.4.1 Khoảng biến thiên
Khoảng biến thiên (còn gọi là toàn cự) là chỉ tiêu được tính bằng hiệu số giữa
lượng biến lớn nhất và lượng biến nhỏ nhất của một dãy số lượng biến. Khoảng
biến thiên càng lớn, mức độ biến động của chỉ tiêu càng lớn. Ngược lại, khoảng biến
thiên nhỏ, mức độ biến động của chỉ tiêu thấp, tức là mức độ đồng đều của chỉ tiêu
cao.
max minR x x
Trong đó maxx và minx là giá trị lớn nhất và nhỏ nhất của tổng thể tính toán.
Việc tính toán khoảng biến thiên đơn giản tuy nhiên chỉ tiêu này thường cho kết
quả không chuẩn xác về sự biến động của tiêu thức.
4.4.2 Độ lệch tuyệt đối bình quân
Độ lệch tuyệt đối trung bình là số bình quân số học của các độ lệch tuyệt đối giữa
các lượng biến với số bình quân số học của các lượng biến đó.
ix xd
n
(trường hợp giản đơn)
i i
i
x x f
d
f
(trường hợp có quyền số)
48
4.4.3 Phương sai ( 2 )
Phương sai là số bình quân cộng của tổng bình phương các sai lệch giữa lượng
biến với số bình quân số học của các lượng biến đó.
2
2
( )ix x
n
hoặc
2
2
( )i i
i
x x f
f
Hoặc có thể tính phương sai theo công thức:
2 2 2( )x x
Nếu có quyền số thì 2x và 2( )x đều phải tính theo công thức gia quyền.
4.4.4 Độ lệch chuẩn ( )
Độ lệch tiêu chuẩn ( ) là căn bậc hai của phương sai
4.4.5 Hệ số biến thiên (V)
Hệ số biến thiên (V) là tỷ lệ % giữa độ lệch tuyệt đối bình quân hoặc độ lệch tiêu
chuẩn so với số bình quân cộng của tiêu thức nghiên cứu.
100d
d
V
x
hoặc 100V
x
Hệ số biến thiên giúp ta so sánh hai tổng thể không cùng đơn vị đo lường.
49
Câu hỏi ôn tập:
1. Kế hoạch tăng trưởng doanh thu của Công ty Hoàng Long năm 2009 là 10%.
Thực tế phấn đấu Công ty đã hoàn thành vượt mức kế hoạch 2%, về số tuyệt
đối vượt kế hoạch là 50 tr. đ. Hãy xác định:
a. Doanh thu 2008, doanh thu kế hoạch 2009 và doanh thu thực hiện 2009.
b. Số tương đối động thái, số tương đối nhiệm vụ kế hoạch và số tương đối thực
hiện kế hoạch.
2. Tài liệu về giá trị sản xuất công nghiệp (theo giá cố định) của các doanh nghiệp
thuộc địa phương X như sau:
Doanh
nghiệp
Giá trị sản xuất (triệu đồng)
Thực hiện năm 2010 Năm 2011
Kế hoạch Thực tế
A
B
C
D
6.450
15.900
7.500
1.800
6.750
18.000
8.250
1.950
9.225
21.300
6.450
1.950
Yêu cầu xác định:
a. Số tương đối nhiệm vụ kế hoạch của mỗi doanh nghiệp và của toàn địa
phương X.
b. Số tương đối hoàn thành kế hoạch của mỗi doanh nghiệp và của toàn địa
phương X.
c. Số tương đối động thái của mỗi doanh nghiệp và của toàn địa phương X.
d. Tỷ trọng về giá trị sản xuất từng doanh nghiệp so với toàn địa phương X:
thực tế năm 2010 và năm 2011. Trình bày
Các file đính kèm theo tài liệu này:
- bc3a0i_gie1baa3ng_nltk_bc3acnh_0634_1997446.pdf