Tài liệu giảng dạy Nguyên lý thống kê kinh tế

Tài liệu Tài liệu giảng dạy Nguyên lý thống kê kinh tế: BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN BỘ MÔN TOÁN KINH TẾ TÀI LIỆU GIẢNG DẠY NGUYÊN LÝ THỐNG KÊ KINH TẾ (TRÌNH ĐỘ ĐẠI HỌC, KHỐI NGÀNH KINH TẾ) Bình Định, 06/2016 i BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN BỘ MÔN TOÁN KINH TẾ TÀI LIỆU GIẢNG DẠY NGUYÊN LÝ THỐNG KÊ KINH TẾ (TRÌNH ĐỘ ĐẠI HỌC, KHỐI NGÀNH KINH TẾ) SỐ TÍN CHỈ: 3 (LÝ THUYẾT: 45) Bình Định, 06/2016 ii MỤC LỤC Chương 1: Tổng quan về thống kê học 1 1.1. Khái niệm thống kê học 1 1.2. Một số khái niệm thường dùng trong thống kê 1 1.2.1. Tổng thể thống kê 1 1.2.2. Tổng thể mẫu 2 1.2.3. Tiêu thức thống kê 2 1.2.4. Chỉ tiêu thống kê 3 1.2.5. Thang đo trong thống kê 3 1.2.5.1. Thang đo định danh 4 1.2.5.2. Thang đo thứ bậc 4 1.2.5.3. Thang đo khoảng 4 1.2.5.4. Thang đo tỷ lệ 4 1.2.5.5. Một số kỹ thuật thiết kế thang đo 5 1.2.6. Bảng câu hỏi (phiếu điều tra) 7 1.2.7. Dữ liệu thống kê 9 1.3. Các phương pháp thống kê 10 Câu hỏi ôn tập 12 Chương...

pdf152 trang | Chia sẻ: putihuynh11 | Lượt xem: 733 | Lượt tải: 0download
Bạn đang xem trước 20 trang mẫu tài liệu Tài liệu giảng dạy Nguyên lý thống kê kinh tế, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN BỘ MÔN TOÁN KINH TẾ TÀI LIỆU GIẢNG DẠY NGUYÊN LÝ THỐNG KÊ KINH TẾ (TRÌNH ĐỘ ĐẠI HỌC, KHỐI NGÀNH KINH TẾ) Bình Định, 06/2016 i BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN BỘ MÔN TOÁN KINH TẾ TÀI LIỆU GIẢNG DẠY NGUYÊN LÝ THỐNG KÊ KINH TẾ (TRÌNH ĐỘ ĐẠI HỌC, KHỐI NGÀNH KINH TẾ) SỐ TÍN CHỈ: 3 (LÝ THUYẾT: 45) Bình Định, 06/2016 ii MỤC LỤC Chương 1: Tổng quan về thống kê học 1 1.1. Khái niệm thống kê học 1 1.2. Một số khái niệm thường dùng trong thống kê 1 1.2.1. Tổng thể thống kê 1 1.2.2. Tổng thể mẫu 2 1.2.3. Tiêu thức thống kê 2 1.2.4. Chỉ tiêu thống kê 3 1.2.5. Thang đo trong thống kê 3 1.2.5.1. Thang đo định danh 4 1.2.5.2. Thang đo thứ bậc 4 1.2.5.3. Thang đo khoảng 4 1.2.5.4. Thang đo tỷ lệ 4 1.2.5.5. Một số kỹ thuật thiết kế thang đo 5 1.2.6. Bảng câu hỏi (phiếu điều tra) 7 1.2.7. Dữ liệu thống kê 9 1.3. Các phương pháp thống kê 10 Câu hỏi ôn tập 12 Chương 2: Điều tra thống kê (Thu thập dữ liệu thống kê) 13 2.1. Khái niệm về điều tra thống kê 13 2.2. Các loại điều tra thống kê 14 2.2.1. Điều tra thường xuyên 14 2.2.2. Điều tra không thường xuyên 14 2.2.3. Điều tra toàn bộ 15 2.2.4. Điều tra không toàn bộ 15 2.3. Hình thức tổ chức thu thập thông tin 15 2.3.1. Báo cáo thống kê định kỳ 16 2.3.2. Điều tra chuyên môn 18 2.4. Phương pháp thu thập thông tin thống kê 18 2.4.1. Phương pháp trực tiếp 18 2.4.2. Phương pháp gián tiếp 19 Câu hỏi ôn tập 21 iii Chương 3: Tổng hợp và trình bày dữ liệu thống kê 22 3.1. Phân tổ thống kê 22 3.1.1. Khái niệm 22 3.1.2. Các loại phân tổ thống kê 22 3.1.3. Tiêu thức phân tổ 25 3.1.4. Bảng phân phối tần số 25 3.1.5. Cách phân tổ thống kê 26 3.2. Bảng thống kê 29 3.2.1. Khái niệm 29 3.2.2. Cấu trúc bảng thống kê 29 3.2.3. Yêu cầu và quy ước của việc xây dựng bảng thống kê 30 3.3. Tổng hợp bằng đồ thị và biểu đồ thống kê 32 Câu hỏi ôn tập 34 Chương 4: Đo lường các mức độ của hiện tượng kinh tế-xã hội 36 4.1. Số tuyệt đối 36 4.1.1. Khái niệm 36 4.1.2. Phân loại số tuyệt đối 36 4.2. Số tương đối 36 4.2.1. Khái niệm 36 4.2.2. Ý nghĩa của số tương đối 37 4.2.3. Đặc điểm của số tương đối 37 4.2.4. Phân loại số tương đối 38 4.3. Các đặc trưng đo lường khuynh hướng tập trung 40 4.3.1. Số bình quân (trung bình) 40 4.3.2. Số trung vị 43 4.3.3. Giá trị mốt 45 4.4. Các đặc trưng đo lường mức độ phân tán 47 4.4.1. Khoảng biến thiên 47 4.4.2. Độ lệch tuyệt đối bình quân 47 4.4.3. Phương sai 48 4.4.4. Độ lệch chuẩn 48 4.4.5. Hệ số biến thiên 48 Câu hỏi ôn tập 49 iv Chương 5: Ðiều tra chọn mẫu 53 5.1. Giới thiệu chung về điều tra chọn mẫu 53 5.1.1. Khái niệm điều tra chọn mẫu 53 5.1.2. Ưu, nhược điểm của điều tra chọn mẫu 53 5.1.3. Sự cần thiết của điều tra chọn mẫu 53 5.2. Các giai đoạn của điều tra chọn mẫu 54 5.2.1. Xác định mục đích nghiên cứu 54 5.2.2. Xác định tổng thể nghiên cứu 54 5.2.3. Xác định kích thước mẫu 54 5.2.4. Lựa chọn phương pháp thu thập dữ liệu 54 5.2.5. Sử dụng các thông tin từ mẫu để suy luận thống kê 55 5.2.6. Kết luận về tổng thể nghiên cứu 55 5.3. Sai số chọn mẫu 55 5.4. Một số phương pháp tổ chức chọn mẫu ngẫu nhiên thường dùng 56 5.4.1. Chọn mẫu ngẫu nhiên đơn giản 56 5.4.2. Chọn mẫu phân tổ (phân loại) 61 5.4.3. Chọn mẫu cả khối (chọn mẫu chùm) 64 5.4.4. Chọn mẫu nhiều cấp (chọn mẫu phân tầng) 67 Câu hỏi ôn tập 68 Chương 6: Phân tích hồi quy và tương quan 70 6.1. Mối liên hệ tương quan và nhiệm vụ của phân tích hồi quy 70 6.1.1. Quan hệ tương quan 70 6.1.2. Nhiệm vụ phân tích hồi quy và tương quan 70 6.1.3. Ý nghĩa của phân tích hồi quy và tương quan 70 6.2. Hồi quy và tương quan tuyến tính giữa hai tiêu thức số lượng 70 6.2.1. Bài toán đặt vấn đề 70 6.2.2. Hệ số tương quan 72 6.3. Hồi quy và tương quan tuyến tính bội 72 6.3.1. Hệ số tương quan bội 72 6.3.2. Hệ số tương quan chuẩn hóa 73 6.3.4. Hệ số tương quan riêng phần 73 6.4. Hồi quy và tương quan phi tuyến giữa hai tiêu thức số lượng 74 6.4.1. Hàm parabol 74 v 6.4.2. Hàm Hyperbol 74 6.4.3. Hàm mũ 74 6.4.4. Tỷ số tương quan 74 6.5. Tương quan hạng và tương quan giữa hai tiêu thức thuộc tính 76 6.5.1. Tương quan hạng 76 6.5.2. Tương quan giữa hai tiêu thức thuộc tính 76 Câu hỏi ôn tập 77 Chương 7: Dãy số thời gian 79 7.1. Khái niệm và phân loại dãy số thời gian 79 7.2. Các thành phần của dãy số thời gian 80 7.2.1. Yếu tố xu thế 80 7.2.2. Yếu tố thời vụ 80 7.2.3. Yếu tố chu kỳ 80 7.2.4. Yếu tố ngẫu nhiên 80 7.3. Các chỉ tiêu phân tích dãy số thời gian 80 7.3.1. Mức độ bình quân theo thời gian 80 7.3.2. Lượng tăng (giảm) tuyệt đối 81 7.3.3. Tốc độ phát triển 83 7.3.4. Tốc độ tăng (giảm) 84 7.3.5. Giá trị tuyệt đối 1% tăng (giảm) liên hoàn 85 7.4. Các phương pháp biểu hiện xu hướng biến động của dãy số thời gian 85 7.4.1. Phương pháp bình quân trượt 85 7.4.2. Phương pháp hồi quy 86 7.5. Các phương pháp dự báo biến động của dãy số thời gian 89 7.5.1. Dự báo dự vào lượng tăng (giảm) tuyệt đối bình quân 89 7.5.2. Dự báo dựa vào tốc độ phát triển bình quân 89 7.5.3. Dự báo theo phương trình hồi quy tuyến tính 90 7.5.4. Dự báo theo mô hình nhân 93 Câu hỏi ôn tập 94 Chương 8: Phương pháp chỉ số 97 8.1. Khái niệm chỉ số thống kê 97 8.2. Các loại chỉ số trong thống kê 97 8.2.1. Chỉ số phát triển 97 vi 8.2.2. Chỉ số không gian 100 8.2.3. Chỉ số kế hoạch 101 8.3. Hệ thống chỉ số 101 8.3.1. Phương pháp xây dựng hệ thống chỉ số 105 8.3.2. Hệ thống chỉ số phân tích biến động chỉ tiêu trung bình 105 8.3.3. Hệ thống chỉ số phân tích biến động tổng lượng biến tiêu thức 107 Câu hỏi ôn tập 109 Chương 9: Kiểm định giả thuyết thống kê 113 9.1. Kiểm định tham số 113 9.1.1. Kiểm định giả thuyết về giá trị trung bình của tổng thể chung 113 9.1.2. Kiểm định giả thuyết về phương sai của tổng thể chung 119 9.1.3. Kiểm định giả thuyết về tham số p của phân phối không – một 122 9.2. Kiểm định phi ttham số 125 9.2.1. Kiểm định giả thuyết về tính độc lập của hai dấu hiệu định tính 125 9.2.2. Kiểm định giả thuyết về quy luật phân phối xác suất của biến ngẫu nhiên 126 9.3. Kiểm định mô hình hồi quy 128 9.3.1. Kiểm định ý nghĩa của các hệ số bêta 128 9.3.2. Kiểm định ý nghĩa của hệ số tương quan 129 9.3.3. Kiểm định sự phù hợp của phương trình 130 TÀI LIỆU THAM KHẢO 131 PHỤ LỤC CÁC BẢNG SỐ 132 1 Chương 1 TỔNG QUAN VỀ THỐNG KÊ HỌC 1.1 Khái niệm thống kê học Trong đời sống hàng ngày, chúng ta thường bắt gặp thuật ngữ “Thống kê” trên các phương tiện thông tin đại chúng như báo chí, phát thanh, truyền hình Thuật ngữ “Thống kê” có thể được hiểu theo hai nghĩa như sau:  Thống kê là các số liệu được thu thập để phản ánh các hiện tượng tự nhiên, kỹ thuật, kinh tế, xã hội. Ví dụ sản lượng của một công ty, lượng mưa trong năm của một khu vực địa lý, tốc độ tăng trưởng kinh tế của một quốc gia, dân số, lao động, nhiệt độ  Thống kê cũng được hiểu là hệ thống các phương pháp để nghiên cứu (thu thập, tổng hợp, phân tích) các hiện tượng tự nhiên, kỹ thuật, kinh tế, xã hội. Xét theo quá trình hình thành và phát triển, có thể thấy thống kê là một bộ phận của khoa học xã hội. Tuy nhiên nó có những đặc thù riêng cho phép nó trở thành một ngành khoa học riêng biệt. Đặc thù thứ nhất là nó chỉ nghiên cứu mặt lượng của các hiện tượng kinh tế xã hội. Đặc thù thứ hai là thống kê học chủ yếu nghiên cứu các hiện tượng số lớn. Đặc thù thứ ba là nó không chỉ nghiên cứu các hiện tượng trong trạng thái tĩnh mà còn nghiên cứu trong cả trạng thái động. Đặc thù thứ tư là nghiên cứu trong điều kiện thời gian và không gian cụ thể. Từ những điều vừa trình bày trên, ta có thể đi đến định nghĩa thống kê như sau: Thống kê là hệ thống các phương pháp dùng để thu thập, xử lý và phân tích các con số (mặt lượng) của những hiện tượng số lớn để tìm hiểu bản chất và tính quy luật vốn có của chúng (mặt chất) trong điều kiện thời gian và không gian cụ thể. 1.2 Một số khái niệm thường dùng trong thống kê 1.2.1 Tổng thể thống kê Tổng thể thống kê là tập hợp các đơn vị hay phần tử thuộc hiện tượng nghiên cứu mà ta cần quan sát, thu thập và phân tích. Ví dụ: Tổng thể các hộ gia đình ở thành phố Quy Nhơn. Các đơn vị cấu thành tổng thể thống kê gọi là đơn vị tổng thể. Đơn vị tổng thể là căn cứ quan trọng để xác định các phương pháp điều tra thích hợp, để tiến hành tổng hợp và áp dụng những công thức tính toán khi phân tích thống kê. Phân loại tổng thể thống kê: Tổng thể bộc lộ: là tổng thể mà ta có thể quan sát trực tiếp hoặc nhận biết được các đơn vị của nó. Ví dụ như số sinh viên của một trường đại học tại một thời điểm nào đó, hoặc số lượng hàng hóa bán ra trong một kỳ nào đó. 2 Tổng thể tiềm ẩn: là các đơn vị tổng thể thường không thể trực tiếp quan sát hoặc nhận biết được. Ví dụ: tổng thể những người ủng hộ chính sách kinh tế nào đó, hoặc tổng thể những người hâm mộ bóng đá. Tổng thể đồng nhất: là các đơn vị giống nhau ở một hay một số đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu, và ngược lại gọi là tổng thể không đồng chất. Ví dụ như đối với việc nghiên cứu tình hình thu nhập của người lao động tại các ngân hàng thương mại cổ phần trên địa bàn thành phố Hà Nội thì tổng thể gồm các ngân hàng thương mại cổ phần trên địa bàn thành phố Hà Nội là tổng thể đồng chất, nhưng tổng thế gồm các ngân hàng trên địa bàn thành phố Hà Nội là tổng thể không đồng chất. Cần lưu ý thêm rằng tổng thể thống kê có thể là hữu hạn hoặc vô hạn. 1.2.2 Tổng thể mẫu (mẫu) Trong nhiều tình huống thực tế, khi phân tích các hiện tượng kinh tế - xã hội, chúng ta không thể nghiên cứu cũng như thu thập số liệu của tổng thể chung do chúng quá lớn gây ra chi phí cao, tốn nhiều thời gian và có thể dẫn đến sai số đáng kể trong quá trình thu thập dữ liệu và nghiên cứu, hoặc do không thể xác định được quy mô tổng thể chung, hoặc cũng có thể là khi nghiên cứu toàn bộ tổng thể chung sẽ làm phá vỡ hay ảnh hưởng hưởng đến việc nghiên cứu các tính chất của tổng thể chung. Chẳng hạn như doanh nghiệp cần nghiên cứu thông tin phản hồi về chất lượng sản phẩm từ phía khách hàng tiêu dùng, rõ ràng rằng doanh nghiệp không thể nào biết hết được số lượng khách hàng của doanh nghiệp để tiến hành thu thập thông tin phân tích. Khi đó người ta thường sử dụng một số phương pháp chọn mẫu thích hợp nào đó (chọn lặp, chọn không lặp, chọn theo khối, chọn hệ thống...) để chọn một số phần tử từ tổng thể chung để nghiên cứu. Những phần tử được chọn ra như thế được gọi là tổng thể mẫu. 1.2.3 Tiêu thức thống kê Là khái niệm dùng để chỉ các đặc điểm đặc trưng của đơn vị tổng thể. Ví dụ khi nghiên cứu nhân khẩu, mỗi nhân khẩu có các tiêu thức như: giới tính, độ tuổi, trình độ học vấn, nghề nghiệp, dân tộc, tôn giáo Khi nghiên cứu các doanh nghiệp, mỗi doanh nghiệp có các tiêu thức như: số lượng công nhân, giá trị tài sản cố định, giá trị máy móc thiết bị, vốn đầu tư, doanh thu tiêu thụ sản phẩm, lợi nhuận Tiêu thức thống kê có thể chia làm hai loại:  Tiêu thức thuộc tính: là tiêu thức phản ánh tính chất hay loại hình của đơn vị tổng thể, không biểu hiện trực tiếp bằng các con số. Ví dụ như tiêu thức giới tính, nghề nghiệp, tình trạng hôn nhân, dân tộc, thành phần kinh tế, nhóm sản phẩmTiêu thức thuộc tính còn được gọi là chất lượng hay tiêu thức phi số lượng.  Tiêu thức số lượng: là tiêu thức biểu hiện trực tiếp bằng các con số. Ví dụ như chiều cao, trọng lượng con người, năng suất lao động, doanh số bán hàng, mức lương, kim ngạch xuất-nhập khẩu Các trị số cụ thể khác nhau 3 của tiêu thức số lượng gọi là lượng biến. Lượng biến có thể phân thành hai loại là lượng biến rời rạc và lượng biến liên tục. 1.2.4 Chỉ tiêu thống kê Là chỉ sự biểu hiện một cách tổng hợp đặc điểm về mặt lượng trong sự thống nhất mật thiết với mặt chất của tổng thể thống kê trong điều kiện thời gian và không gian cụ thể. Một chỉ tiêu thống kê luôn có hai mặt: Khái niệm và mức độ. Khái niệm bao gồm định nghĩa và giới hạn về thực thể, chỉ rõ nội dung kinh tế xã hội của chỉ tiêu thống kê. Mức độ phản ánh quy mô hoặc cường độ của hiện tượng. Ví dụ: Tốc độ tăng trưởng kinh tế Việt Nam năm 2015 là 6,68%. Theo Nghị định số 56/2009/NĐ-CP ngày 30/6/2009 của Chính phủ, doanh nghiệp nhỏ và vừa là cơ sở kinh doanh đã đăng ký kinh doanh theo quy định pháp luật, được chia thành ba cấp như sau: Doanh nghiệp siêu nhỏ Doanh nghiệp nhỏ Doanh nghiệp vừa Số lao động Tổng nguồn vốn Số lao động Tổng nguồn vốn Số lao động I. Nông, lâm nghiệp và thuỷ sản <10 người 20 tỷ đồng trở xuống 10 – 200 người 20 – 100 tỷ đồng 200 – 300 người II. Công nghiệp và xây dựng < 10 người 20 tỷ đồng trở xuống 10 – 200 người 20 – 100 tỷ đồng 200 – 300 người III.Thương mại và dịch vụ < 10 người 10 tỷ đồng trở xuống 10 – 50 người 10 – 50 tỷ đồng 50 – 100 người Chỉ tiêu thống kê được phân thành hai loại:  Chỉ tiêu khối lượng: là các chỉ tiêu biểu hiện quy mô của tổng thể. Ví dụ như số doanh nghiệp quốc doanh, tổng sản phẩm quốc nội, số sinh viên đại học, số diện tích gieo trồng... Chỉ tiêu khối lượng có ý nghĩa rất lớn đối với thực tiễn như trong tiêu dùng, phân phối sản phẩm, kiểm tra tình hình thực hiện kế hoạch...  Chỉ tiêu chất lượng: biểu hiện tính chất, trình độ phổ biến quan hệ so sánh trong tổng thể, chẳng hạn như tốc độ phát triển kinh tế, mật độ dân số, giá thành đơn vị sản phẩm, năng suất lao động, năng suất cây trồng... 1.2.5 Thang đo thống kê 4 Nói chung, thống kê dùng 4 loại thang đo cơ bản dưới đây: 1.2.5.1 Thang đo định danh (Nominal scale) Là thang đo đánh số các biểu hiện cùng loại của tiêu thức thuộc tính. Loại thang đo này thường được dùng với các tiêu thức thuộc tính mà các biểu hiện của nó là một hệ thống các loại khác nhau không theo một trật tự xác định, chẳng hạn như: giới tính, khu vực địa lý, nghề nghiệp, tôn giáo, sắc tộc...Người ta đánh số (mã hóa) hoặc dùng ký tự để chỉ định cho từng loại, ví dụ như đối với tiêu thức giới tính ta có hai loại nam và nữ, hơn nữa không có trật tự nào giữa hai loại này, biểu hiện nam được đánh số 1 và nữ được đánh số 2. Các con số không có quan hệ hơn kém, không thực hiện được các phép tính đại số, chỉ dùng để mã hóa và đếm tần số. 1.2.5.2 Thang đo thứ bậc (Ordinal scale) Là thang đo định danh nhưng giữa các biểu hiện của tiêu thức có quan hệ hơn kém. Thường dùng để đo các tiêu thức thuộc tính mà các biểu hiện có quan hệ thứ tự như đo thái độ đối với một hành vi nào đó (hoàn toàn đồng ý, đồng ý, chưa quyết định, hoàn toàn không đồng ý) hoặc thứ tự chất lượng sản phẩm, huân chương, bậc thợ... Trong một số trường hợp thang đo thứ bậc có thể kết hợp với thang đo định danh để hiểu rõ được khái niệm hơn. Chẳng hạn, để đánh số các biểu hiện của tiêu thức tôn giáo có thể dùng thang đo định danh (1. Phật giáo, 2. Thiên chúa giáo, 3. Hồi giáo, 4. Đạo hinđu, 5. Đạo cao đài...). Tuy nhiên, để biểu hiện hành vi tôn giáo thì có thể dùng thang đo thứ bậc. Chẳng hạn, bạn có dự hoạt động tôn giáo không: 1. Hàng ngày, 2. Hàng tuần, 3. Một vài tuần trong một tháng, 4. Hàng tháng, 5. Một vài lần trong năm, 6. Hàng năm, 7. Không bao giờ. Sự chênh lệch giữa các biểu hiện không nhất thiết là bằng nhau, không thực hiện được các phép tính đại số, con số có trị số cao hơn không có nghĩa ớ bậc cao hơn mà là do quy định, chẳng hạn như chất lượng sản phẩm loại 1 là tốt nhất nhưng bậc thợ càng cao thì càng thể hiện trình độ chuyên môn tốt. 1.2.5.3 Thang đo khoảng (Interval scale) Là thang đo thứ bậc có các khoảng cách đều nhau nhưng không có điểm gốc là 0. Thang đo này được sử dụng cho các tiêu thức số lượng và luôn có đơn vị đo. Ngoài ra, loại thang đo này chưa có điểm gốc là số 0 nên không so sánh được tỷ lệ giữa các trị số đo. Ví dụ, khi đo nhiệt độ không khí, điểm quy ước tại đó nước đóng băng là 0 độ (theo thang đo Celsius). Thang đo này có thể thực hiện các phép tính đại số, và tính được các tham số đặc trưng như trung bình, tỷ lệ, phương sai 1.2.5.4 Thang đo tỷ lệ (Ratio scale) Là thang đo khoảng với một điểm gốc 0 tuyệt đối được coi như là điểm xuất phát 5 của độ dài đo lường trên thang đo. Ví dụ: Thu nhập trung bình một tháng của ông A là 3 triệu đồng và thu nhập của bà B là 6 triệu đồng, ta có thể nói rằng thu nhập trung bình trong một tháng của bà B gấp đôi thu nhập của ông A. Với các đặc điểm của thang đo tỷ lệ, ta có thể so sánh được tỷ lệ giữa các trị số đo. Chẳng hạn các đơn vị đo lường vật lý thông thường (lít, kg, mét..), số lao động, số con, số chiếc... Đây là loại thang đo chặt chẽ nhất trong các loại thang đo vừa được giới thiệu, và ta có thể thực hiện được tất cả các phép tính và phân tích số liệu. Lưu ý rằng, theo thứ tự liệt kê các loại thang đo: thang đo định danh, thang đo thứ bậc, thang đo khoảng, và thang đo tỷ lệ thì thang đo ở sau có chất lượng đo lường cao hơn thang đo phía trước, hơn nữa việc xây dựng thang đo cũng phức tạp hơn. Tuy nhiên, không phải thang đo có chất lượng đo lường cao hơn là tốt hơn mà tuỳ thuộc vào đặc điểm của hiện tượng và tiêu thức nghiên cứu. 1.2.5.5 Một số kỹ thuật thiết kế thang đo Thang đo tỷ lệ liên tục Sử dụng thang đo khoảng để tạo ra các mục lựa chọn, người trả lời sẽ chọn một mục để đánh dấu vào đó. Số mục là chẵn hay lẻ không có sự sai biệt gì đáng kể. Nếu dùng số lẻ thì người trả lời hay có xu hướng “trung dung” bằng cách chọn mục ở giữa, còn nếu dùng số chẵn thì người trả lời sẽ thể hiện nghiêng nhiều hơn về hướng một hướng nào đó. Ví dụ: Bạn ưa thích ngành học của mình ở mức độ nào: □ Rất thích □ Khá thích □ Bình thường □ Không thích □ Rất ghét Thang đo Likert (điều mục) Đây là loại thang đo đơn giản và phù hợp với nhiều hoàn cảnh khác nhau. Loại này đòi hỏi người được phỏng vấn cho biết thái độ của họ và điều mục đánh giá mà họ lựa chọn. Các mục được sắp xếp theo một thứ tự nào đó. Ví dụ: Với câu hỏi “ Bạn có thoả mãn với công việc mà bạn đang làm hiện nay không?” có thể đặt các thang đo sau: o Rất thoả mãn. o Tương đối thoả mãn. o Không quan tâm. o Không được thoả mãn lắm. o Rất khó chịu. Thang đo này tuy đơn giản nhưng cần phải quan tâm đến một số vấn đề sau:  Số lượng điều mục: Cần có sự quyết định số mục lựa chọn tượng trưng cho thái độ của người được phỏng vấn. Chẳng hạn, thang mục chỉ có 2 mục đối nhau (đồng ý hay không đồng ý) mang tính chất của thang đo định danh rất khó cho 6 công việc phân tích nhưng có thể thích hợp khi bảng câu hỏi dài hoặc khi trình độ văn hoá của người được hỏi có giới hạn. Mặt khác có thể sử dụng nhiều điều mục để giúp cho người được hỏi có nhiều sự lựa chọn rộng rãi và cho phép đo độ nhạy bén hơn. Một số nhà nghiên cứu cho rằng câu hỏi có 5 hoặc 6 mục trả lời là phù hợp hơn cả.  Số điều mục trả lời không nên lẻ để tránh dẫn đến việc người trả lời có thái độ trung dung với cách chọn câu trả lời ở giữa, và dễ đưa đến câu trả lời không đúng sự thật. Số điều mục chẵn thì người được hỏi bắt buộc phải biểu lộ thái độ của mình.  Không nên đặt câu trả lời lệch về một phía, vì điều này sẽ làm cho người trả lời khó chọn. Ví dụ, với câu hỏi “đề nghị bạn cho biết tốc độ mau lẹ trong cung cách phục vụ khách hàng” mà sử dụng các điều mục : tuyệt, rất tốt, tốt, trên trung bình, trung bình thì sẽ rất không thích hợp cho người không thích cung cách phục vụ ấy. Thang đo xếp hạng theo thứ tự Loại thang đo này cho phép so sánh các điều mục trả lời trong khi 2 thang đo trước không thể so sánh được vì ở hai loại thang đo trên người được hỏi xét đoán không dựa vào căn cứ cụ thể nào cả. Đối với loại thang đo xếp hạng theo thứ tự, người được hỏi sắp xếp hạng các mục trả lời theo thứ tự mà họ đánh giá. Ví dụ: Để nâng cao chất lượng học tập của sinh viên, nhà trường đã sử dụng các biện pháp sau đây: o Điểm danh thường xuyên ở lớp. o Kiểm tra bài thường xuyên. o Quy chế thi nghiêm túc. o Học bổng có nhiều mức theo theo kết quả thi từng học kỳ. o Cho nhiều chuyên đề nghiên cứu và bài tập lớn. o Nộp chi phí cao khi phải thi lại. Hãy xếp thứ tự các biện pháp trên từ phương pháp hiệu quả nhất theo thứ tự từ 1 đến 6? Loại thang đo này tuy đơn giản, dễ trả lời song cũng có những nhược điểm là:  Khó liệt kê được đầy đủ các trường hợp nên dữ liệu thu thập thiếu chính xác.  Vì nhấn mạnh vào việc xếp thứ tự nên có thể ảnh hưởng đến câu trả lời, đặc biệt là mục thứ nhất và mục chót thường được quan tâm nhiều hơn.  Khi hỏi để xếp hạng những mục hoàn toàn nằm ngoài ý thích của người được hỏi thì những câu trả lời sẽ không có ý nghĩa. Thang đo có tổng số điểm không đổi Thang điểm có tổng không đổi cung cấp một sự nhận thức tổng quát tốt hơn về khoảng cách giữa các điểm trên giải thang điểm. Đối với thang điểm này, người được 7 hỏi cần chia hoặc xác định một số điểm có tổng không đổi (thường là 100) để biểu thị sự quan trọng tương đối của những đặc điểm được nghiên cứu. Số điểm được chia cho mỗi điều mục chỉ rõ hạng bậc của nó và đồng thời cũng chỉ rõ sự khác biệt giữa các điều mục với nhau. Cũng vẫn với ví dụ trên, chia 100 điểm cho các biện pháp theo tầm quan trọng của mỗi biện pháp. Thang điểm này còn một số tồn tại sau: Thứ nhất, không thể chắc chắn là liệu những kết quả có biểu thị đúng với khoảng cách và tỷ lệ hay không. Thứ hai, nếu có quá nhiều đặc điểm thì việc chia điểm cũng gặp khó khăn. Thang đo có hai cực đối nghịch nhau Được biểu hiện dưới dạng một dãy số liên tục từ 1 đến 5, hoặc từ 1 đến 7, hoặc từ - 3 đến +3, trong đó hai cực của thang đo này luôn đối lập nhau về mặt ngữ nghĩa. Dữ liệu thu được trong thang đo này thường được phân tích dưới dạng điểm trung bình của tất cả mẫu nghiên cứu theo từng nội dung được hỏi. Ví dụ, hãy nêu các nhận định của bạn về các mặt sau đây của nhà hàng A. Hãy khoanh tròn số tương ứng với sự lựa chọn của bạn: Sạch 1 2 3 4 5 6 7 Bẩn Rẻ 1 2 3 4 5 6 7 Đắt Phục vụ nhanh 1 2 3 4 5 6 7 Phục vụ chậm Ngon 1 2 3 4 5 6 7 Dở Ngoài các thang đo cơ bản trên còn có nhiều cách đặt thang đo nữa, chẳng hạn như thang đo so sánh từng cặp, thang đo Q-sort, thang đo Stapel tuỳ thuộc vào kỹ thuật của các nhà nghiên cứu. Tuy vậy, mỗi thang đo đều có ưu nhược điểm riêng, do đó người nghiên cứu phải biết lựa chọn loại thang đo nào thích hợp nhất, có khả năng đáp ứng tốt nhất những nhu cầu thông tin với chi phí thấp nhất, phương pháp truyền đạt dễ hiểu, dễ trả lời. 1.2.6 Bảng câu hỏi (phiếu điều tra) Khái niệm bảng câu hỏi Bảng câu hỏi là một công cụ dùng để thu thập dữ liệu, bao gồm một tập hợp các câu hỏi và các câu trả lời được sắp xếp theo logic nhất định, là phương tiện dùng để giao tiếp giữa người thu thập số liệu và người cung cấp thông tin. Các bước cơ bản sau đây để thiết kế một bảng câu hỏi Bước 1: Xác định mục đích, nội dung, đối tượng nghiên cứu Bước 2: Xác định phương pháp phỏng vấn Bước 3: Phác thảo nội dung bảng câu hỏi Bước 4: Chọn dạng cho các câu hỏi (câu hỏi đóng hoặc câu hỏi mở) Câu hỏi mở là dạng câu hỏi mà người cung cấp thông tin có thể tùy chọn phương án và cách thức trả lời. Loại câu hỏi này thường được dùng khi người nghiên cứu 8 muốn có những thăm dò ngoài giả thiết ban đầu về vấn đề nghiên cứu. Người ta thường sử dụng một cách hạn chế các câu hỏi mở vì việc xử lý các thông tin từ loại câu hỏi này phức tạp và ít hiệu quả. Câu hỏi đóng là dạng câu hỏi mà người khảo sát đã định sẵn các phương án trả lời, nhằm tập trung vào việc thỏa mãn mục đích nghiên cứu, tạo điều kiện cho việc tập hợp và xử lý thông tin đơn giản hơn, bao gồm 4 dạng cơ bản sau: Câu hỏi với câu trả lời có dạng: “ có hoặc không”. Câu hỏi xếp hạng thứ tự là dạng câu hỏi mà ta đưa ra sẵn các phương án trả lời, và để cho người trả lời lựa chọn, so sánh và xếp hạng chúng theo thứ tự. Câu hỏi đánh dấu tình huống trong danh sách là dạng câu hỏi mà ta đưa ra sẵn các phương án trả lời, và người trả lời sẽ đánh dấu vào những mục phù hợp với họ. Câu hỏi dạng bậc thang là dạng câu hỏi có sử dụng thang đo thứ bậc hoặc thang đo khoảng để hỏi về mức độ đồng ý hay phản đối, mức độ thích hay ghét của người trả lời về một vấn đề nào đó. Bước 5: Xác định từ ngữ thích hợp cho bảng câu hỏi - Nên dùng từ ngữ quen thuộc, tránh dùng tiếng lóng hoặc từ chuyên môn. - Nên dùng từ ngữ dễ hiểu, để mọi người ở bất cứ trình độ nào cũng có thể hiểu được. - Tránh đưa ra câu hỏi quá dài. - Tránh đặt câu hỏi mơ hồ, không rõ ràng. - Tránh đưa ra câu hỏi quá cụ thể. - Tránh hỏi trực tiếp những vấn đề riêng tư. - Tránh đưa ra câu hỏi quá cường điệu. - Tránh đặt câu hỏi có gợi ý sẵn câu trả lời. - Tránh đặt câu hỏi dựa theo giá trị xã hội đã được xác nhận. Bước 6: Xác định cấu trúc bảng câu hỏi - Nên sắp xếp các câu hỏi theo trình tự hợp lý. - Nên chia vấn đề lớn thành nhiều vấn đề nhỏ hơn để hỏi. - Nên tuân theo trình tự về tâm lý: Hỏi cái chung rồi mới đến cái riêng, những câu hỏi ít gây hứng thú nên hỏi cuối cùng, nên theo trình tự để khơi gợi trí nhớ về các sự việc đã qua. Bước 7: Thiết kế việc trình bày bảng câu hỏi Cần quan tâm đến việc in ấn, trình bày bảng câu hỏi để tạo tâm lý thiện cảm, thoải mái và lôi cuốn người cấp tin. Bước 8: Điều tra thử để kiểm tra bảng câu hỏi Về nguyên tắc, một bảng câu hỏi cần phải được áp dụng thử để kiểm tra trước khi thực hiện phỏng vấn chính thức. Việc điều tra được tiến hành trên một mẫu nhỏ được chọn ra từ tổng thể cần nghiên cứu, để xem người trả lời có hiểu và trả lời đúng hay không, để xem người điều tra có làm tốt nhiệm vụ hay không, để xem thông tin được 9 thu thập như thế nào, và để xác định thời gian cho thực hiện phỏng vấn một người. Sau khi điều tra thử sẽ xử lý và phân tích dữ liệu để qua đó tiến hành chỉnh sửa, loại bỏ hoặc bổ sung câu hỏi nhằm hoàn thiện phiếu điều tra. Cũng cần lưu ý thêm rằng, trong đa số các trường hợp, việc giải thích nội dung thông tin cần thu thập và các khái niệm có liên quan không thực hiện được ngay trong bảng câu hỏi. Khi đó người ta sử dụng sổ tay điều tra. Một sổ tay điều tra cần được soạn thảo với mức chi tiết cao nhất có thể. Đối với các cuộc điều tra do Nhà nước tổ chức, các tài liệu hướng dẫn luôn được soạn thảo đi kèm để giải thích đầy đủ các nội dung trong phiếu điều tra, chẳng hạn như tài liệu hướng dẫn về điều tra doanh nghiệp 2015. 1.2.7 Dữ liệu thống kê Dữ liệu thống kê là các sự kiện và số liệu được thu thập, tổng hợp và phân tích để trình bày và giải thích ý nghĩa của chúng. Tất cả các dữ liệu được thu thập trong một nghiên cứu cụ thể được gọi là bộ dữ liệu phục vụ cho cuộc nghiên cứu đó. Các loại dữ liệu thống kê Dữ liệu thống kê được chia làm hai loại: dữ liệu định tính và dữ liệu định lượng. Dữ liệu định tính bao gồm các nhãn hay tên gọi được sử dụng để xác định đặc điểm của đơn vị tổng thể, và được đo lường bởi thang đo định danh hoặc thang đo thứ bậc. Dữ liệu định tính thường được mã hóa bằng những con số, có tác dụng giúp đếm tần số hay tần suất, việc thực hiện các phép tính đại số trên các số này không có ý nghĩa thống kê. Dữ liệu định lượng bao gồm các giá trị bằng con số cụ thể, và được đo lường bởi thang đo khoảng hoặc thang đo tỷ lệ. Đối với dữ liệu định lượng, ta có thể thực hiện các phép tính đại số cũng như sử dụng nhiều phương pháp phân tích thống kê khác nhau trên đó để thu được những thông tin thống kê có ý nghĩa. Các nguồn dữ liệu thống kê Khi nghiên cứu một hiện tượng cụ thể, người nghiên cứu có thể sử dụng dữ liệu từ nguồn dữ liệu đã có sẵn. Dựa vào cách thức này, người ta chia dữ liệu thành hai loại chủ yếu: dữ liệu thứ cấp và dữ liệu sơ cấp. Dữ liệu thứ cấp: là các thông tin có sẵn, đã qua tổng hợp và xử lý. Loại dữ kiện này có thể thu thập từ các ấn phẩm nhà nước như Niên giám thống kê, từ các tạp chí chuyên ngành như Tạp chí Con số và Sự kiện của Tổng cục Thống kê Ngoài ra, với sự phát triển về khoa học và công nghệ như hiện nay, mạng internet chính là nơi lưu trữ nguồn dữ liệu thứ cấp khổng lồ mà chúng ta được phép truy cập để sử dụng. Hầu hết các công ty đều có trang web riêng để cung cấp những thông tin cơ bản đối với công ty của mình về doanh số, số nhân viên, số lượng sản phẩm, giá sản phẩm, đặc điểm của sản phẩm. 10 Mặt khác, các cơ quan nhà nước cũng có các trang web riêng, cung cấp các dữ liệu thứ cấp tương đối đầy đủ, chẳng hạn như trang web của Tổng cục Thống kê ( trang web của Bộ Lao động - Thương binh Xã hội ( Vì vậy, chúng ta có thể khai thác các dữ liệu từ nguồn tài liệu phong phú này để phục vụ cho việc nghiên cứu thống kê. Dữ liệu thứ cấp có ưu điểm là có thể chia sẻ chi phí, do đó nó có tính kinh tế hơn, số liệu được cung cấp kịp thời hơn. Tuy nhiên, dữ liệu thứ cấp thường là các thông tin cơ bản, số liệu đã được tổng hợp đã qua xử lý nên không đầy đủ hoặc không phù hợp cho quá trình nghiên cứu. Dữ liệu thứ cấp thường ít được sử dụng để dự báo trong thống kê, số liệu này thường được sử dụng trong trình bày tổng quan nội dung nghiên cứu, là cơ sở để phát hiện ra vấn đề nghiên cứu. Ngoài ra, dữ liệu thứ cấp còn được sử dụng để đối chiếu lại kết quả nghiên cứu để nhằm kiểm tra lại tính đúng đắn hoặc phát hiện ra những vấn đề mới để có hướng nghiên cứu tiếp. Dữ liệu sơ cấp: trong nhiều trường hợp, dữ liệu cần cho phân tích thống kê không có sẵn từ nguồn dữ liệu thứ cấp. Khi đó để có dữ liệu, ta cần phải trực tiếp thực hiện các cuộc điều tra thống kê như được trình bày trong chương 2. 1.3 Các phương pháp thống kê Các phương pháp thống kê có thể được chia thành hai nhóm phương pháp: thống kê mô tả và thống kê suy diễn. Thống kê mô tả: bao gồm các phương pháp có liên quan đến việc thu thập số liệu, mô tả và trình bày dữ liệu bằng bảng và đồ thị, tính toán các đặc trưng của dữ liệu như giá trị trung bình, giá trị mốt nhằm phản ánh một cách tương đối đầy đủ về đối tượng nghiên cứu. Thống kê suy luận: bao gồm các phương pháp ước lượng các đặc trưng của tổng thể, kiểm định các giả thuyết thống kê, phân tích mối liên hệ giữa các hiện tượng nghiên cứu, dự đoán hoặc ra quyết định trên cơ sở thông tin thu thập từ kết quả quan sát trên tổng thể mẫu. Cụ thể:  Thu thập và xử lý số liệu: Số liệu thu thập thường rất nhiều và hỗn độn, các dữ liệu đó chưa đáp ứng cho quá trình nghiên cứu. Để có hình ảnh tổng quát về tổng thể nghiên cứu, số liệu thu thập phải được xử lý như: tổng hợp, trình bày, tính toán các số đo; kết quả có được sẽ giúp khái quát được đặc trưng của tổng thể.  Nghiên cứu các hiện tượng trong điều kiện không chắc chắn: Trong thực tế, có nhiều hiện tượng mà thông tin liên quan đến đối tượng nghiên cứu không đầy đủ, chẳng hạn như nghiên cứu về nhu cầu của thị trường về một loại sản phẩm ở mức độ nào, tình trạng của nền kinh tế ra sao, để nắm được các thông tin này một cách rõ ràng quả là một điều không chắc chắn. 11  Điều tra chọn mẫu Trong một số trường hợp, việc nghiên cứu toàn bộ tất cả các đơn cần điều tra của tổng thể là một điều không khả thi hoặc không hiệu quả, xét cả về mặt kinh tế (chi phí, thời gian) và thời hạn báo cáo (báo cáo kịp thời, đúng tiến độ). Chính điều này đã đặt ra cho thống kê xây dựng các phương pháp chỉ cần nghiên cứu đặc điểm, tính chất các đơn vị trong một bộ phận của tổng thể (tổng thể mẫu), ta có thể suy luận ra đặc điểm, tính chất chung cho cả tổng thể mà vẫn đảm bảo độ tin cậy cho phép.  Nghiên cứu mối liên hệ giữa các hiện tượng Giữa các hiện tượng nghiên cứu thường có mối liên hệ với nhau. Ví dụ như mối liên hệ giữa chi tiêu và thu nhập; mối liên hệ giữa lượng vốn vay và các yếu tố tác động đến lượng vốn vay như chi tiêu, thu nhập, trình độ học vấn; mối liên hệ giữa tốc độ phát triển với tốc độ phát triển của các ngành, lạm phát, tốc độ phát triển dân sốSự hiểu biết về mối liên hệ giữa các hiện tượng rất có ý nghĩa, phục vụ cho quá trình dự báo.  Dự báo: Sử dụng phương pháp phân tích định lượng hoặc phương pháp phân tích định tính để dự báo trạng thái tương lai của các hiện tượng kinh tế - xã hội dựa vào tài liệu thống kê. Tuy nhiên, ngày nay, người ta chủ yếu sử dụng phương định lượng để dự báo với mục đích cung cấp cho những nhà quản lý cái nhìn mang tính khoa học hơn và cụ thể hơn trước khi ra quyết định phù hợp. Các phương pháp định lượng như: Phương pháp hàm hồi quy, phương pháp hàm xu thế và biến động thời vụ, phương pháp san bằng mũ thường được sử dụng trong dự báo thống kê. 12 Câu hỏi ôn tập: 1. Đối tượng nghiên cứu của thống kê học là gì? 2. Dữ liệu thống kê là gì? Các loại dữ liệu thống kê và nguồn dữ liệu thống kê? 3. Phân biệt thống kê mô tả và thống kê suy luận (phân tích). 4. So sánh các loại thang đo khác nhau, cho ví dụ minh họa. 5. Phiếu điều tra là gì? Nêu những lưu ý quan trọng khi xây dựng phiếu điều tra, cho ví vụ minh họa. 6. Lượng biến của các tiêu thức sau đây thuộc loại nào? a. Năng suất lao động tính bằng tạ/ha. b. Số lượng công nhân của doanh nghiệp. c. Thời gian thắp sáng của bóng đèn. d. Mức độ phần trăm hoàn thành kế hoạch sản lượng. e. Số doanh nghiệp của một tỉnh. f. Bậc thợ của công nhân. g. Cân nặng của trẻ sơ sinh tại một bệnh viện. h. Thu nhập của nhân viên trong một công ty. i. Số sinh viên tại một trường đại học. j. Vốn điều lệ của một ngân hàng. 7. Các câu sau đây đúng hay sai, nếu sai hãy giải thích. a. Thang đo khoảng là thang đo cao nhất trong các loại thang đo. b. Lượng biến về tuổi tác là một ví dụ của tiêu thức thuộc tính. c. Chiều cao của sinh viên là lượng biến liên tục. d. Thời gian bay từ Hà Nội đến Quy Nhơn là lượng biến rời rạc. e. Thu nhập là thang đo khoảng. 13 Chương 2 ĐIỀU TRA THỐNG KÊ Từ việc nghiên cứu những hiện tượng số lớn, để các con số có thể nói lên được bản chất, quy luật phát triển của hiện tượng, việc nghiên cứu thống kê luôn phải trải qua nhiều giai đoạn có mối quan hệ chặt chẽ với nhau từ việc thu thập thông tin, tổng hợp số liệu đến việc phân tích số liệu. Do đó có thể nói một quá trình nghiên cứu thống kê gồm ba giai đoạn chính: điều tra thống kê (thu thập số liệu), tổng hợp thống kê (xử lý số liệu), phân tích và dự báo. Chương này trình bày nội dung về điều tra thống kê. 2.1 Khái niệm về điều tra thống kê Điều tra thống kê là việc tổ chức một cách khoa học dựa trên kế hoạch thống nhất việc thu thập, ghi chép các tài liệu thống kê theo mục đích, yêu cầu nghiên cứu đối với hiện tượng và quá trình kinh tế - xã hội trong điều kiện thời gian và không gian cụ thể. Ví dụ: Ở nước ta, cuộc tổng điều tra dân số được tiến hành 10 năm một lần. Để thực hiện nhiệm vụ này, các bộ phận chuyên trách và các đơn vị liên quan phải xây dựng kế hoạch và phương án điều tra hết sức cụ thể như việc tổ chức tuyên truyền để người dân hiểu rõ mục đích, ý nghĩa của cuộc điều tra để khai báo trung thực, chính xác; phải tổ chức nhiều tổ điều tra và tập huấn cho nhân viên điều tra cách phỏng vấn, ghi chép số liệu; thiết kế phiếu điều tra, xây dựng phần mềm dùng để nhập và xử lý số liệu; chuẩn bị kinh phí cần thiết cho cuộc điều tra; xác định thời điểm và thời gian điều tra Việc xây dựng kế hoạch và phương án điều tra phải có căn cứ khoa học và đòi hỏi trình độ tổ chức cao. Nhiệm vụ của điều tra thống kê là thu thập và cung cấp thông tin về các đơn vị tổng thể cho các khâu tiếp theo của quá trình nghiên cứu thống kê. Do đó để cho việc thực hiện các giai đoạn nghiên cứu thống kê tiếp theo có hiệu quả và đáp ứng được các yêu cầu đề ra thì các tài liệu điều tra phải có chất lượng. Do vậy các yêu cầu như: thích đáng, chính xác, khách quan, trung thực, kịp thời và đầy đủ là không thể thiếu trong điều tra thống kê. Thích đáng: Số liệu thu thập phải phù hợp, đáp ứng được mục đích nghiên cứu. Số liệu đáp ứng được mục tiêu nghiên cứu có tính chất trực tiếp hoặc gián tiếp. Đối với những thông tin dễ tiếp cận thường thì ta sử dụng số liệu trực tiếp, ví dụ muốn biết được nhu cầu của khách hàng chúng ta có thể hỏi trực tiếp khách hàng. Tuy nhiên, một số nội dung nghiên cứu mang tính chất nhạy cảm hoặc khó thu thập thì chúng ta có thể thu nhập những số liên quan gián tiếp, ví dụ để thu thập thu nhập của cá nhân chúng ta có thể thu thập những nội dung có liên quan như nghề nghiệp, đơn vị công tác, chức vụ, nhà ở, phương tiện đi lại... Chính xác: Các thông tin trong quá trình nghiên cứu phải có giá trị, đáng tin cậy để các phân tích, kết luận phản ánh đúng đặc điểm bản chất của hiện tượng. Vì vậy điều 14 tra viên phải có trình độ chuyên môn và tinh thần trách nhiệm. Khách quan: Có nghĩa là các tài liệu thu thập được phải phản ảnh đúng đắn tình hình thực tế khách quan của hiện tượng nghiên cứu. Điều này đòi hỏi việc ghi chép phải khách quan, không được tùy tiện thêm bớt, không được sao chép một cách tùy hứng, không được suy luận theo ý muốn chủ quan của bất kỳ một tổ chức hay cá nhân nào. Trung thực: Yêu cầu này đòi hỏi người thu thập thông tin phải tuyệt đối trung thực, ghi chép đúng những gì đã được nghe, được thấy. Đối với người cung cấp thông tin, đòi hỏi họ phải cung cấp thông tin xác thực, không được che giấu và khai man thông tin. Kịp thời: Tài liệu ghi chép được phải mang tính thời sự, phục vụ các yêu cầu nghiên cứu đúng lúc cần thiết. Trong quản lý kinh tế, yêu cầu này giúp cho nhà quản lý ra các quyết định chuẩn xác, mang lại lợi ích kinh tế cao. Ngoài ra, việc cung cấp thông tin cũng phải đảm bảo đúng hạn quy định của phương án điều tra. Đầy đủ: Có nghĩa là tài liệu thu thập được theo đúng nội dung và số đơn vị tổng thể đã quy định trong văn bản điều tra, có như vậy mới đáp ứng được mục đích nghiên cứu. 2.2 Các loại điều tra thống kê Ta có sơ đồ về các loại điều tra thống kê như sau: 2.2.1 Điều tra thường xuyên: là tiến hành thu thập thông tin một cách thường xuyên của hiện tượng nghiên cứu, được áp dụng với hiện tượng nghiên cứu có sự biến động liên tục. Tài liệu có được từ loại điều tra này là cơ sở để lập các báo cáo thống kê định kỳ, để theo dõi tình hình thực hiện kế hoạch. Ví dụ như chấm công hàng ngày số công nhân đi làm tại một xí nghiệp, ghi chép số sản phẩm xuất nhập kho hàng ngày, ghi chép số lượng nguyên vật liệu nhập kho 2.2.2 Điều tra không thường xuyên: là chỉ tiến hành thu thập thông tin của hiện tượng nghiên cứu khi thấy cần thiết, được áp dụng cho những hiện tượng nghiên cứu ít biến động, biến động chậm, hoặc không cần theo dõi thường xuyên. Ví dụ như điều tra dân số, điều tra mức sống dân cư, điều tra cơ sở kinh tế, hành chính, sự nghiệp, điều tra nhu cầu nhà ở của dân cư, điều tra dư luận xã hội Hình thức chủ yếu của loại 15 điều tra này là các cuộc điều tra chuyên môn. Để thuận tiện cho việc so sánh, phân tích sự biến động của hiện tượng theo thời gian, các cuộc điều tra không thường xuyên cũng được tiến hành lặp đi lặp lại theo một chu kỳ nhất định và người ta kế thừa các kết quả của cuộc điều tra trước nếu nó vẫn còn sử dụng được. 2.2.3 Điều tra toàn bộ: là tiến hành thu thập thông tin đối với tất cả các đơn vị của tổng thể. Ví dụ như điều tra tài sản, điều tra dân số, điều tra hàng hóa, vật tư tồn khoTài liệu có được qua điều tra toàn bộ là khá đầy đủ và toàn diện, giúp cho việc tính toán các chỉ tiêu một cách chính xác. Do đó, tuy loại điều tra này đòi hỏi chi phí cao nhưng nó đem lại lợi ích rất lớn trong nghiên cứu thống kê. 2.3.4 Điều tra không toàn bộ: là tiến hành thu thập thông tin từ một số đơn vị được chọn ra từ tổng thể chung. Các đặc trưng có được từ kết quả điều tra này dùng để suy rộng ra cho tổng thể chung. Điều tra không toàn bộ được sử dụng khá phổ biến trong nghiên cứu thống kê hiện nay, giúp tiết kiệm được chi phí và thời gian, làm cho chất lượng các tài liệu thu được tốt hơn. Điều tra chọn mẫu là loại điều tra thống kê không toàn bộ mà trong đó một số đơn vị được chọn ra đủ lớn theo những nguyên tắc nhất định (thường thì làm theo nguyên tắc ngẫu nhiên), đảm bảo tính đại diện cho tổng thể chung để điều tra thực tế và dựa vào kết quả điều tra được có thể tính toán suy rộng cho toàn bộ tổng thể chung. Ví dụ như điều tra chất lượng của sản phẩm đồ hộp, điều tra năng suất cây trồng, điều tra giá cả thị trường, điều tra đời sống dân cư Điều tra trọng điểm là loại điều tra không toàn bộ, chỉ tiến hành điều tra ở bộ phận chủ yếu nhất, có đặc điểm nổi bật nhất của tổng thể nhằm nghiên cứu tính chất điển hình của hiện tượng. Kết quả điều tra không được dùng để suy rộng các đặc trưng đó cho tổng thể chung. Loại điều tra này thích hợp với những đối tượng có các bộ phận tương đối tập trung, chiếm tỷ trọng lớn trong tổng thể. Ví dụ như để điều tra sản lượng cây chè, ta chỉ cần thu thập về loại cây này ở các vùng có số lượng lớn như Thái Nguyên, Bảo Lộc Điều tra chuyên đề là loại điều tra chỉ được tiến hành trên một số rất ít đơn vị tổng thể. Do đó có thể đi sâu thu thập thông tin trên nhiều tiêu thức. Kết quả điều tra không được dùng để suy rộng hoặc làm căn cứ để đánh giá tổng thể chung. Kết quả phân tích tài liệu trong điều tra chuyên đề dùng để nghiên cứu những vấn đề mới phát sinh, nghiên cứu kinh nghiệm của các đơn vị tiên tiến hoặc phân tích tìm ra nguyên nhân yếu kém của các đơn vị lạc hậu. Ví dụ như điều tra hiệu quả của thâm canh một số loại cây trồng, điều tra về năng suất lao động, giá thành sản phẩm, chất lượng sản phẩm 2.3 Hình thức tổ chức thu thập thông tin Có hai hình thức thu thập thông tin thống kê chủ yếu: báo cáo thống kê định kỳ và điều tra chuyên môn. 16 2.3.1 Báo cáo thống kê định kỳ Là hình thức thu thập thông tin thống kê theo chế độ báo cáo thống kê do cơ quan Nhà nước có thẩm quyền ban hành. Báo cáo thống kê bao gồm:  Phần tên gọi của báo cáo, cơ quan ban hành, đơn vị báo cáo, thời gian định kỳ lập và gởi báo cáo, cơ quan chủ quản nhận báo cáo, chữ ký của người lập báo cáo, chữ ký của trưởng đơn vị báo cáo  Phần trình bày chỉ tiêu, tiêu thức và số liệu tổng hợp, tính toán theo yêu cầu báo cáo. Dưới đây là biểu báo cáo hàng tháng của các doanh nghiệp nhà nước có hoạt động sản xuất công nghiệp và biểu báo cáo tháng hoạt động xuất khẩu hàng hóa ban hành theo Quyết định số 156/2003/QĐ-TCTK ngày 13/3/2003 của Tổng cục trưởng Tổng cục Thống kê hiện đang sử dụng: - Biểu số 01 - ĐTDN Ban hành theo Quyết định số 156/2003/QĐ-TCTK ngày 13/3/2003 của Tổng cục trưởng Tổng cục Thống kê - Ngày nhận báo cáo: Ngày 08 sau tháng báo cáo BÁO CÁO HOẠT ĐỘNG SẢN XUẤT CÔNG GHIỆP Áp dụng đối với doanh nghiệp hoạt động.... Tháng ..... năm 201.... - Đơn vị gởi:.............................. - Đơn vị nhận báo cáo: + Cục Thống kê tỉnh .. + Ban quản lý. + Đơn vị chủ quản Tên doanh nghiệp: .............................................................Số điện thoại:...................... Địa chỉ: - Huyện (Quận)................................................................ - Tỉnh (Thành phố) ...................................................... Loại hình: DNNN 1 DN Ngoài NN 2 DN có vốn ĐT nước ngoài 3 1. Sản xuất, tiêu thụ, tồn kho sản phẩm: Ghi chú: Cột A ghi theo danh mục sản phẩm quy định của từng ngành. 2. Doanh thu thuần của hoạt động sản xuất công nghiệp: Đơn vị tính: Triệu đồng Mã số Thực hiện tháng Cộng dồn từ đầu năm đến cuối tháng Dự tính thực hiện tháng tiếp theo Tên sản phẩm Mã sản phẩm Đơn vị tính sản phẩm Tồn kho đầu tháng báo cáo Sản phẩm SX trong tháng báo cáo Tiêu thụ trong tháng báo cáo Xuất kho cho chế biến tiếp trong doanh nghiệp Dự tính sản phẩm SX tháng tiếp theo Sản phẩm SX cộng dồn từ đầu năm đến cuối kỳ báo cáo Số lượng sản phẩm Giá trị sản phẩm (triệu đồng) A B C 1 2 3 4 5 6 7 - SP . . . . . . . . . - SP . . . . . . . . . - SP . . . . . . . . . 17 báo cáo báo cáo A B 1 2 3 6.1 Doanh thu thuần của hoạt động SX công nghiệp 01 6.2 Thuế và các khoản phải nộp nhà nước 02 3. Số ngày hoạt động trong tháng của doanh nghiệp: ngày 4. Tình hình sản xuất trong tháng (ghi tóm tắt những khó khăn, thuận lợi chính): ....................................................................................................................................................... Người ghi phiếu (Ký, ghi rõ họ tên) Điều tra viên (Ký, ghi rõ họ tên) Ngày ... tháng ... năm 201. Giám đốc doanh nghiệp (Ký, đóng dấu) - Biểu 01e/CS Ban hành theo Quyết định số 156/2003/QĐ-TCTK ngày 13/3/2003 của Tổng cục trưởng Tổng cục Thống kê - Ngày nhận báo cáo: Ngày 12 tháng sau tháng báo cáo BÁO CÁO THÁNG HOẠT ĐỘNG XUẤT KHẨU HÀNG HÓA (Áp dụng đối với doanh nghiệp có hoạt động xuất khẩu hàng hóa) (Tháng......./..............) Đơn vị nhận báo cáo: - Cục Thống kê tỉnh - Ban quản lý.. - Đơn vị chủ quản Mã số thuế của doanh nghiệp 1. Tên doanh nghiệp: ....................................................................................................................... 2. Ngành sản xuất kinh doanh chính: ....................................................................................... 3. Loại hình doanh nghiệp: ............................................................................................................ Mã số Đơn vị tính Thực hiện tháng báo cáo Cộng dồn Từ đầu năm đến cuối tháng báo cáo Dự tính tháng tiếp theo Lượng Giá trị (1.000USD) Lượng Giá trị (1.000USD) Lượng Giá trị (1.000USD) A B C D 1 2 3 4 5 6 TỔNG GIÁ TRỊ (1+2) (FOB) 1.000USD 1 Xuất khẩu trực tiếp " Tr.đó:XK ủy thác cho DN khác " Mặt hàng/nước hàng đến (*) - Mặt hàng...../nước....... Ghi theo đơn vị tính của hàng hóa Tr.đó:XK ủy thác cho DN khác - Mặt hàng....../nước...... Tr.đó:XK ủy thác cho DN khác ......... 2 Ủy thác xuất khẩu 1.000USD Mặt hàng (*) ......... Ngày ....... tháng ....... năm .............. Người lập biểu (Ký, ghi rõ họ tên) Người kiểm tra biểu (Ký, ghi rõ họ tên) Giám đốc doanh nghiệp (Ký, đóng dấu) 18 2.3.2 Điều tra chuyên môn Là hình thức tổ chức thu thập thông tin thống kê một cách không thường xuyên, được tiến hành theo một kế hoạch và phương pháp quy định riêng cho mỗi lần điều tra. Đối tượng được tổ chức điều tra chuyên môn là những hiện tượng nghiên cứu không có yêu cầu theo dõi thường xuyên, hoặc quá tốn kém khi thực hiện thu thập tài liệu thường xuyên liên tục, hoặc những hiện tượng tuy có biến động theo thời gian nhưng chậm hoặc không quá lớn, hoặc những hiện tượng xảy ra bất thường. Điều tra chuyên môn khác với báo cáo thống kê ở hai điểm: một là, không thường xuyên tổ chức thu thập thông tin thống kê, mà chỉ thực hiện mỗi khi cần thiết; hai là, mỗi lần tổ chức thu thập thông tin được tiến hành theo kế hoạch, phương pháp và nội dung điều tra riêng. Ví dụ như tổng điều tra dân số, điều tra giá cả thị trường, điều tra nhu cầu nhà ở, tổng điều tra tài sản cố định, điều tra hàng hóa, vật tư tồn kho, điều tra thiệt hại bão lũ, thiên tai Trong điều kiện kinh tế thị trường hiện nay, các cuộc điều tra chuyên môn ngày càng có vai trò quan trọng trong việc thu thập các tài liệu thống kê. Tuy nhiên, muốn thực hiện có hiệu quả các cuộc điều tra loại này, chúng ta cần xây dựng các phương án điều tra hết sức chi tiết và toàn diện. 2.4 Phương pháp thu thập thông tin thống kê Có hai phương pháp thu thập thông tin thống kê chủ yếu: phương pháp trực tiếp và phương pháp gián tiếp. 2.4.1 Phương pháp trực tiếp Là phương pháp điều tra để thu thập tài liệu thống kê ban đầu, trong đó nhân viên thống kê trực tiếp tiếp xúc với đối tượng điều tra để tiến hành các công việc điều tra và ghi chép số liệu, hoặc trực tiếp giám sát những người được bố trí tham gia cuộc điều tra. Ví dụ như điều tra dân số, điều tra năng suất lúa, điều tra hàng tồn kho, điều tra chăn nuôi, điều tra giá cả thị trường, điều tra đời sống dân cư Phương pháp trực tiếp được thực hiện theo các hình thức chủ yếu: quan sát trực tiếp, phỏng vấn trực diện, và phỏng vấn qua điện thoại. Quan sát trực tiếp: là phương pháp thu thập dữ liệu bằng cách quan sát hành động, hành vi, thái độ của đối tượng được điều tra đang diễn ra. Ví dụ, quan sát thái độ của khách hàng khi thưởng thức các món ăn tại một nhà hàng, hoặc nghiên cứu trẻ con yêu thích màu sắc nào. Phương pháp này tỏ ra hiệu quả đối với các trường hợp đối tượng khó tiếp cận và người điều tra muốn tăng tính khách quan của đối tượng. Phỏng vấn trực diện: phương pháp này thích hợp cho những cuộc điều tra thu thập nhiều thông tin với nội dung tương đối phức tạp, cần thu thập một cách chi tiết, gồm có hai hình thức là phỏng vấn cá nhân và phỏng vấn nhóm. Phỏng vấn cá nhân là việc nhân viên điều tra tiếp xúc trực diện với đối tượng cung cấp thông tin để thu thập tài liệu ban đầu, thường được thực hiện tại nhà riêng hoặc tại nơi làm việc, và được áp 19 dụng khi tiến hành điều tra chính thức. Phỏng vấn nhóm là việc nhân viên điều tra phỏng vấn từng nhóm để thảo luận về một vấn đề nào đó, thường được sử dụng khi tiến hành điều tra thử để kiểm tra lại nội dung của bảng hỏi (phiếu điều tra) hoặc nhằm tìm hiểu một vấn đề phức tạp mà bản thân người nghiên cứu chưa nắm được một cách đầy đủ, cần tham khảo có ý kiến cụ thể từ những người am hiểu. Phỏng vấn qua điện thoại: là phương pháp thu thập thông tin thống kê thông qua việc phỏng vấn trực tiếp đối tượng điều tra bằng điện thoại theo một bảng hỏi được soạn sẵn. Áp dụng khi mẫu nghiên cứu gồm nhiều đối tượng là cơ quan xí nghiệp, hoặc đối tượng nghiên cứu phân bố phân tán trên nhiều địa bàn thì phỏng vấn bằng điện thoại có chi phí thấp hơn phỏng vấn bằng thư (phỏng vấn gián tiếp). Tuy nhiên, thời gian phỏng vấn bị hạn chế vì người trả lời thường không sẵn lòng nói chuyện lâu qua điện thoại, nhiều khi người cần hỏi từ chối trả lời hay không có ở nhà. Vì vậy, nên sử dụng kết hợp phỏng vấn bằng điện thoại với phương pháp thu thập dữ liệu khác để tăng thêm hiệu quả của phương pháp. Tóm lại, có thể nói rằng tài liệu điều tra bằng phương pháp trực tiếp sẽ có độ chính xác cao, nhân viên điều tra sẽ kịp thời phát hiện sai sót để sửa chữa và bổ sung nếu họ làm việc với tinh thần trách nhiệm cao. Tuy nhiên, phương pháp này đòi hỏi nhiều nhân lực, chi phí cao. 2.4.2 Phương pháp gián tiếp Là phương pháp điều tra thu thập thông tin thống kê trong đó người điều tra không trực tiếp tiếp xúc với đối tượng điều tra, không trực tiếp làm các công việc điều tra. Phương pháp gián tiếp được thực hiện theo các hình thức chủ yếu: quan sát gián tiếp, phỏng vấn gián tiếp (phương pháp phát phiếu điều tra). Quan sát gián tiếp: là tiến hành quan sát kết quả hay tác động của hành vi, chứ không trực tiếp quan sát hành vi. Ví dụ, nghiên cứu hồ sơ về doanh số bán trong từng ngày của một siêu thị để có thể thấy được xu hướng tiêu dùng của khách hàng trong từng thời kỳ, hoặc nghiên cứu về hồ sơ ghi lại hàng tồn kho có thể thấy được xu hướng chuyển dịch của thị trường Phương pháp phỏng vấn gián tiếp: Theo phương pháp này, tài liệu điều tra được thực hiện bằng cách người được hỏi nhận phiếu điều tra (nhân trực tiếp từ cơ quan điều tra thống kê, hoặc nhận phiếu qua thư gửi bưu điện), tự mình ghi hoặc chọn câu trả lời vào phiếu rồi gửi trở lại cơ quan điều tra thống kê. Đặc điểm cơ bản của phương pháp này là người hỏi và người trả lời không trực tiếp gặp nhau. Do đó để nâng cao chất lượng thông tin thu thập được, cần chú ý đến một số điều kiện cơ bản như sau: người được hỏi phải có trình độ nhất định, tự giác và có ý thức trách nhiệm; phiếu điều tra nên ngắn gọn; các câu hỏi phải rõ ràng, dễ hiểu, dễ trả lời; không để thất lạc phiếu. Phương pháp phỏng vấn gián tiếp có ưu điểm là dễ tổ chức, tiết kiệm chi phí và điều tra viên, nhưng lại có nhược điểm là khó kiểm tra cũng như đánh giá độ chuẩn xác các 20 câu trả lời, tỷ lệ thu hồi phiếu trong nhiều trường hợp là không cao. Ngoài ra, trong điều tra thu thập dữ liệu thống kê, người ta còn sử dụng một số phương pháp khác như: phương pháp thu thập thông tin qua những nguồn tài liệu có sẵn như website của tổng cục thống kê ( niên giám thống kê, chứng từ sổ sách 21 Câu hỏi ôn tập: 1. Phân biệt các loại điều tra thống kê, cho ví dụ minh họa. 2. Liệt kê một số cuộc điều tra thống kê thực tế hiện nay ở nước ta (hàng tháng, hàng quý, hàng năm,). Đối với cuộc tổng điều tra dân số được tiến hành năm 2009, hãy xác định mục đích, phạm vi, đối tượng, đơn vị và nội dung của cuộc điều tra này. 3. Vì sao người ta lại cho rằng: để thu thập thông tin thống kê thường tiến hành điều tra không toàn bộ? 4. Để xác định được số sản phẩm công nghiệp sản xuất được hàng tháng thống kê tiến hành điều tra toàn bộ hay không toàn bộ? Vì sao? 5. Để xác định được số sản phẩm công nghiệp sản xuất được hàng tháng thống kê tiến hành điều tra toàn bộ hay không toàn bộ? Vì sao? 6. Hàng năm, các doanh nghiệp phải nộp “Báo cáo tài chính doanh nghiệp” cho các cơ quan liên quan. a. Đây có phải là cuộc điều tra thống kê không? b. Nếu là cuộc điều tra thống kê thì đó là điều tra toàn bộ hay không toàn bộ? c. Phương pháp thu thập thông tin là trực tiếp hay gián tiếp? 7. Số hộ trên địa bàn vào ngày 1 tháng 7 năm 2010 của tỉnh A là 250.000 hộ. Để xác định mức sống của dân cư, Cục Thống kê của tỉnh tiến hành điều tra ở 150 hộ. Nhân viên tham gia điều tra có 5 người. Họ đến các hộ để thu thập thông tin. Hãy xác định: Tổng thể chung, tổng thể mẫu, loại điều tra, phương pháp điều tra. 8. Thiết kế một nghiên cứu thống kê về một vấn đề mà anh/ chị quan tâm. 22 Chương 3 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ Các tài liệu thu được trong quá trình điều tra thống kê chỉ mới là tài liệu sơ khởi ban đầu, phản ảnh đặc trưng riêng lẻ của từng đơn vị tổng thể, chúng ta chưa thể rút ra được những đặc trưng chung nhất về hiện tượng nghiên cứu từ các tài liệu này. Vì vậy chúng cần được tổng hợp lại một cách có hệ thống và khoa học. Tổng hợp thống kê là tiến hành tập trung, chỉnh lý, hệ thống hoá một cách khoa học các tài liệu ban đầu thu thập được trong điều tra thống kê, nhằm làm cho các đặc trưng riêng biệt về từng đơn vị của hiện tượng nghiên cứu bước đầu chuyển thành những đặc trưng chung của toàn bộ hiện tượng. Nhiệm vụ cơ bản của tổng hợp thống kê là chuyển các đặc trưng cá biệt của từng đơn vị thành đặc trưng chung của tổng thể. Tài liệu thống kê sau khi được tổng hợp được sử dụng để phân tích và dự báo thống kê. Có hai phương pháp tổng hợp thống kê chủ yếu, đó là phương pháp đơn giản và phương pháp phân tổ thống kê. Phương pháp đơn giản được vận dụng khi số đơn vị điều tra ít hoặc lượng tài liệu không nhiều, theo đó các tài liệu được sắp xếp theo một trật tự nhất định nào đó như tăng hoặc giảm dần, theo vần Ngược lại, trong trường hợp số đơn vị điều tra nhiều hay lượng tài liệu điều tra lớn, việc sử dụng phương pháp đơn giản sẽ gặp nhiều khó khăn. Khi đó phương pháp phân tổ thống kê được sử dụng để thay thế. 3.1 Phân tổ thống kê 3.1.1 Khái niệm Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để sắp xếp các đơn vị của tổng thể vào các tổ, nhóm tổ, hoặc các tiểu tổ có tính chất khác nhau đáp ứng mục đích yêu cầu nghiên cứu. Ví dụ như dân số được phân tổ theo khu vực, giới tính, độ tuổi, tình trạng hôn nhân... Khi nghiên cứu tình hình sản xuất của các doanh nghiệp công nghiệp, có thể phân tổ số doanh nghiệp thành các nhóm theo các tiêu thức như: thành phần kinh tế, ngành sản xuất, số lượng lao động, giá trị sản xuất công nghiệp Kết quả của quá trình phân tổ thường tạo thành một dãy số phân phối, bao gồm lượng biến và tần số phân phối. Ý nghĩa của phân tổ thống kê Đây là phương pháp tổng hợp dữ liệu có ý nghĩa quan trọng trong nghiên cứu thống kê, bởi vì:  Trong các cuộc khảo sát điều tra thực tế, các hiện tượng kinh tế xã hội tương đối phức tạp, nếu không tiến hành phân tổ thì ta sẽ không thể hệ thống các tài liệu điều tra một cách khoa học. Khi phân tổ thống kê, các đơn vị trong tổng 23 thể có cùng đặc điểm, tính chất được sắp xếp chung vào một tổ. Sau đó nghiên cứu đặc điểm riêng của từng tổ và rút ra các kết luận về đặc điểm chung của tổng thể.  Phân tổ còn được vận dụng ngay trong giai đoạn điều tra thống kê, nhằm phân chia các đối tượng điều tra thành các bộ phận với đặc điểm, tính chất khác nhau. Từ đó chọn các đơn vị điều tra sao cho có tính đại diện cho tổng thể chung. Ví dụ: Có tài liệu điều tra 10 công nhân tại một doanh nghiệp được sắp xếp theo tuổi nghề va năng suất lao động như sau: Tên CN Tuổi nghề (năm) NSLĐ Tên CN Tuổi nghề (năm) NSLĐ A 1 25 F 6 60 B 2 40 G 7 70 C 3 40 H 8 70 D 4 50 I 9 88 E 5 55 J 10 90 Kết quả tổng hợp trên đã thể hiện rõ nét mối quan hệ giữa tuổi nghề với NSLĐ ở công ty này: tuổi nghề càng cao thì năng suất lao động càng cao. 3.1.2 Các loại phân tổ thống kê Căn cứ vào nhiệm vụ của phân tổ thống kê: Có 3 loại phân tổ thống kê, bao gồm phân tổ phân loại, phân tổ kết cấu và phân tổ liên hệ. Phân tổ phân loại là phân chia các loại hình kinh tế - xã hội nhằm nêu lên đặc trưng của từng loại hình và mối quan hệ giữa chúng với nhau. Ví dụ: Phân tổ phân loại dân số bình quân nước ta theo khu vực và giới tính năm 2012 Khu vực Tổng số (Nghìn người) Cơ cấu (%) Giới tính Tổng số (Nghìn người) Cơ cấu (%) Thành thị Nông thôn 28.269,2 60.540,1 31,83 68,17 Nam Nữ 43.908,2 44.901,1 49,44 50,56 Cả nước 88.809,3 100 Cả nước 88.809,3 100 Nguồn: Tổng cục Thống kê Theo ví dụ trên, nếu chỉ căn cứ vào những số liệu thống kê riêng lẻ của từng nhân khẩu, ta không rút ra được kết luận gì về đặc trưng cơ bản của dân số nước ta. Ngược lại, với số liệu thống kê đã được tổng hợp như trên, ta có thể thấy sự mất cân bằng 24 giữa nam và nữ của dân số nước ta năm 2012 là không đáng kể; số dân sống ở khu vực nông thôn gần gấp đôi số dân sống ở khu vực thành thị. Phân tổ kết cấu là phân chia hiện tượng nghiên thành các tổ có tính chất khác nhau, sau đó tính tỷ trọng của mỗi bộ phận cấu thành nên tổng thể, và đánh giá kết cấu của hiện tượng theo tiêu thức nghiên cứu. Ví dụ như tổng sản phẩm trong nước theo giá thực tế được phân tổ kết cấu theo nhóm ngành kinh tế. Ví dụ: Phân tổ kết cấu tổng sản phẩm trong nước theo giá thực tế theo ngành kinh tế qua các năm 2007-2010. TỔNG SỐ Nông nghiệp, lâm nghiệp và thủy sản Công nghiệp chế biến, chế tạo Giá trị (Tỷ đồng) Cơ cấu (%) Giá trị (Tỷ đồng) Cơ cấu (%) Giá trị (Tỷ đồng) Cơ cấu (%) 2007 1.246.769,29 100 232.586 18,66 241.629 19,39 2008 1.616.047,13 100 329.886 20,42 300.256 18,59 2009 1.809.148,95 100 346.786 19,17 331.093 18,30 2010 2.157.828,00 100 396.576 18,38 279.360 12,95 Nguồn: Tổng cục Thống kê Phân tổ liên hệ là việc phân chia hiện tượng nghiên cứu theo nhiều tiêu thức có liên hệ với nhau, trên cơ sở đó đánh giá mối liên hệ giữa các tiêu thức đó. Tiêu thức liên hệ trong trường hợp này gồm hai loại: tiêu thức nguyên nhân và tiêu thức kết quả. Khi phân tổ liên hệ có nhiều tiêu thức, thì tiến hành phân tổ theo một tiêu thức nguyên nhân trước, sau đó mỗi tổ lại được chia thành các tiểu tổ theo tiêu thức nguyên nhân thứ hai Ví dụ như phân tổ liên hệ giữa năng suất lao động và tuổi nghề của công nhân, hoặc phân tổ liên hệ cho năng suất lao động với trình độ kỹ thuật và tuổi nghề của công nhân trong một doanh nghiệp. Dưới đây là một số bảng dữ liệu thống kê dựa trên các kiểu phân tổ vừa nêu ở trên. Ví dụ: Ta có phân tổ liên hệ giữa năng suất lao động với trình độ kỹ thuật và tuổi nghề trong một doanh nghiệp như sau: Phân tổ công nhân Số công nhân Năng suất lao động bình quân năm (tr.đ/người) Trình độ kỹ thuật Tuổi nghề Đã qua đào tạo Dưới 5 5-10 10-15 15-20 20 trở lên 20 40 45 15 10 212,50 237,50 250,00 270,00 255,00 Chung 130 243,08 25 Chưa qua đào tạo Dưới 5 5-10 10-15 15-20 20 trở lên 15 20 20 10 5 150,00 185,00 197,50 240,00 210,00 Chung 70 152,57 Chung cho cả doanh nghiệp 200 211,40 Căn cứ vào số lượng tiêu thức để phân tổ: Có hai loại là phân tổ thống kê, bao gồm phân tổ theo một tiêu thức và phân tổ theo nhiều tiêu thức. Phân tổ theo một tiêu thức: là phân chia tổng thể nghiên cứu thành các tổ có tính chất khác nhau dựa vào một tiêu thức thống kê. Ví dụ như dựa vào tiêu thức thành phần kinh tế, các doanh nghiệp của một địa phương được phân thành 5 tổ với các tên gọi: kinh tế nhà nước, kinh tế tập thể, kinh tế cá thể, kinh tế tư nhân và kinh tế có vốn đầu tư nước ngoài. Phân tổ theo nhiều tiêu thức: là tiến hành phân chia tổng thể nghiên cứu thành các tổ và các tiểu tổ có tính chất khác nhau dựa trên ít nhất hai tiêu thức thống kê trở lên, bao gồm phân tổ kết hợp và phân tổ nhiều chiều. 3.1.3 Tiêu thức phân tổ Khái niệm Tiêu thức phân tổ là tiêu thức được chọn làm căn cứ để phân chia tổng thể nghiên cứu thành các tổ có tính chất và đặc điểm khác nhau. Tiêu thức được chọn để phân tổ phải phản ảnh đúng bản chất của hiện tượng nghiên cứu và phù hợp với mục đích nghiên cứu. Ví dụ, nếu hoạt động sản xuất của doanh nghiệp chủ yếu dựa trên kỹ thuật hiện đại, tiên tiến thì ta chọn tiêu thức phân tổ là giá trị sản xuất, hoặc giá trị thiết bị sản xuất chủ yếu. Ngược lại nếu hoạt động sản xuất của doanh nghiệp chủ yếu bằng phương pháp thủ công, phần lớn dựa vào sức lao động của con người thì ta chọn tiêu thức phân tổ là số lượng công nhân. Các căn cứ để lựa chọn tiêu thức phân tổ Thứ nhất, phải dựa vào phân tích lý luận để lựa chọn ra tiêu thức bản chất nhất phù hợp với mục đích nghiên cứu. Thứ hai, phải căn cứ vào điều kiện lịch sử cụ thể của hiện tượng nghiên cứu để chọn ra tiêu thức phân tổ phù hợp. Thứ ba, phải tuỳ theo mục đích nghiên cứu và điều kiện tài liệu thực tế mà quyết định phân tổ hiện tượng theo một hay nhiều tiêu thức. 3.1.4 Bảng phân phối tần số Sau khi phân tổ thống kê, các số liệu thường được trình bày dưới dạng bảng phân 26 phối tần số để dễ dàng nhận biết được một số tính chất cơ bản của hiện tượng nghiên cứu. Lượng biến Tần số Tần suất (%) Tần số tích luỹ 1x 1f 1f n 1f 2x 2f 2f n 1 2f f ... kx kf kf n 1 2 ... kf f f   Tổng n 100 Cần lưu ý rằng, trong các bài toán có phân tổ thống kê, các lượng biến là giá trị đại diện cho các tổ. 3.1.5 Cách phân tổ thống kê Phân tổ theo tiêu thức thuộc tính Trong phân tổ này, số tổ được hình thành bằng số các loại hình khác nhau của hiện tượng nghiên cứu. Có hai trường hợp:  Nếu tiêu thức có ít thuộc tính, có thể coi mỗi thuộc tính là một tổ.Ví dụ: phân tổ dân số theo giới tính, phân tổ các doanh nghiệp theo thành phần kinh tế, phân tổ sản phẩm công nghiệp theo nhóm A và nhóm B  Nếu tiêu thức có nhiều thuộc tính, nên ghép nhiều tổ nhỏ thành một số tổ lớn theo nguyên tắc các tổ nhỏ ghép lại phải giống nhau hoặc gần giống nhau (thường được quy định bằng văn bản) về tính chất phù hợp với mục đích, yêu cầu nghiên cứu. Ví dụ, khi điều tra về dân số theo khả năng lao động, ta phân tổ thành các loại hình: chưa đến tuổi lao động, trong tuổi lao động, quá tuổi lao động Trong thực tế, thống kê thường phân tổ theo bảng danh mục hay bảng phân loại do Nhà nước quy định thống nhất và cố định trong một thời gian dài, nhằm đảm bảo tính so sánh được của các tài liệu thống kê. Chẳng hạn, người ta đã thực hiện điều này dưới các hình thức: bảng danh mục hàng hóa, bảng danh mục nghề nghiệp, bảng hệ thống ngành kinh tế Phân tổ theo tiêu thức số lượng Đối với tiêu thức số lượng, việc phân tổ thống kê dựa vào số lượng biến của tổng thể mẫu, bao gồm hai trường hợp: Trường hợp tiêu thức số lượng có ít trị số thì mỗi một trị số ứng với một tổ. 27 Ví dụ, phân tổ số công nhân của một doanh nghiệp dệt theo số máy dệt mỗi công nhân phụ trách ở bảng sau: Số máy dệt mỗi công nhân phụ trách Số công nhân (người) 11 12 13 14 15 16 6 14 40 100 80 30 Cộng 270 Trường hợp tiêu thức số lượng có nhiều trị số thì ta sẽ phân tổ thành các khoảng trên trục số thực (có thể bằng nhau hoặc không bằng nhau). Nếu tổ với các đầu mút hữu hạn thì gọi là tổ đóng, khi đó các đầu mút bên phải và bên trái của tổ được gọi là giới hạn trên và giới hạn dưới tương ứng. Trị số chênh lệch giữa hai giới hạn đó gọi là khoảng cách tổ. Tổ thiếu một trong hai giới hạn gọi là tổ mở. Phân tổ với khoảng cách tổ đều nhau: Được sử dụng khi hiện tượng biến động tương đối đồng đều. Đối với lượng biến liên tục, việc phân tổ gồm các bước sau đây: Bước 1: Xác định số tổ  3 2k n , với n là số quan sát (cỡ mẫu). Bước 2: Xác định khoảng cách tổ : max min x x h k   (số này thường được làm tròn) trong đó: xmax và xmin tương ứng là lượng biến lớn nhất và lượng biến nhỏ nhất của tiêu thức, k là số tổ cần phân. Lưu ý: Nếu giá trị quan sát trùng với giới hạn trên của một tổ thì nó được xếp và tổ tiếp theo. Ví dụ: Phân tổ 30 công nhân tại một doanh nghiệp theo tiêu thức mức thu nhập tháng của một công nhân. Biết rằng số liệu thu thập được như sau. Đơn vị: 1000 đồng 3000 3.200 3.350 3.200 3.700 3.500 3.800 3.900 4000 3.850 3.400 3.500 3.600 3.400 3.600 3.600 3.500 3.600 3.750 3.500 3.400 3.55 4000 3.100 3.550 3.600 3.550 3.600 3.400 3.400 28 Nếu dự kiến chia thành 5 tổ thì h = 4000 3000 5 = 200 Dựa vào h = 200 ta thành lập các tổ và sắp xếp số công nhân vào các tổ thích hợp. Khi đó ta có bảng phân tổ công nhân theo mức thu nhập tháng: Mức thu nhập tháng của một công nhân (1000 đồng) Số công nhân (người) Từ 3000 đến dưới 3.200 Từ 3.200 đến dưới 3.400 Từ 3.400 đến dưới 3.600 Từ 3.600 đến dưới 3.800 Từ 3.800 đến 4.000 2 3 12 8 5 Tổng 30 Nếu số tổ được phân không theo yêu cầu cho trước thì ta tính số tổ 3 2 4k n  , sau đó tính khoảng cách tổ h và phân tổ tương tự như trên. Đối với lượng biến rời rạc, các tổ được thiết lập theo quy định như sau: giới hạn dưới của tổ sau lớn hơn giới hạn trên của tổ trước (thường là một đơn vị) và trị số của khoảng cách tổ được xác định theo công thức dưới đây: ( 1)max minx x kh k     Ví dụ: Có tài liệu về số công nhân của 20 doanh nghiệp sản xuất công nghiệp như sau: Doanh nghiệp Số CN (người) Doanh nghiệp Số CN (người) Doanh nghiệp Số CN (người) Doanh nghiệp Số CN (người) 1 1.200 6 1.430 11 1.650 16 2.883 2 1.304 7 1.350 12 2.050 17 2.540 3 1.500 8 1.240 13 2.120 18 2.760 4 1.670 9 1.700 14 1.980 19 2.300 5 1.400 10 1.800 15 2.400 20 2.130 Giả sử chia 20 doanh nghiệp này thành bốn tổ có khoảng cách đều nhau theo tiêu thức số công nhân (có lượng biến rời rạc). Khi đó h = (2.883 1.200) (4 1) 4    = 420 công nhân 29 Dựa vào h = 420, ta thành lập các tổ và sắp xếp các đơn vị tổng thể vào các tổ thích hợp như sau Số công nhân của doanh nghiệp Số doanh nghiệp 1.200 – 1.620 1.621 – 2.041 2.042 – 2.462 2.463 – 2.883 7 5 5 3 Tổng 20 Phân tổ với khoảng cách tổ không đều nhau được áp dụng khi hiện tượng có lượng biến trên các đơn vị tổng thể biến động không đều. Khi đó ta phân tổ dựa trên việc phân tích quan hệ lượng - chất, có nghĩa là khi lượng biến thay đổi làm cho chất thay đổi thì phải hình thành tổ mới, còn khi lượng biến thay đổi mà chất vẫn chưa thay đổi thì ghép các đơn vị đó vào một tổ. Ví dụ, phân tổ dân số tại một địa phương theo độ tuổi như sau: Độ tuổi Số dân Ghi chú Dưới 1 Từ 1 đến 3 Từ 4 đến 6 Từ 7 đến 18 Từ 19 đến 60 Từ 60 tuổi trở lên 15.000 80.000 70.000 515.000 1.200.000 120.000 Còn bú mẹ Nhà trẻ Mẫu giáo Học phổ thông Tuổi lao động Tuổi nghỉ hưu Tổng 2.000.000 Trong ví dụ trên, ta thấy các tổ có khoảng cách tổ không đều nhau, hơn nữa các tổ đầu tiên và tổ cuối cùng là các tổ mở. 3.2 Bảng thống kê 3.2.1 Khái niệm Bảng thống kê là hình thức trình bày thông tin thống kê theo các hàng và các cột; được sắp xếp có hệ thống, logic, khoa học, nhằm phản ánh các đặc trưng về mặt lượng của hiện tượng nghiên cứu. 3.2.2 Cấu trúc bảng thống kê Về hình thức: Bảng thống kê bao gồm các hàng ngang, cột dọc, tiêu đề chung, các tiêu đề nhỏ (tiêu mục) và các con số. Bảng thống kê bao giờ cũng chỉ rõ đơn vị tính của các số liệu trong bảng. Nếu tất cả các số liệu đều thống nhất một đơn vị tính thì ghi “đơn vị tính: ” tại vị trí phía trên cùng, bên phải của bảng. Ngược lại, các số liệu trong bảng không cùng đơn vị tính thì các đơn vị tính ghi thống nhất theo dòng hoặc theo cột, đi kèm bên cạnh các tiêu mục. Lưu ý rằng tiêu đề là tên gọi chung phản ảnh nội dung, ý 30 nghĩa của bảng, do đó nó thường được viết ngắn gọn, dễ hiểu và nói lên được ý nghĩa, nội dung ghi trong bảng. Phần nội dung: gồm phần chủ đề (phần chủ từ) và phần giải thích (phần tân từ). Phần chủ đề thường được đặt ở vị trí bên trái của bảng, nêu rõ đối tượng được trình bày. Phần giải thích thường được đặt ở phía trên của bảng, gồm các chỉ tiêu giải thích các đặc điểm của đối tượng nghiên cứu, tức là giải thích phần chủ đề. Dưới đây là hình thức bảng thống kê giản đơn: Tên bảng thống kê Phần giải thích Phần chủ đề Đơn vị tính Mã số Tên các chỉ tiêu của phần giải thích A B C 1 2 3 4 5 Tên các chỉ tiêu của phần chủ đề Nguồn thông tin: 3.2.3 Yêu cầu và quy ước của việc xây dựng bảng thống kê Khi xây dựng bảng thống kê nên tuân thủ các nguyên tắc sau đây: Quy mô của bảng không quá lớn, không nên kết hợp quá nhiều chỉ tiêu, nhiều tiêu thức phân tổ. Vì như vậy sẽ rất khó nhận thức, đối chiếu các chỉ tiêu, phân tích và nhận xét về hiện tượng nghiên cứu. Một số ký hiệu quy ước cho một bảng thống kê: - Nếu không có tài liệu thì trong ô ghi dấu gạch ngang “-“ - Nếu số liệu còn thiếu, sau này sẽ bổ sung sau thì trong ô ghi dấu ba chấm “...” - Ký hiệu gạch chéo “x” trong ô nào đó thì nói lên hiện tượng không có liên quan đến chỉ tiêu đó, nếu ghi số liệu vào đó sẽ vô nghĩa hoặc thừa. Phần chú thích ở cuối bảng: Được dùng để giải thích rõ các nội dung chỉ tiêu trong bảng, nói rõ nguồn tài liệu đã sử dụng hoặc các chỉ tiêu cần thiết khác. Đối với các tài liệu khoa học, việc ghi rõ nguồn trích dẫn số liệu được coi như là bắt buộc, không thể thiếu trong bảng thống kê. Các ví dụ: a/ Lao động từ 15 tuổi trở lên đang làm việc hàng năm phân theo giới tính và phân theo nhóm tuổi trong cả nước. 31 ĐVT: Nghìn người 2010 2011 2012 2013 Sơ bộ 2014 TỔNG SỐ 49048,5 50352,0 51422,4 52207,8 52744,5 Phân theo giới tính Nam 25305,9 26024,7 26499,2 26830,2 27025,8 Nữ 23742,6 24327,3 24923,2 25377,6 25718,7 Phân theo nhóm tuổi 15-19 3170,9 2924,7 2550,9 2601,5 2395,4 20-24 5422,1 5096,7 4904,8 4826,4 4714,9 25-29 6618,5 6449,4 6258,0 6119,1 6121,1 30-34 6342,1 6301,9 6232,2 6352,2 6514,6 35-39 6225,4 6387,9 6520,9 6449,6 6456,7 40-44 5778,4 6067,1 6412,3 6462,2 6525,1 45-49 5418,4 5835,2 6212,2 6122,7 6085,9 50+ 10072,5 11289,2 12331,0 13274,2 13930,7 Nguồn: Niên giám thống kê 2014 b/ Diện tích, dân số và mật độ dân số năm 2014 phân theo đại phương vùng Bắc Trung Bộ và duyên hải miền Trung. Diện tích(*) (Km2) Dân số trung bình (Nghìn người) Mật độ dân số (Người/km2) Tổng 95832,4 19522,5 204 Thanh Hóa 11129,5 3496,1 314 Nghệ An 16490,0 3037,4 184 Hà Tĩnh 5997,8 1255,3 209 Quảng Bình 8065,3 868,2 108 Quảng Trị 4739,8 616,4 130 Thừa Thiên - Huế 5033,2 1131,8 225 Đà Nẵng 1285,4 1007,7 784 Quảng Nam 0438,4 1471,8 141 Quảng Ngãi 5152,7 1241,4 241 Bình Định 6050,6 1514,5 250 Phú Yên 5060,6 887,4 175 Khánh Hòa 5217,7 1196,9 229 Ninh Thuận 3358,3 590,4 176 Bình Thuận 7813,1 1207,4 155 (*) Theo Quyết định số 1467/QĐ-BTNMT ngày 21 tháng 7 năm 2014 của Bộ trưởng Bộ Tài nguyên và Môi trường. Nguồn: Tổng cục Thống kê 32 3.3 Tổng hợp bằng đồ thị và biểu đồ thống kê Phương pháp trình bày thông tin thống kê bằng đồ thị và biểu đồ thống kê trên cơ sở sử dụng kết hợp giữa thông tin thống kê với hình vẽ, đường nét, màu sắc và mỹ thuật nhằm giúp cho người đọc nhận thức được một cách dễ dàng, nhanh chóng những nét khái quát về đặc điểm cơ bản của hiện tượng nghiên cứu. Trong công tác thống kê, người ta thường dùng các loại đồ thị và biểu đồ như: Đồ thị dạng dòng kẻ (gấp khúc), đồ thị dạng điểm, đồ thị dạng cột, đồ thị dạng mạng nhện (dạng rada), biểu đồ diện tích (dạng bánh), biểu đồ cành – lá. Ví dụ: Về vốn đầu tư phát triển toàn xã hội thực hiện theo giá hiện hành, ta có thể biểu diễn qua các dạng đồ thị sau: Đồ thị dạng điểm Đồ thị dạng cột 33 Đồ thị dạng mạng nhện (đồ thị rada) Biểu đồ diện tích (dạng bánh): Ví dụ, biểu đồ dạng bánh về dân số trung bình theo địa phương vùng Bắc Trung Bộ và duyên hải miền Trung năm 2009. 34 Câu hỏi ôn tập: 1. Có tài liệu về năng suất lúa (tạ/ha) củ 50 hộ nông dân ở một địa phương được ghi nhận như sau: 35 41 32 44 33 41 38 44 43 42 30 35 35 43 48 46 48 49 39 49 46 42 41 51 36 42 44 34 46 34 36 47 42 41 37 47 49 38 41 39 40 44 48 42 46 52 43 41 52 43 a. Hãy phân tổ tài liệu trên thành các tổ có khoảng cách đều nhau, qua đó lập bảng phân phối tần số, tính tần số tích lũy, tần suất, tần suất tích lũy. b. Vẽ biểu đồ phân phối tần số, tần số tích lũy. c. Trình bày số liệu theo phương pháp nhánh và lá. 2. Có tài liệu về số nhân viên bán hàng trong 54 siêu thị thuộc một thành phố năm 2011 như sau: 14 7 10 16 12 7 16 18 18 12 8 14 16 12 16 16 12 16 18 16 14 7 18 20 18 16 14 7 10 18 18 12 14 14 8 14 20 18 16 12 10 14 10 18 10 10 16 14 14 21 16 18 18 16 Hãy phân tổ tài liệu trên để nêu lên quy mô của các siêu thị trong thành phố này. Biểu hiện kết quả phân tổ bằng bảng thống kê, đồ thị và nêu những nhận xét chủ yếu. 3. Một cơ quan bảo vệ môi trường lấy các mẫu nước từ 15 dòng sông và suối khác nhau, sau đó xét nghiệm mức độ ô nhiễm của từng mẫu nước với kết quả như sau: Mẫu nước Tỷ lệ ô nhiễm (%) Mẫu nước Tỷ lệ ô nhiễm (%) Mẫu nước Tỷ lệ ô nhiễm (%) 1 35.5 6 52.9 11 60.0 2 45.3 7 32.1 12 47.3 3 67.3 8 41.2 13 38.6 4 57.4 9 50.7 14 46.2 5 53.6 10 55.8 15 64.1 35 Hãy phân tổ các mẫu nước trên theo tỷ lệ ô nhiễm trong các khoảng (đơn vị tính: %): 30-40, 40-50, 50-60, 60-70. Trình bày kết quả dưới dạng bảng thống kê và rút ra nhận xét. (Theo các nhà khoa học, tỷ lệ ô nhiễm từ 40% trở lên là quá mức cho phép). 4. Có tài liệu về giá trị sản xuất công nghiệp của một địa phương được trình bày dưới bảng sau: Doanh nghiệp Năm 2010 Năm 2011 GTSXCN (triệu đồng) Tỷ trọng (%) GTSXCN (triệu đồng) Tỷ trọng (%) A 6.450 20 9.225 24 B 15.900 50 21.300 55 C 7.500 24 6.450 17 D 1.800 6 1.950 5 Cộng 31.650 100 38.925 100 Hãy biểu diễn những số liệu trên dưới dạng các đồ thị sau: Biểu đồ hình cột, biểu đồ hình tròn. 5. Có tài liệu phân tổ 500 cửa hàng thương mại của một thành phố theo số nhân viên bán hàng như sau: Phân tổ cửa hàng theo số nhân viên bán hàng Số cửa hàng <10 20 11-20 45 21-30 85 31-40 105 41-50 120 51-60 55 61-70 40 >71 30 Yêu cầu: a. Tính số nhân viên bán hàng bình quân của cửa hàng thương mại trong thành phố. b. Tính tỷ trọng từng loại cửa hàng. c. Trình bày kết quả tính toán trong bảng số liệu thống kê. 36 Chương 4 ĐO LƯỜNG CÁC MỨC ĐỘ CỦA HIỆN TƯỢNG KINH TẾ XÃ HỘI Việc nghiên cứu các mức độ của hiện tượng kinh tế xã hội là yêu cầu quan trọng của quá trình nghiên cứu thống kê, nhằm biểu hiện mặt lượng trong quan hệ mật thiết với mặt chất của hiện tượng nghiên cứu trong điều kiện thời gian và không gian cụ thể. 4.1 Số tuyệt đối 4.1.1 Khái niệm: Số tuyệt đối là chỉ tiêu biểu hiện quy mô, khối lượng của hiện tượng hoặc quá trình kinh tế - xã hội trong điều kiện thời gian và không gian cụ thể. Số tuyệt đối trong thống kê bao gồm các con số phản ánh quy mô của tổng thể hay của từng bộ phận trong tổng thể, chẳng hạn như số doanh nghiệp, số nhân khẩu, số học sinh đi học, số lượng cán bộ khoa học... hoặc tổng các trị số theo một tiêu thức nào đó, ví dụ như tiền lương của công nhân, giá trị sản xuất công nghiệp, tổng sản phẩm trong nước (GDP) .... Số tuyệt đối dùng để đánh giá và phân tích thống kê, là căn cứ không thể thiếu được trong việc xây dựng chiến lược phát triển kinh tế, tính toán các mặt cân đối, nghiên cứu các mối quan hệ kinh tế - xã hội, là cơ sở để tính toán các chỉ tiêu tương đối và bình quân. 4.1.2. Phân loại số tuyệt đối: Có hai loại số tuyệt đối: Số tuyệt đối thời kỳ và số tuyệt đối thời điểm. Số tuyệt đối thời kỳ: Phản ánh quy mô, khối lượng của hiện tượng trong một thời kỳ nhất định. Ví dụ, giá trị sản xuất công nghiệp trong một tháng, quý hoặc năm; Sản lượng lương thực năm 2005, năm 2006, năm 2007 ... Số tuyệt đối thời điểm: Phản ánh quy mô, khối lượng của hiện tượng ở một thời điểm nhất định như: dân số của một địa phương nào đó có đến 0 giờ ngày 01/04/2009; giá trị tài sản cố định có đến 31/12/2007; lao động làm việc của doanh nghiệp vào thời điểm 1/7/2007. 4.2 Số tương đối 4.2.1 Khái niệm Số tương đối là chỉ tiêu biểu hiện quan hệ so sánh giữa hai chỉ tiêu thống kê cùng loại nhưng khác nhau về thời gian hoặc không gian hoặc giữa hai chỉ tiêu khác loại nhưng có quan hệ với nhau. Nếu so sánh giữa hai chỉ tiêu thống kê cùng loại nhưng khác nhau về thời gian ta có số tương đối động thái, số tương đối kế hoạch. Nếu so sánh giữa hai chỉ tiêu thống 37 kê cùng loại nhưng khác nhau về không gian có số tương đối không gian hay số tương đối so sánh, số tương đối kết cấu. Nếu so sánh giữa hai chỉ tiêu thống kê khác loại nhưng có quan hệ với nhau ta có số tương đối cường độ. Trong hai đại lượng đem ra so sánh của số tương đối, một đại lượng được chọn làm gốc. Số tương đối có thể được biểu hiện bằng số lần, số phần trăm (%), hay bằng các đơn vị kép như: người/km2.... 4.2.2 Ý nghĩa của số tương đối Để đánh giá sự biến động của hiện tượng theo thời gian người ta thường phải sử dụng số tương đối. Số tương đối được dùng để phản ánh những đặc điểm về kết cấu, quan hệ tỷ lệ, trình độ phát triển, để lập kế hoạch và kiểm tra mức độ hoàn thành kế hoạch, mức độ phổ biến của hiện tượng trong điều kiện không gian và thời gian cụ thể. Người ta sử dụng số tương đối để công bố thông tin trên các phương tiện thông tin đại chúng nhằm giữ bí mật thông tin khi cần thiết. Ví dụ: Nếu nói bão lụt đã gây thiệt hại cho tỉnh A rất lớn, nó làm cho 30% diện tích lúa vụ mùa 2009 không thu hoạch được. Đọc con số này ta không biết được thiệt hại lớn đến mức độ nào. Nếu tỉnh đó cấy 1000 ha mà mất 30% thì chỉ mất 300 ha; còn nếu tỉnh đó cấy 100.000 ha thì diện tích không thu hoạch đượclà 30.000 ha. Số tương đối còn được dùng để so sánh những hiện tượng không cùng quy mô. Chẳng hạn, dân số của thành phố Hồ Chí Minh và tỉnh Bình Định rất khác nhau. Do đó số trẻ em sinh ra trong năm chắc chắn ở thành phố Hồ Chí Minh sẽ nhiều hơn tỉnh Bình Định từ 5 đến 7 lần. Muốn đánh giá công tác kế hoạch hoá gia đình ở đâu thực hiện tốt hơn ta phải dùng số tương đối như tỷ lệ sinh thô trong năm hoặc tỷ lệ phụ nữ trong độ tuổi sinh sản sinh con thứ 3. Đơn vị nào có các tỷ lệ trên cao chứng tỏ ở đó công tác dân số kế hoạch hoá gia đình thực hiện chưa tốt. 4.2.3 Đặc điểm của số tương đối Số tương đối là sản phẩm của tính toán. Căn cứ vào các số tuyệt đối đã có để tính ra số tương đối. Chẳng hạn, căn cứ vào các số tuyệt đối trong báo cáo của Hội đồng nhân dân xã Phúc Sơn ta tính được các số tương đối như: Sản lượng thóc sản xuất được tính bình quân cho một nhân khẩu là 1.200.000 kg : 4000 người = 300 kg/người. Sản lượng thịt sản xuất được tính bình quân cho một nhân khẩu là 700.000 kg : 4000 người = 175 kg/người. Sản lượng thóc sản xuất của năm 2009 so với 2008 là(1200:1100)  100 = 1,091 lần hay bằng 109,1%. Các con số tính được ở trên được gọi là số tương đối. Từ thực tế tính toán đó có thể rút ra nhận xét tổng quát sau: Thứ nhất, muốn tính được số tương đối phải có gốc để so sánh. Thứ hai, số tương đối phải được vận dụng kết hợp với số tuyệt đối. Số tương đối thường là kết quả của việc so sánh giữa hai số tuyệt đối. Số tương đối tính ra có thể rất khác nhau, tuỳ thuộc vào việc lựa chọn gốc so sánh. Có khi số tương đối có giá trị rất lớn nhưng ý nghĩa của nó không đáng kể vì trị số tuyệt đối tương ứng của nó lại rất nhỏ và ngược lại. Ví dụ, 1% dân số Việt Nam tăng lên trong những năm 1960 38 đồng nghĩa với dân số tăng thêm 300 nghìn người, nhưng 1% dân số tăng lên trong những năm 2000 lại đồng nghĩa với dân số tăng thêm 800 nghìn người. 4.2.4 Phân loại số tương đối Tuỳ theo việc lựa chọn chỉ tiêu so sánh theo thời gian hay theo không gian mà hình thành nên số tương đối. Có 5 loại số tương đối với ký hiệu quy ước: yo - Mức độ của hiện tượng nghiên cứu ở kỳ gốc; y1 - Mức độ của hiện tượng nghiên cứu ở kỳ nghiên cứu; yk - Mức độ kỳ kế hoạch của hiện tượng nghiên cứu. Số tương đối động thái Số tương đối động thái là sự so sánh mức độ của hiện tượng kỳ nghiên cứu (hay kỳ báo cáo) với kỳ gốc so sánh.  1 0 100d y t y Công thức trên nếu nhân với 100 đơn vị tính là %; nếu không nhân với 100 thì đơn vị tính là lần. Kết quả tính cho biết, so kỳ nghiên cứu với kỳ gốc thì hiện tượng nghiên cứu đã lớn lên hay nhỏ đi bao nhiêu lần hoặc bằng bao nhiêu %? Số tương đối kế hoạch Số tương đối kế hoạch được dùng để lập kế hoạch phát triển kinh tế –xã hội của từng đơn vị cơ sở hoặc trên phạm vi rộng như cả tỉnh hoặc cả nước và kiểm tra việc thực hiện kế hoạch đó. Nó được tính bằng hai chỉ tiêu:  Số tương đối nhiệm vụ kế hoạch: 0 100kkh y t y   Số tương đối thực hiện kế hoạch: được dùng để kiểm tra tình hình thực hiện kế hoạch phát triển của hiện tượng nghiên cứu. Nó được tính theo công thức sau: 1 100th k y t y  Số tương đối kết cấu (còn gọi là số tương đối cơ cấu hay tỷ trọng) Số tương đối kết cấu (tkc) là tỷ trọng của từng bộ phận cấu thành trong tổng thể của hiện tượng nghiên cứu. 100ikc i y t y   Trong đó: yi - Mức độ của bộ phận thứ i trong tổng thể nghiên cứu  yi - Mức độ chung của tổng thể nghiên cứu. Số tương đối so sánh Số tương đối so sánh (tss) là loại số tương đối được tính bằng cách so sánh hai mức độ của một chỉ tiêu thống kê nhưng khác nhau về không gian (còn gọi là số tương đối không gian); hoặc so sánh giữa hai bộ phận trong cùng một tổng thể. 39 100iss j k t k  Trong đó: tss - Số tương đối so sánh ki - Mức độ của bộ phận i hay đơn vị i kj- Mức độ của bộ phận j hay đơn vị j Số tương đối cường độ Là loại số tương đối so sánh hai chỉ tiêu thống kê khác loại nhưng có quan hệ với nhau. Ví dụ, mật độ dân số / km2 (người / km2); thu nhập / đầu người (nghìn đồng /người)Đơn vị đo của số tương đối cường độ là đơn vị kép. i cd p h t h  Trong đó: tcd – Sốtương đối cường độ hi – Mức độ của chỉ tiêu i hp – Mức độ của chỉ tiêu p Lưu ý:  Khi sử dụng hai loại số này phải chú ý đến đặc điểm của hiện tượng để rút ra kết luận được chính xác. Ví dụ, trong điều kiện lao động thủ công, quy mô lao động được coi là tiêu chuẩn để đánh giá quy mô doanh nghiệp. Song trong điều kiện kinh tế phát triển thì phải xét đến quy mô vốn. Với lao động thủ công, trình độ tay nghề (bậc thợ) của người lao động được dùng để thể hiện trình độ kỹ thuật của doanh nghiệp nhưng trong điều kiện hiện nay phải là mức trang bị vốn / lao động, trình độ học vấn (bằng cấp)  Phải sử dụng kết hợp số tương đối với số tuyệt đối Ví dụ: Mặc dù tốc độ phát triển GDP của Việt Nam khá cao (số tương đối) nhưng do điểm xuất phát (số tuyệt đối) quá thấp nên mức sống của dân cư còn ở mức thấp so với thế giới. Cuối năm 2007, Nhà nước điều chỉnh mức lương tối thiểu tăng 10,2%. Xét về số tương đối ta có cảm giác mức sống được cải thiện rất nhiều. Song mức lương cơ bản xuất phát quá thấp là 490 nghìn đồng. Nay được nâng lên 540 nghìn đồng. Như vậy mức lương cơ bản tăng 90 nghìn đồng và với số tiền này chỉ mua được khoảng 1 kg thịt bò loại ngon. Bởi thế khi sử dụng số tương đối phải luôn xem xét gắn nó với số tuyệt đối. 40 Bảng tổng kết về số tuyệt đối và số tương đối Số tuyệt đối Số tương đối Khái niệm Số tuyệt đối trong thống kê là loại chỉ tiêu biểu hiện quy mô, khối lượng, kích thước của hiện tượng kinh tế – xã hội trong điều kiện thời gian và địa điểm cụ thể Số tương đối trong thống kê là loại chỉ tiêu biểu hiện quan hệ so sánh giữa hai chỉ tiêu thống kê cùng loại nhưng khác nhau về thời gian, không gian hoặc giữa hai chỉ tiêu thống kê khác loại nhưng có quan hệ với nhau. Ý nghĩa Biểu hiện quy mô, khối lượng của hiện tượng nghiên cứu. Để tính các số tương đối, số bình quân. Để đánh giá sự biến động của hiện tượng. Để giữ bí mật thông tin khi cần thiết. Để lập và kiểm tra việc thực hiện kế hoạch. Để so sánh những hiện tượng không cùng quy mô. Đặc điểm Kết quả của điều tra hoặc tổng hợp thống kê Kết quả của tính toán Đơn vị đo Đơn vị tự nhiên, đơn vị vật lý, đơn vị tiêu chuẩn, đơn vị tiền tệ đơn vị kép. %, lần, đơn vị kép Các loại số Hai loại số tuyệt đối: thời điểm và thời kỳ 5 loại số tương đối: Động thái, kế hoạch, kết cấu, so sánh và cường độ. 4.3 Các đặc trưng đo lường khuynh hướng tập trung 4.3.1 Số bình quân (trung bình) Số bình quân là chỉ tiêu biểu hiện mức độ điển hình của một tổng thể gồm nhiều đơn vị cùng loại được xác định theo một tiêu thức nào đó. Số bình quân được sử dụng phổ biến trong thống kê để nêu lên đặc điểm chung nhất, phổ biến nhất của hiện tượng kinh tế - xã hội trong các điều kiện thời gian và không gian cụ thể. Ví dụ: Tiền lương bình quân một công nhân trong doanh nghiệp là mức lương phổ 41 biến nhất, đại diện cho các mức lương khác nhau của công nhân trong doanh nghiệp; thu nhập bình quân đầu người của một địa bàn là mức thu nhập phổ biến nhất, đại diện cho các mức thu nhập khác nhau của mọi người trong địa bàn đó. Số bình quân còn dùng để so sánh đặc điểm của những hiện tượng không có cùng một quy mô hay làm căn cứ để đánh giá trình độ đồng đều của các đơn vị tổng thể. Xét theo vai trò đóng góp khác nhau của các thành phần tham gia bình quân hoá, số bình quân chung được chia thành số bình quân giản đơn và số bình quân gia quyền. Số bình quân giản đơn được tính trên cơ sở các thành phần tham gia bình quân hoá có vai trò về qui mô (tần số) đóng góp như nhau. Số bình quân gia quyền (trung bình có trọng số) được tính trên cơ sở các thành phần tham gia bình quân hoá có vai trò về qui mô (tần số) đóng góp khác nhau. Để tính được số bình quân chính xác và có ý nghĩa, điều kiện chủ yếu là nó phải được tính cho những đơn vị cùng chung một tính chất (tổng thể đồng chất). Muốn vậy, phải dựa trên cơ sở phân tổ thống kê một cách khoa học và chính xác. Đồng thời phải vận dụng kết hợp giữa số bình quân tổ với số bình quân chung. Có nhiều loại số bình quân khác nhau. Trong thống kê kinh tế - xã hội thường dùng các loại sau: Số bình quân giản đơn, số bình quân điều hoà, số bình quân hình học (bình quân nhân). Số bình quân cộng giản đơn ixx n   Trong đó: xi- Lượng biến của tiêu thức ứng với đơn vị thứ i ( 1,i n ) n- Số đơn vị mẫu Ví dụ: Có tài liệu thống kê về năng suất lao động của 5 công nhân trong một tổ như sau: NSLĐ (tr.đ/người) 12 14 11 15 16 Số lao động (Người) 1 1 1 1 1 NSLĐ bình quân = Tổng giá trị / Tổng số lao động = 68/ 5 = 13,6 tr.đ./người Số bình quân cộng gia quyền i i i x f x f    Trong đó xi - Lượng biến của tiêu thức ở tổ thứ i (i= 1,,n) fi - Quyền số (trọng số) Các ví dụ: a/ Giả sử có số liệu thu nhập lao động của một công ty như sau: Mức lương (tr.đ/người) Từ 1-1,5 1,5-3 3-5 5-7 Số lao động (Người) 10 20 30 10 42 (fi) Khi đó mức thu nhập bình quân của một lao động toàn công ty là    i i i x f x f = 3,25 tr. đ/ người, với ix là giá trị bình quân của tổ thứ i. b/ Có tài liệu thống kê về mức thu nhập của một công ty như sau: Mức thu nhập (tr. đ./người) 5 Số lao động (người) 10 20 30 50 18 12 10 Hãy tính mức thu nhập bình quân một lao động của công trên? Trước hết, cần lưu ý rằng: đối với bài toán phân tổ có các tổ mở, để thuận tiện cho tính toán người ta quy ước xem tổ mở như tổ đóng với khoảng cách tổ mở bằng khoảng cách tổ đóng gần nó nhất. Mức thu nhập (triệu đồng/người) Số lao động (người) Thu nhập bình quân tổ <1 10 0,75 1-1,5 20 1,25 1,5-2 30 1,75 2-2,5 50 2,25 2,5-4 18 3,25 4-5 12 4,5 >5 10 5,5 Tổng số 150 Thay số liệu vào công thức ta có     365 2,433 150 i i i x f x f Số bình quân điều hoà Số bình quân điều hoà là một dạng đặc biệt của số bình quân cộng. Xét về nội dung kinh tế, số bình quân điều hoà cũng giống như bình quân cộng giản đơn. Tuy nhiên trong trường hợp này ta không có thông tin nào về số đơn vị tổng thể fi. So sánh những thông tin đã có và chưa biết để tính số bình quân theo phương pháp tính số bình quân cộng và số bình quân điều hoà. 43 Số trung bình cộng Số trung bình điều hoà Biết xi Biết xi Biết fi Không biết fi Không biết xifi Biết xifi Tính số trung bình Tính số trung bình Công thức tính: i i i i i x f x x f x    Ví dụ: Giả sử có tài liệu thống kê về năng suất và sản lượng lúa vụ đông xuân của mộtt xã như sau: Chỉ tiêu \ Thôn A B C Năng suất lúa (tạ / ha) (xi) 40 50 60 Sản lượng lúa (tấn) ( xifi ) 280 350 360 Khi đó năng suất lúa bình quân/ ha của toàn xã là 280 350 360 4,95 280 350 360 4 5 6 i i i i i x f x x f x          tấn/ha Số bình quân nhân (bình quân hình học) Số bình quân nhân (bình quân hình học) là loại số bình quân được tính trong mối quan hệ tích số (tính tốc độ phát triển bình quân). Số bình quân nhân được sử dụng khá rộng rãi trong việc lập lập kế hoạch và đánh giá tình hình phát triển kinh tế-xã hội cho một khoảng thời gian nào đó (thường tính cho 5 hoặc 10 năm). Chẳng hạn, trong nghị quyết Đại hội đại biểu toàn quốc của Đảng Cộng sản Việt Nam lần thứ X có nêu lên mục tiêu phấn đấu đến năm 2010 GDP của Việt Nam sẽ gấp đôi năm 2000. Vậy nhiệm vụ phấn đấu đạt tốc độ phát triển bình quân năm của thời kỳ 2000-2010 là bao nhiêu? Ta sử dụng số bình quân nhân để trả lời câu hỏi trong tình huống này. 4.3.2 Số trung vị (Me) Số trung vị là lượng biến của tiêu thức nghiên cứu ứng với đơn vị đứng ở vị trí chính giữa của dãy số phân phối đã được sắp xếp theo thứ tự tăng dần. Số trung vị chia dãy số làm hai phần, mỗi phần có số đơn vị tổng thể bằng nhau. Cách xác định số trung vị Trường hợp tài liệu không phân tổ 44  Nếu số đơn vị của dãy số là số chẵn thì giá trị của trung vị là trung bình cộng giản đơn của 2 lượng biến đứng giữa dãy số phân phối.  Nếu số đơn vị lẻ thì giá trị của trung vị là lượng biến đứng ở giữa dãy số. Trường hợp tài liệu có phân tổ  Tài liệu phân tổ có khoảng cách tổ: trước tiên ta xác định tổ chứa trung vị, đó là tổ có tần số tích luỹ lớn hơn hoặc bằng 1 2 if  . Sau đó trị số gần đúng của số trung vị được tính theo công thức: 1 (min) 2 e e e e i m e m m m f S m x h f     Trong đó (min)emx : giới hạn dưới của tổ chứa trung vị em h : khoảng cách của tổ chứa trung vị 1emS  : tổng tần số của các tổ đứng trước tổ chứa trung vị em f : tần số của tổ chứa trung vị if : tổng các tần số Ví dụ: Có tài liệu phân tổ như sau: Doanh thu (triệu đồng) Cửa hàng (fi) Tần số tích luỹ 200 – 400 8 8 400 – 500 12 20 500 – 600 25 45 600 – 800 25 70 800 – 1000 9 79 Tổng 79 Ta có 1 79 1 40 2 2 if     Tổ chứa trung vị sẽ là tổ thứ 3 (500 – 600) vì có tần số tích luỹ là 45 > 40 Dựa vào công thức ta có 1 (min) 79 20 2 2500 100. 578 25 e e e e i m e m m m f S m x h f         (triệu đồng) Lưu ý: Nếu dãy số phân phối chuẩn (phân phối đối xứng) thì số trung vị chính bằng số trung bình cộng. Sử dụng số trung vị thay cho số trung bình cộng khi cần ước lượng nhanh giá trị trung bình của hiện tượng nghiên cứu. 45 4.3.3 Giá trị mốt (Mo) Mốt trong thống kê là lượng biến của tiêu thức nghiên cứu ứng với quyền số (hoặc mật độ phân bố) lớn nhất. Điều đó có nghĩa mốt là sự biểu hiện mức độ phổ biến nhất của hiện tượng nghiên cứu. Cách xác định Mo  Tài liệu phân tổ không có khoảng cách tổ thì giá trị của mốt chính là lượng biến của tiêu thức nghiên cứu có quyền số (hoặc tần số) lớn nhất. Ví dụ: Giả sử có tài liệu thống kê mức lương tháng 7/2007 công nhân của một công ty như sau: Số công nhân (người) 10 20 40 60 50 30 10 Mức lương (1000đ) 1.000 1.200 1.250 1.500 1.700 1.800 2.000 Trong trường hợp này quyền số lớn nhất là 60. Như vậy giá trị của mốt (Mo) là 1.500.000 đồng / người. Mốt nói lên rằng mức lương phổ biến nhất ở công ty này là 1.500.000 đồng /người.  Tài liệu phân tổ có khoảng cách tổ đều: trước hết cần xác định tổ chứa mốt, tức là tổ có tần số lớn nhất, sau đó trị số gần đúng của mốt được xác định theo công thức sau: 0 0 0 0 0 0 0 0 1 0 (min) 1 1( ) ( ) m m m m m m m m f f m x h f f f f          Trong đó 0 (min)m x : giới hạn dưới của tổ chứa mốt 0m h : khoảng cách của tổ chứa mốt 0m f : tần số của tổ chứa mốt 0 1m f  : tần số của tổ đứng trước tổ chứa mốt 0 1m f  : tần số của tổ đứng sau tổ chứa mốt Ví dụ: Có tài liệu tổng hợp về doanh số bán của 50 cửa hàng tại một thành phố trong tháng 9/2013 như sau: Doanh số bán (triệu đồng) Số cửa hàng 200 – 300 8 300 – 400 12 400 – 500 20 500 – 600 7 600 – 700 3 46 Tổng cộng 50 Trong tài liệu này, tổ chứa mốt là tổ thứ 3 (400 – 500) vì đây là tổ có tần số lớn nhất. Và mốt được xác định như sau: 0 20 12 400 100 438,095 (20 12) (20 7) m         Tài liệu phân tổ có khoảng cách tổ không đều: trước hết cần xác định tổ chứa mốt, tức là tổ có mật độ phân phối lớn nhất (mật độ phân phối là tỉ số giữa tần số của tổ với khoảng cách tổ tương ứng), sau đó trị số gần đúng của mốt được xác định theo công thức sau: 0 0 0 0 0 0 0 0 1 0 (min) 1 1( ) ( ) m m m m m m m m d d m x h d d d d          Trong đó 0 (min)m x : giới hạn dưới của tổ chứa mốt 0m h : khoảng cách của tổ chứa mốt 0m d : mật độ của tổ chứa mốt, 0 0 0 m m m f d h  0 1m d  : mật độ của tổ đứng trước tổ chứa mốt 0 1m d  : mật độ của tổ đứng sau tổ chứa mốt Ví dụ: Có tài liệu tổng hợp về doanh thu của 70 cửa hàng tại một thành phố trong tháng 7/2012 như sau: Doanh số thu (triệu đồng) Số cửa hàng Khoảng cách tổ Mật độ phân phối 200 – 400 8 200 0,04 400 – 500 10 100 0,01 500 – 600 23 100 0,23 600 – 800 23 200 0,115 800 – 1000 6 200 0,03 Tổng cộng 70 Trong tài liệu này, tổ chứa mốt là tổ thứ 3 (500 – 600) vì đây là tổ có mật độ phân phối lớn nhất (d = 0,23), và mốt được xác định như sau: 0 0,23 0,01 500 100 565,476 (0,23 0,01) (0,23 0,115) m        Ý nghĩa của đại lượng Mo  Nó có thể bổ sung hoặc thay thế cho số bình quân cộng. Giúp ta ước lượng rất nhanh ra giá trị của số trung bình trong trường hợp phân phối chuẩn (phân phối đối xứng). 47  Trong một số lĩnh vực sản xuất hàng loạt liên quan đến kích cỡ. Nếu biết được mốt của kích cỡ thì sản xuất loại đó nhiều hơn các kích cỡ khác. Chẳng hạn sản xuất giầy, quần áo may sẵnphải dựa trên giá trị mốt của người tiêu dùng.  Mốt có ưu điểm là không chịu ảnh hưởng của các lượng biến đột xuất, nhưng cũng chính điều này làm cho nó kém nhạy bén với sự biến thiên trong tiêu thức thống kê. 4.4 Các đặc trưng đo lường mức độ phân tán Độ phân tán của tiêu thức dùng để đánh giá mức độ đại diện của số bình quân đối với tổng thể được nghiên cứu. Trị số này tính ra càng lớn, tính biến thiên của tiêu thức càng lớn do đó mức độ đại diện của số bình quân đối với tổng thể càng thấp và ngược lại. Quan sát độ biến thiên tiêu thức trong dãy số lượng biến sẽ thấy nhiều đặc trưng về phân phối, kết cấu, tính đồng đều của tổng thể. Độ biến thiên của tiêu thức được sử dụng nhiều trong nghiên cứu thống kê như phân tích biến thiên cũng như mối liên hệ của hiện tượng, dự đoán thống kê, điều tra chọn mẫu ... Khi nghiên cứu độ biến thiên của tiêu thức, thống kê thường dùng các chỉ tiêu như khoảng biến thiên, độ lệch tuyệt đối bình quân, phương sai, độ lệch tiêu chuẩn và hệ số biến thiên. Dưới đây là nội dung và phương pháp tính của các chỉ tiêu đó. 4.4.1 Khoảng biến thiên Khoảng biến thiên (còn gọi là toàn cự) là chỉ tiêu được tính bằng hiệu số giữa lượng biến lớn nhất và lượng biến nhỏ nhất của một dãy số lượng biến. Khoảng biến thiên càng lớn, mức độ biến động của chỉ tiêu càng lớn. Ngược lại, khoảng biến thiên nhỏ, mức độ biến động của chỉ tiêu thấp, tức là mức độ đồng đều của chỉ tiêu cao. max minR x x  Trong đó maxx và minx là giá trị lớn nhất và nhỏ nhất của tổng thể tính toán. Việc tính toán khoảng biến thiên đơn giản tuy nhiên chỉ tiêu này thường cho kết quả không chuẩn xác về sự biến động của tiêu thức. 4.4.2 Độ lệch tuyệt đối bình quân Độ lệch tuyệt đối trung bình là số bình quân số học của các độ lệch tuyệt đối giữa các lượng biến với số bình quân số học của các lượng biến đó. ix xd n    (trường hợp giản đơn) i i i x x f d f     (trường hợp có quyền số) 48 4.4.3 Phương sai ( 2 ) Phương sai là số bình quân cộng của tổng bình phương các sai lệch giữa lượng biến với số bình quân số học của các lượng biến đó. 2 2 ( )ix x n     hoặc 2 2 ( )i i i x x f f      Hoặc có thể tính phương sai theo công thức: 2 2 2( )x x   Nếu có quyền số thì 2x và 2( )x đều phải tính theo công thức gia quyền. 4.4.4 Độ lệch chuẩn ( ) Độ lệch tiêu chuẩn ( ) là căn bậc hai của phương sai 4.4.5 Hệ số biến thiên (V) Hệ số biến thiên (V) là tỷ lệ % giữa độ lệch tuyệt đối bình quân hoặc độ lệch tiêu chuẩn so với số bình quân cộng của tiêu thức nghiên cứu. 100d d V x  hoặc 100V x    Hệ số biến thiên giúp ta so sánh hai tổng thể không cùng đơn vị đo lường. 49 Câu hỏi ôn tập: 1. Kế hoạch tăng trưởng doanh thu của Công ty Hoàng Long năm 2009 là 10%. Thực tế phấn đấu Công ty đã hoàn thành vượt mức kế hoạch 2%, về số tuyệt đối vượt kế hoạch là 50 tr. đ. Hãy xác định: a. Doanh thu 2008, doanh thu kế hoạch 2009 và doanh thu thực hiện 2009. b. Số tương đối động thái, số tương đối nhiệm vụ kế hoạch và số tương đối thực hiện kế hoạch. 2. Tài liệu về giá trị sản xuất công nghiệp (theo giá cố định) của các doanh nghiệp thuộc địa phương X như sau: Doanh nghiệp Giá trị sản xuất (triệu đồng) Thực hiện năm 2010 Năm 2011 Kế hoạch Thực tế A B C D 6.450 15.900 7.500 1.800 6.750 18.000 8.250 1.950 9.225 21.300 6.450 1.950 Yêu cầu xác định: a. Số tương đối nhiệm vụ kế hoạch của mỗi doanh nghiệp và của toàn địa phương X. b. Số tương đối hoàn thành kế hoạch của mỗi doanh nghiệp và của toàn địa phương X. c. Số tương đối động thái của mỗi doanh nghiệp và của toàn địa phương X. d. Tỷ trọng về giá trị sản xuất từng doanh nghiệp so với toàn địa phương X: thực tế năm 2010 và năm 2011. Trình bày

Các file đính kèm theo tài liệu này:

  • pdfbc3a0i_gie1baa3ng_nltk_bc3acnh_0634_1997446.pdf