Đề cương bài giảng Xác suất và thống kê trong kinh tế hoc

Tài liệu Đề cương bài giảng Xác suất và thống kê trong kinh tế hoc: TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT HƯNG YÊN KHOA KINH TẾ ĐỀ CƯƠNG BÀI GIẢNG XÁC SUẤT VÀ THỐNG KÊ TRONG KINH TẾ HOC (Tài liệu lưu hành nội bộ) Hưng Yên [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 1 MỤC LỤC Trang CHƯƠNG 1. GIỚI THIỆU MÔN HỌC.3 1.1. Định nghĩa, chức năng của thống kê trong quản lý nền kinh tế thị trường....3 1.2. Các phương pháp thống kê kinh tế..3 1.3. Những khái niệm thường dùng trong thống kê...4 1.4. Thang đo trong thống kê.6 1.5. Thu thập thông tin trong thống kê...7 CHƯƠNG 2. XÁC SUẤT VÀ PHÂN PHỐI XÁC SUẤT..11 2.1. Biến cố ngẫu nhiên và xác suất.11 2.2. Biến ngẫu nhiên và quy luật phân phối xác suất...16 CHƯƠNG 3. THỐNG KÊ MÔ TẢ..20 3.1.Tổng hợp và trình bày số liệu thống kê..20 3.2. Phân tổ số liệu thống kê....28 3.3. Đồ thị mô tả tập thống kê..32 3.4. Chỉ số đặc trưng của tập thống kê.34 3.5. Phương pháp chỉ số...37 CHƯƠNG 4. THỐNG KÊ SUY LUẬN..55 4.1. Phân phối xác suất đại lượng ngẫu nhiên..55 4.2. Ước lượng...

pdf141 trang | Chia sẻ: putihuynh11 | Lượt xem: 433 | Lượt tải: 0download
Bạn đang xem trước 20 trang mẫu tài liệu Đề cương bài giảng Xác suất và thống kê trong kinh tế hoc, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT HƯNG YÊN KHOA KINH TẾ ĐỀ CƯƠNG BÀI GIẢNG XÁC SUẤT VÀ THỐNG KÊ TRONG KINH TẾ HOC (Tài liệu lưu hành nội bộ) Hưng Yên [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 1 MỤC LỤC Trang CHƯƠNG 1. GIỚI THIỆU MÔN HỌC.3 1.1. Định nghĩa, chức năng của thống kê trong quản lý nền kinh tế thị trường....3 1.2. Các phương pháp thống kê kinh tế..3 1.3. Những khái niệm thường dùng trong thống kê...4 1.4. Thang đo trong thống kê.6 1.5. Thu thập thông tin trong thống kê...7 CHƯƠNG 2. XÁC SUẤT VÀ PHÂN PHỐI XÁC SUẤT..11 2.1. Biến cố ngẫu nhiên và xác suất.11 2.2. Biến ngẫu nhiên và quy luật phân phối xác suất...16 CHƯƠNG 3. THỐNG KÊ MÔ TẢ..20 3.1.Tổng hợp và trình bày số liệu thống kê..20 3.2. Phân tổ số liệu thống kê....28 3.3. Đồ thị mô tả tập thống kê..32 3.4. Chỉ số đặc trưng của tập thống kê.34 3.5. Phương pháp chỉ số...37 CHƯƠNG 4. THỐNG KÊ SUY LUẬN..55 4.1. Phân phối xác suất đại lượng ngẫu nhiên..55 4.2. Ước lượng khoảng tin cậy.56 4.3. Kiểm định giả thiết....64 4.4.Tương quan và hồi quy tuyến tính66 4.5. Dãy số thời gian.74 CHƯƠNG 5. THỐNG KÊ KẾT QUẢ HOẠT ĐỘNG SẢN XUẤT, KINH DOANH CỦA ĐƠN VỊ CƠ SỞ.78 5.1. Một số khái niệm cơ bản về kết quả sản xuất, kinh doanh..78 5.2. Hệ thống chỉ tiêu đo lường kết quả hoạt động sản xuất, kinh doanh của đơn vị cơ sở.80 5.3. Thống kê chất lượng sản phẩm...87 5.4. Dự báo thống kê trong các đơn vị sản xuất, kinh doanh.89 5.5. Phương pháp phân tích thống kê kết quả sản xuất, kinh doanh của đơn vị cơ sở.............90 CHƯƠNG 6. THỐNG KÊ KẾT QUẢ HOẠT ĐỘNG KINH DOANH DỊCH VỤ CỦA ĐƠN VỊ CƠ SỞ.92 6.1. Một số đặc điểm của hoạt động dịch vụ........................................................................92 6.2. Thống kê kết quả hoạt động dịch vụ thương mại của các đơn vị cơ sở sản xuất vật chất..............................................................................................................................................92 6.3. Thống kê kết quả hoạt động dịch vụ vận tải của các đơn vị cơ sở hoạt động vật chất..........95 6.4. Thống kê kết quả sửa chữa và xây lắp các công trình kiến trúc......................................96 CHƯƠNG 7. THỐNG KÊ GIÁ THÀNH SẢN XUẤT VÀ HIỆU QUẢ SẢN XUẤT KINH DOANH CỦA ĐƠN VỊ CƠ SỞ...98 7.1. Khái niệm, ý nghĩa của các loại chỉ tiêu giá thành và tác dụng của nó đối với công tác quản lý đơn vị cơ sở...........................................................................................................98 7.2. Nội dung kinh tế của chỉ tiêu giá thành........................................................................99 7.3. Phương pháp phân tích tài liệu thống kê giá thành...100 7.4. Thống kê hiệu quả sản xuất, kinh doanh của đơn vị.104 [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 2 7.5. Thống kê ảnh hưởng của sản xuất đến môi trường của các đơn vị cơ sở.107 CHƯƠNG 8. THỐNG KÊ LAO ĐỘNG CỦA ĐƠN VỊ CƠ SỞ.109 8.1. Thống kê số lượng và sự biến động lao động của đơn vị cơ sở109 8.2. Thống kê tình hình sử dụng số lượng và thời gian lao động của đơn vị cơ sở.112 8.3. Thống kê năng suất lao động trong đơn vị cơ sở..114 8.4. Thống kê thu nhập của lao động trong đơn vị cơ sở.119 CHƯƠNG 9. THỐNG KÊ TÀI SẢN CỐ ĐỊNH VÀ ĐẦU TƯ DÀI HẠN CỦA ĐƠN VỊ CƠ SỞ...126 9.1. Thống kê tài sản cố định của đơn vị cơ sở126 9.2. Thống kê đầu tư dài hạn của đơn vị cơ sở.130 CHƯƠNG 10. THỐNG KÊ VỐN VÀ HOẠT ĐỘNG TÀI CHÍNH CỦA ĐƠN VỊ CƠ SỞ...133 10.1. Thống kê vốn đầu tư của đơn vị cơ sở..133 10.2. Phân loại vốn đầutư của đơn vị cơ sở....135 [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 3 CHƯƠNG 1. GIỚI THIỆU MÔN HỌC 1.1. Định nghĩa, chức năng của thống kê trong quản lý nền kinh tế thị trường Thống kê là một hệ thống các phương pháp bao gồm thu thập, tổng hợp, trình bày số liệu, tính toán các đặc trưng của đối tượng nghiên cứu nhằm phục vụ cho quá trình phân tích, dự đoán và ra quyết định. Chức năng của thống kê Thống kê thường được phân thành 2 lĩnh vực: - Thống kê mô tả (Descriptive statistics): là các phương pháp có liên quan đến việc thu thập số liệu, tóm tắt, trình bày, tính toán và mô tả các đặc trưng khác nhau để phản ánh một cách tổng quát đối tượng nghiên cứu. - Thống kê suy luận (Inferential statistics): là bao gồm các phương pháp ước lượng các đặc trưng của tổng thể, phân tích mối liên hệ giữa các hiện tượng nghiên cứu, dự đoán hoặc ra quyết định trên cơ sở thông tin thu thập từ kết quả quan sát mẫu. 1.2. Các phương pháp thống kê kinh tế - Thu thập và xử lý số liệu: Số liệu thu thập thường rất nhiều và hỗn độn, các dữ liệu đó chưa đáp ứng cho quá trình nghiên cứu. Để có hình ảnh tổng quát về tổng thể nghiên cứu, số liệu thu thập phải được xử lý tổng hợp, trình bày, tính toán các số đo; kết quả có được sẽ giúp khái quát được đặc trưng của tổng thể. - Nghiên cứu các hiện tượng trong hoàn cảnh không chắc chắn: Trong thực tế, có nhiều hiện tượng mà thông tin liên quan đến đối tượng nghiên cứu không đầy đủ mặc dù người nghiên cứu đã có sự cố gắng. Ví dụ như nghiên cứu về nhu cầu của thị trường về một sản phẩm ở mức độ nào, tình trạng của nền kinh tế ra sao, để nắm được các thông tin này một cách rõ ràng quả là một điều không chắc chắn. - Điều tra chọn mẫu: Trong một số trường hợp để nghiên cứu toàn bộ tất cả các quan sát của tổng thể là một điều không hiệu quả, xét cả về tính kinh tế (chi phí, thời gian) và tính kịp thời, hoặc không thực hiện được. Chính điều này đã đặt ra cho thống kê xây dựng các phương pháp chỉ cần nghiên cứu một bộ phận của tổng thể mà có thể suy luận cho hiện tượng tổng quát mà vẫn đảm bảo độ tin cậy cho phép, đó là phương pháp điều tra chọn mẫu. - Nghiên cứu mối liên hệ giữa các hiện tượng: Giữa các hiện tượng nghiên cứu thường có mối liên hệ với nhau. Ví dụ như mối liên hệ giữa chi tiêu và thu nhập; mối liên hệ giữa lượng vốn vay và các yếu tố tác động đến lượng vốn vay như chi tiêu, thu nhập, [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 4 trình độ học vấn; mối liên hệ giữa tốc độ phát triển với tốc độ phát triển của các ngành, lạm phát, tốc độ phát triển dân số,Sự hiểu biết về mối liên hệ giữa các hiện tượng rất có ý nghĩa, phục vụ cho quá trình dự đoán - Dự đoán: Dự đoán là một công việc cần thiết trong tất cả các lĩnh vực hoạt động. Trong hoạt động dự đoán người ta có thể chia ra thành nhiều loại: (1). Dự đoán dựa vào định lượng và dựa vào định tính. Tuy nhiên, trong thống kê chúng ta chủ yếu xem xét về mặt định lượng với mục đích cung cấp cho những nhà quản lý có cái nhìn mang tính khoa học hơn và cụ thể hơn trước khi ra quyết định phù hợp. (2). Dự đoán dựa vào nội suy và dựa vào ngoại suy. - Dự đoán nội suy là chúng ta dựa vào bản chất của hiện tượng để suy luận, ví dụ như chúng ta xem xét một liên hệ giữa lượng sản phẩm sản xuất ra phụ thuộc các yếu tố đầu vào như vốn, lao động và trình độ khoa học kỹ thuật. - Dự đoán dựa vào ngoại suy là chúng ta chỉ quan sát sự biến động của hiện tượng trong thực tế, tổng hợp lại thành qui luật và sử dụng qui luật này để suy luận, dự đoán sự phát triển của hiện tượng. Ví dụ như để đánh giá kết quả hoạt động của một công ty người ta xem xét kết quả hoạt động kinh doanh của họ qua nhiều năm. Ngoài ra, người ta còn có thể phân chia dự báo thống kê ra thành nhiều loại khác. 1.3. Những khái niệm thường dùng trong thống kê 1.3.1. Tổng thể thống kê Tổng thể thống kê là tập hợp các đơn vị cá biệt về sự vật, hiện tượng trên cơ sở một đặc điểm chung nào đó cần được quan sát, phân tích mặt lượng của chúng. Các đơn vị, phần tử tạo nên hiện tượng được gọi là các đơn vị tổng thể. Như vậy, muốn xác định được tổng thể thống kê ta cần xác định được tất cả các đơn vị của tổng thể đó. Dựa vào việc xác định tổng thể, tổng thể chia làm hai loại: Tổng thể bộc lộ: Các đơn vị của tổng thể được biểu hiện một cách rõ ràng, dễ xác định. Tổng thể tiềm ẩn: Các đơn vị của nó không được nhận diện một cách trực tiếp, ranh giới của nó không rõ ràng. Theo mục đích nghiên cứu: Tổng thể đồng chất: những đơn vị có cùng chung những đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 5 Tổng thể không đồng chất: bao gồm những đơn vị khác nhau về loại hình, khác nhau về những đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu. 1.3.2. Mẫu Mẫu (Samples) là một bộ phận của tổng thể, đảm bảo được tính đại diện và được chọn ra để quan sát và dùng để suy diễn cho toàn bộ tổng thể. Như vậy, tất cả các phần tử của mẫu phải thuộc tổng thể, nhưng ngược lại các phần tử của tổng thể thì chưa chắc thuộc mẫu. Điều này tưởng chừng là đơn giản, tuy nhiên trong một số trường hợp việc xác định mẫu cũng có thể dẫn đến nhầm lẫn, đặc biệt là trong trường hợp tổng thể ta nghiên cứu là tổng thể tiềm ẩn. Ngoài ra, chọn mẫu như thế nào để làm cơ sở suy diễn cho tổng thể, tức là mẫu phải mang tính đại diện cho tổng thể. Điều này thực sự không dễ dàng, ta chỉ cố gắng hạn chế tối đa sự sai biệt này mà thôi chứ không thể khắc phục được hoàn toàn. 1.3.3. Quan sát Quan sát (Observations) Là mỗi đơn vị của mẫu; trong một số tài liệu còn được gọi là quan trắc. 1.3.4. Tiêu thức thống kê Tiêu thức thống kê là một khái niệm chỉ đặc điểm của các đơn vị tổng thể được chọn ra để nghiên cứu. Tiêu thức thống kê được chia thành hai loại: Tiêu thức thuộc tính: là loại tiêu thức không được biểu hiện trực tiếp bằng con số, mà các biểu hiện của nó được dùng để phản ánh loại hoặc tính chất của các đơn vị tổng thể. Tiêu thức số lượng: là loại tiêu thức có biểu hiện trực tiếp bằng con số. Đấy là những con số phản ánh đặc trưng có thể cân, đo, đong, đếm được của từng đơn vị tổng thể. Tiêu thức số lượng được chia làm 2 loại: Loại rời rạc: là loại các giá trị có thể của nó là hữu hạn hay vô hạn và có thể đếm đc. Loại liên tục: là loại mà giá trị của nó có thể nhận bất kỳ một trị số nào đó trong một khoảng nào đó. 1.3.5. Chỉ tiêu thống kê Chỉ tiêu thống kê là những con số chỉ mặt lượng gắn với mặt chất của hiện số lớn trong điều kiện thời gian, không gian cụ thể. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 6 Chỉ tiêu thống kê có khái niệm và mức độ. Khái niệm có tên gọi, điều kiện thời gian và không gian. Mức độ phản ánh quy mô hoặc cường độ của hiện tượng với các loại thang đo khác nhau. 1.3.6. Tham số tổng thể Là giá trị quan sát được của tổng thể và dùng để mô tả đặc trưng của hiện tượng nghiên cứu. Trong xác suất thống kê toán chúng ta đã biết các tham số tổng thể như trung bình tổng thể (µ), tỷ lệ tổng thể (p), phương sai tổng thể (σ2 ). Ngoài ra, trong quá trình nghiên cứu sâu môn thống kê chúng ta còn có thêm nhiều tham số tổng thể nữa như: tương quan tổng thể (ρ), hồi qui tuyến tính tổng thể, 1.3.7. Tham số mẫu Tham số mẫu là giá trị tính toán được của một mẫu và dùng để suy rộng cho tham số tổng thể. Đó là cách giải thích mang tính chất thông thường, còn đối với xác suất thống kê thì tham số mẫu là ước lượng điểm của tham số tổng thể, trong trường hợp chúng ta chưa biết tham số tổng thể chúng ta có thể sử dụng tham số mẫu để ước lượng tham số tổng thể. Chúng ta có thể liệt kê vài tham số mẫu như sau: trung bình mẫu ( ̅), tỷ lệ mẫu ( ̂ ), phương sai mẫu (S2 ), hệ số tương quan mẫu (r), 1.4. Thang đo trong thống kê 1.4.1. Thang đo định danh Thang đo định danh là loại thang đo sử dụng cho các tiêu thức thuộc tính, mà các biểu hiện của dữ liệu không có sự hơn kém, khác biệt về thứ bậc, không theo một trật tự xác định nào. 1.4.2. Thang đo thứ bậc Loại thang đo này cũng sử dụng cho các tiêu thức thuộc tính, mà các biểu hiện của dữ liệu có sự hơn kém, khác biệt về thứ bậc. 1.4.3. Thang đo khoảng Thang đo khoảng là thang đo thứ bậc có các khoảng cách đều nhau nhưng không có điểm gốc là 0. 1.4.4. Thang đo tỷ lệ Thang đo tỷ lệ là thang đo khoảng với giá trị 0 tuyệt đối (một trị số thật) được coi như điểm xuất phát của độ dài đo lường trên thang. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 7 Đây là loại thang đo định lượng chặt chẽ nhất 1.5. Thu thập thông tin trong thống kê 1.5.1. Xác định nội dung thông tin Nói chung, tuỳ thuộc vào mục đích nghiên cứu để xác định những nội dung thông tin cần thu thập. Thông tin sử dụng cho quá trình nghiên cứu phải đảm bảo các yêu cầu cơ bản sau: Thích đáng: Số liệu thu thập phải phù hợp, đáp ứng được mục đích nghiên cứu. Số liệu đáp ứng được mục tiêu nghiên cứu có tính chất trực tiếp hoặc gián tiếp. Đối với những thông tin dễ tiếp cận thường thì ta sử dụng số liệu trực tiếp, ví dụ muốn biết được nhu cầu của khách hàng chúng ta có thể hỏi trực tiếp khách hàng. Tuy nhiên, một số nội dung nghiên cứu mang tính chất nhạy cảm hoặc khó thu thập thì chúng ta có thể thu nhập những số liên gián tiếp có liên quan, ví dụ để thu thập thu nhập của cá nhân chúng ta có thể thu thập những nội dung có liên quan như nghề nghiệp, đơn vị công tác, chức vụ, nhà ở, phương tiện đi lại... Chính xác: Các thông tin trong quá trình nghiên cứu phải có giá trị, đáng tin cậy để các phân tích kết luận phản ánh được đặc điểm bản chất của hiện tượng. Kịp thời: Yêu cầu thông tin không những đáp ứng yêu cầu phù hợp, chính xác mà giá trị thông tin còn thể hiện ở chỗ nó có phục vụ kịp thời cho công tác quản lý và tiến trình ra các quyết định hay không. Khách quan: Tức là số liệu thu thập được không bị ảnh hưởng vào tính chủ quan của người thu thập cũng như người cung cấp số liệu và ngay cả trong thiết kế bảng câu hỏi. Yếu tố khách quan tưởng chừng thực hiện rất dễ dàng nhưng thực tế thì chúng ta khó có thể khắc phục vấn đề này một cách trọn vẹn, chúng ta chỉ có thể hạn chế yếu tố chủ quan một cách tối đa. Ví dụ chỉ cần một hành động đơn giản là tiếp cận với đáp viên là ít nhiều cũng ảnh hưởng đến kết quả trả lời của họ. 1.5.2. Nguồn số liệu 1.5.2.1. Dữ liệu thứ cấp (Secondary data) Dữ liệu thứ cấp là các thông tin đã có sẵn và đã qua tổng hợp, xử lý. Loại dữ kiện này có thể thu thập từ các nguồn sau: Số liệu nội bộ: là loại số liệu đã được ghi chép cập nhật trong đơn vị hoặc được thu thập từ các cuộc điều tra trước đây. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 8 (1) Số liệu từ các ấn phẩm của nhà nước: Các dữ liệu do các cơ quan thống kê nhà nước phát hành định kỳ như niên giám thống kê, các thông tin cập nhật hàng năm về tình hình dân số lao động, kết quả sản xuất của các ngành trong nền kinh tế, số liệu về văn hoá xã hội. (2) Báo, tạp chí chuyên ngành: Các báo và tạp chí đề cập đến vấn đề có tính chất chuyên ngành như tạp chí thống kê, giá cả thị trường,... (3) Thông tin của các tổ chức, hiệp hội nghề nghiệp: Viên nghiên cứu kinh tế, phòng thương mại (4) Các công ty chuyên tổ chức thu thập thông tin, nghiên cứu và cung cấp thông tin theo yêu cầu. Số liệu thứ cấp có ưu điểm là có thể chia sẻ chi phí, do đó nó có tính kinh tế hơn, số liệu được cung cấp kịp thời hơn. Tuy nhiên, dữ liệu thứ cấp thường là các thông tin cơ bản, số liệu đã được tổng hợp đã qua xử lý cho nên không đầy đủ hoặc không phù hợp cho quá trình nghiên cứu. Số liệu thứ cấp thường ít được sử dụng để dự báo trong thống kê, số liệu này thường được sử dụng trong trình bày tổng quan nội dung nghiên cứu, là cơ sở để phát hiện ra vấn đề nghiên cứu. Ngoài ra, số liệu thứ cấp còn được sử dụng để đối chiếu lại kết quả nghiên cứu để nhằm kiểm tra lại tính đúng đắn hoặc phát hiện ra những vấn đề mới để có hướng nghiên cứu tiếp. 1.5.2.2. Dữ liệu sơ cấp (Primary data) a) Điều tra toàn bộ: Là tiến hành thu thập thông tin trên tất cả các đơn vị thuộc tổng thể nghiên cứu. Ưu điểm của điều tra toàn bộ là thu thập được thông tin về tất cả các đơn vị tổng thể. Tuy nhiên, loại điều tra này thường gặp phải một số trở ngại sau: Số lượng đơn vị thuộc tổng thể chung thường rất lớn cho nên tiến hành điều tra toàn bộ mất nhiều thời gian và tốn kém. Trong một số trường hợp do thời gian kéo dài dẫn đến số liệu kém chính xác do hiện tượng tự biến động qua thời gian. Trong một số trường hợp điều tra toàn bộ sẽ không thực hiện được, ví dụ như kiểm tra chất lượng sản phẩm phải phá huỷ các đơn vị thuộc đối tượng nghiên cứu. b) Điều tra chọn mẫu: Để nghiên cứu tổng thể, ta chỉ cần lấy ra một số phần tử đại diện để nghiên cứu và từ đó suy ra kết quả cho tổng thể bằng các phương pháp [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 9 thống kê. Điều tra chọn mẫu thường được sử dụng vì các lý do sau: - Tiết kiệm chi phí - Cung cấp thông tin kịp thời cho quá trình nghiên cứu - Đáng tin cậy. Đây là yếu tố rất quan trọng, nó làm cho điều tra chọn mẫu trở nên có hiệu quả và được chấp nhận. Tuy nhiên, để có sự đáng tin cậy này chúng ta phải có phương pháp khoa học để đảm bảo tính chính xác để chỉ cần chọn ra một số quan sát mà có thể suy luận cho cả tổng thể rộng lớn – đó là nhờ vào các lý thuyết thống kê. Việc sử dụng điều tra toàn bộ hay điều tra chọn mẫu phụ thuộc vào nhiều yếu tố có liên quan: kích thước tổng thể, thời gian nghiên cứu cứu, khả năng về tài chính và nguồn lực, đặc điểm của nội dung nghiên cứu. 1.5.3. Các phương pháp thu thập thông tin a) Quan sát: Là phương pháp thu thập dữ liệu bằng cách quan sát hành động, hành vi thái độ của đối tượng được điều tra. Ví dụ, nghiên cứu trẻ con yêu thích màu sắc nào, quan sát thái độ khách hàng khi dùng thử loại sản phẩm. Phương pháp này tỏ ra hiệu quả đối với các trường hợp đối tượng khó tiếp cận và tăng tính khách quan của đối tượng. Tuy nhiên, phương pháp này tỏ ra khá tốn kém nhưng lượng thông tin thu thập được ít. b) Phương pháp gửi thư: Theo phương pháp này nhân viên điều tra gởi bảng câu hỏi đến đối tượng cung cấp thông tin qua đường bưu điện. Phương pháp gởi thư có thể thu thập thông tin với khối lượng lớn, tiết kiệm chi phí so với các phương pháp khác. Tuy nhiên tỷ lệ trả lời bằng phương pháp này tương đối thấp, đây là một nhược điểm rất lớn của phương pháp này. c) Phỏng vấn bằng điện thoại: Phương pháp thu thập thông tin bằng cách phỏng vấn qua điện thoại. Phương pháp này thu thập được thông tin một cách nhanh chóng, tuy nhiên phương pháp này có nhược điểm: tốn kém, nội dung thu thập thông tin bị hạn chế. d) Phỏng vấn trực tiếp: Phương pháp phỏng vấn trực tiếp thích hợp cho những cuộc điều tra cần thu thập nhiều thông tin, nội dung của thông tin tương đối phức tạp cần thu thập một cách [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 10 chi tiết. Phương pháp phỏng vấn trực tiếp cho 2 hình thức: (1) Phỏng vấn cá nhân. Nhân viên điều tra tiếp xúc với đối tượng cung cấp thông tin thường tại nhà riêng hoặc nơi làm việc. Thông thường phỏng vấn trực tiếp được áp dụng khi chúng ta cho tiến hành điều tra chính thức. (2) Phỏng vấn nhóm. Nhân viên điều tra phỏng vấn từng nhóm để thảo luận về một vấn đề nào đó. Trường hợp này người ta thường sử dụng khi điều tra thử để kiểm tra lại nội dung của bảng câu hỏi được hoàn chỉnh chưa hoặc nhằm tìm hiểu một vấn đề phức tạp mà bản thân người nghiên cứu chưa nắm được một cách đầy đủ mà cần phải có ý kiến cụ thể từ những người am hiểu. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 11 CHƯƠNG 2. XÁC SUẤT VÀ PHÂN PHỐI XÁC SUẤT 2.1. Biến cố ngẫu nhiên và xác xuất 2.1.1. Phép thử và các loại biến cố Trong tự nhiên và xã hội, mỗi hiện tượng đều gắn liền với một nhóm các điều kiện cơ bản và các hiện tượng đó chỉ có thể xảy ra khi nhóm các điều kiện cơ bản gắn liền với nó được thực hiện. Do đó, khi muốn nghiên cứu một hiện tượng, ta cần thực hiện nhóm các điều kiện cơ bản ấy. Chẳng hạn, nếu muốn quan sát việc xuất hiện mặt sấp hay mặt ngửa của một đồng xu, ta phải tung đồng xu xuống đất; còn để xem xét việc viên đạn trúng bia hay trượt, ta phải bắn các viên đạn; khi muốn nghiên cứu chất lượng của một lô sản phẩm, ta lấy ngẫu nhiên một hoặc một số sản phẩm của lô sản phẩm đó, Việc thực hiện một nhóm các điều kiện cơ bản để quan sát một hiện tượng nào đó có xảy ra hay không được gọi là thực hiện một phép thử, còn hiện tượng có thể xảy ra trong kết quả của phép thử đó được gọi là biến cố. Thí dụ 1, tung một con xúc xắc xuống đất là một phép thử, còn việc lật lên một mặt nào đó là biến cố. Thí dụ 2, bắn một phát sung vào bia. Việc bắn sung là phép thử, còn việc trúng vào một miền nào đó của bia là biến cố. Như vậy, ta thấy rằng một biến cố chỉ có thể xảy ra khi một phép thử gắn liền với nó được thực hiện. Trong thực tế có thể xảy ra các biến cố sau: + Biến cố chắc chắn: là biến cố nhất định sẽ xảy ra khi thực hiện một phép thử. Biến cố chắc chắn ký hiệu là U. Thí dụ, thực hiện phép thử tung một con xúc xắc. Gọi U là biến cố “Xuất hiện mặt có số chấm nhỏ hơn hoặc bằng 6” U là biến cố chắc chắn. + Biến cố không thể: là biến cố nhất định không xảy ra khi thực hiện phep thử. Biến cố không thể xảy ra có thể được ký hiệu là V. Thí dụ, tung một con xúc xắc, gọi V là biến cố “xuất hiện mặt có 7 chẩm”. V là biến cố không thể có. 2.1.2. Xác suất của biến cố Như trên đã thấy, việc biến cố ngẫu nhiên xảy ra hay không xảy ra trong kết quả của phép thử là điều không thể đoán trước được. Tuy nhiên, bằng trực quan ta có thể nhận thấy các biến cố ngẫu nhiên khác nhau có những khả năng xảy ra khác nhau. Chẳng hạn biến cố “xuất hiện mặt sấp” khi tung một đồng xu sẽ có khả năng xảy ra lớn hơn nhiều so với biến [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 12 cố “ xuất hiện mặt một chăm” khi tung một con xúc xắc. Hơn nữa, khi lặp đi lặp lại nhiều lần cùng một phép thử trong những điều kiện như nhau, người ta thấy tính chất ngẫu nhiên của biến cố mất dần đi và khả năng xả ra của biến cố sẽ được thể hiện theo những quy luật nhất định. Từ đó ta thấy có khả năng định lượng (đo lường), khả năng khách quan xuất hiện một biến cố nào đó. Xác suất của một biến cố là một con số đặc trưng khả năng khách quan xuất hiện biến cố đó khi thực hiện phép thử. Ta chú ý rằng đây là khả năng khách quan, do những điều kiện xảy ra của phép thử quy định chứ không tùy thuộc vào ý muốn chủ quan của con người. Như vậy, bản chất của xác suất của một biến cố là một con số xác định. Để tính xác suất của một biến cố, người ta xây dựng một số định nghĩa và định lý sau 2.1.3. Một số định nghĩa về xác suất 2.1.3.1. Định nghĩa cổ điển về xác suất Xác suất xuất hiện biến cố A trong phép thử là tỉ số giữa số kết cục thuận lợi cho A và tổng số các kết cục duy nhất đồng khả năng có thể xảy ra khi thực hiện phép thử đó. Nếu ký hiệu P(A) là xác suất của biến cố A, m là số kết cục thuận lợi cho biến cố A, n là số kết cục duy nhất đồng khả năng của phép thử, ta có công thức sau: () = - Các tính chất của xác suất: + Xác suất của biên có ngẫu nhiên là một số dương nằm trong khoảng giữa 0 và 1. + Xác suất của biến cố chắc chắn bằng 1. + Xác suất của biến cố không thể có bằng 0. - Các phương pháp tính xác suất bằng định nghĩa cổ điển: + Phương pháp suy luận trực tiếp: nếu sô các kết cục trong phép thử là khá nhỏ, và việc suy đoán là khá đơn giản thì có thể sử dụng phương pháp suy luận trực tiếp. + Phương pháp dung sơ đồ Venn: khi số kết cục là khá lớn và việc suy đoán phức tạp hơn thì có thể dung sơ đồ Venn, tức là mô tả các kết cục của phép thử dưới dạng sơ đồ để dễ nhận biết. + Phương pháp dung các công thức của giải tích tổ hợp: nếu số kết cục của phép thử là rất lớn mà không thể suy đoán trực tiếp được thì có thể dung các công thức của giải tích tổ hợp, chủ yếu là các công thức chỉnh hợp, chỉnh hợp lặp, hoán vị, và tổ hợp để tính toán. 2.1.3.2. Định nghĩa thống kê về xác suất [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 13 Tần suất xuất hiện biến cố trong n phép thử là tỷ số giữa số phép thử trong đó biến cố xuất hiện và tổng số phép thử được thực hiện. Như vậy, nếu ký hiệu số phép thử là n, số lần xuất hiện biến cố A là k, tần suất xuất hiện biến cố A là f(A) thì: f(A) = Một số định nghĩa về xác suất: - Định nghĩa hình học về xác suất: Định nghĩa hình học về xác suất có thẻ sử dụng khi xác suất để một điểm ngẫu nhiên rơi vào một phần nào đó của một miền cho trước tỷ lệ với độ đo của miền đó (độ dài, diện tích, thể tích,) và không phụ thuộc vào vị trí, dạng thức của miền đó. - Xác suất chủ quan: Được định nghĩa như sự đánh giá chủ quan của một cá nhân nào đó về khả năng xảy ra của biến cố. Sự đánh giá này chủ yếu dựa vòa những nhận xét cá nhân, thông tin ngoại lai, trực giác hay các kinh nghiệm tích lũy được của mỗi cá nhân liên quan đến hiện tượng được xem xét. - Định nghĩa tiên đề về xác suất: Vào những năm 30 của thế kỷ 20, nhà toán học người Nga là Kolmogorov đã xây dựng hệ tiên đề làm cơ sở cho việc định nghĩa một cạch hoàn chỉnh khái niệm xác suất về mặt lý thuyết. 2.1.4. Định lý cộng và nhân xác suất 2.1.4.1. Định lý cộng xác suất Định nghĩa cộng xác suất: Định nghĩa 1. Biến cố C được gọi là tổng của hai biến cố A và B, ký hiệu C = A + B nếu C chỉ xảy ra khi có ít nhất một trong hai biến cố A và B xảy ra. Thí dụ, hai người cùng bắn vào một bia. Gọi A là biến cố “Người thứ nhất bắn trúng”, B là biến cố “Người thứ 2 bắn trúng”, C là biến cố “Bia bị trúng đạn”. Rõ ràng là biến cố C sẽ xảy ra khi có ít nhất một trong hai biến cố A và B xảy ra. Vậy C = A + B. Định nghĩa 2. Biến cố A được gọi là tổng của n biến cố A1, A2, A3,.nếu A xảy ra khi có ít nhất một trong n biến cố ấy xảy ra. Định nghĩa 3. Hai biến cố A và B gọi là xung khắc với nhau nếu chúng không thể đồng thời xảy ra trong một phép thử. Trường hợp ngược lại, nếu hai biến cố có thể cùng xảy ra trong một phép thử thì được gọi là không xung khắc. Khi áp dụng khái niệm xung khắc cho nhóm gồm n biến cố, ta có khái niệm xung khắc từng đôi. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 14 Định nghĩa 4. Nhóm n biến cố A1, A2, A3, được gọi là xung khắc từng đôi nếu bất kỳ hai biến cố nào trong nhóm này cũng xung khắc với nhau. Định lý cộng xác suất: Xác suất của tổng hai biến cố xung khắc bằng tổng xác suất của các biến cố đó. Như vậy, nếu A và B là hai biến cố xung khắc với nhau thì: P(A+B) = P(A) + P(B) 2.1.4.2. Định lý nhân xác suất Bây giờ ta chuyển qua nghiên cứu trường hợp khi một biến cố có thể xem như tích của các biến cố khác. Định nghĩa 1. Biến cố C được gọi là tích của hai biến cố A và B nếu C xảy ra khi và chỉ khi cả hai biến cố A và B đồng thời xyar ra. Ký hiệu C = A*B. Định nghĩa 2. Biến cố A được gọi là tích của n biến cố A1, A2, An nếu A xảy ra khi và chỉ khi cả n biến cố nói trên đồng thời xảy ra. Định nghĩa 3. Hai biến cố A và B gọi là độc lập với nhau nếu việc xảy ra hay không xảy ra của biến cố này không làm thay đổi xác suất xảy ra của biến cố kia và ngược lại. Trong trường hợp nếu việc xảy ra hay không xảy ra của biến cố làm cho xác suất xảy ra của biến có kia thay đổi thì hai biến cố đó gọi là phụ thuộc nhau. Định nghĩa 4. Các biến cố A1, A2, , An được gọi là độc lập từng đôi với nhau nếu mỗi cặp hai trong n biến cố độc lập với nhau. Định nghĩa 5: Các biến cố A1, A2, , An gọi là độc lập toàn phần với nhau nếu mỗi biến độc lập với một tổ hợp bất kỳ của các biến còn lại. Định nghĩa 6. Xác suất của biến cố A được tính với điều kiện biến cố B đã xảy ra gọi là xác suất có điều kiện của A và ký hiệu là P(A/B). Định lý: Định lý 1. Xác suất của tích hai biến cố độc lập bằng tích các xác suất thành phần. P(A.B) = P(A).P(B) Định lý 2. Xác suất của tích hai biến cố phụ thuộc A và B bằng tích xác suất của một trong hai biến cố đó với xác suất có điều kiện của hai biến cố còn lại. P(A.B) = P(A).P(B/A) = P(B).P(A/B) 2.1.4.3. Các hệ quả của định lý cộng và định lý nhân xác suất Định lý 1: Xác suất của tổng hai biến cố không xung khắc bằng tổng xác suất các biến cố đó trừ đi xác suất của tích các biến cố đó. P(A+B) = P(A) + P(B) – P(A.B) [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 15 Định lý 2: Xác suất của tổng n biến cố không xung khắc và độc lập toàn phần với nhau bằng một trừ đi tích xác suất của các biến cố đối lập với các biến cố đó. Công thức Bernoulli Định nghĩa: Ta tiến hành n phép thử độc lập. Giả sử trong mỗi phép thử chỉ xảy ra hai trường hợp: Hoặc biến cố A xảy ra với xác suất p hoặc biến cố A không xảy ra với xác suất q = 1 – p. Các bài toán thỏa mãn các điều kiện trên thì được gọi là tuân theo lược đồ Bernoulli. Khi đó xác suất để trong n phép thử độc lập biến cố A xuất hiện k lần được ký hiệu: Pn(k) Ví dụ 1: Hộp có 10 viên bi, trong đó có 6 viên bi màu đỏ. Lần lượt rút có hoàn lại 5 viên bi. Gọi A là biến cố rút được viên bi màu đỏ trong mỗi lần rút, ta được một lược đồ Bernoulli với: * Số phép thử độc lập là n = 5. * P(A) = 6/15. Ví dụ 2: Trong một phân xưởng có 5 máy hoạt động độc lập, xác suất để một máy bị hư trong một ca sản xuất là bằng nhau và bằng p = 0,1. Tính xác suất để trong 1 ca có hai máy bị hư. Ta thấy 5 máy hoạt động độc lập cho nên ta có thể coi như tiến hành 5 phép thử độc lập và mỗi phép thử chỉ có hai kết cục máy hoạt động tốt hoặc máy bị hư với xác suất p = 0,1. Khi đó bài toán tuân theo lược đồ Bernoulli. 2.1.4.4. Công thức xác suất toàn phần và công thức Bayes Giả sử A là biến cố bất kỳ và lập thành hệ đầy đủ các biến cố và . Khi đó: a) (1.2) Công thức (1.2) là công thức xác suất toàn phần b) Nếu thì: (1.3) Công thức này được gọi là công thức Bayes. Chứng minh a) Ta có: [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 16 Vì các B1, B2, , Bn xung khắc từng đối nên AB1, AB2,, ABn cũng xung khắc từng đôi nên: P(A) = P(AB1) + P( AB2) + + P( ABn) Mà P(AB1) = P(B1) P(A/B1) P(ABn) = P(Bn) P(A/Bn) Nên P(A) = P(B1) P(A/B1) + P(B2) P(A/B2) + + P(Bn) P(A/Bn) c) Theo công thức xác suất tính ta có: P(BkA) = P(Bk) P(A/Bk) = P(A) P(Bk/A) 2.2. Biến ngẫu nhiên và quy luật phân phối xác suất 2.2.1. Định nghĩa và phân loại biến ngẫu nhiên Định nghĩa Một biến số gọi là biến ngẫu nhiên nếu trong kết quả của phép thử nó sẽ nhận một và chỉ một trong các giá trị có thể có của nó tùy thuộc vào sự tác động của các nhân tố ngẫu nhiên. Các biến ngẫu nhiên được ký hiệu là X, Y, Z hoặc X1, X2, ; Y1, Y2,còn các giá trị có thể có của nó được ký hiệu là x1, x2, x3,y1, y2, y3, Ta chú ý rằng sở dĩ biến X nào đó gọi là ngẫu nhiên vì trước khi tiến hành phép thử ta chưa có thể nói một cách chắc chắn nó sẽ nhận giá trị bằng bao nhiêu, mà chỉ có thể dự đoán điều đó với một xác suất nhất định. Nói cách khác, việc X nhận một giá trị nào đó (X = x1) hoặc (X=x2) về thực chất là các biến cố ngẫu nhiên. Hơn nữa, vì trong kết quả của phép thử biến X nhất định sẽ nhận một và chỉ một trong các giá trị có thể có của nó, do đó các biến cố (X=x1), (X=x2),.(X=xn) tạo nên một nhóm đầy đủ các biến cố. Thí dụ, gọi X là “số con trai trong 100 trẻ sắp được sinh ra tại một nhà hộ sinh”. X cũng là một biến ngẫu nhiên. Phân loại biến ngẫu nhiên Biến ngẫu nhiên có thể là rời rạc hoặc lien tục. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 17 Biến ngẫu nhiên gọi là rời rạc nếu các giá trị có thể có của nó lập nên một tập hợp hữu hạn hoặc đếm được. Nói cách khác, biến ngẫu nhiên sẽ là rời rạc nếu ta có thể liệt kê được tất cả các giá trị có thể có của nó. Thí dụ, trong phép thử về tung con xúc xắc, nếu ta gọi X là “số điểm thu được” thì X là biến ngẫu nhiên rời rạc vì các giá trị có thể có của nó là một tập hợp hữu hạn. Biến ngẫu nhiên gọi là lien tục nếu các giá trị có thể có của nó lấp đầy một khoảng trên trục số. Đối với biến ngẫu nhiên liên tục ta không thể liệt kê được tất cả các giá trị có thể có của nó. Thí dụ, bắn một phát súng vào bia. Nếu gọi X là “khoảng cách từ điểm chạm của viên đạn đến tâm bia” thì X là biến ngẫu nhiên liên tục vì ta không thể kể ra được tất cả các giá trị có thể có của nó. Ta chỉ có thể nói rằng các giá trị có thể có của nó của X nằm trong khoảng (a, b) nào đó. Có thể nói rằng gần như tất cả các đại lượng mà ta gặp trong thực tế đều là các biến ngẫu nhiên và chúng sẽ thuộc về một trong hai loại biến ngẫu nhiên đã kể trên. 2.2.2. Quy luật phân phối xác suất của biến ngẫu nhiên Ta có thể nghĩ rằng chỉ cần xác định các giá trị có thể có của một biến ngẫu nhiên là đủ để xác định biến ngẫu nhiên ấy. Tuy nhiên điều này chưa đủ. Trong thực tế có những đại lượng rất khác nhau mà các giá trị có thể có của chúng lại giống nhau. Hơn nữa việc các biến ngẫu nhiên nhận một giá trị nào đó trong kết quả của phép thử chỉ là một biến cố ngẫu nhiên, do đó nếu chỉ mới biết được các giá trị có thể có của nó thì ta mới nắm được rất ít thông tin về biến ngẫu nhiên ấy. Định nghĩa Quy luật phân phối xác suất của biến ngẫu nhiên là sự tương ứng giữa các giá trị có thể có của nó và các xác suất tương ứng với các giá trị đó. Trong thực tế người ta thường sử dụng ba phương pháp để mô tả quy luật phân phối xác suất của biến ngẫu nhiên là: bảng phân phối xác suất, hàm phân bố xác suất và hàm mật độ xác suất. Ta sẽ lần lượt nghiên cứu các phương pháp đó. Bảng phân phối xác suất Bảng phân phối xác suất chỉ dùng để mô tả quy luật phân phối xác suất của biến ngẫu nhiên rời rạc. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 18 Giả sử biến ngẫu nhiên rời rạc X có thể nhận một trong các giá trị có thể có x1, x2, x3,, xn với các xác suất tương ứng là p1, p2, p3,pn. Bảng phân phối xác suất của biến ngẫu nhiên rời rạc X có dạng: X x1 x2 Xi xn P p1 p2 Pi pn Ta chú ý rằng để tạo nên một quy luật phân phối xác suất thì các xác suất pi phải thỏa mãn điều kiện. 0≤ pi ≤1 ∑pi = 1 Điều kiện thứ nhất là hiển nhiên theo tính chất của xác suất, còn điều kiện thứ hai suy ra từ định nghĩa của biến ngẫu nhiên. Hàm phân bố xác suất Khái niệm hàm phân bố xác suất áp dụng được đối với cả biến ngẫu nhiên rời rạc và liên tục. Giả sử X là biến ngẫu nhiên bất kỳ, x là một số thực nào đó. Xét biến cố “ biến ngẫu nhiên X nhận giá trị nhỏ hơn x”, ký hiệu (X<x). Hiển nhiên là x thay đổi thì xác suất P(X<x) cũng thay đổi theo. Như vậy, xác suất này là một hàm số của x. Định nghĩa. Hàm phân phối xác suất của biến ngẫu nhiên X, ký hiệu F(x), là xác suất để biến ngẫu nhiên X nhận giá trị nhỏ hơn x, với x là một số thực bất kỳ. F(x) = P(X<x) Ta chú ý rằng đây chỉ là định nghĩa tổng quát của hàm phân bố xác suất. Đối với từng loại biến ngẫu nhiên hàm phân bố xác suất được tính theo những công thức riêng. Các tính chất của hàm phân bố xác suất Tính chất 1. Hàm phân bố xác suất luôn nhận giá trị trong đoạn [0,1]. Tính chất này trực tiếp sinh ra từ định nghĩa của hàm phân bố xác suất, vì nó là một xác suất nên giá trị của nó nằ trong đoạn [0, 1]. Tính chất 2. Hàm phân bố xác suất là hàm không giảm, tức là với x2>x1 thì: F(x2)>F(x1) Từ tính chất thứ 2 có thể suy ra một hệ quả sau đây: Hệ quả 1: Xác suất để biến ngẫu nhiên X nhận giá trị trong khoảng [a, b) bằng hiệu số của hàm phân bố xác suất tại hai đầu khoảng đó. Hệ quả 2: Xác suất để biến ngẫu nhiên liên tục X nhận một giá trị xác định bằng 0. P(X= x) = 0 Hệ quả 3: Đối với biến ngẫu nhiên liên tục X ta có các đẳng thức sau: [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 19 Từ đó: P(a≤x≤b) = P(a ≤x<b) = P (a <x<b) Tính chất 3. Ta có biểu thức giới hạn sau: F(-∞) = 0; F (+∞) = 1 Ý nghĩa của hàm phân bố xác suất Từ định nghĩa của hàm phân bố xác suất F(x) = P(X< x) ta thấy hàm phân bố xác suất phản ánh mức độ tập trung xác suất ở về phía bên trái một số thực x nào đó. Như đã biết toàn bộ xác suất của biến ngẫu nhiên bằng 1, do đó giá trị của hàm phân bố xác suất tại mỗi điểm x cho biết có bao nhiêu phần của một đơn vị xác suất phân bố trong đoạn (-∞,x). Hàm mật độ xác suất Đối với biến ngẫu nhiên liên tục X có thể dùng làm phân bố xác suất để mô tả quy luật phân phối xác suất của nó. Tuy nhiên phương pháp này cũng hạn chế. Hàm phân bố xác suất không thể đặc trưng được xác suất để biến ngẫu nhiên liên tục X nhận một giá trị nhất định. Vì thế, đối với các biến ngẫu nhiên liên tục, người ta thường dung hàm mật độ xác suất để mô tả quy luật phân phối xác suất của nó. Định nghĩa: Hàm mật độ xác suất của biến ngẫu nhiên liên tục X (ký hiệu là f(X)) là đạo hàm bậc nhất của hàm phân bố xác suất của biến ngẫu nhiên đó. f(x) = F’(x) chú ý rằng hàm mật độ xác suất chỉ áp dụng cho các biến ngẫu nhiên liên tục không áp dụng cho các biến ngẫu nhiên rời rạc vì muốn F’(x) tồn tại thì tối thiểu F(x) phải liên tục, do đó X phải là biến ngẫu nhiên liên tục. Các tính chất của hàm mật độ xác suất Tính chất 1: Hàm mật độ xác suất luôn không âm. Tính chất 2: Xác suất để biến ngẫu nhiên liên tục X nhận giá trị trong khoảng (a, b) bằng tích phân xác định của hàm mật độ xác suất trong khoảng đó. Tính chất 3: Hàm phân bố xác suất F(x) của biến ngẫu nhiên liên tục X bằng tích phân suy rộng của hamg mật độ xác suất trong khoảng (-∞, ∞). Tính chất 4: Tích phân suy rộng trong khoảng (-∞, +∞) của hàm mật độ xác suất bằng 1. Ý nghĩa của hàm mật độ xác suất Hàm mật độ xác suất của biến ngẫu nhiên X tại mỗi điểm x cho biết mức độ tập trung xác suất tại điểm đó. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 20 CHƯƠNG 3. THỐNG KÊ MÔ TẢ 3.1. Bảng thống kê và đồ thị thống kê 3.1.1. Bảng thống kê 3.1.1.1. Khái niệm Bảng thống kê là một hình thức trình bày các tài liệu thống kê một cách có hệ thống, hợp lý và rõ ràng, nhằm nêu lên các đặc trưng về mặt lượng của hiện tượng nghiên cứu. Đặc điểm chung của tất cả các bảng thống kê là bao giờ cũng có những con số của từng bộ phận và có mối liên hệ mật thiết với nhau. 3.1.1.2. Cấu thành bảng thống kê a. Về hình thức: bảng thống kê gồm các hàng, cột, các tiêu đề, tiêu mục và . Các hàng cột thể hiện quy mô của bảng, số hàng và số cột càng nhiều thì bảng thống kê càng lớn và càng phức tạp. Tiêu đề của bảng thống kê phản ánh nội dung, ý nghĩa của bảng và của từng chi tiết trong bảng. Trước hết ta có tiêu đề chung, sau đó là các tiêu đề nhỏ (tiêu mục) là tên riêng của mỗi hàng, cột phản ánh ý nghĩa của cột đó. b. Phần nội dung: Bảng thống kê gồm 2 phần: Phần chủ đề và phần giải thích. Phần chủ đề nói lên tổng thể được trình bày trong bảng thống kê, tổng thể này được phân thành những đơn vị, bộ phận. Nó giải đáp: đối tượng nghiên cứu là những đơn vị nào, những loại hình gì. Có khi phần chủ đề phản ánh các địa phương hoặc các thời gian nghiên cứu khác nhau của một hiện tượng. Phần giải thích gồm các chỉ tiêu giải thích các đặc điểm của đối tượng nghiên cứu, tức là giải thích phần chủ đề của bảng. Phần chủ đề thường được đặt bên trái của bảng thống kê, còn phần giải thích được đặt ở phía trên của bảng. Cũng có trường hợp ta thay đổi vị trí. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 21 Cấu thành của bảng thống kê có thể biểu hiện bằng sơ đồ sau: Phần chủ đề Phần giải thích Các chỉ tiêu giải thích (tên cột) (1) (2) (3) (4) (5) Tên chủ đề 3.1.1.3. Các yêu cầu và qui ước xây dựng bảng thống kê Qui mô của bảng thống kê: không nên quá lớn, tức là quá nhiều hàng, cột và nhiều phân tổ kết hợp. Một bảng thống kê ngắn, gọn một cách hợp lý sẽ tạo điều kiện dễ dàng cho việc phân tích. Nếu thấy cần thiết nên xây dựng hai, ba,... bảng thống kê nhỏ thay cho một bảng thống kê quá lớn Số hiệu bảng: nhằm giúp cho người đọc dễ dàng xác định vị trí của bảng khi tham khảo, đặc biệt là đối với các tài liệu nghiên cứu người ta thường lập mục lục biểu bảng để người đọc dễ tham khảo và người trình bày dễ dàng hơn. Nếu số biểu bảng không nhiều thì chúng ta chỉ cần đánh số theo thứ tự xuất hiện của biểu bảng, nếu tài liệu được chia thành nhiều chương và số liệu biểu bảng nhiều thì ta có thể đánh số theo chương và theo số thứ tự xuất hiện của biểu bảng trong chương. Ví dụ, Bảng 2.5 tức là bảng ở chương 2 và là bảng thứ 5. Tên bảng: yêu cầu ngắn gọn, đầy đủ, rõ ràng, đặt trên đầu bảng và phải chứa đựng nội dung, thời gian, không gian mà số liệu được biểu hiện trong bảng. Tuy nhiên yêu cầu này chỉ mang tính chất tương đối không có tiêu chuẩn rõ ràng nhưng thông thường người ta cố gắng trình bày trong một hàng hoặc tối đa là hai hàng. Đơn vị tính: Đơn vị tính dùng chung cho toàn bộ số liệu trong bảng thống kê, trường hợp này đơn vị tính được ghi bên góc phải của bảng. Đơn vị tính theo từng chỉ tiêu trong cột, trong trường hợp này đơn vị tính sẽ được đặt dưới chỉ tiêu của cột. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 22 Đơn vị tính theo từng chỉ tiêu trong hàng, trong trường hợp này đơn vị tính sẽ được đặt sau chỉ tiêu theo mỗi hàng hoặc tạo thêm một cột ghi đơn vị tính. Cách ghi số liệu trong bảng: Số liệu trong từng hàng (cột) có đơn vị tính phải nhận cùng một số lẻ, số liệu ở các hàng (cột) khác nhau không nhất thiết có cùng số lẻ với hàng (cột) tương ứng. - Một số ký hiệu qui ước: + Nếu không có tài liệu thì trong ô ghi dấu gạch ngang “-“ + Nếu số liệu còn thiếu, sau này sẽ bổ sung sau thì trong ô ghi dấu ba chấm “...” + Ký hiệu gạch chéo “x” trong ô nào đó thì nói lên hiện tượng không có liên quan đến chỉ tiêu đó, nếu ghi số liệu vào đó sẽ vô nghĩa hoặc thừa. Phần ghi chú ở cuối bảng: được dùng để giải thích rõ các nội dung chỉ tiêu trong bảng, nói rõ nguồn tài liệu đã sử dụng hoặc các chỉ tiêu cần thiết khác. Đối với tài liệu khoa học, việc ghi rõ nguồn số liệu được coi là bắt buộc không thể thiếu được trong biểu bảng. 3.1.2. ĐỒ THỊ THỐNG KÊ 3.1.2.1. Biểu đồ hình cột Biểu đồ hình cột là loại biểu đồ biểu hiện các tài liệu thống kê bằng các hình chữ nhật hay khối chữ nhật thẳng đứng hoặc nằm ngang có chiều rộng và chiều sâu bằng nhau, còn chiều cao tương ứng với các đại lượng cần biểu hiện. Biểu đồ hình cột được dùng để biểu hiện quá trình phát triển, phản ánh cơ cấu và thay đổi cơ cấu hoặc so sánh cũng như biểu hiện mối liên hệ giữa các hiện tượng. 3.1.2.2. Biểu đồ diện tích Biểu đồ diện tích là loại biểu đồ, trong đó các thông tin thống kê được biểu hiện bằng các loại diện tích hình học như hình vuông, hình chữ nhật, hình tròn, hình ô van,... Biểu đồ diện tích thường được dùng để biểu hiện kết cấu và biến động cơ cấu của hiện tượng. Tổng diện tích của cả hình là 100%, thì diện tích từng phần tương ứng với mỗi bộ phận phản ánh cơ cấu của bộ phận đó. Biểu đồ diện tích hình tròn còn có thể biểu hiện được cả cơ cấu, biến động cơ cấu kết hợp thay đổi mức độ của hiện tượng. Trong trường hợp này số đo của góc các hình [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 23 S :  quạt phản ánh cơ cấu và biến động cơ cấu, còn diện tích toàn hình tròn phản ánh quy mô của hiện tượng. Khi vẽ đồ thị ta tiến hành như sau: - Lấy giá trị của từng bộ phận chia cho giá trị chung của chỉ tiêu nghiên cứu để xác định tỷ trọng (%)của từng bộ phận đó. Tiếp tục lấy 360 (3600) chia cho 100 rồi nhân với tỷ trọng của từng bộ phận sẽ xác định được góc độ tương ứng với cơ cấu của từng bộ phận. Xác định bán kính của mỗi hình tròn có diện tích tương ứng là S: R = vì diện tích hình tròn: S = π. R2. Khi có độ dài của bán kính mỗi hình tròn, ta sẽ dễ dàng vẽ được các hình tròn đó. Ví dụ : Có số lượng về học sinh phổ thông phân theo cấp học 3 năm 2005, 2006 và 2007 của địa phương X như bảng 1.3: Bảng 3.1: Học sinh phổ thông phân theo cấp học của địa phương X, 2005 - 2007 2005 2006 2007 Số lượng (Người) Cơ cấu (%) Số lượng (Người) Cơ cấu (%) Số lượng (Người) Cơ cấu (%) Tổng số học sinh 1.000 100,0 1.140 100,0 1.310 100,0 Chia ra: Tiểu học 500 50,0 600 53,0 700 53,5 Trung học cơ sở 300 30,0 320 28,0 360 27,5 Trung học phổ thông 200 20,0 220 19,0 250 19,0 Từ số liệu bảng 1.3 ta tính các bán kính tương ứng: 2005: 17.84; 2006: 19.05; 2007: 20.42 Nếu năm 2005 lấy R = 1,00 Thì năm 2006 có R = 19,05 : 17,84 = 1,067 Năm 2007 có R = 20,42 : 17,84 = 1,144 Kết quả 3 hình tròn được vẽ phản ánh cả quy mô học sinh phổ thông lẫn cơ cấu và biến động cơ cấu theo cấp học của học sinh qua các năm 2005, 2006 và 2007. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 24 30 Biều đồ 3.2: Biểu đồ cơ cấu học sinh phổ thông địa phương X từ 2005 – 2007 20 53,5 53 50 2005 2006 2007 Tuy nhiên, nếu chúng ta chỉ vẽ biểu đồ mang tính đơn lẽ thì không cần phải xác định độ lớn của đường kính. 3.1.2.3. Biểu đồ tượng hình Biểu đồ tượng hình là loại đồ thị thống kê, trong đó các tài liệu thống kê được thể hiện bằng các hình vẽ tượng trưng. Biểu đồ tượng hình được dùng rộng rãi trong việc tuyên truyền, phổ biến thông tin trên các phương tiện sử dụng rộng rãi. Biểu đồ hình tượng có nhiều cách vẽ khác nhau, tuỳ theo sáng kiến của người trình bày mà lựa chọn loại hình vẽ tượng hình cho phù hợp và hấp dẫn. Tuy nhiên khi sử dụng loại biểu đồ này phải theo nguyên tắc: cùng một chỉ tiêu phải được biểu hiện bằng cùng một loại hình vẽ, còn chỉ tiêu đó ở các trường hợp nào có trị số lớn nhỏ khác nhau thì sẽ biểu hiện bằng hình vẽ có kích thước lớn nhỏ khác nhau theo tỷ lệ tương ứng. Trở lại ví dụ trên số lượng học sinh phổ thông được biểu diễn như sau: 19 27,5 19 28 [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 25 Biểu đồ 3.3: Biểu đồ cơ cấu học sinh phổ thông địa phương X từ 2005 – 2007 3.1.2.4. Đồ thị đường gấp khúc Đồ thị đường gấp khúc là loại đồ thị thống kê biểu hiện các tài liệu bằng một đường gấp khúc nối liền các điểm trên một hệ toạ độ, thường là hệ toạ độ vuông góc. Đồ thị đường gấp khúc được dùng để biểu hiện quá trình phát triển của hiện tượng, biểu hiện tình hình phân phối các đơn vị tổng thể theo một tiêu thức nào đó hoặc biểu thị tình hình thực hiện kế hoạch theo từng thời gian của các chỉ tiêu nghiên cứu. Trong một đồ thị đường gấp khúc, trục hoành thường được biểu thị thời gian, trục tung biểu thị mức độ của chỉ tiêu nghiên cứu. Cũng có khi các trục này biểu thị hai chỉ tiêu có liên hệ với nhau hoặc lượng biến và các tần số (hay tần suất) tương ứng. Độ phân chia trên các trục cần được xác định cho thích hợp vì có ảnh hưởng trực tiếp đến độ dốc của đồ thị. Mặt khác, cần chú ý là trên mỗi trục toạ độ chiều dài của các khoảng phân chia tương ứng với sự thay đổi về lượng của chỉ tiêu nghiên cứu phải bằng nhau. Ví dụ : Sản lượng cà phê xuất khẩu của quốc gia X qua các năm từ 2000 - 2007 (ngàn tấn) có kết quả như sau: Năm 2000 2001 2002 2003 2004 2005 2006 2007 Sản lượng (ngàn tấn) 283,3 391,6 382,0 482,0 733,9 931,0 722,0 749,0 Số liệu trên được biểu diễn qua đồ thị đường gấp khúc sau [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 26 : Đồ thị 3.4: Sản lượng cà phê xuất khẩu của quốc gia X từ 2000 – 2007 1000 900 800 700 600 500 400 300 200 100 0 2000 2001 2002 2003 2004 2005 2006 2007 3.1.2.5. Biểu đồ hình màng nhện Biểu đồ hình màng nhện là loại đồ thị thống kê dùng để phản ánh kết quả đạt được của hiện tượng lặp đi lặp lại về mặt thời gian, ví dụ phản ánh về biến động thời vụ của một chỉ tiêu nào đó qua 12 tháng trong năm. Để lập đồ thị hình màng nhện ta vẽ một hình tròn bán kính R, sao cho R lớn hơn trị số lớn nhất của chỉ tiêu nghiên cứu (lớn hơn bao nhiêu lần không quan trọng, miễn là đảm bảo tỷ lệ nào đó để hình vẽ được cân đối, kết quả biểu diễn của đồ thị dễ nhận biết). Sau đó chia đường tròn bán kính R thành các phần đều nhau theo số kỳ nghiên cứu (ở đây là 12 tháng) bởi các đường thẳng đi qua tâm đường tròn. Nối các giao điểm của bán kính cắt đường tròn ta được đa giác đều nội tiếp đường tròn. Đó là giới hạn phạm vi của đồ thị. Độ dài đo từ tâm đường tròn đến các điểm xác định theo các đường phân chia đường tròn nói trên chính là các đại lượng cần biểu hiện của hiện tượng tương ứng với mỗi thời kỳ. Nối các [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 27 điểm xác định sẽ được hình vẽ của đồ thị hình màng nhện. VD: có số liệu về giá trị xuất, nhập khẩu hải sản của tỉnh X năm 2006 và 2003 như sau: Bảng 3.2. Giá trị xuất khẩu hải sản trong 12 tháng tỉnh X năm 2006 - 2007 ĐVT: Triệu đồng Năm Tháng 2006 2007 Nă m Tháng 2006 2007 1 10,7 14,0 7 19,1 21,3 2 7,0 10,5 8 21,2 22,5 3 13,1 15,4 9 20,5 22,2 4 14,8 16,5 10 21,1 24,4 5 17,4 18,4 11 17,7 21,8 6 18,9 19,8 12 16,8 22,1 Chia đường tròn thành 12 phần đều nhau, vẽ các đường thẳng tương ứng cắt đường tròn tại 12 điểm. Nối các điểm lại có đa giác đều 12 cạnh nội tiếp đường tròn. Căn cứ số liệu của bảng ta xác định các điểm tương ứng với giá trị xuất khẩu đạt được của các tháng trong từng năm rồi nối các điểm đó lại thành đường liền ta được đồ thị hình màng nhện biểu diễn kết quả xuất khẩu qua các tháng trong 2 năm của tỉnh X. Đồ thị 3.5: Đồ thị Giá trị xuất khẩu hải sản trong 12 tháng tỉnh X năm 2006 - 2007 2 5 12 11 9 8 20 15 10 5 0 2 6 3 4 5 2006 2007 [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 28 3.2. PHÂN TỔ THỐNG KÊ 3.2.1. Khái niệm chung về phân tổ thống kê 3.2.1.1. Khái niệm, ý nghĩa và nhiệm vụ của phân tổ thống kê Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để phân chia các đơn vị của tổng thể thánh các tổ có tính chất khác nhau. Kết quả của phân tổ được một dãy số biểu thị sự phân bố của các đơn vị tổng thể dọi là dãy số phân phối, số lượng đơn vị từng tổ được gọi là tần số phân phối, tỷ số đơn vị của từng tổ trong tổng thể gọi là tần số. Ý nghĩa: là phương pháp cơ bản để tổng hợp tài liệu điều tra thống kê. Tài liệu và kết quả của tổng hợp thống kê là cơ sở tính toán các chỉ tiêu phân tích thống kê phục vụ cho giai đoạn phân tích thống kê. Dựa vào kết quả cảu phân tổ thống kê chúng ta có thể nhận xét sơ bộ có tính phân tích so sánh hơn kém giữa các nhóm tổ, qua đó nhận thấy vai trò quan trọng của từng tổ. Nhiệm vụ: là phân chia các loại hình kinh tế-xã hội của hiện tượng nghiên cứu, biểu hiện kết cấu của hiện tượng nghiên cứu và biểu hiện mối liên hệ giữa các tiêu thức. 3.2.1.2.Các loại phân tổ thống kê Căn cứ vào nhiệm vụ của phân tổ thống kê;  Phân tổ phân loại:  Phân tổ kết cấu  Phân tổ liên hệ Căn cứ vào số lượng của tiêu thức phân bổ  Phân tổ theo một tiêu thức  Phân tổ theo nhiều tiêu thức 3.2.1.3. Tiêu thức phân tổ và chỉ tiêu giải thích Tiêu thức phân tổ là những tiêu thức nêu lên đặc tính, đặc trưng cơ bản của hiện tượng nghiên cứu được chọn làm căn cứ để tiến hành phân tổ hiện tượng nghiên cứu. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 29 Mỗi đơn vị tổng thể có nhiều tiêu thức khác nhau, tiêu thức naaof cũng có thể chọn để làm cẳn cứ phân tổ. Tuy nhiên, mỗi tiêu thức có ý nghĩa khác nhau, cho nên kết quả phân tổ theo chúng cũng có ý nghĩa khác nhau. Có tiêu thức khi phân tổ theo nó giúp ta hiểu bản chất của hiện tượng nghiên cứu, có tiêu thức chỉ giúp ta hiểu một phần. Vì vậy, khi tiến hành phân tổ trước hết cần phải lựa chọn tiêu thức phân tổ chính xác. Ví dụ: phân tổ cá cửa hàng bán lẻ theo doanh thu tháng 10 năm 2005 trên địa bàn quận A, đơn vị tính theo triệu đồng. Doanh thu Số của hàng 10 200 20 100 30 300 40 400 50 300 60 100 100 100 Cộng 1.500 3.2.2. Các bước phân tổ thống kê 3.2.2.1. Lựa chọn tiêu thức phân tổ Lựa chọn tiêu thức phân tổ là bước đầu tiên làm cơ sở để tiến hành phân tổ. Lựa chọn tiêu thức chính xác, phù hợp với mục đích nghiên cứu thì kết quả phân tổ mới thực sự có ích cho việc phân tích đặc điểm và bản chất của hiện tượng. 3.2.2.2. Xác định số tổ và khoảng cách tổ a. Phân tổ theo tiêu thức thuộc tính Tiêu thức thuộc tính có 3 biểu hiện cụ thể: Trường hợp có 2 biểu hiện (tiêu thức thay phiên), phân chia hiện tượng nghiên cứu thành 2 tổ. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 30 Ví dụ: phân tổ doanh nghiệp công nghiệp, phân tổ sản phẩm công nghiệp theo tiêu thức nhóm A và nhóm B hoặc theo tiêu thức khu vực Quốc doanh và khu vực ngoài Quốc doanh. Trường hợp có một số biểu hiện cố định, môi biểu hiện hình thành một tổ, có bao nhiêu biểu hiện sẽ phân chia hiện tượng thành bấy nhiêu tổ. Ví dụ: phân tổ dân số theo thành phần giai cấp hay theo tiêu thức dân tộc. Trường hợp có nhiều biểu hiện như tiêu thức tên sản phẩm, rất nhiều tên sản phẩm, không thể dựa trên mỗi biểu hiện hình thành một tổ. Như vậy số tổ quá nhiều, và cac đơn vị trong các tổ sẽ không khác nhau về tình chất, đặc trưng cơ bản, không có ý nghĩa nghiên cứu. Trường hợp này phải thực hiện nguyên tắc ghép tổ:các đơn vị các tổ nhỏ được ghép thành một tổ phải đảm bảo giống nhau hoặc gần giống nhau về tính chất hoặc đặc trưng cơ bản nào đó theo tiêu thức phân tổ, phù hợp với mục đích, yêu cầu nghiên cứu. b. Phân tổ theo tiêu thức số lượng Tiêu thức lượng biến có 3 trường hợp sau đây: Trường hợp tiêu thức thay phiên – lượng biến của tiêu thức phân tổ chỉ có hai biểu hiện: mức trên hoặc mức dưới một trị số lượng biến nào đó. Ví dụ: phân tổ của doanh nghiệp thủ công mỹ nghệ để nghiên cứu quy mô doanh nghiệp theo hai biểu hiện của tiêu thức số công nhân: dưới 200 công nhân và trên 200 công nhân. Do đó hình thành 2 tổ: tổ dưới 200 công nhân và tổ trên 200 công nhân. Trường hợp có một số hữu hạn tương đối cố định lượng biến rời rạc không liên tục thì mỗi lượng biến hình thành một tổ. Số tổ bằng số hạn lượng biến. Ví dụ: phân tổ hộ gia đình theo số con có trong gia đình Phân tổ không có khoảng cách tổ Trường hợp tiêu thức lượng biến liên tục hoặc không liên tục (rời rạc) có rất nhiều biểu hiện về mặt lượng. Ví dụ: tiêu thức tuổi đời của dân số. Trong trường hợp này không thể căn cứ vào mỗi biểu hiện về mặt lượng để hình thành một tổ. Vì như vậy số tổ được phân chia sẽ rất [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 31 nhiều mà điều quan trọng giữa các tổ không khác biệt nhau về chất, đặc trưng cơ bản của hiện tượng, do đó không đáp ứng được yêu cầu phân tích. Vì vậy phải thực hiện ghép tổ để có được một số tổ thích hợp cần thiết. Nguyên tắc cơ bản thực hiện ghép tổ là dựa vào quy luật vận động nghiên cứu trong triết học “ lượng biến dẫn đến chất biến”. Phải phân tích sâu sắc về mặt lý luận khoa học kết hợp với phân tích đầy đủ thực tiễn tồn tại và xem xét đến mục đích yêu cầu nghiên cứu đê xác định lượng biến được tích tụ đến một mức độ nào đó thì sẽ tạo ra một chất mới và phải được hình thành một tổ khác. Trên cơ sở phân tích như vậy sẽ xác định số tổ cần chia. Ví dụ phân tuổi dân cư theo độ tuổi lao động sẽ hình thành được 3 tổ: tổ dân cư chưa đến tuổi lao động, tổ dân cư trong độ tuổi lao động, tổ dân cư ngoài tuổi lao động. - Trường hợp phân tổ không có khoảng cách tổ bằng nhau: các đơn vị tổng thể có sự khác nhau nhiều về chất và sự biến đổi về lượng diễn ra không đều nhau. Do đó, việc xác định khoảng cách tổ dựa vào phương pháp phân tích về lý luận khoa học bản chất của hiện tượng và phân tích sâu sắc thực tế tồn tại của hiện tượng nghiên cứu để xem xét lượng biến dao động đến mức độ nào thì các đơn vị tổng thể hiện tượng nghiên cứu sẽ có cùng hoặc gần giống nhau về tính chất đặc trưng cơ bản từ đó sẽ xếp vào cùng một tổ. -Trường hợp phân tổ có khoảng cách tổ bằng nhau: các đơn vị tổng thể hiện tượng nghiên cứu không có sự khác biệt lớn về chất và đặc trưng cơ bản, hay nói cách khác có sự đồng nhất về chất; sự biến đổi về lượng trong các đơn vị tổng thể nhìn chung diễn ra khá đồng đều, không có sự cách biệt lớn. Do đó phương pháp xác định khoảng cách tổ dựa trên công thức: = − d:Khoảng cách tổ xmax: lượng biến lớn nhất của tiêu thức phân tổ xmin: Lượng biến nhỏ nhất của tiêu thức phân tổ n:Số tổ dự định chia. 3.2.2.3. Phân phối các đơn vị vào từng tổ [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 32 Sau khi xác định số tổ và khoảng cách tổ, bước cuối cùng là phân phối các đơn vị vào từng tổ và tính toán trị số cảu các chỉ tiêu giải thích nếu có. 3.2.3 Dãy số phân phối 3.2.3.1. Khái niệm và các loại dãy số phân phối Dãy số phân phối theo tiêu thức thuộc tính: phản ánh kết cấu của tổng thể theo một tiêu thức thuộc tính nào đó. Ví dụ: dãy số phân phối giá trị sản xuất công nghiệp theo thành phần kinh tế. Dãy số phân phối theo tiêu thức số lượng: phản ánh kết cấu của tổng thể theo một tiêu thức số lượng nào đó. Ví dụ: dãy số phân phối một tổng thể lao động theo mức lương. 3.2.3.2. Dãy số lượng biến Dãy số lượng biến là kết quả của việc phân tổ theo tiêu thức số lượng. Một dãy số lượng biến có các thành phần chu yếu sau: - Thành phần thứ nhất là lượng biến: lượng biến là các trị số nói lên biểu hiện cụ thể của tiêu thức số lượng, thường được ký hiệu là xi . Lượng biến của tiêu thức được chia làm 2 loại: lượng biến liên tục và lượng biến rời rạc. -Thành phần thứ 2 của lượng biến là tần số. Tần số là số đơn vị được phân phối vào mỗi tổ, tức là số lần một lượng biến nhận một trị số nhất định trong một tổng thể. Ngoài 2 thành phần nói trên người ta còn thường tính tần số (tần suất) tích lũy tức cộng dồn tần số. Tần số tích lũy (Si) cho biết số đơn vị có lượng biến lớn hơn hoặc nhỏ hơn một lượng biến cụ thể nào đó và là cơ sở để xác định một đơn vị đứng ở vị trí nào đó trong dãy số lượng biến là bao nhiêu. 3.3 SỐ TUYỆT ĐỐI TRONG THỐNG KÊ 3.3.1. Khái niệm và ý nghĩa số tuyệt đối Số tuyệt đối trong thống kê là chỉ tiêu thể hiện quy mô, khối lượng cảu hiện tượng kinh tế xã hội trong điều kiện và thời gian cụ thể. Số tuyệt đối biểu hiện số đơn vị của tổng thể hay bộ phận của tổng thể. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 33 Ví dụ: số doanh nghiệp của công ty A. Số tuyệt đối biểu hiện tổng trị số của một tiêu thức, một chỉ tiêu kinh tế xã hội. Ví dụ:tổng giá trị sản suất của một quốc gia. Số tuyệt đối có ý nghĩa trong công tác quản lý kinh tế xã hội. Bởi vị qua số tuyệt đối có thể nhận thức rõ ràng cụ thể, có sức thuyệt phục không thể phủ nhận được về khối lượng quy mô, kết quả sản xuất thực tế. Số tuyệt đối là cơ sở đầu tiên thực hiện phân tích thống kê, đồng thời còn làm cở sở để tính các chỉ tiêu mức độ khối lượng tăng trưởng, số bình quân, chỉ tiêu tốc độ phát triển. Số tuyệt đối trong thống kê là căn cứ không thể thiếu được trong việc xậy dựng các dự án, kế hoạch phát triển kinh tế xã hội, tổ chức chỉ đạo thực hiện và kiểm tra kết quả tình hình thực hiện kế hoạch phát triển kinh tế xã hội. 3.3.2. Đặc điểm của số tuyệt đối Số tuyệt đối trong thống kê luôn gắn liền với một hiện tượng kinh tế xã hội nhất định. Mỗi trị số của số tuyệt đối đều mang trong nó một nội dung kinh tế nhất định ở từng thời gian và địa điểmb cụ thể, do đó chúng khác hoàn toàn với số tuyệt đối trong toán học. Muốn xác định đúng đắn số tuyệt đối, vấn đề quan trong trước hết là phải xác định nội dung kinh tế mà nó phản ánh. Số tuyệt đối trong thống kê không phải là số tuyệt đối trong toán học được lựa chọn một cách tùy ý, mà những con số thu được thông qua phương pháp thống kê cụ thể. 3.3.3. Đơn vị tính số tuyệt đối Tùy theo tính chất và đối tượng nghiên cứu, số tuyệt đối bao giờ cũng có đơn vị đo phù hợp bao gồm: đơn vị hiện vật tự nhiên (con, cái, chiếc), hay đợn vị đo lường (m, kg, lít), đơn vị tiền tệ, đơn vị thời gian lao động 3.3.4. Các loại số tuyệt đối Có thể phân biệt hai loại số tuyệt đối sau: Số tuyệt đối thời kỳ: là chỉ tiêu phản ánh quy mô, khối lượng của hiện tượng nghiên cứu trong một khoảng thời gian nhất định. Chúng được hình thành thông qua sự tích lũy (cộng đồn) về lượng trong suốt thời gian nghiên cứu. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 34 Ví dụ: giá trị sản xuất công nghiệp trong một năm. Số tuyệt đối thời kỳ của cùng một chỉ tiêu có thể cộng được với nhau để có trị số của thời kỳ dài hơn. Nều thời kỳ tính toán càng dài thù trị số của chỉ tiêu càng lớn. Số tuyệt đối thời điểm là chỉ tiêu phản ánh quy mô, khối lượng của hiện tượng trong một thời điểm nhất định. Ví dụ: tổng dân số Việt Nam lúc 0 giờ, ngày 4 tháng 1 năm 1999. Số tuyệt đối thời điểm chỉ hiện trạng của sự vật tại thời điểm cụ thể, trước và sau thời điểm nghiên cứu, mức độ khối lượng tuyệt đối có thể bị biến đổi khác đi về trạng thái, quy mô. 3.4. SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ 3.4.1.Khái niệm và ý nghĩa số tương đối Số tương đối trong thống kê là chỉ tiêu biểu hiện quan hệ so sánh giữa hai mức độ của hiện tượng nghiên cứu. Từ khái niệm trên ta thấy có hai trường hợp so sánh sau: So sánh hai mức độ cùng loại nhưng khác nhau về điều kiện thời gian và không gian ví dụ: Hai hiện tượng khác loại nhưng có mối quan hệ với nhau. Ví dụ: Số tương đối trong thống kê có ý nghĩa quan trọng, là một trong những chỉ tiêu phân tích thống kê cơ bản, tạo khả năng cho ta đí sâu nghiên cứu, phân tích bản chất và mối quan hệ của các hiện tượng và quá trình kinh tế xã hội, những mối liên hệ đó có thể là kết cấu, quan hệ tỷ lệ, tốc độ phát triển, quan hệ só sánh. Số tương đối còn sử dụng để công bố khi muốn giữ bí mật số tuyệt đối. Số tương đối giúp ta nghiên cứu, phân tích các hiện tượng mà nhiều khi chỉ số tuyệt đối không nêu rõ được. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 35 Ví dụ: so sánh mức sống dan cư năm 2004 và năm 2003 có được nâng cao hay không. Ta có thể so sánh mức chỉ tiêu bình quân đầu người năm 2004 với năm 2003, qua đó ta biết được tốc độ phát triển của mức sống dân cư là tăng lên hay giảm đi. 3.4.2. Đặc điểm và hình thức biểu hiện số tương đối Số tương đối không phải là số liệu trực tiếp thu thập từ tài liệu, có sẵn trong thực tế mà chúng được hình thành dựa vào việc tính toán từ các số tuyệt đối, số bình quân Bất kỳ số tương đối nào cũng có gốc để so sánh, tùy thuộc vào mục đích nghiên cứu khác nhau mà chọn gốc so sánh phù hợp. Đơn vị tính số tuyệt đối là: lần, %, phần ngàn, hoặc đơn vị kép (người/km2) 3.4.3. Các loại số tương đối a.Số tương đối động thái (tốc độ phát triển) là kết quả so sánh giữa hai mức độ của cùng một hiện tượng nhưng khác nhau về thời gian. Công thức: t = t: số tuyệt đối động thái (lần hoặc %) y0: mức độ của hiện tượng kỳ gốc y1: mức độ hiện tượng nghiên cứu kỳ báo cáo. Ví dụ: có số liệu sản phẩm A đượcsản xuất trong hai năm như sau: năm 2004 sản xuất 1000 tấn, năm 2005 sản xuất 1500 tấn. Số tương đối động thái: t= =1,5=150%. Nếu ta tính các số tương đối động thái kỳ gốc y0 thay đổi và kề ngay trước kỳ báo cáo, khi đó ta có các số động thái liên hoàn (hay còn gọi tốc độ phát triển liên hoàn) Nếu ta tính các số tương đối động thái kỳ gốc y0 cố định, khi đó ta có số tương đối động thái kỳ gốc (hay còn gọi tốc độ phát triển định gốc) b.Số tương đối kế hoạch: là kết quả so sánh giữa hai mức độ kế hoạch với mức độ thực tế của chỉ tiêu ấy ở kỳ gốc. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 36 Số tương đối nhiệm vụ kế hoạch: Công thức: Kn = Kn: mức độ kỳ kế hoạch Yk: mức độ kế hoạch Số tương đối thực hiện kế hoạch Công thức: : KT = Mối quan hế giữa ba loại số tương đối: t= Kn * KT c.Số tương đối kết cấu: được dùng để xác định tỷ trọng của mỗi bộ phận cấu thàh trong tổng thể. Công thức: số tương đối kết cấu= đ đ ∗100% d.Số tương đối cường độ: biểu hiện trình độ phổ biến của hiện tượng nghiên cứu trong một điều kiện lịch sử nhất định. Số tương đối này được tính bằng cách so sánh chỉ tiêu của hai hiện tượng khác nhau nhưng có liên quan với nhau. e.Số tương đối không gian: là loại số tương đối biểu hiện sự so sánh về mức độ giữa hai bộ phận trong một tổng thể, hoặc giữa hai hiện tượng cùng loại nhưng khác nhau về điều kiện không gian. 3.4.4. Một số vấn đề vận dụng chung số tương đối và số tuyệt đối Khi sử dụng số tương đối và số tuyệt đối phải xét đến đặc điểm của hiện tượng nghiên cứu để rút ra kết luận cho đúng. Phải vận dụng một cách kết hợp số tương đối và số tuyệt đối. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 37 3.5. SỐ BÌNH QUÂN TRONG THỐNG KÊ 3.5.1.Khái niệm, ý nghĩa số bình quân trong thống kê Số bình quân trong thống kê là mức độ biểu hiện trị số đại biểu theo một tiêu thức nào đó của một tổng thể bao gồm nhiều đơn vị cùng loại. Nghiên cứu số bình quân có thể biết được xu hướng phát triển của tông thể. Có thể sử dụng số bình quân để so sánh các đại lượng không có cùng quy mô và trình độ đồng đều của tổng thể. Số bình quân rất thông dụng trong lĩnh vực nghiên cứu kinh tế, xã hội. 3.5.2. Các loại số bình quân a.Số bình quân cộng * Số bình quân cộng giản đơn (hay trung bình cộng giản đơn):được vận dụng khi các lượng biến có cùng tần số và bằng 1. Công thức: x = ⋯ hay x = ∑ *.Số bình quân cộng gia quyền(trung bình cộng gia quyền): vận dụng khi các lượng biến có tần số khác nhau. Công thức: ̅ = ∑ ∗ ∑ *.Tính số bình quân từ một dãy số lượng biến có khoảng cách tổ. Người ta thường lấy trị số giữa làm đại diện cho từng tổ Công thức: Trị số giữa của mỗi tổ = Trong đó: xmax, xmin là giới hạn trên và giới hạn dưới của tổ có khoảng cách tổ. *.TÍnh số bình quân chung từ các số bình quân tổ. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 38 Công thức: ̅ = ∑ ∑ b.Số bình quân điều hòa Số bình quân điều hòa cũng có nội dung kinh tế như số bình quân cộng, tính được bằng cách đem chia tổng các lượng biến của tiêu thức cho số đơn vị tổng thể. Nhưng ở đây vì không có sẵn tài liệu về số đơn vị tổng thể, nên phải dựa vào các tài liệu khác để tính ra. Công thức: ̅= ∑ ∑ ∗ Trong đó: xi : các lượng biến ̅: số bình quân Mi =xi*fi –tổng các lượng biến của tiêu thức trong từng tổ là quyền số của số bình quân điều hòa. c.Số bình quân nhân là số bình của những đại lượng có mối quan hệ tích với nhau. Công thức: ̅ = ∏ 3.5.3. Mốt Mốt (M0) là trị số lượng biến của một tiêu thức được gặp nhiều nhất trong tổng thể hay trong một dãy phân phối. Cách xác định M0. Dãy số lượng biến không có khoảng cách tổ: mốt là lượng biến có tần số lớn nhất. Dãy số lượng biến có khoảng cách tổ. Bước 1. xác định tổ chứa mốt. Tổ có khoảng cách tổ đều nhau Tổ có khoảng cách không đều nhau [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 39 Tổ nào có tần số lớn nhất thì tổ đó chứa mốt Tính mật độ phân bố (fi/hi) Tổ nào có mật độ phân bố lớn nhất tổ đó chứ mốt Bước 2. tính Mốt Công thức tính: Mốt là chỉ tiêu nói lên mức độ phổ biến rộng rãi chung của tổng thể hiện tượng nghiên cứu. Do đó có thể sử dụng bổ sung cho mức độ bình quân, trong trường hợp tính toán số bình quân gặp khó khăn. Mốt không chịu ảnh hưởng của các lượng biến đột xuất, không có tính săn bằng bù trừ chênh lệch giữa các lượng biến trong dãy số phân phối. Nhưng cũng chính điều này làm cho mốt kém nhạy bén đối với sự biến thiên của tiêu thức. Trong thực tế người ta sử dụng mốt để nghiên cứu nhu cầu thị trường về một loại kích cỡ sản phẩm nào đó như giày dépngoài ra mốt còn cho biết đa số, thể hiện khuynh hướng phong trào. 3.5.4. Trung vị Số trung vị (Me) là lượng biến của đơn vị đứng ở vị trí chính giữa trong dãy số lượng biến đã được sắp xếp theo thứ tự tăng dần. Số trung vị chia dãy số lượng biến thành 2 phần bằng nhau. Cách xác định số trung vị: +.Dãy số lượng biến không có khoảng cách tổ -.Trường hợp n là số chẵn: số trung vị sẽ là lượng biến đứng ở vị tri giữa dãy số. Tức là đứng ở vị trí thứ (n+1)/2. -Trường hợp n là số chẵn: số trung vị là kết quả trung bình cộng của hai lượng biến đứng ở vị trí chính giữa, nghĩa là trung bình cộng của hai lượng biến đứng ở vị trí n/2 và (n+2)/2. +Dãy số lượng biến có khoảng cách tổ Bước 1.xác định tổ chưá trung vị [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 40 -Tính tần số tích lũy - Trung vị thuộc vị trí: ∑ ( ) Bước 2. tính số trung vị bằng công thức gần đúng. Công thức: = + h* ∑ Trong đó: xMe: cận dưới của tổ chứa trung vị h:khoảng cách tổ SMe -1:tần số tích lũy đứng liền trước tổ chứa trung vị. FMe: tần số của tổ chứa số trung vị Về ý nghĩa kinh tế, số trung vị cũng tương tự số chưa mốt nhưng số trung vị được sử dụng rộng rãi hơn, nó biểu hiện mức độ đại diện của hiện tượng, và cũng có thể thay số bìh quân khi tính toán chỉ tiêu này gặp khó khăn, ngoài ra số trung vị còn là một trong các chỉ tiêu dùng để nêu lên đặc trưng phân phối của dãy số. 3.5.5. Điều kiện vận dụng số bình quân trong thống kê một cách khoa học và chính xác Số bình quân chỉ được tính ra từ tổng thể đồng chất. Số bình quân chung cần được vận dụng kết hợp với số bình quân tổ hoặc dãy số phân phối. 3.6. CÁC CHỈ TIÊU ĐO ĐỘ BIẾN THIÊN CỦA TIÊU THỨC 3.6.1. Ý nghĩa nghiên cứu độ biến thiên của tiêu thức Các chỉ tiêu đo độ biến thiên của tiêu thức giúp ta xét trình độ đại biểu của số bình quân Quan sát sự biến thiên của tiêu thức trong một dãy số lượng biến, sẽ thấy rõ được nhiều đặc trưng của dãy số, như đặc trưng về phân phối, về kết cấu, về tính chất đồng đều của tổng thể nghiên cứu. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 41 Trong phân tích hoàn thành kế hoạch, các chỉ tiêu đánh giá độ biến thiên của tiêu thức giúp ta thấy rõ được chất lượng công tác, và nhịp điệu hoàn thành kế hoạch chung cũng như xủa từng bộ phận, phát hiện khả năng tiềm tàng của các đơn vị. Các chỉ tiêu đánh giá độ biến thiên của tiêu thức còn được sử dụng trong nhiều trường hợp nghiên cứu khác như: phân tích biến động, phân tích mối liên hệ, dự đoán thống kê... 3.6.2.Các chỉ tiêu đo độ biến thiên của tiêu thức a.Khoảng biến thiên: là độ lệch giữa lượng biến lớn nhất và lượng biến nhỉ nhất của tiêu thức nghiên cứu. Công thức: R=xmax - xmin Trong đó: R: khoảng biến thiên xmax, xmin :lượng biến lớn nhất và nhỏ nhất của tiêu thức nghiên cứu. Khoảng biến thiên càng nhỏ thì tổng thể càng đồng đều, số trung bình mang tính đại diện cao, và ngược lại. Khoảng biến thiên phụ thuộc vào lượng biến lớn nhất và nhỏ nhất, do đó chỉ tiêu này không dùng cho được bảng phân tổ mở. b.Độ lệch tuyệt đối bình quân: là số trung bình cộng của các độ lệch tuyệt đối giữa các lượng biến và trị số trung bình cộng của các lượng biến đó. Công thức: ̅ = ∑| ̅| ̅ = ∑ ∗| ̅| ∑ Trong đó: ̅: độ lêch tuyệt đối bình quân [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 42 ̅: số bình quân cộng của các lượng biến xi | |: ký hiệu biểu hiện các trị tuyệt đối Dựa vào độ lêch tuyệt đối bình quân tính được ta cũng có kết luận như các chỉ tiêu trên. Độ lệch tuyệt đối bình quân càng nhỏ thì tổng thể càng đồng đều, do đó tính địa biểu của só trung bình càng cao. Độ lêch tuyệt đối có ưu điểm hơn khoảng biến thiên vì nó xét đến tất cả các lượng biến trong tổng thể. Tuy nhiên, độ lệch tuyệt đối bình quân cũng có hạn chế nhất định, độ lệch tuyệt đối bình quân chỉ mới xét đến dấu cộng (biến động tăng) mà bỏ qua sự khác nhau về dấu âm (biến động giảm), dẫn đến kết luận về sự biến thiên của tiêu thức nhiều lúc bị sai. c.Phương sai: là số trung bình cộng của bình phương các độ lệch giữa các lượng biến với vị trí trung bình cộng của các lượng biến đó. Phương sai đo mức độ phân tán của các biến lượng xung quanh số bình quân Công thức: = ∑( ) = ∑ ( ̅) ∑ d. Độ lệch tiêu chuẩn: là căn bậc hai của phương sai, tức là số bình quân toàn phương của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó. Công thức: σ = ∑( ) σ = ∑ ( ̅) ∑ e. Hế số biến thiên: là số tương đối (%) rút ra từ sự so sánh giữa độ lệch tuyệt đối bình quân (hoặc độ lệch chuẩn) với số bình quân cộng. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 43 Công thức: V = ̅ V: hệ số biến thiên ̅ : độ lệch tuyệt đối bình quân σ: độ lệch tiêu chuẩn ̅ : số bình quân cộng 3.6.3. Một số vấn đề tính toán và vận dụng phương sai Phương sai của tiêu thức thay phiên Quy tắc cộng phương sai. 3.7. Chỉ số 3.7.1. Khái niệm, đặc điểm và tác dụng của chỉ số trong thống kê 3.7.1.1. Khái niệm và phân loại chỉ số a.Khái niêm Chỉ số trong thống kê là số tương đối biểu hiện quan hệ so sánh giữa hai mức độ của một hiện tượng nghiên cứu. Chỉ số trong thống kê được xác định bằng cách thiết lập quan hệ so sánh giữa hai mức độ của hiện tượng ở hai thời gian hoặc không gian khác nhau nhằm nêu lên sự biến động qua thời gian hoặc sự khác biệt về không gian của một hiện tượng nghiên cứu. Ví dụ: doanh số của công ty năm 2003 co với năm 2002 bằng 110,7% (hay 1,107 lần) là chỉ số biểu hiện quan hệ so sánh giữa doanh số của công ty qua hai năm. b.Phân loại -Căn cứ vào đạc điểm thiết lập quan hệ so sánh, phân biệt: Chỉ số phát triển: biểu hiện quan hệ so sánh giữa hai mức độ của hiện tượng ở hai thời gian khác nhau. Ví dụ: doanh số của công ty A ở ví dụ trên là chỉ số phát triển phản ánh biến động doanh số của công ty qua hai năm. Chỉ số kế hoạch: biểu hiện quan hệ so sánh giữa các mức độ thực tế và kế hoạch của chỉ tiêu nghiên cứu bao gồm chỉ số nhiệm vụ kế hoạch và chỉ số thực hiện kế hoạch. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 44 Chỉ số không gian: biểu hiện quan hệ so sánh giữa hai mức độ của hiện tượng ở hai điề kiện không gian khác nhau. Ví dụ: doanh số của công ty A trong quý I năm 2004 ở thị trường miền Bắc so với thị trường miền Nam là 96,8%. -Căn cứ vào phạm vi tính toán Chỉ số đơn (cá thể): là chỉ số phản ánh biến động của từng phần tử, từng đơn vị trong tổng thể. Ví dụ: chỉ số giá bán lẻ một mặt hàng, chỉ số sản lượng của một loại sản phẩm, Chỉ số tổng hợp: là chỉ số phản ánh biến động chung của một nhóm đơn vị hoặc toàn bộ tổng thể nghiên cứu. Ví dụ: chỉ số giá tiêu dung CPI.. -Căn cứ vào tính chất của tiêu thức nghiên cứu: Chỉ số chỉ tiêu khối lượng: được thiết lập đối với chỉ tiêu khối lượng, là những chỉ tiêu biểu hiện quy mô, khối lượng của hiện tượng nghiên cứu. Ví dụ: chỉ số lượng hang tiêu thụ, chỉ số quy mô lao động, Chỉ số chỉ tiêu chất lượng: được thiết lập đối với chỉ tiêu chất lượng. Ví dụ: chỉ số giá, chỉ số giá thành, chỉ số năng suất lao động. 3.7.1.2. Đặc điểm của phương pháp chỉ số Xây dựng chỉ số đối với hiện tượng kinh tế phức tạp thì biểu hiện về lượng của các phần tử được chuyển về dạng chung để có thể cộng trực tiếp với nhau, dựa trên cơ sở mối quan hệ giữa yếu tố nghiên cứu với các yếu tố khác. Khi có nhiều yếu tố tham gia công thức tính chỉ số, việc phân tích biến động của một yếu tố được đặt trong điều kiện các yếu tố khác không đổi. 3.7.1.3. Tác dụng của chỉ số trong thống kê Biểu hiện biến động của hiện tượng nghiên cứu qua thời gian (chỉ số phát triển). Biểu hiện biến động của hiện tượng nghiên cứu trong điều kiệ không gian khác nhau (chỉ số không gian) Biểu hiện kế hoạch và phân tích tình hình thực hiện kế hoạch đối với các chỉ tiêu nghiên cứu. Phân tích vai trò và ảnh hưởng của từng nhân tố đối với biến động của hiện tượng kinh tế phức tạp được cấu thành từ nhiều nhân tố. Thực chất đây cũng là phương pháp phân tích mối liên hệ, nhằm nêu lên nguyên nhân quyết định sự biến động của hiện tượng phức tạp và tính toán cụ thể mức độ ảnh hưởng của mỗi nguyên nhân này. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 45 3.7.2. CHỈ SỐ PHÁT TRIỂN 3.7.2.1.Chỉ số đơn (cá thể) Chỉ số đơn giá: biểu hiện quan hệ so sánh giữa mức giá của từng mặt hang ở hai thời gian. Công thức: = Trong đó; ip: chỉ số đơn giá p1: giá bán lẻ của mặt hang kỳ nghiên cứu p0: giá bán lẻ mặt hàng kỳ gốc. chỉ số đơn phản ánh biến động giá bán của từng mặt hang ở kỳ nghiên cứu so với kỳ gốc. Chỉ số đơn lượng tiêu thụ: biể hiện quan hệ so sánh giữa khối lượng tiêu thụ của từng mặt hàng ở hai thời gian. Công thức: Trong đó: iq: chỉ số đơn lượng tiêu thụ q1: khối lượng tiêu thụ của mặt hàng kỳ nghiên cứu q0: khối lượng tiêu thụ của mặt hàng kỳ gốc. 3.7.2.2.Chỉ số tổng hợp a.Chỉ số tổng hợp giá Chỉ số tổng hợp giá biểu hiện quan hệ so sánh giữa giá bán của một nhóm hay toàn bộ các mặt hàng kỳ nghiên cứu với kỳ gốc và qua đó phản ánh biến động chung giá bán các mặt hàng. Công thức: ∑ ∑ Trong đó: Ip: chỉ số tổng hợp giá cả [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 46 q: lượng tiêu thụ mỗi mặt hàng p1 và p0: giá bán mỗi mặt hàng kỳ nghiên cứu và kỳ gốc Chỉ số tổng hợp giá Laspeyres: là chỉ số tổng hợp giá cả với quyền số là lượng tiêu thụ của mỗi mặt hàng ở kỳ gốc. Công thức: ∑ ∑ = ∑ ∑ Đặt d0 = ∑ Thì chỉ số tổng hợp giá được xác định như sau; = ∑ Chỉ số tổng hợp giá cả Passche: là chỉ số tổng hợp giá cả với quyền số là khối lượng tiêu thụ mỗ mặt hàng kỳ nghiê cứu. Công thức: ∑ ∑ = ∑ ∑ Đặt d1 = = ∑ Thì chỉ số tổng hợp Passche có dạng: = ∑ Chỉ số tổng hợp giá cả Fisher: phản ánh biến động chung giá bán các mặt hàng dựa trên cơ sở san bằng chênh lệch giữa các chỉ số Laspeyres và Passche theo công thức bình quân nhân Công thức: [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 47 = ∑ ∑ ∗ ∑ ∑ b. Chỉ số tổng hợp lượng hàng tiêu thụ Chỉ số tổng hợp lượng hàng tiêu thụ biểu hiện quan hệ so sánh giữa khối lượng tiêu thụ của một nhóm hay toàn bộ các mặt hàng thuộc phạm vi nghiên cứu giữa hai thời gian và qua đó phản ánh biến động chung về khối luwongj tiêu thụ của các mặt hàng. Công thức: ∑ ∑ Trong đó: Iq: chỉ số tổng hợp lượng hàng tiêu thụ q1 và q0: lượng tiêu thụ mặt hàng kỳ nghiên cứu và kỳ gốc. p: giá bán của mỗi mặt hàng Chỉ số tổng hợp lượng hàng tiêu thụ Laspeyres Công thức: ∑ ∑ Chỉ số tổng hợp lượng hàng tiêu thụ Passche Công thức: ∑ ∑ Chỉ số tổng hợp lượng hàng tiêu thụ Fisher Công thức: = ∑ ∑ ∗ ∑ ∑ [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 48 c. Quyến số của chỉ số phát triển Quyền số của chỉ số là những đại lượng được giữ cố định trong công thức chỉ sô tổng hợp. Trong các công thức chỉ số tổng hợp, quyền số có hai tác dụng; -Làm cho các phần tử với đại lượng biểu hiện không thể trực tiếp cộng được với nhau được chuyển về cùng một đại lượng đồng nhất và có thể tổng hợp. -Biểu hiện vai trò và tầm quan trọng của mỗi phần tử hay bộ phận trong toàn bộ tổng thể. Lựa chọn nhân tố giữ vai trò quyền số: việc lựa chọn nhân tố làm quyền số phải căn cứ vào lý thuyết về mối quan hệ giữa các nhân tố và mục đích nghiên cứu. Xác định thời gian cho quyền số: quyền số của mỗi chỉ số tổng hợp có thể được chọn theo các kỳ khác nhau (kỳ gốc, kỳ báo cáo, kỳ kế hoạch)tùy thuộc vào mục đích nghiên cứu và điều kiện dữ liệu thực tế. Sử dụng quyền số với thời gian khác nhau thì ý nghĩa phân tích của chỉ số có những điểm khác nhau. 3.7.3. CHỈ SỐ KHÔNG GIAN Chỉ số không gian biểu hiện quan hệ so sánh của hiện tượng nghiên cứu ở các điều kiện không gian khác nhau. 3.7.3.1. Chỉ số đơn Khi so sánh theo không gian, chỉ số đơn phản ánh quan hệ so sánh về giá bán hay lượng hàng tiêu thụ của từng mặt hàng ở hai thị trường, khu vực Ví dụ: so sánh giữa hai thị trường A và B. Trên cơ sở xác định mức giá đại diện và lượng tiêu thụ của từng mặt hàng ở các thị trường, các công thức so sánh giữa hai thị trường thể hiện như sau: Chỉ số đơn giá so sánh giữa hai thị trường: ⁄ = Chỉ số đơn lượng tiêu thu so sánh giữa hai thị trường: [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 49 ⁄ = 3.7.3.2. Chỉ số tổng hợp a.Chỉ số tổng hợp giá Chỉ số tổng hợp giá so sánh không gian sử dụng để so sánh giá bán một nhóm hay toàn bộ các mặt hàng ở hai điều kiện không gian khác nhau. Chỉ số tổng hợp : ⁄ = ∑ ∑ Với Q = qA + qB:tổng lượng tiêu thụ từng mặt hàng ở hai thị trường A và B. b.Chỉ số tổng hợp lượng hàng tiêu thụ Quyền số của chỉ số tổng hợp lượng hàng tiêu thụ có thể là giá cố định do nhà nước quy định hoặc giá trung bình của từng mặt hàng ở hai thị trường. Trường hợp sử dụng quyền số là giá cố định, song thức chỉ số tổng hợp lượng tiêu thụ so sánh giữa hai thị trường thể hiện như sau: ⁄ = ∑ ∑ Trong đó: pn là giá cố định của các mặt hàng. Trường hợp căn cứ vào giá bán ở cả hai thị trường để xác định giá bình quân của từng mặt hàng thì chì chỉ số tổng hợp lượng hàng tiêu thụ thể hiện như sau: ⁄ = ∑ ̅ ∑ ̅ Trong đó: giá trung bình của từng mặt hàngđược tính theo công thức trung bình cộng gia quyền với quyền số là lượng tiêu thu ở mỗi thị trường. ̅ = 3.7.4. CHỈ SỐ KẾ HOẠCH [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 50 Chỉ số kế hoạch biểu hiện nhiệm vụ kế hoạch hoặc tình hình thực hiện kế hoạch đối với từng chỉ tiêu. Nếu căn cứ vào sản lượng thực tế của doanh nghiệp ở các kỳ, có thể thiết lập các chỉ số sau; Chỉ số kế hoạch giá thành: = ∑ ∑ Chỉ số thực hiện kế hoạch giá thành: = ∑ ∑ Nếu căn cứ vào sản lượng của doanh nghiệp, có thể thiết lập các chỉ số sau: Chỉ số kế hoạch giá thành; = ∑ ∑ Chỉ số thực hiện kê hoạch giá thành: = ∑ ∑ 3.7.5. HỆ THỐNG CHỈ SỐ 3.7.5.1. Khái niệm và cấu thành hệ thống chỉ số Hệ thống chỉ số là một dãy các chỉ số có liên hệ với nhau, hợp thành một phương trình cân bằng. Hệ thống chỉ số thông thường được vận dụng để phân tích mối lien hệ giữa các chỉ tiêu trong quá trình biến động. Trong nghiên cứu kinh tế, nhiều chỉ tiêu tổng hợp có thể được cấu thành từ những nhân tố lien quan thể hiện dưới dạng các phương trình kinh tế và chính mối quan hệ đó là cơ sở để thiết lập các hệ thống chỉ số. Chỉ số sản lượng = Chỉ số năng suất lao động * Chỉ số quy mô lao động [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 51 Chỉ số doanh thu = chỉ số giá * chỉ số lượng hàng tiêu thụ * chỉ số lượng hàng tiêu thụ Như vậy, cấu thành của một hệ thống chỉ số thường bao gồm một chỉ số toàn bộ và các chỉ số nhân tố. Chỉ số toàn bộ phản ánh sự biến động của hiện tượng phức tạp (được biểu hiện qua một chỉ tiêu nào đó) do ảnh hưởng của các nhân tố cấu thành. Chỉ số nhân tố phản ánh ảnh hưởng sự biến động của từng nhân tố đối với sự biến động của hiện tượng phức tạp. 3.7.5.2.Tác dụng của hệ thống chỉ sô Trong phân tích thống kê, hệ thống chỉ số vận dụng đối với các chỉ tiêu có mối quan hệ với nhau và có các tác dụng sau; Xác định vai trò và mức độ ảnh hưởng biến động của các nhân tố đối với sự biến động của hiện tượng được cấu thành từ nhiều nhân tố. Dựa vào hệ thống chỉ số có thể nhanh chóng xác định được một số chỉ tiêu chưa biết khi biết các chỉ số khác trong hệ thống. 3.7.5.3.Phương pháp xây dựng hệ thống chỉ số a.Phương pháp liên hoàn Phương pháp này dựa trên cơ sở lý luận là các nhân tố cấu thánh một hiện tượng phức tạp đều cùng biến động, do đó để nghiên cứu ảnh hưởng của từng nhân tố phải giả định các nhân tố lần lượt biến động. Thứ tự phân tích của các nhân tố trong hệ thống chỉ số được xác định chủ yếu thông qua việc phân biệt các nhân tố mang tính chất lượng hay số lượng. Trên cơ sở xác định các nhân tố, hệ thống chỉ số theo phương pháp lien hoàn mang những đặc điểm sau: -Một chỉ tiêu tổng hợp của hiện tượng phức tạp có bao nhiêu nhân tố thì hệ thống chỉ số có bấy nhiêu chỉ số nhân tố. Mỗi nhân tố là cơ sở để hình thành 1 chỉ số nhân tố. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 52 -Trong hệ thống chỉ số, chỉ số toàn bộ bằng tích của các chỉ số nhân tố và mẫu số của chỉ số nhân tố đứng trước giống với tử số của chỉ số nhân tố đứng sau. DO đó, sự kết hợp của các chỉ số nhân tố hình thành một dãy các chỉ số lien tục, khép kin và đảm bảo quan hệ cân bằng. -Chênh lệnh tuyệt đối giữa tử số và mẫu số của chỉ số toàn bộ bằng tổng các chênh lệch tuyệt đối giữa tử số và mẫu số của các chỉ số nhân tố. Theo những đặc điểm trên, việc thiết lập một hệ thống chỉ số theo phương pháp liên hoàn được thực hiện theo các bước sau: -Phân tích chỉ tiêu nghiên cứu ra các nhân tố cấu thành, đồng thời sắp xếp các nhân tố theo thứ tự tính chất lượng giảm dần và tính số lượng tăng dần. -Viết chỉ số toàn bộ và chỉ số cho các nhân tố. Trong đó, đối với chỉ số nhân tố chất lượng thông thường sử dụng quyền số là nhân tố số lượng ở kỳ nghiên cứu và với chỉ số nhân tố số lượng sử dụng quyền số là nhân tố chất lượng kỳ gốc. Ví dụ: phân tích tổng chi phí nguyên vật liệu cho một nhóm sản phẩm: = ∑ ∑ = ∑ ` ∑ ∗ ∑ ∑ ∗ ∑ ∑ Biến động tuyệt đối ∑ - ∑ = ( ` -Σ ) + (∑ − ∑ ) + ( - Σ) b. Phương pháp biểu hiện ảnh hưởng biến động riêng biệt Phương pháp này dựa trên qua điểm cho rằng tất cả các nhân tố câu thành nên hiện tượng nghiên cứu có vai trò ngang nhau và cùng biến động. Do đó, tất cả các chỉ số nhân tố đều được xây dựng theo một nguyên tắc là thời kỳ quyền số của tất cả các chỉ số nhân tố phải giống nhau và được chọn là kỳ gốc để soa cho mỗi nhân tố biểu hiện được ảnh hưởng biến động riêng của nhân tố. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 53 Ví tất cả các nhân tố đều có quyền số là kỳ gốc, nên tích của các chỉ số này không bằng chỉ số toàn bộ. Để đảm bảo quan hệ cân bằng của hệ thống chỉ số, theo phương pháp này người ta thêm vào hệ thống chỉ số một đại lượng bổ sung gọi là đại lượng liên hệ. Chỉ số liên hệ biểu hiện ảnh hưởng chung của tất cả các nhân tố cùng biến động và cùng tác động lẫn nhau. Mô hình chung thiết lập hệ thống chỉ số theo phương pháp biểu hiện biến động riêng biệt được minh họa: Chỉ số toàn bộ = Chỉ số nhân tố 1 * Chỉ số nhân tố 2 * * Chỉ số nhân tố n * Các chỉ số liên hệ 3.7.5.4. Hệ thống chỉ số phân tích biến động chỉ tiêu bình quân và tổng lượng biến tiêu thức a.Hệ thống chỉ số phân tích biến động chỉ tiêu bình quân Chỉ tiêu bình quân chiuj tác động của hai nhân tố: tiêu thức nghiên cứu và kết cấu tổng thể.nếu sử dụng các ký hiệu: x1 và x0: lượng biến của tiêu thức kỳ nghiên cứu và kỳ gốc và số bình quân kỳ nghiên cứu và kỳ gốc f1 và f0 số đơn vị tổng thể kỳ nghiên cứu và kỳ gốc. Các chỉ số trong hệ thống phân tích chỉ tiêu bình quân được thể hiện như sau: Chỉ số cấu thành khả biến: biểu hiện quan hệ so sánh giữa mức độ của chỉ tiêu bình quân ở kỳ nghiên cứu và kỳ gốc. Công thức: ̅ = = ∑ ∑ ∑ ∑ Chỉ số cấu thành cố định: phản ánh biến động của chỉ tiêu bình quân do ảnh hưởng của tiêu thức nghiên cứu, trong điều kiện kết cấu tổng thể được coi cố định. Công thức [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 54 ̅ = = ∑ ∑ ∑ ∑ Chỉ số ảnh hưởng kết cấu: phản ánh biến động cảu chỉ tiêu bình quân do ảnh hưởng biến động riêng rẽ kết cấu tổng thể. Chỉ số này được thiết lập với giả định các lượng biến tiêu thức không thay đổi. Công thức ̅ = = ∑ ∑ ∑ ∑ Các chỉ số trên hợp thành hệ thống chỉ số phân tích chỉ tiêu bình quân như sau: ∑ ∑ ∑ ∑ = ∑ ∑ ∑ ∑ * ∑ ∑ ∑ ∑ b. Hệ thống chỉ số phân tích biến động tổng lượng biến tiêu thức Hệ thống chỉ số biểu hiện theo công thức: = ∑ ∑ = ∑ ∑ ∗ ∑ ∑ [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 55 CHƯƠNG 4. THỐNG KÊ SUY LUẬN 4.1. Phân phối xác suất đại lượng ngẫu nhiên 4.1.1. Phân phối chuẩn W=(X1, X2, , Xn) Nếu các biến ngẫu nhiên X1, X2,, Xn độc lập và cùng phân phối theo quy luật chuẩn thì mọi tổ hợp tuyến tính của các biến ngẫu nhiên đó cũng phân phối theo quy luật chuẩn Thống kê trung bình mẫu là một tổ hợp tuyến tính của X1, X2, , Xn. do đó cũng tuân theo quy luật chuẩn với các tham số là: () = và () = Do đó: = = () = ()√ Phương sai: ∗ = ∑ ( − ) Suy ra ∗ = ∑ ( − ) = = ∗ = 1 ( − ) =( − ) ) Khi đó thống kê χ2 sẽ phân phối theo quy luật “Khi bình phương” với n bậc tự do χ2(n) = = (− 1) ~( − 1) Từ các kết quả thu được là: = ( − )√ ~ (0,1) Và = ( − 1) ~( − 1) = = − 1 = ( − )√ ∶ ( − 1) ( − 1) = ( − )√ ~ ( − 1) [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 56 4.1.2. Phân phối đại lượng ngẫu nhiên Mẫu ngẫu nhiên kích thước n khá lớn: W=(X1, X2,, Xn) = ( )√ và = ( )√ sẽ phân phối xấp xỉ chuẩn hóa N(0,1) khi n khá lớn Giả sử tổng thể nghiên cứu có thể xem như biến ngẫu nhiên phân phối theo quy luật không- một. từ tổng thể lập mẫu ngẫu nhiên kích thước n: W=(X1, X2,, Xn) Lúc đó tần suất mẫu f sẽ phân phối theo quy luật nhị thức với các tham số đặc trưng là: E(f)= p, V(f)= p(1-p)/n Với p là xác suất của tổng thể Nếu kích thước mẫu n lớn mà p lại nhỏ và ≈ (1 − ) thì tần suất mẫu sẽ phân phối theo quy luật Poisson với tham số là p Nếu kích thước mẫu n lớn mà p lại không nhỏ song thỏa mãn điều kiện: n>5 và √ < 0,3 thì tần suất sẽ phân phối xấp xỉ chuẩn với E(f)=p và V(f)=p(1-p)/n. do đó biến ngẫu nhiên: = () = ()√ () ~ (0,1) 4.2. Ước lượng khoảng tin cậy 4.2.1. Khái niệm 4.2.2. Ươc lượng trung bình tổng thể Trường hợp đã biết phương sai σ2 của biến ngẫu nhiên gốc X trong tổng thể = = − () = ( − )√ Vì vậy với độ tin cậy 1-α có thể tìm được các giá trị α1 và α2 sao cho α1 + α2 = α và tìm được giá trị tới hạn và tương ứng sao cho thỏa mãn điều kiện: ( ) = Từ đó: ( < < ) = 1 − ( + ) = 1 − Vì có tính chất đối xứng nên: [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 57 − √ < < + √ = 1 − Với độ tin cậy 1-α, tham số μ của biến ngẫu nhiên gốc X sẽ nằm trong khoảng ( − √ , + √ ) Khoảng tin cậy đối xứng: α1 = α2= α/2 ( − √ /, + √ /) ℇ là độ chính xác của ước lượng, phản ánh mức độ sai lệch của trung bình mẫu so với trung bình tổng thể xác suất (1-α) cho trước. ℇ = √ / Khoảng tin cậy tối thiểu (bên phải): α1 = 0 và α2= α thì = = +∞ do đó khoảng tin cậy của μ là: ( − √ ,+∞ ) Khoảng tin cậy tối đa (bên trái): α2 =0 và α1=α thì = = +∞ do đó khoảng tin cậy của μ là: (−∞ ; + √ ) Độ dài khoảng tin cậy = 2ℇ = √ / Do đó kích thước mẫu tối thiểu n sao cho với độ tin cậy bằng (1-α) cho trước, độ dài khoảng tin cậy không vượt quá giá trị I0 cho trước, công thức có dạng: ≥ 4 / ≥ ℇ / Chú ý: khi tăng kích thước mẫu n lên và giữ nguyên độ tin cậy (1-α) cho trước thì ℇ giảm đi tức là độ chính xác của ước lượng tăng lên. Khi tăng độ tin cậy mà giữ nguyên kích thước mẫu n thì giá trị tới hạn chuẩn cũng tăng lên do đó ℇ cũng tăng lên làm cho độ chính xác của ước lượng giảm đi. [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 58 VD: trọng lượng một loại sản phẩm là biến ngẫu nhiên phân phối theo quy luật chuẩn với độ lệch chuẩn là 1gam. Cân thử 25 sản phẩm thu được kết quả sau: Trọng lượng (gam) 18 19 20 21 Số Sp tương ứng 3 5 15 2 Với độ tin cậy 95% hãy tìm khoảng tin cậy đối xứng? Giải: gọi X là trọng lượng sản phẩm X phân phối chuẩn với giả thiết σ = 1 Khoảng tin cậy là: ( − √ /, + √ /) Với độ tin cậy 95% => u0,025= 1,96 ̅ = 19,64 Vậy khoảng tin cậy là: (19,64 – 0,392; 19,64 + 0,392) hay (19,248; 20,032) VD2: trong VD1 nếu yêu cầu độ chính xác của ước lượng chỉ là 0,1 và giữ nguyên độ tin cậy 1- α= 0,95 thì phải điều tra một mẫu kích thước bằng bao nhiêu? Giải: với ℇ0= 0,1 ta có: ≥ ℇ / = 1 (0,1) (1,96) = 385 Vậy để tăng độ chính xác từ 0,392 lên 0,1 thì phải tăng mẫu từ 25 lên 385. Chưa biết phương sai σ2 của biến ngẫu nhiên gốc X trong tổng thể và kích thước mẫu <30 Chọn thống kê: = = ()√ với S là độ lệch chuẩn mẫu. Thống kê T phân phối theo quy luật Student bậc (n-1). Vì vậy với độ tin cậy 1-α có thể tìm được các giá trị α1 và α2 sao cho α1 + α2 = α và tìm được giá trị tới hạn và tương ứng sao cho thỏa mãn điều kiện: ( ( − 1)) = Từ đó: (( − 1) < < ( − 1)) = 1 − ( + ) = 1 − [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 59 Vì phân phối Student có tính chất ( − 1) = − ( − 1) nên: (− ( − 1) < < ( − 1)) = 1 − − √ ( − 1) < < + √ ( − 1)= 1 − Như vậy khoảng tin cậy của μ với độ tin cậy 1-α là: ( − √ ( − 1); + √ ( − 1)) Khoảng tin cậy đối xứng: ( − √ /( − 1); + √ /( − 1)) Khoảng tin cậy tối đa: ( − √ ( − 1); +∞ ) Khoảng tin cậy tối thiểu: (− ∞ ; + √ ( − 1)) Độ dài khoảng tin cậy = 2ℇ = √ /( − 1) Kích thước mẫu tối thiểu n sao cho với độ tin cậy bằng (1-α) cho trước, độ dài khoảng tin cậy không vượt quá I0 là: ≥ ℇ / () VD3: để xác định trọng lượng trung bình của các bao bột trong kho, cân ngẫu nhiên 15 bao và thu được ̅ = 39,8 , s2= 0,144. Tìm khoảng tin cậy đối xứng của trọng lượng trung bình các bao bột trong kho với yêu cầu độ tin cậy là 99%. Giả thiết trọng lượng bao bột là biến ngẫu nhiên phân phối chuẩn. Giải: Gọi X là trọng lượng bao bột, theo giả thiết X phân phối chuẩn nhưng chưa biết phương sai. Khoảng tin cậy là: − √ ( − 1); + √ ( − 1)) Với độ tin cậy 99% thì α/2 =0,005 ta có t0,005 (14)= 2,977 Với mẫu cụ thể ta tính được: ̅ = 39,8 , s2= 0,144 => s= 0,379 Vậy khoảng tin cậy của μ là: (39,8 − , √ 2,977;39,8 + , √ 2,977) hay (39,5023, 40,0977) [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 60 VD4: phỏng vấn 5 gia đình có 3 người về chi phí hàng tháng cho nhu yếu phẩm thu được số liệu: 150, 180, 200, 250, 300 nghìn đồng. Vậy phải phỏng vấn bao nhiêu gia đình cùng loại với độ tin cậy 95% sai số của việc ước lượng chi phí trung bình hàng tháng cho nhu yếu phẩm không vượt quá 30 nghìn đồng. giả thiết chi phí hàng tháng cho nhu yếu phẩm là biến ngẫu nhiên phân phối chuẩn. Giải: Gọi X là chi phí hàng tháng cho nhu yếu phẩm Từ mẫu ta có: ̅ = = 216 ℎì đ S2= (150-216)2+ (180-216)2+ (200-216)2+(250-216)2+ (300-216)2 = 3530 ℇ0= 30, t0,025 (4) = 2,776 Ta có: ≥ (2,776) = 31 hộ gia đình. Vậy phải phỏng vấn thêm 31-5 = 26 hộ gia đình. 4.2.3. Ươc lượng tỷ lệ tổng thể Trong tổng thể biến ngẫu nhiên gốc X phân phối theo một quy luật nào đó khác với quy luật chuẩn. để ước lượng giá trị m chưa biết ta có thể dùng thống kê: = = ( )√ nếu đã biết phương sai hoặc = = ( )√ nếu chưa biết phương sai. Giả sử tổng thể kích thước N có M phần tử mang dấu hiệu nghiên cứu. Nếu lấy ngẫu nhiên ra một phần tử và gọi X là số phần tử mang dấu hiệu nghiên cứu được lấy ra thì X là biến ngẫu nhiên tuân theo quy luật không- một: X 0 1 P 1-p P Trong đó p là xác suất để lấy ngẫu nhiên một phần tử thì được phần tử mang dấu hiệu nghiên cứu: p=M/N E(X)=p và V(X)=p(1-p)/n Nếu thỏa mãn điều kiện: n>5 và √ < 0,3 [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 61 Thì: = = () () = ()√ () ~ (0,1) Vì vậy với độ tin cậy 1-α có thể tìm được các giá trị α1 và α2 sao cho α1 + α2 = α và tìm được giá trị tới hạn / và / tương ứng sao cho thỏa mãn điều kiện: ( /) = Từ đó: (/ < < /) = 1 − (/2 + /2) = 1 − Vì / = − / nên: (− / < < ) = 1 − Ta có: (− / < ()√ () < ) hay ()√ () < / Bình phương hai vế và giải phương trình ta được: , = + 1 2 / ∓ / (1 − ) + 1 4 / + / Như vậy với độ tin cậy (1-α) khoảng tin cậy đối xứng của p là: (p1,p2) Nếu mẫu có kích thước n khá lớn ≥ 100 thì ta có thể chọn thống kê = = ()√ () ~(0,1) Vì vậy với độ tin cậy 1-α có thể tìm được các giá trị α1 và α2 sao cho α1 + α2 = α và tìm được giá trị tới hạn và tương ứng sao cho thỏa mãn điều kiện: ( ) = Từ đó: ( < < ) = 1 − ( + ) = 1 − Vì = − nên: − (1 − ) √ < < + (1 − ) √ = 1 − Như vậy với độ tin cậy (1-α) khoảng tin cậy p có dạng: [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 62 − (1 − ) √ ; + (1 − ) √ Khoảng tin cậy đối xứng: − (1 − ) √ /; + (1 − ) √ / Khoảng tin cậy tối thiểu (bên phải): − () √ ; +∞ Khoảng tin cậy tối đa (bên trái): −∞ ; + (1 − ) √ Độ dài khoảng tin cậy ngắn nhất trong trường hợp khoảng tin cậy đối xứng: = 2ℇ = 2(1 − ) √ / Kích thước mẫu tối thiểu n đảm bảo độ tin cậy (1-α) cho trước và độ dài khoảng tin cậy không vượt quá giá trị I0 là: ≥ (1 − ) ℇ / Trong đó f là tần suất kích thước mẫu sơ bộ kích thước ≥ 2 VD: kiểm tra ngẫu nhiên 400 sản phẩm do một máy sản xuất thấy có 20 phế phẩm. Với độ tin cậy 95% hãy ước lượng tỷ lệ phế phẩm tối đa của máy đó? Giải: gọi p là tỷ lệ phế phẩm của máy Khoảng tin cậy của p có dạng: −∞ ; + (1 − ) √ Mẫu cụ thể có f=20/400= 0,05 Với 1-α= 0,95 =>u0,05= 1,645 [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 63 Vậy khoảng tin cậy của p là: − ∞ ; + 0,05(1 − 0,05) √400 1,645 Hay p< 0,0679. Vậy tỷ lệ phế phẩm tối đa của máy là 6,79% 4.2.4. Ươc lượng phương sai tổng thể Giả sử tổng thể biến ngẫu nhiên gốc X phân tuân theo quy luật chuẩn N(μ, σ2) nhưng chưa biết phương sai. Để ước lượng phương sai từ tổng thể lập mẫu ngẫu nhiên kích thước n: W(X1, X2,, Xn) TH1: đã biết kỳ vọng toán μ Ta chọn thống kê = = ∗ ~() Vì vậy với độ tin cậy 1-α có thể tìm được các giá trị α1 và α2 sao cho α1 + α2 = α và tìm được giá trị tới hạn () và () tương ứng sao cho thỏa mãn điều kiện: ( ) = Từ đó: (() < < () ) = 1 − ( + ) = 1 − ∗ () < < ∗ () = 1 − Như vậy với độ tin cậy (1-α) khoảng tin cậy của σ2 có dạng: ( ∗ () < < ∗ () ) Nếu α1=α2=α/2 khoảng tin cậy có dạng: ( ∗ () ; ∗ ()/ ) Nếu α1=0, α2= α ta có khảng tin cậy bên phải: ∗ () < < +∞ Nếu α1=α, α2= 0 ta có khảng tin cậy bên trái: − ∞ < < ∗ () [Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 64 TH2: Chưa biết kỳ vọng toán μ của biến ngẫu nhiên gốc X trong tổng thể. Lúc đó ta chọn thống kê: = = ( − 1) ~( − 1) Vì vậy với độ tin cậy 1-α có thể tìm được các giá trị α1 và α2 sao cho α1 + α2 = α và tìm được giá trị tới hạn () và () tương ứng sao cho thỏa mãn điều kiện: ( < ()

Các file đính kèm theo tài liệu này:

  • pdf07200066_1642_1982821.pdf