Tài liệu Đề cương bài giảng Xác suất và thống kê trong kinh tế hoc: TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT HƯNG YÊN
KHOA KINH TẾ
ĐỀ CƯƠNG BÀI GIẢNG
XÁC SUẤT VÀ THỐNG KÊ TRONG KINH TẾ HOC
(Tài liệu lưu hành nội bộ)
Hưng Yên
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 1
MỤC LỤC Trang
CHƯƠNG 1. GIỚI THIỆU MÔN HỌC.3
1.1. Định nghĩa, chức năng của thống kê trong quản lý nền kinh tế thị trường....3
1.2. Các phương pháp thống kê kinh tế..3
1.3. Những khái niệm thường dùng trong thống kê...4
1.4. Thang đo trong thống kê.6
1.5. Thu thập thông tin trong thống kê...7
CHƯƠNG 2. XÁC SUẤT VÀ PHÂN PHỐI XÁC SUẤT..11
2.1. Biến cố ngẫu nhiên và xác suất.11
2.2. Biến ngẫu nhiên và quy luật phân phối xác suất...16
CHƯƠNG 3. THỐNG KÊ MÔ TẢ..20
3.1.Tổng hợp và trình bày số liệu thống kê..20
3.2. Phân tổ số liệu thống kê....28
3.3. Đồ thị mô tả tập thống kê..32
3.4. Chỉ số đặc trưng của tập thống kê.34
3.5. Phương pháp chỉ số...37
CHƯƠNG 4. THỐNG KÊ SUY LUẬN..55
4.1. Phân phối xác suất đại lượng ngẫu nhiên..55
4.2. Ước lượng...
141 trang |
Chia sẻ: putihuynh11 | Lượt xem: 443 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Đề cương bài giảng Xác suất và thống kê trong kinh tế hoc, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT HƯNG YÊN
KHOA KINH TẾ
ĐỀ CƯƠNG BÀI GIẢNG
XÁC SUẤT VÀ THỐNG KÊ TRONG KINH TẾ HOC
(Tài liệu lưu hành nội bộ)
Hưng Yên
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 1
MỤC LỤC Trang
CHƯƠNG 1. GIỚI THIỆU MÔN HỌC.3
1.1. Định nghĩa, chức năng của thống kê trong quản lý nền kinh tế thị trường....3
1.2. Các phương pháp thống kê kinh tế..3
1.3. Những khái niệm thường dùng trong thống kê...4
1.4. Thang đo trong thống kê.6
1.5. Thu thập thông tin trong thống kê...7
CHƯƠNG 2. XÁC SUẤT VÀ PHÂN PHỐI XÁC SUẤT..11
2.1. Biến cố ngẫu nhiên và xác suất.11
2.2. Biến ngẫu nhiên và quy luật phân phối xác suất...16
CHƯƠNG 3. THỐNG KÊ MÔ TẢ..20
3.1.Tổng hợp và trình bày số liệu thống kê..20
3.2. Phân tổ số liệu thống kê....28
3.3. Đồ thị mô tả tập thống kê..32
3.4. Chỉ số đặc trưng của tập thống kê.34
3.5. Phương pháp chỉ số...37
CHƯƠNG 4. THỐNG KÊ SUY LUẬN..55
4.1. Phân phối xác suất đại lượng ngẫu nhiên..55
4.2. Ước lượng khoảng tin cậy.56
4.3. Kiểm định giả thiết....64
4.4.Tương quan và hồi quy tuyến tính66
4.5. Dãy số thời gian.74
CHƯƠNG 5. THỐNG KÊ KẾT QUẢ HOẠT ĐỘNG SẢN XUẤT, KINH DOANH CỦA ĐƠN
VỊ CƠ SỞ.78
5.1. Một số khái niệm cơ bản về kết quả sản xuất, kinh doanh..78
5.2. Hệ thống chỉ tiêu đo lường kết quả hoạt động sản xuất, kinh doanh của đơn vị cơ sở.80
5.3. Thống kê chất lượng sản phẩm...87
5.4. Dự báo thống kê trong các đơn vị sản xuất, kinh doanh.89
5.5. Phương pháp phân tích thống kê kết quả sản xuất, kinh doanh của đơn vị cơ sở.............90
CHƯƠNG 6. THỐNG KÊ KẾT QUẢ HOẠT ĐỘNG KINH DOANH DỊCH VỤ CỦA ĐƠN
VỊ CƠ SỞ.92
6.1. Một số đặc điểm của hoạt động dịch vụ........................................................................92
6.2. Thống kê kết quả hoạt động dịch vụ thương mại của các đơn vị cơ sở sản xuất vật
chất..............................................................................................................................................92
6.3. Thống kê kết quả hoạt động dịch vụ vận tải của các đơn vị cơ sở hoạt động vật chất..........95
6.4. Thống kê kết quả sửa chữa và xây lắp các công trình kiến trúc......................................96
CHƯƠNG 7. THỐNG KÊ GIÁ THÀNH SẢN XUẤT VÀ HIỆU QUẢ SẢN XUẤT KINH
DOANH CỦA ĐƠN VỊ CƠ SỞ...98
7.1. Khái niệm, ý nghĩa của các loại chỉ tiêu giá thành và tác dụng của nó đối với công tác
quản lý đơn vị cơ sở...........................................................................................................98
7.2. Nội dung kinh tế của chỉ tiêu giá thành........................................................................99
7.3. Phương pháp phân tích tài liệu thống kê giá thành...100
7.4. Thống kê hiệu quả sản xuất, kinh doanh của đơn vị.104
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 2
7.5. Thống kê ảnh hưởng của sản xuất đến môi trường của các đơn vị cơ sở.107
CHƯƠNG 8. THỐNG KÊ LAO ĐỘNG CỦA ĐƠN VỊ CƠ SỞ.109
8.1. Thống kê số lượng và sự biến động lao động của đơn vị cơ sở109
8.2. Thống kê tình hình sử dụng số lượng và thời gian lao động của đơn vị cơ sở.112
8.3. Thống kê năng suất lao động trong đơn vị cơ sở..114
8.4. Thống kê thu nhập của lao động trong đơn vị cơ sở.119
CHƯƠNG 9. THỐNG KÊ TÀI SẢN CỐ ĐỊNH VÀ ĐẦU TƯ DÀI HẠN CỦA ĐƠN VỊ CƠ
SỞ...126
9.1. Thống kê tài sản cố định của đơn vị cơ sở126
9.2. Thống kê đầu tư dài hạn của đơn vị cơ sở.130
CHƯƠNG 10. THỐNG KÊ VỐN VÀ HOẠT ĐỘNG TÀI CHÍNH CỦA ĐƠN VỊ CƠ
SỞ...133
10.1. Thống kê vốn đầu tư của đơn vị cơ sở..133
10.2. Phân loại vốn đầutư của đơn vị cơ sở....135
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 3
CHƯƠNG 1. GIỚI THIỆU MÔN HỌC
1.1. Định nghĩa, chức năng của thống kê trong quản lý nền kinh tế thị trường
Thống kê là một hệ thống các phương pháp bao gồm thu thập, tổng hợp, trình bày số
liệu, tính toán các đặc trưng của đối tượng nghiên cứu nhằm phục vụ cho quá trình phân
tích, dự đoán và ra quyết định.
Chức năng của thống kê Thống kê thường được phân thành 2 lĩnh vực:
- Thống kê mô tả (Descriptive statistics): là các phương pháp có liên quan đến việc thu
thập số liệu, tóm tắt, trình bày, tính toán và mô tả các đặc trưng khác nhau để phản ánh
một cách tổng quát đối tượng nghiên cứu.
- Thống kê suy luận (Inferential statistics): là bao gồm các phương pháp ước lượng các
đặc trưng của tổng thể, phân tích mối liên hệ giữa các hiện tượng nghiên cứu, dự đoán
hoặc ra quyết định trên cơ sở thông tin thu thập từ kết quả quan sát mẫu.
1.2. Các phương pháp thống kê kinh tế
- Thu thập và xử lý số liệu: Số liệu thu thập thường rất nhiều và hỗn độn, các dữ liệu đó
chưa đáp ứng cho quá trình nghiên cứu. Để có hình ảnh tổng quát về tổng thể nghiên
cứu, số liệu thu thập phải được xử lý tổng hợp, trình bày, tính toán các số đo; kết quả có
được sẽ giúp khái quát được đặc trưng của tổng thể.
- Nghiên cứu các hiện tượng trong hoàn cảnh không chắc chắn: Trong thực tế, có nhiều
hiện tượng mà thông tin liên quan đến đối tượng nghiên cứu không đầy đủ mặc dù người
nghiên cứu đã có sự cố gắng. Ví dụ như nghiên cứu về nhu cầu của thị trường về một
sản phẩm ở mức độ nào, tình trạng của nền kinh tế ra sao, để nắm được các thông tin này
một cách rõ ràng quả là một điều không chắc chắn.
- Điều tra chọn mẫu: Trong một số trường hợp để nghiên cứu toàn bộ tất cả các quan sát
của tổng thể là một điều không hiệu quả, xét cả về tính kinh tế (chi phí, thời gian) và tính
kịp thời, hoặc không thực hiện được. Chính điều này đã đặt ra cho thống kê xây dựng
các phương pháp chỉ cần nghiên cứu một bộ phận của tổng thể mà có thể suy luận cho
hiện tượng tổng quát mà vẫn đảm bảo độ tin cậy cho phép, đó là phương pháp điều tra
chọn mẫu.
- Nghiên cứu mối liên hệ giữa các hiện tượng: Giữa các hiện tượng nghiên cứu thường
có mối liên hệ với nhau. Ví dụ như mối liên hệ giữa chi tiêu và thu nhập; mối liên hệ
giữa lượng vốn vay và các yếu tố tác động đến lượng vốn vay như chi tiêu, thu nhập,
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 4
trình độ học vấn; mối liên hệ giữa tốc độ phát triển với tốc độ phát triển của các ngành,
lạm phát, tốc độ phát triển dân số,Sự hiểu biết về mối liên hệ giữa các hiện tượng rất
có ý nghĩa, phục vụ cho quá trình dự đoán
- Dự đoán: Dự đoán là một công việc cần thiết trong tất cả các lĩnh vực hoạt động. Trong
hoạt động dự đoán người ta có thể chia ra thành nhiều loại:
(1). Dự đoán dựa vào định lượng và dựa vào định tính. Tuy nhiên, trong thống kê chúng
ta chủ yếu xem xét về mặt định lượng với mục đích cung cấp cho những nhà quản lý có
cái nhìn mang tính khoa học hơn và cụ thể hơn trước khi ra quyết định phù hợp.
(2). Dự đoán dựa vào nội suy và dựa vào ngoại suy.
- Dự đoán nội suy là chúng ta dựa vào bản chất của hiện tượng để suy luận, ví dụ như
chúng ta xem xét một liên hệ giữa lượng sản phẩm sản xuất ra phụ thuộc các yếu tố đầu
vào như vốn, lao động và trình độ khoa học kỹ thuật.
- Dự đoán dựa vào ngoại suy là chúng ta chỉ quan sát sự biến động của hiện tượng trong
thực tế, tổng hợp lại thành qui luật và sử dụng qui luật này để suy luận, dự đoán sự phát
triển của hiện tượng. Ví dụ như để đánh giá kết quả hoạt động của một công ty người ta
xem xét kết quả hoạt động kinh doanh của họ qua nhiều năm. Ngoài ra, người ta còn có
thể phân chia dự báo thống kê ra thành nhiều loại khác.
1.3. Những khái niệm thường dùng trong thống kê
1.3.1. Tổng thể thống kê
Tổng thể thống kê là tập hợp các đơn vị cá biệt về sự vật, hiện tượng trên cơ sở một
đặc điểm chung nào đó cần được quan sát, phân tích mặt lượng của chúng. Các đơn vị,
phần tử tạo nên hiện tượng được gọi là các đơn vị tổng thể.
Như vậy, muốn xác định được tổng thể thống kê ta cần xác định được tất cả các đơn vị
của tổng thể đó.
Dựa vào việc xác định tổng thể, tổng thể chia làm hai loại:
Tổng thể bộc lộ: Các đơn vị của tổng thể được biểu hiện một cách rõ ràng, dễ xác định.
Tổng thể tiềm ẩn: Các đơn vị của nó không được nhận diện một cách trực tiếp, ranh
giới của nó không rõ ràng.
Theo mục đích nghiên cứu:
Tổng thể đồng chất: những đơn vị có cùng chung những đặc điểm chủ yếu có liên quan
đến mục đích nghiên cứu.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 5
Tổng thể không đồng chất: bao gồm những đơn vị khác nhau về loại hình, khác nhau
về những đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu.
1.3.2. Mẫu
Mẫu (Samples) là một bộ phận của tổng thể, đảm bảo được tính đại diện và được chọn ra
để quan sát và dùng để suy diễn cho toàn bộ tổng thể. Như vậy, tất cả các phần tử của
mẫu phải thuộc tổng thể, nhưng ngược lại các phần tử của tổng thể thì chưa chắc thuộc
mẫu. Điều này tưởng chừng là đơn giản, tuy nhiên trong một số trường hợp việc xác
định mẫu cũng có thể dẫn đến nhầm lẫn, đặc biệt là trong trường hợp tổng thể ta nghiên
cứu là tổng thể tiềm ẩn. Ngoài ra, chọn mẫu như thế nào để làm cơ sở suy diễn cho tổng
thể, tức là mẫu phải mang tính đại diện cho tổng thể. Điều này thực sự không dễ dàng, ta
chỉ cố gắng hạn chế tối đa sự sai biệt này mà thôi chứ không thể khắc phục được hoàn
toàn.
1.3.3. Quan sát
Quan sát (Observations) Là mỗi đơn vị của mẫu; trong một số tài liệu còn được gọi là
quan trắc.
1.3.4. Tiêu thức thống kê
Tiêu thức thống kê là một khái niệm chỉ đặc điểm của các đơn vị tổng thể được chọn ra
để nghiên cứu.
Tiêu thức thống kê được chia thành hai loại:
Tiêu thức thuộc tính: là loại tiêu thức không được biểu hiện trực tiếp bằng con số, mà
các biểu hiện của nó được dùng để phản ánh loại hoặc tính chất của các đơn vị tổng thể.
Tiêu thức số lượng: là loại tiêu thức có biểu hiện trực tiếp bằng con số. Đấy là những
con số phản ánh đặc trưng có thể cân, đo, đong, đếm được của từng đơn vị tổng thể.
Tiêu thức số lượng được chia làm 2 loại:
Loại rời rạc: là loại các giá trị có thể của nó là hữu hạn hay vô hạn và có thể đếm đ c.
Loại liên tục: là loại mà giá trị của nó có thể nhận bất kỳ một trị số nào đó trong
một khoảng nào đó.
1.3.5. Chỉ tiêu thống kê
Chỉ tiêu thống kê là những con số chỉ mặt lượng gắn với mặt chất của hiện số lớn trong
điều kiện thời gian, không gian cụ thể.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 6
Chỉ tiêu thống kê có khái niệm và mức độ. Khái niệm có tên gọi, điều kiện thời gian và
không gian. Mức độ phản ánh quy mô hoặc cường độ của hiện tượng với các loại thang
đo khác nhau.
1.3.6. Tham số tổng thể
Là giá trị quan sát được của tổng thể và dùng để mô tả đặc trưng của hiện tượng nghiên
cứu. Trong xác suất thống kê toán chúng ta đã biết các tham số tổng thể như trung bình
tổng thể (µ), tỷ lệ tổng thể (p), phương sai tổng thể (σ2 ). Ngoài ra, trong quá trình
nghiên cứu sâu môn thống kê chúng ta còn có thêm nhiều tham số tổng thể nữa như:
tương quan tổng thể (ρ), hồi qui tuyến tính tổng thể,
1.3.7. Tham số mẫu
Tham số mẫu là giá trị tính toán được của một mẫu và dùng để suy rộng cho tham số
tổng thể. Đó là cách giải thích mang tính chất thông thường, còn đối với xác suất thống
kê thì tham số mẫu là ước lượng điểm của tham số tổng thể, trong trường hợp chúng ta
chưa biết tham số tổng thể chúng ta có thể sử dụng tham số mẫu để ước lượng tham số
tổng thể. Chúng ta có thể liệt kê vài tham số mẫu như sau: trung bình mẫu ( ̅), tỷ lệ mẫu
( ̂ ), phương sai mẫu (S2 ), hệ số tương quan mẫu (r),
1.4. Thang đo trong thống kê
1.4.1. Thang đo định danh
Thang đo định danh là loại thang đo sử dụng cho các tiêu thức thuộc tính, mà các biểu
hiện của dữ liệu không có sự hơn kém, khác biệt về thứ bậc, không theo một trật tự xác
định nào.
1.4.2. Thang đo thứ bậc
Loại thang đo này cũng sử dụng cho các tiêu thức thuộc tính, mà các biểu hiện
của dữ liệu có sự hơn kém, khác biệt về thứ bậc.
1.4.3. Thang đo khoảng
Thang đo khoảng là thang đo thứ bậc có các khoảng cách đều nhau nhưng không có
điểm gốc là 0.
1.4.4. Thang đo tỷ lệ
Thang đo tỷ lệ là thang đo khoảng với giá trị 0 tuyệt đối (một trị số thật) được coi như
điểm xuất phát của độ dài đo lường trên thang.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 7
Đây là loại thang đo định lượng chặt chẽ nhất
1.5. Thu thập thông tin trong thống kê
1.5.1. Xác định nội dung thông tin
Nói chung, tuỳ thuộc vào mục đích nghiên cứu để xác định những nội dung thông tin
cần thu thập. Thông tin sử dụng cho quá trình nghiên cứu phải đảm bảo các yêu cầu
cơ bản sau:
Thích đáng: Số liệu thu thập phải phù hợp, đáp ứng được mục đích nghiên cứu. Số
liệu đáp ứng được mục tiêu nghiên cứu có tính chất trực tiếp hoặc gián tiếp. Đối với
những thông tin dễ tiếp cận thường thì ta sử dụng số liệu trực tiếp, ví dụ muốn biết
được nhu cầu của khách hàng chúng ta có thể hỏi trực tiếp khách hàng. Tuy nhiên, một
số nội dung nghiên cứu mang tính chất nhạy cảm hoặc khó thu thập thì chúng ta có thể
thu nhập những số liên gián tiếp có liên quan, ví dụ để thu thập thu nhập của cá nhân
chúng ta có thể thu thập những nội dung có liên quan như nghề nghiệp, đơn vị công
tác, chức vụ, nhà ở, phương tiện đi lại...
Chính xác: Các thông tin trong quá trình nghiên cứu phải có giá trị, đáng tin cậy để các
phân tích kết luận phản ánh được đặc điểm bản chất của hiện tượng.
Kịp thời: Yêu cầu thông tin không những đáp ứng yêu cầu phù hợp, chính xác mà giá
trị thông tin còn thể hiện ở chỗ nó có phục vụ kịp thời cho công tác quản lý và tiến
trình ra các quyết định hay không.
Khách quan: Tức là số liệu thu thập được không bị ảnh hưởng vào tính chủ quan của
người thu thập cũng như người cung cấp số liệu và ngay cả trong thiết kế bảng câu hỏi.
Yếu tố khách quan tưởng chừng thực hiện rất dễ dàng nhưng thực tế thì chúng ta khó
có thể khắc phục vấn đề này một cách trọn vẹn, chúng ta chỉ có thể hạn chế yếu tố chủ
quan một cách tối đa. Ví dụ chỉ cần một hành động đơn giản là tiếp cận với đáp viên là
ít nhiều cũng ảnh hưởng đến kết quả trả lời của họ.
1.5.2. Nguồn số liệu
1.5.2.1. Dữ liệu thứ cấp (Secondary data)
Dữ liệu thứ cấp là các thông tin đã có sẵn và đã qua tổng hợp, xử lý. Loại dữ kiện này
có thể thu thập từ các nguồn sau:
Số liệu nội bộ: là loại số liệu đã được ghi chép cập nhật trong đơn vị hoặc được thu thập
từ các cuộc điều tra trước đây.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 8
(1) Số liệu từ các ấn phẩm của nhà nước: Các dữ liệu do các cơ quan thống kê
nhà nước phát hành định kỳ như niên giám thống kê, các thông tin cập nhật hàng năm
về tình hình dân số lao động, kết quả sản xuất của các ngành trong nền kinh tế, số liệu
về văn hoá xã hội.
(2) Báo, tạp chí chuyên ngành: Các báo và tạp chí đề cập đến vấn đề có tính
chất chuyên ngành như tạp chí thống kê, giá cả thị trường,...
(3) Thông tin của các tổ chức, hiệp hội nghề nghiệp: Viên nghiên cứu kinh tế,
phòng thương mại
(4) Các công ty chuyên tổ chức thu thập thông tin, nghiên cứu và cung cấp
thông tin theo yêu cầu.
Số liệu thứ cấp có ưu điểm là có thể chia sẻ chi phí, do đó nó có tính kinh tế hơn, số
liệu được cung cấp kịp thời hơn. Tuy nhiên, dữ liệu thứ cấp thường là các thông tin cơ
bản, số liệu đã được tổng hợp đã qua xử lý cho nên không đầy đủ hoặc không phù hợp
cho quá trình nghiên cứu. Số liệu thứ cấp thường ít được sử dụng để dự báo trong
thống kê, số liệu này thường được sử dụng trong trình bày tổng quan nội dung nghiên
cứu, là cơ sở để phát hiện ra vấn đề nghiên cứu. Ngoài ra, số liệu thứ cấp còn được sử
dụng để đối chiếu lại kết quả nghiên cứu để nhằm kiểm tra lại tính đúng đắn hoặc phát
hiện ra những vấn đề mới để có hướng nghiên cứu tiếp.
1.5.2.2. Dữ liệu sơ cấp (Primary data)
a) Điều tra toàn bộ: Là tiến hành thu thập thông tin trên tất cả các đơn vị thuộc
tổng thể nghiên cứu.
Ưu điểm của điều tra toàn bộ là thu thập được thông tin về tất cả các đơn vị tổng thể.
Tuy nhiên, loại điều tra này thường gặp phải một số trở ngại sau:
Số lượng đơn vị thuộc tổng thể chung thường rất lớn cho nên tiến hành điều tra toàn bộ
mất nhiều thời gian và tốn kém.
Trong một số trường hợp do thời gian kéo dài dẫn đến số liệu kém chính xác do hiện
tượng tự biến động qua thời gian.
Trong một số trường hợp điều tra toàn bộ sẽ không thực hiện được, ví dụ như kiểm tra
chất lượng sản phẩm phải phá huỷ các đơn vị thuộc đối tượng nghiên cứu.
b) Điều tra chọn mẫu: Để nghiên cứu tổng thể, ta chỉ cần lấy ra một số phần
tử đại diện để nghiên cứu và từ đó suy ra kết quả cho tổng thể bằng các phương pháp
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 9
thống kê.
Điều tra chọn mẫu thường được sử dụng vì các lý do sau:
- Tiết kiệm chi phí
- Cung cấp thông tin kịp thời cho quá trình nghiên cứu
- Đáng tin cậy. Đây là yếu tố rất quan trọng, nó làm cho điều tra chọn mẫu trở
nên có hiệu quả và được chấp nhận. Tuy nhiên, để có sự đáng tin cậy này chúng ta
phải có phương pháp khoa học để đảm bảo tính chính xác để chỉ cần chọn ra một số
quan sát mà có thể suy luận cho cả tổng thể rộng lớn – đó là nhờ vào các lý thuyết
thống kê.
Việc sử dụng điều tra toàn bộ hay điều tra chọn mẫu phụ thuộc vào nhiều yếu tố
có liên quan: kích thước tổng thể, thời gian nghiên cứu cứu, khả năng về tài chính và
nguồn lực, đặc điểm của nội dung nghiên cứu.
1.5.3. Các phương pháp thu thập thông tin
a) Quan sát: Là phương pháp thu thập dữ liệu bằng cách quan sát hành động,
hành vi thái độ của đối tượng được điều tra. Ví dụ, nghiên cứu trẻ con yêu thích màu
sắc nào, quan sát thái độ khách hàng khi dùng thử loại sản phẩm. Phương pháp này tỏ
ra hiệu quả đối với các trường hợp đối tượng khó tiếp cận và tăng tính khách quan của
đối tượng. Tuy nhiên, phương pháp này tỏ ra khá tốn kém nhưng lượng thông tin thu
thập được ít.
b) Phương pháp gửi thư: Theo phương pháp này nhân viên điều tra gởi bảng
câu hỏi đến đối tượng cung cấp thông tin qua đường bưu điện. Phương pháp gởi thư có
thể thu thập thông tin với khối lượng lớn, tiết kiệm chi phí so với các phương pháp
khác. Tuy nhiên tỷ lệ trả lời bằng phương pháp này tương đối thấp, đây là một nhược
điểm rất lớn của phương pháp này.
c) Phỏng vấn bằng điện thoại: Phương pháp thu thập thông tin bằng cách phỏng
vấn qua điện thoại. Phương pháp này thu thập được thông tin một cách nhanh chóng,
tuy nhiên phương pháp này có nhược điểm: tốn kém, nội dung thu thập thông tin bị
hạn chế.
d) Phỏng vấn trực tiếp:
Phương pháp phỏng vấn trực tiếp thích hợp cho những cuộc điều tra cần thu
thập nhiều thông tin, nội dung của thông tin tương đối phức tạp cần thu thập một cách
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 10
chi tiết. Phương pháp phỏng vấn trực tiếp cho 2 hình thức:
(1) Phỏng vấn cá nhân. Nhân viên điều tra tiếp xúc với đối tượng cung cấp
thông tin thường tại nhà riêng hoặc nơi làm việc. Thông thường phỏng vấn trực tiếp
được áp dụng khi chúng ta cho tiến hành điều tra chính thức.
(2) Phỏng vấn nhóm. Nhân viên điều tra phỏng vấn từng nhóm để thảo luận về
một vấn đề nào đó. Trường hợp này người ta thường sử dụng khi điều tra thử để kiểm
tra lại nội dung của bảng câu hỏi được hoàn chỉnh chưa hoặc nhằm tìm hiểu một vấn
đề phức tạp mà bản thân người nghiên cứu chưa nắm được một cách đầy đủ mà cần
phải có ý kiến cụ thể từ những người am hiểu.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 11
CHƯƠNG 2. XÁC SUẤT VÀ PHÂN PHỐI XÁC SUẤT
2.1. Biến cố ngẫu nhiên và xác xuất
2.1.1. Phép thử và các loại biến cố
Trong tự nhiên và xã hội, mỗi hiện tượng đều gắn liền với một nhóm các điều kiện
cơ bản và các hiện tượng đó chỉ có thể xảy ra khi nhóm các điều kiện cơ bản gắn liền với
nó được thực hiện. Do đó, khi muốn nghiên cứu một hiện tượng, ta cần thực hiện nhóm các
điều kiện cơ bản ấy. Chẳng hạn, nếu muốn quan sát việc xuất hiện mặt sấp hay mặt ngửa
của một đồng xu, ta phải tung đồng xu xuống đất; còn để xem xét việc viên đạn trúng bia
hay trượt, ta phải bắn các viên đạn; khi muốn nghiên cứu chất lượng của một lô sản phẩm,
ta lấy ngẫu nhiên một hoặc một số sản phẩm của lô sản phẩm đó,
Việc thực hiện một nhóm các điều kiện cơ bản để quan sát một hiện tượng nào đó có
xảy ra hay không được gọi là thực hiện một phép thử, còn hiện tượng có thể xảy ra trong
kết quả của phép thử đó được gọi là biến cố.
Thí dụ 1, tung một con xúc xắc xuống đất là một phép thử, còn việc lật lên một mặt nào đó
là biến cố.
Thí dụ 2, bắn một phát sung vào bia. Việc bắn sung là phép thử, còn việc trúng vào một
miền nào đó của bia là biến cố.
Như vậy, ta thấy rằng một biến cố chỉ có thể xảy ra khi một phép thử gắn liền với nó được
thực hiện. Trong thực tế có thể xảy ra các biến cố sau:
+ Biến cố chắc chắn: là biến cố nhất định sẽ xảy ra khi thực hiện một phép thử. Biến cố
chắc chắn ký hiệu là U.
Thí dụ, thực hiện phép thử tung một con xúc xắc. Gọi U là biến cố “Xuất hiện mặt có số
chấm nhỏ hơn hoặc bằng 6” U là biến cố chắc chắn.
+ Biến cố không thể: là biến cố nhất định không xảy ra khi thực hiện phep thử. Biến cố
không thể xảy ra có thể được ký hiệu là V.
Thí dụ, tung một con xúc xắc, gọi V là biến cố “xuất hiện mặt có 7 chẩm”. V là biến cố
không thể có.
2.1.2. Xác suất của biến cố
Như trên đã thấy, việc biến cố ngẫu nhiên xảy ra hay không xảy ra trong kết quả của
phép thử là điều không thể đoán trước được. Tuy nhiên, bằng trực quan ta có thể nhận thấy
các biến cố ngẫu nhiên khác nhau có những khả năng xảy ra khác nhau. Chẳng hạn biến cố
“xuất hiện mặt sấp” khi tung một đồng xu sẽ có khả năng xảy ra lớn hơn nhiều so với biến
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 12
cố “ xuất hiện mặt một chăm” khi tung một con xúc xắc. Hơn nữa, khi lặp đi lặp lại nhiều
lần cùng một phép thử trong những điều kiện như nhau, người ta thấy tính chất ngẫu nhiên
của biến cố mất dần đi và khả năng xả ra của biến cố sẽ được thể hiện theo những quy luật
nhất định. Từ đó ta thấy có khả năng định lượng (đo lường), khả năng khách quan xuất hiện
một biến cố nào đó.
Xác suất của một biến cố là một con số đặc trưng khả năng khách quan xuất hiện
biến cố đó khi thực hiện phép thử.
Ta chú ý rằng đây là khả năng khách quan, do những điều kiện xảy ra của phép thử quy
định chứ không tùy thuộc vào ý muốn chủ quan của con người.
Như vậy, bản chất của xác suất của một biến cố là một con số xác định. Để tính xác suất
của một biến cố, người ta xây dựng một số định nghĩa và định lý sau
2.1.3. Một số định nghĩa về xác suất
2.1.3.1. Định nghĩa cổ điển về xác suất
Xác suất xuất hiện biến cố A trong phép thử là tỉ số giữa số kết cục thuận lợi cho A
và tổng số các kết cục duy nhất đồng khả năng có thể xảy ra khi thực hiện phép thử đó.
Nếu ký hiệu P(A) là xác suất của biến cố A, m là số kết cục thuận lợi cho biến cố A, n là số
kết cục duy nhất đồng khả năng của phép thử, ta có công thức sau:
( ) =
- Các tính chất của xác suất:
+ Xác suất của biên có ngẫu nhiên là một số dương nằm trong khoảng giữa 0 và 1.
+ Xác suất của biến cố chắc chắn bằng 1.
+ Xác suất của biến cố không thể có bằng 0.
- Các phương pháp tính xác suất bằng định nghĩa cổ điển:
+ Phương pháp suy luận trực tiếp: nếu sô các kết cục trong phép thử là khá nhỏ, và việc suy
đoán là khá đơn giản thì có thể sử dụng phương pháp suy luận trực tiếp.
+ Phương pháp dung sơ đồ Venn: khi số kết cục là khá lớn và việc suy đoán phức tạp hơn
thì có thể dung sơ đồ Venn, tức là mô tả các kết cục của phép thử dưới dạng sơ đồ để dễ
nhận biết.
+ Phương pháp dung các công thức của giải tích tổ hợp: nếu số kết cục của phép thử là rất
lớn mà không thể suy đoán trực tiếp được thì có thể dung các công thức của giải tích tổ
hợp, chủ yếu là các công thức chỉnh hợp, chỉnh hợp lặp, hoán vị, và tổ hợp để tính toán.
2.1.3.2. Định nghĩa thống kê về xác suất
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 13
Tần suất xuất hiện biến cố trong n phép thử là tỷ số giữa số phép thử trong đó biến cố xuất
hiện và tổng số phép thử được thực hiện.
Như vậy, nếu ký hiệu số phép thử là n, số lần xuất hiện biến cố A là k, tần suất xuất hiện
biến cố A là f(A) thì:
f(A) =
Một số định nghĩa về xác suất:
- Định nghĩa hình học về xác suất: Định nghĩa hình học về xác suất có thẻ sử dụng khi xác
suất để một điểm ngẫu nhiên rơi vào một phần nào đó của một miền cho trước tỷ lệ với độ
đo của miền đó (độ dài, diện tích, thể tích,) và không phụ thuộc vào vị trí, dạng thức của
miền đó.
- Xác suất chủ quan: Được định nghĩa như sự đánh giá chủ quan của một cá nhân nào đó về
khả năng xảy ra của biến cố. Sự đánh giá này chủ yếu dựa vòa những nhận xét cá nhân,
thông tin ngoại lai, trực giác hay các kinh nghiệm tích lũy được của mỗi cá nhân liên quan
đến hiện tượng được xem xét.
- Định nghĩa tiên đề về xác suất: Vào những năm 30 của thế kỷ 20, nhà toán học người Nga
là Kolmogorov đã xây dựng hệ tiên đề làm cơ sở cho việc định nghĩa một cạch hoàn chỉnh
khái niệm xác suất về mặt lý thuyết.
2.1.4. Định lý cộng và nhân xác suất
2.1.4.1. Định lý cộng xác suất
Định nghĩa cộng xác suất:
Định nghĩa 1. Biến cố C được gọi là tổng của hai biến cố A và B, ký hiệu C = A + B nếu C
chỉ xảy ra khi có ít nhất một trong hai biến cố A và B xảy ra.
Thí dụ, hai người cùng bắn vào một bia. Gọi A là biến cố “Người thứ nhất bắn trúng”, B là
biến cố “Người thứ 2 bắn trúng”, C là biến cố “Bia bị trúng đạn”. Rõ ràng là biến cố C sẽ
xảy ra khi có ít nhất một trong hai biến cố A và B xảy ra. Vậy C = A + B.
Định nghĩa 2. Biến cố A được gọi là tổng của n biến cố A1, A2, A3,.nếu A xảy ra khi có ít
nhất một trong n biến cố ấy xảy ra.
Định nghĩa 3. Hai biến cố A và B gọi là xung khắc với nhau nếu chúng không thể đồng thời
xảy ra trong một phép thử. Trường hợp ngược lại, nếu hai biến cố có thể cùng xảy ra trong
một phép thử thì được gọi là không xung khắc.
Khi áp dụng khái niệm xung khắc cho nhóm gồm n biến cố, ta có khái niệm xung khắc từng
đôi.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 14
Định nghĩa 4. Nhóm n biến cố A1, A2, A3, được gọi là xung khắc từng đôi nếu bất kỳ hai
biến cố nào trong nhóm này cũng xung khắc với nhau.
Định lý cộng xác suất:
Xác suất của tổng hai biến cố xung khắc bằng tổng xác suất của các biến cố đó.
Như vậy, nếu A và B là hai biến cố xung khắc với nhau thì:
P(A+B) = P(A) + P(B)
2.1.4.2. Định lý nhân xác suất
Bây giờ ta chuyển qua nghiên cứu trường hợp khi một biến cố có thể xem như tích của các
biến cố khác.
Định nghĩa 1. Biến cố C được gọi là tích của hai biến cố A và B nếu C xảy ra khi và chỉ khi
cả hai biến cố A và B đồng thời xyar ra. Ký hiệu C = A*B.
Định nghĩa 2. Biến cố A được gọi là tích của n biến cố A1, A2, An nếu A xảy ra khi và
chỉ khi cả n biến cố nói trên đồng thời xảy ra.
Định nghĩa 3. Hai biến cố A và B gọi là độc lập với nhau nếu việc xảy ra hay không xảy ra
của biến cố này không làm thay đổi xác suất xảy ra của biến cố kia và ngược lại. Trong
trường hợp nếu việc xảy ra hay không xảy ra của biến cố làm cho xác suất xảy ra của biến
có kia thay đổi thì hai biến cố đó gọi là phụ thuộc nhau.
Định nghĩa 4. Các biến cố A1, A2, , An được gọi là độc lập từng đôi với nhau nếu mỗi
cặp hai trong n biến cố độc lập với nhau.
Định nghĩa 5: Các biến cố A1, A2, , An gọi là độc lập toàn phần với nhau nếu mỗi biến
độc lập với một tổ hợp bất kỳ của các biến còn lại.
Định nghĩa 6. Xác suất của biến cố A được tính với điều kiện biến cố B đã xảy ra gọi là xác
suất có điều kiện của A và ký hiệu là P(A/B).
Định lý:
Định lý 1. Xác suất của tích hai biến cố độc lập bằng tích các xác suất thành phần.
P(A.B) = P(A).P(B)
Định lý 2. Xác suất của tích hai biến cố phụ thuộc A và B bằng tích xác suất của một trong
hai biến cố đó với xác suất có điều kiện của hai biến cố còn lại.
P(A.B) = P(A).P(B/A) = P(B).P(A/B)
2.1.4.3. Các hệ quả của định lý cộng và định lý nhân xác suất
Định lý 1: Xác suất của tổng hai biến cố không xung khắc bằng tổng xác suất các biến cố
đó trừ đi xác suất của tích các biến cố đó.
P(A+B) = P(A) + P(B) – P(A.B)
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 15
Định lý 2: Xác suất của tổng n biến cố không xung khắc và độc lập toàn phần với nhau
bằng một trừ đi tích xác suất của các biến cố đối lập với các biến cố đó.
Công thức Bernoulli
Định nghĩa: Ta tiến hành n phép thử độc lập. Giả sử trong mỗi phép thử chỉ xảy ra hai
trường hợp: Hoặc biến cố A xảy ra với xác suất p hoặc biến cố A không xảy ra với xác suất
q = 1 – p.
Các bài toán thỏa mãn các điều kiện trên thì được gọi là tuân theo lược đồ Bernoulli. Khi
đó xác suất để trong n phép thử độc lập biến cố A xuất hiện k lần được ký hiệu: Pn(k)
Ví dụ 1: Hộp có 10 viên bi, trong đó có 6 viên bi màu đỏ. Lần lượt rút có hoàn lại 5 viên
bi. Gọi A là biến cố rút được viên bi màu đỏ trong mỗi lần rút, ta được một lược đồ
Bernoulli với:
* Số phép thử độc lập là n = 5.
* P(A) = 6/15.
Ví dụ 2: Trong một phân xưởng có 5 máy hoạt động độc lập, xác suất để một máy bị hư
trong một ca sản xuất là bằng nhau và bằng p = 0,1. Tính xác suất để trong 1 ca có hai
máy bị hư.
Ta thấy 5 máy hoạt động độc lập cho nên ta có thể coi như tiến hành 5 phép thử độc lập và
mỗi phép thử chỉ có hai kết cục máy hoạt động tốt hoặc máy bị hư với xác suất p = 0,1.
Khi đó bài toán tuân theo lược đồ Bernoulli.
2.1.4.4. Công thức xác suất toàn phần và công thức Bayes
Giả sử A là biến cố bất kỳ và lập thành hệ đầy đủ các biến cố và .
Khi đó:
a) (1.2)
Công thức (1.2) là công thức xác suất toàn phần
b) Nếu thì:
(1.3)
Công thức này được gọi là công thức Bayes.
Chứng minh
a) Ta có:
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 16
Vì các
B1, B2, , Bn xung khắc từng đối nên AB1, AB2,, ABn cũng xung khắc từng đôi nên:
P(A) = P(AB1) + P( AB2) + + P( ABn)
Mà
P(AB1) = P(B1) P(A/B1)
P(ABn) = P(Bn) P(A/Bn)
Nên
P(A) = P(B1) P(A/B1) + P(B2) P(A/B2) + + P(Bn) P(A/Bn)
c) Theo công thức xác suất tính ta có:
P(BkA) = P(Bk) P(A/Bk) = P(A) P(Bk/A)
2.2. Biến ngẫu nhiên và quy luật phân phối xác suất
2.2.1. Định nghĩa và phân loại biến ngẫu nhiên
Định nghĩa
Một biến số gọi là biến ngẫu nhiên nếu trong kết quả của phép thử nó sẽ nhận một và
chỉ một trong các giá trị có thể có của nó tùy thuộc vào sự tác động của các nhân tố ngẫu
nhiên.
Các biến ngẫu nhiên được ký hiệu là X, Y, Z hoặc X1, X2, ; Y1, Y2,còn các giá trị có
thể có của nó được ký hiệu là x1, x2, x3,y1, y2, y3,
Ta chú ý rằng sở dĩ biến X nào đó gọi là ngẫu nhiên vì trước khi tiến hành phép thử ta chưa
có thể nói một cách chắc chắn nó sẽ nhận giá trị bằng bao nhiêu, mà chỉ có thể dự đoán
điều đó với một xác suất nhất định. Nói cách khác, việc X nhận một giá trị nào đó (X = x1)
hoặc (X=x2) về thực chất là các biến cố ngẫu nhiên. Hơn nữa, vì trong kết quả của phép thử
biến X nhất định sẽ nhận một và chỉ một trong các giá trị có thể có của nó, do đó các biến
cố (X=x1), (X=x2),.(X=xn) tạo nên một nhóm đầy đủ các biến cố.
Thí dụ, gọi X là “số con trai trong 100 trẻ sắp được sinh ra tại một nhà hộ sinh”. X cũng là
một biến ngẫu nhiên.
Phân loại biến ngẫu nhiên
Biến ngẫu nhiên có thể là rời rạc hoặc lien tục.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 17
Biến ngẫu nhiên gọi là rời rạc nếu các giá trị có thể có của nó lập nên một tập hợp hữu hạn
hoặc đếm được.
Nói cách khác, biến ngẫu nhiên sẽ là rời rạc nếu ta có thể liệt kê được tất cả các giá trị có
thể có của nó.
Thí dụ, trong phép thử về tung con xúc xắc, nếu ta gọi X là “số điểm thu được” thì X là
biến ngẫu nhiên rời rạc vì các giá trị có thể có của nó là một tập hợp hữu hạn.
Biến ngẫu nhiên gọi là lien tục nếu các giá trị có thể có của nó lấp đầy một khoảng trên
trục số.
Đối với biến ngẫu nhiên liên tục ta không thể liệt kê được tất cả các giá trị có thể có của nó.
Thí dụ, bắn một phát súng vào bia. Nếu gọi X là “khoảng cách từ điểm chạm của viên đạn
đến tâm bia” thì X là biến ngẫu nhiên liên tục vì ta không thể kể ra được tất cả các giá trị có
thể có của nó. Ta chỉ có thể nói rằng các giá trị có thể có của nó của X nằm trong khoảng
(a, b) nào đó.
Có thể nói rằng gần như tất cả các đại lượng mà ta gặp trong thực tế đều là các biến ngẫu
nhiên và chúng sẽ thuộc về một trong hai loại biến ngẫu nhiên đã kể trên.
2.2.2. Quy luật phân phối xác suất của biến ngẫu nhiên
Ta có thể nghĩ rằng chỉ cần xác định các giá trị có thể có của một biến ngẫu nhiên là
đủ để xác định biến ngẫu nhiên ấy. Tuy nhiên điều này chưa đủ. Trong thực tế có những đại
lượng rất khác nhau mà các giá trị có thể có của chúng lại giống nhau. Hơn nữa việc các
biến ngẫu nhiên nhận một giá trị nào đó trong kết quả của phép thử chỉ là một biến cố ngẫu
nhiên, do đó nếu chỉ mới biết được các giá trị có thể có của nó thì ta mới nắm được rất ít
thông tin về biến ngẫu nhiên ấy.
Định nghĩa
Quy luật phân phối xác suất của biến ngẫu nhiên là sự tương ứng giữa các giá trị có thể có
của nó và các xác suất tương ứng với các giá trị đó.
Trong thực tế người ta thường sử dụng ba phương pháp để mô tả quy luật phân phối xác
suất của biến ngẫu nhiên là: bảng phân phối xác suất, hàm phân bố xác suất và hàm mật độ
xác suất. Ta sẽ lần lượt nghiên cứu các phương pháp đó.
Bảng phân phối xác suất
Bảng phân phối xác suất chỉ dùng để mô tả quy luật phân phối xác suất của biến ngẫu nhiên
rời rạc.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 18
Giả sử biến ngẫu nhiên rời rạc X có thể nhận một trong các giá trị có thể có x1, x2, x3,,
xn với các xác suất tương ứng là p1, p2, p3,pn. Bảng phân phối xác suất của biến ngẫu
nhiên rời rạc X có dạng:
X x1 x2 Xi xn
P p1 p2 Pi pn
Ta chú ý rằng để tạo nên một quy luật phân phối xác suất thì các xác suất pi phải thỏa mãn
điều kiện.
0≤ pi ≤1
∑pi = 1
Điều kiện thứ nhất là hiển nhiên theo tính chất của xác suất, còn điều kiện thứ hai suy ra từ
định nghĩa của biến ngẫu nhiên.
Hàm phân bố xác suất
Khái niệm hàm phân bố xác suất áp dụng được đối với cả biến ngẫu nhiên rời rạc và liên
tục. Giả sử X là biến ngẫu nhiên bất kỳ, x là một số thực nào đó. Xét biến cố “ biến ngẫu
nhiên X nhận giá trị nhỏ hơn x”, ký hiệu (X<x). Hiển nhiên là x thay đổi thì xác suất
P(X<x) cũng thay đổi theo. Như vậy, xác suất này là một hàm số của x.
Định nghĩa. Hàm phân phối xác suất của biến ngẫu nhiên X, ký hiệu F(x), là xác suất để
biến ngẫu nhiên X nhận giá trị nhỏ hơn x, với x là một số thực bất kỳ.
F(x) = P(X<x)
Ta chú ý rằng đây chỉ là định nghĩa tổng quát của hàm phân bố xác suất. Đối với từng loại
biến ngẫu nhiên hàm phân bố xác suất được tính theo những công thức riêng.
Các tính chất của hàm phân bố xác suất
Tính chất 1. Hàm phân bố xác suất luôn nhận giá trị trong đoạn [0,1].
Tính chất này trực tiếp sinh ra từ định nghĩa của hàm phân bố xác suất, vì nó là một xác
suất nên giá trị của nó nằ trong đoạn [0, 1].
Tính chất 2. Hàm phân bố xác suất là hàm không giảm, tức là với x2>x1 thì:
F(x2)>F(x1)
Từ tính chất thứ 2 có thể suy ra một hệ quả sau đây:
Hệ quả 1: Xác suất để biến ngẫu nhiên X nhận giá trị trong khoảng [a, b) bằng hiệu số của
hàm phân bố xác suất tại hai đầu khoảng đó.
Hệ quả 2: Xác suất để biến ngẫu nhiên liên tục X nhận một giá trị xác định bằng 0.
P(X= x) = 0
Hệ quả 3: Đối với biến ngẫu nhiên liên tục X ta có các đẳng thức sau:
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 19
Từ đó:
P(a≤x≤b) = P(a ≤x<b) = P (a <x<b)
Tính chất 3. Ta có biểu thức giới hạn sau:
F(-∞) = 0; F (+∞) = 1
Ý nghĩa của hàm phân bố xác suất
Từ định nghĩa của hàm phân bố xác suất F(x) = P(X< x) ta thấy hàm phân bố xác suất phản
ánh mức độ tập trung xác suất ở về phía bên trái một số thực x nào đó. Như đã biết toàn bộ
xác suất của biến ngẫu nhiên bằng 1, do đó giá trị của hàm phân bố xác suất tại mỗi điểm x
cho biết có bao nhiêu phần của một đơn vị xác suất phân bố trong đoạn (-∞,x).
Hàm mật độ xác suất
Đối với biến ngẫu nhiên liên tục X có thể dùng làm phân bố xác suất để mô tả quy luật
phân phối xác suất của nó. Tuy nhiên phương pháp này cũng hạn chế. Hàm phân bố xác
suất không thể đặc trưng được xác suất để biến ngẫu nhiên liên tục X nhận một giá trị nhất
định. Vì thế, đối với các biến ngẫu nhiên liên tục, người ta thường dung hàm mật độ xác
suất để mô tả quy luật phân phối xác suất của nó.
Định nghĩa: Hàm mật độ xác suất của biến ngẫu nhiên liên tục X (ký hiệu là f(X)) là đạo
hàm bậc nhất của hàm phân bố xác suất của biến ngẫu nhiên đó.
f(x) = F’(x)
chú ý rằng hàm mật độ xác suất chỉ áp dụng cho các biến ngẫu nhiên liên tục không áp
dụng cho các biến ngẫu nhiên rời rạc vì muốn F’(x) tồn tại thì tối thiểu F(x) phải liên tục,
do đó X phải là biến ngẫu nhiên liên tục.
Các tính chất của hàm mật độ xác suất
Tính chất 1: Hàm mật độ xác suất luôn không âm.
Tính chất 2: Xác suất để biến ngẫu nhiên liên tục X nhận giá trị trong khoảng (a, b) bằng
tích phân xác định của hàm mật độ xác suất trong khoảng đó.
Tính chất 3: Hàm phân bố xác suất F(x) của biến ngẫu nhiên liên tục X bằng tích phân suy
rộng của hamg mật độ xác suất trong khoảng (-∞, ∞).
Tính chất 4: Tích phân suy rộng trong khoảng (-∞, +∞) của hàm mật độ xác suất bằng 1.
Ý nghĩa của hàm mật độ xác suất
Hàm mật độ xác suất của biến ngẫu nhiên X tại mỗi điểm x cho biết mức độ tập trung xác
suất tại điểm đó.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 20
CHƯƠNG 3. THỐNG KÊ MÔ TẢ
3.1. Bảng thống kê và đồ thị thống kê
3.1.1. Bảng thống kê
3.1.1.1. Khái niệm
Bảng thống kê là một hình thức trình bày các tài liệu thống kê một cách có hệ thống,
hợp lý và rõ ràng, nhằm nêu lên các đặc trưng về mặt lượng của hiện tượng nghiên
cứu. Đặc điểm chung của tất cả các bảng thống kê là bao giờ cũng có những con số
của từng bộ phận và có mối liên hệ mật thiết với nhau.
3.1.1.2. Cấu thành bảng thống kê
a. Về hình thức: bảng thống kê gồm các hàng, cột, các tiêu đề, tiêu mục và . Các
hàng cột thể hiện quy mô của bảng, số hàng và số cột càng nhiều thì bảng thống
kê càng lớn và càng phức tạp.
Tiêu đề của bảng thống kê phản ánh nội dung, ý nghĩa của bảng và của từng chi tiết
trong bảng. Trước hết ta có tiêu đề chung, sau đó là các tiêu đề nhỏ (tiêu mục) là tên
riêng của mỗi hàng, cột phản ánh ý nghĩa của cột đó.
b. Phần nội dung: Bảng thống kê gồm 2 phần: Phần chủ đề và phần giải thích.
Phần chủ đề nói lên tổng thể được trình bày trong bảng thống kê, tổng thể này
được phân thành những đơn vị, bộ phận. Nó giải đáp: đối tượng nghiên cứu là những
đơn vị nào, những loại hình gì. Có khi phần chủ đề phản ánh các địa phương hoặc các
thời gian nghiên cứu khác nhau của một hiện tượng.
Phần giải thích gồm các chỉ tiêu giải thích các đặc điểm của đối tượng nghiên
cứu, tức là giải thích phần chủ đề của bảng.
Phần chủ đề thường được đặt bên trái của bảng thống kê, còn phần giải thích
được đặt ở phía trên của bảng. Cũng có trường hợp ta thay đổi vị trí.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 21
Cấu thành của bảng thống kê có thể biểu hiện bằng sơ đồ sau:
Phần chủ đề Phần giải thích Các chỉ tiêu giải thích (tên cột)
(1) (2) (3) (4) (5)
Tên chủ đề
3.1.1.3. Các yêu cầu và qui ước xây dựng bảng thống kê
Qui mô của bảng thống kê: không nên quá lớn, tức là quá nhiều hàng, cột và nhiều
phân tổ kết hợp. Một bảng thống kê ngắn, gọn một cách hợp lý sẽ tạo điều kiện dễ dàng
cho việc phân tích. Nếu thấy cần thiết nên xây dựng hai, ba,... bảng thống kê nhỏ thay
cho một bảng thống kê quá lớn
Số hiệu bảng: nhằm giúp cho người đọc dễ dàng xác định vị trí của bảng khi tham
khảo, đặc biệt là đối với các tài liệu nghiên cứu người ta thường lập mục lục biểu bảng
để người đọc dễ tham khảo và người trình bày dễ dàng hơn. Nếu số biểu bảng không
nhiều thì chúng ta chỉ cần đánh số theo thứ tự xuất hiện của biểu bảng, nếu tài liệu được
chia thành nhiều chương và số liệu biểu bảng nhiều thì ta có thể đánh số theo chương
và theo số thứ tự xuất hiện của biểu bảng trong chương. Ví dụ, Bảng 2.5 tức là bảng ở
chương 2 và là bảng thứ 5.
Tên bảng: yêu cầu ngắn gọn, đầy đủ, rõ ràng, đặt trên đầu bảng và phải chứa đựng nội
dung, thời gian, không gian mà số liệu được biểu hiện trong bảng. Tuy nhiên yêu cầu
này chỉ mang tính chất tương đối không có tiêu chuẩn rõ ràng nhưng thông thường
người ta cố gắng trình bày trong một hàng hoặc tối đa là hai hàng.
Đơn vị tính:
Đơn vị tính dùng chung cho toàn bộ số liệu trong bảng thống kê, trường hợp này
đơn vị tính được ghi bên góc phải của bảng.
Đơn vị tính theo từng chỉ tiêu trong cột, trong trường hợp này đơn vị tính sẽ được đặt
dưới chỉ tiêu của cột.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 22
Đơn vị tính theo từng chỉ tiêu trong hàng, trong trường hợp này đơn vị tính sẽ được đặt
sau chỉ tiêu theo mỗi hàng hoặc tạo thêm một cột ghi đơn vị tính.
Cách ghi số liệu trong bảng:
Số liệu trong từng hàng (cột) có đơn vị tính phải nhận cùng một số lẻ, số liệu ở các
hàng (cột) khác nhau không nhất thiết có cùng số lẻ với hàng (cột) tương ứng.
- Một số ký hiệu qui ước:
+ Nếu không có tài liệu thì trong ô ghi dấu gạch ngang “-“
+ Nếu số liệu còn thiếu, sau này sẽ bổ sung sau thì trong ô ghi dấu ba chấm “...”
+ Ký hiệu gạch chéo “x” trong ô nào đó thì nói lên hiện tượng không có liên
quan đến chỉ tiêu đó, nếu ghi số liệu vào đó sẽ vô nghĩa hoặc thừa.
Phần ghi chú ở cuối bảng: được dùng để giải thích rõ các nội dung chỉ tiêu trong
bảng, nói rõ nguồn tài liệu đã sử dụng hoặc các chỉ tiêu cần thiết khác. Đối với tài liệu
khoa học, việc ghi rõ nguồn số liệu được coi là bắt buộc không thể thiếu được trong biểu
bảng.
3.1.2. ĐỒ THỊ THỐNG KÊ
3.1.2.1. Biểu đồ hình cột
Biểu đồ hình cột là loại biểu đồ biểu hiện các tài liệu thống kê bằng các hình chữ
nhật hay khối chữ nhật thẳng đứng hoặc nằm ngang có chiều rộng và chiều sâu bằng
nhau, còn chiều cao tương ứng với các đại lượng cần biểu hiện.
Biểu đồ hình cột được dùng để biểu hiện quá trình phát triển, phản ánh cơ cấu và
thay đổi cơ cấu hoặc so sánh cũng như biểu hiện mối liên hệ giữa các hiện tượng.
3.1.2.2. Biểu đồ diện tích
Biểu đồ diện tích là loại biểu đồ, trong đó các thông tin thống kê được biểu hiện bằng
các loại diện tích hình học như hình vuông, hình chữ nhật, hình tròn, hình ô van,...
Biểu đồ diện tích thường được dùng để biểu hiện kết cấu và biến động cơ cấu của hiện
tượng.
Tổng diện tích của cả hình là 100%, thì diện tích từng phần tương ứng với mỗi bộ
phận phản ánh cơ cấu của bộ phận đó.
Biểu đồ diện tích hình tròn còn có thể biểu hiện được cả cơ cấu, biến động cơ cấu kết
hợp thay đổi mức độ của hiện tượng. Trong trường hợp này số đo của góc các hình
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 23
S :
quạt phản ánh cơ cấu và biến động cơ cấu, còn diện tích toàn hình tròn phản ánh quy
mô của hiện tượng.
Khi vẽ đồ thị ta tiến hành như sau:
- Lấy giá trị của từng bộ phận chia cho giá trị chung của chỉ tiêu nghiên cứu để xác
định tỷ trọng (%)của từng bộ phận đó. Tiếp tục lấy 360 (3600) chia cho 100 rồi nhân
với tỷ trọng của từng bộ phận sẽ xác định được góc độ tương ứng với cơ cấu của từng
bộ phận.
Xác định bán kính của mỗi hình tròn có diện tích tương ứng là S: R = vì diện
tích hình tròn: S = π. R2. Khi có độ dài của bán kính mỗi hình tròn, ta sẽ dễ dàng vẽ
được các hình tròn đó.
Ví dụ : Có số lượng về học sinh phổ thông phân theo cấp học 3 năm 2005, 2006 và
2007 của địa phương X như bảng 1.3:
Bảng 3.1: Học sinh phổ thông phân theo cấp học của địa phương X, 2005 - 2007
2005 2006 2007
Số
lượng
(Người)
Cơ
cấu
(%)
Số
lượng
(Người)
Cơ
cấu
(%)
Số
lượng
(Người)
Cơ
cấu
(%)
Tổng số học sinh 1.000 100,0 1.140 100,0 1.310 100,0
Chia ra:
Tiểu học 500 50,0 600 53,0 700 53,5
Trung học cơ sở 300 30,0 320 28,0 360 27,5
Trung học phổ thông 200 20,0 220 19,0 250 19,0
Từ số liệu bảng 1.3 ta tính các bán kính tương ứng: 2005: 17.84; 2006: 19.05; 2007:
20.42
Nếu năm 2005 lấy R = 1,00
Thì năm 2006 có R = 19,05 : 17,84 = 1,067
Năm 2007 có R = 20,42 : 17,84 = 1,144
Kết quả 3 hình tròn được vẽ phản ánh cả quy mô học sinh phổ thông lẫn cơ cấu và biến
động cơ cấu theo cấp học của học sinh qua các năm 2005, 2006 và 2007.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 24
30
Biều đồ 3.2: Biểu đồ cơ cấu học sinh phổ thông địa phương X từ 2005 – 2007
20
53,5
53
50
2005 2006 2007
Tuy nhiên, nếu chúng ta chỉ vẽ biểu đồ mang tính đơn lẽ thì không cần phải xác
định độ lớn của đường kính.
3.1.2.3. Biểu đồ tượng hình
Biểu đồ tượng hình là loại đồ thị thống kê, trong đó các tài liệu thống kê được thể
hiện bằng các hình vẽ tượng trưng. Biểu đồ tượng hình được dùng rộng rãi trong
việc
tuyên truyền, phổ biến thông tin trên các phương tiện sử dụng rộng rãi. Biểu đồ hình
tượng có nhiều cách vẽ khác nhau, tuỳ theo sáng kiến của người trình bày mà lựa chọn
loại hình vẽ tượng hình cho phù hợp và hấp dẫn.
Tuy nhiên khi sử dụng loại biểu đồ này phải theo nguyên tắc: cùng một chỉ tiêu
phải được biểu hiện bằng cùng một loại hình vẽ, còn chỉ tiêu đó ở các trường hợp nào
có trị số lớn nhỏ khác nhau thì sẽ biểu hiện bằng hình vẽ có kích thước lớn nhỏ khác
nhau theo tỷ lệ tương ứng.
Trở lại ví dụ trên số lượng học sinh phổ thông được biểu diễn như sau:
19
27,5
19
28
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 25
Biểu đồ 3.3: Biểu đồ cơ cấu học sinh phổ thông địa phương X từ 2005 – 2007
3.1.2.4. Đồ thị đường gấp khúc
Đồ thị đường gấp khúc là loại đồ thị thống kê biểu hiện các tài liệu bằng một
đường gấp khúc nối liền các điểm trên một hệ toạ độ, thường là hệ toạ độ vuông góc.
Đồ thị đường gấp khúc được dùng để biểu hiện quá trình phát triển của hiện tượng,
biểu hiện tình hình phân phối các đơn vị tổng thể theo một tiêu thức nào đó hoặc biểu
thị tình hình thực hiện kế hoạch theo từng thời gian của các chỉ tiêu nghiên cứu.
Trong một đồ thị đường gấp khúc, trục hoành thường được biểu thị thời gian, trục
tung biểu thị mức độ của chỉ tiêu nghiên cứu. Cũng có khi các trục này biểu thị hai chỉ
tiêu có liên hệ với nhau hoặc lượng biến và các tần số (hay tần suất) tương ứng. Độ
phân chia trên các trục cần được xác định cho thích hợp vì có ảnh hưởng trực tiếp đến
độ dốc của đồ thị. Mặt khác, cần chú ý là trên mỗi trục toạ độ chiều dài của các khoảng
phân chia tương ứng với sự thay đổi về lượng của chỉ tiêu nghiên cứu phải bằng nhau.
Ví dụ : Sản lượng cà phê xuất khẩu của quốc gia X qua các năm từ 2000 - 2007 (ngàn
tấn) có kết quả như sau:
Năm 2000 2001 2002 2003 2004 2005 2006 2007
Sản lượng (ngàn tấn) 283,3 391,6 382,0 482,0 733,9 931,0 722,0 749,0
Số liệu trên được biểu diễn qua đồ thị đường gấp khúc sau
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 26
:
Đồ thị 3.4: Sản lượng cà phê xuất khẩu của quốc gia X từ 2000 – 2007
1000
900
800
700
600
500
400
300
200
100
0
2000 2001 2002 2003 2004 2005 2006 2007
3.1.2.5. Biểu đồ hình màng nhện
Biểu đồ hình màng nhện là loại đồ thị thống kê dùng để phản ánh kết quả đạt được
của hiện tượng lặp đi lặp lại về mặt thời gian, ví dụ phản ánh về biến động thời vụ của
một chỉ tiêu nào đó qua 12 tháng trong năm. Để lập đồ thị hình màng nhện ta vẽ một
hình tròn bán kính R, sao cho R lớn hơn trị số lớn nhất của chỉ tiêu nghiên cứu (lớn
hơn bao nhiêu lần không quan trọng, miễn là đảm bảo tỷ lệ nào đó để hình vẽ được cân
đối, kết quả biểu diễn của đồ thị dễ nhận biết). Sau đó chia đường tròn bán kính R
thành các phần đều nhau theo số kỳ nghiên cứu (ở đây là 12 tháng) bởi các đường
thẳng đi qua tâm đường tròn. Nối các giao điểm của bán kính cắt đường tròn ta được
đa giác đều nội tiếp đường tròn. Đó là giới hạn phạm vi của đồ thị. Độ dài đo từ tâm
đường tròn đến các điểm xác định theo các đường phân chia đường tròn nói trên chính
là các đại lượng cần biểu hiện của hiện tượng tương ứng với mỗi thời kỳ. Nối các
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 27
điểm xác định sẽ được hình vẽ của đồ thị hình màng nhện.
VD: có số liệu về giá trị xuất, nhập khẩu hải sản của tỉnh X năm 2006 và 2003 như sau:
Bảng 3.2. Giá trị xuất khẩu hải sản trong 12 tháng tỉnh X năm 2006 - 2007
ĐVT: Triệu đồng
Năm
Tháng
2006
2007
Nă
m Tháng
2006
2007
1 10,7 14,0 7 19,1 21,3
2 7,0 10,5 8 21,2 22,5
3 13,1 15,4 9 20,5 22,2
4 14,8 16,5 10 21,1 24,4
5 17,4 18,4 11 17,7 21,8
6 18,9 19,8 12 16,8 22,1
Chia đường tròn thành 12 phần đều nhau, vẽ các đường thẳng tương ứng cắt đường tròn
tại 12 điểm. Nối các điểm lại có đa giác đều 12 cạnh nội tiếp đường tròn. Căn cứ số liệu
của bảng ta xác định các điểm tương ứng với giá trị xuất khẩu đạt được của các tháng
trong từng năm rồi nối các điểm đó lại thành đường liền ta được đồ thị hình màng nhện
biểu diễn kết quả xuất khẩu qua các tháng trong 2 năm của tỉnh X.
Đồ thị 3.5: Đồ thị Giá trị xuất khẩu hải sản trong 12 tháng tỉnh X năm 2006 - 2007
2
5
12
11
9
8
20
15
10
5
0
2
6
3
4
5
2006
2007
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 28
3.2. PHÂN TỔ THỐNG KÊ
3.2.1. Khái niệm chung về phân tổ thống kê
3.2.1.1. Khái niệm, ý nghĩa và nhiệm vụ của phân tổ thống kê
Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để phân chia các đơn vị
của tổng thể thánh các tổ có tính chất khác nhau.
Kết quả của phân tổ được một dãy số biểu thị sự phân bố của các đơn vị tổng thể dọi là dãy
số phân phối, số lượng đơn vị từng tổ được gọi là tần số phân phối, tỷ số đơn vị của từng tổ
trong tổng thể gọi là tần số.
Ý nghĩa: là phương pháp cơ bản để tổng hợp tài liệu điều tra thống kê. Tài liệu và kết quả
của tổng hợp thống kê là cơ sở tính toán các chỉ tiêu phân tích thống kê phục vụ cho giai
đoạn phân tích thống kê.
Dựa vào kết quả cảu phân tổ thống kê chúng ta có thể nhận xét sơ bộ có tính phân tích so
sánh hơn kém giữa các nhóm tổ, qua đó nhận thấy vai trò quan trọng của từng tổ.
Nhiệm vụ: là phân chia các loại hình kinh tế-xã hội của hiện tượng nghiên cứu, biểu hiện
kết cấu của hiện tượng nghiên cứu và biểu hiện mối liên hệ giữa các tiêu thức.
3.2.1.2.Các loại phân tổ thống kê
Căn cứ vào nhiệm vụ của phân tổ thống kê;
Phân tổ phân loại:
Phân tổ kết cấu
Phân tổ liên hệ
Căn cứ vào số lượng của tiêu thức phân bổ
Phân tổ theo một tiêu thức
Phân tổ theo nhiều tiêu thức
3.2.1.3. Tiêu thức phân tổ và chỉ tiêu giải thích
Tiêu thức phân tổ là những tiêu thức nêu lên đặc tính, đặc trưng cơ bản của hiện tượng
nghiên cứu được chọn làm căn cứ để tiến hành phân tổ hiện tượng nghiên cứu.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 29
Mỗi đơn vị tổng thể có nhiều tiêu thức khác nhau, tiêu thức naaof cũng có thể chọn để làm
cẳn cứ phân tổ. Tuy nhiên, mỗi tiêu thức có ý nghĩa khác nhau, cho nên kết quả phân tổ
theo chúng cũng có ý nghĩa khác nhau. Có tiêu thức khi phân tổ theo nó giúp ta hiểu bản
chất của hiện tượng nghiên cứu, có tiêu thức chỉ giúp ta hiểu một phần. Vì vậy, khi tiến
hành phân tổ trước hết cần phải lựa chọn tiêu thức phân tổ chính xác.
Ví dụ: phân tổ cá cửa hàng bán lẻ theo doanh thu tháng 10 năm 2005 trên địa bàn quận A,
đơn vị tính theo triệu đồng.
Doanh thu Số của hàng
10 200
20 100
30 300
40 400
50 300
60 100
100 100
Cộng 1.500
3.2.2. Các bước phân tổ thống kê
3.2.2.1. Lựa chọn tiêu thức phân tổ
Lựa chọn tiêu thức phân tổ là bước đầu tiên làm cơ sở để tiến hành phân tổ. Lựa
chọn tiêu thức chính xác, phù hợp với mục đích nghiên cứu thì kết quả phân tổ mới thực
sự có ích cho việc phân tích đặc điểm và bản chất của hiện tượng.
3.2.2.2. Xác định số tổ và khoảng cách tổ
a. Phân tổ theo tiêu thức thuộc tính
Tiêu thức thuộc tính có 3 biểu hiện cụ thể:
Trường hợp có 2 biểu hiện (tiêu thức thay phiên), phân chia hiện tượng nghiên
cứu thành 2 tổ.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 30
Ví dụ: phân tổ doanh nghiệp công nghiệp, phân tổ sản phẩm công nghiệp theo tiêu thức
nhóm A và nhóm B hoặc theo tiêu thức khu vực Quốc doanh và khu vực ngoài Quốc
doanh.
Trường hợp có một số biểu hiện cố định, môi biểu hiện hình thành một tổ, có bao
nhiêu biểu hiện sẽ phân chia hiện tượng thành bấy nhiêu tổ.
Ví dụ: phân tổ dân số theo thành phần giai cấp hay theo tiêu thức dân tộc.
Trường hợp có nhiều biểu hiện như tiêu thức tên sản phẩm, rất nhiều tên sản
phẩm, không thể dựa trên mỗi biểu hiện hình thành một tổ. Như vậy số tổ quá nhiều, và
cac đơn vị trong các tổ sẽ không khác nhau về tình chất, đặc trưng cơ bản, không có ý
nghĩa nghiên cứu. Trường hợp này phải thực hiện nguyên tắc ghép tổ:các đơn vị các tổ
nhỏ được ghép thành một tổ phải đảm bảo giống nhau hoặc gần giống nhau về tính chất
hoặc đặc trưng cơ bản nào đó theo tiêu thức phân tổ, phù hợp với mục đích, yêu cầu
nghiên cứu.
b. Phân tổ theo tiêu thức số lượng
Tiêu thức lượng biến có 3 trường hợp sau đây:
Trường hợp tiêu thức thay phiên – lượng biến của tiêu thức phân tổ chỉ có hai
biểu hiện: mức trên hoặc mức dưới một trị số lượng biến nào đó.
Ví dụ: phân tổ của doanh nghiệp thủ công mỹ nghệ để nghiên cứu quy mô doanh nghiệp
theo hai biểu hiện của tiêu thức số công nhân: dưới 200 công nhân và trên 200 công
nhân. Do đó hình thành 2 tổ: tổ dưới 200 công nhân và tổ trên 200 công nhân.
Trường hợp có một số hữu hạn tương đối cố định lượng biến rời rạc không
liên tục thì mỗi lượng biến hình thành một tổ. Số tổ bằng số hạn lượng biến.
Ví dụ: phân tổ hộ gia đình theo số con có trong gia đình Phân tổ không có
khoảng cách tổ
Trường hợp tiêu thức lượng biến liên tục hoặc không liên tục (rời rạc) có rất
nhiều biểu hiện về mặt lượng.
Ví dụ: tiêu thức tuổi đời của dân số. Trong trường hợp này không thể căn cứ vào mỗi
biểu hiện về mặt lượng để hình thành một tổ. Vì như vậy số tổ được phân chia sẽ rất
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 31
nhiều mà điều quan trọng giữa các tổ không khác biệt nhau về chất, đặc trưng cơ bản của
hiện tượng, do đó không đáp ứng được yêu cầu phân tích. Vì vậy phải thực hiện ghép tổ
để có được một số tổ thích hợp cần thiết. Nguyên tắc cơ bản thực hiện ghép tổ là dựa vào
quy luật vận động nghiên cứu trong triết học “ lượng biến dẫn đến chất biến”. Phải phân
tích sâu sắc về mặt lý luận khoa học kết hợp với phân tích đầy đủ thực tiễn tồn tại và
xem xét đến mục đích yêu cầu nghiên cứu đê xác định lượng biến được tích tụ đến một
mức độ nào đó thì sẽ tạo ra một chất mới và phải được hình thành một tổ khác. Trên cơ
sở phân tích như vậy sẽ xác định số tổ cần chia.
Ví dụ phân tuổi dân cư theo độ tuổi lao động sẽ hình thành được 3 tổ: tổ dân cư chưa đến
tuổi lao động, tổ dân cư trong độ tuổi lao động, tổ dân cư ngoài tuổi lao động.
- Trường hợp phân tổ không có khoảng cách tổ bằng nhau: các đơn vị tổng thể có sự
khác nhau nhiều về chất và sự biến đổi về lượng diễn ra không đều nhau. Do đó, việc
xác định khoảng cách tổ dựa vào phương pháp phân tích về lý luận khoa học bản chất
của hiện tượng và phân tích sâu sắc thực tế tồn tại của hiện tượng nghiên cứu để xem xét
lượng biến dao động đến mức độ nào thì các đơn vị tổng thể hiện tượng nghiên cứu sẽ có
cùng hoặc gần giống nhau về tính chất đặc trưng cơ bản từ đó sẽ xếp vào cùng một tổ.
-Trường hợp phân tổ có khoảng cách tổ bằng nhau: các đơn vị tổng thể hiện tượng
nghiên cứu không có sự khác biệt lớn về chất và đặc trưng cơ bản, hay nói cách khác có
sự đồng nhất về chất; sự biến đổi về lượng trong các đơn vị tổng thể nhìn chung diễn ra
khá đồng đều, không có sự cách biệt lớn.
Do đó phương pháp xác định khoảng cách tổ dựa trên công thức:
=
−
d:Khoảng cách tổ
xmax: lượng biến lớn nhất của tiêu thức phân tổ
xmin: Lượng biến nhỏ nhất của tiêu thức phân tổ
n:Số tổ dự định chia.
3.2.2.3. Phân phối các đơn vị vào từng tổ
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 32
Sau khi xác định số tổ và khoảng cách tổ, bước cuối cùng là phân phối các đơn vị
vào từng tổ và tính toán trị số cảu các chỉ tiêu giải thích nếu có.
3.2.3 Dãy số phân phối
3.2.3.1. Khái niệm và các loại dãy số phân phối
Dãy số phân phối theo tiêu thức thuộc tính: phản ánh kết cấu của tổng thể theo
một tiêu thức thuộc tính nào đó.
Ví dụ: dãy số phân phối giá trị sản xuất công nghiệp theo thành phần kinh tế.
Dãy số phân phối theo tiêu thức số lượng: phản ánh kết cấu của tổng thể theo một
tiêu thức số lượng nào đó.
Ví dụ: dãy số phân phối một tổng thể lao động theo mức lương.
3.2.3.2. Dãy số lượng biến
Dãy số lượng biến là kết quả của việc phân tổ theo tiêu thức số lượng. Một dãy số
lượng biến có các thành phần chu yếu sau:
- Thành phần thứ nhất là lượng biến: lượng biến là các trị số nói lên biểu hiện cụ thể của
tiêu thức số lượng, thường được ký hiệu là xi . Lượng biến của tiêu thức được chia làm 2
loại: lượng biến liên tục và lượng biến rời rạc.
-Thành phần thứ 2 của lượng biến là tần số. Tần số là số đơn vị được phân phối vào mỗi
tổ, tức là số lần một lượng biến nhận một trị số nhất định trong một tổng thể.
Ngoài 2 thành phần nói trên người ta còn thường tính tần số (tần suất) tích lũy tức cộng
dồn tần số. Tần số tích lũy (Si) cho biết số đơn vị có lượng biến lớn hơn hoặc nhỏ hơn
một lượng biến cụ thể nào đó và là cơ sở để xác định một đơn vị đứng ở vị trí nào đó
trong dãy số lượng biến là bao nhiêu.
3.3 SỐ TUYỆT ĐỐI TRONG THỐNG KÊ
3.3.1. Khái niệm và ý nghĩa số tuyệt đối
Số tuyệt đối trong thống kê là chỉ tiêu thể hiện quy mô, khối lượng cảu hiện tượng kinh
tế xã hội trong điều kiện và thời gian cụ thể.
Số tuyệt đối biểu hiện số đơn vị của tổng thể hay bộ phận của tổng thể.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 33
Ví dụ: số doanh nghiệp của công ty A.
Số tuyệt đối biểu hiện tổng trị số của một tiêu thức, một chỉ tiêu kinh tế xã hội.
Ví dụ:tổng giá trị sản suất của một quốc gia.
Số tuyệt đối có ý nghĩa trong công tác quản lý kinh tế xã hội. Bởi vị qua số tuyệt đối có
thể nhận thức rõ ràng cụ thể, có sức thuyệt phục không thể phủ nhận được về khối lượng
quy mô, kết quả sản xuất thực tế.
Số tuyệt đối là cơ sở đầu tiên thực hiện phân tích thống kê, đồng thời còn làm cở sở để
tính các chỉ tiêu mức độ khối lượng tăng trưởng, số bình quân, chỉ tiêu tốc độ phát triển.
Số tuyệt đối trong thống kê là căn cứ không thể thiếu được trong việc xậy dựng các dự
án, kế hoạch phát triển kinh tế xã hội, tổ chức chỉ đạo thực hiện và kiểm tra kết quả tình
hình thực hiện kế hoạch phát triển kinh tế xã hội.
3.3.2. Đặc điểm của số tuyệt đối
Số tuyệt đối trong thống kê luôn gắn liền với một hiện tượng kinh tế xã hội nhất định.
Mỗi trị số của số tuyệt đối đều mang trong nó một nội dung kinh tế nhất định ở từng thời
gian và địa điểmb cụ thể, do đó chúng khác hoàn toàn với số tuyệt đối trong toán học.
Muốn xác định đúng đắn số tuyệt đối, vấn đề quan trong trước hết là phải xác định nội
dung kinh tế mà nó phản ánh.
Số tuyệt đối trong thống kê không phải là số tuyệt đối trong toán học được lựa chọn một
cách tùy ý, mà những con số thu được thông qua phương pháp thống kê cụ thể.
3.3.3. Đơn vị tính số tuyệt đối
Tùy theo tính chất và đối tượng nghiên cứu, số tuyệt đối bao giờ cũng có đơn vị đo phù
hợp bao gồm: đơn vị hiện vật tự nhiên (con, cái, chiếc), hay đợn vị đo lường (m, kg, lít),
đơn vị tiền tệ, đơn vị thời gian lao động
3.3.4. Các loại số tuyệt đối
Có thể phân biệt hai loại số tuyệt đối sau:
Số tuyệt đối thời kỳ: là chỉ tiêu phản ánh quy mô, khối lượng của hiện tượng nghiên cứu
trong một khoảng thời gian nhất định. Chúng được hình thành thông qua sự tích lũy
(cộng đồn) về lượng trong suốt thời gian nghiên cứu.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 34
Ví dụ: giá trị sản xuất công nghiệp trong một năm.
Số tuyệt đối thời kỳ của cùng một chỉ tiêu có thể cộng được với nhau để có trị số của
thời kỳ dài hơn. Nều thời kỳ tính toán càng dài thù trị số của chỉ tiêu càng lớn.
Số tuyệt đối thời điểm là chỉ tiêu phản ánh quy mô, khối lượng của hiện tượng trong một
thời điểm nhất định.
Ví dụ: tổng dân số Việt Nam lúc 0 giờ, ngày 4 tháng 1 năm 1999.
Số tuyệt đối thời điểm chỉ hiện trạng của sự vật tại thời điểm cụ thể, trước và sau thời
điểm nghiên cứu, mức độ khối lượng tuyệt đối có thể bị biến đổi khác đi về trạng thái,
quy mô.
3.4. SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ
3.4.1.Khái niệm và ý nghĩa số tương đối
Số tương đối trong thống kê là chỉ tiêu biểu hiện quan hệ so sánh giữa hai mức độ của
hiện tượng nghiên cứu.
Từ khái niệm trên ta thấy có hai trường hợp so sánh sau:
So sánh hai mức độ cùng loại nhưng khác nhau về điều kiện thời gian và không gian
ví dụ:
Hai hiện tượng khác loại nhưng có mối quan hệ với nhau.
Ví dụ:
Số tương đối trong thống kê có ý nghĩa quan trọng, là một trong những chỉ tiêu phân tích
thống kê cơ bản, tạo khả năng cho ta đí sâu nghiên cứu, phân tích bản chất và mối quan
hệ của các hiện tượng và quá trình kinh tế xã hội, những mối liên hệ đó có thể là kết cấu,
quan hệ tỷ lệ, tốc độ phát triển, quan hệ só sánh.
Số tương đối còn sử dụng để công bố khi muốn giữ bí mật số tuyệt đối.
Số tương đối giúp ta nghiên cứu, phân tích các hiện tượng mà nhiều khi chỉ số tuyệt đối
không nêu rõ được.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 35
Ví dụ: so sánh mức sống dan cư năm 2004 và năm 2003 có được nâng cao hay không.
Ta có thể so sánh mức chỉ tiêu bình quân đầu người năm 2004 với năm 2003, qua đó ta
biết được tốc độ phát triển của mức sống dân cư là tăng lên hay giảm đi.
3.4.2. Đặc điểm và hình thức biểu hiện số tương đối
Số tương đối không phải là số liệu trực tiếp thu thập từ tài liệu, có sẵn trong thực
tế mà chúng được hình thành dựa vào việc tính toán từ các số tuyệt đối, số bình quân
Bất kỳ số tương đối nào cũng có gốc để so sánh, tùy thuộc vào mục đích nghiên cứu
khác nhau mà chọn gốc so sánh phù hợp.
Đơn vị tính số tuyệt đối là: lần, %, phần ngàn, hoặc đơn vị kép (người/km2)
3.4.3. Các loại số tương đối
a.Số tương đối động thái (tốc độ phát triển) là kết quả so sánh giữa hai mức độ của
cùng một hiện tượng nhưng khác nhau về thời gian.
Công thức: t =
t: số tuyệt đối động thái (lần hoặc %)
y0: mức độ của hiện tượng kỳ gốc
y1: mức độ hiện tượng nghiên cứu kỳ báo cáo.
Ví dụ: có số liệu sản phẩm A đượcsản xuất trong hai năm như sau: năm 2004 sản xuất
1000 tấn, năm 2005 sản xuất 1500 tấn.
Số tương đối động thái:
t=
=1,5=150%.
Nếu ta tính các số tương đối động thái kỳ gốc y0 thay đổi và kề ngay trước kỳ báo cáo,
khi đó ta có các số động thái liên hoàn (hay còn gọi tốc độ phát triển liên hoàn)
Nếu ta tính các số tương đối động thái kỳ gốc y0 cố định, khi đó ta có số tương đối động
thái kỳ gốc (hay còn gọi tốc độ phát triển định gốc)
b.Số tương đối kế hoạch: là kết quả so sánh giữa hai mức độ kế hoạch với mức độ thực
tế của chỉ tiêu ấy ở kỳ gốc.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 36
Số tương đối nhiệm vụ kế hoạch:
Công thức:
Kn =
Kn: mức độ kỳ kế hoạch
Yk: mức độ kế hoạch
Số tương đối thực hiện kế hoạch
Công thức: :
KT =
Mối quan hế giữa ba loại số tương đối:
t= Kn * KT
c.Số tương đối kết cấu: được dùng để xác định tỷ trọng của mỗi bộ phận cấu thàh trong
tổng thể.
Công thức:
số tương đối kết cấu=
đ
đ
∗100%
d.Số tương đối cường độ: biểu hiện trình độ phổ biến của hiện tượng nghiên cứu trong
một điều kiện lịch sử nhất định. Số tương đối này được tính bằng cách so sánh chỉ tiêu
của hai hiện tượng khác nhau nhưng có liên quan với nhau.
e.Số tương đối không gian: là loại số tương đối biểu hiện sự so sánh về mức độ giữa hai
bộ phận trong một tổng thể, hoặc giữa hai hiện tượng cùng loại nhưng khác nhau về điều
kiện không gian.
3.4.4. Một số vấn đề vận dụng chung số tương đối và số tuyệt đối
Khi sử dụng số tương đối và số tuyệt đối phải xét đến đặc điểm của hiện tượng nghiên
cứu để rút ra kết luận cho đúng.
Phải vận dụng một cách kết hợp số tương đối và số tuyệt đối.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 37
3.5. SỐ BÌNH QUÂN TRONG THỐNG KÊ
3.5.1.Khái niệm, ý nghĩa số bình quân trong thống kê
Số bình quân trong thống kê là mức độ biểu hiện trị số đại biểu theo một tiêu thức nào
đó của một tổng thể bao gồm nhiều đơn vị cùng loại.
Nghiên cứu số bình quân có thể biết được xu hướng phát triển của tông thể.
Có thể sử dụng số bình quân để so sánh các đại lượng không có cùng quy mô và trình độ
đồng đều của tổng thể.
Số bình quân rất thông dụng trong lĩnh vực nghiên cứu kinh tế, xã hội.
3.5.2. Các loại số bình quân
a.Số bình quân cộng
* Số bình quân cộng giản đơn (hay trung bình cộng giản đơn):được vận dụng khi các
lượng biến có cùng tần số và bằng 1.
Công thức:
x =
⋯
hay x =
∑
*.Số bình quân cộng gia quyền(trung bình cộng gia quyền): vận dụng khi các lượng
biến có tần số khác nhau.
Công thức:
̅ =
∑ ∗
∑
*.Tính số bình quân từ một dãy số lượng biến có khoảng cách tổ. Người ta thường lấy trị
số giữa làm đại diện cho từng tổ
Công thức:
Trị số giữa của mỗi tổ =
Trong đó: xmax, xmin là giới hạn trên và giới hạn dưới của tổ có khoảng cách tổ.
*.TÍnh số bình quân chung từ các số bình quân tổ.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 38
Công thức:
̅ =
∑
∑
b.Số bình quân điều hòa
Số bình quân điều hòa cũng có nội dung kinh tế như số bình quân cộng, tính được bằng
cách đem chia tổng các lượng biến của tiêu thức cho số đơn vị tổng thể. Nhưng ở đây vì
không có sẵn tài liệu về số đơn vị tổng thể, nên phải dựa vào các tài liệu khác để tính ra.
Công thức:
̅=
∑
∑
∗
Trong đó: xi : các lượng biến
̅: số bình quân
Mi =xi*fi –tổng các lượng biến của tiêu thức trong từng tổ là quyền số của số
bình quân điều hòa.
c.Số bình quân nhân là số bình của những đại lượng có mối quan hệ tích với nhau.
Công thức:
̅ = ∏
3.5.3. Mốt
Mốt (M0) là trị số lượng biến của một tiêu thức được gặp nhiều nhất trong tổng thể hay
trong một dãy phân phối.
Cách xác định M0.
Dãy số lượng biến không có khoảng cách tổ: mốt là lượng biến có tần số lớn nhất.
Dãy số lượng biến có khoảng cách tổ.
Bước 1. xác định tổ chứa mốt.
Tổ có khoảng cách tổ đều nhau Tổ có khoảng cách không đều nhau
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 39
Tổ nào có tần số lớn nhất thì tổ đó chứa
mốt
Tính mật độ phân bố (fi/hi)
Tổ nào có mật độ phân bố lớn nhất tổ đó
chứ mốt
Bước 2. tính Mốt
Công thức tính:
Mốt là chỉ tiêu nói lên mức độ phổ biến rộng rãi chung của tổng thể hiện tượng nghiên
cứu. Do đó có thể sử dụng bổ sung cho mức độ bình quân, trong trường hợp tính toán số
bình quân gặp khó khăn.
Mốt không chịu ảnh hưởng của các lượng biến đột xuất, không có tính săn bằng bù trừ
chênh lệch giữa các lượng biến trong dãy số phân phối. Nhưng cũng chính điều này làm
cho mốt kém nhạy bén đối với sự biến thiên của tiêu thức.
Trong thực tế người ta sử dụng mốt để nghiên cứu nhu cầu thị trường về một loại kích
cỡ sản phẩm nào đó như giày dépngoài ra mốt còn cho biết đa số, thể hiện khuynh
hướng phong trào.
3.5.4. Trung vị
Số trung vị (Me) là lượng biến của đơn vị đứng ở vị trí chính giữa trong dãy số lượng
biến đã được sắp xếp theo thứ tự tăng dần. Số trung vị chia dãy số lượng biến thành 2
phần bằng nhau.
Cách xác định số trung vị:
+.Dãy số lượng biến không có khoảng cách tổ
-.Trường hợp n là số chẵn: số trung vị sẽ là lượng biến đứng ở vị tri giữa dãy số. Tức là
đứng ở vị trí thứ (n+1)/2.
-Trường hợp n là số chẵn: số trung vị là kết quả trung bình cộng của hai lượng biến đứng
ở vị trí chính giữa, nghĩa là trung bình cộng của hai lượng biến đứng ở vị trí n/2 và
(n+2)/2.
+Dãy số lượng biến có khoảng cách tổ
Bước 1.xác định tổ chưá trung vị
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 40
-Tính tần số tích lũy
- Trung vị thuộc vị trí:
∑ ( )
Bước 2. tính số trung vị bằng công thức gần đúng.
Công thức:
= + h*
∑
Trong đó:
xMe: cận dưới của tổ chứa trung vị
h:khoảng cách tổ
SMe -1:tần số tích lũy đứng liền trước tổ chứa trung vị.
FMe: tần số của tổ chứa số trung vị
Về ý nghĩa kinh tế, số trung vị cũng tương tự số chưa mốt nhưng số trung vị được
sử dụng rộng rãi hơn, nó biểu hiện mức độ đại diện của hiện tượng, và cũng có thể thay
số bìh quân khi tính toán chỉ tiêu này gặp khó khăn, ngoài ra số trung vị còn là một trong
các chỉ tiêu dùng để nêu lên đặc trưng phân phối của dãy số.
3.5.5. Điều kiện vận dụng số bình quân trong thống kê một cách khoa học và chính
xác
Số bình quân chỉ được tính ra từ tổng thể đồng chất.
Số bình quân chung cần được vận dụng kết hợp với số bình quân tổ hoặc dãy số phân
phối.
3.6. CÁC CHỈ TIÊU ĐO ĐỘ BIẾN THIÊN CỦA TIÊU THỨC
3.6.1. Ý nghĩa nghiên cứu độ biến thiên của tiêu thức
Các chỉ tiêu đo độ biến thiên của tiêu thức giúp ta xét trình độ đại biểu của số bình quân
Quan sát sự biến thiên của tiêu thức trong một dãy số lượng biến, sẽ thấy rõ được nhiều
đặc trưng của dãy số, như đặc trưng về phân phối, về kết cấu, về tính chất đồng đều của
tổng thể nghiên cứu.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 41
Trong phân tích hoàn thành kế hoạch, các chỉ tiêu đánh giá độ biến thiên của tiêu thức
giúp ta thấy rõ được chất lượng công tác, và nhịp điệu hoàn thành kế hoạch chung cũng
như xủa từng bộ phận, phát hiện khả năng tiềm tàng của các đơn vị.
Các chỉ tiêu đánh giá độ biến thiên của tiêu thức còn được sử dụng trong nhiều trường
hợp nghiên cứu khác như: phân tích biến động, phân tích mối liên hệ, dự đoán thống
kê...
3.6.2.Các chỉ tiêu đo độ biến thiên của tiêu thức
a.Khoảng biến thiên: là độ lệch giữa lượng biến lớn nhất và lượng biến nhỉ nhất của
tiêu thức nghiên cứu.
Công thức:
R=xmax - xmin
Trong đó:
R: khoảng biến thiên
xmax, xmin :lượng biến lớn nhất và nhỏ nhất của tiêu thức nghiên cứu.
Khoảng biến thiên càng nhỏ thì tổng thể càng đồng đều, số trung bình mang tính đại diện
cao, và ngược lại.
Khoảng biến thiên phụ thuộc vào lượng biến lớn nhất và nhỏ nhất, do đó chỉ tiêu này
không dùng cho được bảng phân tổ mở.
b.Độ lệch tuyệt đối bình quân: là số trung bình cộng của các độ lệch tuyệt đối giữa các
lượng biến và trị số trung bình cộng của các lượng biến đó.
Công thức:
̅ =
∑| ̅|
̅ =
∑ ∗| ̅|
∑
Trong đó:
̅: độ lêch tuyệt đối bình quân
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 42
̅: số bình quân cộng của các lượng biến xi
| |: ký hiệu biểu hiện các trị tuyệt đối
Dựa vào độ lêch tuyệt đối bình quân tính được ta cũng có kết luận như các chỉ tiêu trên.
Độ lệch tuyệt đối bình quân càng nhỏ thì tổng thể càng đồng đều, do đó tính địa biểu của
só trung bình càng cao.
Độ lêch tuyệt đối có ưu điểm hơn khoảng biến thiên vì nó xét đến tất cả các lượng biến
trong tổng thể. Tuy nhiên, độ lệch tuyệt đối bình quân cũng có hạn chế nhất định, độ
lệch tuyệt đối bình quân chỉ mới xét đến dấu cộng (biến động tăng) mà bỏ qua sự khác
nhau về dấu âm (biến động giảm), dẫn đến kết luận về sự biến thiên của tiêu thức nhiều
lúc bị sai.
c.Phương sai: là số trung bình cộng của bình phương các độ lệch giữa các lượng biến với
vị trí trung bình cộng của các lượng biến đó. Phương sai đo mức độ phân tán của các
biến lượng xung quanh số bình quân
Công thức: =
∑( )
=
∑ ( ̅)
∑
d. Độ lệch tiêu chuẩn: là căn bậc hai của phương sai, tức là số bình quân toàn phương
của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng
biến đó.
Công thức:
σ =
∑( )
σ =
∑ ( ̅)
∑
e. Hế số biến thiên: là số tương đối (%) rút ra từ sự so sánh giữa độ lệch tuyệt đối bình
quân (hoặc độ lệch chuẩn) với số bình quân cộng.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 43
Công thức:
V =
̅
V: hệ số biến thiên
̅ : độ lệch tuyệt đối bình quân
σ: độ lệch tiêu chuẩn
̅ : số bình quân cộng
3.6.3. Một số vấn đề tính toán và vận dụng phương sai
Phương sai của tiêu thức thay phiên
Quy tắc cộng phương sai.
3.7. Chỉ số
3.7.1. Khái niệm, đặc điểm và tác dụng của chỉ số trong thống kê
3.7.1.1. Khái niệm và phân loại chỉ số
a.Khái niêm
Chỉ số trong thống kê là số tương đối biểu hiện quan hệ so sánh giữa hai mức độ của
một hiện tượng nghiên cứu.
Chỉ số trong thống kê được xác định bằng cách thiết lập quan hệ so sánh giữa hai mức
độ của hiện tượng ở hai thời gian hoặc không gian khác nhau nhằm nêu lên sự biến
động qua thời gian hoặc sự khác biệt về không gian của một hiện tượng nghiên cứu.
Ví dụ: doanh số của công ty năm 2003 co với năm 2002 bằng 110,7% (hay 1,107 lần)
là chỉ số biểu hiện quan hệ so sánh giữa doanh số của công ty qua hai năm.
b.Phân loại
-Căn cứ vào đạc điểm thiết lập quan hệ so sánh, phân biệt:
Chỉ số phát triển: biểu hiện quan hệ so sánh giữa hai mức độ của hiện tượng ở hai thời
gian khác nhau.
Ví dụ: doanh số của công ty A ở ví dụ trên là chỉ số phát triển phản ánh biến động
doanh số của công ty qua hai năm.
Chỉ số kế hoạch: biểu hiện quan hệ so sánh giữa các mức độ thực tế và kế hoạch của
chỉ tiêu nghiên cứu bao gồm chỉ số nhiệm vụ kế hoạch và chỉ số thực hiện kế hoạch.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 44
Chỉ số không gian: biểu hiện quan hệ so sánh giữa hai mức độ của hiện tượng ở hai điề
kiện không gian khác nhau.
Ví dụ: doanh số của công ty A trong quý I năm 2004 ở thị trường miền Bắc so với thị
trường miền Nam là 96,8%.
-Căn cứ vào phạm vi tính toán
Chỉ số đơn (cá thể): là chỉ số phản ánh biến động của từng phần tử, từng đơn vị trong
tổng thể.
Ví dụ: chỉ số giá bán lẻ một mặt hàng, chỉ số sản lượng của một loại sản phẩm,
Chỉ số tổng hợp: là chỉ số phản ánh biến động chung của một nhóm đơn vị hoặc toàn
bộ tổng thể nghiên cứu.
Ví dụ: chỉ số giá tiêu dung CPI..
-Căn cứ vào tính chất của tiêu thức nghiên cứu:
Chỉ số chỉ tiêu khối lượng: được thiết lập đối với chỉ tiêu khối lượng, là những chỉ tiêu
biểu hiện quy mô, khối lượng của hiện tượng nghiên cứu.
Ví dụ: chỉ số lượng hang tiêu thụ, chỉ số quy mô lao động,
Chỉ số chỉ tiêu chất lượng: được thiết lập đối với chỉ tiêu chất lượng.
Ví dụ: chỉ số giá, chỉ số giá thành, chỉ số năng suất lao động.
3.7.1.2. Đặc điểm của phương pháp chỉ số
Xây dựng chỉ số đối với hiện tượng kinh tế phức tạp thì biểu hiện về lượng của các
phần tử được chuyển về dạng chung để có thể cộng trực tiếp với nhau, dựa trên cơ sở
mối quan hệ giữa yếu tố nghiên cứu với các yếu tố khác.
Khi có nhiều yếu tố tham gia công thức tính chỉ số, việc phân tích biến động của một
yếu tố được đặt trong điều kiện các yếu tố khác không đổi.
3.7.1.3. Tác dụng của chỉ số trong thống kê
Biểu hiện biến động của hiện tượng nghiên cứu qua thời gian (chỉ số phát triển).
Biểu hiện biến động của hiện tượng nghiên cứu trong điều kiệ không gian khác nhau
(chỉ số không gian)
Biểu hiện kế hoạch và phân tích tình hình thực hiện kế hoạch đối với các chỉ tiêu
nghiên cứu. Phân tích vai trò và ảnh hưởng của từng nhân tố đối với biến động của hiện
tượng kinh tế phức tạp được cấu thành từ nhiều nhân tố. Thực chất đây cũng là phương
pháp phân tích mối liên hệ, nhằm nêu lên nguyên nhân quyết định sự biến động của
hiện tượng phức tạp và tính toán cụ thể mức độ ảnh hưởng của mỗi nguyên nhân này.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 45
3.7.2. CHỈ SỐ PHÁT TRIỂN
3.7.2.1.Chỉ số đơn (cá thể)
Chỉ số đơn giá: biểu hiện quan hệ so sánh giữa mức giá của từng mặt hang ở hai thời
gian.
Công thức:
=
Trong đó;
ip: chỉ số đơn giá
p1: giá bán lẻ của mặt hang kỳ nghiên cứu
p0: giá bán lẻ mặt hàng kỳ gốc.
chỉ số đơn phản ánh biến động giá bán của từng mặt hang ở kỳ nghiên cứu so với kỳ
gốc.
Chỉ số đơn lượng tiêu thụ: biể hiện quan hệ so sánh giữa khối lượng tiêu thụ của từng
mặt hàng ở hai thời gian.
Công thức:
Trong đó:
iq: chỉ số đơn lượng tiêu thụ
q1: khối lượng tiêu thụ của mặt hàng kỳ nghiên cứu
q0: khối lượng tiêu thụ của mặt hàng kỳ gốc.
3.7.2.2.Chỉ số tổng hợp
a.Chỉ số tổng hợp giá
Chỉ số tổng hợp giá biểu hiện quan hệ so sánh giữa giá bán của một nhóm hay toàn bộ
các mặt hàng kỳ nghiên cứu với kỳ gốc và qua đó phản ánh biến động chung giá bán
các mặt hàng.
Công thức:
∑
∑
Trong đó:
Ip: chỉ số tổng hợp giá cả
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 46
q: lượng tiêu thụ mỗi mặt hàng
p1 và p0: giá bán mỗi mặt hàng kỳ nghiên cứu và kỳ gốc
Chỉ số tổng hợp giá Laspeyres: là chỉ số tổng hợp giá cả với quyền số là lượng tiêu thụ
của mỗi mặt hàng ở kỳ gốc.
Công thức:
∑
∑
=
∑
∑
Đặt d0 =
∑
Thì chỉ số tổng hợp giá được xác định như sau;
= ∑
Chỉ số tổng hợp giá cả Passche: là chỉ số tổng hợp giá cả với quyền số là khối lượng
tiêu thụ mỗ mặt hàng kỳ nghiê cứu.
Công thức:
∑
∑
=
∑
∑
Đặt d1 = =
∑
Thì chỉ số tổng hợp Passche có dạng:
=
∑
Chỉ số tổng hợp giá cả Fisher: phản ánh biến động chung giá bán các mặt hàng dựa trên
cơ sở san bằng chênh lệch giữa các chỉ số Laspeyres và Passche theo công thức bình
quân nhân
Công thức:
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 47
=
∑
∑
∗
∑
∑
b. Chỉ số tổng hợp lượng hàng tiêu thụ
Chỉ số tổng hợp lượng hàng tiêu thụ biểu hiện quan hệ so sánh giữa khối lượng tiêu thụ
của một nhóm hay toàn bộ các mặt hàng thuộc phạm vi nghiên cứu giữa hai thời gian và
qua đó phản ánh biến động chung về khối luwongj tiêu thụ của các mặt hàng.
Công thức:
∑
∑
Trong đó:
Iq: chỉ số tổng hợp lượng hàng tiêu thụ
q1 và q0: lượng tiêu thụ mặt hàng kỳ nghiên cứu và kỳ gốc.
p: giá bán của mỗi mặt hàng
Chỉ số tổng hợp lượng hàng tiêu thụ Laspeyres
Công thức:
∑
∑
Chỉ số tổng hợp lượng hàng tiêu thụ Passche
Công thức:
∑
∑
Chỉ số tổng hợp lượng hàng tiêu thụ Fisher
Công thức:
=
∑
∑
∗
∑
∑
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 48
c. Quyến số của chỉ số phát triển
Quyền số của chỉ số là những đại lượng được giữ cố định trong công thức chỉ sô tổng
hợp.
Trong các công thức chỉ số tổng hợp, quyền số có hai tác dụng;
-Làm cho các phần tử với đại lượng biểu hiện không thể trực tiếp cộng được với nhau
được chuyển về cùng một đại lượng đồng nhất và có thể tổng hợp.
-Biểu hiện vai trò và tầm quan trọng của mỗi phần tử hay bộ phận trong toàn bộ tổng
thể.
Lựa chọn nhân tố giữ vai trò quyền số: việc lựa chọn nhân tố làm quyền số phải căn cứ
vào lý thuyết về mối quan hệ giữa các nhân tố và mục đích nghiên cứu.
Xác định thời gian cho quyền số: quyền số của mỗi chỉ số tổng hợp có thể được chọn
theo các kỳ khác nhau (kỳ gốc, kỳ báo cáo, kỳ kế hoạch)tùy thuộc vào mục đích nghiên
cứu và điều kiện dữ liệu thực tế. Sử dụng quyền số với thời gian khác nhau thì ý nghĩa
phân tích của chỉ số có những điểm khác nhau.
3.7.3. CHỈ SỐ KHÔNG GIAN
Chỉ số không gian biểu hiện quan hệ so sánh của hiện tượng nghiên cứu ở các điều kiện
không gian khác nhau.
3.7.3.1. Chỉ số đơn
Khi so sánh theo không gian, chỉ số đơn phản ánh quan hệ so sánh về giá bán hay lượng
hàng tiêu thụ của từng mặt hàng ở hai thị trường, khu vực
Ví dụ: so sánh giữa hai thị trường A và B. Trên cơ sở xác định mức giá đại diện và
lượng tiêu thụ của từng mặt hàng ở các thị trường, các công thức so sánh giữa hai thị
trường thể hiện như sau:
Chỉ số đơn giá so sánh giữa hai thị trường:
⁄ =
Chỉ số đơn lượng tiêu thu so sánh giữa hai thị trường:
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 49
⁄ =
3.7.3.2. Chỉ số tổng hợp
a.Chỉ số tổng hợp giá
Chỉ số tổng hợp giá so sánh không gian sử dụng để so sánh giá bán một nhóm hay toàn
bộ các mặt hàng ở hai điều kiện không gian khác nhau.
Chỉ số tổng hợp :
⁄ =
∑
∑
Với Q = qA + qB:tổng lượng tiêu thụ từng mặt hàng ở hai thị trường A và B.
b.Chỉ số tổng hợp lượng hàng tiêu thụ
Quyền số của chỉ số tổng hợp lượng hàng tiêu thụ có thể là giá cố định do nhà nước quy
định hoặc giá trung bình của từng mặt hàng ở hai thị trường.
Trường hợp sử dụng quyền số là giá cố định, song thức chỉ số tổng hợp lượng tiêu thụ so
sánh giữa hai thị trường thể hiện như sau:
⁄ =
∑
∑
Trong đó: pn là giá cố định của các mặt hàng.
Trường hợp căn cứ vào giá bán ở cả hai thị trường để xác định giá bình quân của từng
mặt hàng thì chì chỉ số tổng hợp lượng hàng tiêu thụ thể hiện như sau:
⁄ =
∑ ̅
∑ ̅
Trong đó: giá trung bình của từng mặt hàngđược tính theo công thức trung bình cộng gia
quyền với quyền số là lượng tiêu thu ở mỗi thị trường.
̅ =
3.7.4. CHỈ SỐ KẾ HOẠCH
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 50
Chỉ số kế hoạch biểu hiện nhiệm vụ kế hoạch hoặc tình hình thực hiện kế hoạch đối với
từng chỉ tiêu.
Nếu căn cứ vào sản lượng thực tế của doanh nghiệp ở các kỳ, có thể thiết lập các chỉ số
sau;
Chỉ số kế hoạch giá thành:
=
∑
∑
Chỉ số thực hiện kế hoạch giá thành:
=
∑
∑
Nếu căn cứ vào sản lượng của doanh nghiệp, có thể thiết lập các chỉ số sau:
Chỉ số kế hoạch giá thành;
=
∑
∑
Chỉ số thực hiện kê hoạch giá thành:
=
∑
∑
3.7.5. HỆ THỐNG CHỈ SỐ
3.7.5.1. Khái niệm và cấu thành hệ thống chỉ số
Hệ thống chỉ số là một dãy các chỉ số có liên hệ với nhau, hợp thành một phương trình
cân bằng.
Hệ thống chỉ số thông thường được vận dụng để phân tích mối lien hệ giữa các chỉ tiêu
trong quá trình biến động. Trong nghiên cứu kinh tế, nhiều chỉ tiêu tổng hợp có thể được
cấu thành từ những nhân tố lien quan thể hiện dưới dạng các phương trình kinh tế và
chính mối quan hệ đó là cơ sở để thiết lập các hệ thống chỉ số.
Chỉ số sản lượng =
Chỉ số năng suất
lao động
*
Chỉ số quy
mô lao động
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 51
Chỉ số doanh thu = chỉ số giá * chỉ số lượng hàng tiêu thụ * chỉ số lượng hàng tiêu thụ
Như vậy, cấu thành của một hệ thống chỉ số thường bao gồm một chỉ số toàn bộ và các
chỉ số nhân tố.
Chỉ số toàn bộ phản ánh sự biến động của hiện tượng phức tạp (được biểu hiện
qua một chỉ tiêu nào đó) do ảnh hưởng của các nhân tố cấu thành.
Chỉ số nhân tố phản ánh ảnh hưởng sự biến động của từng nhân tố đối với sự biến
động của hiện tượng phức tạp.
3.7.5.2.Tác dụng của hệ thống chỉ sô
Trong phân tích thống kê, hệ thống chỉ số vận dụng đối với các chỉ tiêu có mối quan hệ
với nhau và có các tác dụng sau;
Xác định vai trò và mức độ ảnh hưởng biến động của các nhân tố đối với sự biến động
của hiện tượng được cấu thành từ nhiều nhân tố.
Dựa vào hệ thống chỉ số có thể nhanh chóng xác định được một số chỉ tiêu chưa biết khi
biết các chỉ số khác trong hệ thống.
3.7.5.3.Phương pháp xây dựng hệ thống chỉ số
a.Phương pháp liên hoàn
Phương pháp này dựa trên cơ sở lý luận là các nhân tố cấu thánh một hiện tượng phức
tạp đều cùng biến động, do đó để nghiên cứu ảnh hưởng của từng nhân tố phải giả định
các nhân tố lần lượt biến động. Thứ tự phân tích của các nhân tố trong hệ thống chỉ số
được xác định chủ yếu thông qua việc phân biệt các nhân tố mang tính chất lượng hay số
lượng.
Trên cơ sở xác định các nhân tố, hệ thống chỉ số theo phương pháp lien hoàn mang
những đặc điểm sau:
-Một chỉ tiêu tổng hợp của hiện tượng phức tạp có bao nhiêu nhân tố thì hệ thống chỉ số
có bấy nhiêu chỉ số nhân tố. Mỗi nhân tố là cơ sở để hình thành 1 chỉ số nhân tố.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 52
-Trong hệ thống chỉ số, chỉ số toàn bộ bằng tích của các chỉ số nhân tố và mẫu số của chỉ
số nhân tố đứng trước giống với tử số của chỉ số nhân tố đứng sau. DO đó, sự kết hợp
của các chỉ số nhân tố hình thành một dãy các chỉ số lien tục, khép kin và đảm bảo quan
hệ cân bằng.
-Chênh lệnh tuyệt đối giữa tử số và mẫu số của chỉ số toàn bộ bằng tổng các chênh lệch
tuyệt đối giữa tử số và mẫu số của các chỉ số nhân tố.
Theo những đặc điểm trên, việc thiết lập một hệ thống chỉ số theo phương pháp liên
hoàn được thực hiện theo các bước sau:
-Phân tích chỉ tiêu nghiên cứu ra các nhân tố cấu thành, đồng thời sắp xếp các nhân tố
theo thứ tự tính chất lượng giảm dần và tính số lượng tăng dần.
-Viết chỉ số toàn bộ và chỉ số cho các nhân tố. Trong đó, đối với chỉ số nhân tố chất
lượng thông thường sử dụng quyền số là nhân tố số lượng ở kỳ nghiên cứu và với chỉ số
nhân tố số lượng sử dụng quyền số là nhân tố chất lượng kỳ gốc.
Ví dụ: phân tích tổng chi phí nguyên vật liệu cho một nhóm sản phẩm:
=
∑
∑
=
∑ `
∑
∗
∑
∑
∗
∑
∑
Biến động tuyệt đối
∑ - ∑ = ( ` -Σ )
+ (∑ − ∑ )
+ ( - Σ )
b. Phương pháp biểu hiện ảnh hưởng biến động riêng biệt
Phương pháp này dựa trên qua điểm cho rằng tất cả các nhân tố câu thành nên hiện
tượng nghiên cứu có vai trò ngang nhau và cùng biến động. Do đó, tất cả các chỉ số nhân
tố đều được xây dựng theo một nguyên tắc là thời kỳ quyền số của tất cả các chỉ số nhân
tố phải giống nhau và được chọn là kỳ gốc để soa cho mỗi nhân tố biểu hiện được ảnh
hưởng biến động riêng của nhân tố.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 53
Ví tất cả các nhân tố đều có quyền số là kỳ gốc, nên tích của các chỉ số này không bằng
chỉ số toàn bộ. Để đảm bảo quan hệ cân bằng của hệ thống chỉ số, theo phương pháp này
người ta thêm vào hệ thống chỉ số một đại lượng bổ sung gọi là đại lượng liên hệ.
Chỉ số liên hệ biểu hiện ảnh hưởng chung của tất cả các nhân tố cùng biến động và cùng
tác động lẫn nhau.
Mô hình chung thiết lập hệ thống chỉ số theo phương pháp biểu hiện biến động riêng biệt
được minh họa:
Chỉ số
toàn bộ
=
Chỉ số
nhân tố 1
*
Chỉ số
nhân tố 2
* *
Chỉ số
nhân tố n
*
Các chỉ số
liên hệ
3.7.5.4. Hệ thống chỉ số phân tích biến động chỉ tiêu bình quân và tổng lượng biến
tiêu thức
a.Hệ thống chỉ số phân tích biến động chỉ tiêu bình quân
Chỉ tiêu bình quân chiuj tác động của hai nhân tố: tiêu thức nghiên cứu và kết cấu tổng
thể.nếu sử dụng các ký hiệu:
x1 và x0: lượng biến của tiêu thức kỳ nghiên cứu và kỳ gốc
và số bình quân kỳ nghiên cứu và kỳ gốc
f1 và f0 số đơn vị tổng thể kỳ nghiên cứu và kỳ gốc.
Các chỉ số trong hệ thống phân tích chỉ tiêu bình quân được thể hiện như sau:
Chỉ số cấu thành khả biến: biểu hiện quan hệ so sánh giữa mức độ của chỉ tiêu bình quân
ở kỳ nghiên cứu và kỳ gốc.
Công thức:
̅ =
=
∑
∑
∑
∑
Chỉ số cấu thành cố định: phản ánh biến động của chỉ tiêu bình quân do ảnh hưởng của
tiêu thức nghiên cứu, trong điều kiện kết cấu tổng thể được coi cố định.
Công thức
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 54
̅ =
=
∑
∑
∑
∑
Chỉ số ảnh hưởng kết cấu: phản ánh biến động cảu chỉ tiêu bình quân do ảnh hưởng biến
động riêng rẽ kết cấu tổng thể. Chỉ số này được thiết lập với giả định các lượng biến tiêu
thức không thay đổi.
Công thức
̅ =
=
∑
∑
∑
∑
Các chỉ số trên hợp thành hệ thống chỉ số phân tích chỉ tiêu bình quân như sau:
∑
∑
∑
∑
=
∑
∑
∑
∑
*
∑
∑
∑
∑
b. Hệ thống chỉ số phân tích biến động tổng lượng biến tiêu thức
Hệ thống chỉ số biểu hiện theo công thức:
=
∑
∑
=
∑
∑
∗
∑
∑
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 55
CHƯƠNG 4. THỐNG KÊ SUY LUẬN
4.1. Phân phối xác suất đại lượng ngẫu nhiên
4.1.1. Phân phối chuẩn
W=(X1, X2, , Xn)
Nếu các biến ngẫu nhiên X1, X2,, Xn độc lập và cùng phân phối theo quy luật chuẩn
thì mọi tổ hợp tuyến tính của các biến ngẫu nhiên đó cũng phân phối theo quy luật chuẩn
Thống kê trung bình mẫu là một tổ hợp tuyến tính của X1, X2, , Xn. do đó cũng tuân
theo quy luật chuẩn với các tham số là: ( ) = và ( ) =
Do đó: = =
( )
=
( )√
Phương sai: ∗ =
∑ ( − )
Suy ra ∗ = ∑ ( − )
= =
∗
=
1
( − )
= (
− )
)
Khi đó thống kê χ2 sẽ phân phối theo quy luật “Khi bình phương” với n bậc tự do χ2(n)
= =
( − 1)
~ ( − 1)
Từ các kết quả thu được là:
=
( − )√
~ (0,1)
Và
=
( − 1)
~ ( − 1)
= =
− 1
=
( − )√
∶
( − 1)
( − 1)
=
( − )√
~ ( − 1)
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 56
4.1.2. Phân phối đại lượng ngẫu nhiên
Mẫu ngẫu nhiên kích thước n khá lớn: W=(X1, X2,, Xn)
=
( )√
và =
( )√
sẽ phân phối xấp xỉ chuẩn hóa N(0,1) khi n khá lớn
Giả sử tổng thể nghiên cứu có thể xem như biến ngẫu nhiên phân phối theo quy luật
không- một. từ tổng thể lập mẫu ngẫu nhiên kích thước n: W=(X1, X2,, Xn)
Lúc đó tần suất mẫu f sẽ phân phối theo quy luật nhị thức với các tham số đặc trưng
là: E(f)= p, V(f)= p(1-p)/n
Với p là xác suất của tổng thể
Nếu kích thước mẫu n lớn mà p lại nhỏ và ≈ (1 − ) thì tần suất mẫu sẽ phân
phối theo quy luật Poisson với tham số là p
Nếu kích thước mẫu n lớn mà p lại không nhỏ song thỏa mãn điều kiện:
n>5 và
√
< 0,3
thì tần suất sẽ phân phối xấp xỉ chuẩn với E(f)=p và V(f)=p(1-p)/n. do đó biến ngẫu
nhiên:
=
( )
=
( )√
( )
~ (0,1)
4.2. Ước lượng khoảng tin cậy
4.2.1. Khái niệm
4.2.2. Ươc lượng trung bình tổng thể
Trường hợp đã biết phương sai σ2 của biến ngẫu nhiên gốc X trong tổng thể
= =
−
( )
=
( − )√
Vì vậy với độ tin cậy 1-α có thể tìm được các giá trị α1 và α2 sao cho α1 + α2 = α và tìm
được giá trị tới hạn và tương ứng sao cho thỏa mãn điều kiện:
( ) =
Từ đó: ( < < ) = 1 − ( + ) = 1 −
Vì có tính chất đối xứng nên:
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 57
−
√
< <
+
√
= 1 −
Với độ tin cậy 1-α, tham số μ của biến ngẫu nhiên gốc X sẽ nằm trong khoảng ( −
√
,
+
√
)
Khoảng tin cậy đối xứng: α1 = α2= α/2
( −
√
/ , +
√
/ )
ℇ là độ chính xác của ước lượng, phản ánh mức độ sai lệch của trung bình mẫu so với
trung bình tổng thể xác suất (1-α) cho trước.
ℇ =
√
/
Khoảng tin cậy tối thiểu (bên phải):
α1 = 0 và α2= α thì = = +∞ do đó khoảng tin cậy của μ là:
( −
√
,+∞ )
Khoảng tin cậy tối đa (bên trái):
α2 =0 và α1=α thì = = +∞ do đó khoảng tin cậy của μ là:
(−∞ ; +
√
)
Độ dài khoảng tin cậy = 2ℇ =
√
/
Do đó kích thước mẫu tối thiểu n sao cho với độ tin cậy bằng (1-α) cho trước, độ dài
khoảng tin cậy không vượt quá giá trị I0 cho trước, công thức có dạng:
≥
4
/
≥
ℇ
/
Chú ý: khi tăng kích thước mẫu n lên và giữ nguyên độ tin cậy (1-α) cho trước thì ℇ
giảm đi tức là độ chính xác của ước lượng tăng lên.
Khi tăng độ tin cậy mà giữ nguyên kích thước mẫu n thì giá trị tới hạn chuẩn cũng tăng
lên do đó ℇ cũng tăng lên làm cho độ chính xác của ước lượng giảm đi.
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 58
VD: trọng lượng một loại sản phẩm là biến ngẫu nhiên phân phối theo quy luật chuẩn
với độ lệch chuẩn là 1gam. Cân thử 25 sản phẩm thu được kết quả sau:
Trọng lượng (gam) 18 19 20 21
Số Sp tương ứng 3 5 15 2
Với độ tin cậy 95% hãy tìm khoảng tin cậy đối xứng?
Giải: gọi X là trọng lượng sản phẩm
X phân phối chuẩn với giả thiết σ = 1
Khoảng tin cậy là: ( −
√
/ , +
√
/ )
Với độ tin cậy 95% => u0,025= 1,96
̅ = 19,64
Vậy khoảng tin cậy là: (19,64 – 0,392; 19,64 + 0,392) hay (19,248; 20,032)
VD2: trong VD1 nếu yêu cầu độ chính xác của ước lượng chỉ là 0,1 và giữ nguyên độ tin
cậy 1- α= 0,95 thì phải điều tra một mẫu kích thước bằng bao nhiêu?
Giải: với ℇ0= 0,1 ta có:
≥
ℇ
/
=
1
(0,1)
(1,96) = 385
Vậy để tăng độ chính xác từ 0,392 lên 0,1 thì phải tăng mẫu từ 25 lên 385.
Chưa biết phương sai σ2 của biến ngẫu nhiên gốc X trong tổng thể và kích thước mẫu
<30
Chọn thống kê: = =
( )√
với S là độ lệch chuẩn mẫu. Thống kê T phân phối
theo quy luật Student bậc (n-1).
Vì vậy với độ tin cậy 1-α có thể tìm được các giá trị α1 và α2 sao cho α1 + α2 = α và tìm
được giá trị tới hạn và tương ứng sao cho thỏa mãn điều kiện:
( ( − 1)) =
Từ đó: ( ( − 1) < < ( − 1)) = 1 − ( + ) = 1 −
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 59
Vì phân phối Student có tính chất ( − 1) = − ( − 1) nên:
(− ( − 1) < < ( − 1)) = 1 −
−
√
( − 1) < <
+
√
( − 1) = 1 −
Như vậy khoảng tin cậy của μ với độ tin cậy 1-α là:
( −
√
( − 1);
+
√
( − 1))
Khoảng tin cậy đối xứng: ( −
√
/ ( − 1); +
√
/ ( − 1))
Khoảng tin cậy tối đa: ( −
√
( − 1); +∞ )
Khoảng tin cậy tối thiểu: (− ∞ ; +
√
( − 1))
Độ dài khoảng tin cậy = 2ℇ =
√
/ ( − 1)
Kích thước mẫu tối thiểu n sao cho với độ tin cậy bằng (1-α) cho trước, độ dài khoảng
tin cậy không vượt quá I0 là: ≥
ℇ
/
( )
VD3: để xác định trọng lượng trung bình của các bao bột trong kho, cân ngẫu nhiên 15
bao và thu được ̅ = 39,8 , s2= 0,144. Tìm khoảng tin cậy đối xứng của trọng lượng
trung bình các bao bột trong kho với yêu cầu độ tin cậy là 99%. Giả thiết trọng lượng
bao bột là biến ngẫu nhiên phân phối chuẩn.
Giải: Gọi X là trọng lượng bao bột, theo giả thiết X phân phối chuẩn nhưng chưa biết
phương sai.
Khoảng tin cậy là: −
√
( − 1); +
√
( − 1))
Với độ tin cậy 99% thì α/2 =0,005 ta có t0,005
(14)= 2,977
Với mẫu cụ thể ta tính được: ̅ = 39,8 , s2= 0,144 => s= 0,379
Vậy khoảng tin cậy của μ là: (39,8 −
,
√
2,977;39,8 +
,
√
2,977)
hay (39,5023, 40,0977)
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 60
VD4: phỏng vấn 5 gia đình có 3 người về chi phí hàng tháng cho nhu yếu phẩm thu
được số liệu: 150, 180, 200, 250, 300 nghìn đồng. Vậy phải phỏng vấn bao nhiêu gia
đình cùng loại với độ tin cậy 95% sai số của việc ước lượng chi phí trung bình hàng
tháng cho nhu yếu phẩm không vượt quá 30 nghìn đồng. giả thiết chi phí hàng tháng cho
nhu yếu phẩm là biến ngẫu nhiên phân phối chuẩn.
Giải: Gọi X là chi phí hàng tháng cho nhu yếu phẩm
Từ mẫu ta có: ̅ =
= 216 ℎì đ
S2= (150-216)2+ (180-216)2+ (200-216)2+(250-216)2+ (300-216)2 = 3530
ℇ0= 30, t0,025
(4) = 2,776
Ta có: ≥
(2,776) = 31 hộ gia đình. Vậy phải phỏng vấn thêm 31-5 = 26 hộ gia
đình.
4.2.3. Ươc lượng tỷ lệ tổng thể
Trong tổng thể biến ngẫu nhiên gốc X phân phối theo một quy luật nào đó khác với quy
luật chuẩn. để ước lượng giá trị m chưa biết ta có thể dùng thống kê:
= =
( )√
nếu đã biết phương sai
hoặc = =
( )√
nếu chưa biết phương sai.
Giả sử tổng thể kích thước N có M phần tử mang dấu hiệu nghiên cứu. Nếu lấy ngẫu
nhiên ra một phần tử và gọi X là số phần tử mang dấu hiệu nghiên cứu được lấy ra thì X
là biến ngẫu nhiên tuân theo quy luật không- một:
X 0 1
P 1-p P
Trong đó p là xác suất để lấy ngẫu nhiên một phần tử thì được phần tử mang dấu hiệu
nghiên cứu: p=M/N
E(X)=p và V(X)=p(1-p)/n
Nếu thỏa mãn điều kiện: n>5 và
√
< 0,3
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 61
Thì: = =
( )
( )
=
( )√
( )
~ (0,1)
Vì vậy với độ tin cậy 1-α có thể tìm được các giá trị α1 và α2 sao cho α1 + α2 = α và tìm
được giá trị tới hạn / và / tương ứng sao cho thỏa mãn điều kiện:
( / ) =
Từ đó: ( / < < / ) = 1 − ( /2 + /2) = 1 −
Vì / = − / nên:
(− / < < ) = 1 −
Ta có: (− / <
( )√
( )
< ) hay
( )√
( )
< /
Bình phương hai vế và giải phương trình ta được:
, =
+
1
2
/
∓ / (1 − ) +
1
4
/
+ /
Như vậy với độ tin cậy (1-α) khoảng tin cậy đối xứng của p là: (p1,p2)
Nếu mẫu có kích thước n khá lớn ≥ 100 thì ta có thể chọn thống kê
= =
( )√
( )
~ (0,1)
Vì vậy với độ tin cậy 1-α có thể tìm được các giá trị α1 và α2 sao cho α1 + α2 = α và tìm
được giá trị tới hạn và tương ứng sao cho thỏa mãn điều kiện:
( ) =
Từ đó: ( < < ) = 1 − ( + ) = 1 −
Vì = − nên:
−
(1 − )
√
< < +
(1 − )
√
= 1 −
Như vậy với độ tin cậy (1-α) khoảng tin cậy p có dạng:
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 62
−
(1 − )
√
; +
(1 − )
√
Khoảng tin cậy đối xứng:
−
(1 − )
√
/ ; +
(1 − )
√
/
Khoảng tin cậy tối thiểu (bên phải):
−
( )
√
; +∞
Khoảng tin cậy tối đa (bên trái):
−∞ ; +
(1 − )
√
Độ dài khoảng tin cậy ngắn nhất trong trường hợp khoảng tin cậy đối xứng:
= 2ℇ =
2 (1 − )
√
/
Kích thước mẫu tối thiểu n đảm bảo độ tin cậy (1-α) cho trước và độ dài khoảng tin cậy
không vượt quá giá trị I0 là:
≥
(1 − )
ℇ
/
Trong đó f là tần suất kích thước mẫu sơ bộ kích thước ≥ 2
VD: kiểm tra ngẫu nhiên 400 sản phẩm do một máy sản xuất thấy có 20 phế phẩm. Với
độ tin cậy 95% hãy ước lượng tỷ lệ phế phẩm tối đa của máy đó?
Giải: gọi p là tỷ lệ phế phẩm của máy
Khoảng tin cậy của p có dạng:
−∞ ; +
(1 − )
√
Mẫu cụ thể có f=20/400= 0,05
Với 1-α= 0,95 =>u0,05= 1,645
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 63
Vậy khoảng tin cậy của p là:
− ∞ ; +
0,05(1 − 0,05)
√400
1,645
Hay p< 0,0679.
Vậy tỷ lệ phế phẩm tối đa của máy là 6,79%
4.2.4. Ươc lượng phương sai tổng thể
Giả sử tổng thể biến ngẫu nhiên gốc X phân tuân theo quy luật chuẩn N(μ, σ2) nhưng
chưa biết phương sai. Để ước lượng phương sai từ tổng thể lập mẫu ngẫu nhiên kích
thước n: W(X1, X2,, Xn)
TH1: đã biết kỳ vọng toán μ
Ta chọn thống kê = =
∗
~ ( )
Vì vậy với độ tin cậy 1-α có thể tìm được các giá trị α1 và α2 sao cho α1 + α2 = α và tìm
được giá trị tới hạn ( ) và
( )
tương ứng sao cho thỏa mãn điều kiện:
(
) =
Từ đó: ( ( ) <
< ( )
) = 1 − ( + ) = 1 −
∗
( )
< <
∗
( )
= 1 −
Như vậy với độ tin cậy (1-α) khoảng tin cậy của σ2 có dạng:
(
∗
( )
< <
∗
( )
)
Nếu α1=α2=α/2 khoảng tin cậy có dạng:
(
∗
( )
;
∗
( ) /
)
Nếu α1=0, α2= α ta có khảng tin cậy bên phải:
∗
( )
< < +∞
Nếu α1=α, α2= 0 ta có khảng tin cậy bên trái: − ∞ <
<
∗
( )
[Bộ môn KT-Khoa KT-Trường ĐH SP KT Hưng Yên] Trang 64
TH2: Chưa biết kỳ vọng toán μ của biến ngẫu nhiên gốc X trong tổng thể. Lúc đó ta
chọn thống kê:
= =
( − 1)
~ ( − 1)
Vì vậy với độ tin cậy 1-α có thể tìm được các giá trị α1 và α2 sao cho α1 + α2 = α và tìm
được giá trị tới hạn ( ) và
( )
tương ứng sao cho thỏa mãn điều kiện:
( < ( )
Các file đính kèm theo tài liệu này:
- 07200066_1642_1982821.pdf