Tài liệu Thu thập và trình bày dữ liệu - Lê Phương: Chương 2. THU THẬP VÀ TRÌNH BÀY
DỮ LIỆU
Lê Phương
Bộ môn Toán kinh tế
Đại học Ngân hàng TP. Hồ Chí Minh
Homepage:
Nội dung
1 Thu thập dữ liệu
Nguồn dữ liệu
Điều tra thống kê
2 Phân tổ thống kê
Khái niệm
Tiến hành phân tổ thống kê
3 Trình bày dữ liệu định lượng
Bảng phân phối
Đồ thị và biểu đồ
Nguồn dữ liệu
Vấn đề đầu tiên của công việc thu thập dữ liệu là xác định rõ những
dữ liệu nào cần thu thập, thứ tự ưu tiên của các dữ liệu này.
Nguồn dữ liệu
• Dữ liệu thứ cấp là dữ liệu thu thập từ những nguồn có sẵn, đó
chính là những dữ liệu đã qua tổng hợp, xử lý từ các cơ quan
như: tổng cục thống kê, cơ quan chính phủ, tạp chí chuyên
ngành, báo cáo tài chính...
• Dữ liệu sơ cấp là dữ liệu thu thập trực tiếp, ban đầu từ đối tượng
nghiên cứu, để thu thập dữ liệu sơ cấp người ta tổ chức các cuộc
điều tra thống kê.
Điều tra thống kê
Các loại điều tra thống kê
Căn cứ vào tính liên tục của việc thu thập tài liệu:
1 Điều tra thường xuyên.
2 Điều tra không thường xuyên...
13 trang |
Chia sẻ: putihuynh11 | Lượt xem: 632 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Thu thập và trình bày dữ liệu - Lê Phương, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Chương 2. THU THẬP VÀ TRÌNH BÀY
DỮ LIỆU
Lê Phương
Bộ môn Toán kinh tế
Đại học Ngân hàng TP. Hồ Chí Minh
Homepage:
Nội dung
1 Thu thập dữ liệu
Nguồn dữ liệu
Điều tra thống kê
2 Phân tổ thống kê
Khái niệm
Tiến hành phân tổ thống kê
3 Trình bày dữ liệu định lượng
Bảng phân phối
Đồ thị và biểu đồ
Nguồn dữ liệu
Vấn đề đầu tiên của công việc thu thập dữ liệu là xác định rõ những
dữ liệu nào cần thu thập, thứ tự ưu tiên của các dữ liệu này.
Nguồn dữ liệu
• Dữ liệu thứ cấp là dữ liệu thu thập từ những nguồn có sẵn, đó
chính là những dữ liệu đã qua tổng hợp, xử lý từ các cơ quan
như: tổng cục thống kê, cơ quan chính phủ, tạp chí chuyên
ngành, báo cáo tài chính...
• Dữ liệu sơ cấp là dữ liệu thu thập trực tiếp, ban đầu từ đối tượng
nghiên cứu, để thu thập dữ liệu sơ cấp người ta tổ chức các cuộc
điều tra thống kê.
Điều tra thống kê
Các loại điều tra thống kê
Căn cứ vào tính liên tục của việc thu thập tài liệu:
1 Điều tra thường xuyên.
2 Điều tra không thường xuyên.
Căn cứ vào phạm vi đối tượng điều tra:
1 Điều tra toàn bộ.
2 Điều tra không toàn bộ:
1 Điều tra chọn mẫu.
2 Điều tra trọng điểm.
3 Điều tra chuyên đề.
Các phương pháp thu thập dữ liệu ban đầu
1 Thu thập trực tiếp: quan sát, phỏng vấn trực tiếp.
2 Thu thập gián tiếp: nhân viên điều tra thu thập tài liệu qua trao
đổi bằng điện thoại hoặc thư gửi qua bưu điện với đơn vị điều tra.
Phân tổ thống kê
Khái niệm
Phân tổ thống kê là căn cứ vào một (hay một số) tiêu thức nào đó,
tiến hành sắp xếp các đơn vị quan sát của hiện tượng nghiên cứu vào
các tổ có tính chất khác nhau nhưng các đơn vị trong cùng một tổ sẽ
có tính chất giống nhau hoặc gần giống nhau.
Tần số và tần suất
Số đơn vị của từng tổ fi được gọi là tần số của tổ đó.
Tỉ lệ của số đơn vị của tổ và số đơn vị của tổng thể (fi/n) được gọi là
tần suất của tổ đó.
Các bước tiến hành phân tổ thống kê
Để tiến hành phân tổ ta thường theo các bước sau:
1 Lựa chọn tiêu thức phân tổ.
2 Xác định số tổ cần thiết và phạm vi biến thiên của từng tổ.
3 Sắp xếp các đơn vị vào các tổ.
Lựa chọn tiêu thức phân tổ
Để lựa chọn tiêu thức phân tổ một cách chính xác, cần phải dựa trên
2 nguyên tắc cơ bản sau:
1 Phân tích lý luận để chọn ra tiêu thức bản chất nhất, phù hợp với
mục đích nghiên cứu.
2 Phải dựa vào điều kiện lịch sử cụ thể của hiện tượng nghiên cứu
để chọn ra tiêu thức phân tổ thích hợp.
Các bước tiến hành phân tổ thống kê
Xác định số tổ cần thiết
Trường hợp phân tổ theo tiêu thức thuộc tính (dữ liệu định tính)
• nếu tổng thể bao gồm ít loại hình thì mỗi loại hình ta nhóm thành
1 tổ.
• nếu tổng thể bao gồm rất nhiều loại hình, người ta giải quyết
bằng cách ghép nhiều tổ nhỏ lại với nhau theo nguyên tắc: các tổ
ghép lại với nhau phải giống nhau hoặc gần giống nhau về tính
chất, giá trị sử dụng...
Ví dụ
Phân tổ cho một tổng thể gồm 1000 người tham gia một tour du lịch
theo các tiêu thức: giới tính, trình độ văn hóa, tỉnh thành.
Các bước tiến hành phân tổ thống kê
Xác định số tổ cần thiết
Trường hợp phân tổ theo tiêu thức số lượng (dữ liệu định lượng)
• Nếu lượng biến của tiêu thức thay đổi ít, thì thường là mỗi lượng
biến hình thành 1 tổ. Ví dụ: bậc thợ công nhân, số nhân khẩu
trong hộ gia đình. . .
• Nếu lượng biến của tiêu thức thay đổi rất nhiều, ta xét xem lượng
biến tích lũy đến mức độ nào thì chất của lượng biến mới thay
đổi làm nảy sinh tổ khác.
Các bước tiến hành phân tổ thống kê
Mỗi tổ có giới hạn dưới và giới hạn trên, chênh lệch giữa giới hạn trên
và giới hạn dưới của tổ gọi là trị số khoảng cách tổ h.
Cách xác định trị số khoảng cách tổ
Khi phân tổ có khoảng cách tổ đều nhau thành k tổ, trị số khoảng
cách tổ được xác định
• Trường hợp lượng biến liên tục:
h =
xmax − xmin
k
• Trường hợp lượng biến rời rạc (số nguyên):
h =
xmax − xmin − (k − 1)
k
Số tổ k thường được xác định từ công thức thực nghiệm
k ≈ 3
√
2n.
Các bước tiến hành phân tổ thống kê
Ví dụ
Phân tổ cho dữ liệu chiều cao (cm) ghi nhận của mẫu 50 học sinh lớp
12 của một trường trung học như sau:
154 160 162 164 169 155 161 162 168 163
160 161 163 173 172 173 172 163 165 162
170 165 162 175 164 170 163 177 164 160
175 166 167 176 164 174 166 164 176 172
158 162 167 170 171 161 166 178 168 169
Giải.
• Tiêu thức phân tổ: chiều cao mỗi học sinh.
• Loại lượng biến: liên tục.
• Tổng thể: n = 50, xmax = 178, xmin = 154.
• Số tổ: k ≈ 3√2× 50 hay k = 5.
• Trị số khoảng cách tổ: h = 178− 154
5
= 4,8.
Lưu ý. Để đơn giản khi tính toán, trong một số trường hợp ta có thể
làm tròn giá trị của h (với ví dụ trên h = 5).
Trình bày dữ liệu bằng bảng phân phối
Bảng phân phối
Phân tổ Tần số Tần suất Tần số tích lũy Tần suất tích lũy
x1 f1 f1/n f1 f1/n
x2 f2 f2/n f1 + f2 (f1 + f2)/n
x3 f3 f3/n f1 + f2 + f3 (f1 + f2 + f3)/n
...
...
...
...
...
xk fk fk/n f1 + f2 + · · ·+ fk (f1 + f2 + · · ·+ fk )/n
Tổng n 1
Lưu ý : cột thứ nhất là các tổ được phân theo tiêu thức, không nhất
thiết là các giá trị của một lượng biến.
Trình bày dữ liệu bằng bảng phân phối
Ví dụ
Lập bảng phân phối cho dữ liệu chiều cao của 45 học sinh đã phân tổ
trong ví dụ trước. Tính tần suất và tần số tích lũy.
Chiều cao Tần số Tần suất Tần số tích lũy
[154;158,8)
[158,8;163,3)
[163,3;168,4)
[168,4;173,2)
[173,2;178]
Trình bày dữ liệu bằng đồ thị và biểu đồ
Khái niệm
Biểu đồ và đồ thị là các hình vẽ, đường nét hình học dùng để mô tả
có tính quy ước các số liệu thống kê.
Một số loại đồ thị và biểu đồ trong thống kê
Giả sử dữ liệu được phân vào các tổ [x1, x2), [x2, x3), [x3, x4),. . . ,
[xk , xk+1] với các tần số tương ứng f1, f2, . . . , fk và các các tần suất
tương ứng f1/n, f2/n, . . . , fk/n.
• Đồ thị: đường gấp khúc trên mặt phẳng tọa độ tạo thành bởi các
đoạn nối liên tiếp các điểm (xi , fi) hoặc (xi , fi/n).
• Biểu đồ hình cột: gồm các hình chữ nhật với 2 đỉnh là (xi , fi) và
(xi+1, fi) và đáy còn lại nằm trên trục hoành.
• Biểu đồ hình tròn: hình tròn được chia thành k hình quạt, tỉ lệ
diện tích của hình quạt thứ i là fi/n.
Ví dụ
Vẽ biểu đồ hình cột và biểu đồ hình tròn cho dữ liệu chiều cao của 50
học sinh đã phân tổ trong ví dụ trước.
Các file đính kèm theo tài liệu này:
- nguyen_li_thong_ke_c2_5718_1997496.pdf