Tài liệu Bài giảng Nguyên lý Thống kê kinh tế - Trần Kim Thanh: TS. TRẦN KIM THANH
BÀI G
NGUYÊN LÝ THỐNG KÊ KINH TẾ
Tp. HỒ CHÍ MINH - 2015
Chương 1. NHẬP MÔN THỐNG KÊ HỌC
Mục tiêu của chương này nhằm trang bị cho bạn đọc một số khái niệm và một số vấn đề chung nhất của thống kê, như:
Thống kê học là gì?
Lịch sử phát triển của Thống kê học;
Đối tượng nghiên cứu của Thống kê học;
Một số khái niệm thống kê cơ bản;
Các loại thang đo trong thống kê;
Hai hình thức trình bảy tài liệu thống kê.
Phần lớn trong số các kiến thức nhập môn nói trên sẽ được nhắc lại ở các chương tiếp theo của giáo trình này, với tư cách là các khái niệm và thuật ngữ đã được hiểu thống nhất.
KHÁI NIỆM VỀ THỐNG KÊ
Trước đây, khi chưa có sự tác động của các công cụ toán học, thuật ngữ “thống kê” được hiểu là những dữ liệu được ghi chép một cách có hệ thống để phản ánh các hiện tượng tự nhiên, kỹ thuật, kinh tế, xã hội. Chẳng hạn như số liệu ghi chép về lượng mưa, về nhiệt độ, về độ ẩm không khí trên các vùng lãnh thổ của mỗi quốc gia; số liệt về dân số; GDP, vốn đầu t...
96 trang |
Chia sẻ: honghanh66 | Lượt xem: 557 | Lượt tải: 1
Bạn đang xem trước 20 trang mẫu tài liệu Bài giảng Nguyên lý Thống kê kinh tế - Trần Kim Thanh, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
TS. TRẦN KIM THANH
BÀI G
NGUYÊN LÝ THỐNG KÊ KINH TẾ
Tp. HỒ CHÍ MINH - 2015
Chương 1. NHẬP MÔN THỐNG KÊ HỌC
Mục tiêu của chương này nhằm trang bị cho bạn đọc một số khái niệm và một số vấn đề chung nhất của thống kê, như:
Thống kê học là gì?
Lịch sử phát triển của Thống kê học;
Đối tượng nghiên cứu của Thống kê học;
Một số khái niệm thống kê cơ bản;
Các loại thang đo trong thống kê;
Hai hình thức trình bảy tài liệu thống kê.
Phần lớn trong số các kiến thức nhập môn nói trên sẽ được nhắc lại ở các chương tiếp theo của giáo trình này, với tư cách là các khái niệm và thuật ngữ đã được hiểu thống nhất.
KHÁI NIỆM VỀ THỐNG KÊ
Trước đây, khi chưa có sự tác động của các công cụ toán học, thuật ngữ “thống kê” được hiểu là những dữ liệu được ghi chép một cách có hệ thống để phản ánh các hiện tượng tự nhiên, kỹ thuật, kinh tế, xã hội. Chẳng hạn như số liệu ghi chép về lượng mưa, về nhiệt độ, về độ ẩm không khí trên các vùng lãnh thổ của mỗi quốc gia; số liệt về dân số; GDP, vốn đầu tư phát triển của nền kinh tế; giá trị sản xuất, lao động và vốn sản xuất kinh doanh của một doanh nghiệp
Cùng với sự phát triển của toán học, đặc biệt là Lý thuyết xác suất thống kê toán, thống kê đã trở thành một ngành khoa học quan trọng: khoa học về hệ thống các phương pháp thu nhập và phân tích các dữ liệu về mặt định lượng những hiện tượng nói trên để tìm hiểu bản chất và tính quy luật của chúng.
Điều khác biệt cơ bản và quan trọng nhất là ở chỗ: Nếu như trước đây người ta quan niệm thống kê là những dữ liệu xơ cứng thì Lý thuyết xác suất thống kê toán chỉ ra rằng: những dữ liệu thống kê ghi chép đó là những giá trị thể hiện của các phần tử ngẫu nhiên và các tiêu thức quan sát chính là các phần tử ngẫu nhiên. Đây chính là chiếc cầu nối liền giữa toán học với thống kê học, nó giúp cho việc chuyển tải các công cụ của toán học và đặc biệt là của lý thuyết xác suất thống kê toán vào giải quyết các vấn đề của thống kê học như: Ước lượng, kiểm định, phân tích hồi quy, phân tích phương sai,... Chiếc cầu nối này giúp chúng ta tìm hiểu các quy luật – cái tất nhiên – thông qua số lớn các quan sát ngẫu nhiên bới Luật số lớn nổi tiếng. Vì thế, nếu nói Lý thuyết thống kê chính là một loại toán học ứng dụng là có căn cứ.
Chẳng hạn, qua số liệu về kết quả sản xuất, lao động và thu nhập của lao động ở một doanh nghiệp theo thời gian. Sử dụng các phương pháp của thống kê học, ta có thể tính được các chỉ tiêu năng suất lao động, thu nhập bình quận của lao động. Qua đó phân tích được tính quy luật của sự biến động năng suất lao động và thu nhập bình quân của lao động, phân tích được tính quy luật giữa tốc độ tăng năng suất lao động và tốc độ tăng thu nhập bình quân của lao động từ đó giúp lãnh đạo doanh nghiệp có những giải pháp kịp thời.
SƠ LƯỢC VỀ SỰ PHÁT TRIỂN CỦA THỐNG KÊ HỌC
Thống kê học ra đời và phát triển xuất phát từ nhu cầu của hoạt động thực tiễn xã hội. Để trở thành một môn khoa học độc lập như ngày nay, thống kê học đã có một quá trình phát triển lâu dài từ đơn giản đến phức tạp, đúc rút dần thành lý luận ngày càng hoàn chỉnh.
Ngay từ thời bình minh của nhân loại, các di chỉ khảo cổ ở Trung Quốc, Hy Lạp, La Mã, Ai Cập, cho thấy các bộ lạc, bộ tộc đã biết cách ghi chép để năm được số dân, số súc vật, số nô lệ Mặc dù việc ghi chép còn rất đơn giản và cục bộ trong từng phạm vi hẹp.
Trong xã hội phong kiến, thống kê học đã có những bước phát triển vượt bậc so với thời cổ đại. Việc ghi chép, đăng ký dân số, tài sản được tiến hành ở phạm vi rộng hơn, mang tính thống kê rõ hơn. Song, nó vẫn mang tính tự phát, thiếu khoa học, chưa thật sự trở thành một môn khoa học độc lập.
Đến cuối thể kỷ thứ XVII, cùng với sự ra đời và phát triển mạnh mẽ của phương thức sản xuất tư bản chủ nghĩa, các phương pháp ghi chép và phân tích mặt lượng của các hiện tượng kinh tế - xã hội đã được các nhà khoa học đúc kết thành lý luận. Nhiều ấn phẩm về lĩnh vực này đã được ra đời. Ở một số trường đại học người ta bắt đầu giảng dạy về lý luận thống kê, về phương pháp nghiên cứu hiện tượng kinh tế - xã hội dựa vào số liệu điều tra cụ thể. Công tác thống kê phát triển mạnh mẽ nhằm đáp ứng nhu cầu thông tin thường xuyên về tình hình sản xuất và cung ứng hàng hóa, nguyên liệu, lao động của nền kinh tế thị trường tư bản chủ nghĩa, phục vụ cho các mục đích kinh tế, chính trị và quân sự của nhà nước tư bản và của các nhà tư bản. Năm 1682, William Petty (1623 – 1687) nhà kinh tế học người Anh đã cho xuất bản cuốn “Số học chính trị”. Đây là tác phẩm đầu tiên
nghiên cứu các hiện tượng xã hội thông qua sử dụng các phương pháp tổng hợp, so sánh và phân tích các dữ liệu thống kê. K.Marx đã mệnh danh cho William Petty là người sáng lập ra môn thống kê học1.
Đến giữa thế kỷ XVIII (năm 1759), G.Achenwall (1719 – 1772), một giáo sư đại học người Đức, lần đầu tiên dùng từ “Statistic” (sau này được dịch là Thống kê) để chỉ phương pháp nghiên cứu nói trên, và quan niệm đó là môn học so sánh các nước khác nhau về mọi mặt qua các dữ liệu thu nhập được.
Những thành tựu của của khoa học tự nhiên trong thời kỳ này, đặc biệt là sự ra đời của lý thuyết xác suất và thống kê toán, đã có ảnh hưởng quan trọng đối với sự phát triển và hoàn thiện của thống kê học, để nó trở thành một môn khoa học thật sự độc lập. Nếu như trước đây thống kê là các con số xơ cứng thì bằng công cụ xác suất và thống kê toán, toán học đã thổi hồn vào đó, khiến cho các con số biết nói.
Nền kinh tế thị trường tư bản chủ nghĩa cùng với những thành tựu nổi bật về khoa học kỹ thuật, khoa học tự nhiên đã tạo điều kiện cho sự ra đời và phát triển của thống kê học. Thống kê trở thành một công cụ quan trọng trong mọi lĩnh vực của đời sống kinh tế - xã hội.
Ngày nay, thống kê được coi là một trong những công cụ quản lý kinh tế và quản lý xã hội quan trọng. Thông qua nghiên cứu tính quy luật về lượng của các hiện tượng, các dữ liệu thống kê giúp kiểm tra, đánh giá các chương trình, kế hoạch và định hướng phát triển kinh tế - xã hội; cung cấp đầy đủ và kịp thời các thông tin thống kê trung thực, khách quan cho các cấp quản lý từ vi mô đến vĩ mô.
ĐỐI TƯỢNG NGHIÊN CỨU CỦA THỐNG KÊ HỌC
Từ quá trình hình thành và phát triển của thống kê, có thể thấy: đối tượng nghiên cứu của thống kê học là các dữ liệu về mặt định lượng của các hiện tượng kinh tế - xã hội số lớn, trong điều kiện lịch sử cụ thể.
Do vậy, chúng ta cần hiểu đúng đối tượng nghiên cứu của thống kê ở các điểm chính sau:
Các hiện tượng về nguồn tài nguyên, môi trường, của cải tích lũy của đất nước và của một vùng.
Các hiện tượng về sản xuất, phân phối, lưu thông, tiêu dùng sản phẩm như : giá cả, lượng hàng xuất khẩu, nhập khẩu
Các hiện tượng về đời sống vật chất, sức khỏe, văn hóa của dân cư như trình độ văn hóa, số người mắc bệnh, các loại bệnh, phòng chống bệnh
Các hiện tượng về sinh hoạt chính trị xã hội
Thống kê học thông qua nghiên cứu các biểu hiện về lượng của hiện tượng kinh tế xã hội tìm hiểu bản chất và tính quy luật của chúng. Điều này có nghĩa là, thống kê học sử dụng các dữ liệu về quy mô, kết cấu, quan hệ so sánh, trình độ phổ biến, tốc độ phát triển của hiện tượng nghiên cứu để qua đó biểu thị được bản chất và tính quy luật của chúng. Do vậy, các dữ liệu thống kê không phải là những con số trừu tượng, hoặc mang tính số học thuần túy, mà là những con số có ý nghĩa kinh tế, chính trị hoặc xã hội nhất định, giúp ta nhận thức được hiện tượng nghiên cứu.
Thống kê học nghiên cứu hiện tượng số lớn, tức là một tổng thể bao gồm nhiều đơn vị hợp thành. Các số liệu thống kê về hiện tượng nghiên cứu thường được xử lý ra từ cơ sở dữ liệu thu thập trên một số lớn các đơn vị cá biệt của hiện tượng nghiên cứu. Mặt lượng của các đơn vị này thường chịu tác động của nhiều nhân tố. Trong đó có cả các nhân tố tất nhiên và ngẫu nhiên. Mức độ và xu hướng tác động của các nhân tố này thường không giống nhau trên từng đơn vị cá biệt. Nếu chỉ thu thập số liệu trên một số ít các đơn vị của hiện tượng nghiên cứu thì số liệu thống kê tính ra khó có thể phản ánh được bản chất và tính quy luật của hiện tượng nghiên cứu. Song, nếu tổng hợp mặt lượng trên một số lớn các đơn vị của hiện tượng, tác động của các nhân tố ngẫu nhiên sẽ được bù trừ và triệt tiêu, số liệu thống kê xử lý ra có thể biểu hiện được bản chất và tính quy luật của hiện tượng nghiên cứu.
Thống kê học nghiên cứu hiện tượng số lớn, song không có nghĩa là bỏ qua việc nghiên cứu các hiện tượng cá biệt (đơn vị tổng thể). Giữa hiện tượng số lớn và hiện tượng cá biệt có mối quan hệ biện chứng. Nghiên cứu hiện tượng số lớn kết hợp với mở rộng nội dung nghiên cứu các hiện tượng cá biệt này sẽ giúp nhận thức đầy đủ hơn bản chất và tính quy luật của hiện tượng nghiên cứu.
Hiện tượng số lớn mà thống kê học nghiên cứu luôn tồn tại trong những điệu kiện thời gian và địa điểm cụ thể. Trong những điều kiện lịch sử khác nhau, hiện tượng nghiên cứu sẽ có đặc điểm về chất và biểu hiện về lượng không giống nhau. Chính vì thế, khi sử dụng các dữ liệu thống kê về hiện tượng nghiên cứu phải để ý tới điệu kiện lịch sử cụ thể của nó.
Thống kê được chia thành hai lĩnh vực:
Thống kê mô tả : Bao gồm các phương pháp thu thập số liệu (tiến hành điều tra, quan sát, thực nghiệm) mô tả và trình bày số liệu (thông qua các bảng biểu và biểu đồ), tính toán các đặc trưng đo lường.
Thống kê suy diễn: Sử dụng các công cụ của toán học: các phương pháp như ước lượng, kiểm định phân tích mối liên hệ, dự báo, đưa ra quyết định trên cở sở các thông tin thu thập từ mẫu.
MỘT SỐ KHÁI NIỆM THỐNG KÊ CƠ BẢN
Tổng thể thống kê và đơn vị tổng thể thống kê
Tổng thể thống kê là phạm vi của hiện tượng nghiên cứu.
Tổng thể thống kê là hiện tượng số lớn, gồn những đơn vị hoặc phần tử cá biệt hợp thành, cần được quan sát, phân tích mặt lượng của chúng. Những đơn vị hoặc phần tử cá biệt cấu thành hiện tượng nghiên cứu được gọi là đơn vị tổng thể. Đơn vị tổng thể là bộ phận nhỏ nhất trong tổng thể thống kê, nơi phát sinh ra nguồn thông tin ban đầu cần thu thập. Chẳng hạn, toàn bộ các doanh nghiệp trên lãnh thổ Việt Nam tại một thời điểm nào đó là một tổng thể thống kê, trong đó mỗi doanh nghiệp là một đơn vị tổng thể. Dân số Việt Nam là một tổng thể thống kê, trong đó mỗi người dân là một đơn vị tổng thể
Như vậy, thực chất của việc xác định tổng thể thống kê chính là việc xác định các đơn vị của nó. Tổng thể thống kê có thể được phân loại theo nhiều tiêu thức khác nhau:
Dựa vào đặc điểm nhận biết được hay không nhận biết được của các đơn vị tổng thể, người ta chia tổng thể thống kê ra thành tổng thể bộc lộ và tổng thể tiềm ẩn.
Tổng thể bộc lộ là tổng thể gồm các đơn vị cấu thành có thể xác định được bằng trực quan (ví dụ, tổng thể dân số của một quốc gia, tổng thể doanh nghiệp đóng trên địa bàn của một địa phương).
Tổng thể tiềm ẩn là tổng thể gồm các đơn vị cấu thành không thể nhận biết được bằng trực quan (chẳng han, tổng thể những người mắc một căn bệnh nào đó, tổng thể những người thích đi du lich vào cuối tuần). Nghiên cứu thống kê đối với các tổng thể bộc lộ tiến hành khá thuận lợi, song sẽ gặp rất nhiều khó khăn khi nghiên cứu các tổng thể tiềm ẩn, đòi hởi phải sử dụng kết hợp nhiều phương pháp khác nhau, chi phí nghiên cứu tốn kém gấp nhiều lần mới có được kết quả mong đợi.
Dựa vào các đặc điểm chung giống nhau và không giống nhau, người ta phân chia tổng thể thống kê thành
tổng thể đồng chất và tổng thể không đồng chất.
Tổng thể đồng chất gồm các đơn vị cấu thành có các đặc điểm chung giống nhau theo mục đích nghiên cứu, các đặc điểm chung này cũng chính là các đặc điểm hình thành nên tổng thể thống kê. Chẳng han, tổng thể sinh viên của một trường đại học, tổng thể các bác sĩ trong một bệnh viện;
Tổng thể không đồng chất gồm các đơn vị cấu thành khác nhau về loại hình và không có các đặc điểm chung giống nhau theo mục đích nghiên cứu. Ví dụ, tổng thể hành khách trên một chuyến tàu là tổng thể không đồng chất nếu mục đích nghiên cứu là tìm hiểu tình hình thu nhập, việc làm hoặc trình độ tay nghề.
Nghiên cứu thống kê chỉ đặt ra với các tổng thể đồng chất.
Ngoài ra, còn có thể phân chia thành tổng thể chung (bao gồm tất cả các đơn vị của hiện tượng nghiên cứu) và tổng thể bộ phận (chỉ gồm một phần các đơn vị của tổng thể chung). Cả hai tổng thể này, nếu là đồng chất, thì đều có thể thực hiện được các nghiên cứu thống kê khác nhau.
Tiêu thức thống kê
Nghiên cứu thống kê phải dựa vào các đặc điểm của đơn vị tổng thể. Mỗi đơn vị tổng thể đều có nhiều đặc điểm. Các đặc điểm này được gọi là các tiêu thức thống kê. Như vậy, tiêu thức thống kê là các đặc điểm của đơn vị tổng thể. Khi nghiên cứu về một tổng thể thống kê, do gặp phải giới hạn về thời gian, về nhân lực, vật lực và tài lực nên tùy theo mục đích nghiên cứu, người ta chỉ chọn ra một số tiêu thức có liên quan để thu thập thông tin ban đầu.
Tiêu thức thống kê được chia thành hai loại: tiêu thức thuộc tính và tiêu thức số lượng.
Tiêu thức thuộc tính là tiêu thức mà các biểu hiện của nó được dùng để phản ánh tính chất hoặc loại hình của các đơn vị tổng thể, không biểu hiện trực tiếp được bằng con số. Ví dụ: giới tính, nghề nghiệp, khu vực, thành phần kinh tế
* Tiêu thức số lượng là tiêu thức có thể biểu hiện trực tiếp được bằng con số. Ví dụ: Tuổi đời, tuổi nghề, GDP của một quốc gia, doanh thu về bán hàng và cung cấp dịch vụ của một doanh nghiệp, dân số của một địa phương
Các tiêu thức chỉ có hai biểu hiện không trùng nhau trên một đơn vị tổng thể được gọi là tiêu thức thay phiên. Ví dụ, tiêu thức giới tính chỉ có hai biểu hiện không trùng nhau là nam và nữ, tiêu thức tình trạng hôn nhân là các tiêu thức thay phiên.
Chỉ tiêu thống kê
Chỉ tiêu thống kê là sự biểu hiện bằng định lượng của các mặt, các tính chất, các mối quan hệ cơ bản của hiện tượng số lớn trong điều kiện lịch sử cụ thể.
Trong Khoản 3, Điều 3, Chương 1 của Luật Thống kê, cụm từ chỉ tiêu thống kê được giải thích như sau: “Chỉ tiêu thông kê là tiêu chí mà biểu hiện bằng số của nó phản ánh quy mô, tốc độ phát triển, cơ cấu, quan hệ tỉ lệ của hiện tượng kinh tế - xã hội trong điều kiện không gian và thời gian cụ thể”.
Ví dụ: GDP bình quân đầu người của Việt Nam năm 2011 là 2.000 USD; thu nhập bình quân hàng tháng của một lao động trong khu vực nhà nước năm 2011 là 4,5 triệu đồng
Do chỉ tiêu thống kê được tổng hợp từ mặt lượng của nhiều đơn vị, nên nó phản ánh những mối quan hệ chung của tất các đơn vị hoặc nhóm đơn vị tổng thể.
Chỉ tiêu thống kê bao gồm hai mặt: khái niệm và con số.
* Mặt khái niệm bao gồm định nghĩa và các giới hạn về thực thể, thời gian và không gian của hiện tượng kinh tế - xã hội, phản ánh nội dung của chỉ tiêu thống kê.
* Mặt con số của chỉ tiêu thống kê là trị số được phát hiện, đo tính được theo các đơn vị tính toán phù hợp.
Căn cứ vào nội dung, có thể chia các chỉ tiêu thống kê thành hai loại: chỉ tiêu chất lượng và chỉ tiêu khối lượng (hay số lượng).
Chỉ tiêu chất lượng biểu hiện các tính chất, tốc độ phát triển, trình độ phổ biến, mối quan hệ của biểu hiện các tính chất, tốc độ phát triển, trình độ phổ biến, mối quan hệ của tổng thể giá bán đơn vị sản phẩm, năng suất lao động, tỉ suất lợi nhuận tính trên tổng vốn (ROA)
Chỉ tiêu khối lượng (hay số lượng) biểu hiện quy mô của tổng thể, ví dụ: số lượng sản phẩm sản xuất, doanh thu về bán hàng và cung cấp dịch vụ, tổng vốn dùng vào sản xuất kinh doanh
Việc phân loại này nhằm đáp ứng yêu cầu của một số phương pháp phân tích thống kê.
Tập hợp các chỉ tiêu số lượng và chất lượng theo từng yêu cầu nghiên cứu cụ thể ta được các hệ thống chỉ tiêu thống kê.
Hệ thống chỉ tiêu thống kê là một tập hợp những chỉ tiêu có thể phản ánh các mặt, các tính chất quan trọng nhất, các mối liên hệ cơ bản giữa các mặt của tổng thể và mối liên hệ giữa tổng thể và các hiện tượng liên quan.
Hệ thống các chỉ tiêu thống kê được cấu thành từ nhiều nhóm chỉ tiêu và được xây dựng theo những yêu cầu nghiên cứu riêng. Chẳng hạn, hệ thống chỉ tiêu thống kê chủ yếu của doanh nghiệp bao gồm các nhóm chỉ tiêu phản ánh kết quả sản xuất kinh doanh, tình hình sử dụng các yếu tố sản xuất, chi phí xản xuất và các nhóm chỉ tiêu khác. Nếu yêu cầu nghiên cứu cần chi tiết và cụ thể hơn thì có thể thêm các nhóm chỉ tiêu về giá thành, giá bán sản phẩm và hiệu quả sản xuất kinh doanh
Hệ thống chỉ tiêu thống kê là cơ sở để thu thập, tổng hợp thông tin từ các đơn vị tổng thể, tính toán trị số của chỉ tiêu giúp nhận thức được bản chất, tính quy luật và xu hướng biến động, phát triển của hiện tượng số lớn.
Vấn đề xây dựng (hay xác định) hệ thống chỉ tiêu thống kê cho một hướng nghiên cứu cụ thể phải dựa trên các căn cứ sau đây:
Phải xuất phát từ mục đích nghiên cứu. Mục đích nghiên cứu quyết định nhu cầu thông tin về những mặt, những khía cạnh của đối tượng nghiên cứu.
Phải dựa vào tính chất và đặc điểm của đối tượng nghiên cứu. Đối tượng nghiên cứu càng phức tạp thì số lượng chỉ tiêu xây dựng (hay xác định) càng nhiều và ngược lại.
Phải dựa vào khả năng cho phép về thời gian và về nhân, tài, vật lực để tiến hành thu thập và tổng hợp thông tin cho các chỉ tiêu. Căn cứ này đòi hỏi người xây dựng (hay xác định) hệ thống chỉ tiêu thống kê phải cân nhắc để xây dựng (hay xác định) những chỉ tiêu cơ bản và quan trọng nhất, sao cho với số lượng chỉ tiêu không nhiều nhưng vẫn đáp ứng được mục đích nghiên cứu.
Ngoài việc tuân thủ các căn cứ mang tính nguyên tắc nói trên, hệ thống chỉ tiêu thống kê xây dựng (hay xác định) cho một hướng nghiên cứu cụ thể nào đó còn cần phải đáp ứng các yêu cầu sau:
Hệ thống chỉ tiêu phải có khả năng nêu lên được mối liên hệ giữa các bộ phận, các mặt của đối tượng nghiên cứu và giữa đối tượng nghiên cứu với các hiện tượng có liên quan theo mục đích nghiên cứu đã đề ra.
Trong hệ thống chỉ tiêu ngoài các chỉ tiêu mang tính chất chung (tổng hợp) còn phải có các chỉ tiêu phản ánh các bộ phận của đối tượng nghiên cứu và các chỉ tiêu phản ánh các nhân tố tác động đến đối tượng nghiên cứu.
Các chỉ tiêu trong hệ thống phải đảm bảo sự thống nhất về nội dung, phương pháp, phạm vi tính toán và có khả năng thu thập được số liệu.
CÁC LOẠI THANG ĐO TRONG THỐNG KÊ
Theo tính chất của việc đo lường, người ta thường sử dụng bốn loại thang đo sau đây:
Thang đo định danh (hay đặt tên)
Thang đo này dùng để đếm tần số biểu hiện của tiêu thức thuộc tính. Khi sử dụng thang đo này để tổng hợp dữ liệu thống kê cần tiến hành đánh số (hay đặt tên) các biểu hiện cùng loại của tiêu thức.
Ví dụ, khi tổng hợp giới tính của dân số, biểu hiện “nam” được đánh số 1 và “nữ” được đánh số 2. Giữa các con số ở đây không có quan hệ hơn, kém. Vì thế, các phép tính với chúng đều là vô nghĩa.
Thang đo thứ bậc
Thang đo thứ bậc là thang đo định danh, được dùng để đếm số lần biểu hiện của tiêu thức thuộc tính có sự hơn kém khi tổng hợp dữ liệu thống kê. Chênh lệch giữa các biểu hiện không nhất thiết phải bằng nhau.
Ví dụ, chất lượng sản phẩm gồm ba loại: loại một, hai và ba; trình độ văn hóa phổ thông có ba cấp: cấp một, hai và ba; chất lượng học tập của sinh viên trong các trường đại học được phân loại thành: xuất sắc, giỏi , khá, trung bình và yếu kém; bậc thợ của công nhân cơ khí gồm: bậc 1, 2, 3, 4, 5, 6 và 7, con số có trị số lớn hơn không có nghĩa ở bậc cao hơn và ngược lại, mà là do sự quy định. Thang đo này được dùng để tính toán đặc trưng chung của tổng thể một cách tượng đối như tính bậc thợ bình quân, bậc chất lượng bình quân của sản phẩm
Thang đo khoảng
Thang đo khoảng là thang đo thứ bậc có các khoảng cách đều nhau. Có thể đánh giá được sự khác biệt cụ thể về lượng giữa các biểu hiện của tiêu thức.
Ví dụ, thu nhập hàng tháng tính bằng triệu đồng (trđ) của lao động trong doanh nghiệp: 10 trđ.
Trong thang đo khoảng, lượng biến của tiêu thức nghiên cứu có thể được trình bày dưới dạng một phân bố tần số (chẳng hạn, có bao nhiêu người có mức thu nhập dưới 2 triệu đồng). Yêu cầu có khoảng cách đều nhau là đặt ra đối với thang đo, còn biểu hiện về lượng của tiêu thức được đo không nhất thiết phải bằng nhau.
Như vậy, thang đo khoảng luôn có đơn vị đo và được dùng để tổng hợp lượng biến của các tiêu thức số lượng, có thể thực hiện được các phép tính số học đối với các lượng biến của tiêu thức nghiên cứu, nên có thể tinh được các đặc trưng thống kê như số trung bình, trung vị, mốt, phương sai
Thang đo tỉ lệ
Thang đo tỉ lệ là thang đo khoảng với một điểm không (0) tuyệt đối (điểm gốc). Do có điểm gốc trên thang đo nên có thể so sánh được tỉ lệ giữa các trị số đo, cho biết số lượng thực tế của một đặc trưng đang đo lường.
Ví dụ: số cán bộ công nhân viên trong doanh nghiệp đạt mức thu nhập trên 5 triệu đồng; số công nhân hoàn thành vượt định mức khoán sản phẩm Đây là thang đo định lượng chặt chẽ nhất. Với thang đo này ta có thể đo lường được các biểu hiện của tiêu thức theo các đơn vị hiện vật (hiện vật tự nhiên, hiện vật vật lý, hiện vật quy chuẩn) và thực hiện được tất cả các phép tính với trị số đo.
Trong bốn loại thang đo trên, hai loại đầu được gọi là thang đo định tính, còn hai loại sau được gọi là thang đo định lượng. Phương pháp xây dựng thang đo cụ thể được trình bày trong các giáo trình thống kê ứng dụng.
HAI HÌNH THỨC TRÌNH BÀY TÀI LIỆU THỐNG KÊ
Sau khi tổng hợp về mặt định lượng của hiện tượng nghiên cứu, dữ liệu thống kê được trình bày trên các vật mang thông tin phục vụ cho hoạt động phân tích, truyền đạt và lưu trữ.
Có hai hình thức trình bày dữ liệu thống kê, đó là bảng (biểu) thống kê và đồ thị thống kê.
Bảng (biểu) thống kê
Khái niệm bảng thống kê
Bảng thống kê là sự sắp xếp theo hệ thống hai chiều số liệu về các chỉ tiêu thống kê trên các hàng và cột.
Tác dụng của bảng thống kê
Các dữ liệu trong bảng đã được sắp xếp một cách hệ thống, nên có thể sử dụng các phương pháp so sánh, đối chiếu và các phương pháp phân tích khác để nêu lên bản chất của hiện tượng nghiên cứu.
Bảng thống kê được thiết kế và trình bày một cách khoa học sẽ trở thành cơ sở dữ liệu quan trọng để phân tích, chứng minh hiện tượng nghiên cứu một cách sinh động.
Kết cấu của một bảng thống kê, gồm có:
Tên bảng hoặc tiêu đề: được viết ngắn gọn, dễ hiểu phản ánh nội dung của bảng và của từng chi tiết trong bảng. Trước hết có tiêu đề chung hay tên gọi chung, đặt ở phía trên đầu của bảng thống kê; phía trong bảng có các tiêu đề nhỏ (hay tiêu mục) là tên riêng của mỗi hàng và cột.
Phần chủ đề (hay tân từ): nêu lên tổng thể nghiên cứu được trình bày trong bảng và được phân chia thành những bộ phận nào.
Phần giải thích (hay tân từ): gồm các chỉ tiêu giải thích các đặc điểm của hiện tượng nghiên cứu, nghĩa là giải thích phần chủ đề của bảng.
Thân bảng: Phần giao nhau giữa các hàng và cột tạo thành các ô, dùng để ghi các số liệu thống kê.
Phía dưới thân bảng phải ghi rõ nguồn tài liệu để lập bảng thống kê. Các bảng thống kê thuộc các chế độ báo cáo hiện hành còn phải có ngày tháng lập bảng thống kê; họ và tên, chữ ký của người lập bảng; thủ trưởng đơn vị ký tên, ghi rõ họ, tên và đóng dấu.
Dưới đây là sơ đồ về cấu thành của một bảng thống kê:
Bảng 1.1. Tên bảng thống kê (tiêu đề chung)
Phần giải thích
Phần chủ đề
Các chỉ tiêu giải thích (tên cột)
(A)
(1)
(2)
(3)
(n)
Tên chủ đề (tên hàng)
Tổng số:
Nguồn.
..ngày ..tháng.năm.
Người lập bảng Thủ
trưởng đơn vị (Ký, ghi rõ họ tên) (Ký, ghi rõ họ tên và đóng dấu)
Các loại bảng thống kê
Căn cứ vào kết cấu của phần chủ đề, có thể chia bảng thống kê thành ba loại như sau:
Bảng giản đơn: là loại bảng mà phần chủ đề không phân tổ, chỉ sắp xếp các đơn vị tổng thể theo tên gọi, theo địa phương hoặc theo thời gian nghiên cứu.
Ví dụ 1.1. Có bảng số liệu thống kê đơn giản sau:
Bảng 1.2 . Cơ cấu giá trị tăng thêm thuần (NVA) trung bình một doanh nghiệp theo 3 loại hình ở Việt Nam thời kỳ 2008 – 2010.
Năm/Chỉ tiêu
NVA
Thù lao lao động (V)
Nộp ngân sách Nhà nước (M1)
Thu nhập ròng của doanh nghiệp(M2)
(A)
(1)
(2)
(3)
(4)
2008
100
33,0
23,9
46,1
2009
100
33,3
18,0
48,7
2010
100
35,9
18,9
45,2
Doanh nghiệp Nhà nước
2008
100
37,8
31,1
31,2
2009
100
37,6
26,6
35,8
2010
100
44,8
28,5
26,7
Doanh nghiệp ngoài Nhà nước
2008
100
41,7
18,2
40,1
2009
100
39,4
9,3
51,4
2010
100
38,6
11,6
49,8
Doanh nghiệp có vốn đầu tư nước ngoài
2008
100
20,6
21,5
57,9
2009
100
27,3
15,4
57,3
2010
100
28,5
16,0
55,3
- Bảng phân tổ: Là loại bảng trong đó hiện tượng nghiên cứu ghi trong phần chủ đề được phân tổ theo một tiêu thức cụ thể.
Ví dụ 1.2.
Bảng 1.3. Lao động bình quân 1 doanh nghiệp công nghiệp ở Việt Nam thời kỳ 2005 – 2010 phân theo ngành cấp 1
Đơn vị tính: người
Chỉ tiêu/năm
2005
2006
2007
2008
2009
2010
Bình quân chung
Chung toàn ngành
385
285
257
217
206
198
258
Trong đó:
- Công nghiệp khai thác
359
203
177
158
138
139
196
- Công nghiệp chế biến
154
146
149
151
141
129
145
- Công nghiệp sản xuất và phân phối điện, khí và nước
643
506
445
343
340
325
434
Bảng kết hợp: là loại bảng, trong đó hiện tượng nghiên cứu ghi ở phần chủ đề được phân tổ theo hai hoặc ba tiêu thức kết hợp với nhau.
Ví dụ 1.3: Có số liệu về xóa đói giảm nghèo của một huyện như sau:
Xóa đói giảm nghèo
Năm
2004
2005
2006
2007
2008
Số hộ nghèo(chuẩn QG)
856
907
3271
2747
2451
Tỷ lệ hộ nghèo(%)(chuẩn QG)
12,03
12,33
40,09
32,7
28,88
Ví dụ 1.5 : Bảng sau đây là số liệu về GDP, tích lũy tài sản đầu tư và từ đó có được hệ số ICOR của nền kinh tế Việt Nam trong giai đoạn 1995 đến 2008:
Năm
GDP(giá cố định 1994 – tỷ đồng)
Tích lũy tài sản-đầu tư(giá 1994-tỷ đồng)
Hệ số ICOR
1985
106176
12646
1986
109189
16136
5,355
1987
113154
19858
5,008
1988
119960
20505
3,012
1989
125571
20434
3,641
1990
131968
20148
3,149
1991
139634
22366
2,917
1992
151782
27086
2,229
1993
164043
39862
3,251
1994
178534
45483
3,138
1995
195567
53249
3,126
1996
213833
60826
3,330
1997
231264
66529
3,816
1998
244596
74931
5,620
1999
256272
75830
6,494
2000
273666
83997,03
4,829
2001
292535
94358,91
5,0007
2002
313247
104062,3
5,024
2003
336242
119180,5
5,183
2004
362435
128538,8
4,907
2005
392989
139304,9
4,559
2006
425373
156828,9
4,843
2007
461344
185925,3
5,169
2008
489833
202486,4
7,108
Nguồn :
Tổng cục Thống kê Việt Nam, số liệu 20 năm đổi mới và Niên giám 2009. Tổng cục Thống kê Việt Nam, Bảng đầu vào – đầu ra Việt Nam, 1989.
Tổng cục Thống kê Việt Nam, Bảng đầu vào- đầu ra Việt Nam. 1996. Tổng cục Thống kê Việt Nam, Niêm giám Thống kê 2001.
Từ các ví dụ nêu trên chúng ta có nhận xét như sau:
Các số liệu thể hiện trong các bảng là các số liệu thống kê. Các số liệu này thu thập được là dựa vào các tài liệu thống kê;
Tài liệu thống kê có được là do kết quả tổng hợp của các cơ quan từ xã- huyện- tỉnh- toàn quốc bằng cách ghi chép quá trình diễn biến trong sản xuất, trong đời sống văn hóa và lập các báo cáo hàng năm;
Từ các tài liệu thống kê từng năm, ta có thể tính bình quân rồi so sánh giữa các giai đoạn thời gian khác nhau dựa vào số liệu của từng giai đoạn.
Các số liệu thống kê cho phép đánh giá kết quả (bản chất) của các hiện tượng kinh tế xã hội của một khu vực, một đất nước ở từng năm và xu hướng phát triển của nó qua các năm (theo thời gian).
Các số liệu này cũng gợi mở cho người sử dụng nó các biện pháp thúc đẩy quá trình sản xuất tốt hơn hoặc dự kiến khả năng đạt được trong giai đoạn tới.
Tóm lại: Tất cả các công việc từ theo dõi diễn biến của các hiện tượng, ghi chép tài liệu- tổng hợp tài liệu ở phạm vi rộng hơn, phân tích rút ra kết luận về bản chất tính quy luật và đề ra các biện pháp chỉ đạolà một quá trình nghiên cứu thống kê.
Những yêu cầu chung về xây dựng bảng thống kê
Khi xây dựng bảng thống kê cần tuân thủ các yêu cầu sau:
Quy mô của bảng không nên quá lớn (không nên gồm quá nhiều phân tổ và quá nhiều hàng, cột).
Các tiêu đề và tiêu mục (tên riêng của mỗi hàng và cột) cần được ghi chính xác, gọn và dễ hiểu.
Các chỉ tiêu giải thích trong bảng cần được sắp xếp theo thứ tự hợp lý, phù hợp với mục đích nghiên cứu. Các chỉ tiêu có liên hệ với nhau nên sắp xếp gần nhau.
Các hàng và cột có thể sử dụng các ký hiệu hoặc đánh số để tiện cho việc trình bảy hoặc giải thích nội dung (riêng các cột ở phần chủ đề thường được ký hiệu bằng các chữ cái viết hoa A, B, C còn các cột ở phần giải thích thường được ký hiệu bằng các chữ số 1, 2, 3,).
Các số tổng cộng có thể ghi ở hàng (hay cột) đầu hoặc ở hàng (hay cột) cuối của phần thân bảng tùy theo mục đích nghiên cứu. Nếu ghi ở ngay hàng (hay cột) đầu tiên thì mục đích nghiên cứu tổng hợp là chính, phần chi tiết chỉ có tác dụng phân tích thêm, còn nếu ghi ở hàng (hay cột) cuối thì mục đích đi sâu nghiên cứu từng bộ phận là chủ yếu.
Các ô ở thân bảng (phần giao nhau giữa hàng và cột) dùng để ghi các số liệu thống kê. Song nếu không có số liệu thì dùng các ký hiệu quy ước sau đây:
+ Ký hiệu (-): biểu thị hiện tượng nghiên cứu không có số liệu ở ô đó.
+ Ký hiệu (): biểu thị số liệu về hiện tượng nghiên cứu còn bị thiếu, sẽ bổ sung sau.
+ Ký hiệu (x): biểu thị hiện tượng nghiên cứu không có liên quan đến tiêu đề ghi ở hàng và cột, nếu ghi số liệu vào ô đó sẽ vô nghĩa.
Trong bảng thống kê cần ghi rõ đơn vị tính cụ thể cho từng chỉ tiêu.
Số liệu ghi trong bảng có thể làm tròn (khi mục đích nghiên cứu không đặt ra số liệu phải tỉ mỉ hoặc chi ly).
Phần ghi chú ở cuối bảng dùng để giải thích rõ nội dung của một số chỉ tiêu trong bảng và nói rõ nguồn tài liệu.
Tiếp theo phần ghi chú ở cuối bảng, để đảm bảo tính pháp lý cho bảng thống kê, cần ghi rõ: ngày, tháng, năm lập bảng; người lập bảng và người đứng đầu đơn vị ký tên, ghi rõ họ tên và đóng dấu.
Phương pháp khai thác thông tin từ các bảng thống kê sẽ được đề cập ở chương sau.
Đồ thị thống kê
Khái niệm về đồ thị thống kê
Đồ thị thống kê là các hình vẽ hoặc đường nét hình học dùng để mô tả có tính chất quy ước các tài liệu thống kê về hiện tượng nghiên cứu.
Tác dụng của đồ thị thống kê
Các đồ thị thống kê sử dụng các con số kết hợp với các hình vẽ, đường nét và màu sắc để trình bảy một cách khái quát các đặc điểm số lượng của hiện tượng nghiên cứu. Do đó, nó giúp người đọc có được hình ảnh trực quan, ấn tượng để nhận thức được các đặc điểm cơ bản của hiện tượng một các dễ dàng, nhanh chóng. Vì thế nó trở thành một phương tiện truyền thông có tính quần chúng, có sức hấp dẫn và sinh động làm cho những người ít hiểu biết về thống kê vẫn lĩnh hội được vấn đề chủ yếu về hiện tượng nghiên cứu một cách dễ dàng.
Các loại đồ thị thống kê
Theo nội dung phản ánh, có thể phân chia các đồ thị thống kê thành các loại sau:
- Đồ thị phát triển: phản ánh sự phát triển của hiện tượng qua thời gian.
Đồ thị kết cấu: biểu thị kết cầu và biến động kết cấu của hiện tượng.
Đồ thị liên hệ: mô tả mối liên hệ giữa các hiện tượng.
Đồ thị hoàn thành kế hoạch (hoặc định mức): biểu thị tình hình thực hiện kế hoạch ( định mức).
Theo hình thức biểu hiện, có thể phân chia đồ thị thống kê thành:
Đồ thị đường biểu diễn (đường thẳng, đường cong, đường gấp khúc).
Biểu đồ hình cột (dọc, ngang).
Biểu đồ diện tích (hình vuông, hình tròn, hình chữ nhật).
Biểu đồ tượng hình.
Bản đồ thống kê.
Những yếu tố chính của đồ thị thống kê
Để đồ thị thống kê đáp ứng được các yêu cầu: chính xác, dễ xem, dễ hiểu thì khi xây dựng đồ thị phải chú ý đến các yếu tố chính sau:
Hệ tọa độ: giúp cho việc xác định chính xác vị trí các ký hiệu hình học trên đồ thị. Các đồ thị thống kê thường dùng hệ tọa độ Đềcác vuông góc. Trên hệ tọa độ này, trục hoành thường dùng để biểu thị thời gian, trục tung biểu thị trị số của chỉ tiêu. Trường hợp phân tích mối liên hệ giữa hai tiêu thức thị tiêu thức nguyên nhân được ghi ở trục hoành, tiêu thức kết quả ghi ở trục tung.
Các ký hiệu hình học hoặc hình vẽ: các ký hiệu hoặc hình vẽ này quyết định hình dáng của đồ thị (gồm các đường chấm, đường thẳng hoặc cong, các hình cột, vuông, chữ nhật, tròn). Các ký hiệu hình học hoặc hình vẽ trên đồ thị có thể thay đổi tùy theo tính chất của hiện tượng nghiên cứu. Việc lựa chọn này rất quan trọng, vì
mỗi ký hiệu hình học hoặc hình vẽ có khả năng diễn tả riêng. Chẳng hạn, khi cần biểu hiện kết quả của hiện tượng nghiên cứu có thể dùng hình cột (chia thành nhiều đoạn), hình tròn (chia thành các hình quạt), hình vuông hoặc chữ nhật nhưng thường dùng hình tròn vì hình này biểu hiện rõ nhất kết cấu và biến động kết cấu của hiện tượng nghiên cứu.
Thang và tỉ lệ xích: giúp tính chuyển các đại lượng lên đồ thị theo các khoảng cách thích hợp. Thường dùng thang đường thẳng (hệ tọa độ Đềcác vuông góc), một số trường hợp dùng thang đường cong (đồ thị hình tròn chia thành 3600). Khi dùng hệ tọa độ vuông góc để vẽ đồ thị thì thang tỉ lệ chia trên từng trục phải bằng nhau, song giữa hai trục thang tỉ lệ chia có thể không bằng nhau.
Tên và lời ghi chú: mọi đồ thị đều phải có tên rõ ràng và chính xác; có lời ghi chú giải thích các ký hiệu quy ước, các con số và ghi chú dọc theo thang tỉ lệ, các con số và ghi chú bên cạnh từng bộ phận của đồ thị.
*******************
Chương 2. QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ
Chương này giúp cho sinh viên nắm được : Các bước cụ thể của quá trình nghiên cứu thống kê. Từ đó, khi thực hiện đề tài nghiên cứu biết được bắt đầu từ đâu và kết thúc như thế nào?
Sơ đồ tổng quan về quá trình nghiên cứu thống kê:
Xác định vấn đề, mục đích, nội dung, đối tượng nghiên cứu
Giai đoạn 1: Điều tra thống kê
Xây dựng hệ thống các khái niệm, Chi tiêu thống kê
Điều tra thống kê
Xử lý số liệu
Tập hợp, sắp xếp số liệu
Phân tích thống kê sơ bộ
Giai đoạn 2: Tổng hợp thống kê
Chọn các phần mềm xử lý số liệu
Lựa chọn các phương pháp phân tích thống kê
Phân tích và giải thích kết quả, dự đoán xu hướng phát triển
Giai đoạn 3: Phân tích thống kê
Báo cáo truyền đạt kết quả nghiên cứu
Sơ đồ 2.1. Quá trình nghiên cứu thống kê
Quá trình nghiên cứu thống kê theo trình tự được khái quát như sơ đồ trên. Theo sơ đồ này, quá trình nghiên cứu thống kê được chia thành 6 bước theo 3 giai đoạn với trình tự từ trên xuống. Hai mũi tên có hướng đi từ dưới lên nhằm chỉ rõ các công đoạn cần phải kiểm tra lại, bổ sung thông tin hoặc làm lại nếu dữ liệu chưa đạt yêu cầu.
Giai đoạn 1 : Điều tra thống kê bao gồm thu thập các thông tin ban đầu về các tiêu thức ở từng đơn vị tổng thể. Giai đoạn 2 : Tổng hợp thống kê bao gồm tổng hợp và hệ thống hóa các tài liệu đã thu thập được từ giai đoạn 1.
Giai đoạn 3 : Phân tích thống kê nhằm sử dụng những phương pháp chuyên môn của thống kê để phát hiện các vấn đề làm cơ sở đề xuất các giải pháp.
Các bước và các giai đoạn này đều có các mối liên hệ rất chặt chẽ. Kết quả và chất lượng kết quả của bước trước làm cơ sở và có ảnh hưởng đến chất lượng bước sau.
Xác định dữ liệu cần thu thập.
Quá trình nghiên cứu thống kê cần phải có nhiều dữ liệu. Vấn đề đầu tiên của công việc thu thập dữ liệu là xác định rõ những dữ liệu nào cần thu thập, thứ tự ưu tiên của các dữ liệu này. Xác định dữ liệu cần thu thập xuất phát từ vấn đề nghiên cứu và mục tiêu nghiên cứu.
© Các loại dữ liệu thống kê
Phân theo tính chất của dữ liệu
Dữ liệu định tính là dữ liệu phản ánh tính chất và sự hơn kém về tính chất của đối tượng nghiên cứu. Ví dụ như : Giới tính, Thời gian tự học ở nhà dài hay ngắn,...
Dữ liệu định tính được thu thập dễ hơn và người ta thường dùng các thang đo định danh hay thứ bậc để xác định.
Dữ liệu định lượng là dữ liệu được phản ánh bởi các con số. Ví dụ như : độ tuổi, thời gian tự học một ngày,... Dữ liệu định lượng trong nghiên cứu thống kê thường gặp nhiều hơn, dễ áp dụng những phương pháp tính toán, phân tích hơn. Khi xác định các dữ liệu định tính, người ta thường dùng thang đo khoảng cách hay thứ bậc.
Mục đích của cách phân loại này nhằm giúp cho người nghiên cứu xác định trước các phương pháp xử lí tổng hợp và phân tích cần sử dụng cho từng loại dữ liệu sao cho phù hợp và đáp ứng mục tiêu nghiên cứu đặt ra.
Ví dụ : Các dữ liệu và phương pháp phân tích có thể áp dụng trong nghiên cứu mối liên hệ giữa tự học và kết quả học tập của sinh viên cho ở bảng 1.2
Tự học ở nhà/ngày
Kết quả học tập
Thang đo
Phương pháp phân tích
Định tính :
- Dưới 2 giờ
- Từ 2 đến 4 giờ
- Trên 4 giờ
Định tính :
- Khá giỏi
- Trung bình
- Yếu kém
Thứ bậc Định danh
Phân tổ
Định tính :
- Dưới 2 giờ
- Từ 2 đến 4 giờ
- Trên 4 giờ
Định lượng
- Điểm trung bình chung học tập/1 sinh viên
Thứ bậc Khoảng cách
Phân tích Phương sai 1 yếu tố
Định lượng
- Số giờ tự học 1 tuần
Định lượng
- Điểm trung bình chung học tập/1 sinh viên
Khoảng cách
Phân tích hồi quy
Phân theo nguồn hình thành
Dữ liệu thứ cấp là dữ liệu thu thập từ những nguồn có sẵn. Những dữ liệu này đã qua tổng hợp, xử lí, công bố hay xuất bản.
Ví dụ: Những dữ liệu về kết quả học tập của sinh viên có thể thấy ở phòng đào tạo hay trợ lí đào tạo của từng khoa là dữ liệu thứ cấp.
Dữ liệu thứ cấp có ưu điểm là thu thập nhanh, rẻ nhưng thiếu chi tiết và đôi khi không đáp ứng đúng yêu cầu nghiên cứu.
Nguồn dữ liệu thứ cấp khá phong phú thường gặp ở các nguồn chủ yếu sau :
Nội bộ : Các số liệu báo cáo về tình hình sản xuất, tiêu thụ, tài chính, vật tư, nhân sự...của các phòng ban, bộ phận ; các số liệu báo cáo từ các cuộc điều tra khảo sát trước đây ở từng đơn vị( doanh nghiệp,cơ quan, ban, ngành...)
Cơ quan thống kê Nhà nước : Các số liệu do các cơ quan thống kê Nhà nước( Tổng cục Thống kê, Cục Thống kê, Phòng Thống kê,...) cung cấp trong các niêm giám thống kê.
Cơ quan Chính phủ : Số liệu do các cơ quan trực thuộc Chính phủ( Bộ, cơ quan ngang Bộ, Ủy ban nhân dân các cấp) công bố hay cung cấp. Các số liệu này thường chi tiết hơn, mang tính chất đặc thù của ngành hay địa phương.
Sách, báo, tạp chí đã xuất bản. Các số liệu này thường mang tính thời sự và cập nhật cao, mức độ tin cậy tùy thuộc vào nguồn số liệu của từng tờ báo hay tạp chí.
Các tổ chức, hiệp hội, viện nghiên cứu, trường đại học.
Các công ty nghiên cứu và cung cấp thông tin.
Dữ liệu sơ cấp(thông tin gốc) là dữ liệu không có sẵn, dữ liệu ban đầu thu thập trực tiếp từ đối tượng nghiên cứu.
Ví dụ: Các dữ liệu có liên quan đến việc tự học của sinh viên là các dữ liệu sơ cấp, không có sẵn mà chúng ta muốn có phải điều tra từ sinh viên.
-Dữ liệu sơ cấp có ưu điểm là chi tiết, độ tin cậy cao đối với các tình huống cụ thể. Song hạn chế của nó là thu thập tốn kém, phụ thuộc vào trình độ chủ quan của người nghiên cứu( nhất là những tình huống dự báo)
Dữ liệu sơ cấp được thu thập bằng các cuộc điều tra khảo sát khác nhau.
Xét theo phạm vi thu thập
Dữ liệu tổng thể : Là dữ liệu thu thập được trên toàn bộ đơn vị tổng thể. Dữ liệu này là rất đầy đủ cho việc nghiên cứu một hiện tượng. Tuy nhiên người ta ít dùng loại dữ liệu này vì những lí do sau : Chi phí cao, không kịp thời, không thể thu thập được với tổng thể tiềm ẩn, Sai số thu thập thường quá cao do khối lượng công việc lớn, phải dùng cả những cộng tác viên thiếu năng lực.
Dữ liệu mẫu là dữ liệu thu thập được trên tập con được chọn ra từ tổng thể. Dữ liệu này hạn chế được những nhược điểm nói trên của dữ liệu tổng thể nên hay được dùng. Tuy nhiên nhược điểm riêng của nó là làm
phát sinh sai số suy rộng cho tổng thể, gọi là sai số mẫu. Để kiểm soát sai số mẫu, người ta thường dùng các phương pháp lấy mẫu ngẫu nhiên.
Xét theo đối tượng nghiên cứu
Dữ liệu chéo : là dữ liệu thu thập được trên nhiều đơn vị tổng thể, tại cùng một thời kì hay thời điểm nhất định. Trên từng đơn vị tổng thể, dữ liệu được thu thập theo một số tiêu thức được chọn lựa cho việc phục vụ nghiên cứu các hiện tượng. Dạng tổng quát của dữ liệu chéo như sau:
Đơn vị tổng thể
Tiêu thức 1
Tiêu thức 2
...
Tiêu thức k
1
X11
X12
X1k
2
X21
X22
X2k
3
X31
X32
X3k
........
........
........
........
n
Xn1
Xn2
Xnk
Dữ liệu thời gian : Là dữ liệu về một hiện tượng hay đối tượng nghiên cứu được thu thập tại nhiều thời điểm hay thời kì khác nhau. Dạng tổng quát như sau:
Thời gian
1
2
n
Trị số của hiện tượng nghiên cứu
Y1
Y2
Yn
Dữ liệu hỗn hợp : Là dữ liệu về nhiều hiện tượng hay nhiều đối tượng nghiên cứu khác nhau được thu thập tại nhiều thời điểm hay thời kì khác nhau
Ví dụ 2.1: Có số liệu về số lao động trong các ngành kinh tế của các huyện của tỉnh A qua các năm như sau:
Đơn vị
2004
2005
2006
2007
2008
TP Kon Tum
65848
68458
69034
71314
73568
Đăk Hà
17002
17328
17332
17719
18111
Ngọc Hồi
15580
15080
16940
16695
17247
Sa Thầy
15040
15676
17105
19249
19689
Ví dụ 2.2 : Điều tra về tuổi nghề và năng suất lao động trong tháng 10/2010 của 12 công nhân của phân xưởng A Công ty VLC cho kết quả sau :
Tên công nhân
Tuổi nghề
Năng suất lao động(Tr.đ/người/tháng)
A1
25
24
A2
16
28
A3
18
24
A4
22
30
A5
15
28
A6
30
28
A7
28
29
A8
32
27
A9
33
23
A10
35
25
A11
21
24
A12
5
12
A13
9
24
A14
12
22
A15
20
25
Hệ thống chỉ tiêu thống kê
Khái niệm hệ thống chỉ tiêu thống kê
Là tập hợp những chỉ tiêu thống kê nhằm phản ánh bản chất của hiện tượng nghiên cứu. Khoản 4 điều 3 Luật Thống kê quy định: ‘‘Hệ thống chỉ tiêu thống kê là tập hợp những chỉ tiêu thống kê do cơ quan nhà nước có thẩm quyền ban hành ‘‘.
2.2.2. Nguyên tắc xây dựng hệ thống chỉ tiêu thống kê
Đáp ứng được mục đích nghiên cứu
Phù hợp với đặc điểm và tính chất đối tượng nghiên cứu
Hợp lí, không thừa, không thiếu, không trùng lặp, đủ phản ánh những yêu cầu nghiên cứu phù hợp với những khả năng thu thập thông tin.
Điều tra thống kê
Khái niệm, ý nghĩa và nhiệm vụ
Quá trình thu thập thông tin của đơn vị tổng thể gọi là điều tra thống kê.
Điều tra thống kê là tổ chức một cách khoa học và có kế hoạch, để thu thập tài liệu về hiện tượng cần nghiên cứu.
Nhiệm vụ của điều tra thống kê là thu thập và cung cấp tài liệu về các đơn vị tổng thể cho các giai đoạn tiếp theo của quá trình nghiên cứu thống kê.
Điều tra thống kê phải đảm bảo chính xác, kịp thời và đầy đủ.
Chính xác nghĩa là tài liệu điều tra phản ánh đúng sự thật khách quan không thêm bớt một cách tùy tiện.
Kịp thời : nghĩa là tài liệu điều tra phải cung cấp đúng lúc khi người sử dụng cần.
Đầy đủ : nghĩa là tài liệu điều tra phải được thu thập theo đúng nội dung và số đơn vị đã quy định trong phương án điều tra.
Nội dung kế hoạch điều tra thống kê
Để thu thập đầy đủ và kịp thời các dữ liệu thì cần phải xây dựng được kế hoạch điều tra. Đây là một tài liệu dưới dạng văn bản, trong đó đề cập những vấn đề giải quyết hoặc cần được hiểu thống nhất, trình tự và phương pháp tiến hành cuộc điều tra những vấn đề thuộc về chuẩn bị và tổ chức toàn bộ cuộc điều tra.
Nội dung cơ bản của kế hoạch điều tra thống kê:
Xác định mục đích, nhiệm vụ của công tác điều tra thống kê
Mục đích điều tra là nội dung quan trọng đầu tiên cần xét đến của kế hoạch điều tra. Xác định rõ trọng tâm của cuộc điều tra là cần tìm hiểu những vấn đề gì ?. Nếu mục đích điều tra không xác định rõ ràng sẽ dẫn đến tình trạng thu thập số liệu không đầy đủ hoặc thu thập những số liệu không cần thiết, lạc hậu.
Xác định đối tượng điều tra, đơn vị điều tra
Đối tượng điều tra là tổng thể các đơn vị thuộc hiện tượng nghiên cứu có thể cung cấp những dữ liệu cần thiết khi tiến hành điều tra. Xác định đối tượng điều tra là xác định tổng thể và phạm vi cần điều tra.
Xác định đơn vị điều tra là xác định những đơn vị cụ thể cần phải được điều tra trong đối tượng quan sát. Trong điều tra toàn bộ thì số đơn vị điều tra chính là số đơn vị thuộc đối tượng điều tra. Trong điều tra không toàn bộ thì số đơn vị điều tra là những đơn vị được chọn ra trong số đơn vị của đối tượng điều tra.
Nội dung điều tra
Nghĩa là chọn các tiêu thức điều tra, khi lựa chọn tiêu thức điều tra cần đảm bảo các yêu cầu sau :
Tiêu thức điều tra phải phù hợp với mục đích và nhiệm vụ công tác nghiên cứu thống kê.
Phải phản ánh được những đặc điểm cơ bản, quan trọng nhất của đối tượng nghiên cứu.
Phải thống nhất với chỉ tiêu kế hoạch.
Chọn các tiêu thức có liên quan chặt chẽ hoặc có thể bổ sung cho nhau, tạo điều kiện thuận lợi cho việc kiểm tra tính chính xác của dữ liệu.
Xác định thời điểm, thời kì điều tra
Thời điểm điều tra là mốc thời gian được xác định để thống nhất đăng kí dữ liệu của toàn bộ các đơn vị điều tra. Xác định thời điểm điều tra là xác định cụ thể ngày, giờ để thống nhất đăng kí dữ liệu.
Thời kì điều tra là khoảng thời gian từ khi bắt đầu đăng kí thu thập số liệu cho đến khi kết thúc điều tra.
Địa điểm điều tra thường là nơi diễn ra hiện tượng cần nghiên cứu.
Lập biểu điều tra hướng dẫn cách ghi
Biểu điều tra (hay phiếu điều tra, bảng câu hỏi) là bảng hướng dẫn ghi những mục cần thiết để điều tra, bao gồm các cột có ghi các tiêu thức điều tra và các câu hỏi để đơn vị điều tra trả lời.
Ví dụ : Biểu điều tra (qua thư, thư điện tử, fax) để tìm hiểu ý kiến khách hàng về chất lượng dịch vụ điện thoại di động.
Kế hoạch thực hiện
Bố trí lực lượng điều tra và chọn phương pháp
Các loại điều tra thống kê
Theo tính chất liên tục của việc ghi chép dữ liệu
Điều tra thường xuyên : Là việc tiến hành thu thập, ghi chép dữ liệu ban đầu về hiện tượng nghiên cứu một cách có hệ thống theo sát quá trình nghiên cứu một cách thường xuyên, liên tục gắn liền với quá trình phát sinh, phát triển, biến động của hiện tượng.
Ví dụ : Tại một địa phương có thể điều tra biến động dân số( sinh, tử...) Đối với doanh nghiệp có thể điều tra : Số lượng sản phẩm được sản xuất, số sản phẩm tiêu thụ...Dữ liệu điều tra thường xuyên là cơ sở chủ yếu để lập các báo cáo thống kê theo định kì.
Điều tra không thường xuyên : Là tiến hành thu thập ghi chép dữ liệu ban đầu, một cách không liên tục mà chỉ tiến hành khi có nhu cầu cần nghiên cứu hiện tượng. Dữ liệu điều tra không thường xuyên phản ánh trạng thái của hiện tượng tại một thời điểm nhất định.
Ví dụ : Điều tra lượng hàng tồn kho của một doang nghiệp tại một thời điểm, điều tra năng suất cây trồng...Các cuộc điều tra không thường xuyên có thể tiến hành theo định kì nhất định hay không định kì.
Theo phạm vi khảo sát và thu thập thực tế
Điều tra toàn bộ: là tiến hành thu thập, ghi chép dữ liệu trên tất cả các đơn vị của tổng thể hiện tượng nghiên cứu.
Ví dụ: Tổng điều tra dân số, tổng điều tra nhà ở, tổng điều tra dự trử hàng tồn kho.
Ưu điểm của điều tra toàn bộ là thu thập được thông tin về tất cả các đơn vị tổng thể. Tuy nhiên điều tra này thường gặp một số trở ngại sau :
Đòi hỏi chi phí rất lớn về nhân lực, thời gian, chi phí.
Trong một số trường hợp do thời gian kéo dài dẫn đến số liệu kém chính xác do hiện tượng tự biến động qua thời gian.
Điều tra không toàn bộ: là tổ chức điều tra thu thập tài liệu theo yêu cầu nghiên cứu chỉ thực hiện trên một số đơn vị được chọn ra từ tổng thể nghiên cứu.
Ví dụ: Điều tra mức sống của công nhân, giá cả thị trường, điều tra lao động và việc làm
Ưu điểm của điều tra không toàn bộ là chi phí ít tốn kém, thời gian nhanh, khả năng thu thập tài liệu cũng tỷ mỹ, đảm bảo chính xác, kịp thời và áp dụng cho những trường hợp nghiên cứu mà hiện tượng đó không thể áp dụng điều tra toàn bộ.
Nhược điểm chủ yếu là nếu các đơn vị điều tra được chọn không đáp ứng yêu cầu, mục đích nghiên cứu thì phản ánh không đúng thực tế. Vì vậy khâu chọn đơn vị điều tra rất quan trọng.
Điều tra không toàn bộ chia làm 3 loại :
+ Điều tra chuyên đề : Là tiến hành điều tra trên một số ít các đơn vị của tổng thể nhưng lại đi sâu nghiên cứu nhiều khía cạnh của đơn vị đó. Mục đích là khám phá, tìm hiểu các yếu tố ảnh hưởng đến hiện tượng nghiên cứu. Dữ liệu của điều tra phục vụ cho nghiên cứu định tính, không dùng để suy rộng, không dùng để tìm hiểu tình hình cơ bản của hiện tượng, mà chỉ rút ra kết luận về bản thân các đơn vị được điều tra. Kết quả điều tra chuyên đề có thể được sử dụng làm cơ sở thiết kế cho một cuộc điều tra quy mô lớn hơn, mang tính chất nghiên cứu định lượng.
Ví dụ : Điều tra điển hình một số công nhân có con nhỏ, đạt kết quả sản lượng sản phẩm đề ra, một vài công nhân cũng có con nhỏ nhưng đạt sản lượng sản phẩm thấp. Các kết quả điều tra chuyên đề này giúp khám phá những yếu tố quan trọng có ảnh hưởng đến kết quả sản lượng sản phẩm, trên cơ sở đó xác định các dữ liệu cần thu thập trong nghiên cứu định lượng.
+ Điều tra chọn mẫu: Được thực hiện bằng cách chọn ra một số phần tử hay đơn vị thuộc tổng thể đơn vị nghiên cứu để thu thập dữ liệu thực tế. Loại điều tra này được dùng nhiều nhất trong nghiên cứu vì tiết kiệm thời gian, chi phí và dữ liệu đáng tin cậy. Dữ liệu điều tra chọn mẫu được dùng để suy rộng thành các đặc trung chung của toàn bộ tổng thể hiện tượng nghiên cứu.
+ Điều tra trọng điểm: Là tiến hành thu thập dữ liệu trên bộ phận chủ yếu nhất, tập trung nhất trong toàn bộ tổng thể hiện tượng nghiên cứu. Kết quả thu được từ điều tra giúp nhận biết nhanh tình hình cơ bản của hiện tượng nghiên cứu, không dùng để suy rộng thành các đặc trưng chung tổng thể.
Hai hình thức tổ chức điều tra thống kê
Báo cáo thống kê định kỳ : là hình thức điều tra thống kê thu thập tài liệu về hiện tượng kinh tế XH một cách thường xuyên có định kỳ theo nội dung, phương pháp và biểu mẫu báo cáo thống kê do cơ quan có thẩm quyền quy định.
Ví dụ: Báo cáo doanh thu, kim gạch xuất nhập khẩu, tổng chi đầu tư tài sản cố định, báo cáo kết quả thi và kiểm tra môn học của sinh viên; báo cáo tài chính cuối tháng, cuối năm; báo cáo số người đi làm từng ngày....
Hình thức này cung cấp nguồn dữ liệu thường xuyên, ổn định với chi phí thấp nên được sử dụng rất phổ biến.
Điều tra chuyên môn: Là hình thức tổ chức thu thập tài liệu thống kê về hiện tượng KT-XH một cách không thường xuyên, không định kì mà tiến hành theo một kế hoạch và phương pháp quy định riêng cho mỗi lần điều tra.
Điều tra chuyên môn chỉ thu thập tài liệu vào thời kì hoặc thời điểm có yêu cầu nghiên cứu. Ví dụ : Điều tra dân số, điều tra gia súc, điều tra phạm tội...
Các cuộc điều tra chuyên môn trên phạm vi toàn quốc như điều tra dân số, điều tra tình hình kinh tế và đời sống nông thôn, điều tra năng lực sản xuất công nghiệp của các thành phần kinh tế ngoài quốc doanh, thường gọi là tổng điều tra.
Tiến hành điều tra chuyên môn, người ta thường xây dựng phương án điều tra gồm các nội dung :
Mục đích điều tra
Đối tượng điều tra : Là tổng thể các đơn vị thuộc đối tượng nghiên cứu có thể cung cấp những tài liệu cần thiết khi tiến hành điều tra.
Đơn vị điều tra : Là đơn vị thuộc đối tượng điều tra và được xác định sẽ điều tra thực tế.
Nội dung điều tra : xác định rõ danh sách các tiêu thức điều tra.
Biểu mẫu điều tra và bản giải thích các ghi biểu
Ví dụ : Điều tra giá cả, điều tra dư luận xã hội về một chủ đề nào đó (điều tra dư luận về vấn đề tăng giá điện)...
Các phương pháp thu thập tài liệu ban đầu
Phương pháp trực tiếp:
Theo phương pháp này người làm công tác điều tra phải tự mình trực tiếp quan sát, phỏng vấn thực tế, cân, đong, đo, đếm và tự ghi chép tài liệu.
Quan sát: Là thu thập dữ liệu bằng cách quan sát các hành động, thái độ của đối tượng quan sát trong những tình huống nhất định.
Ví dụ : quan sát số lượng và thái độ của du khách tới thăm chùa Linh Ứng tại Đà Nẵng.
Phỏng vẫn trực tiếp: người phỏng vấn trực tiếp hỏi đối tượng điều tra và tự ghi chếp dữ liệu vào bản câu hỏi hay phiểu điều tra. Phương pháp phỏng vấn trực tiếp phải phù hợp với những cuộc điều tra phức tạp cần thu thập nhiều dữ liệu.
Ví dụ : Trong điều tra điều tra năng suất cây trồng, khối lượng gia súc người điều tra đều phải trực tiếp phỏng vấn, đo, đếm để thu thập dữ liệu.
Ưu điểm : Thời gian phỏng vấn có thể ngắn hay dài tùy thuộc vào số lượng dữ liệu cần thu thập. Nhân viên trực tiếp phỏng vấn có điều kiện để giải thích một cách đầy đủ cặn kẽ đặt những câu hỏi chi tiết để khai thác thông tin và kiểm tra dữ liệu trước khi ghi chép vào phiếu điều tra. Ưu điểm lớn nhất là dữ liệu được thu thập đầy đủ theo nội dung điều tra và có độ chính xác khá cao nên thường được áp dụng phổ biến.
Nhược điểm: Phương pháp này đòi hỏi chi phí lớn nhất là chi phí về nhân lực và thời gian.
Phương pháp gián tiếp.
Theo phương pháp này người ta điều tra thu thập tài liệu theo các nội dung cần nghiên cứu phải thông qua một phương tiện trung gian như điện thoại, thư tín hoặc các chứng từ sổ sách đã ghi chép ở thời gian trước.
Ví dụ : Điều tra cảm nhận của khách hàng về sản phẩm mới, điều tra thu chi trong doanh nghiệp, điều tra tình hình sinh tử, điều tra tài sản, điều tra tình hình thu chi của các hộ gia đình...
Ưu điểm của phương pháp này là đỡ tốn kém nhưng có nhược điểm là mức độ đầy đủ và chính xác không cao nên chỉ áp dụng trong những trường hợp khó khăn hoặc không có điều kiện thu thập trực tiếp.
Các sai số trong điều tra thống kê và biện pháp khắc phục.
Sai số trong điều tra thống kê là chênh lệch giữa trị số mà điều tra thống kê thu thập được với trị số thực của tiêu thức ấy.
Sai số trong thống kê thường được chia làm hai loại :
+ Sai số do đăng kí ghi chép : là mọi sai số phát sinh trong quá trình điều tra do các nguyên nhân :
Do người được phỏng vấn không hiểu đúng câu hỏi hay cố ý trả lời sai
Do phương tiện điều tra không chính xác
+ Sai số do tính chất đại biểu : là sai số chỉ tồn tại trong điều tra chọn mẫu do các nguyên nhân :
Do việc chọn các đơn vị điều tra thiếu khách quan, thiếu khoa học
Do bản thân việc suy rộng : nghĩa là ta chỉ thu thập dữ liệu từ một số ít đơn vị thuộc đối tượng điều tra rồi căn cứ kết quả điều tra thực tế mà suy rộng thành các đặc trưng của tổng thể.
Để hạn chế sai số cần chú ý hai biện pháp sau :
Làm tốt công tác chuẩn bị điều tra ở tất cả các khâu
Kiểm tra một cách toàn diện và theo suốt quá trình điều tra để phát hiện và có biện pháp khắc phục kịp thời.
Tổng hợp thống kê
Khái niệm
Kết quả của giai đoạn điều tra thống kê chỉ cho các dữ liệu thô về các đặc trưng riêng biệt của từng đơn vị tổng thể. Các dữ liệu này còn rời rạc, rất khó quan sát để đưa ra các nhận xét chung cho cả hiện tượng nghiên cứu và chưa thể sử dụng được vào công tác nghiên cứu, phân tích và dự báo thống kê được.
Ví dụ : Nghiên cứu tình hình trang bị máy điều hòa không khí cho các phòng học chất lượng cao của trường Đại học Tài chính Marketing, ở giai đoạn điều tra thống kê ta có các tài liệu ban đầu như sau : Số lượng máy, năm sản xuất, năm lắp đặt, nguồn gốc của máy, công suất, hãng sản xuất, tình trạng hiện tại...Khi đó cần trả lời các câu hỏi :
Trường có bao nhiêu máy điều hòa không khí cho các lớp học chất lượng cao ?
Mỗi phòng bao nhiêu máy ?
Hãng sản xuất, công suất ?
Nơi sản xuất ?
Tình trạng hiện tại ?
- ...
Để có các tài liệu phản ánh chung cho cả tổng thể nghiên cứu thì từ các thông tin riêng biệt của từng đơn vị chúng ta phải sắp xếp lại, hệ thống hóa, phân loại theo những tiêu thức cần nghiên cứu để thấy được các đặc trưng chung của tổng thể mẫu hay toàn bộ tổng thể nghiên cứu. Toàn bộ những công việc đó, người ta gọi là tổng hợp thống kê.
Tổng hợp thống kê là tiến hành tập trung, chỉnh lí và hệ thống hóa các tài liệu ban đầu thu thập được trong điều tra thống kê của từng đơn vị tổng thể thành tài liệu phản ánh đặc trưng chung của tổng thể nghiên cứu.
Ý nghĩa và nhiệm vụ của tổng hợp thống kê
+ Ý nghĩa:
Tổng hợp thống kê là giai đoạn thứ hai của quá trình nghiên cứu thống kê không thể thiếu được và là cơ sở rất quan trọng cho giai đoạn phân tích thống kê. Nếu chúng ta có một hệ thống số liệu phong phú nhưng không tổng hợp được một cách khoa học thì không bao giờ chúng ta có được một kết luận đúng đắn, phản ảnh đúng hiện thực xã hội.
+ Nhiệm vụ: Nhiệm vụ của giai đoạn này là:
Tập trung và sắp xếp các tài liệu theo một trình tự nhất định : Thường áp dụng cho dữ liệu thu thập được ở số ít các đơn vị.
Sắp xếp các đơn vị vào các tổ nhóm theo một hay một vài tiêu thức đặc trưng và tính toán các đại lượng thống kê đặc trưng cho tổ nhóm và toàn bộ tổng thể : Nhiệm vụ này thường gặp khi tài liệu điều tra thu thập được ở số lớn các đơn vị, khối lượng dữ liệu nhiều
Trình bày dữ liệu tổng hợp dưới hình thức bảng hay đồ thị thống kê.
Các loại thang đo (Scales of Measuremnt)
Thang đo định danh (Nominal Scale)
Là loại thang đo sử dụng cho dữ liệu thuộc tính. Có thể sử dụng các dữ liệu bằng số, kí tự hoặc kết hợp cả hay để phân loại các biểu hiện của tiêu thức thuộc tính.
Ví dụ: Giới tính của chủ hộ
Nam 2. Nữ Nghề nghiệp của chủ hộ
1. Công, viên chức 2. Công nhân 3. Trường hợp khác
Thang đo thứ bậc(Ordinal Scale)
Được sử dụng cho các dữ liệu thuộc tính, nhưng dữ liệu trong trường hợp này có quan hệ thứ bậc hơn kém, nhưng không diễn tả được độ lớn giữa vị trí cao thấp, giữa các con số. Tóm lại thang đó thứ tự bao gồm cả thông tin về biểu danh đồng thời cung cấp luôn mối quan hệ theo thứ tự giữa các giá trị nhưng không đo được khoảng cách giữa các giá trị đó.
Ví dụ: ( 1) Hãy sắp xếp các loại nước tùy theo mức độ sở thích (thích nhất : 1, thích nhì : 2... đến số 5) Coca-Cola P
Pepsi- Cola P
Sprite P
7-Up P
Fanta P
(2).Trong các yếu tố sau đây, hãy cho biết mức độ quan trọng nhất, nhì, ba trong lựa chọn mua một máy điện thoại ?
Chất lượng bắt sóng P
Kiểu dáng thời trang P
Nguồn gốc xuất xứ P
Hoặc : Mức độ hài lòng với dịch vụ cung cấp của Mobiphone
Hài lòng 2. Bình thường 3. Không hài lòng
Thang đo khoảng (Interval Scale)
Là loại thang đo có khoảng cách đều nhau và được sử dụng cho các dữ liệu định lượng, giúp ta đo lường mức độ khác biệt giữa các thứ bậc, thông thường thang đo khoảng là một dãy số các chữ số liên tục đều đặn từ 1 đến 5 hoặc 1 đến 7, từ 1 đến 10. Dãy số này có hai cực ở hai đầu thể hiện hai trạng thái đối nghịch nhau.
Ví dụ: Câu hỏi khảo sát về các yếu tố ảnh hưởng đến khả năng bỏ học của học sinh
Hãy trả lời các câu hỏi sau bằng cách đánh dấu x vào các ô mà các bạn cho là phù hợp nhất cho mức độ đồng ý hay không đồng ý theo ý kiến cá nhân các bạn
Rất không đồng ý
Không đồng ý
Không ý kiến
Đồng ý
Rất đồng ý
1
2
3
4
5
Nhân tố kinh tế hộ gia đình
1
2
3
4
5
1.
Kinh tế gia đình khó khăn nên phải bỏ học
P
P
P
P
P
2.
Phải nghỉ học để đi làm phụ giúp bố mẹ
P
P
P
P
P
3.
Thường phải đi làm thuê kiếm tiền phụ giúp gia đình trong khi đi học
P
P
P
P
P
4.
Làm nhiều việc phụ giúp gia đình thiếu thời gian học tập
P
P
P
P
P
Điều kiện cơ sở hạ tầng, giao thông đi lại
1
2
3
4
5
5.
Khoảng cách đi từ nhà đến trường quá xa nên bỏ học
P
P
P
P
P
6.
Cơ sở vật chất của trường thiếu thốn nên không muốn học
P
P
P
P
P
Thang đo tỉ lệ (Ratio Scale)
Đây là thang đo dùng cho dữ liệu số lượng. Thang đo tỉ lệ có đầy đủ các đặc tính của thang đo khoảng, ngoài ra nó còn có trị số “ 0 ” thật. Đây là loại thang đo cao nhất trong các loại thang đo.
Từ bốn dạng thang đo trên ta phân ra hai loại biến. Biến định tính là biến chứa các giá trị quan sát ở dạng thang đo biểu danh và thứ tự. Còn biến định lượng là biến chứa các giá trị có dạng thang đo khoảng cách và tỉ lệ.
Phân tích thống kê.
Khái niệm về phân tích thống kê
Là việc nghiên cứu nêu lên một cách tổng hợp bản chất và tính quy luật của hiện tượng trong điều kiện lịch sử nhất định qua biểu hiện bằng số lượng là chủ yếu. Phân tích thống kê là giai đoạn cuối cùng của quá trình nghiên cứu thống kê.
Ý nghĩa nhiệm vụ phân tích thống kê
Phân tích thống kê là căn cứ vào tài liệu tổng hợp thống kê để:
Xem xét mối liên hệ của các nguyên nhân đến kết quả của hiện tượng nghiên cứu.
Rút ra xu hướng vận động, quy luật vận động của hiện tượng nghiên cứu.
Dự báo quy mô, khối lượng hoặc chiều hướng vận động của hiện tượng nghiên cứu trong tương lai,
Phân tích thống kê liên hệ mật thiết với các giai đoạn điều tra và tổng hợp thống kê, chỉ có dựa trên cơ sở tài liệu điều tra phong phú, chính xác, kết quả tổng hợp một cách khoa học thì phân tích thống kê mới có khả năng rút ra được những kết quả đúng đắn, nếu không dù phương pháp phân tích có khoa học, hiện đại như thế nào kết quả cũng sẽ bị hạn chế, thậm chí không có giá trị và còn có thể xuyên tạc sự thật.
Các nhiệm vụ này của phân tích thống kê có liên hệ mật thiết và không tách rời nhau trong mọi trường hợp phân tích thống kê. Trước khi tiến hành phân tích phải lấy đề cương phân tích, trong đó nêu rõ mục đích (nhiệm vụ) phân tích, nội dung phân tích, công tác kiểm tra, đánh giá tài liệu dùng phân tích, các chỉ tiêu và phương pháp phân tích, sau khi phân tích phải lập báo cáo phân tích, trong dố nêu các số liệu cần thiết, các lời bình luận và các kiến nghị cụ thể
Ví dụ : Bảng sau là tốc độ tăng giá trị sản xuất ngành công nghiệp của Việt Nam qua các năm :
(ĐVT : %)
Chỉ tiêu/ Năm
2002
2003
2004
2005
2006
2007
2008
2009
Toàn ngành
14,8
16,8
16,6
17,1
16,8
16,7
13,9
7,6
1. Khu vực doanh nghiệp Nhà nước
12,5
11,9
11,9
7,2
5,8
5,0
2,7
1,6
- Trung ương
12,1
16,2
14,68
12,4
8,9
6,8
4,8
4,1
- Địa phương
13,3
3,5
5,6
-5,2
-2,9
-0,7
-4,5
-7,7
2. Khu vực ngoài Nhà nước
18,3
23,3
22,3
25,4
25,7
24,7
19,8
10,1
3. Khu vực có vốn đầu tư nước ngoài
15,2
18,0
17,4
21,2
19,9
19,7
16,9
9,2
Nguồn : Thời báo kinh tế Việt Nam : Kinh tế 2009 – 2010 Việt Nam và thế giới Tr. 74
Bảng số liệu trên cho thấy giá trị sản xuất nền công nghiệp Việt Nam trong những năm đầu thế kỷ 21 tăng nhanh. Trong đó khu vực ngoài Nhà nước tăng nhanh nhất, kế tiếp là khu vực có vốn đầu tư nước ngoài. Khối các doanh nghiệp Nhà nước tăng chậm hơn cả. Đặc biệt là các doanh nghiệp Nhà nước địa phương có tốc độ tăng là âm từ năm 2005 đến năm 2009. Lý do chính là do chuyển đổi từ sở hữu Nhà nước sang khu vực kinh tế ngoài Nhà nước dưới hình thức « Công ty cổ phần » .
Các bước tiến hành phân tích thống kê
Xác định nhiệm vụ cụ thể của phân tích thống kê
Là xác định mục đích yêu cầu, những vấn đề cần khi tiến hành phân tích mới có thể quyết định được cần thu thập những tài liệu nào, thu thập từ đâu, chọn chỉ tiêu nào để phân tích và phân tích bằng những phương pháp nào. Thực ra để thỏa mãn được yêu cầu của quá trình nghiên cứu thống kê thì nhiệm vụ của phân tích thống kê đã được xác định ngay từ khi đặt kế hoạch điều tra và tổng hợp vì có như vậy các tài liệu điều tra, tổng
hợp mới thỏa mãn được yêu cầu của phân tich, tuy vậy khi bước vào giai đoạn phân tích vẫn cần nhắc lại và cụ thể hóa hơn nữa nhiệm vụ của phân tích, trong khi phân tích phải xoay quanh nhiệm vụ đề ra, tránh được việc tính toán lan man những chỉ tiêu không cần thiết, làm mất thời gian mà không đạt hiệu quả.
Lựa chọn đánh giá tài liệu dùng để phân tích.
Trong thực tế muốn tiến hành phân tích thống kê phải dùng một khối lượng rất lớn các tài liệu, các tài liệu này được thu thập từ rất nhiều nguồn khác nhau cho nên trước khi sử dụng cần có sự lựa chọn và đánh giá tài liệu một cách đầy đủ. Khi đánh giá tài liệu cụ thể, phải xem xét các mặt sau :
Tài liệu thu thập có đảm bảo chính xác, đầy đủ, kịp thời, phương pháp thu thập có khoa học không ?
Tính khoa học và việc đáp ứng mục đích nghiên cứu của sự chỉnh lí và phân tổ của tài liệu.
Phương pháp tính toán các chi tiết, các phương pháp này có nhất quán với các phương pháp của thống kê không ?
Khi đánh giá các tài liệu thu thập bằng điều tra không toàn bộ (điều tra chọn mẫu...) thì cần chú ý đến tính đại diện của số đơn vị được chọn để điều tra thực tế.
Việc lựa chọn, đánh giá tài liệu dùng để phân tích là công việc quan trọng rất cần thiết để đảm bảo tính chính xác và sức thuyết phục của các kết luận thống kê.
Xác định các phương pháp và các chỉ tiêu phân tích
Thống kê học vận dụng nhiều phương pháp khác nhau trong phân tích, mỗi phương pháp có một tác dụng riêng do đó trong phân tích, tùy theo nhiệm vụ nghiên cứu, tùy theo tính chất và đặc điểm của hiện tượng nghiên cứu mà sử dụng các phương pháp phân tích khác nhau cho các hiện tượng khác nhau sao cho tác dụng của từng phương pháp phát huy được một cách đầy đủ nhất.
Vấn đề xác định chỉ tiêu phân tích cũng là vấn đề quá quan trọng vì biểu hiện cuối cùng của bản chất về tính quy luật của hiện tượng là các chỉ tiêu và số liệu thống kê, do đó trong phân tích cần dựa vào mục đích và nhiệm vụ phân tích mà xác định chỉ tiêu phân tích, khi lựa chọn xác định cần lưu ý :
Các chỉ tiêu phải là những chỉ tiêu quan trọng nhất có thể phản ánh đúng đắn và tập trung nhất những đặc điểm, tính chất, các mối liên hệ cơ bản của hiện tượng.
Các chỉ tiêu cần có sự liên hệ với nhau, dựa vào các phương trình kinh tế để xác định hệ thống chỉ tiêu nhằm phân tích được sâu sắc và toàn diện hiện tượng nghiên cứu.
So sánh đối chiếu các chỉ tiêu
Mỗi chỉ tiêu thống kê chỉ phản ánh một mặt nào đó của hiện tượng nghiên cứu, do đó khi phân tích thống kê cần so sánh, đối chiếu các chỉ tiêu với nhau. Qua so sánh đối chiếu mới có thể thấy rõ được các đặc điểm và bản chất của hiện tượng nghiên cứu, mới phát hiện được nhiều vấn đề có ý nghĩa, vạch rõ được nguyên nhân phát triển của hiện tượng, các vấn đề tồn tại, các khả năng tiềm tàng trong nội bộ hiện tượng... từ đó mới có thể rút ra được những kết luận sâu sắc, chính xác.
Ví dụ: Khi phân tích tình hình sản xuất ở một xí nghiệp bưu điện trong tháng nào đó, rõ ràng ta phải tiến hành so sánh đối chiếu sản lượng thực tế tháng này với sản lượng thực tế tháng trước, nhưng nếu chỉ số so sánh như thế thì chưa đủ, chưa thể thấy rõ được sản xuất của xí nghiệp như vậy tốt hay xấu bởi vì sản lượng của xí nghiệp bưu điện thường biến động do nhiều nhu cầu khách quan, có thể sản lượng của tháng này so với tháng trước tăng rất cao nhưng tình hình sản xuất thực tế là không phát triển do đó để có những kết luận sâu sắc và toàn diện ta còn cần so sánh với các chỉ tiêu về năng suất lao động, chất lượng sản phẩm...
Trong so sánh đối chiếu cần lưu ý phải đảm bảo tính chất có thể so sánh được giữa các chỉ tiêu thống kế. Nếu các chỉ tiêu không có đầy đủ tính chất so sánh thì cần phải tiến hành điều chỉnh, tính toán lại cho chúng trở thành so sánh được.
Rút ra kết luận và đề xuất kiến nghị
Đây là sự thể hiện tập trung thành quả của toàn bộ công tác nghiên cứu thống kê bởi vì phân tích thống kê cuối cùng phải đi tới kết luận chính xác và khoa học về bản chất và tính quy luật của hiện tượng, đồng thời phải có thể dự đoán được mức độ phát triển của hiện tượng và đề ra được những kiến nghị thực tế.
Những kết luận rút ra phải chính xác và có căn cứ khoa học, tuyệt đối tránh những kết luận rút ra từ sự suy đoán chủ quan. Các kiến nghị đề xuất phải nhằm giải quyết các vấn đề thúc đẩy sự phát triển hợp với quy luật phát triển của hiện tượng, nhằm tăng cường cải tiến quản lí, đồng thời những kiến nghị, đề xuất này phải có ý nghĩa thiết thực, phù hợp với hoàn cảnh thực tế và các khả năng thực hiện được.
*******************
Chương 3. PHÂN TỔ THỐNG KÊ
Tổng hợp thống kê hay nói cách khác đó chính là phân tổ thống kê bằng cách tóm tắt các dữ liệu.
Thông tin ban đầu có tính rời rạc, dữ liệu lộn xộn, không theo một trật tự nào và có thể quá nhiều, nếu nhìn vào đây chúng ta không thể phát hiện được điều gì để phục vụ cho quá trình nghiên cứu. Do đó, chúng ta cần phải trình bày một cách có hệ thống với hai mục đích là làm cho bảng dữ liệu gọn lại, hai là thể hiện tính chất của nội dung nghiên cứu.
Chương này giúp sinh viên biết cách tóm tắt dữ liệu lại cho gọn gàng hơn, để dữ liệu trở nên dễ nhìn, dễ hiểu và dễ quản lí hơn.
Khái niệm, ý nghĩa và nhiệm vụ của phân tổ thống kê
Khái niệm
Phân tổ thống kê là phân chia tổng thể nghiên cứu thành các tổ có tính chất khác nhau dựa trên một hay một vài tiêu thức nào đó.
Ví dụ 3.1 : Với bảng số liệu trong ví dụ 2.1 (Điều tra về tuổi nghề và năng suất lao động trong tháng 10/2010 của 15 công nhân của phân xưởng A Công ty VLC), theo tiêu thức phân tổ (tiêu thức nguyên nhân) là tuổi nghề, tiêu thức kết quả là năng suất lao động, ta phân tổ như sau :
Tên công nhân
Tuổi nghề
Năng suất lao động(Tr.đ/người/tháng)
A12
5
12
A13
9
24
A14
12
22
A5
15
28
Tổng số tổ 1
41
86
Bình quân tổ 1
10,25
21,5
A2
16
28
A3
18
24
A15
20
25
A11
21
24
A4
22
30
A1
25
24
A7
28
29
A6
30
28
Tổng số tổ 2
180
212
Bình quân tổ 2
22,5
26,5
A8
32
27
A9
33
23
A10
35
25
Tổng số tổ 3
100
75
Bình quân tổ 3
33,33
25
Tổng số chung
321
373
Bình quân chung
21,4
24,87
Bảng 3.1. Phân tổ nghiên cứu mối quan hệ giữa tuổi nghề với năng suất lao động của 15 công nhân phân xưởng A công ty VLC
Ta có bảng kết quả phân tổ như sau :
Tổ
Tuổi nghề
Số lao động
Tuổi nghề bình quân
Năng suất lao động(Trđ/người/tháng)
1
≤ 15
4
10,25
21,50
2
16 đến 30
8
22,50
26,50
3
> 30
3
33,33
25,00
Chung
15
21,40
24,87
Bảng 3.1. Nghiên cứu mối quan hệ giữa tuổi nghề với năng suất lao động của công ty VLC tháng 10 năm 2010.
Ví dụ 3.2: Phân tổ 80 em sinh viên trong lớp Quản trị kinh doanh theo tiêu thức giới tính.
Chỉ tiêu
Số lượng (sinh viên)
Tỷ lệ (%)
Nam
50
62.5%
Nữ
30
37.5%
Tổng
80
100%
Bảng 3.3 Khi phân tổ thống kê, các đơn vị tổng thể được tập hợp vào một số tổ, giữa các tổ lại có sự khác nhau về tính chất. còn trong phạm vi mỗi tổ, các đơn vị có cùng (hoặc gần giống nhau) về tính chất theo tiêu thức được dùng làm căn cứ phân tổ
Ý nghĩa
Phân tổ là phương pháp cơ bản để tổng hợp thống kê nhằm có được các tài liệu thích hợp cho các mục đích nghiên cứu khác nhau
Phân tổ nhằm hệ thống hóa một cách khoa học các tài liệu điều tra, tổng hợp.
Phân tổ thống kê là một phương pháp quan trọng để phân tích thống kê.
Nhiệm vụ của phân tổ thống kê
Muốn phản ánh được bản chất và quy luật phát triển của hiện tượng phải nêu được đặc trưng của từng loại hình của từng bộ phận cấu thành hiện tượng phức tạp, đánh giá tầm quan trọng của mỗi bộ phận, nêu lên mối quan hệ của các bộ phận, từ đó mới nhận thức được các đặc trưng của mỗi tổng thể hiện tượng nghiên cứu. Như vậy phân tổ thống kê có nhiệm vụ :
Phân chia các loại hình kinh tế- xã hội của hiện tượng nghiên cứu
Biểu hiện kết cấu của hiện tượng nghiên cứu
Biểu hiện mối quan hệ giữa các tiêu thức.
Quá trình phân tổ thống kê (phương pháp phân tổ)
Hiện nay công nghệ tin học khá phát triển, người ta đã lập trình và vận dụng các chương trình máy tính đưa vào ứng dụng trong nghiên cứu và phục vụ sản xuất. Về phân tổ thống kê cũng đã có nhiều chương trình máy tính chuyên cho sử dụng số liệu thống kê đã thực hiện. Ví dụ STATGRAF, EVIEW, SPSS và EXCEL... Nhưng, đó chỉ là công việc đơn thuần mà máy tính thực hiện, còn mục đích phân tổ của chúng ta để làm gì, chia làm bao nhiêu tổ... Máy tính không thể thực hiện được, vì vậy người làm công tác chuyên môn thống kê hoặc vận dụng thống kê làm công cụ quản lí xã hội và kinh tế cần nắm vững, hiểu được những công việc của phân tổ thống kê. Quá trình phân tổ thống kê gồm các bước :
Bước 1 : Chọn tiêu thức phân tổ
Bước 2 : Xác định số tổ và phạm vi biến thiên của từng tổ
Bước 3 : Lựa chọn các chỉ tiêu giải thích và sắp xếp các đơn vị vào các tổ tương ứng.
Lựa chọn tiêu thức phân tổ
Tiêu thức phân tổ là tiêu thức được lựa chọn làm căn cứ để tiến hành phân tổ.
♦ Lý do của việc lựa chọn tiêu thức phân tổ : Mỗi đơn vị tổng thể có nhiều tiêu thức phân tổ khác nhau, mỗi tiêu thức phản ánh đặc điểm khác nhau. Có tiêu thức khi được chọn làm căn cứ phân tố sẽ giúp ta hiểu được tính chất của hiện tượng, nhưng cũng có những tiêu thức khi chọn làm tiêu thức phân tổ không những không đáp ứng được mục đích nghiên cứu mà còn làm ta hiểu sai lệch hiện tượng nghiên cứu, dẫn đến nhận xét đánh giá khác nhau về thực tế của hiện tượng.
Ví dụ 3.3: Nghiên cứu kết quả học tập của sinh viên một lớp, trường Đại học Tài chính Marketing năm học 2011- 2012
Nếu chọn tiêu thức phân tổ là thời gian tự học thì ta có kết quả như bảng 3.3
Bảng 3.3: Phân tổ số sinh viên của lớp theo số giờ tự học trong ngày
Số giờ tự học /ngày(giờ)
Số sinh viên (người)
Tỷ lệ %
Kết quả phân tổ ở bảng 3.4 ta thấy số sinh viên sử dụng thời gian học ở nhà từ 2-3 giờ/ngày chiếm hơn 58% chứ chưa cho biết kết quả học tập của sinh viên như thế nào
0
3
4.05
1
6
8.11
2
18
24.32
3
25
33.78
4
12
16.22
5
10
13.51
Tổng cộng
74
100
- Nếu chọn tiêu thức phân tổ là điểm thi trung bình các môn thi trong năm của một sinh viên thì mới thể hiện kết quả học tập của sinh viên( bảng 3.4)
Bảng 3.4: Phân tổ số sinh viên của lớp theo điểm thi trung bình
Điểm thi trung bình 1 sinh viên (điểm)
Số sinh viên (người)
Tỷ lệ %
Kết quả phân tổ ở bảng 3.3 cho biết sinh có điểm thi đạt điểm từ 5 trở lên chiếm 87.84% trong đó có 31.08% khá giỏi, chứng tỏ kết quả học tập của lớp này rất tốt.
Dưới 5.0
9
12.16
Từ 5.0 đến 6.9
42
56.76
Từ 7.0 đến 8.9
21
28.38
Từ 9.0 trở lên
2
2.70
Tổng cộng
74
100
Căn cứ để xác định đúng tiêu thức phân tổ :
Trước hết phải dựa vào phân tích lí thuyết để lựa chọn tiêu thức phù hợp đáp ứng được mục đích nghiên cứu.
Tiêu thức bản chất là tiêu thức nêu rõ bản chất của hiện tượng, phản ánh đặc trưng cơ bản của hiện tượng trong điều kiện thời gian và địa điểm cụ thể.
Chắng hạn : Điểm thi là tiêu thức phản ánh bản chất kết quả học tập của sinh viên, chứ thời gian tự học chỉ phản ánh một phần nguyên nhân của kết quả học tập của sinh viên.
Bản chất của hiện tượng có thể được phản ánh qua nhiều tiêu thức khác nhau, vì vậy tùy thuộc vào mục đích nghiên cứu mà dùng lí thuyết kinh tế- xã hội để chọn ra tiêu thức bản chất nhất.
Căn cứ vào điều kiện cụ thể (muốn nói đến thời gian và không gian) của hiện tượng để chọn tiêu thức phân tổ thích hợp.
Cùng một hiện tượng nhưng ở các điều kiện lịch sử khác nhau thì tiêu thức phân tổ cũng mang ý nghĩa khác nhau. Nếu chỉ dùng một tiêu thức phân tổ chung cho mọi trường hợp thì trong điều kiện này có thể giúp ta nghiên cứu chính xác, nhưng ở điều kiện khác lại không có tác dụng.
Theo ví dụ trên kết quả học tập của sinh viên : Khi sinh viên còn đang học tại trường thì tiêu thức phản ánh đúng đắn nhất kết quả học tập là điểm thi trung bình ; Khi sinh viên đã làm việc thì điểm thi lại không phản ánh đúng bản chất của kết quả làm việc.
Xác định số tổ cần thiết và khoảng cách tổ
Số tổ được xác định tùy thuộc vào tiêu thức thuộc tính (dữ liệu định tính) hay tiêu thức số lượng (dữ liệu định lượng)
Phân tổ theo tiêu thức thuộc tính
+ Tiêu thức thuộc tính có một vài biểu hiện.
Ví dụ 3.4: Phân tổ tai nạn giao thông theo giới tính: Nam, nữ có hai biểu hiện.
Hay phân tổ diện tích trồng lúa trong năm theo thời vụ gieo trồng: vụ đông xuân, vụ mùa
Trong trương hợp này, việc chia hiện tượng làm bao nhiêu tổ khá đơn giản, thông thường cứ mỗi biểu hiện của tiêu thức thuộc tính có thể chia thành một tổ.
+ Tiêu thức thuộc tính có nhiều biểu hiện
Ví dụ 3.5: Phân tổ tai nạn giao thông theo nghề nghiệp : Công nhân, nông dân, y sỹ, dược sỹ, nhà báo.Khi đó người ta thường cân nhắc ghép các biểu hiện gần giống nhau về tính chất, giá trị sử dụng thành một số tổ thích hợp sao cho việc nhận thức hiện tượng được thuận lợi nhất.
Ví dụ 3.6: Phân loại cây trồng : lúa ngô, khoai, sắn, cà chua, bắp cải, xà lách..
Nếu cứ coi mỗi loại hình là một tổ thì số tổ sẽ quá nhiều, hơn nữa chưa chắc các loại hình đã khác nhau về chất. Cụ thể ngô, khoai, sắn là cây hoa màu dùng làm lương thực.
Trong những trường hợp này, người ta thường ghép một số loại hình nhỏ vào cùng một tổ theo nguyên tắc : “Các nhớm ghép lại với nhau phải giống nhau hoặc gần giống nhau về tính chất nào đó hay ý nghĩa kinh tế “.
Trong thực tế, thường tiến hành các bảng phân loại danh mục thống nhất do các cơ quan Nhà nước ban hành, nhằm đảm bảo sự thống nhất và tiện lợi.
Phân tổ theo tiêu thức số lượng
Phân tổ không có khoảng cách
Trong trường hợp số lượng biến của tiêu thức phân tổ và lượng biến biến thiên không nhiều. Trong trường hợp này, thường cứ mỗi trị số ứng với một tổ.
Ví dụ 3.7: Nghiên cứu tình hình sinh đẻ có kế hoạch của một địa phương H, phân tổ số phụ nữ theo số lần sinh con như sau: Bảng 3.4 : Phân tô số phụ nữ của địa phương H theo số lần sinh con
Số lần sinh con (con)
Số phụ nữ (người)
Tỉ lệ %
0
12
6,42
1
52
27,81
2
75
40,11
3
38
20,32
4
10
5,35
Tổng
187
100
Phân tổ có khoảng cách tổ.
Trong trường hợp lượng biến của tiêu thức biến thiên nhiều và số lượng biến của tiêu thức lớn.
Ví dụ 3.8 : Phân tổ dân số theo độ tuổi, phân tổ công nhân theo bậc thợ, phân tổ giảng viên theo thâm niên...
Ta không thể thực hiên giống như trường hợp trên, vì nếu tương ứng vói mỗi trị số hình thành là một tổ thì số tổ sẽ quá nhiều và người nghiên cứu sẽ khó quan sát và thấy rõ sự khác nhau giữa các tổ. Trong trường hợp này ta phân tổ có khoảng cách tổ, mỗi tổ có giới hạn dưới và giới hạn trên.
Giới hạn dưới của môi tổ : là lượng biến nhỏ nhất làm cho tổ đó hình thành.
Giới hạn trên của mỗi tổ : là lượng biến lớn nhất của tổ đó, nếu vượt quá dưới hạn này sẽ làm nảy sinh tổ mới.
Tùy theo mục đích nghiên cứu mà người ta phân chia ra làm hai loại : phân tổ có khoảng cách tổ đều và phân tổ có khoảng cách tổ không đều.
♦ Phân tổ có khoảng cách tổ đều: là phân tổ có khoảng cách tổ bằng nhau. Thông thường nếu chỉ với mục đích nghiên cứu phân phối của tồng thể hoặc làm cho bảng thống kê gọn lại thì thường dùng phương pháp này.
+ Trường hợp đối lượng biến biến thiên liên tục: là loại lượng biến mà trị số của nó lấp kín một khoảng (lượng biến nhận các giá trị nguyên và giá trị thập phân)
ì3 2.n , khi
ï
3 2.n
Î
*
3 2.n Ï
*
- Xác định số tổ (Number of classes) : trong thực tế số tổ k được xác định chủ yếu dựa vào kinh nghệm và tùy theo đặc điểm của hiện tượng nghiên cứu. Ngoài ra ta có thể tham khảo xác định số tỏ bằng công thức sau :
îë û
k =
- Xác định khoảng cách tổ :
íïé 3 2.n ù +1, khi
h = xmax - xmin
k
xmax
: lượng biến lớn nhất của tiêu thức phân tổ ;
k : số tổ định chia ; n : số quan sát
xmin
: lượng biến nhỏ nhất
Quy ước phân tổ :
Giới hạn trên và giới hạn dưới của hai tổ kế tiếp trùng nhau
Quan sát có đúng lượng biến bằng giới hạn trên của tổ nào đó thì đơn vị đó được xếp vào tổ kế tiếp.
Ví dụ 3.9: Lượng vốn đầu tư (triệu USD) của mười doanh nghiệp nước ngoài đầu tư vào thành phố Đà Nẵng như sau : 1 ; 2,3 ; 4,6 ; 7 ; 9 ; 3,1 ; 8,3 ; 2 ; 5,1 ; 7,9.
Xác định số tổ : k=(2.10)1/3 = 2,71. Vậy ta có thể phân làm 3 tổ với khoảng cách tổ như sau :
h = 9−1 = 2,67
3
Bảng 3.5: Phân tổ số doanh nghiệp theo mức vốn đầu tư
Mức vốn (triệu USD)
Số doanh nghiệp
1- 3,67
4
3,67 – 6,34
2
6,34 – 9
4
+ Trường hợp đối với lượng biến thiên rời rạc: là loại lượng biến chỉ nhận một số không quá đếm được các trị số cách rời nhau (thường là lượng biến chỉ nhận các giá trị nguyên)
Xác định khoảng cách tổ:
h = (xmax - xmin ) - (k -1)
k
Quy ước tổ : Trường hợp phân tổ theo tiêu thức số lượng rời rạc thì giới hạn trên và giới hạn dưới của hai tổ kế tiếp nhau không được trùng nhau.
Ví dụ 3.10: Tuổi nghề của 20 giảng viên trong một trường đại học được cho như sau :
8
5
7
4
9
10
25
28
12
15
2
3
6
5
11
17
1
20
5
2
Xác định số tổ k = (2 x 20)1/3 = 3,42. Vậy ta có thể phân làm 4 tổ với khoảng cách tổ như sau :
28 − 1 − (4 − 1)
ℎ = = 6
4
Kết quả phân tổ : Bảng 3.6: Phân tổ số giảng viên theo tuổi nghề
Tuồi nghề (năm)
Số giảng viên
1 – 7
10
8 – 14
5
15 – 21
3
22 – 28
2
♦ Phân tổ có khoảng cách tổ không đều
Được áp dụng khi lượng biến của tiêu thức biến thiên không đều đặn, hoặc khi mục đích nghiên cứu chỉ nhằm đánh giá hiện tượng về quy mô, mức độ của các loại theo tiêu chuẩn đã đề ra.
Ví dụ: So sánh quy mô số công nhân của 2 doanh nghiệp cùng sản xuất một loại sản phẩm (số công nhân của mỗi phân xưởng sản xuất có đều nhau không ?)
Hãy so sánh quy mô sinh viên của 2 trường (so sánh xem số sinh viên của mỗi khoa có đều nhau không ?)
♦ Phân tổ mở: là phân tổ mà tổ đầu tiên không có giới hạn dưới, tổ cuối cùng không có giới hạn trên, các tổ còn lại có thể có khoảng cách tổ đều hoặc không đều.
Lý do của phân tổ mở là lượng biến nhỏ bất thường hoặc lớn bất thường và tránh việc hình thành quá nhiều tổ.
Khi tính toán đối với tài liệu phân tổ mở, người ta quy ước lấy khoảng cách tổ của tổ mở bằng với khoảng cách tổ của tổ nào đứng gần nó nhất.
Ví dụ 3.11: Bảng 3.7: Phân tổ các doanh nghiệp tư nhân tỉnh Kon Tum theo doanh thu
Doanh thu (triệu đồng)
Số DNTN
< 1000
3
1000 – 2000
8
2000 – 3000
14
3000 – 4000
5
Tổng
30
Xác định các chỉ tiêu giải thích
Các chỉ tiêu giải thích là những chỉ tiêu dùng để nói rõ đặc điểm của các tổ cũng như toàn bộ tổng thể.
Chẳng hạn: Phân tổ các hộ trồng bời lời ở Kon Tum theo năng suất : Các chỉ tiêu giải thích là diện tích trồng bời lời, sản lượng bời lởi/ha, chi phí bình quân/ha (chi phí phân bón, chi phí đào hố, chi phí làm cỏ,...) của mỗi nhóm.
♦ Ý nghĩa: Chỉ tiêu giải thích có vai trò quan trọng trong phân tổ vì :
Cho biết rõ đặc trưng của từng tổ và toàn bộ tổng thề ;
Làm căn cứ để so sánh các tổ với nhau và tính một số chỉ tiêu phân tích khác.
Cơ sở chọn đúng các chỉ tiêu giải thích
- Căn cứ vào mục đích nghiên cứu
Cũng theo ví dụ trên:
+ Nếu mục đích nghiên cứu là ảnh hưởng của các biện pháp canh tác đến năng suất bời lời, thì các chỉ tiêu giải thích sẽ là: tổng lượng phân bón (loại phân, lượng phân), phương pháp trồng và chăm sóc (dựa vào kinh nghiệm bản thân, dựa vào sách – báo), theo hướng dẫn của hội khuyến nông xã..)...
+ Nếu mục đích nghiên cứu là quy mô sản xuất thì các chỉ tiêu giải thích là sản lượng bình quân/ha, giá trị sản lượng, diện tích cho sản phẩm, diện tích trồng mới, lao động, tài sản cố định, vốn.
- Các chỉ tiêu giải thích phải liên quan chặt chẽ đến tiêu thức phân tổ.
Theo ví dụ trên nếu tăng năng suất bời lời là tiêu thức phân tổ, thì các chỉ tiêu giải thích phải có mối liên hệ chặt chẽ đến nó.
Trình bày kết quả tổng hợp tài liệu điều tra qua phân tổ thống kê
Bảng thống kê
Khái niệm: bảng thống kê là hình thức biểu mẫu thông dụng nhất, được thiết kế với một số cột, một số hàng để trình bày các kết quả tổng hợp số liệu thống kê theo từng nội dung riêng biệt nhằm phục vụ cho yêu cầu của quá trình ngiên cứu thống kê.
Cấu thành bảng thống kê
Về hình thức: bảng thống kê bao gồm các hàng cột, các tiêu đề, tiêu mục (các bộ phận tiêu thức) và các con số. Các hàng, cột thể hiện quy mô của bảng, số hàng và cột càng nhiều thì bảng thống kê càng lớn và càng phức tạp. Tiêu đề của bảng thống kê phản ánh nội dung, ý nghĩa của bảng và của từng chi tiết trong bảng. Bao gồm tiêu đề chung và các tiêu đề nhỏ (tiêu mục) là tên của mỗi hàng, cột phản ánh ý nghĩa của cột đó.
Phần nội dung: bảng thống kê gồm 2 phần: phần chủ đề và phần giải thích. Phần chủ đề nói lên tổng thể được trình bày trong bảng, tổng thể này được phân thành những đơn vị, bộ phận. Phần này có thể phản ánh: trình bày các bộ phận tổng thể, các địa phương hay các thời gian nghiên cứu. Phần giải thích: gồm các chỉ tiêu giải thích các đặc điểm của đối tượng nghiên cứu, tức là giải thích phần chủ đề của bảng. Phần chủ đề thường được đặt bên trái của bảng, phần giải thích thường đặt ở phần trên của bảng. Cũng có trường hợp thay đổi ngược lại.
Bảng 3.8: Cấu thành bảng thống kê
Phần giải thích
Phần chủ đề
Các chỉ tiêu giải thích (tiêu mục)
Tần số, tần suất, tần số tích lũy, các chỉ tiêu theo nhu cầu phân tích
Cộng
A
b
c
...
(1)
(2)
(3)
...
...
Tiêu thức phân tổ Lượng biến Thuộc tính
Cộng
Yêu cầu đối với bảng thống kê
Quy mô của bảng: không nên quá lớn (nhiều bảng, nhiều cột). Nếu thấy cần thiết, nên xây dựng hai, ba bảng thống kê thay cho một bảng thống kê quá lớn.
Tiêu đề, tiêu mục: chính xác, gọn, dễ hiểu (phải chọn lọc từ, không nên quá dài)
Các chỉ tiêu giải thích: nên được sắp xếp tiện cho việc so sánh đối chiếu.
Đơn vị tính:
+ Dùng chung cho toàn bộ số liệu trong bảng: được đặt góc bên phải của bảng
+ Theo từng chỉ tiêu trong cột: được đặt dưới chỉ tiêu của cột
+ Theo từng chỉ tiêu trong hàng: đặt sau chỉ tiêu của mỗi hàng hoặc tạo thêm cột ghi đơn vị tính.
- Cách ghi số liệu trong bảng:
+ Số liệu trong từng hàng (cột) có cùng đơn vị tính (hay cùng một chỉ tiêu giải thích) phải nhận cùng một số
lẻ.
+ Các ô không được để trống mà phải ghi các số liệu, kí hiệu: Không có số liệu có 3 khả năng : chờ bổ sung
( ..), không có số liệu (–) , không có ý nghĩa (x).
Hàng hay cột tổng cộng có thể ở đầu hay ở cuối bảng: ở đầu bảng ghi tổng cộng là chủ yếu, ở cuối bảng ghi tổng cộng là phụ thêm.
Các bảng phức tạp cần có phần ghi chú, giải thích ở cuối bảng: đặc biệt đối với các tài liệu khoa học, việc ghi rõ nguồn số liệu được coi là bắt buộc trong bảng.
Đồ thị thống kê
Khái niệm: là một hình thức trình bày có tính chất quy ước các tài liệu thống kê dưới dạng các hình vẽ hay đường nét hình học.
Khác với bảng thống kê, đồ thị hay biểu đồ thống kê sử dụng các số liệu kết hợp với hình vẽ, đường nét hay màu sắc để tóm tắt và trình bày các đặc trưng chủ yếu của hiện tượng nghiên cứu, phản ánh một cách trực quan và khái quát các đặc điểm về cơ cấu, xu hướng biến động, mối liên hệ, quan hệ so sánh... của hiện tượng cần nghiên cứu.
Do dùng các hình vẽ, đường nét và màu sắc để biểu hiện các đặc trưng của hiện tượng nên tài liệu thống kê rất sinh động, có sức hấp dẫn lôi cuốn người đọc, giúp cho người xem nhận thức được những biểu hiện của hiện tượng một cách nhanh chóng, từ đó nhận ra được những nội dung chủ yếu của vấn đề nghiên cứu.
Các loại đồ thị.
Xét theo nội dung phản ảnh : Đồ thị kết cấu ; Đồ thị phát triển ; Đồ thị hoàn thành kế hoạch hoặc định mức ; Đồ thị liên hệ ; Đồ thị so sánh ; Đồ thị phân phối
Theo hình thức thể hiện : Biểu đồ hình cột ; Biểu đồ tượng hình ; Biểu đồ diện tích (Biểu đồ hình quạt, hình vuông, biểu đồ miền...) ; Biểu đồ đường gấp khúc ; Bản đồ thống kê (Bản đồ thể hiện dân số Việt nam, tháp dân số của Việt nam....)
Giới thiệu một số đồ thị phổ biến hiện nay
Việc lựa chọn đồ thị thể hiện số liệu thống kê còn tùy thuộc vào biến thuộc tính hay biến số lượng. Trong thực tế, một số loại biểu đồ thường được sử dụng :
Biến thuộc tính: Biểu đồ thanh (Bar chart), biểu đồ quạt (Pie chart), biểu đồ pareto (pareto diagram),
Biến định lượng: Biểu đồ đường (lỉne chart), biểu đồ nhánh và lá (stem and leaf display)
♦ Biểu đồ thanh: là biểu đồ có chiều cao của các thanh đại diện cho tần số hoặc tần suất lần lượt của các thuộc tính
16
14
12
10
8
6
4
2
0
<1000
1000-2000
Doanh thu
2000-3000
3000-4000
Số DNTN
Ví dụ : Thể hiện số liệu ở bảng 3.7 lên đồ thị như sau:
Biểu đồ pareto
Biểu đồ pareto về mặt biểu hiện tương tự như biểu đồ thanh, điểm khác biệt ở đây là đầu tiên viết lại dữ liệu theo hướng giảm dần, sau đó hình thành bản đồ pareto bằng dạng thanh theo nguyên tắc lượng biến có tần số hoặc tần suất lớn nhất đến lượng biến có tần số hoặc tần suất nhỏ nhất.
Số DNTN
Ví dụ: dùng dữ liệu ở bảng 3.7, sau khi sắp xếp theo thứ tự giảm dần ta vẽ được biểu đồ pareto như sau :
16
14
12
10
8
6
4
2
0
2000-3000
1000-2000
3000-4000
<1000
Doanh thu
Biểu đồ quạt
Ví dụ: dùng số liệu ở bảng 3.4 để thể hiện tỷ lệ số lần sinh con, ta vẽ đồ thị như sau :
5,35% 6,42%
20,32%
27,81%
0
1
2
3
4
40,11%
♦ Biểu đồ nhánh và lá: các dữ liệu thu thập sẽ được tách thành hai phần : phần nhánh và phần lá. Các chữ số bên phải là lá (có thể là 1 hay 2 chữ số có ở hàng đơn vị hay hàng chục), tương ứng các chữ số còn lại bên trái (có thể là 1 hay 2 chữ số hàng chục hay hàng trăm) là nhánh.
Ví dụ: Điều tra nhỏ về độ tuổi của công nhân một xí nghiệp may tại khu công nghiệp Tân Bình như sau : Tuổi của 22 công nhân :
28
23
30
21
19
39
22
31
26
25
22
18
34
25
28
22
26
34
38
19
21
18
Đầu tiên là xác định nhánh và lá. Trong ví dụ này, mỗi dữ liệu chỉ có hai chữ số, vậy chữ số hàng dơn vị là lá, chữ số hàng chục là nhánh. Đối vói dữ liệu này ta chỉ có 3 nhánh 1,2,3 vì độ tuổi thấp nhất là 18 và tuổi cao nhất lá 39.
Cách viết: Ta viết 3 nhánh của tuổi công nhân, sau đó lần lượt xếp các dữ liệu liên quan sát vào 3 nhánh này. Để biểu đồ được dễ nhìn hơn ta sắp lại thứ tự các chữ số ở phần lá tăng dần từ trái sang phải. Khi đó ta có biểu đồ nhánh và lá tăng dần từ trái sang phải.Biểu đồ nhánh và lá hoàn chỉnh như sau:
1
8
8
9
9
2
1
1
2
2
2
3
5
5
6
6
8
8
3
0
1
4
4
8
9
Hoặc có thể dùng GPSS ta có kết quả sau:
VAR00001 Stem-and-leaf Plot
Stem width:
Each leaf:
10,00
1 case(s)
Khi các nhánh có phần lá dài quá (nhiều trị số quan sát), chúng ta có thể tách mỗi nhánh thành 2 nhánh nhỏ.
Frequency
Stem & Leaf
4,00
1 . 8899
6,00
2 . 111223
6,00
2 . 556688
4,00
3 . 0144
2,00
3 . 89
Theo kết quả chạy SPSS ta thấy máy tính đã tự động tách nhánh 2 và 3 thành 2 nhánh nhỏ hơn để biểu đồ cân đối hơn và có thêm cột tần số cho biết có bao nhiêu lá trong một nhánh (nhóm)
Biểu đồ phân tán (Scatter Diagram)
Biểu đồ phân tán còn được gọi là biểu đồ tương quan, biểu thị mối quan hệ giữa hai đại lượng trong mối tương quan giữa các chuỗi giá trị của chúng. Khi đại lượng X có giá trị thay đổi, biểu đồ chỉ ra sự thay đổi tương ứng của đại lượng Y.
Một vài đặc trưng của biểu đồ phân tán :
Tương quan thuận (đồng biến) – một biến tăng thì biến kia cũng tăng
Tương quan nghịch (nghịch biến) – một biến tăng còn biến kia giảm
Không tương quan – Không có sự ảnh hưởng từ biến này đến giá trị của biến kia.
Ví dụ : Với số liệu về giá X và lượng hàng Y bán được tương ứng trong bảng, Eviews cho ta biểu đồ phân tán như sau :
Giá
Lượng
12
109
14
102
16
98
17
78
18
65
20
59
110
100
90
Y
80
70
60
50
10 12 14 16 18 20 22
X
*****************
Chương 4. MÔ TẢ ĐẶC TRƯNG THỐNG KÊ
Mọi hiện tượng kinh tế - xã hội đều tồn tại trong những điều kiện không gian, thời gian nhất định về mặt lượng của hiện tượng được biểu hiện ở mức độ khác nhau với nội dung phản ánh khác nhau. Ta có thể sử dụng các chỉ tiêu đo lường, tính toán các mức độ này như số tuyệt đối, số tương đối, các đặc trưng đo lường khuynh hướng tập trung và các đặc trưng đo lường độ phân tán nhằm nêu lên đặc trưng phân phối của dãy số.
Chương này trình bày những nội dung chủ yếu sau :
Khái niệm, đặc điểm phân loại và phương pháp tính số tuyệt đồi và số tương đối.
Khái niệm và cách tính các đặc trưng đo lường độ phân tán
Số tuyệt đối
Khái niệm số tuyệt đối
Là chỉ tiêu biểu hiện qui mô, khối lượng của hiện tượng kinh tế xã hội trong cùng thời gian và địa điểm cụ
thể.
Ví dụ: Doanh thu tiêu thụ 1/2012 của công ty ABC là 100 tỷ đồng
Đặc điểm số tuyệt đối
Luôn có nội dung kinh tế xã hội cụ thể, trong điều kiện thời gian địa điểm cụ thể chứ không trừu tượng như con số toán học.
Được thông qua điều tra tổng hợp thống kê hay tính toán gián tiếp chứ không được lấy tùy tiện.
Đơn vị tính của số tuyệt đối
© Đơn vị hiện vật là đơn vị tính phù hợp với đặc điểm vật lý của hiện tượng.
Đơn vị hiện vật tự nhiên (cái, con, chiếc...)
Đơn vị hiện vật quy ước (m, lit, kg, phút, giờ, ngày, tháng...). Đây là đơn vị cơ bản của sản phẩm, phản ánh chính xác theo giá trị sử dụng của sản phẩm. Tuy nhiên, cũng có nhược điểm là không tổng hợp được các sản phẩm khác loại và những công việc có tính chất dịch vụ.
Để khắc phục một phần nhược điểm này người ta sử dụng đơn vị hiện vật quy đổi.
Đơn vị hiện vật quy đổi là chọn 1 sản phẩm làm gốc rồi quy đổi các sản phẩm khác cùng tên nhưng có phẩm chất khác nhau ra sản phẩm đó theo một hệ số quy đổi.
Ví dụ: người ta sử dụng thóc làm sản phẩm quy đổi để quy đổi các loại cây lương thực khác (bắp, khoai) ra thóc theo hệ số quy đổi được Nhà nước quy định(1kg thóc = 1kg bắp = 3kg khoai).
© Đơn vị tiền tệ: biểu hiện giá trị sản phẩm thông qua giá cả (đồng. Yên, đô la...)
© Đơn vị thời gian lao động, như giờ công, ngày công...dùng để tính lượng lao động hao phí để sản xuất ra sản phẩm. Đơn vị này dùng nhiều trong công tác định mức thời gian cho sản xuất, tính năng suất lao động, quản lý thời gian lao động của đơn vị.
Phân loại số tuyệt đối
© Số tuyệt đối thời kỳ: phản ánh quy mô, khối lượng của một hiện tượng trong một độ dài thời gian nhất định. Nó được hình thành thông qua sự tích lũy (cộng dồn) về lượng của hiện tượng trong suốt thời gian nghiên cứu. Thời kỳ càng dài thì số (mức độ) càng lớn.
Ví dụ: Sản lượng sản phẩm sản xuất ra của một doanh nghiêp trong năm 2012 là 21000.
Doanh thu của một công ty A trong năm 2012 là 340 tỷ đồng.
© Số tuyệt đối thời điểm: phản ánh quy mô, khối lượng của hiện tượng tại một thời điểm nhất định, trước hay sau thời điểm đó mức độ của hiện tượng có thể khác, không tích lũy theo thời gian.
Ví dụ: Mức vốn của công ty TNHH A tính đến tháng 1/2012 là 1200 tỷ đổng. Số công nhân của xí nghiệp dệt 29/3 là 2100 công nhân.
Ví dụ: Có tài liệu thống kê của công ty A trong 7 tháng đầu năm 2009 như sau :
Bảng 4.1
Tháng
Chỉ tiêu
1
2
3
4
5
6
7
Tổng số
1. Giá trị hàng dự trữ đầu tháng
300
360
400
440
450
460
460
2870
2. Doanh số bán ra trong tháng(Trđ)
400
460
480
490
500
520
560
3410
Trong bảng này : Chỉ tiêu 1(Giá trị hàng dự trữ đầu tháng) là số tuyệt đối thời điểm, chỉ tiêu 2 (Doanh số bán ra trong tháng) là số tuyệt đối thời kỳ.
Số tương đối
Khái niệm, ý nghĩa của số tương đối
Khái niệm: là chỉ tiêu biểu hiện quan hệ so sánh giữa 2 mức độ của hiện tượng nghiên cứu. Trong 2 đại lượng được đem ra so sánh của số tương đối thì một đại lượng được chọn làm gốc.
Có 2 mức độ so sánh :
So sánh 2 mức độ cùng loại nhưng khác nhau về thời gian hoặc không gian, số tương đối lúc này còn gọi là số tương đối kết cấu.
Ví dụ:
Sản lượng hàng hóa tiêu thụ của Doanh nghiệp X năm 2012
Sản lượng hàng hóa tiêu thụ của Doanh nghiệp X năm 2011
Hay
Sản lượng hàng hóa tiêu thụ của Doanh nghiệp X năm 2012
Sản lượng hàng hóa tiêu thụ của Doanh nghiệp Y năm 2012
- So sánh hai hiện tượng khác nhau nhưng có liên quan nhau, số tương đối lúc này còn gọi là số tương đối cường độ.
Ví dụ
Mật độ dân số : (Người/km2) = Dân số trung bình ; GDP trung bình đầu người (đ/người) = GDP
Diện tích đất đai Dân số trung bình
NX: số tương đối là kết quả so sánh hai số tuyệt đối, hai số tương đối hay hai số trung bình với nhau. Giả sử ta muốn đánh giá sự hơn kém của hai mức độ, nghiên cứu cơ cấu của một ngành... số tương đối còn được sử dụng để công bố khi muốn giữ bí mật của số tuyệt đối.
Đặc điểm và hình thức biểu hiện của số tương đối
Mỗi số tương đối đều có gốc để so sánh. Vì mục đích nghiên cứu có thể chọn gốc khác nhau, nên việc tính số tương đối khá phong phú. Số tương đối có được là thông qua tính toán phân tích chứ không lấy tùy tiện.
Các loại số tương đối và phương pháp tính
Số tương đối động thái (tốc độ phát triển) (đơn vị tính: lần, %): là kết quả so sánh giữa hai mức độ của cùng hiện tượng nhưng khác nhau về thời gian.
Công thức :
idt
= y1 y0
Trong đó : y1 : mức độ cần nghiên cứu (hay còn gọi là mức độ kỳ báo cáo) y0 : mức độ kỳ gốc (hay mức độ dùng làm cơ sở so sánh)
Ví dụ: Sản lượng hàng hóa tiêu thụ của một doanh nghiệp X qua hai năm như sau : Năm 2010 là 1000 chiếc, năm 2011 là 1400 chiếc.
Số tương đối động thái là : idt =
1400
1000
=1,4 = 140%
Vậy sản lượng hàng hóa tiêu thụ của DN X năm 2011 so với 2010 bằng 1,4 lần hay bằng 140%
© Nếu ta tính các số tương đối động thái với kỳ gốc y0 thay đổi và kề ngay trước kỳ báo cáo, ta có số tương đối động thái liên hoàn (hay tốc độ phát triển liên hoàn), nghiên cứu sự phát triển của hai hiện tượng qua hai thời kỳ liên tiếp liền nhau.
y1 ; y2 ; ...; yn
y0 y1
yn-1
Ví dụ: Có số liệu về doanh số bán hàng của doanh nghiệp X qua các năm như sau:
Bảng 4.2
Năm
2008
2009
2010
2011
Doanh số bán (tỷ đồng)
10
11
13,2
15,125
Các số tương đối động thái liên hoàn về doanh số bán của DN là:
y09 = 11 = 1,1 = 110%;
y10 = 13, 2 = 1, 2 = 120%;
y11 = 16,5 = 1, 25 = 125%
y08 10
y09 11
y10
13, 2
© Nếu ta tính các số tương đối động thái với kỳ gốc y0 cố định, ta có các số tương đối động thái định gốc
(hay tốc độ phát triển định gốc)
y1 ; y2 ; ...; yn
y0 y0 y0
© Lưu ý : Muốn tính số tương đối động thái chính xác cần đảm bảo tính chất so sánh được giữa các mức độ kỳ nghiên cứu và kỳ gốc. Cụ thể phải đảm bảo giống nhau về nội dung kinh tế, về phương pháp tính và đơn vị tính, về phạm vi và độ dài thời gian và mức độ phản ánh.
© Đôi khi tính thêm số tương đối tăng, giảm (a)
dt
a = y1 - y0 = i -1
y0
Để phản ánh tình hình tăng (giảm) thêm bao nhiêu lần (hay %) phải dùng chỉ tiêu tốc độ tăng giảm, còn gọi là số tương đối tăng (giảm), phản ánh mối quan hệ so sánh giữa mức độ chênh lệch tuyệt đối và mức độ kỳ gốc.
Ví dụ: Số công nhân của doanh nghiệp K năm 2010 là 1010, năm 2011 là 1200. Vậy năm 2011 tăng thêm
so với 2010 là : a = 1200 -1000 = 0,12 = 12%
1000
Số tương đối kế hoạch (lần, %):
Dùng để lập kế hoạch và đánh giá tình hình thực hiện kế hoạch của DN.
© Số tương đối nhiệm vụ kế hoạch ( inv ) : là tỷ lệ so sánh giữa mức độ kế hoạch với mức độ thực tế của chỉ tiêu ấy của kỳ gốc.
inv
= yk y0
( yk
: Mức độ kế hoạch ;
y0 : Mức độ kỳ gốc so sánh)
© Số tương đối hoàn thành kế hoạch ( iht ) : Là tỉ lệ so sánh giữa mức độ thực tế đạt được trong kỳ nghiên cứu với mức độ kế hoạch đặt ra cùng kỳ của một chỉ tiêu nào đó.
y
iht = 1
yk
( y1 : Mức độ thực hiện trong kỳ ; yk : Mức độ kế hoạch của kỳ đó)
Số tương đối hoàn
thành kế hoạch
>
=> Hoàn thành vượt mức kế hoạch
=
100%
=> Đạt mức kế hoạch đặt ra
<
=> Không hoàn thành kế hoạch
Ví dụ: Sản lượng lúa của huyện Cần Giờ năm 2010 là 500.000 tấn, kế hoạch dự kiến sản lượng lúa 2011 là 550.000 tấn, thực tế năm 2011 huyện này đạt được 600.000 tấn. Như vậy ta có
Số tương đối động thái:
- Số tương đối nhiệm vụ kế hoạch
idt
inv
= 600.000 = 1,2 = 120%
500.000
= 550.000 = 1,1 = 110%
500.000
Số tương đối hoàn thành kế hoạch
iht
= 600.000 = 1,09 = 109% è Hoàn thành vượt mức kế hoạch
550.000
Nhận xét . Ta có mối quan hệ :
idt
= inv ´
iht
Số tương đối kết cấu (%) : Nói lên kết cấu tỷ trọng của mỗi bộ phận cấu thành tổng thể
ybophan
ikc =
ytongthe
Đặc điểm: Phải được tính ra dựa trên kết quả phân tổ khoa học.
Ý nghĩa: Dùng để phản ánh kết cấu tổng thể. Qua đó có thể phân tích được đặc điểm cấu thành của hiện tượng. Nghiên cứu sự thay đổi kết cấu sẽ thấy được xu hướng phát triển của hiện tượng.
Ví dụ : Trong công ty A có 500 công nhân, trong đó có 300 công nhân nam và 200 công nhân nữ.
Tỷ trọng nam trong tổng số công nhân = (300/500)*100% = 60%
Tỷ trọng nữ trong tổng số công nhân = (200/500)*100% = 40%
Số tương đối cường độ: là kết quả so sánh mức độ của hai hiện tượng khác nhau nhưng có liên quan đến nhau.
Số tương đối cường độ được biểu hiện bằng đơn vị kép do đơn vị tính ở tử số và mẫu số hợp thành Mức độ của hiện tượng này
Số tương đối cường độ =
Mức độ của hiện tượng khác
Đặc điểm hai hiện tượng so sánh phải có mối liên hệ với nhau
Ví dụ:
Năng suất tính theo đầu công nhân = Khối lượng sản phẩm / Tổng số công nhân
Mật độ dân số = Tổng dân số / Tổng diện tích đất đai
Số bác sĩ / 1 vạn dân
Tỉ suất lợi nhuận = Lợi nhuận / vốn
ðCó mối quan hệ vói nhau
Sản lượng bia / Số công nhân thuốc lá : không có quan hệ với nhau.
Số tương đối so sánh: là kết quả so sánh giữa hai mức độ của một hiện tượng nhưng khác nhau về không gian.
Ví dụ : - Có số liệu về số lượng lao động nữ của hai doanh nghiệp như sau :
Bảng 4.3
Doanh nghiệp 1
Doanh nghiệp 2
Số lao động nữ
100
120
Vậy ta có số tương đối so sánh = 120/100 = 1,2 = 120% à Số lao động nữ của DN2 hơn DN1 : 20%
Giá trị sản xuất công nghiệp của huyện A năm 2011 so với giá trị sản xuất công nghiệp của huyện B năm 2011.
GDPvn / GDPThái Lan
Đồng thời số tương đối không gian cũng biểu hiện sự so sánh giữa hai bộ phận trong cùng một tổng
thể.
Số tương đối không gian =
Mức độ của bộ phận này trong tổng thể Mức độ của bộ phận khác trong tổng thể
Các đặc trưng đo lường độ tập trung (Measures of central tendency)
Số bình quân
Khái niệm, ý nghĩa số bình quân
Là mức độ đại diện điển hình cho 1 tiêu thức nào đó của tổng thể mà các đơn vị của tổng thể biểu hiện nhiều mức độ khác nhau.
Ví dụ:
Tiền lương bình quân một công nhân trong doanh nghiệp là mức lương phổ biến nhất, đại diện cho các mức lương khác nhau của công nhân trong doanh nghiệp.
Thu nhập bình quân đầu người của một địa bàn là mức thu nhập phổ biến nhất, đại diện cho các mức thu nhập khác nhau của mọi người trong địa bàn đó.
Ý nghĩa:
Thông qua số bình quân, ta có thể thấy được đặc trưng chung của các đơn vị trong tổng thể theo tiêu thức nào đó.
Với số bình quân giúp ta dễ dàng so sánh về một tiêu thức nào đó của hai tổng thể khác nhau
Nhược điểm của số bình quân : San bằng sự khác biệt, che dấu sự chênh lệch
Các loại số bình quân
b1. Số bình quân cộng (the arithmetic mean): là lấy tổng các lượng biến chia cho tổng số đơn vị tổng thể
* Số bình quân cộng giản đơn (dùng với số tuyệt đối)
n
å xi
x = i=1
n
* Số bình quân cộng gia quyền (weighted mean): (Dùng với số tương đối trừ số tương đối động thái) áp dụng khi mỗi lượng biến được gặp nhiều lần, ý
Các file đính kèm theo tài liệu này:
- 2014_tt_mar_nltkkt_569.docx