Tài liệu Xử lý và phân tích dữ liệu: 1XỬ Lí VÀ PHÂN TÍCH DỮ LIỆUChương 72 Mục tiờu chương 7Chương này giỳp học viờn:Hiểu được cỏc khỏi niệm về xử lý dữ liệuPhõn biệt cỏc phương phỏp xử lý dữ liệuBiết được quy trỡnh xử lý dữ liệu bằng SPSSGiải thớch được ý nghĩa kết quả nghiờn cứu3Nội dung chươngChuẩn bị dữ liệu5.25.1Khỏi niệm về xử lý dữ liệuLàm sạch dữ liệu5.45.5Xử lý và phõn tớch dữ liệu5.3Mó húa dữ liệu47.1 Khỏi niệm về phương phỏp xử lý dữ liệu5Khỏi niệmXử lý dữ liệu là cụng việc diễn ra sau quỏ trỡnh thu thập dữ liệuNhiệm vụ của việc xử lý dữ liệu là chuyển cỏc dữ liệu dưới dạng thụ thành dữ liệu tinh6Xửỷ lyựProcessSoftwareDatabaseDữ liệuthụDữ liệu tinhQuỏ trỡnh chuyển húa dữ liệu7Cỏc phương phỏp xử lý dữ liệu Phương phỏp thủ cụng - Phương phỏp kiểm đếm (Tallying) - Phương phỏp lựa ra và đếm (Sorting and Counting)8Cỏc phương phỏp xử lý dữ liệu Phương phỏp xử lý bằng mỏy tớnh - Sử dụng cỏc chuyờn viờn xử lý dữ liệu - Sử dụng cỏc phần mềm xử lý dữ liệu trọn gúi - Phỏt triển cỏc phần mềm riờng9Quy trỡnh xử lý dữ liệu...
59 trang |
Chia sẻ: putihuynh11 | Lượt xem: 734 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Xử lý và phân tích dữ liệu, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
1XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆUChương 72 Mục tiêu chương 7Chương này giúp học viên:Hiểu được các khái niệm về xử lý dữ liệuPhân biệt các phương pháp xử lý dữ liệuBiết được quy trình xử lý dữ liệu bằng SPSSGiải thích được ý nghĩa kết quả nghiên cứu3Nội dung chươngChuẩn bị dữ liệu5.25.1Khái niệm về xử lý dữ liệuLàm sạch dữ liệu5.45.5Xử lý và phân tích dữ liệu5.3Mã hĩa dữ liệu47.1 Khái niệm về phương pháp xử lý dữ liệu5Khái niệmXử lý dữ liệu là cơng việc diễn ra sau quá trình thu thập dữ liệuNhiệm vụ của việc xử lý dữ liệu là chuyển các dữ liệu dưới dạng thơ thành dữ liệu tinh6Xử lýProcessSoftwareDatabaseDữ liệuthơDữ liệu tinhQuá trình chuyển hĩa dữ liệu7Các phương pháp xử lý dữ liệu Phương pháp thủ cơng - Phương pháp kiểm đếm (Tallying) - Phương pháp lựa ra và đếm (Sorting and Counting)8Các phương pháp xử lý dữ liệu Phương pháp xử lý bằng máy tính - Sử dụng các chuyên viên xử lý dữ liệu - Sử dụng các phần mềm xử lý dữ liệu trọn gĩi - Phát triển các phần mềm riêng9Quy trình xử lý dữ liệu4. Làm sạch dữ liệu 1. Giá trị hĩa dữ liệu3. Nhập dữ liệu vào máy tính6. Phân tích dữ liệu5. Lưu trữ dữ liệu để phân tích2. Mã hĩa các câu trả lờiChuẩn bị dữ liệuLưu trữvàPhân tích107.2 Chuẩn bị dữ liệu11Cơng việc chuẩn bị dữ liệuKiểm tra tính hợp lệ của dữ liệuHiệu chỉnh dữ liệu 12Kiểm tra tính hợp lệ của dữ liệuKiểm tra bảng câu hỏi đã được trả lời: tính đầy đủ của bảng câu hỏi, việc ghi chép câu trả lờiKiểm tra tính logic của các câu trả lờiXem xét những chỉ dẫn về thủ tục phỏng vấnKiểm tra tính trung thực của các câu trả lời 13Hiệu chỉnh dữ liệu Liên hệ trực tiếp phỏng vấn viên để làm sáng tỏ vấn đề: các câu trả lời khơng đọc được, khơng rõ ýGặp và phỏng vấn lại đáp viênSuy luận từ các câu trả lời khácLoại bỏ tồn bộ bản câu hỏi và tiến hành phỏng vấn lại147.3 Mã hĩa dữ liệu 15Khái niệmMã hĩa dữ liệu (coding) là quá trình chuyển đổi các trả lời thành dạng mã số để nhập và xử lý dễ dàngĐược thực hiện trước hoặc sau khi phỏng vấnCác ký hiệu mã hĩa cho các biến và các trả lời được trình bày trong một sổ mã (code book)Dữ liệu mã hĩa xong được nhập vào máy dưới dạng một ma trận gọi là ma trận dữ liệu16Mã hĩa dữ liệu trên bảng câu hỏiMã hĩa câu hỏi mởNhĩm các câu trả lời cĩ cùng ý nghĩaGán các con số cho các nhĩm trả lờiMã hĩa câu hỏi đĩngGán các con số cho các câu trả lời được liệt kê sẵn trên bảng câu hỏi17Mã hĩa dữ liệu trên bảng câu hỏiCâu hỏi nhiều lựa chọn(MA)- Phương pháp multiple dichotomy - Phương pháp multiple category Ví dụ: Bạn hãy đánh dấu vào nhĩm phần mềm mà bạn cĩ thể sử dụng được: Quản lý cơ sở dữ liệu Phần mềm soạn thảo văn bản Phần mềm bản tính Phần mềm tài chính kế tốn Phần mềm truyền thơng Phần mềm khác (xin nêu rõ):Câu hỏi một lựa chọn (SA)Thực hành ví dụ:Bạn đánh giá mức thu nhập hiện nay của bạn như thế nào? quá thấp thấp trung bình cao rất cao khơng trả lời18Biến các trả lời thành các mã số, ký hiệu mà máy tính hiểu đượcGiúp cho việc nhập liệu dễ dàng hơnGiúp nhà nghiên cứu trong việc phân tích và diễn giải dữ liệuDanh bạ mã hĩahay sổ mã hĩa19Nội dung trong danh bạ mã hĩaSố thứ tự của câu hỏi.Vấn đề của câu hỏi (thường là tĩm tắt nội dung câu hỏi).Tên của biến số phát sinh từ câu hỏiNhãn của biến số (variable label)Các giá trị mã hĩa: là các giá trị mà biến số cĩ thể nhận được để biểu diễn thơng tin được trả lờiNhãn giá trị mã hố (Value Label) thường dùng để mơ tả ý nghĩa của các giá trị mã hĩa.20STT câu hỏiVấn đề câu hỏiTên biến sốMơ tả biến sốCác giá trị mã hĩaMơ tả các giá trị mã hĩa1Vùng phỏng vấnREGIVùng địa lý1234Hà NộiĐà NẵngTP.HCMCần Thơ2Cĩ sử dụng sữa rửa mặt khơngUSE12CĩKhơng3Sử dụng nhãn hiệu nào?BRANDNhãn hiệu đang dùng1234567Pond’sHazelineBioreLanaNiveaNacoLoại khác4Sử dụng sữa rửa mặt vào khi nào?TIMEThời điểm sử dụng12345Sáng sớm khi thức dậyBuổi sángBuổi trưaBuổi chiềuTối trước khi ngủ21Câu hỏi (biến)Ý nghĩa câu hỏiGiá trị mã hĩaMơ tả giá trị mã hĩaQ1Giới tính đáp viên12NamNữQ2Nghề nghiệp đáp viên1234567Bác sĩGiáo viênNhân viên văn phịngCơng nhânHưu tríHọc sinh-sinh viênKhác--------------------------------------------------------------------------Q22aQ20bĐánh giá về bao bì sản phẩmĐánh giá về chất lượng sản phẩm123KémTrung bìnhTốt22Ma trận dữ liệuCột: là nơi quản lý các biến (các câu hỏi cĩ trong bảng câu hỏi)Loại câu hỏi một trả lời: chỉ cần một cột chứa các giá trị trả lờiLoại biến nhiều trả lời: nhiều cột chứa nhiều giá trị trả lời cĩ thể cĩ Dịng: là nơi quản lý tất cả các quan sát (bằng kích cỡ mẫu)Ơ giao nhau giữa cột và dịng: là nơi chứa đựng giá trị trả lời của một câu hỏi trong một quan sát cụ thể.23247.4 Làm sạch dữ liệu 25Làm sạch dữ liệu Dữ liệu sau khi nhập xong, chưa thể đưa ngay vào xử lýNhằm phát hiện các sai sĩt do người kiểm sốt chưa phát hiện ra hoặc do nhập liệu26Các phương pháp làm sạch dữ liệuDùng bảng tần sốDùng bảng kết hợp giữa hai hay ba biếnTìm lỗi đơn giản ngay trên cửa sổ dữ liệu (Data View)27FrequencyPercentValid PercentCumulative PercentValidNam24849.649.649.6Nữ25150.250.299.8111.2.2100.0Total500100.0100.0Bảng mơ tả về mẫu nghiên cứu theo giới tính287.5 Xử lý và phân tích dữ liệu 29Phân tích dữ liệu thống kê bao gồm:Thống kê mơ tảThống kê suy diễnPhân tích dữ liệu 30Thống kê mơ tả ( Descriptive Stactistics):Sử dụng bảng tần sốTính các đại lượng thống kê mơ tảBảng kết hợp nhiều biếnBiểu đồ31Dùng để đếm tần số về các biểu hiện của một thuộc tính Được thực hiện với cả biến định tính và định lượngCần tiến hành gom biến trước khi lập bảng tần số với các biến định lượng cĩ nhiều giá trị Bảng tần số đơn giản 32 Bảng tần số đơn giản Tần sốTỷ lệ %Phần trăm có ý nghĩaPhần trăm tích lũyValid1 - 3 triệu3131.031.031.0 3 - 5 triệu4545.045.076.0 5 - 7 triệu1919.019.095.0 >7 triệu55.05.0100.0 Tổng100100.0100.0 33 FrequencyPercentCumulative PercentValid1891.81.8 1981.63.4 20163.26.6 21193.810.4 22224.414.8 23265.220.0 24295.825.8 25214.230.0 26153.033.0 27132.635.6 28193.839.4 29163.242.6 30173.446.0 31102.048.0 32183.651.6 3381.653.2 3491.855.0 35153.058.0 3681.659.6 3761.260.8 38163.264.0 39142.866.8 40183.670.4 41102.072.4 42163.275.6 4371.477.0 4461.278.2 45102.080.2 46122.482.6 4771.484.0 4881.685.6 4981.687.2 50122.489.6 513.690.2 5271.491.6 534.892.4 54102.094.4 Total500100.0 Bảng tần số về tuổi đáp viên34Bảng tần số về độ tuổi đã được mã hĩa lại FrequencyPercentValid PercentCumulative PercentĐộ tuổi18-2515030.030.030.0 26-3514028.028.058.0 36-4511122.222.280.2 46-609919.819.8100.0 Total500100.0100.0 35Tính các đại lượng thống kê Các đại lượng đo lường độ tập trung phổ biếnMean: Trung bình cộngMode: Giá trị cĩ tần số quan sát lớn nhấtStd.Deviation: Độ lệch chuẩnMinimum: Giá trị nhỏ nhấtMaximum: Giá trị lớn nhấtSE mean: Sai số chuẩn khi ước lượng trung bình36Hình dáng của phân phối37Hình dáng của phân phối38Hình dáng của phân phối39Bảng tổng hợp nhiều biếnYêu cầu về thơng tin địi hỏi ta phải xem xét tần số hay tần suất của các biểu hiện của một hay nhiều biến theo sự phân loại của một số biến khácVí dụ: ta muốn biết số người trong độ tuổi từ 18 đến 25 trong mẫu quan sát là bao nhiêu nam, bao nhiêu nữ Vậy ta cĩ bảng kết hợp giữa độ tuổi và giới tính40Bảng tổng hợp nhiều biến(tt)Bảng kết hợp giữa hai biến định tínhBảng kết hợp giữa ba biến định tínhBảng kết hợp giữa một biến định tính với một biến định lượngBảng kết hợp giữa hai biến định tính và một biến định lượng41 Cơ cấu mẫu điều tra về độ tuổi theo từng nhĩm giới tính Giới tínhTổng NamNữTần số% theo cột Tần số% theo cộtTần suất% theo cộtĐộ tuổi18-255823.3%9236.7%15030.0% 26-357128.5%6927.5%14028.0% 36-456827.3%4317.1%11122.2% 46-605220.9%4718.7%9919.8%Tổng249100.0%251100.0%500100.0%42 Hà NộiTPHCMNamNữTổngNamNữTổngTần số Độ tuổi 18-2528406830528226-3533397238306836-4530225238215946--60273158251641Tổng118132250131119250Tỷ lệ Độ tuổi 18-2523.7%30.3%27.2%22.9%43.7%32.8%26-3528.0%29.5%28.8%29.0%25.2%27.2%36-4525.4%16.7%20.8%29.0%17.6%23.6%46--6022.9%23.5%23.2%19.1%13.4%16.4%Tổng100.0%100.0%100.0%100.0%100.0%100.0%Cơ cấu độ tuổi theo giới tính tại hai thành phố43Mơ tả dữ liệu bằng biểu đồHiệu quả trong việc trình bày và báo cáo kết quả, vì:Thể hiện thơng tin sinh động, trực quan và hấp dẫn Thu hút sự chú ý của người đọcGiúp người xem dễ hiểu, dễ nhớ nên cĩ tác dụng truyền đạt hiệu quả tốt 44Một số dạng biểu đồ thường sử dụngBiểu đồ thanh (Bar Chart) - Thanh ngang- Thanh đứngBiểu đồ hình trịn (Pie Chart)Biều đồ diện tíchBiểu đồ gấp khúc45Các dịp sử dụng quần Jeans(biểu đồ thanh ngang46Các dịp sử dụng quần Jeans(biểu đồ thanh đứng)47Vậy khi nào chúng ta sử dụng biểu đồ thanh ngang/thanh đứng? 48Đối tượng: Những người thường mua Q4b Quần jean Quần tây Quần Kaki (n=183) (n=117) (n=83)Dịp sử dụng quầnQuần jean và quần kaki cũng được sử dụng chủ yếu cho việc đi mua sắm, đi dạo, đi chơi, đi ăn uống hoặc đi dự tiệc; và khoảng ½ người sử dụng quần jean và quần kaki mặc chúng để đi làm49Thần tượng của giới trẻ5051Q6. Nhãn hiệu quần jean đã từng mua? Thường mua? Thường mua nhất?Đối tượng: Những người từng mua quần jean (n=219) Từng mua Thường mua Thường mua nhấtThĩi quen mua các nhãn hiệu Quần Jean52Biểu đồ diện tíchChi tiêu cá nhân53Tỷ lệ sinh viên theo học các chuyên ngành54Biểu đồ nào dễ quan sát và so sánh hơn?55Đánh giá nhãn hiệu áoĐối tượng: Những người nhận biết nhãn hiệu cĩ trợ giúp Q7aMean scoreCĩ cửa hàng trưng bày và bán (showroom)Được sản xuất bởi cơng ty quy mơ/ tầm cỡĐược bán tại các cửa hàng thời trang thơng dụng thiết kế bắt mắtCung cách phục vụ của nhân viên bán hàng niềm nở/ tận tìnhĐược bán rộng rãiĐược quảng cáo trên phương tiện thơng tin đại chúngSản xuất tại nước ngồiSản xuất tại Việt NamNhãn hiệu uy tínNhãn hiệu nổi tiếngCĩ kiểu dáng hợp thời trangCĩ kiểu dáng chững chạcGiá cả hợp lýThiết kế phù hợp với các sản phẩm thời trang đi kèmCĩ độ bền màu caoCĩ độ bền sản phẩm caoCĩ kiểu dệt mới lạCĩ chất lượng đường may caoDễ giặt/ ủiChất liệu vải phù hợp với thời trang thơng dụngMàu sắc sản phẩm phù hợp cho thời trang thơng dụng Bossini (n=155) Thành cơng(n=75) F-house/Phương Đơng(n=69) John Henry (n=37) Giordano (n=49)56Đối tượng: Những người nhận biết nhãn hiệu cĩ trợ giúp - Nhĩm kinh doanh/giao tiếp- Q20Cá tính thương hiệu57Mã hĩa dữ liệu là gì? Vì sao phải mã hĩa dữ liệu? Mã hĩa câu hỏi đĩng và câu hỏi mở cĩ gì khác nhau?Trình bày ưu điểm, nhược điểm của hai phương pháp mã hĩaMơ tả dữ liệu bằng bảng và đồ thị cĩ ưu nhược điểm gì? Khi nào nhà nghiên cứu mơ tả dữ liệu bằng biểu đồ hình trịn, hình thanh.Hãy mã hĩa các câu hỏi sau đây?CÂU HỎI VÀ THẢO LUẬN58a) Bạn đánh giá khả năng của bạn về việc sử dụng các phần mềm sau đây: Tốt Khá Trung bình Khơng biết sử dụngMS WordMS ExcelMS AccessMS Power PointCorel DrawsSPSSPhần mềm khácTHỰC HÀNH MÃ HĨA CÂU HỎI59b) Khi đi mua xe hơi ở một cửa hàng, bạn hãy sắp xếp thứ tự các yếu tố sau theo mức độ quan trọng của nĩ giảm dần từ (1 đến 6).----Giá cả thích hợp----Xe vừa ý----Người bán quen biết trước----Vị trí cửa hàng thuận lợi----Dịch vụ bán hàng tốt----Được bạn bè hay người thân giới thiệu
Các file đính kèm theo tài liệu này:
- chuong_7_xu_ly_va_phan_tich_dl_2509_1982125.ppt