Tài liệu Tin học ứng dụng trong công nghệ sinh học thực phẩm: TIN HỌC ỨNG DỤNG TRONG CNSHTP Mục tiờu Giỳp sinh viờn độc lập trong nghiờn cứu khoa học, cú khả năng xử lý số liệu thường gặp trong điều tra, nghiờn cứu trong cụng nghệ sinh học thực phẩm Trang bị cho sinh viờn kỹ năng sử dụng phần mềm tin học trong việc giải quyết xử lý, trỡnh bày số liệu và giải quyết một số bài toỏn trong cụng nghệ Tài liệu tham khảo Nguyễn Ngọc Kiểng, Thống kờ học trong nghiờn cứu khoa học, NXB Giỏo dục, 1996. Lờ Đức Ngọc, Xử lý số liệu và kế hoạch húa thực nghiệm, Khoa Húa, ĐHQGHN, 2001. Nguyễn Cảnh, Quy hoạch thực nghiệm, NXB Đại học Quốc gia, 2004 Phan Hiếu Hiền, Phương phỏp bố trớ nghiệm và xử lý số liệu, NXB Nụng nghiệp, 2001 Noọi dung Tin học ứng dụng trong CNSHTP Mụ tả đại lượng thống kờ bằng phần mềm tin học Mụ tả dữ kiện thớ nghiệm bằng phần mềm tin học Bố trớ thớ nghiệm nghiờn cứu thực phẩm Xử lý số liệu thớ nghiệm kiểu hoàn toàn ngẫu nhiờn bằng phần mềm Statgraphics Noọi dung Xử lý số liệu thớ nghiệm kiểu khối ngẫu nhiờn đầy đủ bằng phần mềm Statgraphics...
297 trang |
Chia sẻ: hunglv | Lượt xem: 1635 | Lượt tải: 1
Bạn đang xem trước 20 trang mẫu tài liệu Tin học ứng dụng trong công nghệ sinh học thực phẩm, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
TIN HỌC ỨNG DỤNG TRONG CNSHTP Mục tiêu Giúp sinh viên độc lập trong nghiên cứu khoa học, cĩ khả năng xử lý số liệu thường gặp trong điều tra, nghiên cứu trong cơng nghệ sinh học thực phẩm Trang bị cho sinh viên kỹ năng sử dụng phần mềm tin học trong việc giải quyết xử lý, trình bày số liệu và giải quyết một số bài tốn trong cơng nghệ Tài liệu tham khảo Nguyễn Ngọc Kiểng, Thống kê học trong nghiên cứu khoa học, NXB Giáo dục, 1996. Lê Đức Ngọc, Xử lý số liệu và kế hoạch hĩa thực nghiệm, Khoa Hĩa, ĐHQGHN, 2001. Nguyễn Cảnh, Quy hoạch thực nghiệm, NXB Đại học Quốc gia, 2004 Phan Hiếu Hiền, Phương pháp bố trí nghiệm và xử lý số liệu, NXB Nơng nghiệp, 2001 Nội dung Tin học ứng dụng trong CNSHTP Mơ tả đại lượng thống kê bằng phần mềm tin học Mơ tả dữ kiện thí nghiệm bằng phần mềm tin học Bố trí thí nghiệm nghiên cứu thực phẩm Xử lý số liệu thí nghiệm kiểu hồn tồn ngẫu nhiên bằng phần mềm Statgraphics Nội dung Xử lý số liệu thí nghiệm kiểu khối ngẫu nhiên đầy đủ bằng phần mềm Statgraphics Xử lý số liệu thí nghiệm kiểu bình phương Latin bằng phần mềm Statgraphics Xử lý số liệu thí nghiệm đa yếu tố bằng phần mềm Statgraphics Xử lý số liệu thí nghiệm hồi quy và tương quan tuyến tính bằng phần mềm Statgraphics Giải một số bài tốn cơng nghệ bằng phần mềm EXCEL 1. Tin học ứng dụng trong CNSHTP Tin học ứng dụng trong nghiên cứu thực phẩm Phần mềm ứng dụng trong bảng tính Phần mềm ứng dụng trong xử lý thống kê Phần mềm ứng dụng trong biểu diễn cơng thức hĩa học 1.1 Tin học ứng dụng trong nghiên cứu thực phẩm Trong mọi ngành khoa học thực nghiệm: thực tế thí nghiệm kết quả bằng số Kết quả bằng số: là giá trị của một biến ngẫu nhiên phụ thuộc vào nhiều yếu tố ước lượng được qui luật phụ thuộc (nghiên cứu trên một tập hợp mẫu với độ tin cậy nào đĩ) Xử lý số liệu dữ liệu thơ - tính tốn, sắp xếp - dữ liệu tinh làm cơ sở cho việc diễn giải, phân tích thống kê 1.2 Phần mềm ứng dụng trong bảng tính Phần mềm bảng tính EXCEL Tạo biểu bảng số liệu Biễu diễn số liệu dưới dạng biểu đồ Xử lý thống kê số liệu nghiên cứu Bảng phân phối tần số Sắp xếp, trình bày dữ liệu một cách cĩ hệ thống Phân chia dữ liệu thành từng nhĩm khác nhau Căn cứ để hình thành biểu đồ phân phối tần số Sơ đồ tổng quát của bảng phân phối tần số Sơ đồ tổng quát của bảng phân phối tần số Sơ đồ tổng quát của bảng phân phối tần số Biểu đồ trong thống kê Biểu diễn tồn bộ số liệu Thể hiện nét đặc trưng của tập hợp số liệu Biểu diễn mối quan hệ giữa tính trạng nghiên cứu và chỉ tiêu theo dõi Biểu đồ phân phối tần số Biểu đồ cột Trình bày số quan sát lớn Cĩ thể trình bày tần số tương đối, tần số tích lũy, tần số tương đối tích lũy Biểu đồ phân phối tần số Biểu đồ phân phối tần số Biểu đồ tần số tích lũy Biểu đồ tần số tương đối tích lũy Biểu đồ hộp Khảo sát sơ lược dữ liệu Tổng quát về phân phối của mẫu/ tổng thể thể hiện ví trí tập trung, phân tán, bất thường Biểu đồ hộp Biểu đồ hộp Khối hộp ‘box’ kéo dài từ giá trị phân vị ¼ đến giá trị phân vị ¾ , khoảng 50% giá trị nẳm trong ‘box’ Đường thẳng đứng ở vị trí trung bị mẫu, chia dãy số liệu thành 2 phần bằng nhau, nếu mẫu phân bố đối xứng thì đường này nằm gần trung tâm của khối hộp Biểu đồ hộp Dấu + ở vị trí trung bình của mẫu Sự khác biệt đáng kể giữa trung bình và trung vị cho thấy cĩ một vài số liệu cĩ khả năng gây ra sai số làm phân bố của mẫu bị lệch Đoạn thẳng hai đầu gọi là ‘whisker’ nối từ giá trị cực tiểu đến điểm phân vị ¼ và từ điểm phân vị ¾ đến giá trị cực đại Biểu đồ điểm 1.3 Phần mềm ứng dụng trong xử lý thống kê Phần mềm xử lý thống kê Statgraphics Thao tác cơ bản trong phần mềm Xử lý thống kê số liệu nghiên cứu Thao tác sao chép kết quả xử lý vào phần mềm văn bản WORD 1.4 Phần mềm ứng dụng trong biểu diễn cơng thức hĩa học Phần mềm ChemWindow Thao tác cơ bản trong phần mềm 2. Mơ tả đại lượng thống kê bằng phần mềm tin học Phân tích thống kê Đại lượng đo lường xu hướng trung bình Đại lượng đo lường sự biến thiên Xác định các đại lượng thống kê bằng phần mềm tin học 2.1 Phân tích thống kê Các con số tĩm lược thơng tin định lượng Phương pháp tính tốn để giúp chúng ta tĩm lược hoặc khái quát hố thơng tin Kỹ thuật giúp quyết định vấn đề như phân tích phương sai, tương quan hồi qui, trắc nghiệm, … Hạn chế của thống kê Sử dụng thống kê phải biết rành về lĩnh vực chuyên mơn của người nghiên cứu Thống kê chỉ là phương tiện, cơng cụ Thống kê trình bày những số liệu hoặc hiện tượng rời rạc một cách hệ thống hơn, chứ khơng nĩi được bản chất của sự việc Thống kê khơng thay thế được cho suy nghĩ và kết luận của người nghiên cứu Thống kê mơ tả Là một trong những bước đầu tiên để phân tích vấn đề và thực hiện một quyết định. Gồm các tính tốn cơ bản mang tính chất mơ tả như trung bình, phương sai, độ lệch chuẩn, … nhằm tổng kết về kết quả của thí nghiệm. Thống kê mơ tả Phương pháp tĩm lược thơng tin để làm cho chúng trở nên dễ hiểu tức giảm một số lớn các số liệu phức tạp thành một số nhỏ hơn gồm các giá trị tĩm tắt Mơ tả mối quan hệ giữa các biến số Thống kê suy diễn Khái quát hố thơng tin của một mẫu cho tồn dân số của mẫu tức là chỉ đo đếm trên một tiểu tập hợp rồi suy luận cho tồn bộ với một độ tin cậy nào đĩ Cung cấp kỹ thuật để kiểm tra trên một mẫu và sử dụng thơng tin này để suy rộng ra các đặc tính của tồn bộ dân số 2.2 Đại lượng đo lường xu hướng trung bình Mốt (mode) Trung vị (median) Trung bình cộng (average) Trung bình nhân (geometric mean) Mode: (Mo) Là giá trị xuất hiện nhiều nhất trong một biến số Ví dụ: Phân phối xác suất: 5, 6, 7, 7, 8, 8, 8, 9, 10 cĩ mode là 8 Dùng để đo độ tập trung Khơng phụ thuộc vào giá trị ở 2 đầu của dãy số Mode: (Mo) Biến số đơn thức là biến số khi gần như mọi trường hợp đều tập trung về một giá trị Biến số nhị thức là biến số khi gần như cĩ hai hay nhiều trường hợp nhất và gần như tương đương nhau Số trung vị: (Me) số nằm ở chính giữa khi dãy số xếp từ nhỏ - lớn Là giá trị chia đơi tổng số các giá trị của biến số thành 2 phần bằng nhau cho kết quả nhanh về ước lượng trung bình. Trung bình cộng Cộng các giá trị của các trường hợp và chia cho tổng trường hợp Trường hợp dị biệt cĩ thể làm trung bình mất đi tính đại diện Tổng các độ lệch giữa các giá trị với trung bình luơn bằng 0 Tổng các độ lệch bình phương cĩ giá trị nhỏ nhất Trung bình cộng Đại diện cho cả một tập hợp lớn số liệu Nêu lên đặc điểm chung nhất của hiện tượng Dùng để so sánh các hiện tượng khơng cĩ cùng qui mơ Trung bình cộng số học Trung bình cĩ trọng số Là trường hợp đặc biệt của trung bình số học khi gía trị của biến xuất hiện nhiều lần Trung bình của dữ liệu phân nhĩm cĩ khoảng cách mi là trị số giữa của nhĩm i fi tần số của nhĩm i Trung bình nhân (trung bình hình học) GM Căn bậc n cho n giá trị Thay cho trung bình cộng trong trường hợp dãy số liệu cĩ phân phối lệch (giá trị đột biến) Phần tư vị (quartile) Xếp dữ kiện từ nhỏ đến lớn, chia dãy n dữ kiện làm 4 phần Phần tư vị dưới (low quartile): lấy giá trị của đơn vị ở vị trí ¼ (25%) dãy dữ kiện. Phần tư vị trên (upper quartile): lấy giá trị của đơn vị ở vị trí ¾ (75%) dãy dữ kiện. 2.3 Đại lượng đo lường sự biến thiên Phương sai Độ lệch chuẩn Hệ số biến dị Độ lệch Độ nhọn Phương sai (variance) Phương sai là trung bình của các độ lệch bình phương giữa các giá trị so với giá trị trung bình. Phương sai Tính giá trị trung bình Trừ giá trị trung bình cho từng giá trị (hiệu số) Bình phương từng hiệu số Cộng các hiệu số được bình phương Lấy tổng của các hiệu số bình phương chia tổng giá trị Ý nghĩa của phương sai Nếu các giá trị được phân phối một cách dàn trãi trên diện rộng và cách xa trung bình thì độ lệch sẽ lớn và phương sai sẽ rất lớn Nếu các giá trị quần tụ gần giá trị trung bình thì độ lệch sẽ nhỏ và phương sai sẽ nhỏ. Độ lệch chuẩn (standard deviation) Biểu thị mức độ phân tán (cùng bản chất của tính trạng) Độ lệch càng lớn mức độ phân tán càng cao, tính đại diện trung bình càng nhỏ Độ lệch chuẩn Là căn bậc hai của phương sai Mơ tả biến thiên Mơ tả biến thiên chính là đo lường sự khác biệt của các giá trị với một giá trị chuẩn nào đĩ tức là điểm trung bình Mơ tả biến thiên Mơ tả biến thiên Mơ tả biến thiên Mơ tả biến thiên Thơng thường làm trịn giá trị của độ lệch chuẩn và phương sai ở chữ số thập phân thứ 2 Biến thiên càng lớn thì độ lệch chuẩn và phương sai càng lớn Khi viết báo cáo kết quả phân tích thống kê, thường dùng độ lệch chuẩn Hệ số biến dị So sánh mức độ phân tán của các tính trạng cĩ bản chất khác nhau Độ lệch (skewness) Là tiêu chuẩn đánh giá tính đối xứng của số liệu Độ lệch = 0 (đối xứng) Độ lệch > 0 (các giá trị cĩ xu hướng tập trung về phía bên phải của đồ thị) Độ lệch 0 (phân bố cĩ đồ thị nhọn hơn phân bố chuẩn) Độ nhọn 3,29 kết luận cĩ khác biệt ở 95% Xử lý số liệu thí nghiệm kiểu hồn tồn ngẫu nhiên bằng phần mềm Statgraphics Nhập dữ liệu Chọn lệnh xử lý Đọc kết quả Chép kết quả vào WORD Kiểu thí nghiệm khối ngẫu nhiên đầy đủ (RCBD - Randomzied complete block design) Xử lý số liệu thí nghiệm kiểu khối ngẫu nhiên đầy đủ bằng phần mềm Statgraphics 6. Xử lý số liệu thí nghiệm kiểu khối ngẫu nhiên đầy đủ bằng phần mềm Statgraphics điều kiện ngoại cảnh khơng được kiểm sốt Điều kiện ngoại cảnh tác động làm sai số của thí nghiệm tăng lên 6.1 Kiểu thí nghiệm khối ngẫu nhiên đầy đủ ĐVTN của NT hiện diện trong cùng khối Đơn vị thí nghiệm trong khối chịu ảnh hưởng như nhau Các NT bố trí ngẫu nhiên vào các ĐVTN Làm giảm sai số ngẫu nhiên giữa các khối Tạo cơ hội đồng đều hơn khi so sánh các nghiệm thức Phải bố trí làm sao giảm được ảnh hưởng của yếu tố ngoại cảnh: Các đơn vị thí nghiệm phải được giữ cùng 1 điều kiện Nếu cĩ thay đổi phải thay đổi trên tồn khối Lưu ý: Mỗi NT hiện diện 1 lần trong mỗi khối Mỗi khối cĩ đầy đủ tất cả các nghiệm thức Dễ dàng tính kết quả. Chính xác hơn kiểu hồn tồn ngẫu nhiên. Khơng bị hạn chế ở số nghiệm thức hay số khối. Thuận lợi: Khi cĩ nhiều biến thiên giữa các đơn vị thí nghiệm trong một khối sẽ cĩ sai số thí nghiệm lớn Bất lợi: Phân tích phương sai So sánh trung bình giữa các nghiệm thức Xử lý số liệu thí nghiệm kiểu khối ngẫu nhiên đầy đủ bằng phần mềm Statgraphics 6.2 Xử lý số liệu thí nghiệm kiểu khối ngẫu nhiên đầy đủ bằng phần mềm Statgraphics Xử lý số liệu thí nghiệm kiểu khối ngẫu nhiên đầy đủ bằng phần mềm Statgraphics Nhập dữ liệu Chọn lệnh xử lý Đọc kết quả Chép kết quả vào WORD Kiểu thí nghiệm bình phương Latin (LSD - Latin Squared design) Xử lý số liệu thí nghiệm kiểu bình phương Latin bằng phần mềm Statgraphics 7. Xử lý số liệu thí nghiệm kiểu bình phương Latin bằng phần mềm Statgraphics Các vật liệu trên đơn vị thí nghiệm khơng đồng nhất Thí nghiệm cĩ tác động của hai yếu tố ngoại cảnh. Số lần lặp lại bằng số nghiệm thức Số đơn vị thí nghiệm bằng số nghiệm thức bình phương. 7.1 Kiểu thí nghiệm bình phương Latin Đơn vị thí nghiệm được xếp theo hình vuơng cĩ hàng và cột Mỗi hàng và mỗi cột đều cĩ đủ các nghiệm thức Mỗi nghiệm thức xuất hiên 1 lần trong mỗi hàng và cột 7.1 Kiểu thí nghiệm bình phương Latin Phân tích phương sai So sánh trung bình giữa các nghiệm thức Xử lý số liệu thí nghiệm kiểu bình phương Latin bằng phần mềm Statgraphics 7.2 Xử lý số liệu thí nghiệm kiểu bình phương Latin bằng phần mềm Statgraphics Xử lý số liệu thí nghiệm kiểu bình phương Latin bằng phần mềm Statgraphics Nhập dữ liệu Chọn lệnh xử lý Đọc kết quả Chép kết quả vào WORD 8. Xử lý số liệu thí nghiệm đa yếu tố bằng phần mềm Statgraphics Trường hợp cần nghiên cứu ảnh hưởng của nhiều yếu tố đến kết quả Trong thí nghiệm nhiều tố, khơng chỉ biết ảnh hưởng của từng yếu tố mà cịn cĩ tác dụng tương hỗ của giữa các yếu tố Tương tác là tác dụng cĩ thêm vì ảnh hưởng đồng thời của 1 hoặc nhiều yếu tố Phân tích phương sai đa biến Phân tích phương sai cho đa biến độc lập (nhiều yếu tố-multifactor analysis of variance ) cho phép xem xét cùng một lúc tác động của nhiều biến độc lập và tác động của sự kết hợp giữa các biến này với biến phụ thuộc Xử lý số liệu thí nghiệm 2 yếu tố bằng phần mềm Statgraphics Nhập dữ liệu Chọn lệnh xử lý Đọc kết quả Chép kết quả vào WORD 9. Xử lý số liệu thí nghiệm hồi quy và tương quan tuyến tính bằng phần mềm Statgraphics Khái niệm hồi quy và tương quan Hồi quy và tương quan tuyến tính đơn biến Hồi quy và tương quan tuyến tính đa biến Xử lý số liệu thí nghiệm hồi quy và tương quan tuyến tính bằng phần mềm Statgraphics 9.1 Khái niệm hồi quy và tương quan Phân tích hồi qui Đồ thị phân tán Phân tích tương quan Trong nhiều trường hợp cĩ hai hoặc nhiều biến số cĩ quan hệ thì việc tìm mơ hình và giải thích mối quan hệ này là quan trọng, sẽ giúp cho việc dự đốn, tối ưu hoặc kiểm sốt quá trình Phân tích hồi qui giả sử biến phụ thuộc y cĩ quan hệ với n biến độc lập, thì mối quan hệ được biểu diễn bởi một mơ hình tốn học gọi là phương trình hồi qui: y = f(x1, x2, …xn) Phân tích hồi qui Thơng thường việc phân tích ANOVA của một thí nghiệm giúp xác định yếu tố nào là quan trọng, sau đĩ hồi qui giúp xây dựng mơ hình định lượng giữa yếu tố phụ thuộc với các yếu tố quan trọng đĩ Phân tích hồi qui Đồ thị phân tán giúp nhìn thấy rõ mối quan hệ giữa 2 biến Đồ thị phân tán Đồ thị phân tán Quan hệ dương là mối quan hệ mà trong đĩ các giá trị lớn nhất của một biến nào đĩ gắn kết với những giá trị lớn nhất của biến cịn lại. Quan hệ âm là mối quan hệ mà trong đĩ các giá trị lớn nhất của một biến nào đĩ gắn kết với những giá trị nhỏ nhất của biến cịn lại. Đồ thị phân tán Quan hệ tương quan cong là những mối quan hệ mà trong đĩ các trường hợp mang những giá trị lớn và nhỏ trong biến độc lập cũng cĩ những giá trị tương ứng trong biến phụ thuộc Đồ thị phân tán Mức độ của mối quan hệ được đo lường bởi độ tập trung của các điểm dữ kiện trên đường thẳng hồi qui trong đồ thị phân tán Phân tích tương quan Nếu các trường hợp tập trung gần đường hồi qui sẽ cĩ mối quan hệ mạnh mẽ Nếu các trường hợp phân tán xa đường hồi qui sẽ cĩ mối quan hệ yếu Phân tích tương quan Sự khơng thích hợp giữa dữ kiện và mục đích Sự khái quát kết quả quá giới hạn Sử dụng số liệu từ các lần lặp lại riêng lẻ thay vì sử dụng trung bình của các lần lặp lại Lạm dụng phân tích tương quan sự diễn đạt kết quả của tương quan hồi quy phụ thuộc rất lớn vào kiểu dữ kiện đang sử dụng Sự khơng thích hợp giữa dữ kiện và mục đích áp dụng hàm hồi quy ngồi phạm vi dữ kiện đã được sử dụng của biến số là một trong những lạm dụng thường xảy ra. Sự khái quát kết quả quá giới hạn sử dụng kết quả phân tích hồi quy tương quan như là một phương pháp thay thế cho việc đo đếm thu thập số liệu, thay vì đo đếm số liệu lại dùng hồi quy tương quan để suy diễn số liệu cho một yếu tố nào đĩ trong nghiên cứu Sự khái quát kết quả quá giới hạn khi phân tích tương quan hồi quy cho dữ liệu từ các thí nghiệm lặp lại các nghiệm thức cĩ 2 cách sử dụng dữ kiện: sử dụng dữ kiện từ các nghiệm thức riêng lẻ sử dụng dữ kiện từ trung bình của các lần lặp lại trong mỗi nghiệm thức. Sử dụng số liệu từ các lần lặp lại riêng lẻ thay vì sử dụng trung bình của các lần lặp lại nên dùng dữ kiện từ trung bình của các lần lặp lại trong mỗi nghiệm thức vì biến thiên giữa các lần lặp lại khơng nên tham gia vào đánh giá tương quan đang nghiên cứu. Sử dụng số liệu từ các lần lặp lại riêng lẻ thay vì sử dụng trung bình của các lần lặp lại Số liệu giả Ngộ nhận giữa nguyên nhân và hậu quả Phân biệt các nhĩm biến số trong phân tích hồi qui và tương quan Kiểu sai lệch khi diễn đạt kết quả của hồi quy đơn giản số liệu mà phân bố của nĩ trong phạm vi của biến độc lập hơi bất thường. dữ kiện chỉ tập trung ở hai cực cịn khoảng giữa khơng cĩ, trong trường hợp này xác lập hồi quy đơn thường cĩ kết quả với hệ số tương quan cao. Số liệu giả hệ số tương quan r cĩ ý nghĩa tức là hiện diện một mối quan hệ nhân quả giữa hai biến số. khi phân tích tương quan cĩ thể định lượng mức độ kết hợp giữa hai đặc tính cũng khơng thể và khơng nên đưa ra lý do cho sự kết hợp đĩ. Ngộ nhận giữa nguyên nhân và hậu quả 9.2 Hồi quy và tương quan tuyến tính đơn biến Hồi qui và đường thẳng bình phương nhỏ nhất Đường thẳng hồi qui Mơ hình hồi qui Hàm hồi qui Biến phụ thuộc Đường thẳng cực tiểu hố tổng các độ lệch bình phương giữa đường thẳng với các điểm số thuộc biến phụ thuộc Hồi qui và đường thẳng bình phương nhỏ nhất Đường thẳng hồi qui dự đốn một cách chính xác điểm số trong biến phụ thuộc của một trường hợp nào đĩ khi biết được điểm số trong biến độc lập của trường hợp đĩ Một đường thẳng mơ tả mối quan hệ nào đĩ gọi là hồi qui tuyến tính Đường thẳng hồi qui Hàm số mô tả quan hệ giữa y với x và sai số € được gọi là mô hình hồi quy. Mô hình hồi quy tuyến tính đơn có dạng: y = ß1x + ß0 + € Trong mô hình hồi quy tuyến tính đơn, ß1 và ß0 là các tham số của mô hình, € là biến ngẫu nhiên biểu thị sai số của mô hình Mô hình hồi qui Một trong những giả định là trị số kỳ vọng của € bằng zero, nghĩa là E(€) = 0. Mô hình hồi qui Hàm số mô tả giá trị trung bình của y có quan hệ với x được gọi là hàm hồi quy. Hàm hồi quy đối với hồi quy tuyến tính đơn có dạng: E(y)= ß1x + ß0 Hàm hồi qui Đồ thị của hàm hồi quy tuyến tính đơn là một đường thẳng, trong đó ß0 là điểm chặn của đường hồi quy, ß1 là độ dốc của đường hồi quy. Khi biết các tham số ß1 và ß0 có thể sử dùng hàm hồi qui để tính giá trị trung bình y đối với giá trị x nhất định. Hàm hồi qui Nhưng trong thực tế chưa biết các tham số ß1 và ß0, do đó chúng ta phải ước lượng các tham số này từ các quan sát mẫu. Hàm hồi qui Các thống kê mẫu b1 và b0 được xem như là các ước lượng tương ứng của ß1 và ß0 khi thay thế b1 và b0 tương ứng cho ß1 và ß0 chúng ta nhận được hàm hồi quy ước lượng có dạng: y’ = b1x + b0 Hàm hồi qui Với: b0 là điểm chặn và b1 là độ dốc của đường hồi quy ước lượng, y’ là giá trị ước lượng (kỳ vọng) của y tương ứng với một giá trị x nhất định. Hàm hồi qui Các tham số b1 và b0 được tính theo phương pháp bình phương nhỏ nhất. Phương pháp bình phương nhỏ nhất sử dụng các số liệu của mẫu để tính các tham số b1 và b0 của hàm hồi quy ước lượng. Hàm hồi qui Bản chất của phương pháp này là làm nhỏ nhất tổng bình phương các sai lệch giữa giá trị của biến yi và giá trị ước lượng của biến yi’ Hàm hồi qui Để tổng các (yi-yi’)2 nhỏ nhất thì b1 và b0 được tính theo công thức: Tính các thơng số của đường thẳng hồi quy n = tổng số quan sát. xi = giá trị của biến độc lập tương ứng với quan sát i. yi = giá trị của biến phụ thuộc tương ứng với quan sát i. xtb = giá trị trung bình của biến độc lập. ytb = giá trị trung bình biến phụ thuộc Tính các thơng số của đường thẳng hồi quy Hệ số xác định là số đo mức độ phù hợp của hàm hồi quy ước lượng Hiệu số (yi-yi’) gọi là sai lệch của quan sát i. Tính hệ số xác định r2 Tổng bình phương các sai lệch hoặc sai số (kí hiệu SSE) là một đại lượng được tối thiểu hoá phương pháp bình phương nhỏ nhất Tính hệ số xác định r2 Giá trị SSE đo đạc sai số khi sử dụng hàm hồi quy ước lượng để ước lượng các giá trị của biến phụ thuộc yi ở mẫu. Tính hệ số xác định r2 Nếu sử dụng giá trị ytb của mẫu để ước lượng yi thì sai số ước lượng là: yi – ytb Đại lượng được gọi là tổng bình phương toàn bộ: Tính hệ số xác định r2 SST đo đạc sự phân bố của các yi xung quanh ytb SSE đo đạc sự phân bố của các yi xung quanh y’ Tính hệ số xác định r2 Để đo đạc giá trị y’ trên đường hồi quy ước lượng cách xa ytb bao nhiêu, thì dùng đại lượng tổng bình phương do hồi quy: Tính hệ số xác định r2 Giữa SST, SSE và SSR có mối quan hệ: SST=SSR+SSE Tính hệ số xác định r2 Nếu tất cả các điểm quan sát yi đều nằm trên đường y’ thì hàm hồi quy ước lượng phù hợp hoàn toàn. Điều này có nghĩa yi - yi’ = 0 hay SSE = 0, và vì SST = SSE + SSR nên để hàm hồi quy ước lượng phù hợp hoàn toàn thì SSR/SST = 1 Tính hệ số xác định r2 Như vậy, mức phù hợp của hàm hồi quy ước lượng phụ thuộc vào SSE lớn hay nhỏ. Tỷ số SSR/SST được gọi là hệ số xác định, ký hiệu r2 r2 lấy giá trị từ 0 đến 1. Tính hệ số xác định r2 hệ số xác định r2 cho biết số tỷ lệ sai biệt mà chúng ta đã giảm được khi dự đốn điểm số của biến phụ thuộc bằng cách dựa vào điểm số của biến độc lập Tính hệ số xác định r2 Căn bậc hai của hệ số xác định được gọi là hệ số tương quan (ký hiệu r) r lấy giá trị từ -1 đến +1. Tính hệ số tương quan (r) Hệ số tương quan r đo lường một cách chính xác mức độ tập trung của các điểm số trên suốt chiều dài của đường hồi qui Tính hệ số tương quan (r) r = 0 thì x và y không có tương quan r = -1 thì x và y có quan hệ tuyến tính âm rất chặt chẽ, có nghĩa các điểm quan sát nằm trên đường thẳng có độ dốc âm. r = +1 thì x và y có quan hệ tuyến tính dương rất chặt chẽ, có nghĩa các điểm quan sát nằm trên đường thẳng có độ dốc dương Tính hệ số tương quan (r) Qui chiếu đánh giá r: 0,0 < r < 0,3 tương quan yếu 0,3 < r < 0,5 tương quan vừa 0,5 < r < 0,7 tương quan tương đối chặt 0,7 < r < 0,9 tương quan chặt 0,9 < r < 1,0 tương quan rất chặt Tính hệ số tương quan (r) Trong hàm hồi quy tuyến tính đơn, E(y)= ß1x + ß0 nếu ß1 = 0 thì E(y)= ß0 trong trường hợp này ytb không phụ thuộc vào x, ngược lại nếu ß1 ≠ 0 thì x và y có quan hệ với nhau. Thực chất của kiểm định mức ý nghĩa là kiểm định giả thiết H0: ß1 = 0. Kiểm định mức ý nghĩa Kiểm định t: là xác định hệ số ß1 có khác zero hay không. Kiểm định F: dựa trên phân bố xác xuất F, được sử dụng để kiểm định mức ý nghĩa trong hồi quy Kiểm định mức ý nghĩa Với hàm hồi quy tuyến tính một biến, kiểm định F cũng đưa ra cùng kết luận như kiểm định t, nhưng hàm hồi quy đa tuyến tính (từ hai biến độc lập trở lên) thì chỉ có kiểm định F được sử dụng. Kiểm định mức ý nghĩa Những quan sát ngoại lai là những số không phù hợp với khuynh hướng biến đổi của các tập hợp quan sát khác hoặc nằm cách xa trị trung bình của các quan sát khác. Để loại bỏ các số ngoại lai, có thể sử dụng đồ thị phân tán hoặc các sai lệch chuẩn. Phân tích các sai lệch Nếu một quan sát phân tán xa trị trung bình của các quan sát khác thì sai lệch chuẩn của nó sẽ lớn hơn về trị tuyệt đối. Nói chung, những giá trị quan sát có sai lệch chuẩn lớn hơn +2 và nhỏ hơn -2 là những số ngoại lai Phân tích các sai lệch Hồi quy và tương quan phi tuyến tính đơn biến (Simple Nonlinear) Các tính trạng cĩ quan hệ với nhau theo những đường cong: Parabol (hàm bậc 2) Hình chữ S (hàm bậc 3) Hồi quy và tương quan phi tuyến tính đơn biến (Simple Nonlinear) Polynomial Regression Analysis ----------------------------------------------------------------------------- Dependent variable: y ----------------------------------------------------------------------------- Standard T Parameter Estimate Error Statistic P-Value ----------------------------------------------------------------------------- CONSTANT 9,57463 4,72639 2,02578 0,0703 x -4,09341 4,62313 -0,885419 0,3967 x^2 2,12537 1,03897 2,04565 0,0680 ----------------------------------------------------------------------------- Analysis of Variance ----------------------------------------------------------------------------- Source Sum of Squares Df Mean Square F-Ratio P-Value ----------------------------------------------------------------------------- Model 215,755 2 107,878 31,20 0,0001 Residual 34,5773 10 3,45773 ----------------------------------------------------------------------------- Total (Corr.) 250,332 12 R-squared = 86,1875 percent R-squared (adjusted for d.f.) = 83,4249 percent y = 9,57463-4,09341*x + 2,12537*x^2 9.3. Hồi quy và tương quan tuyến tính đa biến Mơ hình hồi qui mở rộng Hồi qui và tương quan bội Đồ thị phân tán 3 chiều: Mô hình hồi qui mở rộng Mặt phẳng hồi qui trong đồ thị 3 chiều Phân tích hồi quy đa biến là nghiên cứu biến phụ thuộc y có quan hệ với 2 hay nhiều biến độc lập hay không. Hồi qui và tương quan bội Mô hình hồi quy đa biến có dạng: y = ßo + ß1x1 + ß2x2 + … + ßnxn + €, Với: ßo ß1 ß2 … ßn là các tham số € là sai số của mô hình. Hồi qui và tương quan bội Trong phân tích hồi quy, biến phản hồi thay thế cho biến độc lập, hồi quy đa biến tạo ra một mặt phẳng, nên đồ thị của nó gọi là mặt phẳng phản hồi Hồi qui và tương quan bội Hồi qui và tương quan bội đồ thị hàm hồi quy để phân tích hồi quy đa biến Hàm hồi quy đa biến có dạng: E(y) = ßo + ß1x1 + ß2x2 + … + ßnxn Hàm hồi quy đa biến uớc lượng có dạng: y’ = b0 + b1x1 + b2x2 + … + bnxn Hồi qui và tương quan bội Trong hồi quy tuyến tính đơn, hệ số b1 là ước lượng sự thay đổi của y theo một đơn vị thay đổi của x. Trong hồi quy đa tuyến tính, hệ số bi là ước lượng sự thay đổi của y tương ứng với một đơn vị thay đổi của xi khi tất các biến độc lập khác là hằng số. Hồi qui và tương quan bội SST, SSR và SSE có mối quan hệ: SST = SSR + SSE SST là tổng bình phương toàn bộ: Hồi qui và tương quan bội Với SSE là tổng bình phương do sai số SSR là tổng bình phương do hồi quy Hệ số xác định đa biến giải thích tỷ lệ biến thiên của biến phụ thuộc y. Hệ số tương quan đa biến của mẫu R giải thích cường độ quan hệ giữa y với các biến độc lập. Hồi qui và tương quan bội Hệ số tương quan bộ phận sẽ đo lường được mức độ và hướng của một quan hệ nào đĩ đồng thời vẫn kiểm sốt ảnh hưởng của một hay nhiều biến khác. Mơ hình hồi qui đa biến (hồi qui bội): Là một thống kê đo lường ảnh hưởng chung (ảnh hưởng kết hợp) của một tổng thể các biến độc lập đối với một biến phụ thuộc Cho biết độ lệch giữa các điểm dữ kiện so với mặt phẳng hồi qui Luơn luơn là số dương (0 đến 1) Hệ số tương quan bội Y = a + b1X1 + b2X2 Y là điểm số được dự đốn của biến phụ thuộc a giao điểm giữa mặt cắt trục của biến phụ thuộc b1 độ dốc của mặt phẳng so với biến độc lập x1 X1 là điểm số của biến độc lập 1 b2 độ dốc của mặt phẳng so với biến độc lập x2 X2 là điểm số của biến độc lập 2 Phương trình hồi qui bội Là các hệ số hồi qui khơng chuẩn hố Là những độ dốc bộ phận mơ tả sự thay đổi trong biến phụ thuộc gắn với sự gia tăng của một đơn vị nào đĩ trong biến độc lập X, đồng thời vẫn kiểm sốt được ảnh hưởng của biến độc lập cịn lại b1 và b2: Các biến độc lập cĩ quan hệ tuyến tính với biến phụ thuộc Các biến độc lập cĩ thể ảnh hưởng với biến phụ thuộc nhưng giữa chúng khơng cĩ tương tác thống kê Các biến độc lập trong mơ hình phải khơng cĩ tương quan mạnh mẽ với nhau Điều kiện cần trong phân tích hồi qui đa biến Trong hồi quy tuyến tính đơn, thống kê t và F được dùng để kiểm định sự tồn tại của mô hình. Hai kiểm định t và F có ý nghĩa như nhau, nghĩa là cùng đưa ra những kết luận giống nhau. Kiểm định mức ý nghĩa Nhưng trong hồi quy đa tuyến tính, thống kê t và F được dùng với ý nghĩa khác nhau: Thống kê F được dùng để xác định mô hình hồi quy đa tuyến tính có tồn tại hay không, hay giữa y với các xi có tồn tại mối quan hệ hay không. Kiểm định mức ý nghĩa Nếu kiểm định F chỉ ra mối quan hệ giữa y với các xi có tồn tại thực sự, thì tiếp theo kiểm định t sẽ được sử dụng để xác định từng biến độc lập có ý nghĩa hay không. Kiểm định mức ý nghĩa Kiểm định t riêng biệt được xây dựng cho từng biến độc lập, nên mỗi kiểm định t là một kiểm định mức ý nghĩa riêng biệt. Kiểm định mức ý nghĩa Xử lý số liệu thí nghiệm hồi quy và tương quan tuyến tính bằng phần Statgraphics Xác định mơ hình tuyến tính Xác định mơ hình phi tuyến Xác định mơ hình đơn biến Xác định mơ hình đa biến Xác định mơ hình bậc nhất Xác định mơ hình bậc cao 10. Giải một số bài tốn cơng nghệ bằng phần mềm EXCEL Động hĩa học trong cộng nghệ Tiêu diệt vi sinh vật trong xử lý nhiệt Kiểm sốt chất lượng trong sản xuất Đánh giá cảm quan sản phẩm Vận chuyển chất lỏng 10.1 Động hĩa học trong cộng nghệ Xác định hằng số tốc độ của phản ứng hố học bậc zero Xác định hằng số tốc độ của phản ứng hố học bậc nhất Xác định năng lượng hoạt hố của sự phân hủy vitamin trong quá trình bảo quản thực phẩm Tốc độ của phản ứng enzyme xúc tác 10.2 Tiêu diệt vi sinh vật trong xử lý nhiệt Xác định giá trị D (thời gian tiêu diệt) từ số liệu vi sinh vật sống sĩt Yếu tố kháng nhiệt, giá trị z, trong chế biến nhiệt Lấy mẫu đảm bảo một lơ khơng bị nhiễm với nhiều hơn phần trăm cho trước 10.2 Tiêu diệt vi sinh vật trong xử lý nhiệt Xác định quá trình giết chết VSV đối với thực phẩm xử lý nhiệt Tính tốn thời gian chế biến nhiệt đối với thực phẩm với giá trị z ở 18oF Xác định giá trị tiệt trùng đối với quá trình xử lý nhiệt 10.3 Kiểm sốt chất lượng trong sản xuất Biểu đồ kiểm sốt Xác suất xảy ra trong phân phối chuẩn Dùng phân phối nhị thức để xác định xác suất xảy ra Xác xuất của khoảng khiểm khuyết trong mẫu từ lơ thí nghiệm lớn Xác định giới hạn tin cậy đối với trung bình dân số sử dụng phân bố t 10.4 Đánh giá cảm quan sản phẩm Mơ tả thống kê của dân số ước tính từ dữ liệu cảm quan thu được đối với mẫu Phân tích phương sai 1 yếu tố hồn tồn ngẫu nhiên Phân tích phương sai đối với kiểu 2 yếu tố khơng lặp lại (1 yếu tố khối) Sử dụng hồi qui tuyến tính trong phân tích dữ liệu cảm quan 10.5 Vận chuyển chất lỏng Đo độ nhớt của thực phẩm lỏng Sử dụng ống Pitot để đo tốc độ nước trong ống
Các file đính kèm theo tài liệu này:
- Tin học ứng dụng trong công nghệ sinh học thực phẩm.ppt