Quy luật phân phối chuẩn và ứng dụng trong kiểm định giả thiết về giá trị trung bình - Phạm Thị Thái

Tài liệu Quy luật phân phối chuẩn và ứng dụng trong kiểm định giả thiết về giá trị trung bình - Phạm Thị Thái: 73 TẠP CHÍ KHOA HỌC Khoa học Tự nhiên và Công nghệ, Số 6 (9/2016) tr 73 - 80 QUY LUẬT PHÂN PHỐI CHUẨN VÀ ỨNG DỤNG TRONG KIỂM ĐỊNH GIẢ THIẾT VỀ GIÁ TRỊ TRUNG BÌNH Phạm Thị Thái, Nguyễn Xuân Vui Khoa Toán - Lý - Tin, Trường Đại học Tây Bắc Tóm tắt: Quy luật phân phối chuẩn là một quy luật phân phối xác suất khá thông dụng được áp dụng rộng rãi trong đời sống và trong khoa học. Trong thực tế nhiều biến ngẫu nhiên, nhiều quy luật tuân theo quy luật phân phối chuẩn hoặc xấp xỉ chuẩn. Trong khoa học quy luật phân phối chuẩn cũng có rất nhiều ứng dụng, một trong số đó là ứng dụng vào kiểm định giả thiết thống kê. Trong bài báo này, chúng tôi nghiên cứu ứng dụng của phân phối chuẩn vào việc xây dựng tiêu chuẩn kiểm định giả thiết về giá trị trung bình. Từ khóa: Biến ngẫu nhiên; Phân phối chuẩn; Kiểm định giả thiết thống kê; Hàm mật độ; Hàm phân phối; Kì vọng; Phương sai; Phân phối chuẩn tắc. 1. Quy luật phân phối chuẩn Định nghĩa 1.1 Biến ngẫu nhiên liên tục X đư...

8 trang | Chia sẻ: quangot475 | Lượt xem: 998 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Quy luật phân phối chuẩn và ứng dụng trong kiểm định giả thiết về giá trị trung bình - Phạm Thị Thái, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

73 TẠP CHÍ KHOA HỌC Khoa học Tự nhiên và Công nghệ, Số 6 (9/2016) tr 73 - 80 QUY LUẬT PHÂN PHỐI CHUẨN VÀ ỨNG DỤNG TRONG KIỂM ĐỊNH GIẢ THIẾT VỀ GIÁ TRỊ TRUNG BÌNH Phạm Thị Thái, Nguyễn Xuân Vui Khoa Toán - Lý - Tin, Trường Đại học Tây Bắc Tóm tắt: Quy luật phân phối chuẩn là một quy luật phân phối xác suất khá thông dụng được áp dụng rộng rãi trong đời sống và trong khoa học. Trong thực tế nhiều biến ngẫu nhiên, nhiều quy luật tuân theo quy luật phân phối chuẩn hoặc xấp xỉ chuẩn. Trong khoa học quy luật phân phối chuẩn cũng có rất nhiều ứng dụng, một trong số đó là ứng dụng vào kiểm định giả thiết thống kê. Trong bài báo này, chúng tôi nghiên cứu ứng dụng của phân phối chuẩn vào việc xây dựng tiêu chuẩn kiểm định giả thiết về giá trị trung bình. Từ khóa: Biến ngẫu nhiên; Phân phối chuẩn; Kiểm định giả thiết thống kê; Hàm mật độ; Hàm phân phối; Kì vọng; Phương sai; Phân phối chuẩn tắc. 1. Quy luật phân phối chuẩn Định nghĩa 1.1 Biến ngẫu nhiên liên tục X được gọi là có phân phối theo quy luật chuẩn với các tham số a và 2 nếu hàm mật độ xác suất của nó có dạng     2 2 2 1 , . 2 x a f x e x        Ta kí hiệu   2 ; .X N a  Như vậy, nếu biến ngẫu nhiên X có phân phối theo quy luật chuẩn   2 ;N a  thì hàm phân phối của X là     2 2 2 1 , . 2 u ax X F x e d u x         Đặc biệt nếu  0;1X N thì biến ngẫu nhiên X được gọi là có phân phối theo quy luật chuẩn tắc, khi đó X có hàm mật độ xác suất là   2 2 1 , 2 x x e x      và hàm phân phối xác suất là   2 2 1 , . 2 x u x e d u x        Nếu   2 ;X N a  thì biến ngẫu nhiên X có kỳ vọng  E X a và phương sai   2 .D X  Định lí sau đây (xem [3]) thể hiện mối liên hệ giữa phân phối theo quy luật chuẩn   2 ;N a  với phân phối theo quy luật chuẩn tắc  0;1 .N Ngày nhận bài: 26/3/2016. Ngày nhận đăng: 25/9/2016 Liên lạc: Phạm Thị Thái, e - mail phamthithai68@gmail.com 74 Định lí 1.2 Nếu biến ngẫu nhiên X có phân phối theo quy luật chuẩn   2 ;N a  thì: i) Biến ngẫu nhiên X a Y    có phân phối theo quy luật chuẩn tắc  0;1 ;N ii)   . a a P X                         Định lí trên sẽ được sử dụng trong kiểm định giả thiết thống kê ở phần sau. Từ định nghĩa, ta thấy    1 .x x     Thật vậy theo định nghĩa hàm phân phối xác suất của biến ngẫu nhiên  0;1X N   2 2 1 . 2 x u x e d u         Khi đó, ta biến đổi 2 2 2 2 1 1 1 . 2 2 x u u x e d u e d u            Tiếp theo, ta đặt u t  thì ta được     2 2 1 1 1 . 2 x t x e d t x           Định nghĩa 1.3 Giá trị tới hạn mức  được kí hiệu u  là giá trị của biến ngẫu nhiên U có phân phối theo quy luật chuẩn tắc  0;1N sao cho   .P U u   Nhờ tính chất của hàm mật độ xác suất ta có   2 2 1 . 2 u u P U u e d u          Đồng thời, chú ý rằng giá trị tới hạn chuẩn có tính chất 1 .u u     Sau đây chúng tôi nhắc lại về kiểm định giả thiết thống kê. 2. Kiểm định giả thiết thống kê 2.1. Giả thiết thống kê Giả thiết thống kê đó là giả thiết về phân phối xác suất của biến ngẫu nhiên, về hàm phân phối xác suất của biến ngẫu nhiên, về các tham số đặc trưng của biến ngẫu nhiên, về tính độc lập của các biến ngẫu nhiên và kí hiệu là 0 .H Giả thiết đi kèm với 0 H nhưng mâu thuẫn với 0 H được gọi là đối thiết và kí hiệu là 1 .H Giả thiết thống kê hoàn toàn xác định nếu biết được cặp giả thiết 0 H và 1 .H Chẳng hạn trong sản xuất một loại sản phẩm theo hai dây truyền sản xuất A và B. Ta có cặp giả thiết 0 :H Hiệu quả sản suất của hai dây truyền A và B như nhau, 1 :H Hiệu quả sản suất của hai dây truyền A và B khác nhau. Chúng ta cũng có thể thiết lập bài toán kiểm định giả thiết về tham số đặc trưng của biến ngẫu nhiên. Giả sử biến ngẫu nhiên X có phân phối theo quy luật chuẩn  ; 2N a và 0a là số cho trước. Ta có các cặp giả thiết thống kê sau: 0 0 1 0 : : H a a H a a    hoặc 0 0 1 0 : : H a a H a a    hoặc 0 0 1 0 : : H a a H a a    2.2. Kiểm định giả thiết thống kê 75 Kiểm định giả thiết thống kê là việc lựa chọn một trong hai quyết định: Chấp nhận giả thiết 0 H (tức là chấp nhận giả thiết 0 H đúng) hay là bác bỏ giả thiết 0 ,H trong trường hợp này ta chấp nhận đối thiết 1 .H 2.3. Tiêu chuẩn kiểm định giả thiết Từ biến ngẫu nhiên X lập mẫu ngẫu nhiên  1 2, , ..., ,nX X X chọn tiêu chuẩn kiểm định giả thiết đó là biến ngẫu nhiên  1 2 0, , ..., , ,nG f X X X  trong đó 0 là tham số liên quan tới giả thiết cần kiểm định và nếu 0 H đúng thì quy luật G hoàn toàn xác định. 2.4. Miền bác bỏ giả thiết Với số  cho trước ( rất nhỏ thường lấy 0,1; 0,01; 0,05) tìm miền W  sao cho xác suất để G thuộc miền W  với điều kiện 0H bằng , tức là  0W / .P G H   Khi đó miền W  được gọi là miền bác bỏ giả thiết 0 H với mức ý nghĩa . Để tìm miền bác bỏ giả thiết ta dựa vào hai loại sai lầm sau. Sai lầm loại 1: Bác bỏ giả thiết 0 H nhưng thực tế giả thiết 0 H đúng, xác suất mắc sai lầm này là . Sai lầm loại 2: Chấp nhận giả thiết 0 H nhưng thực tế giả thiết 0 H sai, xác suất mắc sai lầm này giả sử là . Khi đó xác suất để G không thuộc miền W  với điều kiện 1H bằng , tức là  1W / .P G H   Để tìm miền bác bỏ giả thiết 0 H tốt nhất cần cực tiểu xác suất sai lầm loại 1 và loại 2. Đối với kích thước mẫu cho trước thì không đồng thời giảm xác suất hai sai lầm này được. Như vậy ta sẽ tìm miền W  sao cho  0W /P G H   và  1W /P G H   nhỏ nhất. Trong phạm vi nghiên cứu chúng tôi chỉ kiểm định giả thiết với xác suất sai lầm loại 1 đã cho và sau đây là quy tắc kiểm định giả thiết. Bước 1. Xác định giả thiết 0 H và đối thiết 1 .H Bước 2. Lập mẫu ngẫu nhiên  1 2, , ..., nX X X từ biến ngẫu nhiên X cần nghiên cứu. Bước 3. Chọn tiêu chuẩn kiểm định  1 2 0, , ..., ,nG f X X X  và quy luật phân phối của nó khi 0 H đúng. Bước 4. Tìm miền bác bỏ W  của giả thiết 0 H dựa vào đối thiết 1 H khi mức ý nghĩa  đã cho. Bước 5. Dựa vào mẫu cụ thể tìm giá trị quan sát q s G của tiêu chuẩn kiểm định. Bước 6. Kết luận về cặp giả thiết 0 H và 1 H như sau - Nếu W q s G   thì bác bỏ giả thiết 0 H và thừa nhận đối thiết 1 .H - Nếu W q s G   thì chấp nhận giả thiết 0 H (đúng ra, chưa có cơ sở để bác bỏ 0 H , cần chấp nhận 0 H khi có thông tin mới về mẫu). Sau đây, chúng tôi sử dụng quy luật phân phối theo quy luật chuẩn và cở sở lý thuyết về kiểm định giả thiết thống kê, để xây dựng tiêu chuẩn kiểm định giả thiết về giá trị trung bình của biến ngẫu nhiên có phân phối theo quy luật chuẩn. 3. Kiểm định giả thiết về giá trị trung bình 3.1. Kiểm định giả thiết về một giá trị trung bình 76 Giả sử mẫu ngẫu nhiên  1 2, , ..., nX X X được lập từ biến ngẫu nhiên X có phân phối theo quy luật chuẩn   2 ;N a  và 0 a là số cho trước. Với mức ý nghĩa  cho trước ta kiểm định giả thiết 0 0 : .H a a Dựa vào quy luật phân phối theo quy luật chuẩn ta xét các trường hợp sau. 3.1.1. Trường hợp 2 đã biết Ta đã có kết quả: Nếu biến ngẫu nhiên   2 ;X N a  thì các biến ngẫu nhiên   2 ; , i X N a  1, .i n Do đó trung bình mẫu 1 1 n i i X X n    có kỳ vọng     1 1 1 1 n n i i i i E X E X E X a n n            và phương sai     2 2 1 1 1 1 . n n i i i i D X D X D X n n n              Như vậy biến ngẫu nhiên 2 ; .X N a n       Khi đó chọn tiêu chuẩn kiểm định . X a G n    Theo Định lí 1.2 xác định được G có phân phối theo quy luật chuẩn tắc  0;1 .N Nếu giả thiết 0 H đúng, tức là 0 a a thì 0 X a G n    có phân phối theo quy luật chuẩn tắc  0;1N (tức là quy luật G hoàn toàn xác định). Ta sẽ căn cứ vào đối thiết 1 H để xây dựng miền bác bỏ W  theo các trường hợp sau: 0 0 1 0 i ) : , :H a a H a a  Với mức ý nghĩa  cho trước, tìm được hai giá trị tới hạn 2 u  và 1 2 2 u u      của phân phối theo quy luật chuẩn tắc  0;1N sao cho  0 2 2 W / . 2 2 P G H P G u P G u                           Do đó miền bác bỏ hai phía giả thiết 0 H là 2 2 W ; ; .u u                   0 0 1 0 i i ) : , :H a a H a a  Với mức ý nghĩa  cho trước, tìm được giá trị tới hạn u  của phân phối theo quy luật chuẩn tắc  0;1N sao cho    0W / .P G H P G u      Do đó miền bác bỏ một phía giả thiết 0 H là  W ; .u   0 0 1 0 i i i ) : , :H a a H a a  Với mức ý nghĩa  cho trước, tìm được giá trị tới hạn 1 u  của phân phối theo quy luật chuẩn tắc  0;1N sao cho 77      0 1W / .P G H P G u P G u          Do đó miền bác bỏ một phía giả thiết 0 H là  W ; .u    Ví dụ 1. Một nhóm nghiên cứu công bố rằng trung bình mỗi người vào siêu thị A tiêu hết 140 nghìn đồng. Giả sử tiêu tiền của mỗi người mua hàng ở siêu thị A là biến ngẫu nhiên có phân phối theo quy luật chuẩn. Người ta chọn ngẫu nhiên 50 người vào mua hàng tính được số tiền tiêu trung bình của họ là 154 nghìn đồng, với độ lệch chuẩn là 62 nghìn đồng. Với mức ý nghĩa 0,05 hãy kiểm định xem công bố của nhóm nghiên cứu có đúng không. Lời giải. Gọi X là số tiền tiêu của mỗi người mua hàng ở siêu thị A. Theo giả thiết X có phân phối theo quy luật chuẩn   2 ;N a  , với 62 .  Ta kiểm định giả thiết 0 1 : 1 4 0 , : 1 4 0 ,H a H a  với mức ý nghĩa 0 , 0 5 .  Khi đó, tra bảng giá trị tới hạn chuẩn, ta được 0 , 0 2 5 2 1, 9 6 .u u    Do đó miền bác bỏ giả thiết 0 H là    W ; 1, 96 1, 96; .     Tiếp theo, ta có giá trị quan sát  1 5 4 1 4 0 5 0 1, 5 9 6 . 6 2 q s G    Nhận thấy 1, 5 9 6 W q s G    nên chấp nhận giả thiết 0 ,H tức là công bố của nhóm nghiên cứu là đúng. 3.1.2 Trường hợp 2 chưa biết và kích thước mẫu 3 0n  Trong trường hợp này ta dùng tiêu chuẩn như trên nhưng vì phương sai 2 chưa biết nên thay nó bởi phương sai mẫu   2 *2 1 1 . 1 n i i S X X n      Khi đó tiêu chuẩn kiểm định 0 * X a G n S   có phân phối theo quy luật chuẩn tắc  0;1 .N Chú ý. Để thuận lợi cho tính toán phương sai mẫu ta dùng công thức *2 2 , 1 n S S n   với 2 2 2 1 1 . n i i S X X n    Ví dụ 2. Để xác định giá trung bình đối với một loại hàng hóa trên thị trường, người ta điều tra ngẫu nhiên tại 100 cửa hàng và thu được số liệu sau Giá (triệu đồng) 83 85 87 89 91 93 95 97 99 101 Số cửa hàng 6 7 12 15 30 10 8 6 4 2 Giả sử giá của một loại hàng hóa trên là biến ngẫu nhiên có phân phối theo quy luật chuẩn. Với mức ý nghĩa 0 , 0 5 hãy kiểm định giả thiết “Giá trung bình của loại hàng đó trên thị trường là trên 91 triệu đồng”. Lời giải. Giả sử X là giá của một loại hàng hóa trên thị trường, theo giả thiết X có phân phối theo quy luật chuẩn 2, ,N a với 2 chưa biết. Ta kiểm định giả thiết 0 1 : 9 1, : 9 1,H a H a  với mức ý nghĩa 0 , 0 5 .  Khi đó, tra bảng giá trị tới hạn chuẩn, ta được 0 , 0 5 1, 6 5 .u  Do đó miền bác bỏ giả thiết 0 H là  W 1, 65; .   Tính giá trị trung bình mẫu 1 9 0 7 2 [6 .8 3 7 .8 5 1 2 .8 7 1 5 .8 9 3 0 .9 1 ... 2 .1 0 1] 9 0 , 7 2 1 0 0 1 0 0 X          78 và   2 2 2 2 2 2 2 21 6 .8 3 7 .8 5 1 2 .8 7 1 5 .8 9 3 0 .9 1 ... 2 .1 0 1 9 0 , 7 2 1 7 , 2 . 1 0 0 S          Khi đó * 2 *1 0 0 .1 7 , 2 1 7 , 3 7 4 ,1 7 . 9 9 S S    Giá trị quan sát 0 * 9 0 , 7 2 9 1 1 0 0 0 , 6 7 1 . 4 ,1 7 q s X a G n S       Nhận thấy 0 , 6 7 1 W q s G     nên chấp nhận giả thiết 0 ,H tức là giá hàng hóa trung bình loại mặt hàng này là 91 triệu đồng ở mức 0 , 0 5 .  Chú ý. Trường hợp 2 chưa biết và kích thước mẫu 3 0n  ta sử dụng quy luật phân phối Student để xây dựng tiêu chuẩn kiểm định. 3.2. Kiểm định giả thiết về hai giá trị trung bình Giả sử mẫu ngẫu nhiên  1 2, , ..., nX X X được lập từ biến ngẫu nhiên X có phân phối theo quy luật chuẩn   2 1 1 ;N a  và mẫu ngẫu nhiên  1 2, , ..., mY Y Y được lập từ biến ngẫu nhiên Y có phân phối theo quy luật chuẩn   2 2 2 ;N a  . Với mức ý nghĩa  cho trước ta kiểm định giả thiết 0 :H 1 2 .a a Ta xét các trường hợp sau. 3.2.1. Trường hợp 2 2 1 2 ,  đã biết Trung bình mẫu 1 1 n i i X X n    có kỳ vọng     1 1 1 1 1 n n i i i i E X E X E X a n n            và phương sai     2 1 2 1 1 1 1 . n n i i i i D X D X D X n n n              Trung bình mẫu 1 1 m i i Y Y m    có kỳ vọng     2 1 1 1 1 m m i i i i E Y E Y E Y a m m            và phương sai     2 2 2 1 1 1 1 . m m i i i i D Y D Y D Y m m m              Do đó biến ngẫu nhiên  X Y có kỳ vọng   1 2E X Y a a   và phương sai   2 2 1 2 .D X Y n m      79 Như vậy biến ngẫu nhiên   2 2 1 2 1 2 , .X Y N a a n m          Khi đó chọn tiêu chuẩn kiểm định  1 2 2 2 1 2 X Y a a G n m        và G có phân phối theo quy luật chuẩn tắc  0;1 .N Nếu giả thiết 0 H đúng thì 2 2 1 2 X Y G n m      có phân phối theo quy luật chuẩn tắc  0;1 .N Xét các cặp giả thiết sau. 0 1 2 1 1 2 i ) : , :H a a H a a  Với mức ý nghĩa  cho trước miền bác bỏ hai phía giả thiết 0H là 2 2 W ; ; .u u                   0 1 2 1 1 2 i i ) : , :H a a H a a  Với mức ý nghĩa  miền bác bỏ một phía giả thiết 0 H là  W ; .u   0 1 2 1 1 2 i i i ) : , :H a a H a a  Với mức ý nghĩa  miền bác bỏ một phía giả thiết 0 H là  W ; .u    3.2.2. Trường hợp 2 2 1 2 ,  chưa biết và kích thước mẫu 3 0 , 3 0n m  Trong trường hợp này ta cũng sử dụng phân phối theo quy luật chuẩn để xây dựng tiêu chuẩn kiểm định. Các kết quả tương tự như mục 3.2.1 nhưng ta thay 2 1  bởi   *2 2 1 1 1 1 n i i S X X n      và 2 2  bởi   *2 2 2 1 1 . 1 m i i S Y Y m      Khi đó tiêu chuẩn kiểm định  1 2 * 2 * 2 1 2 . X Y a a G S S n m      Nếu giả thiết 0 H đúng thì * 2 * 2 1 2 X Y G S S n m    có phân phối theo quy luật chuẩn tắc  0;1 .N Ví dụ 3. Một trại chăn nuôi chọn một giống gà để tiến hành nghiên cứu hiệu quả của hai loại thức ăn A và B. Sau một thời gian nuôi thử nghiệm người ta cảm thấy thức ăn A hiệu quả hơn thức ăn B đối với giống gà này. Giả sử trọng lượng của gà là một biến ngẫu nhiên có phân phối theo quy luật chuẩn. Người ta lấy 50 con gà nuôi bằng thức ăn A thấy trọng lượng trung bình của mỗi con là 2,2 kg, độ lệch chuẩn mẫu là 1,25 kg và 40 con gà nuôi bằng thức ăn B thấy trọng lượng trung bình của mỗi con là 1,2 kg, độ lệch chuẩn mẫu là 1,02 kg. Với mức ý nghĩa 0,01 điều cảm nhận của người chăn nuôi có đúng không. Lời giải. Gọi 1 2 ,a a tương ứng là trọng lượng trung bình của mỗi con gà nuôi bằng thức ăn A, thức ăn B. Ta kiểm định giả thiết 0 1 2 1 1 2 : , : ,H a a H a a  với mức ý nghĩa 0 , 0 1 .  Khi đó, tra bảng giá trị tới hạn chuẩn, ta được 0 , 0 1 2 , 3 3 .u  Miền bác bỏ giả thiết 0 H là  W 2, 33; .   Ta có 80 * 1 2, 2; 1, 25; 50;X S n   * 2 1, 2; 1, 02; 40 .Y S m   Giá trị quan sát * 2 * 2 2 2 1 2 2 , 2 1, 2 4 ,1 7 9 . 1, 2 5 1, 0 2 5 0 4 0 q s X Y G S S n m       Ở đây 4 ,1 7 9 W q s G    nên bác bỏ giả thiết 0 ,H chấp nhận đối thiết 1 ,H tức là thức ăn A hiệu quả hơn thức ăn B với mức ý nghĩa 0,01 (điều cảm nhận của người chăn nuôi là đúng). Chú ý. Trường hợp 2 2 1 2 ,  chưa biết và kích thước mẫu 3 0 , 3 0n m  ta sử dụng quy luật phân phối Student để xây dựng tiêu chuẩn kiểm định. TÀI LIỆU THAM KHẢO [1] Tô Văn Ban (2010), Xác suất thống kê, Nxb Giáo dục Việt Nam. [2] Đào Hữu Hồ (2001), Xác suất thống kê, Nxb Đại học Quốc gia Hà Nội [3] Phạm văn Kiều (2008), Xác suất và thống kê, Nxb Giáo dục. [4] Trần Ngọc Phác (2006), Lý thuyết thống kê, Nxb Thống kê. [5] Nguyễn Cao Văn (2002), Lý thuyết xác suất và thống kê toán, Nxb Giáo dục. NORMAL DISTRIBUTION RULE AND APPLICATIONS TO STATISTICAL HYPOTHESIS TESTING ON AVERAGE VALUES Pham Thi Thai, Nguyen Xuan Vui Faculty of Mathematic, Physics and Informatics, Tay Bac University Abstract: Normal distribution is a common probability distribution rule which is widely used in daily life and in science. In fact, many random variables, many laws are normal distribution or approximately normal distribution. For example, the yield of a crop height and weight of adults, children's intelligence also follow the rules of a normal distribution. In science, the normal distribution ruleS have a lot of applications. One of which is applied to the problem of statistical hypothesis testing. In this paper, we study the application of the normal distribution in building inspection standard assumptions on the average value. Keywords: Random variable; Normal distribution; Statistical hypothesis testing; Density function; Distribution function; Expected Value; Variance; Canonical normal distribution.

Các file đính kèm theo tài liệu này:

5_0722_2136079.pdf