Tài liệu Bài giảng Khoa học Máy tính - 2. Nhắc lại kiến thức về xác suất thống kê: 1
Bài giảng 2 – Nhắc lại kiến thức về xác
suất thống kê
Nguyễn Phương Thái
BM Khoa học Máy tính
2
Nội dung bài giảng
- Không gian xác suất
- Xác suất có điều kiện và sự độc lập xác suất
- Định luật Bayes
- Biến ngẫu nhiên
- Kỳ vọng và phương sai
- Phân phối có điều kiện và phân phối phụ thuộc
- Ước lượng xác suất
- Các phân phối chuẩn
3
Không gian xác suất
- Lý thuyết xác suất có nhiệm vụ dự đoán cái gì đó sẽ xảy ra với khả năng
như thế nào
Ví dụ: gieo 3 đồng xu, khả năng xuất hiện cả ba mặt ngửa là thế nào?
- Phép thử: là một thí nghiệm hay quan sát nào đó
- Biến cố sơ cấp: kết quả đơn giản nhất của thí nghiệm
- Không gian mẫu: tập tất cả các biến cố sơ cấp
- Biến cố: tập con của không gian mẫu
4
Một số ví dụ
Gieo một đồng tiền xu một lần. Không gian các biến cố sơ cấp (không gian
mẫu) là Ω = {S, N}
Gieo một đồng tiền xu hai lần. Không gian mẫu là: Ω = {SS, SN, NS, NN}
Một đồng tiền được gieo liên tiếp cho tới khi lần đầu tiên ...
25 trang |
Chia sẻ: honghanh66 | Lượt xem: 1532 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Bài giảng Khoa học Máy tính - 2. Nhắc lại kiến thức về xác suất thống kê, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
1
Bài giảng 2 – Nhắc lại kiến thức về xác
suất thống kê
Nguyễn Phương Thái
BM Khoa học Máy tính
2
Nội dung bài giảng
- Không gian xác suất
- Xác suất có điều kiện và sự độc lập xác suất
- Định luật Bayes
- Biến ngẫu nhiên
- Kỳ vọng và phương sai
- Phân phối có điều kiện và phân phối phụ thuộc
- Ước lượng xác suất
- Các phân phối chuẩn
3
Không gian xác suất
- Lý thuyết xác suất có nhiệm vụ dự đoán cái gì đó sẽ xảy ra với khả năng
như thế nào
Ví dụ: gieo 3 đồng xu, khả năng xuất hiện cả ba mặt ngửa là thế nào?
- Phép thử: là một thí nghiệm hay quan sát nào đó
- Biến cố sơ cấp: kết quả đơn giản nhất của thí nghiệm
- Không gian mẫu: tập tất cả các biến cố sơ cấp
- Biến cố: tập con của không gian mẫu
4
Một số ví dụ
Gieo một đồng tiền xu một lần. Không gian các biến cố sơ cấp (không gian
mẫu) là Ω = {S, N}
Gieo một đồng tiền xu hai lần. Không gian mẫu là: Ω = {SS, SN, NS, NN}
Một đồng tiền được gieo liên tiếp cho tới khi lần đầu tiên xuất hiện mặt sấp
thì dừng lại. Không gian mẫu có dạng: Ω = {S, NS, ..., NNS, }
5
Không gian xác suất (tiếp)
- Số biến cố là 2n (giả sử số phần tử của Ω là n)
- Ω được gọi là biến cố chắc chắn, ᴓ được gọi là biến cố không
- Biến cố ܣ ∪ ܤ = {ݓ: ݓ ∈ ܣ hoặc ݓ ∈ ܤ} được gọi là hợp của A và B
- Biến cố ܣ ∩ ܤ = {ݓ: ݓ ∈ ܣ và ݓ ∈ ܤ} được gọi là giao của A và B. Biến cố
này còn được ký hiệu là AB
- Biến cố ܣ\ܤ = {ݓ: ݓ ∈ ܣ và ݓ ∉ ܤ} được gọi là hiệu của A và B
- Biến cố ̅ܣ = {ݓ: ݓ ∉ ܣ } được gọi là biến cố đối của A
6
Không gian xác suất (tiếp)
Theo ngôn ngữ xác suất, các điều trên có nghĩa là:
- ܣ ∪ ܤ xảy ra hoặc A hoặc B xảy ra
- ܣ ∩ ܤ xảy ra cả A và B cùng xảy ra
- ܣ\ܤ xảy ra A xảy ra và B không xảy ra
- ̅ܣ xảy ra A không xảy ra
7
Không gian xác suất (tiếp)
Ví dụ: Gieo một đồng tiền xu hai lần. Không gian mẫu là: Ω = {SS, SN, NS,
NN}. Xét:
A = {SS, SN, NS} (có ít nhất một lần xuất hiện mặt sấp)
B = {NS, SN, NN} (có ít nhất một lần xuất hiện mặt ngửa)
Ta có:
ܣ ∪ ܤ = Ω
AB = {SN, NS} (có đúng một lần xuất hiện mặt sấp)
̅ܣ = {ܰܰ}
A\B = {SS}
8
Xác suất của biến cố
Giả sử A là biến cố của phép thử nào đó:
- P(A), tồn tại khách quan, đo khả năng xuất hiện của A
Số này bằng 1 nếu A là biến cố chắc chắn, bằng 0 nếu A là biến cố không,
nếu A, B là hai biến cố xung khắc thì ܲ(ܣ ∪ ܤ) = ܲ(ܣ) + ܲ(ܤ)
- Giả sử Ω = {ݓଵ, ݓଶ, , ݓ , }, mỗi biến cố sơ cấp được gắn với một “trọng
số” = (ݓ) sao cho:
≥ 0 với mọi ݇ ≥ 1
= 1
- Khi đó:
ܲ(ܣ) =
{:௪ೖ∈}
9
Định nghĩa cổ điển của xác suất
Giả sử Ω = {w1, , wN} là không gian mẫu mà các kết quả có cùng khả năng
xuất hiện, nghĩa là: P(wi) = 1/N với mọi i. Khi đó theo công thức ở slide trên,
xác suất của biến cố A là:
ܲ(ܣ) =
|ܣ|
|Ω|
=
݊
ܰ
Định nghĩa này cho ta một mô hình toán rất tốt với các hiện tượng ngẫu nhiên
liên quan đến phép thử có tính đối xứng và đo đó các kết quả của nó được coi
là có cùng khả năng xuất hiện.
10
Một số tính chất của xác suất
ܲ(ᴓ) = 0, ܲ(Ω) = 1, 0 ≤ ܲ(ܣ) ≤ 1
ܲ(ܣ ∪ ܤ) = ܲ(ܣ) + ܲ(ܤ) − ܲ(ܣܤ)
Nếu A và B là các biến cố xung khắc thì ܲ(ܣ ∪ ܤ) = ܲ(ܣ) + ܲ(ܤ)
ܲ(̅ܣ) = 1 − ܲ(ܣ)
11
Ví dụ
Một cái hộp N quả cầu được đánh số bởi các số của tập hợp các số tự
nhiên từ 1 đến N. Rút lần lượt từng quả n lần, sao cho mỗi lần rút một quả,
quả đó được hoàn trả lại hộp rồi mới rút lần tiếp theo. Hãy tính xác suất của
biến cố:
A = {các quả đã được rút là đôi một khác nhau}
Không gian mẫu: Ω = {w = (a1, , an): 1 ≤ ܽ ≤ ܰ} với |Ω| = ܰ
|ܣ| = ܣே
= ܰ(ܰ − 1) (ܰ − ݊ + 1)
Do đó:
ܲ(ܣ) =
||
|ஐ|
=
ே(ேିଵ)(ேିାଵ)
ே
12
Xác suất có điều kiện
Xác suất có điều kiện của biến cố A với điều kiện B là một số xác định theo
công thức:
ܲ(ܣ|ܤ) =
ܲ(ܣܤ)
ܲ(ܤ)
nếu P(B)>0
Công thức nhân xác suất:
ܲ(ܣܤ) = ܲ(ܤ)ܲ(ܣ|ܤ) = ܲ(ܣ)ܲ(ܤ|ܣ) nếu P(A)P(B)≠0
Bằng qui nạp, bạn dễ dàng suy ra công thức nhân tổng quát.
13
Một số ví dụ
Ví dụ 1: Gieo một con xúc xắc cân đối và đồng chất hai lần. A là biến cố “lần
đầu gieo xuất hiện mặt 1 chấm”, B là biến cố “tổng số chấm trong hai lần gieo
không vượt quá 3”. Tính P(A|B).
Ta thấy Ω = {(݅, ݆): 1 ≤ ݅, ݆ ≤ 6}
A = {(1, 1), ,(1, 6)}, B = {(1, 1), (1, 2), (2, 1)}
P(A) = 6/36; P(B) = 3/36; P(AB) = 2/36
Nếu biết rằng B đã xảy ra thì A xảy ra khi một trong hai kết quả (1, 1) và (1, 2)
xảy ra. Do đó:
ܲ(ܣ|ܤ) =
2
3
=
2
36
3
36
14
Một số ví dụ (tiếp)
Ví dụ 2: Từ một hộp chứa a quả cầu trắng và b quả cầu đen, người ta rút
ngẫu nhiên không hoàn lại từng quả một hai lần. Tính xác suất để lần thứ hai
mới rút được quả cầu trắng.
Ký hiệu Ak là biến cố “lần thứ k rút được quả trắng”, k = 1, 2, Theo công
thức nhân xác suất ta có xác suất cần tìm là:
ܲ(̅ܣଵܣଶ) = ܲ(̅ܣଵ)ܲ(ܣଶ|̅ܣଵ) =
ܾ
ܽ + ܾ
×
ܽ
ܽ + ܾ − 1
15
Công thức Bayes
ܲ(ܤ|ܣ) =
ܲ(ܤܣ)
ܲ(ܣ)
=
ܲ(ܣ|ܤ)ܲ(ܤ)
ܲ(ܣ)
Giả sử ܲ(ܣ) > 0 và {B1, B2, , Bn} là hệ đầy đủ các biến cố với ܲ(ܤ) >
0 với mọi i. Khi đó ta có:
ܲ(ܤ|ܣ) =
ܲ(ܤ)ܲ(ܣ|ܤ)
ܲ(ܣ)
=
ܲ(ܤ)ܲ(ܣ|ܤ)
∑ ܲ(ܤ)ܲ(ܣ|ܤ)
ୀଵ
Ví dụ: Từ một hộp chứa a quả cầu trắng và b quả cầu đen, người ta rút
ngẫu nhiên không hoàn lại từng quả một hai lần. Hãy tính xác suất để lần
đầu rút được quả trắng biết rằng lần thứ hai cũng rút được quả trắng.
16
Công thức Bayes (tiếp)
Ký hiệu Ak là biến cố “lần thứ k rút được quả trắng”, k = 1, 2,
Theo đề bài ta cần tính P(A1|A2). Theo công thức Bayes ta có:
ܲ(ܣଵ|ܣଶ) =
ܲ(ܣଵ)ܲ(ܣଶ|ܣଵ)
ܲ(ܣଶ)
=
ܽ(ܽ − 1)
ܽ(ܽ − 1) + ܾܽ
17
Sự độc lập của hai biến cố
Hai biến cố A và B được gọi là độc lập nếu
ܲ(ܣܤ) = ܲ(ܣ)ܲ(ܤ)
Nếu ܲ(ܤ) > 0 thì dễ thấy A và B độc lập khi và chỉ khi
ܲ(ܣ|ܤ) = ܲ(ܣ)
18
Biến ngẫu nhiên
- Biến ngẫu nhiên là hàm ܺ: Ω → ܴ (thường n=1)
- Hàm mật độ xác suất (pmf): p(x) = p(X=x) = P(Ax) trong đó
ܣ = {ݓ ∈ Ω: ܺ(ݓ) = ݔ}
- Với biến ngẫu nhiên rời rạc ta có: ∑ (ݔ) = ∑ ܲ൫ܣ௫൯ =
ܲ(Ω) = 1
19
Kỳ vọng và phương sai
Kỳ vọng là giá trị trung bình của biến ngẫu nhiên. Giả sử X là
biến ngẫu nhiên với pmf là p(x) mà ∑ |ݔ|(ݔ)௫ < ∞ thì kỳ vọng
là:
ܧ(ܺ) = ݔ(ݔ)
௫
Phương sai của biến ngẫu nhiên là một số không âm dùng để
đo mức độ phân tán (tản mát) của các giá trị của biến ngẫu
nhiên xung quanh giá trị trung bình của nó.
ܸܽݎ(ܺ) = ܧ ቀ൫ܺ − ܧ(ܺ)൯
ଶ
ቁ = ܧ(ܺଶ − ܧଶ(ܺ))
20
Ví dụ
Gieo một con xúc xắc và giả sử Y là giá trị thu được, khi đó:
ܧ(ܻ) = ݕ(ݕ)
ୀଵ
=
1
6
ݕ
ୀଵ
=
21
6
= 3
1
2
ܸܽݎ(ܻ) = ܧ(ܻଶ) − ܧଶ(ܻ) =
91
6
−
49
4
=
35
12
Chú ý: Khi tính E(Y2) cần dùng ∑ ݅ଶୀଵ =
(ାଵ)(ଶାଵ)
21
Phân phối có điều kiện và phân phối phụ
thuộc
Hàm pmf phụ thuộc cho hai biến ngẫu nhiên rời rạc X, Y là:
p(x, y) = P(X = x, Y = y)
Hàm pmf điều kiện :
|(ݔ|ݕ) =
(ݔ, ݕ)
(ݕ)
với y mà (ݕ) > 0
Công thức nhân xác suất :
p(w, x, y, z) = p(w)p(x|w)p(y|w,x)p(z|w,x,y)
22
Phân phối nhị thức
- Tạo bởi dãy phép thử với chỉ hai biến cố sơ cấp, các phép
thử là độc lập
- Ví dụ : gieo đồng xu cân đối và đồng chất
- Họ phân phối nhị thức là :
ܾ(ݎ; ݊, ) = ܥ
(1 − )ି
Trong đó r là số lần thành công trong n lần thử.
- Phân phối nhị thức được dùng nhiều trong nghiên cứu, ví dụ
cho các mô hình n-gram, kiểm định giả thuyết thống kê, v.v.
- Tổng quát hóa của phân phối nhị thức là phân phối đa thức
23
Phân phối nhị thức (tiếp)
Hai đường cong b(r; 10, 0.7) và b(r; 10, 0.1)
24
Phân phối chuẩn
- Đây là một hàm phân phối liên tục có dạng :
݊(ݔ; ߤ, ߪ) =
1
√2ߨߪ
݁ି(௫ିఓ)
మ/(ଶఙమ)
Trong đó ߤ là giá trị trung bình và ߪ là độ lệch chuẩn
- Các ứng dụng : mô hình hóa chiều cao hay chỉ số IQ của
người, các mô hình học máy, thống kê, v.v.
- Tên khác: Gaussians
25
Phân phối chuẩn (tiếp)
Hai đường cong n(x; 0, 1) và n(x; 1.5, 2)
Chú ý: trong thống kê, nhiều khi phân phối nhị thức (rời rạc) được xấp xỉ bằng
phân phối chuẩn (liên tục) – bạn hãy để ý sự tương tự của các đường cong
trong hai hình ví dụ.
Các file đính kèm theo tài liệu này:
- bai_giang_2_2336.pdf