Bài tập xác suất hàm mật độ và phân bố năm 2024

(c) Tìm xác suất để khi tiến hành 3 phép thử độc lập có 2 lần X nhận giá trị trong khoảng (− 1; 1 ) .

Ví dụ 2.10. Biến ngẫu nhiên liên tục X có hàm mật độ xác suất là

(a) Tìm a. (b) Tìm hàm phân phối xác suất tương ứng.

(c) Tìm xác suất để X nhận giá trị trong khoảng (0, π/4)

Lời giải Ví dụ 2.10

2.3 Các tham số đặc trưng của biến ngẫu nhiên

Đặc trưng quan trọng nhất của biến ngẫu nhiên là phân phối xác suất của nó. Nhưng trong thực tế nhiều khi không xác định được hàm phân phối và không phải cứ nhất thiết phải biết hàm phân phối. Vì vậy nảy sinh vấn đề phải đặc trưng cho biến ngẫu nhiên bằng một hoặc nhiều số, mỗi số hạng đặc trưng phản ánh được các tính chất cơ bản nhất của biến ngẫu nhiên X. Trong mục này ta chỉ xét một vài tham số quan trọng nhất.

2.3.1 Kỳ vọng Định nghĩa 2.8 (Kỳ vọng). Kỳ vọng (expected value) của biến ngẫu nhiên X, ký hiệu là E ( X ) (hoặc µ X hoặc đơn giản là µ) được xác định như sau:

1. Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.2) thì

2. Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.3) thì

nếu chuỗi vế phải hội tụ.

3. Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f X ( x ) , x ∈ R thì

nếu tích phân vế phải hội tụ.

Nhận xét 2.5. 1. Kỳ vọng mang ý nghĩa là giá trị trung bình của biến ngẫu nhiên. Kỳ vọng là số xác định. Thật vậy, giả sử đối với biến ngẫu nhiên X, tiến hành n phép thử,

trong đó n 1 lần X nhận giá trị x 1 , n 2 lần X nhận giá trị x 2 , . . . , n k lần X nhận giá trị x k , n 1 + n 2 + · · · + n k = n. Giá trị trung bình của biến ngẫu nhiên X trong n phép thử này là

2. Khái niệm kỳ vọng được áp dụng rộng rãi trong nhiều lĩnh vực. Trong kinh doanh và quản lý, kỳ vọng được ứng dụng dưới dạng lợi nhuận kỳ vọng hay doanh số kỳ vọng. Ví dụ 2.11. Theo thống kê việc một người Mỹ 25 tuổi sẽ sống thêm trên một năm có xác suất là 0,992, còn xác suất để người đó chết trong vòng một năm tới là 0,008. Một chương trình bảo hiểm đề nghị người đó bảo hiểm sinh mạng cho 1 năm với số tiền chi trả 1000$, còn tiền đóng là 10$. Hỏi lợi nhuận trung bình của công ty bảo hiểm nhận được là bao nhiêu? Lời giải Ví dụ 2.11 Gọi X là lợi nhuận của công ty bảo hiểm nhận được. Khi đó X là biến ngẫu nhiên rời rạc có thể nhận giá trị -990, 10. Bảng phân phối xác suất của X là

Suy ra E ( X ) = − 990 × 0, 008 + 10 × 0, 992 = 2$. Ta thấy lợi nhuận trung bình bằng 2$ (một số dương) vì vậy công ty bảo hiểm có thể làm ăn có lãi.

Ví dụ 2.12. Kỳ vọng của biến ngẫu nhiên X trong Ví dụ 2.4 là µ X = E ( X ) = 0 × 99 / 100 + 700 × 1 / 100 = 7 nghìn VNĐ. Như vậy bỏ ra 10 nghìn VNĐ, trung bình thu được 7 nghìn VNĐ, người chơi về lâu dài sẽ lỗ 30% tổng số tiền chơi. Ví dụ 2.13. Xét trò chơi trả lời hai câu hỏi A và B; người chơi có quyền chọn câu hỏi nào để trả lời đầu tiên. Câu hỏi A được trả lời đúng với xác suất 0,8 và khi đó người chơi sẽ được thưởng 100 USD, câu hỏi B được trả lời đúng với xác suất 0,6 và người chơi được thưởng 200 USD. Nếu không trả lời đúng lần thứ nhất sẽ không được trả lời tiếp. Vậy người chơi nên chọn câu hỏi nào trả lời đầu tiên để tiền thưởng trung bình nhận được cao hơn. Lời giải Ví dụ 2.13 Gọi X là số tiền thưởng nhận được khi người chơi chọn câu hỏi A trả lời đầu tiên,

và E ( X ) = 0 × 0, 2 + 100 × 0, 32 + 300 × 0, 48 = 176 USD. Gọi Y là số tiền thưởng nhận được khi người chơi chọn câu hỏi B trả lời đầu tiên,

và E ( Y ) = 0 × 0, 4 + 200 × 0, 12 + 300 × 0, 48 = 168 USD. Vậy nên chọn câu hỏi A để trả lời đầu tiên để có khả năng nhận thưởng cao hơn.

Ví dụ 2.14. Theo thống kê ở một cửa hàng đậu tương, người ta thấy số lượng đậu tương bán ra X là một biến ngẫu nhiên rời rạc có bảng phân phối là:

Nếu giá nhập là 10000 VNĐ/kg thì cửa hàng sẽ lãi 5000 VNĐ/kg, nếu đến cuối ngày không bán được sẽ lỗ 8000 VNĐ/kg. (a) Tìm hàm phân phối xác suất của X. (b) Mỗi ngày cửa hàng nên nhập bao nhiêu kg để thu được lãi nhiều nhất. Lời giải Ví dụ 2.14

(a) Từ bảng phân phối xác suất ta có hàm phân phối xác suất

(b) Số lượng đậu tương nhập trong ngày theo các phương án 10, 13, 16, 19, 22. Gọi T i là "số tiền lời thu được ứng với phương án i", i = 1, 2, . . . , 5, trong đó phương án 1, 2, 3, 4, 5 tương ứng là nhập 10, 13, 16, 19, 22 (kg). (b1) Phương án nhập 10kg: chắc chắn cửa hàng sẽ bán hết vì P ( X < 10 ) = 0. Do đó E ( T 1 ) = 1 × 50000 = 50000 VNĐ. (b2) Phương án nhập 13kg: do không có thống kê số lượng bán 11, 12kg, nên xem như cửa hàng đó chỉ có 2 phương án hoặc bán 10kg, hoặc bán 13kg. Do chỉ nhập 13kg nên xem như số lượng bán trên 13kg là số lượng bán được 13kg. Suy ra E ( T 2 ) = 26000 × 0, 15 + 65000 × 0, 85 = 59150 VNĐ. (b3) Phương án nhập 16kg: số lượng bán ra có thể là 10, 13, 16 với xác suất tương ứng là 0,15; 0,2 và 0,65. Suy ra E ( T 3 ) = 2000 × 0, 15 + 41000 × 0, 2 + 80000 × 0, 65 = 60500 VNĐ.

(b4) Phương án nhập 19kg: số lượng bán ra có thể là 10, 13, 16, 19 với xác suất tương ứng là 0,15; 0,2; 0,35 và 0,3. Suy ra E ( T 4 ) = (− 22000 ) × 0, 15 + 17000 × 0, 2 + 56000 × 0, 35 + 95000 × 0, 3 = 48200 VNĐ. (b5) Phương án nhập 22kg: số lượng bán ra có thể là 10, 13, 16, 19, 22 với xác suất tương ứng là 0,15; 0,2; 0,35; 0,2 và 0,1. Suy ra E ( T 5 ) = (− 46000 ) × 0, 15 + (− 7000 ) × 0, 2 + 32000 × 0, 35 + 71000 × 0, 2 + 110000 × 0, 1 = 28100 VNĐ. Từ các kết quả trên, ta thấy E ( T 3 ) là cao nhất nên phương án nhập hiệu quả nhất là 16kg.

Chú ý 2.1. Nếu trong bảng phân phối xác suất mà giá trị nào của biến ngẫu nhiên X không được đề cập đến thì xem như xác suất tại đó bằng 0. Ví dụ 2.15. Một dây chuyền tự động khi hoạt động bình thường có thể sản xuất ra phế phẩm với xác suất p = 0, 001 và được điều chỉnh ngay lập tức khi phát hiện có phế phẩm. Tính số trung bình các sản phẩm được sản xuất giữa 2 lần điều chỉnh. Lời giải Ví dụ 2.15 Gọi X là số sản phẩm được sản xuất giữa hai lần điều chỉnh. Khi đó X là biến ngẫu nhiên rời rạc có thể nhận các giá trị 1, 2, . . . với xác suất tương ứng

Vậy

ở đây ta sử dụng tính chất của chuỗi lũy thừa và công thức tính tổng của cấp số nhân lùi vô hạn với x = 0, 999:

Ví dụ 2.16. Tuổi thọ của một loại côn trùng nào đó là một biến ngẫu nhiên (đơn vị là tháng) với hàm mật độ xác suất như sau:

Tìm tuổi thọ trung bình của loại côn trùng trên.

Lời giải Ví dụ 2.16 Vì f X ( x ) là hàm mật độ xác suất của biến ngẫu nhiên liên tục X nên theo Định lý 2.3(1),(3), k = 3/ 64 Sử dụng công thức (2.11), tuổi thọ trung bình của loại côn trùng trên là

Hàm của một biến ngẫu nhiên Bây giờ ta xét một biến ngẫu nhiên mới g ( X ) , phụ thuộc vào X; nghĩa là, mỗi giá trị của g ( X ) được xác định bởi giá trị của X. Chẳng hạn, g ( X ) có thể là X 2 hoặc 3X − 1 và giả sử X nhận giá trị 2, thì g ( X ) sẽ nhận giá trị g ( 2 ) .

Ví dụ 2.17. Cho X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất là

và g ( X ) = X 2 , thì g ( X ) nhận các giá trị 0, 1, 2 với

Từ đây, theo Định nghĩa 2.8(1) suy ra

Kết quả này được mở rộng trong định lý dưới đây cho cả biến ngẫu nhiên rời rạc và biến ngẫu nhiên liên tục.

Định lý 2.4. Cho X là một biến ngẫu nhiên và Y = g ( X ) là một hàm của X.

1. Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.2) thì

2. Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f X ( x ) thì

Ví dụ 2.18. Gọi X là số trang trong một bản fax. Một công ty điện thoại tính cước như sau: 10 xu cho trang thứ nhất, 9 xu cho trang thứ hai, . . . , 6 xu cho trang thứ năm. Những bản fax từ 6 đến 10 trang có phí là 50 xu (công ty không nhận những bản fax quá 10 trang). Gọi Y là chi phí phải trả cho một bản fax. (a) Xác định Y. (b) Tính E ( Y ) nếu X có phân phối là

Lời giải Ví dụ 2.18 (a) Y là một hàm của X xác định bởi

(b) Theo Định lý 2.4(1),

Ví dụ 2.19. Với biến ngẫu nhiên X trong Ví dụ 2.16, kỳ vọng của biến ngẫu nhiên Y = X 2 là

Sau đây là một số tính chất hữu ích giúp đơn giản hóa trong tính toán kỳ vọng của các biến ngẫu nhiên. Các tính chất này đúng cho cả biến ngẫu nhiên rời rạc và liên tục. Các chứng minh được đưa ra cho biến ngẫu nhiên liên tục.

Định lý 2.5. Nếu a và b là các hằng số thì E ( aX + b ) = aE ( X ) + b.

Chứng minh. Theo định nghĩa,

Hệ quả 2.1. 1. Nếu a = 0, E ( b ) = b. 2. Nếu b = 0, E ( aX ) = aE ( X ) . Định lý 2.6. Cho X là một biến ngẫu nhiên, h ( X ) , g ( X ) là các hàm của X. Khi đó,

2.3.2 Phương sai Giá trị kỳ vọng hay giá trị trung bình của một biến ngẫu nhiên X có tầm quan trọng đặc biệt trong thống kê vì nó phản ánh giá trị trung tâm của phân phối xác suất của biến ngẫu nhiên. Tuy nhiên, giá trị trung bình không đưa ra một mô tả đầy đủ về hình dạng của phân phối. Trong Hình 2.5, ta có biểu đồ của hai phân phối xác suất rời rạc có cùng giá trị trung bình, µ = 2, nhưng khác nhau đáng kể về độ biến thiên hoặc độ phân tán của các quan sát của chúng so với giá trị trung bình. Do đó cần xác định mức độ phân tán của các giá trị của biến ngẫu nhiên xung quanh giá trị trung bình của nó.

Công thức quan trọng nhất về tính biến thiên của biến ngẫu nhiên X có được bằng cách áp dụng Định lý 2.4 với g ( X ) = [ X − E ( X )] 2 . Đại lượng này được gọi là phương sai của biến ngẫu nhiên X hoặc phương sai của phân phối xác suất của X, ký hiệu là V ( X ) hoặc σ X 2 , hoặc đơn giản là σ 2 .

Định nghĩa 2.9 (Phương sai). Phương sai (variance) của biến ngẫu nhiên X được định nghĩa như sau:

Vì X − E ( X ) là một hàm của biến ngẫu nhiên X, nên từ Định nghĩa 2.9 và Định lý 2.4 ta nhận được các công thức sau đây: 1. Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.2) thì

2. Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.3) thì

nếu chuỗi vế phải hội tụ.

3. Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f X ( x ) , x ∈ R thì

nếu tích phân vế phải hội tụ.

Ví dụ 2.20. Cho X là biến ngẫu nhiên chỉ số lượng ô tô được sử dụng cho mục đích kinh doanh chính thức trong mỗi ngày làm việc. Phân phối xác suất của công ty A, xem Hình 2.5(a), là

và của công ty B, xem Hình 2.5(b), là

Chỉ ra rằng phương sai của phân phối xác suất của công ty B lớn hơn so với công ty A.

Lời giải Ví dụ 2.20 Từ số liệu của công ty A ta tính

E ( X A ) = ( 1 )( 0, 3 ) + ( 2 )( 0, 4 ) + ( 3 )( 0, 3 ) = 2, 0 và V ( X A ) = ( 1 − 2 ) 2 ( 0, 3 ) + ( 2 − 2 ) 2 ( 0, 4 ) + ( 3 − 2 ) 2 ( 0, 3 ) = 0, 6.

ới công ty B ta có E ( X B ) = ( 0 )( 0, 2 ) + ( 1 )( 0, 1 ) + ( 2 )( 0, 3 ) + ( 3 )( 0, 3 ) + ( 4 )( 0, 1 ) = 2, 0, và V ( X B ) = ( 0 − 2 ) 2 ( 0, 2 ) + ( 1 − 2 ) 2 ( 0, 1 ) + ( 2 − 2 ) 2 ( 0, 3 ) + ( 3 − 2 ) 2 ( 0, 3 ) + ( 4 − 2 ) 2 ( 0, 1 ) = 1, 6.

Công thức tương đương của (2.14) được cho trong định lý dưới đây.

Định lý 2.7.

Chứng minh. Giả sử X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.2),

vì theo định nghĩa

Đối với biến ngẫu nhiên liên tục ta chứng minh tương tự.

Hệ quả 2.2. 1. Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.2) thì

2. Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.3) thì

nếu các chuỗi vế phải hội tụ.

3. Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f X ( x ) , x ∈ R thì

nếu các tích phân vế phải hội tụ.

Ví dụ 2.21. Dùng Định lý 2.7 tính phương sai của biến ngẫu nhiên xét trong Ví dụ (2.11).

Lời giải Ví dụ 2.21

Điều này nói lên rằng mặc dù kinh doanh bảo hiểm có lãi nhưng rủi ro khá lớn. Ví dụ 2.22. Dùng Định lý 2.7 tính phương sai của biến ngẫu nhiên xét trong Ví dụ (2.16).

Lời giải Ví dụ 2.22 Từ kết quả của Ví dụ 2.16 và 2.19 suy ra

Chú ý 2.2. Phương sai của biến ngẫu nhiên là một giá trị xác định không âm. Nhận xét 2.6. 1. Phương sai chính là trung bình số học của bình phương các sai lệch giữa các giá trị có thể có của biến ngẫu nhiên so với giá trị trung bình của các giá trị đó. Nó phản ánh mức độ phân tán của các giá trị của biến ngẫu nhiên xung quanh giá trị trung tâm của nó là kỳ vọng. 2. Trong kỹ thuật phương sai đặc trưng cho mức độ phân tán của các chi tiết gia công hay sai số của thiết bị. Trong quản lý và kinh doanh thì phương sai đặc trưng cho mức độ rủi ro của các quyết định. Bây giờ ta sẽ mở rộng khái niệm về phương sai của biến ngẫu nhiên X cho biến ngẫu nhiên liên quan đến X, biến ngẫu nhiên g ( X ) .

Định lý 2.8. Cho X là một biến ngẫu nhiên và Y = g ( X ) là một hàm của X. 1. Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất (2.2) thì

2. Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f X ( x ) thì

Chứng minh. Sử dụng Định lý 2.4 và Định nghĩa 2.9 ta được điều cần chứng minh. Phương sai của biến ngẫu nhiên X có tính chất sau.

Định lý 2.9. Nếu a và b là các hằng số thì

1. V ( aX ) = a 2 V ( X ) . 2. V ( b ) = 0. Hoặc V ( aX + b ) = a 2 V ( X ) .

2.3.3 Độ lệch chuẩn Định nghĩa 2.10 (Độ lệch chuẩn). Độ lệch chuẩn (standard deviation) của biến ngẫu nhiên X, ký hiệu là σ ( X ) , được định nghĩa như sau:

2. Trong nhiều trường hợp ứng dụng, trung vị là đặc trưng vị trí tốt nhất, nhiều khi tốt hơn cả kỳ vọng, nhất là khi trong số liệu có những sai sót. Trung vị còn có tên là phân vị 50% của phân phối.