Mời các bạn cùng tham khảo nội dung bài giảng Bài 4: Phương pháp tính các tham số đặc trưng của mẫu sau đây để tìm hiểu về trường hợp số liệu của mẫu cho dưới dạng gồm đủ n giá trị quan sát, trường hợp số liệu của mẫu cho dưới dạng có tấn số ni (nói chung ni > 1).
Tóm tắt lý thuyết
Giả sử có mẫu cụ thể WX = (X1, X2,. . . ,Xn), thì trung bình mẫu \(\overline X \) và phương sai mẫu (s2) là hai giá trị cơ bản nhất đối với mẫu cụ thể này, s có thể suy ra từ s2; còn f thì tính rất đơn giản. Do đó phần này chúng ta chỉ nêu ra công thức tính \(\overline x \) và s2 tương ứng với từng trường hợp số liệu hiện có như sau:
1. Trường hợp số liệu của mẫu cho dưới dạng gồm đủ n giá trị quan sát
Trường hợp này, để tính \(\overline x \) ta sử dụng công thức định nghĩa:
\(\overline x = \frac{1}{n}\sum\limits_{i = 1}^n {{x_i}} \)
Để tính s2 ta dùng công thức:
\({s^2} = \frac{1}{{n - 1}}\left[ {\sum\limits_{i = 1}^n {x_i^2 - n{{\left( {\overline x } \right)}^2}} } \right]\)
Chứng minh:
Theo công thức định nghĩa của S2 ta có:
\({s^2} = \frac{1}{{n - 1}}\sum\limits_{i = 1}^n {{{\left( {{x_i} - \overline x } \right)}^2}} \)
Ta có:
\({\left( {{x_i} - \overline x } \right)^2} = {\left( {{x_i}} \right)^2} - 2{x_i}\overline x + {\left( {\overline x } \right)^2}\)
Vậy:
\(\sum\limits_{i = 1}^n {{{\left( {{x_i} - \overline x } \right)}^2}} = \sum\limits_{i = 1}^n {\left[ {{{\left( {{x_i}} \right)}^2} - 2\overline x .{x_i} + {{\left( {\overline x } \right)}^2}} \right]} \)
\(= \sum\limits_{i = 1}^n {x_i^2 - 2\overline x .{x_i} + n.{{\left( {\overline x } \right)}^2}} = \sum\limits_{i = 1}^n {x_i^2 - n} .{\left( {\overline x } \right)^2}\)
Suy ra:
\({S^2} = \frac{1}{{n - 1}}\left[ {\sum\limits_{i = 1}^n {x_i^2 - n{{\left( {\overline x } \right)}^2}} } \right]\)
Thí dụ 3: Quan sát điểm thi môn Toán cao cấp của 10 sinh viên được chọn ngẫu nhiên từ một lớp ta thu được các số liệu sau:
5; 6; 7; 4; 6; 9; 4; 5; 5; 7
Tính \(\overline x \) và s của mẫu này.
Giải
Ta có: \(\sum\limits_{i = 1}^{10} {{x_i}} = 58\) vậy: \(\overline x = \frac{{58}}{{10}} = 5,8\)
\(\sum\limits_{i = 1}^{10} {x_i^2} = 358\) vậy: \({s^2} = \frac{1}{9}\left[ {358 - 10.{{(5,8)}^2}} \right] = 2,4\)
\( \Rightarrow s = \sqrt {{s^2}} = \sqrt {2,4} = 1,549193\)
Chú ý:
Để tính \(\overline x \) ta có thể dùng hàm AVERAGE trong Excel: \(\overline x = AVERAGE\left\{ {{x_i}} \right\}\)
Để tính s2 ta có thể dùng hàm VAR trong Excel: s2 =VAR{Xi}
Để tính s ta có thể dùng hàm STDEV trong Excel: s = STDEV{Xi}
Cách thức thực hiện các lệnh này cũng tương tự như lệnh AVERAGE (xem phụ lục 1).
Thí dụ 4: Có các số liệu về doanh số bán (Y) và chi phí chào hàng (X) của 12 công ty thương mại tư nhân cho ỏ bảng dưới đây. Hãy tính trung bình mẫu và độ lệch chuẩn mẫu của X và Y.
Doanh số bán (yi) triệu đ/năm | Chi phí chào hàng (xi) triệu đ/năm | Doanh số bán (yi) triệu đ/năm | Chi phí chào hàng (xi) triệu đ/năm |
1270 1490 1060 1626 1020 1800 | 100 106 60 160 70 170 | 1610 1280 1390 1440 1590 1380 | 140 120 116 120 140 150 |
Tính trung bình mẫu và độ lệch chuẩn mẫu của X và Y.
Từ các số liệu cho ở bảng trên, ta tính được:
\(\sum\limits_{i = 1}^{12} {{x_i}} = 1452\) Vậy: \(\overline x = \frac{{1452}}{{12}} = 121\)
\(\sum\limits_{i = 1}^{12} {{y_i}} = 16956\) Vậy: \(\overline y = \frac{{16956}}{{12}} = 1413\)
\(\sum\limits_{i = 1}^n {x_i^2} = 188192\). Vậy: \(s_X^2 = \frac{1}{{11}}\left[ {188192 - 12{{(121)}^2}} \right] = 1136,363636\)
\( \Rightarrow {s_X} = \sqrt {1136,363636} = 33,71\)
\(\sum\limits_{i = 1}^n {y_i^2} = 24549576\). Vậy: \(s_Y^2 = \frac{1}{{11}}\left[ {24549576 - 12{{(1413)}^2}} \right] = 53704,36364\)
\(\Rightarrow {s_Y} = \sqrt {53704,36364} = 231,742\)
2. Trường hợp số liệu của mẫu cho dưới dạng có tấn số ni (nói chung ni > 1).
Trường hợp này, để tính \(\overline x \) và s2 ta áp dụng công thức:
\(\overline x = \frac{1}{n}\sum\limits_{i = 1}^k {{n_i}{x_i}} \)
\({s^2} = \frac{1}{{n - 1}}\left[ {\sum\limits_{i = 1}^k {{n_i}x_i^2 - n{{\left( {\overline x } \right)}^2}} } \right]\)
Chú ý: \(\sum\limits_{k = 1}^k {{n_i}} {x_i}\) trong công thức (6.30) cũng chính là \(\sum\limits_{i = 1}^n {x_i}\) trong công thức (6.27); Tương tự \(\sum\limits_{k = 1}^k {{n_i}} {x_i^2}\) trong công thức (6.31) cũng chính là \(\sum\limits_{k = 1}^n {x_i^2}\) trong công thức (6.28).
Với các số liệu cho ở thí dụ 3, ta có thể trình bày số liệu quan sát của mẫu này dưới dạng có tần số như sau:
xi | 4 | 5 | 6 | 7 | 9 |
ni | 2 | 3 | 2 | 2 | 1 |
Từ số liệu ở bảng trên, ta tính được:
\(\sum\limits_{i = 1}^k {{n_i}} {x_i} = 58;\sum\limits_{i = 1}^k {{n_i}} x_i^2 = 358\)
So sánh với kết quả tính ở thí dụ 3 ta có thể minh chứng cho nhận xét nêu trên.
Thí dụ 5: Tính trung bình và phương sai của mẫu cho ở bảng sau:
xi | 4 | 5 | 7 | 9 |
ni | 10 | 15 | 13 | 12 |
Giải:
Từ số liệu của mẫu đã cho ta tính được: \(\sum\limits_i {{n_i}{x_i} = 314} \). Vậy: \(\overline x = \frac{{314}}{{50}} = 6,28\)
\(\sum\limits_i {{n_i}} x_i^2 = 2144\). Vậy: \({s^2} = \frac{1}{{49}}\left[ {2144 - 50.{{(6,28)}^2}} \right] = 3,5118\)
Thí dụ 6: Số liệu cho ở cột 1 và cột 3 của bảng dưới đây (bảng 6.33) là số liệu quan sát về lượng hàng bán được (kg/ngày) của một đại lý. Hãy tính trung bình mẫu và phương sai mẫu.
Lượng hàng bán được(kg/ngày) | Số ngày |
800-850 851-900 901-950 951-1000 1001-1050 1051-1100 1101-1150 1151-1200 1201-1300 | 9 12 24 36 25 20 16 10 8 |
Ta thay mỗi khoảng bằng giá trị trung tâm khoảng, từ đó ta có bảng sau: (bảng 6.34)
xi | ni |
825 875,5 925,5 975,5 1025,5 1075,5 1125,5 1175,5 1250,5 | 9 12 24 36 25 20 16 10 8 |
n = 160 |
Từ số liệu của bảng trên, ta tính được: \(\sum\limits_i {{n_i}} {x_i} = 162175,5\)
Vậy:
\(\overline x = \frac{{162175,5}}{{160}} = 1013,596875\)
\(\sum\limits_{i = 1}^n {{n_i}x_i^2} = 166159712,75\)
Vậy
\({s^2} = \frac{1}{{159}}\left[ {166159712,75 - 160.{{(1013,125)}^2}} \right] = 11189,51384\)