Tính cỡ mẫu thái Thanh Trúc


Mục tiêu khóa học

* Kiến thức:

1. Hiểu và trình bày được các bước cần tiến hành của một nghiên cứu khoa học.

2. Liệt kê và mô tả được các loại hình thiết kế nghiên cứu.

3. Trình bày được các phương pháp tính cỡ mẫu, chọn mẫu và thu thập dữ liệu.

4. Trình bày được các vấn đề y đức có thể có khi tiến hành nghiên cứu.

* Thái độ:

5. Nhận thức được vai trò quan trọng của các bằng chứng khoa học trong nghiên cứu.

6. Nhận thức được ý nghĩa của từng hoạt động trong nghiên cứu khoa học.

7. Tôn trọng các nguyên tắc đạo đức trong nghiên cứu khoa học.

* Kỹ năng:

8. Xác định được vấn đề cần nghiên cứu.

9. Tìm kiếm và quản lý được các tài liệu tham khảo trong nghiên cứu khoa học.

            10. Xác định được các phương pháp nghiên cứu phù hợp cho từng loại nghiên cứu, gồm thiết kế, chọn mẫu, cỡ mẫu, công cụ thu thập số liệu, biến số, thống kê.

            11. Xác định được nội dung cần có cho một đề cương nghiên cứu khoa học.

Nội dung khóa học

TT

Tên bài

Giảng viên

Số tiết

Tổng

LT

TH

1

Đại cương nghiên cứu khoa học.

Xác định vấn đề và mục tiêu nghiên cứu.

PGS. TS. Thái Thanh Trúc

4

3

1

2

Tổng quan tài liệu.

PGS. TS. Thái Thanh Trúc

4

3

1

3

Tìm kiếm và quản lý tài liệu tham khảo bằng Endnote.

TS. Đoàn Thị Ngọc Hân

4

0

4

4

Đối tượng nghiên cứu và phương pháp chọn mẫu.

Tính cỡ mẫu cho nghiên cứu.

PGS. TS. Thái Thanh Trúc

4

3

1

5

Các loại thiết kế nghiên cứu.

TS. Nguyễn Thị Minh Trang

4

3

1

6

Phương pháp thu thập số liệu.

Công cụ thu thập số liệu.

TS. Huỳnh Hồ Ngọc Quỳnh

4

3

1

7

Biến số trong nghiên cứu.

Các phương pháp phân tích số liệu.

TS. Đoàn Thị Ngọc Hân

4

3

1

8

Đạo đức trong nghiên cứu.

Phương pháp viết đề cương nghiên cứu.

PGS. TS. Thái Thanh Trúc

4

4

0

Tổng cộng

32

22

10

Danh sách giảng viên

 Giảng viên của khoa Y tế công cộng - Đại học Y Dược TP.  Hồ Chí Minh:

1. PGS. TS. Thái Thanh Trúc Phó trưởng Bộ môn Thống kê y học & Tin học.

2. TS. Nguyễn Thị Minh Trang  Giảng viên Bộ môn Thống kê y học & Tin học.

3. TS. Đoàn Thị Ngọc Hân     Giảng viên Bộ môn Thống kê y học & Tin học.

4. TS. Huỳnh Hồ Ngọc Quỳnh Giảng viên Bộ môn Tâm lý & Giáo dục sức khỏe.

Lịch khai giảng liên quan

Xem mẫu

  1. Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Phụ Bản Tập 22 * Số 1 * 2018 XÁC ĐỊNH CỠ MẪU TRONG NGHIÊN CỨU Y HỌC KHI KHÔNG CÓ CÔNG THỨC: PHƯƠNG PHÁP GIẢ LẬP Thái Thanh Trúc*, Bùi Thị Hy Hân** TÓM TẮT Mở đầu: Tính toán cỡ mẫu là một bước quan trọng trong xây dựng đề cương nghiên cứu khoa học. Từ nhu cầu ngày càng đa dạng các mục tiêu, cách triển khai nghiên cứu và sự thiếu hụt các công thức tính cỡ mẫu tương ứng thì việc tính toán cỡ mẫu dựa vào phương pháp giả lập trở nên hữu ích. Mục tiêu: Ứng dụng tính cỡ mẫu theo phương pháp giả lập và so sánh kết quả với các công thức hiện có. Đối tượng - Phương pháp nghiên cứu: Quy trình 5 bước để tính cỡ mẫu dựa vào giả lập số liệu được sử dụng với một số tình huống nghiên cứu, bao gồm so sánh hai trung bình, so sánh hai tỉ lệ và xây dựng mô hình hồi quy logistic. Tất cả thuật toán giả lập số liệu và phân tích thống kê được thực hiện bằng phần mềm Stata. Kết quả: Các lệnh Stata sử dụng để giả lập số liệu ngắn gọn. Kết quả tính cỡ mẫu chính xác và tương đồng so với công thức tính cỡ mẫu hiện có. Phương pháp này có thể áp dụng được để tính cỡ mẫu cho các trường hợp phức tạp như mô hình hồi quy logistic. Kết luận: Do không có đầy đủ công thức tính cỡ mẫu cho tất cả các tình huống nghiên cứu trong thực tế, việc tính cỡ mẫu dựa vào phương pháp giả lập số liệu cho thấy khả thi và chính xác. Tuy nhiên, việc triển khai phương pháp này đỏi hỏi kỹ thuật chuyên môn về toán thống kê, về lập trình cùng sự am hiểu phần mềm sử dụng tính cỡ mẫu mới đảm bảo được độ chính xác mong muốn. Từ khóa: cỡ mẫu, nghiên cứu y học, giả lập, công thức. ABSTRACT SAMPLE SIZE DETERMINATION IN MEDICAL RESEARCH WITHOUT FORMULA: SIMULATION APPROACH Thai Thanh Truc, Bui Thi Hy Han * Y Hoc TP. Ho Chi Minh * Supplement Vol. 22 - No 1- 2018: 347 - 353 Introduction: Sample size determination is an important step in designing a research protocol. Due to the need for various types of research objective and design as well as the lack of corresponding sample size calculation formula, sample size calculation using simulation becomes an useful approach. Objectives: To apply sample size calculation by simulation and to compare the results with existing formulas. Methods: We employed 5 steps in calculating sample size by data simulation for some research scenarios, including sample size to compare two means, sample size to compare two proportions and logistic regression. All algorithm for data simulation and data analysis were conducted using Stata. Results: Stata commands used to simulate data were brief. The results were precise and similar to those obtained from existing formulas. This approach can be used to calculate sample size for complex situations such as logistic regression. * Khoa YTCC, ĐH Y Dược TPHCM, ** Viện Y Tế Công Cộng TPHCM Tác giả liên lạc: TS. Thái Thanh Trúc ĐT: 0908381266 Email: 348 Chuyên Đề Y tế Công cộng – Khoa học Cơ bản
  2. Y Học TP. Hồ Chí Minh * Phụ Bản Tập 22 * Số 1 * 2018 Nghiên cứu Y học Conclusion: Due to the lack of sample size formula for all research scenarios in the real life, calculating sample size using data simulation has been showed as a practical and precise approach. However, this approach requires advanced knowledge about statistics, programming and the software used to ensure the calculation precision. Keywords: sample size, medical research, simulation, formula. GIỚI THIỆU mềm thống kê để có được cỡ mẫu đảm bảo độ chính xác và sức mạnh thống kê phù hợp(2, 9). Tính toán cỡ mẫu là một bước quan trọng Từ nhu cầu ngày càng đa dạng các mục trong xây dựng đề cương nghiên cứu khoa tiêu, cách triển khai nghiên cứu thì việc tính học. Ứng với mỗi mục tiêu nghiên cứu đặt ra, toán cỡ mẫu dựa vào phương pháp giả lập số nhà nghiên cứu tìm kiếm công thức tính cỡ liệu này càng trở nên hữu ích(7). Bài báo của mẫu và các tham số từ y văn để tính ra cỡ mẫu chúng tôi nhằm giới thiệu nguyên tắc, phương dự trù cần có cho nghiên cứu của mình(5). Ví pháp triển khai của kỹ thuật tính toán cỡ mẫu dụ, với mục tiêu ước tính tỉ lệ hiện mắc tăng này trong nghiên cứu. Tuy nhiên, để cụ thể huyết áp trong cộng đồng, nhà nghiên cứu có hóa và giúp so sánh được với các phương thể sử dụng công thức tính cỡ mẫu để ước tính pháp tính cỡ mẫu truyền thống, tức là khi có một tỉ lệ hiện mắc. Sau đó, dựa vào tỉ lệ tăng công thức, phạm vi bài báo này dừng ở các huyết áp tìm được trên y văn và sai số của ước tình huống về tính cỡ mẫu khi so sánh hai lượng kèm mức độ tin cậy của ước lượng sẽ trung bình và khi so sánh hai tỉ lệ. Bài báo tính được cỡ mẫu tương ứng(5,8). Tuy nhiên, cũng áp dụng tính cỡ mẫu cho tình huống không phải lúc nào nhà nghiên cứu cũng có phức tạp hơn là hồi quy logistic. công thức tính cỡ mẫu cho mục tiêu nghiên của mình, đặc biệt là các trường hợp nghiên PHƯƠNG PHÁP cứu phức tạp. Sức mạnh thống kê Khi không có công thức tính cỡ mẫu, nhiều Về mặt toán thống kê, sức mạnh thống kê, nhà nghiên cứu thường hay chọn cỡ mẫu dựa còn gọi là lực mẫu, được hiểu là xác suất bác theo kinh nghiệm hoặc các quy tắc lòng bàn bỏ H0 khi H0 sai(8). Về mặt nghiên cứu có thể tay mặc dù điều này có thể không hoàn toàn hiểu đơn giản hơn sức mạnh thống kê là xác chính xác(3, 8). Ví dụ, một số ít nhà nghiên cứu suất nghiên cứu kết luận có liên quan có ý cho rằng cỡ mẫu 30 đối tượng là đủ cho các nghĩa thống kê khi thật sự có liên quan vốn đã nghiên cứu lâm sàng. Mặc dù điều này giúp được báo cáo trên y văn. Ví dụ, sức mạnh tăng tính khả thi của nghiên cứu, nhưng độ thống kê bằng 80% có nghĩa là nếu tiến hành chính xác trong các tính toán hoặc phân tích 100 nghiên cứu thì sẽ có khoảng 80 nghiên cứu kiểm định thống kê khi đã thu thập xong dữ cho kết luận có liên quan. Ở đây, thông liệu lại không cao. Một khi cỡ mẫu không đủ thường ‘có liên quan’ được quy ước là khi giá chính xác, các phép kiểm định không đủ sức trị p của nghiên cứu nhỏ hơn 0,05. Cho nên, mạnh thống kê thì nghiên cứu có thể không có sức mạnh thống kê 80% cũng có nghĩa là có 80 giá trị và không thể ứng dụng trong thực tế. nghiên cứu cho kết quả giá trị p < 0,05 khi tiến Một trong các cách tiếp cận tính cỡ mẫu trong hành phân tích trên 100 mẫu nghiên cứu. Nếu trường hợp không có công thức là dựa vào giả khi phân tích trên 100 mẫu nghiên cứu mà có lập ngẫu nhiên dữ liệu ứng với thông tin của 60 nghiên cứu cho p < 0,05 thì sức mạnh thống các đặc điểm trong nghiên cứu và các kiểm kê tương ứng là 60%. Đây chính là cơ sở cho định, mô hình vốn có sẵn trên hầu hết phần các phương pháp giả lập số liệu để từ đó xác định cỡ mẫu phù hợp. Nguyên tắc triển khai Y tế Công cộng 349
  3. Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Phụ Bản Tập 22 * Số 1 * 2018 của phương pháp này là giả lập số liệu nhiều Bước 3: Thực hiện lại bước 1 và 2 nhiều lần lần và đếm tỉ lệ số lần có p
  4. Y Học TP. Hồ Chí Minh * Phụ Bản Tập 22 * Số 1 * 2018 Nghiên cứu Y học Bước 2: Thực hiện kiểm định t hai mẫu độc Sức mạnh thống kê lập để có được giá trị p Cỡ Tình huống 1: So mẫu sánh hai trung Tính huống 2: Tình huống 3: So sánh hai tỉ lệ Hồi quy logistic Bước 3: Thực hiện lại bước 1 và 2 trong bình 1000 lần ứng với 1000 mẫu ngẫu nhiên khác 550 0,766 0,964 0,926 nhau và tính tỉ lệ số lần có giá trị p < 0,05 trong 600 0,804 0,977 0,957 650 0,833 0,981 0,968 tổng số 1000 mẫu ngẫu nhiên. 700 0,847 0,990 0,980 Bước 4: Tăng cỡ mẫu n1 = n1 + 50 và n2 = n2 750 0,877 0,996 0,984 + 50 và lặp lại bước 1, 2, 3 với cỡ mẫu 150. Tiếp 800 0,893 0,996 0,982 tục tăng cỡ mẫu lên thành 200, 250, …, 850, 900 850 0,911 0,999 0,991 900 0,930 1,000 0,996 và tính sức mạnh thống kê tương ứng với từng cỡ mẫu. Kết quả từ bảng 2 cho thấy nếu sử dụng cỡ mẫu N = 100 cho nghiên cứu so sánh BMI ở Bước 5: Cỡ mẫu cần thiết cho nghiên cứu là ni thành thị và nông thôn ứng với các thông tin khi sức mạnh thống kê ứng với ni ≥ 80%. của dân số đã biết thì sức mạnh thống kê khi Bảng 1: Các lệnh giả lập dữ liệu để tính cỡ mẫu so thực hiện kiểm định so sánh là 0,196 (19,6%). sánh hai trung bình trong Stata Khi tăng cỡ mẫu lên thành N = 200 thì sức TT Lệnh Stata Giải thích mạnh thống kê đã có cải thiện và đạt mức 1 qui set seed 123 Khai báo mã ngẫu nhiên 0,281 (28,1%) nhưng vẫn còn quá thấp để triển 2 forvalues n = 100(50)900 { Mẫu n=100, 150…900 khai nghiên cứu. 3 local power = 0 Sức mạnh ban đầu 1 4 forvalues i = 1(1)1000 { Chạy 1000 lần bước 1,2 .9 5 quiet clear Xóa dữ liệu mỗi lần .8 6 quiet drawnorm thanhthi, Tạo mẫu ngẫu nhiên 1 Sức mạnh thống kê .7 mean(20.5) sd(4.2) n(`n') 7 quiet drawnorm nongthon, Tạo mẫu ngẫu nhiên 2 .6 mean(21.2) sd(4.5) n(`n') .5 8 quiet ttest thanhthi == Kiểm định t độc lập nongthon, unpaired .4 9 if r(p)< 0.05 local power = Đếm số lần p
  5. Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Phụ Bản Tập 22 * Số 1 * 2018 lên 700 thì sức mạnh thống kê chỉ tăng thêm thiện và vượt qua mức thường dùng là 80%. 0,043 (4,3%). Như vậy, nghiên cứu có thể triển khai với cỡ Với thông tin nghiên cứu như trên và áp mẫu N = 300 mỗi nhóm với kỳ vọng sức mạnh dụng công thức tính cỡ mẫu để so sánh hai trung thống kê sẽ vào mức 0,810 (81%). bình bằng công thức có sẵn sau đây thì cỡ mẫu Bảng 3: Các lệnh giả lập dữ liệu để tính cỡ mẫu so cần có ít nhất 607 mỗi nhóm với kỳ vọng sai lầm sánh hai tỉ lệ trong Stata loại 1 là 0,05 (5%), sai lầm loại hai là 0,20 (20%) và TT Lệnh Stata Giải thích sức mạnh thống kê là 0,80 (80%). 1 qui set seed 123 Khai báo mã ngẫu nhiên 2 forvalues n = 100(50)900 { Mẫu n=100, 150…900 3 local power = 0 Sức mạnh ban đầu Tình huống 2: cỡ mẫu so sánh hai tỉ lệ 4 forvalues i = 1(1)1000 { Chạy 1000 lần bước Nghiên cứu nhằm so sánh tỉ lệ biến chứng 1,2 5 quiet clear Xóa dữ liệu mỗi lần ở hai phương pháp điều trị. Dựa vào hồi cứu y 6 quiet set obs `n' Khai báo số quan sát văn, tỉ lệ biến chứng ở phương pháp truyền 7 quiet gen truyenthong = Tạo mẫu ngẫu nhiên thống là khoảng =30%. Nhà nghiên cứu runiform()
  6. Y Học TP. Hồ Chí Minh * Phụ Bản Tập 22 * Số 1 * 2018 Nghiên cứu Y học Tuổi thai, trong đó tuổi thai có phân phối bình N = 100 cho nghiên cứu thì sức mạnh thống kê thường với trung bình là 38,6 tuần và phương sai khi xây dựng mô hình hồi quy logistic chỉ ở là 0,36 [Tuổi Thai ~ N(38,6; 0,36)]. Các bước giả mức 0,311 (31,1%). Khi tăng cỡ mẫu lên thành lập dữ liệu để tính cỡ mẫu như sau: N = 350 thì sức mạnh thống kê đã cải thiện và Bước 1: Tạo mẫu ngẫu nhiên cho tuổi thai vượt qua mức thường dùng là 80%. Như vậy, với n = 100, trung bình là 38,6 và độ lệch chuẩn nghiên cứu có thể triển khai với cỡ mẫu N = là 0,6. Tạo mẫu ngẫu nhiên cho nhẹ cân dựa 350 với kỳ vọng sức mạnh thống kê sẽ vào vào phương trình hồi quy logistic trên y văn. mức 0,819 (81,9%). Bước 2: Thực hiện hồi quy logistic của nhẹ BÀN LUẬN cân theo tuổi thai để có được giá trị p của tuổi Mặc dù công thức tính cỡ mẫu có thể giúp thai nhà nghiên cứu ước tính được số lượng đối Bước 3: Thực hiện lại bước 1 và 2 trong tượng cần có cho nghiên cứu, nhưng nhiều 1000 lần ứng với 1000 mẫu ngẫu nhiên khác trường hợp nghiên cứu không có công thức nhau và tính tỉ lệ số lần có giá trị p < 0,05 trong tính cỡ mẫu tương ứng. Phương pháp tính cỡ tổng số 1000 mẫu ngẫu nhiên. mẫu dựa vào việc giả lập số liệu từ thông tin Bước 4: Tăng cỡ mẫu n = n + 50 và lặp lại đã biết về dân số để từ đó có thể áp dụng các bước 1, 2, 3 với cỡ mẫu 150. Tiếp tục tăng cỡ kiểm định hoặc mô hình thống kê phân tích mẫu lên thành 200, 250, …, 850, 900 và tính sức nhằm tính sức mạnh thống kê như đã trình mạnh thống kê tương ứng với từng cỡ mẫu. bày bên trên tỏ ra là một trong các phương Bước 5: Cỡ mẫu cần thiết cho nghiên cứu là pháp thay thế hiệu quả, chính xác. Điểm thuận ni khi sức mạnh thống kê ứng với ni ≥ 80%. lợi của phương pháp này là không cần công thức tính bởi vì nhà nghiên cứu có thể dùng Bảng 4: Các lệnh giả lập dữ liệu để tính cỡ mẫu cho các kiểm định và mô hình vốn đã có sẵn ở hầu hồi quy logistic trong Stata hết các phần mềm thống kê, ví dụ như Stata(9). TT Lệnh Stata Giải thích Với sự phát triển của toán thống kê cùng sự 1 qui set seed 123 Khai báo mã ngẫu nhiên trợ giúp của máy tính, các kiểm định thống kê 2 forvalues n = 100(50)900 { Mẫu n=100, và mô hình gần như đã có đủ cho tất cả các 150…900 loại dữ liệu, ví dụ kiểm định t để so sánh hai 3 local power = 0 Sức mạnh ban đầu 4 forvalues i = 1(1)1000 { Chạy 1000 lần trung bình, kiểm định ANOVA để so sánh bước 1,2 nhiều trung bình, hồi quy tuyến tính, hồi quy 5 quiet clear Xóa dữ liệu mỗi lần logistic(6, 8). Cho nên, phương pháp này có thể 6 quiet drawnorm tuoithai, Tạo mẫu ngẫu mean(38.6) sd(0.6) n(`n') nhiên được thực hiện cho hầu hết các loại dữ liệu 7 quiet gen nhecan = uniform() < Tạo mẫu ngẫu khác nhau, kể cả các mô hình phức tạp(9). Kết invlogit(32.3 - 0.9 * tuoithai) nhiên cho nhẹ cân quả kiểm chứng khi so sánh cỡ mẫu nếu dùng 8 quiet logit nhecan tuoithai Hồi quy logistic công thức sẵn có cho kết quả tương tự nhau. 9 quiet matrix define p = r(table) Lấy giá trị p ra 10 if p[4,1] < 0.05 local power = Đếm số lần p
  7. Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Phụ Bản Tập 22 * Số 1 * 2018 tính cỡ mẫu trên R. Thứ hai, việc giả lập số mềm sử dụng tính cỡ mẫu mới đảm bảo được liệu có thể gặp khó khăn nếu không có kiến độ chính xác mong muốn. Việc nghiên cứu các thức chuyên sâu về thống kê. Ví dụ, trong tình công thức tính cỡ mẫu tương ứng với sự đa huống 3, để tính được xác suất của nhẹ cân thì dạng trong thực tế nghiên cứu là cần thiết. cần áp dụng công thức của hồi quy logistic là r TÀI LIỆU THAM KHẢO = ea + bx / (1+ea + bx)(6,8). Trong Stata, việc tính toán 1. Baum CF (2009), An Introduction to Stata Programming, xác suất này được thực hiện thông qua hàm CRC Press Inc, pp.47-49. invlogit (dòng 7, Bảng 4)(1). Thứ ba, trong một 2. Bush S (2015), "Sample Size Determination for Logistic Regression: A Simulation Study". Communications in số trường hợp mô hình phức tạp thì việc Statistics - Simulation and Computation, 44 (2): 360-373. lượng giá có ý nghĩa thống kê hay không để từ 3. Harrell FE (2001), Regression modeling strategies: with applications to linear models, logistic regression, and đó tính sức mạnh thống kê có thể bị sai lệch survival analysis, Springer, New York, pp.230-234. do giá trị p không hẳn đã đánh giá chính xác 4. Hosmer DW, Lemeshow S, Sturdivant RX (2013), Applied độ phù hợp của mô hình mà còn phải dựa vào logistic regression, Wiley, Hoboken, New Jersey, pp.90-93. 5. Hulley SB (2013), Designing clinical research, Wolters các chỉ số đánh giá độ phù hợp mô hình khác(3, Kluwer/Lippincott Williams & Wilkins, Philadelphia, 4). Cuối cùng, với các mô hình phức tạp, cỡ pp.65-96. mẫu tính được theo phương pháp giả lập có 6. Kirkwood BR, Jonathan AC Sterne (2003), Essential medical statistics, Blackwell Science, Malden, Mass, thể không thuyết phục được nhiều nhà nghiên pp.189-192. cứu bởi chưa có công thức hoặc cách khác 7. Landau S, Stahl D (2013), "Sample size and power calculations for medical studies by simulation when nhằm kiểm chứng mức độ chính xác của cỡ closed form expressions are not available". Stat Methods mẫu tính được. Med Res, 22 (3): 324-45. 8. Rosner B (2011), Fundamentals of biostatistics, KẾT LUẬN Brooks/Cole, Cengage Learning, Boston, pp.427-431. 9. Vasishth S, Broe M (2011), The Foundations of Statistics: A Do không có đầy đủ công thức tính cỡ mẫu Simulation-based Approach, Springer Berlin Heidelberg, cho tất cả các tình huống nghiên cứu trong Berlin, Heidelberg, pp.81-96. thực tế, việc tính cỡ mẫu dựa vào phương pháp giả lập số liệu cho thấy khả thi và chính Ngày nhận bài báo: 02/11/2017 xác. Tuy nhiên, việc triển khai phương pháp Ngày phản biện nhận xét bài báo: 17/11/2017 Ngày bài báo được đăng: 15/03/2018 này đỏi hỏi kỹ thuật chuyên môn về toán thống kê, về lập trình cùng sự am hiểu phần 354 Chuyên Đề Y tế Công cộng – Khoa học Cơ bản

nguon tai.lieu . vn

Chủ đề