Cách làm số lượng mẫu bao nhiêu là đủ
Một trong những quyết định khó khăn nhất người nghiên cứu phải đối mặt là mẫu cần lớn bao nhiêu. Hai cách tiếp cận phổ biến được sử dụng trong các nghiên cứu là: thực nghiệm và phân tích. Cách tiếp cận thực nghiệm liên quan đến việc sử dụng cỡ mẫu đã từng được dùng trong các nghiên cứu tương tự. Việc này không có cơ sở khoa học và chỉ thỏa nếu nghiên cứu trước đó có mức sai số trong khái quát hóa chấp nhận được và nghiên cứu hiện tại là rất giống về phạm vi (mục tiêu, thiết kế, dân số nghiên cứu, …). Phương pháp này không được khuyên dùng và sẽ không được thảo luận thêm. Cách tiếp cận phân tích (khoa học) để xác định cỡ mẫu phù hợp cần đưa vào nghiên cứu phụ thuộc vào việc đánh giá các sai lầm trong suy diễn và mức giảm thiểu “sai số chọn mẫu” mong muốn. Sai số chọn mẫu đo lường mức biến thiên giữa các kết quả mẫu (được coi là số đo gián tiếp cho tính chính xác với tình trạng thực tế của dân số và sự tái lập được của kết quả mẫu); các kết quả mẫu càng ít biến thiên, kết quả mẫu càng gần hơn với kết quả từ dân số. Do đó, yếu tố xác định chủ yếu của cỡ mẫu là mức chính xác cần thiết của kết quả là bao nhiêu. Điều này tùy vào mục đích của nghiên cứu (nghiên cứu mô tả để xác định một số đo tóm tắt về đặc tính hay một nghiên cứu phân tích mà các giả thuyết nhất định đang được kiểm định). Cỡ mẫu cho các nghiên cứu mô tảTrong các nghiên cứu mô tả, thường mục tiêu là ghi nhận một ước lượng về một tham số trong dân số. Ví dụ, trong các điều tra dư luận, các nhà nghiên cứu thị trường có thể quan tâm trong việc tìm ra tỷ lệ người thích một nhãn hiệu nhất định nào đó hơn. Một nhà dinh dưỡng sẽ có thể quan tâm về trung bình calo ăn vào hàng ngày của dân số. Một nhà nghiên cứu y tế có thể quan tâm về tỷ lệ người hút thuốc lá, hoặc trung vị thời gian sống sau khi trãi qua phẫu thuật mạch vành. Việc xác định cỡ mẫu cần thiết để trả lời các câu hỏi này tùy thuộc vào nhiều yếu tố:
Sự tính toán cỡ mẫu trong nghiên cứu mô tả do đó phụ thuộc vào hai tham số - độ rộng khoảng tin cậy và hệ số tin cậy. Nhiều chương trình máy tính để tính toán đã có sẵn (v.d. R có những gói dữ kiện cho phép tính toán cỡ mẫu). Hai trường hợp thường gặp là ước lượng tỷ lệ dân số và ước lượng trung bình dân số được minh họa sau đây:
Cỡ mẫu cho các nghiên cứu phân tíchDo mục đích cơ bản của nghiên cứu phân tích là đề kiểm định (một hoặc nhiều) giả thuyết không, việc xác định cỡ mẫu đòi hỏi việc xác định mức giới hạn của các sai lầm mà người nghiên cứu sẵn sàng để chấp nhận hoặc bác bỏ giả thuyết không (sai lầm loại I và loại II). Giống như trong các nghiên cứu mô tả, cần phải xác định số đo mẫu nào được dùng (tỷ lệ, trung bình mẫu, ước lượng RR hay OR, v.v.) và phân phối chọn mẫu của đo lường (trên cơ sở đó, một quyết định chấp nhận hoặc bác bỏ giả thuyết không được đưa ra). Bằng cách cân bằng hai loại sai lầm dựa vào phân phối chọn mẫu với những giới hạn định trước về những sai lầm này ta có thể tính được cỡ mẫu. Ví dụ, giả sử ta quyết định chấp nhận sai lầm loại I, hay α (xác suất cho một kết luận sai là hai tỷ lệ không bằng nhau trong dân số, trong khi thực sự là bằng nhau). Việc tính toán sai lầm loại II, hay β (xây dựng đưa ra một kết luận sai là hai tỷ lệ là bằng nhau trong khi thực sự là không bằng) tùy thuộc vào định nghĩa chính xác về “giả thuyết không là không đúng”. Cách đơn giản nhất để thực hiện việc này là định nghĩa một sự khác biệt tối thiểu (δ) giữa hai tỷ lệ mà ta coi là có ý nghĩa (sự khác biệt có ý nghĩa lâm sàng) và tính β theo giả thuyết này. Đương nhiên nếu sự khác biệt là lớn hơn δ, xác suất sai lầm loại II sẽ ít hơn. Các công thức tính cỡ mẫu bắt nguồn từ cách tiếp cận này đã được phát triển cho nhiều loại kiểm định thống kê. [Lưu ý: trong các kiểm định thống kê, việc thảo luận về sai lầm loại II có thể được nói tới dưới thuật ngữ “năng lực thống kê”, chính là 1 − β: cụ thể là có 5% sai lầm loại II là tương tự với một nghiên cứu có 95% “năng lực”.] Các trường hợp phổ biến được tóm tắt sau đây. (Tương tự như trước, các chương trình máy tính là có sẵn cho hầu hết các trường hợp này và việc tính toán được giới thiệu chỉ đơn giản để minh họa.)
So sánh nhiều hơn hai nhóm và các phương pháp đa biến Khi xem xét tính toán cỡ mẫu cho các nghiên cứu liên quan đến việc so sánh nhiều hơn hai nhóm, dù là so sánh tỷ lệ hay trung bình, rất nhiều vấn đề khác (v.d. so sánh nào là quan trọng hơn: liệu sai số của so sánh cặp hay của toàn nghiên cứu là quan trọng hơn, v.v.) cần được đưa vào xem xét. Công thức cho mỗi trường hợp tương ứng cũng sẽ được trở nên phức tạp hơn. Trong các phân tích đa biến, như những phân tích sử dụng hồi quy tuyến tính đa biến, hồi quy logistic hoặc so sánh các đường cong sống, các công thức đơn giản để tính toán cỡ mẫu là không có. Một số tác giả đã đề xuất sử dụng ước lượng cỡ mẫu sử dụng đồ thị toán học hoặc dùng các thử nghiệm mô phỏng trong các tạp chí thống kê, những vấn đề này sẽ không được trình bày trong tài liệu này. Khi lên kế hoạch cho một thử nghiệm, một bước quyết định là xác định cỡ mẫu nghiên cứu là bao nhiêu và điều này cần có những hướng dẫn từ những chuyên gia trong lĩnh vực. |