Hướng dẫn sử dụng stata pdf

Trong thời kì xu thế phát triển mạnh mẽ của kĩ thuật thống kê, việc sử dụng các công cụ (phần mềm) vào việc tính toán, phân tích dữ liệu và nghiên cứu khoa học, nghiệp vụ đang ngày càng trở lên phổ biến. Bên cạnh những phần mềm SPSS, EVIEWS, R, SAS... đã trở thành quen thuộc với đại đa số nhà nghiên cứu, thì một trong những công cụ được các chuyên gia đánh giá cao trong việc thống kê phân tích dữ liệu gần đây là phần mềm STATA.

Sau đây là file hướng dẫn sử dụng STATA mà Trung tâm Nghiên cứu Định lượng sưu tầm và giới thiệu tới các bạn quan tâm.

TÓM TẮT: Rút gọn thuộc tính là bài toán quan trọng trong bước tiền xử lý dữ liệu của quá trình khai phá dữ liệu và khám phá tri thức. Trong mấy năm gần đây, các nhà nghiên cứu đề xuất các phương pháp rút gọn thuộc tính trực tiếp trên bảng quyết định gốc theo tiếp cận tập thô mờ (Fuzzy Rough Set FRS) nhằm nâng cao độ chính xác mô hình phân lớp. Tuy nhiên, số lượng thuộc tính thu được theo tiếp cận FRS chưa tối ưu do ràng buộc giữa các đối tượng trong bảng quyết định chưa được xem xét đầy đủ. Trong bài báo này, chúng tôi đề xuất phương pháp rút gọn thuộc tính trực tiếp trên bảng quyết định gốc theo tiếp cận tập thô mờ trực cảm (Intuitionistic Fuzzy Rough Set IFRS) dựa trên các đề xuất mới về hàm thành viên và không thành viên. Kết quả thử nghiệm trên các bộ dữ liệu mẫu cho thấy, số lượng thuộc tính của tập rút gọn theo phương pháp đề xuất giảm đáng kể so với các phương pháp FRS và một số phương pháp IFRS khác.

Đặt vấn đề: Nhiều nghiên cứu cho thấy bệnh nhân đái tháo đường có nguy cơ mắc trầm cảm cao hơn so với những người không bệnh. Bên cạnh đó, trầm cảm thường kèm các rối loạn tâm thần khác như lo âu, làm tăng thêm gánh nặng bệnh tật. Mục tiêu nghiên cứu: Xác định tỷ lệ trầm cảm và tỷ lệ rối loạn lo âu ở bệnh nhân thuộc nhóm người cao tuổi mắc bệnh đái tháo đường típ 2 điều trị ngoại trú tại Bệnh viện Trường Đại học Y Dược Cần Thơ. Đối tượng và phương pháp nghiên cứu: Thiết kế nghiên cứu mô tả cắt ngang, trên bệnh nhân từ 60 tuổi trở lên được chẩn đoán xác định và điều trị ngoại trú ít nhất 3 tháng tại khoa Khám Bệnh viện Trường Đại học Y Dược Cần Thơ. Thu thập số liệu từ tháng 3/2022 đến 5/2022. Sử dụng bộ câu hỏi PHQ-9 và GAD- 7 để xác định các mức độ rối loạn trầm cảm, lo âu. Kết quả: Có 91 bệnh nhân tham gia nghiên cứu, trong đó nữ chiếm 64,8%. Đa số có trình độ học vấn tiểu học (33%), thuộc nhóm tuổi 60-70 (68,1%), đã kết hôn (63,7%) và sống chung cả gia đình (89%). Tỷ lệ bệnh nhân...

The objectives of this research is to examine the effectiveness of attentive relaxation to increase the concentration among students of Vocational High School. Attentive relaxation applied in this research is a relaxation technique with focus on the enhancement of visual sense sensitivity. This attentive relaxation program is based on Robert H.McKim’s theory with three basic phases, which are loosening up, letting go, and going to close. This research was an experiment which apply pre-test and post-test group design. The subject in this research were 60 Vocational High School students consist of 30 students in experimental group and 30 students in control group. This research conducted in Vocational High School Wachid Hasyim Surabaya. The experiment group was given the treatment of attentive relaxation, while the control group was left without treatment. Army alpha test was used to measure learning concentration. The army alpha test was administered to both experiment group and con...

Việc khảo sát, đánh giá về kiểu hình cũng như kiểu gen là cần thiết nhằm làm tăng hiệu quả cho quá trình nhận dạng, phát triển và chọn tạo giống mới đối với cây trồng. Nguồn gen thuộc một số dòng bơ đã qua chọn lọc để canh tác được thu thập từ một số nơi trong địa bàn tỉnh Lâm Đồng để phân tích đa dạng di truyền và nhận dạng giống. Đặc điểm sơ bộ về hình thái quả và năng suất của 11 dòng bơ tiềm năng đã được ghi nhận để hỗ trợ cho cơ sở dữ liệu nhận dạng dòng. Với đặc trưng nhận dạng DNA thu nhận được với 10 mồi ISSR, chúng tôi thu được tổng số 125 band điện di trên gel để tiến hành phân tích đa dạng di truyền tập hợp 11 mẫu khảo sát đại diện cho 11 dòng trên, kết quả cho thấy: tập hợp mẫu có mức dị hợp trông đợi (chỉ số đa dạng gene) đạt He = h = 0,3072, chỉ số Shannon đạt: I = 0,4608, tỷ lệ band đa hình: PPB = 91,84%. Cũng sử dụng 10 mồi ISSR như trên, từ đặc trưng nhận dạng DNA của 18 mẫu đại diện cho 6 dòng bơ tiềm năng (mỗi dòng 3 mẫu), dựa trên sự xuất hiện hay thiếu vắng các ...

Trong phần này, nhóm tác giả trình bày cụ thể và chi tiết hơn về FDI tại Việt Nam sau hơn ba thập kỷ dựa trên các tiêu chí bao gồm những sự kiện nổi bật, thực trạng và triển vọng.

  • 1. DỤNG STATA CƠ BẢN Huỳnh Ngọc Vân Anh ĐẠI HỌC Y DƯỢC TP. HỒ CHÍ MINH – KHOA Y TẾ CÔNG CỘNG Học phần: Thống kê y học Bộ môn Thống kê y học và Tin học 1
  • 2. học xong bài này, học viên có khả năng: 1. Nêu được các chức năng chính của phần mềm Stata. 2. Sử dụng được chức năng nhập số liệu trực tiếp bằng phần mềm Stata. 3. Thực hiện được các thao tác tạo biến số mới, tạo nhãn, dán nhãn. 4. Thực hiện được thống kê mô tả bằng các câu lệnh sum, tab1, bysort.
  • 3. về Stata
  • 4. mềm Stata: 4 Thanh tiêu đề Thanh menu Thanh công cụ Cửa sổ command (Cửa sổ lệnh) Cửa sổ review (Cửa sổ lưu trữ) Cửa sổ variable (Cửa sổ Biến số) Cửa sổ result (Cửa sổ kết quả)
  • 5. mềm Stata: 5 Thanh menu Thanh công cụ Thanh menu: File: Mở tập tin số liệu Data: Xóa biến số, tạo biến mới, hiệu chỉnh số liệu Graphics: Vẽ đồ thị Statistics: Thực hiện thống kê Window: Mở các cửa sổ của Stata Help: Trợ giúp khi sử dụng phần mềm Stata
  • 6. mềm Stata: 6 Thanh menu Thanh công cụ Thanh công cụ: 1. Open file: Mở tập tin 2. Save: Lưu tập tin 3. Print Results: In kết quả 4. Begin/close log: Bắt đầu/kết thúc ghi biên bản kết quả 5. Start Viewer: Bắt đầu sử dụng cửa sổ Viewer 6. Bring graph windows to Front: Đưa cửa sổ đồ họa ra trước 1 2 3 4 5 6 7 8 9 10 11
  • 7. mềm Stata: 7 Thanh menu Thanh công cụ Thanh công cụ: 7. Do-file Editor: Biên soạn tập tin chương trình 8. Data Editor: Biên tập số liệu (sửa chữa, thêm bớt số liệu) 9. Data Browser: Duyệt số liệu (xem nhưng không sửa chữa) 10. Clear – more – condition: xoá lệnh more để tiếp tục chương trình 11. Break: Ngưng tập tin chương trình 1 2 3 4 5 6 7 8 9 10 11
  • 8. mềm Stata: Có 2 cách sử dụng lệnh: 1. Con trỏ chuột với giao diện đồ họa (Graphic Interface) 2. Gõ lệnh trực tiếp vào cửa sổ lệnh VD: sum tuoi, tab1 gioi 8
  • 9. số: 9 Biểu thức: a x b Trong Stata: di a*b b a a2 a di a^2 di a/b di sqrt(a) a x b = c 1 Đúng Sai di a*b==c 0 1.Giới thiệu phần mềm Stata:
  • 10. và kết quả phân tích bằng Stata
  • 11. xem kết quả: 11 1 3 4 2 Chọn ổ đĩa để lưu tập tin log Đặt tên tập tin
  • 12. xem kết quả: 12 Thông báo cho biết biên bản kết quả phân tích sẽ được lưu lại tại tập tin “C:UsersADMINDesktopbaitap.smcl”
  • 13. xem kết quả: 13 Xem lại biên bản kết quả đã lưu Chấm dứt việc lưu kết quả
  • 14. tạo biến mới, tạo nhãn và dán nhãn bằng Stata
  • 15. số liệu dưới đây vào Stata: 15 stt ten gioi namsinh chieucao cannang hamax hamin 1 LHT Nu 1968 157 50 120 80 2 HVB Nam 1973 153 58 160 100 3 NKC Nu 1966 166 54 140 80 4 TVT Nam 1969 156 61 140 90 5 HTL Nam 1967 155 48 150 100 6 NTMT Nu 1965 150 61 120 70 7 DNH Nu 1967 152 54 120 80 8 TTT Nam 1969 154 55 120 60 9 DVD Nam 1958 156 54 130 80 10 TGK Nam 1973 154 41 100 70
  • 16. số liệu dưới đây vào Stata: 16
  • 17. biến số: 17 Đổi tên biến số
  • 18. biến số: 18 rename têncũ tênmới VD: rename var1 stt
  • 19. của biến số: 19 Tạo nhãn của biến số label variable tênbiến nhãnbiến VD: label variable gioitinh gioi_tinh
  • 20. giá trị: 20 Tạo nhãn giá trị 1
  • 21. giá trị: 21 2 3 4 5 6
  • 22. giá trị: 22 7 8 9 10
  • 23. giá trị: 23 11 Dán nhãn giá trị:
  • 24. giá trị: label define nhãn # “Nhãn 1” # “Nhãn 2” label define gioitinh 1 Nam 0 Nu Dán nhãn giá trị: label value biếnsố nhãn label value gioi gioitinh 24
  • 25. mới: Tạo biến số mới: 1. Tạo biến tuổi, biết rằng tuổi tính bằng cách lấy năm hiện tại (2017) – năm sinh (namsinh). 2. Tạo biến cao huyết áp, biết rằng cao huyết áp khi huyết áp tâm thu (hamax) ≥140 hoặc huyết áp tâm trương (hamin) ≥90. 3. Tạo biến béo phì, biết rằng béo phì khi chỉ số khối cơ thể (BMI) ≥23. 25
  • 26. mới: Tạo biến số mới: 26 1 2 3 4 5 6
  • 27. mới: Tạo biến số mới: 1. Tạo biến tuổi: gen biếnmới = điều kiện cho biến mới gen tuoi = 2017 - namsinh 2. Tạo biến cao huyết áp: gen cha = hamax >= 140 | hamin >=90 label define cokhong 1 Co 0 Khong label value cha cokhong 27
  • 28. mới: Tạo biến số mới: 3. Tạo biến béo phì: gen bmi = cannang/(chieucao/100)^2 gen beophi = bmi >=23 label value beophi cokhong 28
  • 29. mô tả bằng Stata
  • 30. tả: Hãy trả lời các câu hỏi sau: 1. Giá trị trung bình của tuổi, huyết áp tâm thu, huyết áp tâm trương, cân nặng, chiều cao, BMI là bao nhiêu? 2. Có bao nhiêu nam tham gia nghiên cứu? Bao nhiêu người bị cao huyết áp? Bao nhiêu người bị béo phì? 3. Chỉ số BMI trung bình ở những người cao huyết áp và không cao huyết áp là bao nhiêu? 4. Tỷ lệ cao huyết áp trong những người nữ là bao nhiêu? Tỷ lệ cao huyết áp trong những người nam là bao nhiêu? 30
  • 31. trung bình của tuổi, huyết áp tâm thu, huyết áp tâm trương, cân nặng, chiều cao, BMI là bao nhiêu? sum tuoi cannang chieucao hamax hamin bmi 31
  • 32. 4
  • 33.
  • 34. nhiêu nam tham gia nghiên cứu? Bao nhiêu người bị cao huyết áp? Bao nhiêu người bị béo phì? tab1 gioitinh cha beophi 34 Total 10 100.00 Co 5 50.00 100.00 Khong 5 50.00 50.00 beophi Freq. Percent Cum. -> tabulation of beophi Total 10 100.00 Co 4 40.00 100.00 Khong 6 60.00 60.00 cha Freq. Percent Cum. -> tabulation of cha Total 10 100.00 Nam 6 60.00 100.00 Nu 4 40.00 40.00 gioi_tinh Freq. Percent Cum. -> tabulation of gioitinh
  • 35.
  • 36.
  • 37. BMI trung bình ở những người cao huyết áp và không cao huyết áp là bao nhiêu? bysort cha : sum bmi 37 bmi 4 22.35455 2.970256 19.59646 25.06575 Variable Obs Mean Std. Dev. Min Max -> cha = Co bmi 6 22.23947 3.294348 17.28791 27.11111 Variable Obs Mean Std. Dev. Min Max -> cha = Khong . bysort cha: sum bmi
  • 38. 4
  • 39.
  • 40. cao huyết áp trong những người nữ là bao nhiêu? Tỷ lệ cao huyết áp trong những người nam là bao nhiêu? bysort gioi : tab1 cha 40 . Total 6 100.00 Co 3 50.00 100.00 Khong 3 50.00 50.00 cha Freq. Percent Cum. -> tabulation of cha -> gioitinh = Nam Total 4 100.00 Co 1 25.00 100.00 Khong 3 75.00 75.00 cha Freq. Percent Cum. -> tabulation of cha -> gioitinh = Nu
  • 41.
  • 42.
  • 43. LỆNH THỐNG KÊ MÔ TẢ BẰNG STATA
  • 44. kê mô tả trong Stata: − Mở tập tin số liệu: use “Ổ đĩa:Folder chứa datadata.dta”, clear use “C:DATAivf.dta”, clear − Log lưu trữ kết quả: log using “Ổ đĩa:Folder chứa filefile.doc”, text replace log using “C:DATAketqua.doc”, text replace − Tắt file log: log close 44
  • 45. kê mô tả trong Stata: − Đổi tên biến số: rename biếncũ biếnmới rename var2 gioitinh − Đổi nhãn biến số: label variabale biếnsố nhãnbiến label variabale gioitinh gioi_tinh − Tạo nhãn giá trị: label define nhãn # “nhãn 1” # “nhãn 2” label define gioi 1 Nam 0 Nu 45
  • 46. kê mô tả trong Stata: − Dán nhãn giá trị: label value biếnđịnhtính nhãn label value gioitinh gioi − Biến số định lượng: sum biếnđịnhlượng sum hamax hamin tuoi bmi − Biến số định tính: tab1 biếnđịnhtính tab1 gioitinh cha beophi 46
  • 47. kê mô tả trong Stata: − Thống kê phân tầng cho biến số định lượng: bysort biếnphântầng : sum biếnđịnhlượng bysort cha : sum bmi − Thống kê phân tầng cho biến số định tính: bysort biếnphântầng : tab1 biếnđịnhtính bysort cha : tab1 beophi 47

Chủ đề