Cách lọc dữ liệu trong Stata

Trang https://phantichstata.com được nhóm MBA Đại Học Bách Khoa Tp.HCM lập ra, nghiên cứu các tài liệu tiếng Việt, tiếng Anh về STATA, quy trình, các thủ thuật xử lý dữ liệu bằng STATA khi làm luận văn. Ngoài ra nhóm còn có thể hỗ trợ thu thập/xử lý dữ liệu, chạy hồi quy, kiểm định trên STATA ra kết quả có ý nghĩa thống kê.

Liên hệ nhóm thạc sĩ Hỗ trợ SPSS.

SMS, Zalo, Viber:

Facebook facebook.com/hotroStata

Email

Sau đây là mục lục các bài viết:

  • Cách import số liệu nhập file excel vào stata
  • Chuyển dạng số liệu từ số liệu dài thành số liệu rộng, long->wide
  • Chuyển dạng số liệu từ số liệu rộng thành số liệu dài, wide->long trong Stata
  • Cách ghép nối file dữ liệu Stata bằng lệnh merge và append
  • Lệnh foreach để thực hiện các vòng lặp dữ liệu trên Stata
  • Thu gọn dữ liệu bằng lệnh collapse để tính trung bình, tổng, đếm số lượng các quan sát
  • Cách giữ và loại biến, giữ và loại quan sát bằng lệnh keep, drop, use if trong Stata
  • Sử dụng lệnh generate replace recode để tạo biến, mã hóa biến trong Stata
  • Gán nhãn label cho bộ số liệu Stata, cho biến, hoặc cho các giá trị bên trong biến
  • Các tham số biểu đồ thông dụng khi vẽ đồ thị với Stata
  • Cách vẽ biểu đồ phân tán twoway scatterplots, từ cơ bản đến nâng cao
  • Cách vẽ một số đồ thị cơ bản trong Stata: biểu đồ tròn, histograms, boxplots, scatterplots
  • Dữ liệu bị thiếu missing value trong Stata: định nghĩa, bản chất và cách xử lý
  • Cách sử dụng câu lệnh cú pháp syntax với Stata
  • Các ví dụ cơ bản về phép thống kê ở Stata
  • Sử dụng lệnh IF trong Stata để lọc dữ liệu theo một số điều kiện nào đó
  • Câu lệnh help và search để tìm kiếm trợ giúp trong Stata
  • Các lệnh phổ biến Stata để hiển thị thông tin mô tả và thống kê mô tả về file dữ liệu
  • Cách cài lệnh esttab
  • Sử dụng DO FILE để chạy các câu lệnh STATA
  • Kiểm định tính dừng unit root test trong stata bằng lệnh dfuller
  • Xử lý lỗi hiển thị dấu chấm . mà không hiển trị giá trị Wald chi2()= . Prob > chi2 = . khi phân tích Stata
  • Dữ liệu bảng bị lỗi unbalanced panel khi dùng lệnh xtset
  • Cách xuất copy kết quả stata ra word đẹp, không bị mất format
  • Đa cộng tuyến trong Stata: các dùng lệnh vif để phát hiện đa cộng tuyến
  • Cách chạy kiểm định Hausman để lựa chọn giữa mô hình tác động cố định FE và mô hình tác động ngẫu nhiên RE
  • Hệ số p value trong kiểm định thống kê với stata là gì?
  • Cách tạo biến giả dummy variable trong stata
  • Biến nội sinh, ngoại sinh : định nghĩa, ví dụ
  • Tải download miễn phí và cài đặt phần mềm Stata cho Mac OS,Macbook, Macbook Air, Macbook Pro
  • Mô hình tác động cố định Fixed effects và các kiểm định liên quan
  • Lệnh esttab để hiển thị bảng tóm tắt kết quả hồi quy
  • Cách cài đặt lệnh xtserial để kiểm tra tương quan chuỗi serial correlation
  • Cách cài đặt lệnh xttest3 để kiểm tra phương sai sai số thay đổi của mô hình FE
  • Tải phần mềm Stata 14 miễn phí, chạy không cần cài đặt
  • Hồi quy tobit, lý thuyết và thực hành, đọc kết quả
  • Kiểm định tự tương quan, tương quan chuỗi trong Stata
  • Phương sai của sai số thay đổi: định nghĩa, cách phát hiện, cách khắc phục bằng Stata
  • Hướng dẫn phân tích logistic regression hồi quy nhị phân trong Stata
  • Mô hình sai số chuẩn mạnh (Robust Standard errors) là gì, sử dụng ra sao
  • Dữ liệu bảng Panel Data là gì
  • Stata Hướng dẫn thực hành cách phân tích hồi quy tuyến tính đa biến
  • Stata Thực hành tính hệ số tương quan Pearson
  • Stata Tính giá trị trung bình cộng đại diện cho nhân tố
  • Cách phân tích nhân tố khám phá EFA bằng Stata (thực hành+đọc kết quả)
  • Cách phân tích độ tin cậy Cronbachs Alpha bằng phần mềm Stata
  • Cách tìm giá trị trung bình, lớn nhất, nhỏ nhất, độ lệch chuẩn trong Stata
  • Cách thực hiện thống kê tần số trong Stata
  • Cách cài đặt phần mềm Stata 13

Comments

Quản lý số liệu (Data management)

Cách lọc dữ liệu trong Stata
Lựa chọn trường hợp (Stata)
Cách lọc dữ liệu trong Stata
Cách lọc dữ liệu trong Stata
Trang chủ  >  Main menu  >  Quản lý, phân tích số liệu  >  Quản lý số liệu (Data management)  >  Xử lý số liệu  >  Lựa chọn trường hợp (select cases)  >  Lựa chọn trường hợp (Stata)

Đôi khi trong một bộ số liệu lớn đôi khi chúng ta có thể chỉ muốn xem xét đặc điểm của một nhóm đối tượng nào đó chứ không phải là tất cả các đối tượng. Điều này tùy thuộc vào câu hỏi nghiên cứu của chúng ta là gì? Ví dụ chúng ta muốn nghiên cứu về hành vi tình dục của khách hàng của phụ nữ mại dâm thì nhóm đối tượng nghiên cứu lúc này sẽ là những nam giới đã từng có quan hệ tình dục với phụ nữ mại dâm chứ không phải là tất cả nam giới .Hoặc chúng ta muốn tìm hiểu về tình trạng nạo phá thai thì nhóm đối tượng được lựa chọn sẽ là những phụ nữ đã từng mang thai chứ không phải tất cả phụ nữ trong độ tuổi sinh đẻ 15-49. Để làm được điều này chúng ta có thể dùng 1 trong 2 syntax sau đây.

Syntax 1:

keep [điều kiện 1] and/or [điều kiện 2]

Cú pháp này có tính chất lọc đối tượng vĩnh viễn và lệnh lọc sẽ xóa hoàn toàn các đối tượng không được lựa chọn. Sau khi câu lệnh kết thúc chúng ta sẽ bị mất bộ số liệu ban đầu, bộ số liệu mới chỉ còn lại nhóm đối tượng ta lựa chọn.

Tất cả các lệnh trong bài viết đều sử dụng trong Data 3.

Ví dụ:Ví dụ: Chúng ta chỉ muốn tìm hiểu về tỉ lệ sinh con thứ 2 của những người làm nông nghiệp (nông dân).

Link: use 'D:\Trang\Work\Thongke.info\Data1.dta'

Kết quả phân bố tần số trước khi lựa chọn đối tượng

Cách lọc dữ liệu trong Stata

Syntax:

tab q8 q38, col

Ví dụ về syntax 1:

keep if q8==1

tab q8 q38, col

Kết quả sau khi chạy lệnh chỉ lựa chọn đối tượng là nông dân.

Cách lọc dữ liệu trong Stata

Syntax 2:

preserve

keep [điều kiện 1] or/and [điều kiện 2]

Cú pháp này dùng để lọc đối tượng tạm thời nhưng chỉ cần chạy cú pháp một lần. Sau đó các lệnh phân tích có thể viết và chạy như bình thường mà phần mềm vẫn có thể hiểu được là các lệnh phân tích này chỉ chạy trên nhóm đối tượng đã được lựa chọn. Sau khi đã chạy xong các lệnh phân tích với nhóm đối tượng lựa chọn, ta có thể dễ dàng quay lại bộ số liệu ban đầu với toàn bộ các đối tượng bằng cú pháp sau:

restore

Ví dụ về syntax 2:

*Lệnh lựa chọn đối tượng

preserve

keep if q8==1

tab q8 q38, col

Kết quả phân bố tần số.

Cách lọc dữ liệu trong Stata

*Lệnh trở về bộ số liệu ban đầu

restore

tab q8 q38, col

Cách lọc dữ liệu trong Stata

Số lượt đọc:  1692  -  Cập nhật lần cuối:  28/06/2012 08:55:18 PM

Cách lọc dữ liệu trong Stata