Tài liệu tham khảo
1. Dương thiệu Tống, Thống kê ứng dụng trong nghiên cứu
khoa học giáo dục, NXB Đại học Quốc Gia HN 2000
2. Nguyễn Công Khanh, Ứng
dụng phần mềm thống kê SPSS để xử lý và phân tích dữ liệu trong khoa học xã hội
(Tài liệu dùng cho học viên cao học TL - GDH), Hà Nội 2004
3. Nguyễn Văn
Liệu, Nguyễn Đình Cử, Nguyễn Quốc Anh, SPSS - Ứng dụng phân tích dữ liệu trong
quản trị kinh doanh và khoa học tự nhiên - xã hội. NXB Giao thông vận tải
2000
4. Võ Văn Huy, Võ Thị Lan, Hoàng Trọng. Ứng dụng SPSS for windows để xử
lý và phân tích dữ kiện nghiên cứu marketing, quản trị, kinh tế, tâm lý, xã hội.
NXB Khoa học Kỹ thuật 1997
Bài 1: Giới thiệu khái quát về phần mềm SPSS
1.
SPSS là gì?
SPSS là một sản phẩm phần mềm chuyên ngành thống kê. Lúc đầu được
sử dụng cho các máy chủ (máy trung tâm -mainframes) vào những năm 1960s, sau này
được sử dụng cho các máy tính cá nhân.
Sản phẩm SPSS được viết tắt từ
Statistical Products for the Social Services, có nghĩa là Các sản phẩm Thống kê
cho các dịch vụ xã hội. Phiên bản mới nhất là SPSS 13.0.
SPSS là một hệ thống
phần mềm thống kê toàn diện được thiết kế để thực hiện tất cả các bước trong các
phân tích thống kê từ những thông kê mô tả (liệt kê dữ liệu, lập đồ thị) đến
thống kê suy luận (tương quan, hồi quy…)
2. Các bộ phận của hệ thống
SPSS
SPSS Professional Statistisc: Cung cấp các kỹ thuật để phân tích dữ liệu
dạng không thích hợp với mô hình tuyến tính truyền thống.
SPSS Ađvance
Statistisc: Tập trung vào các kỹ thuật được dùng trong các thí nghiệm sinh học
và phức tạp.
SPSS Tables: Xây dựng một loạt các báo cáo dạng bảng biểu có
chất lượng trình bày cao, và phức tạp.
SPSS Trends: Thực hiện các phép dự
đoán và phân tích dãy số thời gian phức tạp bao gồm xây dựng các mô hình cho dữ
liệu đa biến phi tuyến tính, các mô hình san bằng, và các phương pháp để ước
lưọng các hàm tự hồi quy.
3. Một số thuật ngữ quan trọng của SPSS.
3.1.
Case (trường hợp/chủ thể)
Các quan sát là các trường hợp/chủ thế
(case).
Một chủ thể bao gồm các thông tin cho một đơn vị của phép phân tích.
Ví dụ: 1 người với tư cách là 1 chủ thể (case) bao gồm các thông tin mà nhà
nghiên cứu cần quan tâm như: tuổi, giới tính, trình độ văn hoá, những thái độ
ứng xử, quan niệm, hành động…
3.2. Biến (variables)
Mỗi chủ thể được thể
hiện qua các biến. Biến (variable) là thông tin hoặc thuộc tính được thu thập
cho từng chủ thể.
Ví dụ: tuổi, giới tính, học vấn, nhận thức,thái độ...
3.3. Variable name (tên biến)
Mỗi biến được đặt tên và không có 2 biến có
tên giống hệt nhau trong mỗi tệp tin.
Mỗi tên biến có tối đa là 8 ký tự
Ví
dụ: Cau1; Cau2; gioi, tuoi, thunhap...
3.4.Variable label (nhãn biến)
Dùng
để mô tả cho tên đầy đủ của biến
3.5. Value label (Nhãn của giá trị
biến)
Dùng để mô tả những biểu hiện riêng biệt của từng biến định
tính.
3.4. Các case (chủ thể/trường hợp) tập hợp với nhau lại tạo nên tệp dữ
liệu hiện hành SPSS (working data file).
Trong hệ thống tệp tin của windows,
các tệp tin có đuôi mở rộng là *.sav, các kết quả đầu ra có phần đuôi mở rộng là
*.spo…
3.5. Measurement (Thang đo)
Các biểu hiện của các giá trị biến được
xác định bằng các thang đo khác nhau tùy tính chất của việc đo lường. Từng
phương pháp phân tích dữ liệu do vậy cũng tuỳ thuộc vào loại thang đo được sử
dụng.
Có 4 loại thang đo thường gặp là: Định danh, thứ bậc, khoảng và tỷ
lệ.
3.5.1. Thang đo định danh (nominal)
là đánh số hoặc gán chuỗi dạng
ngắn cho các biểu hiện của một biến (được gọi là biến định danh [nominal
variable]).
Các trị số của biến định danh chỉ thể hiện các nhóm không có thứ
bậc hơn kém (unordered categories).
Nếu biến định danh được đo bằng các con
số thì giữa các con số ở đây không có quan hệ hơn kém. Do đó mọi phép tính đại
số giữa chúng đều vô nghĩa.
Thang đo định danh chủ yếu để đếm tần số biểu
hiện của biến nghiên cứu.
3.5.2. Thang đo thứ bậc (ordinal)
Là thang đo
định danh những các trị số của biến lại có quan hệ thứ bậc hơn kém:
Các biến
được đo đạc bằng thang đo thứ bậc gọi là các biến định danh có thứ bậc (ordinal
variable). Trong nhiều phép phân tích của SPSS, các biến định danh có thứ bậc
thường được gọi là các biến lập nhóm có thứ bậc (ordered categorical
variable)
3.5.3. Thang đo khoảng (Interval scale)
Là một kiểu đánh giá
phân loại sự vật, hiện tượng hay đặc tính theo nhữnng đơn vị đều nhau ở bất kỳ
khoảng nào trên thanh đo.
Ví dụ như, phép đo chiều cao là một kiểu của thang
định khoảng: sự khác biệt giữa người cao 160 - 165 với người cao 150 - 155; đều
ở một khoảng là 5 cm. Với thang đo thứ bậc, chúng ta có thể dùng các phép tính
số học như cộng, trừ, tính trung bình, phương sai…
3.5.4. Thang đo tỷ lệ
(Ratio)
Là thang đo khoảng với một điểm không (0) tuyệt đối/điểm gốc để có
thể so sánh được tỷ lệ giữa các số đo.
Sự có mặt của số 0 giúp ta thiết lập
được tỷ lệ giữa các điểm số thu được. Ví dụ, chúng ta có thể xác định chính xác
vận tốc 10 km/h lớn gấp 2 lần vận tốc 5 km/h.
3.6. Các loại biến số
Các
hiện tượng mà ta muốn quan sát được gọi là các biến số (variables). Một biến là
những đại lượng có thể mang các giá trị khác nhau như học vấn, thu nhập, tính
cách, khí chất… Các biến này có thể thuộc loại định tính (qualitative) hay định
lượng (quantitative).
Trong nghiên cứu người ta thường phân biệt 2 loại biến
số chính yếu khác nữa: Biến độc lập (independent variables) và biến phụ thuộc
(dependent variables).
3.6.1. Biến định tính (quatitative variables)
Là
những biến mà người ta gán cho các giá trị để phân biệt hay phân loại các quan
sát. Đây là biến lập nhóm (categorical variables), trị số của chúng được xác
định bằng các thang đo định danh hoặc thang đo thứ bậc dưới dạng mã số hoặc
chuỗi ngắn
Ví dụ: Giới tính (nam, nữ); Trình độ học vấn (Mù chữ, tiểu học,
trung học, cao đẳng, đại học, trên đại học)…; Thu nhập (thấp, trung bình, khá,
cao…)
3.6.2. Biến định lượng (quantitative variables)
Là những biến mà các
giá trị của chúng được xác định bằng các thang đo khoảng nên trị số của chúng
luôn để dưới dạng số:
Ví dụ: Thu nhập ( 200.000đ; 220.000đ; 211.000đ…), tuổi
(15; 17; 19; 18; 16…), số lượng tài sản có trong gia đình: Tivi; tủ lạnh, xe
máy…
3.6.3. Biến độc lập (independent variable)
Biến độc lập là một đặc
tính được lựa chọn để nghiên cứu. Biến độc lập được giả thuyết là một biến mà sự
biến đổi của nó có ảnh hưởng chi phối hoặc gây ra những biến đổi khéo theo ở một
biến khác.
3.6.4. Biến phụ thuộc (dependent variable)
Biến phụ thuộc là
một biến mà sự biến đổi của nó chịu sự chi phối (đáp ứng) của 1 biến khác. Một
biến được gọi là biến phụ thuộc khi giá trị của nó tuỳ thuộc vào giá trị của
biến độc lập. Nó chính là hiệu quả giả định của biến độc lập.
Lưu ý: Việc
xác định một biến là độc lập và phụ thuộc thường có tính chất tương đối. Một
biến có thể được xem là phụ thuộc trong phạm vi phân tích này lại là độc lập
trong phạm vi phân tích khác.
Trong nghiên cứu còn có những yếu tố ảnh hưởng
không được kiểm soát (hay không được quan sát một cách có hệ thống) được gọi là
các biến bổ trợ.
4. Các khái niệm đặc trưng trong thống kê
4.1. Yếu vị
(mode)
Yếu vị của một tập hợp các đo lường là trung điểm của khoảng đẳng loại
chứa đựng tần số tối đa hay trong trường hợp các biến định tính, nó là tên của
loại đo lường có tần số lớn nhất.
4.2. Trung vị (median)
Trung vị của một
tập hợp đo lường là trị số rơi vào chính giữa khi các số đo lường ấy được xếp
đặt theo thứ tự độ lớn của chúng
Công thức tính trung vị = 1/2 (N+1)
Nếu
trung vị là số lẻ thì lấy giá trị trung bình của thứ hạng đứng trường và
sau.
4.3. Trung bình cộng (mean)
Trung bình cộng của một tập hợp các số đo
lượng là tổng số cộng các đo lường chia cho N (tổng số) của đo lường ấy.
4.4.
Độ lệch chuẩn (standar deviation)
Độ lệch chuẩn là một phép đo đánh giá mức
độ phân tán hoặc thay đổi của một phân bố điểm (tức là mức độ phân tán hay tập
trung của điểm số xoay quanh giá trị trung bình). Độ lệch chuẩn chính là độ lệch
trung bình của điểm số tính từ giá trị trung bình của mẫu.
4.5. Phương sai
(varian)
Phương sai cũng là một phép đo đánh giá mức độ phân tán hoặc thay
đổi của mộ phân bố điểm.
Phương sai chính là bình phương độ lệch
chuẩn.
4.6. Tương quan
Tương quan (correlation) là một số đo lường về mối
liên hệ giữa hai biến số. Nó có thể là dương (+) hoặc (-) hay = 0.