1.1. Thu thập dữ liệu
Ta thường thu thập từ các nguồn: Internet, sách báo, ti-vi, lập phiếu hỏi, phỏng vấn, làm thí nghiệm,….
1.2. Phân loại dữ liệu
Để thuận tiện trong mô tả và xử lí, người ta thường phải phân loại đữ liệu. Dữ liệu định lượng được biểu điễ bằng số thực. Dữ liệu định tính được biểu diễn bằng từ, chữ cái, kí hiệu, … |
---|
Ví dụ:
+ Chiều cao ( đơn vị centimet) của 6 bạn trong lớp:
148; 153; 140; 160; 146; 155 là số liệu
+ Tên của một số quốc gia: Việt Nam, Trung Quốc, Pháp, Canada, Nam Phi là dữ liệu không là số và không thể sắp thứ tự.
+ Đánh giá học lực của học sinh: Xuất sắc, Giỏi, Khá, Trung bình, Yếu, Kém là dữ liệu liệu không là số và có thể sắp thứ tự.
1.3. Tính hợp lí của dữ liệu
Để đảm bảo tính hợp lí, đữ liệu cần phải đáp ứng đúng các tiêu chí toán học đơn giản, chẳng hạn như: + Tổng tỉ lệ phần trăm của tật cả các thành phần phải bằng 100%; + Số lượng của bộ phận phải nhỏ hơn số lượng của toàn thể; … + Phải có tính đại điện đôi với vân đề cần thông kê. |
---|
Ví dụ: Xét tính hợp lí của dữ liệu trong bảng thống kê sau:
Giải
Dữ liệu cho trong bảng không hợp lí vì tổng tỉ lệ phần trăm của tất cả các thành phần là 120% (khác 100%)