Giới thiệu Sách - Phân tích dữ liệu với R Hỏi và Đáp
SÁCH PHÂN TÍCH DỮ LIỆU VỚI R HỎI VÀ ĐÁP
Tác Giả: Nguyễn Văn Tuấn NXB Tổng hợp TP.HCM Phát hành: Đông Nam Trọng lượng: 500 gram Kích Thước: 16 X 24 cm Hình Thức: Bìa mềm Số Trang: 400 Năm Xuất Bản: 2020
Giới thiệu tác giả: Tác giả Nguyễn Văn Tuấn hiện giữ 3 chức giáo sư tại Úc: Giáo sư trường Y – Đại học New South Wales (UNSW Sydney), Giáo sư Y khoa Tiên lượng thuộc Đại học Công nghệ Sydney (UTS), và Giáo sư Dịch tễ học và Thống kê học thuộc Trường Y – Đại học Notre Dame Australia. Tác giả là người thứ 33 đươc UNSW Sydney trao bằng D.Sc – Tiễn sỹ khoa hoc về những đóng góp xuất sắc cho chuyên ngành loãng xương trên thế giới.
Ông đã công bố gần 300 công trình nghiên cứu trên các tập san nổi tiếng trên thế giới, kể cả nature, Science, Jama, BMJ, Lancet, và New England Journal of Medicine. Ông là một trong những nhà nghiên cứu y khoa được trích dẫn nhiều nhất trên thế giới.
Tại Việt Nam, trong 15 năm qua ông đã giảng cho khoảng 20 Workshop với tổng số hơn 2000 bác sĩ và nhà khoa học tham dự. Ông đã xuất bản 10 cuốn sách về khoa học, ý tế và giáo dục trong nước. Ông được trao nhiều giải thưởng ở nước ngoài và trong nước về những thành tích khoa học và giáo dục.
LỜI GIỚI THIÊU
Phân tích dữ liệu đã và đang trở thành một bộ môn khoa học được rất nhiều người trong giới nghiên cứu khoa học quan tâm. Trong thời đại dữ liệu lớn (Big Data) và dữ liệu đa chiều, việc khai thác và chuyễn hóa dữ liệu thành thông tin, và từ thông tin thành kiến thức thành kiến thức là một trong những quy trình cốt yếu của hoạt động khoa học. Trong quá trình chuyển hóa từ dữ liệu sang thông tin, việc ứng dụng đúng các phương pháp phân tích là một sự lựa chọn rất quan trọng . Cuốn sách Phân tích dữ liệu với R – Hỏi và Đáp bạn đang cầm trên tay sẽ giúp các bạn lựa chọn các phương pháp thích hợp cho phân tích dữ liệu, và giúp cho các bạn biến dữ liệu thành thông tin có ích.
Trong quá trình biên soạn cuốn sách này, tôi suy nghĩ nhiều về mô hình chuyển tải các phương pháp phân tích, và cuối cùng đi đến quyết định dùng mô hình “vấn đáp”. Nói cách khác, cuốn sách là tập hợp những câu hỏi và câu trả lời cụ thể cho những vấn đề mà giới nghiên cứu khoa học thực nghiệm thường gặp phải. Có tất cả 110 câu hỏi và trả lời. Qua kinh nghiệm nghiên cứu thực nghiệm của tôi và những tương tác với rất nhiều đồng nghiệp trong quá khứ, tôi nghĩ rằng đây là hình thức gần gũi nhất và thiết thực nhất để học về phân tích dữ liệu.
Nội dung cuốn sách xoay quanh các vấn đề mà giới nghiên cứu hay gặp hàng ngày. Đó là những vấn đề liên quan đến mô tả dữ liệu, kiểm định giả thuyết, phân tích liên quan, và phân tích tiên lượng. Từ phân tích mô tả, mô hình hồi quy tuyến tính, mô hình hồi quy logistics, mô hình Cox, phân tích sống còn, phân tích đa biên, đến ước tính cỡ mẫu đều được trình bày từ những nghiên cứu thực tế. Tôi còn dành một nội dung khá lớn cho các phương pháp phân tích bằng biểu đồ. Mỗi chủ đề sẽ được trình bày qua một số câu hỏi và kèm theo phương pháp giải quyết…
Tất cả các phương pháp phân tích đều được cung cấp mã R để bạn đọc có thể kiểm tra và thực hiện ngay khi đọc. Tôi chọn R làm phương tiện triển khai các phương pháp vì ngôn ngữ R hiện nay đang trở thành một loại ngôn ngữ chuẩn trong khoa học thống kê và phân tích dữ liệu. R còn là một phương tiện tuyệt vời để các bạn có thể tiếp cận với những phương pháp thống kê hiện đại. Tôi nghĩ rằng các bạn đồng nghiệp cần phải làm quen với ngôn ngữ R để nắm bắt kịp thời những phương pháp mà đồng nghiệp trên thế giới đang sử dụng…
MỤC LỤC
1. GIỚI THIỆU NGÔN NGỮ R
2. GIỚI THIỆU DỮ LIỆU
3. HAI TRƯỜNG PHÁI PHÂN TÍCH THỐNG KÊ
4. TÍNH TOÁN XÁC SUẤT
5. PHÂN TÍCH MÔ TẢ BẰNG BIỂU ĐỒ
6. PHÂN TÍCH MÔ TẢ BIẾN LIÊN TỤC
7. PHÂN TÍCH MÔ TẢ BIẾN PHÂN LOẠI
8. SO SÁNH HAI NHÓM: BIẾN LIÊN TỤC
9. PHÂN TÍCH SO SÁNH HAI TỶ LỆ
10. PHÂN TÍCH PHƯƠNG SAI
11. MÔ HÌNH HỒI QUY TUYẾN TÍNH
12. MÔ HÌNH HỒI QUY LOGICTIC
13. PHÂN TÍCH SỐNG CÒN
14. PHÂN TÍCH ĐA BIÊN VÀ “MACHINE LEARING”
15. PHÂN TÍCH TỔNG HỢP (META – ANALYSIS)
16. MỘT SỐ PHƯƠNG PHÁP PHÂN TÍCH DỊCH TỄ HỌC
17. ƯỚC TÍNH CỠ MẪU CHO NGHIÊN CỨU KHOA HỌC
18. NHỮNG SAI SÓT VÀ THIẾU SÓT PHỔ BIẾN TRONG PHÂN TÍCH DỮ LIỆU