Như mọi người cũng biết mình đã học Data Analytics được một thời gian. Trước khi học mình cũng có tìm hiểu tương đối về Data Science, Data Analytics , Business Analytics xem nó thực ra là cái gì. Những khái niệm này đôi khi được dùng lẫn lộn và không phải ai cũng có hiểu biết rõ ràng về nó. Mình xin chia sẻ một chút hiểu biết của mình dựa theo kinh nghiệm và tìm hiểu trực tiếp của mình về các khái niệm này:
Data Science: Môn khoa học về dữ liệu, với phần cốt lõi là Statistics . Nó không phải chỉ là một môn khoa học truyền thống mà là một ngành / lĩnh vực giao thoa giữa các phương pháp khoa học, thuật toán, quy trình để chiết xuất , lọc ra được “insights” từ các loại dữ liệu.
Data Analytics: Một quy trình/ lĩnh vực phân tích từ “raw” data, sử dụng các công cụ statistics, machine learning etc. để extract insights. Dữ liệu của Data Analytics rộng rất đa dạng.
Data Analytics có 4 mảng chính:
– Descriptive Analytics: phân tích dữ liệu trong quá khứ, hoặc hiện tại để hiểu về dữ liệu, trả lời cho câu hỏi “What happened” (ví dụ doanh số của công ty trong năm vừa qua tập trung vào khu vực, khách hàng nào).
-Diagnosis Analytics: phân tích dữ liệu để trả lời cho câu hỏi “why something happened” (tại sao doanh số của công ty lại tập trung vào khu vực này).
-Predictive Analytics: phân tích và xây dựng mô hình thuật toán để đưa ra câu trả lời cho câu hỏi “what’s likely to happen” : ví dụ dự đoán doanh số của một khu vực dựa trên dữ liệu quá khứ, hoặc dự đoán một bệnh nhân có khả năng bị bệnh không dựa trên các biến số sức khỏe. -Prescriptive Analytics: Phân tích dữ liệu để trả lời cho câu hỏi “ What action to take”, ví dụ như xác định các tập khách hàng mà có khả năng mua sản phẩm dựa theo dữ liệu mua hàng và thông tin về khách hàng.
Trong Data Analytics- cụ thể là mảng Machine learning có 2 loại phân tích dữ liệu là Supervised learning (dùng để dự đoán một biến số nào đó, ví dụ doanh số của công ty ) và unsupervised learning (xác định pattern, các nhóm, gọi là “clustering” ) Các tập và loại dữ liệu dùng trong Data Analytics rất rộng và không chỉ gói gọn trong phạm vi hoạt động của doanh nghiệp. DA cũng rộng và thông thường phức tạp (complex) hơn BA. Người làm được Data Analytics trong doanh nghiệp phải là người rất chắc về statistics, programing, math, etc. và thường biết đến với title Data Scientist.
–Công cụ: DA thường dùng Python và R. R ngày trước rất mạnh và thường dùng trong giới học thuật, còn hiện giờ Python đang chiếm dần ưu thế với hàng trăm libraries và với ưu điểm dễ dùng, dễ học. Nếu bạn bắt đầu tìm hiểu thì có lẽ bạn nên dành thời gian học Python hơn là R.
Business Analytics: Phân tích dữ liệu trong mảng kinh doanh, dữ liệu thường tập trung trong các mảng hoạt động của doanh nghiệp, như marketing, bán lẻ, sales, operation, dữ liệu về khách hàng. Thường các loại dữ liệu của doanh nghiệp là “structured” data – dữ liệu có hệ thống được “pulled” từ cơ sở dữ liệu. Lĩnh vực phổ biến nhất của Business Analytics trong doanh nghiệp hiện giờ mới chủ yếu chỉ dừng ở Business Intelligence (hay chính là Descriptive Analytics vê mặt bản chất).
Chỉ có nhưng doanh nghiệp to, nhiều tiền hoặc chú trọng đến công nghệ, có cơ sở dữ liệu lớn mới bắt đầu mở rộng sang phần Predictive Analytics.
- Công cụ trong BA thường không yêu cầu coding, đa phần dùng Excel, Google Sheet và Visualisation tool như Tableau, Power BI. Alteryx cũng hay được dùng để xử lý dữ liệu theo dạng kéo thả. BA cũng có thể đòi hỏi kỹ năng sử dụng SQL. Các vị trí công việc trong mảng BA hay tuyển dụng là Data Analyst hoặc Business Analyst. Như vậy có thể thấy BA và DA có một số điểm trùng nhau, cùng phân tích dữ liệu để giúp đưa ra quyết định, nhưng DA rộng và có thể nói là khó hơn BA.
- Nếu bạn có background business, bạn có thể cân nhắc học DA để game up kiến thức và kĩ năng, vì khi bạn chắc về DA thì BA không làm khó bạn được. Hy vọng bài viết ngắn này của mình có thể giúp bạn hiểu hơn chút về các buzzwords và lĩnh vực này. Rất mong nghe thêm các comment của các bạn với kinh nghiệm sâu dày hơn trong mảng này để mình học hỏi thêm.
Phần sau mình sẽ chia sẻ thêm về các nguồn học về DA/BA và các khóa học cũng như các công cụ.
Phần 2: Học Data science bắt đầu từ đâu? Đánh giá Khóa học DS của trường đại học Texas (Austin)
Các bạn nhớ đón xem.
Leave a Reply