Data Scientist
Mô tả công việc
Phân tích và Mô hình hóa (Analysis & Modeling- 60%)
- Dự án End- to- End: Tự chủ triển khai các dự án Data Science từ đầu đến cuối, bao gồm thu thập, làm sạch dữ liệu, xây dựng mô hình, và triển khai thử nghiệm (A/B testing).
- Xây dựng Mô hình: Phát triển và tinh chỉnh (fine- tune) các mô hình ML (như Phân loại, Hồi quy, Mô hình Thời gian) để giải quyết các bài toán kinh doanh chính như:
- Phân khúc Khách hàng (Customer Segmentation) cho mục tiêu Marketing.
- Hệ thống Gợi ý (Recommendation System) sản phẩm/nội dung.
- Dự đoán tỷ lệ Khách hàng rời bỏ (Churn Prediction).
- Dự báo Nhu cầu/Doanh thu (Demand/Revenue Forecasting).
- Tối ưu hóa Mô hình: Đánh giá nghiêm ngặt hiệu suất mô hình, thực hiện Hyperparameter Tuning và sử dụng các kỹ thuật tiên tiến để cải thiện độ chính xác và tốc độ.
Triển khai và Vận hành (Deployment & MLOps- 20%)
- Hợp tác chặt chẽ với Data Engineer và DevOps để đóng gói mô hình (Model Packaging) và triển khai vào môi trường sản xuất (Production Environment).
- Thực hiện giám sát hiệu suất mô hình sau triển khai (Model Monitoring) để đảm bảo tính ổn định và duy trì độ chính xác theo thời gian.
Cố vấn Kinh doanh (Business & Communication- 20%)
- Truyền tải Insight: Giải thích các kết quả phân tích và mô hình phức tạp cho đối tượng không chuyên về kỹ thuật bằng các hình thức dễ hiểu (Storytelling, Data Visualization).
- Làm việc trực tiếp với các bên liên quan (Product Owners, Marketing, Sales) để hiểu sâu về yêu cầu kinh doanh và chuyển chúng thành các chỉ số (Metrics) và giả thuyết (Hypotheses) có thể đo lường được.
- Đưa ra các đề xuất chiến lược dựa trên dữ liệu để thúc đẩy tăng trưởng doanh thu hoặc tối ưu hóa chi phí vận hành.
Yêu cầu công việc
Học vấn
: Cử nhân hoặc Thạc sĩ chuyên ngành Khoa học dữ liệu, Trí tuệ nhân tạo, Công nghệ Thông tin hoặc các lĩnh vực liên quan.
Kinh nghiệm:
- Trải nghiệm thực tế trong các dự án chuẩn bị dữ liệu cho huấn luyện mô hình NLP/LLM.
- Ít nhất 3 năm kinh nghiệm trong xử lý dữ liệu văn bản hoặc NLP.
Kiến thức và kỹ năng:
- Kỹ năng phân tích dữ liệu, đánh giá chất lượng và trực quan hóa kết quả.
- Kinh nghiệm trong làm sạch dữ liệu, text augmentation, deduplication và corpus building.
- Hiểu biết về các yêu cầu dữ liệu cho pre- training/fine- tuning LLM (khối lượng, tính đa dạng, domain- specific corpora).
- Thành thạo Python và các thư viện NLP (Hugging Face, SpaCy, NLTK, OpenNMT).
- Khả năng làm việc nhóm, giao tiếp hiệu quả với các nhóm AI/ML và kỹ thuật dữ liệu.
Tư duy và Kỹ năng mềm (Mindset & Soft Skills)
- Giải quyết vấn đề: Có khả năng xử lý các vấn đề dữ liệu thô, không sạch và tìm ra giải pháp sáng tạo.
- Giao tiếp: Khả năng trình bày kết quả một cách mạch lạc, thuyết phục và trực quan hóa dữ liệu hiệu quả.
- Mentor: Có khả năng hướng dẫn và hỗ trợ các Junior Data Analyst/Scientist.
- Tư duy Kinh doanh (Business Acumen): Khả năng chuyển đổi câu hỏi ""số liệu"" thành câu hỏi ""kinh doanh"" và ngược lại.
Ưu tiên:
- Hiểu biết về các xu hướng mới trong chuẩn bị dữ liệu cho LLM: synthetic data generation, data augmentation pipelines.
- Nắm vững quy định pháp lý quốc tế và trong nước về dữ liệu (GDPR, Decree 13/2023/NĐ- CP).
- Kinh nghiệm làm việc với dữ liệu tiếng Việt hoặc ngôn ngữ có tính đa dạng cú pháp cao.
Quyền lợi
Bảo hiểm xã hội, Khám sức khỏe định kỳ, Team building, Du lịch hàng năm, Thưởng tháng 13, Thưởng hiệu quả làm việc
Cập nhật gần nhất lúc: 2025-11-05 03:20:03

EDUPIA
Bí kíp tìm việc an toàn
Tiện ích hỗ trợ bạn
Việc làm đề xuất liên quan
Hiện tại chúng tôi chưa có việc làm đề xuất phù hợp với bạn.








