Data Scientist_Hanoi
Mô tả công việc
Mô tả công việc:
● Phối hợp với thành viên nhóm dự án, nhóm QA, Test để cải thiện sản phẩm
● Đọc hiểu các paper, github và cải tiến sản phẩm
● Xây dựng các mô hình học máy (AI) để thích ứng với các khó khăn hoặc giải quyết triệt để các vấn đề đã phát hiện được ở giai đoạn phân tích
● Thấu hiểu được khó khăn của khách hàng qua phân tích dữ liệu. Làm việc nhiều hệ thống dữ liệu (data warehouse/data lake) và nền tảng phân tích dữ liệu từ đó đề xuất các giải pháp giúp tăng hiệu quả hoạt động sản xuất kinh doanh.
● Xây dựng kế hoạch công việc, báo cáo, đánh giá công việc của cá nhân.
● Các nhiệm vụ khác được phân công
Yêu cầu
- Tối thiểu 1 năm kinh nghiệm ở vị trí tương đương
- Tốt nghiệp Cao đẳng/Đại học, ưu tiên chuyên ngành CNTT, Trí tuệ nhân tạo, Khoa học máy tính, chuyên ngành khoa học (Toán, vật lý),...
- Kỹ năng phân tích dữ liệu
+ Có Kiến thức thống kê từ đó biết cách thiết kế và đánh giá các A/B testing experiments
+ Thành thạo quy trình phân tích dữ liệu theo CRISP
+ Có kinh nghiệm ít nhất 2/4 loại phân tích: Phân tích mô tả, phân tích tìm nguyên nhân, phân tích chẩn đoán, phân tích đề xuất
+ Có thể phân nhóm (K- mean, DBscan, RFM, etc ) và các kĩ năng phân tích theo nhóm :
+ Kỹ năng đặt câu hỏi, kỹ năng giải quyết vấn đề, kỹ năng báo cáo
- Xây dựng mô hình ML/AI:
+ Khả năng đọc research papers, survey
+ Có khả năng training mô hình với high performance tận dụng được tối đa hardware resources đang có (ví dụ: tính toán song song, phân tán, kết hợp nhiều GPUs)
+ Tối ưu tốc độ mô hình AI trong những điều kiện HW resources khác nhau từ đó hướng đến các mục tiêu như: để có thể giảm kích thướng mô hình, tăng tốc độ inference
+ Thành thạo các lớp bài toán phổ biến: regression, classification, clustering. Gồm cả cách tiếp cận Machine Learning or Deep Learning
+ Có thể làm việc với đa dạng loại dữ liệu: dữ liệu theo dòng thời gian (time series), dữ liệu dạng bảng, dữ liệu văn bản (text), etc
+ Hiểu biết sâu sắc các cách phân tích và đánh giá mô hình học máy: Độ chính xác mô hình, sự công bằng, sự thiên lệch và các cách giải quyết tương ứng
- Kỹ năng về lập trình:
+ Thành thạo SQL để truy vấn và xử lý dữ liệu từ IBM Db2 hoặc IBM Big SQL, Single Store.
+ Thành thạo sử dụng các packages sau để xử lý dữ liệu: NumPy, Pandas (hoặc modin, polars), Spark,
+ Thành thạo một trong các framework sau để phục vụ xây dựng mô hình Deeplearning: Karas, TensorFlow hoặc PyTorch và pytorch- forecasting
+ Thành thạo sử dụng các packages sau để xây dựng mô hình machine learning: Scikit- learn, xgboost, lightgbm, Prophet, AutoML opensources
- Ưu tiên ứng viên
+ Có kinh nghiệm với IBM watson và IBM Cognos Analytics:
+ Xây dựng và triển khai mô hình AI theo MLOps (CP4D MLOps)
* Data Preparation: Sử dụng các giải pháp trong IBM Cloud Pak for Data: Presto/Trino và Spark để làm sạch, chuyển đổi và xử lý dữ liệu.
* Khai phá dữ liệu:
● Làm việc với các công cụ visualization của Watson Studio hoặc IBM Cognos Analytics.
● Kỹ năng vẽ biểu đồ và báo cáo trực quan với Python (Plotly, Matplotlib).
* Xây dựng và quản lý mô hình:
* Xây dựng và quản lý features hiệu quả: Biết sử dụng watson- studio/feature- platform của IBM Db2: Feature Design, Feature Catalog, Feature Engine, Feature Store, Feature Management
● Quản lý phiên bản mô hình (model versioning) và giám sát hiệu suất.
● Xử lý và trực quan hóa dữ liệu
● Sử dụng Watson Machine Learning để huấn luyện, theo dõi, và triển khai mô hình.
● Có hiểu biết AutoAI, AutoML
* Triển khai mô hình AI
● Có kinh nghiệm với IBM Cloud, triển khai trên môi trường Cloud và Hybrid
● Làm việc với IBM Kubernetes Service hoặc OpenShift sử dụng container hóa và triển khai mô hình AI.
● Real- time Analytics: Tích hợp mô hình AI/ML với các luồng dữ liệu real- time từ Apache Kafka hoặc IBM Streams.
● Kỹ năng triển khai mô hình và ứng dụng trên IBM Cloud.
Cập nhật gần nhất lúc: 2026-01-20 10:25:03
CÔNG TY TNHH DIKSHA TECHNOLOGIES
Bí kíp tìm việc an toàn
Tiện ích hỗ trợ bạn
Việc làm đề xuất liên quan
Hiện tại chúng tôi chưa có việc làm đề xuất phù hợp với bạn.








