Site Reliability Engineer SRE- Up 2200- middle
Mô tả công việc
Mô tả công việc
Optimize system cost, performance (latency, throughput), and security.
Develop internal tools to automate workflows and support other teams.
Participate in incident response, root cause analysis, postmortem reviews, and improve incident handling processes.
Collaborate in the analysis, design, and deployment of systems and processes to ensure reliability, observability, and scalability.
Build and automate CI/CD pipelines and Infrastructure as Code (IaC) using tools such as Terraform, Ansible, Pulumi, Helm.
Manage and improve system reliability through SLO, SLI, and SLA practices.
Operate and optimize Kubernetes clusters (EKS); strong knowledge of Docker, Kubernetes, Helm is required.
Support and coordinate with NOC (Network Operation Center) teams.
Be part of the on- call rotation when needed.
Design and implement observability systems (metrics, logs, tracing, alerting) using tools like Prometheus, Grafana, ELK, etc.
Yêu cầu công việc
Yêu cầu công việc
Proactive, responsible, and able to work under pressure during incident response.
Proficient in CI/CD tools (GitLab CI, Jenkins) and familiar with Git workflows.
Excellent troubleshooting skills — able to analyze issues from OS to application layer.System- thinking mindset, focus on automation, and ability to mentor teammates.
Hands- on experience with monitoring and alerting systems (Prometheus, Grafana, ELK, Loki, etc.).
Understanding of gRPC, and capable of optimizing nginx connections and network stacks.
Experience in deploying and managing Kubernetes (EKS is a plus).
2–5 years of experience in SRE / DevOps / Platform Engineering.
Strong Linux background with deep knowledge of kernel, network stack, file system, and processes.
Strong understanding of networking concepts (TCP/IP, DNS, Load Balancing, CDN).
Experience with AWS (EKS, EC2, RDS, CloudWatch).
Experience in building or optimizing Golang SDKs or internal frameworks.
Knowledge of cloud- native networking (CNI, overlay, BGP, eBPF- based load balancing).
Experience with high availability and distributed systems.
Previously built a complete observability stack.
Quyền lợi
Thu nhập
Thưởng mềm 1 – 2 tháng lương bình quân mỗi năm
Thưởng tháng lương 13
Lĩnh tiền ngày phép dư cuối năm
Xét tăng lương theo hiệu quả công việc 6 tháng/ lần
Lương NET cạnh tranh với thị trường
Môi trường làm việc
Làm việc cùng đội ngũ trẻ tài năng, đam mê và máu lửa
Du lịch công ty hàng năm, teambuilding hàng quý
Môi trường làm việc trẻ trung, thoải mái, bình đẳng
Tận hưởng văn phòng làm việc tiện nghi, sáng tạo với các phòng chức năng
Ăn trưa miễn phí có đầu bếp riêng tại công ty
Thời gian làm việc linh động, trang phục thoải mái
Đào tạo và phát triển
Được tiếp xúc và giải quyết các bài toán khó về e- commerce.
Được training các công nghệ mới (Machine Learning, Artifical Intelligence, Nosql, System Design…).
Cập nhật gần nhất lúc: 2025-10-29 16:50:03

OPENCOMMERCE GROUP
Bí kíp tìm việc an toàn
Tiện ích hỗ trợ bạn
Việc làm đề xuất liên quan
Hiện tại chúng tôi chưa có việc làm đề xuất phù hợp với bạn.








