Chúng tôi đang tìm kiếm Kỹ sư hạ tầng Cloud (Cloud Engineer) tài năng và tâm huyết để tham gia vào đội ngũ chuyên gia của chúng tôi. Nếu bạn đam mê công nghệ mã nguồn mở, có kinh nghiệm sâu sắc về OpenStack và mong muốn xây dựng, vận hành các hệ thống cloud quy mô lớn, đây chính là cơ hội dành cho bạn.
Thiết kế & Triển khai:
Tham gia thiết kế, quy hoạch và triển khai hệ thống Private Cloud hiệu năng cao, có tính sẵn sàng cao (high availability) dựa trên nền tảng OpenStack.
Tự động hóa hoàn toàn quy trình triển khai, nâng cấp và quản lý OpenStack bằng Kolla- Ansible hoặc Ansible- Openstack cho cả môi trường Production và Staging.
Vận hành:
Đảm bảo tính sẵn sàng của hệ thống OpenStack, bao gồm tối ưu hóa và khắc phục sự cố liên quan đến tính ổn định và hiệu suất theo SLA.
Phân tích, xử lý sự cố, tối ưu hóa hiệu năng và thực hiện scale- up/scale- out hệ thống khi cần thiết.
Xây dựng tài liệu kỹ thuật, quy trình vận hành (SOP), kịch bản tự động hóa (Ansible, Terraform) và các quy trình backup/restore.
Thiết kế và quản lý mạng ảo (SDN), các mạng phức tạp và mạng VLAN/VXLAN/GENEVE theo nhu cầu.
Xây dựng và duy trì hệ thống giám sát (Monitoring), logging, và cảnh báo (sử dụng Prometheus, Grafana, ELK Stack) để đảm bảo hệ thống hoạt động ổn định 24/7.
Quản lý môi trường OpenStack bao gồm thiết lập, cấu hình, nâng cấp và bảo trì các thành phần như Nova, Neutron, Cinder, Keystone, Glance và Skyline.
Quản lý hệ thống lưu trữ Ceph:
Thiết lập, cấu hình và giám sát hạ tầng lưu trữ Ceph, tối ưu hóa hệ thống để đảm bảo hiệu suất và khả năng mở rộng.
Phối hợp với các nhóm ứng dụng để đảm bảo tính sẵn sàng và hiệu năng của hạ tầng lưu trữ theo SLA, bao gồm các hoạt động nâng cấp, sao lưu, và bảo trì định kỳ.
Theo dõi và phân tích các chỉ số hiệu năng của Ceph để điều chỉnh các yếu tố cấu hình cần thiết.
Giám sát và xử lý sự cố:
Triển khai, vận hành các công cụ giám sát và quản lý cảnh báo tự động để phát hiện và xử lý sự cố kịp thời.
Điều tra và khắc phục các vấn đề liên quan đến hệ thống, xử lý các yêu cầu từ người dùng và các bộ phận khác trong tổ chức.
Phối hợp với đội bảo mật để đảm bảo hệ thống an toàn, bao gồm việc kiểm tra và cập nhật bản vá bảo mật thường xuyên.
Tối ưu hóa và nâng cấp:
Phối hợp với đội ngũ bảo mật (Security) để đảm bảo an toàn cho toàn bộ hạ tầng.
Cập nhật và nâng cấp các thành phần của OpenStack và Ceph khi cần thiết, đảm bảo rằng hệ thống luôn trong trạng thái ổn định và bảo mật nhất.
Làm việc chặt chẽ với đội ngũ Phát triển (Development) để hỗ trợ tích hợp ứng dụng và mở rộng các tính năng mới trên nền tảng OpenStack.
Tối ưu hóa tài nguyên và hiệu năng của hệ thống, đảm bảo rằng hệ thống vận hành ổn định dưới các tải cao.