| Temel Sorumluluklar: |
|
|
|
|
|
|
|
|
|
|
| · Conviva, Dynatrace, CloudWatch, Grafana, ELK vb. kullanılan toollardan gelen metric, log ve trace verilerini düzenli olarak analiz etmek. |
| · Servis performansı, video playback kalitesi, latency, error rate ve availability gibi kritik KPI’ları izlemek ve raporlamak. |
|
| · Metriklerde ve loglarda gözlemlenen anormallikler ve iletilen sorunlar için kök neden analizi (RCA) yapmak, problemi izole ederek ilgili takımlara yönlendirmek. |
| · Incident management süreçlerinde aktif yer almak. |
|
|
|
|
|
|
|
| · Geliştirme ekipleri (client, mw, backend), video çözümleri ekipleri (CDN, DRM, fraud vb), altyapı ekipleri (network, cloud, security) ve player ekipleriyle koordineli çalışarak problemlerin çözüm sürecini takip etmek. |
| · İyileştirme önerilerini yazılı olarak sunmak ve uygulanma durumlarını izlemek. |
|
|
|
|
|
| · Gözlemlenebilirlik platformlarında (Dynatrace, Conviva) dashboard, alert ve metric panel geliştirmeleri yapmak. |
|
|
| · Aylık ve haftalık bazlarda performans raporlarını hazırlamak, trend analizleri sunmak, geçmiş haftaların metrik sonuçlarını, kritik olay analizlerini ve alınan aksiyonların durumlarını ilgili tüm ekiplerle paylaşmak. |
| · Uygulanan çözümlerle yapılan iyileştirmelerin sonuçlarının ve yaşanan sorunların istatistiksel olarak uygulama kullanımına etkisini raporlamak ve takip etmek. |
| · Yeni ölçüm ve uyarı (alert) kuralları tanımlayarak proaktif gözlemlenebilirliği artırmak. |
|
|
|
|
| · Gerektiğinde operasyonel takımlara rehberlik ederek en iyi gözlemlenebilirlik uygulamalarının benimsenmesini sağlamak. |
|
| · Performans trendlerine göre kapasite planlama ve ölçekleme önerilerinde bulunmak. |
|
|
|
|
| · **Dynatrace Davis AI ve Conviva Insight raporlarından çıkan öngörüleri operasyonel süreç iyileştirmelerine dönüştürmek.** |
|
| · Alert threshold ve anomaly detection kurallarının etkinliğini düzenli olarak gözden geçirip optimize etmek. |
|
|
| |
|
|
|
|
|
|
|
|
|
|
|
|