Observability ve Logging: Kurumsal Web Sitelerinde İzlenebilirlik Stratejisi

Observability ve Logging: Kurumsal Web Sitelerinde İzlenebilirlik Stratejisi

9 dk okuma26 Haziran 2026DGTLFACE Editorial

Kurumsal web sitelerinde problem genelde “hiç çalışmıyor” diye başlamaz; ara ara başlar: bazı kullanıcılarda sayfa geç açılır, bazı cihazlarda JS hatası çıkar, bazı rezervasyonlar ödeme adımında düşer, bazı B2B dashboard’lar akşam saatlerinde yavaşlar. Bu yüzden sadece sunucu log’una bakmak yetmez. Observability; log+metric+trace ile sistemin teknik sağlığını, RUM (Real User Monitoring) ile gerçek kullanıcı deneyimini birlikte izler; böylece “sorun var”ı değil, sorunun kök nedenini ve iş etkisini görürsünüz.

Log metric trace ve RUM bağlamı, kullanıcı deneyimiyle izleme modeli
Log metric trace ve RUM bağlamı, kullanıcı deneyimiyle izleme modeli

Öne Çıkan Cevap

Observability, kurumsal web’de “bozuldu mu?” sorusuna ek olarak “neden bozuldu, kaç kişiyi etkiledi ve ne zaman başladı?” sorularını cevaplar. Bunun için log, metric ve trace katmanlarını; gerçek kullanıcı verisi (RUM: CWV, JS hataları, etkileşim) ile birleştirmek gerekir. Otel projelerinde rezervasyon hataları ve drop noktaları; B2B’de dashboard performansı ve alert eşikleri kritik izleme senaryolarıdır. Doğru kurgu, hızlı teşhis ve kontrollü müdahale sağlar.

Özet

Observability = log+metric+trace + RUM. Hata nerede başladı, kaç kullanıcı etkilendi? CWV/JS error ve funnel drop’ları izleyin; dashboard+alert eşikleriyle hızlı müdahale edin.

Maddeler

  • Hedef kitle: Ajans teknik lideri, dev/ops, otel e-commerce/revenue, B2B ürün/IT
  • KPI: Incident süresi (MTTR), error rate, CWV trendi, rezervasyon/lead drop-off, uptime/latency
  • Entity set: Observability, Logging, Metrics, Tracing, RUM, CWV, Alerts, Dashboarding
  • GEO: Türkiye geneli; uptime ve deneyim kritik otel/rezervasyon & B2B portal projeleri
  • Funnel: MoFu (kurulum planı) → BoFu (operasyonel hız ve güven)
  • Risk alanları: PII sızıntısı (log), alert fatigue, eksik korelasyon ID, ölçüm maliyeti, “sadece backend” izleme
  • Çıktı: İzlenebilirlik modeli + dashboard seti + eşik matrisi + planlama şablonu

Kısa Cevap

Site ara ara çöküyorsa log+metric+RUM kurun; hatayı, etkilediği kullanıcıyı ve başlangıç anını görün.

Hızlı Özet

  • 1) Log, metric, trace ve RUM katmanlarını birlikte kurgula
  • 2) Frontend ve backend sinyallerini tek izlenebilirlik modelinde birleştir
  • 3) CWV, JS error, funnel drop ve latency metriklerini iş KPI’larına bağla
  • 4) Alert eşiklerini kurum baseline’ına göre kalibre et
  • 5) Go-live sonrası 60 dakika gözlem ve haftalık observability review rutini kur

1. Observability Nedir? (Log, Metric, Trace)

Observability, monitoring’in “ileri versiyonu” gibi düşünülür ama farkı şudur: monitoring size “ne oldu?”yu söyler; observability “neden oldu?”yu bulmanızı kolaylaştırır. Bunun için üç teknik sinyal + bir kullanıcı katmanı gerekir:

  • Log: Olay kaydı (ne hata verdi, hangi parametreyle?)
  • Metric: Sayısal sinyal (error rate, latency, throughput, saturation)
  • Trace: İstek zinciri (frontend → API → servis → DB)
  • RUM: Gerçek kullanıcı deneyimi (CWV, JS errors, etkileşim, drop noktaları)

Observability nedir, logging’den farkı nedir?

Logging, olayları kaydetmektir; observability ise log+metric+trace ve RUM’u birleştirip bir olayın kök nedenini ve kullanıcı etkisini ortaya çıkarmaktır. Tek başına log, “hata var” der; observability “bu hata şu release’ten sonra başladı, şu kullanıcı segmentini etkiliyor, şu endpoint’te yoğunlaşıyor” diyebilir.

Mini Check

  • Log, metric ve RUM ayrı ayrı var ama birbirine bağlanmıyor mu?
  • Bir hatayı “kullanıcı etkisi” ile görebiliyor musunuz?
  • Debugging süresi (MTTR) uzuyor mu?

Ne yapmalıyım?

  • Önce “Altın sinyaller”i belirle: latency, traffic, errors, saturation
  • Her kritiğe RUM ekle: CWV + JS error + drop noktası
  • Log’lara correlation ID ekleyip tüm katmanlarda taşı
Observability tanımı bölüm ayırıcı, deneyim odaklı izleme kültürü kurma
Observability tanımı bölüm ayırıcı, deneyim odaklı izleme kültürü kurma

2. Frontend ve Backend Tarafında Neleri İzlemeliyiz?

Kurumsal web’de “sorun” iki yerde görünür: kullanıcı ekranında ve backend’de. Bu yüzden izleme listesi iki taraflı olmalı.

Frontend izleme (RUM + client signals)

  • CWV: LCP/INP/CLS trendi (sayfa tipi bazında)
  • JS errors: hata türü + tarayıcı/cihaz + release versiyonu
  • Network errors: timeout, 5xx, DNS, CORS (Varsayım)
  • User actions: kritik CTA tıklamaları, form submit, rezervasyon adımı
  • Session context: sayfa tipi, ülke/dil, cihaz (Varsayım)

Backend izleme (API/servis sinyalleri)

  • Error rate: 4xx/5xx ayrımı
  • Latency: p50/p95/p99
  • Throughput: istek sayısı
  • Saturation: CPU/mem, DB bağlantı havuzu (Varsayım)
  • Dependency health: üçüncü parti (ödeme, CRM, OTA) hataları

Mini Check

  • “Frontend hata var ama backend temiz” senaryosunu görebiliyor musunuz?
  • p95 latency yükselince alarm var mı?
  • Üçüncü parti bağımlılıklar ayrı izleniyor mu?

Ne yapmalıyım?

  • Frontend: JS error + CWV + kritik action event’lerini “tek panel”de topla
  • Backend: golden signals dashboard kur (p95, error rate, throughput)
  • Dependency’leri ayrı alarm’la (ödeme/CRM/OTA)

3. Kullanıcı Deneyimi (RUM) ve Teknik Sağlık

Bir site “ayakta” olabilir ama kullanıcı için “işe yaramaz” olabilir. Bu yüzden RUM, teknik sağlığın üstüne “işe yararlılık” katmanı ekler. RUM’u doğru kurgulamazsanız, sadece sentetik testlere bakıp gerçek kullanıcıyı kaçırabilirsiniz.

RUM metrikleri (CWV + davranış sinyalleri)

  • CWV: sayfa tipi + cihaz + ağ kalitesi kırılımı
  • JS errors: error fingerprint + release etiketi
  • Interaction: tıklama gecikmesi, form completion
  • Drop noktaları: funnel step drop (otel: ödeme; B2B: form submit)

Teknik sağlık metrikleri (ops-friendly)

  • Incident sayısı / MTTR
  • Release sonrası hata artışı
  • Alert doğruluğu: kaç “false positive”?
  • Log kalite: PII sızıntısı var mı?

Key Statistics / Data Point (sheet): İyi kurgulanmış observability yapısına sahip projelerde, ciddi hatalar çoğu zaman kullanıcı şikâyetine gerek kalmadan log/metric/alert kombinasyonuyla fark edilebiliyor. (Bu veri noktası abartısız şekilde kullanıldı.)

Mini Check

  • RUM verisi “iş etkisi” ile bağlanıyor mu (rezervasyon/lead)?
  • Release sonrası ilk 60 dakika “gözlem penceresi” var mı?
  • Alert fatigue (çok alarm, az değer) yaşanıyor mu?

Ne yapmalıyım?

  • RUM’u “sayfa” değil “görev” bazında izle (rezervasyon/lead)
  • Release sonrası 60 dakika “war room lite” rutini koy
  • Alarm’ları azalt: kritik 5 metrik + kritik 5 senaryo
Log metric trace ve RUM katmanları diyagramı, hızlı incident teşhisi modeli
Log metric trace ve RUM katmanları diyagramı, hızlı incident teşhisi modeli

4. Otel ve B2B İçin İzlenebilirlik Senaryoları

Observability’nin değeri, “genel dashboard” değil, senaryo bazlı alarmdır. Otel ve B2B’de en kritik senaryolar farklıdır.

Otel senaryoları (rezervasyon hataları + drop noktaları)

  • Rezervasyon adım bazında drop (tarih → oda → fiyat → ödeme)
  • Ödeme sağlayıcı hataları (Varsayım: 3DS/timeout)
  • Call/WhatsApp tıklaması artıyor ama rezervasyon düşüyorsa: UX friksiyonu
  • Kampanya landing’lerinde CWV bozulması (LCP yükselişi)

B2B senaryoları (dashboard/performance alert’leri)

  • Dashboard p95 latency artışı
  • Rapor export hataları (Varsayım)
  • Login hataları / session expiry artışı
  • Lead form submit düşüşü + JS error artışı (frontend kaynaklı)

Kurumsal web sitesinde hangi log ve metrikleri izlemeliyim?

Minimum set: error rate (4xx/5xx), latency (p95), request throughput, dependency error’ları ve RUM (CWV + JS error + kritik funnel event’leri). Otelde rezervasyon/ödeme adımları; B2B’de dashboard/login/lead event’leri “iş KPI” olarak izlenmelidir.

Mini Check

  • Otelde rezervasyon adımları event bazında ölçülüyor mu?
  • B2B’de dashboard p95 ve error rate alarm’ı var mı?
  • Üçüncü parti bağımlılıklar ayrı panelde mi?

Ne yapmalıyım?

  • Otel: “Rezervasyon Sağlık Paneli” kur (drop + ödeme hatası + CWV)
  • B2B: “Portal Sağlık Paneli” kur (login + p95 + JS error)
  • Her iki paneli iş KPI’larıyla bağla (/tr/raporlama/satis-donusum)
Otel ve B2B senaryoları bölüm ayırıcı, rezervasyon ve portal izleme kurgusu
Otel ve B2B senaryoları bölüm ayırıcı, rezervasyon ve portal izleme kurgusu

5. Log Seviyeleri, Korelasyon ve PII Güvenliği

Logging, “ne kadar çok log o kadar iyi” değildir. Kaliteli log; doğru seviyede, doğru bağlamla ve PII sızdırmadan tutulur. Ayrıca log’un tek başına anlamlı olması için korelasyon gerekir: aynı isteğin frontend event’i, backend request’i ve third-party çağrısı aynı “trace/correlation ID” ile bağlanmalıdır.

Log seviyeleri (error/warn/info) ve pratik kural

  • error: kullanıcıyı etkileyen arızalar (alarm tetikleyebilir)
  • warn: riskli ama servis devam ediyor (trend izlenir)
  • info: operasyonel iz (sınırlı, maliyet kontrollü)

PII/KVKK ve log güvenliği

  • Form verilerini log’a yazma (Varsayım: maskeleme)
  • Token/şifre gibi secrets asla log’lanmaz
  • Log erişimi RBAC ile sınırlandırılır
  • Saklama süresi (retention) politika ile belirlenir

Mini Check

  • Log’larda PII var mı (telefon/e-posta)?
  • Correlation ID her katmanda var mı?
  • Log retention ve erişim politikası yazılı mı?

Ne yapmalıyım?

  • Log şemasını standardize et (fields: release, env, user_segment, correlation_id)
  • PII maskeleme kuralı koy
  • “Log maliyet budget” belirle (gereksiz info log’u kes)

6. Dashboard ve Alert Tasarımı

Observability’nin son adımı “dashboard çöplüğü” olmamalı. En iyi yaklaşım: 3 katman dashboard + 2 katman alarm.

  1. Executive/Business: Rezervasyon/lead sağlık + drop + revenue proxy (Varsayım)
  2. Ops/Technical: golden signals + dependency health
  3. Debug: trace ve hata drill-down
Tablo: Alert Eşikleri ve Aksiyon Matrisi (Bu içerikteki tek tablo)
AlarmEşikKim Aksiyon Alır?İlk 10 Dakika Aksiyonu
Rezervasyon/Lead drop%X düşüş (Varsayım: baseline’a göre)Ürün+OpsRelease var mı? Event çalışıyor mu?
5xx error rate%1+ (Varsayım)DevOps/BackendRollback/mitigation, dependency check
p95 latency%Y artış (Varsayım)Backend/PlatformCache/DB/dependency kontrol
JS error spikerelease sonrası artışFrontendRollback/feature flag (Varsayım)
CWV (LCP) bozulmakritik sayfalarda trendFE+PerfGörsel/JS değişimi var mı?

Mini Check

  • Alarmlar aksiyon üretiyor mu, yoksa bildirim gürültüsü mü?
  • “Kim aksiyon alır?” satırı net mi?
  • Alarm sonrası runbook var mı?

Ne yapmalıyım?

  • Alarm sayısını sınırlı tut: kritik 10 alarm ile başla
  • Her alarm için runbook yaz: triage → mitigation → verify
  • İş KPI panelini teknik panelle aynı sayfada ilişkilendir (/tr/raporlama/satis-donusum)

7. Go-Live ve Sürekli İyileştirme Rutini

Observability kurulduktan sonra “bitti” değildir. Araçlar, CWV tanımları ve stack değiştikçe eşikler ve dashboard’lar güncellenmelidir.

Refresh notu (sheet): APM/RUM araçları, log altyapıları ve CWV tanımları geliştikçe diyagramlar ve eşikler güncellenmelidir.

Release sonrası kontrol (60 dakika kuralı)

  • İlk 15 dk: error rate + login/rezervasyon smoke
  • 15–30 dk: p95 latency + dependency health
  • 30–60 dk: RUM (CWV, JS errors) trend

Haftalık “observability review” (30 dk)

  • En çok hata üreten 5 endpoint
  • En çok drop olan 2 adım
  • En çok alarm üreten 3 kural (gerekirse kaldır)

Mini Check

  • Go-live sonrası “izleme penceresi” rutin mi?
  • Haftalık review var mı?
  • Dashboard’lar yaşayan doküman mı?

Ne yapmalıyım?

  • Roadmap’e observability bakım sprint’i ekle (ayda 1)
  • Alarm eşiklerini “baseline” ile güncelle
  • Observability çıktısını iş raporlamasına bağla (/tr/veri-analiz-ve-raporlama)
Observability checklist kartı, otel ve B2B’de hızlı incident teşhisi
Observability checklist kartı, otel ve B2B’de hızlı incident teşhisi
MTTR ve hata oranı KPI kartı, deneyim odaklı monitoring hedefi
MTTR ve hata oranı KPI kartı, deneyim odaklı monitoring hedefi
Dashboard ve alert deliverables kartı, teknik ve iş ekipleri için görünürlük
Dashboard ve alert deliverables kartı, teknik ve iş ekipleri için görünürlük

8. Web Sitesi İzlenebilirlik (Log/Metric/RUM) Planlama Şablonunu İndir — Yazılım / Observability

TEMPLATEv1.0Checklist + Sprint

Web Sitesi İzlenebilirlik (Log/Metric/RUM) Planlama Şablonunu İndir — Yazılım / Observability (v1.0)

Bu şablon, kurumsal web sitelerinde log, metric, trace ve RUM katmanlarını iş KPI’larıyla birlikte planlamanızı sağlar. Otel ve B2B senaryolarında rezervasyon/lead drop, JS hata artışı, p95 latency ve CWV bozulması gibi kritik sinyaller için dashboard ve alert eşikleri oluşturur. Amaç; “bozuldu mu?” sorusundan “neden bozuldu, kaç kişiyi etkiledi, kim aksiyon alacak?” seviyesine geçmektir.

Kim Kullanır?

Ajans teknik lideri, DevOps/backend, frontend/performance ekibi, ürün/proje sahibi, otel revenue/e-commerce ve B2B ürün ekipleri.

Nasıl Kullanılır?

  1. Kritik kullanıcı görevlerini ve iş KPI’larını seçin: rezervasyon, lead, login, dashboard, ödeme.
  2. Log/metric/trace/RUM sinyallerini bu görevlerle eşleştirip dashboard katmanlarını oluşturun.
  3. Alert eşiklerini baseline’a göre kalibre edip runbook ve ilk 10 dakika aksiyonlarını yazın.

Ölçüm & Önceliklendirme (Kısa sürüm)

PDF içinde: Problem→Kök Neden→Çözüm tablosu + 14 gün sprint planı + önce/sonra KPI tablosu

Şablonu İndir Ücretsiz • PDF / Excel

9. Sonuç: İzlenebilirlik, teknik sağlık ile iş etkisini aynı ekranda gösterir

Kurumsal web sitelerinde iyi observability, yalnızca hata kaydı tutmak değildir. Log, metric, trace ve RUM birlikte kurgulandığında; bir problemin ne zaman başladığı, hangi release ile ilişkili olduğu, kaç kullanıcıyı etkilediği ve hangi iş KPI’ına zarar verdiği daha hızlı anlaşılır.

Otel ve B2B projelerinde en değerli izleme modeli; rezervasyon/lead sağlığı, CWV, JS hataları, p95 latency, dependency health ve alert runbook’larını tek operasyon düzeninde birleştirir. Bu yaklaşım, ekiplerin “şikâyet gelince bakarız” yerine proaktif teşhis, hızlı aksiyon ve sürekli iyileştirme kültürü kurmasını sağlar.

Bir Sonraki Adım

Log/metric/trace+RUM mimarinizi kurup otel/B2B senaryolarına uygun dashboard ve alarm setini birlikte tasarlayalım.

Sık Sorulan Sorular

Observability nedir, logging’den farkı nedir?
Logging olayları kaydeder; observability log, metric, trace ve RUM verilerini birleştirerek hatanın kök nedenini, başlangıç zamanını ve kullanıcı etkisini anlamanızı sağlar.
Kurumsal web sitesinde hangi log ve metrikleri izlemeliyim?
Minimum set; error rate, p95 latency, throughput, dependency error’ları, CWV, JS errors ve kritik funnel event’leridir. Otelde rezervasyon/ödeme, B2B’de login/dashboard/lead event’leri iş KPI olarak izlenmelidir.
RUM neden önemlidir?
RUM, gerçek kullanıcı deneyimini gösterir. Site teknik olarak ayakta olsa bile kullanıcı tarafında yavaşlık, JS hatası veya funnel drop yaşanıyorsa bunu RUM ile görebilirsiniz.
Alert eşikleri nasıl belirlenmeli?
Alert eşikleri kurumun baseline’ına göre kalibre edilmelidir. Tek bir sabit eşik herkese uymaz; rezervasyon/lead drop, 5xx error rate, p95 latency ve JS error spike gibi sinyaller kendi geçmiş verinize göre ayarlanmalıdır.
Log’larda PII/KVKK riski nasıl yönetilir?
Telefon, e-posta, token, şifre ve form içeriği gibi hassas veriler log’lanmamalı veya maskelenmelidir. Log erişimi RBAC ile sınırlandırılmalı, retention politikası yazılı olmalıdır.
Otel sitelerinde observability en çok nerede değer üretir?
Rezervasyon adımlarındaki drop, ödeme sağlayıcı hataları, kampanya landing CWV bozulmaları ve call/WhatsApp davranışı ile rezervasyon düşüşü arasındaki ilişkiyi izlemek için yüksek değer üretir.
B2B portallerde hangi izleme senaryoları kritiktir?
Dashboard p95 latency, login/session hataları, rapor export problemleri, lead form submit düşüşü ve JS error artışı B2B portallerde kritik izleme senaryolarıdır.
Go-live sonrası izleme rutini nasıl olmalı?
İlk 60 dakika boyunca error rate, login/rezervasyon smoke, p95 latency, dependency health, CWV ve JS error trendleri izlenmelidir. Sonrasında haftalık observability review ile eşikler ve dashboard’lar güncellenmelidir.
Web Observability ve RUM: İzlenebilirlik Rehberi | DGTLFACE