Yard. Doç. Dr Ali osman Pektaş
aliosmanpektas@gmail.com
Sigorta sektörü için Risk yönetimi diğer sektörlere nazaran çok daha önemlidir. Hatta sigortacılık bir yönüyle risk yönetimidir de denilebilir. Yıllardır, sigortacılar yüksek ve düşük risk taşıyan profilleri tanımlayabilmek için ölçülebilir her türlü veriyi kullanmaya çalışırlar. Veri madenciliği yöntemlerinin gelişmesine paralel olarak sigortacılık sektöründe bir kısım analizler gelenekselleşirken her gün yeni yöntemler ve hibrit kullanımlar literatüre eklenmektedir. Yöntemlerin detaylarına girmeden sigortacılık sektöründe risk yönetimi ile ilgili veri madenciliği uygulamalarını iki genel başlık altında özetleyebiliriz.
1) Risk profili belirleme: Sigorta sektöründe yüksek risk taşıyan gruplara genellikle yüksek sigorta hak edişleri çıkarılmaktadır. Sigorta başvuruları esnasında sigortalanacak nesne veya sigorta konusuna paralel olarak yüzlerce farklı bilgi kayıt altına alınmaktadır. Bu veriler kategorik ve numerik ölçekte değişkenlerdir. Bu bilgilerin bir kısmı kullanılamayacak bilgi (noisy information) statüsünde değerlendirilecek olsa bile gene de onlarca farklı veri kullanılarak risk profilleri belirlenebilmektedir.
- Risk profillerinin belirlenmesinde genellikle karar ağaçları kullanılmaktadır.
- Fakat bu süreçte asıl önemli olan veri seti içinde modele girdi olarak kullanılabilecek anlamlı değişkenlerin seçilmesi sürecini yönetmektir. Bu süreçte ise en çok faktör analizleri ile boyut indirgenmesi yöntemleri tercih edilmektedir.
Aşağıdaki şekilde bir sigorta firmasının yüksek riskli olarak etiketlediği (tecrübeye dayalı olarak yapılan bir etiketleme) veri seti ile yapılan bir analiz sonucunda risk faktörlerinin ağırlıklarını görmektesiniz. Bu örnekte sağlık poliçesi incelenmiş ve sağlık poliçelerine şirket tarafından yüksek oranda ödeme yapılan müşteri verileri kullanılarak yüksek risk profili çıkarılmıştır.
2) Sigorta Riski modelleme: Risk faktörlerini belirlemenin ötesinde kurulan dinamik bir model ile müşterinin riskinin belirlenmesidir. Karar ağaçları ve regresyon modelleri genellikle yetersiz sonuçlar vermektedir. Bu durumun başlıca sebebi sigorta sektöründe riskli grubun %10′ luk bir dilime sıkışmış olmasıdır.
Dolayısı ile veriler oldukça çarpık bir dağılıma sahip olacaktır. Karar ağaçları verilerin kısımlandırılmasına dayandığı için birçok durum için (dağılımın çarpıklığı nedeni ile) yanlı sonuçlar üretecektir.
Regresyon modellerinin de çarpık veriler üzerinde etkili sonuçlar vermediği bilinen bir gerçektir. Bu durumda kestirmeden önerilebilecek en iyi çözüm yapay sinir ağı modelleri kullanmaktır. Yapay sinir ağları problemin yapısını öğrenebilme kabiliyetleri ve kullanılan non lineer dönüşümler itibari ile çarpık veri setlerinde daha başarılı sonuçlar verebilmektedir. Fakat yapay sinir ağları kapalı kutu model yapısına sahip oldukları için kullanıcıya iç süreçler hakkında aydınlatıcı bir fikir verememektedirler. Bu yönüyle hem çarpık dağılım probleminin üstesinden gelme hem de iç süreçleri (ör: hangi müşteriye neden yüksek risk atandığı) daha iyi kavrama adına kural tabanlı algoritmalar tahmin modelleri ile beraber kullanılabilir. Bu hibrit yapılar son yıllarda tüm sektörlerde olduğu gibi risk modellemesinde de yaygın olarak kullanılmaya başlanmıştır.