Veri Madenciliği Nedir
Teknolojinin gelişmesi ve yaygınlaşması alışkanlıklarımızı da değiştirmektedir. Artık fiziksel olarak yapılan birçok şeyi bilgisayar telefon veya tablet aracılığıyla yapılmaktadır. Sadece birkaç dokunuşla bankanıza ödeme yapabilir, market alışverişi yapabilir, doktor randevusu alabilir ve daha fazlasını yapabilirsiniz. Telefonunuzu veya bilgisayarınızı kullanarak İnternet üzerinden yaptığınız her işlem sonucunda bazı verilerin karşı tarafta birikmesine izin veriyoruz. Şirketin sunucularında biriken verilerin toplanması, analiz edilmesi ve bunlardan "faydalı" öğelerin çıkarılmasına "veri madenciliği" denir. Çukurova Marka Patent Kalite Yönetim ve Danışmanlık olarak veri madenciliği sorularıma bu yazımda açıklık getirdim.
Veri Nedir?
Bilgisayar ortamında bulunan bilgilerin, programlar tarafından işlenebilmesini sağlamak amacı ile derlenmiş ve formüle edilmiş şekline veri denir. Bu kavram genellikle enformasyon alanında kullanılan bir terimi ifade etmek için kullanılır. Tek başına anlam ifade etmez ve kullanılmaz. Bunun yanında enformasyona ve bilgiye temel oluşturan gruplandırmaya ve analiz edilmeye gereksinim duyulan ham bilgi olarak tanımlanır.
Veri nasıl toplanır?
Verilerin toplanmasının iki temel yolu vardır. Bu yöntemlerden ilki, siteye girdiğiniz bilgiler veya sizin izniniz ile sitedeki eylemleriniz esas alınarak yapılan "açık veri toplama" yöntemidir. Başka bir yönteme "kapalı veri toplama" denir ve genellikle sosyal ağlar ve arama motorları gibi web siteleri tarafından toplanan verileri içerir. Bu tür bir veri toplama yönteminin amacı, bu web sitesindeki tüm faaliyetleri izlemek, kullanıcı ilgi alanlarını belirlemek ve buna göre pazarlama faaliyetlerini yürütmektir.
Veri Madenciliği Süreç Veri Filtreleme: Bu, madencilik için hangi verilerin kullanılacağına karar verme aşamasıdır.
Veri temizleme: Toplanan verilerden gereksiz, tutarsız veya gürültülü verilerin çıkarılması adımı.
Veri Birleştirme: Bu adım, benzer özelliklere veya ilgili verilere sahip farklı kaynaklardan gelen verileri birleştirir.
Veri Seçimi: Bu adımda, temizlenmiş ve birleştirilmiş verilerden analize uygun veriler seçilir.
Veri Dönüşümü: Mevcut verilerin madenciliğe uygun bir formata dönüştürülmesi aşamasıdır.
Maden Arama: Bu aşamada, önceden hazırlanmış verilere hedeflenen veri madenciliği algoritmaları uygulanır.
Yorumlama ve Doğrulama: Bir veri madenciliği uygulaması çalıştırıldıktan sonra elde edilen sonuçlar yorumlanır ve bu sonuçların doğruluğu kontrol edilir. Doğrulama işlemi, çeşitli uygulamaların sonuçları karşılaştırılarak gerçekleştirilir.
Veri madenciliği tekniği nedir?
Sınıflandırma: Veri madenciliğinde en yaygın kullanılan yöntemlerden biri sınıflandırma yöntemidir. Bu yöntem, mevcut verilerin özelliklerinin incelenmesini ve önceden belirlenmiş sınıflardan uygun olanına aktarılmasını gerektirir.
Birliktelik Kuralları: Bu, veri madenciliğinde yaygın olarak kullanılan başka bir yöntemdir. Bu yöntem, büyük veri tabanlarındaki ilgili verileri ve aralarındaki bağlantıları tanımlamayı amaçlar.
Kümeleme: Bu veri madenciliği tekniğinin amacı, verileri ilişkilere göre bölümlere ayırmaktır.
Çıkarım: Bir veri kümesindeki eksik sayısal verilerin çıkarımına dayalı bir veri madenciliği tekniği. Aykırı değer analizi: Verilerdeki aşırı varyansı tespit etme yöntemi. Bu yöntem anormal kredi kartı kullanımını tespit eder.
Veri Madenciliği Hangi Alanlarda Kullanılır?
Veri madenciliğinin kullanım alanları ile ilgili herhangi bir sınırlama yoktur ve verinin biriktiği her yerde veri madenciliği yapılabilir. Günümüzde veri madenciliğinin en yaygın olarak kullanıldığı alanlara bakacak olursak;
Bankacılık:
Kredi kartı kullanım alışkanlıklarına göre müşterilerin belirlenmesi.
Kredi taleplerine ilişkin değerlendirmelerin yapılması.
Pazarlama:
Bireylerin satın alma alışkanlıklarının belirlenmesi.
Satış tahmini.
Pazar sepeti analizi
CRM:
Müşteri sadakatinin artırılması.
Pazarlama kampanyalarından en yüksek seviyede yarar sağlama çalışmalarının yapılması.
E-Ticaret:
Sunuculara yapılan saldırıların tespit edilmesi.
Web sitesinde gezinen kullanıcıların davranışlarının belirlenmesi.
Sigortacılık
Sigorta risk gruplarının belirlenmesi.
Gibi alanlarda kullanılmaktadır. Bizler Çukurova Marka Patent Kalite Yönetim ve Danışmanlık olarak bugünkü yazımızda sizlere veri madenciliği hakkındaki bilgileri derledik. Daha fazla bilgi için Bizlere Ulaşın:444 8 148
Hazırlayan;
Stajyer Öğrenci Zeynep Çoban
Mustafa Kemal Üniversitesi Bilişim Teknolojileri Bölümü
Bilgisayar Programcılığı 1.Sınıf


