Burc Karakas · 17 Aralık 2021
Teknoloji devriminin en önemli yanlarından bir tanesi de hiç kuşkusuz en küçük bir verinin dahi anlamlandırılabilecek kadar kıymetli olması ve verilerin ziyan edilmemesi konusudur.
Tanım olarak ele almamız gerekirse veri madenciliği; büyük veri kümelerinin nicel, matematiksel yöntemlerle işlenerek istenen bağıntıya, örüntüye veya karara ulaşılmasıdır. Büyük bir Veri setinin olduğu ve bu veri setinden bir sonuç çıkartılması beklenen her alanda uygulanabilir.
Örnek vermek gerekirse; bir market alışverişiniz yaparken ya da telefonunuzla bir yerde konum bildirimi gerçekleştirdiğinizde hatta sosyal medya üzerinden gerçekleştirdiğiniz bir paylaşım ve verdiğiniz herhangi bir detay dahi anlamlandırılacak ve depolanacak veriler sınıfına girer, üstelik şirketlerin veri tabanlarına giriş yapmış olur. Bu şirketlerde; elde ettiği bu verileri işleyip analiz edip kullanıcıyı daha iyi tanımaya, ürünler satmaya ve trendleri takip etmeye veya yaratmaya çalışıyor. Veri Madenciliği de tam olarak burada kullanılıyor.
Kullanım Alanları
E-Ticaret
Pazar araştırması için veri madenciliği çok kullanılır. Müşterilere ait kredi kartı hareketleri, anketler, ucuzluk kuponları, üyelik kartları ve benzeri ortamlardan veri çekilir. Temel amaç hedef pazarların ve benzer özellikli müşterilerin demografik, coğrafi ve biyografik özelliklerine göre analizidir. Amazon ve E-Bay başta olmak üzere Türkiye’de de çoğu firma ürün satışları arasındaki bağıntıyı bulmak için veri madenciliği yöntemlerini kullanır. Sattıkları ürün gruplarını inceleyerek müşterilerin satın alma alışkanlıklarını bu ürünler arasındaki bağlantıları keşfedebilmektedir. Bu birlikte satılan ürünleri İlginizi çekebilecek ürünler veya bunu alanlar şunları da aldı başlığı altında öneri yaparlar.
Bankacılık Sektörü
Kredi kartı sahtekârlığından bahsetmiştim bunların yanında, hisse senedi ve fon tahminlemesi için kullanılıyor. Son 1 2 yıldaki değişimler güncel olaylara bakılarak gelecek planlaması yapılıyor. Customer Churn yani “Müşterilerin mevcut işletmeyi kullanmayı bırakma Oranı” tahhmini yaparak mevcut müşterileri kaçırmamak için işletmeler: müşterinin daha önceki işlemleri ve kişisel özellikleri gibi bilgileri veri madenciliği yöntemleriyle ortaya çıkarıyorlar.. Buna göre de şirketler bu kullanıcılar için geliştirecekleri strajilerini planlıyorlar.
Güvenlik ve Adli suçlar
Örneğin Amerikada Richmond eyalet polisi SPSS firmasına zamanında suçluları yakalamak için bir sistem geliştirdi. Eski suçluların veya olağan şüphelilerin sicil kaydından ve diğer özelliklerinden yararlanarak istatistiksel olarak suçu kimin işlediğini bulmaya yardımcı olacak bir program geliştirdi.
Tıp ve Biyoloji
Hastanelerde yapılan rutin kan testlerinden ve sağlık tarama testlerinden elde edilen verileri kullanarak çeşitli kanserlerin ön tanısı, kalp verilerini kullanarak kalp krizi riskinin tespiti, acil servislerde hasta belirtilerine göre risk ve önceliklerin tespiti gibi çok geniş bir uygulama sahası söz konusudur. Veri madenciliği başarılı tedavi sonuçları almada etken faktörlerin belirlenmesi, ameliyatlarda yüksek risk faktörlerinin ve hasta sağlığı açısından geriye dönük faktörlerin sınanması, yaş, cinsiyet, ırk ve tedavi yöntemi gibi faktörlerin sınıflanması, tedavi yöntemi geliştirme ve benzeri amaçlarla kullanılmaktadır. Veri madenciliği ile yanlış tedavi ve tanının tespiti, tıbbi malzemelerden tasarruf sağlanmasına yardımcı olabilmektedir
Veri Madenciliğini en çok kullanan mesleklerden Data analyst maaşları dünya genelinde çok yüksektir. Çıkan farklı sorunları çözmek için sürekli yeni teknikler ve farklı yöntemler geliştiriliyor. Önü oldukça açık bir meslek. Akademik olarak da en fazla konferans düzenlenen alanlardan.
Peki nasıl bu mesleğe nasıl yöneleceğim nasıl bir veri madencisi olunuyor. Öncelikle bu işi yapacaksanız matematik , istatistik, kodlama ve İngilizce bilmeniz lazım. Bunları da öğrenebileceğiniz en iyi lisans bölümü Bilgisayar mühendisliği veya Yazılım mühendisliğidir. Matematik istatistik derslerinden sonra 3 ve 4.sınıflarda seçmeli derslerle veri madenciliği yapay sinir ağları gibi dersler alarak bir giriş yapılmasında fayda var. Daha sonra bu alanlarda çalışan bir hocayla yüksek lisans yapıp konuyu ve teknikleri iyice öğrenmek gerekir. Doktorada da ileri seviye teknikler geliştirip meslekte iyice tecrübe kazanabilirsiniz. Bunlar dışında eğer ilginiz varsa ve kararlıysanız internette bulabileceğiniz çevrimiçi derslerle, Google sertifikalı kurslarla bu işi öğrenebilirsiniz.
Hayalinizdeki üniversiteyi bulalım