Otomasyon dergisi, Türkiye'nin otomasyon konusundaki ilk ve en köklü dergisidir. 1992 yılında “Türkiye’de Otomasyonsuz Fabrika Kalmasın” sloganıyla yola çıkan dergi, Türkiye endüstrisinin otomasyon konusunda bilgilendirilmesini kendisine misyon edinmiştir. Dünyadaki ve Türkiye'deki gelişmeleri anında okuruna iletmeyi; otomasyon alanında yapılacak yatırımların, doğru ve kârlı olabilmesi için yol gösterici bir rol oynamayı amaçlamıştır.

5 TEMEL SORUDA VERİ MADENCİLİĞİ NEDİR?

VİZYONER GENÇ

GÜNÜMÜZDE TEKNOLOJİ ŞİRKETLERİ VE KURUMLAR BÜYÜK VERİLER ÜZERİNE ÇALIŞIYOR. YAPILAN ARAŞTIRMALAR, TEKNOLOJİYE HAKİM OLMA DÜZEYİNİN ARTIK VERİYİ DOĞRU KULLANMA VE İŞLEME BECERİSİYLE ORANTILI OLACAĞINI ORTAYA KOYUYOR.

Günümüzde teknoloji şirketleri ve kurumlar büyük veriler üzerine çalışıyor. Büyük bir veri yığınından yararlı bilgiyi çekip çıkarabilmek ise oldukça zahmetli bir iş. Madencilik sonucunda edinilen kazanımları göz önünde bulundurulursa şirketler için sadece sahip oldukları verileri değil dışarıdan alınan verileri de koruyabilmek ve işleyebilmek son derece hassas bir konu haline gelmiştir.

BASİT TANIMI NEDİR?

Kurumlardaki büyük ölçekli olarak tanımlanan ve milyonlarca veriye sahip yazılım sistemlerinden, ihtiyacı karşılayacak değerli verilerin elde edilmesi işlemine veri madenciliği deniliyor. Bu sayede veriler arasındaki ilişkileri ortaya koymak ve gerektiğinde ileriye yönelik doğru tahminlerde bulunmak mümkün hale geliyor. Veri Madenciliği’nde milyarca veri üzerinde çalışılabiliyor. Madenciliğin temel amacının, kurumlardaki karar destek mekanizmaları olarak adlandırılan sistemler için değerli olan veriyi belirli yöntemler ve işlem süreçleri sonrası ortaya çıkarmak olduğunu söylenebilir.

UYGULAMA ALANLARI NELERDİR?

Son 10 yılda piyasadaki hemen her alanda çeşitli şekillerde veri madenciliği yapılıyor. Madencilik; her türlü elektronik ortama dayalı işte, pazarlamacılıkta, bankacılık ve sigortacılıkta artık temel bir disiplin haline gelmiştir. Örneğin, pazarlama alanında kullanılan veri madenciliği sistemi, müşterilerin satın alma alışkanlıklarını tespit ederek bunlara yönelik stratejiler izliyor. Müşterilerin yaş, eğitim, cinsiyet ve lokasyon gibi temel özelliklerinin incelenmesiyle ortaya çıkan satış tahminleri ve pazar sepeti analizleri, sektöre oldukça fayda sağlıyor.

NASIL BİR SÜREÇ İZLENİYOR?

Elde edilmek istenen verinin büyüklüğü ve buna bağlı olarak gerçekleşen işleme işleminin uzunluğuna göre farklı büyüklüklerde süreçler izlense de genel olarak veri madenciliğinin ilerleme sistemini şu şekilde ifade edebilir:
Veri yığınını elde etme ve güvenliğini sağlama
Veri Temizleme
Veri Bütünleştirme
Veri İndirgeme
Veri Dönüştürme
İlgili Veri Madenciliği Algoritmaları Uygulama (Kümeleme, Sınıflandırma, Karar Destek Ağaçları)
Sonuçları ilgili yazılım dillerinde test ve eğitim aşamasına sokma (R, Python, Java – Makine öğrenmesine giriş)
Sonuçların değerlendirilmesi ve sunulması

VERİ MADENCİLİĞİ YAPABİLMEK İÇİN HANGİ BECERİLERE SAHİP OLMAK GEREKİYOR?

Milyonlarca hatta bazen milyarlarca farklı özelliğe sahip veri üzerinde çalışma yapmak, sabır ve dayanıklılık gerektiriyor. Bilgisayar sistemlerinde sıklıkla karşılaşılan birbirinden bağımsız hatalara ve verilerde meydana gelen ani değişimlere karşı veriyi koruyabilmek çok fazla dikkat gerektiriyor. İleri seviyede matematik, istatistik, lineer cebir, optimizasyon bilgisi, yöneylem modelleme teknikleri ve gelişmiş yazılım becerisine sahip olmak ise olmazsa olmazdır. Yazılım dillerinden veri madenciliği için en uygun olanlar R ve Python dilleridir. Bazı test aşamaları ve deneme işlemleri yapmak için ise Java dili kullanılabiliyor.

GELECEKTE BİZİ NE BEKLİYOR?

Kişisel bilgilere göre sunulan hizmet anlayışının hemen her sektördeki firmaların ortak paydası haline gelmesi, veriyi doğru elde etme ve işleme zorunluluğunu beraberinde getirmiştir. Örneğin, telefonlarınızdan yaptığınız bir ayakkabı araması sonrasında gireceğiniz sitelerdeki reklamların ayakkabı reklamları olmasına, hatta belirli ayakkabı şirketlerinden kısa mesajlar almanıza neden olabiliyor. Yapılan araştırmalar, teknolojiye hakim olma düzeyinin artık veriyi doğru kullanma ve işleme becerisiyle orantılı olacağını ortaya koyuyor.