Machine Learning Nedir?

Machine learning yani makine öğrenmesi tanımı 1959 yılında Arthur Samuel tarafından yapıldı. Tanıma göre makine öğrenmesi, bilgisayarlara açıkça programlanmadan öğrenme yeteneği veren çalışma alanıdır. Profesör Samuel IBM’de yapay zeka konusunda bir çalışan ve aynı zamanda bir öncüydü ve bir insandan daha iyi satranç oynayabilen bir program geliştirdi. Bu dönemde yapay zekanın en az bir insan kadar iyi bir performans göstermesine odaklanılmıştı. Özellikle 1980’li yıllarda popülerleşen yapay zekanın belirli alanlarda başarılı olduğu görüldükten sonra daha spesifik alanlarda güvenilir tahminler yapabilmesi için geliştirilmeye devam etti. Böylece 2000’li yıllarda machine learning geliştirildi. Bilişsel bilimin bir parçası olarak insanlarla doğal olarak etkileşime girebilen bu sistem, yaptığı tahminler sayesinde karmaşık problemlere çözüm getirebilme kabiliyetini kazandı.

Yapay zeka, makine öğrenmesine göre çok daha kapsamlı bir terimdir ve insan zekasını taklit eden makine veya sistemler bütününe denir. Yani makine öğrenmesi yapay zekanın bir alt grubudur aslında. İkisinin birçok ortak özelliği olsa da sanılanın aksine aynı şey değillerdir. Aradaki en büyük fark, makine öğrenimi sürecindeki çözümlemelerin tümünün yapay zekanın bir ürünü olması ancak tüm yapay zeka çözümlemelerinin makine öğrenimi olmamasıdır.

Machine Learning Nasıl Çalışır?

Makine öğrenimi süreci verilerin hazırlanması ile başlar. Bu süreci algoritma eğitimi ve makine öğrenmesi modelinin oluşturulması ardından da tahminlerin yapılması ve ayıklanması izler. İlk adım verilerin hazırlanmasıdır. Analiz edilen veriler, Machine Learning modeline göre formatlanmalıdır.

Verilerin Hazırlanması

  • Verilerin örnek bir alt kümesi seçilir. Çözmek istediğiniz problemle alakalı nitelikler ve varsayımlar seçilir. Örneğin konunuz ürün çeşitleri veya müşteri verileri olsun. Sonrasında yapmanız gereken seçtiğiniz bir özelliği elemektir. Ürünün nerede imal edildiği özelliğini kaldırın.
  • Veri kümesini birleştirilir. Birleştirme verileri basitleştirir ve yönetimi kolaylaştırır. Örneğin bir müşteri profili ve bu profilin satın aldığı ürünler kümesi verileri birleştirilir. Böylelikle bir ürünü satın alacak yeni bir müşteri profili oluşturulur.
  • Modelleme için veriler biçimlendirilir ve sıralanır. Kullanılacak format seçilir; düz dosya veya ilişkisel veri tabanı. Bazı algoritmalar, verilerin belirli sırayla dizilmesine ihtiyaç duyar. Örneğin müşteri profili satın aldıklarına veya nerede yaşadığına göre gruplandırılabilir. Bu gruplandırmalara lokasyon veya sayı adeti verilerinin girilmesi gerekebilir.
  • Boş veya eksik değerler kaldırılarak veri düzenlenir. Verilerdek hata ve sapmaları bulmaya yardımcı programlar bulunmaktadır. Amaç verilen tam, eksiksiz ve alakalı olmasıdır.
  • Verilerin normalleştirilmesi yani farklı ölçekteki değerlerin aynı ölçek altında tutulması gerekir. Örneğin bir veri rakam olarak bir veri yüzde olarak girilmiştir. Yapılması gereken hepsini ya rakam ya da yüzde olarak düzeltmektir.

Algoritma Eğitimi

Makine öğrenmesi, algoritmalara dayanmaktadır. Veriler üzerinden bir algoritma oluşturulur. Buna göre de machine learning modeli belirlenir. Doğru algoritmanın kullanılması sonuçların başarılı olmasında oldukça önemlidir. Yapılan seçim uygulama ve mevcut verilerden büyük oranda etkilenmektedir. Ancak yaygın olarak kullanılan bazı algoritmalar vardır:

  • Regresyon algoritmaları: Doğrusal ve lojistik regresyon, verideki ilişkileri anlamak için kullanılan regresyonlardan sadece ikisidir. Bu regresyonlarda bağımlı ve bağımsız değişken bulunur. Örneğin doğrusal regresyon, bir satış görevlisinin yıllık satışları (bağımlı değişken) ile eğitim durumu (bağımsız değişken) arasındaki ilişkiyi anlamaya çalışır.
  • Karar ağaçları: Verilen eylemler arasında belirlenen kurallara bağlı olarak istenilen sonuca varmak için en uygun yolu tavsiye eder. Örneğin at yarışı için iddiaya girdiniz ve kazanacak atı tahmin etmek istiyorsunuz. Atla ilgili yaş, kazanma yüzdesi ve soyağacı gibi verileri girebilirsiniz. Karar ağacı algoritması belirli kuralları uygulayarak size en uygun kararı gösterir.
  • Örnek tabanlı algoritmalar: Belirli sayıdaki veri noktaları, diğer veri noktalarına olan yakınlıklarına bağlı olarak, belirli sayıda gruplandırmaya dahil edilirler.
  • Kümeleme algoritmaları: Kümeleme, grupların belirli ortak kayıtlarına göre gruplama yapar ve bu kayıtları da grubu tanımlamak için kullanır. Bu işlem, önceden bilgi sahibi olunmadan yapılır. Değişik kümeleme yöntemleri bulunmaktadır.

Tahminlerin Yapılması

  • Veriler hazırlandıktan ve algoritma eğitildikten sonra, makine öğrenme modeli veriler hakkında kendi başına tespitler veya tahminler yapabilir. Örneğin otomobiller için iki temel değeri olan bir veri kümemiz olsun: ağırlık ve hız. Ulaşılan değerler, hafif otomobillerin hızlı ve ağır otomobillerin yavaş olma eğiliminde olduğunu gösteren bir grafik çizebilir.
  • Makine öğrenme modeli, sağlanan veriler sonucunda, bir otomobilin hızlı/yavaş veya hafif/ağır olma eğiliminde olup olmayacağını tahmin etmek için algoritmayı kullanır. Bunu doğrudan bir insan müdahalesi olmadan yapar. Sağlanan daha fazla veri, model tahminlerinin doğruluğunu test eder ve doğruluk oranlarının geliştirilmesini sağlar.

Kısacası, machine learning’in temel dayanağı, verilerini işleyebildiği algoritmalar oluşturmak ve sonucu istatiksel analiz kullanarak tahmin etmektir. Bu süreç içerisinde ulaşılan yeni veriler de öğrenilmeye devam edilir, sonuçların güncellenmesi ve geliştirilmesi için kullanılır.

Machine Learning Yaklaşımları

Yaklaşımlar aşağıda verilen temel kategorilere ayrılmaktadır.

  • Denetimli öğrenme: İyi sınıflandırılmış ve açıkça etiketlenmiş verileri kullanır. Etiketlere bağlı yapılan tahminlerin doğru veya yanlış olduğunu söyleyen geri bildirimler sayesinde denetlenir ve geliştirilir. Örneğin babunları tanımlamak için bazı etiketler ve sınıflandırılmış hayvan görüntüleri kullanılır. Veriler tanımlanır ve tahminlerin doğru olup olmadığına dair geri bildirim alınır. Böylece tahminler iyileştirilebilir.
  • Denetimsiz öğrenme: Genellikle fazla sayıdaki etiketlenmemiş verileri kullanır. Twitter veya İnstagram gibi etiketlenmemiş ve sınıflandırılmamış veri sağlayan sosyal medya uygulamaları buna iyi bir örnektir. Denetimsiz öğrenme algoritmaları, bu verileri belirli ortak özelliklere ve kümelere bağlı olarak sınıflandırır ve bu verilerden bir anlam çıkarmaya çalışır. Yapılan tahminlerin doğruluğu hakkında bir geri bildirim alınmaz. Çünkü esas amaç verilerde gizli olan yapılandırmalara göre sınıflandırma özelliğini geliştirmektir. E-postaların spam olduğunu belirleme olayı da iyi bir örnektir. Denetimsiz öğrenme, hiçbir insan müdahalesi olmadan tonlarca maili analiz eder ve onları spam veya spam değil olarak sınıflandırır. Bu işlemi bir insanın yaptığını ve harcanılacak zamanı hayal edebiliyor musunuz?
  • Takviyeli öğrenme: Denetimli öğrenmeye benzer bir modelidir ancak algoritma örnek veriler kullanılarak eğitilmez. Bu model deneme yanılma yoluyla öğrenmektedir. Örneğin bir robotun test sırasında bir yere çarpması ve sonrasında gitmesi gereken doğru yolu öğrenmesi gibi.

Machine Learning Neden Önemlidir?

En önemli neden günlük hayatımızdaki kullanımının artması, fonksiyonel ve pratik işler için makine öğrenmesine daha sık başvurulmasıdır. Bunun yanında başka birçok neden vardır:

  • Amazon Prime Video ve Netflix gibi platformlarda algoritmalar sayesinde öneriler sunar.
  • Siri veya Alexa gibi ses asistanlarının oluşumunu sağlar.
  • Kendini kontrol edebilen araçların ortaya çıkışına neden olmuştur.
  • Karakter tanıma ve yüz algılama gibi özellikler sunmaktadır.

Verileri insan müdahalesi olmaksızın analiz edebilen ve en iyi tahminleri sunan machine learning birçok kurumsal uygulamada da kullanılmaktadır. Aynı şekilde sağladığı imkanlarla birçok meslek dalına da yardımcı olmaktadır. Verilerin analizindeki kolaylık ve en iyi tahminlerin verilmesi, anormalliklerin tanımlanması ve problemlerin çözümlenmesi gibi fonksiyonlarıyla machine learning günümüz dünyasında gittikçe ihtiyaç duyulan bir uygulama haline gelmektedir. Analistler, insan kaynakları, müşteri ilişkileri yönetimi ve iş zekası gibi birçok alan machine learning sisteminden destek almaktadır.

 

Bir önceki yazımıza  https://smartpro.com.tr/javascript-nedir-en-cok-kullanilan-javascript-kodlari/ linkinden ulaşabilirsiniz.

 

Net framework