El yazısından milliyet tahmini

Makine öğrenimi kullanan araştırmacılar, İngilizce yazı yazan birinin Malezya, İran, Çin, Hindistan ya da Bangladeş'ten geldiğini belirleyebiliyor.

Haber Özeti

Tam Sürüm

Makine öğrenimi algoritması kullanan araştırmacılar, İngilizce yazı yazan bir kişinin Malezya, İran, Çin, Hindistan ya da Bangladeş’ten geldiğini belirleyebiliyor. Bu ülkelerden 100’er kişinin İngilizce el yazısını toplayan araştırmacılar bu yazıları Çizgi Dağılım Bulutu (COLD) adı verilen bir araca gösterdi. Araç her bir harfi çizgiler halinde değerlendiriyor ve bu çizgilerin ne kadar düz yada yuvarlak olduğunu inceliyor. Algoritma yazıyı yazan kişinin milliyetini tahmin etme konusunda mevcut yöntemlerden daha başarılıydı. Bazı milliyetlerde başarı oranı eski yönteme göre iki kattan fazla arttı.

Algoritmanın yaptığı şey makine öğreniminin en iyi yaptığı iş: örüntü okumak. Örneğin Çinliler, Latin alfabesi kullanırken daha düz çizgiler çiziyorlar çünkü Çince yazı karakterleri genellikle düz çizgilerden oluşuyor. Öte yandan Hindistan ya da Bangladeş’ten gelen kişilerin yazılarında daha yuvarlak çizgiler ön plana çıkıyor çünkü bu ülkelerin kullandığı alfabeler bu şekilde.

Gerçek hayatta ne kadar kullanılabilir?

El yazısı okumak bilgisayar görüşünün üstlendiği ilk görevlerden biriydi. Eski araştırmalarda duygu, cinsiyet ve yaş belirlenmeye çalışılmış ancak el yazısının sahibini belirleme konusunda çok fazla çalışma gerçekleştirilmemişti. Çünkü bu teknolojiden para kazanmak çok mümkün değil.

Hindistan Çin ve Malezya’dan gelen araştırmacılar bu tekniğin suç araştırmaları konusunda yardımcı olacağını düşünüyor. Polisler suçları çözmek için biyometrik verileri her geçen gün daha fazla kullanıyor. El yazısı okumak ya da yüz tanıma teknolojileri bu alanda polislerin işini kolaylaştırabiliyor.

Kötü niyetli kullanım ihtimali

Ancak araştırmacılar bu teknolojilerin mahremiyet ya da kamu hakları konusunda doğurabileceği endişelerden bahsetmiyor. Örneğin, algoritmayı eğitmek için kullanılan verilerde yer alabilecek hatalar ileride yanlış kişilerin suçlu konumuna düşmesine sebep olabilir. Ya da şirketler el yazısı tanıma yazılımını muhtemel müşterilere milliyetlerine hatta zeka seviyelerine göre ayrım yapmak için kullanabilir.

Zaten kolluk kuvvetlerinin bu teknolojiyi kullanması için araştırmacıların kullandığı veri setinin ciddi anlamda genişletilmesi gerekiyor. Şimdilik sadece ‘ilginç bir proje’ olan COLD bu gelişmelerle birlikte gerçek hayata etkisi olan bir teknoloji haline gelebilir.

Kaynak: Fast Company

Makine öğrenimi algoritması kullanan araştırmacılar, İngilizce yazı yazan bir kişinin Malezya, İran, Çin, Hindistan ya da Bangladeş'ten geldiğini belirleyebiliyor. Bu ülkelerden 100'er kişinin İngilizce el yazısını toplayan araştırmacılar bu yazıları Çizgi Dağılım Bulutu (COLD) adı verilen bir araca gösterdi. Araç her bir harfi çizgiler halinde değerlendiriyor ve bu çizgilerin ne kadar düz yada yuvarlak olduğunu inceliyor. Örneğin Çinliler, Latin alfabesi kullanırken daha düz çizgiler çiziyorlar çünkü Çince yazı karakterleri genellikle düz çizgilerden oluşuyor. Öte yandan Hindistan ya da Bangladeş'ten gelen kişilerin yazılarında daha yuvarlak çizgiler ön plana çıkıyor.

Yorum Ekle

Yorum yazmak için tıklayın

Yorumunuz:

e-Bülten Aboneliği