Yapay zeka, sudokuda rakiplerini yenmeyi başaramadı

Colorado Üniversitesi’nden bir araştırma ekibi, yapay zeka modellerinin güvenilirliğini test etmek amacıyla 6×6 formatında oluşturdukları 2.300 yeni Sudoku bulmacasını kullandı.

Yapılan testlerde, OpenAI’nin “o1” modeli en iyi performansı göstererek toplam bulmacaların yalnızca %65’ini doğru şekilde çözebildi. Diğer modellerde bu oran daha da düşük kaldı.

Yapay zeka modellerinin temel oyunlarda ve bulmacalarda başarısız olduğunu daha önce gördük. OpenAI’nin ChatGPT’si (ve diğerleri), 1979 tarihli bir Atari oyununda bilgisayar rakibi tarafından satrançta tamamen ezildi. Apple’ın yakın tarihli bir araştırma makalesi, modellerin Hanoi Kulesi gibi bulmacalarda zorlanabileceğini de ortaya koydu.

Yapay zekayı sohbet dışında çok zorlamayın

Sohbet robotları da satranç eğitimi olmadığı için kötü sonuçlar alabilir. Mantıklı hamleler bulurlar, ancak üç, dört veya beş hamle sonrasını düşünmezler. Bu, iyi satranç oynamak için gereken temel beceridir. Sohbet robotları ayrıca bazen satranç taşlarını kurallara uymayan veya onları anlamsız bir tehlikeye atan şekillerde hareket ettirme eğilimindedir.

Dolayısıyla, yapay zeka araçları, eğitimleri olmayan konularda ve şimdilik cevaplarını internette bulamayacakları detaylarda pek de başarılı sayılmazlar. Ama yakın gelecekte bunun da değişeceğine emin olabiliriz.

Related Posts

Elektrikli araç sahiplerine soğuk duş! Fiyatlar artıyor

Tesla, Türkiye’deki hızlı şarj istasyonlarının tarifesini güncelleyerek kWh başına fiyatı 7,50 TL’den 8,50 TL’ye çıkardı; diğer marka araçlar için ücret 10,60 TL’ye yükseldi.

Tesla Cybertruck, ikinci elde “çakıldı”

Tesla araçlarını satın alıp Instagram’dan otonom sürüş hikayeleri atarak eğlenenler yeni bir krizle karşı karşıya. Araçlarını ikinci elde satmakta zorlanıyorlar. Krizin öncüsü ise Cybertruck kamyonetleri!

“Nabızdaki Yapay Zeka” ile evde takip sistemleri yeniden tanımlanıyor

AI on the Pulse adlı sistem, giyilebilir sensörler ve çevresel verilerden yararlanarak kişinin fizyolojik düzenini öğreniyor. Yapay zeka, potansiyel sağlık risklerini önceden haber verebilecek düzeyde analiz yapabiliyor.

Opera, Microsoft’un Edge dayatmasını mahkemeye taşıdı

Microsoft’un Edge tarayıcısını kullanıcılara benimsetme çabaları, Opera’yı yasal bir hamle yapmaya itti. Şirket, Redmond devinin uyguladığı “manipülatif tasarım taktiklerini” ve rekabete aykırı yöntemleri gerekçe göstererek Brezilya’da resmi bir şikayette bulundu.

Televizyon karşısında uyumadan önce iki kez düşünün

Pek çok insan için televizyon karşısında uyumak çok doğal bir hareket olabilir. Ama bu aynı zamanda büyük sağlık sorunlarına yol açabilir.

Yeni nesil iPhone CPU’su, orijinal iPhone’dan kaç kat güçlü olacak?

Telefon işlemcileri hızla gelişiyor ve artık minik bir bilgisayar kadar güçlü işlemcilerle çalışıyorlar. Peki ilk iPhone’un işlemcisini bir sonraki iPhone işlemcisi ile karşılaştırırsak, sizce ortaya nasıl bir tablo çıkıyor?