İspanyol araştırmacılar, BigScience, Meta ve OpenAI'nin yapay zeka dil modellerini matematik, fen ve coğrafya soruları ile test etti. Araştırma, yeni sürümlerin zorlu sorulara daha doğru yanıtlar verdiğini ancak basit sorularda bile güvenilirlik sorunları yaşadığını ortaya koydu. Yeni modellerin, önceki sürümlere göre daha az 'doğrucu' olduğu ve yanıt bulamadığında tahminde bulunma eğiliminde olduğu belirtildi. Araştırma, Nature dergisinde yayınlandı.