Az AI-modellek piacán különösen nagy a verseny az egyes megoldások között. A gyártók sorra adják ki a korábbiaknál erősebb nagy nyelvi modelljeiket, amelyek erejét különféle benchmarkok segítségével mérik. Néha azonban ezek a tesztek nehezen értelmezhető kritériumok mentén határozzák meg egy-egy új modell erejét, a pontszámok ezáltal nehezen fordít