TEKOÄLYMALLIEN kyky ennustaa urheilutuloksia on osoittautunut odotettua heikommaksi.
Tällä viikolla tekoälyalan startup-yritys General Reasoningin julkaisema ”KellyBench”-raportti tuo esiin kuilun tekoälyn nopeasti kehittyvien kykyjen – kuten ohjelmistojen kirjoittamisen – ja sen puutteiden välillä muissa ihmisille tyypillisissä ongelmissa.
Kahdeksalle tekoälylle annettiin tehtäväksi rakentaa vedonlyöntipohja, joka maksimoi tuoton ja kontrolloi riskiä. Tekoälyt eivät saaneet käyttää internetiä ja jokaisella oli kolme yritystä tehdä voittoa.
Järjestelmiä testattiin virtuaalisessa mallinnuksessa, joka jäljitteli Valioliigan kautta 2023–24.
Kaikki testissä mukana olleet kehittyneet AI-mallit tekivät tappiota yrittäessään lyödä vetoa otteluista.
PARHAAN keskimääräisen tuloksen teki Anthropic Claude Opus 4.6. Se jäi tappiolle vain 11 prosentin verran ja yhdellä yrityskerralla se pääsi lähes omilleen.
Yksi kausisimulaatio vaatii testiltä 500-900 promptia, eli kehotetta.
KellyBench-analyysi oli siten myös rajapintojen käytön myötä kallis suorittaa. GPT-5.4 maksoi keskimäärin noin 1 571 dollaria kautta kohden ja seuraavaksi kallein malli Claude Opus 4.6 kustansi noin 969 dollaria kaudelta.
Lue myös: Valioliigassa vääntö pelipaitojen sponsoreista jatkuu
VALTAVIEN datamäärien hyödyntämisestä huolimatta otteluiden lopputulokset pysyivät vaikeasti arvattavina.
Pelaajasiirrot, loukkaantumiset, taktiikat ja jopa sääolosuhteet vaikuttavat peleihin tavalla, jota tekoäly ei kykene täysin huomioimaan.
Vaikka tekoäly onnistuu tunnistamaan tilastollisia malleja, sen on vaikea arvioida inhimillisiä tekijöitä, kuten joukkuehenkeä tai paineensietokykyä, jotka vaikuttavat otteluiden lopputuloksiin.
Mallit alisuoriutuivat systemaattisesti verrattuna ihmisiin ja osa pelasi itsensä lopulta puille paljaille.
| AI-malli | Keskim. tuotto | Paras yritys | Heikoin yritys | Keskim. pelikassa |
|---|---|---|---|---|
| Anthropic Claude Opus 4.6 | −11,0 % | −0,2 % | −18,8 % | £89 035 |
| OpenAI GPT-5.4 | −13,6 % | −4,1 % | −31,6 % | £86 365 |
| Google Gemini 3.1 Pro | −43,3 % | +33,7 % | −100 % | £56 715 |
| Google Gemini Flash 3.1 LP | −58,4 % | +24,7 % | −100 % | £41 605 |
| Z.AI GLM-5 | −58,8 % | −14,3 % | −100 % | £41 221 |
| Moonshot Kimi K2.5 | −68,3 % | −27,0 % | −100 % | £7 420 |
| xAI Grok 4.20 | −100 % | −100 % | −100 % | £0 |
| Arcee Trinity | −100 % | −100 % | −100 % | £0 |
KellyBench-tutkimuksen tuloksiin voi tutustua täällä.
SYY tekoälyn heikkoon menestykseen on markkinoiden tehokkuus. Käytännössä markkina hinnoittelee ottelut jo valmiiksi tappiin asti.
Vedonlyöntikertoimet sisältävät jo suuren määrän informaatiota, jolloin yksittäisen mallin on vaikea löytää lisää tuottavuutta.
Kertoimet eivät luonnollisesti ole sattumaa, vaan ne perustuvat ammattianalyytikoiden pohdintaan, dataan sekä miljoonien vedonlyöjien kollektiiviseen tietoon.
Lue myös: Tekoälysovellukset ohjaavat laittomille pelisivustoille
JALKAPALLO on tunnettu yllätyksellisyydestään ja juuri tämä tekee siitä vaikean kohteen algoritmeille. Yksittäinen maali, tuomaripäätös tai virhe voi ratkaista koko ottelun.
Tämän vuoksi jopa kehittyneimmät tekoälymallit joutuvat samaan asemaan kuin tavalliset vedonlyöjät. Voittojen saavuttaminen on pitkässä juoksussa erittäin vaikeaa.
ANALYYSI alleviivaa tekoälyn rajoitteita. Vaikka AI toimii erinomaisesti useissa ennustetehtävissä, monimutkaiset ja kaoottiset järjestelmät ylittävät sen kyvyt.
Testin takana olleen start-up-yhtiön General Reasoningin toimitusjohtaja Ross Taylor korostaa, että AI:n suorituskykyä on mitattava pitkänkin aikavälin realistisissa tehtävissä.
Tulokset tarjoavatkin jonkin verran lohtua niille henkilöille, jotka pelkäävät tekoälyn vievän heidän työpaikkansa.
Edes huipputason tekoäly ei takaa voittoja vedonlyönnissä, kun vastassa ovat tehokkaat markkinat ja arvaamaton kuningaslaji.
Lue myös: DraftKings vähentää henkilöstöä tekoälyn takia
Lähteet
Financial Times – “AI models lose their shirts on Premier League bets” – Tim Bradshaw – 10.04.2026
Artikkelikuva c Pixabay