Iets meer dan twee jaar na de lancering is Grok van xAI het toonaangevende AI-taalmodel geworden, waarmee het OpenAI's ChatGPT, Google's Gemini of DeepSeek, evenals Meta en Anthropic voorbijstreeft. Grok komt volgende week naar Tesla's, zei Elon Musk.
Volgens onafhankelijke tests door derden staat de onlangs uitgebrachte Grok 4 nu bovenaan de prestatietabel van openbare AI-modellen. De drijvende kracht achter de 10x verbetering in redeneringen tussen Grok 3 en Grok 4 waren de AI-rekenclusters die xAI razendsnel bouwde, met een verdubbeling naar 200.000 GPU's op weg naar de geplande miljoen.
Het xAI-team nam contact op met de mensen achter de veeleisende ARC-AGI-prestatietest en vroeg hen om hun AI-tests uit te voeren, met verrassende resultaten:
Eerst de feiten: Grok 4 is nu het best presterende openbaar beschikbare model op ARC-AGI. Dit model presteert zelfs beter dan speciaal ontwikkelde oplossingen die zijn ingediend op Kaggle. Ten tweede is ARC-AGI-2 moeilijk voor de huidige AI-modellen. Om goed te scoren, moeten modellen een mini-vaardigheid leren van een reeks trainingsvoorbeelden en die vaardigheid vervolgens demonstreren tijdens een test. De vorige topscore was ~8% (door Opus 4). Onder de 10% is ruis. Als 15,9% de ruisbarrière doorbreekt, laat Grok 4 een niet-nul niveau van vloeiende intelligentie zien
Een andere onafhankelijke AI-tester, Artificial Analysis, zei dat ze"onze volledige reeks benchmarks hebben uitgevoerd en dat Grok 4 een Artificial Analysis Intelligence Index van 73 haalt, vóór OpenAI o3 op 70, Google Gemini 2.5 Pro op 70, Anthropic Claude 4 Opus op 64 en DeepSeek R1 0528 op 68."
Volgens Elon Musk in de Grok 4 releasepresentatie is het xAI-model nu slimmer dan alle afgestudeerde studenten in alle disciplines samen. Met zijn typische mooie praatjes beweerde de CEO van Tesla dat Grok 4 in staat zal zijn om "nieuwe technologieën" te ontdekken, zoals medicijnen of technische doorbraken.
Toch gaf hij toe dat Grok de komende maand of zo nog steeds slecht zal zijn in beeldherkenning, en hij ging in op de recente supremacistische antwoorden controverse door te zeggen dat"wanneer Grok ver fout gaat, dat meestal komt door iets stoms dat we hebben gedaan, zoals een slechte systeemprompt, of het te veel gewicht toekennen aan bevooroordeelde bronnen."
Musk moet Grok 4 oppompen, want zijn xAI introduceert voor het eerst een betaald premiumniveau. Het heet SuperGrok Heavy en begint bij $300/maand, en omvat wat er in de $30/maand SuperGrok-tier zit die initiële toegang tot Grok 4 geeft, plus toegang tot het Grok 4 Heavy-platform dat hogere tarieflimieten en vroege toegang tot nieuwe functies biedt.
Grok 3 blijft gratis te gebruiken voor het grote publiek, terwijl elke X Premium+ abonnee toegang krijgt tot Grok 4 in de SuperGrok-tier.
Top 10 Testrapporten
» Top 10 Multimedia Notebooks
» Top 10 Gaming-Notebooks
» Top 10 Budget Gaming Laptops
» Top 10 Lichtgewicht Gaming-Notebooks
» Top 10 Premium Office/Business-Notebooks
» Top 10 Budget Office/Business-Notebooks
» Top 10 Workstation-Laptops
» Top 10 Subnotebooks
» Top 10 Ultrabooks
» Top 10 Notebooks tot €300
» Top 10 Notebooks tot €500
» Top 10 Notebooks tot € 1.000De beste notebookbeeldschermen zoals getest door Notebookcheck
» De beste notebookbeeldschermen
» Top Windows Alternatieven voor de MacBook Pro 13
» Top Windows Alternatieven voor de MacBook Pro 15
» Top Windows alternatieven voor de MacBook 12 en Air
» Top 10 best verkopende notebooks op Amazon
» Top 10 Convertible Notebooks
» Top 10 Tablets
» Top 10 Tablets tot € 250
» Top 10 Smartphones
» Top 10 Phablets (>90cm²)
» Top 10 Camera Smartphones
» Top 10 Smartphones tot €500
» Top 10 best verkopende smartphones op Amazon