In de video testte Mrwhosetheboss Grok (Grok 3), Gemini (2.5 Pro), ChatGPT (GPT-4o) en Perplexity (Sonar Pro). Gedurende de video maakte hij duidelijk dat hij onder de indruk was van de prestaties van Grok. Grok begon heel goed, verslapte een beetje, en kwam toen terug om de tweede positie op te eisen achter ChatGPT. Om eerlijk te zijn, ChatGPT en Gemini kregen hun score omhoog dankzij een functie die de anderen gewoonweg missen - videogeneratie.
Om de test te beginnen, testte Mrwhosetheboss het probleemoplossend vermogen van de modellen in de echte wereld, hij gaf elk AI-model deze prompt: Ik rijd in een Honda Civic 2017, hoeveel van de Aerolite 29" Hard Shell (79x58x31cm) koffers zouden er in de kofferbak passen? Het antwoord van Grok was het duidelijkst, want hij gaf het juiste antwoord "2", ChatGPT en Gemini gaven aan dat er theoretisch 3 in zouden passen, maar in de praktijk 2. Perplexity sloeg de plank mis en deed simpele wiskunde door te vergeten dat het object in kwestie niet vormloos was, en kwam met "3 of 4"
Voor de volgende vraag maakte hij het de chatbots niet gemakkelijk - hij vroeg om advies over het maken van een taart. Naast zijn vraag uploadde hij een afbeelding met 5 items, waarvan er één niet gebruikt wordt voor het maken van taarten - een pot gedroogde porcini paddenstoelen - alle modellen, op één na, trapten in de val. ChatGPT identificeerde het als een potje gemalen gemengde kruiden, Gemini zei dat het een potje krokant gebakken uien was, Perplexity doopte het instant koffie, terwijl Grok het correct identificeerde als een potje gedroogde paddenstoelen van Waitrose. Hier is de afbeelding die hij geüpload heeft:
Top 10 Testrapporten
» Top 10 Multimedia Notebooks
» Top 10 Gaming-Notebooks
» Top 10 Budget Gaming Laptops
» Top 10 Lichtgewicht Gaming-Notebooks
» Top 10 Premium Office/Business-Notebooks
» Top 10 Budget Office/Business-Notebooks
» Top 10 Workstation-Laptops
» Top 10 Subnotebooks
» Top 10 Ultrabooks
» Top 10 Notebooks tot €300
» Top 10 Notebooks tot €500
» Top 10 Notebooks tot € 1.000De beste notebookbeeldschermen zoals getest door Notebookcheck
» De beste notebookbeeldschermen
» Top Windows Alternatieven voor de MacBook Pro 13
» Top Windows Alternatieven voor de MacBook Pro 15
» Top Windows alternatieven voor de MacBook 12 en Air
» Top 10 best verkopende notebooks op Amazon
» Top 10 Convertible Notebooks
» Top 10 Tablets
» Top 10 Tablets tot € 250
» Top 10 Smartphones
» Top 10 Phablets (>90cm²)
» Top 10 Camera Smartphones
» Top 10 Smartphones tot €500
» Top 10 best verkopende smartphones op Amazon
Vervolgens testte hij ze op wiskunde, productaanbevelingen, boekhouden, taalvertalingen, logisch redeneren, enz. Eén ding was universeel voor hen - hallucinatie - elk van de modellen vertoonde op een bepaald punt in de video een zekere mate van hallucinatie; ze spraken met vertrouwen over dingen die gewoon niet bestonden. Hier is hoe elke AI uiteindelijk eindigde:
- ChatGPT (29 punten)
- Grok (24 punten)
- Gemini (22 punten)
- Perplexiteit (19 punten)
Kunstmatige intelligentie heeft geholpen om de meeste taken minder zwaar te maken, vooral sinds de komst van LLM's. Het boek Artificial Intelligence (momenteel $19,88 op Amazon) is een van de boeken die mensen proberen te helpen voordeel te halen uit AI.