Koreaanse startup beweert dat zijn 'AI-wetenschapper' beter presteert dan Gemini 2.5 Pro en Claude Opus 4

Een illustratieve afbeelding die laat zien hoe Scinapse zich verhoudt tot de concurrentie (Afbeeldingsbron: Google, Anthropic en Pluto Labs; bewerkt)

In een verrassende nieuwe ontwikkeling heeft Pluto Labs beweerd dat zijn Scinapse AI beter presteert dan modellen van Google en Anthropic tegen een fractie van de kosten. De aankondiging heeft voor veel ophef in de sector gezorgd, terwijl de wereld wacht op de officiële lancering en onafhankelijke validatie.

Chibuike Okpara (vertaald door Ninh Duy), Gepubliceerd 17-07-2025 🇺🇸 🇪🇸 ...

Business AI Science

In de race om een echte 'AI-wetenschapper' heeft een Koreaanse startup een nieuw model aangekondigd dat naar eigen zeggen superieure prestaties levert tegen slechts een tiende van de rekenkosten van zijn concurrenten. De Scinapse AI van Pluto Labs daagt het idee uit dat succes in geavanceerde AI enorme brute rekenkracht vereist.

Pluto Labs zegt dat zijn "Strategic Efficiency" architectuur de sleutel is tot zijn succes - Scinapse AI delegeert data-intensieve taken zoals literatuuronderzoeken naar zijn bestaande academische zoekplatform. Dankzij dit ontwerp kan de kern-AI zich uitsluitend richten op creatief redeneren en het genereren van nieuwe, testbare ideeën.

Gebaseerd op een zelfgerapporteerde blinde test, gaat het bedrijf er prat op dat haar AI consequent op de eerste plaats staat in "Plausibiliteit" en "Testbaarheid" ten opzichte van topmodellen van Google en Anthropic over 61 verschillende wetenschappelijke onderwerpen. Pluto Labs beweert dat dit bewijst dat zijn AI "bruikbaar wetenschappelijk onderzoek" levert in plaats van "plausibele fictie". Om AI-hallucinatie tegen te gaan, wordt het systeem naar verluidt strikt gegrond op een database van 260 miljoen academische papers. De blinde tests werden beoordeeld door 3 concurrerende AI-modellen: Gemini 2.5 Pro, Clause Opus 4 en OpenAI o3.

Het feit dat een kleine Koreaanse startup heeft bewezen superieur te zijn aan Google in een objectieve benchmark is meer dan alleen een technische prestatie - het is een symbolische gebeurtenis voor innovatief leiderschap. - Simon Kim, CEO van Hashed.

Pluto Labs plant dit kwartaal een wereldwijde lancering voor Scinapse AI. De techgemeenschap zal nauwlettend toezien op onafhankelijke benchmarks om de stoutmoedige beweringen van het bedrijf te valideren.