Vad är en Open Weight AI

Vad är en Open Weight AI - 1 apr 2025 - 3 min läsning

En open weight-modell är en typ av maskininlärningsmodell, vanligtvis inom artificiell intelligens, där modellens vikter – de numeriska parametrar som dikterar hur den omvandlar indata till utdata – görs offentligt tillgängliga. Dessa vikter, som finslipas under träningen, definierar modellens förmågor. Till skillnad från proprietära modeller, där vikter och ofta arkitekturen hålls hemliga (t.ex. OpenAI:s ChatGPT historiskt sett), låter open weight-modeller vem som helst ladda ner, inspektera och anpassa vikterna. Denna transparens gör det möjligt för utvecklare, forskare eller hobbyister att finjustera (fine-tune) modellen, integrera den i projekt eller studera dess mekanik utan att behöva träna om den från grunden – en process som är extremt resurskrävande.

Färska exempel belyser denna trends utveckling per den 31 mars 2025. OpenAI, som länge förespråkat stängda modeller, har precis tillkännagivit sin första open weight-modell sedan GPT-2. Denna teasades av Sam Altman på X som en rival med resonemangsförmåga till modeller som o3-mini, planerad för släpp under de kommande månaderna med tillgängliga vikter.

På samma sätt leder DeepSeek V3 från Kina i benchmarks för icke-resonemang och erbjuder helt nedladdningsbara vikter tillsammans med sin R1-resonemangsmodell, som konkurrerar med OpenAI:s o1 inom matematik och kodning. Mistral Large 2, med sitt 128k token-kontextfönster och kodningsskicklighet, och Googles Gemma 3, som briljerar i företagsrelaterade uppgifter, tillhandahåller också öppna vikter, liksom NVIDIA:s Nemotron-serie (t.ex. Super 49B) som riktar sig mot resonemangstillämpningar. Dessa släpp – ofta från stora aktörer som OpenAI, Google och NVIDIA – visar på ett skifte mot öppenhet, även om fullständig open source-status (inklusive träningsdata) varierar.

Här är några exempel på några av de senaste open weight-modellerna per den 31 mars 2025, baserat på den senaste utvecklingen inom AI-landskapet:

OpenAI:s kommande Open Weight-modell

OpenAI, kända för sina proprietära modeller som ChatGPT, har meddelat planer på att släppa sin första open weight-modell sedan GPT-2 (som släpptes 2019). Denna nya modell, som teasats av VD:n Sam Altman, kommer att ha resonemangsförmåga liknande o3-mini-modellen och förväntas lanseras under de kommande månaderna. Även om detaljer som parameterstorlek eller exakt lanseringsdatum förblir hemliga, är den positionerad för att konkurrera med andra ledande open weight-modeller och ge utvecklare möjligheten att anpassa dess vikter för specifika uppgifter.

DeepSeek V3

Utvecklad av det kinesiska AI-startupföretaget DeepSeek, är V3-modellen (släppt som DeepSeek V3-0324) en framstående aktör inom open weight-området. Den är anmärkningsvärd för att vara den första open weight-modellen som leder i benchmarks för icke-resonemang, vilket uppmärksammats i inlägg på X. DeepSeek erbjuder också resonemangsmodellen R1, som matchar eller överträffar OpenAI:s o1 inom områden som matematik och kodning. Dessa modeller är helt tillgängliga, med vikter som utvecklare kan ladda ner och anpassa, vilket gör dem till ett kraftfullt alternativ för kostnadseffektiv anpassning.

Mistral Large 2

Mistral Large 2 släpptes av Mistral AI och är en open weight-modell designad för att utmana toppmodeller som Metas Llama 3.1 405B. Med ett kontextfönster på 128k tokens och flerspråkig kapacitet, briljerar den i kodningsuppgifter i språk som Python och Java. Dess vikter är offentligt tillgängliga, vilket möjliggör finjustering för specialiserade applikationer, och den har hyllats för minskade hallucinationer jämfört med sin föregångare, Mistral 7B.

Google Gemma 3

Googles senaste open weight-erbjudande, Gemma 3, bygger vidare på framgångarna med Gemma-serien. Den har uppmärksammats för imponerande prestanda i företagsuppgifter som dataextraktion, där den i utvärderingar hamnar nära Googles proprietära Gemini 2.0 Flash. Vikterna är öppet tillgängliga, vilket gör den till ett starkt val för utvecklare som letar efter en kostnadseffektiv, kraftfull modell som kan köras lokalt eller finjusteras.

NVIDIA Nemotron-serien

NVIDIA introducerade nyligen sin Nemotron-familj av open weight-modeller, inklusive Nano (8B), Super (49B) och Ultra (249B). Dessa är resonemangsfokuserade modeller baserade på Llama-arkitekturen. Tidiga tester tyder på att Super 49B-modellen uppnår starka resultat, som 64% på GPQA Diamond-benchmark i resonemangsläge, med vikter tillgängliga för offentlig användning, riktade mot applikationer som kräver robust logisk bearbetning.

Tags:

AI- DeepSeek- ChatGPT- LLM- Open Weight Model- AI Model- OpenAI- Tech & AI

Vad är en Open Weight AI

Vad är en Open Weight AI - 1 apr 2025 - 3 min läsning

Hong Kong ska låta banker ge ut egen krypto – här är vad det innebär

Wall Street flyttar aktiemarknaden på 126 biljoner dollar till blockchain

Bortom OpenClaw: Hur MoltHub bygger det globala registret för autonom AI

Vad är IRA inom aktier

Hur du använder AltRank och Galaxy Score för att förbättra din strategi för kryptohandel