Kina ikapp Silicon Valley inom AI. Nya modeller imponerar

Kinesiska techbolag skickar ett tydligt budskap till världen

Under det kinesiska nyåret valde landets ledande AI-företag att göra något anmärkningsvärt: de presenterade en ny generation artificiell intelligens som alltmer utmanar USA:s dominans på området. Från humanoidrobotar som dansade på scenen till avancerade språkmodeller och videogeneratorer – signalen från Peking var omöjlig att missa.

Det gap som tidigare gynnade system som ChatGPT och Gemini krymper snabbt. En del kinesiska lösningar utmärker sig dessutom med något som de amerikanska jättarna saknar: öppenhet och möjlighet att köra modellerna lokalt, helt utan molnanslutning.

Nyårsfirande med en touch av teknologisk ambition

Det som fångade tittarnas uppmärksamhet under firandet av kinesiska nyåret var humanoidrobotar som utförde komplexa koreografier sida vid sida med mänskliga dansare. Det futuristiska spektaklet fungerade som ett symboliskt skyltfönster för landets ambitioner inom robotik och artificiell intelligens.

Men bakom kulisserna hände ännu mer. De största aktörerna på den kinesiska AI-marknaden valde just detta ögonblick för att lansera sina senaste modeller – videogeneratorer, avancerade chatbotar och multimodala system som samtidigt förstår text, bild och video. Allt detta visar att den kinesiska AI-sektorn, trots amerikanska exportrestriktioner på avancerade chips, inte bromsar upp. Tvärtom hanterar den situationen allt skickligare.

Kinesiska AI-modeller börjar konkurrera på allvar med amerikanska alternativ – inte bara när det gäller kvalitet, utan också kostnad och möjlighet att köra dem lokalt utan att skicka data till externa servrar.

Chipembargots oväntade effekt: Kina lär sig sparsam AI

USA begränsar exporten av avancerade beräkningschips till Kina i syfte att bromsa landets AI-utveckling. I praktiken kan resultatet bli det motsatta. Medan OpenAI och Google pumpade miljarder dollar in i enorma datacenter tvingades kinesiska företag att tänka annorlunda: maximal optimering blev nödvändig.

Modeller som utvecklas i Kina uppnår ofta liknande prestanda med lägre resursförbrukning. Mindre beräkningskraft innebär lägre kostnader och bredare tillgänglighet. Det är ingen teknisk kuriositet – för företag, myndigheter och mindre aktörer runt om i världen kan det leda till avsevärt billigare implementationer.

Till och med OpenAI:s vd Sam Altman erkände i en intervju att takten i Kinas teknologiutveckling är, som han uttryckte det, "remarkable" – verkligt anmärkningsvärd. Att en konkurrent från Silicon Valley väljer det ordet låter som en allvarlig varning för dem som underskattar det kinesiska teknologisprånget.

Öppenhet som vapen: Kinas satsning på open source

En av de största skillnaderna mellan många kinesiska modeller och amerikanska alternativ är synen på öppenhet. Många nya system lanseras som open source-projekt eller så kallade open-weight-modeller, som går att ladda ner och köra lokalt utan ständig kontakt med tillverkarens servrar.

Open source – hela källkoden publiceras, ofta tillsammans med träningsdata och dokumentation.
Open-weight – koden och träningsdata kan förbli stängda, men modellens vikter – resultatet av träningsprocessen – görs tillgängliga.

I båda fallen kan användaren installera modellen i sin egen miljö, exempelvis på ett företags servrar, och hantera den helt på egen hand. Det förändrar spelplanen på ett fundamentalt sätt. Konversationsinnehåll hamnar varken hos OpenAI eller Google. Informationsflödet till Kina går dessutom att blockera helt, eftersom modellen enbart körs i den egna infrastrukturen.

För företag och offentlig förvaltning är detta ett avgörande argument: AI-verktyg utan krav på att skicka kund- eller medborgardata utanför organisationen.

En våg av nya modeller: från filmliknande videor till multimodala chatbotar

Seedance 2.0: ByteDances svar på filmproduktionens AI-revolution

Den modell som väckt mest uppmärksamhet på sistone är Seedance 2.0 från ByteDance, ägaren till TikTok. Det är en videogenerator som utifrån en kort textbeskrivning kan skapa scener som ser ut som klipp ur storbudgetfilmer. Realistiska kamerarörelser, genomarbetat ljus och figurer som liknar skickliga skådespelare – reaktionerna på nätet lät inte vänta på sig.

Seedance 2.0 är dock ett stängt system och finns varken som open source eller open-weight. Dessutom hamnade ByteDance snabbt på radarn hos Hollywoodstudior. Disney, Paramount och Netflix anklagar företaget för upphovsrättsintrång och antyder att modellen kan ha tränats på deras skyddade material. Tvisten är ännu olöst, men den illustrerar hur djupt generativ AI nu tränger in i territorier som tidigare var förbehållna traditionell filmproduktion.

Qwen3.5 från Alibaba: en chatbot med ögon och öron för allt

Alibaba presenterade Qwen3.5, en nästa generations vision-language-modell. Det är en chatbot som inte bara bearbetar text utan även bilder och video på ungefär 200 språk. Den kan fungera som en agent som självständigt fyller i formulär, navigerar på webbplatser och analyserar skärmdumpar.

Dess främsta styrka är tillgängligheten: Qwen3.5 finns under en öppen licens och kan laddas ner från GitHub. För utvecklare är det ett tydligt tecken på att kinesiska företag vill bygga globala ekosystem kring sina modeller – ungefär som Android en gång byggdes kring Linuxkärnans öppna kod.

GLM-5 och kinesiska chips i stället för amerikanska

Zhipu AI lanserade GLM-5, en modell inriktad på så kallad agentintelligens, flerstegsresonemang och uppgifter som kräver god logisk förmåga. Projektet bygger på tekniken DeepSeek Sparse Attention, som medvetet begränsar modellens uppmärksamhetsfokus vid varje givet tillfälle – vilket ger högre effektivitet vid lägre beräkningskraft.

Det mest symboliska draget är ändå ett annat: GLM-5 har tränats uteslutande på kinesiska Huawei Ascend-processorer. Det gör modellen oberoende av amerikanska tillverkare och visar att Kina kan bygga avancerade AI-ekosystem utan tillgång till Nvidias senaste chips.

DeepSeek, Moonshot och de kinesiska svaren på ChatGPT

Inom textmodellernas värld väcker det kommande DeepSeek-systemet störst förväntningar. Version V3, som lanserades för ett år sedan, överraskade med ett imponerande förhållande mellan prestanda och träningskostnad. I många tester närmade den sig ChatGPT och krävde betydligt färre resurser för att nå liknande resultat.

Version V4, vars lansering väntas inom de närmaste dagarna, ska enligt läckta uppgifter vara särskilt stark inom programmering. Sajten The Information rapporterar att modellen i kodtester ska prestera bättre än både Claudes från Anthropic och de aktuella GPT-generationerna från OpenAI.

I det sammanhanget bygger även Moonshot AI sin position med modellen Kimi K2.5. Den använder en så kallad "mixture of experts"-arkitektur (MoE), liknande Gemini 3.0 Pro. I stället för en enda enorm universell hjärna delar systemet upp sig i specialiserade undernätverk som ansvarar för olika typer av uppgifter. Det begränsar kostnaderna, förbättrar hanteringen av beräkningskraft och levererar ändå svar av hög kvalitet.

Modell	Företag	Huvudfunktion	Öppenhet
Seedance 2.0	ByteDance	Videogenerering från text	Stängd
Qwen3.5	Alibaba	Multimodal chatbot (text, bild, video)	Open source
GLM-5	Zhipu AI	Avancerat resonemang, agenter	Open source
DeepSeek V4	DeepSeek	Textmodell, programmering	Planeras öppen / open-weight
Kimi K2.5	Moonshot AI	Chatbot med MoE-arkitektur	Öppna och kommersiella versioner

Gapet krymper: var befinner sig Kina och Silicon Valley i dag?

ChatGPT och Gemini presterar fortfarande bättre i övergripande riktmärken, särskilt på engelska och i mycket krävande uppgifter. Skillnaderna minskar dock i snabb takt. För många företagsanvändare och utvecklare väger faktorer som licensflexibilitet, driftskostnad och möjlighet att köra modellen lokalt allt tyngre.

Kinesiska system uppfyller dessa krav allt oftare. Företag kan ladda ner en modell, anpassa den till sina egna data, begränsa internetåtkomsten och bygga interna verktyg på den grunden. För europeiska och svenska företag är det ett ytterst attraktivt scenario: full kontroll över data och inget beroende av en enda amerikansk molnleverantör.

Om trenden håller i sig kan kinesiska open source-projekt inom några år bli inte bara ett alternativ, utan det självklara förstavalet i många branscher.

Vad betyder detta för användare och företag i Sverige?

För den vanlige användaren innebär den här konkurrensen fler verktyg att välja mellan – inte bara nya chatbotar utan också videogeneratorer, dokumentsammanfattningssystem och kontorsrobotar som självständigt fyller i data i företagssystem. Mer konkurrens ökar chanserna för lägre priser och snabbare funktionsutveckling.

För företag och offentlig förvaltning växer ett reellt alternativ till tjänster som ChatGPT Enterprise fram. Modeller från Kina kan driftsättas lokalt, utan att data lämnar företaget eller landet. Samtidigt ökar betydelsen av juridiska frågor: open source-licenser, EU:s regelverk kring AI och riskerna med att träningsdata kan ha använts utan upphovsrättshavarnas tillstånd.

Det är också värt att förstå vad begreppet "open-weight" faktiskt innebär. För många organisationer är det den gyllene medelvägen: de får tillgång till en färdigtränad modell som kan anpassas till specifika uppgifter utan att behöva gå igenom hela träningsprocessen från grunden. Kostnaderna sjunker dramatiskt och implementationstiden räknas i dagar snarare än månader.

Parallellt ökar energieffektivitetens betydelse. Modeller som åstadkommer mer med samma beräkningskraft öppnar dörrarna för AI på svagare hårdvara – från lokala servrar på små företag till datorer i skolor och sjukhus. Paradoxalt nog kan de politiska chipexportrestriktionerna påskynda framväxten av just sådana mer "sparsamma" system.

Author

Jonna Jinton

Jonna Jinton är en svensk content creator och bloggare som delar inspiration och praktiska idéer för ett enklare och mer harmoniskt liv. I sina kanaler visar hon kreativa DIY-projekt, vardagliga lifehacks och tips för att organisera livet samt leva närmare naturen. Hennes innehåll kombinerar estetik med användbara råd som kan tillämpas i vardagen.