• A Quick Word
  • Posts
  • Microsoft bygger egna AI-modeller i tysthet

Microsoft bygger egna AI-modeller i tysthet

DESSUTOM: OpenAI ger sig in på röst-AI-marknaden, älskvärd startup dubblar sin värdering till över 4 miljarder dollar och nytt nordiskt AI-center bildas i Helsingfors .

Microsoft har avslöjat att företaget i det tysta utvecklat sina egna grundmodeller. Ett besked som lär skapa några minst sagt intressanta möten framöver. De nya modellerna visar tydligt att Microsoft satsar på att utveckla mer egen AI-teknologi, detta mitt under näsan på miljardpartnern OpenAI.

Microsofts nya textmodell ligger för närvarande på en respektabel 13:e plats på rankningslistan. Men satsningen handlar mindre om att toppa listor och mer om strategisk självständighet. Hur förklarar man egentligen artigt för sin partner att man byggt en egen reservlösning vid sidan av, utifall att?

I dagens A Quick Word:

  • Microsoft presenterar egenutvecklad AI mitt under partnerskapsförhandlingar med OpenAI

  • OpenAIs nya AI-röst blir mer uttrycksfull och lär sig hantera telefonväxlar

  • En svensk startup inom "vibe-coding" når oväntat en värdering på 4 miljarder dollar

  • Norden och Baltikum går samman för att bilda ett regionalt AI-nav

Microsoft bygger egna AI-modeller i det tysta

(Källa: Microsoft blog)

Quick Word: Microsoft har presenterat sina egna AI-grundmodeller, en nyhet som knappast kommer att göra miljardpartnerskapet med OpenAI mindre komplicerat. De två nya modellerna omfattar MAI-Voice-1, ett text-till-tal-system, samt MAI-1-preview, en textmodell under testning för Copilot. Microsoft signalerar en tydlig ambition att utveckla mer egen AI-teknologi, mitt under partnerns näsa.

Quick Points:

  • Den nya röstmodellen är imponerande snabb och kan generera en hel minut ljud på under en sekund. Du kan redan nu testa den i Copilot Labs.

  • Den nya textmodellen, MAI-1-preview, tränades på cirka 15 000 NVIDIA GPU:er och ligger för närvarande på en fullt respektabel trettondeplats på LMArenas topplista.

  • Satsningen på intern utveckling ger Microsoft ett betydande tekniskt oberoende, vilket är en ganska intressant position att befinna sig i samtidigt som man omförhandlar sitt partnerskap med OpenAI.

Quick Take: Utvecklingen visar att även de närmaste AI-partnerskapen kan genomgå strategiska förändringar när tekniken blir allt mer central för affärsverksamheten. Vi kan förvänta oss att fler techjättar kommer att bygga egna grundmodeller för att säkra kontrollen över sitt öde och minska beroendet av underleverantörer.

OpenAIs nya uttrycksfulla AI-röst

(Källa: OpenAI blog)

Quick Word: Precis när man trodde att världen hade tillräckligt med kroppslösa röster har OpenAI presenterat ytterligare en. Deras nya modell gpt-realtime siktar på att sticka ut med ett mer uttrycksfullt ton och en förmåga att följa komplexa instruktioner, vilket är mer än vad man kan säga om vissa människor.

Quick Points:

  • Den är utformad för att hantera komplexa kommandon som "tala med eftertryck och fransk accent" och kan till och med uppfatta icke-verbala signaler som skratt.

  • Det uppdaterade Realtime-API:et har nu stöd för integration med telefonisystem via SIP, vilket öppnar för företagsanvändning i exempelvis avancerade kundtjänstrobotar.

  • OpenAI rapporterar en betydande ökning i träffsäkerhet till 82,8 % i ett ljudtest och har sänkt API-priserna med 20 % för att uppmuntra fler att använda tekniken.

Quick Take: OpenAI tar tydligt steget bortom text för att skapa mer naturliga, multisensoriska interaktioner för sina AI-agenter. För utvecklare innebär detta att verktygen för att bygga mer övertygande och responsiva röstapplikationer blir både kraftfullare och mer tillgängliga.

Svenskt AI-stjärnskott ser värderingen dubblas till 4 miljarder dollar

(Källa: Lovable hemsida)

Quick Word: Svenska "vibe-coding"-företaget Lovable får enligt uppgift oombedda investeringserbjudanden som värderar företaget till över 4 miljarder dollar. Detta kommer bara veckor efter senaste finansieringsrundan, vilket tyder på att investerare antingen är mycket intresserade av AI-baserade utvecklingsverktyg eller har gott om kapital att investera. Kan ju vara både och.

Quick Points:

  • Företagets värdering har mer än fördubblats på bara några veckor utan att de ens sökt kapital, en anmärkningsvärd värdeutveckling.

  • Lovable har bekräftat förväntningarna genom att enligt uppgift passera 100 miljoner dollar i årliga återkommande intäkter bara nio månader efter lanseringen.

  • Detta är inte en isolerad guldrusch, hela "vibe-coding"-sektorn drar till sig enorma kapitalinvesteringar, där konkurrenter som Anysphere nått en värdering på 9 miljarder dollar tidigare i år.

Quick Take: Det intensiva investerarfokuset signalerar en stark tro på att AI i grunden kommer att förändra hur utvecklare skapar mjukvara. Just nu är det en trend värd att bevaka noga, även om värderingarna börjar se en aning uppblåsta ut.

Nytt nordiskt AI-center bildas

(Källa: New Nordic AI hemsida)

Quick Word: De nordiska och baltiska länderna bildar ett nytt AI-center, New Nordics AI, för att accelerera regional innovation och policyutveckling. Med ett initialt stöd på 30 miljoner danska kronor syftar initiativet till att samla expertis och hjälpa regionen att bygga upp sin egen kapacitet, istället för att bara låna den från andra.

Quick Points:

  • AI Swedens Mikael Ljungblom och AI Finlands Iida Lähdemäki kommer att fungera som tillförordnade verkställande direktörer för att etablera organisationen och säkra ytterligare finansiering.

  • Initiativet är ett samarbete mellan ledande AI-organisationer i fem nordiska länder, med planer på expansion till Baltikum.

  • Centret invigs officiellt den 22 oktober i Helsingfors och ska fungera som nav för regeringar och företag att samordna strategiskt AI-ledarskap.

Quick Take: Initiativet signalerar regionens ambition att skapa en enad AI-kraft snarare än en samling mindre, fragmenterade insatser. Det kan innebära tydligare policyer, mer finansiering och en starkare regional marknad för AI-innovation.

Quick Tools

  • Leonardo AI Lucid Origins — Erbjuder en avancerad bildgenereringsmodell som är särskilt bra på att följa komplexa instruktioner och skapa bilder med korrekt text.

  • Runway Aleph — En kontextmedveten videoredigerare som låter användare göra komplexa justeringar som att ändra kameravinklar och objekt via textkommandon.

  • Grok Imagine — En AI-bild- och videogenerator som kan skapa 15-sekunders videor med ljud från text- eller bildkommandon, och som även tillåter skapandet av NSFW-innehåll.

  • Ideogram Character Reference — Skapa konsekventa karaktärer över flera AI-genererade bilder genom att använda en enda referensbild.

  • Descript — Redigera video- och poddinspelningar genom att redigera den autogenererade texttranskriptionen istället för tidslinjen.

  • AIVA — Komponera originella och känslomässiga musikspår för allt från filmer till spel med hjälp av en AI-driven virtuell artist.

Behöver du hjälp att navigera ett ständigt skiftande AI-landskap?
Micke Quick är konsult med särskilt fokus på AI och arbetsflöden inom reklam- och marknadsföring. Han hjälper dig med insikter, utbildning, och strategi för implementering av AI.

Läs mer på mickequick.se 

Quick Links

Anthropic har uppdaterat sin datapolicy och kräver nu att Claude-användare aktivt väljer bort att konversationer sparas i fem år och används för modellutveckling.

Framer har säkrat en finansieringsrunda på 100 miljoner dollar med 2 miljarder i värdering, vilket positionerar no-code webbdesignplattformen att utmana konkurrenten Figma.

Cloudflare har introducerat Signed Agents, ett nytt klassificeringssystem som använder kryptografiska signaturer för att hjälpa webbplatsägare verifiera och hantera trafik från användarstyrda AI-agenter.

Caltech har utvecklat ett kvantminnesystem som omvandlar kvantinformation till ljudvågor och förlänger lagringstiden upp till 30 gånger.

Farang har tagit in 1,5 miljoner euro i såddfinansiering för att bygga sitt Stockholmsbaserade AI-forskningslabb med fokus på grundläggande modeller.

FriendliAI har tagit in 20 miljoner dollar i en utökad såddrunda för att skala upp sin plattform för AI-inferens. Målet är att göra det snabbare och billigare att köra stora språkmodeller.

CrowdStrike förvärvar startupen Onum, som arbetar med dataobserverbarhet, för cirka 290 miljoner dollar. Syftet är att stärka företagets förmåga att upptäcka hot mot AI-modeller i realtid.