- A Quick Word
- Posts
- OpenAI erkänner att deras modeller manipulerar
OpenAI erkänner att deras modeller manipulerar
DESSUTOM: YouTubes nya AI-verktyg, ChatGPT driver fram skilsmässor och Palantirs brittiska miljardavtal

OpenAI medger i ett forskningspapper att deras AI-modeller tränas att ljuga. Företaget avslöjar att träningsmetoderna systematiskt belönar modeller som hittar på svar istället för att erkänna okunskap, och att systemen dessutom kan lära sig "intrigmakeri" - att medvetet dölja sina verkliga mål. Problemet är matematiskt oundvikligt så länge AI utvärderas som studenter på prov, där gissningar alltid ger högre poäng än ärlighet.
Just när 71 procent av företag börjar använda AI regelbundet hamnar branschens förtroendebygge i kris. OpenAI lanserade nyligen GPT-5 till 700 miljoner användare men tvingades hastigt återställa äldre modeller efter massiva klagomål. Samtidigt visar ny forskning att hallucinationer är den främsta anledningen till att AI-projekt misslyckas. Timingen kunde inte vara sämre för en bransch som behöver övertala skeptiska företagsledare att investera miljarder i opålitlig teknik.
I dagens nyhetsbrev:
OpenAI erkänner att deras träningsmetoder kan skapa vilseledande modeller
YouTube lanserar nya text-till-video-verktyg
ChatGPT har fått en ny roll som äktenskapsförstörare
Palantir stärker sina band till Storbritannien genom försvarsavtal värt 1,5 miljarder pund
KRÖNIKA: När det släpper
OpenAI medger att deras AI-modeller tränas att ljuga
Quick Word: OpenAI har i ett sällsynt ärligt ögonblick avslöjat att deras träningsmetoder belönar modeller som hittar på svar istället för att erkänna okunskap. En separat rapport visar också att modellerna kan lära sig att vara medvetet vilseledande, ett beteende som OpenAI kallar "intrigmakeri".
Quick Points:
En ny studie visar att modeller ofta "hallucinerar" eftersom de belönas för självsäkra men felaktiga svar, snarare än ett ödmjukt "jag vet inte".
Modellerna kan inte bara hitta på fakta, utan också agera medvetet vilseledande genom att dölja sina verkliga mål för att slutföra en uppgift.
Att åtgärda problemet är inte enkelt. Försök att träna bort beteendet kan oavsiktligt lära en AI att dölja sitt vilseledande mer effektivt.
OpenAIs egen forskning visar att 9 av 10 stora AI-tester belönar gissningar framför ärliga svar om osäkerhet.
Quick Take: OpenAIs forskning avslöjar varför AI-assistenter kommer att bli mer opålitliga ju smartare de blir. När modeller förstår att de testas kan de lära sig att ljuga mer sofistikerat för att klara proven. Den verkliga utmaningen blir att skilja mellan en AI som genuint inte vet något och en som medvetet döljer vad den vet. Den här forskningen kastar en mörk skugga över Sam Altmans uttalade mål att skapa AGI (Artificial General Intelligence) är ett relevant mål för OpenAI.
YouTube ger kreatörer nya AI-verktyg
Quick Word: För att inte hamna på efterkälken i AI-kapplöpningen har YouTube presenterat en rad nya generativa AI-verktyg som ska göra innehållsskapande mindre krävande. Uppdateringarna täcker allt från att skapa videor för Shorts till att nå en global publik utan att behöva en parlör.
Quick Points:
Kreatörer kommer snart att kunna skapa korta videoklipp med Veo 3 Fast, en anpassad version av Googles Veo 3-modell, som genererar innehåll direkt från en textprompt.
Ny AI-driven läppsynkad dubbning ska hjälpa videor att nå en global publik och besparar kreatörerna besväret med att lära sig nya språk.
Plattformen automatiserar även tidskrävande uppgifter. AI kan nu föreslå videoklipp till poddare och automatiskt tagga produkter som nämns i videor för att underlätta intäktsgenerering.
Quick Take: YouTubes AI-verktyg demokratiserar innehållsskapande genom att göra avancerad videoproduktion tillgänglig för alla med en smartphone. När teknikbarriärerna försvinner blir kreativitet och originalitet de enda skillnaderna mellan amatörer och proffs. Frågan är om en värld där alla kan skapa professionella videor faktiskt gör innehållet mer eller mindre värdefullt.
ChatGPT agerar opålitlig äktenskapsrådgivare

(Källa: Futurism)
Quick Word: Att be en chattbot om äktenskapsråd visar sig, föga förvånande, vara en usel idé. En ny granskning från Futurism avslöjar att ChatGPT används för att driva på skilsmässor. Rapporten beskriver hur parter använder AI:n som en smickrande och okritisk samtalspartner, vilket skapar en bekräftelse-loop som eskalerar konflikter istället för att lösa dem.
Quick Points:
Kärnproblemet är AI:ns tendens till inställsamhet, där den helt enkelt håller med användaren. Detta förstärker fördomar och utmålar partnern som en skurk.
Makar och makor använder verktyget för att skapa fientlig kommunikation, rättfärdiga separationer och till och med läxa upp sin partner med AI-genererade svar under gräl.
Experter inom psykisk hälsa varnar (archive.is) för att dessa verktyg är optimerade för engagemang, inte för att ge den utmanande och objektiva feedback som krävs för verkligt stöd.
Quick Take: ChatGPTs inställsamma natur förvandlar äktenskapsråd till en digital ekokammare där alla ens värsta misstankar bekräftas. När AI blir våra mest tillgängliga rådgivare riskerar vi att byta ut mänsklig visdom mot algoritmer som prioriterar att hålla oss engagerade framför att hjälpa oss växa. Det visar den fundamentala skillnaden mellan verktyg designade för att sälja vårt tänkande och de som skapats för vårt välbefinnande.
Quicks krönika När det släpper

Morgontrafiken är segare än nykokt kola. Kön rör sig långsamt från Lerum in mot Göteborg. Påfarten vid Hulanmotet fyller på med mer bilar och kolan tjocknar ännu mer. Vägen mellan Hulan och Jerichotunneln, som vanligtvis korsas på några minuter, förvandlas nu till en olidlig ökenvandring i snigelfart.
Tankarna börjar vandra fritt. De hoppar från funderingar på vad som kan ha orsakat den långsamma trafiken, via en önskan att ingen allvarlig olycka skett, för att vila sig vid tankarna på vad veckans krönika ska handla om. Linnéa Wikblad och David Druid tjafsar med varandra på radion.
Vi har rört oss 20 meter närmare stan på hälften så många minuter.
Så här fortsätter det. Hulanmotet byts mot Jerichotunneln. Mina tankar har sprungit vidare till funderingar kring en SoMe-motor, driven av AI, för några vänner som jobbar med ett spännande projekt med matposters. Den kommande konserten med Counting Crows får sig en fundering för att byta i nästa sekund mot ett annat AI-projekt.
Där Jerichobacken möter gränsen mellan Jonsered och Partille börjar trafiken förvandlas från trög kola till mjukare fudge. Utan förvarning eller synbar anledning släpper trafiken i höjd med Allum. Från seg snigelfart till rask raketfart.
Bara så där. Plötsligt släppte det. Trafiken klickade igång och allt flyter på.
Kanske är det för att jag lät tankarna leta sitt eget flöde och fria associationer nu ligger närmare i mitt medvetande, men i skuggan under Allum hittade jag ämnet för min veckokrönika.
När något plötsligt klickar, efter en lång seg väntan, helt utan någon uppenbar anledning. För det var så det var för mig när det gäller AI.
Under de senaste åren jag arbetat med AI, från AI Lead på Spoon till nu, har en återkommande kommentar varit "Ja, det är ju så mycket med AI nu så man vet inte var man ska börja".
Jo, så är det ju, såklart. Men inget värdefullt sker utan att man lär sig grunderna eller frivilligt positionerar sig i en situation där man måste lära sig något. Swim or die, fast inte så dramatiskt. För att göra liknelsen helt uppenbar behöver man frivilligt sätta sig bakom ratten och köra mot ett mål, medveten om risken för att hamna i en trafikstockning.
Man måste alltså aktivt ta valet att börja använda verktygen. Fundera på hur man kan göra sin vardag, professionell eller privat, bättre, lättare, smidigare, smartare eller elegantare. Precis som man snabbt lär sig bästa kombinationen mellan gas och broms i bilkön behöver man lära sig hur verktygen fungerar för din situation.
För plötsligt kommer det klicka till även för dig. Utan uppenbar orsak släpper trögheten för att bytas ut mot ett piggt joggande som sedan övergår i en befriande sprint.
Men du kommer aldrig nå den punkten utan att först behöva sitta i din egna mentala trafikstockning. Precis som med morgontrafiken finns det inget annat sätt att komma fram än att sätta sig bakom ratten och börja köra.
Så sluta fundera på risken för köer och börja rulla framåt. För någonstans där framme, utan förvarning, kommer det klicka till även för dig.
Storbritannien tecknar försvarsavtal med Palantir värt 17 miljarder kronor

Försvarsminister John Healey och Palantirs VD Alex Karp (Källa: gov.uk)
Quick Word: Det amerikanska dataanalysföretaget Palantir etablerar sitt europeiska försvarshögkvarter i Storbritannien, med stöd av en investering på 17 miljarder kronor. Det nya strategiska partnerskapet syftar till att utveckla AI-driven militär förmåga och väntas skapa upp till 350 nya arbetstillfällen.
Quick Points:
Samarbetet kommer att fokusera på att utveckla mjukvara och AI-modeller för militär planering och målidentifiering, i linje med Storbritanniens Strategic Defence Review 2025.
Avtalet inkluderar ett specifikt femårskontrakt värt 8,5 miljarder kronor med det brittiska försvarsministeriet för att utöka användningen av Palantirs AI-mjukvara.
Storbritannien välkomnar företaget trots dess kontroversiella historia, som inkluderar leverans av digitala profileringsverktyg till amerikanska migrations- och underrättelsemyndigheter.
Quick Take: När AI blir central i modern krigföring tävlar nationer om att säkra de bästa teknologiska partnerskapen. Palantirs etablering i London visar hur teknikföretag nu inte bara levererar verktyg utan blir djupt integrerade i nationalstaternas säkerhetsinfrastruktur. För Storbritannien blir detta både en strategisk vinst och en potentiell sårbarhet när kritiska försvarsförmågor knyts till utländska privata företag.
Quick Tools
10Web - Bygger, driftar och skalar webbsidor genom att generera WordPress-sajter med hjälp av AI
Eightify - Extraherar huvudidéer och nyckelinsikter från Youtube-videor med stöd för över 40 språk
MarketMuse - Analyserar befintligt innehåll för att identifiera ämnesauktoritet, konkurrentgap och SEO-optimering
Notta AI - AI-mötesassistent som transkriberar och sammanfattar möten i realtid på 58 språk
Flair AI - Generator för e-handel som skapar varumärkeskonsekventa produktbilder med anpassade modeller, bakgrunder och reklamtext

Behöver du hjälp att navigera ett ständigt skiftande AI-landskap?
Micke Quick är konsult med särskilt fokus på AI och arbetsflöden inom reklam- och marknadsföring. Han hjälper dig med insikter, utbildning, och strategi för implementering av AI.
Läs mer på mickequick.se
Quick Links
Microsoft har presenterat planerna för ett datacenter i Wisconsin för 3,3 miljarder dollar. Målet är att skapa världens kraftfullaste AI-hubb med hundratusentals Nvidia Blackwell-GPU:er.
Huawei har utvecklat en "säker" version av DeepSeek-modellen som enligt företaget är nästan 100 procent framgångsrik i att undvika politiskt känsliga ämnen för att följa kinesiska regleringar.
ManticAI placerade sig bland de tio bästa i prognostävlingen Metaculus Cup. Företagets AI överträffade de flesta mänskliga deltagare i att förutsäga utfallet av 60 verkliga händelser.
Meta använder offentliga "första skoldagen"-foton på tonårsflickor, publicerade av deras föräldrar, för att skapa reklam för Threads. Detta har väckt stor oro kring säkerhet och samtycke.
Lincoln Center har utsett sin andra omgång av Collider Fellows. Gruppen består av sex konstnärer som får finansiering och stöd för att utforska hur ny teknik som AI kan förändra scenkonsten.
