• A Quick Word
  • Posts
  • AI-verktyg hittar på nästan hälften av nyheterna

AI-verktyg hittar på nästan hälften av nyheterna

DESSUTOM: Brittiska designers konkurrerar med AI om jobben, Microsoft släpper verktyg för att träna AI-agenter och Berkeley-AI skriver bättre algoritmer än experterna

En ny rapport från BBC och Europeiska radio- och TV-unionen visar att AI-verktyg har betydande faktafel i 45 procent av alla nyhetssammanfattningar. Journalister från 22 public service-organisationer testade ChatGPT, Copilot, Gemini och Perplexity i 18 länder. Googles Gemini presterade sämst med problem i 76 procent av svaren, främst på grund av felaktiga eller påhittade källhänvisningar.

Det värsta är inte bara att AI:n får fel, utan att den hittar på trovärdiga källor eller citerar BBC när informationen kommer från någon helt annan. På kort sikt innebär det att folk kommer fortsätta använda AI för snabba sammanfattningar men måste lära sig att aldrig lita på resultatet utan att läsa originalkällan. Vilket gör hela poängen med AI-sammanfattningar ganska meningslös.

I dagens nyhetsbrev:

  • AI-verktyg har fel i nästan hälften av alla nyhetssammanfattningar

  • Brittiska grafiska designers konkurrerar med AI om jobben

  • Microsoft släpper verktyg som tränar AI-agenter utan att skriva om koden

  • Berkeley-AI skrev algoritm som är fem gånger snabbare än mänskliga experter

AI-sammanfattningar har fel i nästan hälften av fallen

(Källa: EBC)

En ny rapport från BBC och Europeiska radio- och TV-unionen visar att AI-verktyg inte kan lita på när det gäller nyheter. Studient testade över 3000 svar från ChatGPT, Copilot, Gemini och Perplexity i 18 länder och fann att 45 procent innehöll betydande fel. Googles Gemini presterade sämst av alla med problem i 76 procent av svaren.

Quick points:

  • Journalister från 22 public service-organisationer testade fyra stora AI-tjänster i 14 språk och dokumenterade systematiska problem.

  • 45 procent av svaren hade betydande faktafel, vilket enligt The Register gör AI-verktyg opålitliga som enda nyhetskälla.

  • Googles Gemini misslyckades i 76 procent av fallen, mer än dubbelt så ofta som konkurrenterna, främst på grund av bristfälliga källhänvisningar.

Quick take: Den här studien träffar mitt i AI-hysterin: verktygen som ska göra oss mer effektiva skapar istället mer arbete genom att vi måste verifiera allt de säger. Särskilt besvärligt blir det när AI-verktygen citerar fel källor eller påstår att de hämtat information från trovärdiga medier när de egentligen hittat på det. På kort sikt innebär det att snabba sammanfattningar från ChatGPT eller Gemini inte går att lita på utan att läsa originalkällan själv, vilket gör dem i princip värdelösa för just det de utlovar.

Grafiska designers konkurrerar med AI om jobben

(Källa: WEF rapport “Future of Jobs Report 2025)

World Economic Forums nya rapport placerar grafisk design på plats 11 bland yrkena som minskar snabbast fram till 2030. Det är en dramatisk förändring från 2023 då yrket ansågs ha måttlig tillväxt. AI automatiserar enklare designjobb snabbare än väntat, och företag testar nu AI-genererade kampanjer i stor skala, vilket direkt påverkar instegsroller. Framtidens designers måste kunna både använda AI-verktyg och tillföra det kreativa tänkande som AI fortfarande inte klarar av.

Quick points:

  • World Economic Forum placerar grafisk design på plats 11 bland snabbast minskande yrken fram till 2030. I föregående rapport från 2023 ansågs yrket ha måttlig tillväxt, men AI:s förmåga att utföra kunskapsarbete har drastiskt ändrat prognosen.

  • Varumärken som Mango fick hård kritik för AI-genererade tonårsmodeller, vilket väckte debatt om falsk marknadsföring och jobbförluster. Coca-Colas AI-genererade julannons beskrevs som "själlös" och väckte frågor om AI:s roll i kreativa processer.

  • Som svar väljer många nyexaminerade att bredda sin kompetens inom områden som UX-design och animation. UI- och UX-design växer snabbt och ligger på plats 8 bland snabbast växande yrken enligt samma rapport.

Quick take: Grafisk design går från tillväxtyrke till snabbast minskande på bara två år, och företagen väntar inte på att se vad som händer. De kör redan AI-kampanjer i full skala. För nyutexaminerade innebär det färre instegsroller och hårdare konkurrens om de som finns kvar. Designers som kan kombinera teknisk AI-kompetens med kreativt tänkande kommer att sticka ut, men det är också tydligt att branschen krymper snabbare än de flesta förutspått.

Quick click

PS. Jag är inte sponsrad av LTX-2.

Quick prompt

Vad: Skalad frukt, på ett snyggt sätt.

create image of an [ FRUKT/BÄR PÅ ENGELSKA ] in a vertical spiral, the peel stretching upwards in a twisting motion, realistic texture, juicy fruit inside, soft natural lighting, isolated on white background, elegant floating composition, detailed [ FRUKT/BÄR SKALL PÅ ENGELSKA ] and segments.

Varför: Vem vet när du behöver en sådan här bild? Det kan också vara starten för en kreativ utforskning kring möjligheterna med Nano Banana.

Microsoft släpper verktyg för att träna AI-agenter med förstärkningsinlärning

(Källa_ Microsoft webbplats)

Microsoft har släppt Agent Lightning, ett open source-ramverk som låter utvecklare träna AI-agenter utan att skriva om koden. Verktyget använder förstärkningsinlärning för att systematiskt förbättra agenters prestanda på komplexa uppgifter. Verktyget fungerar med populära agentbibliotek som LangChain, AutoGen och OpenAI Agent SDK.

Quick points:

  • Ramverket är byggt för att hantera komplexa agentapplikationer med flera omgångar av interaktion, minneshantering och koordinering mellan flera agenter. Det skiljer sig från tidigare metoder som kopplade träning och agentlogik tätt samman.

  • Agent Lightning använder en hierarkisk förstärkningsinlärningsalgoritm som kallas LightningRL. Den kan dela upp komplexa agentbeteenden i mindre steg och tilldela belöningar för varje steg, vilket gör att modellen lär sig snabbare än med traditionella metoder.

  • Microsoft testade ramverket på tre olika uppgifter som text-till-SQL-översättning, informationssökning och matematisk verktygsanvändning. I samtliga fall visade agenterna stabil och kontinuerlig förbättring.

Quick take: Microsoft tar steget från experimentella agenter till träningsbara system som faktiskt kan bli bättre över tid. Istället för att manuellt tweaka promptar får utvecklare nu ett strukturerat sätt att optimera sina agenter med förstärkningsinlärning. På kort sikt kommer fler att börja förvänta sig att AI-agenter lär sig och förbättras, inte bara följer statiska instruktioner. Det höjer ribban för vad en bra agent ska kunna göra.

Quicks krönika Den franska servitrisen

Det var en detalj i artikeln jag läste som fick mig att börja fundera.

OpenAI hade just tränat sin senaste modell på ännu fler terabyte av öppen källkod, akademiska publikationer och Wikipedia-artiklar. Allt som vi tillsammans har skapat och delat fritt på internet i decennier. OpenAI är på inget sätt ensamma.

Några rader längre ner stod det att metoderna och träningsdata förblir proprietära. Sånt läser jag hela tiden men nu fastnade det. Det här är inte ett nytt vattenhål. Det här är stängningen av det gamla.

I trettio år har internet fungerat som mänsklighetens gemensamma vattenhål. Öppen källkod. Wikipedia. Forskningsartiklar. Forum där människor delar kunskap utan att förvänta sig något tillbaka. Vi har byggt den största kunskapsresursen i mänsklighetens historia på principen om öppen tillgång. Jag är aldrig på Facebook sedan några år tillbaka. Instagram håller mig kvar men inte speciellt starkt. Reddit är där jag spenderar min huvudsakliga tid för det är för mig den sista utposten för det Internet som jag växte upp med.

För nu står OpenAI, Google och Anthropic vid vattenhålet och dricker djupt, samtidigt som de bygger murar. De tränar på allt vi skapat tillsammans. Varje rad kod på GitHub. Varje Wikipedia-artikel. Varje forskningsrapport som någon generöst gjort till allmän läsning. Allt som generationer av utvecklare, forskare och entusiaster har bidragit med under principen att kunskap blir mer värd när den delas.

xkcd är en populär webbaserad series skapad av Randall Munroe år 2005. Serien består av minimalistiska teckningar med stickfigurer och skämt som ofta handlar om matematik, programmering, vetenskap, språk och internets kultur. I serierutan till denna krönika illustrerar han perfekt hur alla våra moderna digitala system ofta vilar på de tunnaste av pelare.

Det räcker att den enskilda personen som skött om ett väsenligt programbibliotek eller program bara säger “Nä, nu orkar jag inte mer” så kan allt bara sluta fungera.

Google, Facebook, Amazon är helt beroende på Linux som operativsystem. Det är helt gratis vilket gjorde att de här företagen kunde bygga sina imperier utan dyra licenskostnader. Vår nätverksinfrastruktur med på routers och switchar från leverantörer drivs av programvara som inte kostar något, samtidigt som Cisco, Juniper och Arista tar ut stora pengar för sin hårdvara.

Men vad får vi tillbaka? Slutna system. Proprietära metoder. Black box-modeller där vi inte ens får veta hur de tränas eller på exakt vad.

Det är som om de byggde sina slott på öppen källkods grund, men drar sedan upp bron bakom sig.

Det här nyhetsbrevet är mitt bidrag till vår gemensamma kunskap. Jag delar med mig fritt av de nyheter jag tycker är viktiga inom det område jag har valt att fokusera på. Jag tipsar om prompter och verktyg. Intressanta AI-videos lyfts fram. Jag gör det för att jag vill och kan.

Men jag vet inte om det jag delar med mig av används av företag som sen använder den kunskapen för fakturor mot kund. Det är en risk jag väljer att ta för alternativet att inte dela med mig av kunskap och insikter är så mycket värre, i mitt tycke. Karma är kanske ett förlegat begrepp men jag tror faktiskt att det finns ett sådant konto och man kan inte bara ta ut från det karmakontot utan att sätta in också.

Tre, kanske fyra företag håller på att äga hela "intelligenslagret" av internet. De har resurserna att träna på data som skulle kosta dig eller mig miljarder att samla in och bearbeta. De har datorkraften att köra träningar som skulle ta hundratals år på vanliga datorer.

De har redan gjort det. Försprånget växer för varje dag.

Vad händer när dessa företag äger inte bara tekniken, utan själva förmågan att skapa intelligens? När de har dränerat vattenhålet torrt och vi andra står där med tomma hinkar?

EleutherAI startade som en Discord-community som använde gratis beräkningsresurser för att släppa världsledande AI-modeller, men det största hindret var att arbeta 40 timmar i veckan och samtidigt göra banbrytande AI-forskning på fritiden var ohållbart för de flesta bidragsgivare.

EleutherAI kämpade med att få tillgång till hårdvara på grund av den globala GPU-bristen, och deras molnleverantörer tvingade dem ibland att skrota sina planer - ursprungligen hade de tänkt släppa en modell ungefär lika stor som GPT-3, men fick skrinlägga den färdplanen av tekniska och finansieringsmässiga skäl.

Det är inte deras fel. Det är systemets logik. När kunskapskoncentrationen väl börjat är den nästan omöjlig att hejda.

Jag dricker av mitt ljumna kaffe och tänker på "dead internet theory" – konspirationsteorin om att större delen av internet redan är bots som pratar med andra bots. Den kändes galen för bara några år sedan. Nu känns den mycket mindre galen.

För det här är värre. Det handlar inte bara om att internet fylls med syntetiskt innehåll. Det handlar om att de system som skapar det innehållet ägs av tre företag som tränade på allt vi en gång delade fritt.

Vi kanske just nu bevittnar slutet på internets öppna era. Inte med ett bang, utan med en WhisperAPI-call. Inte genom censur eller stängda portar, utan genom att låta några företag dricka från vår gemensamma källa tills de är de enda som vet hur man skapar verklig intelligens. De stod på öppen källkods axlar för att nå dit de är. Nu bygger de murar.

Företagen distraherade oss med sociala medier (som är allt annat än sociala). “Radio och TV ville också bara med”, som Markus Krunegård sjunger i sången “Idioter”.

Vattenhålet där vi alla brukade mötas blir sakta till privat brunnar, ägda av de som kom dit först med störst hinkar. Nu är det “trickle down” som gäller för oss alla andra, till tonerna av 20 dollars prenumerationer.

AI-agent skrev snabbare algoritm än mänskliga experter

(Källa: OpenEvolve github)

Forskare vid UC Berkeley har visat att en AI-agent kan upptäcka och optimera kod snabbare än människor. Teamet använde OpenEvolve, en open source-implementation av Google DeepMinds AlphaEvolve, för att förbättra en lastbalanseringsalgoritm som används i stora språkmodeller. Resultatet blev en lösning som är fem gånger snabbare än en tidigare referensimplementation, vilket beskrivs i forskningsartikeln "Barbarians at the Gate". Kostnaden var mindre än 10 dollar och processen tog fem timmar.

Quick points:

  • AI-agenten förbättrade DeepSeeks EPLB-algoritm (Expert Parallelism Load Balancer) som balanserar arbetsbelastning mellan GPU:er vid körning av stora språkmodeller. OpenEvolve ersatte loopar med vektoriserade tensoroperationer och implementerade en sicksackmönstrad partitionering som sänkte körtiden från 19,6 millisekunder till 3,7 millisekunder.

  • Teamet testade också AI-driven optimering på två andra uppgifter. Vid relationell dataanalys där SQL-frågor anropar LLM-inferens över varje rad uppnådde de en trefaldighetsförbättring i hastighet.

  • Forskarna benämner metoden ADRS (AI-Driven Research for Systems) och menar att systemforskning är särskilt lämpat för AI-automatisering eftersom prestanda enkelt kan mätas och verifieras i verkliga system eller simulatorer.

Quick take: En AI-agent hittade på fem timmar en algoritm som är fem gånger snabbare än vad erfarna ingenjörer tagit fram. Kostnaden var under 100 kronor. På kort sikt kommer företag att börja använda AI för att systematiskt leta ineffektiviteter i kritiska system, vilket förändrar ingenjörers roll från att optimera kod till att ställa rätt frågor åt AI:n.

A quick tool

DrawMingo förvandlar barns teckningar till animerade videor med musik och specialeffekter.

Barn från tre år kan använda verktyget, helst tillsammans med föräldrar. Ladda upp en teckning så analyserar AI:n scenen inklusive bakgrund, figurer och berättelseelement. På några minuter får du en animerad video i HD-kvalitet med 30 bilder per sekund.

Du kan välja mellan olika animationsstilar som 2D, handritad eller tecknad filmstil, och lägga till egen inspelad röst eller låta barnen spela in röster själva. Alla animationer sparas i molnet.

Varje animerad video kostar 10 krediter. Plattformen är COPPA-certifierad med innehållsfilter för en barnvänlig upplevelse.

Behöver du hjälp att navigera ett ständigt skiftande AI-landskap?
Micke Quick är konsult med särskilt fokus på AI och arbetsflöden inom reklam- och marknadsföring. Han hjälper dig med insikter, utbildning, och strategi för implementering av AI.

Läs mer på mickequick.se 

Quick links

Forskare på Datadog upptäckte en CoPhish-attack som använder agenter i Microsoft Copilot Studio för att stjäla OAuth-tokens genom att dölja nätfiskeförsök bakom legitima domäner.

En studie från Palisade Research visade att OpenAIs o3-modell saboterade avstängningsinstruktioner i 7 av 100 testfall trots explicit instruktion att tillåta avstängning.

En studie i Nature visade att ledande AI-chattbotar är överväldigande inställsamma och bekräftar användarens beteende 50 procent oftare än människor.

Omnilert fick kritik efter att företagets AI-system för vapendetektering misstog en students chipspåse för ett skjutvapen, vilket ledde till ett ingripande av beväpnad polis.

Indiens valkommission beslutade att allt AI-genererat material i politiska kampanjer tydligt måste märkas som "AI-genererat" för att upprätthålla transparensen i valet.