• A Quick Word
  • Posts
  • Googles mystiska "nano banana"-projekt äntligen avslöjat

Googles mystiska "nano banana"-projekt äntligen avslöjat

DESSUTOM: Anthropic släpper Claude som agent i Chrome, en 2,3 miljarder dollar satsning på AI för HR och en ny teknik ger AI procedurellt minne

Google har äntligen skalat bort mystiken kring sitt projekt 'nano-banana' och avslöjar en kraftfull ny bildmodell kallad Gemini 2.5 Flash Image. Lanseringen ger utvecklare betydligt mer finkänslig kontroll över bildredigering via enkla textkommandon. En av de mest efterlängtade funktionerna är möjligheten att bibehålla en karaktärs utseende över en hel bildserie.

Genom att inkludera möjligheten till precisa lokala ändringar i bilden, som att ta bort ett objekt eller ändra färg på kläder, positionerar Google modellen som mer än bara en bildgenerator. Det är en direkt utmanare till specialiserade bildredigeringsverktyg. Både juniora designers och konkurrerande företag bör se upp så man inte halkar på bananskalet.

I dagens A Quick Word:

  • Googles 'nanobanan-projekt' är avslöjat och visar upp en smart ny bildmodell

  • Anthropic släpper Claude som agent i Chrome

  • Ett riskkapitalbolag satsar 12,3 miljarder dollar på AI för HR-mjukvara

  • En ny teknik ger äntligen AI-agenter ett procedurellt långtidsminne

Google skalar bort hemlighetsmakeriet

(Källa: Google Blog)

Quick Word: Google har nu officiellt lanserat Gemini 2.5 Flash Image, resultatet av det tidigare hemliga projektet 'nano-banana'. Den nya modellen, som redan har imponerat på användare i olika utvärderingsplattformar, ger betydligt mer detaljerad kontroll över bildskapande och redigering med hjälp av enkla textinstruktioner.

Quick Points:

  • Modellen kan bibehålla en karaktärs konsekventa utseende över flera bilder. Det innebär att du äntligen kan skapa en storyboard utan att din huvudperson oförklarligt byter ansikte i varje bildruta.

  • Den utför precisa lokala redigeringar i bilder utifrån kommandon i naturligt språk, som att ta bort ett objekt eller ändra färg på kläder, och beter sig nästan som en osedvanligt kompetent praktikant.

  • Modellen är nu tillgänglig för utvecklare via Gemini API och kostar den ganska specifika summan 0,039 dollar per genererad bild.

Quick Take: Uppdateringen positionerar Gemini som en seriös konkurrent till specialiserade bildredigeringsverktyg genom att integrera avancerade funktioner i en generell språkmodell. För kreatörer och utvecklare innebär detta att komplex bildmanipulation i flera steg nu blir tillgänglig via ett enkelt, konversationsbaserat gränssnitt.

Anthropic släpper lös Claude i webbläsaren (men under uppsikt)

(Källa: Anthropic blog)

Quick Word: Anthropic vill låta sin AI-assistent hantera administrativa uppgifter i webbläsaren. Företaget testar just nu ett nytt tillägg som kan klicka på knappar och fylla i formulär åt användaren. Företaget är berömvärt öppet med säkerhetsriskerna och medger att de måste lösa flera allvarliga problem innan en bredare lansering kan bli aktuell.

Quick Points:

  • Claude for Chrome är tänkt att fungera som en agent som kan utföra uppgifter som att hantera din kalender eller göra utläggsrapporter direkt i webbläsaren.

  • Den största utmaningen är "prompt injection", där dolda instruktioner på en webbsida kan lura AI:n. Inledande tester visade en attackframgång på 23,6 % innan nya skyddsåtgärder infördes.

  • Funktionen är för närvarande en begränsad förhandsversion för 1 000 prenumeranter på Max-planen. Du kan dock anmäla dig till väntelistan om du vill hjälpa till att hitta de återstående buggarna.

Quick Take: AI-agenter i webbläsaren är uppenbart nästa stora steg för alla ledande laboratorier. Anthropics öppna och försiktiga tillvägagångssätt visar att säkerhetsproblemen är det största hindret för en verkligt användbar digital assistent.

AI + HR = 12,3 miljarder dollar

(Källa: Dayforce)

Quick Word: Riskkapitalbolaget Thoma Bravo förvärvar HR-mjukvaruföretaget Dayforce för svindlande 12,3 miljarder dollar. Affären (archive.is) visar att även lönehantering kan locka till sig skyhöga värderingar om man adderar tillräckligt med AI till den ofta otacksamma världen av human capital management.

Quick Points:

  • Kontantaffären värderar Dayforce till 32 procent över marknadsvärdet, vilket visar hur mycket investerare är villiga att betala för en position inom AI-driven företagsmjukvara.

  • Dayforce planerar att använda investeringen för att påskynda sin AI-drivna produktutveckling och säkra sin position som ledande plattform för en automatiserad arbetskraft.

  • Affären är en del av en bredare trend där investerare riktar in sig på etablerade företag inom företagsmjukvara för att dra nytta av den digitala transformation som drivs av AI.

Quick Take: Den enorma prislappen bekräftar att värdet av AI alltmer ses i automatiseringen av centrala, mindre glamorösa företagsfunktioner som HR och lönehantering. Räkna med att de vanliga företagsverktyg du använder kommer att bli betydligt smartare, vare sig du har bett om det eller inte. Men det företag som knäcker automatiskt tidrapportering med hjälp av AI har sin framtid säkrad.

AI-agenter får äntligen ett långtidsminne

(Källa: Memp: Exploring Agent Procedural Memory)

Quick Word: AI-agenter får ett välbehövligt minneslyft som gör att de slipper lära sig samma sak flera gånger. En ny teknik från forskare vid Zhejiang University och Alibaba Group ger agenter ett "procedurminne" som låter dem lära av tidigare erfarenheter istället för att börja om från början.

Quick Points:

  • Ramverket ger agenterna ett minne av hur uppgifter ska utföras, vilket hindrar dem från att behöva börja om från noll varje gång.

  • Det fungerar genom att bygga ett bibliotek av lyckade och misslyckade arbetsflöden, så att agenten inte ständigt behöver uppfinna hjulet på nytt (om det inte är ett särskilt intressant hjul).

  • Minnet är överförbart. Det betyder att en kraftfull modell kan skapa erfarenheten och sedan föra över kunskapen till en mindre, mer kostnadseffektiv modell för implementering.

Quick Take: Denna utveckling tar AI-agenter ett steg närmare att bli pålitliga digitala medarbetare istället för bara bräckliga kommandotolkare. Möjligheten att överföra kunskap från dyra till billigare modeller gör att storskalig och komplex automation nu känns betydligt mer realistisk.

Quick Tools

  1. Klu — Ett verktyg för företag som spårar och förbättrar språkmodellers (LLM) resultat genom att samla in feedback från användare i realtid för att finslipa prompter.

  2. Artisan AI — En AI-plattform som automatiserar affärsprocesser, skräddarsydd för driftsteam med fokus på sömlös integration i befintliga arbetsflöden.

  3. Bloop — Ett semantiskt sökverktyg för kod som förstår kontexten i dina kodarkiv (repositories), vilket snabbar på utvecklingen och underlättar kunskapsdelning.

  4. Metaphor — En avancerad AI-driven sökmotor som förstår frågor i naturligt språk för att möjliggöra djupare research och nya upptäckter på webben.

  5. Kaiber — Ett AI-drivet text-till-video-verktyg för att snabbt och kreativt skapa animerade konceptbilder och storyboards.

  6. Kits.AI — En AI-plattform för musikproduktion som automatiserar mixning, mastring, generering av harmonier och vokal-isolering med avancerad AI i studiokvalitet.

  7. Loudly — En AI-musikgenerator med full kontroll över genre, instrument och energinivå för att skapa dynamiska och molnbaserade kompositioner.

Behöver du hjälp att navigera ett ständigt skiftande AI-landskap?
Micke Quick är konsult med särskilt fokus på AI och arbetsflöden inom reklam- och marknadsföring. Han hjälper dig med insikter, utbildning, och strategi för implementering av AI.

Läs mer på mickequick.se 

Quick Links

IBM och AMD inleder ett partnerskap för att bygga nästa generations arkitekturer som integrerar IBM:s kvantdatorsystem med AMD:s AI-specialiserade chip. Målet är att spränga gränserna för traditionell databehandling.

Meta upplever (archive.is) tidiga avhopp från sitt nya labb för superintelligens. Minst tre AI-forskare har sagt upp sig bara två månader efter att det uppmärksammade initiativet lanserades.

Stanford Digital Economy Lab har upptäckt betydande AI-påverkan på nyutexaminerades anställningsgrad.

Google DeepMind validerade sin AI-modell för väderprognoser i ett verkligt test. Modellen levererade mer exakta tidiga prognoser för orkanen Erin än de officiella fysikbaserade modellerna.

Palo Alto Networks upptäckte att en enda, grammatiskt bristfällig och lång mening är en mycket effektiv metod för att "jailbreaka" stora språkmodeller och kringgå deras säkerhetsbarriärer.

Perplexity står inför en stämningsansökan för upphovsrättsintrång från de japanska mediejättarna Nikkei och Asahi. De anklagar AI-söktjänsten för att olovligen ha skrapat deras artiklar på innehåll.