Föregående
Upplev standardarbetsflödet för appen PhotoRobot Controls
PhotoRobot presenterar hur man konstruerar AI-uppmaningar för att generera anpassade produktfotobakgrunder för robottagna bilder.
Att använda AI för att skapa produktfotobakgrunder är ett sätt att förbättra PhotoRobot robotfångad fotografering. Medan PhotoRobot automatiskt kan ta bort bakgrunden från produktfoton, kan AI-verktyg ersätta bakgrunder med varumärkeskorrekt stil. Ta till exempel att ersätta den exakta bakgrundsborttagningen av PhotoRobot med en bakgrund som visuellt visar produktens rykte.
Det kan vara ett färgschema som kompletterar själva varumärket, eller en fullständig 3D-scen som är värd för produkten. Bakgrunden kan vara en vit ådrad marmor, en djup lila-röd sammet, rubinrött siden eller andra lyxiga texturer. Ännu bättre är att vissa produktbakgrunder kan illustrera föremålets faktiska komponenter, som ingredienser som är specifika för en parfym.
I det här fallet kan AI-verktyg drastiskt spara tid på att hitta och aggregera all relevant produktinformation – särskilt om den inte finns till hands. Teamen kan sedan använda den här informationen när de skapar AI-bilduppmaningar för att generera bakgrunder som är varumärkes- och produktspecifika. Varför inte se själv nedan? Ta reda på hur PhotoRobot-drivna studior utnyttjar AI-verktyg för att förbättra produktbakgrunder och för att införliva i arbetsflöden för studioproduktion.
Att producera fantastiska produktfoton på kortare tid och med mindre ansträngning är fortfarande hörnstenen i PhotoRobot uppdrag. Detta gäller även när AI kan skapa fotorealistiska produktbilder enbart från textmeddelanden. Utgångspunkten är fortfarande ett riktigt produktfoto av hög kvalitet. AI kan sedan berika berättelsen kring den.
Framsteg inom modern AI utökar alltså bara verktygslådan PhotoRobot. Tekniken integreras också smidigt i automatiserade arbetsflöden för fotografering. Med avancerad snabb teknik kan AI påskynda produktflöden i studion och förbättra verkliga produktbilder som vi tar med robot. Robotinläsning säkerställer den höga kvalitet som är nödvändig för produktbilder. Det fungerar också för att producera foton som är mer kompatibla för förbättring med bildgenereringsverktyg.
Om du till exempel använder LED-belysning med låg CRI får du foton där en del av färgspektrumet saknas. Detta leder till kritiska problem för AI-bildgeneratorer, som inte kan återskapa det som inte finns där. PhotoRobot säkerställer dock perfekt belysning, bakgrundsborttagning och efterbehandling av foton för att effektivt köras genom AI. De resulterande bilderna är sedan optimala för ytterligare förbättringar, som bakgrundsbyten eller fullständig 3D-scenteknik.
Varför ta riktiga bilder överhuvudtaget när AI kan generera produktbilderna? Visst, för viss produktmarknadsföring är riktiga foton inte alltid nödvändiga. En djupare granskning av AI-genererade bilder kommer dock ofta att avslöja brister. Det är därför de tenderar att vara användbara endast i begränsade applikationer.
De vanligaste problemen som uppstår med AI-produktfoton är udda typografi och mindre detaljfel. Det är inte lika illa som att se händer med sex fingrar, men ändå märkbart.
AI förvränger ofta dimensioner, samtidigt som man inte uppfyller kvalitetsförväntningarna eller ibland inte matchar reklam och de verkliga varorna. Detta kan ge upphov till både etiska och juridiska problem, vilket stöder behovet av att fortsätta investera i riktig produktfotografering.
För många företag är det fortfarande lämpligt att producera produktfoton på ren vit bakgrund eller transparent bakgrund. Faktum är att majoriteten av PhotoRobot kunder bara kräver dess exakta bakgrundsborttagning.
Men vissa produktlinjer kräver helt enkelt produktbilder av högre kvalitet. Tänk på designer- och lyxmärken med översvallande rykte – Armani, Apple, Louis Vuitton, Rolex. Företag som dessa kommer att kräva professionella foton för tryck i tidningar och reklam på skyltar. Det, liksom bilder för onlineannonser och produktsidor. I samtliga fall måste objektet vara i centrum för fokus i foton. Bakgrunden kan dock också fungera för att dra uppmärksamhet till annonsen och för att särskilja en produkt från konkurrenternas.
Bakgrunden kan matcha färgschemat för själva varumärket, eller framhäva ett föremåls material, textur och design. Ta till exempel att lägga till skuggiga toner i bakgrunden för att lysa upp silver, guld och andra ljusa eller reflekterande produkter. Bakgrunder som dessa är ofta populära i foton av designerarmbandsur, solglasögon, smyckeskollektioner och andra lyxvaror. Även om det primära syftet med bakgrunden fortfarande är att komplettera objektet och inte distrahera bort från det.
I de flesta fall är målet med produktbilder att överföra ett verkligt föremål till den digitala världen. Samtidigt ska objektet vara verklighetstroget, informativt och iögonfallande.
Stora varumärken gör ofta detta genom att investera i mycket avancerade 3D-produktmodeller och pipelines för rendering av 3D-modeller. På så sätt blir tillgångarna mer uppslukande, samtidigt som föremålen också är lätta att placera på alla typer av produktbakgrunder. 3D-visualisering gör det också möjligt för företag att demonstrera utbytbara, rörliga eller interaktiva produktkonfigurationer. Ta till exempel de inbäddningsbara 3D-modellerna av PhotoRobot som används med värdplattformar för 3D-modeller, till exempel vår långvariga Emersya.
Trots det kan expertögon se skillnaden mellan ett riktigt fotografi och en 3D-rendering. Detsamma gäller för helt AI-genererade bilder. Autenticitet saknas helt enkelt, ibland i olika aspekter som det mänskliga ögat lätt urskiljer. Detta begränsar lönsamheten i vissa fall. Det betyder dock inte att 3D-renderingar och AI-bildgenerering inte har någon plats alls i produktfotografering.
På PhotoRobot är målen desamma – autentiska foton med snabbare, enklare och mer skalbara produktionsarbetsflöden.
Trots snabba framsteg inom AI-bildgeneratorer är PhotoRobot fortfarande den snabbare och mer tillförlitliga lösningen, med större avkastning på investeringen. Det finns inga problem när det gäller konsekvens eller kvalitet på resultaten, medan pålitlighet och trohet är en garanti.
När man använder AI inom PhotoRobot-drivna arbetsflöden finns det ett antal områden där AI utmärker sig.
Ett användningsfall skulle till exempel vara att fotografera en samling parfymer för en kund. Men föreställ dig att studion bara har produkterna till hands, med begränsad produktinformation. Det är då AI-prompter enkelt kan hämta relevant data, automatiskt katalogisera den och tillhandahålla strukturerade metadata för objekt.
Studios kan sedan bifoga data till kundens bilder och använda informationen när de byter ut PhotoRobot exakta bakgrundsborttagning. Det kan vara att skapa en bakgrund som är mer representativ för en kunds varumärke, eller för produkten genom dess rykte.
För demonstration är följande en verklig fallstudie som fotograferar en serie Armani Privé-parfymer i PhotoRobot Studio. Själva parfymflaskan finns tillgänglig i studion, men det finns ingen detaljerad metadata med produkten.
I det här fallet kan en AI-prompt samla relevant produktinformation i en strukturerad datamängd för granskning. Dessutom är det möjligt att hämta data om varje artikel i den kompletta doftkollektionen.
Prompten kan hämta doftnamnet, samlingsnamnet och en EAN-kod för varje artikel. Den kan sedan innehålla instruktioner för att skapa data i två format, till exempel: en vanlig TXT-fil och en strukturerad CSV-tabell.
För att hämta en produktlista uppmanar vi först AI genom att beskriva projektet. Prompten bör sedan också ange vilken information som ska hämtas och hur resultaten ska formateras. (Obs: Följande exempel på AI-promptteknik och verkliga utdata är från maj 2025. Tänk på att produktionen kommer att variera mellan olika plattformar och i takt med att tekniken utvecklas i takt med PhotoRobot arbetsflöden.)
Uppmaningen "hämta produktlistan":
Jag bygger en strukturerad datamängd av parfymer för användning i en miljö för produktfotografering och AI-automatisering.
Skapa en komplett översikt över doftkollektionen av Armani Privés parfymlinje, grupperad efter kollektion (t.ex. Les Eaux, La Collection, Les Terres Précieuses, Les Mille et Une Nuits, Kogane Collection, etc.).
För varje parfym, tillhandahåll:
1. Namn på doft
2. Samlingens namn
3. EAN-kod – den internationella streckkoden för standardflaskan på 100 ml
Mata ut resultatet i två format:
- En vanlig, läsbar TXT-fillista, grupperad efter samling (för mänsklig referens).
- En strukturerad CSV-tabell med kolumner: Collection, Fragrance, EAN.
- Förbered filerna för direkt nedladdning.
Inkludera endast parfymer som finns i den officiella Armani Privé-linjen. Om det finns flera EAN-varianter för en doft ska du ange standardversionen på 100 ml (eller den närmaste som finns tillgänglig).
Ta inte med marknadsföringsspråk eller beskrivningar – använd endast strukturerade, faktabaserade data.
Ovanstående prompt innehåller både en vanlig TXT-fil och en strukturerad CSV-tabell. Den innehåller en strukturerad översikt över hela parfymkollektionen, med namn, grupperingar och EAN-koder:
Detta sparar timmar av manuellt arbete för studion. Det, eller onödig fram och tillbaka och ibland fördröjd kommunikation mellan studion och kunden eller leverantören.
Efter att ha tagit bilder med PhotoRobot – med rena bakgrunder och optimal belysning – är det sedan möjligt att förbättra dem ytterligare med AI. För detta integrerar PhotoRobot sömlöst PhotoRoom via API i PhotoRobot styrsystem. Detta möjliggör:
För att ta det ett steg längre är visuellt berättande möjligt genom produktbakgrunden på ett antal sätt där AI kan hjälpa till. Ta till exempel att visualisera de viktigaste doftingredienserna runt varje parfymflaska.
Att hitta visualiserbara ingredienser som är specifika för varje parfym kräver en mer beskrivande AI-prompt. Prompten måste be om att resultaten ska innehålla nyckelanteckningar, visuella teman och designelement för varje objekt. Denna information kommer att hjälpa till att senare uppmana teknikerna att generera bakgrundsbilder som är korrekta för varumärket och produkten.
Ta till exempel följande uppmaning. Vi börjar med att beskriva projektet och bifogar CSV-utdatafilen från den första prompten.
I am preparing a detailed dataset for building a mood board or artistic representation. The dataset must provide structured data to generate visual representations of perfumes using AI. Please provide a detailed CSV table for the perfumes in the following file:
- 2_armani_prive_overview_ean.csv (the output from prompt 1)
Select perfumes only in the dataset:
- La Collection
For each perfume, create the following columns:
1. Fragrance – The name of the perfume
2. Top Notes – Tangible, visualizable ingredients (e.g. flowers, resins, peels)
3. Heart Notes – Tangible, visualizable ingredients
4. Base Notes – Tangible, visualizable ingredients
5. Visual Themes – A short phrase describing the atmosphere and textures the perfume evokes (for artistic use, e.g. “stone walls, golden light”)
6. Bottle Design – A detailed description of the perfume bottle: color and material of the body, shape, color of the cap, and label
Also, keep all ingredients and design details clearly worded for use in image generation. Take for example: resins, woods, herbs, spices, flowers, fruits, leaves, roots, smoke, or textures – e.g., dry, mineral, creamy. Exclude abstract terms like “elegant”, “sophisticated”, or “sensual”. Focus on concrete visual elements like “black glass”, “gold plate label”, “ivory stone cap”, etc.
Additionally, briefly list the main visual themes or textures the perfume evokes (e.g. "golden glow", "stone walls", "church incense", "earthy forest", etc.) — anything useful for background styling or setting a graphic mood.
Prepare a CSV structure that will later be used to generate visual prompts for AI image models like DALL·E. Please format the output clearly and in full.
Uppmaningen ovan resulterar i en detaljerad ingredienstabell enligt specifikation i CSV-filformat.
Till exempel inkluderar resultaten av prompten följande för den första parfymen.
Den andra parfymen har då sina egna resultat som är specifika för föremålet.
Denna strukturerade data om alla parfymer i kollektionen kommer att ge den information som behövs för att börja skapa visuella uppmaningar.
Med den visualiserbara ingredienslistan är nästa steg att konstruera de visuella uppmaningarna för bildgeneratorer. För detta kan prompting AI skapa en ny kolumn "Visual Prompt" för varje enskild parfym i CSV-filen. Detta kräver dock mycket detaljerade instruktioner i den nya prompten. Detta börjar först med att ladda upp den visualiserbara ingredienslistan och sedan beskriva projektet. Prompten måste sedan innehålla flera lager av specifika kommandon. Kommandona täcker promptkraven, vanliga fel att undvika, begränsningar som typografi och utdata samt kvalitetsförväntningar.
Det första lagret i prompten bifogar CSV-filen för analys och ger allmänna instruktioner om uppgiften.
Du får en CSV-fil som innehåller strukturerad data om parfymer från Armani Privé La Collection. Varje rad innehåller:
- Doft (parfymens namn)
- Toppnoter (tydligt visualiserbara ingredienser)
- Hjärtnoter (tydligt visualiserbara ingredienser)
- Basnoter (tydligt visualiserbara ingredienser)
- Visuella teman (atmosfär och texturer som parfymen framkallar)
- Flaskdesign (material, färg, form, etikett och lock)
- EAN (används som namn på bildfilen)
Din uppgift är att generera en ny kolumn som heter "Visual Prompt" som innehåller en fullständig och direkt prompt för AI-bildgenereringsverktyg (t.ex. DALL· E eller mitt under resan).
Det andra lagret i prompten identifierar kraven för varje nytt objekt i den nya kolumnen i CSV-filen.
Varje uppmaning ska beskriva hur man omvandlar ett produktfoto av parfymen (med namnet {EAN}.jpg) till en slutlig bild med följande egenskaper:
För det tredje namnger prompten specifika begränsningar och vanliga fel att undvika.
Nämn inte CSV-filen eller beskriv strukturen. Skriv varje uppmaning som om du vänder dig direkt till AI för att generera bilden för den parfymen.
Resultatet ska framstå som förstklassigt, atmosfäriskt och troget doftidentiteten. Det ska vara omöjligt att skilja från ett professionellt retuscherat redaktionellt fotografi, men helt AI-genererat. Betraktaren ska inte kunna se att bilden är syntetisk.
Nämn eller visa inte heller artificiell generering. Bilden måste se autentisk och fotorealistisk ut.
Den fjärde delen av uppmaningen ger instruktioner när du arbetar med dessa specifika parfymflaskor. Typografi är ett vanligt problem för AI, så det är viktigt att ge mycket tydliga instruktioner om etikettdesign, varumärke och styling.
Pay special attention to the design of the front label on the bottle and its graphics accuracy. The gold plate must include the following exact text, as the original image, centered and aligned as on the real product.
- The slash symbol (" / ") between ARMANI and PRIVĒ is slightly taller than other letters and subtly stylized. It starts slightly below other characters, and ends slightly above the other characters, as on the original image.
- The character "Ē" in PRIVĒ must have a clearly visible horizontal accent mark, while the letter including the accent mark is the same height as other letters. There is a flat horizontal line above it (not an acute line). The line must be the same width as the E below it, not slanted. It must not resemble an É. This is not a diacritic or an accent – it is a flat macron (horizontal bar). In other words, the horizontal line on Ē must resemble a short flat line, like a hyphen, placed precisely above the E. It must not be diagonal like in É.
- Match the exact label design from the reference product photo.
- The label must be identical in typography, spacing, and accents. The label must be the same visual style as the original image, as it is crucial to the brand identity.
- The typography must be accurate and not estimated or replaced. Caution: the typography may be changed for a single character, so follow the details for each character individually.
- Do not change, shorten, or paraphrase any part of the label.
Det sista lagret i prompten fortsätter med förväntningarna för varje visuell uppmaning och ger instruktioner för den nya CSV-filen.
Flaskplattan måste behålla sin proportion, ytfinish och präglade tryckutseende under mjuk belysning.
Denna etikett är varumärkeskritisk – behandla den med samma visuella trohet som en logotyp eller ett varumärke.
Flaskans form är varumärkeskritisk – behandla den med samma visuella trohet som en logotyp eller ett varumärke.
Ändra inte texten eller approximera typen – behandla denna etikett som ett varumärkeskritiskt designelement som måste vara korrekt och skarpt.
Etiketten måste behålla sina verkliga proportioner, sin struktur och sin guldfinish – den är lätt präglad med en mjuk satinglans under mjukt ljus.
Spara resultatet i en ny CSV-fil med alla ursprungliga kolumner plus den nya kolumnen "Visual Prompt".
I slutändan har den resulterande CSV-tabellen den fullständiga listan över parfymer, namn, EAN:er, visualiserbara ingredienser och visuella anvisningar. De visuella uppmaningarna innehåller fullständiga och direkta uppmaningar för AI-bildgenereringsverktyg som DALL· E och Midjourney. Dessa kommer att hjälpa till att skapa anpassade bakgrunder och scener som kreativt kompletterar de riktiga fotona av parfymflaskorna.
När du har skapat de visuella uppmaningarna för varje objekt kan din favorit AI-bildgenerator göra resten. Allt som krävs är att ladda upp PhotoRobot-tagna bilder och mata in de visuella uppmaningarna från CSV-filen för att skapa anpassade bakgrunder. Generatorn kommer att rendera bakgrunden enligt prompttekniken och för rendering i olika stilar.
Samtidigt gör PhotoRobot produktbilder med exakt bakgrundsborttagning det enkelt att byta bakgrunder in och ut. Om en inte matchar perfekt kan dina kvalitetssäkringsteam snabbt skapa en som fungerar. Det, eller be AI-generatorn att justera utdata tills de är tillfredsställande.
Slutligen, om man tänjer på gränserna för AI-bakgrundsgenerering, är det till och med möjligt att rendera scener i full 3D. Detta går dock långt utöver mer enkla bakgrundsbyten. Föreställ dig att du visar upp en fantastisk 3D-miljö med varumärkesexakta landskap utöver de viktigaste ingredienserna. För att uppnå detta krävs en mycket mer ambitiös uppmaning.
För att skapa en fullständig 3D-scen för en av parfymflaskorna krävs en annan sofistikerad uppmaning. Den måste ta hänsyn till scenkompositionen, visuella teman, atmosfäriska element, färgpaletter, belysning och mer. Ta till exempel följande uppmaning.
När du har laddat upp en produktbild till AI:n startar du generatorprompten genom att lista alla krav på bakgrundsscenen. Detta kommer att inkludera informationen för produkten från den visualiserbara ingredienslistan och visuella anvisningar.
Generera hela scenen, inklusive bakgrund, ingredienser, texturer och konstnärlig belysning i harmoni med flaskans design.
Scenens sammansättning:
Bygg en elegant, redaktionell miljö runt flaskan med hjälp av:
Lägg till atmosfäriska förgrundseffekter som rök eller dimma om en del av noterna, delvis över flaskan för realism. Behåll visuell balans, djup och förfining.
Bevara ett framåtriktat perspektiv och en kameravinkel i studiostil.
Ange sedan de kritiska instruktionerna för grafisk noggrannhet för etiketten och flaskan. Det är samma kommandon som i de visuella anvisningarna för utseendet på varje enskilt objekt. Instruktionerna gäller noggrannhet i typografi, etikettdesign, grafik och originalfotoanvändning.
Fråga slutligen AI:n om alla slutliga bildkrav från det enskilda objektets visuella uppmaning. Detta inkluderar att kopiera samma instruktioner som tidigare om proportioner, finish, präglat tryck och belysning. Dessa listar de specifika kvalitetskraven för etiketten, flaskans form, text, typografi och ytterligare designelement. I slutändan bör det slutliga resultatet ta form som en fullständig 3D-scen bakom objektet, som förblir i fokus.
Bedöm själv den resulterande 3D-scenen för parfymens produktbakgrund.
Not: I det här fallet finns det inget sätt att helt integrera det verkliga fotografiet i 3D-världen. Det är nödvändigt för AI-generatorn att istället måla om objektet digitalt för att placera det i 3D-scenen. I det här fallet finns det olika begränsningar, till exempel att det inte finns någon riktig flerskiktskomposition som i Photoshop. Dessutom kvarstår typografiska problem med komplexa tecken. Problem som dessa kommer dock inte alltid att kvarstå och kan lösas förr snarare än senare i takt med att tekniken utvecklas.
I grund och botten kan sammansmältningen av automatiserad fotografering och AI-verktyg dramatiskt berika kundupplevelsen i hela din portfölj. Även om grunden fortfarande är ett verkligt fotografi av hög kvalitet kan AI utöka berättandet kring det. Tekniken stöder tematisk visualisering och kan användas för att i hög grad påskynda arbetsflöden i fotostudior. Det möjliggör snabb informationskälla och syntes, automatisk katalogisering och effektiva bakgrundsbyten (med kunskap om snabb teknik). För att lära sig mer är PhotoRobot-teamet alltid redo att hjälpa företag att förverkliga sin kreativa vision. Fråga bara hur vi kan hjälpa till. Ditt projekt kan till och med finnas med i framtida blogginlägg - om det inte är ett väl bevarat hemligt arbetsflöde, förstås!