06.11.2025
Online

Apple komt met Pico-Banana-400K om AI-makers op weg te helpen

By: Laura Jenny

BlogOnline

De bananen vliegen je om de oren in de techwereld de laatste tijd. Google heeft met zijn Nano Banana een enorm succes, maar nu komt concurrent Apple ook met zijn eigen Chiquita-situatie: Pico-Banana-400K. Het is echter heel wat anders: het is een dataset die uit 400.000 beelden bestaat waarmee researchers aan de slag kunnen. 

Pico-Banana-400K

Het heeft ook een haakje met Google, want het is gebaseerd op Google Gemini-2.5: het is dus niet helemaal bedoeld als een antwoord of een grote concurrent voor Google. Het is juist bedoeld om mensen een grote dataset te bieden voor beeldbewerking op basis van tekst. Er gaat ook een studie mee gepaard die is gedaan, maar het is dus ook bedoeld voor mensen om juist zelf studies mee uit te voeren. Je kunt het dan ook vinden op Github. Het is niet de bedoeling dat het beeld commercieel wordt gebruikt.

Hartstikke goed, maar waarom is het dan toch zo veelbetekenend? Google heeft met Gemini 2.5-Flash een soort nieuwe standaard gezet voor AI-beelden, maar het is nog lang niet perfect. Zo stellen de onderzoekers van Apple: “Ondanks deze vooruitgang wordt open onderzoek nog steeds beperkt door het gebrek aan grootschalige, hoogwaardige en volledig deelbare bewerkingsdatasets. Bestaande datasets zijn vaak gebaseerd op synthetisch gegenereerde data van propriëtaire modellen of op beperkte, door mensen samengestelde subsets. Bovendien vertonen deze datasets vaak verschillen in domein, onevenwichtige verdelingen van bewerkingstypen en inconsistente kwaliteitscontrole, wat de ontwikkeling van robuuste bewerkingsmodellen belemmert.”

Voorbeeld voor AI-makers

En als je dan met zulke kritiek komt, dan moet je het zelf dus beter doen. Dat voorbeeld hoopt het nu te geven met Pico-Banana-400K. Het ging als volgt te werk. Het nam een selectie echte foto’s uit OpenImages, die mensen, objecten en teksten tonen. Toen kwam het met 35 verschillende aanpassingen die een gebruiker zou willen doen, gegroepeerd in 8 categorieën, zoals foto’s die zich op mensen focussen of juist objecten, of juist gezoomde fotografie.

Vervolgens plaatsten de onderzoekers de foto’s in Nano-Banana met een prompt en wanneer het genereren van de beelden klaar was, lieten ze Gemini-2.5-Pro het resultaat analyseren en het goedkeuren of afkeuren op hoezeer het beeld voldeed aan de instructie. En dat resultaat, dat is Pico-Banana-400K, dat als basis moet dienen voor het trainen van de nieuwe afbeeldingsbewerkingsmodellen.

Share this post