Dentro la macchina: Come funziona il riconoscimento alimentare con IA
Quando scatti una foto del tuo pranzo con CalMind, una serie complessa di reti neurali si attiva. In meno di un secondo, l'IA esegue operazioni che richiederebbero diversi minuti a un esperto nutrizionista.
Fase 1: Segmentazione
Per prima cosa, l'IA "guarda" l'immagine per distinguere il cibo dagli oggetti non alimentari (come il piatto, la forchetta o il tavolo). Identifica i singoli componenti: la bistecca, le patatine e l'insalata vengono separati in regioni di interesse distinte.
Fase 2: Classificazione
Successivamente, il modello identifica cosa sia ogni componente. Il nostro database è addestrato su milioni di immagini etichettate che coprono cucine di tutto il mondo. Distingue tra un "Cheeseburger" e un "Burger Vegetariano" analizzando texture, pattern di colore e contesto.
Fase 3: Stima Volumetrica
Questa è la parte più difficile. Identificare il "Riso" è facile; sapere se sono 100g o 300g è complesso. CalMind utilizza tecniche di stima della profondità per costruire un modello 3D del cibo rispetto a oggetti di riferimento noti (come posate standard o dimensioni del piatto) per calcolare il volume.
Apprendimento Continuo
Il sistema è progettato per imparare. Ogni volta che un utente corregge una voce (ad esempio, cambiando "Pollo Fritto" in "Pollo al Forno"), il modello diventa più intelligente per l'utente successivo. Questa intelligenza collettiva rende CalMind il database nutrizionale in più rapida evoluzione al mondo.
CalMind