AI vs. dieteticieni: poate ChatGPT să evalueze cu exactitate mesele?

AI vs. dieteticieni: poate ChatGPT să evalueze cu exactitate mesele?

©

Autor:

AI vs. dieteticieni: poate ChatGPT să evalueze cu exactitate mesele?
Evaluarea aportului alimentar este un proces esenÈ›ial atât pentru cercetările în nutriÈ›ie la nivel de populaÈ›ie, cât È™i în practica clinică individuală. Metodele tradiÈ›ionale, cum ar fi chestionarele de frecvență alimentară, jurnalul alimentar sau reamintirea de 24 de ore, pot fi obositoare pentru utilizatori È™i susceptibile la erori de raportare. Dezvoltarea de tehnologii digitale È™i, mai recent, apariÈ›ia modelelor lingvistice de mari dimensiuni (LLM) oferă oportunități noi de a automatiza parÈ›ial sau total procesul de estimare a nutrienÈ›ilor. ChatGPT, un LLM creat de OpenAI, a atras atenÈ›ia prin capacitatea de a analiza texte È™i (în ultimele versiuni) imagini.
Cercetătorii irlandezi au dorit să evalueze dacă ChatGPT-4, folosind funcÈ›ionalitatea sa de recunoaÈ™tere a imaginilor (prin încărcarea de fotografii direct în interfață), poate:
  • Să identifice corect alimentele din fotografii.
  • Să estimeze gramajele (porÈ›iile) fiecărui aliment.
  • Să determine conÈ›inutul în nutrienÈ›i (macronutrienÈ›i È™i micronutrienÈ›i) pentru mesele din fotografii.

Fotografiile provin dintr-o bancă de imagini reprezentative pentru dieta adulÈ›ilor din Irlanda (National Adult Nutrition Survey), cu 38 de reÈ›ete diverse, fiecare având câte 3 porÈ›ii de dimensiuni diferite (mică, medie, mare).

Metodologia studiului

Selecția fotografiilor de mese

  • În total, 114 fotografii (38 de tipuri de mese, fiecare în 3 mărimi: mică, medie È™i mare).
  • Mesele cuprindeau de la o singură mâncare (de ex. o felie de tort) până la preparate mai complexe (salate cu multiple ingrediente, sandviÈ™uri, etc.).
  • Pentru fiecare masă s-au măsurat exact alimentele (în grame) È™i s-a calculat conÈ›inutul nutriÈ›ional printr-o bază de date specializată (McCance È™i Widdowson’s, prelucrată în Nutritics).

Estimările ChatGPT

  • S-a folosit ChatGPT-4 într-o sesiune specifică.
  • CerinÈ›a principală a solicitat identificarea alimentelor, câte grame are fiecare È™i o listă de 16 nutrienÈ›i, inclusiv energie, macronutrienÈ›i, fibre, vitamine È™i minerale relevante.
  • Fotografiile au fost încărcate una câte una, ChatGPT returnând de fiecare dată:
  • • Denumirea alimentelor recunoscute.
  • • Estimarea greutății (în grame).
  • • Estimarea conÈ›inutului total de nutrienÈ›i pentru masa respectivă.

Comparație cu dieteticieni

  • Pentru a avea un reper suplimentar, s-au recrutat 7 dieteticieni din Irlanda È™i UK, cu experiență în estimarea aportului alimentar.  
  • Dieteticienii au primit doar mesele cu porÈ›ie medie (38 de fotografii), fiind rugaÈ›i să ofere estimări pentru energie (kcal), proteine (g) È™i carbohidraÈ›i (g). Li s-a cerut să răspundă fără acces la baze de date.

Analize statistice

  • RecunoaÈ™terea alimentelor: s-a calculat precizia, sensibilitatea È™i F1-score, comparând alimentele reale cu cele indicate de ChatGPT.
  • Estimarea porÈ›iei: s-au adunat gramajele propuse de ChatGPT pentru a le compara cu greutatea reală.
  • Estimarea nutrientă: s-au examinat diferenÈ›ele procentuale (±10% ca prag al acurateÈ›ei), testele Wilcoxon, corelaÈ›iile Spearman È™i clasificarea pe quartile.
  • Compararea cu dieteticienii: prin coeficient de corelaÈ›ie intraclase (ICC) între cei 7 dieteticieni È™i ChatGPT.

Rezultate

Identificarea alimentelor din fotografii

  • Au fost 547 de alimente în total.
  • ChatGPT a recunoscut corect 463 (true positive), a omis 84 (false negative) È™i a inventat 35 (false positive).
  • Indicii de performanță:
  • • Precizie: 93,0%.
  • • Sensibilitate (recall): 84,6%.
  • • F1-score: 88,6%.

Estimarea porției (gramaj total al mesei)

  • PorÈ›ii mici: greutatea reală 408,2 g (±155,0), ChatGPT 430,5 g (±166,7), fără diferență semnificativă (p=0,221).
  • PorÈ›ii medii: real 580,5 g (±213,8), ChatGPT 425,8 g (±165,9), subestimare semnificativă (p<0,001).
  • PorÈ›ii mari: real 798,1 g (±255,3), ChatGPT 529,5 g (±167,9), subestimare semnificativă (p<0,001).

În medie, ChatGPT a subestimat greutatea la 76,3% dintre fotografii; eroarea procentuală medie: ~28%.

Estimarea nutrienților pentru toate cele 114 fotografii

  • ChatGPT a subestimat majoritatea nutrienÈ›ilor în medie.
  • DiferenÈ›a relativă <10% la 4 parametri (energie, proteine, carbohidraÈ›i, grăsimi polinesaturate).
  • Pentru celelalte 12 nutrienÈ›i, diferenÈ›a depășeÈ™te ±10%.
  • CorelaÈ›iile Spearman între valorile reale È™i ChatGPT au variat de la 0,29 la 0,83 (media 0,62).
  • În clasificarea pe quartile, proporÈ›ia corectă a fost între 33,3% È™i 57,9% (media 46,8%), iar cazurile de discordanță extremă sub 10% la toate nutrienÈ›ii (media 2,1%).

Compararea cu dieteticieni (doar pentru porțiile medii)

  • ToÈ›i dieteticienii au estimat energie, proteine È™i carbohidraÈ›i pentru 38 mese (unele excepÈ›ii minore).
  • Coeficient de corelaÈ›ie intraclase (ICC):
  • • Energie: ICC = 0,56 (0,38–0,72) -> moderat.
  • • Proteine: ICC = 0,67 (0,53–0,80) -> moderat-bun.
  • • CarbohidraÈ›i: ICC = 0,31 (0,16–0,49) -> scăzut.

Aceste rezultate sugerează că ChatGPT se aliniază rezonabil cu estimările dieteticienilor pentru proteine È™i energie, însă mai puÈ›in la carbohidraÈ›i.

Concluzii

PerformanÈ›a ChatGPT „out-of-the-box”

DeÈ™i ChatGPT nu este specializat în nutriÈ›ie È™i nu utilizează direct baze de date de compoziÈ›ie a alimentelor, el prezintă:
  • Identificare alimentară relativ bună (F1=88,6%).
  • AcurateÈ›e mai ridicată pentru mese mici (porÈ›ii mici).
  • Subestimare a porÈ›iilor medii/mari, tradusă în subestimări pentru majoritatea nutrienÈ›ilor.

Utilitate și limitări

  • Multe dintre erorile de estimare sunt comparabile cu alte modele de recunoaÈ™tere a alimentelor din imagini, dar special antrenate în acest scop.
  • ChatGPT nu are acces direct la tabele oficiale de compoziÈ›ie alimentară, bazându-se pe pattern-uri lingvistice. TotuÈ™i, rezultatele sunt promițătoare dacă s-ar implementa conexiuni cu baze de date validate.
  • Erori mai mari în cazul micronutrienÈ›ilor (de ex. vitamina D, fier etc.), unde modul de preparare È™i fortificare pot varia mult.  
  • Dieteticienii, fără acces la date adiacente (reÈ›ete exacte, branduri, greutăți reale), au prezentat È™i ei un nivel de variaÈ›ie, indicând că estimarea nutrienÈ›ilor dintr-o simplă fotografie este un demers dificil chiar È™i pentru specialiÈ™ti.

Recomandări și direcții viitoare

  • Folosirea de indicii în imagine (obiecte cu dimensiuni cunoscute) È™i cerinÈ›e mai detaliate privind prepararea, brandul È™i contextul pot îmbunătăți acurateÈ›ea ChatGPT.
  • Integrarea cu baze de date nutriÈ›ionale: folosirea tehnicilor de tip generare augmentată de recuperare (RAG) poate oferi un salt calitativ în estimări.
  • Antrenare specifică pe imagini de mese din diverse regiuni È™i culturi culinare, pentru a reduce erorile sistematice în recunoaÈ™terea alimentelor mai puÈ›in comune.
  • Cercetări suplimentare pentru evaluarea unui volum mai mare de imagini, testarea stabilității răspunsurilor ChatGPT de-a lungul timpului (în urma actualizărilor), compararea cu alte LLM-uri È™i analiza acceptabilității de către public È™i profesioniÈ™ti.

Studiul arată că, deÈ™i ChatGPT-4 nu este perfect pregătit pentru estimarea nutrienÈ›ilor din fotografii, el oferă deja rezultate remarcabil de bune pentru recunoaÈ™terea alimentelor È™i o clasificare rezonabilă a conÈ›inutului caloric È™i nutritiv. Subestimează însă porÈ›iile mai mari È™i, prin urmare, anumiÈ›i nutrienÈ›i. Îmbunătățiri prin integrarea bazelor de date È™i cerinÈ›e specifice pot creÈ™te acurateÈ›ea. ChatGPT este, aÈ™adar, un instrument promițător în evaluarea aportului alimentar, dar necesită rafinări substanÈ›iale înainte de a fi utilizat la scară largă în cercetare È™i practica clinică.

Data actualizare: 11-02-2025 | creare: 11-02-2025 | Vizite: 82
Bibliografie
O’Hara C, Kent G, Flynn AC, Gibney ER, Timon CM. An Evaluation of ChatGPT for Nutrient Content Estimation from Meal Photographs. Nutrients, 2025, DOI: 10.3390/nu17040607, https://www.mdpi.com/2072-6643/17/4/607

Image by pressfoto on Freepik
©

Copyright ROmedic: Articolul se află sub protecția drepturilor de autor. Reproducerea, chiar și parțială, este interzisă!


Din Ghidul de sănătate v-ar putea interesa și:
  • Algoritm dezvoltat de Google care detectează riscul cardiovascular din analiza ochilor
  • Algoritmul care redă modul în care creierul percepe feÈ›ele
  • Software inteligent pentru diagnosticarea cancerului de prostată
  • Forumul ROmedic - întrebări È™i răspunsuri medicale:
    Pe forum găsiți peste 500.000 de întrebări și răspunsuri despre boli sau alte subiecte medicale. Aveți o întrebare? Primiți răspunsuri gratuite de la medici.
      intră pe forum