ChatGPT-4 mai bun decât GPT-3.5 și Google Bard la examenul oral de neurochirurgie

©

Autor:

ChatGPT-4 mai bun decât GPT-3.5 și Google Bard la examenul oral de neurochirurgie
Un studiu recent a evaluat performanța a trei mari modele linvistice (LLM), și anume ChatGPT (sau GPT-3.5), GPT-4 și Google Bard, la întrebări de ordin superior, reprezentând întrebări din examinarea orală a Consiliului American de Chirurgie Neurologică (ABNS).
În timp ce toate cele trei LLM-uri au demonstrat capacitatea de a trece examenele consiliului medical cu întrebări cu răspunsuri multiple, niciun studiu anterior nu a testat sau comparat performanța lor la întrebări predominant de ordin superior dintr-un domeniu de subspecialitate medicală cu miză mare, cum ar fi neurochirurgia.

Cercetătorii au evaluat performanța celor trei modele linvistice pe un modul de 149 de întrebări care imită examenul oral de neurochirurgie. GPT-4 a avut performanțe mai bune decât ChatGPT, obținând un scor de 82,6% comparativ cu 62,4% al ChatGPT. Google Bard a generat răspunsuri corecte pentru 44,2% dintre întrebări, cu răspunsuri incorecte pentru 45% și a refuzat să răspundă la 10,7%. Interesant, GPT-4 a depășit Google Bard în toate categoriile, cu performanțe îmbunătățite în categoriile de întrebări pentru care ChatGPT a arătat o acuratețe mai mică.

Rezultatele studiului evidențiază necesitatea validării riguroase a performanței modelelor linvistice în scenarii din ce în ce mai mari și deschise pentru a dezvolta mai multă încredere în aceste sisteme.

Descoperirile sugerează că progresele în domeniul AI ar putea face evaluările verbale mai importante decât modelele de examinare cu opțiuni multiple în educația medicală. În plus, LLM-urile ar putea oferi noi perspective clinice și ar putea servi drept ajutoare conversaționale pentru a repeta diverse scenarii clinice pe subiecte provocatoare pentru consiliile examinatoare.

sursa: News Medical
foto: Login / Shutterstock

Data actualizare: 19-04-2023 | creare: 19-04-2023 | Vizite: 266
Bibliografie
ChatGPT-4 outperforms GPT-3.5 and Google Bard in neurosurgery oral board exam, link: https://www.news-medical.net/news/20230419/ChatGPT-4-outperforms-GPT-35-and-Google-Bard-in-neurosurgery-oral-board-exam.aspx
©

Copyright ROmedic: Articolul se află sub protecția drepturilor de autor. Reproducerea, chiar și parțială, este interzisă!


Din Ghidul de sănătate v-ar putea interesa și:
  • Algoritm dezvoltat de Google care detectează riscul cardiovascular din analiza ochilor
  • Algoritmul care redă modul în care creierul percepe fețele
  • Software inteligent pentru diagnosticarea cancerului de prostată
  •