ChatGPT-4 mai bun decât GPT-3.5 și Google Bard la examenul oral de neurochirurgie
©
Autor: Airinei Camelia
Un studiu recent a evaluat performanța a trei mari modele linvistice (LLM), și anume ChatGPT (sau GPT-3.5), GPT-4 și Google Bard, la întrebări de ordin superior, reprezentând întrebări din examinarea orală a Consiliului American de Chirurgie Neurologică (ABNS).
În timp ce toate cele trei LLM-uri au demonstrat capacitatea de a trece examenele consiliului medical cu întrebări cu răspunsuri multiple, niciun studiu anterior nu a testat sau comparat performanța lor la întrebări predominant de ordin superior dintr-un domeniu de subspecialitate medicală cu miză mare, cum ar fi neurochirurgia.
Cercetătorii au evaluat performanța celor trei modele linvistice pe un modul de 149 de întrebări care imită examenul oral de neurochirurgie. GPT-4 a avut performanțe mai bune decât ChatGPT, obținând un scor de 82,6% comparativ cu 62,4% al ChatGPT. Google Bard a generat răspunsuri corecte pentru 44,2% dintre întrebări, cu răspunsuri incorecte pentru 45% și a refuzat să răspundă la 10,7%. Interesant, GPT-4 a depășit Google Bard în toate categoriile, cu performanțe îmbunătățite în categoriile de întrebări pentru care ChatGPT a arătat o acuratețe mai mică.
Rezultatele studiului evidențiază necesitatea validării riguroase a performanței modelelor linvistice în scenarii din ce în ce mai mari și deschise pentru a dezvolta mai multă încredere în aceste sisteme.
Descoperirile sugerează că progresele în domeniul AI ar putea face evaluările verbale mai importante decât modelele de examinare cu opțiuni multiple în educația medicală. În plus, LLM-urile ar putea oferi noi perspective clinice și ar putea servi drept ajutoare conversaționale pentru a repeta diverse scenarii clinice pe subiecte provocatoare pentru consiliile examinatoare.
sursa: News Medical
foto: Login / Shutterstock
În timp ce toate cele trei LLM-uri au demonstrat capacitatea de a trece examenele consiliului medical cu întrebări cu răspunsuri multiple, niciun studiu anterior nu a testat sau comparat performanța lor la întrebări predominant de ordin superior dintr-un domeniu de subspecialitate medicală cu miză mare, cum ar fi neurochirurgia.
Cercetătorii au evaluat performanța celor trei modele linvistice pe un modul de 149 de întrebări care imită examenul oral de neurochirurgie. GPT-4 a avut performanțe mai bune decât ChatGPT, obținând un scor de 82,6% comparativ cu 62,4% al ChatGPT. Google Bard a generat răspunsuri corecte pentru 44,2% dintre întrebări, cu răspunsuri incorecte pentru 45% și a refuzat să răspundă la 10,7%. Interesant, GPT-4 a depășit Google Bard în toate categoriile, cu performanțe îmbunătățite în categoriile de întrebări pentru care ChatGPT a arătat o acuratețe mai mică.
Rezultatele studiului evidențiază necesitatea validării riguroase a performanței modelelor linvistice în scenarii din ce în ce mai mari și deschise pentru a dezvolta mai multă încredere în aceste sisteme.
Descoperirile sugerează că progresele în domeniul AI ar putea face evaluările verbale mai importante decât modelele de examinare cu opțiuni multiple în educația medicală. În plus, LLM-urile ar putea oferi noi perspective clinice și ar putea servi drept ajutoare conversaționale pentru a repeta diverse scenarii clinice pe subiecte provocatoare pentru consiliile examinatoare.
sursa: News Medical
foto: Login / Shutterstock
Data actualizare: 19-04-2023 | creare: 19-04-2023 | Vizite: 266
Bibliografie
ChatGPT-4 outperforms GPT-3.5 and Google Bard in neurosurgery oral board exam, link: https://www.news-medical.net/news/20230419/ChatGPT-4-outperforms-GPT-35-and-Google-Bard-in-neurosurgery-oral-board-exam.aspx ©
Copyright ROmedic: Articolul se află sub protecția drepturilor de autor. Reproducerea, chiar și parțială, este interzisă!
Alte articole din aceeași secțiune:
- Dispozitivele purtabile sunt promițătoare în detectarea semnalelor timpurii de boală
- Cerneală inteligentă folosită la țesături care monitorizează organismul și mediul
- A fost creat un plasture cutanat pentru monitorizarea alcoolemiei
- Micro-robot hibrid cu o gamă largă de aplicații în medicină și protecția mediului, dezvoltat de către cercetătorii israelieni
Din Ghidul de sănătate v-ar putea interesa și:
Forumul ROmedic - întrebări și răspunsuri medicale:
Pe forum găsiți peste 500.000 de întrebări și răspunsuri despre boli sau alte subiecte medicale. Aveți o întrebare? Primiți răspunsuri gratuite de la medici.- Implant silicon sani
- Pentru cei cu anxietate si atacuri de panica FOARTE IMPORTANT
- GRUP SUPORT PENTRU TOC 2014
- Histerectomie totala cu anexectomie bilaterala
- Grup de suport pentru TOC-CAP 15
- Roaccutane - pro sau contra
- Care este starea dupa operatie de tiroida?
- Helicobacter pylori
- Medicamente antidepresive?
- Capsula de slabit - mit, realitate sau experiente pe oameni