ChatGPT-4 mai bun decât GPT-3.5 și Google Bard la examenul oral de neurochirurgie

Un studiu recent a evaluat performanța a trei mari modele linvistice (LLM), și anume ChatGPT (sau GPT-3.5), GPT-4 și Google Bard, la întrebări de ordin superior, reprezentând întrebări din examinarea orală a Consiliului American de Chirurgie Neurologică (ABNS).
În timp ce toate cele trei LLM-uri au demonstrat capacitatea de a trece examenele consiliului medical cu întrebări cu răspunsuri multiple, niciun studiu anterior nu a testat sau comparat performanța lor la întrebări predominant de ordin superior dintr-un domeniu de subspecialitate medicală cu miză mare, cum ar fi neurochirurgia.

Cercetătorii au evaluat performanța celor trei modele linvistice pe un modul de 149 de întrebări care imită examenul oral de neurochirurgie. GPT-4 a avut performanțe mai bune decât ChatGPT, obținând un scor de 82,6% comparativ cu 62,4% al ChatGPT. Google Bard a generat răspunsuri corecte pentru 44,2% dintre întrebări, cu răspunsuri incorecte pentru 45% și a refuzat să răspundă la 10,7%. Interesant, GPT-4 a depășit Google Bard în toate categoriile, cu performanțe îmbunătățite în categoriile de întrebări pentru care ChatGPT a arătat o acuratețe mai mică.

Rezultatele studiului evidențiază necesitatea validării riguroase a performanței modelelor linvistice în scenarii din ce în ce mai mari și deschise pentru a dezvolta mai multă încredere în aceste sisteme.

Descoperirile sugerează că progresele în domeniul AI ar putea face evaluările verbale mai importante decât modelele de examinare cu opțiuni multiple în educația medicală. În plus, LLM-urile ar putea oferi noi perspective clinice și ar putea servi drept ajutoare conversaționale pentru a repeta diverse scenarii clinice pe subiecte provocatoare pentru consiliile examinatoare.

sursa: News Medical
foto: Login / Shutterstock

Data actualizare: 19-04-2023 | creare: 19-04-2023 | Vizite: 312

Bibliografie

ChatGPT-4 outperforms GPT-3.5 and Google Bard in neurosurgery oral board exam, link: https://www.news-medical.net/news/20230419/ChatGPT-4-outperforms-GPT-35-and-Google-Bard-in-neurosurgery-oral-board-exam.aspx

Copyright ROmedic: Articolul se află sub protecția drepturilor de autor. Reproducerea, chiar și parțială, este interzisă!

Alte articole din aceeași secțiune:

O nouă metodă de livrare țintită a medicamentelor ce le dublează durata de acțiune

Compușii tip MOFs (metal-organic-frameworks) au dus ca îmbunătățirea considerabilă a performanțelor chimice ...

Un nou material deschide noi căi către medicamente controlate de la distanță și pastile electronice

Un nou studiu al cercetătorilor de la Universitatea de Tehnologie Chalmers propune un nou material ce prezintă pr...

HealthKit API – o aplicaţie care monitorizează funcţiile vitale

O nouă aplicaţie, dezvoltată de Apple şi compatibilă cu iOS 8, doreşte să eficientizeze modul de urmărire a...

Cercetători de la o universitate britanică renumită implicați în intervenții de implantare la oameni fără aprobare
O nouă aplicație pentru depistarea fibrilației
Senzorul cutanat ce poate măsura presiunea sangvină
Scutecele inteligente pentru adulți care anunță când trebuie schimbate

Din Ghidul de sănătate v-ar putea interesa și:

Predicţia demenţei înainte de debut cu ajutorul inteligenţei artificiale

Un algoritm de calcul al probabilităţii unei persoane de a dezvolta demenţa înainte ca boala să se instal...

Sistem de inteligență artificială pentru a evalua maturarea cerebrală a bebelușilor prematuri

Cercetătorii din cadrul Universității din Helsinki și Spitalului Universitar din Helsinki au dezvoltat un softw...

Inteligența artificială și beneficiile în medicină

Aplicații și gadget-uri pentru depistarea cancerului, ceasuri inteligente pentru depistarea accidentelor vascular...

Algoritm dezvoltat de Google care detectează riscul cardiovascular din analiza ochilor

Algoritmul care redă modul în care creierul percepe fețele

Software inteligent pentru diagnosticarea cancerului de prostată

Forumul ROmedic - întrebări și răspunsuri medicale:

Pe forum găsiți peste 500.000 de întrebări și răspunsuri despre boli sau alte subiecte medicale. Aveți o întrebare? Primiți răspunsuri gratuite de la medici.

intră pe forum