ChatGPT-4.0 ซึ่งเป็นการอัปเดตล่าสุดของ OpenAI เกี่ยวกับโมเดลภาษาขนาดใหญ่ (LLM) ได้ผ่านการทดสอบประสาทวิทยาด้วยคำตอบที่ถูกต้อง 85% ในการศึกษาแบบ proof-of-concept โดยผู้เขียนงานวิจัยเชื่อว่าหลังจากการปรับแต่ง จะทำให้ LLM อาจมี “การใช้งานที่สำคัญ” ในประสาทวิทยาทางคลินิก
ผลการทดลองซึ่งดำเนินการโดยกลุ่มนักวิจัยจากโรงพยาบาลมหาวิทยาลัยไฮเดลเบิร์ก และศูนย์วิจัยมะเร็งแห่งเยอรมันในไฮเดลเบิร์ก ได้รับการเผยแพร่เมื่อวันที่ 7 ธันวาคม ซึ่งการทดสอบดำเนินการเมื่อวันที่ 31 พฤษภาคม ได้นำเสนอ LLM สองตัว ได้แก่ ChatGPT-3.5 และ เวอร์ชันใหม่กว่า ChatGPT-4.0
นักวิจัยใช้ชุดคำถามในการสอบประสาทวิทยาจากคณะจิตเวชศาสตร์และประสาทวิทยาแห่งสหรัฐอเมริกา พร้อมด้วยคำถามกลุ่มเล็กๆ จากคณะกรรมการประสาทวิทยาแห่งยุโรป
โดยทาง ChatGPT เวอร์ชันเก่าได้คะแนน 66.8% และตอบคำถามถูก 1,306 ข้อจากทั้งหมด 1,956 ข้อ แต่ ChatGPT-4.0 เวอร์ชันล่าสุดได้รับคะแนน 85% ด้วยคำตอบที่ถูกต้อง 1,662 ข้อ ซึ่งคะแนนของคนโดยเฉลี่ยนั้นอยู่ที่ 73.8%
ChatGPT-4.0 มีประสิทธิภาพเหนือกว่าคนในคำถามเกี่ยวกับพฤติกรรม , ความรู้ความเข้าใจ , และจิตวิทยา และ “สอบผ่าน” ข้อสอบประสาทวิทยาได้อย่างมีประสิทธิภาพ เนื่องจากโดยทั่วไปแล้วการได้มากกว่า 70% ของคำตอบที่ถูกต้องถือเป็นการสอบผ่านในสถาบันการศึกษา
อย่างไรก็ตาม ทั้งสองโมเดลยังคงแสดงให้เห็นถึงประสิทธิภาพที่ด้อยกว่าในงานที่ต้องใช้ “higher-order thinking” มากกว่าในคำถามที่ต้องใช้เพียง “lower-order thinking” เท่านั้น
“การค้นพบนี้ชี้ให้เห็นว่า ด้วยการปรับแต่งเพิ่มเติม สิ่งนี้อาจมีการนำไปใช้อย่างมีนัยสำคัญในประสาทวิทยาทางคลินิก”
อ้างอิง : cointelegraph.com
ภาพ neurosciencenews.com