AI สามารถวินิจฉัยความเจ็บป่วยได้เช่นเดียวกับมนุษย์

การทบทวนอย่างเป็นระบบครั้งแรกและการวิเคราะห์อภิมานพบว่าปัญญาประดิษฐ์ (AI) นั้นดีพอ ๆ กับการวินิจฉัยโรคโดยอาศัยภาพลักษณ์ทางการแพทย์ในฐานะผู้เชี่ยวชาญด้านการดูแลสุขภาพ อย่างไรก็ตามจำเป็นต้องมีการศึกษาที่มีคุณภาพสูงมากขึ้น

AI และผู้เชี่ยวชาญด้านการดูแลสุขภาพมีประสิทธิภาพเท่าเทียมกันในการวินิจฉัยความเจ็บป่วยโดยอาศัยภาพทางการแพทย์การวิจัยใหม่ชี้ให้เห็น

บทความใหม่ตรวจสอบหลักฐานที่มีอยู่เพื่อพยายามระบุว่า AI สามารถวินิจฉัยความเจ็บป่วยได้อย่างมีประสิทธิภาพเทียบเท่ากับผู้เชี่ยวชาญด้านการดูแลสุขภาพหรือไม่

สำหรับความรู้ของผู้เขียนนั่นคือทีมนักวิจัยจำนวนมากที่นำโดยศาสตราจารย์ Alastair Denniston จาก University Hospitals Birmingham NHS Foundation Trust ในสหราชอาณาจักรนี่เป็นการตรวจสอบอย่างเป็นระบบครั้งแรกที่เปรียบเทียบประสิทธิภาพของ AI กับผู้เชี่ยวชาญทางการแพทย์สำหรับทุกโรค

ศาสตราจารย์เดนนิสตันและทีมค้นหาฐานข้อมูลทางการแพทย์หลายรายการสำหรับการศึกษาทั้งหมดที่ตีพิมพ์ระหว่างวันที่ 1 มกราคม 2555 ถึงวันที่ 6 มิถุนายน 2562 ทีมงานได้เผยแพร่ผลการวิเคราะห์ของพวกเขาในวารสาร มีดหมอดิจิตอลเฮลท์.

AI เทียบเท่ากับผู้เชี่ยวชาญด้านการดูแลสุขภาพ

นักวิจัยมองหาการศึกษาที่เปรียบเทียบประสิทธิภาพการวินิจฉัยของอัลกอริธึมการเรียนรู้เชิงลึกกับผู้เชี่ยวชาญด้านสุขภาพเมื่อทำการวินิจฉัยโดยอาศัยภาพทางการแพทย์

พวกเขาตรวจสอบคุณภาพของรายงานในการศึกษาดังกล่าวคุณค่าทางคลินิกและการออกแบบของการศึกษา

นอกจากนี้เมื่อต้องประเมินประสิทธิภาพการวินิจฉัยของ AI เปรียบเทียบกับผู้เชี่ยวชาญด้านการดูแลสุขภาพนักวิจัยได้พิจารณาผลลัพธ์สองประการ ได้แก่ ความจำเพาะและความไว

“ ความไว” กำหนดความน่าจะเป็นที่เครื่องมือวินิจฉัยจะได้รับผลบวกในผู้ที่เป็นโรค ความจำเพาะหมายถึงความแม่นยำของการทดสอบวินิจฉัยซึ่งช่วยเสริมการวัดความไว

กระบวนการคัดเลือกให้ผลการศึกษาเพียง 14 ชิ้นที่มีคุณภาพสูงพอที่จะรวมไว้ในการวิเคราะห์ ศาสตราจารย์เดนนิสตันอธิบายว่า“ เราตรวจสอบบทความมากกว่า 20,500 บทความ แต่มีน้อยกว่า 1% ที่มีประสิทธิภาพเพียงพอในการออกแบบและการรายงานว่าผู้ตรวจสอบอิสระมีความมั่นใจสูงในการอ้างสิทธิ์ของตน”

“ ยิ่งไปกว่านั้นการศึกษาเพียง 25 ชิ้นเท่านั้นที่ตรวจสอบโมเดล AI จากภายนอก (โดยใช้ภาพทางการแพทย์จากประชากรที่แตกต่างกัน) และมีเพียง 14 การศึกษาเปรียบเทียบประสิทธิภาพของ AI และผู้เชี่ยวชาญด้านสุขภาพโดยใช้ตัวอย่างการทดสอบเดียวกัน”

“ ภายในการศึกษาคุณภาพสูงจำนวนหนึ่งเราพบว่าการเรียนรู้เชิงลึกสามารถตรวจจับโรคต่างๆตั้งแต่มะเร็งไปจนถึงโรคตาได้อย่างแม่นยำเช่นเดียวกับผู้เชี่ยวชาญด้านสุขภาพ แต่สิ่งสำคัญคือต้องทราบว่า AI ไม่ได้มีประสิทธิภาพสูงกว่าการวินิจฉัยของมนุษย์มากนัก”
ศ. อลาสแตร์เดนนิสตัน

โดยเฉพาะอย่างยิ่งการวิเคราะห์พบว่า AI สามารถวินิจฉัยโรคได้อย่างถูกต้องใน 87% ของกรณีในขณะที่การตรวจหาโดยผู้เชี่ยวชาญด้านการดูแลสุขภาพให้อัตราความแม่นยำ 86% ความจำเพาะสำหรับอัลกอริทึมการเรียนรู้เชิงลึกคือ 93% เทียบกับมนุษย์ที่ 91%

อคติอาจทำให้ประสิทธิภาพของ AI เกินจริง

ศาสตราจารย์เดนนิสตันและเพื่อนร่วมงานยังให้ความสนใจกับข้อ จำกัด หลายประการที่พบในการศึกษาที่ตรวจสอบประสิทธิภาพการวินิจฉัยของ AI

ประการแรกการศึกษาส่วนใหญ่จะตรวจสอบความแม่นยำในการวินิจฉัยของ AI และบุคลากรทางการแพทย์ในสภาพแวดล้อมที่แยกได้ซึ่งไม่ได้เลียนแบบการปฏิบัติทางคลินิกตามปกติตัวอย่างเช่นการกีดกันข้อมูลทางคลินิกเพิ่มเติมที่แพทย์มักจะต้องใช้ในการวินิจฉัย

ประการที่สองนักวิจัยกล่าวว่าการศึกษาส่วนใหญ่เปรียบเทียบชุดข้อมูลเท่านั้นในขณะที่การวิจัยที่มีคุณภาพสูงในด้านประสิทธิภาพการวินิจฉัยจะต้องทำการเปรียบเทียบดังกล่าวในคน

นอกจากนี้การศึกษาทั้งหมดได้รับผลกระทบจากการรายงานที่ไม่ดีผู้เขียนกล่าวโดยการวิเคราะห์ไม่ได้บันทึกข้อมูลที่ขาดหายไปจากชุดข้อมูลดังกล่าว “ ส่วนใหญ่ [การศึกษา] ไม่ได้รายงานว่ามีข้อมูลขาดหายไปสัดส่วนที่แสดงนี้เป็นอย่างไรและข้อมูลที่ขาดหายไปได้รับการจัดการอย่างไรในการวิเคราะห์” ผู้เขียนเขียน

ข้อ จำกัด เพิ่มเติม ได้แก่ คำศัพท์ที่ไม่สอดคล้องกันไม่ได้กำหนดเกณฑ์สำหรับการวิเคราะห์ความอ่อนไหวและความจำเพาะอย่างชัดเจนและการขาดการตรวจสอบความถูกต้องนอกตัวอย่าง

“ มีความตึงเครียดโดยธรรมชาติระหว่างความปรารถนาที่จะใช้การวินิจฉัยแบบใหม่ที่อาจช่วยชีวิตได้และความจำเป็นในการพัฒนาหลักฐานที่มีคุณภาพสูงเพื่อเป็นประโยชน์ต่อผู้ป่วยและระบบสุขภาพในการปฏิบัติทางคลินิก” ดร. Xiaoxuan Liu ผู้เขียนคนแรกจาก มหาวิทยาลัยเบอร์มิงแฮม.

“ บทเรียนสำคัญจากการทำงานของเราคือใน AI เช่นเดียวกับส่วนอื่น ๆ ของการดูแลสุขภาพ - การออกแบบการศึกษาที่ดีมีความสำคัญ หากไม่มีสิ่งนี้คุณสามารถนำเสนออคติที่บิดเบือนผลลัพธ์ของคุณได้อย่างง่ายดาย อคติเหล่านี้สามารถนำไปสู่การกล่าวอ้างอย่างเกินจริงถึงประสิทธิภาพที่ดีของเครื่องมือ AI ซึ่งไม่ได้แปลเป็นโลกแห่งความจริง”
ดร. Xiaoxuan Liu

“ หลักฐานว่าอัลกอริทึม AI จะเปลี่ยนแปลงผลลัพธ์ของผู้ป่วยได้อย่างไรนั้นจำเป็นต้องมาจากการเปรียบเทียบกับการตรวจวินิจฉัยทางเลือกในการทดลองที่มีการควบคุมแบบสุ่ม” ผู้เขียนร่วม Dr. Livia Faes จาก Moorfields Eye Hospital, London, UK กล่าวเสริม

“ จนถึงขณะนี้แทบจะไม่มีการทดลองใด ๆ ที่การตัดสินใจวินิจฉัยโดยอัลกอริทึม AI จะดำเนินการเพื่อดูว่าจะเกิดอะไรขึ้นกับผลลัพธ์ที่มีความสำคัญต่อผู้ป่วยเช่นการรักษาอย่างทันท่วงทีเวลาที่ต้องออกจากโรงพยาบาลหรือแม้แต่อัตราการรอดชีวิต”

none: ระบบทางเดินปัสสาวะ - โรคไต โรคเบาหวาน โรคหัวใจ