【医療xAI】AIは94.9％の精度で病状を診断できるが人間がAIを使うことで34.5％まで精度が急低下する [香味焙煎★]

2025年6月17日 2025年6月17日

うさ-管理人

1 香味焙煎 ★ ：2025/06/16(月) 17:08:22.75 ID:RDLBzt9G9

チャットAIのChatGPTは医師免許試験に合格できるというだけでなく、人間の医師よりも患者に好まれる回答を出力できることも明らかになっています。既にさまざまな医療現場でチャットAIが活用されていますが、人間がチャットAIを利用することで、診断精度が著しく低下することが最新の研究により明らかになりました。

Clinical knowledge in LLMs does not translate to human interactions
(PDFファイル)https://arxiv.org/pdf/2504.18919

Just add humans: Oxford medical study underscores the missing link in chatbot testing | VentureBeat
https://venturebeat.com/ai/just-add-humans-oxford-medical-study-underscores-the-missing-link-in-chatbot-testing/

（続きは↓でお読みください）

GIGAZINE
2025年06月16日 17時00分
https://gigazine.net/news/20250616-ai-underscores-miss-link-test/?utm_source=x&utm_medium=sns&utm_campaign=x_post&utm_content=20250616-ai-underscores-miss-link-test

（出典【医療xAI】AIは94.9％の精度で病状を診断できるが人間がAIを使うことで34.5％まで精度が急低下する [香味焙煎★]）

18 名無しどんぶらこ ：2025/06/16(月) 17:16:48.13 ID:XnAUcvRE0

>>1
人間が直接診断する数値がないので臭い

74 名無しどんぶらこ ：2025/06/16(月) 17:34:25.52 ID:6gP7Yp5o0

>>1
医師「ねっだからAIはアテにならんのですよ」

3 名無しどんぶらこ ：2025/06/16(月) 17:10:15.80 ID:ttCcsZwM0

人間がボトルネックになっとるw

33 名無しどんぶらこ ：2025/06/16(月) 17:21:39.35 ID:p+rTt19Q0

>>3
まさにそれ。人間の知見とやらが足を引っ張ってることがデータででてきた。この記事はとても面白い。

6 名無しどんぶらこ ：2025/06/16(月) 17:11:30.92 ID:MvMv5oby0

34.5%って誤診のほうが多いじゃん

49 名無しどんぶらこ ：2025/06/16(月) 17:26:21.18 ID:DGyEWwCI0

>>6
AI：誤診4%、不明1%
人：誤診1%、不明64%
とかかも

34 名無しどんぶらこ ：2025/06/16(月) 17:22:27.93 ID:RDLBzt9G0

別記事

医療AI診断の盲点：GPT-4o・Command R+を人間が使うと精度が3分の1に低下、1,298人実験で判明
https://innovatopia.jp/ai/ai-news/57656/

54 名無しどんぶらこ ：2025/06/16(月) 17:27:18.45 ID:KeBNYZ7c0

>>34
医師ではなく患者の方の問題ってことなのか

50 名無しどんぶらこ ：2025/06/16(月) 17:26:23.41 ID:CMFcErZj0

医師が患者から情報を聞き出す部分は、現状のAIでは真似できない

67 名無しどんぶらこ ：2025/06/16(月) 17:32:25.08 ID:iu+QkHYD0

>>50
だから問診表に細かく記入じゃないの

57 名無しどんぶらこ ：2025/06/16(月) 17:28:32.37 ID:yg1lmH+Y0

名医にはなれなくても
ヤブは排除出来る

60 名無しどんぶらこ ：2025/06/16(月) 17:29:29.70 ID:CX+DxaXQ0

>>57
34.5％だからヤブ以下だわな

73 名無しどんぶらこ ：2025/06/16(月) 17:34:14.40 ID:liLjF2Yo0

チャットAIの問題点は人間による回答誘導に気づけないこと
これが解決されるまであと10年はかかると言われてる

82 名無しどんぶらこ ：2025/06/16(月) 17:36:43.91 ID:pEoHfrP80

>>73
それもう2年くらい前の情報だぞ

85 名無しどんぶらこ ：2025/06/16(月) 17:38:17.58 ID:liLjF2Yo0

>>82
2週間前にロイターで読んだばかりだ

80 名無しどんぶらこ ：2025/06/16(月) 17:36:28.42 ID:Ukh+Ozjq0

（笑）
お前らはAIの特性なんて何も知らないから不正解の５.１％を叩くけど、
人間と比べてどうなのという初歩的な視点がまず抜けてるんだよな

95 名無しどんぶらこ ：2025/06/16(月) 17:40:43.53 ID:CX+DxaXQ0

>>80
LLM使ったら34.5％
使わないと44.2％
使うと精度落ちてるわけだが

93 名無しどんぶらこ ：2025/06/16(月) 17:40:20.16 ID:TG13AN8C0

医者と法曹関係はもうAIでいいわ
そのほうが納得するだろ

99 名無しどんぶらこ ：2025/06/16(月) 17:43:35.50 ID:5PCBEoGT0

>>93
「違和感」まで学習出来たらそうかも知れない。
医者も法曹も、相手は大嘘をつく（しかもその本人にその自覚がない）素人が相手なのよ。

聞き取った情報のからの判断ではなく、そもそも聞き取る相手の考えや性格、仕草、気分、体調まで観測して、
情報源の精度まで考慮した判断が行えれば人間に代われる。

この記事を書いた人

うさ-管理人

音楽とサッカーが好きです。普段、浜松で家庭教師をしています（16年目）。