要点
- AIは、診断結果だけでなく、医師の画像の見方そのものを変える可能性がある。
- AIがあると病変には早く気づく一方で、その後の確認が増えるため、読影時間はやや長くなる。
- 医療AIは精度だけでなく、医師の読影行動に与える影響も含めて評価する必要がある。
はじめに
胸部X線は、肺がんや肺炎などを見つけるために日常診療で非常によく使われる検査です。一方で、小さな肺結節のような所見は見落とされやすく、読影の精度向上は大きな課題です。そこで近年は、胸部X線で異常が疑われる場所をAIが示すコンピュータ支援診断(CAD:Computer-aided detection/diagnosis)が広く使われるようになってきました。
ただし、AIが画面上に「ここが怪しい」と枠で示すと、医師は単に診断しやすくなるだけでなく、画像を見る順番や確認の仕方そのものが変わる可能性があります。この論文は、その変化をアイトラッキングという視線計測の方法で調べたパイロット研究です。目的は、AIの表示が胸部X線の読影行動にどのような影響を与えるかを定量的に調べることでした。
方法
この研究では、VinDR-CXRという公開データセットから胸部X線180例を選んでいます。内訳は、肺結節または肺腫瘤を含む画像が120例、病変のない画像が60例です。AIの表示は四角い枠で再現され、全体として感度80%、特異度80%になるよう設定されました。つまり、実験では「ある程度当たるが、完璧ではないAI」を模した条件が作られています。
読影に参加したのは、経験年数11年、5年、1年の放射線科医3名です。各読影者は同じ180例を2回読み、1回はAIの枠表示あり、もう1回は枠表示なしで評価しました。2回の読影の間には2週間以上の間隔を空け、症例の順番も変えています。これは前回の記憶の影響をできるだけ減らすためです。
さらに、読影中の視線をアイトラッキング装置で記録し、主に次のような指標を評価しました。
どれくらいの時間をかけて読んだか、病変を最初に見るまでに何秒かかったか、病変付近をどれくらい長く見ていたか、そして画像の中をどの程度広く見ていたか、です。主解析は、AIの枠が正しく病変を示していた真陽性96例に絞って行われました。統計解析には線形混合モデルが用いられています。
結果
まず診断成績を見ると、AIの枠が正しく表示された症例では、3人の読影医全員で正答率が改善していました。AI表示ありの条件では、病変あり症例に対する感度も全体として高めでした。
視線の動きには、さらに興味深い変化がありました。AIの枠表示があると、病変を最初に見るまでの時間は平均1.3秒短くなりました。一方で、1症例あたりの読影時間は平均4.9秒長くなり、病変を見ている時間も平均1.3秒長くなっていました。また、視線の移動量も増え、肺の範囲全体を広く見ていることが示されました。これらはいずれも統計学的に有意な差でした。
つまり、AIがあると病変には早く気づくが、その後の確認はむしろ丁寧になる、という結果でした。

考察
この論文の重要なポイントは、AIが単に診断精度を変えるだけでなく、読影のしかたそのものを変えていることを示した点です。著者らはこの変化を、「早く見つけて、しっかり確認する」読み方への変化と解釈しています。
ここで面白いのは、AIがあると読影が速くなるとは限らなかったことです。むしろ今回の研究では、病変に早く到達する一方で、その後に確認の時間が増え、全体の読影時間は延びていました。これは、AIが単純に作業を短縮する道具ではなく、医師の注意の向け方や確認行動を変える存在であることを示しています。
また、読影者ごとにAIの取り入れ方に違いが見られた点も重要です。著者らは、AI支援の影響には読影者差がありうるため、AI製品の性能だけでなく、どのような表示方法が読影者にどんな影響を与えるかを明示する必要があると述べています。
限界
この研究は意義の大きい内容ですが、いくつか明確な限界があります。まず、これはパイロット研究であり、参加した読影医は3人だけです。そのため、結果をそのまま一般化するには慎重である必要があります。
次に、今回使われたAI表示は実際の市販製品そのものではなく、研究のために再現された模擬的な設定です。そのため、実臨床で使われるAIの誤り方や信頼度表示を十分に反映していない可能性があります。さらに、主解析はAIが正しく病変を示した症例に限られており、AIが間違った場所を示したときに医師の行動がどう変わるかは十分に評価されていません。
加えて、視線データの一部は解析条件を満たさず除外されており、微妙な差を検出する力に影響した可能性もあります。
今後の展望
著者らは今後、より大規模な読影実験を行い、実際のAI製品に近い環境で検証を進める必要があるとしています。また、読影者数を増やして、AIの影響が経験年数や個人差によってどう変わるかを詳しく調べることも課題として挙げています。さらに、診断精度と視線行動の関係を合わせて解析することで、AIが人間の読影にどう作用しているのかを、より深く理解できると考えられています。
この意味で、この論文は「胸部X線AIの有効性を最終的に証明した研究」というより、医療AIを評価する際には精度だけでなく、人間の使い方や行動変化まで見るべきだと示した出発点の研究といえます。
結論
この論文は、胸部X線AIの枠表示が、医師の診断結果だけでなく、画像の見方そのものを変えることをアイトラッキングで示した研究です。AIがあると病変には早く気づける一方で、その後の確認はむしろ丁寧になり、読影時間はやや長くなっていました。
医療AIの評価というと精度ばかりに注目しがちですが、この論文は、AIが医師にどう使われるかまで含めて見なければ本当の効果は分からない、という大切な視点を示しています。
論文情報
掲載誌名:European Journal of Radiology Open
論文タイトル:
Eye tracking as a tool to quantify the effects of CAD display on radiologists’ interpretation of chest radiographs
掲載年:2026年
著者名:
Daisuke Matsumoto, Tomohiro Kikuchi, Yusuke Takagi, Soichiro Kojima, Ryoma Kobayashi, Daiju Ueda, Kohei Yamamoto, Sho Kawabe & Harushi Mori
※ この記事に含まれる画像は、適切なライセンスに従って引用されたもの。または、論文を参考に作成されたものです。