音声入力による医用放射線画像の読影システム

Speech Recognition System for Reporting of RadiologicalDiagnostic Imaging Findings

 

 鳥谷部 浩1)   岡野 剛一2)
  Hiroshi TORIYABE Takeshi OKANO

1) インコム青森株式会社
(〒030-0811 青森県青森市青柳1丁目16番地3号
 E-mail: toriyabe@incom-aomori.co.jp )
2) テクマトリックス株式会社 技術本部 第三技術部メディカルテクノロジーグループ
(〒111-8520 東京都台東区柳橋2丁目19番地 秀和柳橋ビル
 E-mail: okano@techmatrix.co.jp )


ABSTRACT. At present, a speech recognition system is prevailedalready at the actual medical spot in Western countries. However, inJapan development of speech recognition engine itself is behind. Thenwe developed a speech recognition system for reporting.


1.背景

医療分野の情報システムでは、既に欧米において音声による入力システムの普及が進んでおり、その一つの応用分野として、医師による医用放射線画像の読影レポート作成システムでは音声入力インターフェースを備えたシステムが商品化されている。一方、国内においては、日本語という言語の特殊性から、音声認識エンジンそのものの開発が欧米に対して立ち遅れており、さらに医用放射線画像の読影分野においても医療分野の情報化の遅れから、読影連続音声認識システムの環境が整っておらず、実用性のある読影レポート作成システムが存在していないのが現状である。

        

2.目的

本応用開発は、放射線読影分野向けの話者不特定を前提とした読影連続音声認識システムを開発し、音声入力された読影レポートを一元管理するシステムを構築し、本システムを医療機関へ適用することにより、その実用性を検証することを目的とするものである。これにより、医療現場における診療行為の効率化支援を目指すものである。

また、音声入力に必要な読影連続音声認識エンジンが使用する辞書は、数万語レベルの単語から作成する必要があり、作成に非常に時間が掛かるため、辞書作成支援システムを開発して、辞書の作成作業を支援する。

 

3.読影レポート作成のワークフロー

 従来の読影レポート作成のワークフローを次に示す。

  1. 診療医師による診察

  2. 技師による撮影

  3. 読影医による読影(MDへの録音)

  4. トランスクライバーによる転記

  5. 読影医による転記内容の確認

  6. 読影レポートのカルテへの貼付

本システムの音声入力を使用すると、「3.読影医による読影(MDへの録音)」、「4.トランスクライバーによる転記」、「5.読影医による転記内容の確認」を、まとめることが可能である。そこで、本システムを導入した場合の読影レポート作成のワークフローは次の様になる。

  1. 診療医師による診察

  2. 技師による撮影

  3. 読影医による読影(音声認識を使用)

  4. 読影レポートのカルテへの貼付

この様に、本システムを使用することで、読影作業時間の短縮ならびに疲労感の減少が期待できる。

 

4.本応用開発の概要

開発したシステムの全体像を図1に示す。

 

5.本応用開発の詳細

(1)読影連続音声認識システムの開発

東京大学医学部附属病院および岩手県立中央病院から提供頂いた読影レポート等を元に、辞書ならびに言語モデルを開発し、アドバンスト・メディア社の連続音声認識エンジンAmiVoiceおよびJava SpeechAPIを使用して本システムの実装を行った。本システムの主要な機能は次の通りである。

a) 連続音声認識機能(ディクテーション)

胸部X線写真、CT、MRI(一部、核医学)を対象とした3万語以上の辞書ならびに言語モデルを使用し、読影医師による所見や診断の音声入力を受け付ける機能。

b) 音声の録音・再生機能

読影医師の発話した音声を、録音・再生する機能。

 

(2)読影レポート作成システムの開発

実際の医療現場での読影レポート作成に関するワークフローの分析を行った上で、本システムの設計・実装を行った。本システムの主要な機能は次の通りである。

a) 音声入力もしくはキー入力による所見や診断の作成機能

読影連続音声認識システムを使用した音声入力、もしくは、キー入力で、所見や診断を作成する機能。

b) 診断コードの入力機能

インクリメンタルサーチを使用し、診断コード(IRDコード)を容易に入力する機能。

c) 画像の検索機能

画像サーバーから、検査画像を取得・表示する機能。

d) アノテーションの作成機能

検査画像の上にアノテーション(注釈)を描画する機能。

e) 読影レポートの検索・承認機能

作成済みの読影レポートの検索ならびに承認(査閲)を行う機能。

 

(3)辞書作成支援システムの開発

漢字のみからなる日本語の医学用語、英語・ドイツ語の医学用語の略語、ドイツ語・ラテン語の医学用語に対し、ソフトウェアによる自動読み付けを行うアルゴリズムを開発し、辞書作成作業を支援するシステムを開発した。

 

6.評価

本システムの実用性を検証するために、次の実証実験を実施した。

a) 読影連続音声認識システムの性能評価の実証実験
読影連続音声認識エンジンの認識率などを評価し、実用性を明らかにする実験。

b) 東京大学医学部附属病院および岩手県立中央病院における実証実験
従来および本システム導入時の読影レポート作成作業を評価し、実用性を明らかにする実験。

これらの実験を通して、読影連続音声認識エンジンはかなり高い認識率を記録するなど、実験結果は概ね良好で、読影連続音声認識システムおよび読影レポート作成システムには、十分な実用性があることが明らかになった。

 

7.考察・まとめ

 実証実験から、読影連続音声認識システムおよび読影レポート作成システムの改善点が明らかになり、非常に意義のある実証実験だった。また、辞書・言語モデルの作成作業からも、辞書作成支援システムならびに読み付けアルゴリズムの改善点が明らかになった。今後、これら改善点への対応、読影連続音声認識エンジンの認識率の更なる向上、そして本システムの普及を通して、読影業務ひいては医療現場における診療行為全体の効率化を支援して行きたい。

 

8.参加企業及び機関

 本応用開発の参加企業及び機関は、以下の通りである。

  インコム青森株式会社

  テクマトリックス株式会社

  東京大学医学部附属病院中央医療情報部

  東京大学医学部附属病院放射線科

  岩手県立中央病院放射線科

 

9.謝辞

本応用開発にご協力頂きました、小野木雄三氏をはじめとしました東京大学医学部附属病院の先生方、佐々木康夫氏をはじめとしました岩手県立中央病院放射線科の先生方に、深く感謝致します。

 

10.参考文献

[1]竹沢寿幸、末松博:音声・テキストコーパスとその構築技術、標準化動向、人工知能学会誌、Vol.10,No.2,p168〜180(1995)