Report
レポート

アカデミックデイ座談会レポート vol.3 コトバのデータベースが社会を変える?

家入 葉子
京都大学大学院文学研究科教授

黒橋 禎夫
京都大学大学院情報学研究科教授

佐藤 恵子
京都大学医学部附属病院臨床研究総合センター特任准教授

書き言葉や、話し言葉を大規模に集積したコーパス。元々は言語研究のために考案されたコトバのデータベースでしたが、電子化が進んだことで、企業のコールセンターにおけるカスタマー対応をはじめとする実社会の課題解決に応用されるなど、その活躍領域は広がっています。では、信頼関係を築くために質の高いコミュニケーションが求められる医療現場にも応用が出来るのか?その意義と可能性を探ってみました。

コトバのデータベース、コーパスとは何か?

専門分野は、英語史、歴史社会言語学、コーパス言語学。著書に「ベーシック英語史」(ひつじ書房)、「否定的な意味の動詞とその構文―英語史の観点」(雄松堂出版)など。

そもそも「コーパス」とは何か?座談会は、英語学研究の中から生まれたというコーパスの意義について、京都大学大学院文学研究科の家入教授の解説からスタートしました。

家入教授の専門は、文献学、歴史社会言語学、コーパス言語学といった英語史全般。時代をさかのぼって、現代英語が成立するまでの言語の変化のプロセスを明らかにしていきます。言語は必ずしも一定の規則に従って変化するものではありません。どのような段階を踏んで現在の形に落ち着いたのかを探る必要があります。特にネイティブスピーカーが存在しない古い時代の英語の研究は、書き言葉にしても、話し言葉にしても、それを使う人の感覚を利用することが出来ないので、可能な限り多くの言語史料を集積しながら行われます。

そこで、対象となる言語を大量に収集したコーパスが必要となるのです。英語学の中でも、英語史がいち早くコーパスを使った研究を始めます。コーパスを使った研究、コーパス言語学が生まれた当初は、そのデータ収集に大変な労力がかかりましたが、コンピュータの登場によって、容易にデータベースを作成することが可能となり、次第にコーパスとは、電子データ化されたものを指すようになります。

つまり、言語学におけるコーパスの定義は、①書き言葉や話し言葉などの現実の言語を、②大規模に、③基準に沿って網羅的・代表的に収集し、④コンピュータ上で処理できるデータとして保存し、⑤言語研究に使用するもの(石川慎一郎『ベーシックコーパス言語学』 ひつじ書房, p. 13) となります。

コンピュータを使ったデータベース作成が行われるようになると、男性が使う言葉と、女性が使う言葉など、収集データに変数を与えて、より細やかな研究を行うことが可能となりました。英語学に限っても、英語史研究から、現代英語語法研究、現代英語の通史研究、歴史社会言語学、会話の分析といったようにコーパスを使った研究分野は増え、さらに、文法書の執筆や、辞書の編纂、英語教材へと、利用領域に広がりを見せるようになります。

言葉と知識と、コンピュータ。

言語学研究におけるコーパスに、コンピュータが果たす役割が大きいという説明を受けて、座談会は、京都大学大学院情報学研究科の黒橋教授から、コンピュータの自然言語処理に関する話に進みます。コトバのデータベースであるコーパスとコンピュータを組み合わせることで、どういったことが可能であるかといった内容でした。

黒橋教授の研究テーマは、コンピュータの自然言語処理能力を高度化して、言葉そのものを理解させること。言葉のみならず、それを使う人間の思考の仕組みを理解させ、人間の知的活動を支援するといったものです。

知識情報学専攻。研究テーマは、言語理解の基礎的研究、知識に基づく構造的言語処理の確立と知識インフラの構築、自動翻訳の高度化に関する研究など、コンピュータによる自然言語処理。

導入として、アメリカのクイズ番組で、コンピュータが人間のクイズ王に圧勝したという話が取り上げられました。百科事典など2億ページの情報を与え、隠喩の判別や、シャレ、スラングなどを理解させるといったコトバのデータベースの発展事例です。インプットされた言語データをコンピュータに解析させて、最適なアウトプットを選ばせるといった仕組みです。身近な例としては、スマートフォンなどに使われている音声対話システムなどがあります。

クイズの回答や、音声対話システムの応答には、言葉の連なりである文章が理解できなければなりません。そこで、コンピュータに構文解析を行わせる必要があります。例えば、「クロールで/泳いでいる/女の子を/見た」と「望遠鏡で/泳いでいる/女の子を/見た」というそれぞれの文章の意味を理解するには、それぞれの格フレーム(誰が何をどうしたか)の違いが分からなければなりません。そこで、格フレームの違いを判別させるために、インターネット上の膨大なページから格フレームのサンプルを大規模に収集し、構文解析とクラスタリングを行うのです。つまり、言語から知識を獲得させるわけです。高い情報処理能力を持つコンピュータを使えば、膨大な言語の収集だけでなく、集めたデータの中から、知識を自動獲得させることが出来るのです。

医療の現場に応用することは可能か?

コンピュータによる知識の自動獲得の仕組みは、膨大なデータの中から必要な情報を取りだすシステム作りに応用することが可能で、企業のコールセンターに集められるカスタマーからの声のうち、対応すべき内容や製品情報をピックアップする作業の効率化を図るなど、実社会における課題解決に役立てることができます。

コトバのデータベースや自ら学習するコーパスが、問題となっているキーワードや事象を明らかにして、その解決を促すことが可能性を持つのであれば、人間同士のコミュニケーションをより円滑に行うこともできるようになる…そのように考えることも出来ます

京都大学医学部附属病院臨床研究総合センター特任准教授/医療現場における「インフォームド・コンセント」をはじめとする日本における生命倫理の在り方を見つめ、生命倫理学の教育プログラムや、教育システムの構築に向けて活動中。

そこで、コーパスの新たな可能性を探るべく、医療の現場における患者と医師、あるいは医師と看護師といったコミュニケーションに課題感を持つ、京都大学医学部附属病院臨床研究総合センターの佐藤特任准教授から「インフォームド・コンセント」の現状について説明がありました。

「インフォームド・コンセント」は、「正しい情報を得て、理解した上での同意」を意味します。医療現場において、手術や投薬、検査といった医療行為は、医師が適切な説明を行い、患者の希望や意見を取り入れて専門家としての提案をし、患者が納得した上で行うことになっています。医師が一方的に説明して患者が従うとか、医師が選択肢を示して患者に選ばせるというようなやり方ではなく、双方向のコミュニケーションを成立させる必要があります。

佐藤特任准教授が持つ課題感は、「インフォームド・コンセント」は一般的になったものの、実際の現場では、患者に対して「何を伝えたら良いのか」、「どう問いかけたら良いのか」、また信頼を得るには「何が必要か」と、コミュニケーションを円滑にする言葉のスキルを高めるといったものでした。もし、医療コーパスのようなデータベースを作ることが可能であれば、患者の同意を得にくく、時には不信感を抱かせてしまうような医師の説明方法の改善や、インフォームド・コンセントを含む、医療現場におけるコミュニケーション力の教育に活かすことができるかもしれません。

医療現場におけるコーパス作りの課題と可能性。

佐藤特任准教授が、コーパスの可能性を見出すのは、言葉の部分でした。特にインフォームド・コンセントのように、医療行為における意思決定は、医師と患者が対面することによって行われるものであり、一人の人間として医師個人が持つ、雰囲気や性格、あるいは伝える話し方については、変えがたい部分もあり、あくまで言葉は限定的な要素と考えられます。

しかし、その言葉ひとつをとっても、選び方一つで大きく患者に与える印象が変わるものであり、コトバのデータベースを作ることは、改善や教育に向けた一歩を踏み出すためには欠かせないものでしょう。

コトバのデータベース、コーパスを作るには、膨大なデータを収集する必要があります。果たして医療の現場において、その労力を割くことは可能なのでしょうか。佐藤特任准教授は、医師と患者がどのようなコミュニケーションを行っているか、第三者がモニタリングすることは難しく、コーパスを作るためのデータ収集は容易ではないことも課題であるとしました。

確かに、すべての医療の現場が足並みを揃えてコーパス作りに向けた環境を整えることは難しいかもしれませんが、共通する課題を持ついくつかの現場や、ひとつの病院といった小さな規模でも、その取り組みを始める価値はあるように感じました。医療の現場は、コーパスそのものと同時に、そのためのデータ収集に向けた取り組みの事例を必要としているはずです。ガイドラインとしてのデータベースを構築する働きかけそのものが、新しい医療のコミュニケーションの在り方を見出す議論の場を作るように思えます。言葉の持つ効果は高いものであり、多くの人が使う言葉の海には、まだ見えない力が眠っているはずです。

座談会の後半、議論の流れをリアルタイムでイラストに起こし、登壇者と参加者をつなぐ絵巻物を描いていたGF(グラフィック・ファシリテーター)のやまざきゆにこ氏から、「医療現場におけるコーパスとは、どのようなキャラクター、存在でしょう?」という問いかけがあり、佐藤特任准教授から、映画『スターウォーズ』に登場する通訳ロボット、C-3POやR2-D2といった例が挙がりました。可能性の扉を開く動きとは、こういった異分野の交流から始まるのではないか…そんな印象を受けた座談会でした。

家入葉子(いえいりようこ)
京都大学大学院文学研究科教授
http://homepage3.nifty.com/iyeiri/

黒橋禎夫(くろはしさだお)
京都大学大学院情報学研究科教授
http://nlp.ist.i.kyoto-u.ac.jp/

佐藤恵子(さとうけいこ)
京都大学医学部附属病院臨床研究総合センター特任准教授

■関連情報

  • Facebook
  • Twitter