topkeywordmaptextarchiveforumindex
 

Chapter1 知のダイナミクスChapter2 知のエレメント
知識とはなにか
  19
20
情報と知識
外在主義
知識の様々なかたち
  21
22
23
経験知/暗黙知
匠の知
土着の知
知識の表現
  24
25
26
状況意味論
情報デザイン
意味論
知識の伝達
  27
28
29
コミュニケーション
コーパス
インフォーマル
コミュニケーション

Chapter3 知のメソドロジー
Chapter4 知のエンジン
 

コミュニケーションを解明するためのリソース
石崎雅人
知識創造論


複雑で精巧なコミュニケーションを解明するために

我々は普段何げなく言葉を交わしており、仮に尋ねられたとしても、何を意識し、どのように言葉を発していたかを答えるのは難しい。実際、我々のコミュニケーション▲は、話す前に内容に関する情報を身振りで伝えたり、自分の言いたいことを伝えるために、相手の状況を考慮して言い方を変えたり、ふだん意識をすることはないが、複雑で精巧な過程であることが分かってきている(27「コミュニケーション」の項参照)。コーパスは、この過程を解明するために利用される。
コーパスとは、広義には、特定の目的のために、言語、音声、非言語(身振り、視線等)情報を集めたものをいう。言語情報だけからなるもの、音声・言語情報からなるもの、言語・音声・非言語情報からなるものを、それぞれ、特に言語コーパス、音声言語コーパス、マルチモーダルコーパスという場合がある。狭義には、特定の地域や集団を代表するように、年齢、性別、ジャンル等を考慮に入れて収集されたものを指す(バランスト・コーパスと呼ばれる)。
情報の検索や統計処理および情報の交換・共有の容易さから、コーパスの多くは電子化されており、電子化は、暗黙の前提となっている。電子化したコーパスは、一般に流通が容易になるが、特定のハードウェア、ソフトウェアに依存した電子化は、流通を疎害する要因になる。これを回避するために、SGML(Standard Generalized Markup Language)、XML(eXtensible Markup Language)といったメタ言語を用いて、コーパスが作成されるようになってきている。言語データの記述のためには、TEI(Text Encoding Initiative)によって、SGMLおよびXMLに準拠した言語データの記述法が提案されている(*28-1)。
代表的な日本語のコーパスには、「日本語地図課題対話コーパス」(*28-2)がある。地図課題対話とは、情報提供者が情報追随者に、地図上の経路を伝える対話である。情報提供者の地図には、経路(出発地点と目標地点)と目標物が、情報追随者の地図には、出発地点と目標物だけが描かれている。性別、親密性、視認性(相手が見えるかどうか)、対話の回数、地図の特徴(目標物の種類、数、名称およびその音声的特徴など)は、さまざまな条件を比較対照できるように計画的に決定されている。このコーパスは、全128対話(約22時間)についての音声データ、転記データ、画像データ、地図データ、および対話参加者に関する情報と公開許諾書からなっている。 転記データは、TEIによって記述されている。
TEIにより記述されたコーパスの概略を★28-1に示した。コーパスは、対話の状況、条件などのカタログ情報、対話とその要素(発話)との関係や、発話と単語との関係を表現する階層情報、要素に関する属性情報(発話の場合、話者、開始時間、終了時間などが相当する=アミかけ部)、音声情報との関連などを示すリンク情報(両方向矢印)からなっている。

◎対話に含まれるさまざまな情報を収集・分析する
コーパスを利用してコミュニケーションを解明するためには、当然のことであるが、コーパスが必要になる。現段階ではそのまま利用できるものがほとんどないため▼1、多くの場合、コーパスの作成から始める必要がある。コーパス作成には、データ収集の計画、データ収集、転記、研究対象とする特徴の付与、特徴の分析、TEIなどによる記述といった作業が必要になる。
どのようなデータを、どのように収集するかは、研究の目的に照らして考える必要がある。転記は、聞こえたままにすべてを書き起こすのが基本である。書き起こしの単位は、発話であると考えられているが、発話の客観的な特徴による定義は明らかではない。音声学的には、ある程度長い休止(ポーズ)、音の弱まりが発話の切れ目の特徴を示し、休止直前での文節末の短母音延伸と「尻上がり」音調が、発話の切れ目でないことを示す特徴であるとされる(*28-3)。表記に関しては、日本語の場合、漢字かな混じり、ひらがな、かたかな、ローマ字、音素記号といった選択肢があり、研究の目的、読みやすさ、作業のしやすさ等を考慮に入れて、決定する必要がある。転記情報は、コミュニケーション過程を分析する上で基本となるが、あくまでも二次情報であり、分析に当たっては、必要に応じて一次情報である音声や画像の記録を参考にしなければならない。
研究対象となる特徴は、休止の長さ、発話の重複といった時間に関係する情報や、音の高さや強さといった韻律情報、形態素、統語、意味、談話行為、談話構造といった言語情報、身振り、視線といった非言語情報がある。コーパス中のさまざまな特徴間の相関を調べていくことにより、非言語、音声、言語情報について個々の情報の役割やそれらの情報間の関係を明らかにすることができ、その知見は、リアルタイムの相互調整としてのコミュニケーション過程を解明することにつながっていく。



  対応ARCHIVE
  コミュニケーション▲
27
  ▼1
前記の地図課題コーパスは公開が予定されているが、本稿執筆時点では、まだ公開されていない。
 
  ▲page top