Kudoyarova T. Kakikotoba ni okeru ryakugo no shiyo teichaku to sono yoin
30.06.2016 г.

書きことばにおける略語の使用・定着とその要因
-数量化理論Ⅱ類による口語性弱化の探索-

クドヤーロワ・タチアーナ

1.目的

日本語において、略語は現代の言語生活に欠かせないものになっている。日常一般の会話をはじめ、専門的なニュアンスをもつ職場語や集団語などでも、俗語的・隠語的なものも含めて、多くの略語が用いられている。また、「科学技術は言うまでもなく、経済や社会のさまざまな重要問題も、もはや略語なしでは語れないほどである」と指摘されてもいる[1]

現代日本語の略語研究では、略語は俗語的・話しことば的であるとする印象が先行しているためか、書きことばにおける略語使用の実態調査はほとんど行われていない。しかし、略語の使用に保守的だと考えられる新聞でも略語は数多く使われ、また、その使用が原語(略語のもとになった単語)を圧倒して、定着するものも少なくない。

略語には基本的に口語性・俗語性が備わっており、こうした口語性がなくなるか、あるいは、弱まるかすれば、略語は(語形の短い点では原語より使いやすいから)書きことばでも使われるようになるはずである。田中も、「略語の中には、長く使われているうちに口語的・俗語的なニュアンスを失って語彙の中に定着し、さらには略語と意識されなくなったものも多い」と指摘している[2]。

略語の使用・定着を促す要因は、口語性の弱化だけではない。原語の語形が長大であるというような要因も考えられるし、語が使われるテキストの方に、たとえば新聞の見出しなどのように、略語が選択・使用されやすい環境が用意されている場合も考えられる。ただし、書きことばにおける略語の使用や定着においては、略語の口語性が大きな阻害要因であり、従ってまた、その弱化が促進要因となることは、十分な蓋然性を持つように思われる。

とはいえ、「書きことばにおける略語の使用と定着の要因がその口語性の弱化にある」ということを実証するのは容易ではない。たとえば、「バイト」「携帯」「コンビニ」「パソコン」という略語は、後述するように、この順に新聞での(原語と比較した場合の)相対的な使用率が大きくなるが、もし口語性の弱化が略語の使用・定着の要因であるというなら、そのためには、これら4語の口語性の度合いもこの順に弱くなるということを示さなければならない。しかし、口語性は単語の文体的特徴という内在的な性質であるから、それを直接に観察することはできない。そのため、「新聞での相対的な使用率が大きいほど、その略語の口語性は弱化しているのだ」といった循環論法に陥る危険性も大きい。こうしたことを避けるためには、略語の口語性の度合いを単なる使用率などとは異なる別の尺度で計量する必要がある。

そこで、本稿では、略語の口語性の弱化が書きことば(とくに新聞)におけるその使用と定着の要因であるという、従来から当たり前とされてきた「仮説」について、それをただちに実証することは困難であるとしても、実証するための方法論を探ってみたいと思う。

2.方法と手順

本稿では、コーパスを利用した計量言語学的な方法として、林の数量化理論Ⅱ類という統計技法を応用して、使用・定着の度合いが異なる略語について、その口語性の度合いの違いを探る方法を提案する。

数量化理論Ⅱ類とは、判別分析と呼ばれる多変量解析の一種である。判別分析とは、基本的には、「どの個体がどのグループに属するかが明確な学習用データを利用して、所属不明の個体がどのグループに帰属するかの判定を行う方法である」[3]。本稿の問題に即して言えば、ある略語と原語の対について、それが新たにある条件のもとで用いられるとするとき、略語と原語のいずれが選択・使用されるかということを、すでに得られている略語と原語の使用データ(学習用データ)から割り出した判別の式にその条件をあてはめて予測する、というものである。ここでいう判別式とは、略語と原語のいずれを選択するかということを基準変数(従属変数)とし、その選択に影響する(と分析者が考える)言語内的・外的な諸側面を説明変数(独立変数)とするとき、次のように表される。

基準変数の値(判別得点)=定数+(重み1)×[説明変数1]

+(重み2)×[説明変数2]

+(重み3)×[説明変数3]

+......

ここで、各説明変数の重み(判別係数)は、学習用データにおける略語グループと原語グループとの平均的距離の値が最大になるように決められる。いま、ある略語原語対が新たに選択・使用されるとして、この判別式に従い、その使用における説明変数としての諸側面の値を求め、それぞれの重みを乗じ(定数を加え)て基準変数の値(判別得点)を求めたとする。この判別得点が、学習用データの略語グループと原語グループとを最もよく判別する境界値(カットオフポイント)より大きいか小さいかで、この新たな使用においては略語と原語のいずれが選択されるかを予測するのである。なお、数量化理論Ⅱ類は、基準変数が「略語か原語か」というような質的な場合で、説明変数も質的である場合に用いられる。また、基準変数に対する説明変数の直接的な影響(主効果)のみが検討され、交互作用は考慮されない。説明変数の影響について統計的検定を行うこともできない。[4]

本稿では、書きことばにおいて略語の使用・定着の度合いが異なる略語原語対ごとに、コーパスから得た学習用データをもとにそれぞれの判別式を求め、略語か原語かの選択に対する各説明変数の影響力を比較する。もし、書きことばにおける略語の使用・定着の要因がその口語性の弱化であるなら、略語の使用・定着が進んでいる略語原語対ほどそれらの説明変数は当該略語の口語性が弱いことを何らかの形で示し、逆に、略語の使用・定着が進んでいない略語原語対ほどそれらの説明変数は当該略語の口語性が強いことを何らかの形で示すのではないかと予想される。

分析の対象として、新聞の経年的調査をもとに、略語の使用・定着の度合いが大きいものと小さいものを1つずつ、計2つの略語原語対を選ぶ。略語か原語かの選択(基準変数)に影響すると考えられる説明変数を設定した上で、新聞のコーパスを利用して、それぞれの略語原語対の学習用データを作成する。この学習用データについて数量化理論Ⅱ類の解析を施し、設定した各説明変数とその値である分類項目(カテゴリー)について基準変数に対する影響力を求め、その結果をもとに、略語の使用・定着の度合いの大きい略語原語対と小さい略語原語対とで、略語の口語性の度合いに違いが見られるかどうかを検討する。

3.分析の対象

筆者は、先に、一般人に馴染みのある略語とその原語の対30種について、『朝日新聞』記事データベースの23年分(1984~2006)を利用し[5]、略語か原語いずれかの用例数の多かった紙面を選んで、それぞれの使用頻度[6]を調査した[7]。これらの対の略語率が23年間でどのように変動したのかを調べ、各々の変動を以下のような8つの傾向(変動類型)にまとめた[8]。

略語が原語を圧倒するタイプ(略語圧倒型)

略語が原語を圧倒し、その使用率がほぼ100%となるものである。「インフレ」「ダイヤ」「パトカー」「パソコン」「リストラ」「リハビリ」などは、略語の使用が圧倒的になる。

略語が原語より優勢であるタイプ(略語優勢型)

「原発」「原爆」「入試」など、略語の使用が原語のそれよりきわめて優勢になるものである。これらの略語はどの紙面でも原語より優勢で、特にオピニオン面では、略語のみが使用される年も見られることが特徴的である。

略語が原語を上回るタイプ(略語逆転型)

「コンビニ」「産廃」「着メロ」など、略語の使用が殆どの紙面において、緩やかに原語を上回るものである。ただし、そうした傾向には、紙面別に遅速がある。

略語が原語と拮抗するタイプ(拮抗型)

略語と原語の使用率が接近し、両者が拮抗するようになるものである。「自販機」ははじめ原語が優勢であり、逆に、「卒論」は略語が優勢であるが、どちらも、原語・略語が互角に使われる傾向に収束するように、どの紙面でも見える。

略語が原語を上回らないタイプ(略語微増型)

「携帯」「通販」「コンタクト」「有休」「サプリ」など、略語が少し増えるものの、原語を上回ることがないものである。このタイプの略語は、オピニオン面や生活面など、口語的な表現や用語が許容される紙面で増えやすい。

略語が増えないタイプ(原語優勢型)

「バラエティー」「院生」「定期」など、どの紙面でも略語の使用率が低く、増えないものである。略語率が低い点が、やや口語的である紙面において使用頻度が少し増える略語微増型と違うところである。

略語が殆ど使用されないタイプ(原語圧倒型)

「高速」「バイト」「就活」など、原語が圧倒的に多く、略語が増えることなく、殆ど使用されないものである。このタイプは、略語使用率が非常に低いのだが、それでも、オピニオン面、生活面のような紙面ではわずかだが使用されている。

略語が不規則に増減するタイプ(不規則型)

「スパコン」「投信」「入管」など、略語が原語に取って代わることなく、その使用が不規則に増減するものである。これらの使用頻度は、指示対象の話題性(時事性)と関連して増減する。

今回の分析対象としては、この8つの変動類型のうち、対照的なタイプである、略語が原語を上回るC略語逆転型(「コンビニ/コンビニエンスストア」)と、略語が原語を上回らないE略語微増型(「携帯/携帯電話」)とに注目する。

4.説明変数

次に、数量化理論Ⅱ類の判別式に盛り込む説明変数を決める。ここでは、新聞にみられる以下のような文章・文体上の諸側面を説明変数として設定することにする。①~⑩が説明変数、その下位の各項目が変数の値としての分類項目(カテゴリー)であり、たとえば、①紙面という説明変数では、分析対象とした略語と原語の(コーパスにおける)1つ1つの用例について、それが総合面~生活面のいずれの紙面で使われたかを<1>~<5>の値で示すことになる。作成した学習用データに数量化理論Ⅱ類の解析を施し、これらの説明変数および分類項目の中から、基準変数(略語か原語かの選択)に対する影響力の大きいものを見出し、それらについて略語の口語性との関係を検討していくことになる。

紙面:<1>総合面、<2>社会面、<3>経済面、<4>オピニオン面、<5>生活面。

記事内の出現位置:<1>1回目(初出)、<2>2回目以降。

記事の長さ:<1>300字まで、<2>それ以上。

文脈的意味:略語ないし原語の文脈における指示対象が、<1>一般的なものである場合、<2>特定のものである場合。

引用か地か:<1>単語が引用文で使用される場合、<2>地の文で使用される場合。引用文には、会話文のほか、「 」で囲まれる文も含める。単に用語を「 」で囲んだものは含まない。

文章の様式(文体):<1>普通体、<2>丁寧体。

文章の人称体:<1>一人称体、<2>三人称体。

文の構造:<1>単語が主節中に出現する場合、<2>従属節中に出現する場合。従属節は、補足節、名詞修飾節、副詞節とし、等位節は主節に含める。

列挙構造か否か:「コンビニエンスストア、デパート、百貨店」や「携帯電話、パソコン、...」など、<1>同一意味領域の単語とともに列挙されている場合と、<2>そうでない場合。

署名の有無:<1>署名記事、<2>無署名記事。

5.コーパスと学習用データ

数量化理論Ⅱ類の解析に用いる学習用データは、『朝日新聞』記事データベース23年分のうち、期間の最終年にあたる2006年1年分のコーパスから作成する。このコーパスで、これらの略語原語対が一般名(普通名詞)の単純語として用いられた用例を検索し、それぞれ、「コンビニ」350例と「コンビニエンスストア」219例、「携帯」443例と「携帯電話」1973例を得ている。学習用データは、略語原語対ごとにまとめて作られ、それぞれの1つ1つの使用例について、基準変数の値(略語か原語か)と①~⑩の説明変数の値が入力される。

6.解析の結果

数量化理論Ⅱ類の解析結果を表1に示す[9]。

表1 数量化理論Ⅱ類の解析結果

 

 

コンビニ/コンビニエンスストア

携帯/携帯電話

 

 

判別的中率: 74.9%

相関比=0.378

判別的中率: 71.2%

相関比=0.172

アイテム

カテゴリー

用例数

カテゴリースコア

レンジ

偏相関係数

用例数

カテゴリースコア

レンジ

偏相関係数

①紙面

総合面

88

0.097

0.427

0.100

568

-0.043

0.996

0.105

社会面

235

-0.198

899

-0.236

経済面

110

0.143

406

-0.240

オピニオン面

82

0.229

334

0.527

生活面

54

0.067

209

0.756

②出現位置

1回目

407

-0.345

1.213

0.382

1311

-0.581

1.270

0.266

2回目以降

162

0.868

1105

0.689

③記事の長さ

300字まで

101

-0.244

0.297

0.078

299

0.208

0.237

0.034

それ以上

468

0.053

2117

-0.029

④文脈的意味

一般的

385

0.203

0.629

0.171

1484

0.038

0.098

0.020

特定

184

-0.426

932

-0.060

⑤引用か地か

引用文

56

0.864

0.959

0.206

203

1.039

1.134

0.139

地の文

513

-0.094

2213

-0.095

⑥文章の様式

普通体

537

0.009

0.156

0.026

2265

0.050

0.804

0.079

丁寧体

32

-0.147

151

-0.753

⑦文章の人称体

一人称体

87

0.826

0.975

0.202

417

0.906

1.095

0.123

三人称体

482

-0.149

1999

-0.189

⑧文の構造

主節中

262

0.111

0.206

0.077

971

0.108

0.180

0.040

従属節中

307

-0.095

1445

-0.072

⑨列挙構造

列挙

171

0.069

0.099

0.032

464

-0.000

0.000

0.000

非列挙

398

-0.030

1952

0.000

⑩署名の有無

署名記事

252

0.131

0.235

0.071

1059

0.019

0.034

0.006

無署名記事

317

-0.104

1357

-0.015

なお、以下では、数量化理論Ⅱ類の用語に従って、「説明変数」を「アイテム」、その値(分類項目)を「カテゴリー」ということがある。

判別的中率と相関比は、判別式による解析の精度(設定した説明変数全体で、基準変数である事象をどれくらい説明できているか)を示す指標である。一般に、判別的中率は75.0%以上、相関比は0.25以上であれば解析精度がよいとされている。今回の結果は、いずれも、決して大きな値ではないが、許容できないほどの小さな値でもない。

レンジと偏相関係数は、設定したアイテムの、基準変数に対する効果(影響力)を表す。レンジは、各アイテムにおいて最も大きなカテゴリースコア(後述)と最も小さなカテゴリースコアとの差であり、偏相関係数は、他の変数の影響をすべて取り除いたときのアイテムの影響の大きさを表す標準化された係数である。表1によれば、これらの値の大きな、すなわち、略語か原語かの選択に影響力のあるアイテムは、「コンビニ(エンスストア)」では、

②出現位置>⑦文章の人称体>⑤引用か地か>④文脈的意味>①紙面

の順となり、「携帯(電話)」では、

②出現位置>⑤引用か地か>⑦文章の人称体>①紙面>⑥文章の様式

の順となって、ほぼ同様の結果となった。

 カテゴリースコアは、他のアイテムの影響をすべて取り除いたとき、そのカテゴリーに属すことが基準変数に及ぼしている影響の大きさと向きを表している。影響の大きさは絶対値の大きさによって表され、表1では、向きが正ならば略語を、負ならば原語を選択・使用することを表すようになっている。これにより、たとえば②(記事内の)出現位置というアイテムでは、どちらの略語原語対でも、<1>1回目(初出)であることは原語を選択・使用する方向に、<2>2回目以降であることは略語を選択・使用する方向により強く作用していることがわかる。

次節では、影響力の大きさの順に各アイテムのカテゴリースコアを見て、略語の口語性との関係を探る。

7.結果の検討

②記事内の出現位置は、「コンビニ(エンスストア)」「携帯(電話)」の両方で最も大きな影響力をもち、最初<1>に正式な名称としての原語を用い、<2>2回目以降は字数節約のために略語を用いるということであり[10]、このことは、基本的には、略語の使用・定着の度合いの違いにかかわらないようである。ただし、<1>1回目のカテゴリースコアの絶対値は、「携帯(電話)」(-0.581)より「コンビニ(エンスストア)」(-0.345)の方が小さく、1回目を原語とする力は後者の方が小さい。このことは、「コンビニ(エンスストア)」では「原語は正式=文章語的で、略語は略式=口語的」という度合い、すなわち、略語の口語性が弱まっていることを示唆しているように思われる。

⑤引用か地かというアイテムも、「コンビニ(エンスストア)」「携帯(電話)」の両方で大きな影響力を持ち、<1>引用文が略語を選択・使用する方向に大きく作用し、<2>地の文はわずかに原語を選択・使用する方向に作用するという点でも共通している。話し手の発言・談話を示すことが多い引用文で略語の選択・使用が促進されるということは、略語が口語性を持っていることと整合する。ただし、その度合いは、「コンビニ(エンスストア)」(0.864)の方が「携帯(電話)」(1.039)より小さく、略語の口語性が弱いことを示唆している。

⑦文章の人称体も、「コンビニ(エンスストア)」「携帯(電話)」の両方で大きな影響力を持つ。投書などに代表される一人称体の記事は、多くの場合、三人称体の記事に比べて口語的であり、また、書き手の用語がそのまま掲載されることも多いことから、略語使用が促進されるのであろう。ただし、ここでもその度合いは、わずかではあるが、「コンビニ(エンスストア)」(0.826)の方が「携帯(電話)」(0.906)より小さく、略語の口語性が弱いことを示唆している。

①紙面も、「コンビニ(エンスストア)」「携帯(電話)」の両方で影響力を持つが、「携帯(電話)」での影響力の方がより大きい。「携帯(電話)」では、カテゴリーの間に、<5>生活面、<4>オピニオン面では略語の選択・使用が、<3>経済面、<2>社会面では原語の選択・使用が促進されるという明確な差があり、これは、生活面・オピニオン面は口語的、経済面・社会面は文章語的な性格が強いという、紙面の文体的な違いときれいに対応している[11]。一方、「コンビニ(エンスストア)」では、紙面の文体的な違いと対応するような傾向は見られない。こうしたことは、「コンビニ(エンスストア)」の方で略語の口語性が弱まっていることを示している。

⑥文章の様式は、「コンビニ(エンスストア)」ではあまり影響力がないが、「携帯(電話)」では、<2>丁寧体の記事で原語の選択・使用が促進されるという結果が出ている。

1) 携帯電話は、我が家では必要不可欠です。(「オピニオン面」、2006年)

これは、略語「携帯」の口語性が強く、丁寧体と整合しにくいことによるものだろう。一方、こうしたことが「コンビニ(エンスストア)」で見られないということは、略語「コンビニ」の口語性が弱まり、原語との文体差が小さくなっていることを示している。

④文脈的意味は、「携帯(電話)」ではほとんど影響力がないが、「コンビニ(エンスストア)」では、<2>特定の店を表す場合に原語の選択・使用が促進されるという結果になっている。これは、特に社会面記事で、事件などの発生場所として特定の店が示される場合、原語「コンビニエンスストア」が使われることが一般的であることと関係している。

3)5日午前4時半ごろ、大阪府東大阪市吉原2丁目のコンビニエンスストア「ローソン東大阪吉原店」で、新聞などを買うふりをしてレジに近づいた男が男性店員(20)に包丁を突きつけ、「金を出せ」と脅した。店員がレジから現金約20万円を取り出し渡すと、男は現金を奪って徒歩で逃げた。(「社会面」、2006年)

『朝日新聞』の社会面記事では、こうした場合、原語の選択・使用が一つの慣用となっているようであるが、その理由については明らかでない。

8.結論

以上の検討結果は、次のようにまとめることができる。

(1) 「コンビニ(エンスストア)」と「携帯(電話)」の両方で影響力の大きい上位3アイテム(②、⑤、⑦)は、それぞれのカテゴリーの作用の向きも同じであり、略語か原語かの選択・使用に同じように影響している。ただし、カテゴリーの影響の程度の違いから、いずれも、「コンビニ(エンスストア)」の方が「携帯(電話)」より、略語の口語性が弱いことを示唆している。

(2) ①と⑥は、いずれも「携帯(電話)」での影響力が大きく、口語的な紙面では略語の、文章語的な紙面では原語の選択・使用が促進され、また、丁寧体の記事では原語の選択・使用が促進されることなどから、略語「携帯」の口語性が強いことを示し、一方で、「コンビニ(エンスストア)」ではいずれの影響力も弱いことから、略語「コンビニ」の口語性が弱いことを示している。「コンビニ(エンスストア)」で影響力が認められた④文脈的意味については、略語の口語性との関連は見出せない。

これらの結果は、略語の使用・定着が進んでいる「コンビニ(エンスストア)」の方が、あまり進んでいない「携帯(電話)」よりも、略語の口語性が弱いことを示していると言ってよい。したがって、数量化理論Ⅱ類を応用する本稿の方法は、略語の口語性の弱化が書きことばにおけるその使用と定着の要因であるという従来の「仮説」を実証するための、その方法論として一定の有効性をもつものと結論することができる。

[1]加藤大典編(1995)『略語大辞典』丸善

[2]田中章夫(1978)『国語語彙論』明治書院

[3]村上征勝・金明哲(1998)『講座人文科学研究のための情報処理5 数量的分析編』尚学社

[4]古谷野亘(1988)『数学が苦手な人のための多変量解析ガイド 調査データのまとめかた』川島書店

[5]朝日新聞オンライン記事データベース『聞蔵Ⅱビジュアル』(『AERA』『週刊朝日』は除く)を、大阪大学附属図書館を通して利用した。

[6]使用頻度は、一般名(普通名詞)の単純語として用いられた場合だけをカウントし、合成語の構成要素や固有名詞として用いられた場合は除いている。

[7]クドヤーロワ・タチアーナ(2011)「現代新聞における略語使用の変動傾向」『計量国語学』28-3

[8]クドヤーロワ・タチアーナ(2012)「現代新聞における略語使用の変動傾向とその類型」『待兼山論叢』46(日本学篇)

[9]統計解析には、"HALWIN"(Ver6.24、現代数学社)、および、群馬大学社会情報学部・青木繁伸氏作成によるデータ解析サイト"Black-Box"(http://aoki2.si.gunma-u.ac.jp/BlackBox/BlackBox.html、2014年9月30日アクセス)を利用した。

[10]菅野も「マスコミ言語の省略表現」(『日本語学』1993、12-10)において指摘するように、語形の長い原語を何度も使用することは、書き手・読み手の双方にとって負担となるという事情もあるだろう。

[11]オピニオン面は、専門家や識者の意見だけでなく、一般読者からも様々な意見や感想が寄せられており、それらには会話的な表現が多い。また、(「家庭面」と「くらし面」を合わせた)「生活面」にも、読者からの投稿のほか、日々の暮らしに役立つ情報が掲載されて、一般読者に馴染み深い用語が数多く使われており、いずれも、口語的な性格が強い紙面であるといえる。

【参考文献】

高木廣文・佐伯圭一郎・中井里史(1989)『HALBAUによるデータ解析入門』現代数学社

宮島達夫(1996)「カテゴリー的多義性」『日本語文法の諸問題 高橋太郎先生古希記念論文集』ひつじ書房

森岡健二(1988)「略語の条件」『日本語学』7-10

Последнее обновление ( 22.07.2016 г. )