単ー化文法に基づく 辞書記述 - AZ

P
r
o
l
o
gによる機械翻訳システム その 4
単ー化文法に基づく
辞書記述
高野真
前回は,埋め込み文の処理を考慮した日蒋喜
の文全体の生成について具体的なインプリメ
ントを行なったo
舎回は,英文の形態素解析および単→じ丸宝
に基づく辞書苗遣のシステムについて紹介す
る
。
操作句(手の中 (
0旬e
c
t
)
.
K
t
)
->
機械翻訳システムは、英文の形態素解析、構文
つみき (
O
b
j
e
c
t
)
.
解析と中間表現の生成、中間表現からの日本語文
"を
の生成といった 3段階で構成される 。
把握動詞 (
K
t
)
.
つみき(赤い積木)-->
前固までで、中間表現から、日本語文を生成す
,
赤(述体).
る手続きについて考えた 。今回は英文の中間表現
"つみき .
.
¥
.
から中間表現の生成までの部分の概要と、形態素
赤(侭
Kt
吟
)
ト
一
-
..あか"¥
解析の具体的な手続きについて考える 。
'
形容詞語尾 (
K
t
)
.
英文の処理は、最先端の自然言語言語記述であ
把握動詞 (
K
t
)
>
る単一化文法の枠組みで考える 。
回 文法記述と文法処理
この連載の最初のほうで、 意味文法による自然
言語処理(積木の世界)システムを紹介した 。そ
のときは、意味文法の枠組みで記述した文法を、
直接 p
r
o
l
o
gプログラムに翻訳して解析を進めた
はずである 。
"っか
ま 5(
K
t
)
.
図I 積木の世界の文法記述
た活用形を伝えるためのものである 。
そして 「
手の中 (Object)J が文章を解析するこ
とで得られる 意味表現である 。
たとえば、
「あかいつみきをつかめ」 といった
入力があるとする 。 この文の処理をトップダウン
その際の文法記述の一部を、図 lに示す。
に行なうことを考えよう 。 トップダウンに処理す
図 1の文法記述の中で「操作句 J "
[
つみき」
るとは、 一番上位の文法カテゴリーから、単語へ
「
赤J "
[
把握動詞 J "
[ま 5J などの文字アトム
は、文法カテゴリーの名前である 。
"
[
KtJ という変数は 「
命令 J [
"
連
用
」 といっ
と処理を進めていくことである 。
最初に 「
入力文が 『
操作句(手の中
(Ob
j
e
c
t
)。 命令形),にマッチするか , l
い勺た問いカりがなされる .文全体がいき
下位のカテゴリーとのマッチングがとられる 。
あかいつみ
つまり、暗初の問いかけは rr
復作句(手の中(Ob
j民
,
)
. 命令),
むり r
にマァチしない tJ,~ 1
)
, 文法記述に従って
き・・・ 』は 『
つみき(赤い柿木 )
J+ を
・+ r
把
出動詞(命令 )
J とマッチするか J に分けられ
る。
このように問いかけを下位のカテゴリーに
T"
Ri
,h
t
次々に分解していくと、いつかはカテゴリーと
l
'
l踊がマッチする 。たとえば 「い」は「形容阿
描居住i
l
休)
Jに 「
あかい」は 「
赤{迎休 )
Jマッチ
する 。
盤作句
つみき
"を"
このようにして入力文全体は 「
操作句(手の中
把握動調
J というぶんぽうカテゴリ
(赤い続本)命令 )
に
マッチする 。
ζ
凶
2 文諸島記述
うしたトップダウンの解析を図式化する
と、図 2のような立法記述に対 L図 3のような
その'
文法担理プログラムを適用することに側 当す
ヲ
.
る。
t
r
e
e
(
T
o
p,S
)
It(To
p,S
)
次に、関 1の文法記述をボトムアップに解析
p,
S
)
t
r
e
e(To
句.逝観劇 (
T
o
p,
L
e
f
t引 &
h
t
)
t
r
e
e
(L
t
:
ft
,
S
I
)
.
,
e(Rih
t
.
S
2
)。
t
re
a
p
p
e
n
d
(
S
I,
S
2
.
S
)
することを考えよう 。入力は同じく 「
あかいつ
みきをとれ Jである 。
ボトムアップに解析するとは、 l~ 陪 の 方 から
上位のカテゴリーへと処理を進めることであ
図 3 ト刀プダウンの文洛処1
1プログラ'"
T
o
o
る。
Iていくと 「あか」
まず、入力文を左端 から J
が亦(迎休)の下位のカテゴリーである 困
あか・とい
う文字列とマッチする 。
赤日i
l
体)を完成するには、次は形容詞出毘{辿
体l
でなければならない。副 しにマッチングをと
同o
t
her
L
eft
ってみると、確かにうまくいく .
R
i&
h
t
そこで次はさらに上位のカテゴリーである
「つみき(赤い制 *)Jが完成するかを調べにい
像作句
S
く。
このように処理は進んでいく 。
こうしたボトムアップの解析を図式化する
と、図 4のような立法記述に対し図 5のような
智
彦
"畠か "
文法盟纏プログラムを適用することに相 当す
彫 曹 関 宮尾{連体 }
る。
トップダウンとボトムアップの文法処思は、
1
1できる 。
図 1の共通の立法記述に対 L適1
図. ,.法"湿その 2
この節の題名は 「
立法記述と文出処理」 とな
っているが、
「
立法記述」 と 「
立法処組」
3
句構造文法の極には図7で挙げた文法があ
[
第1要素] 品詞名を表わす
り、句構造文法に偏った左側には図8で挙げ
"
n"
は名詞
は、LFG、GPSG、HPSGと呼ばれている一群
"
a"
は形容詞、副詞
た文法や意味文法がある。単一化文法の側に
"
v"
は動詞
の文法記述体系が存在する。
"
det
"
は冠詞、名詞の所有格
文法の極にある、HPSGをベースにした文法記
述体系である。文法規則の数は現在の所5つ
"
p"
は前置詞
[
第2要素] 形態に関する記述
"
fin"
は原型、動詞の場合"
past
p"
(過
で足りるところまで抽象化してある。意味文
去分詞)、"
presp"
(現在分詞)などが
法で実用的なシステムを記述しようとすると
ある。
数百から千のオーダーの文法規則が必要であ
るのに比べると劇的に少ないといえる。
文法規則が抽象化されるに伴い、文法カテ
ゴリーの数も今の所6で足りている。
その内訳は
名詞では人称・数を記述する。
be"
はbe動詞を表わす。
[
第3要素] "
名詞では格を表わす。
[
第4要素]
は支配的。
n 名詞
"
i
s"
の場合は主格の名詞が前方に来
v 動詞
る。
a 形容詞、副詞
"
l
ove"
の場合は主格の名詞が前方に来
det 冠詞、名詞の所有格
j
unc 接続詞
る。
[
第5要素]
は支配的。
である。
"
l
ove"
の場合は直接目的語として名詞
"
vp"
や"
np"
といった上位の文法カテゴリー
は"
v"
や"
n"
に吸収されている。
文法規則や文法処理については次回で解説
をとる。
[
第6要素] 前方への接続に関するする制約、品詞
は被支配的。後置詞的な修飾語などは
するものとし、今回は語彙の記述の方法につ
いて解説を行なう。
図10が語彙記述の例である。
i
s"
の記述である。引き数は3つ
動詞としての"
あって、最初が語彙の形態の記述と接続に関
する制約の記述である。
2番目と3番目の引き数は、語彙の形態に
対する制約を重リストで表わした物である。
語彙の記述のリストの要素はそれぞれ下記
のようになっている。
後方への接続に関するする制約、品詞
ここに制約を記述する。
[
第7要素]
は被支配的。冠詞や修飾語はここに制
約を記述する。"
t
he"
の場合は次に名詞
が来ることが記述されている。
[
第8要素] 非制限依存と呼ばれる間接的な制約を
記述する。
またコロン"
:
"
の後には意味情報が書き込まれてい
る。例えば"
hot
el
"
の意味は「ホテル」で"
t
he"
の
意味は次に来る名詞と同じである。
4
このように語藁の中に、事細かに接続に関
このように語彙の中に、事細かに接続に関
する情報を記述することで文法への負担は大
する情報を記述することで文法への負担は大
幅に減って、 5つの文法規則だけで広範囲の
幅に減って、5つの文法規則だけで広範囲の
文を説明することができる。
文を説明することができる。
しかし、一つの語藁が様々な接続に関する
しかし、一つの語彙が様々な接続に関する
制約を持つ場合は、それらを全て記述しなけ
制約を持つ場合は、それらを全て記述しなけ
ればならない。
ればならない。
り受動態における制御動詞になったりもす
り受動態における制御動詞になったりもす
る。文法規則がすっきりした代償に、語藁の
る。文法規則がすっきりした代償に、語彙の
記述の冗長性という新たな問題が生ずるので
記述の冗長性という新たな問題が生ずるので
ある。
ある。
では句構造文法に比べて全くメリットが無
では句構造文法に比べて全くメリットが無
いかというと、そうともいえない。
いかというと、そうともいえない。
れば、誤りは語葉の記述にあることは明か
れば、誤りは語彙の記述にあることは明か
で、それも入力文で使った単語だけを調べれ
で、それも入力文で使った単語だけを調べれ
ばすむ。
ばすむ。
こうしたデバッグのしやすさが、単一化文
こうしたデバッグのしやすさが、単一化文
法のメリットである。
法のメリットである。
も、句構造文法では他の文法規則との干渉を
も、句構造文法では他の文法規則との干渉を
考慮に入れなければならず、文法体系に
考慮に入れなければならず、文法体系に
n
n,
,
s
3,
5
3
,
_,
[
],
[
]
,
[
],
[
]
,
[
],
[
]
,
[
],
[
]
,
[
]
[
]
i
n(
[
p,
_,
I
n,
,
i
n
[
[
v
_
,
_
,
[
]
,
[
]
,
[
]
,
[
]
,
[
]
]:X
X]
],
[
[
V,
,
_
,
_
,
[
]
,
[
]
,
[
]
,
[
]
,
[
]
]
目
,
[
[n
,
P
ac
cc
c,
[
],
[
],
[
],
[
],
[
]
]:Y
Y]
],
[
[
n
,
PN,
N,
a
,
[
]
,
[
]
,
[
]
,
[
]
,
[
]
]
目
,
[
],
[
]
,
[
],
[
]
,
[
]
[
]
t
h
e(
(
t
h
e
]
目
[
Y,
,
に
,X
,
C
,
C
:
[
Y
に,
X]
],
C,
C)
).
[
VA
]
[
]
[
]
[
d
et
t,
de
,
s3
_,
[],
[],
[[n,
_,
_,
[],
[],
[],
[],
[]]:X],
[]
''nH
図1
0動詞の語藁記述の例
図1
0
動詞の語彙記述の例
]
目
[
背が高い, S
Se
e
m
,
J,C
C,
,
C)
:
[
背が高い,
m]
C
).
JHUHUHμHU
]
目
[
愛する, X
,
は
,Y
,
を
]
,,C
C,
,
C
:
[
愛する,
X,
は,
Y,
を]
C)
).
a
a,
,
_,
_,
[
],
[
]
,
[
],
[
]
,
[
],
[
]
,
[
[
n
P
_
,
[
]
,
[
]
,
[
]
,
[
]
,
[
]
]:S
[
[
n,
,
PN,
N,
_
,
[
]
,
[
]
,
[
]
,
[
]
,
[
]
]
目
Se
em]
m],
,
[
]
[
]
ド
v,
V
,
白n
fin
_,
[
[
n,
P
n
o
m,
[
],
[
],
[
],
[
],
[
]
]:X
],
[
[
n
,
PN,
N,
n
o
m,
[
]
,
[
]
,
[
]
,
[
]
,
[
]
]
目
X]
,
[
[n
,
P
ac
cc
c,
[
],
[
],
[
],
[
],
[
]
]:Y
Y]
],
[
[
n
,
PN,
N,
a
,
[
]
,
[
]
,
[
]
,
[
]
,
[
]
]
目
,
[
],
[
]
,
[
],
[
]
,
[
]
[
]
[
,
n
v,
V
,
fi
n
f
i
n,
,
be
e,
b
[
[
n,
P
n
o
m,
[
],
[
],
[
],
[
],
[
]
]:X
],
[
[
n
,
PN,
N,
n
o
m,
[
]
,
[
]
,
[
]
,
[
]
,
[
]
]
目
X
]
,
[
],
[
]
,
[
],
[
]
,
[
],
[
]
,
[
]
[
]
]
:
[
いる,
X,
は]
,
[
単数(
P
N)
C
],
C
).
目
[
い
る
,X
,
は],
[
単数 (
P
N)|
I
C
]
,
C)
[
て確認する事になる。
て確認する事になる。
n
H
l
o
v
e
(
l
o
v
e
(
特定は非常に難しく、実際はトレースをかけ
特定は非常に難しく、実際はトレースをかけ
t
a
l
l
(
t
a
l
l
(
]
目
ホテル, C
C,
,
C
)
:
ホテル,
C
).
[
る。その場合どの文法規則が誤っているかの
る。その場合どの文法規則が誤っているかの
(
i
s(
[
ときは、句構造文法では文法規則に原因があ
ときは、句構造文法では文法規則に原因があ
それに対し文法が単一化文法で記述してあ
それに対し文法が単一化文法で記述してあ
的に用いられることもあれば、補語をとった
的に用いられることもあれば、補語をとった
h
o
t
e
l
(
h
o
t
e
l
(
自然言語処理システムを開発している際
自然言語処理システムを開発している際
に、入力文を思ったように解析してくれない
に、入力文を思ったように解析してくれない
]
X,
,
C,
,
C
:X
C
C)
).
目
5
5
ついて熟知している必用があるが、単一化文法
今回は中庸をとって、語桑規則が簡単な名調や
では文法はいじらずに、語集を拡張するだけで記
形容詞・副詞の変化は語藁規則で記述し、動詞に
述方法さえ分かれば素人でも可能である 。
ついては制約記述が大幅に変わる現在分調形や過
しかし、こうした利点はあっても "Hotel"と
川 otel"のように大文字の有無、冗 at"と冗 ats"の
ような単数形と複数形、さらには動詞の時制、 3
去分調形は扱わず、 3人称・単数・現在の語桑規
則についてのみ記述することにした 。
従って "
l
i
v
e
"の場合は "
l
i
v
e
s
"の記述は必要はな
人称単数現在の "SI¥ 修飾語の比較級や最上級に
いが、 "
l
i
v
e
d
"や "
l
i
v
i
n
g
"については別途記述しな
ついての記述をいちいち行なっていたのでは、記
ければならない 。
述の数は膨大なものになってしまう o
そこで、導入されるのが原型(見出し語)の語
桑記述から、変化形の語桑記述を生成するための
図形態素開斤プログラムの
インプリメント
図 11が、英文読み込みルーチンと、語最規則
「
語桑規則」である 。
しかし、語桑記述を生成するための処理時聞は
を含んだ形態素解析のプログラムである 。
無視できないものがある 。スピードを優先する場
32767までの数字や熟語の処理もサポートして
合は、語桑記述の冗長性は我慢するべきであろ
いる 。
う。パソコン上の Arity-PROLOGの様な大容量の
"
i
n
p
u
t
"という述語が、英文読み込みルーチン
データベース空聞を持つ処理形では語桑規則は導
である 。今回は形態素解析までなのででる幕はな
入しない方が良い 。
いが、入力された英文をスペースなどの句切り記
Prolog-KABAの様にコードエリアが狭い処理
号で分けてアトムを要素とするリストにして返す
形では、スピードの遅さには目をつむって語桑記
機能を持っている 。同時に文頭の大文字を小文字
述を導入する必要があろう o
に直す処理も行なっている 。
% ホキ*ホ******ホ噂********ホキ*%
%
オペレータ
%
%*********本*本**窓********%
。
p(
lOO,
xfy,
'
:
'
)
%*******牢**牢*本*ホキ*ホ*********牢**牢%
%
英文入力パッケージ
%
%ホキ*ホ**ホ*本**噂********ホキ*ホ*本**本**%
word_cut([331X]
,
[[
33
]
1Y
]
)一
word_cut(X,
Y
)
wordJut([631X
],
[
[
6
3
]
I
Y
]
)ー
word_cut(X,
Y
)
[Word1
Y
]
)ー
word_cut(X,
word_cutl(
X,Word,T
a
i
l
),
word_cut(Tail,
Y
)
.
input(Ret) 一
ascread(
X
),
word_cut(X,
Y
),
naming(
Y,
R
e
t
),
word_cut1(
[
]
,
[
]
.[
]
)
。
wordJutl(
[
3
2I
T
a
i
l
]
.
[
]
.
[
3
21
T
a
i
l
]
):
naming([]
.
[]
)
word_cutl(
[
4
4I
T
a
i
l
]
.
[
]
.
[
4
4I
T
a
i
l
]
):
-
word_cut
1(
[
3
3I
T
a
i
l
]
.
[
]
.
[
3
31
T
a
i
l
]
)
,
[Z1
W])
naming([XI
Y]
upper_lower(X,
X1
),
name(Z,
X1
),
naming(Y,
W)
%キ****キホ*ネホ**ホ仲ホ仲*****%
%
単語切り出し
%
wordJut1(
[4
61T
a
i
l
]
.[
]
.[461
T
a
i
l
]
)ー
word_cut1([Code1
X
]
.[Code1
Word_Rest].Tail)
word_cutl(
X,
Word_Rest,
T
a
i
l
)
ー
%ホキ*ホ**ホ****噂*ホ******ホキ*%
%本*叫ホ叫*村本車****叫*叫*本%
% 辞書 引き
%
wordJut([]
.[]
)
wordJut([321X
]
.
Y
)ー
wordJut(X,
Y
)
,
[
[4
4
1
1Y
]
)
word_c
u
t
(
[441X]
Y
)
word_cut(X,
% 熟語
%
word_cut([46IX]
,
[[
4
6
1
I
Y
]
):
word_cut(X,
Y
).
ex:
-
%******ホ****本**本********o/c
lex(Lex,C1,C2,S1,S2)
phrase(S1,S2,C1,C2,Lex),
6
図 11 形態素解析プログラム
次ページに続く
I
n
p
u
l
(
S
)
M
)
I
C
K
(
L
c
K.
C1
.
1
1
.
5
.
(1
w
r
l
l
e(
L
eヌ)
l
e
K
(
[
P
o
s
.FormI
L
e
K
)
.
CI.C2.[WordI
T
[.
T
)
name(Word.Word1
)
師1
(
Pos.
F
orm.WordI.Word2)
name(Word3.
Word2)
M'
"
"[Word3.[Pos自n1
L
e
K
):
x
'CI
.C2)
'
"
処
吾埋
w
r
l
t
e
(
C1
)
n.
ln
l
f
a
l
l
.
.
M
%
・・・
・
・・
・
・・
・
・
・
・
・・
・
・・
‘'
0
0
0
0
%
静櫛引 き
%
数値か
%・・
・
・
・
・
。
ー
・
・
・・
・
・
・
.
.
.
・・
・%
% 掛
賂処
隈
%
%・
・
.
.
.
.
.
.
.
.
.
..
.
.
.
..
.
.
.
.
・9‘
%・
・
・
・
・
・
.
.
.
・
・
・
・
.
.,
0
0
%
%単..‘
%
・・
・・・
・
"
・
・
・
・
・・
・・
・
・
・
・
・
.
.,
,.
J
'.
.
.
.
.
.
.
.
.
.
.
.
.
.
‘,
%
%
・・・・・・%
l
e
K(
jd
e
l
.
[,
)1
,
(1l
.(
(
n.
PN
.
_
.
1,
)11
.
1(
.
()
.
1
1
1:
X(
.
[I
1:
IWordの
X)
.[
C
[Cl
[.
C1
.
[
W
o
r
dl
ηTI
g
er
(Wor
d)
'
"
旬
、
l
e
K
(
L
e拠 CI
.C2.
1.
V
o
r
d[
TI
.
T
)
IWord.
Lex.
CI
.
C
2
1
M
・
M
%
.
.
.
.
.
.
.
.
.
.
.....
.
.
.
.
.
.
.
・
餅1
廷を出してひ <
‘
,
a
所 -Ii輸の名絢 "冠澗と して鍛う
%
・
・
・ ・
%
I.~I~ 処哩 (n.p3 : les ':y')
9
%
・・
・・・
・・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・
・・
・
・
・‘'
,'
J
'"
・ ・・
・
・
・ ・・ ・・
・
・
.
.
.
.%
u
裕i
数形
都
足処
哩 (n.p3・
,
h,
ぷ
同
, h・
}
1
Mさ
処
埋 (n.p3:ches','ch')
処
甥 (n.p3・
s
e
s'ー
ピ}
d
Mさ
舗
賂処
埋 (n.p3:xes'.
"x'
)
制
服処
理 (n.p3・
oes'・
,
.
,
%
・
・
・ ・ ・ ・'
‘
そのままひ〈
%
%
%
・・
・・・
・・
.
.
..
..
.
.
..
.
.
..%
%
%
%
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.%
C置単 数 (
PN
)
c.桜 殻 (
PN
)
)
%
, 所l
f納
%・
"
・
・
・
.
.
.
・
・
・
・
..
,
1
Mさ
処
坦 (del.p3:s".[]
)
制
限処
型 (det
._
.ダ 1
1
1
%・
・
・
・
・
・
・
.
.
.
.
.
.
.
.%
%
作V
or
d_< 1.>
・
・
・
0
・
%
・%
l
e
K
(
制
応
処
埋 (n.p3:ves'.T)
制
応
処坦(n.p3:v目 fe')
舗
陪
処
哩 (n.p3.'vs".'f'
)
羽
陪処
埋 (n.p3:vs fe'
)
紡
応
処
哩 (n.p3:s'.
[]
)
%.
.
.
.
.
.
.
.
.
・
・
・
.
.
悶
.・・・・........ ~‘
,
,
Form
所/
i
愉
1
1
1
1
1
1
%
0
臨 I~ 処 哩 (v.fin. "s" .' I[l
%・
"
・
・
・
.
.
.
・
・・
・.
.
,
1
1
・
・
・
・
・
・
.
.
.
.
.
.
.
.%
‘%
'・
似
、
"の別 C.C.(Word[T)η
name(Word .
.
.
.
o
r
d1
)
.,
己
処
伺 (del.Form.WordI.Word2)
name(Word3.Word2)
I
Word3.
l
n.
_.
_
.[1
.
1
1
.
[1
.
11
.
1
1
1
M
X.
C1,C
2
]
・
M
%
・
・
・
・
・
・
・
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
‘,
3人".胤敵
0
(
n
.
P
N
.
C
a
s
e1
.(
.
(,
)1(
.
[(
.
(1
I
YI
,
3人 祢 ." 数 .3Uf
•
%・・
・
・
・
・
.
.
.
.
・・
・
・
・
・
.
.
.・
・
・"'9‘
ches'・
,
h・
}
簡
略処
煙 (v.fin・
制
賂処
埋 (v.fin.'shes':sh')
制
限処
理 (v.fin・
l
e
s'
,
'y'
l
在
"
,'
J
'"
・・
・ ・
・
・
・ ・
・
・
.
.
.
.
.
.
.
,
‘.
',
a
l
e
x
(
v.
f
i
n,
_
.l
In,
PN
._,
(]
.
[]
.
(,]1(
.
[I:
Y
]
.
S
u
b
(:
X
.
I
I[
t
敬(
P
N
)[
Cl
(
.C
2
.
IWord[
T
I,
T
)
c
a
t
[
Tl
name(Word.
Wordt
)
n.
Word],Word2)
nameれNord3、
.
vord2)
M_
.
,IWord3,
l
v
.
t
i
n,
_
.l
In,
_
.
_
.[]
.
(1
[
]
.
[J
.1
1
1
:Y
)
.
S
u
b
c
a
l
[
Tl
(:
X'
c
I
.C
2
1
"
随
処
理
(
.自
f級
%
1[Xll
説
}
苔
処
埋 (a.ML.[X.X.lOl.l15.116.
member
(
X
.
'
l
p
d
'
)
踊賂処哩(
,
品l
:.
"i
e
s
t y1
舗庖処硬(
,
必 I::es¥".'e')
舗賂処煙(
,
似.
I
:
.
"e
s
t
・1])
%・
ー
・・
・
.
.
ー
.
.
.
.
・・
%
司
%
同腕
,
%・
・・
・
..・
・
・
・
..
,
邸 I~ 処哩 ( P OS , Form. [
XI
Y
[
.
[
XI
Z
l
l
制}
丞
処
埋 (Pos.Form.Y,Z)
%・
・
・
・
・
・
・
・
・
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.%
%
ユーティリティー
%
%・
・
・
・
・
・
・
・
・
.
..
..
.
.
.
.
.
.
.
.
.
.
.
.
..
.%
member(Tgげ gl
-]
)
Tg,
LjT
l
l
member(
Tg
.
T
)
member(
upper_lower
(
[
UI
T
).
[L[
T
l
)
・
U> 65
U _<90
(続き)
7
phrase(
coldI
5
j,
5,
[
[
c
a
t
c
h,
V,
f
i
n,
[
[
n,
_nom,
[]
,
[]
,
[]
,
[]
,
[J
jX,
]
[
]
,
[
]
,
[
]
,
[]
][風邪をひく, X,
が
]
, C,
C
)
図 12"catchcold" I
風 邪をひく 」 の 記 述
1
e
x
"という述語が形態素解析のトップレベル
1
I
?ex,
1
である。
1: h0te1
[n,S3ー
, 1.42,[],[
]
, [
]
, [],[J]:ホテル
[]
最初はまず熟語に該当するかどうかを調べる。
熟語の記述は "
p
h
r
a
s
e
"のいう述語で制約を、単語
yes
1 ?e
x.
1
: hotels
[n,p3,.1.55,[],[],[],[],[]]:ホ テ ル
の時と同様にして記述すれば良い。
[]
のように記述する 。
c
a
t
c
hc
o
l
d
"I
風邪をひく」は、図 12
たとえば "
3番目は原型として語黛を引くための述語であ
守
'
3f1
I,
VA
:]
][
],
[]
B
aJ9AM
﹃
,
マ
'
]-
I',
u
[]
,司, J
][
['l
,]!
][耳
[,,
︽
門
UR''t
,] 7
m[3
u,
一
n]V
,[,
マ,,一.
3]k
一
[,
'c-
pC3
nuq-vA
一
一
331
[7 1
e
[,,
b
内
,H 3
・e'nr'Fxvn'aE
eoin[
-1f[:
可
'
r
LJ
: v']]
S9
・
e
us--[][[
2番目の "
l
e
x
"は数字の処理である 。
る
。
4番目以降が語黛規則で、まず最初は所有格の
5番目は動詞の 3人称・単数・現在に対する処
旬
J-uτ
][
1
'
[]
、'n
d
[ 'vv
Jnud
4
rtL''
一C
]:
[]
,、,
][
[,]
'] !
][4
O[4
4' 、
,
]Y
2[ ,
一,;
,] t
内
urL ,
nuz'
nnu
nH cυ
nravv
,,
,
司dTd
5 内
U
ー,
[421
[了
,n
z
o m
-﹀
凋性
n[4
I-[
f
・
a
'-s ]H
・ ρb ,
,司
E
A
n
r
x v n ] [︿
e o l n u,I
- lf 4 ] E
S?'
[L
e - - v v v ' 泊珂
ylif--][
名調を冠調として扱うための語桑規則である。
理である。その中では、主格の名詞の数が 3人
1
1
1
3
s
称・単数 1
で、あるという制約をつけ加えてい
る
。
そして、最後に来るのが、 3人称・単数・現在
yes
1 ?ex.
1
: hotel's
[det,Forl.50,所有格,[],[],[], [[n,PN.50,Case
50,[],[],[],[],[]]:V.50],[]]:[ホテル,の ,V.50
情報が変わらない変化に対する語桑規則に当た
1
る
。
[]
yes
園実行例
?ex.
1
: ta11
[8,.1.37時
, 2.37¥[],[],[], [[n,PN.37,.3.37,[],[
] [J]:[背が高い, Se .37]
],[J,[],[J]:Se .37,
f】
や名詞の複数形、修飾語の最上級といった、接続
・
・
yes
1 ?
'ex.
I: tallest
]
,[
)
, [),
[[n,P
N_59,.3.59,[),[)
[a,最上, .2.59,[
,[],[),[)]・ Set.59],[J]:[背が高い, Sel.59]
[]
形態素解析の結果を確かめるために、図 13に
図 10の例に対し形態素解析を施した結果をいく
つか示す。
さて、次回では単一化文法に基づく文法記述と
文法処理の詳細について考える 。 これで、ひと通
り、翻訳システムのプログラムは完成するものと
する 。
図 13 図 10の 例 に 形 態 素 解 析 の 結 果
さらにその後は、中学生向けの問題集にある具
体的な英文を対象に、翻訳システムの具体的な問
題点を探ることにする o
8