言語工学研究所代表取締役・国分芳宏氏~いま再びの日本語 仕様書用ワープロを作りませんか~①

 情報システムの要求仕様書用のワープロができないか、という筆者の問いかけに、「当社の構文解析技術を応用すれば、そんなに難しくないんじゃないか」という人が現れた。言語工学研究所の代表取締役・国分芳宏氏だ。1970年代からコンピュータによる日本語構文解析に取組み、パソコンソフトの創成期に日本語ワープロ「松」を開発したことで知られる。早速、東京・飯田橋のオフィスを訪問したところ、同氏は筆者と「一杯飲みながら」のつもりでいたらしい。ゴメンナサイ、全くの下戸なんですよ。

続きを読む "言語工学研究所代表取締役・国分芳宏氏~いま再びの日本語 仕様書用ワープロを作りませんか~①"

| コメント (0)

国分芳宏氏~いま再びの日本語 仕様書用ワープロを作りませんか~②

文の意図を解析する

国分 でも文章のプロでしょ? だから分かっていただけると思うけれど、一般の文法は主語と述語で整理する。文を名詞、形容詞、動詞、副詞、接続詞に分解して、その関係性を理解する。ところが我われの日常の会話や文っていうのは、いつも主語と述語を明確に使っていないし、必ずキーワードになる単語が入っているとは限らない。それが曖昧性を生み出す第一の原因であり、コンピュータによる構文解析の限界でもあったわけです。

―単語と単語の関係だけでは限界がある、と。

続きを読む "国分芳宏氏~いま再びの日本語 仕様書用ワープロを作りませんか~②"

| コメント (0)

国分芳宏氏~いま再びの日本語 仕様書用ワープロを作りませんか~③

「など」の排除は当たり前

 ――ここまでのお話を整理しますと、文の曖昧性を生み出す原因は係り受け、並列構造、表記の揺れ、代名詞の4つ。「など」「および」はあまり問題じゃない、ということですか?
国分 いや、そうじゃなくて、「など」が曖昧性を生み出すのは明らかなんで、あえて言わなかったんです。「など」を排除したければ、キーボードで「など」と入力したときアラームを鳴らすとか、入力できないようにすればいい。あるいはテキストから「など」を抽出して赤く表示してあげればいい。それより、無意味な付属語を削って代名詞を補正する。その上で単語の距離を測る。そうすると文全体の曖昧性がかなり排除できる。

続きを読む "国分芳宏氏~いま再びの日本語 仕様書用ワープロを作りませんか~③"

| コメント (0)