1996.8.31

日本語処理プログラム集MCL(第2版)

 この日本語処理プログラム集は、日本語研究,とくに文字・語彙・対照研究用の道具として作成したものです。

JGAWKで書いていますから、DOS/Vでも使用が可能です。

さらに良いプログラム集とするため、改良情報をお寄せください。

中 野  洋

1.研究用または直接の教育用に使用する場合は、無料とします。

2.第3者に複写、配布しても結構です。 ただし、このファイルを含むすべてを複写してください。 改変した場合は、それがわかるように注記してください。

3.このファイルは、使用時に容易に参照できるようにしてください。

4.プログラムおよびデ−タの内容について保証しません。 またこれを使用して生じたいかなる損害についても責任を負いません。

5.アフタケアはしません。

6.著作権は中野洋にあります。

7.プログラム・データは予告なく改変します。 その最新版は国立国語研究所の中野のホームページ(http://www.kokken.go.jp/)から入手できます。 参照ください。

8.改良情報を中野にお知らせください。

9.この版のMCLを教育に利用する場合、あるいは研究の成果を発表する場合は、

中野洋「日本語処理プログラム集MCL」(1996.8.31) を使用した、

と明示してください。

10.一貫処理プログラムは、国立国語研究所での特別研究「語彙調査の自動化に関する基礎的研究」の研究成果です。

11.他のプログラムは文部省科学研究費補助金を受けた「文章の生成・解析のための記述に関する基礎的研究」(代表者:中野洋、1994-1996)の成果の一部を含みます。

東京都北区西が丘34

国立国語研究所 中野 洋

FAX 03-3906-3530,

日本語研究用プログラム集 MCL 一覧

[注意]

 BATプログラムでは、C ドライブにシステムがあり、\mcl\demo に以下のプログラム等 が、 \MCL\NAP に一貫処理プログラム類があることを前提としています。

デイレクトリ \mcl\demo を作り、そこに mcl を解凍してください。 同様に、\mcl\napを作り、そこに nap を解凍してください。

 C ドライブ以外にシステムがある場合には、すべてのバッチプログラムの c:\command /cの c:\部分をシステムがあるドライブ(例えば、A ドライブなら、a:\command /c )に変えてください。

 下記 MCL1,2,3 は、中野洋「パソコンによる日本語研究法入門−語彙と文字−」(笠間書院)の 1,2,3章に解説または使用例があることを示します。

主要なプログラムの使用法は、MCL2SYO.TXT にあります。

BEST10GO AWK  96-08-31	語種別上位10語の頻度表		MCL2
BEST10GO BAT  96-08-31	品詞別上位10語の表の作成		MCL2
BEST15   BAT  96-08-31	頻度順文字表ファイルから上位15字を表示	MCL1
BEST15   AWK  96-08-31	頻度順文字表ファイルから上位15字を表示	MCL1
BEST3    BAT  96-08-31	上位3サンプルのデータ名および使用率表	MCL3
BIL1     AWK  96-08-31	対照研究用テキスト作成		MCL2
BIL2     AWK  96-08-31	2つのファイルの用例を並べる。		MCL2
BILING   BAT  96-08-31	2か国語対照用例表の作成		MCL2,3
COMP8795 AWK  96-08-31	二つの語彙表の対照表の作成		MCL3
GOIHYO   AWK  96-08-31	語彙表を作る。			MCL1,2,3
GOIHYO   BAT  96-08-31	語彙表を作る。			MCL1,2,3
GOIHYO0  BAT  96-08-31	空白分かち書きデータから語彙表を作る。	MCL2
GOIHYO1  BAT  96-08-31	情報なしのデータから語彙表を作る。	MCL1,2
GOIHYO2  BAT  96-08-31	文章情報付きデータから語彙表を作る。	MCL1,2
GOIHYO3  BAT  96-08-31	話者別の語彙表を作る。		MCL1,2
GRAPH    AWK  96-08-31	グラフ作成言語処理プログラム		MCL1,2
HIND     BAT  96-08-31	文字の頻度分布図を描く。		MCL2
HIND1    BAT  96-08-31	語彙の頻度分布図を求める。		MCL1
JOHOKWIC AWK  96-08-31	KWICに付けた情報を新しいKWICに付ける。	MCL3
KACNV    AWK  96-08-31	英数字2バイトコードを1バイトコードに変換する	MCL2
KWIC1    BAT  96-08-31	文章情報付き分かち書きデータからのKWIC作成	MCL1
KWIC2    BAT  96-08-31	漢字仮名混じりデータからKWICを作る。	MCL1
KWIC3    BAT  96-08-31	一貫処理 napout で KWIC を作る。	MCL1
KWICNAOS AWK  96-08-31	KWIC の簡易情報付け結果を完全にする。	MCL1,3
MCLBUN   AWK  96-08-31	一貫処理結果を分かち書き表示にする。	MCL2
MCLBUNP  AWK  96-08-31	総語数と頻度分布をもとめる。		MCL1,2
MCLBUNP  BAT  96-08-31	総語数と頻度分布をもとめる。		MCL1,2
MCLDANWA BAT  96-08-31	話しことばの語彙調査で単語レコードを作る	MCL3
MCLGOI   BAT  96-08-31	語彙表、頻度・語種・品詞分布表の作成	MCL2
MCLGOI1  BAT  96-08-31	語彙調査(文字種による自動単位分割)	MCL3
MCLGOI2  BAT  96-08-31	KWICの作成			MCL3
MCLGOI3  BAT  96-08-31	簡易情報を完全な情報に直す。		MCL3
MCLGOI4  BAT  96-08-31	辞書引き			MCL3
MCLGOI5  BAT  96-08-31	修正を完全にする。		MCL3
MCLGOI6  BAT  96-08-31	語彙表の作成と集計		MCL3
MCLGOI7  BAT  96-08-31	語彙表作成・各種集計(意味分布表まで)	MCL3
MCLGOKEI AWK  96-08-31	指定項目から代表形と異形態の頻度表を作る	MCL2,3
MCLGOKEI BAT  96-08-31	指定項目から代表形と異形態の頻度表を作る	MCL2,3
MCLGOSYU AWK  96-08-31	語種・品詞別語彙量を計算する。		MCL1,2,3
MCLGOSYU BAT  96-08-31	語種・品詞別語彙量を計算する。		MCL1,2,3
MCLIMI   BAT  96-08-31	意味分布表の作成		MCL3
MCLIMI   AWK  96-08-31	意味分布表の作成		MCL3
MCLKLIC  AWK  96-08-31	文字索引表(KLIC)作成		MCL1,2
MCLKLIC  BAT  96-08-31	文字索引表(KLIC)作成		MCL1,2
MCLKWIC  AWK  96-08-31	文脈付き用語索引(KWIC)作成		MCL1,2,3
MCLKWIC  BAT  96-08-31	文脈付き用語索引(KWIC)作成		MCL1,2,3
MCLMOZI  BAT  96-08-31	文字頻度表,文字種分布表を作る。		MCL2
MCLMOZI2 BAT  96-08-31	文字頻度表,文字種分布表を作る。		MCL3
MCLMOZIY AWK  96-08-31	先頭行にあるファイル名をコピーする。	MCL3
MCLNAP   BAT  96-08-31	自動読み仮名、語種、品詞情報付け	MCL3
MCLNAP2  AWK  96-08-31	自動読み仮名、語種、品詞情報付け	MCL3
MCLNAP2  BAT  96-08-31	自動読み仮名、語種、品詞情報付け	MCL3
MCLUNIQ  AWK  96-08-31	指定項目から頻度と範囲を計算。MCL版UNIQ 	MCL1,2,3
MCLUNIQ  BAT  96-08-31	指定項目から頻度と範囲を計算。MCL版UNIQ 	MCL1,2,3
MCLWC    AWK  96-08-31	語数とレコード数計算。半角全角空白処理	MCL1,2
MCLWC    BAT  96-08-31	語数とレコード数計算。半角全角空白処理	MCL1,2
MCLWORD  AWK  96-08-31	単語レコード作成。文字種で分割、情報付加	MCL1,2,3
MCLWORD  BAT  96-08-31	単語レコード作成。文字種で分割、情報付加	MCL1,2,3
MCLZISYO AWK  96-08-31	辞書引き。指定の情報項目をつける。	MCL1,2,3
MCLZISYO BAT  96-08-31	辞書引き。指定の情報項目をつける。	MCL1,2,3
MOZI     AWK  96-08-31	文字頻度表、文字種分布表作成。		MCL1,2,3
MOZI     BAT  96-08-31	文字頻度表、文字種分布表作成。		MCL1,2,3
MOZI1    AWK  96-08-31	文字データ作成			MCL3
MOZI2    AWK  96-08-31	文字頻度表作成			MCL3
MOZI3    AWK  96-08-31	文字種分布表作成		MCL3
MOZIAVR  AWK  96-08-31	文字種分布表の各標本の平均値を求める。	MCL3
MOZIPRT  AWK  96-08-31	文字種別頻度表作成		MCL3
NAOSI    AWK  96-08-31	一貫処理修正。全角空白分割。ーの片仮名化	MCL3
NAP      BAT  96-08-31	一貫処理			MCL2,3
NAP1     BAT  96-08-31	一貫処理			MCL3
NAP2     BAT  96-08-31	一貫処理 NAPNAOSI,NAOSI 組み込み	MCL3
NAP3     BAT  96-08-31	一貫処理結果の単語データ化、語種認定。	MCL3
NAP4     BAT  96-08-31	一貫処理 活用形変換		MCL3
NAPALL   BAT  96-08-31	NAP1, NAP2, NAP3,MCLUNIQ,MCLGOI組み込み	MCL1
NAPALL1  BAT  96-08-31	NAP1.BAT, NAP2.BAT, NAP3.BAT 組み込み	MCL1
NAPALL2  BAT  96-08-31	MCLUNIQ,MCLGOI 組み込み		MCL1
NAPBUN   AWK  96-08-31	一貫処理結果を、| 分かち書き形式に直す。	MCL1,2,3
NAPBUN   BAT  96-08-31	一貫処理結果を、| 分かち書き形式に直す。	MCL1,2,3
NAPCONJ  AWK  96-08-31	活用形変換			MCL1,2,3
NAPGOREC AWK  96-08-31	一貫処理結果の単語データ化、語種認定。	MCL1,2,3
NAPGOREC BAT  96-08-31	一貫処理結果の単語データ化、語種認定。	MCL1,2,3
NAPNAOSI AWK  96-08-31	一貫処理修正。全角空白分割。ーの片仮名化	MCL3
NAPOUT   BAT  96-08-31	一貫処理で KWIC を作る。		MCL1,2,3
NAPSP    AWK  96-08-31	半角空白を全角空白に変える。		MCL3
NAPTAIL  AWK  96-08-31	一貫処理前の改行挿入		MCL3
OBI      AWK  96-08-31	帯グラフ用GRAPH.AWK		MCL1,2,3
OBI      BAT  96-08-31	n×mの表を帯グラフに表示する。	MCL1,2
PRINT15  AWK  96-08-31	ファイルの先頭から15レコード出力	MCL2
SAKUIN   AWK  96-08-31  	用語索引の作成			MCL3
SAKUIN   BAT  96-08-31  	用語索引の作成			MCL3
SANPZU1  AWK  96-08-31	散布図を作るためのGRAPH.AWK		MCL1,2
SANPZU1  BAT  96-08-31	散布図の作成			MCL1,2
SANPZU2  AWK  96-08-31	漢字と平仮名の散布図用GRAPH.AWK		MCL1,2
SANPZU2  BAT  96-08-31	散布布図の作成			MCL1,2
SANPZU3  AWK  96-08-31	頻度分布を描く			MCL1,2
SANPZU31 AWK  96-08-31	頻度分布を描く			MCL1
UNIXGOI  BAT  96-08-31	UNIX版語彙表作成 word sortf uniq 使用	MCL1

MCL2SYO  TXT  96-08-31	主要プログラムの使用法		MCL2
以上 1996.8.31