1996.8.31
この日本語処理プログラム集は、日本語研究,とくに文字・語彙・対照研究用の道具として作成したものです。
JGAWKで書いていますから、DOS/Vでも使用が可能です。
さらに良いプログラム集とするため、改良情報をお寄せください。
中 野 洋
1.研究用または直接の教育用に使用する場合は、無料とします。
2.第3者に複写、配布しても結構です。 ただし、このファイルを含むすべてを複写してください。 改変した場合は、それがわかるように注記してください。
3.このファイルは、使用時に容易に参照できるようにしてください。
4.プログラムおよびデ−タの内容について保証しません。 またこれを使用して生じたいかなる損害についても責任を負いません。
5.アフタケアはしません。
6.著作権は中野洋にあります。
7.プログラム・データは予告なく改変します。 その最新版は国立国語研究所の中野のホームページ(http://www.kokken.go.jp/)から入手できます。 参照ください。
8.改良情報を中野にお知らせください。
9.この版のMCLを教育に利用する場合、あるいは研究の成果を発表する場合は、
中野洋「日本語処理プログラム集MCL」(1996.8.31) を使用した、
と明示してください。
10.一貫処理プログラムは、国立国語研究所での特別研究「語彙調査の自動化に関する基礎的研究」の研究成果です。
11.他のプログラムは文部省科学研究費補助金を受けた「文章の生成・解析のための記述に関する基礎的研究」(代表者:中野洋、1994-1996)の成果の一部を含みます。
東京都北区西が丘34
国立国語研究所 中野 洋
FAX 03-3906-3530,
[注意]
BATプログラムでは、C ドライブにシステムがあり、\mcl\demo に以下のプログラム等 が、 \MCL\NAP に一貫処理プログラム類があることを前提としています。
デイレクトリ \mcl\demo を作り、そこに mcl を解凍してください。 同様に、\mcl\napを作り、そこに nap を解凍してください。
C ドライブ以外にシステムがある場合には、すべてのバッチプログラムの c:\command /cの c:\部分をシステムがあるドライブ(例えば、A ドライブなら、a:\command /c )に変えてください。
下記 MCL1,2,3 は、中野洋「パソコンによる日本語研究法入門−語彙と文字−」(笠間書院)の 1,2,3章に解説または使用例があることを示します。
主要なプログラムの使用法は、MCL2SYO.TXT にあります。
BEST10GO AWK 96-08-31 語種別上位10語の頻度表 MCL2 BEST10GO BAT 96-08-31 品詞別上位10語の表の作成 MCL2 BEST15 BAT 96-08-31 頻度順文字表ファイルから上位15字を表示 MCL1 BEST15 AWK 96-08-31 頻度順文字表ファイルから上位15字を表示 MCL1 BEST3 BAT 96-08-31 上位3サンプルのデータ名および使用率表 MCL3 BIL1 AWK 96-08-31 対照研究用テキスト作成 MCL2 BIL2 AWK 96-08-31 2つのファイルの用例を並べる。 MCL2 BILING BAT 96-08-31 2か国語対照用例表の作成 MCL2,3 COMP8795 AWK 96-08-31 二つの語彙表の対照表の作成 MCL3 GOIHYO AWK 96-08-31 語彙表を作る。 MCL1,2,3 GOIHYO BAT 96-08-31 語彙表を作る。 MCL1,2,3 GOIHYO0 BAT 96-08-31 空白分かち書きデータから語彙表を作る。 MCL2 GOIHYO1 BAT 96-08-31 情報なしのデータから語彙表を作る。 MCL1,2 GOIHYO2 BAT 96-08-31 文章情報付きデータから語彙表を作る。 MCL1,2 GOIHYO3 BAT 96-08-31 話者別の語彙表を作る。 MCL1,2 GRAPH AWK 96-08-31 グラフ作成言語処理プログラム MCL1,2 HIND BAT 96-08-31 文字の頻度分布図を描く。 MCL2 HIND1 BAT 96-08-31 語彙の頻度分布図を求める。 MCL1 JOHOKWIC AWK 96-08-31 KWICに付けた情報を新しいKWICに付ける。 MCL3 KACNV AWK 96-08-31 英数字2バイトコードを1バイトコードに変換する MCL2 KWIC1 BAT 96-08-31 文章情報付き分かち書きデータからのKWIC作成 MCL1 KWIC2 BAT 96-08-31 漢字仮名混じりデータからKWICを作る。 MCL1 KWIC3 BAT 96-08-31 一貫処理 napout で KWIC を作る。 MCL1 KWICNAOS AWK 96-08-31 KWIC の簡易情報付け結果を完全にする。 MCL1,3 MCLBUN AWK 96-08-31 一貫処理結果を分かち書き表示にする。 MCL2 MCLBUNP AWK 96-08-31 総語数と頻度分布をもとめる。 MCL1,2 MCLBUNP BAT 96-08-31 総語数と頻度分布をもとめる。 MCL1,2 MCLDANWA BAT 96-08-31 話しことばの語彙調査で単語レコードを作る MCL3 MCLGOI BAT 96-08-31 語彙表、頻度・語種・品詞分布表の作成 MCL2 MCLGOI1 BAT 96-08-31 語彙調査(文字種による自動単位分割) MCL3 MCLGOI2 BAT 96-08-31 KWICの作成 MCL3 MCLGOI3 BAT 96-08-31 簡易情報を完全な情報に直す。 MCL3 MCLGOI4 BAT 96-08-31 辞書引き MCL3 MCLGOI5 BAT 96-08-31 修正を完全にする。 MCL3 MCLGOI6 BAT 96-08-31 語彙表の作成と集計 MCL3 MCLGOI7 BAT 96-08-31 語彙表作成・各種集計(意味分布表まで) MCL3 MCLGOKEI AWK 96-08-31 指定項目から代表形と異形態の頻度表を作る MCL2,3 MCLGOKEI BAT 96-08-31 指定項目から代表形と異形態の頻度表を作る MCL2,3 MCLGOSYU AWK 96-08-31 語種・品詞別語彙量を計算する。 MCL1,2,3 MCLGOSYU BAT 96-08-31 語種・品詞別語彙量を計算する。 MCL1,2,3 MCLIMI BAT 96-08-31 意味分布表の作成 MCL3 MCLIMI AWK 96-08-31 意味分布表の作成 MCL3 MCLKLIC AWK 96-08-31 文字索引表(KLIC)作成 MCL1,2 MCLKLIC BAT 96-08-31 文字索引表(KLIC)作成 MCL1,2 MCLKWIC AWK 96-08-31 文脈付き用語索引(KWIC)作成 MCL1,2,3 MCLKWIC BAT 96-08-31 文脈付き用語索引(KWIC)作成 MCL1,2,3 MCLMOZI BAT 96-08-31 文字頻度表,文字種分布表を作る。 MCL2 MCLMOZI2 BAT 96-08-31 文字頻度表,文字種分布表を作る。 MCL3 MCLMOZIY AWK 96-08-31 先頭行にあるファイル名をコピーする。 MCL3 MCLNAP BAT 96-08-31 自動読み仮名、語種、品詞情報付け MCL3 MCLNAP2 AWK 96-08-31 自動読み仮名、語種、品詞情報付け MCL3 MCLNAP2 BAT 96-08-31 自動読み仮名、語種、品詞情報付け MCL3 MCLUNIQ AWK 96-08-31 指定項目から頻度と範囲を計算。MCL版UNIQ MCL1,2,3 MCLUNIQ BAT 96-08-31 指定項目から頻度と範囲を計算。MCL版UNIQ MCL1,2,3 MCLWC AWK 96-08-31 語数とレコード数計算。半角全角空白処理 MCL1,2 MCLWC BAT 96-08-31 語数とレコード数計算。半角全角空白処理 MCL1,2 MCLWORD AWK 96-08-31 単語レコード作成。文字種で分割、情報付加 MCL1,2,3 MCLWORD BAT 96-08-31 単語レコード作成。文字種で分割、情報付加 MCL1,2,3 MCLZISYO AWK 96-08-31 辞書引き。指定の情報項目をつける。 MCL1,2,3 MCLZISYO BAT 96-08-31 辞書引き。指定の情報項目をつける。 MCL1,2,3 MOZI AWK 96-08-31 文字頻度表、文字種分布表作成。 MCL1,2,3 MOZI BAT 96-08-31 文字頻度表、文字種分布表作成。 MCL1,2,3 MOZI1 AWK 96-08-31 文字データ作成 MCL3 MOZI2 AWK 96-08-31 文字頻度表作成 MCL3 MOZI3 AWK 96-08-31 文字種分布表作成 MCL3 MOZIAVR AWK 96-08-31 文字種分布表の各標本の平均値を求める。 MCL3 MOZIPRT AWK 96-08-31 文字種別頻度表作成 MCL3 NAOSI AWK 96-08-31 一貫処理修正。全角空白分割。ーの片仮名化 MCL3 NAP BAT 96-08-31 一貫処理 MCL2,3 NAP1 BAT 96-08-31 一貫処理 MCL3 NAP2 BAT 96-08-31 一貫処理 NAPNAOSI,NAOSI 組み込み MCL3 NAP3 BAT 96-08-31 一貫処理結果の単語データ化、語種認定。 MCL3 NAP4 BAT 96-08-31 一貫処理 活用形変換 MCL3 NAPALL BAT 96-08-31 NAP1, NAP2, NAP3,MCLUNIQ,MCLGOI組み込み MCL1 NAPALL1 BAT 96-08-31 NAP1.BAT, NAP2.BAT, NAP3.BAT 組み込み MCL1 NAPALL2 BAT 96-08-31 MCLUNIQ,MCLGOI 組み込み MCL1 NAPBUN AWK 96-08-31 一貫処理結果を、| 分かち書き形式に直す。 MCL1,2,3 NAPBUN BAT 96-08-31 一貫処理結果を、| 分かち書き形式に直す。 MCL1,2,3 NAPCONJ AWK 96-08-31 活用形変換 MCL1,2,3 NAPGOREC AWK 96-08-31 一貫処理結果の単語データ化、語種認定。 MCL1,2,3 NAPGOREC BAT 96-08-31 一貫処理結果の単語データ化、語種認定。 MCL1,2,3 NAPNAOSI AWK 96-08-31 一貫処理修正。全角空白分割。ーの片仮名化 MCL3 NAPOUT BAT 96-08-31 一貫処理で KWIC を作る。 MCL1,2,3 NAPSP AWK 96-08-31 半角空白を全角空白に変える。 MCL3 NAPTAIL AWK 96-08-31 一貫処理前の改行挿入 MCL3 OBI AWK 96-08-31 帯グラフ用GRAPH.AWK MCL1,2,3 OBI BAT 96-08-31 n×mの表を帯グラフに表示する。 MCL1,2 PRINT15 AWK 96-08-31 ファイルの先頭から15レコード出力 MCL2 SAKUIN AWK 96-08-31 用語索引の作成 MCL3 SAKUIN BAT 96-08-31 用語索引の作成 MCL3 SANPZU1 AWK 96-08-31 散布図を作るためのGRAPH.AWK MCL1,2 SANPZU1 BAT 96-08-31 散布図の作成 MCL1,2 SANPZU2 AWK 96-08-31 漢字と平仮名の散布図用GRAPH.AWK MCL1,2 SANPZU2 BAT 96-08-31 散布布図の作成 MCL1,2 SANPZU3 AWK 96-08-31 頻度分布を描く MCL1,2 SANPZU31 AWK 96-08-31 頻度分布を描く MCL1 UNIXGOI BAT 96-08-31 UNIX版語彙表作成 word sortf uniq 使用 MCL1 MCL2SYO TXT 96-08-31 主要プログラムの使用法 MCL2以上 1996.8.31