README.ja 5.8 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195
  1. README.ja 2007/05/31
  2. 鬼車 ---- (C) K.Kosako <sndgk393 AT ybb DOT ne DOT jp>
  3. http://www.geocities.jp/kosako3/oniguruma/
  4. 鬼車は正規表現ライブラリである。
  5. このライブラリの特長は、それぞれの正規表現オブジェクトごとに
  6. 文字エンコーディングを指定できることである。
  7. サポートしている文字エンコーディング:
  8. ASCII, UTF-8, UTF-16BE, UTF-16LE, UTF-32BE, UTF-32LE,
  9. EUC-JP, EUC-TW, EUC-KR, EUC-CN,
  10. Shift_JIS, Big5, GB18030, KOI8-R, CP1251,
  11. ISO-8859-1, ISO-8859-2, ISO-8859-3, ISO-8859-4, ISO-8859-5,
  12. ISO-8859-6, ISO-8859-7, ISO-8859-8, ISO-8859-9, ISO-8859-10,
  13. ISO-8859-11, ISO-8859-13, ISO-8859-14, ISO-8859-15, ISO-8859-16
  14. * GB18030: 久保健洋氏提供
  15. * CP1251: Byte氏提供
  16. ------------------------------------------------------------
  17. ライセンス
  18. BSDライセンスに従う。
  19. インストール
  20. ケース1: UnixとCygwin環境
  21. 1. ./configure
  22. 2. make
  23. 3. make install
  24. アンインストール
  25. make uninstall
  26. 動作テスト (ASCII/EUC-JP)
  27. make atest
  28. 構成確認
  29. onig-config --cflags
  30. onig-config --libs
  31. onig-config --prefix
  32. onig-config --exec-prefix
  33. ケース2: Win32(VC++)環境
  34. 1. copy win32\Makefile Makefile
  35. 2. copy win32\config.h config.h
  36. 3. nmake
  37. onig_s.lib: static link library
  38. onig.dll: dynamic link library
  39. * 動作テスト (ASCII/Shift_JIS)
  40. 4. copy win32\testc.c testc.c
  41. 5. nmake ctest
  42. 正規表現
  43. doc/RE.jaを参照
  44. 使用方法
  45. 使用するプログラムで、oniguruma.hをインクルードする(Oniguruma APIの場合)。
  46. Oniguruma APIについては、doc/API.jaを参照。
  47. oniguruma.hで定義されている型名UChar(== unsigned char)を無効にしたい場合
  48. には、ONIG_ESCAPE_UCHAR_COLLISIONをdefineしてからoniguruma.hをインクルード
  49. すること。このときにはUCharは定義されず、OnigUCharという名前の定義のみが
  50. 有効になる。
  51. oniguruma.hで定義されている型名regex_tを無効にしたい場合には、
  52. ONIG_ESCAPE_REGEX_T_COLLISIONをdefineしてからoniguruma.hをインクルード
  53. すること。このときにはregex_tは定義されず、OnigRegexType, OnigRegexという
  54. 名前の定義のみが有効になる。
  55. Unix/Cygwin上でコンパイル、リンクする場合の例:
  56. (prefixが/usr/localのとき)
  57. cc sample.c -L/usr/local/lib -lonig
  58. GNU libtoolを使用しているので、プラットフォームが共有ライブラリをサポートして
  59. いれば、使用できるようになっている。
  60. 静的ライブラリと共有ライブラリのどちらを使用するかを指定する方法、実行時点での
  61. 環境設定方法については、自分で調べて下さい。
  62. Win32でスタティックリンクライブラリ(onig_s.lib)をリンクする場合には、
  63. コンパイルするときに -DONIG_EXTERN=extern をコンパイル引数に追加すること。
  64. 使用例プログラム
  65. sample/simple.c 最小例 (Oniguruma API)
  66. sample/names.c 名前付きグループコールバック使用例
  67. sample/encode.c 幾つかの文字エンコーディング使用例
  68. sample/listcap.c 捕獲履歴機能の使用例
  69. sample/posix.c POSIX API使用例
  70. sample/sql.c 可変メタ文字機能使用例 (SQL-like パターン)
  71. テストプログラム
  72. sample/syntax.c Perl、Java、ASIS文法のテスト
  73. sample/crnl.c --enable-crnl-as-line-terminator テスト
  74. ソースファイル
  75. oniguruma.h 鬼車APIヘッダ (公開)
  76. onig-config.in onig-configプログラム テンプレート
  77. regenc.h 文字エンコーディング枠組みヘッダ
  78. regint.h 内部宣言
  79. regparse.h regparse.cとregcomp.cのための内部宣言
  80. regcomp.c コンパイル、最適化関数
  81. regenc.c 文字エンコーディング枠組み
  82. regerror.c エラーメッセージ関数
  83. regext.c 拡張API関数
  84. regexec.c 検索、照合関数
  85. regparse.c 正規表現パターン解析関数
  86. regsyntax.c 正規表現パターン文法関数、組込み文法定義
  87. regtrav.c 捕獲履歴木巡回関数
  88. regversion.c 版情報関数
  89. st.h ハッシュテーブル関数宣言
  90. st.c ハッシュテーブル関数
  91. oniggnu.h GNU regex APIヘッダ (公開)
  92. reggnu.c GNU regex API関数
  93. onigposix.h POSIX APIヘッダ (公開)
  94. regposerr.c POSIX APIエラーメッセージ関数
  95. regposix.c POSIX API関数
  96. enc/mktable.c 文字タイプテーブル生成プログラム
  97. enc/ascii.c ASCII エンコーディング
  98. enc/euc_jp.c EUC-JP エンコーディング
  99. enc/euc_tw.c EUC-TW エンコーディング
  100. enc/euc_kr.c EUC-KR, EUC-CN エンコーディング
  101. enc/sjis.c Shift_JIS エンコーディング
  102. enc/big5.c Big5 エンコーディング
  103. enc/gb18030.c GB18030 エンコーディング
  104. enc/koi8.c KOI8 エンコーディング
  105. enc/koi8_r.c KOI8-R エンコーディング
  106. enc/cp1251.c CP1251 エンコーディング
  107. enc/iso8859_1.c ISO-8859-1 (Latin-1)
  108. enc/iso8859_2.c ISO-8859-2 (Latin-2)
  109. enc/iso8859_3.c ISO-8859-3 (Latin-3)
  110. enc/iso8859_4.c ISO-8859-4 (Latin-4)
  111. enc/iso8859_5.c ISO-8859-5 (Cyrillic)
  112. enc/iso8859_6.c ISO-8859-6 (Arabic)
  113. enc/iso8859_7.c ISO-8859-7 (Greek)
  114. enc/iso8859_8.c ISO-8859-8 (Hebrew)
  115. enc/iso8859_9.c ISO-8859-9 (Latin-5 または Turkish)
  116. enc/iso8859_10.c ISO-8859-10 (Latin-6 または Nordic)
  117. enc/iso8859_11.c ISO-8859-11 (Thai)
  118. enc/iso8859_13.c ISO-8859-13 (Latin-7 または Baltic Rim)
  119. enc/iso8859_14.c ISO-8859-14 (Latin-8 または Celtic)
  120. enc/iso8859_15.c ISO-8859-15 (Latin-9 または West European with Euro)
  121. enc/iso8859_16.c ISO-8859-16
  122. (Latin-10 または South-Eastern European with Euro)
  123. enc/utf8.c UTF-8 エンコーディング
  124. enc/utf16_be.c UTF-16BE エンコーディング
  125. enc/utf16_le.c UTF-16LE エンコーディング
  126. enc/utf32_be.c UTF-32BE エンコーディング
  127. enc/utf32_le.c UTF-32LE エンコーディング
  128. enc/unicode.c Unicode情報
  129. win32/Makefile Win32用 Makefile (for VC++)
  130. win32/config.h Win32用 config.h
  131. 残件
  132. ? case fold flag: Katakana <-> Hiragana
  133. ? ONIG_OPTION_NOTBOS/NOTEOS追加 (\A, \z, \Z)
  134. ?? \X (== \PM\pM*)
  135. ?? 文法要素 ONIG_SYN_CONTEXT_INDEP_ANCHORSの実装
  136. ?? 検索位置移動停止演算子 (match_at()からONIG_STOPを返す)
  137. and I'm thankful to Akinori MUSHA.
  138. アドレス: K.Kosako <sndgk393 AT ybb DOT ne DOT jp>