異体字も含めて検索したい デモ版

データベースやテキストを検索する場合、ある文字の異体字も含めて検索したい場合があります。

例えば「対応」を検索するとき「對應」も検索したいというような場合です。

特に人名で「高(くちだか)」と「髙(はしごだか)」の両方を一度に検索したいケースは多いと思います。

しかしながら、「これとこれは異体字」「これはこれとは別の字」という区別になかなか決定的なものがなく、 したがって、「異体字も含めて検索」機能が実装されているシステムも数少ないと思います。

ということで、自力で「異体字も含めて検索」機能を作成してみました。漢字に加え一部のラテン文字、仮名(半角カタカナは除く)も含みます。


動作環境・著作権・注意

ブラウザで動作します。ということはソースが丸見えなので、勝手に流用できてしまいます(JavaScript以外では書けなかった自分の能力の限界です)。 これは防ぎようがありませんので、使いたい方は断りなしに使用してかまいません。その代り尊重し感謝しなさい。「ラッキー!」と思っちゃいけません。 これは私の努力の結晶なのです(T_T)

さて、異体字の認定は、「東京大学史料編纂所データベース異体字同定一覧」をベースとし、これに自分で思い当たるものを追加しました。 検索結果がどれだけ膨大になろうとも、必要なものが出てこないよりはいい、という考え方です。

また、小塚明朝Pro6Nとメイリオの両方のフォントで表示できないものや部首としてしか使わないものは実用的でないとして削除しています(したがって研究者向けではありません)。

中にはこれは異体字ではないだろうというものがあるでしょうが、私は研究者ではないですし、勝手に流用できますので、不満のある方は修正して使用してください。


デモ

入力欄

適当に語句を入力してください。たとえば「島崎煕」(架空の人名:しまざきひろし)とか。

結果出力(SQL文の例)

SELECT * FROM [targetTable] WHERE

結果出力(JavaScript正規表現の例)

myString.replace(g, "")

[HOME]