Skip to content

mimneko/kanji-data

Repository files navigation

kanji-data

日本語・漢字に関する各種データを整理し、再利用しやすい形で保管することを目的としたデータ集。 主に、漢字検定1級の学習への利用を想定している。

データ一覧

JIS漢字.csv

日本産業規格(JIS)の JIS X 0213 漢字一覧 の漢字10050字を収録した CSV データ。 作成にあたっては,漢字辞典オンライン「JIS第1–4水準の漢字」1を参考資料として用いた。 本データは、以下の情報から構成される。

  • 漢字
  • JIS 面区点番号
  • Unicode 符号位置
  • JIS 第何水準か

JIS水準と面区点番号のおおまかな対応は以下のとおりである。

  • JIS 第1水準:1面 16~46区の全部、47区の一部
  • JIS 第2水準:1面 48~83区の全部、84区の一部
  • JIS 第3水準:1面 14~15区の全部、47区の一部、84区の一部、85~94区の全部
  • JIS 第4水準:2面の全部

常用漢字表

文化庁が発表した常用漢字表23をもとに構成した。

常用漢字.csv

常用漢字2136字を収録した CSV データ。 本データは、以下の情報から構成される。

  • 掲載順
  • 漢字

常用漢字表本表.json

常用漢字表の本表に基づき、常用漢字2136字種およびその異体字を収録した JSON データ。 本データは、以下の情報から構成される。

  • 漢字
  • 音訓・例
  • 備考

なお、漢字については、常用漢字表に掲げられている漢字のうち

  • 括弧に入っていない字(表の見方及び使い方4)を 通用字体 に置いた。
  • 丸括弧に入っている字(表の見方及び使い方6)を 康熙字典体 に置いた。
  • 角括弧に入っている字(表の見方及び使い方5)の5字(「餌」「遡」「遜」「謎」「餅」)の許容字体は、テキストでは表記できないため、ここでは省いた。

1字下げで示した音訓(表の見方及び使い方7)は、ここでは他の音訓と並列に扱っている。

備考(表の見方及び使い方12)については、

  • 常用漢字表付表に記載の当て字・熟字訓は 付表 に置いた。
  • 都道府県は 都道府県 に置いた。
  • 参照すべき字体が常用漢字表にあるのものは 参照 に置いた。
  • マークとともに書かれているものは各音訓の 異字同訓 に置いた。
  • その他は各音訓の 留意事項 に置いた。

常用漢字表付表.json

常用漢字表の付表に基づき、当て字・熟字訓など116語を収録した JSON データ。 本データは、以下の情報から構成される。

  • 読み

「付表」には,いわゆる当て字や熟字訓など,主として1字1字の音訓としては挙げにくいものを語の形で掲げた。便宜上,その読み方を平仮名で示し,五十音順に並べた。3

教育漢字.csv

教育漢字1026字を収録した CSV データ。 本データは、以下の情報から構成される。

  • 漢字
  • 学年

学年ごとの配当漢字数は以下のとおりである。

  • 第一学年:80字
  • 第二学年:160字
  • 第三学年:200字
  • 第四学年:202字
  • 第五学年:193字
  • 第六学年:191字

Note

教育漢字は小学校学習指導要領(平成29年告示)4pp.42-45に別表として掲載されている学年別漢字配当表に記載されている漢字である。

漢検漢字辞典漢字.csv

『漢検漢字辞典』5および漢字ペディア6の漢字6786字体を収録した CSV データ。 本データは、以下の情報から構成される。

  • 漢字(テキストまたは画像)
  • 親字・旧字・その他の別
  • 漢検級
  • 漢検漢字辞典での掲載ページ
  • 漢字ペディアへのリンク
  • 字種ID・字項ID
  • 新字体統合における例外、漢字ペディアでの表示の例外、編集に関する注記

公式発表7による各漢検級における対象漢字数は以下のとおりである。

  • 10級:80字
  • 9級:240字
  • 8級:440字
  • 7級:642字
  • 6級:835字
  • 5級:1026字
  • 4級:1339字
  • 3級:1623字
  • 準2級:1951字
  • 2級:2136字
  • 準1級:約3000字
  • 1級:約6000字

本データにおいては、各漢字を『漢検漢字辞典』5の記載に沿って以下のとおりの漢検級に分類している。

  • 10級:80字
  • 9級:160字
  • 8級:200字
  • 7級:202字
  • 6級:193字
  • 5級:191字
  • 4級:313字
  • 3級:284字
  • 準2級:328字
  • 2級:185字
  • 準1級:857字
  • 1/準1級:644字
  • 1級:2676字
  • 配当外(記載のなかったもの):473字

部首一覧.csv

漢字の部首214部首を収録した CSV データ。 本データでは、『漢検漢字辞典』5に基づく部首分類を採用している。 本データは、以下の情報から構成される。

  • 部首
  • 名称
  • 画数
  • Unicode 符号位置
  • 漢検漢字辞典での掲載順

Note

『康熙字典』の部首も214種類であるが、漢検漢字辞典では「⼡(U+2F21)」と「⼢(U+2F22)」を統合し、さらに「⺍(U+2E8D)」を追加しているため、内訳は一致しない。

子の名に使える漢字.csv

子の名に使用可能な漢字83000字(2770字種・3000字体)を収録した CSV データ。 本データは、以下の情報から構成される。

  • 漢字
  • 区分(常用漢字の通用字体か、常用漢字外の字か、常用漢字の異体字か)

Note

戸籍法施行規則(昭和二十二年司法省令第九十四号)別表第二(第六十条、第六十八条の三関係)9

六十干支

十干・十二支および、それらの組合せによって成立する六十干支に関するデータを収録した。 作成にあたっては,国立国会図書館「日本の暦」10を参考資料として用いた。

六十干支.csv

六十干支(甲子〜癸亥)を収録した CSV データ。 本データは、以下の情報から構成される。

  • 順番
  • 干支
  • 訓読み・音読み
  • 該当西暦例、使用例

十干.csv

十干(甲・乙・丙・丁・戊・己・庚・辛・壬・癸)を収録した CSV データ。 本データは、以下の情報から構成される。

  • 順番
  • 十干
  • 訓読み・音読み
  • 五行
  • 陰陽

十二支.csv

十二支(子・丑・寅・卯・辰・巳・午・未・申・酉・戌・亥)を収録した CSV データ。 本データは、以下の情報から構成される。

  • 順番
  • 十二支
  • 訓読み・音読み
  • 五行

今後の追加予定

  • 各種の字や語に対して、全ファイル間で共通となる一意の識別番号を付与する。
  • 『漢検四字熟語辞典』、『新字源』、『漢字源』、「漢字辞典オンライン」、「グリフウィキ」での掲載ページ・リンクを整理する。 ― 印刷標準字体と簡易慣用字体の一覧を作成する。
  • 漢字検定1級の過去問を調査する。
    • 配当漢字が実際にどのくらいの頻度で出題されているか、また漢検漢字辞典外の漢字が出題されていないか調べる。
    • 出題される四字熟語は『漢検四字熟語辞典』に載っているものだけか調べる。
    • 試験全体を通して、『漢検漢字辞典』および『漢検四字熟語辞典』の知識だけで何点取ることができるか調べる。
  • リポジトリを「編集用ファイル群」「利用用ファイル群」「変換プログラム」に分割する。

Footnotes

  1. 漢字辞典オンライン「JIS第1–4水準の漢字」, https://kanji.jitenon.jp/cat/jisdai1, https://kanji.jitenon.jp/cat/jisdai2, https://kanji.jitenon.jp/cat/jisdai3, https://kanji.jitenon.jp/cat/jisdai4, 参照日:2025-12-18

  2. 文化庁「常用漢字表の音訓索引」, https://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/joho/kijun/naikaku/kanji/joyokanjisakuin/index.html, 参照日:2026-02-10

  3. 文化庁「常用漢字表」, https://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/joho/kijun/naikaku/pdf/joyokanjihyo_20101130.pdf, 参照日:2026-02-10 2

  4. 文部科学省「小学校学習指導要領(平成29年告示)」, https://www.mext.go.jp/content/20230120-mxt_kyoiku02-100002604_01.pdf, 参照日:2026-02-11

  5. 日本漢字能力検定協会『漢検漢字辞典』第二版,2014年,1984p. 2 3

  6. 漢字ペディア, https://www.kanjipedia.jp/, 参照日:2026-02-09

  7. 日本漢字能力検定協会「各級の概要(出題内容・審査基準・合格基準・採点基準)」, https://www.kanken.or.jp/kanken/grades/overview/, 参照日:2026-02-09

  8. 法務省「子の名に使える漢字」, https://www.moj.go.jp/MINJI/minji86.html, 参照日:2026-02-07

  9. e-Gov 法令検索「戸籍法施行規則(昭和二十二年司法省令第九十四号)」, https://elaws.e-gov.go.jp/document?lawid=322M40000010094, 参照日:2026-02-09

  10. 国立国会図書館「日本の暦:干支①六十干支」, https://www.ndl.go.jp/koyomi/chapter3/s1.html, 参照日:2026-01-31

About

日本語・漢字に関する各種データを整理し、再利用しやすい形で保管することを目的としたデータ集。 主に、漢字検定1級の学習への利用を想定している。

Topics

Resources

License

Stars

Watchers

Forks

Contributors