Giter Site home page Giter Site logo

jp-textbook / jp-textbook.github.io Goto Github PK

View Code? Open in Web Editor NEW
16.0 7.0 1.0 578.9 MB

Japanese Textbook Linked Open Data (LOD)

Home Page: https://w3id.org/jp-textbook/

HTML 99.99% Ruby 0.01% CSS 0.01% Makefile 0.01% JavaScript 0.01%
textbook curriculum education school japan japanese turtle rdf linked-data linked-open-data

jp-textbook.github.io's People

Contributors

masao avatar yegusa avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar

Forkers

j-7

jp-textbook.github.io's Issues

(対象データ外)教科書目録掲載年度が1956年度以降の検定年がゼロか空のもので文部省著作のものは修正する

  • 教育図書館に連絡済み 2017-05-01 17:52
  • 教育図書館のレコード修正済み
  • 元データ入手

1956年以降で、ゼロや空白となっている、文科省(文部省)著作の「検定年」は「著作年を入れることとした。(1956年より前については、ゼロや空白の教科書が大変多いので今回はしない)

#27 の後に、教育図書館と検討し、教育図書館のシステム(に入力するデータ)としては、
文科省著作の教科書の「検定年」の欄に、「著作年」を入力することとし、ヘルプなどで、文科省著作のはものは「検定年」に「著作年」が入っている旨を書くこととした。

※システムの関係上、これ以上あたらしい項目を増やすことができないため、「著作年」を増やすことはできないこと、検定年で検索することをかんがえると、それににた「著作年」で検索できるのは便利なため、このような措置とする。

【古い教科書:対象範囲外データ】1956年以降の検定年がゼロか空のものを修正する

今回の公開範囲にはないが、古いデータには、検定ねんがゼロか空のものがある。

教育図書館に連絡済み 2017-04-17

1955年以前のものについては、とりあえずは、いいことにする。

教科書目録掲載年度は全部レコードについていたので、
それで、検定年がゼロか空のものを集計すると、
こんな感じでありました。

教科書目録掲載年度 レコード数
1947 2
1948 139
1949 352
1950 407
1951 735
1952 674
1953 534
1954 728
1955 553
1956 10
1957 10
1958 3
1959 11
1960 4
1961 2
1964 1
1968 1
1970 1
総計 4167

スクリプト作成: ttl変換のrubyスクリプトを作る

  • スクリプト作成
  • #35 重複レコード処理をやる

現在は、ttl変換は、Excelでやっているが、今後、元データ(TSV)から、
すぐに変換できるようにするために、ruby で作り直す。

  1. 抽出しないフラグを除去 #10
  2. 種目の正規化(半角・全角、アルファベット・ローマ数字など)
  3. ttl 変換

が少なくとも必要

【古い教科書:対象範囲外データ】請求記号の検定年 or 使用年がないもの

  • 教育図書館データ修正
  • ttl作成 古い教科書で対象範囲外であった

#27 と関連

https://nieropac.nier.go.jp/ebopac/EB10011153 K260.3||S15A||28/
https://nieropac.nier.go.jp/ebopac/EB10007410 K170.3||F1A||
https://nieropac.nier.go.jp/ebopac/EB10007409 K170.3||F1A||
https://nieropac.nier.go.jp/ebopac/EB10007398 K170.3||F1A||
https://nieropac.nier.go.jp/ebopac/EB10007387 K170.3||F1A||
https://nieropac.nier.go.jp/ebopac/EB10020587 K280.66||J3|| 重複のため削除

教育図書館に連絡済み 2017-04-17

請求記号の3列目にHがある

  • 教育図書館データ一括修正(業者作業)
  • ttl作成

666件

教育図書館で確認、必要なら修正。
教育図書館に連絡済み 2017-04-17

【現在対象範囲外データ】教科書目録掲載年度が1955年度以前のもので、文部省著作で、検定年がゼロか空のものを修正する

  • 教育図書館に連絡済み 2017-05-01 17:52
  • 教育図書館のレコード修正済み
  • 元データ入手

#44 より古いレコード。

教科書目録掲載年度が1955年度以前のもので、文部省著作で、検定年がゼロか空のものを修正する

#27 の後に、教育図書館と検討し、教育図書館のシステム(に入力するデータ)としては、
文科省著作の教科書の「検定年」の欄に、「著作年」を入力することとし、ヘルプなどで、文科省著作のはものは「検定年」に「著作年」が入っている旨を書くこととした。

※システムの関係上、これ以上あたらしい項目を増やすことができないため、「著作年」を増やすことはできないこと、検定年で検索することをかんがえると、それににた「著作年」で検索できるのは便利なため、このような措置とする。

該当レコード

EB10019212
EB10019289
EB10019290
EB10019375
EB10019559
EB10019560
EB10019817
EB10019823
EB10019859
EB10019892
EB10019897
EB10020560
EB10020574
EB10020575
EB10020576
EB10020581

教科書目録掲載年度や使用年などがおかしいレコードの修正

https://nieropac.nier.go.jp/ebopac/EB10019335

-請求記号:K280.522||J3H||49/52  49/50?
-教科書目録掲載年度・・・誤:1947
-使用年度・・・誤:1948-1981
-使用年度(検索用?・・・誤:1948 1981

あたりが間違っている可能性大。

ひととおり見た方がよさそう。

教育図書館に報告済み。 2017-04-15

追記コメント:
検定年が、昭和49年
この教科書の使用年(開始)としては、昭和50年だが、
教育図書館が所蔵している個別資料の使用年は昭和52年
なので、請求記号としてはあっている。

LODクラウドへの掲載

LODクラウドの一部に掲載してもらい、LOD情報としての可視性を高めたい。
本家または日本語版のLODクラウドに加えてもらうこと。

掲載条件は以下の6点です:

  1. 解決可能なURIを付与していること
  2. RDFデータ形式を提供していること
  3. 1000トリプル以上のデータセットであること
  4. LODクラウドにすでに掲載されている他のデータセットへのリンクを50件以上含むこと
  5. データセット全体にアクセスできること
  6. DataHubに掲載されていること

現状では6番のDataHubへの掲載が満足されれば問題なく掲載可能となります。

種目カテゴリの精査と確認と修正

  • ローマ数字・半角の統一は、 #11 にて対応する
  • 教育図書館に連絡 2017-05-01 再度連絡:2017-05-26
  • 教育図書館のデータ修正 2017-05-10 2017-05-26
  • 教育図書館データ修正の確認 2017-05-26
  • 教育図書館のデータ入手 2017-06-01

トップページからのブラウジングで使用している種目一覧に、教科書目録に存在しないものがあったり、ゆれていると思われるので、確認すること。

以下は、2017-05-01 に教育図書館にデータ修正依頼済み

  • 2003年度以降施行
    • 中学 音楽(器楽) ※「音楽(器楽合奏)」の誤り?
    • 高校 国語表現 ※「国語表現I」または「国語表現II」のいずれか?
    • 高校 数学 ※「数学基礎」または「数学I・II・III」または「数学A・B・C」のいずれか?
    • 高校 物理 ※「物理I・II」のいずれか?
    • 高校 化学 ※「化学I・II」のいずれか?
    • 高校 生物 ※「生物I・II」のいずれか?
    • 高校 音楽 ※「音楽I・I」のいずれか?
    • 高校 美術 ※「美術I・II・III」のいずれ?
    • 高校 書道 ※「書道1, 2, 3」のいずれか?
    • 高校 英語 ※「英語1・2」のいずれか?
  • 1994年度以降施行
    • 高校 理科2 ※指導要領に見当たらず。要確認。

以下は、別 issueへ移動

以下は、#11 (version 2.0)で、プログラムで正規化する

別issue #40 に分割  追記:勘違いなので修正しない詳細は #40へ

  • 1994年度以降施行
    • 高校 現代語 ※指導要領には見当たらない。教科書目録の種目? 要確認。→ 対象外の古い教科書だったので対象からはずす 20170501のデータに反映済み

別issue #39 へ分割

  • 1994年度以降施行
    • 高校 「工芸3」の教科書が見当たらない。不存在を要確認。

別issue #38 へ分割

  • 2003年度以降施行
    • 高校 「家庭基礎」「家庭総合」「生活技術」の3種目は教科書が見当たらない。要確認。

別issue #36 で修正済み

教科・種目の詳細ページを追加

以下、とりあえず、今は、科目はやらない

  • 科目:データの作成(excel)
  • 科目:プロパティの検討・決定
  • 科目:ttlの作成
  • 科目:プログラム開発

学年記載ミス

  • 教育図書館に連絡(2017-05-03に連絡済み)(2017-05-26 再度連絡)
  • 教育図書館データ修正(1度目確認:2017-05-08) (残:EB16219851 2017-05-26)
  • 元データ入手 (2017-06-01)

「小学 こくご 4下」の書名なので、4年生向けと思われるが、書誌情報には1年との記載。
https://nieropac.nier.go.jp/ebopac/EB16219847
データ誤りを確認すること。

請求記号の区切り記号が - になっているのを修正する 499件

  • 教育図書館一括修正待ち(業者作業)
  • ttl作成

請求記号の区切り記号が - になっているのを修正する 499件

注意:
区切り文字に || をつかって、かつ、
内容にハイフンを使っているレコード(例:K171.76||F2C||5-6)は
除外してあります。

教育図書館に連絡済み

種目「保健体育」の記述を検討する

高校の学習指導要領には、「保健体育」という科目はなく、「保健」「体育」という科目がある。
「保健体育」という教科はある。この種目「保健体育」は教科を表す?

学習指導要領リソースと教科書との関連付け

関連付けを毎回手でリンクしているが、これらの情報をどこかマスターファイルのように保存しておいて、残し、次回の新しいデータだけに対して紐づけなおすようなやりかたを検討する必要がある。

重複レコードをチェック

  • 教育図書館データ修正
  • 教育図書館からデータ入手 2017-04-27版
  • ttl作成

同一のURIを持つレコードがいくつか出ている。。。

教育図書館で内容を確認すること。

請求記号の2列目に全角があるので修正する

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.