Giter Site home page Giter Site logo

imasparql's Introduction

imasparql

stat Actions Status

im@sparql's RDFs

編集者歓迎

データがまだまだ完璧とは言えません。
データの追加・データの修正ぜひぜひお願いします。  
CONTRIBUTING.md

使い方(im@sparqlでの使用方法 with Apache Jena Fuseki2)

Apache Jena Fuseki2
Fusekiでは、Configureの.ttlファイルにファイルを登録することで使えるようになります。
参考:https://jena.apache.org/documentation/fuseki2/fuseki-configuration.html#dataset

Discussion

IM@StudyのSlackのimasparqlチャンネルにて、時たま話し合いが行われています。
みなさまのご意見や要望も募集しています。
@croMisaへでも大丈夫です。

Source

このDBは、アイドルマスターの各種コンテンツ及び以下のWebコンテンツを参考にしています。

  • ニコニコ大百科
  • ピクシブ辞典
  • その他各種個人サイト

アイドルマスター以外を情報元にする場合は、レビュー時に検索等で信憑性を測るものとします。

Special Thanks

and... You!

imasparql's People

Contributors

arrow2nd avatar crssnky avatar foooomio avatar forno avatar fyui001 avatar gomao9 avatar hagiayato avatar hsugita avatar idol99 avatar izumin0x0f avatar kagankan avatar kagemiku avatar katao avatar kiridaruma avatar maraigue avatar mh35 avatar nkudryavka avatar oniipon avatar rinsuki avatar smicle avatar subroh0508 avatar suienzan avatar suzuka-samidare avatar takayamaki avatar takemikami avatar tankarup avatar tumugin avatar yutagoto avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

imasparql's Issues

Unit.rdfにKBKYZDが2つ登録されている

これは意図的なのものでしょうか?

これによってクエリ

PREFIX schema: <http://schema.org/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX imas: <https://sparql.crssnky.xyz/imasrdf/URIs/imas-schema.ttl#>
SELECT ?unit (?name as ?member)
WHERE {
  ?s rdf:type imas:Unit;
     schema:name ?unit;
     schema:member ?m.
  ?m schema:name ?name;
  filter(regex(str(?unit), "KBKYZD"))
}

は以下のように同じ名前を2度返しますが、

{
  "head": {
    "vars": [ "unit" , "member" ]
  } ,
  "results": {
    "bindings": [
      {
        "unit": { "type": "literal" , "value": "KBKYZD" } ,
        "member": { "type": "literal" , "xml:lang": "ja" , "value": "白坂小梅" }
      } ,
(中略、星輝子、輿水幸子、姫川友紀も同様)
      {
        "unit": { "type": "literal" , "value": "KBKYZD" } ,
        "member": { "type": "literal" , "xml:lang": "ja" , "value": "小早川紗枝" }
      } ,
      {
        "unit": { "type": "literal" , "datatype": "https://www.w3.org/TR/xmlschema11-2/#string" , "value": "KBKYZD" } ,
        "member": { "type": "literal" , "xml:lang": "ja" , "value": "白坂小梅" }
      } ,
(中略、星輝子、輿水幸子、姫川友紀も同様)
      {
        "unit": { "type": "literal" , "datatype": "https://www.w3.org/TR/xmlschema11-2/#string" , "value": "KBKYZD" } ,
        "member": { "type": "literal" , "xml:lang": "ja" , "value": "小早川紗枝" }
      }
    ]
  }
}

以下のクエリ

PREFIX schema: <http://schema.org/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX imas: <https://sparql.crssnky.xyz/imasrdf/URIs/imas-schema.ttl#>
SELECT (?name as ?member)
WHERE {
  ?s rdf:type imas:Unit;
     schema:name "KBKYZD";
     schema:member ?m.
  ?m schema:name ?name;
}

は以下のように1回ずつしか返さない

{
  "head": {
    "vars": [ "member" ]
  } ,
  "results": {
    "bindings": [
      {
        "member": { "type": "literal" , "xml:lang": "ja" , "value": "白坂小梅" }
      } ,
(中略、星輝子、輿水幸子、姫川友紀も同様)
      {
        "member": { "type": "literal" , "xml:lang": "ja" , "value": "小早川紗枝" }
      }
    ]
  }
}

というような不思議な結果にもなっています。

「趣味:なし」のアイドルの表記統一

現在、プロフィール上の趣味が「なし」となっているアイドルは、以下の3名です。

  • 双葉杏
  • ジュリア
  • 都築圭

このうち、双葉杏はimas:Hobbyが「なし」となっていますが、ジュリアと都築圭の2名はimas:Hobbyが定義されていません。
「なし」と表記するか、未定義とするか、どちらかに統一すべきと考えます。

個人的には、プロフィールに「趣味」欄がないアイドルと区別するために、「なし」表記で統一するほうが良いと思います。

文字コード等の統一

各XMLファイルを編集するにあたって、文字コードなどが統一されていないことが少し気になりました。

$ file RDFs/*
RDFs/283.rdf:                    exported SGML document text, UTF-8 Unicode (with BOM) text
RDFs/765AS.rdf:                  UTF-8 Unicode (with BOM) text
RDFs/765MillionStars.rdf:        UTF-8 Unicode (with BOM) text
RDFs/876.rdf:                    UTF-8 Unicode (with BOM) text
RDFs/961.rdf:                    UTF-8 Unicode (with BOM) text
RDFs/CallTable.rdf:              Little-endian UTF-16 Unicode text, with CRLF line terminators
RDFs/CinderellaGirls.rdf:        exported SGML document text, UTF-8 Unicode (with BOM) text
RDFs/CinderellaIntroduction.rdf: UTF-8 Unicode (with BOM) text
RDFs/CinderellaRanking.rdf:      ASCII text
RDFs/Clothes.rdf:                exported SGML document text, UTF-8 Unicode (with BOM) text
RDFs/Clothes_Own.rdf:            Little-endian UTF-16 Unicode text, with CRLF, CR line terminators
RDFs/Disc.rdf:                   UTF-8 Unicode text
RDFs/Event.rdf:                  UTF-8 Unicode text
RDFs/Live.rdf:                   UTF-8 Unicode text, with very long lines
RDFs/MusicComposition.rdf:       UTF-8 Unicode (with BOM) text
RDFs/SideM.rdf:                  UTF-8 Unicode (with BOM) text
RDFs/Song.rdf:                   UTF-8 Unicode text
RDFs/Staff.rdf:                  UTF-8 Unicode (with BOM) text
RDFs/Unit.rdf:                   exported SGML document text, UTF-8 Unicode (with BOM) text
RDFs/Unit_memberOf.rdf:          Little-endian UTF-16 Unicode text, with very long lines, with CRLF line terminators

$ file URIs/*
URIs/imas-schema.ttl: UTF-8 Unicode (with BOM) text

文字コード

  • UTF-8
  • UTF-8 with BOM
  • UTF-16

改行コード

  • LF
  • CRLF

ファイル末尾の改行

  • あり
  • なし

個人的には、Linuxなどで標準的な「UTF-8・LF・ファイル末尾の改行あり」に統一するのが好ましいかと思うのですがいかがでしょうか。

今後も新しくXMLファイルが追加されていくことでしょうし、CIでチェックするようにするのもいいかもしれません。(やりすぎですかね笑)

成長中のアイドル

以前、デレパでクイズになったきらりを始め、時期によってプロフィールの数値が変わるアイドル、特訓後に変わるアイドルがいるみたいです

rdf:datatype="日付"系のwarning

日付系の型で、warningが発生している。
日付系はISO 8601で定められた形式が使える。
現在は分かりやすさでその「拡張形式」を利用しているが、基本形式にすべきか。

[危険]出演タイトル・所属を分ける

今現在、imas:Titleでなんとなくシリーズ?事務所?って感じで曖昧に分けてるけど、ちゃんとしたい。

imas:Title

出演作品を書く

imas:Production

所属事務所を書く
URI指定 Ref. #215

秋月涼は同一人物か

現在は秋月涼のURIを男女兼用としているが、分けるべきか
同じにする問題点として、同じ人物だが、プロフィールが2つ出てしまう(876用・315用)。
分けてしまうと、同じ人物としてリンクすることが難しくなる。

英語名

アイドルのアルファベット表記欲しい

CinderellaRankingPerson か CinderellaRankingResult 、どっち?

#123 で追加された第7回総選挙結果の rdf:type が、前略#CinderellaRanking "Person" になっている。
第6回までは、前略#CinderellaRanking "Result" であった。
/URIs/imas-schema.ttl にあるのも、CinderellaRanking "Result" (line68-70) である。

というわけでどちらかに統一できます?

セリフテキストの登録方法

語彙を作る?
またテキストに含まれる情報をどれだけ載せるか。
発言者、誰に向けて、状況、ソース、Pの選択肢(?)

アイドルのイメージカラーの決定

シンデレラやSideMってイメージカラーどうする?
シンデレラ→サイリウムの色
SideM→ユニットカラーをサイリウムから?
(実際765,Millionも公式でRGBで厳密かつ不変に決まってるわけじゃないけど)

RDFによって、文字列は文字列でも違う型のものが使われている?

PREFIX schema: <http://schema.org/>

SELECT * WHERE {
  ?s schema:name "島村卯月"@ja.
}

はちゃんと結果が返るのですが、

PREFIX schema: <http://schema.org/>

SELECT * WHERE {
  ?s schema:name "ピンクチェックスクール"@ja.
}

では結果が返ってきません(@jaがあってもなくてもだめでした。本来であれば、?sとしてユニットを表すURIが返るはず)。なお

PREFIX schema: <http://schema.org/>

SELECT * WHERE {
  ?s schema:name ?n.
  filter(regex(str(?n), "^ピンクチェックスクール$")).
}

とすれば結果が得られました。

実際RDFを見てみると、アイドル名の場合は<schema:name xml:lang="ja">島村卯月</schema:name>のようになっているのに対し、ユニット名の場合は<schema:name rdf:datatype="https://www.w3.org/TR/xmlschema11-2/#string">ピンクチェックスクール</schema:name>とdatatypeが別途指定されており、これが問題なのではという指摘を今日のim@sparqlハッカソンにおいていただきました。

黛冬優子の紹介文が変わっている

黛 冬優子 (まゆずみ ふゆこ) | アイドルマスター シャイニーカラーズ(シャニマス)

- 常に控えめな笑顔で、清楚な女の子。可愛いものが大好きで、周囲への気配りもできるため人に好かれる性格。専門学校1年生。
+ 常に控えめな笑顔で、清楚に見える女の子。可愛いものが大好きで、周囲への気配りをするなど人に好かれるように振る舞う。専門学校1年生。

ゲーム内でプロデュースできるようになったことで紹介文が変わったようです。

清楚な女の子 -> 清楚に見える女の子
周囲への気配りもできるため人に好かれる性格 -> 周囲への気配りをするなど人に好かれるように振る舞う

im@sparqlとしてはどちらを正とするのがいいでしょうか。
公式サイトの最新の記述を採用するのが自然?

ジュリアが検索できない

P向け名刺管理サービスの担当アイドル登録にim@sparqlのデータを使わせていただいているのですが、アイドル名を検索するときに、例えば「あ」で検索すると、名前に「あ」を含むアイドルのうちジュリアだけが引っ掛かりません。(天海春香、アスラン=BBⅡ世、エミリースチュアートなどその他のアイドルは(おそらく)全員検索できています。)

検索のために投げているクエリは以下の通りです。

PREFIX schema: <http://schema.org/>
PREFIX imas: <https://sparql.crssnky.xyz/imasrdf/URIs/imas-schema.ttl#>
SELECT distinct ?name 
WHERE { ?s imas:nameKana|schema:name ?o;
        ?p imas:Idol.
        FILTER(regex(str(?o), "あ")).
        ?s schema:name ?name.}
order by(?name)

データが間違っているのか私のクエリが悪いのか分からないのですが、よろしくお願いいたします。

衣装の詳細とか欲しいね

Class:Clothes

  • 名前[schema:name,@ja]
  • 説明[schema:description,@ja]
  • タイプ[imas:ClothesType]
    • タイトル別に分けない
  • イメージ[imas:うわ翻訳しにくい何にしよう]
    • PS4系のやつ、従来のタイプに当たる部分っぽく感じるけど...
  • ボーカル値[imas:Vocal]
  • ダンス値[imas:Dance]
  • ビジュアル値[imas:Visual]
  • スキル[imas:Skill]
    • 表記ゆれしたくないところ
  • ランク[imas:Rank]
  • 専用着用者[imas:Whose ]

PS4になってから複雑化して、モバイル版で専用になって、一つにまとめるのもおかしい(?)

名前被りユニット

    "name": { "type": "literal" , "datatype": "https://www.w3.org/TR/xmlschema11-2/#string" , "value": "TIP! TAP!" } ,
    ".1": { "type": "literal" , "value": "栗原ネネ 松原早耶 乙倉悠貴" }
  } ,
  {
    "name": { "type": "literal" , "datatype": "https://www.w3.org/TR/xmlschema11-2/#string" , "value": "TIP!TAP!" } ,
    ".1": { "type": "literal" , "value": "乙倉悠貴 栗原ネネ 松原早耶" }

おうちでやる

デレ以外の出身地

横山奈緒のようなプロフィールには無いけど、明言している場合など

日本語フィールドのxml:lang属性が統一されていない

RDFの日本語フィールドが xml:lang="ja" だったり xml:lang="jp" だったりして統一されていません。
国ではなく言語ですので、 ja のほうが正しいと思うのでそちらへ統一すべきかと思います。
(使い分けに何か意図があったらごめんなさい)

"du" => "zu" 漏れ

#122 によってアイドル詳細のURIの綴りは zu に統一されているものの、
下記のように参照する側で du が残っているものがあり、クエリの結果から漏れる原因になっている

<schema:actor rdf:resource="https://sparql.crssnky.xyz/imasrdf/RDFs/detail/Mochiduki_Anna"/>

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.