Giter Site home page Giter Site logo

kfcd / hyzd Goto Github PK

View Code? Open in Web Editor NEW
20.0 2.0 4.0 5.15 MB

開放漢語字典 - 現代漢語字音數據庫

Home Page: http://kaifangcidian.com/han/han

License: Other

chinese mandarin chinese-characters character-dictionaries chinese-dictionary dictionary-database open-dictionary

hyzd's Introduction

開放漢語字典

說明

本項目提供開放詞典網漢語字典的完整數據,並以繁簡兩種字體、漢語拼音、注音符號、威妥瑪等13種拼音方案、以及TSV、CSV、MD等多種文檔格式發佈,以便於人與機器皆能讀取、利用數據創造出衍生作品。

特色

  • 按照描寫語言學的原則編寫的漢語字典
  • 包含普通話(以《新華字典》為準)和國語(以《重編國語辭典修訂本》為準)兩種發音、用詞、和術語
  • 以漢語母語者實際講的語言為標準
  • 著重於現代漢語而非文言文(即現代語言為主,文言文為副)
  • 儘量為破音字、異體字等容易混淆的字區分、辨析、舉例
  • 完全開源/開放授權的語料數據

數據格式

繁體 簡體 拼音 詞例 定義 又作
suo1 蓑衣 用草或棕製作的雨衣
xun1 壎篪相和 一種古代吹奏樂器

同形不同音的字分為兩詞條。只有一項字義才有異體字的字亦分行處理,如:

繁體 簡體 拼音 詞例 定義 又作
cai2 方才,剛才 剛剛
cai2 才能,天才 能力
繁體 簡體 拼音 詞例 定義 又作
duk9 du2 讀書,閱讀 (動詞)看書
dau6 dou4 句讀 (古)文章裡停頓的地方

當拼音欄出現多於一個發音時,一般前者為普通話標準發音,而後者為國語標準發音,如:

繁體 簡體 拼音
ci4/si4
jiu1/jiu4
kai3/kai4
qi1/qi2

支援拼音方案

原數據採用漢語拼音標音,此外一共13種拼音版本(如注音符號)分別在dist/tsv等子目錄裡可找到。

  • 漢語拼音
    • (數字)如:han4、yu3、zi4、dian3
    • (調符)如:hàn、yǔ、zì、diǎn
  • 注音符號
    • 如:ㄏㄢˋ、ㄩˇ、ㄗˋ、ㄉㄧㄢˇ
  • 威妥瑪拼音
    • 如:han⁴、yü³、tzu⁴、tien³
  • 注音二式
    • 如:han4、yu3、tz4、dian3
  • 耶魯拼音
    • 如:hàn、yǔ、dz`、dyǎn
  • 通用拼音
    • 如:hanˋ、yuˇ、zihˋ、dianˇ
  • 國語羅馬字
    • 如:hann、yeu、tzyh、dean
  • 國際音標
    • 如:xan˥˩、y˨˩˦、tsɯ˥˩、tjɛn˨˩˦
  • 拼聲拼音
    • 如:Han、yu、Zi、dian
  • 俄文拼音
    • 如:хань⁴、юй³、цзы⁴、дянь³
  • 漢字(範例)
    • (繁體)如:汗⁴、于³、子⁴、典³
    • (繁體)如:汗⁴、于³、子⁴、典³

實現示例

  • 國粵消歧義字譜
  • 國粵字音對照表

另見

版權

© 2009-2020 開放詞典

本倉庫所含數據皆依照共享創意(創用CC/知識共享)姓名標示(署名)協議發佈。

創用 CC 授權條款
本著作係採用創用 CC 姓名標示 3.0 未本地化 授權條款授權。

hyzd's People

Contributors

dohliam avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.