Giter Site home page Giter Site logo

japanese-words's Introduction

日语单词整理

Motivation

在学习日语的过程中,背单词是一个绕不去的砍。

对于不同的语言,单词的特点也不相同。对日语而言,有以下几个特点:

  • 汉字可以通过音读记忆
  • 同一个汉字可能对应不同的音读
  • 同一个音读可能对应不同的汉字

在我背单词的过程中,发现一个很有趣也很普遍的问题,在经过一段时间的 记忆后,看到汉字我可以回忆起假名,不用太费功夫。但是当我尝试看假名去回忆汉字时,却屡屡受挫。

通过看假名回忆汉字,是为了训练听力,因为你在听听力时,只能听到假名

Target

为了达到我们的目的,看到假名就能回忆起对应的日文和中文意思,首先需要进行分类。

我认为分类记忆会强化记忆,所以我会把不同的假名发音分类,在该类别下是该发音对应的假名和组词。 以下是一个例子:

假名 日语 组词
こう 高校
天候
効果
幸運
講演

RoadMap

1. Read Excel

使用pandas的表格处理功能,我们可以读取excel中的行列,并将读取所有的单词的

  • 假名
  • 日文
  • 汉字意思

所以get_words_list.py的输出为一个word_list.

技术细节:每个词条用Dict表示,分别为{'假名':, '日文':, '意思':},所有词条装在一个list

2. 分类

构建一个词汇表类,类的数据成员为希望得到的各个类别,初始化为空。
例如: self.kou = {'こう': []} # こう} ,每个数据成员都是一个Dict,其中key为字段,value为包含该字段的词汇的列表。

该词条表类有一个classify函数,输入为一个word_list,该函数遍历所有词条,假如该词条包含某个字段,则对应的数据成员添加该词条。

3. 生成Dataframe

得到每个字段所包含的词条后,需要整合。
创建一个pandas dataframe,如以下形式:

假名 日文 意思 类型
こう
こうそう 高層 高层 名词
...
せい
せいぞう 製造 制造,生产 名词
...

排除专有名词

4. 输出到excel

dataframe输出到excel文件。

5. 样品

我已经处理了生成的excel的文件,进行了校对和字体调整,并生成了PDF文件,可以在example里找到。

如果您有好的修改意见,或者发现了一些bug,欢迎提issue!
如果您有解决办法,也欢迎fork并pull!

最後の最後に, 如果该项目对您有帮助,欢迎分享并star!
ありがとうございます!

japanese-words's People

Contributors

rabbearsu avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar

japanese-words's Issues

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.