Giter Site home page Giter Site logo

iadb's Introduction

信分基建 🚧 学术数据库

0. 目录

1. 如何贡献?

1.1 获取权限

  • PS:在申请权限前,首先确认你已经加入飞书协作群
  • 如何获取 Airtable 权限并加入协作?
    • 第一步:点击 👉 链接,注册 Airtable 账户:
    • 第二步:注册账户时,姓名和头像需更改为与微信一致:
      • 你可以在 Last Name 填入一个空格;
      • 然后把你的微信昵称填入 First name 中;
    • 第三步,打开 👉 ✔️ 任务追踪表,选择任务。
      • 你可以在 1-100 中的十个小组任选一个加入。然后在小组里面分配任务。
    • 第四步,把 Airtable 加入你的登山工具的代理里。
  • 如何获得 GitHub 权限?
    • 你需要注册一个 GitHub 账户,注意昵称与微信群同步。
    • 把你的 Email 或者 ID 发给 Alex,他会邀请你加入本仓库

1.2 你在 2021-05-09 要交付的东西

  • 你要把收集到的学者元数据填入 Airtable 对应表格。把表格中没有的数据(自然语言)填入其他笔记。
  • 你在探索收集中,记录使用的信息源以及行动步骤(放在自己的本地笔记里)。在下一次会议时交流。讨论出一个添加词条的通用步骤。
  • 你在探索收集中,积累可以被自动化抓取的元数据(如,谷歌学术作者主页的标签分类)
  • 你在探索收集中,思考现有表格的元数据是否科学。

1.3 软件相关教程

2. 项目目标

项目不是什么?简单的人肉爬虫,你需要加入的是信息分析视角挖掘出的反常识信息。

所以,我们项目数据框架先不定死。收集前 100 学者,可以带各自的风格。(未来在汇总之后,再定个稳定具体的模板之后,再严格执行)

其次,希望大家,在收集元数据时候记录可以自动化的地方。(记录检索清单、记录痛点)记录,如何形成一个学者的最小全局认识(控制在 30 分钟里)。

3. 项目里程碑

  • 里程碑 1:建立包含 100 个学者的数据库
    • 要确定大时间周期稳定的元数据(空间、时间、变量)
    • 要确定添加一个词条的最佳实践。(如何快速准确的信息分析一个学者)
    • 思考 3 个使用场景。比如如何展示数据……
  • 里程碑 2: 建立包含 500 个学者的数据库
  • 里程碑 3 建立包含 1000 个学者的数据库
    • 数据源的交叉验证放在项目后期

4. 项目节奏

  • 任务分工:
    1. 参考会议纪要中的行动点;
    2. 参考任务分配看板
  • 本项目有旁观者淘汰机制,2021-05-30 时淘汰不积极参与项目的同学。

5. 信息流动图

小队微信群/私下会议/独立探索/ ... 任何即时场景中
        ^ \
        |  +- 触发创想/改进点/卡片创意/疑问点/...
        |   \               
        |    *- => Issues 进行具体描述/追踪/讨论/...
        ^   / \         +- https://github.com/Spehhhhh/IADB_Scholar/issues
        |   |  \            +- 自动提醒 -> #TODO 需要配置
        |   ^   +- 定期 腾讯会议/飞书会议 交流嗯哼
        |   |   |       +- #TODO 需补充会议号
        |   ^   +- 定期 Airtable 发布任务 (*wd0 2042)
        |   |   |       +- https://airtable.com/tbl7cdh4nRbSfzxsH/viw6gIMROhVAa0pFH
        ^   ^   +- 笔记 追踪在 https://github.com/Spehhhhh/IADB_Scholar/
        |   |   |     +- 可以存放在专有 Orphan Branch 中
        |   |   |         +- 提交规格 Commit Message 
        |   |   |             +- 含对应 Issue 标号
        |   |   |            /
        |   +---+-----<---<-+ (将自动匹配增补到对应 Issue 时间线事件中)
        |       |       
        ^       +- 知识点/经验/手册 沉淀到 Wiki 在完全配置之前暂放于 Master Branch 
        |      /      +- https://github.com/Spehhhhh/IADB_Scholar/wiki
        +---<-+       +- https://github.com/Spehhhhh/IADB_Scholar/tree/master

6. 协作工具与绝对坐标

7. 作品展示

最终呈现在 Master Branch,方式待未定,可能以 Web 作品呈现。

9. FAQ

  • Airtable 访问慢怎么办?
  • 我不会爬虫会不会不适合这个项目?
    • 不会,你只需要有信息分析的热情就行。

ChangeLog

  • 210425 Alex init;

iadb's People

Contributors

ipruning avatar lxy-888 avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar

Forkers

freejacklee

iadb's Issues

关于搜索流程的优化讨论

搜索流程

搜索步骤 截图
1 从下面获得H指数大于100的学者,选取一个开始搜索
Highly Cited Researchers (h>100)
image-20210427182003330
2 在谷歌学术搜索
‪AS Fauci‬ - ‪Google 学术搜索‬
image-20210427182033975
3 在维基百科搜素
Anthony Fauci - Wikipedia
image-20210427182043679
4 通过谷歌搜索,找到其他信息,如学者官网等
AS Fauci - Google 搜索
image-20210427182107636
5 通过Acemap搜索获得作者合作网络图
Anthony S. Fauci - Acemap
image-20210427182118889

TODO与待优化

  • 高引文章,高引论文上述流程无法搜索到,有什么好的办法吗?比如wos?
  • 高引文章取谷歌学术里排名前几的可以吗?
  • 部分学者acemap中查不到作者关系图,还有别的办法吗?

总结

  • 不纠结于某些自己难以解决没有思路的东西,先完成基础的,剩下通过提问大佬来找解决办法
  • 需要沉淀出更多信息源,应该每个信息的查询都要有2个以上不同的信息源来进行交叉验证或者补充

ChangeLog

  • V0.0.0 m 2021-04-27 Tue

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.