此程序还在开发中,只有基本的一些功能实现
数据工作流设计器,这个软件的设计目标是实现工作流驱动数据的ETL,集成panda的数据处理能力,实现高效的交互式数据可视化以及能固定输出论文级别的图片,软件主要分三大块:work flow、data、chart,三大板块的关系如下图所示:
软件的设计初衷:
在数据处理过程往往有很多重复性的工作,尤其针对科研实验数据,有可能要面对n组数据,每组数据的清洗抽取方式基本是一样的,因此我希望一个数据处理软件应该是带有工作流功能的,当然python是很容易实现上述功能,但要求有一定的开发基础且要熟悉一些库才能得心应手
另外通过python进行数据处理过程,很多功能是隐藏的,panda有那么多种数据清洗方法,除非你把整个文档浏览一遍,否则你很难想起他们,因此一个交互式的数据清洗工具是很有必要的,把功能通过GUI明确的展现给用户,这样数据处理过程不需要长时间的翻阅文档
最后也是我用matlab和python这类数据处理工具最头疼的一点,就是数据可视化,虽然matlab和python能做出很漂亮的图,但细微的调节非常令人抓狂,例如要调整一个文本的位置,交互式的设计你只需要拖动一下鼠标,但在脚本语言里你要指定它的坐标,如果图片非常大,渲染时间比较久,那么移动一个文本到你想要的地方是一件令人非常抓狂的事情,而且matlab或者matplotlib的数据可视化函数有多有细,每次操作都要查阅半天文档,这是另人非常苦恼的事情。
本软件的设计就是为了解决上面遇到的这三个问题,因此软件会分为三大板块:工作流解决固定流程问题,数据处理板块会把pandas的功能进行集成,chart板块能实现交互式的数据可视化,且能生成论文级别的图片
编译前请确保已经拉取了第三方库,由于使用的是git submodule
方式管理大部分第三方库,因此需要执行:
git submodule update --init --recursive
把所有第三方库拉取
具体可见:submodule.md
详细构建教程见:doc/how-to-build.md文档
DA项目编译好的二进制文件统一生成到bin{Debug/Release}qt{$$QT_VERSION}{MSVC/GNU}_{x64/x86}目录下,如:使用qt5.14.2, msvc版本debug模式64位编译,将生成bin_Debug_qt5.14.2_MSVC_x64
文件夹
用户可以自定义安装路径,需要手动调整CMakeLists.txt
首先需要编译第三方库,第三方库位于src/3rdparty
, 第三方库使用git submodule
形式进行管理,因此第三方库需要在根目录下(存在.gitmodules
的目录)执行下面语句对第三方库进行拉取
git submodule update --init --recursive
用qt creator 打开./src/3rdparty/CMakeLists.txt
进行编译
编译完第三方库后,需要进行安装(install),所有依赖将安装到bin目录下
需要编译的第三方库如下:
- SARibbon
- Qt-Advanced-Docking-System
- ctk
- qwt
- QtPropertyBrowser
- spdlog
在需要python时将引入下面的库
- pybind11
用户可以自定义安装路径,需要手动调整
CMakeLists.txt
DA_ENABLE_PYTHON
选项用于指定是否需要python环境,如果开启将自动查找系统的python环境并进行依赖,python环境有如下要求
- 至少是python3.7
- python环境需要安装pandas库
最好把安装好pandas库的python环境整体拷贝到bin_xx
目录下,并指定Python3_ROOT_DIR
对应到目录上
tips:如果系统有多个Python,想指定某个Python环境,可以设置
Python3_ROOT_DIR
变量
在确保完成了./src/3rdparty/CMakeLists.txt
的编译,以及完成Python路径的配置(如果需要依赖python),直接用Qt Creator (或vs)打开./CMakeLists.txt
进行编译,编译完成后安装,默认的安装路径会自动把文件安装到工程目录的bin_xx
目录下
如果第三方库的安装路径不是使用默认路径,需要指定各个第三方库的安装位置
详细构建教程见:doc/how-to-build.md文档
本项目开发规范:开发规范文档:coding-standard.md
主体界面演示