Giter Site home page Giter Site logo

Comments (8)

wubo2cyp avatar wubo2cyp commented on August 18, 2024

集成hdfs的大致过程:
1、修改$POSEIDON_HOME/dist/index-0.1/bin/start.sh 主要涉及点 hadoop命令,环境变量 poseidon相关的jar包名称(编译之后的jar包名和start.sh 中不一致)
2、修改$POSEIDON_HOME/dist/index-0.1/etc/test.json 主要涉及点name_node,hadoop_user,local_mock
3、poseidon组件相关的配置文件:idgenerator/conf/idgenerator.ini,proxy/conf/app.ini,searcher/conf/app.ini, meta/conf/meta.ini 这几个配置文件中的127.0.0.1 地址改成真实的ip地址。

from poseidon.

liwei-ch avatar liwei-ch commented on August 18, 2024

感谢回馈~
1-4 应该和hadoop版本有关;我在hadoop.2.7.1测试没有问题;请提供下具体的hadoop版本;
另外 @wubo2cyp 同学,集成hadoop,请使用$POSEIDON_HOME/dist/index-0.1/etc/test_hdfs.json
5:不影响使用
6-7: @dunixd 帮忙解决下

from poseidon.

liwei-ch avatar liwei-ch commented on August 18, 2024

@guojun1992 帮忙看看有时候查询不到的问题

from poseidon.

wubo2cyp avatar wubo2cyp commented on August 18, 2024

@liwei-ch 我这边一共在两套集群做了测试,一套是基于HDP2.4(hadoop2.6)还有一套是hadoop2.4 都有上述的问题

from poseidon.

zieckey avatar zieckey commented on August 18, 2024

@wubo2cyp

下面说下我的问题:用官方提供的测试数据,在进行curl查询的时候,经常性的第一次查询结果显示为没有的,在执行一次才有数据,如果我输入days:条件中输入多个日期比如2017-01-06,2017-01-09,返回的结果中day属性有时候是2017-01-06,有时候是2016-01-07。当查询调节keywords中的text有多个值的时候也会出现类似的问题。期待解决

这个问题,我们也遇到多次,可以从readhdfs接口看到更多的错误日志。猜测是读HDFS数据时,第一次都是从磁盘加载,导致超时失败,第二次读的时候,由于有文件系统的缓存作用,读取成功率更高些。

欢迎交流。
谢谢。

from poseidon.

liwei-ch avatar liwei-ch commented on August 18, 2024

@wubo2cyp 确认是使用$POSEIDON_HOME/dist/index-0.1/etc/test_hdfs.json 出现的上诉问题吗?

from poseidon.

wubo2cyp avatar wubo2cyp commented on August 18, 2024

刚更新了代码发现最近代码已经更新了,我集成hdfs的代码是一个月之前的代码,所以遇到了这些问题,按照最新的代码再进行编译试试!仅供参考吧

from poseidon.

zhouyuan-dev avatar zhouyuan-dev commented on August 18, 2024

集成hdfs的大致过程:
1、修改$POSEIDON_HOME/dist/index-0.1/bin/start.sh 主要涉及点 hadoop命令,环境变量 poseidon相关的jar包名称(编译之后的jar包名和start.sh 中不一致)
2、修改$POSEIDON_HOME/dist/index-0.1/etc/test.json 主要涉及点name_node,hadoop_user,local_mock
3、poseidon组件相关的配置文件:idgenerator/conf/idgenerator.ini,proxy/conf/app.ini,searcher/conf/app.ini, meta/conf/meta.ini 这几个配置文件中的127.0.0.1 地址改成真实的ip地址。

@wubo2cyp

下面说下我的问题:用官方提供的测试数据,在进行curl查询的时候,经常性的第一次查询结果显示为没有的,在执行一次才有数据,如果我输入days:条件中输入多个日期比如2017-01-06,2017-01-09,返回的结果中day属性有时候是2017-01-06,有时候是2016-01-07。当查询调节keywords中的text有多个值的时候也会出现类似的问题。期待解决

这个问题,我们也遇到多次,可以从readhdfs接口看到更多的错误日志。猜测是读HDFS数据时,第一次都是从磁盘加载,导致超时失败,第二次读的时候,由于有文件系统的缓存作用,读取成功率更高些。

欢迎交流。
谢谢。

请问还有在使用这个产品吗?

from poseidon.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.